Пример решения задания Осуществить синтез и верификацию модели
Верификацию модели предлагается проверить путем расчета внутренней дифференциальной и интегральной валидности.
Для этого студентам необходимо выполнить следующие действия:
1. Скопировать обучающую выборку в распознаваемую в подсистеме: "F2 Обучение – ввод корректировка обучающей информации – F5 Об.инф.->Расп.анк. – F2 Перезапись БД распознаваемых анкет – F1 Копировать всю БД".
2. Выполнить пакетное распознавание в подсистеме: "F4 Распознавание – Пакетное распознавание – Критерий сходства [64] корреляция".
3. Измерить внутреннюю интегральную и дифференциальную валидность информационной модели в подсистеме: "F6 Анализ".
Синтез модели осуществляется на основе обучающей выборки (таблица69) в соответствующем режиме (рисунок 123) после формирования классификационных и описательных шкал и градаций и обучающей выборки.
Рисунок 123. Режим "Синтез семантической информационной модели" системы "Эйдос" |
В результате синтеза семантической информационной модели рассчитываются две ее основные матрицы: матрица абсолютных частот (таблица 70) и матрица информативностей (таблица 71).
В матрице частот отражается суммарное количество встреч каждого признака у объектов каждого класса по данным обучающей выборки. Каждый элемент матрицы информативностей показывает, какое количество информации о переходе объекта управления в состояние, соответствующее классу, мы получаем, если узнаем, что действует некоторый признак.
Таблица 70 – МАТРИЦА АБСОЛЮТНЫХ ЧАСТОТ (ФРАГМЕНТ)
Коды букв | Коды классов (слов) | ||||||||||||||||||||||||||||||||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | |||||||||||||||||||||
37 | 2 | 1 | 1 | 1 | 1 | 2 | |||||||||||||||||||||||||||||||||
38 | 1 | 1 | 1 | 1 | 1 | ||||||||||||||||||||||||||||||||||
39 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | ||||||||||||||||||||||||||||||||
40 | 1 | 1 | 1 | 1 | |||||||||||||||||||||||||||||||||||
41 | 1 | 1 | 1 | 1 | 1 | 1 | |||||||||||||||||||||||||||||||||
42 | 1 | 1 | 1 | 1 | 1 | 2 | 1 | 1 | 1 | ||||||||||||||||||||||||||||||
43 | |||||||||||||||||||||||||||||||||||||||
44 | 1 | ||||||||||||||||||||||||||||||||||||||
45 | 2 | 1 | 2 | 1 | 1 | 1 | 1 | 2 | 1 | 1 | 1 | ||||||||||||||||||||||||||||
46 | 1 | 1 | 1 | ||||||||||||||||||||||||||||||||||||
47 | 1 | 1 | 1 | 1 | 2 | 2 | 1 | ||||||||||||||||||||||||||||||||
48 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | |||||||||||||||||||||||||||||
49 | 1 | 1 | |||||||||||||||||||||||||||||||||||||
50 | 1 | 1 | 2 | 1 | 3 | 3 | |||||||||||||||||||||||||||||||||
51 | 2 | 1 | 2 | 1 | 1 | 2 | 1 | 3 | 3 | ||||||||||||||||||||||||||||||
52 | 1 | ||||||||||||||||||||||||||||||||||||||
53 | 1 | 1 | 1 | 1 | |||||||||||||||||||||||||||||||||||
54 | 1 | 1 | 1 | 1 | 2 | 1 | |||||||||||||||||||||||||||||||||
55 | 1 | 1 | 2 | 1 | 1 | 1 | |||||||||||||||||||||||||||||||||
56 | 1 | 1 |
Таблица 71 – МАТРИЦА ИНФОРМАТИВНОСТЕЙ (ФРАГМЕНТ)
Коды букв |
Коды классов (слов) |
||||||||||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
37 |
1,0 |
1,1 |
0,6 |
1,1 |
1,7 |
1,0 |
|||||||||||||
38 |
1,2 |
0,9 |
1,8 |
1,8 |
1,6 |
||||||||||||||
39 |
1,1 |
1,6 |
1,4 |
1,3 |
1,3 |
0,7 |
1,4 |
||||||||||||
40 |
1,0 |
1,7 |
1,2 |
1,0 |
|||||||||||||||
41 |
1,0 |
1,9 |
1,7 |
1,7 |
1,1 |
2,1 |
|||||||||||||
42 |
0,4 |
0,9 |
0,6 |
0,9 |
0,7 |
0,9 |
0,7 |
1,1 |
0,2 |
||||||||||
43 |
|||||||||||||||||||
44 |
4,1 |
||||||||||||||||||
45 |
1,0 |
1,3 |
0,3 |
0,2 |
1,1 |
0,2 |
1,4 |
0,9 |
0,7 |
||||||||||
46 |
1,8 |
2,0 |
1,6 |
||||||||||||||||
47 |
0,8 |
1,0 |
1,2 |
1,2 |
2,5 |
1,9 |
1,2 |
||||||||||||
48 |
0,8 |
0,4 |
1,0 |
0,7 |
1,2 |
0,6 |
1,4 |
1,2 |
1,2 |
0,4 |
|||||||||
49 |
2,8 |
2,7 |
|||||||||||||||||
50 |
0,4 |
0,9 |
0,2 |
1,2 |
1,1 |
||||||||||||||
51 |
0,4 |
0,7 |
-0,5 |
0,1 |
-0,6 |
1,1 |
0,3 |
||||||||||||
52 |
1,3 |
||||||||||||||||||
53 |
0,6 |
1,7 |
1,5 |
1,3 |
|||||||||||||||
54 |
0,6 |
0,2 |
1,0 |
1,0 |
1,1 |
0,4 |
|||||||||||||
55 |
0,1 |
1,0 |
0,9 |
1,2 |
0,8 |
0,8 |
|||||||||||||
56 |
2,0 |
1,3 |
Верификация модели осуществляется путем копирования обучающей выборки в распознаваемую (рисунок 124), распознавания (рисунок 125, 126) и измерения дифференциальной и интегральной валидности (рисунок 127):
|
Рисунок 124. Режим "Ввод-корректировка обучающей выборки" системы "Эйдос" (копирование ее в распознаваемую – F5) |
|
Рисунок 125. Выбор режима "Пакетное распознавание" системы "Эйдос" |
|
Рисунок 126. Выполнение режима "Пакетное распознавание" системы "Эйдос" |
|
Рисунок 127. Выбор режима "Измерение адекватности модели" системы "Эйдос" |
|
Рисунок 128. Режим "Измерение адекватности модели" системы "Эйдос" |
Видим, что модель адекватна, т.к. интегральная валидность составляет 100%. Это означает, что при идентификации слов на основе знания входящих в них букв системой не было допущено ни одной ошибки, причем необходимо специально отметить, что при этом в модели не учитывались последовательность букв и их сочетаний.