Осуществить пересинтез модели и измерить, как изменилась ее адекватность
Под повторным синтезом (пересинтезом) модели понимается ее качественная модификация, осуществляемая путем включения в модель новых дополнительных классификационных и описательных шкал и градаций, представленных примерами в обучающей выборке.
Пересинтез модели обеспечивает возможность ее применения для идентификации объектов расширенной или новой генеральной совокупности.
Приведем пример синтеза новой модели, обобщающей предыдущую.
В модель добавлены новые классы распознавания (таблица 81).
Таблица 81 – КЛАССИФИКАЦИОННЫЕ ШКАЛЫ
№ | Наименования классов распознавания | ||
1 | Загадки о животных |
| |
2 | А.П.Чехов "Вишневый сад" | ||
3 | Ф.М.Достоевский "Преступление и наказание" | ||
4 | Н.В.Гоголь "Ревизор" | ||
5 | А.С.Грибоедов "Горе от ума" | ||
6 | И.А.Крылов | ||
7 | М.Ю.Лермонтов "Мцыри" | ||
8 | Фольклорные загадки о природе | ||
9 | Некрасов "Кому на Руси жить хорошо" | ||
10 | Пословицы |
Продолжение таблицы 81
№ | Наименования классов распознавания | ||
11 | А.С.Пушкин "Евгений Онегин" | ||
12 | Загадки о саде и огороде | ||
13 | В.Шекспир | ||
14 | М.А.Шолохов "Тихий Дон" | ||
15 | Скороговорки | ||
16 | Л.Н.Толстой "Война и мир" | ||
17 | И.С.Тургенев "Отцы и дети" |
Описательные шкалы и градации не приводятся, т.к. размерность составляет 6974 градации. Необходимо отметить, что текущая версия 12.5 системы "Эйдос" не имеет принципиальных ограничений на суммарное количество градаций классификационных и описательных шкал при синтезе модели и решении задач идентификации и прогнозирования, а также количество объектов обучающей выборки. Реально решались задачи с объемом обучающей выборки до 25000 объектов с 1500 классами и 7000 признаками. При этом был осуществлен синтез и исследование моделей, содержащих до 25 миллионов фактов.
В программном интерфейсе импорта данных из 17 исходных текстовых файлов, посвященных различным темам (см. таблицу 81) было сформировано 592 фрагмента, которые стали основой обучающей выборки.
После синтеза модели измеряется ее адекватность. Для этого обучающая выборка копируется в распознаваемую, после чего проводится распознавание и измерение валидности (рисунок 168). Продемонстрирована очень высокая внутренняя валидность новой модели.
Рисунок 168. Выходная форма с результатами измерения внутренней валидности после пересинтеза модели |