Пример решения задания "Оценить
В подсистеме "Оптимизация" режиме "Исключение признаков с низкой селективной силой" получаем перечень признаков, ранжированных в порядке убывания среднего количества информации о направлении следования состава (таблица 50).
Таблица 50 – ПРИЗНАКИ В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ | |
08-11-04 18:49:35 г.Краснодар
================================================================ | N° | Код | Н а и м е н о в а н и е |Ценн.|Сумма| Сумма | |п/п |п.пр.| п р и з н а к о в | Бит | Бит | % | ================================================================ | 1| 14 |груз_2_коротких_прямоугольника.|0.476|0.476| 4.888| | 2| 17 |груз_3_маленьких_круга.........|0.476|0.953| 9.776| | 3| 3 |Кол-во_вагонов=2...............|0.431|1.384| 14.201| | 4| 18 |груза_нет......................|0.414|1.798| 18.448| | 5| 10 |груз_1_перевернутый_треугольник|0.405|2.202| 22.599| | 6| 15 |груз_2_маленьких_круга.........|0.405|2.607| 26.750| | 7| 30 |форма_вагона_ромбовидная.......|0.405|3.011| 30.901| | 8| 27 |форма_вагона_U-образная........|0.388|3.399| 34.885| | 9| 7 |груз_1_длинный_прямоугольник...|0.372|3.772| 38.705| | 10| 9 |груз_1_короткий_прямоугольник..|0.372|4.144| 42.526| | 11| 8 |груз_1_квадрат.................|0.358|4.502| 46.203| | 12| 11 |груз_1_ромб....................|0.358|4.861| 49.881| | 13| 13 |груз_1_шестиугольник...........|0.358|5.219| 53.559| | 14| 16 |груз_3_квадрата................|0.358|5.577| 57.236| | 15| 22 |крыша_вагона_двухскатная.......|0.358|5.936| 60.914| | 16| 31 |форма_вагона_эллипсоидная......|0.358|6.294| 64.591| | 17| 21 |крыша_вагона_гофрированная.....|0.358|6.652| 68.266| | 18| 2 |N_осей_вагона=3................|0.323|6.975| 71.577| | 19| 25 |стенки_вагона_двойные..........|0.315|7.290| 74.807| | 20| 4 |Кол-во_вагонов=3...............|0.304|7.594| 77.927| | 21| 28 |форма_вагона_V-образная........|0.280|7.873| 80.797| | 22| 24 |крыша_вагона_прямая............|0.266|8.139| 83.523| | 23| 5 |Кол-во_вагонов=4...............|0.263|8.402| 86.224| | 24| 29 |форма_вагона_прямоугольная.....|0.206|8.608| 88.340| | 25| 23 |крыша_вагона_отсутствует.......|0.201|8.809| 90.403| | 26| 12 |груз_1_треугольник.............|0.191|9.000| 92.358| | 27| 6 |груз_1_большой_круг............|0.190|9.190| 94.307| | 28| 19 |длина_вагона_длинный...........|0.160|9.350| 95.954| | 29| 20 |длина_вагона_короткий..........|0.158|9.508| 97.573| | 30| 1 |N_осей_вагона=2................|0.141|9.649| 99.015| | 31| 26 |стенки_вагона_одинарные........|0.096|9.745|100.000| ================================================================ Универсальная когнитивная аналитическая система НПП *ЭЙДОС* |
Накопительная диаграмма селективной силы (Парето-диаграмма) приведена на рисунке 94.
Рисунок 94. Парето-диаграмма ценности признаков для решения задач идентификации, прогнозирования и управления |
В подсистеме: "F3 Оптимизация" выбрать режим: "Исключение признаков с низкой селективной силой". В результате появится экранная форма, представленная на рисунке 102:
Рисунок 102. Экранная форма "Селективная сила признаков" |
Количественные значения селективной силы можно просмотреть, прокручивания экранную форму по горизонтали.
Более подробно эта информация представлена в таблице 55:
Таблица 55 – ПРИЗНАКИ (ГРАДАЦИИ ШКАЛ)
В ПОРЯДКЕ УБЫВАНИЯ СЕЛЕКТИВНОЙ СИЛЫ (ИНТ.ИНФ.)
10-10-04 16:15:55 г.Краснодар
=========================================================================================
|N°|Код |Код | Наименование | Наименование |Интегр.|Сумм.инт|Сумм.ин|
| |К.шк|град| классификационной шкалы | градации |инф-ть |инф. Бит| в % |
=========================================================================================
| 1| 5 | 19 |ОДЕЖДА:.................. Юбка...................| 0.470| 0.470| 4.147|
| 2| 3 | 10 |ЦВЕТ ГЛАЗ:............... Голубые................| 0.467| 0.938| 8.271|
| 3| 8 | 30 |ПОСЕЩАЕМОСТЬ:............ Плохая.................| 0.456| 1.393| 12.290|
| 4| 8 | 33 |ПОСЕЩАЕМОСТЬ:............ Очень хорошая..........| 0.438| 1.831| 16.150|
| 5| 2 | 8 |ЦВЕТ ВОЛОС:.............. Очень светлые..........| 0.437| 2.268| 20.002|
| 6| 1 | 3 |ДЛИНА ВОЛОС:............. Длинные................| 0.429| 2.697| 23.788|
| 7| 2 | 7 |ЦВЕТ ВОЛОС:.............. Крашеные...............| 0.421| 3.118| 27.502|
| 8| 1 | 2 |ДЛИНА ВОЛОС:............. Средние................| 0.418| 3.536| 31.192|
| 9| 7 | 28 |ДОСТАТОК:................ Ничего нет.............| 0.413| 3.949| 34.836|
|10| 5 | 17 |ОДЕЖДА:.................. Пиджак.................| 0.408| 4.357| 38.432|
|11| 7 | 25 |ДОСТАТОК:................ Есть автомобиль........| 0.408| 4.765| 42.027|
|12| 4 | 16 |НАЛИЧИЕ УКРАШЕНИЙ:.......
Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.
Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления |
Рисунок 138. Парето-диаграмма ценности букв для идентификации слов |
Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились
в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.
Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ
№ | Код | Буква | Ценность (бит) | Ценность (бит) "нарастающим итогом" | Ценность (%) "нарастающим итогом" | ||||||
1 | 66 | Э | 0,76988 | 0,76988 | 4,841 | ||||||
2 | 56 | У | 0,74529 | 1,51517 | 9,526 | ||||||
3 | 49 | М | 0,71090 | 2,22607 | 13,996 | ||||||
4 | 46 | Й | 0,69728 | 2,92335 | 18,380 | ||||||
5 | 61 | Ш | 0,68748 | 3,61083 | 22,703 | ||||||
6 | 47 | К | 0,68569 | 4,29652 | 27,014 | ||||||
7 | 67 | Ю | 0,66376 | 4,96028 | 31,187 | ||||||
8 | 52 | П | 0,66014 | 5,62042 | 35,338 | ||||||
9 | 64 | Ы | 0,65157 | 6,27199 | 39,434 | ||||||
10 | 41 | Д | 0,64023 | 6,91222 | 43,460 | ||||||
11 | 68 | Я | 0,63612 | 7,54834 | 47,459 | ||||||
12 | 44 | З | 0,62131 | 8,16965 | 51,366 | ||||||
13 | 65 | Ь | 0,59697 | 8,76662 | 55,119 | ||||||
14 | 38 | Б | 0,59622 | 9,36284 | 58,868 | ||||||
15 | 53 | Р | 0,58610 | 9,94894 | 62,553 | ||||||
16 | 59 | Ц | 0,57201 | 10,52095 | 66,149 | ||||||
17 | 40 | Г | 0,56958 | 11,09053 | 69,730 | ||||||
18 | 39 | В | 0,55490 | 11,64543 | 73,219 | ||||||
19 | 62 | Щ | 0,52045 | 12,16588 | 76,492 | ||||||
20 | 37 | А | 0,51477 | 12,68065 | 79,728 | ||||||
21 | 48 | Л | 0,50010 | 13,18075 | 82,872 | ||||||
22 | 54 | С | 0,47977 | 13,66052 | 85,889 | ||||||
23 | 55 | Т | 0,47498 | 14,13550 | 88,875 | ||||||
24 | 51 | О | 0,46548 | 14,60098 | 91,802 | ||||||
25 | 50 | Н | 0,45089 | 15,05187 | 94,637 | ||||||
26 | 45 | И | 0,43046 | 15,48233 | 97,343 | ||||||
27 | 42 | Е | 0,42253 | 15,90486 | 100,000 |