Интеллектуальные информационные системы


Пример решения задания Оценить


Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.

Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления

Рисунок 138. Парето-диаграмма ценности букв для идентификации слов

Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились

в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.

Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ

Код

Буква

Ценность (бит)

Ценность (бит)

"нарастающим итогом"

Ценность (%)

"нарастающим итогом"

1

66

Э

0,76988

0,76988

4,841

2

56

У

0,74529

1,51517

9,526

3

49

М

0,71090

2,22607

13,996

4

46

Й

0,69728

2,92335

18,380

5

61

Ш

0,68748

3,61083

22,703

6

47

К

0,68569

4,29652

27,014

7

67

Ю

0,66376

4,96028

31,187

8

52

П

0,66014

5,62042

35,338

9

64

Ы

0,65157

6,27199

39,434

10

41

Д

0,64023

6,91222

43,460

11

68

Я

0,63612

7,54834

47,459

12

44

З

0,62131

8,16965

51,366

13

65

Ь

0,59697

8,76662

55,119

14

38

Б

0,59622

9,36284

58,868

15

53

Р

0,58610

9,94894

62,553

16

59

Ц

0,57201

10,52095

66,149

17

40

Г

0,56958

11,09053

69,730

18

39

В

0,55490

11,64543

73,219

19

62

Щ

0,52045

12,16588

76,492

20

37

А

0,51477

12,68065

79,728

21

48

Л

0,50010

13,18075

82,872

22

54

С

0,47977

13,66052

85,889

23

55

Т

0,47498

14,13550

88,875

24

51

О

0,46548

14,60098

91,802

25

50

Н

0,45089

15,05187

94,637

26

45

И

0,43046

15,48233

97,343

27

42

Е

0,42253

15,90486

100,000




Начало  Назад  Вперед