Методы кластерного анализа
Термин "Кластерный анализ" впервые ввел Tryon в 1939.
Кластеризация – это операция автоматической классификации, в ходе которой объекты объединяются в группы (кластеры) таким образом, что внутри групп различия между объектами минимальны, а между группами – максимальны. При этом в ходе кластеризации не только определяется состав кластеров, но и сам их набор и границы.
Поэтому вполне обоснованно считается, что методы кластерного анализа используются в большинстве случаев тогда, когда нет каких-либо априорных гипотез относительно классов, т.е. исследование находится на первой эмпирической стадии: описательной.
Существует большое количество различных алгоритмов кластеризации, которые обычно связаны с полным перебором объектов и весьма трудоемки в вычислительном отношении, здесь же мы упомянем лишь о трех из них:
– объединение (древовидная кластеризация);
– двухвходовое объединение;
– метод K средних.
Рассмотрим кратко эти алгоритмы (описание взято с сайта http://StatSoft.ru).