Иерархический кластерный анализ

Иерархический кластерный анализ - метод разбиения множества многомерных объектов на однородные группы, относящийся к классу агломеративных методов. Агломеративные методы последовательно объединяют отдельные объекты в кластеры.

Исходные данные:

Пусть Х(n x m) - матрица, описывающая n объектов в Rm. Алгоритм иерархической кластеризации заключается в последовательном слиянии кластеров с минимальным межкластерным расстоянием, начиная с n тривиальных кластеров по одному объекту в каждом и заканчивая на шаге n - Q после построения ровно Q кластеров.

Изначально расстояния между однообъектными кластерами – это расстояния между соответствующими объектами, и на каждом шаге пересчету подлежит только расстояние от вновь образованного кластера посредством слияния до оставшихся кластеров.

Межкластерное расстояние и, соответственно, метод пересчета межкластерного расстояния между произвольным кластером i и кластером, образованным посредством объединения кластеров jk может быть определен одним из способов:

Где ni, nj, nk - размеры кластеров.

Способы, используемые для определения первоначальных расстояний между объектами:

См. также:

Библиотека методов и моделей | ISmHierarchicalClusterAnalysis