Результатом расчета является разбиение совокупности наблюдений на однородные группы, или кластеры.
Для удобства интерпретации результаты кластерного анализа представлены в отдельном контейнере со следующими объектами:
- Круговая диаграмма с количеством наблюдений в каждом кластере (Рисунок 45).
При наведении курсора мыши на сектор кластера можно узнать количество наблюдений в нем.
Рисунок 45 — Пример Круговой диаграммы с результатами кластеризации- График в параллельных координатах — Parallel Coordinates Plot (Рисунок 46)
Диаграмма с параллельными координатами позволяет интерпретировать построенные кластеры.
На диаграмме с параллельными координатами каждой переменной присваивается собственная ось. Оси располагаются параллельно друг другу, и каждая имеют свою собственную шкалу. Начальная ось отражает кластер, к которому модель отнесла наблюдение. Каждое наблюдение наносится на график в виде линии, пересекающейся с каждой из осей. Таким образом, пользователь может выявить паттерны и корреляции между разными переменными.
Рисунок 46 — Пример Графика в параллельных координатах- Силуэт — Silhouette Plot (Рисунок 47)
Значение Silhouette для каждого наблюдения является мерой того, насколько это наблюдение похоже на наблюдения в собственном кластере по сравнению с наблюдениями в других кластерах.
Значение Silhouette находится в диапазоне от -1 до 1. Высокое значение указывает на то, что наблюдение хорошо соответствует собственному кластеру и плохо соответствует другим кластерам.
Если большинство наблюдений имеют низкое или отрицательное значение Silhouette, тогда пользователь должен перестроить кластеризацию с большим или меньшим количеством кластеров.
Рисунок 47 — Пример Silhouette Plot- Таблица с координатами центроидов, где в качестве строк выступают номера кластеров и значения переменных, в которых находятся центроиды этих кластеров (Рисунок 48)
Рисунок 48 — Пример таблицы с координатами центроидов- Таблица со статистиками по кластерам (Рисунок 49). Содержит следующие статистики:
- Номер кластера.
- Количество наблюдений.
- Среднеквадратичное расстояние между наблюдениями внутри кластера.
- Сумма расстояний между наблюдениями внутри кластера.
- Расстояние между центроидом и ближайшим наблюдением.
- Расстояние между центроидом и наиболее удаленным наблюдением.
- Расстояние между центроидом и вторым по удаленности наблюдением.
- Расстояние между центроидом и третьим по удаленности наблюдением.
- Ближайший кластер.
- Расстояние до ближайшего центроида.
- Среднее расстояние между центроидом и наблюдениями в кластере.
- Сумма расстояний между наблюдениями и центроидом.
Рисунок 49 — Пример таблицы со статистиками кластеров- Информация по параметрам запуска (Рисунок 50). Соответствует интерфейсу окна Параметры кластеризации.
Рисунок 50 — Пример вкладки с параметрами запуска кластерного анализа- Таблица со статистиками по переменным кластера (Рисунок 51). По каждому кластеру отражены среднее и стандартное отклонение для каждой переменной.
Рисунок 51 — Пример таблицы со статистиками переменных по кластерам