Статические исходные данные для кластеризации – это набор объектов с несколькими суммарными характеристиками. Число этих характеристик ничем не ограничено. В Polymatica Analytics для этого нужно вынести в левую часть рабочей зоны одну размерность. Можно вынести и несколько размерностей, но кластеризация будет обрабатывать элементы только самой левой размерности.
Например, можно провести кластеризацию регионов по следующим признакам:
- соотношение заявок и конкурсов: сколько заявок было подано на один конкурс;
- полученная экономия: какой процент от суммы конкурса сэкономил заказчик.
Эти исходные данные можно проиллюстрировать с помощью графика Точечный, какпоказано на рисунке ниже:
После отметок нужных фактов и элементов размерности осталось только нажать кнопку Кластеризация, и система автоматически определит оптимальное число групп и отнесет похожих по обоим параметрам заказчиков в соответствующую группу. Результат кластеризации отображается на том же графике Точечный:
На рисунке выше видны границы кластеров. Также виден новый факт Расстояние 1, который показывает расстояние каждого элемента до центра группы – то есть элемент с самым маленьким расстоянием находится ближе всего к центру группы и является, таким образом, ее типичным представителем.
Как выполнить статическую кластеризацию
Для проведения статической кластеризации:
- Добавьте влево размерность, элементы которой требуется кластеризовать.
- При необходимости отфильтруйте или сгруппируйте данные.
- При необходимости выделите факты. Если факты не будут выделены, кластеризация будет выполнена по всем видимым фактам.
- Нажмите кнопку Кластеризация.
Будут определены максимально близкие друг к другу элементы левой размерности, которые будут объединены в кластеры.
Результатом анализа будет новая размерность Кластеризация N, где индекс N (размерности и факта кластеризации) – порядковый номер кластеризации, и новый факт Расстояние N.