Данная вкладка представляет собой список с процедурами кластерного анализа, которые будут рассчитаны в ходе Исследования.
Кластеризация — это разбиение множества объектов на подмножества (кластеры) по заданному критерию.
На этапе исследования полезно получить априорную информацию об исходных данных, чтобы на этапе построения модели k-средних указать параметр, который будет увеличивать ее предсказательную способность.
Для создания новой процедуры кластерного анализа необходимо:
- Выбрать «Добавить кластер».
- В открывшемся окне Настройки кластеризации задать параметры (подробнее в таблице ниже).
- Сохранить параметры.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Название | Ручной ввод | Название, которое будет отображаться в результатах исследования |
Количество кластеров | Ручной ввод целочисленного значения больше 0 | Задание числа кластеров, на которые будет делиться векторное пространство. |
Random Seed | Ручной ввод числового значения | Начальное числовое значение для генератора случайных чисел |
Тип инициализации | Раскрывающийся список со следующими значениями:
| Данные параметр отвечает за выбор метода инициализации начальных точек кластеров. Предусмотрены:
|
Тип стандартизации | Раскрывающийся список со следующими значениями:
| Данный параметр задает тип стандартизации данных. Предусмотрены:
|
Подготовить данные | Чекбокс | Выбор данного чекбокса указывает на необходимость подготовить данные |
Количество бинов в графике в параллельных координатах | Ручной ввод целочисленного значения | Данный параметр задает количество бинов, на которое делятся наблюдения для отображения на графике в параллельных координатах |
Атрибуты | Список атрибутов, доступных в наборе данных | Выбор атрибутов набора данных для проведения кластерного анализа |