Данная вкладка представляет собой список с процедурами кластерного анализа, которые будут рассчитаны в ходе Исследования (Рисунок 29).
Рисунок 29 — Вкладка «Кластеризация» Мастера настройки
Кластеризация — это разбиение множества объектов на подмножества (кластеры) по заданному критерию.
На этапе исследования полезно получить априорную информацию об исходных данных, чтобы на этапе построения модели k-средних указать параметр, который будет увеличивать ее предсказательную способность.
Для создания новой процедуры кластерного анализа необходимо:
- Выбрать «Добавить кластер».
- В открывшемся окне Настройки кластеризации (Рисунок 30) задать параметры (подробнее в таблице (Таблица 1)).
- Сохранить параметры.
Рисунок 30 — Окно Настройки кластеризации
Таблица 1 — Параметры кластеризации
Параметр |
Возможные значения и ограничения |
Описание |
---|---|---|
Название |
Ручной ввод |
Название, которое будет отображаться в результатах исследования |
Количество кластеров |
Ручной ввод целочисленного значения больше 0 |
Задание числа кластеров, на которые будет делиться векторное пространство. |
Random Seed |
Ручной ввод числового значения |
Начальное числовое значение для генератора случайных чисел |
Тип инициализации |
Раскрывающийся список со следующими значениями:
|
Данные параметр отвечает за выбор метода инициализации начальных точек кластеров. Предусмотрены:
|
Тип стандартизации |
Раскрывающийся список со следующими значениями:
|
Данный параметр задает тип стандартизации данных. Предусмотрены:
|
Подготовить данные |
Чекбокс |
Выбор данного чекбокса указывает на необходимость подготовить данные |
Количество бинов в графике в параллельных координатах |
Ручной ввод целочисленного значения |
Данный параметр задает количество бинов, на которое делятся наблюдения для отображения на графике в параллельных координатах |
Атрибуты |
Список атрибутов, доступных в наборе данных |
Выбор атрибутов набора данных для проведения кластерного анализа |