Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Scroll Title
title-positiontop
title-alignmentright
titleПараметры кластеризации

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название, которое будет отображаться в результатах исследования

Количество кластеров

Ручной ввод целочисленного значения больше 0
По умолчанию — 5

Задание числа кластеров, на которые будет делиться векторное пространство.

Random Seed

Ручной ввод числового значения
По умолчанию — 42

Начальное числовое значение для генератора случайных чисел

Тип инициализации

Раскрывающийся список со следующими значениями:

  • k-means++ (По умолчанию)
  • Forgy
  • Random

Данные параметр отвечает за выбор метода инициализации начальных точек кластеров. Предусмотрены:

  • k-means++
    Идея метода k-means++ состоит в том, чтобы выбрать начальные точки, которые находятся как можно дальше друг от друга.
  • Forgy
    Метод Forgy случайным образом выбирает k наблюдений (по числу заданных кластеров) из набора данных и использует их в качестве начальных значений.
  • Random
    Метод Random сначала случайным образом назначает кластер каждому наблюдению, а затем переходит к этапу обновления, таким образом вычисляя начальное среднее значение как центроид случайно назначенных точек кластера.

Тип стандартизации

Раскрывающийся список со следующими значениями:

  • Не выбрано
  • Стандартное отклонение (По умолчанию)
  • Нормализация

Данный параметр задает тип стандартизации данных. Предусмотрены:

  • Не выбрано
    Не стандартизировать
  • Стандартное отклонение
    Из каждого записи вычитается среднее значение и результат делится на стандартное отклонение
  • Нормализация
    Из каждой записи вычитается минимальное значение и результат делиться на разницу между максимальным и минимальным значением

Подготовить данные

Чекбокс

Выбор данного чекбокса указывает на необходимость подготовить данные:

  • Заменить пропущенные значения количественной переменной на mean
  • Замена пропущенные значения категориальной переменной на текстовый None

Количество бинов в графике в параллельных координатах

Ручной ввод целочисленного значения
Больше 0
По умолчанию — 10

Данный параметр задает количество бинов, на которое делятся наблюдения для отображения на графике в параллельных координатах

Атрибуты

Список атрибутов, доступных в наборе данных

Выбор атрибутов набора данных для проведения кластерного анализа