Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Scroll Title
title-positiontop
title-alignmentright
titleПараметры узла «Дерево решений»

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название узла, которое будет отображаться в интерфейсе

Описание

Ручной ввод
Ограничений на значение нет

Описание узла

Критерий разбиения для классификации

Раскрывающийся список со следующими значениями:

  • gini (по умолчанию)
  • entropy

Данный параметр задает критерий разбиения на узлы для классификации. Предусмотрены следующие критерии:

  • gini (неопределенность Джини) –направлен на максимизацию количества пар объектов, одного класса, оказавшихся в одном поддереве.
  • entropy (критерий прироста информации, энтропия) – направлен на максимизацию прироста информации

Критерий разбиения для регрессии

Раскрывающийся список со следующими значениями:

  • squared error (по умолчанию)
  • friedman mse
  • absolute error
  • poisson

Данный параметр задает критерий разбиения для регрессионной задачи. Предусмотрены следующие критерии:

  • squared error (среднеквадратичная ошибка)
  • friedman mse (среднеквадратичная ошибка с оценкой улучшения Фридмана)
  • absolute error (средняя абсолютная ошибка)
  • poisson (отклонение Пуассона)

Стратегия разбиения

Раскрывающийся список со следующими значениями:

  • best (по умолчанию)
  • random

Данный параметр задает стратегию разделения на каждом узле. Предусмотрены следующие стратегии:

  • best – выбор наилучшей функции сегментации и точки сегментации
  • random – случайное разделение

Максимальная глубина

Ручной ввод
Неотрицательное число
По умолчанию — 5

Данный параметр задает максимальную глубину дерева, после достижения которой алгоритм останавливает работу

Минимальное количество наблюдений для разбиения

Ручной ввод
Неотрицательное число
По умолчанию — 2

Данный параметр задает минимальное количество наблюдений, которое должно быть в разбиении

Минимальное количество наблюдений в листе

Ручной ввод
Неотрицательное число
По умолчанию — 5

Данный параметр задает минимальное количество наблюдений, которое может быть в листе

Минимальная доля веса наблюдений в листе

Ручной ввод
Неотрицательное число
По умолчанию — 0

Данный параметр определяет минимальный весовой коэффициент выборки в листовом узле. По умолчанию наблюдения имеют одинаковый вес

Максимальное количество признаков

Раскрывающийся список со следующими значениями:

  • all (по умолчанию)
  • sqrt
  • log2
  • number
  • frac

Данный параметр определяет максимальное количество признаков, которое будет учитываться при поиске лучшего разделения. Предусмотрены следующие варианты:

  • all – учитывать все доступные признаки
  • sqrt – учитывать sqrt(число всех доступных признаков)
  • log2 – учитывать log2(число всех доступных признаков)
  • number – учитывать указанное число признаков
  • frac – учитывать int(указанное число * число всех доступных признаков)
    При выборе number или frac появится дополнительный параметр Число (вводится int) и Frac (вводится float) соответственно.

Seed

Ручной ввод
По умолчанию — 12345

Начальное числовое значение для генератора случайных чисел

Максимальное количество листов

Ручной ввод
Неотрицательное число

Данный параметр определяет максимальное количество листов в дереве

Минимальное снижение неоднородности

Ручной ввод
Неотрицательное число
По умолчанию — 0

Данный параметр определяет минимальное снижение неоднородности
Узел будет разделен, если это разделение вызовет уменьшение неоднородности большее или равное указанному значению

ccp_alpha
(отсечение с минимизацией стоимости-сложности)
Метод отсечения дерева

Ручной ввод
По умолчанию — 0

Данный параметр регулирует количество отсекаемых узлов. Чем больше значение ccp_alpha, тем большее количество узлов удаляется из дерева


Результаты выполнения узла:


Узел «Дерево решений» имеет разные результаты в зависимости от решаемой задачи.
Результаты бинарной классификации представлены следующими объектами:

  • График ROC .


Якорь_Ref91705494_Ref91705494Рисунок 127 — Пример графика ROC

  • График Lift.


Якорь_Ref91705570_Ref91705570
Рисунок 128 — Пример графика Lift

  • График Cumulative Lift.


Якорь_Ref91705653_Ref91705653
Рисунок 129 — Пример графика Cumulative Lift

  • График Gain.


Якорь_Ref91705726
_Ref91705726Рисунок 130 — Пример графика Gain

  • График Cumulative Gain (Рисунок 131).


Якорь_Ref91705870
_Ref91705870Рисунок 131 — Пример графика Cumulative Gain

  • Диаграмма дерева решений (Рисунок 132).


Якорь_Ref91705916
_Ref91705916Рисунок 132 — Пример графика дерева решений

  • Таблица с метриками качества модели (Рисунок 133).


Якорь_Ref91706491
_Ref91706491Рисунок 133 — Пример таблицы с метриками качества модели

  • Таблица с метриками качества модели для задачи классификации (Рисунок 134).


Якорь_Ref91706623_Ref91706623Рисунок 134 — Пример  Пример таблицы с метриками качества модели для задачи классификации

  • Таблица со списком переменных, сортированных по важности (Рисунок 135).


Якорь_Ref91706733
_Ref91706733 Якорь_Hlk91707335_Hlk91707335Рисунок 135 — Пример таблицы со списком переменных, отсортированных по важности


Результаты многоклассовой классификации представлены следующими объектами:

  • Диаграмма дерева решений (аналогично Рисунок 132).
  • Таблица с метриками качества модели (Рисунок 136).


anchor
_Ref91707360_Ref91707360Рисунок 136 — Пример таблицы с метриками качества модели

  • Таблица с метриками качества модели для задачи классификации (Рисунок 137).


anchor
_Ref91707406_Ref91707406Рисунок 137 — Пример таблицы с метриками качества модели для задачи классификации

  • Таблица со списком переменных, сортированных по важности (Рисунок 138).


Якорь_Ref91707511_Ref91707511 Якорь_Hlk91708150_Hlk91708150
Рисунок 138 — Пример таблицы со списком переменных, сортированных по важности


Результаты регрессии представлены следующими объектами:

  • Тепловые карты обучающей, тестовой и валидационной выборок (Рисунок 139).


Якорь_Ref91708195_Ref91708195
Рисунок 139 — Пример тепловой карты на данных обучающей выборки
"Тепловыекартыотражающие корреляцию или ассоциацию типа хи-квадрат первоначальных значений с целевыми признаками по сегментам.

  • Диаграмма дерева решений (Рисунок 140).


Якорь_Ref91708242_Ref91708242Рисунок 140 — Пример диаграммы дерева решений для задачи регрессии

  • Таблица с метриками качества модели (Рисунок 141).


Якорь_Ref91708619_Ref91708619Рисунок 141 — Пример таблицы с метриками качества модели

  • Таблица со списком переменных, сортированных по важности (Рисунок 138).