Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

Версия 1 Следующий »

Узел «Подбор отсечки» позволяет определить оптимальный порог отсечения. Порог отсечения нужен для того, чтобы относить новые примеры к одному из двух классов (задача бинарной классификации).
Список параметров узла представлен в Таблица 47.
Таблица 47 — Параметры узла «Подбор отсечки (Cut off)»

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название узла, которое будет отображаться в интерфейсе

Описание

Ручной ввод
Ограничений на значение нет

Описание узла

Количество разбиений

Ручной ввод целочисленного значения
По умолчанию — 100

Данный параметр задает количество разбиений

Размер бина для Lift

Ручной ввод целочисленного значения
По умолчанию — 20

Данный параметр задает размер бина для расчета Lift

Критерий отсечки

Раскрывающийся список со следующими значениями:

  • Число (по умолчанию)
  • Колмогорова-Смирнова

Данный параметр задает критерий выбора порога отсечения

Отсечка

Ручной ввод
Число больше 0 меньше 1
По умолчанию — 0,5

Данный параметр задает порог отсечки

Результаты выполнения узла:

  • Таблица со статистикой разбиения (Рисунок 153), в которой отражены следующие показатели:
    • Cutoff value – значение порога отсечения (считается в соответствии с заданным параметром Количество разбиений).
    • True Positives – количество верно классифицированных положительных примеров.
    • False Positives – количество неверно классифицированных положительных примеров.
    • True Negatives – количество верно классифицированных отрицательных примеров.
    • False Negatives – количество неверно классифицированных отрицательных примеров.
    • Predicted Positive – сумма True Positives и False Positives.
    • Predicted Negative – сумма True Negatives и False Negatives.
    • False Positives and Negatives – сумма False Positives и False Negatives
    • True Positives and Negatives – сумма True Positives и True Negatives
    • Accuracy – результат деления суммы True Positive и True Negative на сумму всех значений (доля правильных ответов).
    • True Positive Rate (Recall, полнота) – доля найденных объектов класса к общему числу объектов класса. Показывает, насколько хорошо классификатор находит объекты из класса.
    • True Negative Rate – доля верно классифицированных отрицательных примеров от общего количества отрицательных примеров.
    • False Positive Rate – доля неверных срабатываний классификатора к общему числу объектов за пределами класса. Показывает, насколько часто классификатор ошибается при отнесении того или иного объекта к классу.
    • Precision (точность) – показывает долю объектов класса среди объектов, выделенных классификатором.
    • F-score – гармоническое среднее между точностью и полнотой.
    • KS (Kolmogorov-Smirnov statistic).
    • partition_id (если был в выборке).


Рисунок 153 — Пример таблицы со статистикой разбиения

  • Таблица с метриками (Рисунок 154).


Рисунок 154 — Пример таблицы с метриками

  • Нет меток