Узел «Подбор отсечки» позволяет определить оптимальный порог отсечения. Порог отсечения нужен для того, чтобы относить новые примеры к одному из двух классов (задача бинарной классификации).
Список параметров узла представлен в Таблица 47.
Таблица 47 — Параметры узла «Подбор отсечки (Cut off)»
Параметр |
Возможные значения и ограничения |
Описание |
---|---|---|
Название |
Ручной ввод |
Название узла, которое будет отображаться в интерфейсе |
Описание |
Ручной ввод |
Описание узла |
Количество разбиений |
Ручной ввод целочисленного значения |
Данный параметр задает количество разбиений |
Размер бина для Lift |
Ручной ввод целочисленного значения |
Данный параметр задает размер бина для расчета Lift |
Критерий отсечки |
Раскрывающийся список со следующими значениями:
|
Данный параметр задает критерий выбора порога отсечения |
Отсечка |
Ручной ввод |
Данный параметр задает порог отсечки |
Результаты выполнения узла:
- Таблица со статистикой разбиения (Рисунок 153), в которой отражены следующие показатели:
- Cutoff value – значение порога отсечения (считается в соответствии с заданным параметром Количество разбиений).
- True Positives – количество верно классифицированных положительных примеров.
- False Positives – количество неверно классифицированных положительных примеров.
- True Negatives – количество верно классифицированных отрицательных примеров.
- False Negatives – количество неверно классифицированных отрицательных примеров.
- Predicted Positive – сумма True Positives и False Positives.
- Predicted Negative – сумма True Negatives и False Negatives.
- False Positives and Negatives – сумма False Positives и False Negatives
- True Positives and Negatives – сумма True Positives и True Negatives
- Accuracy – результат деления суммы True Positive и True Negative на сумму всех значений (доля правильных ответов).
- True Positive Rate (Recall, полнота) – доля найденных объектов класса к общему числу объектов класса. Показывает, насколько хорошо классификатор находит объекты из класса.
- True Negative Rate – доля верно классифицированных отрицательных примеров от общего количества отрицательных примеров.
- False Positive Rate – доля неверных срабатываний классификатора к общему числу объектов за пределами класса. Показывает, насколько часто классификатор ошибается при отнесении того или иного объекта к классу.
- Precision (точность) – показывает долю объектов класса среди объектов, выделенных классификатором.
- F-score – гармоническое среднее между точностью и полнотой.
- KS (Kolmogorov-Smirnov statistic).
- partition_id (если был в выборке).
Рисунок 153 — Пример таблицы со статистикой разбиения
- Таблица с метриками (Рисунок 154).
Рисунок 154 — Пример таблицы с метриками