Узел «Подбор отсечки» позволяет определить оптимальный порог отсечения. Порог отсечения нужен для того, чтобы относить новые примеры к одному из двух классов (задача бинарной классификации).
Список параметров узла представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Название | Ручной ввод | Название узла, которое будет отображаться в интерфейсе |
Описание | Ручной ввод | Описание узла |
Количество разбиений | Ручной ввод целочисленного значения | Данный параметр задает количество разбиений |
Размер бина для Lift | Ручной ввод целочисленного значения | Данный параметр задает размер бина для расчета Lift |
Критерий отсечки | Раскрывающийся список со следующими значениями:
| Данный параметр задает критерий выбора порога отсечения |
Отсечка | Ручной ввод | Данный параметр задает порог отсечки |
Результаты выполнения узла:
- Таблица со статистикой разбиения, в которой отражены следующие показатели:
- Cutoff value – значение порога отсечения (считается в соответствии с заданным параметром Количество разбиений).
- True Positives – количество верно классифицированных положительных примеров.
- False Positives – количество неверно классифицированных положительных примеров.
- True Negatives – количество верно классифицированных отрицательных примеров.
- False Negatives – количество неверно классифицированных отрицательных примеров.
- Predicted Positive – сумма True Positives и False Positives.
- Predicted Negative – сумма True Negatives и False Negatives.
- False Positives and Negatives – сумма False Positives и False Negatives
- True Positives and Negatives – сумма True Positives и True Negatives
- Accuracy – результат деления суммы True Positive и True Negative на сумму всех значений (доля правильных ответов).
- True Positive Rate (Recall, полнота) – доля найденных объектов класса к общему числу объектов класса. Показывает, насколько хорошо классификатор находит объекты из класса.
- True Negative Rate – доля верно классифицированных отрицательных примеров от общего количества отрицательных примеров.
- False Positive Rate – доля неверных срабатываний классификатора к общему числу объектов за пределами класса. Показывает, насколько часто классификатор ошибается при отнесении того или иного объекта к классу.
- Precision (точность) – показывает долю объектов класса среди объектов, выделенных классификатором.
- F-score – гармоническое среднее между точностью и полнотой.
- KS (Kolmogorov-Smirnov statistic).
- partition_id (если был в выборке).
- Таблица с метриками.