Узел «Веса классов» позволяет скорректировать дисбаланс классов при помощи задания весов.
В задаче классификации данные называются несбалансированными, когда в обучающей выборке доли объектов разных классов существенно различаются. Для такой ситуации существуют разные стратегии перебалансировки данных (например, замена большого класса подвыборкой по мощности равной малому классу, или undersampling, который предусмотрен в узле «Sample»).
В узле «Веса классов» Пользователь может задать веса для объектов каждого из классов вручную, либо сбалансировать автоматически.
Список параметров узла представлен в таблице (Таблица 21).
Таблица 21 — Параметры узла «Веса классов»
Параметр |
Возможные значения и ограничения |
Описание |
---|---|---|
Название |
Ручной ввод |
Название узла, которое будет отображаться в интерфейсе |
Описание |
Ручной ввод |
Описание узла |
Сбалансировать веса |
Чекбокс |
Выбор данного чекбокса указывает, что необходимо использовать автоматическую корректировку весов, которая считается обратно пропорционально частотам классов во входных данных. |
Задать веса |
Кнопка |
При выборе кнопки открывается окно Задать веса, в котором необходимо задать вес каждому из классов. |
В окне Задать веса Пользователь может вручную задать веса каждому из классов. Для этого необходимо:
- Рядом с интересующей переменной выбрать иконку .
- В столбце Вес задать необходимое значение.
- Сохранить изменения, выбрав иконку .
Рисунок 101 — Окно Выбор переменных
Для работы узла достаточно выбрать чекбокс Сбалансировать веса и запустить расчет узла. Весы классов посчитаются автоматически (без необходимости указывать их вручную в окне Задать вес).
Результаты выполнения узла:
- Таблица с примером полученных данных (Рисунок 102). Отображаются первые 100 наблюдений.
Рисунок 102 — Таблица с примером полученных данных
В результате выполнения узла в наборе данных будет рассчитана новая переменная с весами и ролью ClassWeight (имя переменной _class_weight_0).
- Таблица с весами классов (Рисунок 103).
Рисунок 103 — Таблица с весами классов