Узел «Веса классов» позволяет скорректировать дисбаланс классов при помощи задания весов.
В задаче классификации данные называются несбалансированными, когда в обучающей выборке доли объектов разных классов существенно различаются. Для такой ситуации существуют разные стратегии перебалансировки данных (например, замена большого класса подвыборкой по мощности равной малому классу, или undersampling, который предусмотрен в узле «Sample»).
В узле «Веса классов» Пользователь может задать веса для объектов каждого из классов вручную, либо сбалансировать автоматически.
Список параметров узла представлен в таблице.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Название | Ручной ввод | Название узла, которое будет отображаться в интерфейсе |
Описание | Ручной ввод | Описание узла |
Сбалансировать веса | Чекбокс | Выбор данного чекбокса указывает, что необходимо использовать автоматическую корректировку весов, которая считается обратно пропорционально частотам классов во входных данных. |
Задать веса | Кнопка | При выборе кнопки открывается окно Задать веса, в котором необходимо задать вес каждому из классов. |
В окне Задать веса Пользователь может вручную задать веса каждому из классов. Для этого необходимо:
- Рядом с интересующей переменной выбрать иконку .
- В столбце Вес задать необходимое значение.
- Сохранить изменения, выбрав иконку .
Для работы узла достаточно выбрать чекбокс Сбалансировать веса и запустить расчет узла. Весы классов посчитаются автоматически (без необходимости указывать их вручную в окне Задать вес).
Результаты выполнения узла:
- Таблица с примером полученных данных. Отображаются первые 100 наблюдений.
В результате выполнения узла в наборе данных будет рассчитана новая переменная с весами и ролью ClassWeight (имя переменной _class_weight_0).
- Таблица с весами классов.