Узел «Веса классов» позволяет скорректировать дисбаланс классов при помощи задания весов.
В задаче классификации данные называются несбалансированными, когда в обучающей выборке доли объектов разных классов существенно различаются. Для такой ситуации существуют разные стратегии перебалансировки данных (например, замена большого класса подвыборкой по мощности равной малому классу, или undersampling, который предусмотрен в узле «Sample»).
В узле «Веса классов» Пользователь может задать веса для объектов каждого из классов вручную, либо сбалансировать автоматически.
Список параметров узла представлен в таблице (Таблица 21). Якорь
Scroll Title | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||
|
В окне Задать веса Пользователь может вручную задать веса каждому из классов. Для этого необходимо:
- Рядом с интересующей переменной выбрать иконку .
- В столбце Вес задать необходимое значение.
- Сохранить изменения, выбрав иконку .
...
- .
Scroll Title | ||||
---|---|---|---|---|
| ||||
Для работы узла достаточно выбрать чекбокс Сбалансировать веса и запустить расчет узла. Весы классов посчитаются автоматически (без необходимости указывать их вручную в окне Задать вес).
Результаты выполнения узла:
- Таблица с примером полученных данных (Рисунок 102). Отображаются первые 100 наблюдений.
...
...
Scroll Title | ||||
---|---|---|---|---|
| ||||
В результате выполнения узла в наборе данных будет рассчитана новая переменная с весами и ролью ClassWeight (имя переменной _class_weight_0).
- Таблица с весами классов (Рисунок 103).
...
...
Scroll Title | ||||
---|---|---|---|---|
| ||||