Вы просматриваете старую версию данной страницы. Смотрите текущую версию.

Сравнить с текущим просмотр истории страницы

Версия 1 Следующий »

Узел «Веса классов» позволяет скорректировать дисбаланс классов при помощи задания весов.
В задаче классификации данные называются несбалансированными, когда в обучающей выборке доли объектов разных классов существенно различаются. Для такой ситуации существуют разные стратегии перебалансировки данных (например, замена большого класса подвыборкой по мощности равной малому классу, или undersampling, который предусмотрен в узле «Sample»).
В узле «Веса классов» Пользователь может задать веса для объектов каждого из классов вручную, либо сбалансировать автоматически.
Список параметров узла представлен в таблице (Таблица 21).
Таблица 21 — Параметры узла «Веса классов»

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название узла, которое будет отображаться в интерфейсе

Описание

Ручной ввод
Ограничений на значение нет

Описание узла

Сбалансировать веса

Чекбокс

Выбор данного чекбокса указывает, что необходимо использовать автоматическую корректировку весов, которая считается обратно пропорционально частотам классов во входных данных.

Задать веса

Кнопка

При выборе кнопки открывается окно Задать веса, в котором необходимо задать вес каждому из классов.


В окне Задать веса Пользователь может вручную задать веса каждому из классов. Для этого необходимо:

  • Рядом с интересующей переменной выбрать иконку .
  • В столбце Вес задать необходимое значение.
  • Сохранить изменения, выбрав иконку .


Рисунок 101 — Окно Выбор переменных
Для работы узла достаточно выбрать чекбокс Сбалансировать веса и запустить расчет узла. Весы классов посчитаются автоматически (без необходимости указывать их вручную в окне Задать вес).
Результаты выполнения узла:

  • Таблица с примером полученных данных (Рисунок 102). Отображаются первые 100 наблюдений.


Рисунок 102 — Таблица с примером полученных данных
В результате выполнения узла в наборе данных будет рассчитана новая переменная с весами и ролью ClassWeight (имя переменной _class_weight_0).

  • Таблица с весами классов (Рисунок 103).


Рисунок 103 — Таблица с весами классов

  • Нет меток