Узел «Стандартизация» приводит признаки в разных единицах измерения и диапазонах значений к общей шкале.
Стандартизация – преобразование числовых наблюдений с целью приведения их к некоторой общей шкале. Необходимость стандартизации вызвана тем, что разные признаки из обучающего набора могут быть представлены в разных масштабах и изменяться в разных диапазонах, что влияет на выявление некорректных зависимостей моделью.
Предусмотрены следующие методы:
- Стандартное отклонение (std) – преобразует наблюдения таким образом, чтобы их среднее значение равнялось нулю, а стандартное отклонение равнялось 1.
- Диапазон (range) – линейно преобразует значения переменных в диапазон [0, 1].
Список параметров узла представлен в таблице.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Название | Ручной ввод | Название узла, которое будет отображаться в интерфейсе |
Описание | Ручной ввод | Описание узла |
Префикс выходных переменных | Ручной ввод | Данный параметр задает префикс стандартизированным выходным переменным |
Выбор переменных | Кнопка | При выборе кнопки «Выбор переменных» открывается окно Выбор переменных, в котором необходимо выбрать переменные для стандартизации. |
В окне Выбор переменных Пользователь имеет возможность выбрать атрибут для стандартизации и указать метод. Для этого необходимо:
- Рядом с интересующей переменной выбрать иконку
- В выпадающих меню выбрать Метод (std или range) и ограничить диапазон при стандартизации в [0, 1] на скоринге (столбец Clip). Если в столбце Clip стоит нет, то при стандартизации в [0, 1] на обучающей выборке всё точно будет в [0, 1], а на других выборках не обязательно.
- Сохранить изменения, выбрав иконку .
Результаты выполнения узла:
- Таблица с примером полученных данных. Отображаются первые 100 наблюдений.
В результате выполнения узла в наборе данных будут рассчитаны новые стандартизированные переменные (с префиксом STD_).