Узел «Стандартизация» приводит признаки в разных единицах измерения и диапазонах значений к общей шкале.

Стандартизация – преобразование числовых наблюдений с целью приведения их к некоторой общей шкале. Необходимость стандартизации вызвана тем, что разные признаки из обучающего набора могут быть представлены в разных масштабах и изменяться в разных диапазонах, что влияет на выявление некорректных зависимостей моделью.
Предусмотрены следующие методы:

  • Стандартное отклонение (std) – преобразует наблюдения таким образом, чтобы их среднее значение равнялось нулю, а стандартное отклонение равнялось 1.
  • Диапазон (range) – линейно преобразует значения переменных в диапазон [0, 1].


Список параметров узла представлен в таблице ниже.


Параметры узла «Стандартизация»

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название узла, которое будет отображаться в интерфейсе

Описание

Ручной ввод
Ограничений на значение нет

Описание узла

Префикс выходных переменных

Ручной ввод

Данный параметр задает префикс стандартизированным выходным переменным

Выбор переменных

Кнопка

При выборе кнопки «Выбор переменных» открывается окно Выбор переменных, в котором необходимо выбрать переменные для стандартизации.


В окне Выбор переменных Пользователь имеет возможность выбрать атрибут для стандартизации и указать метод. Для этого необходимо:

  • Рядом с интересующей переменной выбрать иконку
  • В выпадающих меню выбрать Метод (std или range) и ограничить диапазон при стандартизации в [0, 1] на скоринге (столбец Clip). Если в столбце Clip стоит нет, то при стандартизации в [0, 1] на обучающей выборке всё точно будет в [0, 1], а на других выборках не обязательно.
  • Сохранить изменения, выбрав иконку .


Окно Выбор переменных



Результаты выполнения узла:

  • Таблица с примером полученных данных. Отображаются первые 100 наблюдений.


Таблица с примером полученных данных


В результате выполнения узла в наборе данных будут рассчитаны новые стандартизированные переменные (с префиксом STD_).


  • Нет меток