Узел «Стандартизация» приводит признаки в разных единицах измерения и диапазонах значений к общей шкале.
Стандартизация – преобразование числовых наблюдений с целью приведения их к некоторой общей шкале. Необходимость стандартизации вызвана тем, что разные признаки из обучающего набора могут быть представлены в разных масштабах и изменяться в разных диапазонах, что влияет на выявление некорректных зависимостей моделью.
Предусмотрены следующие методы:
- Стандартное отклонение (std) – преобразует наблюдения таким образом, чтобы их среднее значение равнялось нулю, а стандартное отклонение равнялось 1.
*Диапазон (range) * – линейно преобразует значения переменных в диапазон \ [0, 1\].Wiki разметка
Список параметров узла представлен в таблице (Таблица 20). Якорь
Scroll Title | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||
|
В окне Выбор переменных Пользователь имеет возможность выбрать атрибут для стандартизации и указать метод. Для этого необходимо:
- Рядом с интересующей переменной выбрать иконку .unmigrated-wiki-markup
- В выпадающих меню выбрать *Метод * (std или range) и ограничить диапазон при стандартизации в \ [0, 1\] на скоринге (столбец *Clip{*}). Если в столбце *Clip* стоит нет, то при стандартизации в \ [0, 1\] на обучающей выборке всё точно будет в \ [0, 1\], а на других выборках не обязательно.
- Сохранить изменения, выбрав иконку .
...
...
Scroll Title | ||||
---|---|---|---|---|
| ||||
Результаты выполнения узла:
- Таблица с примером полученных данных (Рисунок 100). Отображаются первые 100 наблюдений.
...
...
Scroll Title | ||||
---|---|---|---|---|
| ||||
В результате выполнения узла в наборе данных будут рассчитаны новые стандартизированные переменные (с префиксом STD_).