Узел «Стандартизация» приводит признаки в разных единицах измерения и диапазонах значений к общей шкале.
Стандартизация – преобразование числовых наблюдений с целью приведения их к некоторой общей шкале. Необходимость стандартизации вызвана тем, что разные признаки из обучающего набора могут быть представлены в разных масштабах и изменяться в разных диапазонах, что влияет на выявление некорректных зависимостей моделью.
Предусмотрены следующие методы:
- Стандартное отклонение (std) – преобразует наблюдения таким образом, чтобы их среднее значение равнялось нулю, а стандартное отклонение равнялось 1.
Диапазон (range) – линейно преобразует значения переменных в диапазон [0, 1].
Список параметров узла представлен в таблице (Таблица 20).
Таблица 20 — Параметры узла «Стандартизация»
Параметр |
Возможные значения и ограничения |
Описание |
---|---|---|
Название |
Ручной ввод |
Название узла, которое будет отображаться в интерфейсе |
Описание |
Ручной ввод |
Описание узла |
Префикс выходных переменных |
Ручной ввод |
Данный параметр задает префикс стандартизированным выходным переменным |
Выбор переменных |
Кнопка |
При выборе кнопки «Выбор переменных» открывается окно Выбор переменных, в котором необходимо выбрать переменные для стандартизации. |
В окне Выбор переменных Пользователь имеет возможность выбрать атрибут для стандартизации и указать метод. Для этого необходимо:
- Рядом с интересующей переменной выбрать иконку .
В выпадающих меню выбрать Метод (std или range) и ограничить диапазон при стандартизации в [0, 1] на скоринге (столбец Clip). Если в столбце Clip стоит нет, то при стандартизации в [0, 1] на обучающей выборке всё точно будет в [0, 1], а на других выборках не обязательно.
- Сохранить изменения, выбрав иконку .
Рисунок 99 — Окно Выбор переменных
Результаты выполнения узла:
- Таблица с примером полученных данных (Рисунок 100). Отображаются первые 100 наблюдений.
Рисунок 100 — Таблица с примером полученных данных
В результате выполнения узла в наборе данных будут рассчитаны новые стандартизированные переменные (с префиксом STD_).