Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

Узел «Разделение выборки» разбивает набор данных на части: обучающую (используемую в процессе обучения модели), валидационную (используемую для подбора оптимального набора гиперпараметров модели) и тестовую согласно заданным Пользователем пропорциям (Рисунок 68). Image Removed
Якорь_Ref107914797_Ref107914797Рисунок 68 —


Scroll Title
title-alignmentcenter
titleПринцип работы узла «Разделение выборки»

Image Added


Разбиение можно произвести двумя способами:

...


Список параметров узла представлен в таблице (Таблица 9).
Якорь_Ref91589559_Ref91589559Таблица 9 — ниже.


Scroll Title
title-alignmentright
titleПараметры узла «Разделение выборки»

Параметр

Возможные значения и ограничения

Описание

Название

Ручной ввод
Ограничений на значение нет

Название узла, которое будет отображаться в интерфейсе

Описание

Ручной ввод
Ограничений на значение нет

Описание узла

Разделение выборки на части

Ручной ввод доли (в %) для каждой части
Сумма долей должна быть равна 100%

Доли обучающей, валидационной и тестовой выборок в исходном наборе данных

Метод разбиения

Раскрывающийся список со следующими значениями:

  • Simple Random (по умолчанию)
  • Stratified

Метод разбиения исходного набора данных. Предусмотрены:

  • Simple Random — все наблюдения имеют одинаковый шанс быть отобранными
  • Stratified — случайный отбор наблюдений выполняется в пределах каждого класса (при выборе данного метода появится поле «Список входных переменных» для указания переменной, по которой будет проводиться стратификация)

Seed

Ручной ввод числового значения
По умолчанию — 12345

Начальное числовое значение для генератора случайных чисел
Используется для воспроизведения результатов при повторном запуске


Результаты выполнения узла:

  • Таблица с примером данных (Рисунок 69). Отображаются первые 100 наблюдений.

...

Scroll Title
title-alignmentcenter
titleТаблица с примером данных

Image Added


В результате выполнения узла будет рассчитана новая переменная, по которой далее будет производиться разделение набора данных на выборки (переменная _partid_0).

  • Таблица с указанием долей и количества наблюдений, попавших в соответствующую выборку (Рисунок 70).

...


...

Scroll Title
title-alignmentcenter
titleПример таблицы с указанием выборок и количества наблюдений

Image Added