Узел "AutoML" позволяет в автоматизированном режиме построить алгоритмы машинного обучения с различными параметрами и выбрать из них лучшую, исходя из заданной метрики качества.
Список параметров узла представлен в таблице ниже.
Параметр | Возможные значения и ограничения | Описание |
---|---|---|
Название | Ручной ввод | Название узла, которое будет отображаться в интерфейсе |
Описание | Ручной ввод | Описание узла |
Время на построение всех моделей, с | По умолчанию - 300 | Количество времени в секундах, которым ограничено выполнение данного узла |
Время на построение одной модели, с | По умолчанию - 30 | Количество времени в секундах, которым ограничено время построения одной модели |
Количество конфигураций подбора гиперпараметров | По умолчанию - 25 | Количество конфигураций подбора гиперпараметров для ускорения подбора с помощью алгоритма SMAC |
Размер ансамблевых моделей | По умолчанию - 5 | Максимальное количество моделей в ансамбле |
Количество лучших моделей в ансамбле | По умолчанию - 50 | Количество лучших моделей, участвующих в отборе в ансамбль |
Максимальное количество моделей на диске | По умолчанию - 50 | Максимальное количество моделей, которое будет построено в рамках временных ограничений |
Seed | По умолчанию - 42 | Начальное числовое значение для генератора случайных чисел |
Лимит памяти модели | По умолчанию - 3072 | Лимит памяти для обучения модели |
Типы предобработки переменных |
| Набор методов предобработки переменных, который будет использован при переборе вариантов моделей |
Типы используемых моделей |
| Набор алгоритмов, который будет использован при построении вариантов моделей |
Тип ресемплинга |
| Тип ресемплинга выборки |
% обучающей выборки для AutoML | По умолчанию - 0,67 | % Обучающей выборки, который будет использован для AutoML |
Перемешать наблюдения | Чекбокс | При выборе этой опции наблюдения будут перемешаны заново |
Количество параллельных потоков | По умолчанию - 0 | Параллельное исполнение |
Метрика | По умолчанию - MSE | Метрика, которую оптимизирует AutoML |
Коэффициент сжатия датасета | По умолчанию - 1 | Сжатие датасета для оптимизации памяти. Сжатие выполняется за счёт сокращения точности чисел с плавающей точкой. |