В таблице ниже представлен пример базового сценария с разбивкой по шагам.
№ | Шаг | Узлы |
---|---|---|
1 | Подключение набора данных | В любом из сценариев первоначальным узлом всегда должен быть «Набор данных». |
2 | Задание метаданных | Узел «Метаданные» позволяет изменить метаданные (например, задать предикторы и целевую переменную).
|
3 | Подготовка данных | Данный этап включает в себя процессы подготовки данных:
|
4 | Построение ML моделей | Узлы моделирования подразделяются в зависимости от решаемой задачи:
Узел «Дерево решений» Узел «Случайный лес» Узел «Логистическая регрессия» Узел «Линейные модели» Узел «Нейронная сеть» Узел «LDA» Узел «Градиентный бустинг (XGBoost)» Узел «Градиентный бустинг (LightGBM)» Узел «Градиентный бустинг (CatBoost)» Узел «Нейронная сеть (PyTorch)» Узел «AutoML» В результате выполнения данных узлов рассчитываются новые переменные, одна из которых – класс наблюдения, остальные – вероятность принадлежности к одному из классов (для каждого класса рассчитывается своя вероятность).
Узел «Дерево решений» Узел «Случайный лес» Узел «Байесовская регрессия» Узел «Линейная регрессия» Узел «Линейные модели» Узел «Нейронная сеть» Узел «Градиентный бустинг (XGBoost)» Узел «Градиентный бустинг (LightGBM)» Узел «Градиентный бустинг (CatBoost)» Узел «GLM» Узел «Нейронная сеть (PyTorch)» Узел «AutoML» В результате решения задачи регрессии в данных узлах рассчитывается переменная с результирующим значением.
Узел «Кластерный анализ (k-means)» Узел «Иерархическая кластеризация» В результате решения задачи кластеризации рассчитывается переменная, в которой указывается кластер, к которому относится данное наблюдение.
Узел «Ассоциативные правила»
Узел «Детекция аномалий»
|
5 | Работа с моделями | После процесса построения моделей и перебора гиперпараметров, идет этап интерпретации и сравнения построенных моделей. Для этого предусмотрены следующие узлы:
|
6 | Регистрация модели | На конечном этапе модель-победитель можно зарегистрировать в Репозитории MM (узел «Регистрация модели»). |