Этап построения моделей включает в себя обширный пласт работ. Первоначально необходимо нормализовать и доработать данные согласно полученной на этапе их исследования информации и решаемой задачи. Сам процесс обучения происходит итерационно — пробуются разные модели, перебираются гиперпараметры, сравниваются значения выбранной метрики качества и выбирается лучшая комбинация. Также перед переходом к внедрению нужно убедиться, что результат моделирования понятен и логичен.
С учетом этих шагов в компоненте Построение моделей предусмотрены инструменты:
- Подготовки данных (обработка пропусков, расчет новых показателей, фильтрация и т.д.).
- Алгоритмы машинного обучения (включающие в себя широкий список методов обучения с учителем и обучения без учителя).
- Разделение набора данных на выборки для обучения, валидации и тестирования.
- Кросс-валидация.
- Автоподбор параметров.
- Оценки результатов (метрики и диаграммы оценки с учетом типа задачи).
- Сравнения моделей.
- Интерпретации моделей.
- Регистрация моделей в Репозиторий.
Компонент включает в себя:
- Главный экран со списком доступных проектов моделирования (проектов MD).
- Конструктор сценариев.
- Вспомогательные окна настройки вида, создания проекта и т.д.