Этап исследования данных представляет собой процесс графического и статистического анализа, необходимый для проверки общего качества данных и поиска взаимосвязей атрибутов, тенденций и аномалий. Полученная на данном этапе информация позволяет сформулировать гипотезы о том, как данные помогут решить поставленную задачу.
Для этого в компоненте Исследование данных предусмотрены следующие инструменты:
- Графическое представление данных (одномерные и многомерные графики и таблицы).
- Профилирование данных (статистические характеристики).
- Корреляционные матрицы.
- Кластерный анализ.
- Статистические тесты.
- Периодический запуск исследования данных (постановка исследований на расписание).
Компонент включает в себя:
- Главный экран со списком доступных исследований.
- Мастер настройки исследования.
- Экран с результатами исследования.
- Окно постановки исследования на расписание.
- Вспомогательные окна настройки вида, пример данных и т.д.