Результат профилирования для всего набора данных зависит от размера анализируемого файла.
Так для набора данных размером менее 1 Гб считается следующий набор статистик:
- Количество наблюдений.
- Количество уникальных наблюдений.
- Процент уникальных наблюдений (в процентах).
- Количество дублирующих строк.
- Процент дублирующих строк (в процентах).
Для набора данных размером более 1 Гб:
- Количество наблюдений.
- Количество количественных переменных
- Количество категориальных переменных
- Количество переменных дат