Результат профилирования для всего набора данных зависит от размера анализируемого файла.

Так для набора данных размером менее 1 Гб считается следующий набор статистик:

  • Количество наблюдений.
  • Количество уникальных наблюдений.
  • Процент уникальных наблюдений (в процентах).
  • Количество дублирующих строк.
  • Процент дублирующих строк (в процентах).
  • Количество количественных переменных.
  • Количество категориальных переменных.
  • Количество переменных дат.

Для набора данных размером более 1 Гб:

  • Количество наблюдений.
  • Количество количественных переменных.
  • Количество категориальных переменных.
  • Количество переменных дат.
  • Нет меток