Сравнение версий

Ключ

  • Эта строка добавлена.
  • Эта строка удалена.
  • Изменено форматирование.

...

Профиль данных рассчитывается по всему набору данных и по каждой из переменных и зависит от ее типа (для категориальных и количественных переменных разный набор статистик).

Для того, чтобы отобразить статистики по нужной переменной, необходимо выбрать ее в списке.

...

Scroll Title
title-alignmentcenter
titleПример профиля данных


Общие статистики

Для всех наблюдений набора данных считается следующий набор статистик (пункт Статистика по набору данных):

...

Категориальные переменные

Для категориальных переменных рассчитывается набор статистик в соответствии с таблицей ниже.

...

Облако слов (или облако тегов) визуализирует частоту появления значения переменной. Размер облака отражает частоту появления значения. Цветовая гамма не несет в себе смысла и выполняет исключительно эстетическую функцию.

Посмотреть Облако слов можно в том же контейнере с профилированием, выбрав в правом верхнем углу иконку .

...

Количественные переменные

Для количественных переменных посчитывается набор статистик в соответствии с таблицей ниже.

...

Гистограмма визуализирует распределение данных в рамках непрерывного интервала. На горизонтальной оси отмечаются интервалы (бины), а на вертикальной оси отмечается частота попаданий наблюдений в каждый интервал. Количество бинов не изменяемо и по умолчанию равно 50.

Посмотреть гистограмму можно в том же контейнере, выбрав в правом верхнем углу иконку .

...