После выбора в качестве источника файла типа:

  • XML,
  • XLS,
  • JSON или
  • CSV

и нажатия кнопки «Далее» открывается окно для загрузки файла.


Загрузка файла


Для загрузки файла следует выбрать файл для загрузки, нажав предварительно кнопку «Загрузить» или перетащив файл в окно, и нажать кнопку «Далее». Произойдет переход в окно проверки колонок загруженного файла. Для закрытия окна следует нажать кнопку, расположенную в верхнем правом углу окна, или нажать левую кнопку мыши вне области окна. Для возврата на предыдущий шаг (окно создания датасета на основе имеющегося источника) необходимо нажать кнопку «Назад» в нижнем левом углу окна.

Если в качестве источника выбран файл CSV, то в окне загрузки файла следует указать разделитель, а также используемую в файле кодировку.


Загрузка файла CSV


Доступны следующие виды кодировки файла для загрузки:

  • windows-1251;
  • utf-8;
  • utf-16;
  • koi8_r;
  • latin_1;
  • maccyrillic.

Проверка колонок

На шаге проверки колонок отображаются распознанные наименования колонок и их типы данных. Также для каждой колонки отображается переключатель, который служит для отключения создания колонки в создаваемом датасете. Для перехода на следующий шаг должен быть включен хотя бы один переключатель. По умолчанию все переключатели включены.

Для файлов форматов Excel и CSV типы данных колонок можно изменять. Для этого в колонке типов данных отображается кнопка выпадающего списка. Также тип данных может быть изменен позже в настройках датасета.


Окно проверки колонок. В колонке типов данных для каждой колонки отображается кнопка выпадающего списка


Сохранение датасета

После нажатия кнопки «Далее» в окне проверки колонок появляется окно, предназначенное для сохранения датасета:


Окно сохранения датасета


Окно состоит из следующих блоков:

  • Название датасета;
  • Описание датасета;
  • Права доступа к датасету.

Название и описание датасета

В полях «Название датасета» и «Описание датасета» необходимо ввести название и описание датасета. Название для датасетов на основе источников CSV, XLS, JSON, XML заполнится автоматически, для датасетов на основе других источников поле с названием датасета по умолчанию окажется пустым. Поле «Название датасета» является обязательным для заполнения, поле «Описание датасета» можно оставить пустым.

Настройка прав доступа

Для настройки прав доступа необходимо нажать на текстовую кнопку «Добавить». После нажатия откроется модальное окно с настройками прав доступа для отдельных пользователей и групп. Для просмотра подробной инструкции необходимо перейти в раздел Права доступа.

Сохранение 

После заполнения полей наименования и описания и установки прав доступа к датасету необходимо нажать кнопку  в окне сохранения датасета. Датасет сохранится, произойдет переход в список датасетов. Сохраненный датасет отобразится в списке датасетов. Для закрытия окна сохранения датасета следует нажать кнопку, расположенную в верхнем правом углу окна, или нажать левую кнопку мыши вне области окна. Для возврата на предыдущий шаг (окно проверки колонок) необходимо нажать на кнопку «Назад» в нижнем левом углу окна.


Правила распознавания данных для заполнения колонок

  1. Колонки определяются по заполненным ячейкам первой строки, а также включают в себя пустые столбцы, если они находятся среди заполненных, в случае файлов XLS и CSV. В случае файлов JSON и XML, колонки формируются из перечисления в columns.
  2. За название колонки берется значение ячейки первой строки, или порядковый номер столбца, когда ячейка пуста, в случае файлов XLS и CSV. В случае файлов JSON и XML, названия колонок указаны в перечислении columns.
  3. Тип данных колонки определяет первая, следующая после названия, заполненная ячейка. В случае обнаружения в ячейке, следующей за ячейкой, определяющей тип данных, типа данных, отличного от определенного, тип данных всей колонки определяется как «Строка».
  4. Колонка, содержащая только значения 1 и 0, НЕ определяется как содержащая тип данных «Булево».
  5. Тип данных «Дата» определяется, только когда дата находится в одном из форматов: 

    dd.mm.yyyy
    dd.mm.yyyy H
    dd.mm.yyyy H:M
    dd.mm.yyyy H:M:S
    dd.mm.yy
    dd.mm.yy H
    dd.mm.yy H:M
    dd.mm.yy H:M:S
    dd-mm-yyyy
    dd-mm-yyyy H
    dd-mm-yyyy H:M
    dd-mm-yyyy H:M:S
    dd-mm-yy
    dd-mm-yy H
    dd-mm-yy H:M
    dd-mm-yy H:M:S
    dd/mm/yyyy
    dd/mm/yyyy H
    dd/mm/yyyy H:M
    dd/mm/yyyy H:M:S
    dd/mm/yy
    dd/mm/yy H
    dd/mm/yy H:M
    dd/mm/yy H:M:S
    yyyy.mm.dd
    yyyy.mm.dd H
    yyyy.mm.dd H:M
    yyyy.mm.dd H:M:S
    yyyy-mm-dd
    yyyy-mm-dd H
    yyyy-mm-dd H:M
    yyyy-mm-dd H:M:S
    yyyy/mm/dd
    yyyy/mm/dd H
    yyyy/mm/dd H:M
    yyyy/mm/dd H:M:S 
  6. Тип данных «Дата» автоматически приводится к виду yyyy-mm-dd HH:MM:SSS, который потом может быть изменен в настройках датасета.
  • Нет меток