После выбора в качестве источника файлы типов:

  • xml
  • xls
  • json
  • csv

и нажатия кнопки «Далее» открывается окно для загрузки файла:


Загрузка файла


Для загрузки файла следует выбрать файл для загрузки, нажав предварительно кнопку «Загрузить» или перетащив файл в окно, и нажать кнопку «Далее». Произойдет переход в окно проверки колонок загруженного файла. Для закрытия окна следует нажать кнопку, расположенную в верхнем правом углу окна или нажать левую кнопку мыши вне области окна. Для возврата на предыдущий шаг (окно создания датасета на основе имеющегося источника) необходимо нажать на кнопку , расположенную в левом верхнем углу окна.

Если в качестве источника выбран csv файл, то в появившемся окне следует указать разделитель в значениях содержимого файла, а также используемую в файле кодировку: 


Загрузка csv файла


Доступны следующие виды кодировки файла для загрузки:

  • windows-1251;
  • utf-8;
  • utf-16;
  • koi8_r;
  • latin_1;
  • maccyrillic.

Для закрытия окна загрузки csv файла следует нажать кнопку, расположенную в верхнем правом углу окна или нажать левую кнопку мыши вне области окна. Для возврата на предыдущий шаг (окно создания датасета на основе имеющегося источника) необходимо нажать на кнопку , расположенную в левом верхнем углу окна.

JSON - файл

Для выбора источника рассмотрим на примере файла в формате JSON. Для выбора типа источника в формате JSON необходимо нажать на флажок, расположенный слева от названия источника и нажать кнопку :


Выбор источника - формат JSON


После нажатия кнопки откроется модальное окно с предложением загрузить файл. Необходимо выбрать файл в формате JSON, нажав на кнопку или перетащив файл в окно загрузки файла:


Загрузка файла - формат JSON


После загрузки файла система уведомляет пользователя, что «Файл успешно загружен». Необходимо перейти на следующий шаг, нажав на кнопку :


Успешная загрузка файла


После нажатия открывается модальное окно «Проверка колонок». На данном этапе пользователь может проверить наименования и отменить загрузку колонок с помощью «Switcher» в будущий датасет.

Для перехода на следующий шаг необходимо нажать на кнопку :


Проверка колонок


После нажатия открывается модальное окно «Сохранение». На данном этапе пользователь может изменить наименование и описание будущего датасета. Для установления прав доступа для других пользователей необходимо нажать на текстовую кнопку . Откроется модальное окно с настройками, где можно выбрать группы и пользователей для установления прав доступа. Для создания датасета необходимо нажать кнопку :


Сохранение


После нажатия датасет отобразится в списке созданных датасетов.

Для сброса загрузки датасета необходимо нажать на или на свободную область вне модального окна.

XML - файл

Для выбора источника рассмотрим на примере файла в формате XML. Для выбора типа источника в формате XML необходимо нажать на флажок, расположенный слева от названия источника и нажать кнопку :


Выбор источника - формат XML


После нажатия кнопки откроется модальное окно с предложением загрузить файл. Необходимо выбрать файл в формате XML, нажав на кнопку или перетащив файл в окно загрузки файла:


Загрузка файла - формат XML


После загрузки файла, система уведомляет пользователя, что «Файл успешно загружен». Необходимо перейти на следующий шаг нажав на кнопку :


Успешная загрузка файла


После нажатия открывается модальное окно «Проверка колонок». На данном этапе пользователь может проверить наименования и отменить загрузку колонок с помощью «Switcher» в будущий датасет.

Для перехода на следующий шаг необходимо нажать на кнопку :


Проверка колонок


После нажатия открывается модальное окно «Сохранение». На данном этапе пользователь может изменить наименование и описание будущего датасета. Для установления прав доступа для других пользователей необходимо нажать на текстовую кнопку . Откроется модальное окно с настройками, где можно выбрать группы и пользователей для установления прав доступа. Для создания датасета необходимо нажать кнопку :


Сохранение


После нажатия датасет отобразится в списке созданных датасетов.

Для сброса загрузки датасета необходимо нажать на или на свободную область вне модального окна.

Сохранение датасета

После нажатия кнопки «Далее» в окне проверки колонок появляется финальное окно, предназначенное для сохранения датасета:


Окно сохранения датасета


Окно состоит из следующих блоков:

  • Название датасета;
  • Описание датасета;
  • Права доступа к датасету.

Название и описание датасета

В полях «Название датасета» и «Описание датасета» необходимо ввести название и описание датасета. Название для датасетов на основе источников csv, xls, json, xml заполнится автоматически, для датасетов на основе других источников поле с названием датасета по умолчанию окажется пустым. Поле «Название датасета» является обязательным для заполнения, поле «Описание датасета» можно оставить пустым.

Настройка прав доступа

Для настройки прав доступа необходимо нажать на текстовую кнопку «Добавить». После нажатия откроется модальное окно с настройками прав доступа для отдельных пользователей и групп. Для просмотра подробной инструкции необходимо перейти в раздел - Права доступа

Сохранение 

После заполнения полей наименования и описания и установки прав доступа к датасету необходимо нажать кнопку  в окне сохранения датасета. Датасет сохранится, произойдет переход в список датасетов. Сохраненный датасет отобразится в списке датасетов. Для закрытия окна сохранения датасета следует нажать кнопку, расположенную в верхнем правом углу окна или нажать левую кнопку мыши вне области окна. Для возврата на предыдущий шаг (окно проверки колонок) необходимо нажать на кнопку , расположенную в левом верхнем углу окна.


Правила распознавания данных для заполнения колонок

  1. Колонки определяются по заполненным ячейкам первой строки, а также включают в себя пустые столбцы, если они находятся среди заполненных, в случае файлов XLS и CSV. В случае файлов JSON и XML, колонки формируются из перечисления в columns.
  2. За название колонки берется значение ячейки первой строки, или порядковый номер столбца, когда ячейка пуста, в случае файлов XLS и CSV. В случае файлов JSON и XML, названия колонок указаны в перечислении columns.
  3. Тип данных колонки определяет первая, следующая после названия, заполненная ячейка. В случае обнаружения в ячейке, следующей за ячейкой, определяющей тип данных, типа данных, отличного от определенного, то тип данных всей колонки определяется как «Строка».
  4. Колонка, содержащая только значения 1 и 0, НЕ определяется как содержащая тип данных «Булево».
  5. Тип данных «Дата» определяется только когда дата находится в одном из форматов: 

    dd.mm.yyyy
    dd.mm.yyyy H
    dd.mm.yyyy H:M
    dd.mm.yyyy H:M:S
    dd.mm.yy
    dd.mm.yy H
    dd.mm.yy H:M
    dd.mm.yy H:M:S
    dd-mm-yyyy
    dd-mm-yyyy H
    dd-mm-yyyy H:M
    dd-mm-yyyy H:M:S
    dd-mm-yy
    dd-mm-yy H
    dd-mm-yy H:M
    dd-mm-yy H:M:S
    dd/mm/yyyy
    dd/mm/yyyy H
    dd/mm/yyyy H:M
    dd/mm/yyyy H:M:S
    dd/mm/yy
    dd/mm/yy H
    dd/mm/yy H:M
    dd/mm/yy H:M:S
    yyyy.mm.dd
    yyyy.mm.dd H
    yyyy.mm.dd H:M
    yyyy.mm.dd H:M:S
    yyyy-mm-dd
    yyyy-mm-dd H
    yyyy-mm-dd H:M
    yyyy-mm-dd H:M:S
    yyyy/mm/dd
    yyyy/mm/dd H
    yyyy/mm/dd H:M
    yyyy/mm/dd H:M:S 
  6. Тип данных «Дата» автоматически приводится к виду yyyy-mm-dd HH:MM:SSS, который потом может быть изменен в настройках датасета.
  • Нет меток