После выбора в качестве источника файла типа:

и нажатия кнопки «Далее» открывается окно для загрузки файла.



Для загрузки файла следует выбрать файл для загрузки, нажав предварительно кнопку «Загрузить» или перетащив файл в окно, и нажать кнопку «Далее». 

Если в качестве источника выбран файл CSV, то в окне загрузки файла следует указать разделитель, а также используемую в файле кодировку.



Доступны следующие виды кодировки файла для загрузки:

Для перехода на следующий этап необходимо нажать кнопку «Далее 2/4». 

Структуры данных файлов для создания датасетов

XSLX

Файл для создания датасета из Excel должен иметь следующий формат:

CSV

Файл для создания датасета из CSV должен иметь следующий формат (разделитель может быть иным):

XML

Файл для создания датасета из XML должен иметь следующий формат:

JSON

Файл для создания датасета из JSON должен иметь следующий формат:

Правила распознавания данных для заполнения колонок

  1. Колонки определяются по заполненным ячейкам первой строки, а также включают в себя пустые столбцы, если они находятся среди заполненных, в случае файлов XLS и CSV. В случае файлов JSON и XML, колонки формируются из перечисления в блоке сolumns.
  2. За название колонки берется значение ячейки первой строки, или порядковый номер столбца, когда ячейка пуста, в случае файлов XLS и CSV. В случае файлов JSON и XML, названия колонок указаны в перечислении columns.
  3. В случае файлов XLS и CSV данных колонки определяет первая, следующая после названия, заполненная ячейка. В случае обнаружения в ячейке, следующей за ячейкой, определяющей тип данных, типа данных, отличного от определенного, тип данных всей колонки определяется как «Строка». В случае файлов JSON и XML, типы данных колонок берутся из перечисления в блоке field_types.
  4. В случае файлов XLS и CSV rолонка, содержащая только значения 1 и 0, НЕ определяется как содержащая тип данных «Булево».
  5. В случае файлов XLS и CSV тип данных «Дата» определяется, только когда дата находится в одном из форматов: 

    dd.mm.yyyy
    dd.mm.yyyy H
    dd.mm.yyyy H:M
    dd.mm.yyyy H:M:S
    dd.mm.yy
    dd.mm.yy H
    dd.mm.yy H:M
    dd.mm.yy H:M:S
    dd-mm-yyyy
    dd-mm-yyyy H
    dd-mm-yyyy H:M
    dd-mm-yyyy H:M:S
    dd-mm-yy
    dd-mm-yy H
    dd-mm-yy H:M
    dd-mm-yy H:M:S
    dd/mm/yyyy
    dd/mm/yyyy H
    dd/mm/yyyy H:M
    dd/mm/yyyy H:M:S
    dd/mm/yy
    dd/mm/yy H
    dd/mm/yy H:M
    dd/mm/yy H:M:S
    yyyy.mm.dd
    yyyy.mm.dd H
    yyyy.mm.dd H:M
    yyyy.mm.dd H:M:S
    yyyy-mm-dd
    yyyy-mm-dd H
    yyyy-mm-dd H:M
    yyyy-mm-dd H:M:S
    yyyy/mm/dd
    yyyy/mm/dd H
    yyyy/mm/dd H:M
    yyyy/mm/dd H:M:S 
Тип данных «Дата» автоматически приводится к виду yyyy-mm-dd HH:MM:SSS, который потом может быть изменен в настройках датасета.

Для перехода на следующий этап необходимо нажать кнопку «Далее 2/4».