После выбора в качестве источника файла типа:

  • XML,
  • XLS,
  • JSON,
  • CSV или TXT

и нажатия кнопки «Далее» открывается окно для загрузки файла.


Загрузка файла


Для загрузки файла следует выбрать файл для загрузки, нажав предварительно кнопку «Загрузить» или перетащив файл в окно, и нажать кнопку «Далее». 

Если в качестве источника выбран файл CSV, то в окне загрузки файла следует указать разделитель, а также используемую в файле кодировку.


Загрузка файла CSV


Доступны следующие виды кодировки файла для загрузки:

  • windows-1251;
  • utf-8;
  • utf-16;
  • koi8_r;
  • latin_1;
  • maccyrillic.

Правила распознавания данных для заполнения колонок

  1. Колонки определяются по заполненным ячейкам первой строки, а также включают в себя пустые столбцы, если они находятся среди заполненных, в случае файлов XLS и CSV. В случае файлов JSON и XML, колонки формируются из перечисления в columns.
  2. За название колонки берется значение ячейки первой строки, или порядковый номер столбца, когда ячейка пуста, в случае файлов XLS и CSV. В случае файлов JSON и XML, названия колонок указаны в перечислении columns.
  3. Тип данных колонки определяет первая, следующая после названия, заполненная ячейка. В случае обнаружения в ячейке, следующей за ячейкой, определяющей тип данных, типа данных, отличного от определенного, тип данных всей колонки определяется как «Строка».
  4. Колонка, содержащая только значения 1 и 0, НЕ определяется как содержащая тип данных «Булево».
  5. Тип данных «Дата» определяется, только когда дата находится в одном из форматов: 

    dd.mm.yyyy
    dd.mm.yyyy H
    dd.mm.yyyy H:M
    dd.mm.yyyy H:M:S
    dd.mm.yy
    dd.mm.yy H
    dd.mm.yy H:M
    dd.mm.yy H:M:S
    dd-mm-yyyy
    dd-mm-yyyy H
    dd-mm-yyyy H:M
    dd-mm-yyyy H:M:S
    dd-mm-yy
    dd-mm-yy H
    dd-mm-yy H:M
    dd-mm-yy H:M:S
    dd/mm/yyyy
    dd/mm/yyyy H
    dd/mm/yyyy H:M
    dd/mm/yyyy H:M:S
    dd/mm/yy
    dd/mm/yy H
    dd/mm/yy H:M
    dd/mm/yy H:M:S
    yyyy.mm.dd
    yyyy.mm.dd H
    yyyy.mm.dd H:M
    yyyy.mm.dd H:M:S
    yyyy-mm-dd
    yyyy-mm-dd H
    yyyy-mm-dd H:M
    yyyy-mm-dd H:M:S
    yyyy/mm/dd
    yyyy/mm/dd H
    yyyy/mm/dd H:M
    yyyy/mm/dd H:M:S 
Тип данных «Дата» автоматически приводится к виду yyyy-mm-dd HH:MM:SSS, который потом может быть изменен в настройках датасета.

Для перехода на следующий шаг необходимо нажать кнопку «Далее». Для закрытия окна проверки колонок следует нажать кнопку, расположенную в верхнем правом углу окна, или нажать левую кнопку мыши вне области окна. Для возврата на предыдущий шаг необходимо нажать на кнопку .

  • Нет меток