После выбора в качестве источника файла типа:
- XSLX,
 - CSV или TXT
 - XML,
 - JSON
 
и нажатия кнопки «Далее» открывается окно для загрузки файла.
Для загрузки файла следует выбрать файл для загрузки, нажав предварительно кнопку «Загрузить» или перетащив файл в окно, и нажать кнопку «Далее».
Если в качестве источника выбран файл CSV, то в окне загрузки файла следует указать разделитель, а также используемую в файле кодировку.
Доступны следующие виды кодировки файла для загрузки:
- windows-1251;
 - utf-8;
 - utf-16;
 - koi8_r;
 - latin_1;
 - maccyrillic.
 
Для перехода на следующий этап необходимо нажать кнопку «Далее 2/4».
Структуры данных файлов для создания датасетов
XSLX
Файл для создания датасета из Excel должен иметь следующий формат:
CSV
Файл для создания датасета из CSV должен иметь следующий формат (разделитель может быть иным):
XML
Файл для создания датасета из XML должен иметь следующий формат:
JSON
Файл для создания датасета из JSON должен иметь следующий формат:
Правила распознавания данных для заполнения колонок
- Колонки определяются по заполненным ячейкам первой строки, а также включают в себя пустые столбцы, если они находятся среди заполненных, в случае файлов XLS и CSV. В случае файлов JSON и XML, колонки формируются из перечисления в блоке сolumns.
 - За название колонки берется значение ячейки первой строки, или порядковый номер столбца, когда ячейка пуста, в случае файлов XLS и CSV. В случае файлов JSON и XML, названия колонок указаны в перечислении columns.
 - В случае файлов XLS и CSV данных колонки определяет первая, следующая после названия, заполненная ячейка. В случае обнаружения в ячейке, следующей за ячейкой, определяющей тип данных, типа данных, отличного от определенного, тип данных всей колонки определяется как «Строка». В случае файлов JSON и XML, типы данных колонок берутся из перечисления в блоке field_types.
 - В случае файлов XLS и CSV rолонка, содержащая только значения 1 и 0, НЕ определяется как содержащая тип данных «Булево».
 В случае файлов XLS и CSV тип данных «Дата» определяется, только когда дата находится в одном из форматов:
Для перехода на следующий этап необходимо нажать кнопку «Далее 2/4».





