После выбора в качестве источника файла типа:
и нажатия кнопки «Далее» открывается окно для загрузки файла.
| Scroll Title |
|---|
| title-alignment | center |
|---|
| title | Загрузка файла |
|---|
|

|
Для загрузки файла следует выбрать файл для загрузки, нажав предварительно кнопку «Загрузить» или перетащив файл в окно, и нажать кнопку «Далее».
Если в качестве источника выбран файл CSV, то в окне загрузки файла следует указать разделитель, а также используемую в файле кодировку.
| Scroll Title |
|---|
| title-alignment | center |
|---|
| title | Загрузка файла CSV |
|---|
|

|
Доступны следующие виды кодировки файла для загрузки:
- windows-1251;
- utf-8;
- utf-16;
- koi8_r;
- latin_1;
- maccyrillic.
Для перехода на следующий этап необходимо нажать кнопку «Далее 2/4».
Структуры данных файлов для создания датасетов
XSLX
Файл для создания датасета из Excel должен иметь следующий формат:
| Раскрыть |
|---|
| title | Пример структуры файла XSLX |
|---|
|

|
CSV
Файл для создания датасета из CSV должен иметь следующий формат (разделитель может быть иным):
| Раскрыть |
|---|
| title | Пример структуры файла CSV |
|---|
|

|
XML
Файл для создания датасета из XML должен иметь следующий формат:
| Раскрыть |
|---|
| title | Пример структуры файла ХМL |
|---|
|

|
JSON
Файл для создания датасета из JSON должен иметь следующий формат:
| Раскрыть |
|---|
| title | Пример структуры файла JSON |
|---|
|

|
Правила распознавания данных для заполнения колонок
- Колонки определяются по заполненным ячейкам первой строки, а также включают в себя пустые столбцы, если они находятся среди заполненных, в случае файлов XLS и CSV. В случае файлов JSON и XML, колонки формируются из перечисления в блоке сolumns.
- За название колонки берется значение ячейки первой строки, или порядковый номер столбца, когда ячейка пуста, в случае файлов XLS и CSV. В случае файлов JSON и XML, названия колонок указаны в перечислении columns.
- В случае файлов XLS и CSV данных колонки определяет первая, следующая после названия, заполненная ячейка. В случае обнаружения в ячейке, следующей за ячейкой, определяющей тип данных, типа данных, отличного от определенного, тип данных всей колонки определяется как «Строка». В случае файлов JSON и XML, типы данных колонок берутся из перечисления в блоке field_types.
- В случае файлов XLS и CSV rолонка, содержащая только значения 1 и 0, НЕ определяется как содержащая тип данных «Булево».
В случае файлов XLS и CSV тип данных «Дата» определяется, только когда дата находится в одном из форматов:
| Раскрыть |
|---|
|
dd.mm.yyyy
dd.mm.yyyy H
dd.mm.yyyy H:M
dd.mm.yyyy H:M:S
dd.mm.yy
dd.mm.yy H
dd.mm.yy H:M
dd.mm.yy H:M:S
dd-mm-yyyy
dd-mm-yyyy H
dd-mm-yyyy H:M
dd-mm-yyyy H:M:S
dd-mm-yy
dd-mm-yy H
dd-mm-yy H:M
dd-mm-yy H:M:S
dd/mm/yyyy
dd/mm/yyyy H
dd/mm/yyyy H:M
dd/mm/yyyy H:M:S
dd/mm/yy
dd/mm/yy H
dd/mm/yy H:M
dd/mm/yy H:M:S
yyyy.mm.dd
yyyy.mm.dd H
yyyy.mm.dd H:M
yyyy.mm.dd H:M:S
yyyy-mm-dd
yyyy-mm-dd H
yyyy-mm-dd H:M
yyyy-mm-dd H:M:S
yyyy/mm/dd
yyyy/mm/dd H
yyyy/mm/dd H:M
yyyy/mm/dd H:M:S |
| Информация |
|---|
| Тип данных «Дата» автоматически приводится к виду yyyy-mm-dd HH:MM:SSS, который потом может быть изменен в настройках датасета. |
Для перехода на следующий этап необходимо нажать кнопку «Далее 2/4».