Общие сведения


Объединение датасетов необходимо для:

  • создания датасета на основе объединения двух или нескольких датасетов;
  • создания сокращенного датасета на основе уже имеющегося датасета;
  • создания прямого подключения к источнику для получения данных

Объединенный датасет, это представление (view), которое не записывается в локальное хранилище, и не может быть использовано для создания другого объединенного датасета. Расчетная колонка в таком датасете не может быть записана в датасет.

Для объединения датасетов нажмите в окне выбора типа создаваемого датасета на вариант «Объединить датасеты». Откроется окно объединения датасетов:


Объединение датасетов


Окно состоит из следующих блоков:



Для закрытия окна объединения датасетов необходимо нажать кнопку , расположенную в нижнем правом углу окна. Произойдет возврат в окно выбора типа создания датасета.

Создание датасета на основе объединения датасетов


Для примера используем датасеты со статистическими данными по численности населения за два года.


Датасеты для объединения


В каждом датасете есть восемь колонок с данными: "Федеральный округ", "Субъект", "Район или округ", "Муниципальное образование", "Год", "Население", "Городское", "Сельское". Объединим датасеты так, чтобы в полученном датасете были данные за оба года в следующих друг за другом колонках.

Откроем окно объединения датасетов.

Перетащим из области "Доступные таблицы" в область "Настройки объединения" требуемые датасеты.


Настройка объединения


Кликнем для второго датасета кнопку "". В открывающемся окне "Параметры объединения" настроим параметры объединения.


Параметры объединения


В области "Колонки" снимем выбор с колонок "Федеральный округ", "Субъект", "Район или округ", "Муниципальное образование" второго датасета, так как они уже есть в первом.


Выбор колонок


Кликнем "Далее", сохраним датасет. В результате получен объединенный датасет с двенадцатью колонками "Федеральный округ", "Субъект", "Район или округ", "Муниципальное образование", "Год", "Население", "Городское", "Сельское", "Год", "Население", "Городское", "Сельское".

Создание сокращенного датасета


Для создания сокращенного датасета вынесите в область "Настройки объединения" одну таблицу и снимите выбор с колонок, которые не требуются, аналогично как в предыдущем примере. Должна быть выбрана хотя бы одна колонка. Таким образом вам не придется удалять колонки из существующего датасета.

Создание прямого подключения к источнику для получения данных


Прямое подключение позволяет видеть все доступные таблицы в базе данных и создавать объединенный датасет напрямую из базы. При этом для такого датасета в его настройках недоступно объединение данных и редактирование SQL-запроса.

С использованием прямого подключения могут быть получены объединенный и сокращенный датасеты, аналогично как из датасетов в локальном хранилище.

Чтобы создать прямое подключение, выберите в окне объединения датасетов в области "Доступные таблицы", внизу, в поле "Источник", требуемую базу данных – источник. Чтобы источник отображался в списке, необходимо предварительно создать его и иметь право доступа к нему.


Обратите внимание

Прямое подключение поддерживают только следующие типы источников.

  • PostgreSQL;
  • QuestDB;
  • Oracle;
  • ClickHouse;
  • MySQL;
  • Vertica;
  • Microsoft SQL Server.

Актуальную информацию по типам источников, поддерживающим прямое подключение можно найти на странице приложения https://адрес_приложения/setting/plugins


Когда источник выбран, в списке "Доступные таблицы" отобразятся доступные таблицы базы. Далее работайте с ними так же, как с датасетами из локального хранилища.


Выбран источник PostgreSQL и отображаются таблицы базы данных
  • Нет меток