Общие сведения

Объединенный датасет - это датасет, который не записывается в ХД Polymatica, но формируется в реальном времени из нескольких датасетов ХД Polymatica или источника.

Функциональность объединения датасетов позволяет:

  • создать объединенный датасет из одного или нескольких датасетов, загруженных в ХД Polymatica;
  • создать объединенный датасет из одной или нескольких таблиц, подключаясь к источнику данных;
  • создать сокращенный датасет из имеющегося.

Создание объединенного датасета

Для объединения датасетов нажмите в окне выбора типа создаваемого датасета вариант "Объединенный". Откроется окно создания объединенного датасета.



Окно объединения датасетов


Для закрытия окна объединения датасетов необходимо нажать кнопку "Отменить", расположенную в нижнем правом углу окна, или на кнопку в верхнем правом углу окна. Произойдет возврат в окно выбора типа создания датасета.

Создание объединенного датасета из ХД Polymatica

Для примера создадим датасет из двух датасетов, находящихся в ХД Polymatica.

Откроем окно объединения датасетов и в раскрывающемся списке в области "Доступные таблицы" выберем "Локальное хранилище". 

Перетащим из области "Доступные таблицы" в область "Настройки объединения" требуемые датасеты. При этом блоки перенесенных датасетов в области "Доступные таблицы" поменяют цвет:


Выбор датасетов для объединения


На этом этапе можно выбрать колонки датасетов, которые будут отображаться в результирующем датасете. Чтобы убрать колонку из датасета, необходимо снять чекбокс рядом с ней в области "Колонки".

Выбор колонок объединенного датасета

Обратите внимание

В объединенный датасет нельзя добавить незаписанные расчетные колонки датасета. Такие колонки отображаются заблокированными в списке колонок.

Незаписанные расчетные колонки нельзя добавить в объединенный датасет


После выбора колонок нажмем для второго датасета кнопку . В открывающемся по нажатию кнопки окне "Параметры объединения" настроим параметры объединения:

Параметры объединения
  • "Колонка" - наименование колонки второго датасета, по которой будет проводиться объединение с первым.
  • "Тип объединения" - тип SQL-операции JOIN, которую нужно выполнить для объединения.
  • "С таблицей" - наименование первого датасета, с которым будет производиться объединение по колонке.
  • "По колонке" - наименование колонки первого датасета, по которой будет производиться объединение со вторым.


Обратите внимание

  • Объединяемых датасетов может быть более, чем два. В этом случае настройки объединения с первым датасетом в списке необходимо задать для всех последующих датасетов.
  • Объединенный датасет может быть создан из нескольких объединенных датасетов.
  • Колонки, по которым производится объединение, должны иметь одинаковый тип и содержать одинаковые данные (допустимо различное расположение значений в ячейках колонки).
  • На скриншоте выше колонка "ID транзакции" исключена из датасета. Она не будет отображаться в результирующем датасете, но, тем не менее, по ней можно настроить объединение. 


Нажмем на кнопку "Сохранить", чтобы сохранить настройки объединения. После этого в окне создания объединенного датасета нажмем на кнопку "Далее". Отобразится окно сохранения датасета.

Для создания датасета необходимо нажать на кнопку "Создать". Отобразится реестр датасетов с новым объединенным датасетом в статусе загрузки. 

Просмотр результирующего датасета. Объединенный датасет содержит выбранные колонки обоих датасетов

Создание объединенного датасета из прямого подключения к источнику

Прямое подключение позволяет видеть все доступные таблицы в базе данных источника и создавать из них объединенный датасет, не используя SQL-запрос.

Выберем источник для прямого подключения в окне объединения датасетов, в области "Доступные таблицы", внизу, в поле "Источник". Чтобы источник отображался в списке, необходимо предварительно создать его и иметь к нему право доступа.

Обратите внимание

Прямое подключение поддерживают следующие типы источников:

  • PostgreSQL
  • MySQL
  • Oracle
  • Microsoft SQL Server
  • Clickhouse
  • Vertica
  • YDB Cloud
  • YDB Server
  • Greenplum

Актуальную информацию по типам источников, поддерживающим прямое подключение, можно найти в реестре коннекторов.


Когда источник выбран, в списке "Доступные таблицы" отображаются доступные таблицы базы данных источника.


Выбор источника и таблиц в области "Доступные таблицы"


Далее работайте с таблицами так же, как с датасетами из ХД Polymatica.

Сокращение датасета

Для сокращения датасета в списке "Доступные таблицы" нужно выбрать только один датасет. Его колонки отобразятся в списке "Колонки". Чтобы сократить датасет, нужно снять чекбоксы с колонок, которых не должно быть в сокращенном датасете.


Выбор источника в области "Доступные таблицы"

Сохранение объединенного датасета

Для сохранения объединенного или сокращенного датасета необходимо нажать кнопку "Далее", расположенную в нижнем правом углу окна объединения датасетов. После нажатия кнопки откроется окно сохранения:


Сохранение объединенного датасета

Окно разделено на две вкладки:

  • Общее - включает в себя:
    • Название автоматически присваивается в формате "Объединенный + %наименование_первого_датасета%", но может быть изменено.
    • Описание - произвольное описание датасета (не обязательно).
    • Теги - особые отметки к датасету, см. Работа с реестром - Управление тегами.
  • Права доступа - для настройки см. Права доступа к сущности системы (не обязательно).

Для сохранения датасета необходимо нажать на кнопку "Создать".  Для возврата к настройкам датасета необходимо нажать "Назад". Для отмены создания датасета нажмите на кнопку  , кнопку "Отменить" или левую кнопку мыши в любом месте вне области окна.

  • Нет меток