Общие сведения
Объединение датасетов необходимо для:
- создания датасета на основе объединения двух или нескольких датасетов;
- создания сокращенного датасета на основе уже имеющегося датасета;
- создания прямого подключения к источнику для получения данных
Объединенный датасет, это представление (view), которое не записывается в локальное хранилище, и не может быть использовано для создания другого объединенного датасета. Расчетная колонка в таком датасете не может быть записана в датасет.
Для объединения датасетов нажмите в окне выбора типа создаваемого датасета на вариант «Объединить датасеты». Откроется окно объединения датасетов:
Окно состоит из следующих блоков:
Для закрытия окна объединения датасетов необходимо нажать кнопку , расположенную в нижнем правом углу окна. Произойдет возврат в окно выбора типа создания датасета.
Создание датасета на основе объединения датасетов
Для примера используем датасеты со статистическими данными по численности населения за два года.
В каждом датасете есть восемь колонок с данными: "Федеральный округ", "Субъект", "Район или округ", "Муниципальное образование", "Год", "Население", "Городское", "Сельское". Объединим датасеты так, чтобы в полученном датасете были данные за оба года в следующих друг за другом колонках.
Откроем окно объединения датасетов.
Перетащим из области "Доступные таблицы" в область "Настройки объединения" требуемые датасеты.
Кликнем для второго датасета кнопку "". В открывающемся окне "Параметры объединения" настроим параметры объединения.
В области "Колонки" снимем выбор с колонок "Федеральный округ", "Субъект", "Район или округ", "Муниципальное образование" второго датасета, так как они уже есть в первом.
Кликнем "Далее", сохраним датасет. В результате получен объединенный датасет с двенадцатью колонками "Федеральный округ", "Субъект", "Район или округ", "Муниципальное образование", "Год", "Население", "Городское", "Сельское", "Год", "Население", "Городское", "Сельское".
Создание сокращенного датасета
Для создания сокращенного датасета вынесите в область "Настройки объединения" одну таблицу и снимите выбор с колонок, которые не требуются, аналогично как в предыдущем примере. Должна быть выбрана хотя бы одна колонка. Таким образом вам не придется удалять колонки из существующего датасета.
Создание прямого подключения к источнику для получения данных
Прямое подключение позволяет видеть все доступные таблицы в базе данных и создавать объединенный датасет напрямую из базы. При этом для такого датасета в его настройках недоступно объединение данных и редактирование SQL-запроса.
С использованием прямого подключения могут быть получены объединенный и сокращенный датасеты, аналогично как из датасетов в локальном хранилище.
Чтобы создать прямое подключение, выберите в окне объединения датасетов в области "Доступные таблицы", внизу, в поле "Источник", требуемую базу данных – источник. Чтобы источник отображался в списке, необходимо предварительно создать его и иметь право доступа к нему.
Обратите внимание
Прямое подключение поддерживают только следующие типы источников.
- PostgreSQL;
- QuestDB;
- Oracle;
- ClickHouse;
- MySQL;
- Vertica;
- Microsoft SQL Server.
Актуальную информацию по типам источников, поддерживающим прямое подключение можно найти на странице приложения https://адрес_приложения/setting/plugins
Когда источник выбран, в списке "Доступные таблицы" отобразятся доступные таблицы базы. Далее работайте с ними так же, как с датасетами из локального хранилища.