Отличия CedrusData от Trino#

CedrusData является коммерческим продуктом, который основан на open-source технологии Trino, и включает дополнительный функционал безопасности, управления и мониторинга, улучшения производительности, веб-интерфейс для запуска запросов, профессиональную документацию и поддержку.

Ниже приведено описание дополнительного функционала, который доступен только в CedrusData.

Примечание

Для работы с CedrusData вам потребуется лицензия. Пожалуйста, ознакомьтесь с документом Управление лицензией CedrusData.

Коннекторы и интеграции#

Название

Описание

Greenplum коннектор

Коннектор к аналитической СУБД Greenplum с многочисленными оптимизациями для ускорения операций чтения и записи данных.

Teradata коннектор

Коннектор к аналитической СУБД Teradata.

Vertica коннектор

Коннектор к аналитической СУБД Vertica.

Поддержка ODBC и протокола Arrow Flight SQL

Возможность подключения к CedrusData по протоколу Arrow Flight SQL, в том числе через open-source ODBC-драйвера.

Безопасность#

Название

Описание

Управление группами пользователей с помощью LDAP

Возможность получения групп пользователя из LDAP.

Аутентификация в коннекторах от имени текущего пользователя

Возможность аутентификации в некоторых коннекторах от имени текущего пользователя CedrusData.

Управление#

Название

Описание

Динамическое управление каталогами

Промышленная поддержка динамического управления каталогами.

Web-интерфейс CedrusData

Web-интерфейс для запуска SQL-запросов

Статистика работы с таблицами в удаленных источниках

Кумулятивная статистика чтения данных из удаленных таблиц.

Статистика кластера

Кумулятивная статистика использования ресурсов кластера.

Интерактивная визуализация планов запросов

Интерактивная визуализация планов запросов для удобного и эффективного анализа производительности.

Персистентная история запросов CedrusData

Возможность сохранения истории выполнения запросов между запусками координатора.

Производительность#

Название

Описание

Автоматическое удаление ненужных операторов Join

Возможность удаления ненужных операторов Join в сложных запросах. Ускоряет запросы, характерные для BI-инструментов, а также моделей данных Anchor и Data Vault.

Кэш результатов запросов CedrusData

Ускорение повторяющихся запросов за счет кэширования результатов на диске или в оперативной памяти.

Hive коннектор: Оптимизация запросов к partitioned таблицам

Ускорение запросов к партиционированным таблицам Hive путем выбора более оптимального плана запроса.

Hive коннектор: Локальный дисковый кэш данных

Ускорение чтения из Hive за счет их кэширования на узлах CedrusData.

Iceberg коннектор: Оптимизация запросов к partitioned таблицам

Ускорение запросов к партиционированным таблицам Iceberg путем выбора более оптимального плана запроса.

Iceberg коннектор: Локальный дисковый кэш данных

Ускорение чтения из Iceberg за счет их кэширования на узлах CedrusData.

Greenplum коннектор: Pushdown сложных вычислений

Ускорение запросов за счет переноса (pushdown) сложных операций на сторону Greenplum.

Greenplum коннектор: Параллельная запись данных через протокол GPFDIST

Ускорение записи в Greenplum за счет прямой пересылки данных в сегменты через протокол GPFDIST.

Greenplum коннектор: Параллельное чтение данных через протокол GPFDIST

Ускорение чтения из Greenplum за счет прямой пересылки данных с сегментов через протокол GPFDIST.

Greenplum коннектор: Параллельное чтение данных через JDBC

Ускорение чтения из Greenplum за счет выполнения нескольких параллельных запросов к различным сегментам посредством JDBC-драйвера.

Пул соединений для коннекторов на основе JDBC

Кэширование соединений к JDBC источникам для ускорения доступа к ним: ClickHouse, Greenplum, Ignite, MariaDB, MySQL, PostgreSQL, SQL Server, Teradata. Vertica.

Режим оптимизации Cascades

Cost-based оптимизатор, который позволяет находить более оптимальные планы запросов, требующие передачи меньшего количества данных между узлами.