ClickHouse (База данных) — различия между версиями
Админ (обсуждение | вклад) м |
Админ (обсуждение | вклад) м |
||
Строка 1: | Строка 1: | ||
Колоночная СУБД для аналитики и отчётов в реальном времени | Колоночная СУБД для аналитики и отчётов в реальном времени | ||
+ | == Тестирование Yandex Clickhouse == | ||
+ | В процессе тестирования выяснилось, что эта БД для наших задач не подходит — джойны в ней представлены только номинально. Так, например: | ||
+ | * поддерживается только JOIN с подзапросом в качестве правой части; | ||
+ | * условия в join-е не пробрасываются внутрь подзапроса; | ||
+ | * распределённые join-ы выполняются неэффективно. | ||
+ | |||
+ | Оказалось практически невозможным переписать «тяжёлые» запросы (N1-N3) на синтаксис Clickhouse. Также печалит ограничение по памяти — результат любого из подзапросов в любом запросе должен вмещаться в память на одном (!) сервере из кластера. | ||
+ | |||
+ | Несмотря на то, что для BI-задач эта БД оказалась непригодна, по результатам тестирования она нашла применение в хранилище в другом проекте. | ||
+ | |||
+ | Отдельно хочется отметить очень подробную и удобную документацию, доступную на официальном сайте (к сожалению, пока она покрывает не все аспекты использования БД), а также поблагодарить разработчиков Yandex за оперативные ответы на наши вопросы при проведении тестирования. https://habrahabr.ru/company/tcsbank/blog/310620/ тестирование БД | ||
== Ссылки == | == Ссылки == |
Версия 21:09, 12 октября 2016
Колоночная СУБД для аналитики и отчётов в реальном времени
Тестирование Yandex Clickhouse
В процессе тестирования выяснилось, что эта БД для наших задач не подходит — джойны в ней представлены только номинально. Так, например:
- поддерживается только JOIN с подзапросом в качестве правой части;
- условия в join-е не пробрасываются внутрь подзапроса;
- распределённые join-ы выполняются неэффективно.
Оказалось практически невозможным переписать «тяжёлые» запросы (N1-N3) на синтаксис Clickhouse. Также печалит ограничение по памяти — результат любого из подзапросов в любом запросе должен вмещаться в память на одном (!) сервере из кластера.
Несмотря на то, что для BI-задач эта БД оказалась непригодна, по результатам тестирования она нашла применение в хранилище в другом проекте.
Отдельно хочется отметить очень подробную и удобную документацию, доступную на официальном сайте (к сожалению, пока она покрывает не все аспекты использования БД), а также поблагодарить разработчиков Yandex за оперативные ответы на наши вопросы при проведении тестирования. https://habrahabr.ru/company/tcsbank/blog/310620/ тестирование БД