Школа Больших Данных

#ClickHouse #статьи
Какие бывают словари и как создать свой словарь

ClickHouse имеет встроенные (внутренние) словари.
Например, полностью управляемый сервис ClickHouse на платформе Яндекса (Managed Service for ClickHouse) содержит встроенный словарь-геобазу и набор функций для работы с ним, позволяющие получить имя региона на нужном языке по его идентификатору, а также узнать id города, области, округа, страны или континента по идентификатору региона.

Также можно проверить, входит ли один регион в другой и получить цепочку родительских регионов.

ClickHouse хранит словари в оперативной памяти полностью или частично, периодически обновляет их и динамически подгружает отсутствующие значения.

Помимо встроенных словарей, можно подключать собственные словари из различных источников данных, загрузив xml-файл, HTTP-ресурс или другую СУБД.

Также можно создать словарь, используя DDL-запросы. Конфигурация внешних словарей может находиться в одном или нескольких xml-файлах. Путь к конфигурации указывается в параметре dictionaries config. Загружать словарь можно при старте сервера или при первом использовании, в зависимости от настройки dictionaries lazy load.

Например, следующий xml-файл описывает данные словаря в CSV-файле под названием ext-dict-example.
Его можно использовать для оптимизации запросов к базе данных, например, для замены кодов состояний на их строковые представления без необходимости делать дополнительные запросы к основным таблицам.
Смотрим пример по ссылке.

@BigDataSchool_ru
https://bigdataschool.ru/blog/news/clickhouse/clickhouse-dictionaries.html

Курсы Big Data,Arenadata,Greenplum, Kafka и Spark

Словари в ClickHouse

Что такое словарь в ClickHouse, какие бывают словари, как их создать и каким командами к ним о

229 views13:13