Linux | OpenSource | Tech
5 subscribers
1.47K links
Download Telegram
Основы ETL: обработка данных с Superset, Airflow и ClickHouse

<img src="https://habrastorage.org/getpro/habr/uploadfiles/1a1/e7d/b9b/1a1e7db9b385c53f3ec050aec1fe87b5.jpg" />

Кратко о том, как запустить простой ETL-процесс с помощью связки
Superset, Airflow и ClickHouse. В статье — пример выгрузки и визуализации данных о товарах Wildberries.

**Что используется:**
🔹 **
Superset + Airflow** — готовый набор от Beget для удобной работы с данными
🔹 **ClickHouse** — для хранения и обработки информации
🔹 **Selenium, BeautifulSoup, re** — парсинг и обработка данных

👉 [Подробнее в статье](
https://habr.com/ru/companies/beget/articles/928712/?utmcampaign=928712&utmsource=habrahabr&utmmedium=rss)

#ETL #DataEngineering #Superset #Airflow #ClickHouse