Apache Airflow: делаем ETL проще
#Python #BigData #Хранениеданных #DataEngineering #apacheairflow #airflow #dag IV
https://habr.com/ru/post/512386/
#Python #BigData #Хранениеданных #DataEngineering #apacheairflow #airflow #dag IV
https://habr.com/ru/post/512386/
t.me
Apache Airflow: делаем ETL проще
Привет, я Дмитрий Логвиненко — Data Engineer отдела аналитики группы компаний «Везёт». Я расскажу вам о замечательном инструменте для разработки ETL-процессов —...
Как мы оркестрируем процессы обработки данных с помощью Apache Airflow
#БлогкомпанииLamoda #Python #BigData #Hadoop #DataEngineering #biddata #apacheairflow IV
https://habr.com/ru/post/518620/
#БлогкомпанииLamoda #Python #BigData #Hadoop #DataEngineering #biddata #apacheairflow IV
https://habr.com/ru/post/518620/
t.me
Как мы оркестрируем процессы обработки данных с помощью Apache Airflow
Всем привет! Меня зовут Никита Василюк, я инженер по работе с данными в департаменте данных и аналитики компании Lamoda. В нашем департаменте Airflow играет роль...
Проектирование Data Pipelines в Apache Airflow
#БлогкомпанииOTUS #Хранениеданных #apacheairflow #dataops #datapipelines #mapreduce #обработкабольшихданных IV
https://habr.com/ru/post/679104/
#БлогкомпанииOTUS #Хранениеданных #apacheairflow #dataops #datapipelines #mapreduce #обработкабольшихданных IV
https://habr.com/ru/post/679104/
Хабр
Проектирование Data Pipelines в Apache Airflow
Привет, Хабр! Меня зовут Рустем, являюсь Senior DevOps Engineer в компании IBM. Сегодня я хотел бы познакомить вас с важным инструментом в методологии DataOps, а именно Apache Airflow и...
Что делают дата-инженеры, когда данные сами движутся между десятками систем?
#БлогкомпанииGarageEight #Хранилищаданных #DataEngineering #dataengineering #elt #selfservice #apacheairflow IV
https://habr.com/ru/post/707180/
#БлогкомпанииGarageEight #Хранилищаданных #DataEngineering #dataengineering #elt #selfservice #apacheairflow IV
https://habr.com/ru/post/707180/
Хабр
Что делают дата-инженеры, когда данные сами движутся между десятками систем?
Привет, Хабр! Меня зовут Андрей Гончаров, я дата-инженер в Garage Eight, и сегодня я расскажу о том, как мы подходим к батч-процессингу и нашей self-service платформе данных. Почему self-service?...
Airflow в Kubernetes. Часть 2
#DevOps #DataEngineering #apacheairflow #kubernetes #devops #деплой #оркестрация IV
https://habr.com/ru/articles/774924/
#DevOps #DataEngineering #apacheairflow #kubernetes #devops #деплой #оркестрация IV
https://habr.com/ru/articles/774924/
Хабр
Airflow в Kubernetes. Часть 2
Приветствую! В прошлой части мы развернули основные сервисы Airflow. Однако у нас остались незакрытые моменты. Такие как: Синхронизация списка DAG с удаленным репозиторием Сохранение логов Worker...
Рулим запуском Spark-приложений в Airflow с помощью самописного оператора
#БлогкомпанииLamodaTech #Python #BigData #Hadoop #DataEngineering #apacheairflow #spark
https://habr.com/ru/companies/lamoda/articles/810705/
#БлогкомпанииLamodaTech #Python #BigData #Hadoop #DataEngineering #apacheairflow #spark
https://habr.com/ru/companies/lamoda/articles/810705/
Хабр
Рулим запуском Spark-приложений в Airflow с помощью самописного оператора
Airflow в Lamoda Tech играет роль оркестратора процессов обработки данных. Ежедневно с его помощью мы запускаем 1 800+ тасок на проде, примерно половина из которых являются Spark-приложениями. Все...
Агрегация данных для аналитики продаж с помощью DataSphere Jobs и Airflow SDK
#БлогкомпанииYandexCloudYandexInfrastructure #Apache #Машинноеобучение #Облачныесервисы #DataEngineering #apacheairflow #datasphere
https://habr.com/ru/companies/yandex_cloud_and_infra/articles/839494/
#БлогкомпанииYandexCloudYandexInfrastructure #Apache #Машинноеобучение #Облачныесервисы #DataEngineering #apacheairflow #datasphere
https://habr.com/ru/companies/yandex_cloud_and_infra/articles/839494/
Хабр
Агрегация данных для аналитики продаж с помощью DataSphere Jobs и Airflow SDK
В маркетинге и продажах крупных компаний есть несколько аналитических задач, которые требуют регулярной обработки сотен тысяч и миллионов записей из разных источников. Например, это...
Гайд по установке Apache Airflow, на случай, если у тебя его ещё нет в преддверии 2025 года
#apacheairflow #dataanalytics #датааналитик #dataengineering #etl
https://habr.com/ru/articles/860900/
#apacheairflow #dataanalytics #датааналитик #dataengineering #etl
https://habr.com/ru/articles/860900/
Хабр
Гайд по установке Apache Airflow, на случай, если у тебя его ещё нет в преддверии 2025 года
Немного лирики, что такое Apache Airflow — это оркестратор (ваших данных), инструмент для создания, планирования и мониторинга рабочих процессов (так называемых DAGs — Directed Acyclic Graphs). Что с...
Интеграция с ClickHouse: 1С vs Apache Airflow. Плюсы и минусы
#1с #apacheairflow #clickhouse #интеграция #сравнение #плюсыиминусы
https://habr.com/ru/articles/864088/
#1с #apacheairflow #clickhouse #интеграция #сравнение #плюсыиминусы
https://habr.com/ru/articles/864088/
Хабр
Интеграция с ClickHouse: 1С vs Apache Airflow. Плюсы и минусы
На связи Никита Скирдин, программист 1С компании «Белый код». Для BI-аналитики необходимо собирать данные из различных систем в централизованное хранилище. Как правило, перед использованием данных для...
Как мы деплоем Apache Airflow для промышленного использования в Kubernetes
#apacheairflow #observability #kubernetes #production
https://habr.com/ru/articles/871660/
#apacheairflow #observability #kubernetes #production
https://habr.com/ru/articles/871660/
Хабр
Как мы деплоим Apache Airflow для промышленного использования в Kubernetes
Что делает инженер, если DAG не выполняется? Проверяет Airflow 50 раз, а потом вспоминает, что забыл поставить @dag над функцией. Развертывание Apache Airflow в промышленной среде — это сложная...