Data Engineering / Инженерия данных / Data Engineer / DWH
1.95K subscribers
49 photos
7 videos
52 files
350 links
Data Engineering: ETL / DWH / Data Pipelines based on Open-Source software. Инженерия данных.

DWH / SQL
Python / ETL / ELT / dbt / Spark
Apache Airflow

Рекламу не размещаю
Вопросы: @iv_shamaev | datatalks.ru
Download Telegram
Meltano: Your DataOps OS

Meltano is open source, self-hosted, CLI-first, debuggable, and extensible.
Pipelines are code, ready to be version controlled, containerized, and deployed continuously. Develop and test locally, then deploy in production along with the built-in Airflow integration, or inside your orchestrator of choice.
Meltano embraces the Singer standard and its community-maintained library of open source extractors and loaders, and leverages dbt for transformation.

https://gitlab.com/meltano/meltano
1
Отправка сообщений в Slack

Basic Usage — slackclient (Legacy Python Slack SDK)
https://slack.dev/python-slackclient/basic_usage.html
Python_и_DevOps_Ключ_к_автоматизации_Linux_etc_z_lib_org.pdf
7.5 MB
Python и DevOps: Ключ к автоматизации Linux

Гифт Ной, Берман Кеннеди, Деза Альфредо, Георгиу Григ

За последнее десятилетие технологии сильно изменились. Данные стали хитом, облака — вездесущими, и всем организациям понадобилась автоматизация. В ходе таких преобразований Python оказался одним из самых популярных языков программирования. Это практическое руководство научит вас использовать Python для повседневных задач администрирования Linux с помощью наиболее удобных утилит DevOps, включая Docker, Kubernetes и Terraform.
DevOps_для_современного_предприятия_Мирко_Херинг_z_lib_org.pdf
3.2 MB
DevOps для современного предприятия (Мирко Херинг).pdf

DevOps – методика автоматизации рабочих процессов, существенно облегчающая задачи организации и способствующая действенным преобразованиям. Мирко Херинг, менеджер со стажем, рассказывает о том, как избежать распространенных ошибок на пути внедрения инноваций и добиться успеха в долгосрочной перспективе.

В первой части книги обсуждается экосистема предприятия, формирующая благоприятные условия для преобразований. Вторая часть посвящена работе с людьми, управлению ИТ-командой, внедряющей изменения, и выстраиванию рабочих процессов. В третьей части описываются технологические и архитектурные аспекты применения DevOps. В конце каждой главы приводятся практические упражнения.

Издание предназначено для менеджеров и ИТ-специалистов, занимающихся DevOps-проектами в организациях разного уровня.
Docker_на_практике_Иан_Милл,_Эйдан_Хобсон_Сейерс_z_lib_org.pdf
8.8 MB
Docker на практике (Иан Милл, Эйдан Хобсон Сейерс).pdf

Данная книга научит вас надежным, проверенным методам, используемым Docker, таким как замена виртуальных машин, использование архитектуры микросервисов, эффективное моделирование сети, произво­ дительность в автономном режиме и создание процесса непрерывной доставки на базе контейнеров. Следуя формату «проблема/решение» в стиле поваренной книги, вы изучите реальные варианты использования Docker и узнаете, как применить их к собственным проектам.
Издание предназначено разработчикам, использующим Docker в своем рабочем окружении.
Облачные_архитектуры_разработка_устойчивых_и_экономичных_облачных.pdf
13.8 MB
Облачные архитектуры: разработка устойчивых и экономичных облачных приложений.
Облачные вычисления — это, пожалуй, наиболее революционная разработка в IT со времен виртуализации. Облачно-ориентированные архитектуры обеспечивают большую гибкость по сравнению с системами предыдущего поколения. В этой книге продемонстрированы три важнейших аспекта развертывания современных cloud native архитектур: организационное преобразование, модернизация развертывания, паттерны облачного проектирования.

Книга начинается с краткого знакомства с облачно-ориентированными архитектурами — на примерах объясняется, какие черты им присущи, а какие нет. Вы узнаете, как организуется внедрение и разработка облачных архитектур с применением микросервисов и бессерверных вычислений как основ проектирования. Далее вы изучите такие столпы облачно-ориентированного проектирования, как масштабируемость, оптимизация издержек, безопасность и способы достижения безупречной эксплуатационной надежности.
Introduction to Data Engineering (Daniel Beach) (z-lib.org).pdf
1.9 MB
Introduction to Data Engineering (Daniel Beach).pdf

With the rise of Data Science and Machine Learning, Data Engineering is quickly becoming an in-demand skill. Data Engineering requires a unique skill set that is hard to learn without experience. I will teach you how to write scalable data pipelines and more!

Introduction
Cha
pter 1 - The Theory
Chapter 2 - Data Pipeline Basics
Chapter 3 - Pipeline Architecture
Chapter 4 - Storage
Chapter 5 - Compute and Resources
Chapter 6 - Mastering SQ
Chapter 7 - Data Warehousing / Data Lakes
Chapter 8 - Data Modeling
Chapter 9 - Data Quality
Chapter 10 - DevOps for Data Engineers