Data Engineering / Инженерия данных / Data Engineer / DWH

Привет! Меня зовут Михаил Иванов, я работаю архитектором DWH в Тинькофф и занимаюсь развитием Batch ETL направления платформы обработки данных. Я расскажу о направлении data engineering в Тинькофф, о...

363 views07:27

Docker_на_практике_Иан_Милл,_Эйдан_Хобсон_Сейерс_z_lib_org.pdf

8.8 MB

Docker на практике (Иан Милл, Эйдан Хобсон Сейерс).pdf

Данная книга научит вас надежным, проверенным методам, используемым Docker, таким как замена виртуальных машин, использование архитектуры микросервисов, эффективное моделирование сети, произво дительность в автономном режиме и создание процесса непрерывной доставки на базе контейнеров. Следуя формату «проблема/решение» в стиле поваренной книги, вы изучите реальные варианты использования Docker и узнаете, как применить их к собственным проектам.
Издание предназначено разработчикам, использующим Docker в своем рабочем окружении.

345 viewsedited 18:14

Data Engineering / Инженерия данных / Data Engineer / DWH

The Data Engineering Cookbook (MOUSAIF, YASSINE) (z-lib.org).fb2

2.4 MB

The Data Engineering Cookbook
Mastering The Plumbing Of Data Science
September 12, 2021

https://github.com/andkret/Cookbook code examples

https://cookbook.learndataengineering.com/docs/01-Introduction - free online version

1K viewsedited 18:20

Data Engineering / Инженерия данных / Data Engineer / DWH

Облачные_архитектуры_разработка_устойчивых_и_экономичных_облачных.pdf

13.8 MB

Облачные архитектуры: разработка устойчивых и экономичных облачных приложений.
Облачные вычисления — это, пожалуй, наиболее революционная разработка в IT со времен виртуализации. Облачно-ориентированные архитектуры обеспечивают большую гибкость по сравнению с системами предыдущего поколения. В этой книге продемонстрированы три важнейших аспекта развертывания современных cloud native архитектур: организационное преобразование, модернизация развертывания, паттерны облачного проектирования.

Книга начинается с краткого знакомства с облачно-ориентированными архитектурами — на примерах объясняется, какие черты им присущи, а какие нет. Вы узнаете, как организуется внедрение и разработка облачных архитектур с применением микросервисов и бессерверных вычислений как основ проектирования. Далее вы изучите такие столпы облачно-ориентированного проектирования, как масштабируемость, оптимизация издержек, безопасность и способы достижения безупречной эксплуатационной надежности.

299 viewsedited 05:30

Data Engineering / Инженерия данных / Data Engineer / DWH

Introduction to Data Engineering (Daniel Beach) (z-lib.org).pdf

1.9 MB

Introduction to Data Engineering (Daniel Beach).pdf

With the rise of Data Science and Machine Learning, Data Engineering is quickly becoming an in-demand skill. Data Engineering requires a unique skill set that is hard to learn without experience. I will teach you how to write scalable data pipelines and more!

Introduction
Chapter 1 - The Theory
Chapter 2 - Data Pipeline Basics
Chapter 3 - Pipeline Architecture
Chapter 4 - Storage
Chapter 5 - Compute and Resources
Chapter 6 - Mastering SQ
Chapter 7 - Data Warehousing / Data Lakes
Chapter 8 - Data Modeling
Chapter 9 - Data Quality
Chapter 10 - DevOps for Data Engineers

1.1K views06:16

Data Engineering / Инженерия данных / Data Engineer / DWH

GitHub - bregman-arie/devops-exercises: Linux, Jenkins, AWS, SRE, Prometheus, Docker, Python, Ansible, Git, Kubernetes, Terraform, OpenStack, SQL, NoSQL, Azure, GCP, DNS, Elastic, Network, Virtualization. DevOps Interview Questions
https://github.com/bregman-arie/devops-exercises

GitHub

GitHub - bregman-arie/devops-exercises: Linux, Jenkins, AWS, SRE, Prometheus, Docker, Python, Ansible, Git, Kubernetes, Terraform…

Linux, Jenkins, AWS, SRE, Prometheus, Docker, Python, Ansible, Git, Kubernetes, Terraform, OpenStack, SQL, NoSQL, Azure, GCP, DNS, Elastic, Network, Virtualization. DevOps Interview Questions - bre...

436 views06:36

Data Engineering / Инженерия данных / Data Engineer / DWH

Для того чтобы стать хорошим инженером данных и расти в профессии, нужно понимать, что учить, куда двигаться и какой инструмент за что отвечает. Ориентироваться во всём этом часто бывает сложно, особенно новичку.
https://www.youtube.com/watch?v=pRiRpOg64-4

YouTube

Data lake и DWH: практический опыт | Вебинар Александра Волынского | karpov.courses

Курс «Инженер данных»: https://bit.ly/3yuBNsz

Чтобы стать хорошим инженером данных и расти в профессии, нужно понимать, что учить, куда двигаться и какой инструмент за что отвечает. Ориентироваться во всём этом часто бывает сложно, особенно новичку.

Материалы:…

👍1

320 viewsedited 06:34

Data Engineering / Инженерия данных / Data Engineer / DWH

Презентация_Data_lake_и_DWH_практический_опыт.pdf

788.8 KB

252 views06:35

Data Engineering / Инженерия данных / Data Engineer / DWH

https://youtu.be/lDkTNURDIaY

YouTube

074. Чем отличаются data analyst, data engineer и data scientist – Алексей Натёкин

- Как войти в сообщество data science?
- О различиях data scientist, data analyst, data engineer, кто из них чем занимается?
- В чём отличия между Machine Learning и Data Science?
- Что у них общего и чем их работа отличается?

* 21 октября 2018 г. в московском…

248 views08:53

Data Engineering / Инженерия данных / Data Engineer / DWH

GitHub - eugeneyan/applied-ml: 📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production.
https://github.com/eugeneyan/applied-ml

GitHub

GitHub - eugeneyan/applied-ml: 📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production.

📚 Papers & tech blogs by companies sharing their work on data science & machine learning in production. - eugeneyan/applied-ml

253 views09:09

Data Engineering / Инженерия данных / Data Engineer / DWH

https://medium.com/@yashwant.deshmukh23/data-engineering-datawarehouse-data-mesh-to-delta-lakes-17394cdc238

Medium

Data Engineering: DataWarehouse, Data Mesh to delta Lakes

Why, what and about DataMesh, DataLake, Delta Lake, Data Warehouse.

257 views04:59

Data Engineering / Инженерия данных / Data Engineer / DWH

Self-service Business Intelligence, Powered by dbt

https://medium.com/modern-business-intelligence/self-service-business-intelligence-powered-by-dbt-3b7e24a92e27

Medium

Self-service Business Intelligence, Powered by dbt

Self-service Business Intelligence (BI) is just around the corner, right?

1.3K viewsedited 14:15

Data Engineering / Инженерия данных / Data Engineer / DWH

242 views18:44

Data Engineering / Инженерия данных / Data Engineer / DWH

Fundamentals_of_Data_Engineering_Joe_Reis_and_Matt_Housley_z_lib.pdf

6.6 MB

Fundamentals of Data Engineering (Joe Reis and Matt Housley).pdf

2022

This book will help you:
🔨 Assess data engineering problems using an end-to-end data framework of best practices
🔨 Cut through marketing hype when choosing data technologies, architecture, and processes
🔨 Use the data engineering lifecycle to design and build a robust architecture
🔨 Incorporate data governance and security across the data engineering lifecycle

You will understand how to apply the concepts of data generation, ingestion, orchestration, transformation, storage, governance, and deployment that are critical in any data environment regardless of the underlying technology.

339 viewsedited 18:27

Data Engineering / Инженерия данных / Data Engineer / DWH

https://maximebeauchemin.medium.com/functional-data-engineering-a-modern-paradigm-for-batch-data-processing-2327ec32c42a?

Medium

Functional Data Engineering — a modern paradigm for batch data processing

Batch data processing — historically known as ETL — is extremely challenging. It’s time-consuming, brittle, and often unrewarding. Not only…

243 viewsedited 14:37

Data Engineering / Инженерия данных / Data Engineer / DWH

What is a Data Platform? And How to Build One

In this post:
- What is a data platform?
- The six must-have layers of a modern data platform
- Data Storage and Processing
- Data Ingestion
- Data Transformation and Modeling
- Business Intelligence (BI) and Analytics
- Data Observability
- Data Discovery
- Data platform vs. customer data platform
- Build or buy your 6-layer data platform? It depends.

https://www.montecarlodata.com/blog-what-is-a-data-platform-and-how-to-build-one/

Monte Carlo Data

What Is A Data Platform And How Do You Build One?

A data platform is a central repository and processing house for all of an organization's data. Here's how to build an awesome data platform.

1.07K viewsedited 16:32

Data Engineering / Инженерия данных / Data Engineer / DWH

Data_Algorithms_with_Spark_Recipes_and_Design_Patterns_for_Scaling.pdf

12.6 MB

Data Algorithms with Spark Recipes and Design Patterns for Scaling Up using PySpark (Mahmoud Parsian).pdf

284 views17:30

Data Engineering / Инженерия данных / Data Engineer / DWH

Linux_Книга_рецептов_Карла_Шрёдер_z_lib_org.pdf

9.7 MB

Linux. Книга рецептов (Карла Шрёдер).pdf

230 views08:51

Data Engineering / Инженерия данных / Data Engineer / DWH

What Good Data Product Managers Do – And Why You Probably Need One

https://www.montecarlodata.com/blog-what-good-data-product-managers-do-and-why-you-probably-need-one/

Monte Carlo Data

What Good Data Product Managers Do — And Why You Probably Need One

A data product manager is responsible for data democratization and increasing the time to value for the data itself.

207 viewsedited 12:25

Data Engineering / Инженерия данных / Data Engineer / DWH

Потоковая_обработка_данных_с_Apache_Flink_Фабиан_Уэске,_Василики.pdf

10.9 MB

Потоковая обработка данных с Apache Flink (Фабиан Уэске, Василики Калаври).pdf

Начните работу с Apache Flink, фреймворком с открытым исходным кодом, на котором основаны многие крупнейшие в мире системы обработки потоковых данных. В данной книге вы изучите фундаментальные понятия параллельной потоковой обработки и узнаете, чем эта технология отличается от традиционной пакетной обработки данных.

Ф. Уэске и В. Калаври, занятые в проекте Apache Flink с первых дней, покажут вам, как создавать масштабируемые потоковые приложения с помощью API Flink DataStream, а также непрерывно выполнять и поддерживать эти приложения в операционных средах.

Потоковая обработка идеально подходит для многих задач: подготовки данных с малой задержкой, потоковой аналитики и информационных панелей в реальном времени, раннего оповещения и обнаружения мошенничества. Вы можете обрабатывать потоковые данные любого типа, включая взаимодействия с пользователем, финансовые транзакции и данные интернета вещей, немедленно после получения.

202 views18:37

About

Blog

Apps

Platform