Data_Pipelines_with_Apache_Airflow_by_Bas_P_Harenslak,_Julian_Rutger.pdf
21.4 MB
Data Pipelines with Apache Airflow by Bas P. Harenslak, Julian Rutger de Ruiter
What's inside
Build, test, and deploy Airflow pipelines as DAGs
Automate moving and transforming data
Analyze historical datasets using backfilling
Develop custom components
Set up Airflow in production environments
What's inside
Build, test, and deploy Airflow pipelines as DAGs
Automate moving and transforming data
Analyze historical datasets using backfilling
Develop custom components
Set up Airflow in production environments
Apache_Superset_Quick_Start_Guide_by_Shashank_Shekhar_z_lib_org.pdf
80.2 MB
Apache Superset Quick Start Guide by Shashank Shekhar
What you will learn
✴️ Get to grips with the fundamentals of data exploration using Superset
✴️ Set up a working instance of Superset on cloud services like Google Compute Engine
✴️ Integrate Superset with SQL databases
✴️ Build dashboards with Superset
✴️ Calculate statistics in Superset for numerical, categorical, or text data
✴️ Understand visualization techniques, filtering, and grouping by aggregation
✴️ Manage user roles and permissions in Superset
✴️ Work with SQL Lab
What you will learn
✴️ Get to grips with the fundamentals of data exploration using Superset
✴️ Set up a working instance of Superset on cloud services like Google Compute Engine
✴️ Integrate Superset with SQL databases
✴️ Build dashboards with Superset
✴️ Calculate statistics in Superset for numerical, categorical, or text data
✴️ Understand visualization techniques, filtering, and grouping by aggregation
✴️ Manage user roles and permissions in Superset
✴️ Work with SQL Lab
How did we build a Data Warehouse in six months? | by Jérémy Wimsingues | Everoad | Medium
https://medium.com/everoad/building-a-data-warehouse-in-six-months-what-did-we-learn-e058e42446f1
https://medium.com/everoad/building-a-data-warehouse-in-six-months-what-did-we-learn-e058e42446f1
Medium
How did we build a Data Warehouse in six months?
Using the data if something every companies want to do. This is how we build our DTW in 6 months.
Apache Superset Meetup - Developing and Deploying Custom Visualization Plugins in Superset
Webinar Registration - Zoom
https://us02web.zoom.us/webinar/register/WN_nmtjoY8fR9-PlkUXrMhkSw
Webinar Registration - Zoom
https://us02web.zoom.us/webinar/register/WN_nmtjoY8fR9-PlkUXrMhkSw
Forwarded from Reveal the Data
Media is too big
VIEW IN TELEGRAM
Таня Бибикова сделала небольшую 💣 интерактивную объяснялку про алгоритм Лаборатории Данных. Она проводит по всем шагам и объясняет как сделать крутую визуализацию или аналитический инструмент.
Для меня — самая классная часть когда Таня начинает крутить одни и те же данные на разных каркасах. Это отлично выправляет мозг и даёт понять как показать данные с разных сторон, чтобы в итоге получить полную картинку.
Почитать мысли Тани об этой штуке и высказать своё мнение можно в комментах FB, она будет рада обратной связи.
П.С. А ещё у нас осталось два места на майский курс Δλ.
Для меня — самая классная часть когда Таня начинает крутить одни и те же данные на разных каркасах. Это отлично выправляет мозг и даёт понять как показать данные с разных сторон, чтобы в итоге получить полную картинку.
Почитать мысли Тани об этой штуке и высказать своё мнение можно в комментах FB, она будет рада обратной связи.
П.С. А ещё у нас осталось два места на майский курс Δλ.
Everyday Data Engineering: Tips on Developing Production Pipelines in Airflow | by Niv Sluzki | Databand.ai | Medium
https://databand.ai/blog/everyday-data-engineering-tips-on-developing-production-pipelines-in-airflow/
https://databand.ai/blog/everyday-data-engineering-tips-on-developing-production-pipelines-in-airflow/
Databand
Tips on Developing Production Pipelines in Airflow - Databand
How we manage pipeline development lifecycle, including iterations deployment over multiple Airflow environments, from dev to production.
Python Exercises, Practice, Solution - w3resource
https://www.w3resource.com/python-exercises/
https://www.w3resource.com/python-exercises/
w3resource
Python Exercises, Practice, Solution - w3resource
Python Exercises, Practice, Solution: Python is a widely used high-level, general-purpose, interpreted, dynamic programming language. Its design philosophy emphasizes code readability, and its syntax allows programmers to express concepts in fewer lines of…
What_Is_Data_Governance_Understanding_the_Business_Impact_by_Andy.epub
2.3 MB
What Is Data Governance? Understanding the Business Impact
Сравнение открытых OLAP-систем Big Data: ClickHouse, Druid и Pinot / Блог компании Конференции Олега Бунина (Онтико) / Хабр
https://habr.com/ru/company/oleg-bunin/blog/351308/
https://habr.com/ru/company/oleg-bunin/blog/351308/
Хабр
Сравнение открытых OLAP-систем Big Data: ClickHouse, Druid и Pinot
ClickHouse, Druid и Pinot — три открытых хранилища данных, которые позволяют выполнять аналитические запросы на больших объемах данных с интерактивными задержкам...
How Airbnb Achieved Metric Consistency at Scale | by Robert Chang | Airbnb Engineering & Data Science | Apr, 2021 | Medium
https://medium.com/airbnb-engineering/how-airbnb-achieved-metric-consistency-at-scale-f23cc53dea70
https://medium.com/airbnb-engineering/how-airbnb-achieved-metric-consistency-at-scale-f23cc53dea70
Medium
How Airbnb Achieved Metric Consistency at Scale
Part-I: Introducing Minerva — Airbnb’s Metric Platform
Building Power BI custom visuals with React and D3.js | Pt. One | Welcome, Developer
https://www.welcomedeveloper.com/building-power-bi-custom-visuals-with-react-and-d-3-js-pt-one
https://www.welcomedeveloper.com/building-power-bi-custom-visuals-with-react-and-d-3-js-pt-one
Peritos_Solutions_Case_Study_Power_BI_Custom_Visualization_v1_0.pdf
367.1 KB
PeritosSolutionsCase-Study-Power-BI-Custom-Visualization-v1.0.pdf
Docker_на_практике_by_Иан_Милл,_Эйдан_Хобсон_Сейерс.pdf
8.8 MB
Docker на практике by Иан Милл, Эйдан Хобсон Сейерс.pdf
Простая идея Docker – упаковка приложения и его зависимостей в единый развертываемый контейнер – породило ажиотаж в индустрии программного обеспечения. Теперь контейнеры являются крайне необходимыми для корпоративной инфраструктуры, а Docker представляет собой бесспорный отраслевой стандарт.
Простая идея Docker – упаковка приложения и его зависимостей в единый развертываемый контейнер – породило ажиотаж в индустрии программного обеспечения. Теперь контейнеры являются крайне необходимыми для корпоративной инфраструктуры, а Docker представляет собой бесспорный отраслевой стандарт.
Руководство по Docker Compose для начинающих / Блог компании RUVDS.com / Хабр
https://habr.com/ru/company/ruvds/blog/450312/
https://habr.com/ru/company/ruvds/blog/450312/
Хабр
Руководство по Docker Compose для начинающих
Автор статьи, перевод которой мы сегодня публикуем, говорит, что она предназначена для тех разработчиков, которые хотят изучить Docker Compose и идут к тому, чтобы создать своё первое клиент-серверное...
Orchestration Frameworks for Big Data | by Javier Ramos | ITNEXT
https://itnext.io/orchestration-frameworks-for-big-data-cfb9d3af6e7e
https://itnext.io/orchestration-frameworks-for-big-data-cfb9d3af6e7e
Medium
Orchestration Frameworks for Big Data
Introduction
ETL_with_Azure_Cookbook_Practical_recipes_for_building_modern_ETL.pdf
14.2 MB
ETL with Azure Cookbook Practical recipes for building modern ETL solutions to load and transform data from any source
- Explore ETL and how it is different from ELT
- Move and transform various data sources with Azure ETL and ELT services
- Use SSIS 2019 with Azure HDInsight clusters
- Discover how to query SQL Server 2019 Big Data Clusters hosted in Azure
- Migrate SSIS solutions to Azure and solve key challenges associated with it
- Understand why data profiling is crucial and how to implement it in Azure Databricks
- Get to grips with BIML and learn how it applies to SSIS and Azure Data Factory solutions
- Explore ETL and how it is different from ELT
- Move and transform various data sources with Azure ETL and ELT services
- Use SSIS 2019 with Azure HDInsight clusters
- Discover how to query SQL Server 2019 Big Data Clusters hosted in Azure
- Migrate SSIS solutions to Azure and solve key challenges associated with it
- Understand why data profiling is crucial and how to implement it in Azure Databricks
- Get to grips with BIML and learn how it applies to SSIS and Azure Data Factory solutions