Принципы_организации_распределенных_баз_данных_М_Тамер_Ёcy,_Патрик.pdf
9 MB
Принципы организации распределенных баз данных (М. Тамер Ёcy, Патрик Вальдуриес).pdf
В книге представлено подробное описание распределенных и параллельных баз данных с учетом новейших технологий. Авторы затрагивают такие темы, как проектирование распределенных и параллельных БД, контроль распределенных данных, распределенная обработка запросов и транзакций, интеграция баз данных. Отдельная глава посвящена обработке больших данных (в частности, обсуждаются распределенные системы хранения, потоковая обработка данных, платформы MapReduce и Spark, анализ графов и озера данных). Обработка веб-данных рассматривается с акцентом на технологию RDF, получившую широкое распространение.
В конце глав 2–12 приводятся упражнения, позволяющие закрепить теоретический материал. На сопроводительном сайте читатели найдут информацию об основах реляционных баз данных, обработке запросов, управлении транзакциями и компьютерных сетях.
В книге представлено подробное описание распределенных и параллельных баз данных с учетом новейших технологий. Авторы затрагивают такие темы, как проектирование распределенных и параллельных БД, контроль распределенных данных, распределенная обработка запросов и транзакций, интеграция баз данных. Отдельная глава посвящена обработке больших данных (в частности, обсуждаются распределенные системы хранения, потоковая обработка данных, платформы MapReduce и Spark, анализ графов и озера данных). Обработка веб-данных рассматривается с акцентом на технологию RDF, получившую широкое распространение.
В конце глав 2–12 приводятся упражнения, позволяющие закрепить теоретический материал. На сопроводительном сайте читатели найдут информацию об основах реляционных баз данных, обработке запросов, управлении транзакциями и компьютерных сетях.
Видео с конференции Airflow 2022
https://youtube.com/playlist?list=PLGudixcDaxY2LxjeHpZRtzq7miykjjFOn
https://youtube.com/playlist?list=PLGudixcDaxY2LxjeHpZRtzq7miykjjFOn
Создание современной платформы для работы с данными с помощью Open-Source-решений
https://habr.com/en/company/vk/blog/671642/
https://habr.com/en/company/vk/blog/671642/
Habr
Создание современной платформы для работы с данными с помощью Open-Source-решений
Команда VK Cloud Solutions перевела краткий конспект с Open Source Data Stack Conference . Конференция была посвящена созданию платформ для работы с данными на базе Open-Source-решений —докладчики...
Зачем вам Dagster, если есть AirFlow: сравнение ETL-оркестраторов
https://www.bigdataschool.ru/blog/dagster-vs-airflow-dag-orchestration-in-big-data.html
https://www.bigdataschool.ru/blog/dagster-vs-airflow-dag-orchestration-in-big-data.html
Краткое описание Airflow с инструкцией по установке через docker-compose
https://ivan-shamaev.ru/apache-airflow-docker-python-dag-data-pipeline/
https://ivan-shamaev.ru/apache-airflow-docker-python-dag-data-pipeline/
Персональный блог Data Engineer | Ex-TeamLead BI Developer
Apache Airflow: docker, python, DAG, конвейер обработки данных
Apache Airflow: docker, python, DAG, конвейер обработки данных. Установка install. Учебник книга book курсы. Примеры
awesome-apache-airflow: Curated list of resources about Apache Airflow
https://github.com/jghoman/awesome-apache-airflow
https://github.com/jghoman/awesome-apache-airflow
GitHub
GitHub - jghoman/awesome-apache-airflow: Curated list of resources about Apache Airflow
Curated list of resources about Apache Airflow. Contribute to jghoman/awesome-apache-airflow development by creating an account on GitHub.
10+ Apache Airflow Courses [2022] | Learn Online for Free | Class Central
https://www.classcentral.com/subject/apache-airflow
https://www.classcentral.com/subject/apache-airflow
Class Central
100+ Apache Airflow Online Courses for 2025 | Explore Free Courses & Certifications | Class Central
Master workflow orchestration and data pipeline automation using Apache Airflow's DAGs, operators, and scheduling capabilities. Build production-ready ETL pipelines with hands-on training on Udemy, LinkedIn Learning, and YouTube, integrating with AWS, Google…
Apache Nifi Crash Course
https://www.youtube.com/watch?v=fblkgr1PJ0o
https://www.youtube.com/watch?v=fblkgr1PJ0o
YouTube
Apache Nifi Crash Course
Introduction: This workshop will provide a hands on introduction to simple event data processing and data flow processing using a Sandbox on students’ personal machines.
Format: A short introductory lecture to Apache NiFi and computing used in the lab followed…
Format: A short introductory lecture to Apache NiFi and computing used in the lab followed…
1.Introduction to Airflow
2.Airflow DAGs
3.Airflow web interface
2.Airflow DAGs
3.Airflow web interface
👍1
Forwarded from karpov.courses
Мы уже записывали видео с разбором полезных функций для работы с массивами в ClickHouse, и теперь пришло время практики. В этот раз преподавательница «Симулятора аналитика» Мария Сомова покажет, как применять массивы для решения реальной прикладной задачи.
Представьте, что вы работаете в отделе аналитики онлайн-магазина, и перед вами стоит задача оценить эффект от запуска маркетинговой кампании. Рассказываем, как сворачивать данные в массивы и применять функции из предыдущего видео для их обработки.
Представьте, что вы работаете в отделе аналитики онлайн-магазина, и перед вами стоит задача оценить эффект от запуска маркетинговой кампании. Рассказываем, как сворачивать данные в массивы и применять функции из предыдущего видео для их обработки.
YouTube
Применение массивов для решения прикладной задачи в ClickHouse | Мария Сомова | karpov.courses
Симулятор аналитика: http://bit.ly/3xH64DP
Мы уже записывали видео с разбором полезных функций для работы с массивами в ClickHouse, и теперь пришло время практики. В этот раз преподавательница «Симулятора аналитика» Мария Сомова покажет, как применять массивы…
Мы уже записывали видео с разбором полезных функций для работы с массивами в ClickHouse, и теперь пришло время практики. В этот раз преподавательница «Симулятора аналитика» Мария Сомова покажет, как применять массивы…
Dynamic Tasks in Airflow
With the release of Airflow 2.3, users can write DAGs that dynamically generate parallel tasks at runtime. This feature, known as dynamic task mapping, is a paradigm shift for DAG design in Airflow.
https://www.astronomer.io/guides/dynamic-tasks
With the release of Airflow 2.3, users can write DAGs that dynamically generate parallel tasks at runtime. This feature, known as dynamic task mapping, is a paradigm shift for DAG design in Airflow.
https://www.astronomer.io/guides/dynamic-tasks
www.astronomer.io
Create dynamic Airflow tasks | Astronomer Documentation
How to dynamically create tasks at runtime in your Airflow DAGs.
The State of Data Engineering 2022 - LakeFS
https://lakefs.io/the-state-of-data-engineering-2022/
https://lakefs.io/the-state-of-data-engineering-2022/
Git for Data - lakeFS
The State of Data Engineering 2022 - Git for Data - lakeFS
Discover the latest tools and trends in data engineering for 2022. Get insights on advancements in Git for Data and how to stay ahead in the industry.
apache-nifi-for-dummies.pdf
4.5 MB
Apache Nifi for Dummies
Apache NiFi is an integrated data logistics and simple event processing platform. It provides an end-to-end platform that can collect, curate, analyze and act on data in real-time, on-premise, or in the cloud with a drag-and-drop visual interface.
💡 NiFi fundamentals
💡 NiFi use cases
💡 How to get started, debug and manage your own dataflows
Apache NiFi is an integrated data logistics and simple event processing platform. It provides an end-to-end platform that can collect, curate, analyze and act on data in real-time, on-premise, or in the cloud with a drag-and-drop visual interface.
💡 NiFi fundamentals
💡 NiFi use cases
💡 How to get started, debug and manage your own dataflows
👍1
Apache NiFi User Guide
Apache NiFi is a dataflow system based on the concepts of flow-based programming. It supports powerful and scalable directed graphs of data routing, transformation, and system mediation logic. NiFi has a web-based user interface for design, control, feedback, and monitoring of dataflows. It is highly configurable along several dimensions of quality of service, such as loss-tolerant versus guaranteed delivery, low latency versus high throughput, and priority-based queuing. NiFi provides fine-grained data provenance for all data received, forked, joined cloned, modified, sent, and ultimately dropped upon reaching its configured end-state.
https://nifi.apache.org/docs/nifi-docs/html/user-guide.html
Apache NiFi is a dataflow system based on the concepts of flow-based programming. It supports powerful and scalable directed graphs of data routing, transformation, and system mediation logic. NiFi has a web-based user interface for design, control, feedback, and monitoring of dataflows. It is highly configurable along several dimensions of quality of service, such as loss-tolerant versus guaranteed delivery, low latency versus high throughput, and priority-based queuing. NiFi provides fine-grained data provenance for all data received, forked, joined cloned, modified, sent, and ultimately dropped upon reaching its configured end-state.
https://nifi.apache.org/docs/nifi-docs/html/user-guide.html
nifi.apache.org
Apache NiFi User Guide
Apache Nifi Expression Language Cheat Sheet.pdf
62.4 KB
Apache Nifi Expression Language Cheat Sheet
Осваиваем_Kubernetes_Оркестрация_контейнерных_архитектур_Джиджи.pdf
8.9 MB
Осваиваем Kubernetes. Оркестрация контейнерных архитектур (Джиджи Сайфан).pdf
В книге рассмотрена новейшая версия Kubernetes 1.10.
Kubernetes – это система с открытым кодом, предназначенная для работы с контейнерными приложениями, их развертывания, масштабирования, управления ими. Если вы хотите запустить дополнительные контейнеры или автоматизировать управление, то вам не обойтись без Kubernetes.
Книга начинается с изучения основ Kubernetes, архитектуры и компоновки этой системы. Вы научитесь создавать микросервисы с сохранением состояния, ознакомитесь с такими продвинутыми возможностями, как горизонтальное автомасштабирование подов, выкатывание обновлений, квотирование ресурсов, обустроите долговременное хранилище на бэкенде. На реальных примерах вы исследуете возможности сетевой конфигурации, подключение и настройку плагинов. Эта книга поможет вам стать искусным дирижером и обращаться с контейнерными системами любой сложности.
В книге рассмотрена новейшая версия Kubernetes 1.10.
Kubernetes – это система с открытым кодом, предназначенная для работы с контейнерными приложениями, их развертывания, масштабирования, управления ими. Если вы хотите запустить дополнительные контейнеры или автоматизировать управление, то вам не обойтись без Kubernetes.
Книга начинается с изучения основ Kubernetes, архитектуры и компоновки этой системы. Вы научитесь создавать микросервисы с сохранением состояния, ознакомитесь с такими продвинутыми возможностями, как горизонтальное автомасштабирование подов, выкатывание обновлений, квотирование ресурсов, обустроите долговременное хранилище на бэкенде. На реальных примерах вы исследуете возможности сетевой конфигурации, подключение и настройку плагинов. Эта книга поможет вам стать искусным дирижером и обращаться с контейнерными системами любой сложности.