Как_вытащить_из_данных_максимум_Навыки_аналитики_для_неспециалистов.pdf
2 MB
Как вытащить из данных максимум Навыки аналитики для неспециалистов (Джордан Морроу)
Полный_бред_Скептицизм_в_мире_больших_данных_Карл_Бергстром,_Джевин.epub
6.6 MB
Полный бред Скептицизм в мире больших данных (Карл Бергстром, Джевин Уэст)
🔥1
gRPC_Запуск_и_эксплуатация_облачных_приложений_Go_и_Java_для_Docker.pdf
3.7 MB
gRPC: Запуск и эксплуатация облачных приложений - Go и Java для Docker и Kubernetes
Год от года обретая новых сторонников, облачно-ориентированные и микросервисные архитектуры стали основой современного IT. Такой переход значительно повлиял и на структуру коммуникаций. Теперь приложения часто подключаются друг к другу по сети, и это происходит с помощью технологий межпроцессной коммуникации. Одной из наиболее популярных и эффективных технологий такого рода является gRPC.
В книге разбирается, как технология gRPC устроена «под капотом».
Год от года обретая новых сторонников, облачно-ориентированные и микросервисные архитектуры стали основой современного IT. Такой переход значительно повлиял и на структуру коммуникаций. Теперь приложения часто подключаются друг к другу по сети, и это происходит с помощью технологий межпроцессной коммуникации. Одной из наиболее популярных и эффективных технологий такого рода является gRPC.
В книге разбирается, как технология gRPC устроена «под капотом».
GitHub - charlax/professional-programming
A collection of full-stack resources for programmers.
https://github.com/charlax/professional-programming
A collection of full-stack resources for programmers.
https://github.com/charlax/professional-programming
GitHub
GitHub - charlax/professional-programming: A collection of learning resources for curious software engineers
A collection of learning resources for curious software engineers - charlax/professional-programming
Tarantool is an in-memory computing platform consisting of a database and an application server.
Key features of the database:
- MessagePack data format and MessagePack based client-server protocol.
- Two data engines: 100% in-memory with complete WAL-based persistence and an own implementation of LSM-tree, to use with large data sets.
- Multiple index types: HASH, TREE, RTREE, BITSET.
- Document oriented JSON path indexes.
- Asynchronous master-master replication.
- Synchronous quorum-based replication.
- RAFT-based automatic leader election for the single-leader configuration.
- Authentication and access control.
- ANSI SQL, including views, joins, referential and check constraints.
- Connectors for many programming languages.
- The database is a C extension of the application server and can be turned off.
Key features of the database:
- MessagePack data format and MessagePack based client-server protocol.
- Two data engines: 100% in-memory with complete WAL-based persistence and an own implementation of LSM-tree, to use with large data sets.
- Multiple index types: HASH, TREE, RTREE, BITSET.
- Document oriented JSON path indexes.
- Asynchronous master-master replication.
- Synchronous quorum-based replication.
- RAFT-based automatic leader election for the single-leader configuration.
- Authentication and access control.
- ANSI SQL, including views, joins, referential and check constraints.
- Connectors for many programming languages.
- The database is a C extension of the application server and can be turned off.
GitHub
GitHub - tarantool/tarantool: Get your data in RAM. Get compute close to data. Enjoy the performance.
Get your data in RAM. Get compute close to data. Enjoy the performance. - tarantool/tarantool
Modern_Data_Engineering_with_Apache_Spark_A_Hands_On_Guide_for_Building.pdf
6.4 MB
Data Engineering with Apache Spark. A Hands-On Guide for Building Mission-Critical Streaming Applications.pdf
🔥1
Docker и Docker-Compose Tutorial (Контейнеры, install, run, image, daemon, etc.)
Внутри статьи по разделам довольно много полезных видео прикреплено с YouTube.
https://ivan-shamaev.ru/docker-compose-tutorial-container-image-install/
Внутри статьи по разделам довольно много полезных видео прикреплено с YouTube.
https://ivan-shamaev.ru/docker-compose-tutorial-container-image-install/
Персональный блог Data Engineer | Ex-TeamLead BI Developer
Docker и Docker-Compose Tutorial (Контейнеры, install, run, image, daemon, etc.)
Docker и Docker-Compose Tutorial. Установка Docker. Архитектура Docker. Образы и контейнеры Docker. DockerFile. Основные команды. Bind Mount.
👍1
DevOps Roadmap
Step by step guide for DevOps, SRE or any other Operations Role in 2022
👉 @devops_dataops
https://roadmap.sh/devops
Step by step guide for DevOps, SRE or any other Operations Role in 2022
👉 @devops_dataops
https://roadmap.sh/devops
👍1
GitHub - DataTalksClub/data-engineering-zoomcamp: Free Data Engineering course!
https://github.com/DataTalksClub/data-engineering-zoomcamp
https://github.com/DataTalksClub/data-engineering-zoomcamp
GitHub
GitHub - DataTalksClub/data-engineering-zoomcamp: Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals…
Data Engineering Zoomcamp is a free nine-week course that covers the fundamentals of data engineering. - DataTalksClub/data-engineering-zoomcamp
👍3
Хорошее обзорное видео про data engineering
https://youtu.be/qWru-b6m030
https://youtu.be/qWru-b6m030
YouTube
How Data Engineering Works
So, the sole purpose of data engineering is to take data from the source and save it to make it available for analysis. Sounds simple, but it’s the matter of the system that works under the hood.
Watch our video to find out more about data engineering:
00:00…
Watch our video to find out more about data engineering:
00:00…
👍1
Forwarded from ChernovDev (Stanislav Chernov)
Серия статей про Apache Airflow c хабра:
Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписания
Все, что вам нужно знать об Airflow DAGs, ч.2 — Операторы и Датчики
Все, что вам нужно знать об Airflow DAGs, ч.3 — Проектирование DAG
Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписания
Все, что вам нужно знать об Airflow DAGs, ч.2 — Операторы и Датчики
Все, что вам нужно знать об Airflow DAGs, ч.3 — Проектирование DAG
👍1
Forwarded from 🔋 Труба данных
- https://seattledataguy.substack.com/p/cataloging-data-catalogs
- https://github.com/opendatadiscovery/awesome-data-catalogs
- И целый топик в GitHub - https://github.com/topics/data-catalog
Каталог Каталогов Данных
Относительно недавно мы начали готовить почву для того, чтобы внедрять каталог данных и автоматическую документацию. Поэтому я сидел и исследовал, а что же доступно на рынке каталогов данных. В общем и целом, много чего, и платного и опен-сорс.
Поэтому, если вам предстоит похожая задача, вот несколько подборок (по большей части, пересекающиеся между собой).
@ohmydataengineer
- https://github.com/opendatadiscovery/awesome-data-catalogs
- И целый топик в GitHub - https://github.com/topics/data-catalog
Каталог Каталогов Данных
Относительно недавно мы начали готовить почву для того, чтобы внедрять каталог данных и автоматическую документацию. Поэтому я сидел и исследовал, а что же доступно на рынке каталогов данных. В общем и целом, много чего, и платного и опен-сорс.
Поэтому, если вам предстоит похожая задача, вот несколько подборок (по большей части, пересекающиеся между собой).
@ohmydataengineer
SeattleDataGuy’s Newsletter
Cataloging Data Catalogs
And Building Data Infra
👍1
Modern Data Orchestration Stack with Prefect 2.0, Airbyte and dbt
Узнать больше информации про Airbyte можно в группе 👉 @airbyte
https://blog.devgenius.io/modern-data-orchestration-stack-with-prefect-2-0-airbyte-and-dbt-e7c0e9b27add
Узнать больше информации про Airbyte можно в группе 👉 @airbyte
https://blog.devgenius.io/modern-data-orchestration-stack-with-prefect-2-0-airbyte-and-dbt-e7c0e9b27add
Medium
Modern Data Orchestration Stack with Prefect 2.0, Airbyte and dbt
Using Publicly Available COVID-19 Data.
👍1
Data Product Canvas — A practical framework for building high-performance data products
https://medium.com/@leandroscarvalho/data-product-canvas-a-practical-framework-for-building-high-performance-data-products-7a1717f79f0
https://medium.com/@leandroscarvalho/data-product-canvas-a-practical-framework-for-building-high-performance-data-products-7a1717f79f0
Medium
Data Product Canvas — A practical framework for building high-performance data products
How to avoid creating the right solution to the wrong problem?
👍1🔥1
Lessons learned after 1 year with dbt
https://medium.com/@imweijian/lessons-learned-after-1-year-with-dbt-a7f0ccf85b12
https://medium.com/@imweijian/lessons-learned-after-1-year-with-dbt-a7f0ccf85b12
Medium
Lessons learned after 1 year with dbt.
I spoke to some of my fellow data friends about dbt, and how it made our ELT pipelines more manageable. Not everyone agreed with our…
👍1