Data Engineering / Инженерия данных / Data Engineer / DWH

Репозиторий с проектами Data Engineering
https://github.com/san089/Udacity-Data-Engineering-Projects

GitHub - san089/Udacity-Data-Engineering-Projects: Few projects related to Data Engineering including Data Modeling, Infrastructure…

291 views09:09

Data Engineering / Инженерия данных / Data Engineer / DWH

Инженерия_машинного_обучения_Андрей_Бурков_2022.pdf

14.9 MB

Инженерия машинного обучения

Содержит множество рекомендаций и паттернов проектирования надежных и масштабируемых решений в области машинного обучения.

276 views09:14

Data Engineering / Инженерия данных / Data Engineer / DWH

10 Best Open Source ERP Software Systems For 2022

https://dynamics.folio3.com/blog/open-source-enterprise-resource-planning-software/

Folio3 Dynamics Blog

🥇 Top 10 open source ERP systems to consider in 2024

We will be looking at top 10 open source ERP software available in the market for 2024. We will be discussing all you want to know about the open source ERP software systems and its working.

217 views11:29

Data Engineering / Инженерия данных / Data Engineer / DWH

Odoo. Open Source Apps To Grow Your Business
https://github.com/odoo/odoo

GitHub

GitHub - odoo/odoo: Odoo. Open Source Apps To Grow Your Business.

Odoo. Open Source Apps To Grow Your Business. Contribute to odoo/odoo development by creating an account on GitHub.

215 views11:29

Data Engineering / Инженерия данных / Data Engineer / DWH

ОБРАБОТКА_БОЛЬШИХ_ДАННЫХ_С_APACHE_SPARK_Университет_ИТМО.pdf

2.8 MB

Обработка больших данных с
Apache Spark– СПб: Университет ИТМО, 2019г.

Учебно-методическое пособие содержит теоретический материал и примеры выполнения задач для курса «Введение в технологии обработки больших данных». Пособие составлено с учётом проведения лабораторных работ с помощью фреймворка Apache Spark. Содержание дисциплины охватывает круг вопросов, связанных с организацией построения ETLконвейеров на основе Spark SQL и DataFrame API для распределенного выполнения на кластерных вычислительных система, включая использование итеративных вычислений, важных для машинного обучения, рассмотрения shuffle механизмов и принципов организации управлением памятью в Spark.
В результате освоения дисциплины студенты приобретают способности разработки программ и построения конвейеров обработки различных данных, навыки по работе с распределенными кластерными системами, а также способности к применению машинного обучения на распределенных наборах данных.

324 views16:27

Data Engineering / Инженерия данных / Data Engineer / DWH

How to Design and Build a Data Platform

https://productcoalition.com/how-to-design-and-build-a-data-platform-as-a-product-d22329ff5a3f

Medium

How to Design and Build a Data Platform

A breakdown of the challenges, teachable moments, frameworks and recommendations to deliver a data platform successfully.

228 viewsedited 10:07

Data Engineering / Инженерия данных / Data Engineer / DWH

Перевод книги Problem Solving with Algorithms and Data Structures

https://aliev.me/runestone/index.html

aliev.me

Оглавление — Problem Solving with Algorithms and Data Structures

An interactive version of Problem Solving with Algorithms and Data Structures using Python.

236 views10:14

Data Engineering / Инженерия данных / Data Engineer / DWH

Data_Analysis_with_Python_and_PySpark_Final_Release_Jonathan_Rioux.pdf

14.6 MB

Data Analysis with Python and PySpark (Final Release) (Jonathan Rioux)

👉 @devops_dataops

In Data Analysis with Python and PySpark you will learn how to:
• Manage your data as it scales across multiple machines
• Scale up your data programs with full confidence
• Read and write data to and from a variety of sources and formats
• Deal with messy data with PySpark’s data manipulation functionality
• Discover new data sets and perform exploratory data analysis
• Build automated data pipelines that transform, summarize, and get insights from data
• Troubleshoot common PySpark errors
• Creating reliable long-running jobs

259 viewsedited 10:19

Data Engineering / Инженерия данных / Data Engineer / DWH

Про Kafka (основы)

Apache Kafka - популярный распределенный отказоустойчивый брокер сообщений, используемый в высоконагруженных системах и BigData проектах.
https://www.youtube.com/watch?v=-AZOi3kP9Js

YouTube

Про Kafka (основы)

Apache Kafka - популярный распределенный отказоустойчивый брокер сообщений, используемый в высоконагруженных системах и BigData проектах.
На видео мой рассказ про основы Kafka: что, зачем, как и где.

251 views11:51

Data Engineering / Инженерия данных / Data Engineer / DWH

Ansible_Up_and_Running_Automating_Configuration_Management_and_Deployment.epub

12.9 MB

Ansible: Up and Running - Automating Configuration Management and Deployment the Easy Way, 3rd Edition

🔹 Explore Ansible configuration management and deployment
🔹 Manage Linux, Windows, and network devices
🔹 Learn how to apply Ansible best practices
🔹 Understand how to use the new collections format
🔹 Create custom modules and plug-ins
🔹 Generate reusable Ansible content for open source middleware
🔹 Build container images, images for cloud instances, and cloud infrastructure
🔹 Automate CI/CD development environments

264 views12:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Как_вытащить_из_данных_максимум_Навыки_аналитики_для_неспециалистов.pdf

2 MB

Как вытащить из данных максимум Навыки аналитики для неспециалистов (Джордан Морроу)

Полный_бред_Скептицизм_в_мире_больших_данных_Карл_Бергстром,_Джевин.epub

6.6 MB

Полный бред Скептицизм в мире больших данных (Карл Бергстром, Джевин Уэст)

🔥1

286 views16:02

Data Engineering / Инженерия данных / Data Engineer / DWH

gRPC_Запуск_и_эксплуатация_облачных_приложений_Go_и_Java_для_Docker.pdf

3.7 MB

gRPC: Запуск и эксплуатация облачных приложений - Go и Java для Docker и Kubernetes

Год от года обретая новых сторонников, облачно-ориентированные и микросервисные архитектуры стали основой современного IT. Такой переход значительно повлиял и на структуру коммуникаций. Теперь приложения часто подключаются друг к другу по сети, и это происходит с помощью технологий межпроцессной коммуникации. Одной из наиболее популярных и эффективных технологий такого рода является gRPC.

В книге разбирается, как технология gRPC устроена «под капотом».

293 views11:01

Data Engineering / Инженерия данных / Data Engineer / DWH

GitHub - charlax/professional-programming

A collection of full-stack resources for programmers.

https://github.com/charlax/professional-programming

GitHub

GitHub - charlax/professional-programming: A collection of learning resources for curious software engineers

A collection of learning resources for curious software engineers - charlax/professional-programming

321 views13:23

Data Engineering / Инженерия данных / Data Engineer / DWH

https://youtu.be/lZ7JPsRS4NY

YouTube

МИКРОСЕРВИСЫ vs МОНОЛИТ: Какую АРХИТЕКТУРУ выбрать?

🤚 Привет! Вы на канале "TeachMeSkills Школа программирования"! И это новый выпуск рубрики НАТИВ в формате подкаста. Сегодня поговорим на очень знаковую, отчасти холиварную, сложную, но однозначно важную тему из сферы IT - архитектура приложений: монолит или…

271 views07:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Полный разбор SQL задач из Кремниевой долины (FAANG)

https://www.youtube.com/watch?v=kIRR7M8Ryp0

337 views13:34

Data Engineering / Инженерия данных / Data Engineer / DWH

Tarantool is an in-memory computing platform consisting of a database and an application server.

Key features of the database:
- MessagePack data format and MessagePack based client-server protocol.
- Two data engines: 100% in-memory with complete WAL-based persistence and an own implementation of LSM-tree, to use with large data sets.
- Multiple index types: HASH, TREE, RTREE, BITSET.
- Document oriented JSON path indexes.
- Asynchronous master-master replication.
- Synchronous quorum-based replication.
- RAFT-based automatic leader election for the single-leader configuration.
- Authentication and access control.
- ANSI SQL, including views, joins, referential and check constraints.
- Connectors for many programming languages.
- The database is a C extension of the application server and can be turned off.

GitHub

GitHub - tarantool/tarantool: Get your data in RAM. Get compute close to data. Enjoy the performance.

Get your data in RAM. Get compute close to data. Enjoy the performance. - tarantool/tarantool

277 views10:45

Data Engineering / Инженерия данных / Data Engineer / DWH

Data Governance Framework — Implementation Guide

https://jelvix.medium.com/data-governance-framework-implementation-guide-e5161afa454f

Medium

Data Governance Framework — Implementation Guide

Why Do Data-Driven Businesses Need a Data Governance Framework?

289 views15:37

Data Engineering / Инженерия данных / Data Engineer / DWH

Modern_Data_Engineering_with_Apache_Spark_A_Hands_On_Guide_for_Building.pdf

6.4 MB

Data Engineering with Apache Spark. A Hands-On Guide for Building Mission-Critical Streaming Applications.pdf

🔥1

383 views05:00

Data Engineering / Инженерия данных / Data Engineer / DWH

Docker и Docker-Compose Tutorial (Контейнеры, install, run, image, daemon, etc.)

Внутри статьи по разделам довольно много полезных видео прикреплено с YouTube.

https://ivan-shamaev.ru/docker-compose-tutorial-container-image-install/

Персональный блог Data Engineer | Ex-TeamLead BI Developer

Docker и Docker-Compose Tutorial (Контейнеры, install, run, image, daemon, etc.)

Docker и Docker-Compose Tutorial. Установка Docker. Архитектура Docker. Образы и контейнеры Docker. DockerFile. Основные команды. Bind Mount.

👍1

344 viewsedited 09:13