Инжиниринг Данных – Telegram

Инжиниринг Данных

21K subscribers

1.58K photos

33 videos

176 files

2.87K links

Делюсь новостями из мира аналитики и вредными карьерными советами;)

8 лет в FAANG, инвестиции в недвижимость, компании и акции, solo entrepreneur🏄‍♂️

https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce

Download Telegram

About

Blog

Apps

Platform

Инжиниринг Данных

21K subscribers

Инжиниринг Данных

Ещё один отзыв от человека, который получил необходимые навыки и знания на ресурсах #datalearn. Сегодня он мне написал, что недавно вышел на отличную работу и отличной зарплатой. Так, что все в ваших руках! У вас есть все необходимое.

Вот его словами:
Если прям кратко, то ситуация такая, в июне 2020 я встретился с DataLearn и подсел, в самом начале одно из самых полезных было то, что я понял роль аналитики и данных в целом, плюс некоторые вебинары заходят на ура) спустя некоторое время нашёл работу системным аналитиком в разработке продукта в ритейле, на зарплату +- среднюю для старта, спустя 7 месяцев опыта, самообучения по вечерам и в свободное время(~10 часов в неделю, это на вскидку) мне удалось получить оффер с доходом ~2,5 раза больше.

По навыкам ещё, курс Анатолия прекрасен, помог шлифануть то, что было) (примечание Анатолий создал лучший русскоязычный курс по SQL)

Собеседование было единственное, у меня не было в планах менять работу в ближайшее время, помог нетворкинг) в целом с SQL, Tableau/PowerBI работу можно найти быстрее, чем Танос щёлкнет пальцами, но если подкрепить это питоном, то работа найдёт тебя сама)

Всем успехов и никогда не сдавайтесь)

3.3K viewsDmitry Anoshin, edited 19:30

Инжиниринг Данных

Game Analytics on Azure-1.pdf

Презентация с конференции gamestack про Azure решения для аналитики игр.

4.9K viewsDmitry Anoshin, 20:29

Инжиниринг Данных

Будет PDF, присылайте! Уверен крутая книга🤠

3.2K viewsDmitry Anoshin, 05:49

Инжиниринг Данных

Анастасия Дробышева записала 5й урок модуля 1.
Если еще не записались на курс Job Hunting, то Welcome!

DATALEARN | JOB HUNTING - 101 | АНАСТАСИЯ ДРОБЫШЕВА | УРОК 1-5 | ОБЪЯСНЕНИЕ ПРИЧИН ПЕРЕХОДА

Курс "Поиск работы для аналитических специальностей в России и за рубежом". Модуль JH 1-5. Объяснение причин перехода (Exit Statement).

Грамотно отвечаем на вопрос "Почему вы ищете новую работу" для пяти ситуаций:

- Вы меняете профессию;
- Вы делаете апгрейд…

3.3K viewsDmitry Anoshin, edited 05:54

Инжиниринг Данных

А вот ещё один отзыв #datalearn ! И это мы ещё только половину сделали из запланированного контента.

Хочу поблагодарить тебя за твой крутейший образовательный проект! Благодаря нему я услышал про дивный мир дата инженеров, вдохновился, начал проходить курс, приобретать новые знания и подтягивать имеющиеся неструктурированные.
В итоге сменил сферу деятельности на ту, которая меня больше драйвит и выглядит более перспективной: продуктовая/ BI аналитика в одной из топовых IT компании РФ, цифровыми продуктами которой большинство из нас пользуется регул(Я)рно.

Не скажу, что я "ворвался в IT", т.к. до этого я уже был системным\бизнесовым аналитиком (тем самым "бизнес-аналитиком", быть которым у нас в РФ означает что угодно).
Тем не менее, сдвиг парадигмы произошел значительный (крупнейший за последнее время), задачи теперь более осмысленные и ежедневная деятельность ощущается по-новому!

3.3K viewsDmitry Anoshin, 14:14

Инжиниринг Данных

Я много писал про delta lake от Databricks. А есть ещё одно интересное решение, и мы о нём узнаем, наш следующий вебинар!

Друзья, завтра (22 апреля) в 19:00 по мск вебинар
Тема: озеро данных
Вещать будет Viktor Kessler, он из самого Dremio, Solution Architect.
Ссылка на вебинар: https://youtu.be/W9JvqMAc73Y
Не буду говорить, что всем нужно быть, будет прикольно, если вообще никто не придет :)))

DREMIO ОЗЕРО ДАННЫХ / VIKTOR KESSLER

Стремясь стать data driven, многие организации хотят демократизировать доступ к данным.

Однако они часто борются с постоянно увеличивающемся объемом данных, количеством запросов и растущим расходам на хранение данных.

Чтобы решить эту проблему, была…

3.3K viewsDmitry Anoshin, 18:20

Инжиниринг Данных

3.4K viewsDmitry Anoshin, 22:06

Инжиниринг Данных

Учите эксель? Занятия не должны быть скучными! Мне кажется у такого учителя скучно не бывает))

3.7K viewsDmitry Anoshin, 23:10

Инжиниринг Данных

Через 5 минут начинаем:
https://youtu.be/W9JvqMAc73Y

DREMIO ОЗЕРО ДАННЫХ / VIKTOR KESSLER

Стремясь стать data driven, многие организации хотят демократизировать доступ к данным.

Однако они часто борются с постоянно увеличивающемся объемом данных, количеством запросов и растущим расходам на хранение данных.

Чтобы решить эту проблему, была…

4.0K viewsRoman Ponomarev, 15:55

Инжиниринг Данных

Виктор Кесслер очень классно рассказал про современный landscape решений и про индустрию. Рассказал про историю продукта Dremio и Apache Arrow, и много другого. Обаятельно посмотрите доклад и узнаете много нового. https://youtu.be/W9JvqMAc73Y

3.7K viewsDmitry Anoshin, edited 02:21

Инжиниринг Данных

Learning SQL.pdf

6.5K viewsDmitry Anoshin, 05:11

Инжиниринг Данных

Study Guide- Data Retrieval with SQL.pdf

6.1K viewsDmitry Anoshin, 16:31

Инжиниринг Данных

Orphaned (осиротевшая) Analytics are one-off Machine Learning (ML) models written to address a specific business or operational problem, but never engineered for sharing, re-use and continuous-learning and adapting. То есть модель, которая решает конкретную задачу, но о ней мало кто знает внутри организации. А еще лучше, если человек, который ее создал, просто уволился.

Этот термин отлично подойдет для дашбордов, таблиц фактов, ETL jobs.

А вот сама статья.

Data Science Central

Orphaned Analytics: The Great Destroyers of Economic Value - DataScienceCentral.com

I’m overjoyed to announce the release of my latest book “The Economics of Data, Analytics, and Digital Transformation.” The book takes many of the concepts discussed in this blog to the next level of pragmatic, actionable detail. Thanks for your support!…

3.3K viewsDmitry Anoshin, 04:11

Инжиниринг Данных

Компания Thoughtworks (BI вендор) выпускает интересный digest - Technology Radar. В свежем выпуске они рассказали про тренды в аналитике. Многое мы уже и так знаем, например о популярности SQL, удобстве dbt для T в процессе ELT, data mesh и mainstream machine learning.

Еще они затронули тему monorepo. У кого-то есть соображения по этому вопросу?

PS Кстати, мы готовим очень полезный курс - DevOps для инжиниринга данных на Azure. Автор курса дата инженер Майкрософт из Сиэтла, наша соотечественница. Я сам жду этот курс, чтобы добавить best practices в свою работу.

Macro trends in the technology industry | April 2021

In each edition of the Radar we include a handful of “themes” that help the reader understand larger trends among the details of the individual blips. We only have limited space and often there are more trends than we have room for. These “macro trends” articles…

3.3K viewsDmitry Anoshin, 04:12

Инжиниринг Данных

В статье сравниваю форматы таблиц для озера данных: Hudi, Iceberg и Delta Lake.

Git for Data - lakeFS

Hudi, Iceberg and Delta Lake: Data Lake Table Formats Compared

A comparison between data lake table formats: Hudi Iceberg and Delta Lake. With advice on how to pick the best one for a particular workload

3.2K viewsDmitry Anoshin, 10:15

Инжиниринг Данных

А тут, автор сравнивает Redshift (для меня это обычно хранилище данных), PrestoDb, Trino (никогда не слышал). И вообще SQL движков очень много, автор решил привлечь внимание к своему продукту. Вы какие SQL движки используете для аналитики? У меня теперь целый арсенал в Synapse:
- Serverless SQL Pool - managed SQL engine (платим только, когда используем)
- Dedicated SQL Pool - аналитическое MPP хранилище данных
- Spark Pool - кластер managed Spark на Azure

Benchmarking SQL engines for Data Serving: PrestoDb, Trino, and Redshift

In the business of external data enrichment for data science, the main focus is on the ability to provide a fast and scalable way to…

3.4K viewsDmitry Anoshin, 13:21

Инжиниринг Данных

Вот как бывает - чувак был BI консультантом, я его даже приглашал в Amazon на BI tech talks года 3 назад, а сейчас он баллотируется в меры))

3.2K viewsDmitry Anoshin, 20:05

Инжиниринг Данных

Backstage модуль 5

3.0K viewsDmitry Anoshin, 23:42

Инжиниринг Данных

Layering Your Data Warehouse with dbt (open source инструмент для T в ELT):
1. Root Layer - The first layer is the landing zone for any initial data ingestion.
2. Logic Layer - The logic layer is where the heavy lifting of your data transformation is done.
3. Dimension and Activity Layer - This layer is where we begin to surface data models for others to use in their own analysis and projects.
4. Reporting Layer - This layer is for your metric calculations and any levels of aggregation you might need for reporting.

Layering Your Data Warehouse

Hello I am Mitchell Silverman! I have worked in data over the last decade at a number of tech companies including WayUp, WeWork, and now…

3.3K viewsDmitry Anoshin, 05:26

Инжиниринг Данных

Интересный материал.

3.1K viewsDmitry Anoshin, 05:35

Инжиниринг Данных

Forwarded from Dmitry N

https://github.com/joelparkerhenderson/monorepo_vs_polyrepo

GitHub - joelparkerhenderson/monorepo-vs-polyrepo: Monorepo vs. polyrepo: architecture for source code management (SCM) version…

Monorepo vs. polyrepo: architecture for source code management (SCM) version control systems (VCS) - joelparkerhenderson/monorepo-vs-polyrepo

3.4K viewsDmitry Anoshin, 05:35