Ещё один отзыв от человека, который получил необходимые навыки и знания на ресурсах #datalearn. Сегодня он мне написал, что недавно вышел на отличную работу и отличной зарплатой. Так, что все в ваших руках! У вас есть все необходимое.
Вот его словами:
Если прям кратко, то ситуация такая, в июне 2020 я встретился с DataLearn и подсел, в самом начале одно из самых полезных было то, что я понял роль аналитики и данных в целом, плюс некоторые вебинары заходят на ура) спустя некоторое время нашёл работу системным аналитиком в разработке продукта в ритейле, на зарплату +- среднюю для старта, спустя 7 месяцев опыта, самообучения по вечерам и в свободное время(~10 часов в неделю, это на вскидку) мне удалось получить оффер с доходом ~2,5 раза больше.
По навыкам ещё, курс Анатолия прекрасен, помог шлифануть то, что было) (примечание Анатолий создал лучший русскоязычный курс по SQL)
Собеседование было единственное, у меня не было в планах менять работу в ближайшее время, помог нетворкинг) в целом с SQL, Tableau/PowerBI работу можно найти быстрее, чем Танос щёлкнет пальцами, но если подкрепить это питоном, то работа найдёт тебя сама)
Всем успехов и никогда не сдавайтесь)
Вот его словами:
Если прям кратко, то ситуация такая, в июне 2020 я встретился с DataLearn и подсел, в самом начале одно из самых полезных было то, что я понял роль аналитики и данных в целом, плюс некоторые вебинары заходят на ура) спустя некоторое время нашёл работу системным аналитиком в разработке продукта в ритейле, на зарплату +- среднюю для старта, спустя 7 месяцев опыта, самообучения по вечерам и в свободное время(~10 часов в неделю, это на вскидку) мне удалось получить оффер с доходом ~2,5 раза больше.
По навыкам ещё, курс Анатолия прекрасен, помог шлифануть то, что было) (примечание Анатолий создал лучший русскоязычный курс по SQL)
Собеседование было единственное, у меня не было в планах менять работу в ближайшее время, помог нетворкинг) в целом с SQL, Tableau/PowerBI работу можно найти быстрее, чем Танос щёлкнет пальцами, но если подкрепить это питоном, то работа найдёт тебя сама)
Всем успехов и никогда не сдавайтесь)
Game Analytics on Azure-1.pdf
1.4 MB
Презентация с конференции gamestack про Azure решения для аналитики игр.
Анастасия Дробышева записала 5й урок модуля 1.
Если еще не записались на курс Job Hunting, то Welcome!
Если еще не записались на курс Job Hunting, то Welcome!
YouTube
DATALEARN | JOB HUNTING - 101 | АНАСТАСИЯ ДРОБЫШЕВА | УРОК 1-5 | ОБЪЯСНЕНИЕ ПРИЧИН ПЕРЕХОДА
Курс "Поиск работы для аналитических специальностей в России и за рубежом". Модуль JH 1-5. Объяснение причин перехода (Exit Statement).
Грамотно отвечаем на вопрос "Почему вы ищете новую работу" для пяти ситуаций:
- Вы меняете профессию;
- Вы делаете апгрейд…
Грамотно отвечаем на вопрос "Почему вы ищете новую работу" для пяти ситуаций:
- Вы меняете профессию;
- Вы делаете апгрейд…
А вот ещё один отзыв #datalearn ! И это мы ещё только половину сделали из запланированного контента.
Хочу поблагодарить тебя за твой крутейший образовательный проект! Благодаря нему я услышал про дивный мир дата инженеров, вдохновился, начал проходить курс, приобретать новые знания и подтягивать имеющиеся неструктурированные.
В итоге сменил сферу деятельности на ту, которая меня больше драйвит и выглядит более перспективной: продуктовая/ BI аналитика в одной из топовых IT компании РФ, цифровыми продуктами которой большинство из нас пользуется регул(Я)рно.
Не скажу, что я "ворвался в IT", т.к. до этого я уже был системным\бизнесовым аналитиком (тем самым "бизнес-аналитиком", быть которым у нас в РФ означает что угодно).
Тем не менее, сдвиг парадигмы произошел значительный (крупнейший за последнее время), задачи теперь более осмысленные и ежедневная деятельность ощущается по-новому!
Хочу поблагодарить тебя за твой крутейший образовательный проект! Благодаря нему я услышал про дивный мир дата инженеров, вдохновился, начал проходить курс, приобретать новые знания и подтягивать имеющиеся неструктурированные.
В итоге сменил сферу деятельности на ту, которая меня больше драйвит и выглядит более перспективной: продуктовая/ BI аналитика в одной из топовых IT компании РФ, цифровыми продуктами которой большинство из нас пользуется регул(Я)рно.
Не скажу, что я "ворвался в IT", т.к. до этого я уже был системным\бизнесовым аналитиком (тем самым "бизнес-аналитиком", быть которым у нас в РФ означает что угодно).
Тем не менее, сдвиг парадигмы произошел значительный (крупнейший за последнее время), задачи теперь более осмысленные и ежедневная деятельность ощущается по-новому!
Я много писал про delta lake от Databricks. А есть ещё одно интересное решение, и мы о нём узнаем, наш следующий вебинар!
Друзья, завтра (22 апреля) в 19:00 по мск вебинар
Тема: озеро данных
Вещать будет Viktor Kessler, он из самого Dremio, Solution Architect.
Ссылка на вебинар: https://youtu.be/W9JvqMAc73Y
Не буду говорить, что всем нужно быть, будет прикольно, если вообще никто не придет :)))
Друзья, завтра (22 апреля) в 19:00 по мск вебинар
Тема: озеро данных
Вещать будет Viktor Kessler, он из самого Dremio, Solution Architect.
Ссылка на вебинар: https://youtu.be/W9JvqMAc73Y
Не буду говорить, что всем нужно быть, будет прикольно, если вообще никто не придет :)))
YouTube
DREMIO ОЗЕРО ДАННЫХ / VIKTOR KESSLER
Стремясь стать data driven, многие организации хотят демократизировать доступ к данным.
Однако они часто борются с постоянно увеличивающемся объемом данных, количеством запросов и растущим расходам на хранение данных.
Чтобы решить эту проблему, была…
Однако они часто борются с постоянно увеличивающемся объемом данных, количеством запросов и растущим расходам на хранение данных.
Чтобы решить эту проблему, была…
Через 5 минут начинаем:
https://youtu.be/W9JvqMAc73Y
https://youtu.be/W9JvqMAc73Y
YouTube
DREMIO ОЗЕРО ДАННЫХ / VIKTOR KESSLER
Стремясь стать data driven, многие организации хотят демократизировать доступ к данным.
Однако они часто борются с постоянно увеличивающемся объемом данных, количеством запросов и растущим расходам на хранение данных.
Чтобы решить эту проблему, была…
Однако они часто борются с постоянно увеличивающемся объемом данных, количеством запросов и растущим расходам на хранение данных.
Чтобы решить эту проблему, была…
Виктор Кесслер очень классно рассказал про современный landscape решений и про индустрию. Рассказал про историю продукта Dremio и Apache Arrow, и много другого. Обаятельно посмотрите доклад и узнаете много нового. https://youtu.be/W9JvqMAc73Y
Orphaned (осиротевшая) Analytics are one-off Machine Learning (ML) models written to address a specific business or operational problem, but never engineered for sharing, re-use and continuous-learning and adapting. То есть модель, которая решает конкретную задачу, но о ней мало кто знает внутри организации. А еще лучше, если человек, который ее создал, просто уволился.
Этот термин отлично подойдет для дашбордов, таблиц фактов, ETL jobs.
А вот сама статья.
Этот термин отлично подойдет для дашбордов, таблиц фактов, ETL jobs.
А вот сама статья.
Data Science Central
Orphaned Analytics: The Great Destroyers of Economic Value - DataScienceCentral.com
I’m overjoyed to announce the release of my latest book “The Economics of Data, Analytics, and Digital Transformation.” The book takes many of the concepts discussed in this blog to the next level of pragmatic, actionable detail. Thanks for your support!…
Компания Thoughtworks (BI вендор) выпускает интересный digest - Technology Radar. В свежем выпуске они рассказали про тренды в аналитике. Многое мы уже и так знаем, например о популярности SQL, удобстве dbt для T в процессе ELT, data mesh и mainstream machine learning.
Еще они затронули тему monorepo. У кого-то есть соображения по этому вопросу?
PS Кстати, мы готовим очень полезный курс - DevOps для инжиниринга данных на Azure. Автор курса дата инженер Майкрософт из Сиэтла, наша соотечественница. Я сам жду этот курс, чтобы добавить best practices в свою работу.
Еще они затронули тему monorepo. У кого-то есть соображения по этому вопросу?
PS Кстати, мы готовим очень полезный курс - DevOps для инжиниринга данных на Azure. Автор курса дата инженер Майкрософт из Сиэтла, наша соотечественница. Я сам жду этот курс, чтобы добавить best practices в свою работу.
Thoughtworks
Macro trends in the technology industry | April 2021
In each edition of the Radar we include a handful of “themes” that help the reader understand larger trends among the details of the individual blips. We only have limited space and often there are more trends than we have room for. These “macro trends” articles…
В статье сравниваю форматы таблиц для озера данных: Hudi, Iceberg и Delta Lake.
Git for Data - lakeFS
Hudi, Iceberg and Delta Lake: Data Lake Table Formats Compared
A comparison between data lake table formats: Hudi Iceberg and Delta Lake. With advice on how to pick the best one for a particular workload
А тут, автор сравнивает Redshift (для меня это обычно хранилище данных), PrestoDb, Trino (никогда не слышал). И вообще SQL движков очень много, автор решил привлечь внимание к своему продукту. Вы какие SQL движки используете для аналитики? У меня теперь целый арсенал в Synapse:
- Serverless SQL Pool - managed SQL engine (платим только, когда используем)
- Dedicated SQL Pool - аналитическое MPP хранилище данных
- Spark Pool - кластер managed Spark на Azure
- Serverless SQL Pool - managed SQL engine (платим только, когда используем)
- Dedicated SQL Pool - аналитическое MPP хранилище данных
- Spark Pool - кластер managed Spark на Azure
Medium
Benchmarking SQL engines for Data Serving: PrestoDb, Trino, and Redshift
In the business of external data enrichment for data science, the main focus is on the ability to provide a fast and scalable way to…
Layering Your Data Warehouse with dbt (open source инструмент для T в ELT):
1. Root Layer - The first layer is the landing zone for any initial data ingestion.
2. Logic Layer - The logic layer is where the heavy lifting of your data transformation is done.
3. Dimension and Activity Layer - This layer is where we begin to surface data models for others to use in their own analysis and projects.
4. Reporting Layer - This layer is for your metric calculations and any levels of aggregation you might need for reporting.
1. Root Layer - The first layer is the landing zone for any initial data ingestion.
2. Logic Layer - The logic layer is where the heavy lifting of your data transformation is done.
3. Dimension and Activity Layer - This layer is where we begin to surface data models for others to use in their own analysis and projects.
4. Reporting Layer - This layer is for your metric calculations and any levels of aggregation you might need for reporting.
Medium
Layering Your Data Warehouse
Hello I am Mitchell Silverman! I have worked in data over the last decade at a number of tech companies including WayUp, WeWork, and now…
Forwarded from Dmitry N
GitHub
GitHub - joelparkerhenderson/monorepo-vs-polyrepo: Monorepo vs. polyrepo: architecture for source code management (SCM) version…
Monorepo vs. polyrepo: architecture for source code management (SCM) version control systems (VCS) - joelparkerhenderson/monorepo-vs-polyrepo