Хороший пост из 2х частей про роль Program Manager от Microsoft:
In this two-part article series, author describe the unique responsibilities of a program manager (PM) on an ML team, the value that a PM adds, and how to be successful in this new role.
ML program management at scale (Part 1 of 2)
ML program management at scale (Part 2 of 2)
In this two-part article series, author describe the unique responsibilities of a program manager (PM) on an ML team, the value that a PM adds, and how to be successful in this new role.
ML program management at scale (Part 1 of 2)
ML program management at scale (Part 2 of 2)
Medium
ML program management at scale (Part 1 of 2)
A deep dive into the role and its responsibilities.
В общем качество данных это не шутка! Поэтому у бизнеса и у нас должны быть высокие ожидание про качества данных, что есть Great Expectations!
А еще, неплохо бы не изобретать велосипед, а использовать готовый framework для обеспечения качества данных, можно например использовать Deequ для Spark (Scala или Pyspark), а можно посмотреть на новый популярный инструмент, который работает без спарка - Great Expectations.
Вот вам аж целых 3 поста про них!
https://greatexpectations.io/blog/maximizing-productivity-of-analytics-teams-pt1/
https://greatexpectations.io/blog/maximizing-productivity-of-analytics-teams-pt2/
https://greatexpectations.io/blog/maximizing-productivity-of-analytics-teams-pt3/
Great Expectations writes a three-part series on maximizing the productivity of the analytics team, focusing on the debugability of the dashboards, reducing the technical debt on the data pipeline, and the role of Great Expectations in the data engineering process.
А еще, неплохо бы не изобретать велосипед, а использовать готовый framework для обеспечения качества данных, можно например использовать Deequ для Spark (Scala или Pyspark), а можно посмотреть на новый популярный инструмент, который работает без спарка - Great Expectations.
Вот вам аж целых 3 поста про них!
https://greatexpectations.io/blog/maximizing-productivity-of-analytics-teams-pt1/
https://greatexpectations.io/blog/maximizing-productivity-of-analytics-teams-pt2/
https://greatexpectations.io/blog/maximizing-productivity-of-analytics-teams-pt3/
Great Expectations writes a three-part series on maximizing the productivity of the analytics team, focusing on the debugability of the dashboards, reducing the technical debt on the data pipeline, and the role of Great Expectations in the data engineering process.
Что может быть общего подхода по моделированию данных Data Vault и Python? Оказывается есть - diepvries is the name of a Python library. It automates the data loading process for Data Vault and avoids the maintenance of repetitive SQL queries for ETL jobs.
https://blog.picnic.nl/releasing-diepvries-a-data-vault-framework-for-python-3f01a5d46f84
https://blog.picnic.nl/releasing-diepvries-a-data-vault-framework-for-python-3f01a5d46f84
Medium
Releasing diepvries, a Data Vault framework for Python
diepvries is a simple Python interface that generates complex SQL queries used to load a complete Data Vault model.
Через 40 минут начинаем:
https://youtu.be/-ZgzpQXsxi0
https://youtu.be/-ZgzpQXsxi0
YouTube
DataVault / Anchor Modeling / Николай Голов
"As data people, we definitely have a lot of tools. In 2017, Y Combinator—an incubator of both startups and the Silicon Valley zeitgeist—funded 15 analytics, data engineering, and AI and ML companies. In 2021, they funded 100.² It’s impossible to make sense of this many tools, much less manage even a fraction of them in a single stack."
Все так - кол-во инструментов (tools) для работы с данными растет в геометрической прогрессии. Свеже испеченным дата профессионалом будет очень сложно понять разницу в инструментах, их назначении и различии. 🙄
Новички, как собираетесь решать проблему? Всего не перепробовать и не выучить, и концов не найти. Как в песне:
Data может, data может
Все что угодно....
Все так - кол-во инструментов (tools) для работы с данными растет в геометрической прогрессии. Свеже испеченным дата профессионалом будет очень сложно понять разницу в инструментах, их назначении и различии. 🙄
Новички, как собираетесь решать проблему? Всего не перепробовать и не выучить, и концов не найти. Как в песне:
Data может, data может
Все что угодно....
Специально нашел soundtracks Tableau Conference 2019, раз уж про песни заговорил, https://open.spotify.com/playlist/5mohLACrVKdX6zxCfagScw
Spotify
TC19 Tableau Conference - General
Playlist · jennyd · 113 items · 174 saves
Все помнят что сегодня в 20:00 по мск вебинар :
https://youtu.be/DmqGfdQWP94
https://youtu.be/DmqGfdQWP94
YouTube
Angry Data Scientist - изучаем машинное обучение / Роман Зыков
Достала реклама курсов, обещающих светлое будущее и полный кошелек. Давайте поговорим серьезно о изучении машинного обучения, чтобы выйти из хобби в реальную работу, которое приносит настоящую пользу.
Через пол часа начинаем:
https://youtu.be/DmqGfdQWP94
https://youtu.be/DmqGfdQWP94
YouTube
Angry Data Scientist - изучаем машинное обучение / Роман Зыков
Достала реклама курсов, обещающих светлое будущее и полный кошелек. Давайте поговорим серьезно о изучении машинного обучения, чтобы выйти из хобби в реальную работу, которое приносит настоящую пользу.
Через 2 минуты начинаем кстати гоу в зум кому в кайф:
Подключиться к конференции Zoom
https://us02web.zoom.us/j/89848486805?pwd=THg0UHRGdTBxZml6ZjNtZnF3VFVCdz09
Идентификатор конференции: 898 4848 6805
Код доступа: 996986
Одно касание на мобильном телефоне
+13017158592,,89848486805#,,,,*996986# Соединенные Штаты Америки (Washington DC)
+13126266799,,89848486805#,,,,*996986# Соединенные Штаты Америки (Chicago)
Набор в зависимости от местоположения
+1 301 715 8592 Соединенные Штаты Америки (Washington DC)
+1 312 626 6799 Соединенные Штаты Америки (Chicago)
+1 346 248 7799 Соединенные Штаты Америки (Houston)
+1 669 900 6833 Соединенные Штаты Америки (San Jose)
+1 929 205 6099 Соединенные Штаты Америки (New York)
+1 253 215 8782 Соединенные Штаты Америки (Tacoma)
Идентификатор конференции: 898 4848 6805
Код доступа: 996986
Найдите свой местный номер: https://us02web.zoom.us/u/kd2F7vdGeS
Подключиться к конференции Zoom
https://us02web.zoom.us/j/89848486805?pwd=THg0UHRGdTBxZml6ZjNtZnF3VFVCdz09
Идентификатор конференции: 898 4848 6805
Код доступа: 996986
Одно касание на мобильном телефоне
+13017158592,,89848486805#,,,,*996986# Соединенные Штаты Америки (Washington DC)
+13126266799,,89848486805#,,,,*996986# Соединенные Штаты Америки (Chicago)
Набор в зависимости от местоположения
+1 301 715 8592 Соединенные Штаты Америки (Washington DC)
+1 312 626 6799 Соединенные Штаты Америки (Chicago)
+1 346 248 7799 Соединенные Штаты Америки (Houston)
+1 669 900 6833 Соединенные Штаты Америки (San Jose)
+1 929 205 6099 Соединенные Штаты Америки (New York)
+1 253 215 8782 Соединенные Штаты Америки (Tacoma)
Идентификатор конференции: 898 4848 6805
Код доступа: 996986
Найдите свой местный номер: https://us02web.zoom.us/u/kd2F7vdGeS
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
Вы уже знакомы с TPC benchmarking (модуль 6.2)? Вот и Databricks сделал свои тесты https://databricks.com/product/databricks-sql-2
У кого есть возможность, можете оставить отзыв Роман Зыков на Amazon про его книну: Roman's Data Science: How to monetize your data
Amazon.ca
Amazon.com
Или на вашем амазоне, например в Европе.
Amazon.ca
Amazon.com
Или на вашем амазоне, например в Европе.
Amazon
Roman's Data Science: How to monetize your data
Roman's Data Science: How to monetize your data eBook : Zykov, Roman, Vishvanyuk, Vladimir, Zykova, Ekaterina, Taylor, Philip, Alexandrov, Alexander: Amazon.ca: Kindle Store
И снова хорошие новости, Табло конференция будет 9-12 ноября ( прям на мое др) и поэтому она бесплатна для вас, хотя она и так бесплатна, так как 100% онлайн. Уверен будет много интересного. https://www.tableau.com/events/conference?utm_campaign=PowerBI
Свежая статья про FeatureStore. Никто не хочет рассказать про него на вебинаре? Отличие от хранилища данных, архитектура, и тп.
Medium
MLOps: Building a Feature Store? Here are the top things to keep in mind
A Feature Store should have 3 major building blocks and offer 10 major functionalities.
Хотите разобраться в облачных технологиях?
19 и 20 сентября присоединяйтесь к онлайн-курсу от Microsoft, посвящённому облачным решениям Azure (200+ решений на одной платформе).
Специалисты Microsoft расскажут, как облачные сервисы решают проблему безопасности и конфиденциальности данных пользователей. Покажут, как быстро, безопасно и эффективно интегрировать Azure с существующими сетями.
На курсе вы сможете подготовиться к сертификационному экзамену по Azure и попробовать его сдать бесплатно.
Регистрируйтесь, чтобы не пропустить: https://bit.ly/3C1KEBD
PS Microsoft поддержал фонд.
19 и 20 сентября присоединяйтесь к онлайн-курсу от Microsoft, посвящённому облачным решениям Azure (200+ решений на одной платформе).
Специалисты Microsoft расскажут, как облачные сервисы решают проблему безопасности и конфиденциальности данных пользователей. Покажут, как быстро, безопасно и эффективно интегрировать Azure с существующими сетями.
На курсе вы сможете подготовиться к сертификационному экзамену по Azure и попробовать его сдать бесплатно.
Регистрируйтесь, чтобы не пропустить: https://bit.ly/3C1KEBD
PS Microsoft поддержал фонд.
Arguments made with data are celebrated as unimpeachable level-minded science; arguments without it are the shrill opinions of a hysteric. Walk into a conversation without a supporting graph, and you’re hit with a Goodread link to W. Edwards Deming quotes: “Without data, you’re just another person with an opinion.” “In God we trust; all others must bring data.”
Power BI Guide.pdf
8 MB
Power BI
for Intermediates
A step-by-step training guide - 80 страниц
for Intermediates
A step-by-step training guide - 80 страниц