Популярная тема - “metrics standardization”:
1. Achieving metric consistency & standardization — Uber Data
2. Achieving metric consistency at Scale — Airbnb Data
Мой самый любимый пример в этом вопросе, когда несколько департаментов используют единое хранилище данных и считают Revenue (прибыль) и у всех оно разное. В Амазоне я такую картину наблюдал, как отдел маркетинга, финасов и продажников считали доход в разрезе регионов, использую разную логику и получали разные ответы на 5-10% и из года в год, всплывали вопросы почему цифры разные в Weekly Business Review (WBR). (Если вы не знаете, что такое WBR, то я рассказывал в одном из уроков datalearn и писал в канале)
1. Achieving metric consistency & standardization — Uber Data
2. Achieving metric consistency at Scale — Airbnb Data
Мой самый любимый пример в этом вопросе, когда несколько департаментов используют единое хранилище данных и считают Revenue (прибыль) и у всех оно разное. В Амазоне я такую картину наблюдал, как отдел маркетинга, финасов и продажников считали доход в разрезе регионов, использую разную логику и получали разные ответы на 5-10% и из года в год, всплывали вопросы почему цифры разные в Weekly Business Review (WBR). (Если вы не знаете, что такое WBR, то я рассказывал в одном из уроков datalearn и писал в канале)
Forwarded from DE or DIE
Чат, а вы знаете что всю смартдату уже выложили и можно смотреть? https://www.youtube.com/playlist?list=PLeN_80lmoMY1ugdDLg2mWht5eQDq6CoNQ
Кстати, пишите какие у вас любимые доклады оттуда!
Кстати, пишите какие у вас любимые доклады оттуда!
YouTube
SmartData 2020 - YouTube
Модуль 5 сейчас пока остановился на уроке 5.6 про Архитектуру облачных решений, да и вообще про архитектуру - все, что знал, рассказал и показал. Я решил добавить модуль 5.10 - Python в AWS. Так как нам всеравно понадобится питон в модуле 7, то будет самое то получить азы.
У AWS есть замечальный ресурс (free) - LEARN PYTHON ON AWS WORKSHOP. Там подробная инструкция на английском и упражнения. Большое спасибо Сергею (@erfolg5862), который уже оформлял лабы для модуля 5, за то, что он перевел этот workshop на русский, все очень подробно и со скринами. Если есть необходимость и время, можно пройти. И это отличная строчка в резюме для современного рынка.
У AWS есть замечальный ресурс (free) - LEARN PYTHON ON AWS WORKSHOP. Там подробная инструкция на английском и упражнения. Большое спасибо Сергею (@erfolg5862), который уже оформлял лабы для модуля 5, за то, что он перевел этот workshop на русский, все очень подробно и со скринами. Если есть необходимость и время, можно пройти. И это отличная строчка в резюме для современного рынка.
Продолжая серию постов про транспортные средства (я уже писал про электро велосипед и самокат), я хочу поделиться опытом про доску с веслом - paddle board. Их бывает много и разброс цен большой. Бывают твердые и надувные. Не буду вас грузить подробностями. Так как у нас океан под боком, я решил выбрать модель touring - это длинные доски 12"-14" на которых комфортно плавать при небольших волнах и встречном ветре и можно брать с собой много груза или детей)
В общем я выбрал себе Starboard Touring 14"x30. Доска идет без весла и к ней я выбрал карбоновое весло из 3х частей. Я ждал эту доску в наличие больше года. Другой хороший бренд - Red, у них есть доска Red Voyager. Вчера проплыл не ней 9км с дочкой, мы попали в встречный ветер и волны, но доплыли, макс скорость была 9км\ч и средняя 5 км\ч при встречном ветре и волнах это хорошо. Если вы в Strava то я там посщу тренировки.
И чтобы лучше трекать все, я купил часы Suunto 9 Baro - очень крутые!
В общем я выбрал себе Starboard Touring 14"x30. Доска идет без весла и к ней я выбрал карбоновое весло из 3х частей. Я ждал эту доску в наличие больше года. Другой хороший бренд - Red, у них есть доска Red Voyager. Вчера проплыл не ней 9км с дочкой, мы попали в встречный ветер и волны, но доплыли, макс скорость была 9км\ч и средняя 5 км\ч при встречном ветре и волнах это хорошо. Если вы в Strava то я там посщу тренировки.
И чтобы лучше трекать все, я купил часы Suunto 9 Baro - очень крутые!
Starboard SUP
2025 Touring Inflatable Paddle Board
21 книга по визуализации данных, со многими знаком https://builtin.com/data-science/data-visualization-books
Built In
21 Great Data Visualization Books, Chosen by Experts | Built In
From general interest to advanced texts, these data visualization books are bound to boost your skills and give you new insights into the data science industry.
Заметил интересный момент, вот этот товарищ возглавлял и развивал Azure Databricks и делал это очень успешно. Azure Databricks один из самый пользуемых продуктов в аналитике на Azure Cloud. Недавно я общался с VP Azure и еще рядом менеджером, где мы обсуждали можно ли нам не использовать Azure Synapse, а продолжать использовать Databricks. Azure Synapse это посути замена Databricks но уже от Microsoft. ПОка это не говорят в слух, но выглядит очевидно, что 2 продукта похожих в Azure не очень уживутся. И сейчас я заметил, что товарищ ушел из Microsoft и перешел в другою компанию, интересно как дальше сложится с Azure Databricks и Synapse Analytics.
Новый термин - синтетические данные (synthetic data) применимо к кейсам ML. - Synthetic data is annotated information that computer simulations or algorithms generate as an alternative to real-world data.
NVIDIA Blog
What Is Synthetic Data?
Synthetic data generated from computer simulations or algorithms provides an inexpensive alternative to real-world data that’s increasingly used to create accurate AI models.
Чувак заморочился и собрал все возможные решения для Data Discovery
Atlan on Notion
The Ultimate Repository of Data Discovery Solutions | Notion
Built with Notion, the all-in-one connected workspace with publishing capabilities.
Амазон добавил ещё 2 leadership принципа:
Strive to be Earth’s Best Employer
Leaders work every day to create a safer, more productive, higher performing, more diverse, and more just work environment. They lead with empathy, have fun at work, and make it easy for others to have fun. Leaders ask themselves: Are my fellow employees growing? Are they empowered? Are they ready for what’s next? Leaders have a vision for and commitment to their employees’ personal success, whether that be at Amazon or elsewhere.
Success and Scale Bring Broad Responsibility
We started in a garage, but we’re not there anymore. We are big, we impact the world, and we are far from perfect. We must be humble and thoughtful about even the secondary effects of our actions. Our local communities, planet, and future generations need us to be better every day. We must begin each day with a determination to make better, do better, and be better for our customers, our employees, our partners, and the world at large. And we must end every day knowing we can do even more tomorrow. Leaders create more than they consume and always leave things better than how they found them.
Список всех https://www.aboutamazon.com/about-us/leadership-principles
Strive to be Earth’s Best Employer
Leaders work every day to create a safer, more productive, higher performing, more diverse, and more just work environment. They lead with empathy, have fun at work, and make it easy for others to have fun. Leaders ask themselves: Are my fellow employees growing? Are they empowered? Are they ready for what’s next? Leaders have a vision for and commitment to their employees’ personal success, whether that be at Amazon or elsewhere.
Success and Scale Bring Broad Responsibility
We started in a garage, but we’re not there anymore. We are big, we impact the world, and we are far from perfect. We must be humble and thoughtful about even the secondary effects of our actions. Our local communities, planet, and future generations need us to be better every day. We must begin each day with a determination to make better, do better, and be better for our customers, our employees, our partners, and the world at large. And we must end every day knowing we can do even more tomorrow. Leaders create more than they consume and always leave things better than how they found them.
Список всех https://www.aboutamazon.com/about-us/leadership-principles
About Amazon
Amazon Leadership Principles
Our Leadership Principles are more than inspirational wall hangings
Окей, облако это хорошо, но что делать, если существующее решение существует on-premise? Ответ прост - мигрировать. Но как? Облачные вендоры максимально решили нам помочь и предоствили огромное колличество сервисов, которые упростят нашу жизнь.
Из модуля вы узнаете:
📌 Стратегии миграции в облако
📌 Примеры миграции базы данных и аналитического решения
📌 AWS Schema Conversion Tool
📌 AWS Database Migration Service
📌 Azure Migration Services
https://youtu.be/QGgQj34JG1Q
Из модуля вы узнаете:
📌 Стратегии миграции в облако
📌 Примеры миграции базы данных и аналитического решения
📌 AWS Schema Conversion Tool
📌 AWS Database Migration Service
📌 Azure Migration Services
https://youtu.be/QGgQj34JG1Q
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 5-7 МИГРАЦИЯ В ОБЛАКО
Окей, облако это хорошо, но что делать, если существующее решение существует on-premise? Ответ прост - мигрировать. Но как? Облачные вендоры максимально решили нам помочь и предоствили огромное колличество сервисов, которые упростят нашу жизнь.
Из модуля…
Из модуля…
Статья по этой теме, которую я написал 2 года назад https://medium.com/rock-your-data/cloud-analytics-migration-strategies-74af248de066
Medium
Cloud Analytics Migration Strategies
Nowadays, speed and timing matter. This agility combined with innovation has proven to be a game-changer for several organizations across…
Forwarded from Anscombe's Quartet
Немного поработал с фреймворком для написания веб-приложений на Python под названием Streamlit - и описал пример такого приложения в отдельной статейке:
https://polarpersonal.medium.com/building-data-visualization-apps-with-streamlit-and-databricks-sql-54e51bb6b0a8
https://polarpersonal.medium.com/building-data-visualization-apps-with-streamlit-and-databricks-sql-54e51bb6b0a8
Medium
Building data visualization apps with Streamlit and Databricks SQL
A quick example of building a data visualization app in almost pure Python
👍2
У AWS Glue (ETL от AWS на базе Spark) появился продукт Data Brew, с помощью которого можно чистить данные и изучать их природу. Для Data scientist должно быть очень удобно при работе с большим объемом.
Тут назрел вопрос, с удаленной работой, можно теперь “теоретически” работать full time на несколько работах. Мой хороший товарищ в Канаде😜, успешно это делает, причем у него не начальные позиции, а senior с зарплатой выше среднего. Я, например, мог бы не увольняться из Amazon и работь на Microsoft. Информация о моих общих доходах и о том, что я делаю конфиденциальна для моего работодателя. Но я перегорел и хотел просто больше времени отдыхать. Возможно в будущем я вернусь к этой затеи. Мне интересно про рынок в РФ, реально ли там удаленно работать на 2 фулл тайм работе? (конечно, если вы опытный специалист). Вариант про фул тайм + подработка я не рассматриваю, это всегда было норм.
На канале мы обсуждали про инструмент для ETL, которые делает T с помощью кода - DBT tool. Да ещё и опен сорс. 2 свежие статьи:
Julien Kervizic: Leveraging DBT as a Data Modeling tool
DBT: dbt + Materialize: Streaming to a dbt project near you
Julien Kervizic: Leveraging DBT as a Data Modeling tool
DBT: dbt + Materialize: Streaming to a dbt project near you
Medium
Leveraging DBT as a Data Modeling tool
Reflections on one year of using DBT for modeling a data warehouse
"Management is the opportunity to help people become better people. Practiced that way, it’s a magnificent profession." Clayton Christensen
Облачные вычисления дают нам много преимущест, и аналитика не исключение. Мы можем сфокусироваться на решение бизнес задач и не тратить время на создание инфраструктуры. В зависимости от задачи и доступных ресурсов мы можем использвать IaaS, PaaS или SaaS. Пару кликов и у вас есть хранилище данных, куда вы можете загружать данные и сразу их визуализировать практически в реальном времени. Если кратко, то возможности безграничны и зависят лишь от вашей фантазии и кошелька.
В этом видео вы узнаете про:
📌 Основные компоненты аналитики
📌 Роли и специалисты
📌 AWS решения для аналитики
📌 Azure решения для аналитики
📌 GCP решения для аналитики
https://youtu.be/E4kZI4-S2SY
В этом видео вы узнаете про:
📌 Основные компоненты аналитики
📌 Роли и специалисты
📌 AWS решения для аналитики
📌 Azure решения для аналитики
📌 GCP решения для аналитики
https://youtu.be/E4kZI4-S2SY
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 5-8 АНАЛИТИКА В ОБЛАКЕ
Облачные вычисления дают нам много преимущест, и аналитика не исключение. Мы можем сфокусироваться на решение бизнес задач и не тратить время на создание инфраструктуры. В зависимости от задачи и доступных ресурсов мы можем использвать IaaS, PaaS или SaaS.…