Инжиниринг Данных
23.5K subscribers
1.98K photos
55 videos
192 files
3.2K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Новый термин - синтетические данные (synthetic data) применимо к кейсам ML. - Synthetic data is annotated information that computer simulations or algorithms generate as an alternative to real-world data.
Амазон добавил ещё 2 leadership принципа:
Strive to be Earth’s Best Employer
Leaders work every day to create a safer, more productive, higher performing, more diverse, and more just work environment. They lead with empathy, have fun at work, and make it easy for others to have fun. Leaders ask themselves: Are my fellow employees growing? Are they empowered? Are they ready for what’s next? Leaders have a vision for and commitment to their employees’ personal success, whether that be at Amazon or elsewhere.

Success and Scale Bring Broad Responsibility
We started in a garage, but we’re not there anymore. We are big, we impact the world, and we are far from perfect. We must be humble and thoughtful about even the secondary effects of our actions. Our local communities, planet, and future generations need us to be better every day. We must begin each day with a determination to make better, do better, and be better for our customers, our employees, our partners, and the world at large. And we must end every day knowing we can do even more tomorrow. Leaders create more than they consume and always leave things better than how they found them.

Список всех https://www.aboutamazon.com/about-us/leadership-principles
Окей, облако это хорошо, но что делать, если существующее решение существует on-premise? Ответ прост - мигрировать. Но как? Облачные вендоры максимально решили нам помочь и предоствили огромное колличество сервисов, которые упростят нашу жизнь.

Из модуля вы узнаете:
📌 Стратегии миграции в облако
📌 Примеры миграции базы данных и аналитического решения
📌 AWS Schema Conversion Tool
📌 AWS Database Migration Service
📌 Azure Migration Services

https://youtu.be/QGgQj34JG1Q
Forwarded from Anscombe's Quartet
Немного поработал с фреймворком для написания веб-приложений на Python под названием Streamlit - и описал пример такого приложения в отдельной статейке:

https://polarpersonal.medium.com/building-data-visualization-apps-with-streamlit-and-databricks-sql-54e51bb6b0a8
👍2
У AWS Glue (ETL от AWS на базе Spark) появился продукт Data Brew, с помощью которого можно чистить данные и изучать их природу. Для Data scientist должно быть очень удобно при работе с большим объемом.
Тут назрел вопрос, с удаленной работой, можно теперь “теоретически” работать full time на несколько работах. Мой хороший товарищ в Канаде😜, успешно это делает, причем у него не начальные позиции, а senior с зарплатой выше среднего. Я, например, мог бы не увольняться из Amazon и работь на Microsoft. Информация о моих общих доходах и о том, что я делаю конфиденциальна для моего работодателя. Но я перегорел и хотел просто больше времени отдыхать. Возможно в будущем я вернусь к этой затеи. Мне интересно про рынок в РФ, реально ли там удаленно работать на 2 фулл тайм работе? (конечно, если вы опытный специалист). Вариант про фул тайм + подработка я не рассматриваю, это всегда было норм.
На канале мы обсуждали про инструмент для ETL, которые делает T с помощью кода - DBT tool. Да ещё и опен сорс. 2 свежие статьи:
Julien Kervizic: Leveraging DBT as a Data Modeling tool
DBT: dbt + Materialize: Streaming to a dbt project near you
"Management is the opportunity to help people become better people. Practiced that way, it’s a magnificent profession." Clayton Christensen
Облачные вычисления дают нам много преимущест, и аналитика не исключение. Мы можем сфокусироваться на решение бизнес задач и не тратить время на создание инфраструктуры. В зависимости от задачи и доступных ресурсов мы можем использвать IaaS, PaaS или SaaS. Пару кликов и у вас есть хранилище данных, куда вы можете загружать данные и сразу их визуализировать практически в реальном времени. Если кратко, то возможности безграничны и зависят лишь от вашей фантазии и кошелька.

В этом видео вы узнаете про:
📌 Основные компоненты аналитики
📌 Роли и специалисты
📌 AWS решения для аналитики
📌 Azure решения для аналитики
📌 GCP решения для аналитики

https://youtu.be/E4kZI4-S2SY
Как-то давно, после внедрения Matillion ETL, мне предложили написать use case про наше решение в Amazon Subsidiary - Migrates to the cloud and increases ETL literacy within the company by 150%. Ну написал и забыл.

Оказывается, есть много венчурных компаний, которые исследуюь рынок дата и опрашивают пользователей инструментов, чтобы лучше понять инвестировать или нет. Рынок ETL не исключение, я уже много раз рассказывал про разные инструменты, их +\- и тд, даже если не работал с инструментов особо (пример это Fivetran). Одна консультация стоит 350US$ в час. И находят они меня через этот use case. И они где-то 1-2 раза в месяц. Можно их считать спонсором телеграмм канала, на котором нет рекламы за 2000 рублей😝

Теперь про фирмы, которые вы можете посмотреть и попробовать вписаться:
https://thirdbridge.com/
https://www.alphasights.com/
Есть и много других.
(Перезалил видео)

AWS, Azure и GCP предлагают нам сертификацию на любой вкус и цвет. Есть для начинающих и продвинутых. Помимо основной сертификации есть еще специализация в Аналитике, сетях, безопасности и тд.

В этом видео вы узнаете про:
📌 Сертификации и специализации в AWS, Azure, GCP
📌 Материалы подготовки
📌 Нужна ли сертификация или нет?
📌 Обзор облачных профессий на HeadHunter и Indeed

https://youtu.be/0-sbxggc9KQ
Все хотят строить модели, но не все хотят ковыряться в данных, чистить их, интегрировать и консолидировать. https://research.google/pubs/pub49953/
Крупнейшие облачные проекты в штатах:
1) Amazon, Microsoft and Google Pursue $1 Billion Cloud Deal With Boeing (пока не понятно, кто возьмет, возможно будет multicloud)
2) Pentagon Cancels Multibillion-Dollar Cloud Contract With Microsoft - изначально Microsoft выиграл контракт на Joint Enterprise Defense Infrastructure (JEDI), но Amazon подал в суд, что сделка была непрозрачная, и теперь пентагон решил тоже разделить контракт на Microsoft и Amazon. (А google совсем мимо). Акции Амазон выросли на этой волне. Теперь ждем когда Безос полетит в космос на своей ракете в конце июля

Источник The Information
В продолжение крупных сделок - оказывается у главного конкурента Boeing - Airbus, инфраструктура на Google Cloud.
Узнал новое выражение - "no over the fence".
Today’s comic is about that age old problem in games dev when we build fences instead of bridges and silos instead of pastures. Throwing things over that fence is something we want to work hard to move away from as a way of working. We want to foster collaboration at every stage of the game, and enable everyone to do their best creative work, as a team.

PS мне кажется я так делаю разработчикам Power BI, типа, вот вам connection string, enjoy
А это про data literacy в картинках