Инжиниринг Данных
23.4K subscribers
1.98K photos
56 videos
192 files
3.2K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Management Seat Time — Erika Pullum (Swartz) has a great piece about being a manager, and the concept of 'management seat time'. This isn't about data, per se — though Erika's Substack is filled with great data-related articles, and she cut her teeth managing a fairly large data team. This piece, though, is about the more general experiences of being a manager.

The thing is, reading about how to fire someone is different from doing it. It’s easy to read about the need for clear feedback and nod along, but hard not to soften feedback to someone you like at the moment you’re giving it. The impact of your decisions plays out over a longer timescale and it’s not always easy to see your own mistakes.
Одной вакансии уже недостаточно, минимум надо 2. Я например могу быть:
- Data Engineer или BI engineer (основной опыт)
- Преподаватель и ментор (опыт в datalearn и университете)
- Pre Sales Engineer (это что-то вроде демонстрации продукта и решения при продажах)
Но все эти вакансии практически об одном и том же - дата, а нужно наверно иметь совсем разные вещи - Аналитики и Плотник, Дата Инженер и инструктор по горным лыжам и тд.
Наш любимый slack был куплен SalesForce, надеюсь будет еще бесплатная версия работать. - Salesforce Closes $27.7 Billion Acquisition of Slack
Отличная статья про сравнение менеджерского и инженерного пути. Мы часто думаем, что после старшего инженера/архитектора мы станем менеджером. Но это не так, это совершенная другой путь и требует других навыков. https://charity.wtf/2017/05/11/the-engineer-manager-pendulum/
Forwarded from Reveal the Data
💼 Ищем BI-аналитиков в Яндекс =)

🚕 BI-аналитик в Go целых 3 позиции
Ищем коллег, которые хотят работать на стыке аналитики и визуализации. Вашей задачей будет развивать отчётность одного из направлений: международного бизнеса, финансов или аналитики привлечения пользователей. Предстоит формировать стратегию развития отчётности для подразделения, собирать данные и делать классные отчёты. Больше всего задач именно про дашборды, но придется готовить и данные. Необходимо стать внутренним центром экспертизы по визуализации и Табло внутри команды аналитиков, а мы будем помогать вам советами и менторством.

Нужны классные навыки создания отчётов, сильный SQL и, как преимущество, Питон. Позиция уровня мидл. Описание на сайте.

Присылайте мне в личку CV и небольшой рассказ про себя.

📦 BI-аналитик в Маркет
Задач много, бизнес растет вширь и ввысь. Если не пугают слова e-com, dead stock, SQL optimization, логистическое плечо, UE и другие — СУПЕР!

У нас Tableau, но вы можете знать и другой инструмент, главное — активное понимание принципов и подходов визуальной аналитики и желание переучиться =) Надо будет делиться экспертизой и работать руками, думать продуктово и не бояться выражать свое мнение.

CV и вопросы по позиции присылайте Юре, тим-лиду BI в Маркете.

Условия
Все вакансии новые, мы расширяем наш BI-контур. Основная локация в Москве, но готовы обсудить и другие города. Зарплата обсуждается после интервью. В Яндексе классный соц. пакет, приятные коллеги, премии, опционы и просто интересно.

ТГ — @rbunin
Почта — rbunin@yandex-team.ru
#вакансия
Архитектура и описание решения для создания управленческой отчётности в linkedin. Описание https://engineering.linkedin.com/blog/2021/from-daily-dashboards-to-enterprise-grade-data-pipelines
Аналитик в 1988 году
Модели или не модели в хранилище данных?

Inmon vs Kimball vs Data Vault? Personally I prefer wide, nested and denormalized tables as data warehouse architecture. Why?

Cloud Data warehouses are designed as distributed systems with columnar storage that is separated from compute. Hence, you can efficiently query specific fields over a huge amount of records but you want to avoid joins as it introduces overhead when shuffling data between compute instances. Also, I prefer to keep my data immutable and if something is wrong I rather replay the data with the new logic than performing mutations on existing data.

Another aspect that rarely is mentioned is that wide, nested and denormalized tables better reflect the operational data structures produced by micro-services that are exchanged over API:s (think JSON but with a schema) but more frequently stored in key/value-stores or document DB:s. That is different from the relational tables that have been the default choice of monoliths and perhaps reflected by traditional data warehouse architectures.

It is often claimed that the star schema is easier for end-users to navigate, but my experience is actually the opposite once end-users understand UNNEST() and the fields contain proper descriptions.

Also, wide & nested models makes it easier to use the same structure and logic for batch SQL as streaming SQL (you really want to avoid joins in streaming mode if possible).

I must say that BigQuery really shines when applying this architecture and I'm puzzled that this data warehouse architecture isn't more popular. But I guess the analytical layer will often reflect the operational layer used (similar to Conways law).
This media is not supported in your browser
VIEW IN TELEGRAM
Весь LinkedIn сегодня сходит с ума по этой гифке🤗💯🔥🥂👑🙈 какая то ёлка новогодняя
Rock Your Data номинировали в списке Top Information Services Company in Vancouver . А тут история про саму компанию. В целом компания как бы есть, но ее как бы и нет) Наверно еще не пришло время))
CEO Microsoft твитнул, что на новом Xbox вышла - For nearly 40 years, Microsoft Flight Simulator has been one of our most beloved franchises, and it’s now available for the first time on Xbox Series X and S using the power of Azure, Bing Maps, and Xbox Game Pass.

По мне это самая крутая игра с технологической точки зрения, там задействованно куча ML, данных и других инновационных вещей. Да и на джойстике удобно играть (у меня Xbox Series S), дети могут изучать мир с высоты птичьего полета.
North Star любого аналитического подразделения - это Self Service. У нас ни одна встреча с BI не обходится без слов - нам нужно сделать self-service. За 10 лет работы в разных компаниях, так и не удалось реально сделать self-service BI, есть ощущения, но нет конкретики. Обычно self-service ограничивается несколько крутыми аналитиками из бизнес подразделений, которых мы показываем как success stories в качестве примера другим 95% процентам пользователям - будьте как они и будет вам дата счастья.

Такие мысли навеяла очередная встреча с нашим BI и вот это статья - Self-serve is a feeling

Most definitions of self-serve analytics are both vague and vaguely tautological. TDWI offers a definition without a subject, describing it as “typically involving users throughout an organization to directly access data for self-directed discovery and analysis;” Tableau says it “empowers teams” to “to be more involved in their own data analysis;” and on a page titled “What is self serve analytics?,” Snowflake doesn’t even attempt to define it, gestures at some idea about “finessing data,” and describes its pros and cons.
Быть Principal Software Engineer в Amazon - это очень круто! А если при этом еще при этом создавать флагманский BI продукт в AWS - Amazon Quicksight, поработать в Microsoft с Power BI и в Tableau, создавая лучшие BI решения, то это вообще фантастика. Но это все реально, хотите узнать как это? Послушайте новое интервью от Яны Одинцов и Яны Конн:

Интервью c Principal Engineer Amazon QuickSight Татьяной Якушевой каналу DataLearn. Беседа об аналитике, жизненном пути, необходимых компетенциях и многом другом.

Интервью провела куратор сообщества “Women In Data Analytics” Яна Одинцова. Если у вас остались вопросы, есть идеи или вы хотели бы узнать больше о сообществе, обращайтесь к Яне.
yana.odintsov@gmail.com
Недавно, все компании опубликовали свои результаты доходов за прошлый квартал. Давайте посмотрим на тех, кто действительно вырос:
ALPHABET
• Revenue +62% to $61.9 billion
• Net income + 166% to $18.5 billion
• Google Cloud revenue +53% and losses shrank 58% to $591 million

MICROSOFT
• Revenue + 21% to $46.2 billion
• Net income +47% to $16.5 billion
• Azure +51%, without adjusting for forex shifts


Вот про AWS нашел так пока:
For Q2 analysts estimate AWS revenue growth of 30%, reaching $14.7 billion. In the first quarter, AWS revenue reached $13.5 billion, rising 32% year over year, besting the 22.5% growth rate expected.

Все это показывает насколько облачные вычисления популярны и теперь можно сказать что в западных странах компании реально оценили преимущества облаков и максимально хотят ими пользоваться. Конечно не без проблем и косяков (outages часто бывает). Если вы еще не в теме - может быстро ознакомиться на 5м модуле курса DE-101.

Еще из интересного - давненько аналитические компании не получали больших инвестиций - Artificial intelligence startup DataRobot has raised $300 million in Series G funding at a valuation of $6.3 billion, led by existing investors Altimeter Capital and Tiger Global.

Я кстати к ним окликался когда работал в Бостоне, думал быть на пике AI кейсов - AI solution architect, но потом они уволили много людей и закрыли набор.
В продолжение облаков. Мы видим космические прибыли облачных провайдеров. Инновации и масштаб делают дешевле стоимость железа, а вот цены на облака не меняются.

Что еще прикольного, в блоге CEO Cloudflare (компания по безопасности интеренет решений - provides content delivery network and DDoS mitigation services) написал, что клиенты плататя на 80% больше за передачу данных:

"Amazon Web Services is dramatically marking up the price of networking bandwidth for moving data out of its cloud, with customers in the U.S., Canada and Europe paying 80 times more than what AWS pays" https://blog.cloudflare.com/aws-egregious-egress/

Отличная работа Product Managers и хорошая стратегия по удержанию клиентов - "several top AWS customers, including Apple, Pinterest and Netflix, were seeing hefty bills for moving data out of AWS." https://www.theinformation.com/articles/aws-customers-rack-up-hefty-bills-for-moving-data

Ну а что? Безос честно сказал - ребята спасибо, вы за все это заплатили!
Очень хороший пример про 2 типа метрик - хорошие и плохие, хотя могу измерять одну и туже цель
#вакансия от Банк «Открытие».

Они ищут ведущего аналитика с опытом работы в Power BI, MS SQL/MySQL/Oracle, Excel

Мы ждём человека, который умеет анализировать маркетинговые данные, данные о продажах и результаты опросов, строить дашборды, выявлять зависимости и корреляции, сверять данные с макропрогнозами и визуализировать результаты в Power BI.

Требования:
- умение строить дашборды
- готовность интенсивно обучаться
- желание разбираться в банковском бизнесе (опыт работы в банковской/финансовой отрасли приветствуется)
- ориентация на создание ценности для конечного получателя
- навыки операционной аналитики или навыки парсинга данных (как существенное преимущество)

Условия работы:
- Оклад 150-180 тыс руб + квартальные и годовые премии
- График 5/2, офис м.Павелецкая (5 мин от метро)
- ДМС после испытательного срока (3 мес)

Резюме и сопроводительное письмо отправлять на mariya.zlenko@open.ru

Вам спасибо!