Инжиниринг Данных
23.5K subscribers
1.98K photos
56 videos
192 files
3.2K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
Understanding the Experience of Code Review.pdf
603.4 KB
Небольшое чтиво про code review - Understanding the Experience of Code Review:
Misalignments, Attention, and Units of Analysis

Code review is a common practice in software development and
numerous studies have described different aspects of the process;
its characteristics, the expectations on that process, issues around
reviewer allocation, and more. However, one aspect that has not
been studied to a large extent is the experience of the developers
in the code review process. This is unfortunate given the signifi cant amount of time that developers spend on this activity, where
problems that degrade developers’ experience on a daily basis can
create work environment issues.
In this paper, we present an extended analysis of an exploratory
mixed-method study where we focus on developers’ experience of
code review. We use semi-structured interviews to gather data from
two multi-national companies and conduct a follow-up survey. Our
results suggest that developers are frequently bothered by misalign ments in the code review tooling and process which is hindering
them in carrying out their code review tasks effectively. We present
an initial characterization of misalignments that may hamper the
developer experience. Based on our findings, we propose directions
for further exploration to improve the developer experience.
7🌚1👨‍💻1👾1
Недавно я подписался на рассылку от Олега про dbt tips. Все четко и по делу, если вы используете dbt, то вам пригодятся его советы.
❤‍🔥26🙈1
На edX появилось 2 новых курса от Databricks:

Databricks: Large Language Models: Application through Production
Databricks: Large Language Models: Foundation Models from the Ground Up

Теперь вы сможете удивлять своими познаниями на собеседованиях про LLM из 🧱

PS Databricks готов к новому раунду инвестиций и они планируют выйти в положительный кэш фло в 2025. Думаю многие сотрудники databricks неплохо обкешатся рано и поздно.

Вот у snowflake тоже акции были дорогие на IPO но потом упали (явно были переоценены), посмотрим как у databricks.
❤‍🔥17🐳2😭2
На работе я часто видел ссылки про data contracts и посты на эту тему от Chad Sanderson. С одной стороны темы data consumers/data producers не нова, а с другой стороны раз есть бизнес проблема, то почему бы не предложить решение. Товарищ запустил компанию и полчил 7лям для старта.

Уверен тема и проблема уже мусолилась в стартапах. Поэтому аудитория то очень важная составляющая для успешного запуска компании.
🍌6❤‍🔥4🤷3🤷‍♂1🌚1
Сегодня был замечательный день, сразу отражает всю индустрию.

Утром слушал о миграции с Azure Databricks на Snowflake. 👏

В обед слушал о миграции с AWS Snowflake на Databricks, тут я бы даже сказал это не миграция, а больше как добавление еще одного продукта, который делает тоже самое.😔

А под вечер я ковырял Redshift, где делаю прототип миграции AWS Athena на Redshift. 👨‍💻

При этом абсолютно везде одинаковые проблемы - дорого/медленно/качество данных/legacy&tech debt. Вообще такие решения принимаются сверху. Меня вообще нигде не спросили, хотят я книгу написал про Snowflake, и 3 года внедрял Databricks, и с Redshift мы вообще знакомы с 2014 года.
Please open Telegram to view this post
VIEW IN TELEGRAM
🦄29🤷19🗿32🎄2🍌1
Шо за биг дата?

Алексаднр Сайков — мой коллега по дата инженерному цеху, выступил с презентацией про биг дату — что это вообще такое, чем там занимаются, на кой нужон дата инженер и вот это вот всё.

Если тема интересует, а маркетинговые видосы с баззвордами надоели — смотрите запись его годного выступления на ютубе!
❤‍🔥356🍾3🌭1
Forwarded from Книжный куб (Alexander Polomodov)
Крутое интервью Андрея Стыскина, директор в Amazon, ex-CEO Яндекс.Поиск

В этом видео Дмитрий Грац взял интервью у Андрея Стыскина, в котором они поговорили про подход к менеджменту в Amazon и чем он отличался от Яндекса. Андрей поделился своими впечатлениями от процессов найма, онбординга, принятия решений на основе письменной культуры (ревью документов). Напоследок была тема про жизнь в Лос-Анджелесе, куда переехал Андрей в феврале 2023 года. И чем жизнь там отличается от Москвы. В общем, это интересное интервью, после которого я решил в скором времени прочитать книгу "Working backwards", в которой можно подробнее узнать про культуру Amazon (пока я читал токльо Invent and Wander, про которую рассказывал раньше)

#Interview #Management
❤‍🔥275🐳5🍌1🦄1
Привет!

Подскажите мне по технике для записывания видео, если есть опыт? Мне бы хотелось немного проапгрейдить вариант, когда я записываю на телефон. По идее нужно:

- камера и объектив
- микрофон без проводной
- свет
- может есть еще чего из необходимого?

Какие-то громоздкие штуки не хочу рассматривать, в идеале, чтобы было все мобильно.
🙈2🍾1
Давненько деньги никуда не инвестировались, и вот снова видим, как одни компании готовятся выйти на биржу (IPO), в другие компании в data инвестируются млны. А на картинке пост, на котором мы видим как две data компании получили денег почти одновременно.
6🍾2
В потоке информации про generative AI и LLM затерялась информация про Amazon Alexa. После выхода ChatGPT все колонки превратились в тыкву, даже Алиса была намного умней и веселей с самого начала. Мне как бывшему инженеру Alexa было обидно и я все ждал ну когда же. Вроде наконец они решили добавить LLM и сделать более правильное решение. Прошло уже много времени и видать это не так просто добавить свой LLM, вот и статья вышла https://www.amazon.science/blog/alexa-unveils-new-speech-recognition-text-to-speech-technologies
6
А это мощно - Cisco купил Splunk. Скорей всего будет как с Табло, когда душа продукта погибнет.

Splunk был такой же уникальный продукт с большим сообществом, крутыми конференциями, идеями. Да и сам продукт топ. Я даже в 2014 году прошел множество тренингов по нему и сдал экзамены, а потом, когда решил уволиться руководство компании cleverdata стало орать на меня и трясти с меня деньги за обучение обратно😅, хорошо, что обошлось без рукоприкладства😳

А в 2015 я даже хотел в Splunk пойти на работу в Торонто, но не прошёл собеседование👩‍💻

Наверно такая судьба ждет все крутые продукты😞
Please open Telegram to view this post
VIEW IN TELEGRAM
😭7🙈6🌚1
Последнее время все чащи возникают дискуссии у меня про жизнь в Канаде и США, всегда же интересно все сравнивать. Вот например статистика по Канаде из официального источника.

Медиана зп (кстати очень близко к среднему) 40к, то есть на семью из 2х человек это 80к. А 80к в год после налогов, это 4к-4.5к в месяц.

Если взять средний рент в большом городе, это будет 2.5к. Если взять тоже самое в ипотеку то это будет 4к. То есть ипотека уже не доступна. Но еще надо первоначальный взнос тысяч 100, а как накопить, если жить от ЗП до ЗП. А ведь есть еще расходы на еду, одежду, связь и развлечения. А если работает только один человек?

И самое интересно, компании, которые нанимают в Канаде абсолютно все будут low ball на ваш оффер. Однозначно, кто недавно приехал будет не просто и все в один голос говорят, что попали как будто в прошлое после удобных сервисов. Я сам лично недавно получил справку из полиции онлайн в Госуслугах за 3 дня, мне нужно было для Security Clearance на проект. Тут такое даже и не слилось, и так везде.

И для многих кажется, что можно немного потерпеть и все наладится в плане дохода, но потом оказывается, что потолок-то по зарплате очень реальный и это сильно демотивирует. Но как говорится, кто ищет, то найдет пути к преодолению всех препятствий и будет зарабатывать столько, сколько хочет😎 Очень сильно зависит от целей, мотивации и дисциплины.

Недавно я обнаружил, что я сместил фокус на мотивирующие видео, подписался на различных успешных людей и заряжаюсь у них! Думаю пришло время все записывать в блокнот и благодарить вселенную👨‍💻

А кто вас мотивирует? Как вы себя дисциплинируете?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥49👾6🐳4💯3🍌1🫡1
Кстати, у меня есть слайд из моей недавней презентации про рынок Северной Америке. На протяжении последних 8 лет я только и делал, что вечно искал работу, собеседовался и пытался нащупать, где и сколько платят. Все кто мне знает лично, знают, что мой любимый вопрос, а сколько ты получаешь. Именно, чтобы понять как вообще все работает и какие перспективы есть, а может быть их и нет, как на примере Канадского рынка.

Самое интересное, что ЗП в 200-300 в Канаде это реально, если например у вас удаленная работа + фриланс. Но конкуренция дикая, куча народа со всего мира приезжает в Канаду и готовы работать еду за 50т в год в нашей индустрии.

Поэтому у меня уже есть свой железобетонный рецепт для иммигрантов как быть, что делать и тп, вот его и хочу реализовать в Surfalytics. Так же планирую писать еженедельные отчеты про прогрессу.

🔠🔠🔠🔠🅰️🔠🔠🔠🔠🔠🔠

Пока больше все на стадии идей. Но совсем недавно вышел на сообщество аналитиков из LATAM и уже пропиарил им идею, в целом зашло хорошо, но у меня пока нет контента. Так же стал искать на Dribbble крутых content makers, чтобы сделать анимацию, телеграм стикерпак. Заказал еще футболок брендовых. Изучаю про свет для видео или думаю просто нанять профессионального оператора и заснять весь модуль один. Пока я совершаю главную ошибку - много думаю, мало делаю! Вообще же все просто, все что мы захотим и попросим у вселенной - все будет! Надо просто напоминать об этом!😆
Please open Telegram to view this post
VIEW IN TELEGRAM
41🦄11🌚5💯5❤‍🔥2🍌2🙈2
#weeklydatanewsdump

Самое интересное за последнее время - это оживления рынка - больше вакансий, компании планируют свое IPO, или ожидают поглощения, меньше увольнений и самого страха увольнения, снова инвестиции в data компании.

Единственное, что я не заметил это рост зарплат, хотят должны быть 10% в год к base pay на рынке. Вот работаете год за X, в следующем году у вас будет X+2% (если повезет), а на рынке уже можно просить X+10%-15%, поэтому сидеть на одной работе это упущенная выгода, если вам конечно важна ваша компенсация, так как для многих от "скакунов" появляется презрительная ухмылка. Хотя "скакуны" это двигатель прогресса по части компенсации.

Другой момент - это стоимость рынка акций, в целом есть компании кто вырос сильно, как NVIDEO, но большинство tech и стоки инженеров в глубоком минусе. Придется дальше ждать😲

Кстати, недавно узнал сколько стоит сделать custom sticker park для телеграмма с анимацией - 3к USD 10 штук, 6к USD 20 штук, но это прям мега профессиональные, дорого конечно. Я бы купил и 20, если за меня еще и всю концепцию придумали, а то ведь надо еще и концепцию придумать. Зато можно себя увековечить, почти как памятник поставить, недорого))

💲Давайте еще раз посмотрим на интересные события:
Cisco купил Splunk
Secoda Raises $14M to Save Companies from Drowning in Data
Tabular Closes $26 Million in Funding - интересный продукт и есть Open Source, работает с Iceberg, но я сам еще не попробовал, стоящая штука чтобы изучить. У нас даже со Snowflake планируют использовать для landing zone.
DataBlend Raises Seed Funding Round
Databricks raises over $500 mln at $43 bln valuation - сегодня изучал компании, которые позволяют инвестировать в private компании, кто-нибудь знает хороший сервис?
ThoughtSpot acquires Mode Analytics, a BI platform, for $200M in cash and stock - не пробовал ни один, ни другой, но у Mode классный SQL симулятор.
MotherDuck secures investment from Andreessen Horowitz to commercialize DuckDB - кто-нибудь использует их?
А вот еще отличная бизнес ниша для kaggle чемпионов - As AI porn generators get better, the stakes get higher.

Ладно, давайте ближе к телу делу.
🐶Zach Wilson - является топ DE influencer. Его посты в linkedin набирают по 300 лайков. Он и курс запустил по DE, где за 1000+ вы можете пройти его самостоятельно, самое интересное, что он сделал сам платформу, где нужно лабу делать. Недавно он написал, что в месяц он получает 50к US, ну что могу сказать, красавчик!
Вот парочка его писем из недавних:
- How to pass data engineering SQL interviews in big tech - все по делу. Знали бы вы сколько раз я провалился на простых SQL вопросах на собесах, реально стыдно. Даже если вы его используете каждый день, некоторые вопросы вас застанут врасплох.
- How to pass the data modeling round in big tech data engineering interviews - на таких вопросах я тоже плыл. На самом деле данный пост не совсем однозначный, например про One Big table я не знаю, зато знаю про Data Vault.

🐼Другой influencer - Seattle Data Guy тоже не молчит, и спамит мой почтовый ящик:
- The Challenges You Will Face When Data Modeling - тоже про моделирование данных. Но все это похоже на плохой пересказ Кимбала. Сколько чувак зарабатывает я не знаю.

Для меня всегда вопрос, что народ делает с баблом. Вот музыкальные блогеры понятно, все на показ, и tech блогеры выглядят, как будто за еду работают😮

- Mistakes I Have Seen When Data Teams Deploy Airflow - мне кажется, что Airflow это инструмент, который все используют, и все ненавидят, потому что ни в одной серьезной организации он не может работать стабильно, по крайней мере я не видел. Лучше cron ничего не придумали еще.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥16🐳7🌚1👨‍💻1
🔬Еще есть интересный paper - What Predicts Software Developers’ Productivity?
Organizations have a variety of options to help their software developers become their most productive selves, from modifying office layouts, to investing in better tools, to cleaning up the source code. But which options will have the biggest impact? Drawing from the literature in software engineering and industrial/organizational psychology to identify factors that correlate with productivity, we designed a survey that asked 622 developers across 3 companies about these productivity factors and about self-rated productivity. Our results suggest that the factors that most strongly correlate with self-rated productivity were non-technical factors, such as job enthusiasm, peer support for new ideas, and receiving useful feedback about job performance. Compared to other knowledge workers, our results also suggest that software developers' self-rated productivity is more strongly related to task variety and ability to work remotely.

😯Последнее время много попадается клиентов у кого есть Databricks. Я всегда думал, что главная проблема в Spark это производительность и всем нужно будет помогать тюнить spark. Оказывается в 70% случаев это проблемы с networking. У Databricks есть опция - Secure Cluster Connectivity (No Public IP), это когда ваш кластер не подключен к интернету. И вам нужно настраивать виртуальную сеть, группы безопасности, firewall... Сами понимаете, что главные пользователи Databricks это инженеры данных, и у них могут быть скудные познания в настройках сети, а документацию читать лень, да она еще не очень user friendly. Так что нужен курс - networking for DE 101. Я кстати уделял этому много внимания в datalearn.

Из личных новостей я продал несколько платных консультаций surfalytics и люди остались более чем довольны. Пока еще в бета режиме

Впервые решил попробовать Apple watch, как раз вышли новые ultra с большой батареей. Задачи у часов 2:
- напоминать про встречи, так как это мой главный косяк, я пропускаю встречу, и некоторых это очень сильно тригерит, типа плохой work ethics.
- другая задача - трекать время активностей - работа, спорт, чтение и тп, использую ATracker, можно будет потом посчитать, сколько вы реально зарабатываете в час, и сколько чистых часов работаете.

PS есть еще важные новости про которые забыл? Присылайте в комментарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
11❤‍🔥4🦄3
Staff Engineer в Мета с зарплатой $800K ⬆️

Вышла статья инженера Rahul Pandey про то, как он за 4 года вырос из senior до staff инженера (E5 to E6) в Meta и его совокупный доход за последний год достиг более $800K.

Автор в статье делиться опытом каждого года, прочитайте на досуге. Я лишь скопирую самое интересное.

Самый большой скачок в зарплате произошел при переходе от Senior до Staff.

Важно первый год посвятить изучению кода и проекта, даже если очень тяжело. Автор работал 50+ часов в неделю и это дало свои результаты, в следующем году он уже брал тимлидские обязанности.

Чтобы получить повышение - недостаточно один-два раза на ревью показать результат “выше ожиданий”. Нужно постоянно показывать высокую эффективность, на это может потребоваться время.

Если планируете расти внутри компании, закладывайте как минимум 2 года. Поэтому важно выбирать правильную компанию, в которой можно несколько лет посвятить своей карьере.

Как только выбрали правильную компанию, можно забыть про литкод и алгоритмы, и не тратить на это время.

Нужно понимать как работают акции и опционы. Слишком много разработчиков закцикливаются только на зарплате. Автор закрыл 2021 год с доходом в 800 тысяч долларов в Meta, и почти 600 тысяч долларов из них составили акции компании.

⬅️Ссылка на оригинальную статью.
https://www.jointaro.com/blog/how-i-became-an-800k-engineer
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥20
В четверг команда российского BI, построенного на NLP, проводит вебинар - "BI в мессенджере для менеджеров продаж: кейс ГК Самолет"

Ребята расскажут о том, как сделать бизнес-аналитику доступной сотруднику, даже если он работает «в полях» или у него нет времени разбираться со сложным интерфейсом.

А также обсудят, как AI позволяет получать аналитические данные прямо в мессенджер за доли секунды.

Что будет на вебинаре:

👉🏻 Easy Report: BI в мессенджере.
Обзор системы и кейсы применения.
👉🏻 Быстрый доступ к данным для коммерческого блока через BI в мессенджере: кейс застройщика.
👉🏻 Демонстрация работы решения.

Спикеры:

Юрий Ефаров
- CEO Easy Report, генеральный директор Sapiens solutions (в ТОП-15 поставщиков аналитических решений в РФ)

Павел Сухоруков - руководитель группы формирования отчетности, ГК Самолет.

Игорь Пантелеев - Соучредитель и CTO Easy Report.

Ссылка на вебинар.

🗓 28 сентября, 11:00 мск • Онлайн
🙈11❤‍🔥10🍌1
Самый популярный hint в SQL 1=1

Когда только начинал, никак не мог понять зачем. Оказывается все просто, можно убирать и добавлять условия и не нужно переживать за лишний AND.
❤‍🔥104💯32🙉14🙈4
Продолжаю серию постов про пеликанов. VK Cloud опубликовали кейс - Как облако помогло ученым посчитать пеликанов за 30 миллисекунд вместо 7 дней

Ссылка на канал VK Cloud - 🌎 Мы считали пеликанов: как нейросеть помогает сохранять популяцию редких птиц в дикой природе

А вот история постов про пеликанов
Пост1 - идея использовать ML для подсчета колоний пеликанов
Пост2, Пост3 - публикация научной статьи
Пост4 - статья в научном журнале

PS технический лидер проекта Владимир Валеев зарекомендовал себя как очень крутой специалист по компьютерному зрению да теперь еще и большой опыт ML на отечественных облаках, если вам нужен специалист, то обращайтесь к нему, он как раз ищет новый проект! А если хотите получить ML опыт, тоже пишите ему, лишние руки не помешают!

PS А если вы в Москве, приходите в зоопарк посмотреть на живых пеликанов..
❤‍🔥20🍌5🐳1