АННА В ДАННЫХ
1.86K subscribers
143 photos
5 videos
65 links
Яркие будни Senior Product Analyst

Не только материалы по SQL, Python и советы по трудоустройству для аналитиков, но и мои размышления на разные темы и лайфстайл 💅

Пост-знакомство: https://t.me/anna_in_data/4

По обучению и сотрудничеству @annaindata
Download Telegram
Музей для любителей IT (и не только)💻

Я побывала в научно-техническом музее криптографии и осталась в полном восторге!

❇️Если вам интересно, как устроены шифрование, блокчейн, NFT или как защищаются наши данные в мессенджерах и платежных системах, то вам точно сюда 👉

В музее куча интерактивных инсталляций. Мне особенно понравилась та, где нужно было вскрыть ящик, угадав самый популярный семизначный численный пароль ⌨️ А еще было много загадок на дешифровку. Нахлынули приятные воспоминания, как я в детстве вела личный дневник, используя шифр Цезаря 💜

Музей очень насыщенный, можно провести там несколько часов, даже не заметив. Особенно круто, что залы расположены в обратном хронологическом порядке: начинаешь с современных технологий, а в конце узнаёшь, как шифровали информацию ещё за несколько тысяч лет до нашей эры

Всем москвичам рекомендую посетить, находится тут
📍Москва, Ботаническая ул., д. 25с4

#поболтать_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
311🔥5
Снова наступил понедельник, и мой календарь выглядит вот так

Не знаю, как вы, но лично я такое не люблю, большое количество созвонов в день не дают нормально поработать:

⏺️Часто на созвонах делятся информацией, которую можно было бы передать асинхронно в корпоративном мессенеджере
⏺️Аналитика требует концентрации внимания на погружение в данные, поиск закономерностей, проверку гипотез. Каждая встреча это переключение внимания. О каком погружении может идти речь?
⏺️Ну и просто представьте сколько стоит час работы каждого участника встречи

(Блин, помню, как на одной из прошлых работ с кучей встреч каждый день, нам поставили ретро на 2 часа, на котором мы обсуждали, почему мы не успеваем делать задачи в спринт 🤪А когда мой коллега сказал, что ему мешает количество встреч, лид ответил, что он все выдумывает и встреч у него не много)

Конечно, есть ситуации, когда важно обсудить что-то голосом, но далеко не всегда

А как вы относитесь к большому количеству встреч? И как ваш календарь сегодня?
😎 - свободен
😱 - ломится от встреч

#карьера_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
315643
Поступил вопрос от подписчика: стоит ли идти на работу аналитиком на Excel, без SQL и Python?

Тут уж каждый волен решать сам, поделюсь исключительно моим мнением:

🟣Рынок уже давно требует аналитиков, которые работают с SQL и Python. Тем более ты потратил время на их изучение. И когда захочешь развиваться дальше, то поймешь, что без практики все забылось и нужно учить заново
🟣Вакансии, где нужен только Excel, обычно оплачиваются хуже. В среднем чем шире и продвинутее стек инструментов, тем выше зарплата
🟣Если в какой-то момент захочется уйти в DE или DS, SQL и Python сильно облегчат переход, в отличие от Excel
🟣Excel конечно мощный инструмент, но у него есть пределы. Если данных больше миллиона строк, он начинает тормозить и просто не справляется. SQL и Python работают с большими объёмами данных гораздо быстрее и эффективнее
🟣Скорее всего, данные в компании на одних эксельках хранятся в виде десятков локальных файлов, которые теряются, дублируются и ломаются - будет хаотичный процесс работы с данными
🟣Мне кажется, тебе быстро станет скучно

Когда делают первый оффер на первую айти работу, велик соблазн схватить сразу, что дают. Но я бы порекомендовала тебе не торопиться и поискать что-то другое, более релевантное↕️

Всех несогласных приглашаю на дискуссию в комментарии⌨️

А для тех, кто хочет в аналитику, но по какой-то причине еще не выучил базу по Python и SQL, ссылочки на 2 бесплатных классных курса с тренажером от Карпова:
👉https://karpov.courses/simulator-sql
👉https://karpov.courses/pythonzero

Эх, если бы в мое время такое было!

#карьера_анна_в_данных
#курсы_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2895
Идеи для подарков на 8 марта айти-даме и не только

До праздника осталось совсем мало времени. Держите варианты, что можно подарить девушке / подруге:

💗Симпатичный чехол для ноутбука, который защитит его от царапин и будет радовать глаз
💗Стильная сумка, в которую влезет ноутбук
💗Сертификат на массаж, чтобы размять затекшие мышцы
💗Перкуссионный массажер все за тем же
💗Ультралегкий мощный power bank на 20к mAh, чтобы ноутбук и телефон всегда были заряжены, даже если поблизости нет розетки, например от Nitecore
💗Мастер-класс по изготовлению кольца, чтобы отвлечься от монитора и сделать свое уникальное украшение
💗Сертификат в ЗЯ - просто беспроигрышный вариант

Если нужны ссылочки, пишите!

Что добавили бы в список?


#поболтать_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
31563
Лучший источник по статистике для аналитика

Недавно я рассказывала о несложной книге по статистике для новичков.

А сегодня поговорим о настоящей объемной энциклопедии! Я обожаю книгу «Практическая бизнес статистика» Эндрю Сигела и вот почему:
🔵Максимально подробно раскрыты все основные темы по статистике
🔵Много детально разобранных примеров с расчетами и графиками
🔵Удобная навигация (несмотря на внушительный объем книги)

Никакие «Статистика и котики» и что там еще рекомендуют и рядом не стояли. А вот к этой книге я неизменно возвращаюсь каждый раз, когда готовлюсь к собеседованиям и хочу освежить знания по каким-то темам.

Очень рекомендую каким-то образом найти ее в бумажном виде (я покупала через Авито). Ну а электронный вариант прикрепила в комментариях

#статистика_анна_в_данных
#книги_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
525🔥93
Отметили с подружками день женской солидарности, поехав в загородный спа-отель и задонатив в фонд поддержки женщин💓💃

Мы очень круто провели время: релакснули в спа, попарились в русской бане и обсудили кажется все на свете. Кстати, двое из девчонок не просто мои подруги, а еще и коллеги👩‍💻Не первый раз работа сводит меня с чудесными людьми, тем более есть общие интересы, совместно пережитый опыт и куча общих знакомых

Еще я успела открыть велосезон🚴‍♀️ Бесит конечно, когда люди ходят по велодорожкам, но само катание очень успокаивает

Вообще эти выходные помогли мне перезагрузиться. Последний месяц на работе есть небольшой стресс фактор, связанный с перестройкой процессов 👍 Надеюсь в ближайшее время все разрешится наилучшим образом

Как прошли ваши выходные?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
372🔥2
А еще я очень рада вас всех здесь видеть👀

Буду рада, если вы расскажете о себе в комментариях👀

Если вы ведете свой телеграм канал, можете рассказать о нем тут же в комментариях к этому посту
Please open Telegram to view this post
VIEW IN TELEGRAM
3185
Обработка десятков миллионов строк за секунды или Как я заменила Pandas и не пожалела 🐻‍❄️

*Pandas - библиотека для анализа данных на Python

Я уже рассказывала в одном из предыдущих постов, для чего использую Python. Вот и вчера мне понадобилось выгрузить десятки миллионов строк из одной СУБД, потом сметчить с десятками миллионов строк из другой, пофильтровать и посчитать агрегаты. Так как рабочий компьютер у меня слабоват, к сожалению (Air на 8 Гб), Pandas мне бы его положил 🥺Уже сталкивалась с таким

Сразу поняла, что тут он мне не помощник, и стала искать замену. В закладках у меня была статья про Polars🐻‍❄️ https://nuancesprog.ru/p/18192/

Попросила ChatGPT переписать мой код с Pandas. Синтаксис, кстати, очень похож, но различия есть.

В общем, это песня! 🥰Polars выполнил все преобразования и выплюнул мне результат просто за секунду. Он как-то под капотом круто оптимизирует, распараллеливает операции, делает обработку частями и творит прочую магию

А я в результате быстро закрыла задачу и не тратила свои нервы 😎

Документация:
https://docs.pola.rs/user-guide/getting-started/

#python_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2683
Мы дожили до пятницы! 🫠

Не знаю как у вас, у меня эта неделя была довольно загруженной: несколько презентаций директорам по итогам эффективности дорогостоящих💲фичей, соответственная аналитика и расчеты для них. Одна фича прям спорная и находится на стыке интересов нескольких отделов 😱

При этом я простудилась, поэтому отменила походы на все крутые мероприятия, которые себе запланировала, чтобы никого не заразить. В итоге worklife-balance на этой неделе полностью завален! 😱Не люблю такое

Как ваша рабочая неделя?

(На фото моя очаровательная Булочка)
Please open Telegram to view this post
VIEW IN TELEGRAM
10124🔥3
Всю неделю проболела и продолжаю чувствовать себя не очень😪Но в очередной раз задумалась насколько мир стал удобнее за последние годы

Сейчас, если ты простужаешься, тебе НЕ надо (версия для айтишников):

↔️Брать больничный и терять в доходе♦️
Раньше приходилось либо «героически» идти на работу (и заражать остальных), либо брать больничный и терять огромную часть зарплаты. Сейчас, благодаря удаленке, можно просто продолжать работать в привычном режиме из дома. Помню, как до 2020 года я, как и многие мои коллеги, ходила в офис простуженной, потому что больничный казался слишком большой роскошью. Сейчас это кажется дикостью, но тогда это было нормой.

Идти в поликлинику к врачу
Я предпочитаю обращаться к своим проверенным врачам, а не просто по ДМС, но в несерьезных случаях ДМС очень меня выручает! Например, очень удобно вызывать врача на дом, чтоб послушал, сделал экспресс-тест на 🦠. А иногда можно вообще ограничиться и телемедициной: пообщаться с врачом в чате приложения страховой или созвониться по телефону.

Идти в магазин за продуктами и готовить◀️
К счастью, есть доставка. Этим я пользуюсь даже когда здорова, потому что это удобно и экономит время. А уж когда плохо себя чувствуешь, это просто спасение. Заказал животворящий супчик, мед, лимончик и еще что-то вкусненькое — и через 15 минут уже можно есть, не тратя силы на готовку.

Выходить из дома в аптеку за лекарствами🔼
Все лекарства кроме рецептурных можно просто доложить в корзину к еде, и их так же быстро привезут

‼️Главное, помните, что даже с такими удобствами важно заботиться о себе и не перегружаться‼️

Всем подписчикам желаю крепкого здоровья ❤️

#поболтать_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
31354
Ну а утро понедельника началось у меня с тупняка: я полчаса поэтапно раскомменчивала блоки кода в своем даге, пытаясь понять, почему он падает. Вместо того, чтобы просто глянуть в логи и увидеть, что я забыла выдать техучетке права на изменение таблицы👍

*Даг (DAG) - это грубо говоря Python-скрипт в Airflow, в котором прописано как и какие задачи нужно выполнить, в каком порядке, с какими зависимостями и когда

А календарь свой даже показывать не буду 😅Я выкладывала пару недель назад, так вот на этой он еще хуже

Как ваш понедельник?
Please open Telegram to view this post
VIEW IN TELEGRAM
3753
Ну а закат сегодня просто 💔

Присылайте свои закатики
5❤‍🔥115
Аналитик должен знать ответы на эти 10 вопросов по SQL ⌨️

Для этих вопросов не нужно писать запросы и ответить можно очень быстро, поэтому какие-то из них иногда задают прям рекрутеры во время первого скрининга. У них перед глазами есть правильные ответы, и они делают себе пометочки, чтобы отсеять кандидатов еще до собеседования:

1️⃣Может ли измениться результат запроса, если в LEFT JOIN поменять таблицы местами?

🆒В чем разница между UNION и UNION ALL?

3️⃣Сколько будет 5 + NULL?

4️⃣Можно ли делать JOIN таблицы саму на себя?

5️⃣Включает ли функция COUNT NULL-значения при подсчете?

6️⃣При каких типах соединения условие из WHERE можно перенести в ON с гарантированным сохранением результата запроса?

🆒Какой из операторов: SELECT, FROM, WHERE, GROUP BY - будет выполняться последним при обработке запроса?

8️⃣Какие функции умеют возвращать значения из предыдущих/последующих строк для заданной строки таблицы?

🔡В чем разница между HAVING и WHERE?

1️⃣🔡Какое минимальное и максимальное количество записей может выдать FULL JOIN таблицы на 10 строк с таблицей на 100 строк?

На все получилось ответить?

Ставьте кричащего котенка - 😱, если хотите, чтобы выложила правильные ответы
Ставьте крутого котенка - 😎, если и так знаете ответы на эти вопросы

#sql_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
1025173
Аналитик должен знать ответы на эти 10 вопросов по SQL: ОТВЕТЫ👉

Мы собрали достаточно кричащих котиков под предыдущим постом, поэтому выкладываю правильные ответы.

А если что-то показалось непонятным, смело пишите в комментариях, разберём подробнее!

1.Может ли измениться результат запроса, если в LEFT JOIN поменять таблицы местами?

Да. В LEFT JOIN сохраняются все строки из первой (левой) таблицы и соответствующие строки из второй (правой) таблицы. Порядок тут критически важен.

2.В чем разница между UNION и UNION ALL?

UNION удаляет дубликаты строк после объединения, а UNION ALL - нет.

3.Сколько будет 5 + NULL?

Любая математическая операция с NULL вернет NULL.

4.Можно ли делать JOIN таблицы саму на себя?

Да, это называется self-join (слово self при этом писать не нужно, джойните как обычно)

5.Включает ли функция COUNT NULL-значения при подсчете?

COUNT по конкретному столбцу не будет включать NULL значения. COUNT(*) посчитает все строки.

6.При каких типах соединения условие из WHERE можно перенести в ON с гарантированным сохранением результата запроса?

Гарантированно - при обычном JOIN. В случаях с другими видами JOIN есть нюансы (в зависимости от того, к какой таблице условие)

7.Какой из операторов: SELECT, FROM, WHERE, GROUP BY - будет выполняться последним при обработке запроса?

Среди перечисленных операторов SELECT будет выполняться последним, несмотря на то, что пишется первым. Сначала будет определяться откуда берутся данные (FROM), потом какие (WHERE), потом условия группировки (GROUP BY) и только затем, что будет выведено (SELECT)

8.Какие функции умеют возвращать значения из предыдущих/последующих строк для заданной строки таблицы?

Оконные функции, например такие как: LAG(), LEAD()

9.В чем разница между HAVING и WHERE?

WHERE фильтрует отдельные исходные строки таблицы и не может применяться к агрегирующим функциям. HAVING - наоборот фильтрует строки уже после группировки по значениям агрегирующих функций.

А 10-й вопрос я решила сделать через квиз ⌨️ В комментах к ним добавила объяснение

#sql_анна_в_данных
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥2132
Какое минимальное количество записей может выдать FULL JOIN таблицы на 10 строк с таблицей на 100 строк?
Anonymous Quiz
18%
10
31%
100
18%
110
33%
1000
1🔥3