Only Analyst
2.55K subscribers
140 photos
20 videos
158 links
Канал для всех, кто интересуется аналитикой данных и хочет изучить данную профессию
@onlyanalyst
Download Telegram
😀 Всем привет!

👍 Уже завтра пойдет техническая конференция для аналитиков Aha’23.

🧑‍🏫 Делюсь своей подборкой докладов, которые я выбрал на основе потенциальной пользы для работы, ориентируясь на схожие проблемы и стек технологий

🏁 В итоге получился полноценный bootcamp по аналитике:

🖼️ 12:00 Наглядная визуализация для ELT-процессов в DWH от СберМаркет.

🚕 12:45 Сколько должен стоить тариф доставки? от Яндекса

🐍 13:30 Улучшаем пользовательский опыт с Python-библиотекой Retentioneering

🤑 15:00 Как мы автоматизируем оценку экономического эффекта фичей в СберМаркете

❤️ 15:45 Смена источника данных для сквозной аналитики: миграция веб-стриминга крупного проекта от DataGo

🩺 16:30 Разметка-событий-как-код от SberHealth

💼 17:15 Как научиться проходить технические интервью (но в итоге облажаться)

👨‍🍳 Конференция преподносит нам «на блюдечке» дистиллированный опыт команд опытнейших аналитиков индустрии, который стоит на много дороже любых курсов и отражает реальное положение дел.

🤔 Думаю, что начинающим аналитикам будет очень полезно посмотреть на кухню изнутри и ознакомиться с какими проблемами сталкивается команда и главное: как и к какому решению они пришли.

✒️ Какие доклады интересны Вам? Что хотели бы обсудить?

#матемаркетинг #aha23
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
😀 Всем привет!

🐶 Расскажу про свой мини пет-проект:

🏦 Извлекаем (extract) данные ВВП стран из открытых данных с пощью библиотеки requests

🐼 Используя библиотеку Pandas преобразуем (transform) данные в нужный формат

🐎 Визуализируем данные библиотекой bar_chart_race

⚒️ Это простой пример ETL процесса, который продемонстрирует работодателю Ваши навыки по работе с популярными библиотеками (requests, pandas), понимание работы с открытыми API и зацепит нескучной визуализацией.

✒️ Кому интересно, то пишите в комментариях ,что хотели бы добавить к проекту, и делитесь с друзьями.

🧑‍🏫 А я в следующих постах подробно расскажу как самим сделать такой pet-проект и добавить к себе в резюме

#петпроект
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥296
😀 Всем привет!

☀️ Сегодня первое июня, а значит день отчета по метрикам канала за май перед моими главными стейкхолдерами - подписчиками, то есть Вами.

🥬 Для начинающих продуктовых аналитиков - это отличный шанс «поиграть» в продукт: в комментариях жду ваши выводы/гипотезы/инсайты

🤰 Напомню, что канал стартовал в апреле 2023 и каждый месяц я делюсь аналитикой. Подробную статистику, которую предоставляет телеграмм, и результаты первого месяца можно посмотреть тут.

📊 Основные достижения за месяц:

🌱 +108 подписчиков, +25%

📺 512 просмотров в среднем на пост, 99% подписчиков читают посты (но это не точно)

🥳 10% вовлеченности (ставят реакции, комментарии и пересылают посты), хотя только у 30% включены уведомления

🏆 Рейтинг постов:

🫣 1350 просмотров у поста про техническую конференцию Aha!23

📦 36 пересылок у поста с подборкой источников датасетов для пет-проектов

👍 28 реакций у поста с новым пет-проектом и нескучным видео

🕵️‍♀️ Инсайты:

📚 Подборки заходят, так как они плотно наполнены информацией и полезны для людей

🖼 Визуальная часть не менее важна, чем наполнение

🎎 Смежные по тематике мероприятия повышают интерес

🖋 Если хотите повлиять на развитие канала, то попрошу Вас в свободной форме написать, что нравится/не нравится и какой контент хотелось бы видеть

#аналитика
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍7🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
📋 Вот отличный план как провести выходные с пользой

🤖 Прошел ровно месяц с тех пор, как Andrew Ng последний раз радовал нас бесценными (не путать с бесплатными) курсами по использованию ИИ в работе.

💧 Список нового дропа от коллаборации DeepLearning.ai и Stanford University:

🏗 Building Systems with the ChatGPT API

Научитесь разбивать сложные задачи, автоматизировать рабочие процессы, связывать вызовы LLM и получать более качественные результаты

LangChain for LLM Application Development

Изучите как применять LangChain для создания личных помощников и специализированных чат-ботов непосредственно у создателя фреймворка Харрисона Чейза

🧑‍🏭 How Diffusion Models Work

Создайте свою собственную diffusion model и научитесь ее тренировать, в видео к посту как раз запись использования модели

✒️ Когда лидирующие компании мира делятся потрясающими курсами совершенно бесплатно, даже неловко становится за конторы, которые скомпоновав несколько документаций в более менее связный текст продают их под видом курсов, которым суждено помочь Вам найти свою первую работу в IT. Что думаете по этому поводу?

#курсы #chatgtp #подборка
11🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
😀 Всем привет!

♣️ Смотрели фильм «21»? Помните сцену, где учитель, которого играет Кевин Спейси, предлагает ученикам провести мысленный эксперимент:

🚗🐓🐓 Есть три двери, за одной из которых находится приз (скажем, автомобиль), а за двумя другими - курочки.

🚪 Игрок выбирает одну дверь # 1

🔢 Теперь ведущий, который знает, что находится за каждой дверью, открывает одну из оставшихся двух дверей, чтобы показать, что там курица, скажем, за дверью # 2

🏅 Далее ведущий предлагает игроку выбрать вместо двери # 1 оставшуюся дверь # 3

🙋‍♀️ Внимание, вопрос: Стоит ли игроку менять свой выбор, чтобы увеличить шансы на победу?

🎬 Фильм мне понравился, но к сожалению, мало рассказали про данный парадокс.

🤔 Парадокс назван в честь ведущего программы Let’s Make the Deal шоу Монти Холла.

🧑‍🏫 Самое просто объяснение звучит примерно так: если не менять дверь, то шанс на победу 1/3, а если менять, то 1/2. Кто хочет сойти с ума и вспомнить курс тервера, то можете почитать эту статью.

🧫 Я написал небольшую программу, которая симулирует сценарий игры 1000 раз, чтобы убедиться в работоспособности данного парадокса. Результаты и правда любопытные, их можете наблюдать на видео к посту.

📊 Количество побед, если не менять дверь отображается в колонке Stay, а если менять, то в Switch. В нижнем левом углу показывается номер симуляции.

✒️ Какие еще подобные проблемы хотели бы опробовать? Интересен ли код симуляции? Угадали ли Вы с правильным ответом?

#тервер
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1311
This media is not supported in your browser
VIEW IN TELEGRAM
😀 Всем привет!

🦊 Продолжаем тему создания пет-проектов, про которую я писал в этом посте.

📕 Создал репозиторий в GitHub DataPetProject, где уже выполнена часть с загрузкой данных через API World Bank и преобразованием их в DataFrame Pandas нужной формы для дальнейшей визуализации, как на видео к посту.

🫡 В функции request_world_bank_data можно выбрать любое количества стран, периода и индикаторов (ВВП, население и так далее).

📽️ Визуализация демонстрирует изменение населения топ 15 государств по этому признаку с 1970 по 2020 годы. Добавил медиану и общее количество по всем колонкам.

🕵️‍♀️ Вы можете сами поучаствовать в развитии проекта: сделать описание, пофиксить ошибки, реализовать или предложить свои идеи! Я всех добавлю в contributors, а это отличный способ выделиться из толпы, поучаствовав в OpenSource проекте.

🙋 Также у нас еще есть проект, в котором многие (нет) поучаствовали по созданию синтетических данных.

🤦‍♀️ Постараюсь в ближайшее время добавить часть с анимированием графиков, останется только немного украсить и отличный пет-проект готов!

✒️ Если хотите поучаствовать, то пишите в комментариях! Отвечу на все вопросы

#петпроект
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍4🔥3
💣 Если после этого Яндекс не сделает свои курсы бесплатными, то я не знаю, что еще должно произойти

🥽 Google выпустили бесплатный учебный путь по Generative AI, который включает 8 курсов.

🤖 GenAl - это тип искусственного интеллекта, который создает новый контент на основе того, что он извлек из существующего контента.

🧑‍⚖️ Процесс изучения существующего контента называется обучением и приводит к созданию статистической модели.

🙋‍♀️ При получении запроса GenAl использует эту статистическую модель для прогнозирования ожидаемого ответа - и это генерирует новый контент.

👨‍👩‍👦 Всех поздравляю: мы застали третий этап развития программирования и порог вхождения в него как никогда низкий.

😻 Для примера возьмем кошку! В традиционном программировании мы четко задавали все необходимые условия для определения кошки (4 лапы, хвост и усы), во время волны нейронных сетей мы «показывали» картинки с кошками, чтобы ИИ смог их различать, а теперь ИИ сам может дать кошке определение или создать картинку с кошкой.

✒️ Как думаете изменится работа аналитика с развитием таких ИИ?

#курсы
11🔥7
📺 На канале уже более 90 постов, поэтому ориентироваться стало сложно, даже мне, поэтому сделал навигация по хэштегам и оставлю ее в закрепе:

Программирование:

🐍 #python
📕 #словари
🔢 #множества #set
🌀 #циклы
🐼 #pandas
🎱 #numpy
🕵️‍♀️ #задача

Профессиональный путь:

🔎 #поискработы
👔 #собеседования
🔥 #прожарка
📃 #резюме
📚 #курсы

Развитие:

🦊 #петпроект
👫 #opensource
📕 #книги
🧑‍🏫 #учеба
📊 #визуализация
🔬 #абтесты
🎲 #тервер
🤖 #chatgtp
🧞 #парадокс
💿 #данные

Youtube:

👩‍💻 #интервью
📹 #видео

Личное:

🦹 #истории
💼 #работа - профессиональный опыт
👩‍💻 #аналитика - статистика группы и youtube канала
©️ #авторскиеправа
🗒️ #подборка - наборы полезных ссылок
📑 #проект
🧑‍⚖️ #статьи
📰 #хабр

Конференции:

👍 #матемаркетинг #aha23

✒️ Также приглашаю в наш чат, где будем помогать друг другу и отвечать на вопросы и делиться тестовыми. Если есть советы, как сделать навигацию удобнее, то жду предложений
Please open Telegram to view this post
VIEW IN TELEGRAM
👍108🔥8
Only Analyst pinned «📺 На канале уже более 90 постов, поэтому ориентироваться стало сложно, даже мне, поэтому сделал навигация по хэштегам и оставлю ее в закрепе: Программирование: 🐍 #python 📕 #словари 🔢 #множества #set 🌀 #циклы 🐼 #pandas 🎱 #numpy 🕵️‍♀️ #задача Профессиональный…»
🤰В 2023 нельзя быть junior специалистом

💼 Наткнулся сегодня на пост от Хабра.Карьеры, в котором проводят исследования IT рынка за май 2023 года.

🫣 Я понимал, что ситуация со стажерами и junior специалистами выглядит не лучшим образом, но оказывается на них приходится всего 4 % вакансий, а сколько из них аналитиков данных, я даже предположить боюсь.

🫡 Если бы я сегодня искал первую работу или хотел сменить профессию на аналитика данных в IT, то первое, что я бы понял было: в 2023 году нельзя быть junior специалистом, а стажером тем более.

🤦‍♀️ Наверное такое у вас лицо сейчас, но погодите бежать в комментарии о том, что это невозможно, а лучше разберем сначала в чем разница между junior и middle специалистом:

👶 Младший аналитик данных:

🔬 Нет рабочего опыта
⛺️ Базовые знания концепций анализа данных
🧹 Помогает в очистке, подготовке и базовом анализе данных
🧑‍🍼 Работает под присмотром
📿 Участвует в простых проектах
🤝 Ограничено взаимодействует с заинтересованными сторонами

🦸‍♂️ Средний аналитик данных:

💼 Несколько лет в области
🧠 Более глубокое понимание инструментов и методов анализа данных
💪 Самостоятельно справляется со сложными задачами анализа
📈 Разрабатывает и выполняет аналитические проекты
💡 Предоставляет информацию и рекомендации, основанные на полученных результатах
🗣️ Взаимодействует с заинтересованными сторонами, представляет результаты

🏁 Вывод такой: единственное, что сложно получить - это реальный релевантный опыт, все остальное можно выучить, спросить или понять на этапе собеседований.

🧟 Про получение опыта в аналитике вне работы уже написано много, только у меня есть несколько постов на эту тему: Kaggle, Уловка 22 и наш open source проект

💎 Если меняете профессию, то это значит, что у Вас уже есть опыт решения аналитических задач и soft скиллы, которые просто необходимо грамотно инкрустировать в Ваше резюме.

✒️ Что думаете по этому поводу? Буду рад услышать Ваше мнение.

#поискработы #резюме
👍138🔥4
🕵️‍♀️ Сегодня разберем очень интересную тему, которую часто поднимают на собеседованиях, а именно репрезентативность выборки

👩‍⚖️ Правило: не делайте выводов по нерепрезентативным выборкам

📈 Посмотрев на первый график, видим, что все хорошо и имеется восходящий тренд

📊 Далее выделяем 3 «сегмента», каждый их которых не является репрезентативным для генеральной совокупности, так как они не отражают ее статистических характеристик

📉 Каждый «сегмент» в отдельности имеет нисходящий тренд

🧞Разберем на примере: Вы получили результаты трех групп: детей 👶, женщин 🙋‍♀️и мужчин🤵‍♂️. В каждой из которых влияние некого лекарства имеет отрицательный результат и интуитивно кажется, что общий результат будет негативным, но как мы с Вами видим на графики: такое происходит не всегда.

☝🏻 Это явление называется Парадоксом Симпсона и происходит из-за усреднений данных с различным количеством наблюдений, что приводит к неверным выводам.

✒️ А вы сталкивались с такой ситуацией в жизни или работе?

#собеседование #парадокс
17🔥2👍1🥰1
🙇‍♂️ Сегодня поделюсь очень важным для меня видео!

🧑‍🏫 Если у Вас были вопросы про смену профессии или начало карьеры в IT, то перед Вами живой пример - Михаил Измайлов @mishizm, мой наставник и хороший друг!

🗺️ Подкаст сможет стать для Вас не только призывом к действию, но и подробной инструкцией как перейти в желаемую область.

🗣️ Обсуждали такие темы, как предыдущий опыт работы, образование, планирование новой должности, преимущества и недостатки анализа данных, найм и удержание стажеров, менторинг и онбординг, смена профессии, курсы и планы на будущее.

✒️ Если после видео остались вопросы, то смело задавайте их в комментариях и мы обязательно ответим!

🛟 Если видео Вам будет интересным, то поставите лайк, подписывайтесь на YouTube и поделитесь с друзьями.

😀 Подписаться

#видео #интервью #поискработы
Please open Telegram to view this post
VIEW IN TELEGRAM
13🔥7👍4