🇧🇷 Любовь с акцентом: мой роман с португальским
Ну что, кажется, пора закрывать серию языковых историй моим самым любимым языком — португальским.
Бразильским, конечно. Тут даже вопросов нет.
Как и почти со всеми языками в моей жизни, всё началось с человека.
Неожиданно, немного киношно и, как водится, на работе.
Когда я ещё работала закупщиком, мы много общались с европейскими поставщиками. В основном по почте, иногда по телефону и почти никогда вживую. Но раз в год случалась выставка, куда приезжали иностранцы. И иногда нас, закупщиков, брали «для компании» — поболтать, помочь с коммуникацией, при необходимости что-то перевести.
Однажды меня отправили сопровождать итальянского поставщика. Мы провели вместе почти целый день: работа, разговоры обо всём подряд, жизнь, языки. И в какой-то момент я гордо заявила, что учу испанский.
А он ответил:
— Круто. А я знаю португальский. Давай проверим, насколько они похожи.
И тут случилось непоправимое.
Представьте себе итальянскую версию Тома Эллиса в роли Люцифера в одноимённом сериале.
А теперь добавьте к этому бразильский португальский.
Закройте глаза и вообразите, что вам тихо говорят:
Bom dia, querida…
Спойлер: он говорил не это.
Я вообще не помню, что именно он говорил.
Но я влюбилась.
В язык, конечно. А вы что подумали?
Наученная горьким опытом с испанским, я решила не бросаться в самообучение. Погуглила и выяснила, что испанский и португальский могут быть либо благословением, либо проклятием при одновременном изучении.
Я, конечно, решила рискнуть и попробовать оба, но сначала пошла искать школу португальского.
Так я оказалась в языковом центре Ensina-me в Москве. Там учат и испанскому, и португальскому (оба варианта), онлайн и офлайн. Это не реклама, а искренняя рекомендация — вдруг кому-то тоже пригодится.
И именно там мне достался самый терпеливый преподаватель португальского языка на планете. Он выглядел как Иисус и, как выяснилось, друзья так его и зовут. Хотя по паспорту он Бруно.
Я начала учиться в группе. После школьного английского это был мой первый групповой опыт, и, неожиданно, он оказался очень классным. Но месяца через четыре я поняла, что хочу индивидуальные занятия. Я слишком сильно залипла в язык: слушала, читала, думала на нём при любой возможности. Мой темп стал заметно быстрее темпа группы.
И тут случился разрыв. Я бросила испанский.
Он начал мешать. Лез в речь, путал слова. Помню, как я что-то рассказывала и зависла, выбирая между двумя одинаковыми по смыслу глаголами. Выбрала наугад.
Бруно посмотрел на меня и сказал:
— Não entendo! (Не понимаю!)
Он, конечно, всё понял. Но дал понять мне: опять испанский.
В тот момент я решила — всё, выбираю один язык. И это будет португальский.
Это были невероятно крутые три года. Благодаря Бруно я сейчас спокойно читаю книги и слушаю подкасты на португальском. Разговорной практики не хватает, но это, как говорится, дело наживное.
В этом году я хочу вернуться к языку.
И к своему любимому преподавателю тоже.
А теперь вопрос к вам:
какой свой гештальт вы хотите закрыть в этом году?
#полиглот_полюбви
Ну что, кажется, пора закрывать серию языковых историй моим самым любимым языком — португальским.
Бразильским, конечно. Тут даже вопросов нет.
Как и почти со всеми языками в моей жизни, всё началось с человека.
Неожиданно, немного киношно и, как водится, на работе.
Когда я ещё работала закупщиком, мы много общались с европейскими поставщиками. В основном по почте, иногда по телефону и почти никогда вживую. Но раз в год случалась выставка, куда приезжали иностранцы. И иногда нас, закупщиков, брали «для компании» — поболтать, помочь с коммуникацией, при необходимости что-то перевести.
Однажды меня отправили сопровождать итальянского поставщика. Мы провели вместе почти целый день: работа, разговоры обо всём подряд, жизнь, языки. И в какой-то момент я гордо заявила, что учу испанский.
А он ответил:
— Круто. А я знаю португальский. Давай проверим, насколько они похожи.
И тут случилось непоправимое.
Представьте себе итальянскую версию Тома Эллиса в роли Люцифера в одноимённом сериале.
А теперь добавьте к этому бразильский португальский.
Закройте глаза и вообразите, что вам тихо говорят:
Bom dia, querida…
Спойлер: он говорил не это.
Я вообще не помню, что именно он говорил.
Но я влюбилась.
В язык, конечно. А вы что подумали?
Наученная горьким опытом с испанским, я решила не бросаться в самообучение. Погуглила и выяснила, что испанский и португальский могут быть либо благословением, либо проклятием при одновременном изучении.
Я, конечно, решила рискнуть и попробовать оба, но сначала пошла искать школу португальского.
Так я оказалась в языковом центре Ensina-me в Москве. Там учат и испанскому, и португальскому (оба варианта), онлайн и офлайн. Это не реклама, а искренняя рекомендация — вдруг кому-то тоже пригодится.
И именно там мне достался самый терпеливый преподаватель португальского языка на планете. Он выглядел как Иисус и, как выяснилось, друзья так его и зовут. Хотя по паспорту он Бруно.
Я начала учиться в группе. После школьного английского это был мой первый групповой опыт, и, неожиданно, он оказался очень классным. Но месяца через четыре я поняла, что хочу индивидуальные занятия. Я слишком сильно залипла в язык: слушала, читала, думала на нём при любой возможности. Мой темп стал заметно быстрее темпа группы.
И тут случился разрыв. Я бросила испанский.
Он начал мешать. Лез в речь, путал слова. Помню, как я что-то рассказывала и зависла, выбирая между двумя одинаковыми по смыслу глаголами. Выбрала наугад.
Бруно посмотрел на меня и сказал:
— Não entendo! (Не понимаю!)
Он, конечно, всё понял. Но дал понять мне: опять испанский.
В тот момент я решила — всё, выбираю один язык. И это будет португальский.
Это были невероятно крутые три года. Благодаря Бруно я сейчас спокойно читаю книги и слушаю подкасты на португальском. Разговорной практики не хватает, но это, как говорится, дело наживное.
В этом году я хочу вернуться к языку.
И к своему любимому преподавателю тоже.
А теперь вопрос к вам:
какой свой гештальт вы хотите закрыть в этом году?
#полиглот_полюбви
1🔥22❤12👍7
🛒 Трейлер сезона: осваиваем e-commerce
Ну что, начнём наше эпичное приключение с изучения разных доменных областей и построением небанального портфолио?
Если честно, планов на этот год я себе навалила столько, что иногда даже моя литания против страха не справляется. Но, как говорится, глаза боятся, руки делают. Иногда криво. Иногда медленно. Но делают.
Ближайшие три месяца я решила посвятить e-commerce.
Почему именно он?
Потому что это максимально прикладной домен и, что немаловажно, немного мне знакомый. Я работаю в компании, где большая часть заказов проходит через сайт, так что общее понимание процессов есть. Поможет ли это в изучении сферы? Теоретически — да. Практически — посмотрим.
Если говорить про рынок, то e-commerce в России — это Wildberries, Ozon, Яндекс Маркет, МегаМаркет и ещё куча вариаций. Метрик много, данных много — идеальная среда для обучения.
План действий мы накидали вместе с ChatGPT. Он был настолько любезен, что:
🟠 разложил темы по полочкам
🟠 предложил проекты под каждую из них
Правда, пока не уточнил, где мы будем брать данные. Но это, как говорится, задача со звёздочкой, с которой разберёмся по ходу.
Параллельно я начинаю самостоятельное путешествие в BI-аналитику.
В этом году я дала себе зарок не покупать курсы (держим кулачки), а попробовать самообучение. Доступной информации ведь много, говорят они🤭
Что планирую:
🟠 собрать roadmap BI-аналитика и идти по нему шаг за шагом
🟠 каждые два месяца разбирать один инструмент визуализации, который встречается в вакансиях на hh
Любимые рубрики "Отзыв на курс" и "Отзыв на книгу" никуда не исчезают.
Плюс добавлю новую тему:
как делать (и как не делать) портфолио — на основе советов YouTube-аналитиков.
Что хочу получить через три месяца:
🟠 понять, как устроен домен e-commerce и какие метрики там реально важны
🟠 разобраться, с какими типами данных приходится работать и как подходят к их анализу
🟠 собрать три проекта в портфолио, привязанные к домену
💬 Кстати, с какого домена вы бы начали изучение аналитики и почему?
#аналитик_собирает_пазл
Ну что, начнём наше эпичное приключение с изучения разных доменных областей и построением небанального портфолио?
Если честно, планов на этот год я себе навалила столько, что иногда даже моя литания против страха не справляется. Но, как говорится, глаза боятся, руки делают. Иногда криво. Иногда медленно. Но делают.
Ближайшие три месяца я решила посвятить e-commerce.
Почему именно он?
Потому что это максимально прикладной домен и, что немаловажно, немного мне знакомый. Я работаю в компании, где большая часть заказов проходит через сайт, так что общее понимание процессов есть. Поможет ли это в изучении сферы? Теоретически — да. Практически — посмотрим.
Если говорить про рынок, то e-commerce в России — это Wildberries, Ozon, Яндекс Маркет, МегаМаркет и ещё куча вариаций. Метрик много, данных много — идеальная среда для обучения.
План действий мы накидали вместе с ChatGPT. Он был настолько любезен, что:
Правда, пока не уточнил, где мы будем брать данные. Но это, как говорится, задача со звёздочкой, с которой разберёмся по ходу.
Параллельно я начинаю самостоятельное путешествие в BI-аналитику.
В этом году я дала себе зарок не покупать курсы (держим кулачки), а попробовать самообучение. Доступной информации ведь много, говорят они
Что планирую:
Любимые рубрики "Отзыв на курс" и "Отзыв на книгу" никуда не исчезают.
Плюс добавлю новую тему:
как делать (и как не делать) портфолио — на основе советов YouTube-аналитиков.
Что хочу получить через три месяца:
💬 Кстати, с какого домена вы бы начали изучение аналитики и почему?
#аналитик_собирает_пазл
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18❤11⚡10👨💻3
Учебные проекты для портфолио — это плохо (и вот почему)
Почти каждый курс по аналитике продаётся через один и тот же аргумент:
«В конце у вас будут проекты для портфолио».
Звучит логично. Но есть нюанс.
Christine Jiang — бывший директор по данным, нанимающий менеджер и автор программы Analytics Accelerator — считает, что учебные проекты не стоит включать в портфолио. И я решила разобрать её аргументацию, потому что она показалась мне логичной.
По мнению Кристин, портфолио — это не про инструменты.
Это не «смотрите, я знаю SQL, Python и Power BI».
Это ответ на вопрос: готов ли человек к реальной работе аналитика.
Поэтому она делит проекты на два типа:
1. Learning projects (учебные)
2. Showing projects (демонстрационные)
Почему учебные проекты — слабое место
Учебные проекты, по мнению Кристин, почти всегда:
🟠 заточены на отработку инструментов, а не на решение бизнес-задач
🟠 используют либо слишком «стерильные», либо слишком учебные датасеты
🟠 не имеют чёткого вопроса и структуры
🟠 фокусируются на том, чем ты пользовался, а не зачем
В глазах нанимающего такой проект читается как:
человек всё ещё учится и пока не готов к продакшену.
Жёстко? Да.
Правда? Тоже да.
Что тогда считается хорошим проектом
Showing projects — это попытка имитировать реальную работу аналитика.
Они показывают:
🟠 доменную экспертизу
🟠 структурное мышление
🟠 умение говорить с бизнесом, а не только с данными
Идеальный источник данных — реальный мир:
стажировки, волонтёрство, рабочие задачи.
Но Кристин честно признаёт, что это сложно, и даже записала отдельное видео о том, где брать данные, если у тебя нет коммерческого опыта.
READY-фреймворк для проектов в портфолио
Чтобы проект выглядел как «боевой», Кристин предлагает использовать фреймворк READY:
R — Representative data
Данные должны быть похожи на рабочие:
грязные, большие, с бизнес-метриками.
Не Kaggle на 3k строк, а условные GoogleAnalytics-данные на 100k+ записей.
E — Exec-driven questions
Не «посмотрим, что есть в данных»,
а конкретные бизнес-вопросы.
Например: как перераспределить маркетинговый бюджет по регионам?
A — Analytical frameworks
Чёткая структура анализа:
очистка → EDA → инсайты → визуализация,
а не набор разрозненных запросов.
D — Data best practices
Чистый SQL, комментарии, читаемость, понимание,
зачем ты используешь CTE, а не «потому что можешь».
Y — Your insights & impact
Не просто «продажи выросли на 12%», а:
за счёт каких сегментов
что с этим делать
какое решение ты рекомендуешь бизнесу
Свою логику Кристин подробно показывает в серии видео Portfolio Playbook, где шаг за шагом проходит весь путь анализа.
В следующем посте серии #аналитик_слушает_советы разберём, как она рекомендует оформлять README проекта, чтобы он соответствовал её представлениям о прекрасном.
💬 А теперь вопрос к вам:
как вы относитесь к учебным проектам из курсов?
Это чисто «тренировка» или их всё-таки можно дотянуть до демонстрационных?
#аналитик_слушает_советы
Почти каждый курс по аналитике продаётся через один и тот же аргумент:
«В конце у вас будут проекты для портфолио».
Звучит логично. Но есть нюанс.
Christine Jiang — бывший директор по данным, нанимающий менеджер и автор программы Analytics Accelerator — считает, что учебные проекты не стоит включать в портфолио. И я решила разобрать её аргументацию, потому что она показалась мне логичной.
По мнению Кристин, портфолио — это не про инструменты.
Это не «смотрите, я знаю SQL, Python и Power BI».
Это ответ на вопрос: готов ли человек к реальной работе аналитика.
Поэтому она делит проекты на два типа:
1. Learning projects (учебные)
2. Showing projects (демонстрационные)
Почему учебные проекты — слабое место
Учебные проекты, по мнению Кристин, почти всегда:
В глазах нанимающего такой проект читается как:
человек всё ещё учится и пока не готов к продакшену.
Жёстко? Да.
Правда? Тоже да.
Что тогда считается хорошим проектом
Showing projects — это попытка имитировать реальную работу аналитика.
Они показывают:
Идеальный источник данных — реальный мир:
стажировки, волонтёрство, рабочие задачи.
Но Кристин честно признаёт, что это сложно, и даже записала отдельное видео о том, где брать данные, если у тебя нет коммерческого опыта.
READY-фреймворк для проектов в портфолио
Чтобы проект выглядел как «боевой», Кристин предлагает использовать фреймворк READY:
R — Representative data
Данные должны быть похожи на рабочие:
грязные, большие, с бизнес-метриками.
Не Kaggle на 3k строк, а условные GoogleAnalytics-данные на 100k+ записей.
E — Exec-driven questions
Не «посмотрим, что есть в данных»,
а конкретные бизнес-вопросы.
Например: как перераспределить маркетинговый бюджет по регионам?
A — Analytical frameworks
Чёткая структура анализа:
очистка → EDA → инсайты → визуализация,
а не набор разрозненных запросов.
D — Data best practices
Чистый SQL, комментарии, читаемость, понимание,
зачем ты используешь CTE, а не «потому что можешь».
Y — Your insights & impact
Не просто «продажи выросли на 12%», а:
за счёт каких сегментов
что с этим делать
какое решение ты рекомендуешь бизнесу
Свою логику Кристин подробно показывает в серии видео Portfolio Playbook, где шаг за шагом проходит весь путь анализа.
В следующем посте серии #аналитик_слушает_советы разберём, как она рекомендует оформлять README проекта, чтобы он соответствовал её представлениям о прекрасном.
💬 А теперь вопрос к вам:
как вы относитесь к учебным проектам из курсов?
Это чисто «тренировка» или их всё-таки можно дотянуть до демонстрационных?
#аналитик_слушает_советы
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤23🔥10👍9
🤦♀️ Как же я люблю наступать на одни и те же грабли
Кажется, только вчера я клялась себе больше не брать одновременно два больших курса.
И вот я снова танцую на тех же самых граблях. Красиво. Уверенно. С огоньком 💃
Да, курс в Simulative я ещё не закончила. Формально там остались визуализация и математика со статистикой. Но, как я уже писала, в этом году я решила осознанно идти в BI-аналитику.
Не просто учиться рисовать красивые графики и дашборды (хотя это тоже надо),
а понимать, как через визуализацию решаются задачи бизнеса.
А для этого, внезапно, нужно чуть больше, чем знать, где в Power BI кнопочки.
В общем, я села составлять себе план обучения.
И тут выяснилось, что фраза «всё можно выучить самостоятельно» немного лукавая.
Потому что собрать себе адекватную программу — это вообще-то отдельный навык.
На YouTube я нашла ровно один вменяемый roadmap по BI.
Хорошо, что образовательные платформы давно уже сделали свои программы и там можно что-то подсмотреть.
Если сильно упростить, BI-аналитика у всех выглядит примерно так:
🟠 понимать данные: откуда они берутся и что с ними делать
🟠 владеть инструментами анализа и визуализации
🟠 уметь рассказывать историю через данные
🟠 хотя бы в общих чертах понимать, как устроена data-инфраструктура в компании
Параллельно я решила подключить GPT и пошла двумя путями:
1️⃣ описала, что именно хочу изучать, и попросила собрать план
🔟 закинула ему программы разных курсов и попросила сделать из них roadmap
И внезапно первый вариант оказался ближе к тому, что мне нужно. Я убрала инструменты анализа (SQL, Python) и BI-план получился более сфокусированным именно на смысле профессии.
А инструменты визуализации я буду изучать отдельно.
Но, конечно, внутренний червячок сомнений никуда не делся:
🟠 а вдруг план не оптимальный?
🟠 а вдруг ребята из курсов знают лучше?
🟠 а вдруг я сейчас изобретаю велосипед?
Вот это, пожалуй, главный минус самостоятельного обучения:
ты всё время сомневаешься, туда ли идёшь.
Но я люблю эксперименты.
Буду набивать шишки, по ходу дела корректировать план и делиться с вами тем, что работает, а что нет.
💬 А вы когда-нибудь составляли себе программу обучения с нуля? Можете поделиться лайфхаками?
#аналитик_и_визуализация
Кажется, только вчера я клялась себе больше не брать одновременно два больших курса.
И вот я снова танцую на тех же самых граблях. Красиво. Уверенно. С огоньком 💃
Да, курс в Simulative я ещё не закончила. Формально там остались визуализация и математика со статистикой. Но, как я уже писала, в этом году я решила осознанно идти в BI-аналитику.
Не просто учиться рисовать красивые графики и дашборды (хотя это тоже надо),
а понимать, как через визуализацию решаются задачи бизнеса.
А для этого, внезапно, нужно чуть больше, чем знать, где в Power BI кнопочки.
В общем, я села составлять себе план обучения.
И тут выяснилось, что фраза «всё можно выучить самостоятельно» немного лукавая.
Потому что собрать себе адекватную программу — это вообще-то отдельный навык.
На YouTube я нашла ровно один вменяемый roadmap по BI.
Хорошо, что образовательные платформы давно уже сделали свои программы и там можно что-то подсмотреть.
Если сильно упростить, BI-аналитика у всех выглядит примерно так:
Параллельно я решила подключить GPT и пошла двумя путями:
И внезапно первый вариант оказался ближе к тому, что мне нужно. Я убрала инструменты анализа (SQL, Python) и BI-план получился более сфокусированным именно на смысле профессии.
А инструменты визуализации я буду изучать отдельно.
Но, конечно, внутренний червячок сомнений никуда не делся:
Вот это, пожалуй, главный минус самостоятельного обучения:
ты всё время сомневаешься, туда ли идёшь.
Но я люблю эксперименты.
Буду набивать шишки, по ходу дела корректировать план и делиться с вами тем, что работает, а что нет.
💬 А вы когда-нибудь составляли себе программу обучения с нуля? Можете поделиться лайфхаками?
#аналитик_и_визуализация
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤28🔥16👍7
🍸 Любите ли вы бары так, как люблю их я?
Если вы сейчас представили барную стойку, танцы и коктейли — притормозите😅
Сегодня хочу познакомить вас с Машей — автором канала «Пирожки и бары | про BI».
Маша — тимлид BI-аналитиков в Avito с 5+ годами опыта в аналитике.
А значит, человек, который точно знает, как делать не только красивые, но и полезные бизнесу дашборды.
Вы могли заметить, что в этом году я активно смотрю в сторону BI.
И если учиться, то только у тех, кто:
🟠 работает с реальными заказчиками,
🟠 живёт в требованиях, правках и «а можно ещё вот тут добавить»,
🟠 и при этом умеет объяснять сложное простым языком.
У Маши как раз такой контент.
Если вы уже строите дашборды или только собираетесь, очень советую начать с этих постов:
🟠 5 вопросов для сбора требований к дашборду
🟠 Чек-лист хорошего дашборда
Есть и моя любимая тема — курсы и обучение. Например:
🟠 Большая подборка ресурсов для изучения SQL для разных уровней
Но BI — это не только серьёзные лица и метрики.
У Маши есть отдельная рубрика #bi_вредные_советы, где можно и посмеяться, и узнать себя:
🟠 Как выбесить аналитика: вредные советы для заказчиков
🟠 Как выбесить заказчика: вредные советы для аналитиков
Если вам откликается BI, с реальными кейсами, юмором и пользой —
очень рекомендую заглянуть в «Пирожки и бары | про BI»!
💬 А как дела у вас с этим?
Вы больше по барам или по bar chart'ам?
Если вы сейчас представили барную стойку, танцы и коктейли — притормозите
Сегодня хочу познакомить вас с Машей — автором канала «Пирожки и бары | про BI».
Маша — тимлид BI-аналитиков в Avito с 5+ годами опыта в аналитике.
А значит, человек, который точно знает, как делать не только красивые, но и полезные бизнесу дашборды.
Вы могли заметить, что в этом году я активно смотрю в сторону BI.
И если учиться, то только у тех, кто:
У Маши как раз такой контент.
Если вы уже строите дашборды или только собираетесь, очень советую начать с этих постов:
Есть и моя любимая тема — курсы и обучение. Например:
Но BI — это не только серьёзные лица и метрики.
У Маши есть отдельная рубрика #bi_вредные_советы, где можно и посмеяться, и узнать себя:
Если вам откликается BI, с реальными кейсами, юмором и пользой —
очень рекомендую заглянуть в «Пирожки и бары | про BI»!
💬 А как дела у вас с этим?
Вы больше по барам или по bar chart'ам?
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤17🔥9👍6
🚀 Metabase как первая BI-система: проверяю на практике
В этом году я целенаправленно изучаю BI-аналитику.
А что такое BI-аналитика, если не работа с данными + их визуализация?
Этим постом я открываю серию про инструменты визуализации.
На каждый инструмент я закладываю примерно два месяца: изучить, применить и сделать выводы.
Чтобы не распыляться, все инструменты я буду разбирать через один сквозной проект:
e-commerce с поведенческими событиями пользователей.
Базовый датасет взят с Kaggle, но дальше мы с GPT будем обогащать его синтетическими данными под нужные бизнес-задачи. Хочу, чтобы проект был максимально приближен к реальности. Правда в этом вопросе полностью полагаюсь на GPT😅
Начинаем с Metabase.
Почему именно он?
Во-первых, в Simulative этот инструмент идёт третьим модулем, сразу после метрик и SQL. То есть уже после первой трети курса предполагается, что ты можешь работать аналитиком «на минималках».
Во-вторых, у Metabase низкий порог входа:
запросы можно писать на SQL, а можно собирать через визуальный конструктор. Фактически ты описываешь, что хочешь увидеть, и система это собирает. Это сильно снижает порог входа в BI-аналитику.
И, в-третьих, Metabase часто используют как первую BI-систему в компаниях, которые только встают на data-driven рельсы.
Про обучение.
GPT утверждает, что Metabase можно освоить за условные часы, даже если опыта с данными немного. Возможно, он слегка оптимист, но по сравнению с другими BI-инструментами Metabase действительно даёт быструю отдачу без долгого онбординга.
Плюс на YouTube полно туториалов: установка, настройка, первые дашборды.
С Metabase я планирую сделать два проекта:
🟠 Executive View — общее понимание, что происходит с бизнесом
🟠 Monitoring & Control — где процессы нестабильны и где находятся точки риска
Буду смотреть, насколько инструмент подходит для этих задач и где начинаются его ограничения.
Ну что, погнали?😊
💬 А вы использовали Metabase в работе или для обучения? Какие впечатления?
#аналитик_и_визуализация
В этом году я целенаправленно изучаю BI-аналитику.
А что такое BI-аналитика, если не работа с данными + их визуализация?
Этим постом я открываю серию про инструменты визуализации.
На каждый инструмент я закладываю примерно два месяца: изучить, применить и сделать выводы.
Чтобы не распыляться, все инструменты я буду разбирать через один сквозной проект:
e-commerce с поведенческими событиями пользователей.
Базовый датасет взят с Kaggle, но дальше мы с GPT будем обогащать его синтетическими данными под нужные бизнес-задачи. Хочу, чтобы проект был максимально приближен к реальности. Правда в этом вопросе полностью полагаюсь на GPT
Начинаем с Metabase.
Почему именно он?
Во-первых, в Simulative этот инструмент идёт третьим модулем, сразу после метрик и SQL. То есть уже после первой трети курса предполагается, что ты можешь работать аналитиком «на минималках».
Во-вторых, у Metabase низкий порог входа:
запросы можно писать на SQL, а можно собирать через визуальный конструктор. Фактически ты описываешь, что хочешь увидеть, и система это собирает. Это сильно снижает порог входа в BI-аналитику.
И, в-третьих, Metabase часто используют как первую BI-систему в компаниях, которые только встают на data-driven рельсы.
Про обучение.
GPT утверждает, что Metabase можно освоить за условные часы, даже если опыта с данными немного. Возможно, он слегка оптимист, но по сравнению с другими BI-инструментами Metabase действительно даёт быструю отдачу без долгого онбординга.
Плюс на YouTube полно туториалов: установка, настройка, первые дашборды.
С Metabase я планирую сделать два проекта:
Буду смотреть, насколько инструмент подходит для этих задач и где начинаются его ограничения.
Ну что, погнали?
💬 А вы использовали Metabase в работе или для обучения? Какие впечатления?
#аналитик_и_визуализация
Please open Telegram to view this post
VIEW IN TELEGRAM
1✍22🔥13👍10❤3
Мой конёк — горбунок. С характером и без тормозов!
Вообще-то сегодняшний пост должен был быть про инсайты после первого месяца изучения e-commerce.
Но есть нюанс: я до сих пор в лёгком шоке от того, что именно мы напланировали. Поэтому вместо инсайтов давайте сначала разберёмся с планом. А к выводам я вернусь во втором посте серии. Честно-честно 🤞
План по e-commerce я собирала вместе с ChatGPT (кажется, ему уже пора дать имя).
Сама я в домене ориентировалась очень примерно и решила не изобретать велосипед, а спросить у того, кто не устаёт и не паникует от объёма задач.
Вот что получилось.
Месяц 1. Скелет домена
KPI, воронка, базовая диагностика.
Цель — понять, как вообще работает e-commerce:
Месяц 2. Поведение и деньги
Когорты, retention, LTV, сегменты.
Фокус — научиться оценивать ценность пользователей, а не просто считать клики.
Месяц 3. Цены, промо и эксперименты
Здесь будем учиться оценивать эффект, а не просто красиво описывать прошлое.
Промо, A/B, гипотезы — всё по-взрослому.
Все три месяца я работаю с одним и тем же датасетом, который мы немного обогатим синтетическими данными.
Каждый месяц — отдельный проект, отражающий пройденный материал.
Датасет беру из библиотеки материалов Олимпиады DANO за прошлый год.
А ещё, так как значительную часть дня я провожу на прогулках с ребёнком, решила добавить формат «учёбы для ушей».
Нашла подкаст «Практика days» — интервью с предпринимателями и топ-менеджерами из e-commerce.
Почему он мне зашёл:
Не уверена, что это прям must-have для подготовки к собесам в конкретную компанию.
Но для формирования общего контекста — очень даже.
В общем, я продолжаю мучить себя бессонными ночами и наполеоновскими планами.
А вам пока задам вопрос:
💬 Когда вы готовитесь к собеседованию, вы смотрите только конкретную компанию или ещё и всю сферу целиком?
#аналитик_собирает_пазл
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤22🙈11🤗8👍3
Никогда такого не было — и вот опять!
Я снова побежала впереди паровоза.
Паровоз, разумеется, меня догнал. И аккуратно переехал 🚂
Помните мой первый факап с тестовым заданием? Там, где я торопилась и не проверила форматы данных.
После этого я пообещала себе:
всегда внимательно изучать данные перед анализом.
Я даже нашла отличный чек-лист и теперь честно по нему прохожусь: полнота, адекватность, форматы, NULL’ы — всё чётко.
Но, как выяснилось, проверить данные и познакомиться с данными — это вообще-то два разных действия.
Сейчас мы поговорим об очередном факапе: первом проекте по e-com'у.
Для проекта я взяла данные из заданий Олимпиады DANO 2025.
Выбрала датасет SM Lab: воронка онлайн-продаж (Спортмастер).
Файл здоровый — около 7 миллионов строк. В Excel такое, понятно, не покрутишь, поэтому сразу пошла в DBeaver.
Пишу своему верному другу GPT:
— Давай проверим данные по чек-листу.
Проверили. Всё красиво. Можно работать.
И вот тут я делаю ключевую ошибку: начинаю проект «по-взрослому».
Я говорю GPT:
— Делаем проект. С дашбордом. Executive-level. Чтобы ух!
GPT мгновенно входит в роль ментора:
— Отлично. Давай я тебе сейчас без суеты распишу весь план...
В план проекта входила визуализация, поэтому Metabase мы поставили через Docker. Кстати, это реально несложно, особенно если есть нормальная видео-инструкция.
И дальше мы начали считать метрики через questions, то есть через визуальный конструктор.
Я не сопротивлялась.
Во-первых, Metabase у меня всё равно в плане изучения.
Во-вторых, конструктор действительно снижает порог входа.
По ощущениям, для простых запросов конструктор — ок, а вот для вычисляемых столбцов и трендов — танцы с бубном!
Я думаю, что через SQL я бы сделала это быстрее.
В результате я сделала 4 карточки.
Четыре. Карточки. Карл.
Для executive-дашборда.
Которые показывают состояние воронки…
и при этом даже не в виде воронки!
И только в самом конце я вдруг задаю себе вопросы:
🟠 А что вообще происходит с данными?
🟠 Какая общая картина?
🟠 А на что ещё стоило посмотреть?
Спойлер: задавать эти вопросы надо было в самом начале, а не на четвёртый день.
Что получилось по факту
Проект:
🟠 не демонстрационный
🟠 дашборд — откровенно слабый
🟠 времени убито — 4 дня
Зато README от GPT — просто конфетка.
Там даже в разделе «Next steps» аккуратно написано всё то, что мы будем делать в следующий раз.
Я злюсь.
Потому что снова полезла делать «красиво», не разобравшись в сути.
Я даже толком не поняла, что такое executive dashboard, но полезла его строить. Самооценка уровня «Илон Маск, подвинься».
Но есть и хорошая новость.
Я снова на собственных шишках убедилась, как делать не надо.
А это, к сожалению, самый рабочий способ обучения.
Если хотите посмотреть на этот проект и поугарать — добро пожаловать на GitHub 👉 [ссылка на README].
Если есть идеи, замечания или рекомендации на будущее — буду рада.
Только давайте экологично! Что всё плохо и надо дальше учиться я и сама догадываюсь😎
💬 А у вас бывали моменты, когда вы понимали, что убили кучу времени на ерунду?
Как вы выходили из состояния «Халк крушить»?
#портфолио_аналитика
Я снова побежала впереди паровоза.
Паровоз, разумеется, меня догнал. И аккуратно переехал 🚂
Помните мой первый факап с тестовым заданием? Там, где я торопилась и не проверила форматы данных.
После этого я пообещала себе:
всегда внимательно изучать данные перед анализом.
Я даже нашла отличный чек-лист и теперь честно по нему прохожусь: полнота, адекватность, форматы, NULL’ы — всё чётко.
Но, как выяснилось, проверить данные и познакомиться с данными — это вообще-то два разных действия.
Сейчас мы поговорим об очередном факапе: первом проекте по e-com'у.
Для проекта я взяла данные из заданий Олимпиады DANO 2025.
Выбрала датасет SM Lab: воронка онлайн-продаж (Спортмастер).
Файл здоровый — около 7 миллионов строк. В Excel такое, понятно, не покрутишь, поэтому сразу пошла в DBeaver.
Пишу своему верному другу GPT:
— Давай проверим данные по чек-листу.
Проверили. Всё красиво. Можно работать.
И вот тут я делаю ключевую ошибку: начинаю проект «по-взрослому».
Я говорю GPT:
— Делаем проект. С дашбордом. Executive-level. Чтобы ух!
GPT мгновенно входит в роль ментора:
— Отлично. Давай я тебе сейчас без суеты распишу весь план...
В план проекта входила визуализация, поэтому Metabase мы поставили через Docker. Кстати, это реально несложно, особенно если есть нормальная видео-инструкция.
И дальше мы начали считать метрики через questions, то есть через визуальный конструктор.
Я не сопротивлялась.
Во-первых, Metabase у меня всё равно в плане изучения.
Во-вторых, конструктор действительно снижает порог входа.
По ощущениям, для простых запросов конструктор — ок, а вот для вычисляемых столбцов и трендов — танцы с бубном!
Я думаю, что через SQL я бы сделала это быстрее.
В результате я сделала 4 карточки.
Четыре. Карточки. Карл.
Для executive-дашборда.
Которые показывают состояние воронки…
и при этом даже не в виде воронки!
И только в самом конце я вдруг задаю себе вопросы:
Спойлер: задавать эти вопросы надо было в самом начале, а не на четвёртый день.
Что получилось по факту
Проект:
Зато README от GPT — просто конфетка.
Там даже в разделе «Next steps» аккуратно написано всё то, что мы будем делать в следующий раз.
Я злюсь.
Потому что снова полезла делать «красиво», не разобравшись в сути.
Я даже толком не поняла, что такое executive dashboard, но полезла его строить. Самооценка уровня «Илон Маск, подвинься».
Но есть и хорошая новость.
Я снова на собственных шишках убедилась, как делать не надо.
А это, к сожалению, самый рабочий способ обучения.
Если хотите посмотреть на этот проект и поугарать — добро пожаловать на GitHub 👉 [ссылка на README].
Если есть идеи, замечания или рекомендации на будущее — буду рада.
Только давайте экологично! Что всё плохо и надо дальше учиться я и сама догадываюсь
💬 А у вас бывали моменты, когда вы понимали, что убили кучу времени на ерунду?
Как вы выходили из состояния «Халк крушить»?
#портфолио_аналитика
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤22👍12🙈5🔥4
Metabase: визуализация данных (обзор курса)
Stepik | визуализация | платный
👉 [ссылка на курс]
Этот курс я купила ещё в прошлом году.
Причина банальная: мне казалось, что сама я с визуализацией в Metabase точно не разберусь.
Ну что поделать, если вера в себя иногда уходит в отпуск без предупреждения🥲
Как я уже писала раньше, Metabase часто используют как первую BI-систему в компаниях.
Порог входа низкий: SQL знать не обязательно, можно работать через конструктор.
Я, кстати, проверяла это на практике в своём первом e-commerce проекте.
Для кого этот курс
Курс рассчитан на абсолютных новичков.
SQL знать не нужно вообще.
Сначала:
работа с запросами в визуальном конструкторе
Потом:
SQL появляется, но код просто дают готовым (писать самому необязательно)
Все лекции в формате видео с демонстрацией интерфейса.
К каждому блоку есть короткие конспекты:
— зачем нужна визуализация
— когда её использовать
— примеры
Если у вас уже есть опыт в BI
Тут возможны два сценария:
— либо вы быстро освоите Metabase
— либо будете плеваться от его простоты и ограничений
Третьего не дано😅
Что внутри курса
Разбирают:
— установку Metabase (локально, на сервере, в VM)
— конструктор запросов
— SQL-режим
— коллекции
— дашборды
— модели и метрики
— все типы визуализаций
Есть бонусный блок с бизнес-кейсами на SQL.
Но визуализировать их в Metabase нельзя, поэтому для меня это выглядит как приятный, но немного лишний бонус.
Чего не хватило
Мне не хватило подробного разбора пользовательских выражений в режиме конструктора.
Автор честно отправляет в документацию, аргументируя это тем, что иначе курс раздуется до бесконечности. В целом — fair enough.
Итог
Курс очень практичный.
После него вы точно будете понимать:
— как устроен Metabase
— куда нажимать
— как собрать дашборд
Но если вам не нужно, чтобы вас вели за ручку, то:
— на YouTube полно туториалов
— при установке Metabase есть тестовая база, на которой можно спокойно тренироваться
Моя субъективная оценка (критерии тут)
Полезность: 3/5
Практика: 3/5
Подача: 4/5
Если вы только начинаете путь в BI — курс может быть хорошей точкой входа.
Если уже работали с визуализаций, даже в excel, то разберётесь и без него😉
💬 Как думаете, курсы по инструментам — must have или лишняя трата денег?
#курсес_ресурсес
Stepik | визуализация | платный
👉 [ссылка на курс]
Этот курс я купила ещё в прошлом году.
Причина банальная: мне казалось, что сама я с визуализацией в Metabase точно не разберусь.
Ну что поделать, если вера в себя иногда уходит в отпуск без предупреждения
Как я уже писала раньше, Metabase часто используют как первую BI-систему в компаниях.
Порог входа низкий: SQL знать не обязательно, можно работать через конструктор.
Я, кстати, проверяла это на практике в своём первом e-commerce проекте.
Для кого этот курс
Курс рассчитан на абсолютных новичков.
SQL знать не нужно вообще.
Сначала:
работа с запросами в визуальном конструкторе
Потом:
SQL появляется, но код просто дают готовым (писать самому необязательно)
Все лекции в формате видео с демонстрацией интерфейса.
К каждому блоку есть короткие конспекты:
— зачем нужна визуализация
— когда её использовать
— примеры
Если у вас уже есть опыт в BI
Тут возможны два сценария:
— либо вы быстро освоите Metabase
— либо будете плеваться от его простоты и ограничений
Третьего не дано
Что внутри курса
Разбирают:
— установку Metabase (локально, на сервере, в VM)
— конструктор запросов
— SQL-режим
— коллекции
— дашборды
— модели и метрики
— все типы визуализаций
Есть бонусный блок с бизнес-кейсами на SQL.
Но визуализировать их в Metabase нельзя, поэтому для меня это выглядит как приятный, но немного лишний бонус.
Чего не хватило
Мне не хватило подробного разбора пользовательских выражений в режиме конструктора.
Автор честно отправляет в документацию, аргументируя это тем, что иначе курс раздуется до бесконечности. В целом — fair enough.
Итог
Курс очень практичный.
После него вы точно будете понимать:
— как устроен Metabase
— куда нажимать
— как собрать дашборд
Но если вам не нужно, чтобы вас вели за ручку, то:
— на YouTube полно туториалов
— при установке Metabase есть тестовая база, на которой можно спокойно тренироваться
Моя субъективная оценка (критерии тут)
Полезность: 3/5
Практика: 3/5
Подача: 4/5
Если вы только начинаете путь в BI — курс может быть хорошей точкой входа.
Если уже работали с визуализаций, даже в excel, то разберётесь и без него
💬 Как думаете, курсы по инструментам — must have или лишняя трата денег?
#курсес_ресурсес
Please open Telegram to view this post
VIEW IN TELEGRAM
2✍7👍7🤪5⚡2❤2🔥2
Где мои данные, чувак?
Когда я только начала думать о проектах для портфолио, я упёрлась в очень простой вопрос:
а где вообще брать данные?
На курсах, конечно, датасеты дают. Но есть нюанс.
Если один и тот же датасет дают сотне студентов, то и проекты в портфолио у них потом выглядят… почти одинаково🤭
В какой-то момент я захотела разобраться:
— где брать данные
— как понять, подходят ли они для портфолио
— и как не сделать очередной «проект как у всех»
Так что этим постом я открываю новую рубрику — буду разбирать источники данных.
Начнём с самого очевидного и самого спорного.
Kaggle
Kaggle — это платформа с открытыми датасетами и соревнованиями по анализу данных и ML.
Данные туда загружают компании, исследователи и сами пользователи.
Там можно найти вообще всё:
— продажи, заказы, клиенты
— маркетинг и рекламу
— финансы, медицину, образование, ритейл
Плюс, у Kaggle есть свои курсы — от основ программирования до ML и computer vision.
Звучит идеально. Но, как всегда, есть «но».
В чём проблема с Kaggle
Большинство датасетов там:
— слишком чистые
— с минимумом пропусков и аномалий
— без реального бизнес-контекста
Оценка реалистичности данных в разных источниках колеблется от низкой до средне-высокой.
При этом Kaggle:
— отлично подходит для первых шагов
— хорош для знакомства с инструментами
— норм для самого первого проекта
Но если говорить про портфолио, тут и начинаются претензии:
— датасеты не уникальны
— проекты получаются «как у всех»
— легко скатиться в копипаст чужих решений
Как выжать из Kaggle максимум
Если уж брать данные оттуда, то стоит немного подшаманить и:
— придумать бизнес-контекст
— сформулировать вопросы от «заказчика»
— делать выводы и рекомендации, а не просто графики и код
Потому что без этого проект выглядит как учебное упражнение (learning project), а не как работа аналитика (showing project).
Ирония момента
Многие аналитики — от Simulative до западных YouTube-менторов — в один голос говорят:
«Kaggle — плохо, не используйте».
Но при этом:
— альтернатив почти не предлагают
— или предлагают… свои курсы😅
Так что Kaggle — это не зло.
Это просто инструмент, с которым нужно понимать ограничения.
💬 А вы как относитесь к Kaggle?
Пользуетесь им или «титаникоподобные» датасеты уже вызывают нервный тик?
#аналитик_ищет_данные
Когда я только начала думать о проектах для портфолио, я упёрлась в очень простой вопрос:
а где вообще брать данные?
На курсах, конечно, датасеты дают. Но есть нюанс.
Если один и тот же датасет дают сотне студентов, то и проекты в портфолио у них потом выглядят… почти одинаково
В какой-то момент я захотела разобраться:
— где брать данные
— как понять, подходят ли они для портфолио
— и как не сделать очередной «проект как у всех»
Так что этим постом я открываю новую рубрику — буду разбирать источники данных.
Начнём с самого очевидного и самого спорного.
Kaggle
Kaggle — это платформа с открытыми датасетами и соревнованиями по анализу данных и ML.
Данные туда загружают компании, исследователи и сами пользователи.
Там можно найти вообще всё:
— продажи, заказы, клиенты
— маркетинг и рекламу
— финансы, медицину, образование, ритейл
Плюс, у Kaggle есть свои курсы — от основ программирования до ML и computer vision.
Звучит идеально. Но, как всегда, есть «но».
В чём проблема с Kaggle
Большинство датасетов там:
— слишком чистые
— с минимумом пропусков и аномалий
— без реального бизнес-контекста
Оценка реалистичности данных в разных источниках колеблется от низкой до средне-высокой.
При этом Kaggle:
— отлично подходит для первых шагов
— хорош для знакомства с инструментами
— норм для самого первого проекта
Но если говорить про портфолио, тут и начинаются претензии:
— датасеты не уникальны
— проекты получаются «как у всех»
— легко скатиться в копипаст чужих решений
Как выжать из Kaggle максимум
Если уж брать данные оттуда, то стоит немного подшаманить и:
— придумать бизнес-контекст
— сформулировать вопросы от «заказчика»
— делать выводы и рекомендации, а не просто графики и код
Потому что без этого проект выглядит как учебное упражнение (learning project), а не как работа аналитика (showing project).
Ирония момента
Многие аналитики — от Simulative до западных YouTube-менторов — в один голос говорят:
«Kaggle — плохо, не используйте».
Но при этом:
— альтернатив почти не предлагают
— или предлагают… свои курсы
Так что Kaggle — это не зло.
Это просто инструмент, с которым нужно понимать ограничения.
💬 А вы как относитесь к Kaggle?
Пользуетесь им или «титаникоподобные» датасеты уже вызывают нервный тик?
#аналитик_ищет_данные
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥19❤11👍7👏5
🤖 Как не превратить дашборд в «Евротур» для мозга
Обычно такие посты начинаются с фразы
«я никогда ничего не выигрываю, но тут внезапно…»
Я тоже не собираюсь быть оригинальной.
И да, мне правда повезло — я весело провела время на канале «Руковожоп», где нужно было угадывать первые профессии людей по эмодзи, и выиграла книгу.
Причём книгу, которая максимально совпала с моим фокусом в аналитике в этом году.
Речь про «Данные: визуализируй, расскажи, используй».
До этой книги я жила с наивной установкой:
аналитик просто делает графики.
Оказалось — нет. Аналитик рассказывает истории с помощью графиков.
И прежде чем вообще думать о визуализации, нужно ответить себе на три вопроса:
• кто будет это смотреть и на каком уровне его понимание вопроса
• что этот человек должен понять или сделать после
• как выстроить информацию так, чтобы история попала в яблочко
И вот с вопросом «как» эта книга справляется на отлично.
Мы любим графики за простоту: один раз взглянул и понял смысл.
Но это работает только если график сделан с учётом когнитивной нагрузки.
Если нет — в голове у зрителя происходит примерно следующее: Error. Error.
(помните парижского мима из «Евротура»?).
В книге разбирается почти каждая возможная визуализация данных:
от текста и таблиц
до диаграмм / гистограмм и slopegraph’ов
Показано:
— какие визуальные приёмы помогают фокусировать внимание
— как убирать информационный мусор
— почему «красиво» ≠ «понятно»
— и как сделать так, чтобы визуализация не требовала устного перевода
Отдельный кайф — разборы примеров в формате
"что такое хорошо, и что такое плохо".
Если вы делали визуализации и никогда не задумывались,
насколько они дружелюбны к мозгу того, кто на них смотрит, то эту книгу стоит прочитать.
💬 А как дела у вас с «евротуром»? Думаете об удобстве того, кто будет воспринимать ваши аналитические выводы?
#книги_и_мысли
Обычно такие посты начинаются с фразы
«я никогда ничего не выигрываю, но тут внезапно…»
Я тоже не собираюсь быть оригинальной.
И да, мне правда повезло — я весело провела время на канале «Руковожоп», где нужно было угадывать первые профессии людей по эмодзи, и выиграла книгу.
Причём книгу, которая максимально совпала с моим фокусом в аналитике в этом году.
Речь про «Данные: визуализируй, расскажи, используй».
До этой книги я жила с наивной установкой:
аналитик просто делает графики.
Оказалось — нет. Аналитик рассказывает истории с помощью графиков.
И прежде чем вообще думать о визуализации, нужно ответить себе на три вопроса:
• кто будет это смотреть и на каком уровне его понимание вопроса
• что этот человек должен понять или сделать после
• как выстроить информацию так, чтобы история попала в яблочко
И вот с вопросом «как» эта книга справляется на отлично.
Мы любим графики за простоту: один раз взглянул и понял смысл.
Но это работает только если график сделан с учётом когнитивной нагрузки.
Если нет — в голове у зрителя происходит примерно следующее: Error. Error.
(помните парижского мима из «Евротура»?).
В книге разбирается почти каждая возможная визуализация данных:
от текста и таблиц
до диаграмм / гистограмм и slopegraph’ов
Показано:
— какие визуальные приёмы помогают фокусировать внимание
— как убирать информационный мусор
— почему «красиво» ≠ «понятно»
— и как сделать так, чтобы визуализация не требовала устного перевода
Отдельный кайф — разборы примеров в формате
"что такое хорошо, и что такое плохо".
Если вы делали визуализации и никогда не задумывались,
насколько они дружелюбны к мозгу того, кто на них смотрит, то эту книгу стоит прочитать.
💬 А как дела у вас с «евротуром»? Думаете об удобстве того, кто будет воспринимать ваши аналитические выводы?
#книги_и_мысли
1🔥16❤11✍5😁5
🎙 Что важно в BI-аналитике на практике, а не в курсах
Когда ты осваиваешь новую профессию в одиночку, ощущение примерно такое же, как у ёжика в тумане.
Да, сейчас можно открыть ChatGPT, нагенерить себе роадмап и бодро по нему пойти. Но всегда есть сомнения.
В такие моменты особенно ценен опыт человека, который уже работает в профессии, куда ты только целишься.
Поэтому сегодня я открываю рубрику с интервью и пригласила Алису Ручкину — автора канала «Датавиз в BI».
Алиса поделилась своим реальным BI-путём и ответила на вопросы, которые чаще всего волнуют начинающих BI-аналитиков.
___
1) Как ты пришла в BI и с чего начинался путь?
2) Какие навыки оказались реально важными в работе, а какие переоценены?
3) Какие BI-инструменты ты используешь сейчас? Что в них нравится, а что регулярно вызывает дергающийся глаз?
4) Как выглядит «хороший BI-аналитик» глазами бизнеса?
5) Что бы ты посоветовала человеку, который хочет войти в BI сейчас?
___
Алиса, большое спасибо, что поделилась своим опытом!
💬 А какой вопрос задали бы вы на моём месте?
#аналитик_берёт_интервью
Когда ты осваиваешь новую профессию в одиночку, ощущение примерно такое же, как у ёжика в тумане.
Да, сейчас можно открыть ChatGPT, нагенерить себе роадмап и бодро по нему пойти. Но всегда есть сомнения.
В такие моменты особенно ценен опыт человека, который уже работает в профессии, куда ты только целишься.
Поэтому сегодня я открываю рубрику с интервью и пригласила Алису Ручкину — автора канала «Датавиз в BI».
Алиса поделилась своим реальным BI-путём и ответила на вопросы, которые чаще всего волнуют начинающих BI-аналитиков.
___
1) Как ты пришла в BI и с чего начинался путь?
По основному образованию я инженер-железнодорожник и на 4-5 курсе дополнительно училась на экономиста. После универа я 7,5 лет работала менеджером по импорту и организовывала международные контейнерные перевозки.
2020 год стал для меня поворотным:🤩 из-за карантинных ограничений в мире сильно пострадала логистика, поэтому на работе сильно возрос уровень стресса.🤩 я попробовала работать удалённо и не захотела возвращаться в офис.🤩 я вышла замуж и поняла, что не хочу работать по вечерам и выходным, что в логистике просто невозможно, потому что это сфера с ненормированным графиком
Поэтому в сентябре 2020 года я пошла учиться на аналитика данных в «Яндекс-Практикум» (17-я когорта).
После защиты дипломного проекта весной 2021 года я устроилась аналитиком SQL в «НЛМК-ИТ». В том же году осенью я перешла в «ПИК-Индустрию» на позицию Junior BI-аналитика.
В апреле 2022 года я пришла в «Уралсиб» на позицию BI-аналитика в Службе управления данными. Это по сути центр компетенций по данным, поэтому помимо разработки дашбордов в FineBI я проводила вебинары и консультировала других разработчиков компании.
В 2023 году я перешла в компанию T2 (тогда Tele2) на похожую позицию в Дата-Офис, где и работаю по сей день.
2) Какие навыки оказались реально важными в работе, а какие переоценены?
Из хард-скиллов реально важным оказался SQL, поэтому в первый год работы я активно проходила разные SQL-тренажёры.
Из софт-скиллов считаю важным быть проактивным и идти до конца. Умение напоминать о себе и дожимать — очень важный скилл при удалённой работе.
По моему BI-опыту, переоценено знание Python. В некоторых компаниях он нужен, но лично мне до сих пор не пригодился.
3) Какие BI-инструменты ты используешь сейчас? Что в них нравится, а что регулярно вызывает дергающийся глаз?
Каждый день я использую FineBI.
Что мне нравится:🤩 его гибкость. В нём много аналитических функций и есть опция Custom Chart, которая позволяет создавать нестандартные визуализации без JS, HTML или CSS кода🤩 понятный интерфейс. Возможно, это субъективно, потому что с FineBI я работаю почти 4 года и к нему уже привыкла😁
Почему у меня дёргается глаз:🤩 новые версии могут сильно отличаться от предыдущих, поэтому какой-то функционал может перестать работать, требуется время на адаптацию и обновление инструкций🤩 есть небольшие бесячие нюансы (например, в графиках нельзя откатить изменения в создаваемых калькуляциях)
4) Как выглядит «хороший BI-аналитик» глазами бизнеса?
🤩 обозначает сроки, хотя бы приблизительно🤩 не перебивает, если заказчик начинает рассказывать что-то на бизнесовом. Может показаться, что он отдаляется от сути, да и в целом всё непонятно, но хороший BI-аналитик пытается выудить из этого что-то ценное для аналитики🤩 объясняет простыми словами, а не техническим языком, если что-то невозможно реализовать или просто не работает🤩 не ставит перед проблемой, а предлагает решение
5) Что бы ты посоветовала человеку, который хочет войти в BI сейчас?
🤩 лучше узнать, чем занимается BI-аналитик. Возможно, что эта работа вообще не понравится🤩 хорошенько потренировать SQL🤩 сделать портфолио или пет-проект, чтобы было что показать на собеседовании. Не уверена, что вы будете подробно рассказывать о своих работах, но само их наличие поможет выделиться на фоне других кандидатов.
___
Алиса, большое спасибо, что поделилась своим опытом!
💬 А какой вопрос задали бы вы на моём месте?
#аналитик_берёт_интервью
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥15❤8👍3✍2🤩2
📝 README как лицо проекта: фреймворк для портфолио аналитика
В прошлый раз мы разбирали подход Christine Jiang к проектам в портфолио и почему учебные кейсы чаще вредят, чем помогают.
Сегодня продолжим и посмотрим как именно она предлагает оформлять проект, а точнее README, чтобы его было не стыдно показать нанимающему менеджеру.
Спойлер: README — это не «описание файлов в репозитории».
Это ваш финальный аналитический артефакт.
Принципы, на которых Кристин настаивает
По её опыту, сильные аналитики всегда держат в голове три вещи:
🟠 ясность важнее сложности, функция важнее «красоты»
🟠 ответ на вопрос «и что?» должен быть понятен сразу
🟠 всегда думайте об уровнях детализации
Отсюда и рекомендации по GitHub:
🟠 один репозиторий = один проект
🟠 README = обложка проекта и итог всей аналитической работы
Структура README, которая работает
Кристин предлагает следующую логику документа.
1. Background / Overview
Контекст и цель проекта, написанные не от первого лица.
Без «мне было интересно...», «я решил попробовать...».
Текст должен выглядеть как внутренний аналитический документ компании.
2. Data Structure Overview
Описание структуры данных и домена.
Желательно добавить ERD (entityrelationship diagram), чтобы сразу было понятно, с чем вы работали.
3. Executive Summary
Короткое резюме для занятых стейкхолдеров.
Самое важное, без деталей, по существу.
4. Insights Deep Dive
Расшифровка ключевых выводов из executive summary.
3–4 абзаца с логикой, цифрами и пояснениями.
Здесь же уместен скрин high-level дашборда.
5. Recommendations
Рекомендации и следующие шаги.
Именно здесь вы отвечаете на главный вопрос:
зачем вообще проводился этот анализ и что бизнесу с этим делать.
А где код?
Код, SQL-запросы и технические детали — по ссылкам.
Если кому-то важно, он посмотрит.
Захламлять README техническими подробностями не нужно — это и есть разделение уровней детализации.
Хороший README — это документ, который можно показать стейкхолдеру.
У Кристин есть:
🟠 шаблон README, который можно взять за основу
🟠 разборы реальных портфолио, присланных подписчиками тут [ссылка] и тут [ссылка]
В целом, её канал — кладовая практичных советов без воды и мотивационных лозунгов.
💬 Как вам такой фреймворк?
Стал бы понятнее ваш проект, если оформить README именно так, или вы бы что-то поменяли?
#аналитик_слушает_советы
В прошлый раз мы разбирали подход Christine Jiang к проектам в портфолио и почему учебные кейсы чаще вредят, чем помогают.
Сегодня продолжим и посмотрим как именно она предлагает оформлять проект, а точнее README, чтобы его было не стыдно показать нанимающему менеджеру.
Спойлер: README — это не «описание файлов в репозитории».
Это ваш финальный аналитический артефакт.
Принципы, на которых Кристин настаивает
По её опыту, сильные аналитики всегда держат в голове три вещи:
Отсюда и рекомендации по GitHub:
Структура README, которая работает
Кристин предлагает следующую логику документа.
1. Background / Overview
Контекст и цель проекта, написанные не от первого лица.
Без «мне было интересно...», «я решил попробовать...».
Текст должен выглядеть как внутренний аналитический документ компании.
2. Data Structure Overview
Описание структуры данных и домена.
Желательно добавить ERD (entityrelationship diagram), чтобы сразу было понятно, с чем вы работали.
3. Executive Summary
Короткое резюме для занятых стейкхолдеров.
Самое важное, без деталей, по существу.
4. Insights Deep Dive
Расшифровка ключевых выводов из executive summary.
3–4 абзаца с логикой, цифрами и пояснениями.
Здесь же уместен скрин high-level дашборда.
5. Recommendations
Рекомендации и следующие шаги.
Именно здесь вы отвечаете на главный вопрос:
зачем вообще проводился этот анализ и что бизнесу с этим делать.
А где код?
Код, SQL-запросы и технические детали — по ссылкам.
Если кому-то важно, он посмотрит.
Захламлять README техническими подробностями не нужно — это и есть разделение уровней детализации.
Хороший README — это документ, который можно показать стейкхолдеру.
У Кристин есть:
В целом, её канал — кладовая практичных советов без воды и мотивационных лозунгов.
💬 Как вам такой фреймворк?
Стал бы понятнее ваш проект, если оформить README именно так, или вы бы что-то поменяли?
#аналитик_слушает_советы
Please open Telegram to view this post
VIEW IN TELEGRAM
✍16❤9🔥7
BI аналитик — это дизайнер от аналитики?
Когда я думала, чем заняться в последний год декрета и параллельно усилить себя как аналитика, я решила углубиться в BI-аналитику. В моей голове это выглядело так: BI — это про красивые графики, аккуратные дашборды и людей с хорошим вкусом. Ну, дизайнеры, только с данными🤭
Поэтому в плане обучения у меня сначала появились инструменты визуализации. Логично же!
А потом я начала копать глубже и задаваться простым вопросом: а кто вообще такие BI-аналитики и зачем они нужны бизнесу?
И тут картинка начала разваливаться.
Оказалось, что BI-аналитик — это не «рисовальщик дашбордов», а человек, который помогает бизнесу принимать решения. Через отчёты, метрики и интерактивные визуализации, но всё же про решения, а не про красоту.
Ключевая задача BI-аналитика — понять цель заказчика:
что именно он хочет видеть, какие решения собирается принимать и в каком формате ему нужна информация. А дальше уже начинается работа с данными, логикой и визуализацией.
Лучше всего разницу между ролями показывает их сравнение.
Data-аналитик сфокусирован на данных.
Его основная цель — объяснить прошлое и ответить на вопросы: «что произошло?» и «почему так вышло?»
Он криминалист / детектив: изучает улики (данные), ищет причины и мотивы событий, которые уже произошли.
BI-аналитик сфокусирован на бизнесе.
Его цель — мониторить настоящее и держать руку на пульсе, отвечая на вопросы: «как у нас дела прямо сейчас?» и «где нужно вмешаться?».
Отличную аналогию привела LLM'ка: инженер-проектировщик информационных табло. Создаёт и поддерживает большие информационные дисплеи на вокзале (дашборды), куда стекаются данные о всех поездах (метриках), чтобы диспетчеры (менеджеры) видели ситуацию в реальном времени.
Product-аналитик сфокусирован на продукте и будущем.
Его главный вопрос: «как сделать продукт лучше?».
Это про эксперименты, гипотезы и влияние на развитие продукта.
Это своего рода учёный, как Док Браун («Назад в будущее»)🤭
Если совсем коротко:
Data — объясняет прошлое
BI — поддерживает принятие решений
Product — влияет на будущее продукта
Это не уровни «сложности» аналитиков (мы же не в компьютерные игры играем), а разные зоны ответственности.
Нагляднее всего разницу видно, когда все три аналитика смотрят на одну и ту же бизнес-ситуацию. Вот тут примеры [ссылка на github], если хотите посмотреть.
💬 А у вас, в вашей области деятельности, были моменты «узнал в только что лет»?
#аналитик_и_визуализация
Когда я думала, чем заняться в последний год декрета и параллельно усилить себя как аналитика, я решила углубиться в BI-аналитику. В моей голове это выглядело так: BI — это про красивые графики, аккуратные дашборды и людей с хорошим вкусом. Ну, дизайнеры, только с данными
Поэтому в плане обучения у меня сначала появились инструменты визуализации. Логично же!
А потом я начала копать глубже и задаваться простым вопросом: а кто вообще такие BI-аналитики и зачем они нужны бизнесу?
И тут картинка начала разваливаться.
Оказалось, что BI-аналитик — это не «рисовальщик дашбордов», а человек, который помогает бизнесу принимать решения. Через отчёты, метрики и интерактивные визуализации, но всё же про решения, а не про красоту.
Ключевая задача BI-аналитика — понять цель заказчика:
что именно он хочет видеть, какие решения собирается принимать и в каком формате ему нужна информация. А дальше уже начинается работа с данными, логикой и визуализацией.
Лучше всего разницу между ролями показывает их сравнение.
Data-аналитик сфокусирован на данных.
Его основная цель — объяснить прошлое и ответить на вопросы: «что произошло?» и «почему так вышло?»
Он криминалист / детектив: изучает улики (данные), ищет причины и мотивы событий, которые уже произошли.
BI-аналитик сфокусирован на бизнесе.
Его цель — мониторить настоящее и держать руку на пульсе, отвечая на вопросы: «как у нас дела прямо сейчас?» и «где нужно вмешаться?».
Отличную аналогию привела LLM'ка: инженер-проектировщик информационных табло. Создаёт и поддерживает большие информационные дисплеи на вокзале (дашборды), куда стекаются данные о всех поездах (метриках), чтобы диспетчеры (менеджеры) видели ситуацию в реальном времени.
Product-аналитик сфокусирован на продукте и будущем.
Его главный вопрос: «как сделать продукт лучше?».
Это про эксперименты, гипотезы и влияние на развитие продукта.
Это своего рода учёный, как Док Браун («Назад в будущее»)
Если совсем коротко:
Data — объясняет прошлое
BI — поддерживает принятие решений
Product — влияет на будущее продукта
Это не уровни «сложности» аналитиков (мы же не в компьютерные игры играем), а разные зоны ответственности.
Нагляднее всего разницу видно, когда все три аналитика смотрят на одну и ту же бизнес-ситуацию. Вот тут примеры [ссылка на github], если хотите посмотреть.
#аналитик_и_визуализация
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍20❤11🙊4
Я танцую на граблях и Metabase тут не при чём
Каждый раз, вступая вговно партию, я клятвенно себе обещаю, что «это было в первый и последний раз». Но на практике это не так.
В первом посте про Metabase я радостно сообщила, что беру крутой датасет с Kaggle, который мне подобрал ChatGPT. Всё по ТЗ, всё как просила.
Только я забыла учесть одну мелочь — производительность моего старенького Honor. Он не смог открыть даже один файл. А их было семь.
Пошла к Perplexity искать замену, раз ChatGPT не умеет думать за меня. В итоге выбрали Ecommerce Order & Supply Chain Dataset. Данные по поставкам — привет, мой бэкграунд закупщика.
Наученная прошлым факапом, я решила «в этот раз всё проверить как надо».
Проверила. Так проверила, что разобрала до костей одну таблицу… и не успела посмотреть остальные четыре. Про визуализацию вообще молчу!
Если вам кажется, что я всё успеваю — вам просто кажется. Я не успеваю ничего.
Ну, а теперь к Metabase.
Полностью самостоятельным изучением это не назовёшь: был модуль в Simulative, был курс. Но инструмент правда простой.
Пробовала и SQL, и Question (конструктор без кода).
SQL — понятно и гибко.
Question — вроде должен упрощать жизнь, но сложные штуки собираются со скрипом. И сводные таблицы только через него.
Графиков немного, но базовые все на месте.
Бесил один момент: нельзя убрать вспомогательные линии, не снеся всю ось. Моё чувство прекрасного сильно страдало (покажу в комментах).
Про «Metabase плохо работает с большими объёмами» — не проверила. Я загрузила уже предобработанные данные, чисто под визуализацию.
Итог: хороший инструмент для старта.
Простой, понятный.
Но дальше будет интереснее, когда сравню его с другими BI-системами.
Кстати, есть отличная статья от LeftJoin с реальными кейсами, где простота Metabase сыграла против него.
💬 У вас тоже бывают проекты, которые «почти гениальны», но в итоге вы застревает «на пороге»?
#аналитик_и_визуализация
Каждый раз, вступая в
В первом посте про Metabase я радостно сообщила, что беру крутой датасет с Kaggle, который мне подобрал ChatGPT. Всё по ТЗ, всё как просила.
Только я забыла учесть одну мелочь — производительность моего старенького Honor. Он не смог открыть даже один файл. А их было семь.
Пошла к Perplexity искать замену, раз ChatGPT не умеет думать за меня. В итоге выбрали Ecommerce Order & Supply Chain Dataset. Данные по поставкам — привет, мой бэкграунд закупщика.
Наученная прошлым факапом, я решила «в этот раз всё проверить как надо».
Проверила. Так проверила, что разобрала до костей одну таблицу… и не успела посмотреть остальные четыре. Про визуализацию вообще молчу!
Если вам кажется, что я всё успеваю — вам просто кажется. Я не успеваю ничего.
Ну, а теперь к Metabase.
Полностью самостоятельным изучением это не назовёшь: был модуль в Simulative, был курс. Но инструмент правда простой.
Пробовала и SQL, и Question (конструктор без кода).
SQL — понятно и гибко.
Question — вроде должен упрощать жизнь, но сложные штуки собираются со скрипом. И сводные таблицы только через него.
Графиков немного, но базовые все на месте.
Бесил один момент: нельзя убрать вспомогательные линии, не снеся всю ось. Моё чувство прекрасного сильно страдало (покажу в комментах).
Про «Metabase плохо работает с большими объёмами» — не проверила. Я загрузила уже предобработанные данные, чисто под визуализацию.
Итог: хороший инструмент для старта.
Простой, понятный.
Но дальше будет интереснее, когда сравню его с другими BI-системами.
Кстати, есть отличная статья от LeftJoin с реальными кейсами, где простота Metabase сыграла против него.
💬 У вас тоже бывают проекты, которые «почти гениальны», но в итоге вы застревает «на пороге»?
#аналитик_и_визуализация
😁9❤8🔥5
Не по Сеньке шапка!
Ребята, простите, я вас подвела!
Сегодня должен был выйти очередной пост про e-com домен, который я собиралась тщательно изучать. И в котором, по факту, я вообще не продвинулась.
Я поняла, что взяла на себя слишком большую нагрузку, которую реально в нынешнем состоянии не готова вывезти. Оказалось, что изучать BI-аналитику в придачу к изучению доменов — это немного «дофига» для тех 2–3 свободных часов в день, которые я могу чему-то посвятить.
К тому же у меня самой пока не сформировалось понимание того, как изучать эти домены. И я просто не могу придумать себе расписание, чтобы успеть всё и сразу.
При этом я не готова отказаться от того блестящего плана, который себе наметила. Но первый блин оказался комом, огромным комом, которым меня и придавило.
Мне нужно немного времени для передышки и совершения манёвра. В такие моменты грандиозных факапов мне всегда хочется начать с чистого листа, но стоит учесть ошибки прошлого, чтобы не наступить на одни и те же грабли. А, видит бог, я нахожу особое наслаждение в танцах на граблях.
Я всё равно буду разбирать эти чёртовы домены, и BI-аналитика с инструментами визуализации от меня точно никуда не денется. Но я пересмотрю то количество проектов для портфолио, которое хотела сделать, и немного умерю свой пыл в изучении курсов. И, я надеюсь, такие посты нытья больше не повторятся!
Признание своего поражения далось мне не очень легко. И мне хотелось бы сказать, что я живу этой цитатой из «Рокки Бальбоа»:
Но иногда нужно признаться, что раунд проигран...
💬 А у вас как дела?
#аналитик_тоже_человек
Ребята, простите, я вас подвела!
Сегодня должен был выйти очередной пост про e-com домен, который я собиралась тщательно изучать. И в котором, по факту, я вообще не продвинулась.
Я поняла, что взяла на себя слишком большую нагрузку, которую реально в нынешнем состоянии не готова вывезти. Оказалось, что изучать BI-аналитику в придачу к изучению доменов — это немного «дофига» для тех 2–3 свободных часов в день, которые я могу чему-то посвятить.
К тому же у меня самой пока не сформировалось понимание того, как изучать эти домены. И я просто не могу придумать себе расписание, чтобы успеть всё и сразу.
При этом я не готова отказаться от того блестящего плана, который себе наметила. Но первый блин оказался комом, огромным комом, которым меня и придавило.
Мне нужно немного времени для передышки и совершения манёвра. В такие моменты грандиозных факапов мне всегда хочется начать с чистого листа, но стоит учесть ошибки прошлого, чтобы не наступить на одни и те же грабли. А, видит бог, я нахожу особое наслаждение в танцах на граблях.
Я всё равно буду разбирать эти чёртовы домены, и BI-аналитика с инструментами визуализации от меня точно никуда не денется. Но я пересмотрю то количество проектов для портфолио, которое хотела сделать, и немного умерю свой пыл в изучении курсов. И, я надеюсь, такие посты нытья больше не повторятся!
Признание своего поражения далось мне не очень легко. И мне хотелось бы сказать, что я живу этой цитатой из «Рокки Бальбоа»:
Борьба не окончена, пока не прозвенел гонг, а гонг ещё не прозвенел
Но иногда нужно признаться, что раунд проигран...
💬 А у вас как дела?
#аналитик_тоже_человек
3❤30👍13🕊11🤝3🙏1
Не доходит через голову, дойдет через ноги руки
Мне кажется, моя учительница по математике именно так и говорила. И знаете, она оказалась права.
Я уже не первый раз наступаю на одни и те же грабли: начинаю анализ с метрик, а не со знакомства с данными. Ведь прежде чем поцеловать парня, надо хотя бы его имя спросить! Хотя…😅
В этот раз я решила действовать радикально.
Если теория не закрепляется — значит будет практика!
Янаказала «наградила» себя челленджем:
10 guided projects, а потом ещё 10 полностью самостоятельных. Почему это хорошая связка я писала тут.
Что такое guided project?
Это когда ты повторяешь за кем-то более опытным. Например, за «экспертом» на YouTube.
Знаете, есть когнитивное искажение — «эффект авторитета».
Мы склонны верить человеку просто потому, что он звучит уверенно и имеет какой-то статус.
Я наткнулась на серию видео турецкого дата саентиста по EDA (exploratory data analysis) в pandas на книжном датасете с Kaggle.
Целая серия из 10 видео. Думаю: «ну всё, ща как научусь!»
Идёт третья минута анализа.
Он видит минимальный год выпуска книги «минус 590».
И… просто удаляет строку.
Хм... Ну, как бы, ладно...
Четвёртая минута анализа.
21 пропущенное значение в колонке «Название».
Что делает эксперт? Правильно, просто удаляет строки.
Не проверяет, не смотрит соседние колонки, не оценивает долю пропусков. Просто удаляет...
Я сижу, брови ползут вверх, думаю: «это, конечно, супер странно, но он же дата саентист, он же знает что делает, да?»
Осознание,что этонеправильные пчелы неправильный эксперт у меня пришло тогда, когда он не смог написать функцию, потому что всё время не угадывал с названием колонки. А знаете почему? Потому что названия колонок никто не проверял перед тем, как приступить к работе, а там пробелов тьма тьмущая…
В общем, я решила, что это не тот человек, у которого я хочу учиться. А ведь он ещё и курсы свои продаёт…
Я не ищу идеального инструктора.
Я просто набиваю руку.
Интенсивная практика по EDA реально начинает работать как буткэмп.
Да, из-за этого в e-com у меня будет не три проекта, а два, если повезёт.
Но лучше меньше, да лучше!
И главное — больше никаких «он эксперт, ему виднее».
А с датасетом попробуйте поработать, он хорошо под EDA подходит.
💬 Как вы проверяете экспертность человека?
#портфолио_аналитика
Мне кажется, моя учительница по математике именно так и говорила. И знаете, она оказалась права.
Я уже не первый раз наступаю на одни и те же грабли: начинаю анализ с метрик, а не со знакомства с данными. Ведь прежде чем поцеловать парня, надо хотя бы его имя спросить! Хотя…
В этот раз я решила действовать радикально.
Если теория не закрепляется — значит будет практика!
Я
10 guided projects, а потом ещё 10 полностью самостоятельных. Почему это хорошая связка я писала тут.
Что такое guided project?
Это когда ты повторяешь за кем-то более опытным. Например, за «экспертом» на YouTube.
Знаете, есть когнитивное искажение — «эффект авторитета».
Мы склонны верить человеку просто потому, что он звучит уверенно и имеет какой-то статус.
Я наткнулась на серию видео турецкого дата саентиста по EDA (exploratory data analysis) в pandas на книжном датасете с Kaggle.
Целая серия из 10 видео. Думаю: «ну всё, ща как научусь!»
Идёт третья минута анализа.
Он видит минимальный год выпуска книги «минус 590».
И… просто удаляет строку.
Хм... Ну, как бы, ладно...
Четвёртая минута анализа.
21 пропущенное значение в колонке «Название».
Что делает эксперт? Правильно, просто удаляет строки.
Не проверяет, не смотрит соседние колонки, не оценивает долю пропусков. Просто удаляет...
Я сижу, брови ползут вверх, думаю: «это, конечно, супер странно, но он же дата саентист, он же знает что делает, да?»
Осознание,что это
В общем, я решила, что это не тот человек, у которого я хочу учиться. А ведь он ещё и курсы свои продаёт…
Я не ищу идеального инструктора.
Я просто набиваю руку.
Интенсивная практика по EDA реально начинает работать как буткэмп.
Да, из-за этого в e-com у меня будет не три проекта, а два, если повезёт.
Но лучше меньше, да лучше!
И главное — больше никаких «он эксперт, ему виднее».
А с датасетом попробуйте поработать, он хорошо под EDA подходит.
💬 Как вы проверяете экспертность человека?
#портфолио_аналитика
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍18😁10👨💻6😱2
Pandas для анализа данных (обзор курса)
Stepik | аналитика | платный
[ссылка на курс]
Продолжаем расчищать авгиевы конюшни купленных впрок курсов. Сегодня на очереди третий пройденный мною курс по Pandas. Я устроила себе буткэмп по EDA, и мне показалось логичным пройти дополнительный курс и получить корочку. Как говорится, без бумажки — ты букашка!
Первый пройденный курс мне не очень понравился, второй, наоборот, очень понравился, но он короткий. А вот этот вызывает у меня смешанные чувства, и я расскажу почему.
Для кого этот курс
Этот курс рассчитан примерно на 35 часов прохождения. За это время можно выучить многое.
Но абсолютным новичкам он вряд ли подойдёт. Попадаются задачи, где потребуются навыки в Python. Мне немного не хватило знаний, пришлось прибегать к помощи чат-бота😅
Что внутри курса
Курс состоит из видеолекций. В каждом уроке присутствует достаточное количество задач на отработку теории. Часто приходится вспоминать пройденный материал.
В этом курсе нет конспектов, поэтому приходилось создавать их самой. С одной стороны, это здорово. Говорят, что составление конспектов положительно влияет на запоминание информации.
С другой стороны, записи получаются немного хаотичными. Наверное, было бы лучше сначала полностью посмотреть весь урок, понять его структуру, а потом уже делать конспект.
Чего не хватило
Первое, чего мне не хватило, — это представленных в виде конспекта (или комментария) датафреймов или серий, которые разбираются на уроке в видео.
Позиция автора такова: в реальном мире вам никто ничего не будет предоставлять, поэтому сами делайте себе конспекты, сами создавайте датафреймы для практикии вообще пошли вы к чёрту!
В общем, я поняла, как набегают 35 часов практики — переписывание датафреймов с экрана довольно ресурсозатратное занятие.
Второе — мне не понравилось, как автор отвечает на комментарии. С одной стороны, спасибо, что он вообще присутствует на курсе.
Но ответы в духе «Где у меня такое сказано?» и «Мне в голову не приходит хороший пример, чтобы было понятно, в чём суть функции concat и когда её стоит применять» не добавляют ему очков.
Есть задачи, где не совсем понятно, в каком виде нужно предоставить вывод или какую функцию использовать. Приходится играть в угадайку: «А что хотел сказать автор?»🤨
Итог
Я впервые оказалась в ситуации, когда подошла к курсу, уже имея практический опыт работы. С одной стороны, я понимаю, как то, что рассказывает автор, применяется в жизни, потому что уже сделала несколько guided projects по EDA. С другой стороны, часть курса показалась мне пока чисто теоретической.
Стала бы я рекомендовать этот курс? Честно, не знаю. Задач на отработку много, но манера общения автора меня останавливает.
На YouTube-канале автора курса, где выложены лекции курса, можно найти промокод на скидку, если вам будет интересно.
Моя субъективная оценка (критерии тут)
Полезность: 4/5
Практика: 4/5
Подача: 3/5
А теперь у меня к вам пара вопросов:
💬 Хватит ли знаний, полученных при выполнении проекта «под диктовку», для реальной работы или обязательно нужно пройти целый курс?
💬 Стали бы вы до конца проходить курс, если вам не нравится манера общения автора? При этом, к самому материалу претензий практически нет.
#курсес_ресурсес
Stepik | аналитика | платный
[ссылка на курс]
Продолжаем расчищать авгиевы конюшни купленных впрок курсов. Сегодня на очереди третий пройденный мною курс по Pandas. Я устроила себе буткэмп по EDA, и мне показалось логичным пройти дополнительный курс и получить корочку. Как говорится, без бумажки — ты букашка!
Первый пройденный курс мне не очень понравился, второй, наоборот, очень понравился, но он короткий. А вот этот вызывает у меня смешанные чувства, и я расскажу почему.
Для кого этот курс
Этот курс рассчитан примерно на 35 часов прохождения. За это время можно выучить многое.
Но абсолютным новичкам он вряд ли подойдёт. Попадаются задачи, где потребуются навыки в Python. Мне немного не хватило знаний, пришлось прибегать к помощи чат-бота
Что внутри курса
Курс состоит из видеолекций. В каждом уроке присутствует достаточное количество задач на отработку теории. Часто приходится вспоминать пройденный материал.
В этом курсе нет конспектов, поэтому приходилось создавать их самой. С одной стороны, это здорово. Говорят, что составление конспектов положительно влияет на запоминание информации.
С другой стороны, записи получаются немного хаотичными. Наверное, было бы лучше сначала полностью посмотреть весь урок, понять его структуру, а потом уже делать конспект.
Чего не хватило
Первое, чего мне не хватило, — это представленных в виде конспекта (или комментария) датафреймов или серий, которые разбираются на уроке в видео.
Позиция автора такова: в реальном мире вам никто ничего не будет предоставлять, поэтому сами делайте себе конспекты, сами создавайте датафреймы для практики
В общем, я поняла, как набегают 35 часов практики — переписывание датафреймов с экрана довольно ресурсозатратное занятие.
Второе — мне не понравилось, как автор отвечает на комментарии. С одной стороны, спасибо, что он вообще присутствует на курсе.
Но ответы в духе «Где у меня такое сказано?» и «Мне в голову не приходит хороший пример, чтобы было понятно, в чём суть функции concat и когда её стоит применять» не добавляют ему очков.
Есть задачи, где не совсем понятно, в каком виде нужно предоставить вывод или какую функцию использовать. Приходится играть в угадайку: «А что хотел сказать автор?»
Итог
Я впервые оказалась в ситуации, когда подошла к курсу, уже имея практический опыт работы. С одной стороны, я понимаю, как то, что рассказывает автор, применяется в жизни, потому что уже сделала несколько guided projects по EDA. С другой стороны, часть курса показалась мне пока чисто теоретической.
Стала бы я рекомендовать этот курс? Честно, не знаю. Задач на отработку много, но манера общения автора меня останавливает.
На YouTube-канале автора курса, где выложены лекции курса, можно найти промокод на скидку, если вам будет интересно.
Моя субъективная оценка (критерии тут)
Полезность: 4/5
Практика: 4/5
Подача: 3/5
А теперь у меня к вам пара вопросов:
💬 Хватит ли знаний, полученных при выполнении проекта «под диктовку», для реальной работы или обязательно нужно пройти целый курс?
💬 Стали бы вы до конца проходить курс, если вам не нравится манера общения автора? При этом, к самому материалу претензий практически нет.
#курсес_ресурсес
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤15✍9👍7
Hogwarts для аналитика данных?
Продолжаем разбирать источники, где можно получить датасеты без регистрации и смс. Сегодня посмотрим на один из наименее рекомендуемых — UCI Repository
UCI Machine Learning Repository — это крупная коллекция датасетов для обучения и исследования алгоритмов машинного обучения, поддерживаемая Университетом Калифорнии в Ирвайне.
У этого источника есть несомненные плюсы:
— большая коллекция классических датасетов (самым первым идёт Iris Dataset);
— представлены разнообразные домены: медицина, биология, социология, физика и др.
Но количество минусов, на мой взгляд, перевешивает (с точки зрения аналитика данных):
— это не «боевые данные»: многие датасеты маленькие (сотни — тысячи строк) и не похожи на реальные;
— данные уже «вылизаны» и подготовлены для загрузки в модели;
— часть датасетов очень старая (90-е / 2000-е годы) и не соответствует современным реалиям.
Хотя из таких датасетов можно слепить что-то пригодное для тренировки, если добавить в них шум, пропуски, лаги по загрузке и другой мусор, на который только способна ваша фантазия.
И это идеальная задача для любимых чат-ботов:
— выбираем домен, в котором хотим практиковаться;
— уточняем у ИИ, какие обычно бывают проблемы с данными в этом домене / области;
— просим ИИ составить план «ухудшения» данных — и вперёд, к генерации.
Но есть одна загвоздка: при малой насмотренности можно сгенерировать ерунду вместе с ИИшкой.
Я бы на данном этапе просто игнорировала этот источник данных. Мне кажется, он не для новичков, особенно если вы хотите «реальные данные» пощупать. Этот репозиторий больше подходит для академических задач. Поэтому предлагаю оставить его ML-щикам.
💬 Колитесь, кто работал с датасетами «Ирис» или «Титаник»?
#аналитик_ищет_данные
Продолжаем разбирать источники, где можно получить датасеты без регистрации и смс. Сегодня посмотрим на один из наименее рекомендуемых — UCI Repository
UCI Machine Learning Repository — это крупная коллекция датасетов для обучения и исследования алгоритмов машинного обучения, поддерживаемая Университетом Калифорнии в Ирвайне.
У этого источника есть несомненные плюсы:
— большая коллекция классических датасетов (самым первым идёт Iris Dataset);
— представлены разнообразные домены: медицина, биология, социология, физика и др.
Но количество минусов, на мой взгляд, перевешивает (с точки зрения аналитика данных):
— это не «боевые данные»: многие датасеты маленькие (сотни — тысячи строк) и не похожи на реальные;
— данные уже «вылизаны» и подготовлены для загрузки в модели;
— часть датасетов очень старая (90-е / 2000-е годы) и не соответствует современным реалиям.
Хотя из таких датасетов можно слепить что-то пригодное для тренировки, если добавить в них шум, пропуски, лаги по загрузке и другой мусор, на который только способна ваша фантазия.
И это идеальная задача для любимых чат-ботов:
— выбираем домен, в котором хотим практиковаться;
— уточняем у ИИ, какие обычно бывают проблемы с данными в этом домене / области;
— просим ИИ составить план «ухудшения» данных — и вперёд, к генерации.
Но есть одна загвоздка: при малой насмотренности можно сгенерировать ерунду вместе с ИИшкой.
Я бы на данном этапе просто игнорировала этот источник данных. Мне кажется, он не для новичков, особенно если вы хотите «реальные данные» пощупать. Этот репозиторий больше подходит для академических задач. Поэтому предлагаю оставить его ML-щикам.
💬 Колитесь, кто работал с датасетами «Ирис» или «Титаник»?
#аналитик_ищет_данные
👍10✍6🤓4
Успешная карьера или счастливая жизнь? А можно оба варианта?
По неведомой мне причине у меня в голове всегда была установка: либо успешная карьера, либо свободная жизнь и путешествия. Третьего не дано!
Я не представляла, что можно по-другому. А моя знакомая Лена, продакт в Авито, на своём примере показывает, что не только можно, но и нужно совмещать работу и жизнь.
Последние четыре года она работает в крупных зарубежных и российских компаниях на удалёнке. Она, как никто другой, умеет совмещать работу и путешествия: проводила зумы на фоне египетских пирамид и даже с острова Пасхи.
В этом году мне возвращаться в офис, а так хотелось бы работать удалённо. Неужели удалёнке конец?
У Лены есть классные посты со списками компаний, которые нанимают профессионалов, а не «охранников клавиатуры»:
топ-10 российских и зарубежных компаний
А если вы думаете пожить за границей, у неё есть отличный пост«кому на Руси жить хорошо» «Где работать на удалёнке?»
Заглядывайте в канал, пока он не стал мейнстримным!😎
💬 Проведём перекличку: вы в офисе трудитесь или на гибриде? В чистую удалёнку я уже не верю🤭
По неведомой мне причине у меня в голове всегда была установка: либо успешная карьера, либо свободная жизнь и путешествия. Третьего не дано!
Я не представляла, что можно по-другому. А моя знакомая Лена, продакт в Авито, на своём примере показывает, что не только можно, но и нужно совмещать работу и жизнь.
Последние четыре года она работает в крупных зарубежных и российских компаниях на удалёнке. Она, как никто другой, умеет совмещать работу и путешествия: проводила зумы на фоне египетских пирамид и даже с острова Пасхи.
В этом году мне возвращаться в офис, а так хотелось бы работать удалённо. Неужели удалёнке конец?
У Лены есть классные посты со списками компаний, которые нанимают профессионалов, а не «охранников клавиатуры»:
топ-10 российских и зарубежных компаний
А если вы думаете пожить за границей, у неё есть отличный пост
Заглядывайте в канал, пока он не стал мейнстримным!
💬 Проведём перекличку: вы в офисе трудитесь или на гибриде? В чистую удалёнку я уже не верю
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍8✍5
Три в ряд или морковка на ферме?
В комментариях ко вчерашнему посту мы поднимали тему о том, что в офис не хочется ездить, потому что дорога занимает чертову уйму времени, которое очень сложно потратить продуктивно.
Вы когда-нибудь обращали внимание на то, что люди смотрят, уткнувшись в свои телефоны в транспорте? Мне бы хотелось сказать, что они там книги читают, не возить же с собой «кирпичи». И именно это «повсеместно люди читают» было одним из сильных впечатлений от Москвы, когда я в первый раз сюда приехала в командировку. Правда было это лет десять назад🤭
Но сейчас я замечаю, что многие люди сидят в играх. И, на мой взгляд, самая популярная игра это «три-в-ряд». Да будь я проклята, если скажу, что сама не залипаю в ней! Правда у меня одно условие - такое нельзя ставить на телефон, поэтому я за компьютером мужа балуюсь, когда он уходит на тренировку.
Ведь так здорово просто бездумно потыкать эти шарики, да получить легкий дофамин. И знаете кто виноват в моей зависимости? Аналитики! Игровые аналитики!
В этом году я взялась изучать домены, в которых мне было бы интересно попробовать свои силы. Так вот книга Василия Сабирова «Игра в цифры. Как аналитика позволяет видеоиграм жить лучше» это отличный старт для изучения игровой индустрии.
Эта книга дает отличное представление об этом домене и понятно рассказывает, как именно применение аналитических инструментов помогает оптимизировать игровой процесс на всех его этапах.
В книге описаны не только важные для игры метрики, воронки конверсий и механики монетизации, но и «типичный» рабочий день игрового аналитика.
Эта книга отличное пособие не только для начинающего игрового аналитика, но и для аналитика вообще, потому что показывается взаимосвязь явлений и метрик. Становится понятно зачем мы эти метрики считаем и как они отражаются на реальном мире.
Я бы рекомендовала прочитать эту книгу, хотя бы для того, чтобы знать, как нас сажают на игровой крючок😎
💬 А какое у вас guilty pleasure [тайное удовольствие]?
#книги_и_мысли
В комментариях ко вчерашнему посту мы поднимали тему о том, что в офис не хочется ездить, потому что дорога занимает чертову уйму времени, которое очень сложно потратить продуктивно.
Вы когда-нибудь обращали внимание на то, что люди смотрят, уткнувшись в свои телефоны в транспорте? Мне бы хотелось сказать, что они там книги читают, не возить же с собой «кирпичи». И именно это «повсеместно люди читают» было одним из сильных впечатлений от Москвы, когда я в первый раз сюда приехала в командировку. Правда было это лет десять назад
Но сейчас я замечаю, что многие люди сидят в играх. И, на мой взгляд, самая популярная игра это «три-в-ряд». Да будь я проклята, если скажу, что сама не залипаю в ней! Правда у меня одно условие - такое нельзя ставить на телефон, поэтому я за компьютером мужа балуюсь, когда он уходит на тренировку.
Ведь так здорово просто бездумно потыкать эти шарики, да получить легкий дофамин. И знаете кто виноват в моей зависимости? Аналитики! Игровые аналитики!
В этом году я взялась изучать домены, в которых мне было бы интересно попробовать свои силы. Так вот книга Василия Сабирова «Игра в цифры. Как аналитика позволяет видеоиграм жить лучше» это отличный старт для изучения игровой индустрии.
Эта книга дает отличное представление об этом домене и понятно рассказывает, как именно применение аналитических инструментов помогает оптимизировать игровой процесс на всех его этапах.
В книге описаны не только важные для игры метрики, воронки конверсий и механики монетизации, но и «типичный» рабочий день игрового аналитика.
Эта книга отличное пособие не только для начинающего игрового аналитика, но и для аналитика вообще, потому что показывается взаимосвязь явлений и метрик. Становится понятно зачем мы эти метрики считаем и как они отражаются на реальном мире.
Я бы рекомендовала прочитать эту книгу, хотя бы для того, чтобы знать, как нас сажают на игровой крючок
💬 А какое у вас guilty pleasure [тайное удовольствие]?
#книги_и_мысли
Please open Telegram to view this post
VIEW IN TELEGRAM
😁17🐳8🔥6❤3👾3