🫖 Основы дизайна для аналитиков
Как и обещал выкладываю запись митапа про основы дизайна, который проводил пару недель назад. Видео и звук «живые», но зато можно услышать вопросы и обсуждения слушателей. Полезно, если вы ещё не смотрели мои выступления на эту тему.
Самое классное, что во время митапа мы в онлайн режиме сделали перевёрстку дашборда для компании CloudReports, которая делает автоматизированный сбор данных и шаблоны дашбордов под ключ. То есть можно купить набор конекторов и дашбордов, а данные будут автоматом тянуться из 1С, CRM-ок и т.п. Если у вас есть задачи по работе с такими источниками, то можно приглянуться к сервису.
Классно, что они не побоялись и согласились на публичную прожарку, уважение. На митапе мы не успели сделать перевёрстку до конца, поэтому я ещё посидел с Looker Studio и доделал свой вариант. Посмотреть до/после можно на картинках выше или по ссылкам: до, после.
Если вдруг у вас тоже есть публичные кейсы для перевёрстки — приносите.
#выступление #переверстка
Как и обещал выкладываю запись митапа про основы дизайна, который проводил пару недель назад. Видео и звук «живые», но зато можно услышать вопросы и обсуждения слушателей. Полезно, если вы ещё не смотрели мои выступления на эту тему.
Самое классное, что во время митапа мы в онлайн режиме сделали перевёрстку дашборда для компании CloudReports, которая делает автоматизированный сбор данных и шаблоны дашбордов под ключ. То есть можно купить набор конекторов и дашбордов, а данные будут автоматом тянуться из 1С, CRM-ок и т.п. Если у вас есть задачи по работе с такими источниками, то можно приглянуться к сервису.
Классно, что они не побоялись и согласились на публичную прожарку, уважение. На митапе мы не успели сделать перевёрстку до конца, поэтому я ещё посидел с Looker Studio и доделал свой вариант. Посмотреть до/после можно на картинках выше или по ссылкам: до, после.
Если вдруг у вас тоже есть публичные кейсы для перевёрстки — приносите.
#выступление #переверстка
🔴 Пай-чарт мемы
Недавно проводил занятие для одной компании и снова возник вопрос — когда стоит использовать пай-чарты в дашбордах?
Если кратко — никогда! 😈 Используйте пай-чарты для мемов!
Проблема не в том, что пай-чарты плохие сами по себе. Просто для их использования надо соблюсти много условий, которых редко удается добиться на дашбордах:
— Все сектора аддитивны и в сумме дают логическое целое в 100% (а не план-факт, который так часто любят делать в виде донат-чарта).
— Мы хотим ответить на вопрос: какую долю занимает сектор от 100%, а не сравнить значения секторов между собой.
— Кол-во секторов больше 2-4, но не больше 6-8.
— При использовании фильтров или обновлении данных, кол-во секторов не меняется или не может стать равным одному.
— Значения распределены неравномерно между секторами.
— Подписи секторов и значений можно расположить на самом пай-чарте без отдельной легенды.
— Ваша целевая аудитория ещё помнит, что такое стрелочные часы =))
В итоге, сложно соблюсти всё это в дашбордре, поэтому для дашбордов лучший пай-чарт — это бар-чарт. А вот для презентаций, при грамотном использовании, пай-чарты очень даже норм. Посмотрите доклад замечательной Нади Андриановой, которая поясняет, почему это так и приводит интересные примеры. А ещё у неё классный канал про дата-арт.
Ну и да, лето, мемы, выходные )))
#ссылка #юмор
Недавно проводил занятие для одной компании и снова возник вопрос — когда стоит использовать пай-чарты в дашбордах?
Если кратко — никогда! 😈 Используйте пай-чарты для мемов!
Проблема не в том, что пай-чарты плохие сами по себе. Просто для их использования надо соблюсти много условий, которых редко удается добиться на дашбордах:
— Все сектора аддитивны и в сумме дают логическое целое в 100% (а не план-факт, который так часто любят делать в виде донат-чарта).
— Мы хотим ответить на вопрос: какую долю занимает сектор от 100%, а не сравнить значения секторов между собой.
— Кол-во секторов больше 2-4, но не больше 6-8.
— При использовании фильтров или обновлении данных, кол-во секторов не меняется или не может стать равным одному.
— Значения распределены неравномерно между секторами.
— Подписи секторов и значений можно расположить на самом пай-чарте без отдельной легенды.
— Ваша целевая аудитория ещё помнит, что такое стрелочные часы =))
В итоге, сложно соблюсти всё это в дашбордре, поэтому для дашбордов лучший пай-чарт — это бар-чарт. А вот для презентаций, при грамотном использовании, пай-чарты очень даже норм. Посмотрите доклад замечательной Нади Андриановой, которая поясняет, почему это так и приводит интересные примеры. А ещё у неё классный канал про дата-арт.
Ну и да, лето, мемы, выходные )))
#ссылка #юмор
Вчера перевозил данные на новый комп и нашел файл с последней записью второго сезона зум-сериала Залетай в BI, где я вместе с компанией Синапс занимался разработкой системы дашбордов в прямом эфире. Прошло более полугода, а я, оказывается, случайно забыл её выложить 🙈
Ну как случайно. Во время сбора требований для дашборда всё пошло не так, как должно было быть «по методике». Получается я всех учу пользоваться своим Dashboard Canvas, а сам не могу по нему собрать требования. Отстой! Поэтому мой мозг решил не расстраиваться, забыть про эту запись и не рассказывать про неё вам )))))
📽Драма
Во время встречи с ребятами я смог разработать классный макет дашборда, но просто делал это из опыта, а не по алгоритму и в какой-то момент на встрече просто забил на заполнение кенваса, а сразу пошёл делать макет. Анализируя этот опыт, понял две вещи:
— Я зря расстроился, что не смог пойти прямо по алгоритму. Алгоритм — помощник в том, чтобы научиться делать правильно, но когда опыта много, то уже быстрее думать и работать автоматом, а не пытаясь разложить всё по полочкам.
— У меня все дальше развивается мысль, что для разных типов дашбордов, нужны разные методики проектирования и сбора требований. Странно натягивать один и тот же подход и на овервью дашборд, где будет куча метрик для мониторинга, и на дашборд по АБ-тестам, где будет несколько графиков с совершенно другой целью. Теперь есть идея, что для каждого типа дашборда нужен свой список вопросов и свои детальные дизайн-гайды и типовые решения. Ждите обновления моих мыслей про Dashboard Map и Dashboard Canvas =)
А запись 👉 я решил выложить 👈 Поэтому вы можете посмотреть как я местами нервничаю, туплю и потом забиваю на кенвас. И это классно, так как показывает реальную жизнь как есть, без приукрас и чего-то волшебного.
Получился отличный проект, спасибо большое ребятам за смелость поделиться своими проблемами и запросами бизнеса. Мы даже собрали данные и я сделал на них классный дешик в DataLens, он как раз на картинке. А еще у меня тут произошли изменения на работе, поэтому думаю, что запущу новый сезон сериала, но уже про себя и свои реальные процессы, надеюсь вам будет интересно =) Stay tuned
Все серии:
— Dashboard Map
— Метрики и срезы
— Dashboard Canvas
#залетайвbi
Please open Telegram to view this post
VIEW IN TELEGRAM
Тут ученые наисследовали, что AI плохо понимает графики и диграммы. Вух, выдыхаем BI-аналитики =)))
Но я считаю, что в исследовании надо было сравнивать не просто с людьми, а с бизнес пользователями дашбордов, тогда AI выглядел бы лучше на их фоне 😈
Ну и еще непонятно зачем LLM смотреть на дашборды, когда есть сырые данные, не выдыхаем 😁
#ссылка #юмор
Но я считаю, что в исследовании надо было сравнивать не просто с людьми, а с бизнес пользователями дашбордов, тогда AI выглядел бы лучше на их фоне 😈
Ну и еще непонятно зачем LLM смотреть на дашборды, когда есть сырые данные, не выдыхаем 😁
#ссылка #юмор
THE DECODER
Study reveals major weaknesses in AI's ability to understand diagrams and abstract visuals
Recent advances have made AI models increasingly multimodal, able to process text, images, speech, and video together.
🕰 Back to BIasics 🎬
Последние два года я работал сначала евангелистом/менеджером продукта DataLens, а потом и менеджером продукта для облачной платформы данных в Nebius AI. Я давно хотел попробовать себя в такой роли и узнал много нового и про технологии, и про продукт. Но при этом я понял, что это не так интересно для меня как казалось из далека.
Да, классно придумывать фичи, считать объёмы рынка и проводить кастдевы. Нет, совсем не классно заново находить product market fit продукта, когда компания развернула стратегию на 180°; пытаться приоритизировать гигантский беклог, где важно всё; отказываться от фичей и даже закрывать целые продукты.
Где-то полгода назад началось выгорание и «работа на нелюбимой работе». Даже в канал я стал писать реже, всё меньше было реальных кейсов из практики про дашборды и BI. Было чувство самозванца — пишу вам про BI, но занимаюсь им уже совсем мало. В итоге я решил возвращаться к тому, что люблю — работать с данными, дашбордами и процессами вокруг них.
Наверное вы слышали про завершение разделения Яндекса на международную и российскую часть, оно повлияло и на мою карьеру. Теперь я Head of Data в Nebius Group — головной компании четырех международных бизнесов, которые отделились от Яндекса. Буду строить DWH и BI для финансов, HR, закупок и других общих функций. Предстоит делать это с нуля, что потрясающе интересно, давно не испытывал столько куража и любопытства. А так как я теперь отвечаю не только за BI, но и за DWH и аналитику, то буду рассказывать и про эти области больше.
И начну это делать в формате сериала про выбор технологий и построение DWH и BI. Так что новый сезон «Залетай в BI: Back to BIasics» объявляю открытым, вы только что прочитали трейлер. Главным героем в этот раз буду я сам и буду рассказывать про этапы нового проекта.
А вы учитесь на моих ошибках и делайте то, что вам нравится. Интерес к работе важнее важного и залог к успеху в любой профессии.
P.S. Песня "Let's bring it back to basics", любимого мною DubFX, будет саундтреком к этому сезону. Хорошо отражает текущее настроение от новой работы =)
Все серии:
— S3E0: Трейлер
— S3E1: Архитектура решения
— S3E2: Data Ingestion
— S3E3: Инструмент Data Ingestion
— S3E4: Итоги за полгода
#залетайвbi
Последние два года я работал сначала евангелистом/менеджером продукта DataLens, а потом и менеджером продукта для облачной платформы данных в Nebius AI. Я давно хотел попробовать себя в такой роли и узнал много нового и про технологии, и про продукт. Но при этом я понял, что это не так интересно для меня как казалось из далека.
Да, классно придумывать фичи, считать объёмы рынка и проводить кастдевы. Нет, совсем не классно заново находить product market fit продукта, когда компания развернула стратегию на 180°; пытаться приоритизировать гигантский беклог, где важно всё; отказываться от фичей и даже закрывать целые продукты.
Где-то полгода назад началось выгорание и «работа на нелюбимой работе». Даже в канал я стал писать реже, всё меньше было реальных кейсов из практики про дашборды и BI. Было чувство самозванца — пишу вам про BI, но занимаюсь им уже совсем мало. В итоге я решил возвращаться к тому, что люблю — работать с данными, дашбордами и процессами вокруг них.
Наверное вы слышали про завершение разделения Яндекса на международную и российскую часть, оно повлияло и на мою карьеру. Теперь я Head of Data в Nebius Group — головной компании четырех международных бизнесов, которые отделились от Яндекса. Буду строить DWH и BI для финансов, HR, закупок и других общих функций. Предстоит делать это с нуля, что потрясающе интересно, давно не испытывал столько куража и любопытства. А так как я теперь отвечаю не только за BI, но и за DWH и аналитику, то буду рассказывать и про эти области больше.
И начну это делать в формате сериала про выбор технологий и построение DWH и BI. Так что новый сезон «Залетай в BI: Back to BIasics» объявляю открытым, вы только что прочитали трейлер. Главным героем в этот раз буду я сам и буду рассказывать про этапы нового проекта.
А вы учитесь на моих ошибках и делайте то, что вам нравится. Интерес к работе важнее важного и залог к успеху в любой профессии.
P.S. Песня "Let's bring it back to basics", любимого мною DubFX, будет саундтреком к этому сезону. Хорошо отражает текущее настроение от новой работы =)
Все серии:
— S3E0: Трейлер
— S3E1: Архитектура решения
— S3E2: Data Ingestion
— S3E3: Инструмент Data Ingestion
— S3E4: Итоги за полгода
#залетайвbi
В каком формате вам интереснее всего «смотреть» сериал?
Anonymous Poll
72%
Текстовыми сообщениями
6%
Мини-подкастами в виде голосовых
22%
Видео в формате «говорящая голова»
Media is too big
VIEW IN TELEGRAM
Недавно сделал для команды Valiotti Analytics учебный курс по BI и визуализации данных для онбординга аналитиков. Получилось классно, даже сыграл для них в конце на бас-укулеле🤘
Если вы хотите похожий курс для вашей компании, то приходите в личку (игра на укулеле за отдельную доплату =)
А если хотите пройти именно этот курс, то у ребят есть две классные вакансии — BI-специалиста и младшего аналитика данных, налейтайте.
#отзыв #вакансия
Если вы хотите похожий курс для вашей компании, то приходите в личку (игра на укулеле за отдельную доплату =)
А если хотите пройти именно этот курс, то у ребят есть две классные вакансии — BI-специалиста и младшего аналитика данных, налейтайте.
#отзыв #вакансия
Forwarded from LEFT JOIN Insider
Please open Telegram to view this post
VIEW IN TELEGRAM
В команде, куда я перешёл, нет DWH и BI, всё делается через ERP и выгрузки в Excel. Поэтому первой задачей стоит разработка архитектуры аналитического решения и выбор технологий.
Начнём с того, что разберемся в том, что входит в тот самый «modern data stack». В интернете можно найти кусу схем с дата-лейками, стримингом, reverse ETL и другими сложными терминами. Для своей задачи я выберу упрощённую схему из 6 основных компонентов:
Data sources
Источники данных из нашего «бек-энда». Это логи и события из приложений или данные из SaaS-сервисов. В моём случае основными источниками будут ERP и различные SaaS-инструменты для HR-менеджмента, управления закупками и т.п.
Data Ingestion
Этап сбора данных из всех источников в одну базу данных или озеро. Это может быть стриминговое пополнение данных (реалтайм логи из приложений) или батчевая загрузка по расписанию. В моём случае будет только батчевая загрузка. Реализовать её можно вручную с помощью скриптов, опрашивающих API приложений и раскладывающих JSON в таблицы, или с помощью инструментов, имеющих готовые коннекторы к источникам данных.
Raw Data Storage
Место для хранения всех сырых данных, полученных из источников. Тут всё просто, должно быть дешёвое и работать без перебоев.
Transforamtoin and Semantic Layer
Сырые данные нужно преобразовать в витрины данных, которые аналитики и бизнес смогут удобно использовать в работе. Исходные данные будут агрегированы, очищены и проверены на качество. Здесь же хранится логика и правила преобразования данных – семантический слой. Скрипты для преобразования нужно регулярно запускать по правилам и событиям — это называется оркестрацией.
Data Marts Storage
Преобразованные данные нужно сложить в хранилище. Это может быть отдельная база данных или таблицы в том же месте, где хранятся сырые данные (тогда это будет «data lake», так как исходные данные и конечные витрины храним в одном месте).
Presenting Layer
Интерфейсы или инструменты, где конечные пользователи могут использовать данные: Jupiter Notebook для аналитиков или BI-системы для бизнес-пользователей.
Вух, пока писал, казалось, что пишу банльщину, а с другой стороны столько всего получилось в чем нужно разбираться аналитику, что кажется, что такое будет полезно. И это мы ещё не затронули Data Governance, Quality, Security и техническую инфраструктуру и Observability .
Дальше мы разберём каждый шаг подробнее, а в следующей серии расскажу, как составить список источников и выбрать инструменты для сбора данных.
Как вам такие вводные теоретические посты?
Все серии:
— S3E0: Трейлер
— S3E1: Архитектура решения
— S3E2: Data Ingestion
— S3E3: Инструмент Data Ingestion
— S3E4: Итоги за полгода
#залетайвbi
Please open Telegram to view this post
VIEW IN TELEGRAM