Reveal the Data
27.2K subscribers
902 photos
34 videos
4 files
661 links
Канал Ромы Бунина про визуализацию данных, дашборды и развитие BI-систем.

Подробнее про канал, рубрики, правила и контакты — https://t.me/revealthedata/386

Сайт и блог — https://revealthedata.com/
Download Telegram
🫖 Основы дизайна для аналитиков
Как и обещал выкладываю запись митапа про основы дизайна, который проводил пару недель назад. Видео и звук «живые», но зато можно услышать вопросы и обсуждения слушателей. Полезно, если вы ещё не смотрели мои выступления на эту тему.

Самое классное, что во время митапа мы в онлайн режиме сделали перевёрстку дашборда для компании CloudReports, которая делает автоматизированный сбор данных и шаблоны дашбордов под ключ. То есть можно купить набор конекторов и дашбордов, а данные будут автоматом тянуться из 1С, CRM-ок и т.п. Если у вас есть задачи по работе с такими источниками, то можно приглянуться к сервису.

Классно, что они не побоялись и согласились на публичную прожарку, уважение. На митапе мы не успели сделать перевёрстку до конца, поэтому я ещё посидел с Looker Studio и доделал свой вариант. Посмотреть до/после можно на картинках выше или по ссылкам: до, после.

Если вдруг у вас тоже есть публичные кейсы для перевёрстки — приносите.
#выступление #переверстка
🔴 Пай-чарт мемы
Недавно проводил занятие для одной компании и снова возник вопрос — когда стоит использовать пай-чарты в дашбордах?

Если кратко — никогда! 😈 Используйте пай-чарты для мемов!

Проблема не в том, что пай-чарты плохие сами по себе. Просто для их использования надо соблюсти много условий, которых редко удается добиться на дашбордах:
— Все сектора аддитивны и в сумме дают логическое целое в 100% (а не план-факт, который так часто любят делать в виде донат-чарта).
— Мы хотим ответить на вопрос: какую долю занимает сектор от 100%, а не сравнить значения секторов между собой.
— Кол-во секторов больше 2-4, но не больше 6-8.
— При использовании фильтров или обновлении данных, кол-во секторов не меняется или не может стать равным одному.
— Значения распределены неравномерно между секторами.
— Подписи секторов и значений можно расположить на самом пай-чарте без отдельной легенды.
— Ваша целевая аудитория ещё помнит, что такое стрелочные часы =))

В итоге, сложно соблюсти всё это в дашбордре, поэтому для дашбордов лучший пай-чарт — это бар-чарт. А вот для презентаций, при грамотном использовании, пай-чарты очень даже норм. Посмотрите доклад замечательной Нади Андриановой, которая поясняет, почему это так и приводит интересные примеры. А ещё у неё классный канал про дата-арт.

Ну и да, лето, мемы, выходные )))
#ссылка #юмор
📈 Залетай в BI | #3 Dashboard Canvas 🍿
Вчера перевозил данные на новый комп и нашел файл с последней записью второго сезона зум-сериала Залетай в BI, где я вместе с компанией Синапс занимался разработкой системы дашбордов в прямом эфире. Прошло более полугода, а я, оказывается, случайно забыл её выложить 🙈

Ну как случайно. Во время сбора требований для дашборда всё пошло не так, как должно было быть «по методике». Получается я всех учу пользоваться своим Dashboard Canvas, а сам не могу по нему собрать требования. Отстой! Поэтому мой мозг решил не расстраиваться, забыть про эту запись и не рассказывать про неё вам )))))

📽Драма

Во время встречи с ребятами я смог разработать классный макет дашборда, но просто делал это из опыта, а не по алгоритму и в какой-то момент на встрече просто забил на заполнение кенваса, а сразу пошёл делать макет. Анализируя этот опыт, понял две вещи:
— Я зря расстроился, что не смог пойти прямо по алгоритму. Алгоритм — помощник в том, чтобы научиться делать правильно, но когда опыта много, то уже быстрее думать и работать автоматом, а не пытаясь разложить всё по полочкам.
— У меня все дальше развивается мысль, что для разных типов дашбордов, нужны разные методики проектирования и сбора требований. Странно натягивать один и тот же подход и на овервью дашборд, где будет куча метрик для мониторинга, и на дашборд по АБ-тестам, где будет несколько графиков с совершенно другой целью. Теперь есть идея, что для каждого типа дашборда нужен свой список вопросов и свои детальные дизайн-гайды и типовые решения. Ждите обновления моих мыслей про Dashboard Map и Dashboard Canvas =)

А запись 👉 я решил выложить 👈 Поэтому вы можете посмотреть как я местами нервничаю, туплю и потом забиваю на кенвас. И это классно, так как показывает реальную жизнь как есть, без приукрас и чего-то волшебного.

Получился отличный проект, спасибо большое ребятам за смелость поделиться своими проблемами и запросами бизнеса. Мы даже собрали данные и я сделал на них классный дешик в DataLens, он как раз на картинке. А еще у меня тут произошли изменения на работе, поэтому думаю, что запущу новый сезон сериала, но уже про себя и свои реальные процессы, надеюсь вам будет интересно =) Stay tuned

Все серии:
Dashboard Map
Метрики и срезы
Dashboard Canvas
#залетайвbi
Please open Telegram to view this post
VIEW IN TELEGRAM
Тут ученые наисследовали, что AI плохо понимает графики и диграммы. Вух, выдыхаем BI-аналитики =)))

Но я считаю, что в исследовании надо было сравнивать не просто с людьми, а с бизнес пользователями дашбордов, тогда AI выглядел бы лучше на их фоне 😈

Ну и еще непонятно зачем LLM смотреть на дашборды, когда есть сырые данные, не выдыхаем 😁
#ссылка #юмор
🕰 Back to BIasics 🎬
Последние два года я работал сначала евангелистом/менеджером продукта DataLens, а потом и менеджером продукта для облачной платформы данных в Nebius AI. Я давно хотел попробовать себя в такой роли и узнал много нового и про технологии, и про продукт. Но при этом я понял, что это не так интересно для меня как казалось из далека.

Да, классно придумывать фичи, считать объёмы рынка и проводить кастдевы. Нет, совсем не классно заново находить product market fit продукта, когда компания развернула стратегию на 180°; пытаться приоритизировать гигантский беклог, где важно всё; отказываться от фичей и даже закрывать целые продукты.

Где-то полгода назад началось выгорание и «работа на нелюбимой работе». Даже в канал я стал писать реже, всё меньше было реальных кейсов из практики про дашборды и BI. Было чувство самозванца — пишу вам про BI, но занимаюсь им уже совсем мало. В итоге я решил возвращаться к тому, что люблю — работать с данными, дашбордами и процессами вокруг них.

Наверное вы слышали про завершение разделения Яндекса на международную и российскую часть, оно повлияло и на мою карьеру. Теперь я Head of Data в Nebius Group — головной компании четырех международных бизнесов, которые отделились от Яндекса. Буду строить DWH и BI для финансов, HR, закупок и других общих функций. Предстоит делать это с нуля, что потрясающе интересно, давно не испытывал столько куража и любопытства. А так как я теперь отвечаю не только за BI, но и за DWH и аналитику, то буду рассказывать и про эти области больше.

И начну это делать в формате сериала про выбор технологий и построение DWH и BI. Так что новый сезон «Залетай в BI: Back to BIasics» объявляю открытым, вы только что прочитали трейлер. Главным героем в этот раз буду я сам и буду рассказывать про этапы нового проекта.

А вы учитесь на моих ошибках и делайте то, что вам нравится. Интерес к работе важнее важного и залог к успеху в любой профессии.

P.S. Песня "Let's bring it back to basics", любимого мною DubFX, будет саундтреком к этому сезону. Хорошо отражает текущее настроение от новой работы =)

Все серии:
— S3E0: Трейлер
— S3E1: Архитектура решения
— S3E2: Data Ingestion
— S3E3: Инструмент Data Ingestion
— S3E4: Итоги за полгода
#залетайвbi
Media is too big
VIEW IN TELEGRAM
Недавно сделал для команды Valiotti Analytics учебный курс по BI и визуализации данных для онбординга аналитиков. Получилось классно, даже сыграл для них в конце на бас-укулеле🤘

Если вы хотите похожий курс для вашей компании, то приходите в личку (игра на укулеле за отдельную доплату =)

А если хотите пройти именно этот курс, то у ребят есть две классные вакансии — BI-специалиста и младшего аналитика данных, налейтайте.
#отзыв #вакансия
Forwarded from LEFT JOIN Insider
Please open Telegram to view this post
VIEW IN TELEGRAM
📈 Залетай в BI: Архитектура аналитического решения S3E1
В команде, куда я перешёл, нет DWH и BI, всё делается через ERP и выгрузки в Excel. Поэтому первой задачей стоит разработка архитектуры аналитического решения и выбор технологий.

Начнём с того, что разберемся в том, что входит в тот самый «modern data stack». В интернете можно найти кусу схем с дата-лейками, стримингом, reverse ETL и другими сложными терминами. Для своей задачи я выберу упрощённую схему из 6 основных компонентов:

Data sources
Источники данных из нашего «бек-энда». Это логи и события из приложений или данные из SaaS-сервисов. В моём случае основными источниками будут ERP и различные SaaS-инструменты для HR-менеджмента, управления закупками и т.п.

Data Ingestion
Этап сбора данных из всех источников в одну базу данных или озеро. Это может быть стриминговое пополнение данных (реалтайм логи из приложений) или батчевая загрузка по расписанию. В моём случае будет только батчевая загрузка. Реализовать её можно вручную с помощью скриптов, опрашивающих API приложений и раскладывающих JSON в таблицы, или с помощью инструментов, имеющих готовые коннекторы к источникам данных.

Raw Data Storage
Место для хранения всех сырых данных, полученных из источников. Тут всё просто, должно быть дешёвое и работать без перебоев.

Transforamtoin and Semantic Layer
Сырые данные нужно преобразовать в витрины данных, которые аналитики и бизнес смогут удобно использовать в работе. Исходные данные будут агрегированы, очищены и проверены на качество. Здесь же хранится логика и правила преобразования данных – семантический слой. Скрипты для преобразования нужно регулярно запускать по правилам и событиям — это называется оркестрацией.

Data Marts Storage
Преобразованные данные нужно сложить в хранилище. Это может быть отдельная база данных или таблицы в том же месте, где хранятся сырые данные (тогда это будет «data lake», так как исходные данные и конечные витрины храним в одном месте).

Presenting Layer
Интерфейсы или инструменты, где конечные пользователи могут использовать данные: Jupiter Notebook для аналитиков или BI-системы для бизнес-пользователей.

Вух, пока писал, казалось, что пишу банльщину, а с другой стороны столько всего получилось в чем нужно разбираться аналитику, что кажется, что такое будет полезно. И это мы ещё не затронули Data Governance, Quality, Security и техническую инфраструктуру и Observability .

Дальше мы разберём каждый шаг подробнее, а в следующей серии расскажу, как составить список источников и выбрать инструменты для сбора данных.

Как вам такие вводные теоретические посты?

Все серии:
— S3E0: Трейлер
— S3E1: Архитектура решения
— S3E2: Data Ingestion
— S3E3: Инструмент Data Ingestion
— S3E4: Итоги за полгода
#залетайвbi
Please open Telegram to view this post
VIEW IN TELEGRAM