Дашбордец
8.47K subscribers
242 photos
3 videos
62 files
683 links
Привет, котятки) Я Даша, и это мой уютный канал про дашборды - от бизнес-анализа до реализации на BI. Темы канала: data viz, BI, dashboards, DWH.
По вопросам писать: @Dddv_2705
Download Telegram
Котятки🐱
Я люблю блоги, в которых на конкретных примерах пошагово рассказывается аналитический путь: как были подготовлены данные, как выделялись и перерабатывались группировки, как работает декомпозиция и что идет в дриллдаун. Недавно восторгалась материалами коллег по P&L в это стиле)
Короче, люблю контент для BI-аналитиков в бизнесе, стык BI и бизнес-смыслов, и при этом тебе дают не готовый результат, а показывают, как думал аналитик.
Сегодня я про анализ покупательского поведения, подобрала два неплохих образца)
Что подметила: в иностранных статьях больше стараются показать свой ход мыслей, а вот в российских - дать методологические основы. Бывают исключения, конечно, но в целом почему-то наши материалы претендуют на универсальность чаще.
Короче, ловите наиболее типичных представителей:
https://blog.enterprisedna.co/customer-analysis-in-power-bi-reviewing-performance-over-time/

https://www.passteam.ru/blog/bolshoy-gayd-po-rfm-analizu-klientskoy-bazy-industrii-krasoty
Котятки🐱
Иногда наступает время, когда команде нужен PM. Порой это происходит из-за размера самой команды, иногда из-за стадии развития, а бывает, что амбициозность задач требует, чтобы вами порулил опытный капитан.
Ну и поною: найти нормального PM в разработке непросто, найти его в хранилище - еще сложнее. Проще украсть у кого-то)
А уж вводить его в роль, закапывая материалами и курсами - такое себе.
Но вот эту книжечку я бы рекомендовала, она очень неплохо дает понимание, что ждут от проджекта в BI и хранилищах, да и вообще хорошее понимание домена:
https://ebrary.net/99159/business_finance/business_analytics_for_managers_taking_business_intelligence_beyond_reporting
Котятки🐱,
Вчера у меня было занятное обсуждение на тему ‘скрестить ежа с ужом’- как провести маппинг функций, бизнес-процессов и физических объектов в системе-источнике без логической модели источника. Ну хотя бы с качеством процентов 70, чтобы от чего-то оттолкнуться.
Я сразу по памяти выдала ‘Берем Наташу’, имея ввиду библиотеку Natasha, чтобы выделить устойчивые онтологии с двух сторон и их смэтчить, а потом чуть притормозила.
Мне не нравится паттерн работы в стиле ‘готовишь гипотезу-готовишь данные-тестируешь-смотришь’, и никогда не нравился. Я тот еще хаосит при ресерче, и в подготовке данных весьма агрессивно себя веду, сначала пробую, потом думаю.
В общем, спасибо небесам за Power BI и его функции для анализа текстов, а также за нормальный откат изменений в Power Query:
https://learn.microsoft.com/ru-ru/power-bi/transform-model/desktop-ai-insight
Котятки🐱,
Когда я училась в аспирантуре, у меня была философия науки.
С подачи одной из дискуссий на лекции, в моей голове устойчиво сформировалась мысль о том, что статистика - это не наука, а суповой набор из тервера, матанализа и рядов с острой приправой всего, что под руку попадется (включая, например, замес между режимами вывода типа абдукции, дедукции и индукции при генерации гипотез). С тех пор я завалила десяток собеседований, так как, если мягко выражаться, мое мнение не совсем классическое, но я упорно ищу подтверждение. Отсюда и мой интерес к анализу и BI.
Короче, были длинные выходные, на столе лежала книжка про ДАО,  и я озаботилась влиянием философии на рамки формирования науки о данных (и да, не считаю наукой).
Удалось наскрести парочку занятных материалов, делюсь. Последнее исследование очень интересно, так как оно ставит вопрос о знаниях, полученных с помощью науки о данных, и заходит на такой интересный термин, как "объяснимость" - что является достаточным? В практическом смысле, это сводится к тому, запихивать ли объяснение каждой запятой в легенду к дашикам, или полагаться на культурный контекст :) Ну а в более широком очень неплохо закрывает вопрос, зачем нужны эти ваши аналитики.
How do Taoist thoughts influence big data technological innovation? - исследование влияния даосизма на технологические инновации в области больших данных
A Taoist Foundation of Systems Modeling and Thinking - статья о применении даосских принципов в системном моделировании и мышлении
Regarding Big Data through the Lens of the Philosophy of Information - исследование философии информации и её связи с большими данными
The epistemological foundations of data science: a critical review - критический обзор эпистемологических основ науки о данных
Forwarded from Yet Another Analyst
Нашелся репозиторий вида "все про интеграцию": технологии, паттерны, протоколы. Не знаю, как использовать, но может вам полезно будет: https://github.com/stn1slv/awesome-integration
Котятки🐱,
Я сейчас корплю над data lineage в своем хранилище, и грущу. Раньше я искренне считала это одноразовым инструментом, который продать пользователям почти нереально: пресловутый data trust не продается, если в компании достаточно аналитической культуры и понимания происхождения своих данных.
У меня была пачка заблуждений, которые проще не пересказывать, а поделиться с вами вот этой статьей:
https://medium.com/alvin-ai/the-most-common-misconceptions-about-data-lineage-18a65e10d9a1
И хотела бы я высказаться в стиле ‘а раньше я не понимала, а вот щас каак поняла’, но нет. Я по прежнему думаю, что оно того не стоит, если твой вопрос, на который ты отвечаешь с помощью data lineage, не окупается созданием и сопровождением этой хмурой цепочки.
У меня два фактора окупаемости:
-я кормлю этой цепочкой AI, так он лучше контекст датасета понимает. Но не всегда результат идеален, ибо иногда в незнании ему проще, и результаты лучше
-реверс инжиниринг: ненавижу хранимки, хоть они и кэшируют план запроса и вообще полезные типа. Полная цепочка сразу показывает, где и что переделать.
Ну и да, согласна с автором статьи, это точно не ‘просто диаграммы’.
Котятки🐱,
Я предпочитаю не экономить на печеньках, поэтому экономлю на лицухах;)
В любой компании, где внедряется BI, стратегия управления лицензиями плавно меняет вектор от ‘как раздать’ к ‘как не дать’. Но иногда гибридный подход закладывают в самом начале, при проектировании процесса, в 2 ветки:
-раздача лицензий: активным пользователям, которым необходимо интерактивное взаимодействие с дашбордами.
-рассылка отчетов: пассивным пользователям, которым достаточно получать статические отчеты по электронной почте.
У меня чаще всего история всегда развивается по-классике, так как заранее закладывать гибридную стратегию=замедлить темп роста аналитической культуры.
Поэтому все полезные действия, а именно сегментация пользователей, мониторинг и анализ использования отчетов (сиречь, слежка), оптимизация и разработка механики переназначений лицензий, - у меня в процессах возникают не сразу.
Почитать про всякие тактики можно тут (статей без привязки к какому-то ПО у меня в копилочке, увы, нет, но буду благодарна если поделитесь):
https://redresscompliance.com/optimizing-microsoft-365-licensing-for-hybrid-workforces/
Котятки🐱 Я очень люблю всякие исследования по считыванию диаграмм с точки зрения когнитивных аспектов. Сегодня вселенная мне подкинула обзорную статью, как тестируется разная когнитивная нагрузка и в целом про ее влияние на эффективность визуализации данных:
https://datafloq.com/read/how-cognitive-load-impacts-data-visualization-effectiveness/
Ее я читала минут 5 и была очень рада, ибо предыдущую монументальную работу про визуализацию network-диаграмм я прямо буквально дожимала
https://vcg.seas.harvard.edu/publications/scalability-of-network-visualisation-from-a-cognitive-load-perspective/paper
P.s. помнится, дет 5 назад у меня были проблемы с horizon -диаграммой. Так вот, ничего не поменялось. Я по-прежнему не могу ее читать, она сильно перегружает меня. Боюсь, ее когнитивная ценность для меня близится в нулю.
Котятки🐱,
спустя десяток лет в аналитике и IT я сегодня узнала, что когда я крашу кнопочку в дашике в ярко красный и пишу на ней "Жми меня", то это называется аффорданс.
Еще я иногда поля для ввода параметров для пересчета делаю крупненькими и с жирненькой границей. Это оно же.
Мир полон невероятного.
Линк на статью:
https://idbi.ru/blogs/blog/affordansy-v-dizayne#:~:text=%D0%90%D1%84%D1%84%D0%BE%D1%80%D0%B4%D0%B0%D0%BD%D1%81%20%E2%80%94%20%D0%BD%D0%B0%D0%B2%D0%B8%D0%B3%D0%B0%D1%82%D0%BE%D1%80%20%D0%B4%D0%BB%D1%8F%20%D0%BF%D0%BE%D0%BB%D1%8C%D0%B7%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D0%B5%D0%B9.,%D0%B8%20%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D1%81%D1%82%D0%B2%D0%B8%D1%8F%20%D0%BC%D0%BE%D0%B3%D1%83%D1%82%20%D0%B1%D1%8B%D1%82%D1%8C%20%D0%BD%D0%B5%D0%BF%D1%80%D0%B5%D0%B4%D1%81%D0%BA%D0%B0%D0%B7%D1%83%D0%B5%D0%BC%D1%8B%D0%BC%D0%B8.
Котятки,
Сегодня утром искала себе аргументы, почему я не стану пересаживаться на модный Rolap в BI, ибо иногда недостаточно просто обозвать их ‘Джаваскрипт на ножках для бедных’, нужно что-то более осознанное.
Поиски привели меня в Хабр, вчитываться в неудачные кейсы Superset (хотя он не совсем ROLAP, имхо).
Хабр привел меня к статье, где ребята из Ростелекома решают классические хотелки пользователей в BI:
-‘Давай введем параметр прямо в дашборд, и чтобы оно все пересчитало’
-‘Давай пользователи будут довносить данные руками прямо черкез дашборд, а они сохраняться будут’
Что ж, на Superset это выглядит прямо не космосом, а чем-то более осознанным. Аргументов остаться на Qlik стало меньше.
В общем, неудачный день для гугления, может шашлык выйдет лучше.
Линк:
https://habr.com/ru/amp/publications/772118/
Котятки, очень хотела написать сегодня пятничный пост, но что-то мешает
Котятки🐱,
В этот день, добрый и прекрасный, я наконец ушатала нагрузочный тестированием базу MS SQL и перешла к новому кусочку -нагрузочного тестированию BI.
Начала я с вот этого занятного докладика, так как он по моему стеку:
https://sqadays.com/ru/talk/11073
Ну и сразу ломанулась в эмуляторы нагрузки эндпоинтов, и начала с Power BI, ибо у меня на этом инструменте весь self-service отстраивается:
https://github.com/microsoft/PowerBI-Tools-For-Capacities/tree/master/LoadTestingPowerShellTool/
Но в коробочных вендорских BI мы упираемся в то, что нагрузочное тестирование почти всегда сводится к нагрузке по сценарию массового чтения/рендеринг при обновлении фильтров, а мне хотелось бы все же тестировать нагрузку по созданию дашбордов.
Думаю о Selenium, ибо пока хз что делать. Чувствую себя древним мамонтом среди котяток.
Котятки🐱,
Я иду шаткой дорогой автоматизации и ИИ. Что-то выходит, как с системным анализом, но Business intelligence- точно для живых)
В нашу дружную команду нужны Джуны.
Итак,
Компания - Lactalis,
Локация оформления - Казахстан
Позиция - в штат.

Вакансия: junior/middle-администратор Qlik. Навыки разработки приложений будут конкретным преимуществом. Обязанности: 🔹Поддержка инфраструктуры QlikView (до 300 пользователей); 🔹 Настройка ролевой модели доступа пользователей; 🔹 Решение инцидентов и запросов от пользователей; 🔹Разработка/доработка технических приложения Qlik; Пожелания: 🔹Высшее образование (желательно специализация в области информационных технологий); 🔹 Знание SQL, понимание принципов разработки BI-приложений; 🔹Опыт работы от 1 года в области аналитики и автоматизации; 🔹Знание и опыт работы с Qlik View/ Qlik Sense или иным BI-инструментом; 🔹Ответственность, системное и аналитическое мышление, ориентация на результат.

От себя: у нас опытный BI-тимлид, который видел то, что я названий таких и не знаю, международная команда и хороший стек. В общем, вам будет, куда вырасти.
Ах да, у нас сырочек вкусный.
Кидайте резюмешки @Dddv_2705 и помогите пожалуйста репостом ! Ваша Даша
Котятки 🐱
когда я работала на стороне заказчика, с исполнителей я собирала всякие сертификаты для подтверждения квалификации.
Потом, когда я уже сама стала работать в консалтинге, встал вопрос уже о моих сертификатах. И как же было бы кстати подтвердить свои знания сертификатом по работе BI! Но у меня такого не было.

В общем, если вы ждали знака - то это он.
Добро пожаловать на сертификацию DataLens Analyst от Yandex Cloud.

Там — все, что надо, и в плане обучалок, и в плане гайдов:
📊 датасеты, чарты, параметры, вычисления, дашборды, доступы — все разложено по полочкам.
🌐 есть бесплатный курс и разборы, можно подготовиться не в одиночку.
💸 до конца августа для всех, кто этот пост увидел, сертификация стоит всего 2 500 ₽, потом — 5 000 ₽.

Все детали, курс и примеры заданий — вот тут

После успешного прохождения экзамена обязательно дадут сертификат.
Котятки, у Ромы Бунина и Тани Мисютиной был прикольный курс Лаборатории данных.👍

Поэтому когда я наткнулась на анонс вебинара от AW BI — решила вас позвать, там будет Таня Мисютина, один из самых сильных специалистов по визуализации данных. Она преподавала в Яндексе, Сбере, X5 и точно знает, как донести мысль не только до аналитика, но и до тех, у кого KPI в Excel.

📊Таня будет рассказывать, как подходить к визуализации не с позиции «выбора цвета графика», а с позиции мышления — что, зачем и почему стоит показывать.
Продемонстрирует дашборд для банковского кейса и на его примере — как может выглядеть понятная и чистая визуализация в отечественной BI-системе AW BI (всё больше интересных продуктов появляется у нас, кстати).

Участие бесплатное. 🔗Регистрируйтесь по ССЫЛКЕ

Уверена, будет полезно даже тем, кто давно работает с визуализацией.

Реклама. Рекламодатель АО «ОСТ»
ИНН: 9709108924
Котятки🐱,
Сегодня пятничка, и я чилю на MTS True tech days. Площадка Mts hall, мне с ней все понятно еще со времен фестиваля Будущее.
А вот мысли тут сегодня бродят достаточно новые.
Первый же доклад на главной сцене заставил меня чувствовать себя в сбывшейся реальности черного зеркала, поэтому я свалила на инженерный трек, сверить часы.
Выяснила, что в сфере применения ИИ примерно все крутятся возле одних и тех же доменов/кейсов. У меня тот же самый списочек с разным прогрессом)
P.S. Ну кроме автоматизации код ревью. Я параноик, и принятие решений ИИ доверить не готова.
⚡️Пошаговый план: как стать аналитиком данных в 2025

Хотите попасть в аналитику, но теряетесь в море информации и не понимаете, какие навыки действительно важны? Боитесь, что без опыта вас не возьмут на работу? И да, ещё один популярный вопрос — а что, если мне 30/40/50+ лет?

Андрон Алексанян — эксперт по аналитике с 8-летним опытом и по совместительству CEO Simulative — покажет рабочие схемы и чёткий план, как устроиться в аналитику быстрее, даже если у вас нет опыта

Что будет на вебинаре?

🟠 Разберёте полный роадмап: что учить, в каком порядке, до какого уровня;
🟠 Лайфхаки трудоустройства:
— покажут реальные примеры, как оформить резюме и портфолио, чтобы привлекать внимание;
— обсудите, какие отклики работают, а какие сразу отправляют в корзину;
— изнанка найма: инсайдерский взгляд на процессы отбора
🟠 Практические техники для новичков: разберёте, как компенсировать недостаток опыта и быстро закрывать пробелы в знаниях

🕗 Важно досмотреть вебинар до конца, чтобы получить бонус от Simulative, который поможет бустануть карьеру

😶Зарегистрироваться на бесплатный вебинар
Please open Telegram to view this post
VIEW IN TELEGRAM
Котятки🐱 я впервые пользовалась MongoDb очень давно - так давно, что у крупных BI тогда и коннекторов к нему не было. Сегодня я уже более осознанно проходила этот путь, но уже с Qlik https://www.youtube.com/watch?v=RgXFRDRujKg
Зачем делала?
У одного из систем-источников, который у меня сейчас есть, родная база - Mongo, и я очень хотела ее отзеркалить вместо парсинга json. И сразу вытянуть в Qlik. Так сказать, в качестве промежуточного решения.
Что еще для себя нашла? -я думала, что вязка Mongo+BI не очень пригодна для ad-hoc, кроме аналитики поведения. Оказалось, что для категорийного анализа тоже годно, да и агрегации можно сделать.
-я все еще осталась при своем мнении, что лучше подключать Mongo через промежуточные слои.

И короче вернулась я в парсинг json на питоне и плоскую раскладку в Postgresql.

Но кому интересно, такой общий гайд и всякие кейсы тут: https://moldstud.com/articles/p-integrating-mongodb-with-bi-tools-enhancing-data-warehousing-capabilities-for-better-insights
Котятки🐱,
Вчера вечером я читала лекцию про методы управления временем в рамках курса DevOps Lead.
И хотя лекция в целом была про тайм-менеджмент, я не удержалась и немного залезла в сторону структурирования - ну подумаешь, не только же время можно структурировать.
На волне вдохновения сделала памятку с 4 методами, делюсь👆. Мой любимый - Zettelkasten.
История и теория тут.
Реальный опыт и шаблоны тут.