Дашбордец
8.89K subscribers
301 photos
3 videos
76 files
798 links
Привет, котятки) Я Даша, и это мой уютный канал про дашборды - от бизнес-анализа до реализации на BI. Темы канала: data viz, BI, dashboards, DWH.
Download Telegram
Котятки🐱,
Иногда артефакты, связанные с аналитикой, визуализацией, творчеством и вдохновением, мы находим в самых неожиданных местах.
Сегодня вот эта книжечка и ее побратимы были найдены в стоматологии)
Основную, «Кради как художник», я по-прежнему нежно люблю, но «Покажи свою работу» тоже неплоха.
12🔥8👍2
Котятки🐱

Если в BI вдруг начинает ощущаться, что вы не аналитик, а оператор ручного труда — возможно, это звоночек.

10 марта в 12:00 (мск) Yandex Cloud делает вебинар «API в DataLens – все пути автоматизации». Будут разбирать, как через Public API и API-коннектор убрать лишние телодвижения и перестать перекладывать одно и то же из раза в раз.

Автоматизация в BI — штука коварная. Пока всё стабильно — живём. Как только отчётов становится больше, пользователей — шире, а сценариев — сложнее, ручные действия начинают мстить.

Полезно будет тем, кто живёт рядом с данными: BI-аналитикам, дата-инженерам, разработчикам, архитекторам и тем, кто отвечает за аналитику целиком.

Участие бесплатное, но нужна регистрация.
Если автоматизация давно в бэклоге — хороший повод наконец туда посмотреть 👀
👍75🔥1
Котятки,
На прошлой неделе в моей команде была очень крутая дискуссия - как хранить сущность с динамическим набором атрибутов (в зависимости от какого-нибудь атрибута этой же сущности). Обычно такие кейсы возникают, когда мы берем слишком высокий уровень абстракции (условно, не сущности ‘стол’ и ‘шкаф’, а объединяем в одну сущность- ‘мебель’).
Я люблю всякое хранение, основанное на идентифицирующих связях. Он мне напоминает data vault. Кто-то любит EAV.
До 24 года я очень любила БД Cassandra для таких кейсов. Отсутствие гибкости компенсировалось скоростью работы в конкретно задачах с динамическими атрибутами. Моя любовь бы и дальше продолжалась, если бы не драматическая ситуация с удвоением данных,- увы, тут эта базеночка явно не пушка, однажды начисто парализовала чтение.
Линк на почитать: https://habr.com/ru/companies/tbank/articles/951772/
7👍5🔥2
Спешу поделиться потрясающим проектом Фабиана Ланга.

Дизайнер и аналитик Фабиан Ланг 3 года работал с открытыми источниками, архивами и различными экспертами, чтобы получить уникальные наборы данных о природных и человеческих явлениях, связанных с Альпами. В результате получился 200-страничный сборник из 100 визуальных историй, где данные превращены в наглядные визуализации.

Проект охватывает такие темы, как:
- жизнь бородатого стервятника (GPS-трек)
- прошлое и будущее крупнейших альпийских ледников
- биоразнообразие на основе 30 000 наблюдений
- сосуществование людей и волков
- изменение климата, энергетический переход, распространение фамилий по высоте и др.

Это не просто визуализация гор - это визуализация взаимосвязей между средой, биоразнообразием, климатом и людьми. Данные становятся языком, с помощью которого читатель узнает и чувствует Альпы, а не просто читает сухие цифры.

Проект был отмечен рядом наград за сочетание дизайна, аналитики и ясного визуального языка.

Обязательно посмотрите, вдохновитесь
➡️https://www.fabianlang.net/schweizer-bergwelten/
🔥168👍1
Котятки🐱,
Внутри любого продукта для хранения/аналитики есть логирование и возможность мониторинга.
На тачках, где они хостятся, если логирование и мониторинг.
Есть агенты типа Zabbix, которые ходят по всем тачкам и собирают всякие метрики, чтобы потом все это выдать в какой-нибудь Grafana.
Но факт в общем простой: любая observability-система, которую мы сами себе строим, имеет глубину погружения. Можно завезти в зоопарк видеокамеры, а можно ходить и брать у животных кровь на анализы и тыкать в них градусником. И то и другое не дает понимание, что на самом деле происходит в организме наших лисичек и бегемотиков, но по крайней мере мы понимаем, что они живы и возможно не умирают.
Вот тут неплохая программная статья про многослойный подход к observability в BI, линк: https://www.sigmacomputing.com/blog/data-observability
5👍4🔥1
Котятки🐱,
С 8м марта девочек) пусть будет прекрасной и удивительной эта весна для всех нас!
Ну и сегодня еще тот самый день, который оказывает сильное влияние на ретейл)
У меня сегодня на изучении заумный гайд по сезонности и baseline ( книженция Intermittent Demand Forecasting) и чуть более веселая вещь - гайд по тому, как построить аналитику для цветочного магазина):
https://youtu.be/7fmij5j3hwM?si=RHj_HZwEYLNVnDmY
8👍7🔥4
Forwarded from Чернов пишет (Stanislav Chernov)
Опубликовал mcp-superset — MCP-сервер для Apache Superset

128+ инструментов. Дашборды, графики, датасеты, SQL Lab, пользователи, роли, RLS, группы, аудит прав — всё через Claude Code / Claude Desktop / Cursor.

Там "конкуренты" и рядом не стояли, сравнительную таблицу в том числе написал (по состоянию на 11 марта 2026 года)

Что умеет:
- полный CRUD всего что есть в Superset
- выполнение SQL запросов
- управление доступом (пользователи, роли, RLS, группы)
- аудит прав (матрица кто-куда-имеет-доступ)
- экспорт/импорт всего инстанса
- встроенная защита от случайного удаления и DDL/DML в SQL Lab

Ни один другой MCP-сервер для Superset даже близко не подошёл — ближайший конкурент имеет 60 инструментов и
ноль управления безопасностью.

pip install mcp-superset

или просто
uvx mcp-superset


репа: github.com/bintocher/mcp-superset
pypi: pypi.org/project/mcp-superset
описание: https://github.com/bintocher/mcp-superset/blob/main/README_RU.md

Лицензия: MIT

#mcp@chernovdev #superset@chernovdev #claudecode@chernovdev
https://t.me/chernovdev
🔥147🎉5👍1
Котятки,
Мне очень понравилась вот эта статья по масштабированию данных. Аккурат как раз когда я решаю вопрос о горизонте хранения:
https://arxiv.org/html/2501.13779v1
Несмотря на то, что она относится к LLM, в ней важные мысли про критерии качества данных и расширение этих критериев для разных целей, и как это влияет на масштабирование.
Грубо говоря, зачем хранить факт за 10 лет, если его поведение стабильно и доп горизонт хранения не даст дополнительных полезных свойств ни в задачах анализа, ни в задачах прогнозирования? Ну то есть, результат расчета всяких корреляций за 10 лет и за 3 года дает близкие коэффициенты?
Впрочем, эти проблемы решены в Data vault 2.0, где мы можем сжать сателлит до состояния ‘признак-период’, оптимизировать производительность и оставить неограниченной глубину хранения.
👍74🔥3
Нашла эту книгу на одной уютной кухне, не смогла с вами не поделиться👆
19👍4🔥2