Дашбордец

Котятки🐱,
Долго вам ничего не писала, каюсь. Ничего не трогало мое сердечко, ибо большая часть статей и информации крутится вокруг датавиза и ИИ, и создается ощущение, будто свежих идей нет и мы немного ‘в болоте’.
Однако на прошлой неделе вышла вот такая занимательная статеечка по архитектуре: https://thearchitectcoach.com/top-trends-in-data-analytics-governance-for-2026-2028/
В ней декларируется успех новой модели, которую скромно назвали ‘операционная истина’: стабильный смысл по всему предприятию, дисциплинированное движение данных, инженерная надежность и проверяемые решения.
Ну то есть никакого супер-упора на data governance, суверенитет, качество данных и ‘нужно больше ИИ’.
Статья очень стратегическая, в ней нет привычного нам разбора тактических шагов -только прогноз на удачную стратегию и сборка модных сейчас дата-трендов с их экстраполяцией на будущее.
Но что важно: я сама сейчас озабочена такими штуками, как ‘интеграция с нулевым копированием’ и построение AI-архитектуры с полным отходом от суждений, которые может родить этот AI. В общем, мне откликнулось, мой рекомендасьон.

The Architect Coach | Gen AI Leadership & Strategy Coach

Top Trends in Data, Analytics & Governance for 2026–2028

Data is entering a new phase inside the enterprise—not because we found a better place to store it, but because the way it is created, consumed, and governed has changed. A decade ago, software ate the world. Now, workflows are eating data. Data used to be…

❤14👍7🔥5

2.91K views07:52

Дашбордец

Котятки🐱,
Я почти не умею расставаться с любимыми дашбордами или витринами данных, поэтому пытаюсь впихнуть в инциденты то, что близко к change requests, да и сами CR активно приветствую. Короче, пытаюсь продлить жизнь любимых поделок: живите, дашики)).
Для такого поведения есть и достаточно околонаучное обоснование -колесо смерти данных, в обобщенном виде: https://brianbalfour.com/essays/growth-data-mistakes . В него достаточно сложно не войти, скажу я вам)
В чуть более расширенном виде его неплохо описали вот в этой статье на Medium, буквально разжевав основные ловушки: https://medium.com/craftingdataproducts/the-data-death-cycle-6b10ef261d8e

Brian Balfour

How You Battle the "Data Wheel of Death" in Growth — Brian Balfour

Data Isn’t Constantly Maintained -> Data Becomes Irrelevant / Flawed -> People Lose Trust -> They Use Data Less If the above looks familiar, you’re not alone. I estimate that greater than ⅔ of data efforts at companies fail. This is trouble because data…

👍9🔥7❤3

2.27K views07:40

Дашбордец

Котятки,
Я, наверное, мамонт, и предпочитаю изоляцию сред.
А вот новенький Qlik Sense нежно шепчет мне, что все это уже устарело, не нужен мне отдельная VM, ведь я могу делать «спейсы» в рамках одного инстанса и так имитировать разные среды.
Для меня это централизация (физическая), а промо-материалы говорят, что наоборот, децентрализация (логическая). Разные пласты реальности.
Также и Self-service, там тоже есть в процессах разные логические пласты и , имхо, в зависимости от религии архитектора песочницу можно организовать очень по-разному.
Продолжая классную историю ‘Давать ли пользователям sql в зубки или централизовать все и организовать governance’, почитываю утром вот эту статейку:
https://dataopsleadership.substack.com/p/data-death-cycle-the-silo-trap

Substack

Data Death Cycle: The Silo Trap

How to avoid common self-service pitfalls

🔥7👍3❤2🤔1

2.59K views08:02

Дашбордец

Котятки,
Чтение статеек и гайдов вряд ли подготовят вас к тому, с чем придется реально столкнуться на онбординге, особенно когда вы джун. Получение доступов к средам, трекинг, code style guides, чтение документации ,- это цветочки. Первые задачки с хз каким ТЗ, первые фейлы, вечно занятые коллеги, коммуникации с бизнесом, когда тебе просто не отвечают и всё тут, - добро пожаловать в мир аналитики:) Я сама в свое время долго училась балансу, - когда нужно подождать, а когда, наоборот,дожать.
Я училась опытным путем. Потом пришли очные мастер-классы. А теперь есть нормальные вебинары, где спикеры делятся живым опытом.
17 февраля ждем вас на вебинаре «Аналитик данных изнутри: онбординг, задачи и роль в команде». Нина Гусева (кстати, она работала в MyGames, я с теплом вспоминаю вайб, лучший офис в моей жизни) расскажет, как устроена работа аналитика изнутри - когда уже оформили и в зубы дали нейросеть и надо бы понять, что дальше. Вместе с вами разберут первые недели на работе аналитика: что ждут, как не провалиться.
Линк на регистрацию: https://clc.to/erid_2W5zFJdD7e8

Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFJdD7e8

🔥15👍5❤2

2.64K views09:41

Дашбордец

Forwarded from Ментальные модели

Для любителей дата-визуализаций

Здесь собрана интерактивная визуализация всей истории западной философии с возможностью простроить связи, спорные моменты, зарождение и развитие теорий и идей.

Автор работает над этим проектом уже 12 лет.

Единственное – очень плохо работает скролл, но, возможно, это мой браузер Comet не очень подружился с майндмэпом.

🔥17❤11👍7

2.27K views06:40

Дашбордец

Котятки🐱,
Тема последних двух недель у меня: как дать пользователям привычные UX-паттерн, полностью изменив технологию под капотом.
Пользователи у меня уж очень полюбили SSAS-кубы с подключением экселя как эндпоинта.
Интересные факты:
1)Qlik Sense обладает особой магией и может быть неотличим от экселя
2) Если подшаманить с Qlik Automate, можно делать обновляемый экспорт в Excel
3) К экселю можно подключить опубликованную в рабочую область модель данных Power BI , и визуально он почти-почти как куб
Казалось бы, зачем так извращаться, если можно сказать ‘Вот новый BI-инструмент(ы), берите что дают?’
Но увы, время такое, что дашборд может генерировать и ИИ : BI гоняется за пользователями, а не они за нами)

GitHub

GitHub - Fotian/KlikSheet: Multi-Function Spreadsheet extension for Qlik Sense

Multi-Function Spreadsheet extension for Qlik Sense - Fotian/KlikSheet

🔥9👍8❤7

1.84K views14:02

Дашбордец

Котятки🐱,
В моей практике не первый раз встречаются апплики и области Power BI с запутанной моделью. Обычно для появления этих клубков ужаса несколько причин - старая команда ушла, новая не стала делать рефакторинг и просто нашлепала сверху меры, проблемы с производительностью решались не системно, а локальными костылями и пр.
Короче, поддерживали как могли.
Как правило, команды начинают копаться в этом либо руками, либо спец инструментами типа такого:
https://fabric.guru/measure-maze-visualizing-measure-dependencies-using-semantic-link-network-analysis

И потом приходят к классическому артефакту - data dependency graph.
Я веду сейчас самый простой и универсальный, вот по этой методике, минимумом атрибутов и слоев: https://philarchive.org/archive/NAVACF
Но он подходит, если у вас чисто DWH и контроль за эндпоинтами:)

🔥8❤6👍2

1.93K views10:18

Дашбордец

Котятки🐱
Я по качеству данных всегда иду простым путем - создание DQ-policy as a layer и ставлю какую-то отдельностоящую коробочку или изолированное решение: в любимках у меня Great Expectations как ядро всяких DQ-коробочек, но кто что любит, тут вкусовщина: https://www.kdnuggets.com/5-python-data-validation-libraries-you-should-be-using
В этом сезоне у меня сошлись в команде три парадигмы, и команда тоже разделилась на три части:
-одна топит за уменьшение скорости вставки данных и работу с целостностью на уровне ключей там, где у нас слой datamarts, типа так: https://chat2db.ai/resources/blog/primary-and-foreign-keys
-вторая - моя, но я в одиночестве и без адептов) Централизация функции качества данных почти всегда ведет к росту затрат, увы.
-третья перешла в религию пооперационной истины (о чем я писала выше) и предложила вставить шаблоны DQ прямо в пайплайны как обязательные элементы. Динамические скрипты подъехали незаметно, что их))
Сижу на развилке, дальше все интереснее и интереснее.
Из новенького: открыла для себя портал Data Quality Pro, у них концептуальный блог, не гайдлайны, но тоже занимательно: https://www.dataqualitypro.com

KDnuggets

5 Python Data Validation Libraries You Should Be Using - KDnuggets

These five libraries approach validation from very different angles, which is exactly why they matter. Each one solves a specific class of problems that appear again and again in modern data and machine learning workflows.

👍9🔥5❤4

1.47K views11:35

Дашбордец

Котятки🐱,
Наверное, некоторые шишки надо набить, а ошибки - прожить.
Сейчас переписываю свой парсер с формата ‘куст’, в нечто, близкое вот к этой статье: https://habr.com/ru/companies/spectr/articles/815831/
Что могу сказать?
С точки зрения разработки и хранения, динамические решения даже в хранилище уже могут быть вариантом нормы.
Но увы, классическая BI-аналитика и BI-инструменты не предназначены для таких решений. Им на входе надо ‘знать, что придет’. Всякие лайфхаки типа Schema-drift и иже с ними на длинном горизонте очень неслабо деградируют по производительности.
Что делать, не знаю, но думаю)

Хабр

Магия динамического маппинга. Реализация универсальной обработки файлов нефиксированной структуры на Python

Привет! На связи Никита Ильин из Spectr , Backend-разработчик с опытом более 5 лет. Один из проектов, с которым мы работаем, — IBP-платформа для планирования и прогнозирования спроса и продаж в...

❤6🔥4👍2

1.43K views16:27

Дашбордец

Котятки🐱,
У меня сегодня всплыла сложная и специфическая темка - коммодификации данных , то есть превращение их в товар. Ну или актив,- более модное словечко.
Впервые я столкнулась с этим в 2014 году и не смогла выдохнуть,- на моих глазах разворачивалась история, когда обладание определенным массивом данных и пониманием, как его применить, давало нехилое преимущество в рыночной стратегии.
Сейчас этим никого уже не удивишь - есть и биржа данных, и коммерческие датасеты, и торговля API с консолидациями. Ну и скрытую коммодификацию никто не отменял - ряд узких IT-решений берут чисто за то, что их модели заточены годами операционных процессов и датасетов профильных компаний, и они учли все возможные узкие места. Это, фактически, способ подсмотреть к конкурентам или лидерам направлений, - Закон Конвея пока еще работает.
Но сегодня я уже думаю о коммодизации - страшилке, что восприятие данных как актива подрывает понятие конфиденциальности и безопасности.
В общем, как говаривал однажды наш безопасник, некоторые данные не надо собирать даже в эксельку. Пусть валяются.

Forbes

Council Post: The Massive Implications Of Data Becoming A Commodity

As data becomes increasingly commodified, businesses have to adjust.

🔥7❤4👍1

1.6K views07:30

Дашбордец

Котятки🐱,
Иногда артефакты, связанные с аналитикой, визуализацией, творчеством и вдохновением, мы находим в самых неожиданных местах.
Сегодня вот эта книжечка и ее побратимы были найдены в стоматологии)
Основную, «Кради как художник», я по-прежнему нежно люблю, но «Покажи свою работу» тоже неплоха.

❤12🔥8👍2

1.69K views09:56

Дашбордец

Котятки🐱

Если в BI вдруг начинает ощущаться, что вы не аналитик, а оператор ручного труда — возможно, это звоночек.

10 марта в 12:00 (мск) Yandex Cloud делает вебинар «API в DataLens – все пути автоматизации». Будут разбирать, как через Public API и API-коннектор убрать лишние телодвижения и перестать перекладывать одно и то же из раза в раз.

Автоматизация в BI — штука коварная. Пока всё стабильно — живём. Как только отчётов становится больше, пользователей — шире, а сценариев — сложнее, ручные действия начинают мстить.

Полезно будет тем, кто живёт рядом с данными: BI-аналитикам, дата-инженерам, разработчикам, архитекторам и тем, кто отвечает за аналитику целиком.

Участие бесплатное, но нужна регистрация.
Если автоматизация давно в бэклоге — хороший повод наконец туда посмотреть 👀

👍7❤5🔥1

1.46K views07:05

Дашбордец

Котятки,
На прошлой неделе в моей команде была очень крутая дискуссия - как хранить сущность с динамическим набором атрибутов (в зависимости от какого-нибудь атрибута этой же сущности). Обычно такие кейсы возникают, когда мы берем слишком высокий уровень абстракции (условно, не сущности ‘стол’ и ‘шкаф’, а объединяем в одну сущность- ‘мебель’).
Я люблю всякое хранение, основанное на идентифицирующих связях. Он мне напоминает data vault. Кто-то любит EAV .
До 24 года я очень любила БД Cassandra для таких кейсов. Отсутствие гибкости компенсировалось скоростью работы в конкретно задачах с динамическими атрибутами. Моя любовь бы и дальше продолжалась, если бы не драматическая ситуация с удвоением данных,- увы, тут эта базеночка явно не пушка, однажды начисто парализовала чтение.
Линк на почитать: https://habr.com/ru/companies/tbank/articles/951772/

Хабр

Что нужно знать системному аналитику о Apache Cassandra

Всем привет! Я Илья Глазунов, системный аналитик в проекте карточного хранилища T-Pay Online — быстрого способа оплаты для наших клиентов. В качестве БД в проекте хранилища мы используем Apache...

❤7👍5🔥2

1.25K viewsedited 14:33

Дашбордец

Forwarded from Диаграммы и презентации

Спешу поделиться потрясающим проектом Фабиана Ланга.

Дизайнер и аналитик Фабиан Ланг 3 года работал с открытыми источниками, архивами и различными экспертами, чтобы получить уникальные наборы данных о природных и человеческих явлениях, связанных с Альпами. В результате получился 200-страничный сборник из 100 визуальных историй, где данные превращены в наглядные визуализации.

Проект охватывает такие темы, как:
- жизнь бородатого стервятника (GPS-трек)
- прошлое и будущее крупнейших альпийских ледников
- биоразнообразие на основе 30 000 наблюдений
- сосуществование людей и волков
- изменение климата, энергетический переход, распространение фамилий по высоте и др.

Это не просто визуализация гор - это визуализация взаимосвязей между средой, биоразнообразием, климатом и людьми. Данные становятся языком, с помощью которого читатель узнает и чувствует Альпы, а не просто читает сухие цифры.

Проект был отмечен рядом наград за сочетание дизайна, аналитики и ясного визуального языка.

Обязательно посмотрите, вдохновитесь
➡️https://www.fabianlang.net/schweizer-bergwelten/

🔥16❤8👍1

1.45K views10:51

About

Blog

Apps

Platform