Данные в ДейSTвии

ИИ для анализа данных

🤖

Использовал связку Gemini3 Pro + RStudio для анализа данных.
В результате анализ ускорился раз в 10 🚀 (по сравнению с вычислениями в Excel, конечно 😊)

Язык R- это язык созданный именно для работы с данными и их анализа. В одну строчку можно посчитать статистические метрики и вывести график. А RStudio - это IDE (интерфейс) для разработки на языке R

Почему Gemini, а не ChatGPT? Потому что Gemini 3 с первого раза пишет код правильно ❤️❤️❤️
Видимо сказывается то, что он используется в Gemini Code Assist и обучен на большой кодовой базе.

В итоге я действую так :
1) прошу Gemini написать код на R
2) вставляю код в RStudio и выполняю
3) иногда тюню код под себя - названия переменных, фильтры добавляю, еще что-то

Исходные данные: файл Excel с датами перехода задач по статусам. С пропусками, со сбитой хронологией, с непонятными workflow и тд и тп - в общем, данные кривые и косые изначально. В них еще предстоит разобраться.

Действуя вышеописанным образом я за 1 час создал код который:
1) С помощью цепи Маркова определяет наиболее вероятный workflow на основе данных Excel

2) Считает Customer LT и строит графики распредения, отмечает на них медиану и другие нужные мне метрики

3) Раскладывает графики LT Scatterplot по годам и отмечает медиану и Trimean

4) Рассчитывает децили и выводит график функции сдвига по децилям - в абсолютных значениях и в %

5) Вычленяет математически моды (пики) распределения и отмечает их на графике распределения

6) Ищет значения аномалий (больше 95% перцентиля), отмечает их на графике LT Scatterplot по годам

Ну просто песня! ❤️🤯
Так быстро я еще никогда не анализировал данные по 10 командам - за 1 день

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥19👍5❤1🥰1🦄1

908 viewsВасилий Савунов, 11:05

Данные в ДейSTвии

Не знаете где такую книгу взять? 😊
Говорят - хит сезона 😂

🤣11🔥3❤2🥰1🦄1

710 viewsВасилий Савунов, 08:44

Данные в ДейSTвии

Умер Скотт Адамс 🪦 😭

😢11

850 viewsВасилий Савунов, 11:38

Данные в ДейSTвии

Данные в ДейSTвии pinned «Практикум «Данные в действии» — не просто воркшоп, а настоящее расследование для менеджеров 🕵️‍♂️ Зачем идти? Вы когда-нибудь смотрели на красивые графики в JIRA - все эти CFD, Lead Time, Throughput, и думали: «И что мне теперь со всем этим делать?» 🤔 Спойлер:…»

08:27

Данные в ДейSTвии

Реальные данные от реального клиента. Статистика за несколько лет. IT-департамент.

Давайте потренируемся перед будущим Практикумом.

Ваше мнение - что здесь происходит?
Напишите в комментарии 👇 как бы вы охарактеризовали динамику происходящего по годам?
А если сравнить Upstream и Downstream, и на Customer Lead Time посмотреть, что скажете?

Расскажите ваши версии, а я потом расскажу, что я увидел на этих графиках. И как это соотносится с реальной ситацией

PS кто затрудняется - в комментарии скину ссылку на инструкцию по анализу Lead Time Scatterplot

❤1🥰1🦄1

775 viewsВасилий Савунов, 08:44

Данные в ДейSTвии

YouTube

🤖 ИИ-переполох под Новый год: Прожектор Сэма Альтмана #3

Восстание машин не случилось, но в офисах всё равно подгорает.
Пока вы отдыхали на НГ, нейросети переписывают правила игры. Обсуждаем, как выжить в мире «черных ящиков» и не стать жертвой «всеобщей джунизации».

В этом выпуске:
- Почему разработчики теперь…

А между тем, под Новый Год мы записали новую серию ПрожекторСэмаАальтмана - про то, что ИИ делает с миром, и как люди реагируют на эти изменения

В этом выпуске мы решили не привязываться к конкретным цифрам и новостям, а просто подвести некоторые ИИ-итоги 2025 года.

В этом выпуске:
➡️ Почему разработчики теперь кодят быстрее, чем продакты успевают думать и приносить новые идеи в бэклог?
➡️ Как продакты с помощью вайб-кода создают работающие прототипы вместо ТЗ
➡️ Зачем рынку нужны «реаниматоры» кривого вайб-кода?
➡️ Лайфхаки для защиты от прохождения собеседований с помощью ИИ
➡️ Смерть Agile? Станут ли команды микроскопическими и почему стабильность больше не в моде.
➡️ Кибер-саботаж: зачем пользователи кормят ИИ «отвратительной датой» и портят модели.
➡️ Узнайте, как не превратиться в простого «оператора черного ящика» в 2026 году

Говорим свободно, с юмором, в меру собственного понимания происходящего.

https://youtu.be/sguUHwmCHNQ?si=wXdJ2D6-3UG0dAVN

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4🎉4🥰1

1.91K viewsВасилий Савунов, edited 14:46

Данные в ДейSTвии

487 viewsВасилий Савунов, 10:51

Данные в ДейSTвии

Последний пост был 23 января, куда делся автор? (Спойлер: цифровая археология, вайб-кодинг и HR)

Я не ушел в монастырь, я ушел в глубокий R&D.
Проверял, на что способен эксперт в 2026 году, вооружившись ИИ, здравым смыслом и прошлым опытом.

Итоги месяца (выбирайте тему для лонгрида 👇)

1. Process Mining в помощь канбанисту 🕵️‍♂️
Дано: 10+ команд, 12 тысяч строк логов и полный разнобой в workflow
Задача: Найти реальный Commitment Point и построить аналитику (Upstream/Downstream Lead Time).
Выход: С помощью Gemini реализовал алгоритм Transition Analysis. Он вычислил реальные Commitment Point, игнорируя хаос в Jira. Дальше — дело техники.

2. Импортозамещение Канбан-игры 🎮
Дано: Любимая Канбан-игра для тренингов попала под VPN. Заменить нечем.
Выход: Психанул, открыл Cursor и сел писать свою версию (с блэкджеком и 💃)
Итог: За 2 часа «вайб-кодинга» создал рабочий прототип. За 4 часа — 90% механик. Скоро релиз! Хотите попробовать? 😁

3. Вероятностный Анализ на R 🎲
Задача: Обработать огромный, пятилетний массив данных клиента по 10+ проектам. LLMки захлебываются, вручную делать - годы.
Выход: Делегировал нейросети написание кода на R для подготовки и анализа данных. Код был написан и отлажен за 4 часа. Итоговый анализ всех данных занял 2 дня. Клиент в восторге от точности попадания и инсайтов.

4. Практикум в BigTech 🏢
Дано: Крупная IT-компания, 10+ зубастых менеджеров.
Задача: Научить анализу метрик.
Что сделал: Сперва играли на чужих данных — было весело. Когда загрузили свои — случился ледяной душ. Видеть реальный Lead Time страшно, как прием у стоматолога, но лечить надо.

5. Инсайт: Смерть обучения как поощрения 💼
Задача: Понять через интервью с HR, что творится с обучением.
Инсайт: Бюджеты на «счастье сотрудников» закрыты. Теперь обучение — только под жесткий бизнес-заказ и фин. обоснование.

О чем написать подробнее? Жмите реакцию 👇 или пишите в комментарии:
🗿 — Археология Commitment Point в JIRA
🆒 — Моя игра и как я ее делал
🦄 — Прогнозы на R
🙊 — Инсайты в HR
👍 — просто порадоваться за автора 😊

Please open Telegram to view this post

VIEW IN TELEGRAM

🆒27🗿23👍9🦄9🙊8❤1🥰1

525 viewsВасилий Савунов, edited 10:52

Данные в ДейSTвии

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Шедевр, по-моему! 😂

Если ваш начальник не понимает про WIP-лимиты, то попробуйте показать ему это видео 😂😂😂

(c) автор: https://t.me/roricrisuet

❤14🤣8🔥5👍3👎2🥰1🤯1

1.26K viewsВасилий Савунов, 14:02

Данные в ДейSTвии

Данные в ДейSTвии pinned a video

10:14

Данные в ДейSTвии

🗿

JIRA-археология с помощью Process Mining ⛏️ Часть 1.

Кратко: 27 000 строк логов 📜, 5 лет хаотичных процессов 🌪, конец года ❄️ и Process Mining⛏️

Сеттинг:
Огромное подразделение разработки Data-продуктов в одной огромной компании 🏢
20+ внутренних заказчиков, 10 направлений разработки.

😤 Бизнес жалуется: «Мы не понимаем, когда Data-подразделения сделают задачи! Их обещания по срокам не сбываются! Мы не знаем как нам выполнять обещания, которые мы даем нашему руководству».

🛡 Департамент Data-продуктов оправдывается: «У нас все сложно, контекст меняется часто, а бизнес постоянно меняет приоритеты! Проектов больше чем людей!»

🆘 Запрос классический, но болезненный: «Помогите нам разобраться, кто прав, расскажите как нам сделать работу прогнозируемой».

На дворе декабрь ❄️, конец года, у всех горят дедлайны 🔥. Доступ к людям ограничен, «посидеть и поговорить» с представителем каждого из 10 проектов нереально! 🚫

У меня на руках — выгрузка из трекера: 27 000 задач за 5 лет 💾

🕵️‍♂️ Проблема: Вавилонская башня в Excel

Открываю файл лога статусов и вижу:
1️⃣ 30 разных статусов, из который часть используется в одних проектах, часть в других. Часть вообще не используется.

2️⃣ 4 статуса, означающих закрытие задач 🏁

3️⃣ 5 статусов означающих на открытие задачи 🚦

4️⃣ 7 статусов-буферов 🛋

🤯🤯🤯🤯🤯

Но главная проблема: десяток промежуточных Work-статусов, среди которых спрятана точка принятия обязательств (ТПО)📍!

А без знания точки принятия обязательств не возможно понять границу между ⬆️Upstream (выбор и подготовка задач) и ⬇️Downstream (разработка).

Анализировать вручную 27 тысяч строк — это месяца два работы 🐢
Напомню - декабрь, все в мыле 🧼, времени поговорить ни у кого нет. А тем более разобрать 10 разных проектов.

🤖 Решение: эвристики Process Mining
Я решил не гадать, а использовать два алгоритма Process Mining, адаптированные под Kanban. С помощью ИИ-шки написал код на языке R и прогнал данные.

🎰

Алгоритм 1. Trace Variant Analysis (Анализ вариантов процесса)
Для начала я взял каждую задачу и по последовательности дат в логе, восстановил её реальный путь по статусам.

Получилась таблица из двух полей:

🆔 ID задачи,
🔀 Workflow ( последовательность статусов )

Посчитал частоту повторения одних и тех же workflow - получил список частотности workflow 📊

1) 1234 раза:
"Open -> Ready To Develop -> In Progress -> Done"

2) 976 раз:
"Open -> In Progress -> Done "

3) 540 раз:
"Open -> Analysis -> In Progress -> Close "

И тд

Очевидно самый частый workflow, который включает в себя статус открытия, промежуточные статусы и статус закрытия - скорее всего и есть основной 🏆

😱 Сюрприз: Оказалось, что примерно 20-30% задач в каждом проекте имеют путь "Open -> Closed".
Это «шум», мусорные задачи или массовые чистки бэклога. Они искажали статистику, поэтому пришлось их отфильтровать.

[продолжение в следующем посте] 👇

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍4❤2🥰2

349 viewsВасилий Савунов, edited 13:27

About

Blog

Apps

Platform