Я твой продукт анализировал
1.67K subscribers
104 photos
8 videos
3 files
50 links
Про продуктовую аналитику в IT, мысли, методы анализа и алгоритмы. Всё, что ты хотел знать, но стеснялся спросить.

ЛС тут: @de_kn
Download Telegram
Приветики, а помните в прошлом году в мире многие страны тестировали 4-х дневную рабочую неделю? Они теперь периодически постят результаты, и там прям прекрасное 🤩

Вот из недавнего по Великобритании:

🔵Большинство участвующих компаний в Великобритании сделали эту политику постоянной. Из 61 компании 54 (89%) продолжают придерживаться этого графика, а 31 компания (51%) официально перешли на четырехдневную неделю.

🔵82% компаний отметили улучшение благополучия сотрудников, а 50% — снижение текучести кадров. Позитивное влияние на организацию отметили все опрошенные руководители, причем более половины описали его как «очень положительное».

🔵Основные улучшения наблюдались в work-life балансе и физическом / психическом здоровье.

🔵Там даже зафиксировали улучшение качества воздуха. Видимо, потому что все душнилы остались по домам.

Ждём когда эта практика докатится и до нас? 🍿
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾31🔥9🦄8👍2😎1
Наткнулся в твиттере на чела, который занимается с ментором, пытается залететь в аналитику. Ментор типичный волчара. План у чела такой — залететь на 150к, а через годик метить в 300к.

Я с этого дико проорал, конечно.

Окей, ты накрутишь годик-два на старте, чтобы тебя просто не скипнули на отборе, вопросов нет. Ну есть, конечно, но отбор сломан, и тут какбэ не до этого. А дальше то как? Сидишь ты значит и весь год адхоки перекладываешь. Ну нарисуешь себе +3-4 года.

Но, внезапно, на хаймиддл и выше собесах никто не спрашивает базу, всем похер на твою статистику, скуль (который учится за неделю) и питон (на полторы нужных библиотеки). Там за бизнес решения диалог. Про реализацию нестандартных проектов и про кейсы с деталями. Любой нанимающий тебя расколет если просто будет внимательно слушать.

Челу удачи, конечно, а ментору респект за маркетинг. Но это так не работает.
👍31
Приветики, скучаете тут сидите? А мне некогда, попробовал я значит такое стильное, модное, молодёжное развлечение как… гольф. И чёт меня затянуло прям. Я в клубе прописался. Такой кайф 🙂

Ещё пару лет назад бы мне кто-то сказал, я бы подумал чё за прикол, дедовская игра. А оно вообще не так просто, как кажется. В одну только терминологию пока въедешь, на своём языке говорят чуваки: “фулл-свинг драйвером с ти на фервей, чип веджем на грин, пат до бёрди и два до пара”. Но это сильно проще чем body-control при ударе, когда любое миллимитровое отклонение от техники закручивает мяч куда угодно, но не куда тебе надо.

В общем моё.

А завтра финальная игра на грин карту. В 6:30 утра 😩
👍10🔥9
Здоров, бандиты 💅
😱33👀23🍾15🔥7🤝7🦄5🤔3🤯321🤷‍♂1
Ну рассказывайте, как жизнь, нашли работу или бросили это гиблое дело и пошли дальше курсы проходить?

Время открыть чат 🍿
📌 Винзоризация

Все тут итак вкурсе, что для нормального анализа, данные требуют какой-то предобработки. Один из пунктов на этом этапе — работа с выбросами. Что с ними делать? Ну чаще всего это либо очистка по IQR/SD/Кастом, либо какое-то преобразование всего скопа (типа логарифмирования), либо сохранение выбросов, если они являются каким-то значимым бизнес-сигналом.

Но не многие вкурсе о таком хитром методе как винзорирование (или винзоризация, кому как нравится). Смысл данной процедуры одновременно в том, чтобы подчистить выбросы и не потерять наблюдения. Если на пальцах, то работает так — берём набор данных, выбираем границы-перцентили и преобразуем вылеты за них в значения по верхам-низам.

Т.е. вот есть у нас ряд значений какой-то метрики (как самый частый представитель числовых рядом): 1, 2, 3, 4, 5, 2000. Тут 2000 явный выброс. В 90-м перцентиле, например, граница у нас на 5, значит всё что выше этой отметки преобразуем в это значение, и 2000 через вжух становится 5. Теперь у нас ряд 1, 2, 3, 4, 5, 5.

И наблюдения остались, и выбросов нет.

Стоп, так мы же тогда горб на границе нарастим? Ага, функция может получиться некрасивой, плотность искусственной и нормальность, скорее всего, тоже потрачена. Но зато мы получим более устойчивый сет. Дисперсии и среднее будут менее дёргаными, а это зачастую намного важнее для тестов или моделей.

Более стабильная математика всегда лучше красивой картинки (даже если твой менеджер настаивает на обратном).
👍198🔥3
Приветики, рассказать вам про свой пет-проект, который зародился году так в 2016-м, в ленивую разработку перешёл в 23-м и вот сейчас уже крутится в стадии около релизной бетки?
38🔥21👍10🤷‍♂3
Чё там телега работает то?
👍22👎4🤔2😎2👌1
Тут между делом Posit выкатили новый IDE для аналитиков с поддержкой Python и R (Posit вообще лучшие в плане ide для работы с R) + с ноутбуками сразу (jupiter/quarto), встроенный гит, подключение своих агентов, дебагер новый. Красота вообще, я уже неделю залипаю, даже R Studio снёс за ненадобностью.

Воткнул свой ключ антропика на сонет, openAI пока не поддерживают официально, но можно закастомить. Новый gpt 5.4 (вчерашний) тоже потенциально бодро должен залетать.

https://posit.co/products/ide/positron/
👍5🔥1
📌 Обещал рассказать про пет-проект. Будет большой пост.

Часть 1/2.

Так вот, ещё как только я начинал работать в продуктовой аналитике, мне приходилось сталкиваться с АБ-тестами. Не скажу что я прям гуру этой темы или это мой основной фокус, но опыт какой-никакой и перетоптанных грабель за почти 12 лет имеется. В общем, почти с самого начала я эти все скрипты аккуратненько складывал к себе на гит и копил там разные методы на все случаи жизни.

💡 И уже тогда меня много раз посещала мысль написать какой-то оркестратор простейший а-ля if else, который бы просто переиспользовал заранее заготовленные методы под мои данные. Ну просто чтобы себе жизнь упростить и в ручную под каждый кейс не шариться по выбору методов. Но лень впереди меня родилась, поэтому это и оставалось долгие годы просто идеей.

🦄 А потом что-то произошло и я таки загорелся этой идеей снова, но в этот раз решил заморочиться. Подключил кореша, жёсткого инженера, который в основное время пилит какой-то сверхсекретный проект для оборонки США, чтобы сваять нормальную архитектуру на беке.

🎓 Потом нашёл пару заинтересованных действующих профессоров статистики из разных вузов, чтобы провалидировали/переписали всю математическую часть (опять же, я не то чтобы гуру в этой теме), от рассчёта базовых z-тестов, до Байесовских прогнозов и последовательных тестов. С их помощью прикрутил туда модуль препроцессора, который анализирует кучу характеристик распределения, от анализа разброса до симметрии, эксцесса и модальности. А уже на основе этого анализа препроцессор сам реша-а-а-ет как обрабатывать данные, чистить ли выбросы, нужны ли логарифмы или хрен бы с ним.

🤖 Ну и мы припахали Sonet для простой черновой работы по фронту и документированию всего этого безобразия.

В итоге получился движок для расчётов практически любых стандартных экспериментов.

Но только движок, хоть и бодрый, это всё таки не так весело. Потому как в индустрии в целом что ни компания то процессы через пень-колоду. Посидев, повспоминав прошлый опыт, выписав что нравилось и казалось удобным, а что мусор, я сформировал себе фреймворк по управлению гипотезами и экспами, который мне лично казался весьма удобным. Потом просидел вечерами/выходными в Axure (не даром я 4 года интерфейсы проектировал) и всё это упаковал в прототип. Потыкал, потестил, обкатал на бою, и отдал в разработку.

Так получилась полноценная платформа с UI и мат движком под капотом.

Основные фичи, которые мы туда навтыкали, по задумке должны охватывать начальную часть процесса (гипотезы, планирование) и финальную (анализ и хранение результатов), само сплитование мы специально обошли стороной, т.к. там геморой с серваками и скоростью работы.

Что в итоге получилось:
4🔥3
📌 Часть 2/2

🔖 Собственно, часть с дизайном. АБ-направление, как правило, это или отдельный подотдел внутри аналитического, или просто сайдквест аналитиков. А задачи им, обычно, поставляют заказчики в лице менеджеров, продактов, дизайнеров и т.д. Т.е. нужна какая-то общая точка доступа, чтобы они могли записывать свои идеи, планировать график и тд. Из этой логики выросли раздел “Гипотезы”, “Планирование”, “Оценка выборки” которые закрывают этап подготовки экспа.

🔖 Анализатор это итак понятно, тут особо не буду вдаваться в подробности, можно доку на сайте почитать, если интересно. Лучше расскажу как мы это дело связывали с контуром клиента.

Вообще есть 3 метода поставки данных в нашу систему.

1️⃣ Самый простой это просто загрузить CSV. Файл хранится локально на время сесии, закрыл вкладку - файл выпилился.

2️⃣ Второй, это настройка загрузки по АПИ по графику, условно вы складываете свои данные на наш защищенный сервак, они по пути шифруются и лежат пердят там 2 недели, потом автоматически выпиливаются. Но у вас есть прямой доступ к своей папке, так что можно удалить руками с нашего сервака когда вздумается. Метод простой, но жёсткие безопасники будут ругаться, если вы супер секретные ребята.

3️⃣ И третий, самый секьюрный, это развернуть раннер в своём контуре, движок сидит у вас, за данными ходит к вам, считает у вас, и кидает в облако только всякие доверительные интервалы да p-value, чтобы красиво было. Там просто докер-образ, который у себя разворачиваете, логируете и смотрите что уходит.

При настройке 2-м или 3-м методом, автоматически по графику обновления ваших данных катаются всякие последовательные тестирования и прогнозы куда вообще катится эксп и стоит ли его дожимать. Ну и SRM на лету чекает, чтобы быть уверенным что там нормально сплитуется всё.


И ещё потом накрутили по мелочи всякой косметики, типа раздел для заметок, библиотеку метрик для дизайнов, AI на базе GPT для интерпретации результатов человеческим языком, аггрегацию статистики для понимания куда вообще катятся наши эксперименты, где мы умеем, а где не особо, и пока простенький конфигуратор сообщений в корп мессенджеры, типа дайджестов для пингов команды, типа “На этой неделе катим вот это, а на прошлой завершились вот эти”.

Доступ ограничен ключами, сейчас подумываем о разделении корпоративных (платных, для работы с командой) и фри-прайвэт чисто для себя. Чтобы потыкаться надо запросить ключ через форму баг-фиксов (пока так, да).

Заточен под европейский рыночек, т.к. там сервак в Германии и страйп и юр лицо забугорное, но ру локализация имеется.

Ну и собственно, зацените что получилось, тыкайте, в РФ вроде работает 🙃

https://ab-labz.com/ru/
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍4🦄1
Я твой продукт анализировал
📌 Часть 2/2 🔖 Собственно, часть с дизайном. АБ-направление, как правило, это или отдельный подотдел внутри аналитического, или просто сайдквест аналитиков. А задачи им, обычно, поставляют заказчики в лице менеджеров, продактов, дизайнеров и т.д. Т.е. нужна…
Прикрутили типизацию аккаунтов, теперь в соло можно пользоваться без всяких ключей, с ограничениями на автоматизацию и приглашение юзеров, но самостоятельно покрутить расчёты через загрузку CSV можно, ну и хранить карточки тоже.

Получается такое карманное решение для быстрых рассчётов без заморочки чисто для себя, но, надеюсь, поможет бедным джунам, у которых в запасе не так много скриптов и понимания как посчитать результаты экспа, а менеджеру нужно уже вчера 😀
🔥92
runner_demo_experiment.csv
1.3 MB
А вот маленький демо датасет, если захочется глянуть как оно всё работает
6🔥1
📌 Про оценку направления экспериментов, 1/4

Я как-то недавно выступал на одной конфе, рассказывал про эксперименты (а про что ж ещё на конфах рассказывать), но не про духоту всякую, а про культуру, скорее. И там значит был у меня блок про то, как оценивать направление целиком. Понятное дело, что правильный ответ давно известен — “как карта ляжет, и хорошо если вообще хоть как-то оцениваете”, — но именно где-то там я вообще задался этим вопросом с точки зрения минимизации информации и одновременно её целостности.

Кароч суть да дело, накидал я вот такую систему, которая, вроде как, закрывает основные вопросы. Собственно тут ей и поделюсь.

Что вообще такое направление экспериментов под капотом? Ну глобально это что-то типа команды, со своими процессами, регламентами и нормативами. Каждая команда может быть разложена на 3 условных уровня:

🟡 Операционный (как хорошо вообще сама машина едет),

🟡 Продуктовый (а что именно эта машина везёт, куда и зачем)

🟡И бизнесовый (а по чём там литр солярки сейчас?).

И вот исходя из этой концепции и начинаем накидывать идеи.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2
📌 2/4, Операционный уровень. Эта часть про то, насколько оптимально расходуются ресурсы. В контексте экспериментальной бригады я бы выделил 3 ключевых показателя:

Утилизация слотов — насколько вообще у нас забит график тестирований, нет ли простоя или завала. Не проводим ли мы 2 экспа в квартал, при пропускной способности, например, 60 экспов за этот же период.

Тех. качество — доля экспов, которые отработали качественно технически, не провалились по srm, не пересоздавались потому что забыли что-то прикрутить в тестовый вариант и т.д.

Достаточность выборки — тут про долю экспов, которые идут в своём темпе, мы их не закрываем раньше срока и не передерживаем.

В совокупности по этим показателям мы можем ответить на вопрос, работает ли наша машина вообще, и насколько хорошо с т.з. операционки.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2