What does data mean?

Привет, Хабр! Меня зовут Денис, я работаю продуктовым аналитиком в Delivery Club. Наша команда за последние полгода провела около сотни продуктовых исследований данных, которые способствовали...

431 views10:56

Forwarded from Канал Алексея Куличевского (Alexey Kulichevskiy)

Николай спрашивает:

> Как развивать в себе умение генерировать какие-то гипотезы, когда смотришь на данные. Все очевидные, типа сколько заказов у нас из города N быстро заканчиваются, да и ценность их не всегда велика. Базовые все проработали, а что дальше? Особенно когда нет каких-то видимых проблем?

Предположу, что называется это аналитическое мышление. И конечно есть курсы, лекции и все такое. Но курсы во-первых часто про общие какие-то вещи, а во-вторых не сильно много времени чтобы их проходить. Если уточнить вопрос, как развивать это умения находясь в рабочем потоке?

Ой я знаю! Никак!
С помощью данных гипотезы надо не генерить, а проверять.

Есть такой миф о работе с данными, типа существуют такие супер-умные датасаентисты, которые умеют смотреть в ~~матрицу~~ данные, применять хитрые матметоды, доставать скрытые закономерности, и волшебным образом делать так, чтобы расходы снижались, а продажи росли.

На самом деле все происходит не так. Конечно, бывает, что случайно замечаешь аномалию в данных, раскапываешь ее и находишь суперское решение. Но это как в лотерею выиграть.

Гораздо надежнее сначала думать о бизнесе и все гипотезы генерить на основе здравого смысла.

Специально в честь такого замечательного вопроса достал старую заметку из уже закрытого курса: https://smysl.io/blog/figure-out/

437 views17:12

What does data mean?

https://habr.com/ru/company/alfa/blog/684774/

Хабр

Как и зачем мы начали искать бизнес-инсайты в отзывах клиентов с помощью машинного обучения

Естественный источник обратной связи для любой компании — отзывы их клиентов. И Альфа-Банк не исключение: за год мы собираем больше 100 млн оценок по различным каналам и продуктам. Но среди этих...

481 views18:27

What does data mean?

Forwarded from Автостопом по аналитике

Выгрузила в ноушн мысли по составлению дерева метрик.

В основном - для продуктовых аналитиков Додо, чтобы валидировать их понимание иерархической реальности.

Но в целом, если вы только начали думать в сторону иерархии метрик в своём продукте, то вам тоже зайдёт.

498 views07:40

What does data mean?

https://systems.education/requirements-never-changes

systems.education

■ Статья. Требования не меняются, это мы их недовыявили

10 техник проверки полноты требований

503 views15:24

What does data mean?

490 views14:56

What does data mean?

https://t.me/varim_ml/66

Варим МЛ

В погоне за заветной тысячей подписчиков написал немаленький пост про ML-мониторинг. Рекомендую насладиться за бокалом грузинского вина, армянского коньяка или крепкого казахского кумыса.

#Жека #mlops

493 views19:51

What does data mean?

https://habr.com/ru/company/yandex_praktikum/blog/697092/

Хабр

Какую математику сегодня проверяют работодатели при найме Data Analysts & Scientists

Всемирный экономический форум в своем прогнозе самых востребованных профессий до 2025 года поставил Data Analysts & Scientists на первое место рейтинга. За последние три года в России число...

526 views17:49

What does data mean?

https://habr.com/ru/company/tinkoff/blog/696756/

Хабр

Как определять пользовательские намерения, о которых мы узнали 5 минут назад

Привет! Меня зовут Даниил Цимерман, я R&D-инженер в NLP-отделе Тинькофф. Недавно я выступил на конференции DUMP и рассказал, как мы решали задачу определения интентов пользователей в чате в...

569 views13:49

What does data mean?

Конспект лекции "Что должен знать о финансах каждый product-менеджер и аналитик?" с открытого трека Матемаркетинга:
https://messy-caption-8ff.notion.site/product-4a641832018240558a7ceab4a9a5e97b

messy-caption-8ff on Notion

Что должен знать о финансах каждый product-менеджер и аналитик? | Notion

Юнит экономика и P&L

696 viewsedited 13:29

What does data mean?

https://habr.com/ru/company/X5Tech/blog/596279/

Хабр

Стратификация. Как разбиение выборки повышает чувствительность A/B теста

Всем привет! На связи команда ad-hoc аналитики X5 Tech. Сегодня подробно обсудим применение стратификации для повышения чувствительности оценки AB экспериментов. Вы узнаете: что такое...

796 views15:12

What does data mean?

https://sqlzoo.net/wiki/SELECT_from_Nobel_Tutorial#Harder_Questions

706 views17:00

What does data mean?

https://habr.com/ru/company/tinkoff/blog/579794/

Хабр

Spill-файлы в Greenplum

Если вы читаете эту статью, скорее всего, с некоторой периодичностью сталкиваетесь со spill-файлами, а может, и генерируете их. В сети мало статей и постов на эту тему, поэтому я решил написать здесь...

789 views19:25

What does data mean?

Forwarded from Борис опять

# Серия постов: Минимальные знания Software Engineering для Data Scientist

Минимальный список необходимых тем по инженерии для DS. Со ссылками и упражнениями для закрепления. Расчитан на месяц очень неспешного изучения.
0. Введение и зачем это может быть нужно
1. Часть 1
2. Часть 2
3. Часть 3

821 views16:24

What does data mean?

https://habr.com/ru/company/postgrespro/blog/697300/

Хабр

NULL-значения в PostgreSQL: правила и исключения

Навскидку многим кажется, что они знакомы с поведением NULL-значений в PostgreSQL, однако иногда неопределённые значения преподносят сюрпризы. Мы с коллегами написали статью на основе моего доклада с...

875 views15:41

What does data mean?

https://medium.com/@hnasr/following-a-database-read-to-the-metal-a187541333c2

Medium

Following a database read to the metal

App to DB to OS to SSD

1.02K views15:57

What does data mean?

https://hakibenita.com/sql-for-data-analysis#example-train-test-split-with-sql

Hakibenita

Practical SQL for Data Analysis

What you can do without Pandas

1.1K views13:49

What does data mean?

Forwarded from Chief Philosophy Officer

Забавно, но становление функции исследований в отдельно взятой компании проходит те же этапы, что проходила наука на протяжении последних столетий:

Догматизм средневековья - отцы-основатели компании все знают, они нас и ведут в светлое будущее
Ранний позитивизм Конта - Соберем побольше всяких разных данных в одну большую базу и сразу как все поймем и про рынок, и про пользователей.
Фальсификационизм Поппера - просто собирать все подряд данные в мешок мало, нужно еще проверять. Все покроем АБ-тестами!
Постпозитивизм Куна - А почему мы именно так формулируем свои гипотезы. А именно так формулируя, например, кто наша ЦА, мы случайно не предопределяем факты о ней, которые можем найти?
Релятивизм Блура - кстати, а что такое "факт", нам нужны именно такие "факты"?

423 views18:10

What does data mean?

https://habr.com/ru/companies/ods/articles/544208/

Хабр

Причинно-следственный анализ в машинном обучении

Что появилось первым: курица или яйцо? Статистики давно уже нашли ответ на этот вопрос . Причем несколько раз. И каждый раз ответ был разным. А если серьезно, то для машинного обучения становятся все...

435 views20:56

What does data mean?

Forwarded from Не AБы какие тесты

Не пропускаем понедельник, товарищи-статистики!

Хотел продолжить серию про секвентальное тестирование, но уже довольно свежий (!) и интересный алгоритм показался мне прям сильно сложнее для объяснения, чем тот, что был ранее, поэтому сегодня поговорим про оценку кумулятивного эффекта - то, как несколько изменений, по которым были тесты, повлияли совместо.

Классическая и очень простая история это выделить глобальную контрольную группу, - holdout, - на которую какое-то время не будет распространяться никаких улучшений.

Но что если такую группу выделить по каким-то причинам невозможно, а оценить нужно?
Причины могут быть от технических до ~~прое~~ "забыли".

В начале года столкнулся с тем, что нужно было продумать, как оценить кумулятив при сценарии невозможности выделения holdout'a. И на методологию от Airbnb, которая мне очень пришлась по душе (так как математически выведена оценка!), меня навел Влад. Статья ниже написана в том числе благодаря его материалам, большое ему спасибо!

Статья начинается со слов "Winner's Curse", Проклятье победителя: смысл в том, что в рамках аукциона, где продается неких товар, победитель аукциона (а это часто наибольшая ставка) скорее всего заплатит больше, чем фактическая стоимость товара. Так и в рамках наивного суммирования эффектов от прошедших тестов - скорее всего оценка будет завышенной.

Разберем Winner's Curse: Bias Estimation for Total Effects of Features in Online Controlled Experiments

Telegraph

Оценка кумулятивного эффекта

Объяснение будет следовать согласно докладам как Влада, так и ребят из Airb'n'b. Пускай у нас есть ряд экспериментов, в которых мы получили следущее: Observed - это та дельта, что мы наблюдаем, а True - это истинная дельта, "что есть на самом деле". Как видно…

458 views07:04

What does data mean?

Завтра рассказываю про боли выбора абшницы при ограниченных ресурсах

473 views12:13

About

Blog

Apps

Platform