Сверка аналитики: почему “мы меряем всё” почти всегда превращается в миф
В 2026 я всё чаще вижу один и тот же сценарий: бренд, B2B-платформа или e-commerce действительно “настроили аналитику” — события льются в GA4, дублируются в Amplitude или Mixpanel, а отдельные команды ещё и ковыряют Heap для UX. В таблицах есть конверсии, в дашбордах есть воронки, в отчётах — уверенность. Но когда доходит до решений, выясняется простое: **мы не измеряем одну и ту же реальность**.
Я формулирую это как правило редактора стека: если у вас нет процедур “кто и как сверяет”, то стек превращается в набор источников правды, которые спорят между собой.
Что конкретно ломает согласованность — без морали, только практика:
— Семантика событий разъезжается. В GA4 событие называется “lead_submit”, а в продуктовой аналитике оно же считается “form_submit”, и при этом один и тот же пользовательный путь даёт разные “лиды”.
— Разные окна атрибуции. Last-click — это уже не единственный ответ, но команды до сих пор сравнивают метрики, построенные на разных правилах: где-то 30 дней, где-то только в рамках сессии.
— Серверная часть (server-side) не одинаково отражает источник. Часть команд гоняет идентификаторы через клиент, другая — подписывает события на сервере. Итог: расхождение по пользователям и ретеншену.
Моё наблюдение из проектов по e-commerce и B2B: когда мы запускаем сверку на одном и том же наборе сценариев (1–2 ключевых user journey), расхождения между GA4 и продуктовой платформой обычно находятся в коридоре 5–25%. Причём это не “ошибка на 1%”, а систематическое смещение: как правило, из-за того, что определения конверсий различаются хотя бы на уровне фильтров или дедупликации.
Как я предлагаю чинить это без “пересборки вселенной”:
1) Жёстко зафиксировать “словарь метрик” — события, параметры, что считается конверсией и где происходит дедупликация. Не в одном документе на 40 страниц, а в коротком контракте: event_name + параметры + правила исключений.
2) Ввести регулярную “аналитическую контрольную точку”: один и тот же список сценариев и контрольных выборок прогоняется везде (GA4 / Amplitude / Mixpanel / Heap — что у вас реально стоит) с единым эталоном. Если расхождение растёт — ищем причину, а не успокаиваемся.
3) Приоритет — на измерение результата, а не на накопление событий. В эпоху privacy-first атрибуции и инкрементальности (incrementality) ценность получает то, что можно защитить на уровне методологии: когортный ретеншен, повторные покупки, повторные обращения, вклад по периодам.
Сейчас, когда рынок уходит от “просто лида” к RevOps (общая ответственность маркетинга, sales и customer success за выручку), цена несогласованных определений растёт. Не потому что “аналитика плохая”. А потому что решения принимаются быстрее, чем успевают договориться о смысле. В таком мире стек не должен быть коллекцией инструментов — он должен быть системой измерения.
Если хотите, в следующем посте разберу, как я обычно строю “контрольные сценарии” для сверки в B2B (MQL/SQL уже не достаточно) и как корректно отличать продуктовые конверсии от маркетинговых.
Соседняя редакция @BeautyCasesRu недавно писала об этом под другим углом
В 2026 я всё чаще вижу один и тот же сценарий: бренд, B2B-платформа или e-commerce действительно “настроили аналитику” — события льются в GA4, дублируются в Amplitude или Mixpanel, а отдельные команды ещё и ковыряют Heap для UX. В таблицах есть конверсии, в дашбордах есть воронки, в отчётах — уверенность. Но когда доходит до решений, выясняется простое: **мы не измеряем одну и ту же реальность**.
Я формулирую это как правило редактора стека: если у вас нет процедур “кто и как сверяет”, то стек превращается в набор источников правды, которые спорят между собой.
Что конкретно ломает согласованность — без морали, только практика:
— Семантика событий разъезжается. В GA4 событие называется “lead_submit”, а в продуктовой аналитике оно же считается “form_submit”, и при этом один и тот же пользовательный путь даёт разные “лиды”.
— Разные окна атрибуции. Last-click — это уже не единственный ответ, но команды до сих пор сравнивают метрики, построенные на разных правилах: где-то 30 дней, где-то только в рамках сессии.
— Серверная часть (server-side) не одинаково отражает источник. Часть команд гоняет идентификаторы через клиент, другая — подписывает события на сервере. Итог: расхождение по пользователям и ретеншену.
Моё наблюдение из проектов по e-commerce и B2B: когда мы запускаем сверку на одном и том же наборе сценариев (1–2 ключевых user journey), расхождения между GA4 и продуктовой платформой обычно находятся в коридоре 5–25%. Причём это не “ошибка на 1%”, а систематическое смещение: как правило, из-за того, что определения конверсий различаются хотя бы на уровне фильтров или дедупликации.
Как я предлагаю чинить это без “пересборки вселенной”:
1) Жёстко зафиксировать “словарь метрик” — события, параметры, что считается конверсией и где происходит дедупликация. Не в одном документе на 40 страниц, а в коротком контракте: event_name + параметры + правила исключений.
2) Ввести регулярную “аналитическую контрольную точку”: один и тот же список сценариев и контрольных выборок прогоняется везде (GA4 / Amplitude / Mixpanel / Heap — что у вас реально стоит) с единым эталоном. Если расхождение растёт — ищем причину, а не успокаиваемся.
3) Приоритет — на измерение результата, а не на накопление событий. В эпоху privacy-first атрибуции и инкрементальности (incrementality) ценность получает то, что можно защитить на уровне методологии: когортный ретеншен, повторные покупки, повторные обращения, вклад по периодам.
Сейчас, когда рынок уходит от “просто лида” к RevOps (общая ответственность маркетинга, sales и customer success за выручку), цена несогласованных определений растёт. Не потому что “аналитика плохая”. А потому что решения принимаются быстрее, чем успевают договориться о смысле. В таком мире стек не должен быть коллекцией инструментов — он должен быть системой измерения.
Если хотите, в следующем посте разберу, как я обычно строю “контрольные сценарии” для сверки в B2B (MQL/SQL уже не достаточно) и как корректно отличать продуктовые конверсии от маркетинговых.
Соседняя редакция @BeautyCasesRu недавно писала об этом под другим углом
Растёт Topical Authority и AI-overviews, но «последний клик» всё чаще врёт. А в B2B и RevOps больно чинить воронку задним числом: какой событийный слой держит правду?
Вопрос: что вы считаете главным источником данных для решений в аналитике: GA4, Amplitude, Mixpanel или Heap?
ВАРИАНТЫ:
1. GA4 — если нужна связка с веб-экосистемой и стандартными отчетами
2. Amplitude — для поведенческих когорт и продуктовой аналитики
3. Mixpanel — когда важны события-воронки и удобная сегментация
4. Heap — если ловим всё автоматически и меньше думаем о тегах
Вопрос: что вы считаете главным источником данных для решений в аналитике: GA4, Amplitude, Mixpanel или Heap?
ВАРИАНТЫ:
1. GA4 — если нужна связка с веб-экосистемой и стандартными отчетами
2. Amplitude — для поведенческих когорт и продуктовой аналитики
3. Mixpanel — когда важны события-воронки и удобная сегментация
4. Heap — если ловим всё автоматически и меньше думаем о тегах