Стек аналитики — обзоры
15 subscribers
1 photo
Analytics stack
Download Telegram
GA4 против Amplitude: где чаще всего ломается аналитика (и почему “правильная” настройка не спасает)

Я регулярно вижу одну и ту же картину: в компании настроили события в GA4 «как в методичке», сделали воронки, включили косты (стоимость) и вроде бы всё заработало. Потом приходит Amplitude (или Mixpanel/Heap), команда делает параллельную аналитику — и выясняется, что цифры не сходятся. Не на 1–2%, а радикально: конверсия в воронке то растёт, то падает, а когорты «плавают». На мой взгляд, проблема почти никогда не в инструменте. Проблема в модели измерения: как именно вы определяете пользователя, событие, сессию и “момент истины”.

Моё наблюдение из практики: чаще всего расхождения рождаются в трёх местах.

1) Идентификация пользователя: device id vs login id
В GA4 и Amplitude по-разному реализованы механики user identity и маппинга между анонимным и авторизованным состоянием. Если в одной системе “пользователь” — это device, а в другой — устойчивый login, то вы получите разные когорты и разные retention-показатели. Технически оба могут быть “правильными”. Бизнес-метрика при этом — нет.

2) Дублирование событий из-за серверной/клиентской отправки
Когда подключают server-side (отправку событий с сервера) или используют теги, которые дублируют one-time события (например, view → снова view при повторной отрисовке), разъезжаются и MAU, и воронки. В GA4 это особенно видно, когда событие попадает в несколько «сценариев» через разные источники. В Amplitude — если вы не закладываете идемпотентность (в логике “одно событие — один раз”).

3) Единый язык метрик не закреплён документом
Команды называют одинаковыми словами разные вещи: “lead” в одном месте — это submit формы, в другом — успешный handoff в sales (или даже переход в статус квалификации). В результате вы сравниваете несопоставимые события, и кажется, что инструмент «врёт». На самом деле инструмент просто показывает то, что вы ему разрешили.

Как я это чиню в stack-подходе (без религии GA4/Amplitude)

— Делаю **контракт событий**: список событий + формальные определения (что является триггером, какие поля обязательны, какие значения допустимы).
— Ввожу “контрольные” метрики: 3–5 событий, которые нельзя трактовать по-разному (например, login success, purchase completed, signup submitted).
— Согласую identity-стратегию: что первично до логина, что происходит после логина, как меряем пользователя в когортном разрезе.

Одна цифра из недавнего кейса: после наведения порядка в identity и запрета дублей мы получили разницу по конверсии на первом шаге воронки не «на десятки процентов», а в пределах 3–5%. До этого расхождение достигало ~22%. Суть была не в том, что GA4 или Amplitude “плохие”, а в том, что метрика “пользователь” определялась по-разному, и эта разница размножалась по цепочке: от воронок до retention.

Мой вывод: в analytics stack побеждает не тот, у кого больше фич, а тот, у кого лучше измерительная дисциплина. Инструмент можно менять. **Определение метрики — нельзя.**

@AnalyticsStackRu

Соседняя редакция @MessengerMarketingRu недавно писала об этом под другим углом
GA4 vs «плагины Universal Analytics»: как не потерять события при миграции

Если у вас в прошлых проектах были «универсальные аналитические плагины» (Universal Analytics Plugins) и вы сейчас переносите логику в GA4 или в свой аналитический стек, проверьте риски как методический аудит. Не «вспомнить», а системно восстановить соответствия событий.

— Инвентаризируйте плагины и их области действия
Составьте таблицу: название плагина, что именно менял (валидации, фильтрация, обогащение), на каких страницах/событиях работал. Дальше это станет картой соответствий для GA4 событий.

— Зафиксируйте правила трансформаций в исходном виде
Плагины часто меняют поля до отправки: формат, параметры, структуру категории/действия. Перенесите логику в описание: какие входные поля → какие выходные, какие условия срабатывания.

— Подсветите «тихие потери» данных при переносе
В UA часть логики могла не доходить до отчётов как ожидается (например, если плагин блокировал событие или корректировал параметры). Проверьте, какие события в UA были «всегда» и какие внезапно могут стать редкими в GA4.

— Переведите аналитику в контролируемые конвейеры (GTM/сервер)
Вместо «вшитых» UA-плагинов заложите трансформации в более управляемый слой: тег-менеджер или серверная прослойка (server-side), чтобы правила были воспроизводимыми и тестируемыми.

— Сделайте сопоставление UA-параметров с GA4-структурой
Сформируйте маппинг: category/action/label и прочие UA-поля → в какие параметры GA4 event (имя события, параметры, пользовательские/сессионные свойства). Цель — чтобы отчётность и воронки строились на одинаковом смысле.

— Проведите регрессионное тестирование на одинаковых сценариях
Прогоните 5–10 пользовательских путей (лендинг → форма → отправка → навигация) и сравните: полный набор событий, обязательные параметры, кратность, порядок. Сравнение делайте не «по ощущению», а по экспортам сырья.

— Документируйте правила для RevOps/контроля качества выручки
Раз GA4/стек становится частью ответственности маркетинга-сейлза-customer success за выручку, добавьте в регламенты: какие события считаются конверсией, какие — поддержкой, где ошибка превращается в неверный MQL/SQL (и как это отлавливать до релиза).

когда это пригодится: при миграции с Universal Analytics и разборе расхождений по событиям в GA4 после изменений в тегах или измерениях.

@AnalyticsStackRu
Как выбрать систему продуктовой аналитики под B2B и e-commerce

Если у вас в 2026 году маркетинг завязан на retention, LTV и общую выручку, выбор аналитики уже не про «какой график красивее». Смотрите на задачу: куда пойдут решения — в продукт, в performance или в RevOps.

Сделайте выбор за 5 шагов:

— Зафиксируйте 3 вопроса, на которые система должна отвечать еженедельно. Например: где теряем лидов до демо, какие сценарии ведут к повторной покупке, какие каналы дают не просто заявки, а выручку.

— Проверьте, как платформа работает с событиями. Для **GA4** это базовая веб-аналитика и отчётность по трафику, для **Amplitude** и **Mixpanel** — сильнее продуктовые воронки и когортный анализ, **Heap** удобен, когда важна автосборка событий и быстрый старт без долгой разметки.

— Сверьте интеграции с вашей реальной схемой данных: CRM, серверные события, CDP, рекламные кабинеты, BI. Если нужен server-side и privacy-first атрибуция, платформа должна жить не отдельно, а в общей схеме с CRM и warehouse.

— Проверьте права доступа и логику ролей. Маркетингу нужны каналы и кампании, продукту — поведение, sales — качество лидов, customer success — удержание и повторные продажи. Если всё смотрят в один отчёт, система не приживётся.

— Запустите пилот на одном сценарии. Например: онбординг в SaaS или повторная покупка в e-commerce. Через 2 недели должно быть понятно, кто теряет пользователя, на каком шаге и какое действие менять.

Практическое правило: **GA4 — для веба и маркетинга, Amplitude/Mixpanel — для продуктовой глубины, Heap — для быстрого старта и меньшей нагрузки на разметку**.

Не выбирайте платформу «на вырост». Выбирайте под один управленческий вопрос, который влияет на выручку уже сейчас.

@AnalyticsStackRu
Факт-таблица (fact table) в аналитическом контуре

Факт-таблица — это таблица в модели данных аналитики, где хранятся измерения поведения и событий как “факты”: что произошло и при каких параметрах. Типичные поля: идентификатор события/действия, время (timestamp), ключи к контексту (пользователь, сессия, заказ, продукт), а также числовые метрики (количество, выручка, длительность) или коды атрибутов (канал, устройство, план тарифов).

Чем отличается от измерительной (dimension) таблицы:
— Факт-таблица отвечает на вопрос “как часто и сколько” (и для чего это было).
— Dimension-таблица отвечает на вопрос “какой” (кто/какой продукт/какой канал/какие свойства).
GA4, Amplitude и Mixpanel по смыслу близки к комбинированию этих слоёв, но в BI-слое (DWH/витринах) модель чаще явно разделяют: факты — события, измерения — справочники.

Типичные ошибки:
— Смешивать в одном месте “справочные” значения и “событийные” метрики: например, хранить название кампании в каждой строке события, вместо нормализации в dimension.
— Делать событие “пользователь_создал_аккаунт” измерением пользователя: тогда теряется многократность и корректная динамика по времени.
— Подменять “metric” логикой вычислений в момент запроса и получать разные результаты в GA4 и в отчёте DWH.

Пример:
В e-com вы фиксируете fact-талицу `orders_events`: каждая строка — событие покупки с ключами `user_id`, `order_id`, `product_id`, `timestamp` и полем `revenue`. Dimension-таблицы содержат `channels` (UTM/источник), `products` (категория/маржа) и `users` (когортные признаки). Это помогает корректно считать LTV и удержание (retention) даже при privacy-first атрибуции, когда last-click становится менее надежным.

Заголовок вашей модели данных должен звучать так: “Факт — это строки про события, измерения — это описания для фильтров”.
GA4 не «плохой». Плохой у вас часто процесс вокруг него

Я всё чаще вижу одну и ту же ошибку в аналитическом стеке: GA4 пытаются использовать как универсальный ответ на любой вопрос, а потом ругают его за шум, неполноту и «кривую» отчётность. На практике проблема обычно не в самой системе, а в том, что ей поручили чужую работу.

GA4 силён там, где нужен широкий слой наблюдения: трафик, поведение по источникам, первичная диагностика воронки, быстрые срезы по каналам. Это хороший «первый экран» для маркетинга. Но как только задача становится глубже — удержание, продуктовые сценарии, когорты, сравнение качественных сегментов, влияние действий на выручку — одного GA4 уже мало.

Я бы формулировал так: **GA4 — это навигатор, а не черный ящик для управленческих решений**. Он показывает направление, но не объясняет причинность. И именно здесь начинаются бессмысленные споры «GA4 против Amplitude» или «GA4 против Mixpanel». Это не конкуренты, если вы строите нормальный стек. Это разные уровни зрелости.

В одном B2B-проекте у нас было 18 событий в GA4 и почти 70 в Amplitude. После сверки оказалось, что маркетинг месяцами смотрел на усреднённую конверсию, а продукт — на поведение ключевого сегмента, который приносил 62% оплаченных сделок. GA4 этот слой не подсвечивал: там всё «среднее» и слишком общее. В итоге решение по бюджету приняли только после того, как связали GA4 с продуктовой аналитикой и CRM.

Мой вывод простой:
— GA4 нужен всем, но не как единственная система истины;
— Amplitude или Mixpanel нужны там, где важны сценарии и удержание;
— Heap полезен, когда надо ускорить сбор событий и не утонуть в ручной разметке.

В 2026-м выигрывает не тот, у кого «есть аналитика», а тот, у кого она связана с выручкой, продуктом и действиями. Поэтому я бы меньше спорил о том, какая платформа лучше, и больше — о том, какой вопрос она вообще должна закрывать.

Соседняя редакция @BigQuery4Marketing недавно писала об этом под другим углом