Forwarded from statbase
Недавно к нам заглянули наши друзья из телеграм-канала @dnortinelli с классным и дерзким запросом:
Что ж... Математика и дата-инжиниринг не имеют жестких границ, и у нас было немного времени между игровыми неделями, чтобы взяться за реализацию.
Прямо сейчас мы на постоянной основе обеспечиваем продвинутой аналитикой некоторые европейские бейсбольные клубы и федерации, выстраивая для них скаутинговые репорты, перфоманс ревью и предиктивные модели. Так, например, один из клубов пытается спастись от вылета из «Премьер Лиги» в «Чемпионшип», и мы с ними тесно работаем, чтобы каждое решение на поле и вне его приносило желаемый результат.
Наш внутренний фреймворк аналитики, вышеупомянутый StatPredict, изначально проектировался как гибкая кросс-спортивная система. Для алгоритмов не так важно, выбьет ли бэттер хоумран после хорошего свинга или попадет ли мяч в «девятку» после классного розыгрыша. Главное – правильно настроить веса, ролевые фильтры и симуляционные матрицы, ну и, конечно же, исходные данные.
В общем, мы приняли вызов команды @dnortinelli и решили провести масштабный практический ресерч. А чтобы тест-драйв обновленной модели был максимально показательным и релевантным, мы выбрали главный матч европейского сезона 2026 – Финал Лиги чемпионов: Арсенал против ПСЖ.
Что доработали под капотом?
Мы масштабировали архитектуру StatPredict за пределы бейсбольной логики:
• Ролевые индексы ценности и формы (PVI/PFI): теперь алгоритм оценивает игроков по специфическим метрикам (для форвардов – объем ударов и xGOT-proxy, для полузащиты – xA и продвижение, для защиты – подавление npxGA, и многое другое). В сумме в расчетной модели учитывается почти полторы сотни различных параметров
• Марковские симуляции: модель раскладывает 90 минут матча на пошаговые вероятностные состояния.
• Стресс-тесты сценариев: от логики «титульной усталости» до контроля низкого блока после «рандома с корнера».
Тизер модели: кто станет победителем «новой» ЛЧ?
Наша футбольная модель выдала обновленные расчеты по финалу:
Это наш первый пост в формате футбольного превью. Обычно мы занимаемся нефутбольной аналитикой, но теперь надеемся радовать и вас качественными репортами.
Подписывайтесь, ставьте лайки и включайте уведомления – в скоро мы разберем ролевые модели лидеров команд и покажем, почему алгоритмы так высоко оценивают микро-профили игроков, на примере ТОП25 в АПЛ (уже в следующем посте).
Оставайтесь с нами и обязательно заглядывайте к ребятам в @dnortinelli – они уже готовят разбора перформанса Чемпионов АПЛ в своем фирменном стиле.
👇 Вся инфографика из репорта по разбору финала ЛЧ в посте ниже
🏆 Подписаться
«Ребята, ваше аналитическое ядро переваривает гигантские массивы бейсбольных данных. А есть ли техническая возможность адаптировать вашу модель StatPredict под футбольные метрики?»
Что ж... Математика и дата-инжиниринг не имеют жестких границ, и у нас было немного времени между игровыми неделями, чтобы взяться за реализацию.
Прямо сейчас мы на постоянной основе обеспечиваем продвинутой аналитикой некоторые европейские бейсбольные клубы и федерации, выстраивая для них скаутинговые репорты, перфоманс ревью и предиктивные модели. Так, например, один из клубов пытается спастись от вылета из «Премьер Лиги» в «Чемпионшип», и мы с ними тесно работаем, чтобы каждое решение на поле и вне его приносило желаемый результат.
Наш внутренний фреймворк аналитики, вышеупомянутый StatPredict, изначально проектировался как гибкая кросс-спортивная система. Для алгоритмов не так важно, выбьет ли бэттер хоумран после хорошего свинга или попадет ли мяч в «девятку» после классного розыгрыша. Главное – правильно настроить веса, ролевые фильтры и симуляционные матрицы, ну и, конечно же, исходные данные.
В общем, мы приняли вызов команды @dnortinelli и решили провести масштабный практический ресерч. А чтобы тест-драйв обновленной модели был максимально показательным и релевантным, мы выбрали главный матч европейского сезона 2026 – Финал Лиги чемпионов: Арсенал против ПСЖ.
Что доработали под капотом?
Мы масштабировали архитектуру StatPredict за пределы бейсбольной логики:
• Ролевые индексы ценности и формы (PVI/PFI): теперь алгоритм оценивает игроков по специфическим метрикам (для форвардов – объем ударов и xGOT-proxy, для полузащиты – xA и продвижение, для защиты – подавление npxGA, и многое другое). В сумме в расчетной модели учитывается почти полторы сотни различных параметров
• Марковские симуляции: модель раскладывает 90 минут матча на пошаговые вероятностные состояния.
• Стресс-тесты сценариев: от логики «титульной усталости» до контроля низкого блока после «рандома с корнера».
Тизер модели: кто станет победителем «новой» ЛЧ?
Наша футбольная модель выдала обновленные расчеты по финалу:
Вероятность взять трофей: «Арсенал» – 57.7% / «ПСЖ» – 42.3% (в основное время: победа «Арсенала» – 43.4%, ничья – 26.8%, победа «ПСЖ» – 29.8%) Сила команд (Индекс TPM): Общий рейтинг «канониров» зафиксирован на отметке 91 (благодаря железобетонной защите на 97 баллов). Парижане дышат в спину с общим TPM 85, при этом минимально опережая лондонцев в атакующей мощи (Атака: 82 против 81) Скрипт матча: Модель четко разделяет фазы игры. «ПСЖ» опаснее и эффективнее в динамике (-0.33 в пользу Парижа по xG в open-play), но «Арсенал» тотально доминирует на стандартах (+0.26) и при давлении с угловых (+0.18) Плотность счета: Основное время имеет высокую концентрацию «низовых» исходов. Самый вероятный счет по итогам симуляций – 1:1 (12.8%), а следом идет минимальная сухая победа «Арсенала» 1:0 (11.6%)
Это наш первый пост в формате футбольного превью. Обычно мы занимаемся нефутбольной аналитикой, но теперь надеемся радовать и вас качественными репортами.
Подписывайтесь, ставьте лайки и включайте уведомления – в скоро мы разберем ролевые модели лидеров команд и покажем, почему алгоритмы так высоко оценивают микро-профили игроков, на примере ТОП25 в АПЛ (уже в следующем посте).
Оставайтесь с нами и обязательно заглядывайте к ребятам в @dnortinelli – они уже готовят разбора перформанса Чемпионов АПЛ в своем фирменном стиле.
👇 Вся инфографика из репорта по разбору финала ЛЧ в посте ниже
🏆 Подписаться
Telegram
statbase
кросс-спортивная экосистема анализа и моделирования спортивных событий
❤15👍9🍓5