Футбол в цифрах
10.6K subscribers
1.14K photos
568 links
Футбол, продвинутая статистика, аналитика.

Поддержать проект https://ko-fi.com/markstats

@markmatch - наш канал с отчетами матчей.

По всем вопросам обращайтесь к @jan_curtis
Download Telegram
Переход Данила Пруцева в “Спартак” будет отличным усилением центральной зоны с точки зрения создания остроты и продвижения мяча через пас

График сравнивает выступления Умярова, Зобнина и Пруцева в этом сезоне РПЛ. Каждая точка на графике - перформанс в одной встрече, при условии что игрок провел на поле минимум 60 минут. Для демонстрации распределения добавлены серые точки - выступления других центральных полузащитников лиги

Ось X - ожидаемая угроза от передач и навесов (xThreat)

Ось Y - продвижение мяча через пас (Fields Gained)

Лучший матч сезона Пруцев провел в августе против тульского Арсенала, в котором было набрано 0.3 xThreat и 7.4 Fields Gained. Было еще несколько хороших выступлений, когда Данил превысил средний уровень лиги. Главный вопрос, как обычно, в способности без потери перенести эти цифры в новое окружение

Результаты в пересчете на 90 минут

Острота:

Пруцев - 0.11
Умяров - 0.08
Зобнин - 0.06

Продвижение:

Пруцев - 3.65
Умяров - 2.97
Зобнин - 2.45

patreon.com/markstats
Метрика xGBuildup показывает суммарное качество ударов по воротам соперника, к которым привели владения с участием игрока

Хотим рассказать о двух главных недостатках модели

Во-первых, xGBuildup слабо связана со способностью игрока продвигать мяч вперед, а значит, приближать владение к созданному моменту. Игроку достаточно отдать любой пас в атаке, которая привела к удару, чтобы ему были “начислены” очки

Поэтому, например, Родри лидирует в АПЛ по xGBuildup, но занимает лишь 22 место по Fields Gained за 90 минут. А с отрывом лучший по продвижению мяча Трент едва попадает в 25 лучших по xGBuildup

Во-вторых, никак не учитываются атаки, которые не привели к удару по воротам. То есть, около 90% данных попросту игнорируются. Игроки из слабых команд, как бы здорово они не обращались с мячом, всегда будут недополучать признания просто потому, что их команды реже доводят владения до ударов

На графике сравнение показателей xGBuildup и Fields Gained для игроков АПЛ 21/22

patreon.com/markstats
👍1
Собрали вместе самые важные публикации, которые вышли в блоге “Футбол в Цифрах” в 2021 году

Материалы сгруппированы на две категории:

1. Словарь терминов, которыми мы часто пользуемся в статьях и отчетах

2. Исследования, направленные на изучение различных аспектов игры (эффективность короткого розыгрыша от ворот, откуда совершаются самые опасные навесы, изменение показателей игроков при переходе из одной лиги в другую и т.д.)

Если вы недавно подписались, наверняка пропустили что-то интересное
4👍4
Футбол в цифрах pinned «Собрали вместе самые важные публикации, которые вышли в блоге “Футбол в Цифрах” в 2021 году Материалы сгруппированы на две категории: 1. Словарь терминов, которыми мы часто пользуемся в статьях и отчетах 2. Исследования, направленные на изучение различных…»
На графике изображены связки игроков АПЛ, которые в этом сезоне внесли наибольший вклад в продвижение мяча своей команды. В качестве метрики продвижения была использована модель Fields Gained, кроссы не учитывались

У двух команд из двадцати самый большой процент очков набирают пары “голкипер-нападающий”. Это ожидаемый результат для Бёрнли и Брентфорда, но не увидеть Пикфорда на карте Эвертона - сюрприз, причиной которого, скорее всего, является ротация форвардов

По общему количеству очков продвижения, набранных через пас в этом сезоне лидирует пара Трент->Салах. Судя по карте Ман Сити, для Канселу и Бернарду совершенно не важно на каком фланге взаимодействовать

Хотя ротация игроков, без сомнения, вносит “шумы”, в результате для каждой команды АПЛ мы получили интересную информацию об устойчивых направлениях продвижения мяча. В комментариях к посту мы оставим вариант графика, который показывает что получится, если заменить фамилии игроков на названия их позиций на поле

patreon.com/markstats
👍1
Краснодар объявил о расторжении контракта с Виктором Гончаренко

График сравнивает показатели перформанса и стиля с периодом прошлого сезона, когда команду возглавлял Мурад Мусаев

Что изменилось под руководством Гончаренко, по пунктам:

1. Значительно уменьшился процент владения и наклон поля

2. Краснодар стал создавать меньше ожидаемой угрозы и больше допускать

3. Выросла средняя длина паса в первой трети поля

4. Прессинг стал менее эффективным (увеличились точность передач соперника и процент доведенных до финальной трети атак)

Вы наверняка уже запомнили как правильно “читать” графики такого типа, но на всякий случай скажем, что по оси X тут изображена величина стандартного отклонения каждой из метрик от среднего (вертикальная линия) значения по РПЛ

patreon.com/markstats
Мы обработали около 40 тысяч вбрасываний мяча из аута, совершенных в финальной трети поля, и сравнили две стратегии - длинный бросок прямо в штрафную и короткий ввод

Чтобы оценить эффективность, рассмотрены следующие 3, 10 и 20 действий на поле. Если они привели к удару той же команды, которая осуществляла вброс, ауту присваивалось соответствующее значение xG со знаком “плюс”, если соперником - “минус”

Значение xGD10 равное +0.017 означает, что вероятность забить гол в течение следующих 10 действий после вбрасывания на 1.7% превышает вероятность пропустить

Результаты говорят о том, что стратегия длинного заброса в штрафную является более эффективной, чем короткий розыгрыш. Значения xGD слева всегда больше, чем справа, но отставание сокращается при увеличении количества действий

Несмотря на это, к вбрасываниям прямо в штрафную прибегают лишь в 14% случаев. Самая высокая доля таких аутов у Брентфорда (58%) и Салернитаны (50%), самая низкая - у Реала (2.9%) и Барселоны (3%)

patreon.com/markstats
1
Мы проанализировали все матчи, сыгранные в европе за последние несколько сезонов, и посчитали “вероятность успеха” и “награду” за продвижение мяча в определенный радиус от центра ворот соперника

Для примера того, как правильно “читать” результаты, рассмотрим столбец с подписью “R 20”. Успехом заканчивается примерно одна из трех попыток продвижения в “радиус 20”. При этом, чуть более половины удачных продвижений приводят к удару

На графике слева показана вероятность того, что попытка продвинуть мяч в определенный радиус окажется удачной. Интересное наблюдение - команды начинают испытывать заметный скачок в сопротивлении защищающейся стороны при преодолении отметки 32 метра, далее вероятность успеха снижается линейно

График справа показывает вероятность того, что владение, в котором было зарегистрировано успешное продвижение в тот или иной радиус, окончится ударом или голом. Приближение мяча к воротам соперника, ожидаемо, увеличивает вероятность завершить владение моментом

@markstats
Наибольший вклад в продвижение мяча через пас средней команды из топ-5 вносят центральные защитники (CB, 30%), фулбэки (FB, 24.5%) и центральные полузащитники (CM, 22%)

Новый график демонстрирует несколько интересных отклонений от стандартного распределения, обнаруженные за последние два сезона

Вклад Мануэля Римана почти в три раза превышает значение среднего европейского голкипера. Одно из следствий в том, что Бохум - команда с самым низким процентом вовлеченности центральных защитников

Благодаря тому, что Бруну Фернандеш попадает в категорию AM/FW, у Ман Юнайтед уже два года подряд наблюдается аномально высокий процент продвижения, набранный игроками атаки. Личный показатель Бруну в этом году немного снизился с 12% до 10%

У клубов, использующих тройку защитников, процент в столбце “CB” почти наверняка будет выше среднего. Но 43% Челси выделяются даже на фоне других систем с тремя центральными

Больше команд в комментариях

@markstats
В интервью после матча Томас Тухель хвалил свою команду за оборонительный перформанс. По признанию немецкого специалиста, ничья тоже была бы справедливым результатом

Наименьшее количество созданной Манчестером ожидаемой угрозы с игры (xThreat) и второй худший показатель качества созданных моментов (xG) косвенно подтверждают его слова

Еще ни одной команде АПЛ в этом сезоне не удавалось так хорошо сдержать атаку Сити

Планом Челси на игру был отказ от высокого прессинга, средний блок 5-4-1 и терпеливое ожидание переходных ситуаций. До гола КДБ, у Ман Сити было много владения (62%), в четыре раза больше касаний в финальной трети (наклон поля 82%), но по созданным явным голевым моментам ничья 1-1 (Грилиш в первом тайме и Лукаку в самом начале второго)

На графике по оси X изображена величина стандартного отклонения показателей Ман Сити от среднего (вертикальная линия) значения по АПЛ в этом сезоне

Подробный статистический отчет о матче на канале @markmatch
Пример ситуации, когда показатель интенсивности прессинга (PPDA) в рамках одного матча без дополнительного контекста практически бесполезен

Сравните два статистических факта:

1. Аталанта показала худшую в сезоне интенсивность прессинга (10.4 PPDA вчера против 7.4 PPDA в среднем)

2. В этом году атаки Интера, начинающиеся в первой трети, успешно достигают половины соперника в 47% случаев, а финальной трети - в 32%. С Аталантой оба показателя были ниже среднего не только по меркам Интера, но по лиге (39.6% и 20.8%)

Если рассматривать прессинг только с точки зрения PPDA, Аталанта не показала ничего особенного. Но почему это так сильно противоречит ощущениям после просмотра и в чем причина затруднений Интера при выходе со своей трети?

Ответ в самом определении PPDA. Для расчета используются только зарегистрированные оператором оборонительные действия. А ситуации, когда команда коллективно, не совершая отбора или перехвата, вынуждает соперника терять мяч - никак не учитываются

Ссылка на отчет о матче
Как ведет себя команда, которая только что вернула себе мяч вблизи ворот соперника? Кто пытается сразу продвинуть мяч вперед, а кто не спешит?

На графике клубы из топ-5, которые за два последних сезона совершили как минимум 250 high turnovers (владения, которые начались в радиусе 40 метров от центра чужих ворот)

По осям координат продвижение мяча, набранное следующей за high turnover попыткой передачи или проходом на дриблинге. В случаях, когда действие отдаляло мяч от цели, ему присуждалось отрицательное значение Fields Gained

Оба показателя скорее стилистические - направление действия сразу после высокого возврата слабо коррелирует с вероятностью того, что это владение закончится ударом

Вольфсбург, Интер и Майнц относятся к категории “прямолинейных” команд, которые после высокого перехода стремятся как можно скорее доставить мяч ближе к цели. А вот Ман Сити и, особенно, Ливерпуль после high turnover не рискуют, а совершают несколько подготовительных “горизонтальных” действий

@markstats
На восприятие работы Ральфа Рангника в Ман Юнайтед сильное влияние оказывают результаты (5 побед, 2 ничьи и 1 поражение в АПЛ) и блестящая игра Давида де Хеа, который маскирует ошибки в обороне

Сравнивая показатели с тем, что было при Сульшере, вы скорее всего обратите внимание на некоторые стилистические изменения и на снижение среднего качества допущенных ударов. Из последнего факта не обязательно следует, что команда стала лучше обороняться, соперники доставляют мяч в опасный радиус около ворот примерно с той же частотой, что и раньше

Импонирует гибкость Рангника. После изначальных попыток внедрения своих принципов и новой схемы, немецкий специалист, кажется, заметил, что это не приносит явных преимуществ. При этом, не позволяет лидерам команды раскрывать свои лучшие качества и откатил настройки к предыдущей версии. Кто-то воспримет этот факт как признание неудачи, но скорее это подчеркивает открытость ума и отсутствие приверженности догмам

@markstats
👍1
Сравнение предматчевых предсказаний модели fivethirtyeight с итоговыми результатами для различных видов спорта и футбольных лиг

Если вероятность победы команды превышает вероятность победы соперника хотя бы на 10%, то в баскетболе “фаворит” выиграет 72% таких матчей, в американском футболе - 69%

В европейском футболе точные предсказания победы встречаются реже. Для каких-то турниров прогнозы работают лучше (60% в Лиге Чемпионов), для каких-то хуже (40% в четвертой по силе Английской лиге), но в среднем футбольная модель “угадывает” победителя пары примерно для 53% матчей

Прежде чем сделать вывод об уникальной непредсказуемости футбола, давайте сравним долю побед “андердогов”. В североамериканских видах спорта так завершаются 30% игр, а в футболе - 21%. То есть, сюрпризы, когда слабая команда обыгрывает сильную, в футболе случаются реже, чем в НБА, НХЛ и НФЛ

В комментариях результаты аналогичных расчетов, когда разница между вероятностями победы команд составляла не 10%, а 20% и 30%

@markstats
Представьте что у вас есть набор данных с информацией об ударах интересующих вас нападающих, включая значения xG и xGOT. Показатель “качество исполнения” игрока А получился выше, чем у игрока Б. Но кто из них должен быть выше в рейтинге, если первый нанес 33 удара, а второй - 165?

Интуитивно вы больше доверяете результатам игрока Б. Возможно ли при ранжировании учесть число известных экспериментов?

На помощь приходит байесовская оценка. @Ivan_xG уже рассказывал о ее применении в сервисе Polar Bear. В нашем случае тоже можно посчитать среднее значение “мастерства исполнения”, взвешенного с учетом заранее известного распределения данных. Похожим способом составлялся список 250 лучших фильмов IMDb

Сравните “качество исполнения” и “место в рейтинге” Агаларова и Азмуна. Первый имеет отличную разницу между xGOT и xG, но скромный размер выборки. Второй доказал свою способность на длинной дистанции, поэтому, несмотря на меньшее значение показателя “исполнение”, находится выше в рейтинге

@markstats
👍2
Известный тренер по вбрасываниям из аута Томас Гроннемарк считает, что быстрый и умный ввод мяча увеличивает шансы команды сохранить владение или даже создать момент. Нам захотелось проверить первую часть этого утверждения

Обработав 150 тысяч вбрасываний, мы выяснили, что в подавляющем большинстве случаев на подготовку требуется от 3 до 27 секунд (в среднем 15). Успехом заканчиваются 80% аутов. Но это если под “успехом” понимать только первое касание. Если же рассмотреть 5 следующих действий, то команде удается сохранить мяч в 60% случаев

На графике изображен процент вбрасываний, закончившихся сохранением владения или ударом по воротам соперника в зависимости от потраченного на подготовку времени и разбивкой по третям поля

В пределах первых 8 секунд результаты почти отличаются. Зато после 8-й секунды наблюдается следующее: каждые две дополнительные секунды подготовки снижают вероятность сохранить мяч или нанести удар на 2-5 процентов. Особенно сильно эффект проявляется в первой трети поля

@markstats
Еще одна метрика, подсмотренная у saturdayoncouch. Автор называет её “Ров” (Moat) и вычисляет как отношение количества допущенных проникновений в опасные зоны около своих ворот к числу передач соперника прямо перед этой зоной

Идея в том, что если команда вынуждает противника проводить много времени на подступах к опасному радиусу, но без непосредственного проникновения, это может служить индикатором того, что у нее выстроена качественная позиционная оборона

Наша версия метрики основана на Expected Threat и рассчитывается как количество допущенной угрозы в пересчете на 100 передач соперника на чужой половине

Наиболее глубокий ров среди команд из топ-5 в этом году “выкопал” Диего Симеоне. Соперники зарегистрировали наименьшее число успешных проникновений с игры относительно количества передач совершенных на половине Атлетико

На графике пример с результатами для АПЛ. В правом верхнем углу находятся клубы, позволяющие находиться на своей половине, но затрудняющие продвижение в опасные зоны

@markstats
Мы когда-то уже рассказывали о StatsBomb360 и делились результатами расчета метрики packing, основанной на этом уникальном наборе данных

Сегодня появился еще один отличный пример использования SB360. Два энтузиаста из твиттера (Charles и Abhishek) натренировали модель xG, которая рассчитывает вероятность гола с учетом расположения защитников и вратаря. На вход поступают стандартные параметры удара и, кроме того, “картинка” с тремя слоями - положение мяча, голкипера и игроков обороны. Подробнее об архитектуре можно прочитать здесь

В теории, эта модель должна работать лучше “наивных” версий xG, которые в лучшем случае анализируют информацию о предыдущих действиях команды, чтобы “угадать” тип атаки, который привел к удару

Респект авторам, которые сами указывают на главные недостатки модели - не учитывается часть тела бьющего и высота на которой находился мяч

Теперь, используя картинку из телетрансляции, вы можете перенести расположение игроков в симулятор и узнать примерное xG интересующего момента
Гибридные схемы и ложные фулбэки уже даже не удивляют. Как минимум в двух топовых матчах этих выходных тренеры использовали эти концепции. И речь даже не о Гвардиоле или Нагельсмане

Дани Алвес в игре против Атлетико постоянно смещался в центр, освобождая фланг для Адама Траоре. Похожим образом действовали Тео Эрнандес и Калабрия в миланском дерби. Пиковый уровень Челси этого сезона совпал с отрезком, когда Чилвелл и Джеймс совершали движения не во фланг, а внутрь

Одним из преимуществ узкого расположения фланговых защитников принято считать их более выгодную в случае потери мяча позицию, что позволяет команде быть подготовленной к переходной фазе

Джон Мюллер из the athletic провел исследование и обнаружил, что хотя пасы в финальной трети из полуфланга на край (overlap) все еще более распространены, доля передач в обратном направлении (underlap) за последние 7 лет удвоилась

На картинке сравнение зон, в которых Тео Эрнандес принимал мяч в матче с Интером и за последние два сезона

@markstats
Игроки АПЛ с наиболее значительным изменением вовлеченности в пасовые метрики своей команды по сравнению с прошлым сезоном

Основными условиями для попадания в расчетную группу были: отыграть достаточное количество минут, остаться игроком той же команды и иметь разницу игрового времени в пределах 10%

Список возглавляет Кевин Де Брёйне. В прошлом сезоне он провел на поле 58% из максимально возможных минут, в этом - 53%. При этом, вклад в создание угрозы снизился почти вдвое (с 12.2% до 6.5%)

На the athletic есть статья о “затруднениях” КДБ, в которой Сэм Ли рассуждает о возможных причинах:

На данном этапе Гвардиола делает ставку на терпеливые горизонтальные розыгрыши и снижение количества переходных фаз. По словам журналиста, терпение не является отличительной чертой характера Кевина. Поэтому в полузащите Пеп предпочитает Гюндогана и Бернарду, которые реже рискуют и лучше сохраняют мяч. КДБ все чаще можно увидеть в роли нападающего, что не может не влиять на креативные показатели

@markstats
На 75 минуте встречи МЮ - Саутгемптон Антони Эланга заменил Скотта Мактоминей, Юнайтед перестроился на 4-2-4, а в пару к Полю Погба в центр полузащиты опустился Фернандеш

Ход с размещением на поле максимально возможного числа атакующих игроков, иногда приводит и к положительным результатам, но в конкретном случае баланс все же был нарушен

Без Мактоминея у Юнайтед не осталось игрока, который не был бы нацелен только на обострение, а мог бы просто сохранить мяч. Игра свелась к длинным забросам в исполнении фулбэков и Бруну на одного из открывающихся за спину форвардов

После 75-й минуты было создано в два раза меньше ожидаемой угрозы, чем за соизмеримый отрезок второго тайма до замены, точность передач упала с 85% до 72%. Из-за постоянных переходов владения, МЮ так и не смог качественно прижать соперника в концовке

Особенно невыразительно это выглядело на фоне тактических перестроений Хазенхюттля, которые помогли Саутгемптону вернуться в игру после первых минут доминирования Юнайтед

@markstats