Футбол в цифрах
10.6K subscribers
1.14K photos
568 links
Футбол, продвинутая статистика, аналитика.

Поддержать проект https://ko-fi.com/markstats

@markmatch - наш канал с отчетами матчей.

По всем вопросам обращайтесь к @jan_curtis
Download Telegram
Краснодар объявил о расторжении контракта с Виктором Гончаренко

График сравнивает показатели перформанса и стиля с периодом прошлого сезона, когда команду возглавлял Мурад Мусаев

Что изменилось под руководством Гончаренко, по пунктам:

1. Значительно уменьшился процент владения и наклон поля

2. Краснодар стал создавать меньше ожидаемой угрозы и больше допускать

3. Выросла средняя длина паса в первой трети поля

4. Прессинг стал менее эффективным (увеличились точность передач соперника и процент доведенных до финальной трети атак)

Вы наверняка уже запомнили как правильно “читать” графики такого типа, но на всякий случай скажем, что по оси X тут изображена величина стандартного отклонения каждой из метрик от среднего (вертикальная линия) значения по РПЛ

patreon.com/markstats
Мы обработали около 40 тысяч вбрасываний мяча из аута, совершенных в финальной трети поля, и сравнили две стратегии - длинный бросок прямо в штрафную и короткий ввод

Чтобы оценить эффективность, рассмотрены следующие 3, 10 и 20 действий на поле. Если они привели к удару той же команды, которая осуществляла вброс, ауту присваивалось соответствующее значение xG со знаком “плюс”, если соперником - “минус”

Значение xGD10 равное +0.017 означает, что вероятность забить гол в течение следующих 10 действий после вбрасывания на 1.7% превышает вероятность пропустить

Результаты говорят о том, что стратегия длинного заброса в штрафную является более эффективной, чем короткий розыгрыш. Значения xGD слева всегда больше, чем справа, но отставание сокращается при увеличении количества действий

Несмотря на это, к вбрасываниям прямо в штрафную прибегают лишь в 14% случаев. Самая высокая доля таких аутов у Брентфорда (58%) и Салернитаны (50%), самая низкая - у Реала (2.9%) и Барселоны (3%)

patreon.com/markstats
1
Мы проанализировали все матчи, сыгранные в европе за последние несколько сезонов, и посчитали “вероятность успеха” и “награду” за продвижение мяча в определенный радиус от центра ворот соперника

Для примера того, как правильно “читать” результаты, рассмотрим столбец с подписью “R 20”. Успехом заканчивается примерно одна из трех попыток продвижения в “радиус 20”. При этом, чуть более половины удачных продвижений приводят к удару

На графике слева показана вероятность того, что попытка продвинуть мяч в определенный радиус окажется удачной. Интересное наблюдение - команды начинают испытывать заметный скачок в сопротивлении защищающейся стороны при преодолении отметки 32 метра, далее вероятность успеха снижается линейно

График справа показывает вероятность того, что владение, в котором было зарегистрировано успешное продвижение в тот или иной радиус, окончится ударом или голом. Приближение мяча к воротам соперника, ожидаемо, увеличивает вероятность завершить владение моментом

@markstats
Наибольший вклад в продвижение мяча через пас средней команды из топ-5 вносят центральные защитники (CB, 30%), фулбэки (FB, 24.5%) и центральные полузащитники (CM, 22%)

Новый график демонстрирует несколько интересных отклонений от стандартного распределения, обнаруженные за последние два сезона

Вклад Мануэля Римана почти в три раза превышает значение среднего европейского голкипера. Одно из следствий в том, что Бохум - команда с самым низким процентом вовлеченности центральных защитников

Благодаря тому, что Бруну Фернандеш попадает в категорию AM/FW, у Ман Юнайтед уже два года подряд наблюдается аномально высокий процент продвижения, набранный игроками атаки. Личный показатель Бруну в этом году немного снизился с 12% до 10%

У клубов, использующих тройку защитников, процент в столбце “CB” почти наверняка будет выше среднего. Но 43% Челси выделяются даже на фоне других систем с тремя центральными

Больше команд в комментариях

@markstats
В интервью после матча Томас Тухель хвалил свою команду за оборонительный перформанс. По признанию немецкого специалиста, ничья тоже была бы справедливым результатом

Наименьшее количество созданной Манчестером ожидаемой угрозы с игры (xThreat) и второй худший показатель качества созданных моментов (xG) косвенно подтверждают его слова

Еще ни одной команде АПЛ в этом сезоне не удавалось так хорошо сдержать атаку Сити

Планом Челси на игру был отказ от высокого прессинга, средний блок 5-4-1 и терпеливое ожидание переходных ситуаций. До гола КДБ, у Ман Сити было много владения (62%), в четыре раза больше касаний в финальной трети (наклон поля 82%), но по созданным явным голевым моментам ничья 1-1 (Грилиш в первом тайме и Лукаку в самом начале второго)

На графике по оси X изображена величина стандартного отклонения показателей Ман Сити от среднего (вертикальная линия) значения по АПЛ в этом сезоне

Подробный статистический отчет о матче на канале @markmatch
Пример ситуации, когда показатель интенсивности прессинга (PPDA) в рамках одного матча без дополнительного контекста практически бесполезен

Сравните два статистических факта:

1. Аталанта показала худшую в сезоне интенсивность прессинга (10.4 PPDA вчера против 7.4 PPDA в среднем)

2. В этом году атаки Интера, начинающиеся в первой трети, успешно достигают половины соперника в 47% случаев, а финальной трети - в 32%. С Аталантой оба показателя были ниже среднего не только по меркам Интера, но по лиге (39.6% и 20.8%)

Если рассматривать прессинг только с точки зрения PPDA, Аталанта не показала ничего особенного. Но почему это так сильно противоречит ощущениям после просмотра и в чем причина затруднений Интера при выходе со своей трети?

Ответ в самом определении PPDA. Для расчета используются только зарегистрированные оператором оборонительные действия. А ситуации, когда команда коллективно, не совершая отбора или перехвата, вынуждает соперника терять мяч - никак не учитываются

Ссылка на отчет о матче
Как ведет себя команда, которая только что вернула себе мяч вблизи ворот соперника? Кто пытается сразу продвинуть мяч вперед, а кто не спешит?

На графике клубы из топ-5, которые за два последних сезона совершили как минимум 250 high turnovers (владения, которые начались в радиусе 40 метров от центра чужих ворот)

По осям координат продвижение мяча, набранное следующей за high turnover попыткой передачи или проходом на дриблинге. В случаях, когда действие отдаляло мяч от цели, ему присуждалось отрицательное значение Fields Gained

Оба показателя скорее стилистические - направление действия сразу после высокого возврата слабо коррелирует с вероятностью того, что это владение закончится ударом

Вольфсбург, Интер и Майнц относятся к категории “прямолинейных” команд, которые после высокого перехода стремятся как можно скорее доставить мяч ближе к цели. А вот Ман Сити и, особенно, Ливерпуль после high turnover не рискуют, а совершают несколько подготовительных “горизонтальных” действий

@markstats
На восприятие работы Ральфа Рангника в Ман Юнайтед сильное влияние оказывают результаты (5 побед, 2 ничьи и 1 поражение в АПЛ) и блестящая игра Давида де Хеа, который маскирует ошибки в обороне

Сравнивая показатели с тем, что было при Сульшере, вы скорее всего обратите внимание на некоторые стилистические изменения и на снижение среднего качества допущенных ударов. Из последнего факта не обязательно следует, что команда стала лучше обороняться, соперники доставляют мяч в опасный радиус около ворот примерно с той же частотой, что и раньше

Импонирует гибкость Рангника. После изначальных попыток внедрения своих принципов и новой схемы, немецкий специалист, кажется, заметил, что это не приносит явных преимуществ. При этом, не позволяет лидерам команды раскрывать свои лучшие качества и откатил настройки к предыдущей версии. Кто-то воспримет этот факт как признание неудачи, но скорее это подчеркивает открытость ума и отсутствие приверженности догмам

@markstats
👍1
Сравнение предматчевых предсказаний модели fivethirtyeight с итоговыми результатами для различных видов спорта и футбольных лиг

Если вероятность победы команды превышает вероятность победы соперника хотя бы на 10%, то в баскетболе “фаворит” выиграет 72% таких матчей, в американском футболе - 69%

В европейском футболе точные предсказания победы встречаются реже. Для каких-то турниров прогнозы работают лучше (60% в Лиге Чемпионов), для каких-то хуже (40% в четвертой по силе Английской лиге), но в среднем футбольная модель “угадывает” победителя пары примерно для 53% матчей

Прежде чем сделать вывод об уникальной непредсказуемости футбола, давайте сравним долю побед “андердогов”. В североамериканских видах спорта так завершаются 30% игр, а в футболе - 21%. То есть, сюрпризы, когда слабая команда обыгрывает сильную, в футболе случаются реже, чем в НБА, НХЛ и НФЛ

В комментариях результаты аналогичных расчетов, когда разница между вероятностями победы команд составляла не 10%, а 20% и 30%

@markstats
Представьте что у вас есть набор данных с информацией об ударах интересующих вас нападающих, включая значения xG и xGOT. Показатель “качество исполнения” игрока А получился выше, чем у игрока Б. Но кто из них должен быть выше в рейтинге, если первый нанес 33 удара, а второй - 165?

Интуитивно вы больше доверяете результатам игрока Б. Возможно ли при ранжировании учесть число известных экспериментов?

На помощь приходит байесовская оценка. @Ivan_xG уже рассказывал о ее применении в сервисе Polar Bear. В нашем случае тоже можно посчитать среднее значение “мастерства исполнения”, взвешенного с учетом заранее известного распределения данных. Похожим способом составлялся список 250 лучших фильмов IMDb

Сравните “качество исполнения” и “место в рейтинге” Агаларова и Азмуна. Первый имеет отличную разницу между xGOT и xG, но скромный размер выборки. Второй доказал свою способность на длинной дистанции, поэтому, несмотря на меньшее значение показателя “исполнение”, находится выше в рейтинге

@markstats
👍2
Известный тренер по вбрасываниям из аута Томас Гроннемарк считает, что быстрый и умный ввод мяча увеличивает шансы команды сохранить владение или даже создать момент. Нам захотелось проверить первую часть этого утверждения

Обработав 150 тысяч вбрасываний, мы выяснили, что в подавляющем большинстве случаев на подготовку требуется от 3 до 27 секунд (в среднем 15). Успехом заканчиваются 80% аутов. Но это если под “успехом” понимать только первое касание. Если же рассмотреть 5 следующих действий, то команде удается сохранить мяч в 60% случаев

На графике изображен процент вбрасываний, закончившихся сохранением владения или ударом по воротам соперника в зависимости от потраченного на подготовку времени и разбивкой по третям поля

В пределах первых 8 секунд результаты почти отличаются. Зато после 8-й секунды наблюдается следующее: каждые две дополнительные секунды подготовки снижают вероятность сохранить мяч или нанести удар на 2-5 процентов. Особенно сильно эффект проявляется в первой трети поля

@markstats
Еще одна метрика, подсмотренная у saturdayoncouch. Автор называет её “Ров” (Moat) и вычисляет как отношение количества допущенных проникновений в опасные зоны около своих ворот к числу передач соперника прямо перед этой зоной

Идея в том, что если команда вынуждает противника проводить много времени на подступах к опасному радиусу, но без непосредственного проникновения, это может служить индикатором того, что у нее выстроена качественная позиционная оборона

Наша версия метрики основана на Expected Threat и рассчитывается как количество допущенной угрозы в пересчете на 100 передач соперника на чужой половине

Наиболее глубокий ров среди команд из топ-5 в этом году “выкопал” Диего Симеоне. Соперники зарегистрировали наименьшее число успешных проникновений с игры относительно количества передач совершенных на половине Атлетико

На графике пример с результатами для АПЛ. В правом верхнем углу находятся клубы, позволяющие находиться на своей половине, но затрудняющие продвижение в опасные зоны

@markstats
Мы когда-то уже рассказывали о StatsBomb360 и делились результатами расчета метрики packing, основанной на этом уникальном наборе данных

Сегодня появился еще один отличный пример использования SB360. Два энтузиаста из твиттера (Charles и Abhishek) натренировали модель xG, которая рассчитывает вероятность гола с учетом расположения защитников и вратаря. На вход поступают стандартные параметры удара и, кроме того, “картинка” с тремя слоями - положение мяча, голкипера и игроков обороны. Подробнее об архитектуре можно прочитать здесь

В теории, эта модель должна работать лучше “наивных” версий xG, которые в лучшем случае анализируют информацию о предыдущих действиях команды, чтобы “угадать” тип атаки, который привел к удару

Респект авторам, которые сами указывают на главные недостатки модели - не учитывается часть тела бьющего и высота на которой находился мяч

Теперь, используя картинку из телетрансляции, вы можете перенести расположение игроков в симулятор и узнать примерное xG интересующего момента
Гибридные схемы и ложные фулбэки уже даже не удивляют. Как минимум в двух топовых матчах этих выходных тренеры использовали эти концепции. И речь даже не о Гвардиоле или Нагельсмане

Дани Алвес в игре против Атлетико постоянно смещался в центр, освобождая фланг для Адама Траоре. Похожим образом действовали Тео Эрнандес и Калабрия в миланском дерби. Пиковый уровень Челси этого сезона совпал с отрезком, когда Чилвелл и Джеймс совершали движения не во фланг, а внутрь

Одним из преимуществ узкого расположения фланговых защитников принято считать их более выгодную в случае потери мяча позицию, что позволяет команде быть подготовленной к переходной фазе

Джон Мюллер из the athletic провел исследование и обнаружил, что хотя пасы в финальной трети из полуфланга на край (overlap) все еще более распространены, доля передач в обратном направлении (underlap) за последние 7 лет удвоилась

На картинке сравнение зон, в которых Тео Эрнандес принимал мяч в матче с Интером и за последние два сезона

@markstats
Игроки АПЛ с наиболее значительным изменением вовлеченности в пасовые метрики своей команды по сравнению с прошлым сезоном

Основными условиями для попадания в расчетную группу были: отыграть достаточное количество минут, остаться игроком той же команды и иметь разницу игрового времени в пределах 10%

Список возглавляет Кевин Де Брёйне. В прошлом сезоне он провел на поле 58% из максимально возможных минут, в этом - 53%. При этом, вклад в создание угрозы снизился почти вдвое (с 12.2% до 6.5%)

На the athletic есть статья о “затруднениях” КДБ, в которой Сэм Ли рассуждает о возможных причинах:

На данном этапе Гвардиола делает ставку на терпеливые горизонтальные розыгрыши и снижение количества переходных фаз. По словам журналиста, терпение не является отличительной чертой характера Кевина. Поэтому в полузащите Пеп предпочитает Гюндогана и Бернарду, которые реже рискуют и лучше сохраняют мяч. КДБ все чаще можно увидеть в роли нападающего, что не может не влиять на креативные показатели

@markstats
На 75 минуте встречи МЮ - Саутгемптон Антони Эланга заменил Скотта Мактоминей, Юнайтед перестроился на 4-2-4, а в пару к Полю Погба в центр полузащиты опустился Фернандеш

Ход с размещением на поле максимально возможного числа атакующих игроков, иногда приводит и к положительным результатам, но в конкретном случае баланс все же был нарушен

Без Мактоминея у Юнайтед не осталось игрока, который не был бы нацелен только на обострение, а мог бы просто сохранить мяч. Игра свелась к длинным забросам в исполнении фулбэков и Бруну на одного из открывающихся за спину форвардов

После 75-й минуты было создано в два раза меньше ожидаемой угрозы, чем за соизмеримый отрезок второго тайма до замены, точность передач упала с 85% до 72%. Из-за постоянных переходов владения, МЮ так и не смог качественно прижать соперника в концовке

Особенно невыразительно это выглядело на фоне тактических перестроений Хазенхюттля, которые помогли Саутгемптону вернуться в игру после первых минут доминирования Юнайтед

@markstats
ПСЖ - Реал

“С возрастом Месси неизбежно потеряет в скорости, но сможет играть в полузащите как Хави или вообще где захочет”. Это слова бывшего помощника Гвардиолы Доменека Торрента

На данном этапе карьеры, Лионелю отлично подходит роль глубинного плеймейкера. Особенно, если соперник согласен проводить много времени на своей трети. Как, например, Реал в первом тайме вчерашнего матча (наклон поля 77% в пользу ПСЖ)

Хозяева использовали гибридную схему, которая в позиционных атаках напоминала 3-3-4: Данило становился третьим защитником, Месси опускался в тройку к Паредесу и Верратти, откуда и помогал с продвижением и созиданием. Лео находился практически в центральном круге поля, когда на 17-й минуте он, в стиле квотербеков из американского футбола, вывел Мбаппе один на один с Куртуа

Во втором тайме Реал отодвинул игру от своих ворот, подровнял владение мячом и территорией, позиционных атак у Парижа стало меньше, а переходных моментов - больше. Поэтому, Месси проявил себя уже в другом аспекте - здорово разгонял быстрые атаки. В итоге, как это часто бывает, занял первые места почти по всем ключевым атакующим метрикам (xThreat, Fields Gained через пас и carry, Deep Completions)

На картинке тепловые карты зон приема мяча в матче с Реалом и за последние два сезона

Ссылка на отчет о матче на канале @markmatch
Сравнивая показатели Ливерпуля в конкретной игре (точки с подписями) с остальными матчами сезона в АПЛ и ЛЧ (полупрозрачные), можно заметить две вещи, за которые нужно хвалить Интер:

Эффективный прессинг

Обычно, примерно треть атак Ливерпуля, начавшихся в первой трети, успешно добираются до половины соперника. Команда прекрасно разыгрывает мяч и входит в элиту по метрикам “эффективности билдапа”. Персональный прессинг Интера вчера работал настолько хорошо, что практически каждая такая метрика Ливерпуля была вдвое ниже среднего значения по сезону

Выход из-под прессинга

Снова сравниваем с другими командами, столкнувшимися с давлением Ливерпуля. Средний соперник пасует с точностью 72% за пределами финальной трети. Интер же не стеснялся разыгрывать коротко и отдавал 80.7% точных передач

По проценту атак, которые начались в первой трети и успешно добрались до трети Ливерпуля, существенно превзойти показатель Интера (10.9%) в этом сезоне удалось только Атлетико, Ман Сити, Бёрнли и Лидсу

@markstats
Мы обработали около 50 тысяч угловых и сравнили результаты двух стратегий ввода мяча: короткие розыгрыши и подачи в штрафную

Количественно в выборке доминируют навесы. Даже у команд с самым большим процентом коротких розыгрышей, их доля не превышает 50% (у Барселоны - 41%, Реала и Сити - по 34%)

Чтобы оценить эффективность, были рассмотрены 10 следующих за угловым событий и рассчитаны ожидаемые голы созданных (xG) и допущенных (xGA) моментов. Такой способ позволяет учесть не только количество ударов, но еще и оценить их среднюю “опасность”

В пересчете на 100 попыток, прямая подача в штрафную является немного более рискованной стратегией: выше вероятность допустить удар в течение следующих 10 действий. При этом, “вознаграждение” в виде возможности создания качественного момента, значительно перевешивает этот “риск”

Было подсчитано, что за последние 3 года наиболее эффективные короткие розыгрыши были у Хоффенхайма и Интера, а подачи в штрафную - у Юве и Униона. Картинки - в комментариях

@markstats
Гол Деяна Кулусевски в ворота Ман Сити был забит в результате непрерывной цепочки передач, начатой вводом мяча от своих ворот

Доставить мяч до ударной позиции после розыгрыша от голкипера - крайне редкое событие. Может показаться, что второй гол Тоттенхэма тоже попадает в категорию успешных атак от своих ворот. Но если подходить к вопросу алгоритмически, это не совсем так. В том владении был зафиксирован неточный пас Харри Кейна, прерванный Диашом. Уже после этого, игроки Тоттенхэма совершили подбор второго мяча и доставили его до ударной позиции. То есть, цепочка передач формально прервалась

Даже если расширить понятие “успешный”, и кроме ударов по воротам учитывать передачи в опасный радиус 20 метров (deep completion), все равно получится, что непрерывные атаки от своих ворот случаются лишь один раз в две игры

На графике количество успешных владений, начатых ударом от ворот. Больше всего таких атак в этом сезоне АПЛ провел Ман Юнайтед, меньше всего допустил - Челси

@markstats
Помните недавний пост о метрике “ров” (moat), которая предлагалась как возможный индикатор качественной позиционной обороны?

Главным недостатком той версии модели было то, что кроме позиционных атак, мы также учитывали угрозу, допущенную после быстрых прорывов. Этот нюанс был исправлен и теперь в расчетах используются только передачи, совершенные после 20 секунды владения и только если соперник не вел в счете (game state)

Это длинное вступление было для того, чтобы сказать, что Ювентус вчера неплохо припарковался. Или, если посмотреть с другой стороны, Вильярреал не справился со взломом низкого блока. Кроме эпизода, когда защитники Юве дружно упустили забегание Парехо, у ворот Щесны было создано не так уж много угрозы. Учитывая наклон поля 82.4% в пользу Вильярреала, можно было ожидать большего

На графике матчи этого розыгрыша ЛЧ, в которых одна из команд много позиционно оборонялась, но допустила, при этом, мало угрозы в поздних фазах владения

@markstats