Футбол в цифрах – Telegram
Футбол в цифрах
10.6K subscribers
1.15K photos
569 links
Футбол, продвинутая статистика, аналитика.

Поддержать проект https://ko-fi.com/markstats

@markmatch - наш канал с отчетами матчей.

По всем вопросам обращайтесь к @jan_curtis
Download Telegram
До закрытия летнего трансферного окна остается еще очень много времени, но уже сейчас на рынке выделяются две тенденции

1. Увеличение доли обменов и бесплатных трансферов

На первом графике процентное соотношение типов сделок: переходы игроков за деньги, бесплатно или в аренду

Летом 2017 каждый второй трансфер был осуществлен за вознаграждение, в последующие два года уже каждый третий. Но начиная с лета 2020, лишь 26% переходов в другой клуб совершаются за деньги

Доля бесплатных трансферов в 2021 году составляет 36.7% (в эту категорию включены обмены)

2. Уменьшение средней суммы сделки

На втором графике сравнение стоимости одного трансфера за последние 5 лет с разбивкой по лигам. Чтобы снизить влияние самых дорогих покупок, мы использовали не среднее арифметическое, а медиану

Тренд наиболее заметен в АПЛ - по сравнению с прошлым сезоном, стоимость одного трансфера сократилась почти вдвое. Многие команды предпочитают инвестировать в более доступных молодых игроков

patreon.com/markstats
Удары от ворот - третий по частоте упоминания в событиях матча тип стандартных положений (после аутов и свободных ударов)

Мы сравнили эффективность коротких и длинных вводов мяча в игру. Короткими считаются передачи голкипера, адресованные внутрь радиуса 40 метров от центра своих ворот, остальные - длинными

Для расчетов использованы все имеющиеся в нашей базе матчи сезона 20/21. В таблице результаты, к которым привели следующие после удара от ворот пятнадцать событий матча

Для кого-то прозвучит парадоксально, но атаки, начатые коротким пасом, в среднем продвигают мяч на 20 метров дальше

Используя короткий ввод мяча, команда в два раза повышает вероятность сохранить владение и, что более важно, существенно увеличивает шанс нанести удар в течение следующих 15 действий

Важно подчеркнуть, что на графике результаты среднестатистической команды. Как и в случае игроков, которые оверперформят свои xG, некоторые клубы могут значительно превышать эти показатели

patreon.com/markstats
Мы проанализировали стили игры команд из топ-5 прошлого сезона и, используя методы машинного обучения и статистического анализа, изобразили их на одном графике

Стиль определяется набором метрик, отвечающих на вопрос “как играет команда” - владение или контратаки, прессинг или низкий блок, средняя длина передачи, прямолинейность и так далее

Оси координат не подписаны потому, что расположение команды на плоскости (левее, правее, выше или ниже) не имеет значения. Что действительно важно - расстояния между точками. Чем ближе команды на графике - тем сильнее они похожи стилистически

ПСЖ, Сити и Барселона входят в кластер, отличающийся большим процентом владения, преобладанием коротких горизонтальных передач и малым количеством навесов

В соседнюю группу входят Бавария, Ливерпуль и Аталанта - команды, которые тоже много владеют мячом, но с чуть более “вертикальным” подходом и агрессивным прессингом

Ссылка на картинку в оригинальном разрешении

patreon.com/markstats
График демонстрирует вовлеченность игроков в атаки, закончившиеся моментом у ворот соперника. Результаты разбиты на три категории: игрок нанес удар самостоятельно, ассистировал или принял участие в билдапе (отдал одну из пяти предшествующих удару передач)

Если игрок одновременно и участвовал в билдапе, и заработал удар/ассист, то, как более ценное действие, мы засчитывали только удар/ассист

В сезоне 20/21 Месси помогал команде в создании 9.5 ударов по воротам за матч. Среди игроков, которые провели на поле более 900 минут, он уступает только Неймару и Муриэлю. Последний часто выходит в концовках матчей против уставших соперников и, при пересчете на 90 минут, это помогает ему оказываться в топе очень многих рейтингов

Усман Дембеле - ближайший к Месси игрок в составе Барселоны - имеет результат 6.3 моментов за 90 минут. В новом сезоне многое будет зависеть от того, сможет ли Мемфис Депай перенести в более сильный чемпионат свои прошлогодние 7.2 ударов за матч

patreon.com/markstats
График демонстрирует изменения показателей в атаке при переходе игроков из одного топ-чемпионата в другой

Мы рассмотрели все трансферы форвардов и полузащитников за последние 4 сезона. В строках таблицы находятся лиги “откуда” они перешли, в столбцах - “куда”. Сравнивались два сезона - последний до трансфера и следующий после. Под “атакующими показателями” понимаются сумма ожидаемых голов и ассистов за 90 минут (NPxG + xA p90)

В Бундеслиге исторически наносится больше ударов за матч, чем в других топ-чемпионатах (Серия А вышла на первое место только в прошлом году). Поэтому, игроки переходящие из Германии, часто не могут повторить свои цифры в новой лиге. Особенно заметно при переходе в АПЛ (-38.1%) и Ла Лигу (-26.1%). На ум приходят выступления Вернера в Челси или Аллера в Вест Хэме

Похожий эффект наблюдается и при подписании нападающих из Франции. Например, игроки, приезжающие в Испанию, набирают в среднем на 24% меньше ожидаемых голов и ассистов, чем было в Лиге 1

patreon.com/markstats
Недавно мы писали про эффективность короткого розыгрыша от ворот. Тогда для анализа использовались объединенные данные топ-5 и РПЛ. На этот раз, пересчитано отдельно: первый график - результаты в Европе, второй - в Российской лиге

В РПЛ только Зенит, Локомотив, Краснодар и Спартак относительно регулярно коротко вводят мяч в игру. В среднем же, 73.4% владений начинаются длинным пасом за пределы радиуса 40 метров. Для сравнения, в Европе доля коротких розыгрышей составляет 43.4%

Одним из следствий того, что коротким вводом в Российской лиге пользуются лишь небольшая группа топ-клубов, является то, что его эффективность в среднем даже выше, чем в Европе:

- 8.5% коротких розыгрышей заканчиваются ударом (против 6.0%)
- владения, начатые коротко, в РПЛ продвигают мяч на пять метров дальше, чем в Европе

Увеличению показателей эффективности способствует еще и то, что в Российской лиге очень мало команд, которые предпринимают попытки оказывать высокое давление на билдап соперника

patreon.com/markstats
Мы проанализировали все владения команд, которые в прошлом сезоне привели к созданному моменту у ворот соперника

На графике самые распространенные кластеры трех последних передач перед ударом. Пунктирными линиями обозначены кроссы. Цифра внутри прямоугольника - размер кластера

Одного взгляда на график достаточно, чтобы распознать угрозу, которая исходит с левого фланга Арсенала (Тирни и Сака)

Далее можно заметить, что кроме навесов Хуана Куадрадо, у Ювентуса в прошлом сезоне проходили быстрые вертикальные атаки, доставляющие мяч со своей трети в зоны удара

Подобным способом можно проанализировать не только завершающую фазу атаки, но и найти закономерности в розыгрыше от ворот, продвижении мяча в финальную треть и так далее. Если отсортировать кластеры по размеру и вывести не верхние четыре (как сделали мы), а значительно больше, это поможет в деталях изучить повторяющиеся шаблоны игры интересующей вас команды

patreon.com/markstats
Примерно раз в год “Футбол в Цифрах” устраивает поиск идеальной замены Давида Сильвы в Манчестер Сити. На этот раз, мы воспользовались методом главных компонент и сгруппировали популярных полузащитников из топ-5 в кластеры

Как и в случае с командами, оси координат не подписаны, расположение точек на плоскости не имеет значения, важны расстояния между ними. Чем ближе игроки друг к другу - тем сильнее они похожи стилистически

Под “стилем” понимается совокупность показателей, оценивающих манеру игры и роль на поле. Например, насколько часто относительно числа касаний игрок пытается пойти в обводку, вступить в единоборство, совершить навес или передачу с продвижением. Итого набралось около 20 различных метрик

Среди рассмотренных игроков, на Давида Сильву образца 2017-2019 больше всего похожи Танги Ндомбеле, Бернарду Силва и Марко Верратти, а Джека Грилиша алгоритм [справедливо] относит к кластеру форвардов

Ссылка на картинку в хорошем качестве

patreon.com/markstats
Ромелу Лукаку в сезоне 2020/21 с большим отрывом был самым вовлеченным в быстрые атаки своей команды игроком Серии А

У компании Opta очень строгие критерии того, чтобы момент квалифицировался как “fast break” - удар должен быть нанесен в течение нескольких секунд сразу после отбора мяча на своей половине поля

Бельгиец принял участие в наибольшем числе атак, удовлетворяющих условиям Опты - 13 раз завершал сам, в 8 случаях напрямую ассистировал партнеру и еще один раз помог в билдапе

Имея в составе нападающего с такими качествами, у Тухеля появляется опция с переходом в очень эффективный вертикальный режим игры, который может быть полезен против активно прессингующего соперника или если команда уже ведет в счете

patreon.com/markstats
График демонстрирует уникальные классы передач, которые отличают игрока от других центральных полузащитников из топ-5

Рассмотрены все пасы с игры (включая неточные), совершенные в прошлом сезоне в домашних чемпионатах, еврокубках и на Евро-2020

Длинные переводы с левого фланга на правый являются визитной карточкой Тони Крооса и сильнее всего отличают его от других игроков, выступающих на похожей позиции

Уникальные кластеры Мануэля Локателли указывают, что в прошлом сезоне он участвовал во всех фазах игры Сассуоло и сборной Италии: помогал с розыгрышем от ворот, продвигал мяч в развитии атаки и пасовал в штрафную

Френки Де Йонг намного чаще чем средний игрок его позиции принимает мяч в опорной зоне и штрафной соперника

Среди кластеров Родриго Де Пауля выделяются необычные с точки зрения традиционных центральных полузащитников попытки проникновения в штрафную с правого полуфланга

Ссылка на картинку в хорошем качестве

patreon.com/markstats
Перерыв на матчи сборных - это отличный повод для подведения итогов стартового отрезка Российской Премьер-Лиги 2021-22

Команда “Футбола в Цифрах” подготовила большую статью, в которой, с помощью продвинутой статистики, проанализировала команды и игроков РПЛ с различных точек зрения:

-Кто из лидеров чемпионата, ведя в счете, моментально садится в оборону, а кто продолжает атаковать?
-Созданная и допущенная ожидаемая угроза (xThreat)
-Хвича все еще лучший дриблер РПЛ?
-Какая команда наиболее эффективна в прессинге?
-Игроки, проявившие себя с точки зрения продвижения мяча
-Какие 6 клубов РПЛ доводят хотя бы половину своих владений до трети соперника?
-Три команды с самыми высокими линиями обороны
-Лидеры среди игроков по количеству deep entrances

Если вы хотите поддержать проект, сделайте репост и подпишитесь на наш Patreon, ссылка patreon.com/markstats
График демонстрирует соотношение побед и поражений в индивидуальных дуэлях команд АПЛ с разбивкой по зонам

Дуэлями мы считаем попытки отбора, фолы, верховые единоборства и обводки, подборы и перехваты не учитываются

Вулверхэмптон лидирует по проценту выигранных индивидуальных противостояний (57%). Много побед “волкам” принесли дуэли в атаке на левой стороне поля (зоны 7, 10, 13, 16). На этом фланге в новом сезоне располагается Адама Траоре, который, благодаря своей технике и атлетизму, выиграл 89% единоборств

Арсенал проиграл 10 из 17 дуэлей в центре своей штрафной (зона 2) - худший результат среди всех команд лиги

Возглавляющий турнирную таблицу Тоттенхэм имеет самый низкий процент побед (44%) в АПЛ. Особенно много противостояний проигрывается справа в обороне, где играет молодой Джафет Танганга, уступивший в 61% случаев

Стандартное в таких случаях предупреждение об очень маленькой выборке данных

Ссылка на оригинал картинки

patreon.com/markstats
Модель Expected Goals On Target (xGOT) для оценки вероятности гола использует все те же параметры, что и традиционная xG, но, кроме того, учитывает дополнительную информацию о том, куда именно был направлен мяч

xGOT входит класс post-shot моделей, использующих характеристики, появляющиеся у удара только после его совершения. Классическая же Expected Goals - это pre-shot модель, она оперирует только той информацией, которая была известна до момента удара

Интересно сравнивать значения pre- и post-shot моделей для одних и тех же наборов данных. Это позволяет, например, оценить увеличил ли игрок своим исполнением вероятность забить или, наоборот, уменьшил

Для примера рассмотрим гол Сона в ворота Ман Сити в первом туре АПЛ. Классическая модель xG учла игровую ситуацию, точку откуда был нанесен удар и оценила вероятность забить в 2%, но, с учетом исполнения, вероятность возросла до 21%

В следующих постах мы сравним xG и xGOT игроков на длинной дистанции

patreon.com/markstats
Совместно с Roaming Playmaker мы продолжаем работать над сервисом Polar Bear, который позволяет визуализировать перформанс любого игрока из топ-5 и сравнить его с другими, выступающими на похожей позиции

Список новых возможностей, которые теперь поддерживает Polar Bear:
- данные по игрокам из топ-5 начиная с 2017 года
- режим сравнения с возможностью выбора интересующего вас сезона для каждого из игроков
- имена игроков в списке дополнены информацией о команде

Каждый сектор окружности представляет собой одну метрику, цветами выделены три группы характеристик: “оборона”, “атака” и “владение”. В прямоугольниках значение параметров в пересчете на 90 минут. Радиус сектора показывает перцентиль, в который попадает игрок, чем шире фигура - тем лучше. Данные берутся с FBRef и обновляются раз в неделю

Сервис Polar Bear абсолютно бесплатный, но мы будем рады, если вы рассмотрите возможность поддержки проекта. Купить кофе разработчикам можно по ссылке
Как и было обещано, мы рассчитали влияние качества исполнения ударов на изменение вероятности забить гол для дистанции более чем один сезон

“Мастерство исполнения” - это разница между прогнозами моделей xGOT и xG для всех ударов, поделенная на их количество. Если полученное число положительное, значит игрок в среднем увеличивает вероятность забить, отрицательная - уменьшает. Пенальти и штрафные удалены из выборки, для удара мимо ворот xGOT равен нулю

Среди рассмотренных игроков лучший показатель качества исполнения имеет Лионель Месси. И это даже без учета ударов со штрафных. Такая большая разница между xGOT и xG заработана благодаря уникальному умению наносить точные удары с неочевидных позиций, среднее значение xG одного удара меньше только у Мэйсона Гринвуда

Важно отметить, что модель xGOT не учитывает положение голкипера в створе. Поэтому, для некоторых типов ударов прогноз может быть заниженным. Например, для завершений прямо по центру в пустые ворота

patreon.com/markstats
Статья, в которой мы проанализировали три матча сборной России, сыгранные в это окно, и затронули следующие темы:

- Объем, эффективность и интенсивность прессинга в сравнении другими национальными командами
- Сколько процентов владений сборной России достигли трети соперника?
- Кто из игроков отдавал самые опасные передачи, кто чаще всех высоко прессинговал, а кто возвращал владение?
- Повторяющиеся шаблоны в игре: выходы со своей трети, продвижение мяча и создание моментов
- Какая доля ударов от ворот была разыграна коротко?

Если вы хотите поддержать проект, сделайте репост и подпишитесь на наш Patreon
Уже очень скоро Зенит начнет свое выступление в Лиге Чемпионов 21/22. Мы подготовили отчет о первом сопернике питерской команды, в котором

- Изучили принципы игры Челси в различных фазах: выход со своей трети, продвижение мяча, проникновение в финальную треть и создание остроты у ворот соперника

- Сравнили перформанс под руководством Тухеля и Лэмпарда

- Нашли команды, которые преуспели в матчах против Челси и попытались разобраться как им это удалось

- Определили самых опасных игроков и связки “пасующий — адресат”

Отчет о матче Челси - Зенит, содержащий разнообразную продвинутую статистику, вы найдете на нашем канале @markmatch сразу после финального свистка

patreon.com/markstats
PPDA - это метрика интенсивности прессинга. Показывает сколько передач успевает отдать соперник до того как команда совершит оборонительное действие (Passes Allowed Per Defensive Action)

Мы изучили влияние счета на табло (game state) на изменение PPDA. Рассмотрены все матчи, сыгранные в прошлом сезоне в топ-5 и РПЛ

Результаты совпадают с ожиданиями. Даже самые прессингующие команды, выигрывая, начинают немного сбавлять интенсивность. И наоборот, уступая, пытаются вернуть мяч более активно, чем при ничейном счете

Средняя Европейская команда, играя вничью, имеет показатель 9.48 PPDA. В случае проигрыша, интенсивность прессинга увеличивается примерно на 20%

Из примечательного, прошлогодняя версия Спартака, выигрывая, не теряла в интенсивности, но даже слегка прибавляла. Интер Антонио Конте, по-умолчанию игравший в “режиме экономии”, проигрывая, начинал прессинговать на уровне уступающей в счете Барселоны или Баварии

patreon.com/markstats
Мы рассмотрели все атаки команд, которые привели к удару по воротам соперника. Полученные владения были разбиты на короткие (1-3 паса), средние (4-9) и продолжительные (10+). А в зависимости от того, где они были начаты, дополнительно сгруппированы по третям поля (Def, Mid, Att)

Воспользуемся примером Челси 21/22, чтобы показать как читать результаты. У лондонской команды на пересечении строки “10+” и столбца “Mid” находится значение 20%. Это означает, что каждое пятое владение Челси, которое завершилось ударом, состояло из более чем 10 передач и начиналось в середине поля

Возможно, дело в маленькой выборке, а не в радикальном изменении стиля Барселоны, но в прошлом году из 10 или более передач состояли 28% владений с ударом, в этом - лишь 9%. Кроме того, доля атак, начатых в своей трети, снизилась с 23% до 9%

57% успешных атак Баварии в этом сезоне были начаты на трети соперника и менее чем за 10 передач доставлены до точки удара

Ссылка на картинку в хорошем качестве

patreon.com/markstats
Недавно Джеймс Йорк (Statsbomb) в своем твиттере написал прекрасный пост:

"Почему, прежде чем оценивать силу команды, специалисты обычно просят подождать, чтобы она сыграла, скажем, 10 матчей?

Все потому, что на маленькой выборке данных, метрики могут быть очень нестабильными. Расписание матчей, травмы игроков, игра в неравных составах - все это, на короткой дистанции, оказывает сильное влияние на результаты

Но, к тому моменту, как команды успевают провести по 10 встреч, даже самые волатильные метрики приобретают относительную устойчивость"

На картинке пример изменения среднего значения xGDiff в прошлом сезоне АПЛ

Видно, что результаты первых пяти туров имеют мало общего с итоговыми показателями по окончании сезона. Однако, уже после шестой игры линии стабилизируются, а после десятой становятся практически горизонтальными

Если вы думаете что метрики, основанные на более частых (чем удары) типах событий, ведут себя иначе, в комментарии мы приложили такой же график, но для Non-Shot xG
1