FootSci
86 subscribers
41 photos
2 files
27 links
Работа с футбольными данными, метрики, визуализация, аналитика и многое другое.


@mborodastov - автор
t.iss.one/footsci_eng
Download Telegram
В дополнение про тему влияния футзальной базы на качество игры в большом футболе.

Обычно ярче всего эти навыки выделяются у атакующих футболистов. Однако есть примеры и вратарских историй. По ссылке приводится краткая статья годичной давности на skysports с комментариями Эдерсона относительно его минифутбольного прошлого и того, как это помогает ему в игре.

Futsal really helped with that. You have to be calm, make the right decisions, pick the right passes. Because it is a small-sided pitch, you are playing under pressure a lot of the time and that helps me as a player even today. It makes that feeling of calmness more natural.

https://www.skysports.com/football/news/11679/12851047/ederson-exclusive-interview-man-city-goalkeeper-on-assists-futsal-skills-being-crazy-and-targeting-the-treble
🔥4
Динамика эффективности ТОП5 команд Бундеслиги через оценку разницы ожидаемых голов после ударов по воротам соперников (xG) и ударов, допущенных у своих ворот (xGC).

Для сглаживания использовал скользящее среднее по 3 матчам.

В зависимости от разницы - соответствующая раскраска внутри по xGD.

- Байер - большая часть сезона xGD > 1, последние 7 туров (начиная с января) стали создавать на 1 xG меньше, есть тренд

- Бавария - существенный участок чемпионата xGD > 2, но с 11 тура плавный спад. Уже потерли более 1.5 xG. Плюс с 18 тура резкий рост по xGC. Как итог по xGD < 1.

- Штутгарт - хороший участок в первой половине чемпионата, затем спад и нормализация.

- Боруссия Д - худшие по xGC среди ТОП5 на участке с 10 по 16 тур с отрицательным xGD. Затем нормализация.

-РБЛ - хороший участок с 8 по 19 туры, затем спад.

Этот график полезен, чтобы понимать, из чего состоит xGD, которую далее буду сравнивать с xTD.
👍4
Вот как выглядит аналогичная разница для xT vs xTC.

Визуально картинки кажутся похожими с предыдущими. Действительно между разницей по xTD и по xGD есть некоторая линейная взаимосвязь.

Для некоторых команд она выражена более сильно, для некоторых менее.

Это ожидаемый результат, так как xG - как вероятность гола из определенной точки футбольного поля, содержится в упрощенном виде внутри xT.

Однако, напрямую сравнивать эти показатели не совсем корректно.

xT - служит для оценки ожидаемого эффекта от действий, которые переводят мяч в зоны с повышенной вероятностью гола. (передачи и продвижения)

xG - оценивает ожидаемые голы непосредственно после ударов.
1👍1
Тем не менее мы можем качественно сравнивать команды друг с другом по демонстрируемым xGD и xTD и выделять ситуации, когда наблюдаются асиметричные перфомансы с точки зрения двух этих показателей.

Если упрощать, то

1) xTD - высокое (выше среднего), xGD - низкое (ниже среднего)-> команда хорошо доставляет мяч в зоны с повышенной вероятностью гола, но не может качественно завершать владение ударами

2) xTD - низкое, xGD - высокое -> команда чаще доставляет мяч в зоны, из которых наносятся опасные удары, не через "полноценное" владение (продолжительные комбинации, цепочки из нескольких передач), а спорадически (короткие владения после возврата мяча на чужой половине, владение после борьбы и т д)
1👍1
Вот так соотносятся xGD и xTD для тех же ТОП5 команд.

Для РБ высокая корреляция межу фактическими значениями и довольно сильное визуальное наложение параметров.

Для Баварии и Штутгарта корреляция слабая, те в xT не содержится некоторая полезная информация, объясняющая то, как эти команды конвертируют владение в удары. Что еще раз подчеркивает некоторую ограниченность данного инструмента и напоминает, что xT не всегда напрямую связан с итоговым xG.
👍1🔥1
Если вам нужна актуальная статистика с fbref для анализа, то можете использовать парсер, который я выложил сюда

https://github.com/hadjdeh/football-data-analysis/tree/main/Scraping_fbref_static_data/notebooks

Если нужны уже собранные данные, то в том же репозитории есть

data/old_seasons/ - данные за последние 5 сезонов по Топ5 лигам

-top5_leagues_keeper_2018_2019__2022_2023.csv: Goalkeeper statistics for the last five seasons.
-top5_leagues_outfields_2018_2019__2022_2023.csv: Outfield player statistics.
-top5_leagues_team_2018_2019__2022_2023.csv: Team-level statistics.
-top5_leagues_team_vs_2018_2019__2022_2023.csv: Team versus team statistics.

data/current_season/2024-03-02/ - данные по текущему сезону по Топ5 лигам

-top5_leagues_keeper_2023_2024.csv: Current season goalkeeper statistics.
-top5_leagues_outfields_2023_2024.csv: Outfield player statistics.
-top5_leagues_team_2023_2024.csv: Team-level statistics.
-top5_leagues_team_vs_2023_2024.csv: Team versus team statistics.

Ключевые "advanced" метрики, доступные на fbref - это xG, PSxG, xA от Opta.
👍7
Лучшие по созданной угрозе по xT через передачи и продвижения в TOP5 европейских чемпионатах в привязке к зонам.
👍7
TOP10 в Европе по опасности, создаваемой через передачи с игры. (OP xT)
👍2
Интересная картинка.

Эволюция технологий в футболе (на примере АПЛ).
🔥3
Автор указывает на то, что развитие технологий в топовых чемпионатах приводит к постепенному увеличению перформанса команд.

Для иллюстрации приводится динамика изменения среднего количества очков за матч по ходу сезона для победителей АПЛ в разрезе трех 10-летий.
1👍1
Forwarded from Соккер-радар
Как назвать позицию Беллингема? Загадка сезона.

Против «Лейпцига» формально играл ложную девятку, но периодически уходил настолько глубоко, что становился восьмеркой и взаимодействовал с фланговыми игроками.

В этом сезоне он часто открывается между линиями и как десятка регулирует процессы.

Но при этом невероятно много забивает (лучший бомбардир Ла Лиги) как будто бы он Холанд!

Тепловая карта Беллингема по матчам, кажется, хорошо подчеркивает многообразие его роли.

Смахиваем пыль со словосочетания «Свободный художник»? Правда, и оно вряд ли отражает суть Беллингема, так как предполагает освобождение от некоторых обязанностей и, возможно, даже лень. А он дисциплинированный командный игрок.

В общем, «Лейпциг», конечно, жаль, но здорово, что Беллингем остается в ЛЧ. Явление!

@soccerradar
👍2👻1
Выше атакующий радар для первого матча 28 тура Ла Лиги.

Выложил на github jupyter notebook с пошаговым описанием, как строить такие радары.

https://github.com/hadjdeh/football-data-analysis/tree/main/Team_radar

Нужно сделать всего два шага

1) обновить данные с fbref.com по интересующей лиге
2) Запустить ноутбук для отрисовки радаров

Дальше хочу автоматически отгружать в тг или твиттер.

Также попробовал описать роадмап ближайшей активности - https://github.com/hadjdeh/football-data-analysis/blob/main/README.md.

Буду обновлять и актуализировать этот файл.
🔥2
Ливерпуль - Ман Сити

Сравнение базовых статистик, отражающих качество игры в атаке.

Ливерпуль набирает в среднем более 19 ударов за матч, что соответствует лучшим показателям в Европе за последние 5 лет. Как итог - почти 2 ожидаемых гола за игру.

Ман Сити проникает в штрафную через продвижения на дриблинге почти 11 раз за матч в среднем. Это 100 перцентиль - лучшие в Европе за последние 5 лет соответственно.

Обе команды ожидаемо демонстрируют высокие значения всех базовых стат показателей.
🔥2
Ливерпуль - Ман Сити

Оборонительные метрики.

Посмотрим, что напишишет ChatGPT по данной визуализации.

🌟 Предматчевый разбор: "Манчестер Сити" против "Ливерпуля" | Анализ защитных стратегий 🛡️ | Сезон 2023-2024 🏆

🔵 "Манчестер Сити" продемонстрировал феноменальную оборону в текущем сезоне, причем их показатели впечатляют на фоне статистики ТОП5 европейских лиг за последние 5 лет. С ожидаемыми пропущенными голами (npxG C.) на уровне 94-го процентиля, они доказывают, что их ворота одни из самых надежных в лиге. Игра на мяче — еще одна сильная сторона "Сити", ведь низкий процент подкатов свидетельствует о контроле над игрой и владении мячом, что уменьшает необходимость в агрессивной обороне.
👍2
Далее про Ливерпуль


🔴 "Ливерпуль" не отстает с их высокооктановым стилем прессинга. Статистика PPDA на уровне 94-го процентиля подчеркивает, что "Ливерпуль" активно оказывает давление на соперников, стараясь быстро возвращать мяч. Эта тактика принуждает противников к ошибкам и ускоряет переход от обороны к атаке.

📈 Данные радара, построенного с учетом данных по пяти лучшим лигам, выделяют "Манчестер Сити" как команду с одной из лучших оборон последних лет, в то время как "Ливерпуль", несмотря на более низкие перцентильные значения в некоторых статистиках, сохраняет свои позиции благодаря эффективной тактике прессинга.

Остается вопрос, сможет ли давление "Ливерпуля" нарушить контроль "Манчестер Сити" над мячом и преобразовать игру в свою пользу. Следите за матчем, чтобы увидеть, как стратегии этих двух великанов противостоят друг другу на поле! 🏟️
👍2
Кажется, что сырой GPT без дополнительного тюнинга или преднастрйки промтами не очень качественно справляется с поставленной задачей.

PPDA корректно связал с прессингом, но использовал выражение High-Octane pressing, что не очень хорошо транслируется с английского на русский.

Но в целом суть более менее передана верно.
👍2
Никогда в истории АПЛ не было такой плотности по набранным очкам в тройке претендентов после 28 туров.
3
top_europe_GOALSCORERS.jpg
839.6 KB
Карты ударов и голов для лучших в Европе по количеству голов на 90 минут игрового времени.

Фильтр по сыгранным минутам - более 14 90-минуток.

Кейн и Гирасси - больше гола за 90 минут в среднем.
👍2
top_europe_BY npxG.jpg
854.8 KB
Аналогичный рейтинг, только теперь игроки отсортированы по xG без учета пенальти на 90 минут игрового времени.

Кейн остается на первом. В среднем набирает 0.9 npxG за игру и оверперформит свои ожидаемые показатели, демонстрируя лучшие в Европе 1.1 npG.

Холанн будучи 9 по фактической эффективности попадает на 2ое место по ожидаемой эффективности с 0.83 npxG за игру. Интересно подметить, что только Норвежец имеет отрицательную разницу между npG и npxG среди лучших бомбардиров с предыдущего рейтинга.

Гирасси же наоборот в рейтинге по xG попадает на 7 место, что подчеркивает насколько сильно он оверперфомит, относительно модельных оценок. (1.08 голов, против 0.68 xG)
👍2
Франция. Лига 1. Лучшие по метрике xT по текущему сезону в разрезе зон.

Тотальное доминирование Парижа в финальной трети и зеркальное заполнение зон первой трети Брестом, идущим вторым.

Монако представлен двумя игроками, которые создают наибольшую опасность из центральной части поля в среднем блоке и в непосредственной окрестности штрафной.

К сожалению, Францию почти не смотрю. Видел комплиментарное интервью Нобеля. Кроме сухих цифр у меня нет базы для формирования собственного представления относительно перформанса Головина в текущем сезоне. В любом случае приятно видеть его фамилию в окружении таких игроков как Мбаппе и Дембеле.
👍3