FootSci
86 subscribers
41 photos
2 files
27 links
Работа с футбольными данными, метрики, визуализация, аналитика и многое другое.


@mborodastov - автор
t.iss.one/footsci_eng
Download Telegram
Тем не менее мы можем качественно сравнивать команды друг с другом по демонстрируемым xGD и xTD и выделять ситуации, когда наблюдаются асиметричные перфомансы с точки зрения двух этих показателей.

Если упрощать, то

1) xTD - высокое (выше среднего), xGD - низкое (ниже среднего)-> команда хорошо доставляет мяч в зоны с повышенной вероятностью гола, но не может качественно завершать владение ударами

2) xTD - низкое, xGD - высокое -> команда чаще доставляет мяч в зоны, из которых наносятся опасные удары, не через "полноценное" владение (продолжительные комбинации, цепочки из нескольких передач), а спорадически (короткие владения после возврата мяча на чужой половине, владение после борьбы и т д)
1👍1
Вот так соотносятся xGD и xTD для тех же ТОП5 команд.

Для РБ высокая корреляция межу фактическими значениями и довольно сильное визуальное наложение параметров.

Для Баварии и Штутгарта корреляция слабая, те в xT не содержится некоторая полезная информация, объясняющая то, как эти команды конвертируют владение в удары. Что еще раз подчеркивает некоторую ограниченность данного инструмента и напоминает, что xT не всегда напрямую связан с итоговым xG.
👍1🔥1
Если вам нужна актуальная статистика с fbref для анализа, то можете использовать парсер, который я выложил сюда

https://github.com/hadjdeh/football-data-analysis/tree/main/Scraping_fbref_static_data/notebooks

Если нужны уже собранные данные, то в том же репозитории есть

data/old_seasons/ - данные за последние 5 сезонов по Топ5 лигам

-top5_leagues_keeper_2018_2019__2022_2023.csv: Goalkeeper statistics for the last five seasons.
-top5_leagues_outfields_2018_2019__2022_2023.csv: Outfield player statistics.
-top5_leagues_team_2018_2019__2022_2023.csv: Team-level statistics.
-top5_leagues_team_vs_2018_2019__2022_2023.csv: Team versus team statistics.

data/current_season/2024-03-02/ - данные по текущему сезону по Топ5 лигам

-top5_leagues_keeper_2023_2024.csv: Current season goalkeeper statistics.
-top5_leagues_outfields_2023_2024.csv: Outfield player statistics.
-top5_leagues_team_2023_2024.csv: Team-level statistics.
-top5_leagues_team_vs_2023_2024.csv: Team versus team statistics.

Ключевые "advanced" метрики, доступные на fbref - это xG, PSxG, xA от Opta.
👍7
Лучшие по созданной угрозе по xT через передачи и продвижения в TOP5 европейских чемпионатах в привязке к зонам.
👍7
TOP10 в Европе по опасности, создаваемой через передачи с игры. (OP xT)
👍2
Интересная картинка.

Эволюция технологий в футболе (на примере АПЛ).
🔥3
Автор указывает на то, что развитие технологий в топовых чемпионатах приводит к постепенному увеличению перформанса команд.

Для иллюстрации приводится динамика изменения среднего количества очков за матч по ходу сезона для победителей АПЛ в разрезе трех 10-летий.
1👍1
Forwarded from Соккер-радар
Как назвать позицию Беллингема? Загадка сезона.

Против «Лейпцига» формально играл ложную девятку, но периодически уходил настолько глубоко, что становился восьмеркой и взаимодействовал с фланговыми игроками.

В этом сезоне он часто открывается между линиями и как десятка регулирует процессы.

Но при этом невероятно много забивает (лучший бомбардир Ла Лиги) как будто бы он Холанд!

Тепловая карта Беллингема по матчам, кажется, хорошо подчеркивает многообразие его роли.

Смахиваем пыль со словосочетания «Свободный художник»? Правда, и оно вряд ли отражает суть Беллингема, так как предполагает освобождение от некоторых обязанностей и, возможно, даже лень. А он дисциплинированный командный игрок.

В общем, «Лейпциг», конечно, жаль, но здорово, что Беллингем остается в ЛЧ. Явление!

@soccerradar
👍2👻1
Выше атакующий радар для первого матча 28 тура Ла Лиги.

Выложил на github jupyter notebook с пошаговым описанием, как строить такие радары.

https://github.com/hadjdeh/football-data-analysis/tree/main/Team_radar

Нужно сделать всего два шага

1) обновить данные с fbref.com по интересующей лиге
2) Запустить ноутбук для отрисовки радаров

Дальше хочу автоматически отгружать в тг или твиттер.

Также попробовал описать роадмап ближайшей активности - https://github.com/hadjdeh/football-data-analysis/blob/main/README.md.

Буду обновлять и актуализировать этот файл.
🔥2
Ливерпуль - Ман Сити

Сравнение базовых статистик, отражающих качество игры в атаке.

Ливерпуль набирает в среднем более 19 ударов за матч, что соответствует лучшим показателям в Европе за последние 5 лет. Как итог - почти 2 ожидаемых гола за игру.

Ман Сити проникает в штрафную через продвижения на дриблинге почти 11 раз за матч в среднем. Это 100 перцентиль - лучшие в Европе за последние 5 лет соответственно.

Обе команды ожидаемо демонстрируют высокие значения всех базовых стат показателей.
🔥2
Ливерпуль - Ман Сити

Оборонительные метрики.

Посмотрим, что напишишет ChatGPT по данной визуализации.

🌟 Предматчевый разбор: "Манчестер Сити" против "Ливерпуля" | Анализ защитных стратегий 🛡️ | Сезон 2023-2024 🏆

🔵 "Манчестер Сити" продемонстрировал феноменальную оборону в текущем сезоне, причем их показатели впечатляют на фоне статистики ТОП5 европейских лиг за последние 5 лет. С ожидаемыми пропущенными голами (npxG C.) на уровне 94-го процентиля, они доказывают, что их ворота одни из самых надежных в лиге. Игра на мяче — еще одна сильная сторона "Сити", ведь низкий процент подкатов свидетельствует о контроле над игрой и владении мячом, что уменьшает необходимость в агрессивной обороне.
👍2
Далее про Ливерпуль


🔴 "Ливерпуль" не отстает с их высокооктановым стилем прессинга. Статистика PPDA на уровне 94-го процентиля подчеркивает, что "Ливерпуль" активно оказывает давление на соперников, стараясь быстро возвращать мяч. Эта тактика принуждает противников к ошибкам и ускоряет переход от обороны к атаке.

📈 Данные радара, построенного с учетом данных по пяти лучшим лигам, выделяют "Манчестер Сити" как команду с одной из лучших оборон последних лет, в то время как "Ливерпуль", несмотря на более низкие перцентильные значения в некоторых статистиках, сохраняет свои позиции благодаря эффективной тактике прессинга.

Остается вопрос, сможет ли давление "Ливерпуля" нарушить контроль "Манчестер Сити" над мячом и преобразовать игру в свою пользу. Следите за матчем, чтобы увидеть, как стратегии этих двух великанов противостоят друг другу на поле! 🏟️
👍2
Кажется, что сырой GPT без дополнительного тюнинга или преднастрйки промтами не очень качественно справляется с поставленной задачей.

PPDA корректно связал с прессингом, но использовал выражение High-Octane pressing, что не очень хорошо транслируется с английского на русский.

Но в целом суть более менее передана верно.
👍2
Никогда в истории АПЛ не было такой плотности по набранным очкам в тройке претендентов после 28 туров.
3
top_europe_GOALSCORERS.jpg
839.6 KB
Карты ударов и голов для лучших в Европе по количеству голов на 90 минут игрового времени.

Фильтр по сыгранным минутам - более 14 90-минуток.

Кейн и Гирасси - больше гола за 90 минут в среднем.
👍2
top_europe_BY npxG.jpg
854.8 KB
Аналогичный рейтинг, только теперь игроки отсортированы по xG без учета пенальти на 90 минут игрового времени.

Кейн остается на первом. В среднем набирает 0.9 npxG за игру и оверперформит свои ожидаемые показатели, демонстрируя лучшие в Европе 1.1 npG.

Холанн будучи 9 по фактической эффективности попадает на 2ое место по ожидаемой эффективности с 0.83 npxG за игру. Интересно подметить, что только Норвежец имеет отрицательную разницу между npG и npxG среди лучших бомбардиров с предыдущего рейтинга.

Гирасси же наоборот в рейтинге по xG попадает на 7 место, что подчеркивает насколько сильно он оверперфомит, относительно модельных оценок. (1.08 голов, против 0.68 xG)
👍2
Франция. Лига 1. Лучшие по метрике xT по текущему сезону в разрезе зон.

Тотальное доминирование Парижа в финальной трети и зеркальное заполнение зон первой трети Брестом, идущим вторым.

Монако представлен двумя игроками, которые создают наибольшую опасность из центральной части поля в среднем блоке и в непосредственной окрестности штрафной.

К сожалению, Францию почти не смотрю. Видел комплиментарное интервью Нобеля. Кроме сухих цифр у меня нет базы для формирования собственного представления относительно перформанса Головина в текущем сезоне. В любом случае приятно видеть его фамилию в окружении таких игроков как Мбаппе и Дембеле.
👍3
Пока очень похоже на то, что Барколя станет достойным приемником Мбаппе в ПСЖ и сделает его уход максимально безболезненным с точки зрения потери качества на левом фланге.
👍4
Одна из немногих вакансий на рынке РФ в домене SportTech. Насколько я понял, внутри Яндекса (который остался в РФ) в направлении FunTech есть небольшая группа, которая занимается построением системы трекинга данных по видео для РПЛ.

Судя по вакансии им нужен ML инженер с фокусом на Computer Vision.

Если кому актуально, можете попробовать свои силы.



https://yandex.ru/jobs/vacancies/%D1%80%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D1%87%D0%B8%D0%BA-%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B3%D0%BE-%D0%B7%D1%80%D0%B5%D0%BD%D0%B8%D1%8F-%D0%B2-sporttech-17943
Следом еще одна интересная вакансия (Product Manager / Project Manager / Presale Manager - нужен многофункциональный универсальный специалист на данном этапе). Общался с фаундерами. Амбициозный проект. Параллельно прорабатывают проекты как в РФ, так и вне РФ.

Первая продуктовая вакансия в домене SportTech / Футбол на рынке РФ, которую я увидел.

https://ekaterinburg.hh.ru/vacancy/98952770?query=product+%D1%84%D1%83%D1%82%D0%B1%D0%BE%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9+%D1%81%D1%82%D0%B0%D1%80%D1%82%D0%B0%D0%BF&hhtmFrom=vacancy_search_list

Вот их канал https://t.iss.one/junistatsystem