Ekstraklasa – analiza

Zaczynamy nową serię – analizę i przede wszystkim przewidywania dotyczące rozgrywek w ramach piłkarskiej Ekstraklasy.

Cykl będzie składał się z trzech części:

  • w pierwszej przeprowadzimy analizę danych z historycznych rozgrywek na podstawie wyników meczów z sezonów 2008/09 do 2016/17
  • w drugiej części spróbujemy znaleźć model, który pozwoli na symulację rozgrywek oraz sprawdzimy jego skuteczność
  • zaś w ostatniej części – przygotowanym modelem wytypujemy wyniki na nadchodzący sezon 2017/18

Zapowiada się ciekawie, zatem do dzieła! Tym razem będzie bez kodów R w treści posta, wszystkie zaś dostępne są na moim GitHubie.

Historyczne dane pobrałem ze strony Historia Polskiej Piłki Nożnej, stosowny skrypt na GitHubie nazywa się load_table.r.

Dane zawierają informację o dacie meczu (i sezonie w którym mecz został rozegrany), drużynach i wyniku. Niestety nie znalazłem łatwych do zaadoptowania wyników z np. minutami meczu w których padają bramki – przez to analiza będzie nieco uboga. Ale może ciekawa?

Na początek zobaczmy czy własne boisko sprzyja wygranej? Uwaga – są to dane uśrednione ze wszystkich sezonów, jeśli Legia grała z Wisłą Kraków u siebie (grała 13 razy) to liczymy średnią liczbę bramek zdobytą przez oba zespoły i to traktujemy jako wynik takiego super-meczu.

Zwycięzca Częstość
Gospodarz 58.2
Gość 27.9
Remis 13.9

W ponad połowie przypadków wygrywa gospodarz. Jedna czwarta meczy została przegrana na własnym boisku.

Czy to zależy od grających drużyn? Być może są zespoły, które wygrywają zawsze, wszystko jedno czy grają u siebie czy na wyjeździe? Zobaczmy to na wykresie (znowu – dane uśrednione):

Już na pierwszy rzut oka widać zdecydowaną przewagę czerwonego – czyli zwycięstwa Gospodarzy.

Przyjżyjmy się wybranym drużynom:

  • Legia Warszawa jako gospodarz (wiersz podpisany Legią) poza dwoma przypadkami remisowymi wygrywa. Jeden z przypadków remisowych to mecze z GKS Bełchatów. Takich spotkań przy Łazienkowskiej było 6, średnio każda z drużyn zdobyła jedną bramkę (kolejne wyniki to: 3-0, 2-2, 0-2, 1-1, 0-0, 0-1), mimo iż Legia dwa razy przegrała u siebie (raz wygrała i trzy razy zremisowała)
  • Legia jako gość (kolumna podpisana Legia) jest już bardziej zróżnicowana
  • Arka u siebie prawie zawsze przegrywa, podobnie Cracovia
  • Kolejorz poza grą z Legią, Jagiellonią i Podbeskidziem wygrywał za każdym razem (uśrednionym)

Teraz zobaczmy, czy mecze z sezonu na sezon są coraz bardziej atrakcyjne? O ile za miarę atrakcyjności uznamy liczbę padających bramek.

Bramek jak widać pada coraz więcej. I – jako nie-fan piłki nożnej – jestem zaskoczony, że pada ich ponad 2, a ostatnio nawet prawie trzy na mecz. Gdzieś wewnętrznie byłem przekonany że najpopularniejsze wyniki to 1-0 albo remisy 0-0 czy też 1-0.

Sprawdźmy teraz jak bardzo się myliłem (wewnętrznie), czyli jakie są najczęstsze wyniki meczy, w podziale na kolejne sezony:

Polecam szczegółową analizę. Na pewno widać, że z każdym sezonem rośnie rozpiętość wyników (w 2008/9 w żadnym spotkaniu nie padły więcej niż cztery bramki dla jednej drużyny, w 2016/17 były już przypadki po 5 i 6 bramek).

Najpopularniejsze wyniki w sezonie są już jednak bliższe mojemu wewnętrznemu przeczuciu:

sezon Gospodarze Goście Częstość
2008-09 1 0 13.8%
2009-10 1 0 15.0%
2010-11 1 0 16.2%
2011-12 1 0 13.8%
2012-13 1 1 15.0%
2013-14 1 1 13.2%
2014-15 1 1 12.8%
2015-16 1 1 16.2%
2016-17 1 1 12.2%

Średnio co 6-7 mecz kończy się wynikiem 1-0 lub 1-1. Jeśli mecz nie zakończył się remisem to wygrywali gospodarze.

W bazie mamy 2384 spotkań. Zobaczmy teraz które drużyny wygrywały najczęściej, a które najczęściej przegrywały…

Czołówka to oczywiście czołówka Ekstraklasy – Legia, Lech i Wisła Kraków. Dla porównania Wisła Płock wygrała tylko 12 spotkań.

Najwięcej meczy przegrał Ruch Chorzów, Cracovia i Lechia.

Ciekawa w obu zestawieniach jest Jagiellonia – z jednej strony wygrała 117 meczy (4 miejsce), a z drugiej – przegrała 103 (też 4 pozycja). Tyle tylko, że są to sztuki i nie każda drużyna rozegrała tyle samo meczy we wszystkich sezonach (niektóre wypadały z Ekstraklasy, inne dołączały).

Popatrzmy na te same dane w ujęciu procentowym:

Tutaj już wyraźnie widać czołówkę. Legia wygrała ponad połowę (dokładnie 57.7%) swoich meczy, a wspomniana Jagiellonia wygrała 39.3% i przegrała 34.6% – to tłumaczy wysokie miejsca na liście ilości przegranych i wygranych meczy. Dodam jeszcze, że najczęściej remisuje Pogoń Szczecin (34.3%).

Spójrzmy na ostatni sezon (2016/17) na – moim zdaniem – ciekawym wykresie obrazującym historię spotkań:

Widać tutaj, że Legia przegrała tylko kilka razy, a finisz sezonu to “nieustające pasmo zwycięstw” (prawie). Podobnie Kolejorz, zaś moja ulubiona Wisła Kraków (cóż, mieszkałem przy stadionie kilka lat) miała stosunkowo dobry środek sezonu, ale początek to jakaś masakra, podobnie zresztą jak koniec.

Przygotujmy teraz obraz drużyny sezon po sezonie – czy w miarę upływy lat drużyny były coraz lepsze (wygrywały coraz więcej) czy wręcz przeciwnie:

Widać tutaj wyraźnie które drużyny pojawiały się w lidze na chwilę, a które są w niej cały czas. Tutaj bardzo ważna uwaga – je są uwzględnione sytuacje, w których drużyna zmienia nazwę lub łączy się z inną.

Przyjrzyjmy się w bliżej trzem typowym sytuacjom:

  • Lechia Gdańsk staje się coraz lepszą drużyną – wygrywa coraz więcej meczy, na stałym poziomie utrzymując liczbę remisów.
  • Legia Warszawa utrzymuje mniej więcej stały poziom, w każdym sezonie wygrywając co najmniej połowę meczy (w sezonie 2013-14 wygrała 70% meczy, a sezon wcześniej – 66%)
  • Wisła Kraków to przeciwieństwo Legii (nomen omen) – lata świetnych czasów trenera Smudy minęły i zaczął się zjazd. O ile jeszcze w latach 2013-2016 ratowały ich remisy, tak ostatni sezon to już prawie 46% przegranych meczy (dla porównania – w 2008/9 było to tylko 13%).

To wszystko na dzisiaj. Jeśli znajdzie się jakiś znawca piłki nożnej i zechce skomentować wyniki – zapraszam serdecznie!

A dla zainteresowanych kodami źródłowymi odsyłam na GitHuba. Materiał powyższy to wynik działania skryptu analiza.r.

5 myśli na temat „Ekstraklasa – analiza

  1. I jeszcze jedno:
    .
    „Wisła Kraków (cóż, mieszkałem przy stadionie kilak lat) miała stosunkowo dobry środek sezonu, ale początek to jakaś masakra, podobnie zresztą jak koniec.”
    .
    Końcówka to chyba zasługa systemu z podziałem na grupę mistrzowską i spadkową. Wisła grała przeciw, w większości, mocniejszym składom, nie groził jej już spadek, ani awans do pucharów (a przynajmniej 4 drużyny walczyły o mistrzostwo)

  2. Też myślałem żeby takie coś napisać. W ciągu sezonu najlepsi potrafią wyciągnąć ok. 50% więc kombinuję jak tu podnieść ilość trafionych meczów do poziomu 55-60 na sezon. W poprzednim sezonie udało mi się wytypować 46%, a najlepszy wynik jaki uzyskałem to 7 trafień na kolejkę i to dwukrotnie.

Dodaj komentarz