– Algorytmy SI pozwalają na stworzenie takich modeli, które prosto z pliku video zbierają dane. To przyspieszenie pracy, ale i zakresu danych. Dziś w większości dane, które otrzymujemy, to “on ball tracking”. Wiemy co się dzieje z zawodnikiem, który ma piłkę. Natomiast jest o wiele mniej informacji o pozostałych. Sztuczna inteligencja może tu dokonać rewolucji, ogarnąć, nazwijmy to, “wzrokiem” całe boisko. To da większe pole manewru do analiz kontekstowych, gdzie będziemy mogli każdą akcję umieścić w jakimś kontekście, konkretnym ustawieniu, konkretnej sytuacji boiskowej – jak sztuczna inteligencja może zmienić futbol? Czy obserwujemy technologiczną rewolucję w piłce?
Czy analityka i zaawansowane statystyki w futbolu pozostają niedoceniane? Co mówią liczby o karierze Krzysztofa Piątka? Jak do analizy i zaawansowanych statystyk podchodzą działacze w polskiej piłce?
O tym rozmawiamy z Wojciechem Supko, analitykiem współpracującym między innymi z firmą SportsSolver.
***
Miałeś długo u siebie na Twitterze taką maksymę: “Adaptuj się albo giń”. Dotyczyła piłki czy szerszych zagadnień?
Odnosiła się do piłki nożnej, nie mam wielkich przemyśleń socjologicznych. W dobie rewolucji technologicznej, która dokonuje się w sporcie, trzeba co najmniej zaadaptować się w nowej rzeczywistości. Wykorzystać to, co daje technologia. Oczywiście ideałem byłoby nie tylko bierne wykorzystywanie, tylko bycie liderem. Wyprzedzenia trendu.
Druga z maksym, którą u ciebie znalazłem, a która wpadła mi w oko: “Bez danych jesteś tylko kolejnym gościem ze swoją opinią”.
Moim zdaniem powinniśmy odejść w piłkarsko-biznesowych stosunkach od subiektywnych opinii, opartych wyłącznie na naszej obserwacji świata. Dane obiektywizują temat. Mogą stanowić centralny punkt odniesienia. Można przejść dzięki nim z dyskusji pod tytułem “MOIM ZDANIEM”, do “Z UWAGI NA”, w drugim wariancie wskazując miary, statystyki, konkretne kwestie. Subiektywności i tak nie unikniemy, ale już będzie wykonany krok do przodu. Ta subiektywność będzie oscylować w pewnych ramach.
Czyli jest problem z zawodnością opinii jako takiej?
Opinie nie powinny być w futbolu przyczynkiem do podejmowania dalekosiężnych decyzji. Sama opinia, nie poparta twardymi fundamentami, w jakiejkolwiek dziedzinie może być kłopotliwa. Dla mnie takim fundamentem są dane liczbowe. Dla kogoś innego może to być doświadczenie. Inteligencja zespołowa. Wybierać można z pewnej puli. Ale dane pozbawione są spaczenia subiektywizmem. Odsuwamy emocje. Odsuwamy to, co serducho podpowiada. Patrzymy chłodno.
Miałeś taką historię, gdzie serce podpowiadało ci pewną opinię, narrację, a dane się z tym ku twej niechęci rozprawiały?
Krzysiek Piątek jest taką historią. Nie jestem fanem ani Serie A, ani Genui czy Milanu. Ale oglądałem chętnie jego mecze i cieszyłem się bardzo z bramek. To było piękne, że co dotknął piłkę, wpadało do siatki. Nawet gdy strzelał z nieprawdopodobnych pozycji.
Natomiast pod spodem dane nie bardzo potwierdzały, żeby ten trend mógł się utrzymać. Widziałem teksty analityków, którzy próbowali argumentować: to taki typ snajpera. Ma aż taką smykałkę, trafia zewsząd. Jednak nie chodzi zawsze o to, czy ktoś akurat strzeli, tylko czy – mimo bramki – powinien z takiej pozycji oddawać strzały. Bo czy z tej trudne strefy, z danego ustawienia, w długiej perspektywie będą padać bramki? Praktyka pokazuje, że nie.
W skrócie, dane pokazywały, że Krzysiek bardzo mocno wyprzedzał swoje miary odnośnie skuteczności. 30 stycznia 2019 pisaliśmy, że strzela ze średnią 0.87 bramki na dziewięćdziesiąt minut, podczas gdy jego xG (expected goals, miara jakości sytuacji i ich wykorzystywania – przyp. LM.) wynosił 0.59 na dziewięćdziesiąt minut. Jeśli spojrzymy na jego średnią kroczącą – a więc nie patrząc na sezonu, tylko jego wycinki – to już pod koniec 2018, przed transferem do Milanu, jego krzywe skuteczności z xG zaczynały się zbiegać.
Teraz serce mnie boli, gdy wrócił do średniej, ale dane sugerowały takie rozwiązanie, na zasadzie równowagi. Na pocieszenie powiem, że obecna skuteczność Krzyśka według danych jest zaniżona, powinno być lepiej. Pytanie: kto może sobie pozwolić na ocenianie piłkarza w czapce kibica.
Emocje potrafią zaciemniać obraz.
Problem z podejmowaniem decyzji w klubach, nie tylko ekstraklasowych, polega na trudnym do zmierzenia wpływie poszczególnych elementów na finalną decyzję. Jaki jest ciąg logiczny, który doprowadził do tej decyzji? Dane? Ocena skauta? Czy okazja, która pojawiła się na stole osoby decyzyjnej? Prawda jest taka, że wiele kluczowych decyzji jest podejmowanych na bazie subiektywnej opinii.
Skupmy się na polskich klubach: niewielki procent klubów, z którymi współpracowaliśmy jako Sports Solver, bierze pod uwagę liczbowe dane jako ważny element decyzyjności. Natomiast z drugiej strony, jeśli spojrzymy na trend, jest coraz większe zainteresowanie tematem zaawansowanej analizy i szczegółowych statystyk. Trend jest wyraźnie wzrostowy od około trzech lat. Trzy lata temu było zdecydowanie mniej transferów, przy których decyzja została podparta jakimikolwiek danymi. Teraz wiem o przynajmniej kilku, między innymi takich, przy których dołożyliśmy swoją cegiełkę.
Ostatnio, nawet w zimowym okienku, sporo mówiło się o wadach skautingu w Polsce, dość mocno opierającego się na platformach skautingowych takich jak WyScout, InStat. Jak ty, jako analityk, podchodzisz do tych narzędzi?
Jestem zdania, że sam InStat czy WyScout, nawet biorąc pod uwagę możliwość obserwacji meczów za pośrednictwem bazy video, to za mało. Oczywiście, że potrzebny jest do wzięcia pod uwagę szereg innych czynników, niedostępnych tą drogą. Chcę podkreślić jedną rzecz: nie chodzi o to, by podejmować decyzje tylko na bazie liczb czy statystyk. Ale o to, by się tym posiłkować. Jako wzmocnienie analizy, względnie w kontrze do opinii uzyskanej na żywo? Pożyteczny, interesujący dodatek.
Problem z takimi platformami jest taki, że są mocno nastawione na analizę indywidualną. Występuje problem z kontekstem szerszym, czyli ligi albo grupy zawodników. Drugi problem polega na tym, że każdy użytkownik tej platformy ma dostęp do takich samych danych.
Twoje słowa: “Pewien dyrektor sportowy stwierdził, że klubom ESA nie opłaca się wykorzystywać danych do skautingu, bo jeżeli piłkarz się wyróżnia w statystykach, to jest dla klubu ESA za późno – kolejka do piłkarza jest już zbyt długa”.
Futbolem, co do zasady, rządzą pieniądze. Występuje twarda korelacja – im większy budżet, tym lepsze wyniki. To oczywistość, ale potwierdzalna też w liczbach. Drogi do sukcesu więc są dwie. Pierwsza: naturalnie zwiększyć budżet. Super łatwy sposób? Nie bardzo. Drugi sposób: znalezienie sprytnej metody, by te finanse nie były aż tak istotnym czynnikiem, żeby nasza pozycja w kraju czy Europie ni wynikała tylko i wyłącznie z perspektywy pieniędzy. Tu jest pole na choćby efektywniejszą estymację jakości zawodnika.
Zawsze mam jednak wrażenie, że choć w piłce rozwój zaawansowanych statystyk jest bezsprzeczny, tak problemem jest sam futbol, dużo trudniejszy do opisania niż koszykówka czy baseball.
Oczywiście, są dyscypliny, które łatwiej poddają się statystykom. Książkowym przykładem są dyscypliny, gdzie masz pewną, nazwijmy to, turowość. Futbol jest bardzo dynamicznym sportem. Na sukces, rozumiany jako wygrana, składa się bardzo duża liczba czynników. Komplikacja jest większa.
Ten moneyball jest w ogóle w futbolu możliwy do odtworzenia?
Moneyball jest inspirujący, ale problem tamtej metody polega na tym, że chciała znaleźć świętego graala. Zestawić wszystko w jedną liczbę, która powie jaka jest rzeczywista wartość zawodnika. To bardzo romantyczne podejście. W rzeczywistości sytuacja tak nie wygląda.
Nie opiszesz zawodnika jak w FM-ie.
Na pewno nie jedną liczbą. Analitycy są w stanie stworzyć profil, który ułatwi wyciąganie wniosków na temat zawodnika, można opisać go i 180 miarami. Z tym, że wtedy to będzie nieczytelne. Najlepiej jest sprowadzić do poniżej dziesięciu wartości, na przykład pięciu, wtedy to będzie interpretowalne.
A i to nie jest za dużym uproszczeniem?
Zasada Pareto mówi, że za 80% korzyści odpowiada 20% pracy. Nie mówię, żebyśmy się specjalnie przywiązywali do liczby pięć. Chodzi o odsianie ziarna od plew.
Przykładowo, mamy ofensywnego pomocnika i multum miar odnośnie podań. Jak podaje do przodu, jak do tyłu, celność, częstotliwość dośrodkowań, zagrań w pole karne, w strefę niebezpieczną. Liczba statystyk się rozrasta. Korzystając z ciężkiej pracy mądrych ludzi, którzy są obecni w szeroko rozumianym środowisku analitycznym, możemy te liczbę zmniejszyć do 2-3. Tak powstało Expected Threat – dzieło pracy Karuna Singha. Expected Threat polega na zmierzeniu w jaki sposób zagrania, zarówno podania, jak i bieg z piłką, wpływa na zwiększenie niebezpieczeństwa pod bramką rywala. Bierze on pod uwagę również podania w strefy, z których szansa na strzelenie bramki jest mała, ale odegranie spowoduje niesamowite zagrożenie. W ten sposób, z kilkunastu statystyk, wyprowadzamy jedną, użyteczną.
Mam jednak wrażenie, że wciąż jesteśmy na początku drogi. Jestem przekonany, że zaawansowane statystyki i analityka to przyszłość, ale co z piłkarzem, który źle wypada, bo gra w takim a nie innym systemie? Co z dyspozycjami trenera? Co z partnerami, gdzie w futbolu jesteś od nich bardzo uzależniony?
Jasne, nietrudno sobie wyobrazić przykładowo, jak różnić się będzie dyspozycja stopera w drużynie, która ciągle się broni, a w takiej, która dużo atakuje i prowadzi grę. Ale można włączyć w analizę dane, które świadczą o stylu.
Da się to zrobić?
Oczywiście.
Ale robi to człowiek?
Tak. Co do zasady, najpierw dokonuje się przybliżonej analizy zespołu. Na ile taki zespół pozwala drużynie przeciwnej. Jak skutecznie gra. Czy ma wymienność podań na poziomie średniej ligowej.
Jest też ten przypadek, gdy zawodnik zostaje kupiony na bazie swojej skuteczności w innej, lepszej od Ekstraklasy lidze, ale rzecz w tym, że tamtejsze ligi są bardziej spolaryzowane: mocna czołówka, a dół tabeli na poziomie pierwszej ligi. On mógł nastrzelać słabeuszom.
Tu trzeba wprowadzić czynnik Exchange Rate ligi, mówiący o tym jak statystyki danego zawodnika mogłyby się przekładać na inne rozgrywki. Jest kilka modelów do tego, od nawet najprostszego, a dającego całkiem niezłe wyniki: to patrzenie na przeciętne kursy bukmacherskie, w oparciu o to budowa rankingu ELO. To proste do zrobienia i tanim kosztem.
Ciekawe. Bukmacherzy muszą znać bardzo dobrze takie ligi i układ sił, to ich chleb. Z tego faktycznie można stworzyć coś wymiernego, model proporcji drużyn do siebie, nawet jeśli ogólny.
Analiza zespołu to jedno, ale też chodzi o wydłużenie horyzontu analizy. Jeśli zawodnik sprawdza się w długim okresie, to jest duże prawdopodobieństwo, że oddziałuje dobrze niezależnie od taktyki. Inna rzecz, o której ostatnio czytałem: patrzenie nie tylko na skuteczność zawodnika, czyli ile on de facto strzela albo jak często strzela z korzystnych pozycji, tylko miara stabilności. Czy mecz w mecz notuje podobne rezultaty. To też zmniejsza ryzyko, że jest uzależniony od taktyki, rywala.
Czyli dane pozostają danymi, a potem faktycznym frontem walki jest sztuka interpretacji.
Dane w próżni mogą dać fałszywy obraz. Natomiast wymieszanie ich z obserwacją zmniejsza ryzyko pomyłki.
Gdzie jest największe pole do rozwoju w analityce?
Tak naprawdę, ciut zbaczając, to… w sile przebicia. To jest problemem dla analityka. Na końcu ma bardzo niską siłę przebicia, nawet jakby wykonał znakomitą pracę, to przecież nie on podejmuje decyzje. Nie ma w Polsce kultury brania pod uwagę danych przy podejmowaniu decyzji, natomiast znowu odnotuję, że są ludzie w strukturach klubów, który bardzo się tym interesują. Chcą iść w tą stronę. Natomiast wciąż często spotykają się na duży opór.
O ciekawym przykładzie słuchałem w branżowym podcaście “Measureables”. Wypowiadał się tam pan Treacy z Dundalk, który próbował w klubie wdrażać wykorzystywanie danych w większym zakresie, miał też doświadczenia z pracy nad “data science” w biznesie. Mówił, że co z tego, iż on wymyśli dobre, prawidłowo wyestymowane modele, skoro na końcu jest problem z przekazaniem tego sztabowi. Komunikacja nie dociera do adresata. Powody mogą być różne: po pierwsze, ludzie, którzy pracują na danych, mogą nie umieć przekazać posiadanej wiedzy. Siedzą w tym tak głęboko, że nie potrafią jej przełożyć, począwszy od porozumiewania się hermetycznym slangiem. Po drugie: sztab nie miał wystarczającej wiedzy na temat tych modeli. Nie potrafi połączyć danych z tym, co widzi na boisku. Wydaje mi się, że jednym i drugim by pomogło wyjście na “cudze boisko”.
Analitycy przebrać się w dres i wyjść na trening, żeby też zrozumieć praktykę?
Absolutnie. Kluczowa sprawa. Przykład z biznesu. Nie miałem okazji nigdy pracować w McDonalds, ale tam jest bodajże taka reguła, że każdy z zarządzających na pewnym etapie kariery musi pewien czas przepracować również na kuchni. Bez tego nie jest w stanie zwizualizować sobie na czym polega praca na linii frontu. Ta wymienność ról w sztabie analitycznym i szkoleniowym mogłaby przynieść wiele korzyści.
Dodam, że jakiś czas temu budującym przykładem była konferencja zorganizowana z inicjatywy analityków Legii Warszawa, a wsparta przez Ekstraklasę. Była spora obecność ze strony drugich trenerów ekstraklasowych klubów. Tak samo analityk mógłby sporo zyskać zapisując się na kurs trenerski.
Widzisz tu szansę dla polskiej piłki, czy jednak to pogłębi przepaść? Jak pieniądze na analityków mają się znaleźć, to prędzej tam.
Niestety, już odstajemy przez finanse, szersze wykorzystanie analityki może zwiększyć różnię w prędkościach. Choć paradoksalnie wielkie pieniądze nie są do tego potrzebne, ale czytałem, że w polskich klubach cały czas jest większa wola zatrudnienia jednego dodatkowego zawodnika, nawet jeśli nie są do niego przekonania, niż ze czterech junior analityków, którzy prawdopodobnie i tak razem zarabiali mniej.
Co ciebie najbardziej ekscytuje w obecnych trendach analityki w piłce?
Najciekawszym obszarem jest wykorzystanie sztucznej inteligencji do generowania danych na podstawie kamer video. To bardzo mocno ruszyło w ostatnich miesiącach. Jest gros danych w tym momencie cały czas kodowanych przez ręczną pracę oglądających mecz. Natomiast algorytmy SI pozwalają na stworzenie takich modeli, które prosto z pliku video zbierają dane. To przyspieszenie pracy, ale i zakresu danych. Dziś w większości dane, które otrzymujemy, to “on ball tracking”. Wiemy co się dzieje z zawodnikiem, który ma piłkę. Natomiast jest o wiele mniej informacji o pozostałych. Sztuczna inteligencja może tu dokonać rewolucji, ogarnąć, nazwijmy to, “wzrokiem” całe boisko. To da większe pole manewru do analiz kontekstowych, gdzie będziemy mogli każdą akcję umieścić w jakimś kontekście, konkretnym ustawieniu, konkretnej sytuacji boiskowej.
Wojtek, działasz w ramach marki SportsSolver. Na czym polega wasze działanie?
Założyliśmy ją jakiś czas temu, żeby popularyzować wykorzystanie zaawansowanych statystyki w klubach, głównie polskich. Firma zrodziła się z pobudek romantycznych: może czas spróbować to pokazać, wtedy nie było nikogo, kto by się tym zajmował. A przynajmniej nie widzieliśmy, żeby ktoś się zajmował wsparciem analityczno-taktycznym i skautingowym.
I jaki był odzew?
Najpierw dużo entuzjazmu, głosów: fajnie, że coś się ruszyło. Dużo spotkań, także z klientami potencjalnymi. Później ta krzywa zainteresowania się wypłaszczyła. Natomiast robiliśmy raporty holistyczne dla Ekstraklasy, przygotowywaliśmy warsztaty, zainteresowanie powoli się odradza. Przyszedł koronawirus, zobaczymy jak to będzie. Podczas kwarantanny zaproponowaliśmy klubom z 1.ligi i Ekstraklasy, że za darmo wesprzemy na czas pandemii naszymi analizami trzy pierwsze, które się zgłoszą. Odzew był spory, co pokazuje potencjał.
Robicie na co dzień analizy Ekstraklasy?
Jako, że część współzałożycieli to osoby związane z EkstraStats, to jak najbardziej, natomiast klientów bardziej interesują inne ligi. Wydaje mi się, że uważają iż mają Ekstraklasę “pokrytą”, a przez nasz szukają informacji odnośnie innych rynków.
Zawsze w rozmowach z analitykami pytam o strzały z dystansu i dośrodkowania – żelazny element każdego meczu, nadużywany, a wypadający fatalnie w analizach.
Zapamiętasz jedną bombę z daleka, zrobisz och i ach, ale dziewięćdziesiąt dziewięć prób ląduje w rzędzie Z. Grają tu emocje. Taki gol zapada w pamięć, a my przekładamy to na efektywność, gdzie w analityce chodzi o prawdopodobieństwo gola – a ono w takich sytuacjach jest nikłe. Tak samo z dośrodkowaniami, za którymi dość trudno znaleźć analityczne argumenty. Przy strzale z daleka, owszem – wciąż można sobie wyobrazić sytuację, gdy to będzie optymalne rozwiązanie. Przy dośrodkowaniu dużo trudniej.
Był ostatnio taki filmik, na którym Cafu – ten ze złotej Brazylii i Romy – czeka na podanie na prawej stronie, ale go nie dostaje, bo ktoś oddaje piękny strzał prosto do siatki. Można pomyśleć: no tak, podałby, nie byłoby takiego gola. Rzeczywiście. Ale paradoksalnie podanie zwiększyłoby prawdopodobieństwo zdobycia gola w tej akcji. To, że akurat tutaj z małej szansy prawdopodobieństwa udało się trafić, to inna historia.
Czy w piłce da się złamać kod jak po części, według mnie, łamany jest w koszykówce, gdzie z równania efektywności wynika, że trzeba stawiać na rzuty za trzy, przez co nigdy nie miały takiej wagi jak dzisiaj?
Serce romantyka podpowiada, że zawsze znajdziemy w piłce nieoczekiwane wyniki, nieoczekiwanie wydarzenia. Piłka nie będzie ujarzmiona, pozbawiona swoich odstępstw od normy, które często przekładają się na jej piękno. Analityka nigdy nie pokryje stu procent futbolu. Nie zaprogramujemy meczu. Piłkarze nie będą robotami. Czy w futbolu znajdziemy coś podobnego, do wzrostu znaczenia trzech punktów w koszykówce? Tak. Ale czynnik losowy zawsze będzie ważną częścią piłki nożnej, na nasze i jej szczęście.
Leszek Milewski