Da produttori di contenuti o da semplici fruitori ci stiamo abituando all’uso e alla consultazione delle statistiche applicate al calcio: come metro di paragone tra due squadre o due calciatori, o anche solo per comprendere meglio le prestazioni in campo – renderle più oggettive. Capire qual è il futuro delle statistiche, quali saranno gli strumenti che finiremo per utilizzare da qui a poco, non è semplice, ma se esiste un buon periodo per fare il punto della situazione, è sicuramente questo, e lo è sostanzialmente per due motivi.
Anzitutto perché tutti i maggiori campionati europei sono ben oltre la metà del loro percorso ed è possibile verificare quanto i risultati sul campo si stiano allineando, o meno, alle previsioni fatte dagli strumenti analitici attualmente in uso.
Gli Expected Goals che usiamo qui su l’Ultimo Uomo, ad esempio, per lo scorso campionato e dopo poche giornate, segnalavano che i livelli di Juventus e Napoli erano vicini tra loro ma molto distanti da quelli di Roma, Lazio e Inter, a loro volta molto ravvicinate. Nelle prime battute di questo campionato, le prestazioni della Juventus sembravano tali da poter permettere alla squadra di Allegri di creare un solco tra sé e le altre; e per le statistiche il Milan valeva la quarta piazza anche nei momenti più difficili della stagione, già prima del rimpasto di gennaio che ha portato in rosa Paquetá e Piatek.
In secondo luogo poi, nei primi mesi dell’anno si tengono alcuni eventi nel corso dei quali i ricercatori presentano i risultati dei loro sforzi, ovvero nuovi strumenti statistici applicati al calcio. Da sei anni, Opta organizza gli OptaPro Analytics Forum, che rappresentano un’occasione d’interesse anche per i cosiddetti soggetti istituzionali: all’ultimo Forum londinese (si è tenuto, poche settimane dopo, un evento gemello a Colonia), si erano iscritti i rappresentanti di oltre 70 società di calcio.
Nello stesso periodo si svolge anche la Sloan Sports Analytics Conference, organizzata dalla MIT Sloan, la Business School del prestigioso Massachusetts Institute of Technology di Boston. Secondo la missione della scuola, la SSAC è un luogo di incontro tra i professionisti del mondo dello sport, gli studenti della scuola e i semplici appassionati per discutere dell’importanza crescente delle statistiche nello sport. Al contrario degli OptaPro Forum, la SSAC per costituzione non si occupa solo di calcio, anche se negli ultimi anni questo sta conquistando sempre più spazio.
Il futuro delle analytics nel calcio passa inevitabilmente per questi due eventi.
Guardare cosa succede lontano dalla palla
Dai lavori presentati ai due Forum si evince che i modelli basati su eventi stanno per essere messi in crisi da altri più avanzati. Nel corso degli ultimi anni, soprattutto nel calcio, si è lavorato all’individuazione degli eventi maggiormente correlati con la prestazione, e quindi con il risultato sportivo di lungo periodo. Gli Expected Goals ad esempio effettuano una valutazione della probabilità di fare gol di ogni singolo tiro, e le squadre che tirano costantemente con qualità hanno più chance di vincere le partite. Per contro, se l’evento “tiro” non viene registrato, se un’azione potenzialmente pericolosa si conclude senza che la squadra riesca a scagliare il pallone verso la porta, il modello non effettua alcuna valutazione.
Tutti i modelli attualmente in uso non possono prescindere dalla presenza di un evento: il modello che valuta la progressione della palla tiene in conto la componente verticale di ogni passaggio in avanti; l’efficacia difensiva si misura attraverso i duelli aerei, i tackle vinti, gli intercetti sulle linee di passaggio. E così via. L’attenzione di chi registra un evento si concentra quindi su quello che succede intorno al pallone.
L’evento presuppone un’azione. L’azione presuppone a sua volta una scelta. Uno dei modelli più interessanti tra quelli presentati ai Forum di quest’anno ha l’ambizione di misurare la capacità di scelta di ogni singolo calciatore sul campo, momento per momento.
Il modello presentato tra gli altri da Javier Fernandez, Data Scientist del Barcellona, utilizza i dati di posizione di tutti i 22 uomini in campo, registrati istante per istante. In ogni momento, un calciatore può decidere se avanzare portando palla, se effettuare un passaggio verso un compagno o se tentare un tiro. Considerando la probabilità che ciascuna di queste tre azioni possa compiersi istante per istante in ogni zona di campo, e misurando la loro efficacia presunta, il modello di Fernandez calcola un Expected Possession Value.
L’indice EPV stima la probabilità che ogni possesso possa scaturire in un gol per chi ha la palla (con il valore EPV che oscilla tra 0 e 1), oppure in un gol per chi non ha la palla in caso di turnover (cioè di una palla persa, con il valore EPV che oscilla tra -1 e 0).
Questa immagine è tratta da Juventus-Atletico. Emre Can è in possesso del pallone, ha di fronte a sé diverse opzioni: la più redditizia è il servizio tra le linee per Bernardeschi (freccia verde), la quale porta con sé un elevato rischio di intercetto (frecce rosse). La soluzione ottimale è costituita da un passaggio su Cancelo (linea azzurra), temuta per altro anche da Simeone che da bordo campo la indica a Lemar. Can ritiene di non poter accettare il rischio della giocata in avanti e in questa occasione gioca palla all’indietro (freccia nera).
Per riconoscere ogni tipo di possibile azione, e per calcolare le probabilità di riuscita connaturate con ciascuna di esse, il computer va allenato secondo differenti metodologie. Ad esempio, le possibili scelte che un calciatore può prendere di volta in volta sono modellizzate con la tecnica delle reti neurali. Le probabilità di segnare in caso di tiro, poi, sono valutate attraverso un modello di Expected Goals.
L’approccio proposto è estremamente complesso dal punto di vista matematico, ma la ricchezza delle informazioni spazio-temporali che è possibile ricavare sul gioco è impagabile. Ogni singolo giocatore, quando è in possesso del pallone, può essere valutato nella sua capacità di generare valore (quantificato nella differenza positiva nel EPV dopo un suo passaggio), a fronte del rischio che è in grado di sostenere (la differenza negativa nel EPV in caso di turnover dopo un suo errore). Allo stesso modo, anche un giocatore che non è in possesso del pallone, ma che detta un passaggio smarcandosi con un movimento corretto nello spazio eseguito con i tempi giusti, può essere valutato nella sua capacità di generare valore senza palla.
Un altro modello, presentato dal Data Analyst dell’Huddersfield Town Mladen Sormaz, si concentra ancora di più su quello che accade lontano dalla palla. In questo caso, indipendentemente dal fatto che il pallone venga servito o meno a un determinato giocatore, viene valutata la sua capacità di disordinare le linee avversarie con una corsa senza palla.
Bernardeschi si muove dal centro verso l’esterno, attirando fuori posizione il centrale di sinistra dell’Udinese. Ma è la successiva corsa nello spazio di Bentancur a creare i danni maggiori, costringendo i centrocampisti avversari a correre all’indietro e verso la palla. L’azione di Bentancur crea lo spazio per Matuidi, che arriverà in area indisturbato e siglerà il gol.
La forma difensiva di riferimento di una squadra può essere nota a priori, o valutata ex-post mediante le posizioni medie tenute in fase di non possesso. Come cambia spazialmente questa forma rispetto al riferimento, in reazione ad una corsa senza palla di un offendente, dà la misura del danno creato dalla corsa stessa.
Dal confronto tra la forma ideale e quella reale viene calcolato il punteggio che misura l’efficacia della corsa senza palla, variabile da 0 (forma ideale mantenuta inalterata) a 1 (forma avversaria completamente disorganizzata). Accoppiando poi questa misura del danno indotto nella squadra che si difende con la quantità di spazio in controllo della squadra in possesso palla, agli autori è stato possibile verificare una correlazione tra la qualità della corsa e la creazione del pericolo. Cioè più è alto lo scompiglio che una corsa senza palla crea nelle linee avversarie, maggiore sarà la probabilità che l’azione offensiva terminerà con un tiro. Gli autori per ora hanno solo conteggiato i tiri effettuati in corrispondenza di valori elevati del loro indice, ma già pensano di integrare un modello di Expected Goals.
Douglas Costa salta l’uomo sulla fascia e si dirige verso il centro del campo. Potrebbe tirare, invece sceglie di servire Cristiano Ronaldo al centro dell’area. Il portoghese, a sua volta, fa la sua scelta prima ancora di ricevere palla: si predispone con il corpo per giocare di sponda per l’accorrente Dybala. L’argentino colpisce al volo e batte il portiere alla sua sinistra. Come vanno distribuiti i meriti dell’azione vincente tra i 3 protagonisti?
Nonostante le premesse, in questa tornata di pubblicazioni ancora un modello basato su eventi si è rivelato comunque degno di attenzione. È il modello Expected Threat (minaccia attesa) sintetizzato da Karun Singh.
Karun si è posto il problema della corretta assegnazione del merito di un’azione offensiva. Gli Expected Goals aiutano a valutare le abilità di finalizzazione di un attaccante, ma non riescono ad attribuire un valore di merito a tutti i contributori di quel determinato possesso risultato in un tiro o in un gol.
Karun ha diviso il campo in 192 zone discrete, e in ciascuna di queste ha valutato quattro componenti: la probabilità che venga effettuato un passaggio; la probabilità che venga effettuato un tiro; la pericolosità creata eventualmente da un passaggio; infine, quella creata da un eventuale tiro. Quindi, anche Karun include un modello di Expected Goals, e con la stessa tecnica valuta le altre componenti, modellando il comportamento di un calciatore professionista, zona per zona, dati gli eventi del passato.
I risultati ottenuti da Expected Threat per quanto riguarda la scorsa Premier League sono più che interessanti: Kevin De Bruyne è il giocatore che crea più pericoli in assoluto. Soprattutto: riesce a farlo da entrambi i lati del campo pur partendo da mezzala destra.
Sembrerebbe anche che il Chelsea abbia rinunciato forse con troppa fretta ai servizi di Cesc Fabregas, assistman per antonomasia; e che il contributo offensivo di un terzino di spinta come l’ex romanista José Holebas sia forse sottovalutato.
In un certo senso, l’approccio con le statistiche sta abbassando le barriere d’ingresso nel mondo del calcio. Persone con esperienze diverse, appassionati del Beautiful Game ma senza un passato da calciatori professionisti, stanno approcciando il gioco e stanno portando il loro contributo creativo.
Grazie al loro lavoro, impercettibilmente ma già ai massimi livelli, il gioco sta cambiando: Pep Guardiola anche quest’anno ha sottolineato quanto sia strategicamente importante per la sua squadra andare al tiro da posizioni vantaggiose, facendo il verso agli Expected Goals (in questo pezzo Michael Cox sottolinea quanto il City sia abile a battere le attese statistiche).
Man mano che l’efficacia degli strumenti numerici verrà riconosciuta e il loro utilizzo si diffonderà, assisteremo a un’influenza maggiore delle statistiche sulla tattica e sul gioco. La tecnologia, più in generale, aiuterà i calciatori nel loro sviluppo tecnico, tattico, fisico, mentale e cognitivo. Dallo scorso marzo, le squadre professionistiche americane sono state autorizzate all’uso di un ricevitore GPS indossabile. Mentre i primi prototipi di realtà virtuale si stanno facendo strada per aiutare i calciatori ad immergersi nelle situazioni reali di gioco, tenendo conto delle distanze da compagni e avversari.
La tecnologia cambierà il calcio, è inevitabile. Potete disperarvi o eccitarvi all’idea, a voi la scelta.