Esclusive per gli abbonati
Newsletters
About
UU è una rivista di sport fondata a luglio del 2013, da ottobre 2022 è indipendente e si sostiene grazie agli abbonamenti dei suoi lettori
Segui UltimoUomo
Cookie policy
Preferenze
→ UU Srls - Via Parigi 11 00185 Roma - P. IVA 14451341003 - ISSN 2974-5217.
Menu
Articolo
A che punto sono le statistiche nel calcio
28 feb 2017
Quanto sono affidabili, come vanno lette, dove si può migliorare. Una panoramica della situazione.
(articolo)
24 min
Dark mode
(ON)

La soggettività delle statistiche

di Alfredo Giacobbe

Le statistiche sono un supporto analitico per chi osserva e giudica un evento sportivo ormai da qualche decennio. Negli ultimi tempi, però, si è rincorsa l’utopia di sintetizzare la realtà attraverso un solo numero, immediatamente consultabile e di per sé trasparente: nel basket, ad esempio, una decina di anni fa, John Hollinger mise in piedi il PER, una super combinazione di tutti gli indici conosciuti in una sola cifra.

Per gli appassionati di statistiche e calcio, gli Expected Goals hanno rappresentato negli ultimi anni l’approdo a una specie di terra promessa. Il fascino dell’idea che una singola statistica restituisse il potenziale offensivo di una squadra, anche al di là dell’imponderabile: al di là di periodi più o meno sfortunati, o delle difficoltà poste dal calendario.

I modelli di xG si sono rivelati uno strumento formidabile specialmente per rivelare i trend nelle fasi iniziali di una stagione. Per fare un esempio di efficienza predittiva, i neonati xG de L’Ultimo Uomo - a cui ho lavorato nel corso della scorsa stagione e che stiamo usando in pianta stabile dall’inizio di quella in corso - hanno lasciato intuire che qualcosa bolliva nella pentola atalantina nonostante le 4 sconfitte nelle prime 5 partite, così come hanno svelato l’overperformance del Milan, passato poi dal secondo posto di inizio dicembre all’attuale settima piazza. In un certo senso, gli xG hanno ripagato le aspettative.

Certo, non sono privi di limiti criticabili e frustranti per chi vuole analizzare un evento complesso come una partita di calcio, con ventidue attori sul palcoscenico e un oggetto del contendere difficile da controllare con i piedi. Il primo e principale problema è che gli xG tengono in conto delle azioni che partecipano alla costruzione del tiro, ma ignorano completamente le posizioni relative ai 22 giocatori in campo al momento della conclusione. È così perché, banalmente, la collocazione spazio-temporale dei giocatori non è disponibile.

In particolare, gli xG ignorano la posizione dei difendenti, quindi non considerano la pressione che questi portano al tiratore. Faccio un esempio concreto che riguarda l’ultimo, spettacolare Fiorentina-Napoli. I gol di Insigne e Bernardeschi si assomigliano per come sono stati costruiti: distanza e angolo di tiro, relativamente alla porta, sono simili ed entrambi nascono da azioni individuali. Senza alcuna sorpresa, i valori xG delle due conclusioni differiscono appena per la terza cifra decimale: 0,024 xG per il napoletano, 0,026 xG per il fiorentino.

Tra le due conclusioni, però, c’è una differenza sostanziale: Insigne è libero di girarsi e di alzare la testa verso la porta, ha il tempo di crearsi lo spazio sul destro prima di calciare; Bernardeschi è inseguito dal centrocampista, che ne influenza la corsa e la battuta. La pressione sul tiratore è ben diversa e la bravura di Bernardeschi, nel realizzare un gol in condizioni ben più avverse, è superiore.

Cosa c’è dopo gli xG

Gli Expected Goals sono il migliore strumento di analisi oggi a disposizione, ma si sta già lavorando per superarne i limiti. Le strade oggi battute sono sostanzialmente due, e lo saranno almeno fino a quando i giocatori non indosseranno un localizzatore GPS (rendendo disponibili le statistiche “fisiche”, tipo posizione, chilometri percorsi, chilometri percorsi ad alta intensità, aprendo anche alla possibilità di incrociare questo tipo di statistiche a quelle “tecniche”) .

Da un lato si cerca di aggiungere ingredienti alla ricetta degli xG, cioè si prova a dare maggiori informazioni all’algoritmo che calcola le probabilità di successo di un tiro: ad esempio si aggiungono informazioni relative alla catena dei passaggi che hanno generato il tiro, e non più solo sull’assist vincente; oppure si tenta di creare un profilo del tiratore, inserendo dati sulla precisione al tiro tenuta nella stagione corrente o in quella passata.

Dall’altro lato si sta provando a creare metriche che ignorano completamente l’output finale: nei cosiddetti “non-shot models” si tenta di dedurre i rapporti di forza tra due squadre da altri fattori che non siano la costruzione o l’esito delle conclusioni a rete. L’applicazione del modello di Grund alla Serie A che trovate qui è appunto un esempio di non-shot model.

Charles Reep, il primo a elaborare un modello statistico da applicare al calcio. Nella sua idea l’aumento della quantità di palle lunghe aumentava proporzionalmente la pericolosità offensiva di una squadra.

Il senso dei modelli

Perché si costruisce un modello? Perché in definitiva il calcio è uno sport estremamente complesso, il cui risultato dipende da un evento sporadico come il gol. La scorsa stagione, nelle 380 partite giocate in Serie A sono stati segnati 979 gol, cioè una media di 2,58 reti a partita e di 1,29 reti per squadra.

Il calcio è diverso per struttura: non è uno sport di situazione, e se escludiamo i calci piazzati, le azioni si susseguono mentre il cronometro scorre continuamente. Bisogna anche considerare che lo sviluppo del gioco è fortemente influenzato dalla relazione che esiste tra un numero di giocatori più alto che in altri sport.

Insomma, si creano modelli della realtà proprio per ridurre la sua complessità. La riduzione a un numero finito di variabili comporta però delle scelte: ogni componente va pesato, incluso o scartato. Bisogna sottolineare che dietro ogni scelta c’è un’idea personale su cosa ha più o meno significato nel Gioco. Il modello degli Expected Goals è quindi soggettivo per costruzione. Quanto è importante che il tiratore abbia calciato col suo piede preferito o con quello sbagliato? Che differenza fa che l’assist sia arrivato da un cross o da un filtrante? Includere un fattore e ignorarne un altro è una scelta che chi mette in piedi un modello fa sulla base delle proprie conoscenze e delle sue percezioni sul Gioco.

Ma non è solo l’elaborazione di un modello a essere soggettiva, a ben vedere tutte le statistiche lo sono, per quanto suoni straniante quest’affermazione parlando di numeri. Alla base di ogni analisi attraverso le statistiche c’è bisogno di un’interpretazione.

Edin Dzeko è il miglior attaccante del campionato secondo gli xG, ininterrottamente dalla prima giornata ad oggi. Avremmo tutti commesso un errore se da questo singolo dato avessimo dedotto di aver sbagliato le nostre valutazioni su Dzeko lo scorso anno (cosa che alcuni quotidiani hanno invece fatto, nei loro “mea culpa” autunnali). Dal rapporto (scadente) tra tiri e gol abbiamo capito che le capacità realizzative di Dzeko non erano affatto cambiate da un anno all’altro, e che la Roma stava banalmente costruendo per lui occasioni migliori, più vicino alla porta, e in maggior numero rispetto allo scorso anno. Ma per arrivare a questa conclusione ragionata, abbiamo dovuto scegliere le statistiche da associare tra loro. È un atto che comporta una responsabilità verso il lettore: avremmo potuto esaltare il centravanti o gettarlo nella polvere, banalmente scegliendo il dato che faceva più comodo allo scopo.

Le statistiche sono tra noi per restarci e dobbiamo imparare a convivere con l’approccio analitico all’analisi sportiva, che sarà sempre più presente nel linguaggio dei media.

Nasceranno nuovi strumenti, i vecchi si affineranno. Ne trarremo tutti vantaggio, perché potremo confrontare tra loro le prestazioni del passato e fare previsioni su quelle del futuro. Ma dobbiamo anche diventare consapevoli, criticamente, che dietro ogni sistema di numeri c’è l’interpretazione di chi li presenta. I numeri non mentono, le persone a volte sì.

Alfredo Giacobbe è nato a Napoli, dove vive e lavora. Ingegnere come Manuel Pellegrini, ha dipinto l'area tecnica attorno al suo divano. Redattore de l'Ultimo Uomo per il quale ha creato l’unico indice Expected Goals italiano.

Le statistiche oltre gli Expected Goals e il loro utilizzo nei media

di James Yorke

Passaggi, dati fisici e analisi della difesa: andare oltre gli xG

Gli expected goals hanno dotato le football analytics di una strana traccia da seguire. I dati necessari a costruire un modello di Expected Goals non erano pubblici e le abilità tecniche per costruire un modello del genere erano altamente specifiche e tutt’altro che banali. Perciò, per un lungo periodo, i membri della comunità hanno costruito nuovi modelli di xG, o comunque hanno cercato di ragionare a proposito di essi.

L’effetto ottenuto è che l’evoluzione delle analytics si è focalizzata intorno ad argomenti correlati agli xG: i modelli sono diventati sempre più complessi, ma il concetto base è rimasto sempre quello del valore atteso e forse gli analisti non hanno osservato altre aree di rilievo.

Più recentemente gli studi sui passaggi hanno acquisito sempre maggiore importanza, con l’obiettivo di identificare i giocatori e le squadre più efficienti e abili a muovere la palla. Rimane comunque difficile separare la descrizione puramente stilistica dalle risultanze effettivamente influenti sulla possibile vittoria di una partita di calcio (un punto fondamentale nello sviluppo a lungo termine di qualsiasi metrica, ovviamente).

C’è molta aspettativa riguardo ai “tracking data” che potrebbero aggiungere nuovi fattori e, di conseguenza, aumentare la precisione dei vari modelli, ma ancora non ci sono dati disponibili pubblicamente ed è comunque possibile che anche un eventuale perfezionamento sia solo marginale - una critica che, ad esempio, potrebbe essere mossa a proposito dell’aggiunta di dati di corsa e sprint.

Le analisi difensive rimangono decisamente le più complicate, soprattutto a livello individuale, la speranza è che un aumento nella qualità dei dati permetta di fare luce anche su questo aspetto.

L’utilizzo delle statistiche nei media

Nel frattempo le statistiche sono sempre più utilizzate nei media , anche grazie all’interesse per giochi costruiti attorno a un aspetto predittivo (come il Fantacalcio o Football Manager), oltre che per siti analitici aperti al pubblico come Squawka e Whoscored. Soprattutto per le nuove generazioni, sembra ormai radicata l’accettazione di una descrizione numerica dei giocatori e squadre.

Si sente parlare sempre più spesso di numeri a proposito di tiri e di occasioni create sia a livello di squadra che di giocatore, un’attenzione che però rende ancor più necessario un secondo livello di analisi, e questo è certamente positivo (gli xG da soli potrebbero essere troppo “esoterici” per un utilizzo puramente mainstream).

Jamie Carragher è uno dei più importanti “pundit” (esperti) di analisi calcistica in Inghilterra, importante per il suo lavoro di divulgazione.

Meno positivo, invece, è l’utilizzo forzato di statistiche che non rappresentano quello per cui vengono utilizzate. Facciamo un esempio: dati difensivi come contrasti e intercetti sono spesso letti come se “più” fosse sempre “meglio”, quando in realtà si tratta di dati poco più che descrittivi, che non riflettono necessariamente la qualità di gioco. Nemmeno i portieri possono essere valutati accuratamente tramite il computo delle parate.

Semplici liste, basate su una o due statistiche, non permettono di classificare i giocatori, a meno che non si tratti di metriche offensive.

Le statistiche sono sempre di più e sempre più accettate, ma serve ancora tempo prima che si diffonda un tipo di analisi più ragionata, in grado di cogliere anche le sfumature. Ci vuole tempo, e un certo livello di competenza, per saper leggere l’autentico significato nelle statistiche calcistiche: cose che spesso mancano nell’utilizzo che ne fanno i media.

Ma questo è un problema esistente anche all’interno dei club professionistici, dove gli analisti delle performance stanno introducendo le statistiche all’interno del loro lavoro spesso senza capire cosa sia davvero importante e cosa no. Finché non sarà chiara l’esigenza di utilizzare i dati con costrutto il loro utilizzo sarà per forza di cose solo marginale (come succede nei club), oppure degradato a livello di curiosità o poco più (come succede nei media).

Anche l’utilizzo dei grafici è aumentato nei media, ma le mappe sulle posizione medie, oppure le heat-map, raramente sono capaci di dirci ciò che è davvero successo sul campo; e la loro popolarità ne ha causato anche un utilizzo a sproposito. Nonostante ciò non bisogna dimenticare che le mappe di tiro (con o senza i valori di xG) o anche i grafici che evidenziano alcuni passaggi specifici o le occasioni create, possono rivelare verità significative su una gara, una squadra o un giocatore.

Il problema è chi dice: “Guarda questo giocatore calcia sempre da 30 metri ma non segna mai”, con la mappa che diventa un modo un metodo molto semplice di presentare e provare un’opinione.

Bisogna avere chiaro un principio: una statistica deve essere presentata solo se capace di aggiungere una chiave di lettura all’interpretazione di un evento. Se è in grado di rivelare verità nascoste, accessibili e rapide da comprendere.

C’è sicuramente del lavoro da fare sotto ogni punto di vista. Solo l’interazione di squadra tra esperti di visualizzazione, narratori e analisti può alzare il livello complessivo e permettere un utilizzo razionale e davvero utile dei dati.

James Yorke è il Managing Editor del sito di analytics StatsBomb e collabora regolarmente con ESPN insider.

Statistiche per i tifosi

di Emiliano Battazzi

In un esperimento del 1961, Bugelsky e Alampay mostrarono ad un gruppo di individui un’immagine ambigua, cioè aperta a diverse interpretazioni: un disegno che poteva rappresentare il volto di un uomo, o un topo. Ne uscì fuori che gli osservatori vedevano cose diverse a seconda del loro set percettivo, cioè in base ad altre immagini che gli erano state sottoposte precedentemente.

Per seguire i giocatori di un solo campionato (la Ligue 1 francese), il Direttore Sportivo del Siviglia Monchi si avvale di una struttura del genere: 16 scout in sede che seguono i vari campionati; poi altri osservatori mandati in Francia per vedere un singolo giocatore almeno 10 volte (e devono sempre tornare con una dettagliata analisi, of course).

Monchi stesso vede almeno tre partite di Ligue 1 per fine settimana, con l’obiettivo di vedere in una stagione almeno tre partite di tutte le 20 squadre del campionato.

A questo si aggiunge anche una parte umana, relazionale: ad esempio, Monchi ha visitato per più di un anno Gameiro in Francia, prima di acquistarlo.

E nonostante la struttura, i report, i video, le statistiche e i contatti umani, anche il Siviglia, come qualunque club professionistico, può sbagliare acquisti: come possiamo noi spettatori quindi valutare un giocatore? Non possiamo vedere centinaia di partite l’anno e non abbiamo a disposizione gli strumenti di un club.

Dobbiamo per forza di cose basarci sulla nostra capacità di osservazione: ma a volte è bene non fidarsi troppo.

Fare confronti diretti tra calciatori cercando di trarne un valore assoluto è sbagliato. Al tempo stesso le diverse forme dei radar indicano le diverse qualità dei registi analizzati: ognuno è speciale a modo suo. Una sfumatura interpretativa che bisogna sempre aver presente.

Finora nel dibattito pubblico sull’utilizzo delle statistiche nel calcio ci si è giustamente concentrati sulla parte manageriale, cioè sulla loro utilità per dirigenti, allenatori, insomma per gli addetti ai lavori.

Eppure è più facile che un set di dati accurati ma comprensibile ci dia un’idea generale su un giocatore e una squadra piuttosto che una netta indicazione di acquisto. Allo stato attuale, cioè, le statistiche potrebbero aiutare molto di più il pubblico.

I vari tentativi dei media sembrano confermare la volontà di migliorare la visione del pubblico attraverso le statistiche: in Coppa Italia ad esempio la Rai utilizza dei dati in sovraimpressione. Il problema è che se decontestualizzati o non interpretati, i dati più che aiutare lo spettatore a casa finiscono per confonderlo.

Pensate alla classica schermata di fine partita, con il numero dei corner, di tiri, di cartellini e di possesso palla (in Champions League ci sono anche i km percorsi): indicazioni davvero marginali sull’andamento di una partita e che rischiano di fuorviarne la percezione finale. Non sarebbe meglio una schermata con gli expected goals? Anche in quel caso, ovviamente, andrebbero interpretati e relativizzati.

La finestra invernale di mercato è appena terminata e nel valutare i giocatori ci si affida a spezzoni di partite, qualche gol, qualche assist: eppure una schermata come questa, con un radar, potrebbe davvero aiutare lo spettatore che giustamente non sa nulla di quel calciatore.

Emerson Palmieri è uno dei migliori laterali della Serie A: quante volte lo avete letto sui giornali o sentito in tv (prima del gol contro il Villarreal)?

Il prossimo passo, probabilmente, sarà una presa di coscienza da parte dello spettatore dei propri limiti e delle proprie responsabilità. Un’interpretazione resta tale, in fondo, anche se illustrata con un grafico o dei numeri. Ma è indubbio che una maggiore disponibilità di “materiale da interpretare” non possa che arricchire la conoscenza di un gioco che è al tempo stesso semplice e complessissimo. Al momento però non sembra che l’industria sia così pronta e desiderosa di fornire i propri dati (e non solo al grande pubblico): due “pigrizie” che si incontrano, e così rischiano di creare un fossato dannoso per entrambe.

Si tratterebbe, in fondo, di fornire degli strumenti: chi non apprezza le statistiche e le ritiene inutili continuerebbe a fruire del calcio nella maniera tradizionale.

Ma almeno chi preferisce un approccio più analitico, volto a una migliore comprensione di ciò che guarda, potrebbe aumentare la propria capacità di giudizio, e non confondere più un topo con un volto umano.

Emiliano Battazzi, economista, prova a coniugare la razionalità della tattica all'imprevedibilità del talento. È il caporedattore della sezione calcio de l'Ultimo Uomo.

I tracking data e l’esempio dell’NBA

di Salvador Carmona

L’idea che le football analytics abbiano interrotto il proprio processo di evoluzione dopo la diffusione dei vari modelli di Expected Goals è, almeno in parte, condivisibile. Gli xG sono stati un enorme passo in avanti rispetto ai modelli di tiro pubblici fino a quel momento, ma è altrettanto vero che non sono perfetti.

Da quando gli xG si sono affermati gli analisti hanno continuato a girarci intorno, senza sviluppare niente di altrettanto sensibile. In questo senso, credo che i tracking data – pubblici o privati – possano dare un ulteriore impulso ai modelli che la nostra piccola comunità sviluppa.

Negli anni in cui lavoravo in NBA, la tecnologia di tracking è passata da essere usata da solo 8 squadre, a tutta la lega diventando infine persino di pubblico dominio. Il solo diffondersi di questo tipo di dati ha enormemente incrementato la conoscenza degli analisti NBA.

Modelli come quello di “quantified shots quality” (qSQ) – simile al concetto di xG, ma che tiene conto della distanza dal difensore più vicino, il game state eccetera – sono stati sviluppati in maniera relativamente veloce e hanno permesso a tutti noi di comprendere meglio il gioco e di analizzare i giocatori, il coaching, la strategia e le necessità delle squadre in maniera più approfondita.

Diverse figure di spicco a livello manageriale, come RC Buford (President of Basketball dei San Antonio Spurs), hanno riconosciuto pubblicamente i benefici che i tracking data offrono alle squadre, non solo dal punto di vista della configurazione del roster, ma anche da quello delle rotazioni. Sono dati che permettendo di misurare anche i carichi di lavoro che certi giocatori sopportano e di cui certe giocate necessitano per essere messe in pratica.

Aggiungere i tracking data aiuterebbe non solo a creare modelli di xG migliori e più accurati, ma anche a quantificare meglio il possesso, la pressione, la qualità dei passaggi e così via. Il passaggio da migliaia a milioni di data point darà ai primi utilizzatori un margine che molte persone che lavorano nel calcio non hanno, permettendogli di beneficiare di un vantaggio competitivo per tutto il tempo che servirà agli altri per mettersi al passo.

Il problema al momento non risiede nella mentalità della comunità, sempre alla ricerca di miglioramenti, ma in quella dei professionisti che lavorano nel calcio, soprattutto qui in Europa meridionale. La nostra community può sviluppare idee e creare nuovi strumenti, ma alla fine sono i club e le federazioni a doverli usare. E per ora, nonostante la varietà di materiale disponibile a livello pubblico, il salto è stato ben più complicato del previsto.

Salvador Carmona è il fondatore dell’impresa di consulenza sportiva Origami Sports. Tra gli altri, ha precedentemente lavorato per l’IMG College, l’NBA e la IE Business School. I suoi articoli sono apparsi su Diario AS, El Confidencial, la Vanguardia e Playboy Magazine.

La situazione in Italia e la raccolta dati tecnico-tattica

di Antonio Gagliardi

Il rapporto in Italia tra club e FIGC

In Italia da pochi mesi è stata ufficializzata dal Settore Tecnico la figura del Match Analyst (una delle poche federazioni al mondo ad averlo fatto), che si occupa dell’analisi oggettiva delle prestazioni in campo e della preparazione tattica dei prossimi avversari. Analisi e preparazione che prevedono lo studio dei video ma anche dei dati. Tuttavia non esiste una figura specifica di data analyst come accade all’estero nei paesi anglosassoni.

In Inghilterra, ad esempio, i club professionistici hanno degli analisti che studiano quotidianamente i dati a disposizione per fornire informazioni allo staff tecnico: spesso questi analisti hanno un’ottima formazione matematica e di analisi ma basse conoscenze calcistiche e tattiche. Le stesse riunioni video tattiche in Inghilterra sono meno approfondite rispetto all’Italia e talvolta sono gli stessi collaboratori dello staff tecnico a preparare i montaggi, demandando all’analista solo la lettura dei dati.

Da noi, invece, la figura è maggiormente ibrida e completa. Un match analyst italiano è un allenatore con buone conoscenze tattiche, lavora molto sui video e sulla preparazione tattica delle partite (contrapposizioni, scalate, pregi e difetti). Allo stesso tempo analizza i dati con meno competenze matematiche ma maggior capacità di rielaborazione tattica.

Credo che aumentando ed integrando maggiori competenze statistiche, questa italiana possa essere la strada giusta. Perché i dati vanno letti, incrociati e rielaborati partendo dalla comprensione tecnico-tattica di quello che avviene in campo.

Ramon Monchi, direttore sportivo del Siviglia, che dispone di uno dei più grandi sistemi di scouting in Europa.

La Figc, insieme ad alcuni club di prima fascia, ha fatto da apripista in Italia nella creazione di un vero e proprio reparto di match analysis: in Federazione ci sono 5 analisti che coordinati da me e Filippo Lorenzon (analista Nazionale under 21) seguono tutte le Nazionali maschili e femminili (dalla A alla u17). Oltre alla preparazione tattica al video, vengono prodotti dati statistici su tutte le partite delle giovanili: dati utili agli allenatori e soprattutto al coordinatore delle Nazionali giovanili Maurizio Viscidi (ex allenatore del settore giovanile del Milan e poi di Pescara, Vicenza) per avere una visione a 360° delle prestazioni delle varie rappresentative.

Tra i club posso sottolineare i progetti di Juventus, Inter e Roma. La Juventus è stata fra le prime società in Italia a credere nella materia e grazie al coordinamento di Riccardo Scirea (figlio dell’indimenticato Gaetano) ha a disposizione 4 analisti che si occupano di analisi video e dati dalla prima squadra fino alle giovanili.

L’Inter concentra tutte le risorse per la prima squadra con un reparto di 3 analisti interni (dunque indipendenti dallo staff tecnico di turno) guidati da Michele Salzarulo, uno dei pochi data analyst italiani.

La Roma con Simone Beccaccioli e altri analisti è forse la squadra che maggiormente sfrutta i dati statistici anche nel settore scouting in fase di calciomercato, merito anche della società americana maggiormente vicina culturalmente allo sfruttamento dei big data.

Ci sono poi singoli allenatori molto attenti ai dati statistici. Uno è sicuramente Maurizio Sarri che spesso in conferenza stampa cita alcuni numeri per commentare le prestazioni con maggior oggettività. Anche Pioli e De Zerbi sono allenatori che utilizzano le statistiche, soprattutto riguardanti la propria squadra. Esistono tuttavia ancora numerose barriere e pregiudizi soprattutto fra i direttori sportivi ed anche in alcuni allenatori, convinti che la lettura dei dati non solo sia inutile ma addirittura possa portarti fuori strada.

Passaggi chiave e Indice di Pericolosità

Personalmente porto avanti la battaglia per una raccolta dati più tecnica, e di conseguenza per una rielaborazione dei dati maggiormente vicina agli aspetti tattici del gioco, da quando collaboravo con Sics e Opta (Due società che, appunto, raccolgono dati ndr). Uno dei concetti su cui ho più lavorato è stato quello di “passaggio chiave”. I passaggi non vanno semplicemente contati ma pesati: i “passaggi chiave” sono quelli che apportano un contributo significativo allo sviluppo dell’azione offensiva, come una verticalizzazione che smarca un compagno dietro una linea avversaria (Bonucci che trova Pjanic fra le linee per esempio), ma anche tutti gli assist (passaggio prima del tiro) e i third pass (l’assist dell’assist): Qualche allenatore all’estero chiama questi passaggi “killer pass” (passaggi che “uccidono” due o più avversari). In Italia è stata Sics ha sposato questo concetto e rileva i passaggi chiave così concepiti (Opta invece con “Key Passes” intende semplicemente gli assist non vincenti, che non portano al goal, cioè).

Il mio percorso verso una rielaborazione più tattica dei dati passa anche attraverso “l’indice di pericolosità”: partendo da un’idea di Maurizio Viscidi abbiamo creato questa metrica per misurare l’efficacia offensiva e difensiva di una squadra aldilà dei goal segnati. Crediamo che un allenatore, ma anche un giornalista o un tifoso con occhio critico, debba valutare la prestazione senza farsi influenzare dai goal fatti o subiti, evento troppo raro e casuale e vera causa che rende il gioco del calcio così diverso statisticamente dagli altri sport dove il punteggio finale è costruito da decine se non centinaia di punti.

L’indice di pericolosità assegna un peso ponderale a diverse azioni d’attacco (dalle occasioni da goal ai corner guadagnati) fornendo poi un valore numerico alla prestazione. La differenza tra gli Expected Goals e l’Indice di Pericolosità è che quest’ultimo ha basi meno puramente matematiche e statistiche, ma maggior capacità di comprensione tecnica di quello che avviene in campo. Gli ottimi indici di Expected Goals si basano quasi esclusivamente sui tiri in porta, l’Indice di Pericolosità prende invece in esame altre situazioni offensive: corner e punizioni guadagnati, cross, occasioni da goal ed azioni promettenti non per forza concluse con il tiro in porta (traversone che attraversa lo specchio della porta senza che nessun attaccante riesca a toccarlo). Abbiamo aumentato la “soggettività” degli eventi raccolti per poter però avere maggior “oggettività” tattica.

Tracking

Credo che la rivoluzione dei Big Data nel calcio sia definitivamente esplosa e sia ormai irreversibile, gli addetti ai lavori che sceglieranno di non cavalcare e percorrere questa strada rimarranno semplicemente indietro. L’occhio, la sensibilità, l’intuizione di un allenatore o di un direttore sportivo saranno sempre importanti e fondamentali nei processi di scelta ma non si potrà non sfruttare il vantaggio di uno studio e di una rielaborazione attenta dei dati statistici.

La grande evoluzione ci sarà, però, quando avremo a disposizione i dati del tracking (dati della prestazione fisica, tipo chilometri percorsi e velocità, ndr) per tutte le partite. Le tracce di tutti i movimenti dei 22 giocatori in campo e della palla garantirà un plusvalore di dati raccolti che se ben incrociati potranno garantire notevoli informazioni, ad oggi sconosciute. Dovremmo seguire l’esempio delle analitycs nel basket NBA che ha compiuto passi da gigante negli ultimi 10 anni, cioè da quando sono stati integrati i dati dei movimenti e delle posizioni dei giocatori con i tradizionali dati tecnici.

Venti anni fa sapevamo che Steve Kerr tirava da 3 con il 45% di precisione. Oggi integrando i dati del tracking sappiamo che Stephen Curry quando tira da tre in contropiede dall’angolo destro con l’avversario a più di 1 metro, tira con 55% di precisione. Oppure, ancora, che in quella specifica azione LeBron James per la posizione da lui tenuta, e soprattutto per la posizione di ogni singolo avversario, avrebbe dovuto scaricare a Kyle Korver dal limite (75% di possibilità di fare canestro) piuttosto che servire Kyrie Irving che da quella determinata mattonella con quel specifico difensore così vicino aveva solo il 15% di possibilità di segnare.

Tutto questo similmente sarà possibile farlo anche nel calcio. Certo bisognerà istruire la macchina ed i software nel riconoscere le situazioni tattiche che ci interessano: quante volte Pjanic ha ricevuto fra le linee? Quante volte Kantè ha effettuato dei raddoppi che hanno impedito le ripartenze avversarie? Quante volte Muller ha attaccato la linea avversaria, abbassandola e consentendo a Thiago Alcantara di ricevere palla al limite dell’area?

Questa è la grande sfida che ci attende.

Antonio Gagliardi è un allenatore professionista, nello staff tecnico della Nazionale Italiana Calcio dal 2010, precedentemente è stato analista e project manager per Opta e Sics.

Attiva modalità lettura
Attiva modalità lettura