Negli ultimi anni, l’utilizzo della analytics applicate al calcio ha subito un’accelerata importante. Non solo nell’adozione da parte dei club professionistici e dei media, ma anche nella varietà degli strumenti a disposizione. Il numero di nuove aziende innovative nel settore è in costante espansione, anche grazie alla crescita del mercato dello SportsTech in Europa, settore in cui nel 2019 sono stati investiti oltre 500 milioni di euro, di cui il 45% in startup dedicate al monitoraggio delle attività e delle prestazioni sportive.
Sempre più club si affidano, con diversi gradi di integrazione, agli strumenti della data science con la volontà di prendere decisioni sempre più informate a bordo campo e sul calciomercato, anche grazie alla spinta di squadre come Leicester e Liverpool, che rappresentano casi di successo conclamati per quanto riguarda l’impiego di tecnologie innovative.
Gli Expected Goals e i modelli associati sono diventati ormai parte integrante dell’analisi anche dei media più generalisti, ma rimangono ancora molte opportunità di ricerca nel campo degli “event data”, ovvero quei dati che tengono in considerazione solo quello che accade in relazioni ai tocchi di palla.
Adesso che siamo in grado di misurare la “qualità” dei tiri, il focus si sta gradualmente spostando sulla misurazione del valore di passaggi, tiri, contrasti, intercetti e tutti gli altri eventi che riguardano la palla. L’attenzione della ricerca a medio e lungo termine si sta concentrando su analisi di costo/beneficio, con l’obiettivo di comprendere meglio il valore di determinate giocate e dunque di ottimizzare il gioco di squadra sia in fase offensiva che difensiva, oltre che le valutazioni di quanto avviene sul campo.
È però opinione comune che la prossima frontiera tecnologica sarà segnata dall’impiego dei “tracking data”, ovvero quei dati che vengono monitorati più volte al secondo, di solito con l’ausilio delle telecamere installate allo stadio, e che catturano in maniera continua la posizione della palla e dei 22 calciatori in campo. Una tecnologia già ampiamente sfruttata in NBA, che rende questo tipo di dati disponibili addirittura sul proprio sito ufficiale.
Questo tipo di dataset non sono ancora disponibili pubblicamente per i principali campionati europei, ma sono già a disposizione di molti club europei e italiani. Proprio per incentivare l’adozione di nuovi processi di analisi, la Lega Serie A ha appoggiato l’adozione di un innovativo sistema denominato Virtual Coach e sviluppato dalla startup italiana Math&Sport, con l’obiettivo di fornire a tutte e 20 le squadre di Serie A uno strumento che le mettesse in condizione di analizzare in tempo reale i dati di tracking relativi alla propria squadra e agli avversari.
Per approfondire le caratteristiche e le potenzialità dello strumento, abbiamo intervistato Gilberto Pastorella, Product e Account Manager di Math&Sport e Jacopo Aloe, che si occupa invece del Customer Support.
Come nasce il progetto “Virtual Coach”? Da dove siete partiti per farvi le ossa nel mondo dello sport?
Gilberto Pastorella: Math&Sport nasce nel 2017 come spin-off di uno spin-off universitario. La nostra società madre, Moxoff, è stata fondata nel 2010 con l’obiettivo di portare la competenza del Politecnico di Milano nei modelli matematici e negli algoritmi di intelligenza artificiale al servizio delle aziende. Siamo stati quindi approcciati da Mauro Berruto, coach della nazionale di pallavolo, per sviluppare le analisi all’interno di un sistema che registrava tutti i tocchi effettuati all’interno di una partita di pallavolo. Addirittura sviluppammo dei sistemi previsionali, che provavano ad anticipare le mosse dell’avversario durante le azioni di gioco. Abbiamo portato i frutti di questa esperienza in Math&Sport al servizio di altre discipline.
Quanti siete in Math&Sport? Avete specialisti dedicati per sport?
GP: Siamo attualmente in dieci, per essere assunto in Math&Sport bisogna essere specialista di almeno uno sport. Circa il 40% dei nostri ragazzi sono esperti di pallavolo, alcuni di loro giocano in Serie B o C. Gli altri seguono più da vicino il calcio, alcuni sono allenatori con certificazioni UEFA.
Pensate di focalizzarvi su calcio e pallavolo? Escludete di lavorare con altri sport?
GP: Per niente. Abbiamo un accordo con il CONI per dare supporto ad ogni Federazione che lo richiedesse la nostra assistenza. Abbiamo lavorato con la Federazione Italiana Tiro con l’arco, con la Federgolf e con la Federtennis.
In questi casi siete partiti da una loro richiesta specifica o lavorate voi sui dati disponibili per poi proporre loro soluzioni?
GP: L’approccio è abbastanza misto. All’inizio viene fatto un assessment dei dati a disposizione, per capire insieme come usarli per gli scopi richiesti o se è necessario sviluppare delle tecnologie che ne generino di nuove. Il nostro grande focus è comunque l’utilizzo dei dati in tempo reale.
Che è il cuore di “Virtual Coach” (VC da qui in avanti, nda). VC nasce da questa esigenza di lavorare sul real time? Oppure c’era stato prima da parte vostra un approccio più classico, di tipo event data?
GP: VC nasce dal nostro approccio al mondo del calcio. Abbiamo subito chiesto quali erano i dati più ricchi, e nel calcio di oggi sono sicuramente quelli di tracking. Ogni giocatore tocca la palla, quindi genera eventi, per un massimo di 2 minuti. Grazie ai dati di posizione, noi sappiamo cosa fa ogni giocatore nei restanti 88.
VC nasce comunque da una vostra ricerca o era una ricerca specifica di un committente come la Lega Calcio?
GP: Lo sviluppo è partito da noi. L’idea era quella di portare la matematica e gli algoritmi avanzati in partita. Perché è in real time che si vincono le partite.
E VC nasce contestualmente alla fondazione di Math&Sport, nel 2017? Quando avete avuto un MVP in produzione?
GP: No, abbiamo iniziato a lavorare al VC nel 2018 grazie a un finanziamento di Vodafone. Hanno visto delle opportunità per loro interessanti nell’analisi in tempo reale. Abbiamo fatto dei test sul campo con Roma e Juventus alla fine della stagione 2018/19 con un primissimo MVP. Il lancio ufficiale è avvenuto allo Sports Technology Symposium di Barcellona a novembre 2019. Le squadre di Serie A hanno iniziato a utilizzarlo all’inizio del girone di ritorno, lo scorso febbraio.
Spiegaci, che cos’è VC?
GP: VC è uno strumento di supporto alle decisioni degli staff tecnici. Si basa interamente sull’analisi in tempo reale dei dati di posizione. Al sistema arriva, circa 20 volte al secondo, l’informazione della posizione di tutti i giocatori e della palla, che viene elaborata al fine di fornire analisi e indicazioni agli staff tecnici in panchina o in tribuna tramite un’applicazione su un tablet. Le analisi sono state sviluppate facendo un mix tra modelli matematici deterministici e modelli di intelligenza artificiale, allo scopo di studiare il comportamento dei giocatori e della loro interazione. Abbiamo indicazioni sulla copertura degli spazi o sulla pressione generata su ogni singolo giocatore che non avremmo con un’analisi per eventi. È come se distogliessimo la nostra attenzione da quello che succede intorno alla palla, per aver uno sguardo su tutto il resto del campo. Questo aiuta gli staff tecnici a prendere decisioni informate, con il supporto dei dati.
Perché non è opportuno avere un modello puramente machine learning? Perché la macchina dev’essere istruita a priori, come accade in un modello deterministico?
GP: Il gol nel calcio, a differenza dei punteggi in altri sport, è un evento raro, per cui l’addestramento dei modelli è diverso. Inoltre è importante creare metriche che rispettino la visione e l’esperienza degli analisti. Questo aiuta perché il modello venga accettato più facilmente dagli addetti ai lavori.
Aspetta, intendi dire che ci sono ragioni commerciali dietro ad una scelta tecnologica?
GP: No, dico che l’idea di calcio che può avere un allenatore o un analista può essere formalizzata con alcune regole. Nel calcio ci sono gli schemi o determinate dinamiche nelle fasi della partita, che sono dettati da regole. Se l’allenatore, in tempo reale, vuole monitorare certe informazioni, bisogna applicare un modello deterministico perché lui ha fornito le regole del monitoraggio. Ti faccio notare che VC non esprime giudizi sul fatto che una squadra stia facendo bene o male, va solo a misurare determinati parametri. Faccio un esempio: noi misuriamo il ritmo partita. Se il ritmo si alza o si abbassa, può essere una cosa positiva o negativa, a seconda delle scelte e delle esigenze dell’allenatore in quel determinato momento. Noi diamo un dato oggettivo, sarà l’allenatore o lo staff a decidere se intervenire in base all’informazione ricevuta.
Escludi comunque un domani di ridurre al minimo la parte deterministica nel vostro mix? Penso a quello che è successo negli scacchi, dove le nuove intelligenze artificiali hanno cambiato il modo di giocare degli umani che si allenavano con loro.
GP: È difficile prevederlo oggi. Posso immaginare che pian piano aumenterà l’utilizzo dei modelli di machine learning a discapito dei modelli deterministici. Questo potrà influire anche sui metodi di allenamento? Sinceramente me lo aspetto.
All’interno di VC generate un centinaio di metriche. Com’è stato il processo di ideazione? Vi siete seduti a tavolino con analisti e allenatori di Serie A o è stato un processo interamente interno?
GP: Siamo partiti con un confronto diretto e giornaliero con gli analisti di varie squadre, a vari livelli, ma abbiamo anche persone al nostro interno con competenze calcistiche, come ti dicevo prima. Siamo stati in grado di sviluppare strumenti utili ai tecnici oggi, ma non dimentichiamo che stiamo facendo innovazione. Cioè il nostro lavoro è anche creare indici che oggi non ci vengono richiesti, ma che, studiando le dinamiche calcistiche dai dati, noi capiamo essere importanti.
Com’è fatta visivamente l’applicazione? Quali sono le possibilità di un allenatore o del suo staff in partita?
GP: Abbiamo un livello base, con una visualizzazione in 2D con quello che avviene in tempo reale sul campo. La latenza è così bassa da non percepire differenza tra il movimento dei calciatori live e quello che viene visualizzato sul tablet. Ci sono degli effetti grafici che possono essere sovraimpressi in tempo reale, tipo la forma delle squadre, la distanza tra i reparti, le zone di copertura e altri.
C’è poi un livello intermedio, che permette di generare e mostrare degli indici di performance. Vengono mostrati come un semplice numero, oppure come delle percentuali di incremento o decremento rispetto a un valore, oppure come un trend degli ultimi minuti.
C’è un ultimo livello, per noi il più importante, che è quello della generazione degli alert. Ogni squadra riceve delle notifiche che il sistema genera automaticamente per aiutare gli staff a capire quali sono gli indicatori che stanno cambiando in maniera significativa, o che sono correlati tra di loro, o che l’intelligenza del sistema ritiene particolarmente importanti in questa fase di gioco. Ogni alert è personalizzabile per ogni squadra. Per esempio, a un allenatore può interessare sapere qual è la pressione che un certo modulo adottato sugli avversari genera sui propri difensori centrali. Noi possiamo sviluppare per lui un algoritmo ad hoc.
Per quello che ci stai dicendo, VC è uno strumento per supportare le decisioni degli allenatori, ciascuno dei quali prova a portare sul campo il proprio modello di gioco. In nessun caso diresti che VC influenza la scelta del modello di gioco o addirittura si sostituisca all’allenatore, giusto?
GP: Assolutamente no. Noi non diciamo all’allenatore qual è il modulo migliore per vincere la partita.
Invece abbiamo letto in giro alcune note stampa che presentavano l’applicazione come un vero e proprio “Coach virtuale”, cioè una sorta di intelligenza artificiale calcistica in grado di prendere decisioni da sola.
GP: Se c’è stata un’informazione distorta, è dovuta alla non conoscenza dello strumento e di tutto quello che c’è dietro e che stiamo raccontando ora. È come dire che l’intelligenza artificiale è alla guida di aziende come FIAT. È ovviamente un’informazione errata, aziende di quel calibro utilizzano ogni giorno sistemi di intelligenza artificiale come supporto alle decisioni dei propri manager, ciò non toglie nulla all’importanza dei manager. Lo stesso vale nel calcio.
Dopo le note stampa, c’è stato l’episodio della finale di Coppa Italia. Alcune di queste metriche innovative, di cui ci hai parlato, sono andate in onda durante la diretta televisiva della finale, giusto?
GP: Sì, abbiamo portato in TV la pressione ricevuta, che mostra un po’ il lato invisibile del gioco, ovvero che tipo di pressione sta ricevendo ogni singolo giocatore dagli avversari, anche di quelli lontani dalla palla. È un indicatore, direi, al confine tra la tecnica, la tattica e la parte mentale del gioco. Capire come è influenzato il gioco di calciatore quando ha costantemente l’uomo addosso, per noi è molto interessante.
Le metriche complesse che avevate generato non sono state presentate adeguatamente e hanno finito per spiazzare lo spettatore. Ti chiedo: chi deve fare il massimo sforzo di fronte a una innovazione del genere? Voi o il media?
GP: C’è bisogno di uno sforzo di formazione e di informazione da parte di tutti. Sforzo che deve partire da noi per primi, il più possibile. Ogni processo innovativo parte da un cambio di mentalità e uno stravolgimento dello status quo. Fino a ieri, gli staff delle squadre, ma anche i tifosi che guardano le partite alla TV, non hanno mai visto dati di questo tipo. Da domani, immagino che faranno parte del discutere comune fra gli uomini dello staff tecnico e di un modo nuovo di guardare la partita.
Pensate quindi a un processo di formazione che vi coinvolga in prima persona?
Jacopo Aloe: Sì, è già in corso con gli staff di varie squadre, abbiamo alcune demo disponibili. La ricezione del prodotto è generalmente buona. In Serie A, ci sono squadre che sono più avanti rispetto alle altre, semplicemente perché avevano già iniziato ad adottare sistemi di analisi basati sui dati. Anche una questione generazionale, i preparatori e gli allenatori più giovani sono più aperti verso l’utilizzo di strumenti del genere. Lo stesso si può dire per i media.
A tal proposito, com’è la penetrazione dell’utilizzo dei dati nelle squadre di Serie A? La percezione dall’esterno è che siamo più indietro rispetto ad altri campionati europei.
GP: Sono dell’opinione che si sta generando molto interesse. Riceviamo anche richieste dall’estero, un tool di analisi real time è il prossimo passo per tutte le squadre che puntano in alto. Il grosso cambiamento da fare è ancora una volta culturale: da un approccio video-analista a uno data-analista. In Inghilterra, Spagna e Germania questo salto è già stato fatto, negli staff sono stati incorporati analisti che si occupano in maniera esclusiva di dati. In Italia queste figure non sono ancora presenti in tutte le squadre.
Queste figure sono collocate per di più nei top-team italiani? Io se fossi un dirigente di un piccolo club, cercherei opportunità del genere per ottenere un vantaggio competitivo che le risorse economiche limitate non riescono a darmi sul mercato.
GP: I top-team sono i più attrezzati. Ci vuole comunque una struttura per supportare l’analisi con i dati al meglio, e questa struttura ha dei costi. L’obiettivo della Lega Calcio, che promuove questo progetto con noi, è di fare innovazione anche per i club con budget minori. L’idea è proprio quella di far crescere tutto il movimento. Aggiungo però che, anche in piccole realtà, ci sono staff di allenatori che si sono strutturati autonomamente per lavorare con i dati, e non solo con i video. Il progetto VC abbatte i costi a carico dei club, ma i club hanno comunque bisogno di acquisire persone con determinate competenze per ottenere un vantaggio dai dati che forniamo.
Però penso che la differenza col resto del panorama europeo sia qui: i club inglesi, tedeschi e spagnoli hanno portato da tempo queste figure nel proprio organigramma. Da noi c’è l’interesse degli staff, che sono però legati a doppio filo con l’allenatore, e quindi se acquisiscono una competenza, ad un certo punto la portano via dal club.
GP: Però si inizia anche qui da noi a strutturarsi diversamente. Ci sono persone di squadre di ogni livello che stanno provando VC, e sono persone inquadrate nell’organigramma del club, e non negli staff. Ovviamente gli staff sono più interessati, ragionano con noi delle personalizzazioni e degli indicatori che possono essere più utili per il modo di giocare che ha la propria squadra. Dall’altro lato i club stanno capendo che incorporare una conoscenza del genere può essere un asset di valore.
Se il movimento si sta muovendo in una certa direzione, perché sembra che alcuni allenatori mettano ancora i dati fuori dalla discussione calcistica di proposito?
GP: Probabilmente è un problema dei dati di cui si parla. Ti faccio un esempio: se un giornalista dice all’allenatore che il suo modo di difendere non è efficace perché il numero di scivolate è diminuito, sto guardando a un dato che non dice niente. Non si può giudicare una performance di un reparto o di una squadra così, anch’io se fossi un allenatore non risponderei a domande del genere.
JA: Soprattutto non si può rispondere solo guardando ai dati. Gli allenatori immaginano che guardando i dati si possano trarre delle conclusioni parziali o sbagliate. Ci vuole l’occhio umano in panchina, sempre, anche quando è supportato dai dati. Non si potrà mai sostituire l’esperienza trentennale di un allenatore.
GP: Un tipo di domanda che io immagino accettabile per gli allenatori è: ho notato che il difensore centrale ha subito una pressione superiore alla sua media stagionale, perché è successo? A domande del genere seguirà una risposta per forza, perché prevede una discussione tecnico/tattica.
Quindi come immagini il calcio e la sua fruizione da qui a cinque anni?
GP: Degli staff supportati dai numeri e il mondo dei media e dei tifosi in cui le discussioni sono guidate dagli indicatori. Un mondo dove tutti capiscono meglio cosa stanno guardando.