Esclusive per gli abbonati
Newsletters
About
UU è una rivista di sport fondata a luglio del 2013, da ottobre 2022 è indipendente e si sostiene grazie agli abbonamenti dei suoi lettori
Segui UltimoUomo
Cookie policy
Preferenze
→ UU Srls - Via Parigi 11 00185 Roma - P. IVA 14451341003 - ISSN 2974-5217.
Menu
Articolo
La rivincita dei nerd
27 feb 2015
Come statistica e tecnologia stanno rivoluzionando l'analisi della pallacanestro.
Dark mode
(ON)

«I Fenici, quando hanno inventato i numeri, hanno sottovalutato l'ipotesi che poi potessero nascere gli americani». (Federico Buffa)

Alle 8:30 americane del 27 Febbraio 2015 verrà dichiarata ufficialmente aperta la nona edizione del MIT Sloan Sports Analytics Conference (SSAC).

L’estate scorsa, su Rivista Ufficiale NBA #91, Tommaso Panni e io ne abbiamo parlato brevemente, provando a spiegare di cosa si trattasse e analizzando una delle applicazioni analitiche più interessanti della rassegna del 2014. In prossimità dell’evento più atteso dell’anno dai malati di “analytics”, abbiamo cercato di allargare la discussione per dare un’idea di cosa sia la SSAC, che impatto ha sullo sport americano e perché interessa così tanto. Anche agli immancabili detrattori.

Genealogia di una rivoluzione (ovvero: la nascita della SSAC)

Affermare che lo sport a stelle e strisce sia sempre all’avanguardia rispetto al resto del mondo rappresenta ormai un dato di fatto quasi stereotipato, ma la nuova frontiera delle statistiche applicate allo sport—e, nel nostro esempio specifico, alla pallacanestro—è un settore che sta oggettivamente cambiando il modo di interagire con i “big numbers” che ogni partita e giocatore producono. Grazie ad un continuo miglioramento delle tecnologie di rilevamento e analisi dell’immagine a disposizione, e grazie ad un manipolo di “avanguardisti” sempre alla ricerca di modalità d’osservazione migliori e sempre più specifiche, le statistiche sono diventate parte integrante delle analisi di allenatori e front office degli sport pro USA. Tant’è che ormai uno specialista con conoscenze tecniche profonde di “advanced statistics” è ritenuto fondamentale all’interno dello staff della maggior parte delle franchigie MLB, NBA, NFL e NHL.

Nel frattempo, fuori dagli ambienti competitivi, e in ecosistemi molto meno affollati e chiassosi di un’arena NBA, decine di studiosi e ricercatori universitari—spesso finanziati direttamente dalle franchigie—stanno continuando a sviluppare nuovi modelli matematici applicabili allo sport.

Il punto più alto di questa “rivoluzione analitica” è stato probabilmente l’articolo del 6 Febbraio 2014 di Kirk Goldsberry dal titolo “DataBall”, ovvero l’argomento più eccitante della SSAC 2014 e il legame definitivo tra statistiche e palla a spicchi che a breve approfondiremo.

Uno scenario innovativo che il colosso ESPN (che è media partner della SSAC) e la sua propaggine più pop culture, irriverente e talentuosa, Grantland (“casa” del "DataBall"), hanno trasformato in un libro destinato a diventare la Bibbia dei nerd e dei general manager, Talk Nerdy to Me: Grantland's Guide to the Advanced-Analytics Revolution, una sorta di manifesto futurista che fonde modelli e rilevamenti statistici d’ultima generazione applicati allo sport con la solita, dissacrante ironia americana—esplicitata già dalla prima parte del titolo.

Nel 2007 alcuni di questi studiosi, influenzati tra gli altri dai prorompenti successi della celebre sabermetrics del baseball resa pop da Brad Pitt col film “Moneyball”, tratto da omonimo libro di Michael Lewis, grazie all’iniziativa dell’allora esordiente general manager degli Houston Rockets Daryl Morey e a Jessica Gelman (Kraft Sports Group), diedero vita nell’allegra cittadina di Cambridge (Boston Area) alla MIT Sloan Sports Analytics Conference, un raduno organico e pianificato in cicli di conferenze tra studiosi, giornalisti ed appassionati chiamati a dibattere sull’impatto crescente dell’approccio analitico sullo sport professionistico.

L’aumento esponenziale, anno dopo anno, di relatori ed ospiti dai più eterogenei background ha fatto schizzare alle stelle l’interesse di dirigenti, media e GM, facendo evolvere un meeting al principio di 175 persone (oggi sono più di 2.000, con oltre 300 squadre pro rappresentate) in un evento internazionale seguito anche fuori dagli Stati Uniti, punto di riferimento secondo Forbes per l’industria sportiva del terzo millennio.

Gli organizzatori, originariamente provenienti dalla scuola di management del famoso Massachusetts Institute of Technology (il MIT, appunto), si sono definiti da subito dei nerd con in mano un potenziale atomico che ha già iniziato a rivoluzionare l’approccio dello sport ai numeri, mettendo a disposizione nuovi ed esaltanti livelli di lettura dei dati.

Il panel dell’anno scorso con ospiti Bryan Colangelo (ex presidente Raptors), Stan Van Gundy (ora allenatore dei Pistons), Steve Kerr (ora allenatore dei Warriors), Brad Stevens (allenatore dei Celtics) e Mike Zarren (assistente GM dei Celtics), moderati da Zach Lowe di Grantland.

Dan, il nostro “insider” nel "DataBall"

Proprio uno di questi nerd, Dan Cervone, dottorando in statistica ad Harvard—quartier generale degli illuminati della SSAC—e membro del gruppo che ha prodotto l’articolo basato sullo studio presentato alla MIT Sloan del 2014 a seguito dell’intuizione geniale di Goldsberry, ha dialogato a lungo con noi sulle caratteristiche dei suoi studi, sui loro effetti e le possibili evoluzioni, partendo però da un presupposto fondamentale: d’ora in avanti si parlerà, oltre che di pallacanestro, anche e soprattutto di spazio ed efficienza.

La rivoluzione di cui abbiamo accennato nell’introduzione infatti passa inevitabilmente da alcune premesse d’obbligo che Dan ci ha aiutato a sintetizzare. La caratteristica più importante da sottolineare per questi studi è che si tratta di ricerche cominciate solo da un paio di anni, da quando cioè è sbocciato l’amore tra l’alta tecnologia usata dalla statistica spazio-temporale e la pallacanestro NBA. Per questo motivo i risultati e le ricerche di cui andremo a discutere non devono essere considerati come la conclusione di un percorso, ma come l’alba sperimentale di una nuova era cestistica, destinata a migliorare nel prossimo futuro, implementando nel modello base già collaudato tutti quei fattori non considerati da queste prime applicazioni del “DataBall”.

Nel concreto—e per dare un’idea di quanto ancora sia enorme il margine di sviluppo—gli studi di Dan & Co. si sono focalizzati prevalentemente “solo” sull’efficienza offensiva del giocatore che ha la palla in mano in un qualsiasi istante della partita. L’efficienza, per definizione, varia come un flusso in positivo o in negativo a causa di molteplici fattori lungo l’arco del match, un’idea innovativa teorizzata proprio da Dan durante il suo dottorato ad Harvard.

Va ricordato infatti che stiamo discorrendo con un ragazzo che prima del “DataBall” vantava pubblicazioni in campi completamente diversi dallo sport professionistico, come i rischi di decesso e il cambiamento di questi rischi in un dato arco temporale. Modelli statistici complessi che, dopo l’incontro con Goldsberry, Dan ha “semplicemente” provato ad applicare con i dovuti adattamenti alla pallacanestro, sostituendo la parola “decessi” con “punti attesi per ogni possesso” e “flusso della partita” allo “scorrere della vita”.

Un po’ macabro forse, ma i numeri e la statistica consentono in modo indolore anche queste conversioni che, per quanto riguarda la pallacanestro, hanno dato una decisa sterzata rispetto a tutte le analisi del passato sia recente che remoto.

L’EPV—L’Expected Possession Value e il fulcro del "DataBall"

Finora sono sempre stati gli “eventi terminali” di un’azione gli unici riferimenti a livello statistico per analizzare e confrontare giocatori e squadre, ovvero tutto ciò che avviene su un campo di basket che porta il gioco al termine di un’azione o un cambiamento del punteggio. L’assist è contato come il passaggio che fa tirare un compagno (termina l’azione del palleggio e del passaggio, inizia quella del tiro); il tiro finisce a referto come la conclusione di un’azione (e relative percentuali); il rimbalzo come la conquista di un nuovo possesso e via dicendo, in maniera molto simile anche per le statistiche di squadra (numero di possessi giocati, rapporto assist/palle perse, punti segnati su ogni possesso, da pick and roll ecc.).

Quel che i numeri applicati alla pallacanestro finora non ci hanno mai detto è che cosa avvenga prima di un “evento terminale”, durante l’azione. In altre parole, nessuno è mai riuscito a quantificare matematicamente la qualità o la mediocrità di tutto ciò che sta nella fase di “decision making”, del “prendere una decisione”.

Il valore aggiunto della statistica spazio-temporale applicata alla pallacanestro è proprio questo: esprimere con certezza scientifica e dei valori finali “facilmente” interpretabili se il giocatore con la palla in mano ha preso la decisione migliore per la sua squadra, andando poi ad analizzare in quale momento dell’azione avrebbe raggiunto l’apice della qualità della scelta.

Il fine, chiaramente, è quello di migliorare il suo “decision making”, non un mero esercizio statistico. L’idea è di avere un impatto reale sulle scelte dei giocatori in campo.

Come spiega Kirk Goldsberry nel suo articolo per la SSAC 2014: «[...] Ogni istante di gioco in una partita di pallacanestro ha un valore. Questo valore è basato sulla probabilità che un canestro venga realizzato, ed è uguale al totale dei punti attesi che risulteranno da quel preciso possesso. Mentre il valore medio di un possesso NBA è molto prossimo a 1 punto, quell’esatto valore di punti attesi fluttua di istante in istante, e queste fluttuazioni dipendono da ciò che sta avvenendo in ogni istante sul campo di gioco».

Essenzialmente, quel che fino a poco fa era una “sensazione” visiva, una valutazione personale sulla qualità dell’azione (la scelta di penetrare piuttosto che tirare o passare ad un dato compagno; un blocco portato a 8 metri dal canestro piuttosto che a 7; un passaggio a Ginobili piuttosto che a Duncan ecc.) o al massimo una “intuizione” mutuata dalle statistiche “terminali”, ora sta diventando matematica, statistica tangibile, misurabile, confrontabile.

Tutto ciò è stato reso possibile dall’accesso a degli strumenti ad altissima tecnologia che nel caso specifico della NBA sono riconducibili all’accordo siglato con la società STATS LLC e al suo “kit di rilevamento e raccolta dati” (SportVu—Optical Tracking Data) che la Lega di Adam Silver ha obbligato dal 2013-14 a far installare in tutte e 30 le arene NBA.

Dan Cervone può aiutarci a definire molto meglio di noi che dati sono in loro possesso: «Allora, avete in mente che un film è fatto di fotogrammi? Cioè, ogni secondo è diviso in così tante parti da sembrare un continuum all’occhio umano? Beh, diciamo che, analogamente, questa tecnologia permette di scansionare ogni partita NBA in tantissimi frammenti, precisamente 25 al secondo. Mi spiego meglio: sei telecamere 3D puntate sul parquet dove si sta giocando la partita “scannerizzano” il campo e un software trasforma queste istantanee in dati quantitativi, rilevando posizioni di giocatori e palla. Ciò che otteniamo sono delle variabili binarie 1/0 che indicano dove sono i giocatori, dov’è la palla e che evento è accaduto (passaggio, tiro, palleggio) ad ogni preciso momento».

Ogni fotogramma mostra il valore del “decision making” di chi è in possesso della palla in quel preciso istante della partita o, per meglio dire, il valore indicante i “punti attesi” per quel possesso in quel momento a seconda della possibile decisione (tiro, passaggio, palleggio).

Quel valore così ossessivamente cercato è rappresentato dal dolce virgulto nato dalle ricerche del team di Dan chiamato teneramente “EPV” (Expected Possession Value). Dan, con malcelato entusiasmo, ci ha spiegato il fulcro del “DataBall”: «È il numero atteso di punti dato un certo evento durante un possesso. Cioè: avere un EPV pari a 1 mentre sto per tirare da dietro l’arco del tiro da 3 punti significa che mediamente otterrò 1 punto, interpretabile come una tripla segnata ogni tre. E così via per ogni altra possibilità in base alla scelta del giocatore. È fondamentale seguire come varia l’EPV perché ci dice quanto vale la pena prenderci un rischio o orientare l’azione in una certa direzione. La cosa innovativa dell’EPV è che tiene conto della maggior parte dei fattori in gioco, non solo delle mere percentuali di tiro che alla fine toccano solo l’apparenza di ciò che realmente accade».

La figura qui sotto mostra meglio di molte parole il concetto espresso da Dan, e quello che sta avvenendo agli EPV dei cinque attaccanti in un preciso momento di una partita, con l’ala degli Spurs Kawhi Leonard in punta con palla in mano e gli Oklahoma City Thunder schierati in difesa.

I nostri ripetuti «wow!» ci introducono rapidamente ai fattori principali del modello, che Dan da navigato professore così ci illustra: «Senza entrare nel dettaglio statistico potremmo affermare che quei valori riflettono previsioni statistiche su due livelli. Il primo livello è il valore atteso del risultato di un singolo evento. Ovvero, come una scelta incrementerebbe o meno i punti che mi aspetto di ottenere in un dato e preciso momento. Il secondo livello è la probabilità che un evento accada. Questo ci serve più come “peso”, ossia quali azioni sono più frequenti e quali meno. Un dato di cui è importante tenere conto, considerato che è direttamente influenzato dallo sviluppo del gioco. Sono tutte cose che richiedono una conoscenza della statistica... starà a noi farla capire alle persone! [ride]».

Dan, lo notiamo anche dallo sguardo più acceso e dalla passione genuina nella sua voce, ci tiene particolarmente a raccontarci le due caratteristiche fondamentali e rivoluzionarie del modello.

Non parliamo più di macro-transizioni e di statistica “terminale” (cioè che raccoglie i dati e analizza solo le parti dell’azione che finiscono—appunto—a referto), ma di micro-transizioni, ovvero una statistica “del flusso”, del cambiamento frazione di secondo dopo frazione di secondo delle possibilità decisionali del giocatore con la palla, e della loro efficacia attesa in termini di punti e di indice EPV.

La superiorità scientifica di questo tipo di calcoli sta proprio nella diversa qualità e quantità, potendo infatti già comprendere al loro interno tutte le statistiche “base” (le macro-transizioni di cui sopra) che invece da tempo conosciamo ed utilizziamo, ora correlate però tra loro con le “micro” (tempi e spazi) per definire i punti attesi per ogni giocatore data una particolare condizione. Esempi di correlazione: “percentuali di tiro in una particolare zona del campo”+ “contested o uncontested shot” (ovvero tiro con un difensore vicino ad ostacolare o tiro da libero con difensore lontano) + “tendencies” (abitudini a reagire in determinati modi sul campo, come ad esempio passare di più la palla a destra o palleggiare a sinistra) + percentuali al tiro usando il pick and roll + ecc.

Questa è nettamente la parte che attira di più Dan, quella che più vorrebbe approfondire in futuro nonostante il suo impegno ad Harvard sia attualmente orientato verso mondi diversi da quello sportivo: «La valutazione continua dell’EPV, cioè che si possa avere un valore che varia istantaneamente al variare del possesso, che valuta la bontà della tua azione è secondo me davvero affascinante. Ogni giocatore porta il suo contributo. Pensate all’esempio del paper (vedi figura sotto): l’EPV diminuisce leggermente solo perché Waiters [il difensore, vedi punto 4] corre alla disperata per impedire a Leonard di tirare! Sembra sciocco, ma quale altro metodo al mondo considera fattori così scontati e minimali? E se nella lunghezza della regular season la correzione di un semplice evento come quello portasse ad un significativo incremento delle possibilità di successo? I nostri risultati vengono da dati reali, quindi una variazione dell’EPV riflette sempre un 'qualcosa' accaduto sul campo, ma occorre fare attenzione ai 2 livelli di EPV, quello reale, appena descritto, e quello ipotetico. Ossia: al momento di prendere una decisione, come migliorerebbe il mio EPV? È come se ad ogni istante fossero calcolati tanti EPV, ma solo uno venisse poi eseguito. Questo potrebbe decisamente aiutare a capire chi è un miglior decision maker».

Perplessità—Un approccio che ancora non convince tutti

L’idea di un indice che sappia “catturare” lo spostamento infinitesimale dei giocatori nello spazio tridimensionale del campo da gioco applicandovi a corredo tutto lo scibile cestistico già cristallizzato in numeri è stato solo l’ultimo degli incredibili argomenti sviluppati e presentati nel corso degli anni alla SSAC.

Come ogni rivoluzione però, anche quella dei “big numbers” sta incontrando alcuni ostacoli sul proprio cammino. Che sia il lato tradizionale dello sport, dei media e dei tifosi, che sia una sorta di “beata ignoranza” o una condanna da chi ha interesse affinché le cose non cambino, esiste un’ala che si vorrebbe definire “romantica” che si sta opponendo con forza all’avvento della razionalità assoluta dei discepoli della SSAC.

Da interventi anche molto recenti come quello di Charles Barkley che ha paragonato i nerd degli “analytics” ai nerd che non riuscivano a rimorchiare al liceo, a dichiarazioni passate di addetti ai lavori e giocatori, sono tanti gli esempi di opinioni contrastanti la strada intrapresa dai discepoli di Daryl Morey.

L’SSAC ha accolto anche uno che si è fatto chiamare “Coach Zen”, non proprio l’epitome del nerd. Come sempre è stato affascinante da ascoltare, anche in un ambiente non suo.

Non aiuta il fatto che proprio la squadra del cofondatore della SSAC, gli Houston Rockets costruiti appunto secondo criteri “analitici”, fatichino ad avere successo nella pur ipercompetitiva Western Conference delle ultime stagioni, uscendo ad esempio, come nei playoff del 2014, al primo turno nonostante il vantaggio del fattore campo.

Sembrano soprattutto essere l’aspetto psicologico del gioco e la chimica di squadra i cavalli di battaglia di chi si oppone alla cosidetta “Morey-Ball”, ovvero i lati meno prevedibili e convertibili in numeri e statistiche dello sport.

C’è chi come Milwaukee si è messa dunque a sperimentare nuovi approcci, come l’assunzione di un esperto di mimiche facciali di giocatori professionisti, mentre il nostro Dan Cervone ha un’idea ben precisa a riguardo, non pensando purtroppo che i giocatori possano ottenere benefici diretti dagli indici che ha aiutato a sviluppare.

Questo perché «oltre a ciò che gli riesce o meno sul campo, i giocatori NBA hanno un’immagine di sé basata su una storia personale, sulla squadra, sui compagni, sul loro istinto. Ci sono giocatori altruisti cui viene consigliato di tirare più spesso basandosi sulle analisi derivate dalle nostre statistiche, ma molti di loro si sono sempre rifiutati perché preferiscono sentirsi più “passatori” (ad esempio José Calderón, ora ai Knicks). Ma in fondo il nostro scopo non è cambiare il loro modo di giocare, casomai migliorarlo, renderlo più globale. Per gli allenatori è un discorso complesso. So per certo che Brad Stevens (con cui siamo più in contatto allenando a Boston, vicino ad Harvard) è tra i più sensibili alle potenzialità dei “big numbers”, forse anche perché è l’allenatore più giovane di tutta la NBA. Ma qui si tratta con veri e propri maestri d’arte del basket, con un bagaglio d’esperienza e comprensione del gioco altissima e dettagliatissima, e in fondo anche dei grandi motivatori. L’aspetto psicologico infatti è un fattore con cui è doveroso fondere i nostri risultati, e sarebbe un grosso errore sostituirlo o dimenticarlo».

La parola d’ordine sembra dunque essere ancora una volta “equilibrio”; è però evidente che siamo entrati da qualche anno in una nuova era dello sport pro (negli USA, perlomeno), nella quale l’applicazione delle nuove tecnologie visive e di elaborazione dei dati era da ritenersi tanto fisiologica quanto necessaria, considerati i milioni di dollari investiti nel “prodotto” e la virtuosa tendenza tutta anglosassone a voler cercare continuamente modi per migliorare e creare vantaggi competitivi—migliorando di conseguenza il prodotto stesso e i ricavi relativi.

Quel che infatti rende unica e in continua espansione la SSAC è questo mirabile tentativo di fondere all’interno di un solo grande incontro i tanti lati che influenzano l’ambiente sportivo, fortemente correlato a dinamiche sociali, economiche e tecnologiche in continuo cambiamento.

Non è un caso che a distanza di anni molte tematiche vengano riproposte (un esempio: il fenomeno della “mano calda” nel basket analizzata sia nel 2009 che nel 2014): l’evoluzione delle ricerche e del gioco continua a macinare dati e nuove scoperte che aggiornano, o addirittura cambiano su basi empiriche, convinzioni e approcci, passando praticamente come nel “DataBall” dalla giocata percepibile ad occhio nudo all’atomo cestistico.

Evoluzione che, se applicata con criterio e incorporata in analisi future sempre più dettagliate e con strumentazioni sempre più precise, sarà destinata a colmare lo storico gap che dall’alba dei tempi separa la realtà virtuale-matematica da quella sportiva reale.

Non sappiamo che ne pensate, ma per noi la rivincita dei nerd è solo agli inizi.

Attiva modalità lettura
Attiva modalità lettura