Chapel Hill, primavera 1959.
Dean Edwards Smith, leggendario e recentemente scomparso allenatore dei North Carolina Tar Heels, "the only man who could hold Michael Jordan to 20 points", è un brillante 28enne alla prima stagione come assistente sulla panchina di UNC. La laurea in matematica conseguita alla University of Kansas è appesa in bella mostra in camera, il proposito di diventare un professore al liceo è nel cassetto, ma è proprio per il suo background matematico che l’innovativo Frank McGuire lo ha voluto al proprio fianco. Tra le mansioni di Smith c’è quella di comunicare ai giocatori due informazioni, all’intervallo e alla fine di ogni incontro: i punti segnati e quelli subiti, in relazione ai possessi giocati.
Dal capitolo “The Importance of Possession Statistics” del libro Defensive Basketball, Frank McGuire, 1959.
Per valutare numericamente l’efficienza di attacco e difesa non ci si può basare sui semplici punti a partita, perché si tratta di dati inficiati dal “pace”, la velocità della partita, che poi si misura in numero di possessi giocati. Anzi, studiare le variazioni dei punti per possesso (o per 100 possessi, basta spostare la virgola) può aiutare a capire, insieme a tutti gli strumenti tradizionali a disposizione di un allenatore, quale sia il ritmo di gioco più adatto per lo specifico gruppo di giocatori che si ha per le mani. O quale schema difensivo di base dia risultati migliori contro un certo tipo di quintetto.
Nel 1961 McGuire viene accusato di aver violato le norme NCAA in materia di recruiting e, costretto a dimettersi, indica Smith come proprio successore. La prima mossa del nuovo head coach è di assegnare ai propri assistenti il compito di tracciare i punti per possesso. Ovviamente. «Tutti gli indizi indicano lui come il padre del basket analytics» dice oggi Daryl Morey.
Andiamo avanti di oltre mezzo secolo.
Cambridge (Boston), Massachusetts Institute of Technology, 1 marzo 2015. Kirk Patrick Goldsberry, Ph.D. presso l’università di Santa Barbara, California, dipartimento di Geografia, con una tesi sull’aggiornamento in tempo reale del traffico sulle mappe stradali, è collaboratore di Grantland e principale promotore della rivoluzione statistica su base spazio-temporale che ha investito la NBA. Alla nona edizione della Sloan Sports Analytics Conference presenta lo studio Counterpoints: Advanced Defensive Metrics for NBA Basketball: è il primo fondato e strutturato tentativo di quantificare l’impatto difensivo individuale di un giocatore. La definizione di Counterpoints? «La media ponderata dei punti segnati contro uno specifico difensore, per 100 possessi». Dean Smith, da lassù, idealmente approva.
Per comprendere l’impatto di questo studio basti sapere che si stima che solo il 10% del totale dei dati statistici attualmente disponibili riguarda la metà campo difensiva e che le reali opzioni credibili appartengono solo a due società, entrambe peraltro di genesi recente o molto recente:
Synergy Sports (da quest’anno ospitato direttamente su stats.nba.com), basato sui punti per possesso, ovviamente. E suddiviso nelle varie situazioni di gioco: transizione; isolamento; "pick and roll da ball handler"; "pick and roll da bloccante"; spalle a canestro; tiro piazzato; passaggio consegnato dopo un taglio; in uscita dai blocchi; a rimbalzo d’attacco.
Vantage Sports, che è l’evoluzione di Synergy (o «Synergy on steroids» come è stato definito da alcuni esponenti di squadre NBA).
Prima di approfondire questo e gli altri temi emersi dalla SSAC15, un minimo di contesto storico, per tappe fondamentali: l’evoluzione del Basketball Analytics è legata a quella del Personal Computer, strumento fondamentale prima per il calcolo e, successivamente, per la diffusione. Ci sono un paio di coincidenze di quelle che farebbero impazzire gli ammiratori di alcune teorie del complotto.
Nel 1959 la Digital Equipment Corporation produce il PDP–1, primo modello di computer dotato di schermo a tubo catodico integrato. Riservato a pochissimi, tra cui il Massachusetts Institute of Technology, ovviamente. (Un aneddoto: venne utilizzato per la creazione di Spacewar!, uno dei primissimi videogames di vasta distribuzione, ma questa è un’altra storia).
Avanti, al 1981. Torna in scena Dean Smith, per il quale è un anno estremamente significativo: spegne 50 candeline, recluta tal Michael Jeffrey Jordan, termina e pubblica il libro Basketball: Multiple Offense and Defense.
Ventidue anni dopo McGuire, un allenatore di primissimo piano, torna a scrivere di concetti come i punti per possesso. E molti colleghi iniziano a prendere nota.
Nello stesso anno IBM lancia il 5150, più comunemente noto come IBM PC. Il capostipite di tutti i PC odierni. Xerox ha in produzione lo Star, il primo computer venduto sul mercato ad essere dotato di interfaccia grafica a icone guidata da mouse e di hard disk di serie. Apple II invece è già in commercio da 4 anni e se avete visto Jobs non serve spiegare altro. Insomma, tutto pronto per la diffusione al grande pubblico? Beh, no. Le statistiche “avanzate” (anche se in realtà nella divisione di un numero per un altro di “avanzato” non c’è granché) restano nell’ombra per altri 20 anni.
Altro salto in avanti, 2003: dei PC non serve raccontare nulla, ci si può concentrare esclusivamente su Dean Oliver e Basketball on Paper. Dean Smith lo definisce «un’aggiunta unica e sorprendentemente pratica alla libreria di un allenatore». È il libro che dà finalmente il via alla vera rivoluzione, introducendo concetti che ancora oggi sono di estrema attualità, tanto da permettere a Oliver di diventare il primo statistico ad essere assunto a tempo pieno da una franchigia NBA, i Seattle Supersonics, nel 2004. Il leitmotiv è comunque sempre lo stesso: parametrare. Ai possessi, alle occasioni, ai minuti, etc., per ottenere dati paragonabili tra loro, come insegnato da Dean Smith.
Pochi anni dopo «si poteva trovare una copia di Basketball on Paper più o meno in ogni ufficio dei massimi dirigenti NBA. Ora, non tutte le copie erano state lette, ma quantomeno si trovavano lì».
La scrivania non è certo quella di un front office NBA, ma la copia di Basketball on Paper c’è.
Ultimo piccolo salto temporale e ultima finestra sul passato: si torna al MIT (e prometto che da qui non ci si sposta più), 2007, prima edizione della Sloan Sports Analytics Conference. Di cosa si tratti lo hanno raccontato su queste pagine Michele e Tommaso settimana scorsa, ne “La rivincita dei nerd”. In ogni caso ecco una brevissima cronistoria: la prima edizione viene inaugurata da John Hollinger, giornalista di ESPN e creatore del celeberrimo indice “PER” (Player Efficiency Rating), e da un professore di Economia di Northwestern University. Rappresenta una sorta di passaggio di consegne tra le “analytics” tradizionali, quelle lanciate da Oliver, e la nuova generazione (Hollinger peraltro ora è un dirigente dei Memphis Grizzlies), con gli embrioni degli argomenti che poi verranno maggiormente discussi nelle seguenti edizioni.
Dalle scelte dei giocatori da parte dei GM attraverso strumenti statistici (SSAC 2007: Sam Presti - NBA, Bill James - MLB, Paraag Marathe - NFL), si passa nel 2008 a parlare, tra gli altri, di gestione degli stadi e dei ricavi da abbonamenti (ospiti cinque tra i principali manager di impianti sportivi USA). Poi nel 2009 dell’impatto dei nuovi media sugli sport pro (Adam Silver - NBA, John Walsh - ESPN, John Collins - NHL) e dell’importanza sociale di un’icona sportiva (Ray Allen - NBA), fino al “boom” del 2010 con 27 incontri mixati tra il futuro dello storytelling sportivo (Henry Abbott - ESPN, Howard Beck - Bleacher Report), l’espansione internazionale degli sport USA (ospite anche il nostro Maurizio Gherardini, all’epoca vice-presidente dei Toronto Raptors) e i problemi di tassazione legati ad una franchigia pro. Un’infinita serie di topic trasversali, multiculturali e tutti intersecati tra loro, analizzati da un élite sportiva, dirigenziale e scientifica animata dalla volontà comune di condividere i propri know-how con mondi vicini ma diversi, senza preoccuparsi di proteggere e nascondere il proprio “giardino” ma provando invece ad allargarlo per renderlo più ricco, efficiente, versatile. In breve: migliore.
Un approccio lontano anni (secoli?) luce dal desolante panorama italico, in cui il Dean Smith del 1959 rischierebbe l’Inquisizione, e che nel secondo decennio del 2000 ha preso definitivamente il largo: nel 2011 63 “discussioni” tra cui analisi sul mondo scommesse, innovative analytics sul golf, il calcio, gli arbitri e il vantaggio del fattore campo; nel 2012 64, con nuovi topic come i cambiamenti in atto nel tennis, la pressione nella performance sportiva e la previsione dei rischi nel business sportivo; nel 2013 70, tra cui il doping come necessità di vincere ad ogni costo, la valutazione di una chimica di squadra e l’utilizzo delle stampanti 3D nello sport; infine nell’ultima edizione, quella del 2014, oltre al “DataBall”, anche come costruire una dinastia, Adidas e la sua rivoluzione tecnologica, e altre 65 tematiche.
Ed ecco, finalmente, l’edizione 2015, che però ha scontentato quasi tutti.
Per primi ha scontentato quelli dello zoccolo duro-e-puro delle analytics, che per due giorni non hanno fatto altro che cercare di spiegare a sé stessi (perché non è certo impuntandosi su ricerche sempre più complicate che si può sperare di smuovere chi è ancorato a una visione eccessivamente old school) cosa si intende per analytics e chiedersi: «Where are the analytics?». Quasi spaesato in un contesto improvvisamente mainstream (ESPN è sponsor ufficiale dell’evento) e in via di mutazione, un po’ come accade ai fan della prima ora di un gruppo indie rock che si trova catapultato in cima alle classifiche di vendita.
Dall’altra parte ha scontentato anche “Gli Altri”, i paladini dell’eye-test che rifiutano di considerare l’esistenza di strumenti diversi da quelli che hanno imparato ad usare nel corso degli anni (e senza leggere Dean Smith, probabilmente).
E infine anche quelli che «l’idea delle analytics non di è avere ragione; è di avere mente aperta a diversi modi di avere ragione», alla ricerca di soluzioni per favorire la diffusione e divulgazione dei concetti più importanti, ma presi in mezzo tra estremismi, testardaggine e due eserciti che combattono una guerra che non dovrebbe aver senso di esistere.
Una delusione, quindi. O meglio, l’asticella è ormai posta talmente in alto che il bene non è più sufficiente, l’ottimo basta a malapena e solo l’eccellente riesce a regalare qualche brivido. Lo stesso metro di valutazione è valido per le ricerche.
Dalla Rice University arriva uno studio sulle partite punto a punto, “When to Foul When Trailing and Leading”, che però probabilmente manca il bersaglio e offre risultati controintuitivi e metodologicamente opinabili. Bene, per carità, ma non più sufficiente.
Tre studenti della Columbia University hanno presentato invece “Graphical Model for Baskeball Match Simulation”. Per farla brevissima, un modello basato su una dozzina di variabili (quintetti; propensione al tiro assoluta e relativa alla difesa; passaggi; rimbalzi; propensione a commettere/subire fallo; abilità al tiro; capacità di contestare o negare un tiro; etc.) e una decina di parametri (tipo di possesso; frequenza ed efficienza di tiro; sistema di passaggi, etc.), che possa fungere da strumento predittivo dell’effetto di differenti quintetti sul risultato finale di una partita (o serie). Concept decisamente interessante, ma modello perfettibile e, soprattutto, che manca della necessaria attrattiva per andare oltre contesti accademici. Ottimo, per carità, ma basta a malapena.
Per l’eccellenza (aiutata dal fatto di poter disporre in esclusiva di tutti i dati forniti dalle telecamere di SportVU, tema che peraltro è stato discusso a lungo) bisogna tornare da Goldsberry e soprattutto da Alexander Franks (statistico) e Andrew Miller (informatico), i dottorandi veri artefici di Counterpoints. L’idea di base? Innanzitutto creare un modello in grado di riconoscere gli assegnamenti e le responsabilità difensive, in ogni singolo istante di una partita. Facile, no? Oltre un anno di lavoro, su un database da oltre 80GB. Vi sembrano pochi? Provate a creare un documento Excel di 80 giga e poi ne riparliamo. Per usare le parole di Goldsberry, «an unwieldy pain in the ass». Il risultato però...
Una volta affinato il sistema è stato possibile ricavare diverse statistiche di rendimento. Una di queste, più immediata, è quella delle shot charts difensive, che mostrano la capacità di contestare (efficienza) e negare (volume) un tiro all’avversario. Tenendo conto non della media generica di efficienza e volume in ogni singolo punto del campo (come accade per le charts offensive), ma di tendenze e valori specifici di ogni singolo avversario affrontato. A quel punto abbiamo dei risultati interessanti.
Per esempio Chris Paul è stato, nella stagione 2013/14, il miglior difensore perimetrale della lega.
La vera novità è rappresentata dal dato che riguarda il volume. Contestare efficacemente un tiro è una grande qualità, ma negarlo totalmente è abilità estremamente rara e che fa la differenza. Al contrario, far tirare tanto e bene ti rende... James Harden, ovvero uno dei peggiori difensori della scorsa stagione, come si può apprezzare nell’articolo introduttivo al tema pubblicato su Grantland (almeno fino agli scorsi playoff, perché il salto di qualità compiuto in questa stagione è innegabile e non necessità del supporto di alcuna chart).
Estremamente interessante è la valutazione dell’impatto dei cosiddetti rim-protectors: il Dwight Effect (vale a dire negare del tutto che si tiri in area) a confronto con la minor intimidazione, ma maggior abilità di contestare le conclusioni in area offerte da Duncan e Hibbert. Anche per scelte tattiche ben precise, come dimostra la presenza di Ian Mahinmi (riserva di Hibbert) ai primi posti del "Contest Rate", cioè la frequenza con cui un lungo difende un tiro.
Le shot charts hanno il grosso vantaggio di essere immediatamente fruibili (vero obiettivo del lavoro di Goldsberry, come si potrà leggere anche poco sotto), ma non tengono in considerazione lo sviluppo temporale dei singoli possessi. Un difensore è responsabile della marcatura di un singolo avversario solo in situazioni di isolamento o gioco statico, mentre nell’affrontare schemi offensivi elaborati occorre valutare anche cambi, aiuti, rotazioni e quant’altro.
Unendo gli studi sull’EPV (vedi "DataBall"), in questo caso against, al sistema sviluppato da Franks e Miller, si giunge finalmente ai “counterpoints”, che si basano sul giocatore che conclude il possesso con un tiro (tiratore) e sono calcolati con i seguenti metodi:
- "Original Matchup Method", assegnati al difensore che ha marcato il tiratore a inizio possesso (tra 10 e 4 secondi prima del tiro), valutando per ogni istante la media dei tiri tentati e la media dei punti segnati;
- "Pre-Shot Matchup Method", assegnati al difensore che marca il tiratore al momento del tiro, valutando "Contest Rate" e punti subiti per 100 possessi.
Il tutto viene poi unito attraverso il "fractional method", con "counterpoints" assegnati in modo proporzionale ai vari giocatori impegnati nella marcatura del tiratore nell’arco dell’intero possesso, per ovviare alle imperfezioni di primo (ignora la responsabilità del giocatore che fisicamente difende il tiro) e secondo (penalizza i lunghi che contestano un’elevata quantità di tiri, senza aver avuto responsabilità difensive rilevanti nel corso del possesso) dei suddetti procedimenti. Quel che ne deriva è un numero semplice, i "Points Against", nelle tre possibili versioni. E Chris Paul anche in questo caso primeggia.
La parte migliore di tutto ciò è che è solo l’inizio. Questo studio non ha alcuna pretesa di ridurre a un unico valore il rendimento difensivo globale di un giocatore (impossibile e comunque non è questo l’obiettivo delle analytics), ma rappresenta un ottimo punto di partenza per studi futuri, magari integrando schemi e linee guida date dagli allenatori di ogni singola squadra. Eccellente, sì. Qui effettivamente qualche brivido è arrivato.
E allora per finire, nerds & geeks (o ladies & gentlemen, ma stonerebbe): le Medaglie della SSAC, edizione 2015.
Il meglio
3° Mike D’Antoni: «A dirla tutta, con la psicoterapia fanno miracoli. Sto bene...» (in risposta a chi gli chiedeva se schierare e gestire un "ball-stopper" come Carmelo Anthony lo portasse ad avere incubi la notte).
2° Pablo Torre, giornalista di ESPN: «Mi hanno chiamato a moderare questa discussione perché sono uno di quelli che al liceo non ha visto una ragazza» (riferimento: Charles Barkley e il suo ormai celebre monologo anti-analytics).
1° Jeff Van Gundy:
«Le due chiavi per vincere in una partita di basket tra bambine di 9 anni sono le seguenti: saper segnare un sottomano e... tutte le tue giocatrici devono per forza presentarsi? Perché se si presentano tutte, devi farle giocare in maniera uguale, ma se riesci a convincerne due di essere veramente malate... a quel punto le tue due giocatrici migliori giocano tre quarti ciascuna. È così che si vince nel basket tra bambine di 9 anni». (riferimento: Vivek Ranadivé, l’eccentrico proprietario dei Sacramento Kings, che afferma di aver utilizzato le analytics per guidare alla vittoria del campionato una squadra di ragazzine poco talentuose).
Il peggio
3° Byron Scott (e Babbo Natale): «Le analytics? Credo che vi siano alcune persone che ci credono. Io non sono una di queste» (antecedente alla SSAC, ma medaglia honoris causa).
2° Mike Zarren, la ruota. Di nuovo. Il Draft è scienza inesatta per definizione, la Lottery aggiunge ulteriore casualità e soprattutto ci sono Draft ottimi e Draft pessimi. Determinare preventivamente quali squadre possano scegliere per prime in ogni singolo anno... no.
1° Kevin McHale (riportata da Daryl Morey): «Se il Triangolo è uno schema che può funzionare nella NBA di oggi? Se si hanno i migliori giocatori, si può usare anche il quadrato». Se state pensando al primo turno dei playoff 2014, in cui i Rockets sono stati eliminati da dei Trail Blazers inferiori. Sì, anche io.
Kirk Goldsberry
Menzione d’onore: il suo gruppo di lavoro ad Harvard si chiama XY Hoops (...)
3° «Per capire i fenomeni che succedono in tutto il mondo non vogliamo vedere i dati. Vogliamo vedere le rappresentazioni grafiche».
2° «La NBA dovrebbe mettersi una mano sulla coscienza e rendere pubblica una quantità di dati ancora maggiore» (sottinteso: così che più studiosi possano avervi accesso, per fornire rappresentazioni ancora migliori).
1° (si parla degli Utah Jazz, come esempio di pessima difesa) «Oh, no, i dati si riferiscono alla scorsa stagione. Ora i Jazz sono più che a posto. Fate conto che si tratti... dei Lakers». (A margine: Rudy Gobert ALERT, nda).
I Numeri
3° oltre 5.000, le persone ad essersi messe in lista per acquistare un biglietto. “Solo” 3100 circa sono state accontentate.
2° 200$, il costo del biglietto per gli studenti universitari.
1° 575$, il costo del biglietto per tutti gli altri (!!!).
MVP: Shane Battier
3° «L’influenza del gruppo e dei compagni di squadra è la forza più potente che ci possa essere in uno sport di squadra. Si trova in tutte le grandi organizzazioni. La sola presenza di Duncan, Parker e Ginobili è più importante di qualsiasi cosa Popovich possa dire».
2° «Per quanto riguarda la difesa, credo che le analytics abbiano aiutato immensamente la mia carriera. E anche la mia vita. Sono un calcolatore, unire un piano razionale agli istinti dà grandi risultati. In attacco invece ho perso la mia creatività, che è il vero segreto. Ecco cosa rende eccezionali i grandi realizzatori, la capacità di improvvisare, non pensare troppo».
1°