
Prima di iniziare a scrivere questo articolo ho chiesto su Twitter chi, istintivamente, si pensa sia miglior finalizzatore degli ultimi tempi. E il fatto che molte risposte sono andate vicino alla realtà, almeno rispetto a quanto sono riuscito ad evincere alla fine di questa analisi, fa pensare che evidentemente la finalizzazione è una qualità che si percepisce anche ad occhio nudo.
In particolare, molti hanno suggerito Messi come il miglior finalizzatore in assoluto, ma qualcuno ha notato che sarebbe stato “persino troppo ovvio”, forse proprio perché la sua abilità di trasformare le occasioni in gol ci sembra evidente (forse anche perché chi mi segue sa che ho una predilezione per Messi e già in passato ho evidenziato la sua straordinarietà...).
Ma cosa intendiamo esattamente con finalizzazione? L'interpretazione più semplice si riferisce all’abilità di un calciatore di trasformare tiri in gol, ma vale la pena sottolineare che così come la stiamo definendo la finalizzazione è diversa dall’abilità realizzativa, che potenzialmente è un concetto più ampio e più complesso. Il miglior finalizzatore, cioè, non è necessariamente il miglior realizzatore, o il miglior attaccante possibile: questa seconda categoria si riferisce ai calciatori in grado di costruire anche da soli la propria occasione, di inventare dal nulla un gol e se possibile di farlo con costanza. Il finalizzatore, come detto, è semplicemente quello che sul totale delle occasioni in cui ha potuto provare a segnare (sul totale dei tiri, cioè) ci è riuscito.
Per questo, per scoprire chi fosse il miglior finalizzatore del calcio contemporaneo, va tenuto conto di un volume di dati piuttosto grande, un problema visto che trovare dati grezzi sul calcio accessibili liberamente non è facile (per fortuna, però, qualcosa si trova). Per il nostro studio ho tenuto conto di tutti i tiri effettuati nelle cinque maggiori leghe europee: Liga, Serie A, Premier League, Bundesliga e Ligue 1; per le stagioni comprese tra il 2006 e il 2017. I dati prima dell’anno 2006 non sembravano avere la stessa accuratezza e precisione di quelli degli anni successivi e per questo ho deciso di escluderli.
In totale sono 685,953 tiri, escludendo i rigori, da 14267 calciatori differenti. Di ogni conclusione conosciamo il nome del tiratore, l’esito (gol/no gol) e il punto del campo dal quale il tiro è partito – quindi conosciamo la distanza dal centro della porta.

Dal grafico qui sopra, che mette in ordine i giocatori semplicemente in base al numero di tiri e di gol, possiamo farci una primissima idea, dividendo i giocatori sostanzialmente in tre gruppi:
Il primo costituito da Cristiano Ronaldo e Messi, che hanno tirato e segnato molto più di qualunque altro giocatore. Cristiano, in particolare, ha effettuato un numero incredibile di tiri ed è interessante notare che, nonostante questo, ha comunque segnato meno gol di Messi, nonostante lo superi di più di mille tiri.
Il secondo include alcuni dei migliori attaccanti degli ultimi 10-15 anni in Europa, cioè quelli che hanno segnato tra i 200 e i 300 gol.
Il terzo include tutti gli altri calciatori.
Prima di addentrarci nell'analisi vera e propria vanno fatte alcune precisazioni. Innanzitutto bisogna tenere a mente che il nostro database è molto corposo e che estende la sua attenzione in un arco temporale di ben 12 anni. Ma, nonostante sia un lasso di tempo enorme (si fa in tempo a giocare 4 Mondiali in 12 anni) nel database mancano diversi anni di calcio competitivo di molti calciatori. Per esempio, nel database ci sono solo 284 tiri (e 56 gol) di Filippo Inzaghi e 484 tiri (e 57 gol) di Alessandro Del Piero. I migliori anni della loro carriera, precedenti al periodo di valutazione, sono rimasti fuori dall’analisi: inevitabilmente, la stima delle loro capacità realizzative è stata quindi condizionata dalla scelta iniziale, e dovrà essere tenuta in conto nelle conclusioni.
Come detto, questa analisi è basata sul tasso di conversione, un parametro semplice, quasi primitivo, che misura quanti gol un giocatore è riuscito a segnare in media con un tiro. Ovviamente, quindi, è un valore che va da 0 a 1 (almeno fino a quando non si inizierà a segnare due gol con un unico tiro, una pratica che Messi ha già iniziato a perfezionare) e, almeno teoricamente, più alto è il tasso di conversione, migliore è un finalizzatore.

Possiamo anticipare, guardando la linea rossa del trend in questo grafico, che più un calciatore tira in assoluto, più aumenta il suo tasso di conversione (la percentuale di tiri che diventa gol).
Il problema della distanza
Il tasso di conversione indica l’abilità di finalizzazione, ma non dobbiamo dimenticare che nella realtà non tutti i tiri sono uguali: cioè, come insegna l’approccio stocastico degli Expected Goals, ogni tiro ha probabilità differenti di essere trasformato in gol. Inoltre, giocatori differenti, per ruolo o per caratteristiche, tendono a effettuare tiri differenti, quindi comparare i loro rapporti di conversione sarebbe ingiusto, oltre che fuorviante.
Anziché utilizzare un modello di Expected Goals, che non possiamo applicare per la scarsità dei dati, per ridurre la complessità dell’analisi ho considerato la distanza dalla porta come un proxy, cioè una misura approssimata, della difficoltà del tiro. È una semplificazione, è vero, ma ha senso se consideriamo che la posizione di tiro è uno dei fattori più importanti in ogni modello di Expected Goals.
Ho quindi diviso tutti i tiri in 25 categorie in base alla loro distanza dal centro della porta. Ogni categoria ha un range di distanza di 15 metri, sovrapponendosi di 14 con quella successiva: la prima fascia di tiri quindi comprende quelli partiti da 0 a 15 metri di distanza, la seconda da 1 a 16 metri, la terza da 2 a 17 metri, e così via.

Nel grafico qui sopra possiamo già distinguere la distribuzione dei tiri per alcuni giocatori, e come possiamo osservare dagli istogrammi sulla sinistra ogni giocatore ha una sua propria distribuzione, un modo proprio di arrivare al tiro (Totti e Coutinho ad esempio amano tirare da fuori, centravanti come Lukaku e Mario Gomez tirano da più vicino). Quando restringiamo l’analisi ai soli tiri ravvicinati, nel grafico a destra che suddivide la distribuzione di tiri nei primi 15 metri, si notano ancora alcune differenze da giocatore a giocatore, ma sono molto meno accentuate rispetto ai diagramma completo: è una conferma indiretta che tenere in conto la distanza di tiro migliora la qualità dell’analisi.
La distanza di tiro assume molta più importanza se ci allontaniamo dalla porta. Dal vicino un tiro può essere effettuato di piede o di testa, può scaturire da passaggi molto diversi come un cross o un filtrante, può arrivare in situazioni particolarmente pericolose come un uno contro uno col portiere avversario, ma la preponderanza di questi fattori ovviamente decresce con l’aumentare della distanza dalla porta.
Il problema del volume di tiri
Un'altra riflessione va fatta sulle enormi differenze tra i volumi di tiro di molti calciatori. Sul totale di calciatori presi in considerazione (cioè tutti quelli che hanno effettuato almeno un tiro nei cinque maggiori campionati europei, dal 2006/7 in poi) la stragrande maggioranza in esame ha tirato poco: la media è molto bassa, di circa 6 tiri; il che rischia di alterare il senso del tasso di conversione portando molto in alto giocatori con pochi tiri.
Per questo ho provato a tenere conto della variazione nei volumi di tiro (usando uno stimatore bayesiano, e modellano i tassi di conversione nel dataset come una distribuzione Beta) per ottenere una stima riveduta e corretta del tasso di conversione di ogni giocatore.

Ovviamente Messi e Cristiano fanno sempre eccezione: il portoghese ha fatto più di 3 mila tiri negli ultimi 12 anni.
Ma va considerato anche che se la percentuale realizzativa media è di circa il 10%, non resta costante lungo tutto il campione di tiri presi da ciascun calciatore: perché - come anticipato nel secondo grafico - i tiratori con grossi volumi tendono ad avere anche percentuali di conversione maggiori (e in senso assoluto più si tira più aumentano le probabilità di segnare).
Se adesso proviamo a vedere quali sono i migliori finalizzatori, con tiri partiti tra 0 e 15 metri di distanza, vediamo che spunta il nome di Cavani subito dietro i soliti due e anche finalizzatori come Suarez e Aduriz guadagnano posizioni (qui sotto c'è prima la relazione tiri/gol, poi quella tiri/tasso di conversione).
[gallery columns="4" ids="37733,37734"]
Il grafico ancora sotto, invece, mostra l'istogramma del tasso di conversione. In altre parole mostra come sono distribuiti i valori del tasso di conversione tra i giocatori con almeno 200 tiri, in modo da avere una distribuzione rappresentativa: più ci si sposta a destra migliori diventano i finalizzatori, e ovviamente abbiamo la maggior parte dei giocatori nella parte centrale del grafico. La curva rossa è una rappresentazione matematica della distribuzione, che è rappresentata staticamente dalle colonne nere, considerando il valore medio per ogni colonna. Successivamente vedremo come si comporteranno singoli giocatori rispetto a questo "giocatore medio", rappresentato da questa questa curva rossa.

L'altezza delle barre nere rappresenta il totale dei giocatori che hanno quel determinato tasso di conversione. La vetta della parabola che ottimizza il grafico (e che useremo dopo come confronto) è a poco più di 0,2: rappresenta il tasso di conversione medio in cui ci sono più giocatori.
E a questa base media possiamo confrontare la distribuzione del tasso di conversione di tutti i calciatori nel database. Per fare un esempio, qui sotto ho considerato le distribuzioni di Dzeko, Icardi e Salah. La curva tratteggiata rappresenta l’abilità media di tutti i calciatori, che sarà utile come indicatore per valutare i tre giocatori presi in esame. Un giocatore che si posiziona sulla destra della curva tratteggiata sarà un finalizzatore migliore della media, viceversa a sinistra. Dzeko è in ritardo sia nel confronto con Icardi e Salah, sia anche rispetto a tutti gli altri calciatori.
Se guardiamo il grafico successivo possiamo notare che tutte le curve hanno la forma di una campana. La forma della campana dipende sostanzialmente da due valori: il valore medio del tasso di conversione (la vetta: 0.19 per Dzeko, 0.24 per Icardi, 0.32 per Salah, e così via) e la quantità dei tiri effettuati, che determina l'altezza e l'ampiezza della curva.
Per i giocatori con molti tiri effettuati la campana sarà alta e stretta, e il tasso di conversione sarà anche più preciso perché basato su un volume di tiri più ampio. Per i giocatori con pochi tiri, invece, la curva sarà bassa e larga.

Per giocatori come Cristiano Ronaldo, che ha più di tremila tiri, siamo quindi sicuri che la nostra rappresentazione sarà piuttosto stabile, e che probabilmente non cambierà in futuro. Per giocatori con un campione molto più ristretto, come Mbappé, invece le cose potrebbero cambiare molto.
Rappresentare i tassi di realizzazione con una curva (per rappresentare la variazione nelle performance) anziché come un singolo punto (che rappresenterebbe solo il numero medio) rende le comparazioni tra giocatori più significative e precise, perché, come abbiamo visto, il tasso di conversione varia a seconda di diversi fattori (non solo la distanza).
In questo modo, però, non possiamo essere quasi mai sicuri al 100% che un giocatore sia un miglior finalizzatore di un altro, ma ciò che possiamo fare in questi casi è calcolare che probabilità che questo avvenga. La curva di Salah, ad esempio, è più a destra di quella di Icardi, il che potrebbe indicare che l’egiziano è un realizzatore migliore dell’argentino. In realtà le due curve si sovrappongono in parte: in quei punti i loro dati sono simili e c'è una probabilità che Icardi sia un realizzatore migliore di Salah - in questo caso, la probabilità che Icardi sia un miglior realizzatore di Salah è di solo il 2.8%, mentre il contrario si attesta al 97.2%.
Graficamente, più due curve si sovrappongono più due giocatori simili, in quanto ad abilità realizzative. Se guardiamo il grafico, possiamo notare come esista anche una piccolissima area di sovrapposizione tra le curve di Salah e Dzeko, il che significa che esiste una bassissima probabilità che il bosniaco sia un miglior finalizzatore dell'egiziano.
Le distribuzioni dei tassi di conversione sono molto efficaci nelle comparazioni grafiche tra due o tre giocatori, ma diventa difficile utilizzarle per un numero superiore di calciatori, perché troppe curve si sovrapporrebbero rendendo i grafici illeggibili. Per superare questo problema possiamo costruire un intervallo di credibilità. L’intervallo credibile mostra il range dei valori nel quale il tasso di conversione di un calciatore ricade con una certa probabilità predefinita. Matematicamente sono costruiti rimuovendo le "code", cioè i valori più estremi, di ciascuna curva, in modo da togliere i valori che sono meno probabili di rappresentare la reale abilità realizzativa di ogni giocatore. Visivamente è un trick che ci permette di comparare molti giocatori tra loro.

Nel grafico qui sopra sono rappresentati i 10 migliori finalizzatori sotto i 15 metri dalla porta, con un intervallo di credibilità del 90% (per tutti e 10, quindi, abbiamo tolto il primo 5% dei valori e l'ultimo 5%). In altre parole, per ogni giocatore siamo sicuri al 90% che il loro tasso di conversione ricada nell'intervallo preso in considerazione (le barre nere). Le linee bianche, invece, rappresentano il valore di mediana.
Troviamo diverse sorprese prima e dopo Messi, come ovviamente Ribery, che è incredibilmente in testa in questa prima categoria.
Chi è il miglior finalizzatore tra Messi e Ronaldo?
Tutto il paragrafo precedente è un’applicazione della metodologia solo per la prima delle 25 categorie in cui avevamo diviso il database. Vediamo ora come cambiano i numeri in tutte le restanti categorie, allontanandoci dalla porta.

Come si può notare dal grafico qui sopra, le linee di trend in rosso hanno una pendenza minore via via che scorriamo con le categorie: questo, in sostanza, indica che i tassi di conversione diminuiscono all'allontanarsi dei tiri dalla porta. Messi e Cristiano Ronaldo sono vicini l’un l’altro e lontani da tutti gli altri calciatori (in pratica sono i punti isolati dal gruppo in alto a destra in ogni riquadro). La differenza sostanziale tra i due è che, allontanandosi dalla porta, i volumi di Messi si riducono mentre quelli di Ronaldo restano sostanzialmente invariati: CR7 ha più di 1300 tiri da una distanza pari o superiore a 24 metri.

Messi, Higuain e Ribery sono gli unici giocatori che hanno la migliore conversione media in almeno una delle categorie di tiro considerate. Ma il vero dato eccezionale è quello di Messi, che batte tutti in praticamente tutte le categorie, tranne quattro.

Per rendere ancora più evidente la performance di Messi, nel grafico qui sopra ho isolato la conversione media di tutti i giocatori (in nero) e l’ho confrontata con quella dell’argentino (in rosso). Nei tre grafici successivi, invece ho selezionato i risultati di alcuni dei migliori attaccanti degli ultimi 12 anni, almeno secondo la metodologia, e le ho confrontate tra loro.
[gallery columns="4" ids="37450,37451,37452"]
È semplicemente incredibile come Messi domini questa statistica. Solo alcuni calciatori riescono ad essere bravi quanto l’argentino e solo in alcune categorie di tiro, ma al di fuori di queste, la loro abilità crolla drammaticamente. Higuain e Lacazette sono probabilmente i due calciatori con l’abilità in finalizzazione più simile a quella dell’argentino, ma i loro dati crollano quando la distanza dalla porta sale oltre i 20 metri. Lo stesso si può dire di giocatori come Salah e Griezmann, che hanno pattern simili tra loro, anche se in categorie di tiro diverse.
Altri giocatori mostrano un trend differente. Del Piero e Dybala, per esempio, hanno pattern molto simili, ma hanno uno scarso feeling con la rete da distanza ravvicinata. Cristiano Ronaldo mostra delle similitudini, ma il suo posizionamento in classifica non è così in basso quanto quello di Del Piero e Dybala dalla corta e media distanza: CR7 è tra il 40° e 190° posto per queste due categorie (mentre Del Piero e Dybala sono oltre la 400a posizione); mentre tutti e tre sono nella top 10 per le realizzazioni da lontano. Anche Ibrahimovic, che non si piazza tra i primi quando è davanti al portiere, è addirittura secondo dietro Messi per la finalizzazione dalla media e dalla lunga distanza.

Giusto come ulteriore conferma, ho illustrato la distribuzione posteriore di Messi e Ronaldo per tutte e 25 le categorie di tiro. La differenza è tale in alcune categorie che le curve non si sovrappongono nemmeno. I due diventano comparabili solo su distanze di tiro lunghe, con Messi però ancora a destra di Ronaldo.
La classifica finale
Adesso è il momento di tirar fuori un'unica classifica, per tutti i tiri, che superi quindi le distinzioni per categoria. Eccovi, finalmente, accontentati con i 20 migliori finalizzatori dal 2006 ad oggi.

Quando ho iniziato questo studio, la mia idea era che Messi era un ottimo finalizzatore, ma che avrebbe avuto almeno 5, se non 10 calciatori migliori di lui: nonostante sia un calciatore straordinario, la finalizzazione non è di certo la prima caratteristica che ci viene in mente quando pensiamo a lui. E invece il risultato di questa analisi è che l’argentino è il migliore in assoluto, e anche di tanto. D’altra parte, stiamo parlando di un giocatore capace di segnare anche 91 gol in un anno.
Visto che il successo è fin troppo celebrato, soprattutto quello di Messi, vorrei chiudere però parlando del caso di Higuain, che incarna forse meglio di chiunque altro la distanza che spesso c'è tra la percezione di un giocatore e la sua reale efficienza statistica. L'attaccante argentino è terzo in questa speciale classifica, ed è uno dei migliori finalizzatori del ventunesimo secolo, ma è stato comunque capace di sbagliare gol e rigori in alcune delle più importanti finali disputate negli ultimi anni dall’Argentina, e per quegli errori, più che per i suoi gol, verrà probabilmente ricordato. Il calcio, d'altra parte, sa essere crudele.