DATA ANALYSIS DEL TIRO IN PORTA

“Devi per forza tirare, altrimenti non puoi segnare”
(Johan Cruyff, il padre del calcio moderno)

PREMESSA

Con il presente, inizia la mia collaborazione con l’amico e collega ingegner Francesco Francia. L’ingegner Francia è un esperto allenatore di calcio ed ha avuto la geniale idea di fondere le sue due passioni, dando vita a https://ingegneriadelcalcio.com/: “Metodi organizzativi, idee di gestione, tecnologie di supporto, startup innovative saranno oggetto di discussione, insieme a nuovi spunti che l’esperienza e la condivisione ci porteranno a partorire. Insomma un piccolo contributo, con una visione ingegneristica, al mondo del calcio.


1. ANALISI DESCRITTIVA DEI DATI

Gianni Brera, foto tratta dal sito Gazzetta.it

“Sono infiniti i modi per giungere al gol, infiniti gli schemi e le circostanze che li determinano. Tanto più valida è una squadra quanto più numerose sono le sue invenzione per ottenere il gol”.

Gianni Brera, il padre dell’analisi critica nel calcio.
(“Il mestiere del calciatore”)

Domanda

  1. È possibile dare un senso ingegneristico all’analisi critica di una partita di calcio?

Amici, per iniziare questo viaggio è necessario dare una definizione di dato. Per gli ingegneri (quorum ego), un DATO è un fenomeno misurabile che fornisce una informazione. Stabilire ch’essa (l’informazione intendo) sia o meno utile, è uno dei compiti dello scienziato, il quale, è bene dirlo, deve prima presentare una opportuna definizione della faccenda.

In una partita di calcio i dati si ottengo attraverso la definizione dei seguenti eventi: passaggi, cross, dribbling, chiusure, recuperi palla, parate, reti e l’oggetto di questa trattazione: il tiro. Ovviamente la scelta è arbitraria e ho riportato solamente la più comune.

È mia ferma convinzione che la cifra dello spettacolo di una gara non sia il numero dei gol, bensì la quantità e soprattutto la qualità delle conclusioni a rete, tuttavia, non è possibile oggettivare il concetto di “spettacolo” ovvero di “partita divertente”. Risulta più interessante cercare una correlazione tra il numero di tiri in porta e il successo in una competizione, perché è possibile misurare questi dati.

La seguente analisi è puramente descrittiva: non si utilizzano metodi di inferenza statistica superiore. L’obiettivo è comprendere come i numeri possano rispondere a qualche interessante domanda.

Prendiamo in esame le stagioni dal 2008/09 al 2017/18 della Serie A (fonte Footstats, LINK DIRETTO).


1A. TIRI TOTALI E TIRI NELLO SPECCHIO

Domande

  1. Quanti tiri verso la porta vengono effettuati durante una stagione di Serie A?
  2. Quanti di essi finiscono nello specchio della porta?
  3. Quanti di essi finiscono in rete?
Figura 1: tiri, tiri nello specchio e reti totali dal 2008/09 al 2017/18.

Il grafico in Figura 1 descrive l’andamento del numero di tiri totali (linea blu), il numero di tiri nello specchio della porta (linea rossa) e il numero di gol (linea gialla). Si tratta della somma di tutti i dati di ogni singola partita della stagione.

  • Vengono effettuati (in media) 10.000 tiri (circa) in ogni stagione.
  • Solamente il 34% dei tiri finisce nello specchio della porta, ovvero 1 ogni 3: 3400 (circa) in media.
  • Solamente il 30% dei tiri nello specchio si traduce in gol (meno di 1 su 3) e appena il 10% dei tiri totali entra in porta: 1000 gol (circa) in media.
Figura 2: totale dei tiri, dei tiri nello specchio e delle reti effettuate nelle 10 stagioni in esame.

Nella Figura 2 vediamo la somma dei tiri totali, di quelli finiti nello specchio e dei gol segnati nelle 10 stagioni analizzate. Il grafico è utile per comprendere visivamente la proporzione tra le grandezze in esame (1/3).

È conveniente studiare l’andamento medio dei tiri totali, l’andamento dei tiri nello specchio e l’andamento delle reti segnate, inserendo questa media (stagione per stagione) tra i valori minimi e i valori massimi che gli indici assumono.

Figura 3: andamento valori medi, massimo e minimo dei tiri totali.
Figura 4: andamento valori medi, massimo e minimo dei tiri nello specchio.

Nella Figura 3 viene descritto l’andamento della media dei tiri che ogni squadra effettua in ogni partita (linea blu). Traduciamo. Per ogni singola squadra è stato calcolato il numero medio di tiri totali effettuati in ogni singola partita [(tiri totali)/(numero di gare)]; è stata effettuata la media di questi 20 valori [(media tiri per partita singola squadra)/20], ottenendo l’indice descritto dalla linea blu.

Per ogni stagione viene mostrata la media tiri per partita più alta (linea rossa) e la media tiri per partita più bassa (linea gialla) tra tutte le squadre di ogni singola stagione. Stesso ragionamento per quanto riguarda i tiri nello specchio della porta (Figura 4).

Se ne deduce che:

  • In ogni partita vengono effettuati mediamente 13 tiri (circa) da ogni singola squadra; tra i 4 e i 5 di essi finiscono nello specchio della porta.
  • La squadra che in una singola stagione effettua il maggior numero di tiri, mediamente risulta averne fatti più di 17 a partita; la squadra che in una singola stagione effettua il maggior numero di tiri nello specchio della porta, mediamente risulta averne fatti più di 6 a partita.
  • La squadra che in una singola stagione effettua il minor numero di tiri, mediamente risulta averne fatti meno di 10 a partita; la squadra che in una singola stagione effettua il minor numero di tiri nello specchio della porta, mediamente risulta averne fatti circa 3 a partita.


1B. POSIZIONE IN CLASSIFICA E TIRI IN PORTA

Domande

  1. La squadra che alla fine della singola stagione ha effettuato il maggior numero di tiri, quale posizione finale occupa?
  2. C’è differenza tra effettuare più tiri totali e più tiri nello specchio?
Figura 6: posizione finale delle squadre che hanno effettuato il maggior numero di tiri.

Nella Figura 6 vediamo la posizione delle squadre che hanno totalizzato il maggior numero di tiri (linea blu) e il maggior numero di tiri nello specchio (linea rossa).

Deduciamo che:

  • Nel 40% dei casi, le squadre che hanno effettuato il maggior numero di tiri NON hanno terminato il campionato tra le prime 3.
  • Solamente nel 20% dei casi (2011/12 e 2012/13) la squadra campione d’Italia è risultata essere quella che ha effettuato il maggior numero di tiri.
  • Nella stagione 2009/10, la squadra che ha effettuato il maggior numero di tiri nello specchio ha terminato la stagione addirittura in 15a posizione, ben 4 posizioni in meno della squadra che ha effettuato il maggior numero di tiri totali, anch’essa ben lontana dal podio (11a).
  • Non c’è sostanziale differenza (ai fini del raggiungimento del podio) tra tiri totali e tiri nello specchio: solamente nella stagione 2014 la squadra ad aver effettuato il maggior numero di tiri nello specchio è andata a podio, a differenza di quella che aveva effettuato più tiri totali (8a).

1C. CAMPIONE D’ITALIA E TIRI IN PORTA

Domande

  1. La squadra che vince il campionato risulta essere quella che ha effettuato più tiri totali?
  2. La squadra che vince il campionato risulta essere quella che ha effettuato più tiri nello specchio della porta?
  3. La squadra che vince il campionato risulta essere quella che ha effettuato più gol?
Figura 6: posizione della squadra campione d’Italia nella classifiche tiri totali, tiri nello specchio e numero di reti.

Il grafico in Figura 6 sintetizza le seguenti considerazioni:

  • nel 50% dei casi, la squadra campione d’Italia NON è stata nemmeno tra le prime 3 squadre per numero di tiri totali (linea blu).
  • nel 50% dei casi, la squadra campione d’Italia NON è stata nemmeno tra le prime 3 squadre per numero di tiri nello specchio (linea rossa).
  • nel 60% dei casi, la squadra campione d’Italia NON è risultata essere quella col migliore attacco.

CONCLUSIONE

Effettuare un numero notevole di tiri in porta non è necessariamente sintomatico di aver terminato il campionato sul podio, né tanto meno di aver vinto il torneo.


2. CENNI DI ANALISI STATISTICA

Arrigo Sacchi, foto tratta dal sito Sky Sport.

“Sembra che Sacchi si sia divertito ad annusare le attese della gente, ispirate a una logica elementare, e poi abbia deciso di agire in maniera nettamente diversa, talvolta sino a farsi dare del matto”.

Arrigo Sacchi, il padre del calcio italiano moderno.
(Candidò Cannavo, “Storia sentimentale dello sport italiano”)

Domanda

  1. Un’analisi dei big data sui tiri in porta può permettere una generalizzazione dei concetti precedenti?

Per generalizzare il concetto dedotto dall’analisi descrittiva proposta, è necessario effettuare una vera e propria inferenza statistica su un set di dati molto più grande. Attenzione alla differenza tra match analysis e data analysis.

Lo scopo della ormai famosa Match Analysis è quello di migliorare le prestazioni della squadra e del singolo atleta, attraverso l’analisi delle gare mediante supporto video, sfruttando inoltre strumenti statistici, arrivando a considerazioni tecnico-tattiche.

L’analisi dei dati in senso stretto (data science) riguarda l’inferenza statistica sui big data del calcio (esempio: inferenza sui celebri dati Opta)- Essa prevede una definizione differente: si parla di football data analysis.

Esempi di football data analysis:

Wylab: hub di sviluppo tecnologico legato al mondo dello sport (LINK DIRETTO).

Driblab: modelli statistici avanzati per la valutazione delle prestazioni e la rilevazione dei talenti (LINK DIRETTO).

Optasport: raccolta dei dati supportata da analisti in-stadio (LINK DIRETTO).

Una risposta alla nostra domanda iniziale può essere trovata nello studio “Quantifying the relation between performance and success in soccer” di Luca Pappalardo, (esperto di Computer Science, all’epoca all’Università di Pisa) e Paolo Cintia (esperto di IT del CNR) (LINK DIRETTO).

I due geniali ricercatori italiani hanno effettuato un’analisi su un insieme di dati enorme, condizione necessaria affinché le stime statistiche siano attendibili in senso assoluto. Essi hanno studiato 3 stagioni (2013-2015) dei primi 6 campionati del ranking UEFA: 6.396 gare con circa 10 milioni di singoli eventi (definiti come nel precedente paragrafo). Il numero di tiri risulta essere un ottimo indice di prestazione relativa, cioè pesata anche in base alla prestazione degli avversari.

In una regressione lineare con un ipotetico indice di successo, il coefficiente di determinazione risulta pari a R² =0.65. Traduco: i dati dello studio trovano un valore statistico all’asserto “più tiri, più vinci”.

I passaggi, invece, forniscono il miglior indice di prestazione assoluta, cioè basata sulle caratteristiche della singola squadra. Essi rappresentano il 72% del totale degli eventi di una gara di massima serie: essendo l’evento che occorre di più, il passaggio può fornire un indice del dominio.

I tiri in porta rappresentano solamente il 2.2% dei 1600 eventi attesi (in media): la declinazione del giuoco del calcio è tale da impedire una loro frequente occorrenza. Non solo: meno di 1/10 dei tiri si traduce in gol. Essendo un evento raro, l’efficienza del tiro riveste un fattore decisivo per l’esito della gara.

Se ne deduce che:

con una analisi statistica più precisa possiamo asserire che i tiri in porta risultano essere il miglior indice di prestazione relativa di una squadra di calcio.

CONCLUSIONE

  • La prestazione di una squadra può essere valutata in base ai tiri in porta effettuati, con una buona correlazione tra successi e numero di tiri (condizione necessaria).
  • Effettuare un elevato numero di tiri totali (o nello specchio) non garantisce statisticamente di vincere la competizione (condizione NON sufficiente).
  • È quindi necessario introdurre un indice di efficienza delle conclusioni a rete, in modo da comprendere se e come una conclusione possa portare al gol.


3. CENNI SUGLI “EXPECTED GOALS”

Tavola dei tiri e dei passaggi, statistiche di Charles Reep, 1962 (fonte: Optasports)

“Estrapolando questo dato [l’attaccante Swindon aveva effettuato 147 attacchi nel secondo tempo] e ipotizzando 280 attacchi a partita, con una media di 2 gol segnati, Reep si rese conto che ciò equivaleva a un tasso di fallimento del 99,29%. Un miglioramento del solo 0,71% per cento era necessario per ottenere una media di tre gol a partita”

Thorold Charles Reep, il padre dell’analisi statistica nel calcio.
(Jonathan Wilson , “Inverting the Pyramid: The History Of Football Tactics”)

Domanda

Esiste un indice statistico di immediata fruizione utile a capire se una squadra tira in porta in maniera efficace?

Uno degli studi più completi a riguardo è “An examination of expected goals and shot efficiency in soccer” (LINK DIRETTO). L’autore, Alex Rathke (Università di Limerick, Irlanda), ha parametrizzato l’efficienza dei tiri in porta attraverso la definizione di “expected goal”.

Per accennare al concetto, ho scelto lo studio di Paul Riley (LINK DIRETTO), il quale è stato tra i primi a fornire una definizione completa di “expected goals” (LINK DIRETTO).

L’espressione “expected goals” è traducibile semplicemente come “gol previsti”. Si tratta di attribuire una probabilità di successo ad ogni tiro, a seconda della posizione del campo dal quale esso viene effettuato. Riley è partito dall’idea che la probabilità di segnare non sia omogenea: essa dipende fortemente dalla distanza e dall’angolo dai quali si scaglia la conclusione e se esso viene effettuato in movimento o da calcio da fermo.

Effettuare 10 tiri nello specchio da 30 metri non è un buon indice di pericolosità, perché la probabilità di segnare dalla lunga distanza è, ovviamente, bassa. Non solo. Secondo il professor Jonathan T. Finnoff, anche gli “expected goals” sono incompleti perché, oltre alla posizione in campo, vanno considerate le caratteristiche del singolo calciatore.

Riley attribuisce, dunque, un peso a ogni tiro: probabilità di realizzare una rete dalla posizione dalla quale è stato scagliato. L’indice di “expected goal” è abbreviato in xG.

Un tiro effettuato su calcio di rigore, ad esempio, ha una probabilità molto alta di essere realizzato: xG=0.76 perché in base alle statistiche fino a ora studiate si ha il 76% di probabilità di segnare.

Sommando l’xG di ogni tiro, ottengo:

  • analisi a priori: il numero di reti che segnerei calciando dalle posizioni ipotizzate.
  • analisi a posteriori: il numero di reti che avrei dovuto segnare ottimizzando l’efficacia di tiro.

Esempio

Semplificando notevolmente il modello realmente usato, dividiamo il campo in 4 zone e studiamo la probabilità di segnare da ognuna di esse.

Figura 7: semplificazione del modello xG.
  • Zona1: centro dell’area, xG=0.70 perché statisticamente il 70% dei tiri nello specchio termina in rete.
  • Zona2: zona laterale dell’area, xG=0.50
  • Zona3: zona centrale fuori area, xG=0.20
  • Zona4: zona laterale fuori area, xG=0.10

Una squadra effettua 7 tiri totali, dei quali 5 nello specchio. Prima di tutto consideriamo solamente i tiri nello specchio della porta. Pesiamo ogni tiro con la probabilità di successo teorica (il nostro fattore xG): essa, come detto, dipende dalla posizione.

  • Tiro1 effettuato dalla Zona1: xG=0.70
  • Tiro2 effettuato dalla Zona1: xG=0.70
  • Tiro3 effettuato dalla Zona4: xG=0.20
  • Tiro4 effettuato dalla Zona3: xG=0.10
  • Tiro5 effettuato dalla Zona2: xG=0.50
  1. Totale xG=2.20
  2. La squadra avrebbe dovuto segnare 2 reti.


3A. EFFICIENZA DEI TIRI IN PORTA

Secondo il modello di Colin Trainor (LINK DIRETTO) per comprendere l’efficienza dei tiri, è sufficiente rapportare le reti segnate al fattore xG: in tal modo sto rapportando le reti effettivamente segnate con quelle che avrei dovuto segnare in base al concetto di xG, ovvero in base alla teorica pericolosità della posizione dalla quale sono stati effettuati i tiri.

Efficienza dei tiri

Et= Gol / xG

Questo indice va valutato con attenzione, non fornisce un dato assoluto sulla bontà delle nostre conclusioni a rete.

  1. Et=0, ovvero Gol=0.
    Efficienza nulla dato che non segnato nemmeno una rete.
  2. Et≃0, ovvero xG>>Gol
    Efficienza pessima, perché le occasioni da rete prodotte avevano una probabilità di essere concretizzate molto maggiore delle reti effettivamente segnate.
  3. E>>1, ovvero Gol>>xG
    Efficienza clamorosamente elevata, perché ho prodotto occasioni da rete che avevano una probabilità bassa di essere realizzate e invece ne sono stato capace.
  4. Et≃1 ovvero Gol≃xG
    Ottima efficienza, perché ho rispettato la probabilità di realizzare le occasioni da rete prodotte.

CONCLUSIONE

Per un elevato valore di xG, se il fattore di efficienza tende a 0 (cioè 0 reti), significa (ovviamente semplificando il discorso) che il problema risiede nell’esecuzione della conclusione, non nel creare occasioni.

Per migliorare l’efficienza di esecuzione è necessario studiare due aspetti:

  1. Meccanica del tiro in porta.
  2. Fluidodinamica del tiro in porta.

Questi saranno gli argomenti del secondo capitolo.

CONDIVIDI VIA SOCIAL