Magazine | Match Analysis | Scienza| Ricerche | Wired.it | Simone VALESINI

 

 

Ecco quello che i big data possono fare per il calcio

 

Valutare la performance dei giocatori, prevedere gli schemi degli avversari, scegliere gli atleti migliori da mettere in campo e pronosticare i risultati delle partite. È la promessa che arriva dalla data science, disciplina che negli ultimi anni sta facendo il suo ingresso nel calcio mondiale

 

Negli anni ’50, il ragioniere e appassionato di calcio Charles Reep iniziò ad annotare minuziosamente le statistiche delle partite di calcio cui assisteva.

Reep registrava sul suo taccuino passaggi, goal, falli, tempistiche, insomma tutti i dati che gli sembravano rilevanti, alla ricerca di schemi e pattern ricorrenti. 2.200 match più tardi, aveva scoperto qualcosa di interessante.

In media, i team inglesi segnavano un goal ogni 9 tiri in porta, l’80% delle reti avveniva in azioni con meno di quattro passaggi, e il 50% delle palle che finivano in porta era stata recuperata, e poi rilanciata, entro i 30 metri dalla propria linea di fondo.

 

Agli occhi analitici di Reep, il messaggio era chiaro: bisogna giocare di contropiede.

 

Nacque così la cosiddetta teoria della palla lunga, che ispirò per anni, con successi altalenanti, le strategie del calcio inglese. Se all’epoca la statistica si faceva a mano, oggi ci pensano però computer e reti neurali, e con risultati sorprendenti.

 

Ne sa qualcosa la Roma, che a detta del suo presidente, James Pallotta, deve in parte i suoi recenti successi alla partnership con un’azienda californiana specializzata in data science e analisi dei big data.

L’azienda in questione si chiama Tag.bio, una startup con base a in San Francisco, che è stata finanziata con 250mila dollari dalla Raptor Capital Management, il veicolo di investimento della famiglia Pallotta, lo stesso che controlla anche la As Roma.

Non è un caso quindi che il presidente abbia deciso di rivolgersi a loro.

 

E guardando ai recenti successi della sua squadra, sembra aver fatto un affare. Cosa faccia di preciso per la Roma il software americano non è chiaro (contattata da Wired, la società non ha voluto sbottonarsi), ma dal sito della Tag.bio scopriamo che si tratta di un sistema per applicare la data science al mondo del calcio.

 

Il software di Tag.bio dovrebbe sfruttare i big data calcistici per scoprire nuove giovani promesse, aiutare a scegliere la formazione migliore da mettere in campo, e soprattutto, prevedere le strategie delle squadre avversarie.

 

“Un po’ come in Moneyball”, per usare le parole con cui lo ha presentato lo stesso Pallotta.

In effetti, come racconta il film del 2011 diretto da Bennett Miller, per sport come il baseball, ma anche il basket, o il rugby, l’analisi dei dati e le statistiche sono all’ordine del giorno da decenni.

Diversa invece la situazione nel calcio, che paradossalmente è il primo sport in cui si è sviluppata l’analisi statistica, ma anche quello in cui questa disciplina ha trovato le resistenze maggiori.

 

Dopo le pionieristiche ricerche di Reep infatti, il mondo del pallone ha voltato completamente le spalle alla data analysis per un lungo periodo.

Le ragioni? Una certa resistenza da parte di allenatori ed esperti. Ma soprattutto: il calcio è uno sport estremamente complicato, almeno da prevedere.

 

Si corre, si passa la palla e si tira in porta per 90 minuti, ma alla fine in media sono un paio di azioni quelle che decidono la partita: quelle in cui si segna un gol.

In una partita di baseball ci sono decine di battute valide da analizzare, in una di basket dozzine di canestri, ma nel calcio conta solo mettere la palla in rete.

Un evento raro, imprevedibile e in qualche modo ineffabile: 50% talento, e 50% fortuna, assicurano gli esperti

 

Per questo la scienza dei dati ha impiegato molto più tempo a diffondersi nel mondo del pallone.

Ma oggi, con l’avvento dei big data e di computer con la potenza di calcolo necessaria per analizzarli, è impossibile ignorarne le potenzialità.

 

Negli ultimi anni infatti anche i team europei hanno iniziato ad affidarsi ad analisti e data scientist, e sono fiorite moltissime società dedicate alla raccolta e all’analisi dei dati calcistici. In Inghilterra per esempio c’è la Prozone, una realtà che fornisce servizi di raccolta e analisi dei dati e a cui si affidano 19 team su 20 nella Premier League.

 

Una delle realtà più importanti del settore però è italiana: si chiama Wyscout, nata in Liguria dall’intuizione di un gruppo di giovani ricercatori, e trasformatasi in meno di 10 anni in un colosso mondiale, con oltre 300 dipendenti, e sedi a Dakar e Sofia.

 

La società ligure fornisce raccolta e analisi di dati calcistici con una database di oltre 330mila giocatori, per i quali offre video e statistiche di tutte le azioni e di tutte le partite degli ultimi anni.

Oggi la utilizzano praticamente tutti i grandi team, i procuratori (che la utilizzano per scoprire le nuove promesse da portare nei campionati importanti) e gli stessi giocatori, che la usano per rivedere le proprie prestazioni, o per studiare l’avversario che incontreranno nella prossima partita.

 

Un’altra realtà simile è la Sap, multinazionale tedesca del software che realizza anche piattaforme di analisi dati pensate specificamente per il calcio: valutazione della prestazione e degli avversari, ma anche un’analisi del rischio personalizzata per ogni atleta che promette di diminuire gli infortuni.

A questa piattaforma, basata sul software Sap Hana, ha fatto ricorso la Germania per preparare la vittoria dell’ultimo mondiale.

 

Ultimo in ordine di tempo è il progetto di Bing, chiamato La passione per il calcio, che sfrutta un algoritmo di Microsoft per analizzare i risultati delle partite già giocate, incrociarli con le ricerche fatte dagli utenti di bing, e ottenere i pronostici per le prossime giornate del campionato.

 

Con questo sistema, l’algoritmo aveva azzeccato 15 pronostici sulle 16 partite della fase finale dei mondiali brasiliani. Uno dei progetti più ambiziosi in questo campo però è tutto italiano, e viene portato avanti proprio in questi mesi da due ricercatori del Kdd lab del Cnr di Pisa: Luca Pappalardo e Paolo Cintia (qui il loro blog). Il loro studio, svolto in collaborazione con la Northeastern University di Boston, punta a comprendere e modellare la performance sportiva, e parte dal calcio perché, a detta dei due giovani data scientist, è uno dei sistemi più complessi che si possano studiare.

 

Si tratta di un progetto in tre fasi. La prima riguarda la valutazione della performance dei giocatori: un po’ come fanno i giornalisti nelle tipiche pagelle del post partita, ma in modo scientifico e rigoroso, con algoritmi che analizzano i dati di ogni giocatore nel corso della partita e sfruttano la cosiddetta wisdom of the crowd, cioè l’opinione collettiva degli appassionati, che si può ricavare dal loro comportamento online (accessi alle pagine di wikipedia, commenti sui social, etc… ).

 

La seconda fase del progetto riguarda la previsione dei risultati di una partita a partire dall’analisi dei big data calcistici.

La terza ed ultima arriverà invece più avanti, al termine del progetto, ed è la più ambiziosa: mettere insieme le ricerche effettuate per sviluppare un modello di simulazione, con cui ricostruire in maniera virtuale lo svolgimento di una partita.

 

“Lo immaginiamo come un sistema astratto di potenziometri”, hanno spiegato a Wired i due ricercatori. “Inserendo le informazioni necessarie, i dati delle due squadre che si affrontano e dei loro giocatori, sarà in grado di simulare non solo il risultato, ma anche le azioni delle gara, la prestazione dei singoli giocatori, e così via. Ci vorranno anni di ricerca ovviamente, ma è una sfida affascinante: perché viene segnato un gol? Come? Sviluppare un modello di simulazione ci permetterebbe di rispondere a queste domande, e aiuterebbe a capire meglio tutti i sistemi complessi, come il calcio, che esistono in natura e nella società”.

 


Vai all'articolo originale nel sito Wired.it


Fonti: Wired.it
Foto copertina: (foto: UEFA via Getty Images)
Data inserimento nel sito: 30.03.2016

Magazine