Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti

Pagina creata da Luigi Miceli
 
CONTINUA A LEGGERE
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
il Gatto Di Schrödinger
NUMERO 15 - MAGGIO 2018   il   G iornale   di   D ivulgazione S cientifica   del GDS

                                         La Statistica
                                     nel campo di basket

                                  Tito Livio Burattini e
                                      l’invenzione
                                meravigliosa delli Pendoli
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
Editoriale

          Nel precedente editoriale, quasi con           analisi dei dati.
       vergogna, chiedevo umilmente scusa ai                Il secondo articolo è a cura del Prof.
       lettori per non essere riusciti a pubblicare il   Gianfranco Cisilino e ci riporta con la
       secondo numero del Gatto di Schrödinger           mente alla conferenza di Paolo Alessandrini
       del 2017 entro la fine dell’anno. Un’eresia       del “Dolomiti in Scienza 2016”, dato che
       per noi del GDS, così scientifici e               si parla di Tito Livio Burattini. Un articolo
       metodici! Con non poche difficoltà siamo          complementare al seminario di allora, che
       poi riusciti a pubblicare il numero 14 a          offre al lettore nuove informazioni sullo
       fine gennaio.                                     scienziato locale.
         È quindi con estremo piacere ed orgoglio          Se è vero che in questo numero abbiamo
       che scrivo questo quindicesimo editoriale         solo due articoli in senso stretto, è anche
       nei primi giorni di maggio, a tre mesi di         vero che abbiamo una lunghissima
       distanza dalla singolarità appena rievocata.      intervista al Prof. Roberto Natalini,
       Un ottimo lavoro di squadra, sotto la             matematico e direttore al CNR; il tutto a
       guida del nostro responsabile editoriale          cura di Paolo Alessandrini. Per la rubrica
       Paolo Alessandrini, ci ha permesso questo         Grandi della Scienza il nostro consigliere
       recupero che pareva inimmaginabile fino           Alex Casanova ci parla di Michael Faraday,
       a non molto tempo fa.                             un’ottima occasione per un ripasso della
         Un numero sicuramente speciale per la           sua conferenza tenuta il gennaio scorso.
       sua gestazione, ma soprattutto per i suoi           Completano l’opera la rubrica Gocce di
       contenuti; mi sentirei di dire un numero          Scienza e le curiosità sul numero 15, curate
       dedicato alla Statistica, dato il corposo         dal nostro Segretario Manolo Piat con la
       articolo riservato a questa disciplina e          collaborazione di Paolo Alessandrini.
       scritto a due mani dalla Prof.ssa Paola              Chiudo questo editoriale lanciando una
       Zuccolotto e dalla sua collega Prof.ssa           sfida a noi del GDS: siamo già a due numeri
       Marica Manisera dell’Università di Brescia.       nel 2018, perché non prepararne un terzo
       La genialità di questo contributo sta nella       per fine anno?
       declinazione della scienza statistica al gioco
       della pallacanestro; i lettori rimarranno
       sorpresi di quante informazioni si possono                            Il Presidente del GDS
       ottenere da una accurata e competente               		                   Dott. Fabiano Nart

2 - il Gatto Di Schrödinger
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
Indice

Curiosità sul Numero 15                                               4

Gocce di Scienza                                                      6

La Statistica nel campo di basket

   di Paola Zuccolotto e Marica Manisera				                         8

Tito Livio Burattini e l’invenzione meravigliosa delli Pendoli

   (parte prima) di Gianfranco Cisilino 						                       25

L’intervista a... Roberto Natalini 				                  		          28

Grandi della Scienza: Michael Faraday

   a cura di Alex Casanova                                           35

Informazioni utili                                                   37

                                                 NUMERO 15 - MAGGIO 2018 -   3
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
Curiosità sul Numero 15
                       a cura di Manolo Piat e Paolo Alessandrini

   Per la rubrica che svela alcune curiosità legate ai numeri
siamo arrivati al 15, proprio come 15 sono i “Gatti” finora
pubblicati. Andiamo quindi a scoprirle insieme, partendo
dalle proprietà matematiche.
   Il 15 è, ovviamente, un numero dispari. Tra i suoi divisori
(1, 3, 5, 15) non compare infatti il due. Dato che la somma
dei divisori (escluso lo stesso 15) è pari a 9, che è un numero
minore di15, si dice che 15 è un numero difettivo. Il 15 è
la somma dei primi cinque numeri naturali: 1+2+3+4+5; è
anche uguale a 20+21+22+23; ed è la somma dei tre numeri
primi consecutivi 3, 5 e 7. È anche un numero semiprimo,
poiché è il prodotto di due numeri primi (3 e 5).
                                                                                     Un quadrato magico 3 x 3
   È un numero triangolare, perché se prendiamo 15
oggetti possiamo disporli su una griglia regolare in modo         Un quadrato magico è una tabella quadrata nelle cui caselle
da formare un triangolo. Lo sanno bene i giocatori di             vengono inseriti numeri interi tutti diversi l’uno dall’altro,
biliardo americano, che all’avvio della partita dispongono        in modo tale che la somma dei numeri presenti in ogni
le 15 palle in forma di triangolo. Insieme al 21, il 15 forma     riga, in ogni colonna e in entrambe le diagonali, dia sempre
la più piccola coppia di numeri triangolari la cui differenza     lo stesso risultato, che viene chiamato “costante di magia”
e somma (6 e 36) sono anch’esse triangolari. Allo stesso          del quadrato.
modo, 15 è anche un numero esagonale.                                Il 15 è anche un numero delle successioni Tetranacci
   In teoria dei numeri, 15 è un numero idoneo, cioè un           e Tribonacci, varianti della più celebre successione di
numero naturale che non può essere espresso nella forma           Fibonacci. È anche un componente delle terne pitagoriche
ab+bc+ac, dove a, b e c sono interi positivi distinti. Ma è       (8, 15, 17), (9, 12, 15), (15, 20, 25), (15, 36, 39), (15,
anche un numero fortunato, ovvero un numero naturale              112, 113) ed è il più piccolo numero naturale appartenente
in un insieme generato da un “crivello” simile a quello di        a 5 terne.
Eratostene che genera numeri primi.                                  È inoltre un numero intero privo di quadrati, non
  Il 15 è la costante di magia di un quadrato magico 3 x 3.       essendo divisibile per alcun quadrato perfetto tranne 1.

4 - il Gatto Di Schrödinger                                                                   8 oremuN lus àtisoiruC
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
Curiosità sul Numero 15
                     a cura di Manolo Piat e Paolo Alessandrini

È un numero congruente, perché rappresenta l’area di un             Il premio Nobel per la chimica 2015 è stato assegnato allo
triangolo rettangolo che ha per lati tre numeri razionali.       svedese Tomas Lindahl, allo statunitense Paul Modrich e ad
                                                                 Aziz Sancar, con doppia cittadinanza turca e statunitense,
   In chimica, 15 è il numero atomico del fosforo (P),
                                                                 per gli studi che hanno effettuato sui meccanismi cellulari
elemento che contiene nel proprio nucleo 15 protoni.
                                                                 di riparazione del Dna.
15 è inoltre il numero di massa di un isotopo stabile
dell’azoto (15N) e degli isotopi instabili del carbonio (15C)
e dell’ossigeno (15O). Gli elementi del gruppo 15 della
tavola periodica (gruppo dell’azoto) sono anche chiamati
pnicogeni, termine che deriva dal greco e significa “che
provoca soffocamento”. Essi sono: azoto (N), fosforo (P),
arsenico (As), antimonio (Sb) e bismuto (Bi).
   In ambito astronomico troviamo il nostro numero 15
nella denominazione di alcuni corpi celesti. 15P/Finlay
è una cometa periodica del sistema solare; 15 Eunomia
è il nome di un asteroide battezzato così in onore di una
delle Ore, figlie di Zeus e di Temi nella mitologia greca;
infine NGC 15 è una galassia spirale della costellazione di
Pegaso.
   Il premio Nobel per la medicina 2015 è stato assegnato
a tre scienziati diversi. L’irlandese William C. Campbell
e il giapponese Satoshi Omura sono stati insigniti del
prestigioso premio per una nuova terapia contro le infezioni
causate da parassiti, e la scienziata cinese Tu Youyou per una
terapia antimalaria. Il premio Nobel per la fisica 2015 è                         La galassia a spirale NGC 15
stato assegnato al giapponese Takaaki Kajita e al canadese
Arthur B. McDonald. Il loro lavoro si è basato su uno
studio sperimentale delle oscillazioni dei neutrini, che ha
permesso di stabilirne per la prima volta la massa.

                                                                                          NUMERO 15 - MAGGIO 2018 -          5
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
Gocce Di Scienza
                                                a cura di Manolo Piat (GDS)

                                “Lo scoprire consiste nel vedere ciò che tutti hanno visto e nel pensare ciò che
                              nessuno ha pensato.” (Albert Szent-Györgyi, nella figura sotto)

                                 Un problema bizzarro sui numeri relativi. In un’aula ci sono 15 alunni,
                              durante l’intervallo ne escono 20; quanti alunni bisogna fare entrare perché la
                              classe sia vuota?

                                 La fissione nucleare è il fenomeno alla base dello sfruttamento dell’atomo
                              per ricavare la ben nota energia nucleare. Molti atomi, nella fattispecie quelli
                              molto pesanti, ad esempio l’uranio o il plutonio, sono per natura molto instabili
                              avendo al proprio interno un non esatto bilanciamento tra elettroni, protoni e
                              neutroni. Questo fa sì che se un proiettile, come una particella, impatta l’atomo
                              fissile, questo a causa della sua instabilità intrinseca si suddividerà in atomi figli
                              di dimensioni minori e stabili. Questo processo di rottura libera enormi quantità
                              di energia, ad esempio pochi chili di uranio equivalgono a migliaia di centrali a
                              carbone. Oppure, come tristemente sappiamo dalla storia, una bomba a fissione
                              nucleare può radere al suolo una metropoli.

6 - il Gatto Di Schrödinger
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
Gocce Di Scienza
                   a cura di Manolo Piat (GDS)

   “La teoria scientifica che più apprezzo è quella che afferma che gli anelli di Saturno
sono interamente composti dai bagagli persi dagli aerei.” (Mark Russell)

  Nel 1787, in una scuola elementare di Braunschweig, in Germania, al fine di
ottenere un po’ di quiete tra i turbolenti alunni, un insegnante assegnò loro un
compito: sommare tutti i primi cento numeri interi. Peccato che dietro a uno dei
banchi fosse seduto il futuro matematico Carl Friedrich Gauss (nell’immagine
sotto) che, dopo pochi secondi, diede il risultato corretto: 5.050. Non è chiaro
quale fu il metodo seguito, né, per la verità, se la vicenda si sia svolta davvero
così. È certo però che quel bambino prodigio non avrebbe in seguito deluso le
promesse!

   L’età delle rocce può essere espressa secondo due criteri. Si può parlare,
infatti, di un’età relativa, in base alla quale una roccia è definita più antica (o
più recente) rispetto ad un’altra roccia e si basa principalmente sui fossili e sui
rapporti geometrici tra i diversi corpi rocciosi. L’età assoluta, invece, espressa in
anni (o milioni di anni) si ottiene attraverso la datazione radiometrica: essa si
basa sul tempo di dimezzamento di alcuni isotopi radioattivi a lunga vita ed è la
principale fonte di informazioni sull’età della Terra e sulla velocità dell’evoluzione
delle specie viventi. Esistono vari metodi di datazione radiometrica, differenti
nella precisione della misura, nei costi e nelle scale temporali per le quali possono
essere utilizzati. I più conosciuti sono quelli basati sul 14C, sulla serie dell’U e
sui rapporti Rb-Sr. Attraverso i metodi di datazione assoluta si può affermare
che le rocce più antiche della crosta terrestre conosciute sino ad oggi si sono
formate oltre 4 miliardi di anni fa e che le più antiche forme di vita documentate
risalgono a circa 3,5 miliardi di anni fa.

                                                                                            NUMERO 15 - MAGGIO 2018 -   7
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
S TAT I S T I C A

La Statistica nel campo
di basket
Paola Zuccolotto e Marica Manisera (Università di Brescia)
La Statistica offre oggi numerose tecniche per analizzare i dati relativi alle gare sportive e
ricavarne informazioni preziose per supportare i tecnici nelle loro decisioni.

  1. S maiuscola, s minuscola                                       Di cosa parliamo allora? Della Statistica nel basket. E di
   Secondo il numero 33 dei Memphis Grizzlies, Marc              come fare in modo che sia uno strumento utile e non, come
Gasol, le statistiche stanno uccidendo il basket. Il gigante     teme Marc Gasol, un modo per ridurre il gioco a numeri che
spagnolo ha informato il mondo dello sport di questa sua         non lo rappresentano. Partiamo quindi dal modo sbagliato
opinione circa un anno fa, verso la fine della Regular Season    di intendere la Statistica. Prima di tutto, la stragrande
NBA 2016/2017, proprio quando, secondo le statistiche,           maggioranza delle persone crede che fare Statistica nel basket
aveva appena stabilito il record del primo Centro ad aver        significhi contare il numero di tiri, di canestri, di punti, di
messo a segno 300 assist, 100 canestri da tre punti e 100        assist, di palle perse… E d’altra parte è una semplificazione
stoppate in una sola stagione.                                   comprensibile: ogni giorno i media specializzati riportano
                                                                 notizie riguardanti queste cosiddette statistiche, rilevate
   Iniziamo questo nostro articolo sulla Statistica nel basket   nottetempo (per noi) nelle partite dell’NBA, e gli appassionati
fornendo in anteprima una rivelazione sconcertante:              si dilettano a scommettere su chi sarà il primo giocatore che
secondo noi Marc Gasol ha ragione. E speriamo che questa         supererà il record (attualmente di Klay Thompson) di 13
dichiarazione, resa da due esperte di Statistica, suoni quanto   canestri segnati in un solo quarto, senza errori. Ma queste
meno provocatoria.                                               statistiche (e volutamente continuiamo a scrivere il termine con
                                                                 l’iniziale minuscola, per distinguerlo dalla Statistica, che è la
                                                                 scienza di cui ci occupiamo), ha ragione Gasol, da sole dicono
                                                                 veramente poco. Per uno Statistico, questi sono semplicemente
                                                                 dei dati che, raccolti in grande quantità ed opportunamente
                                                                 rielaborati, potranno trasformarsi in informazione utile per
                                                                 supportare i tecnici nelle loro decisioni. Sicuramente valutare
                                                                 una performance solo sulla base di questi valori è non solo
                                                                 molto riduttivo, ma addirittura, in certi casi, fuorviante.
                                                                 Inoltre, pensiamo che il concetto che Marc Gasol ha cercato
                                                                 di far passare sia uno dei più cruciali: i media, con il loro
                                                                 solito fare sensazionalistico, sbandierano le statistiche come se
                                                                 fossero il termometro della bravura dei giocatori, decretando,
                                                                 anche attraverso queste, il loro successo di pubblico. Se
                                                                 continueranno a cercare per questa via la loro notizia da prima
                                                                 pagina, i giocatori prima o poi modificheranno il loro modo
                                                                 di giocare con l’obiettivo di tenere alte le statistiche. Con
                                                                 buona pace del gioco di squadra. E dell’unico vero obiettivo:
                                                                 vincere.
                                                                    In realtà l’opinione del giocatore spagnolo non si riduce a
                                                                 questo argomento, già di per sé fondamentale, ma investe un
                                                                 altro aspetto ancora più sottile: i numeri sono veramente in
                                                                 grado di descrivere il gioco? Come misurare aspetti come la
     Figura 1: Screenshot del sito www.slamonline.com, 14
                                                                 lettura di gioco di un playmaker, l’influenza di un leader sulla
                         aprile 2017
                                                                 fiducia della squadra, la coesione dei giocatori, il sacrificio

8 - il Gatto Di Schrödinger
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
S TAT I S T I C A
difensivo? Di certo non contando il numero di assist, di          genetica, fisica…) ma ovviamente non può essere anche
punti, di palle rubate. Non serve essere degli esperti per        un esperto di tutti i possibili campi di applicazione, così
capirlo. Su questo punto, inaspettatamente, la Statistica         come gli esperti dei campi di applicazione non possono
(quella con la S maiuscola) ha molto da dire perché vi            essere anche degli Statistici. Va da sé che in ogni settore lo
è una linea di ricerca ben sviluppata che si occupa dello         Statistico debba lavorare gomito a gomito con gli esperti,
studio delle variabili latenti, cioè di tutte quelle variabili    che hanno il compito di formulare le domande di ricerca,
che non sono concretamente e fisicamente misurabili. Gli          aiutare ad individuare i dati che contengono l’informazione
strumenti chiamati in causa da questi metodi sono tecniche        e ad interpretare i risultati ottenuti.
e algoritmi piuttosto sofisticati che gli Statistici però ben
                                                                     •      La Statistica da sola non fornisce decisioni, ma
conoscono. Quindi, se mai leggesse questo articolo (cosa
                                                                  supporto per le decisioni. Nessun algoritmo potrà mai
ahimè piuttosto improbabile), il grande Marc scoprirebbe
                                                                  sostituirsi al cervello umano nel momento in cui è necessario
che ha ragione lui: i fatti più importanti del basket non
                                                                  tirare le fila di tutte le evidenze emerse e formulare il giudizio
sono misurati dalle statistiche. Ma potrebbero venire
                                                                  finale. Questo perché solamente il cervello umano è in
misurati dalla Statistica (Manisera e Zuccolotto, 2017,
                                                                  grado di sintetizzare le informazioni raccolte, riunendo in
Statistica&Società).
                                                                  un’unica percezione quelle quantitative e quelle qualitative,
                                                                  allo stesso tempo tenendo conto di tutti gli elementi
  2. La Statistica: miti, leggende e luoghi comuni                imponderabili che, per quanti sforzi si facciano, sempre e
                                                                  comunque caratterizzano un problema.
   In occasione della prima Giornata Mondiale della
Statistica, il 20 ottobre 2010, l’Istat ha pubblicato una            •     Non c’è domanda a cui la Statistica non possa
raccolta di frasi celebri sulla “scienza del pollo di Trilussa”   rispondere se ha i dati giusti da analizzare. A volte questi
(Trilussa, 1871-1950, Le Poesie). Tutte decisamente               dati ci sono e bisogna solo trovare il modo di recuperarli.
divertenti, molte colgono nel vivo punti delicati, altre          A volte non ci sono, ma si può programmare un disegno
semplicemente scherzano sulle possibili errate interpretazioni    sperimentale con il quale iniziare a raccoglierli: in questo
dei risultati, alcune riflettono luoghi comuni e anche qualche    caso bisogna avere la pazienza di aspettare il tempo che
pregiudizio di sostanza. La verità è che la Statistica è una      serve perché i dati vengano generati. A volte non ci sono e
materia sconosciuta ai più, spesso ridotta ad affermazioni        raccoglierli può essere troppo difficile o troppo costoso: in
riguardanti semplici conteggi o percentuali o, giusto nei         questo caso si deve necessariamente scendere a compromessi
casi più fortunati, associata al calcolo delle probabilità. Ma    e modificare la domanda di ricerca.
molto raramente sono noti la sua vera accezione di “scienza         •     La Statistica non è una sfera di cristallo: non fornisce
che estrae informazione dai dati” e i suoi enormemente            certezze (diffidate di chi dice di essere in grado di farlo!)
ampi ambiti di applicazione (Zuccolotto, 2016, Il Gatto di        ma scenari verosimili e indicazioni strutturali di periodo
Schrödinger).                                                     medio-lungo.
  Allora, prima di proseguire vorremmo fissare alcuni                •     I risultati delle analisi statistiche sono tanto più
concetti chiave riguardanti la Statistica. Giusto per evitare     stabili e robusti quanto più grande è la mole di dati su cui si
malintesi.                                                        basano.
   •     La Statistica è una scienza che si occupa di estrarre       Pertanto la Statistica non ha alcuna ambizione di
informazione dai dati: a fronte di una domanda di ricerca,        sostituirsi agli esperti di basket, ma piuttosto ha l’obiettivo
raccoglie i dati che si presume contengano l’informazione         di supportarli nelle loro scelte e decisioni, cercando di dare
necessaria a fornire una risposta, li elabora e interpreta i      una risposta quantitativa alle domande che essi pongono.
risultati.                                                        Resta responsabilità degli esperti sintetizzare tutte le
   •     L’interpretazione   dei risultati è una fase             informazioni a loro disposizione, quelle qualitative, quelle
estremamente delicata. William Whyte Watt affermò nel             quantitative fornite dalla Statistica e quelle derivanti da
suo libro “An American Rhetoric” che non bisogna fidarsi          semplici loro sensazioni che, provenendo dall’esperienza,
di quello che la Statistica dice senza aver accuratamente         non sono meno importanti delle altre. In un interessante
considerato quello che non dice: i risultati delle analisi        servizio di Superquark del 2014 intitolato “La scienza nel
statistiche dipendono dalle ipotesi formulate e dai dati          pallone”, Mark Brunkhart – l’esperto di computer science
utilizzati, quindi non bisogna pretendere di estendere il         dei Los Angeles Galaxy – sottolinea che la statistica “non
loro significato al di là di questi confini, attribuendo loro     può prendersi il merito delle vittorie: è la squadra che vince...
conclusioni che non sono in grado di accreditare.                 però la statistica dà alle squadre un vantaggio. La prospettiva
                                                                  dell’allenatore è giusta al 90% ed è in quel 10% rimanente che
   •   Lo Statistico è uno scienziato che possiede gli
                                                                  matematica e statistica fanno la differenza”.
strumenti necessari a elaborare i dati relativi a qualunque
campo dello scibile umano (medicina, economia, finanza,             La Statistica non deve quindi diventare la pagella di

                                                                                              NUMERO 15 - MAGGIO 2018 -                9
Il Gatto Di Schrödinger - Tito Livio Burattini e La Statistica nel campo di basket - GDS Dolomiti
S TAT I S T I C A

                                                                                                         Figura 2: Il processo
                                                                                                           di Sport Analytics

 coach, squadre e giocatori, ma uno strumento al loro                  sono di conseguenza le procedure di registrazione. Talvolta
 servizio, con tutte le potenzialità e i limiti sopra evidenziati,     l’accesso a questi canali richiede competenze informatiche di
 per comprendere punti di forza e di debolezza.                        alto livello, come la conoscenza di procedure di webscraping,
                                                                       creazione di database relazionali, data warehousing.
   3. Il processo di Sports Analytics                                    Inoltre, i dataset possono avere diverse caratteristiche
                                                                       dal punto di vista di dimensione, varietà e velocità di
   Il processo di Sport Analytics si compone di 4 fasi (Figura
                                                                       aggiornamento, pertanto si va dalle piccole raccolte fino a
 2): reperimento e organizzazione dei dati, formulazione
                                                                       giungere ai veri e propri big data.
 della domanda di ricerca, sviluppo dei modelli e analisi dei
 dati, interpretazione dei risultati (Zuccolotto e Manisera,              Tra le varie tipologie di dati, troviamo primariamente
 2017, Scuola dello Sport).                                            quelli rilevati manualmente, con o senza strumenti
                                                                       informatici per l’annotazione. Appartengono a questa
                                                                       categoria le registrazioni dei singoli eventi durante le partite
   3.1 I dati                                                          (ad esempio i cosiddetti play-by-play delle partite di basket),
    Se i risultati delle analisi statistiche fossero una bella torta   le prime statistiche di base spesso presenti sui siti ufficiali
 fatta da un bravo pasticciere, i dati sarebbero gli ingredienti.      delle Federazioni, ma anche i resoconti compilati dai
 Sappiamo tutti che perché la torta sia buona è necessario             preparatori tecnici in occasione di sessioni di allenamento, i
 che il pasticciere utilizzi delle uova fresche, del burro             pareri e le valutazioni di esperti che possono essere affiancati
 di qualità… insomma che gli ingredienti siano di prima                ai dati derivanti dalle misurazioni. È curioso sottolineare
 scelta. Nello stesso modo, il livello qualitativo delle analisi       che le statistiche, quelle con la s minuscola di cui parla
 statistiche dipende in buona parte anche dalla bontà dei              Marc Gasol, appartengono a questa categoria. Significa
 dati che vengono utilizzati. Le procedure di reperimento e            che, contrariamente a quanto molti credono, esse non
 organizzazione dei dati devono essere strutturate e validate          sono la torta, ma soltanto uno dei suoi tanti ingredienti. E
 in modo da garantirne la qualità, intesa come esaustività             nemmeno quello principale.
 (presenza delle variabili di interesse per condurre le analisi           Una seconda tipologia di dati sono quelli rilevati mediante
 richieste), accuratezza (assenza o minimizzazione degli               dispositivi tecnologici, sempre più spesso utilizzati nel
 errori), completezza (assenza o eventuale trattamento                 training e nelle gare. Esempi sono le registrazioni effettuate
 dei missing data), consistenza (presenza di un cospicuo               tramite sensori GPS (che rilevano le posizioni degli atleti
 numero di osservazioni, necessarie per la robustezza delle            nell’area di gioco a intervalli di tempo dell’ordine dei
 analisi statistiche), accessibilità (possibilità di interrogare       millisecondi), i dati video provenienti da videocamere e
 il database estraendo di volta in volta le porzioni di dati           occhi di falco, le pedane e tutte le tecnologie di tipo wearable
 necessarie).                                                          che rilevano movimenti del corpo, posture, parametri vitali
   I dati si possono ricavare attraverso molteplici canali e varie     come pressione sanguigna e battito cardiaco.

10 - il Gatto Di Schrödinger
S TAT I S T I C A
  Ancora, una terza varietà di dati a disposizione delle          atleti individuali), identificazione dei fattori di successo e
analisi statistiche sono quelli provenienti da questionari        delle strategie di gioco ottimali, previsione, misurazione dei
psicometrici a cui possono venire sottoposti gli atleti,          tratti della personalità (mental toughness, coping strategies …),
per la valutazione di atteggiamenti e caratteristiche della       analisi di mercato per il marketing management sportivo,
personalità.                                                      analisi finanziaria...
   Infine, in una categoria residuale convergono tutte le
eterogenee classi di dati che possono integrare le analisi da       3.3 Analisi dei dati e interpretazione dei risultati
diverse prospettive, come, a titolo esemplificativo, i dati di
                                                                     Una volta formulata la domanda e reperiti i dati
analisi di mercato, i dati testuali ottenuti interrogando i
                                                                  necessari, entrano in gioco tecniche moderne e sofisticate,
Social Network (che possono servire ad esempio a misurare
                                                                  che includono modelli statistici, analisi multivariata,
il sentiment dei tifosi), i dati di Google Trends ed altri
                                                                  data mining (letteralmente: scavare nella montagna di
strumenti capaci di monitorare le ricerche in rete e la
                                                                  dati come un minatore in una miniera, alla ricerca delle
popolarità degli hashtag.
                                                                  informazioni), machine learning e algoritmi di intelligenza
                                                                  artificiale. Ci avvarremo, per indicare questa fase, del
  3.2 Le domande                                                  termine Data Science, oggi molto utilizzato per indicare
                                                                  l’attività svolta da chi (il Data Scientist, appunto) possiede
   “Potete giudicare quanto intelligente è un uomo dalle sue
                                                                  tutte le conoscenze metodologiche e computazionali per
risposte. Potete giudicare quanto è saggio dalle sue domande.”
                                                                  utilizzare in modo integrato i più moderni ed eterogenei
Queste parole, pronunciate dallo scrittore egiziano Naguib
                                                                  approcci di analisi dei dati (anche big) e interpretazione dei
Mahfouz, premio Nobel per la letteratura nel 1988,
                                                                  risultati. Sarà quindi compito del Data Scientist scegliere la
mettono l’accento in modo inequivocabile sull’essenza
                                                                  combinazione di strumenti più adatta al problema oggetto
dell’approccio scientifico allo studio della realtà. La ricerca
                                                                  di studio, implementarla a livello informatico, valutare
scientifica può procedere in varie direzioni: sarà la saggezza
                                                                  attentamente la robustezza dei risultati e, infine, esporli nel
del ricercatore ad individuare la direzione giusta e la sua
                                                                  modo più decifrabile possibile ai tecnici che inizialmente
intelligenza a condurlo fino alla risposta.
                                                                  avevano posto le domande. Quest’ultima operazione può
   Nel caso delle Sports Analytics, grazie alle sofisticate       avvantaggiarsi dell’utilizzo di tecniche di data visualization,
tecniche sapientemente applicate dallo Statistico, si giunge      di estrema utilità ai fini della comprensione dell’informazione
ad estrarre informazione e conoscenza dai dati. Questa è          contenuta nei dati.
l’intelligenza (dal latino intus = dentro e legere = leggere)
e non a caso ci si riferisce spesso ai metodi utilizzati con il
termine di intelligenza artificiale.                                4. Basketball Analytics
   Tuttavia, la conoscenza estratta in questo modo potrebbe          In questa sezione descriviamo brevemente alcuni esempi
rivelarsi null’altro che un’enorme perdita di tempo o un          di Statistica applicata al basket. Gli esempi sono tratti da
esercizio fine a sé stesso, se a guidarla non fosse la saggezza   studi pubblicati o in corso di pubblicazione nell’ambito
della domanda giusta.                                             delle attività di BDsports (Big Data analytics in sports), un
                                                                  progetto internazionale coordinato dalle autrici di questo
   Ecco perché il secondo passo del processo di Analytics
                                                                  articolo e incardinato nel Big&Open Data Innovation
consiste nel raccogliere le domande, provenienti
                                                                  Laboratory (BODaI-Lab) dell’Università di Brescia, di cui
preferibilmente dal mondo dello sport, quindi formulate da
                                                                  Paola Zuccolotto è direttore scientifico. BDsports (bodai.
persone che possiedono la conoscenza tecnica dei problemi
                                                                  unibs.it/bdsports) ha l’obiettivo di creare un network di
e sono in grado di suggerire linee di ricerca efficaci, cioè in
                                                                  esperti interessati alle analisi quantitative nell’ambito dello
grado di estrarre informazione utile dai dati. In mancanza di
                                                                  sport, mettendo in contatto il mondo accademico con chi
domande, il processo di analisi potrebbe portare a risultati
                                                                  si occupa di sport a vario titolo. I temi di ricerca affrontano
inservibili in quanto, ad esempio, scontati o non in linea
                                                                  con un approccio quantitativo le più svariate problematiche
con le necessità effettive. In questa fase diviene necessaria
                                                                  attinenti al mondo dello sport, come l’analisi delle
una stretta interazione tra lo Statistico e il tecnico.
                                                                  performance e delle strategie di gioco, lo studio dei dati
   In questa interazione tra esperti di competenze diverse,       rilevati con sensori e tecnologie wearable, le connessioni tra
ognuno dovrà progressivamente imparare a comunicare nel           sport e salute, la psicometria degli atleti, il management e
linguaggio degli altri, fino a formulare le domande corrette,     l’analisi di mercato per le società sportive. Le attività svolte
espresse in un modo comprensibile a tutti.                        all’interno del progetto coprono in modo integrato quattro
  I temi che possono essere coperti dalle domande sono i          canali di azione:
più svariati: analisi di una gara, un match, un torneo, un           •     la ricerca scientifica - proposta di nuove metodologie
campionato, analisi della performance (di squadre, giocatori,     di analisi e pubblicazione di articoli scientifici, organizzazione

                                                                                            NUMERO 15 - MAGGIO 2018 -             11
S TAT I S T I C A
di workshop, seminari, conferenze…                                   ben diversi, e spesso le linee di distinzione tra essi sono molto
   •    l’applicazione sul campo - collaborazione con team           sottili, quasi inesistenti. Ecco perché non ci si stupisce più di
di esperti e tecnici, per la risoluzione di problemi specifici,      vedere una squadra senza pivot in campo, oppure un portatore
                                                                     di palla che non sia necessariamente un playmaker”. Già negli
   •    la didattica - interventi nelle scuole e nelle università,   anni ’60 in NBA vi erano giocatori capaci di coprire diversi
predisposizione di materiale per esperimenti didattici con           ruoli, ma più recentemente hanno iniziato ad emergere dei
gruppi di lavoro (Zuccolotto e Manisera, 2016, Induzioni),           veri e propri ruoli aggiuntivi (sempre coach Manca cita, ad
stage per studenti presso società sportive, tesi di Laurea e         esempio, lo swingman, la combo-guard, l’ala-centro, l’ala
Dottorato di Ricerca…                                                pura, il point-forward), per rispecchiare modalità di gioco
  •     la divulgazione – pubblicazione di articoli su riviste       non etichettabili nei ruoli tradizionali.
di tipo divulgativo, partecipazione a eventi pubblici (La               Uno studio BDsports si è occupato di analizzare le
Notte Europea dei Ricercatori, StatisticAll…)                        statistiche di gioco del campionato NBA 2015-2016 per
   Il team conta ad oggi più di 50 partecipanti (si veda la          evidenziare l’esistenza di profili di gioco non classificabili
pagina «Team» del sito web), divisi in 4 sezioni a seconda del       nei ruoli tradizionali (Bianchi, Facchinetti, Zuccolotto,
tipo di competenza con cui partecipano al progetto (Data             2017, Electronic Journal of Applied Statistical Analysis).
Science, Sport Psychology, Technical Experts & Coaching, Sports         L’analisi ha riguardato 240 giocatori (per ogni squadra,
Analytics Services & Data Management, Sport Management,              gli 8 giocatori con il minutaggio più elevato) e ha preso
Marketing and Finance).                                              in considerazione 7 statistiche di gioco (medie per partita):
                                                                     rimbalzi totali (TRB), palle stoppate (BLK), assist (AST),
 4.1 I ruoli in campo: fotografia reale del basket                   palle rubate (STL), palle perse (TOV), falli personali (PF),
moderno o etichette anacronistiche?                                  punti segnati (PPG). L’individuazione dei profili di gioco
                                                                     è stata affidata ad algoritmi di cluster analysis, tecniche
   Nel 1891 il canadese James Naismith lavorava come                 statistiche in grado di suddividere un insieme di soggetti
insegnante presso la YMCA International Training School              in gruppi, detti cluster, con l’obiettivo di massimizzare la
di Springfield, nel Massachusetts, e gli venne chiesto di            coesione intra-cluster (cioè la similitudine tra i soggetti che
inventare qualcosa per tenere in allenamento i giocatori di          appartengono a un dato gruppo) e la separazione infra-cluster
baseball e football durante la stagione invernale. Fu così che       (cioè la diversità tra i profili dei soggetti che appartengono
nacque, con un regolamento molto stringato, due cesti di             a gruppi differenti).
vimini per le pesche e due squadre di nove giocatori, uno
dei giochi destinati a divenire tra i più popolari del mondo.           Nel caso in esame, l’obiettivo era definire un certo numero
Le regole del basket sono state più volte rimaneggiate. La           di gruppi di giocatori. I giocatori che appartengono a uno
prima a farlo fu Senda Berenson, che nel 1893 pensò bene             stesso gruppo sono caratterizzati da profili di gioco simili
che vi potessero giocare anche le donne. Da allora, come in          (dal punto di vista delle 7 statistiche considerate) e diversi
tutti gli altri sport, vi è stata una costante evoluzione, nei       rispetto ai profili di gioco dei giocatori che appartengono a
regolamenti e nelle modalità di gioco, che ha reso il basket         un gruppo differente.
uno sport molto differente da quello originariamente                   Il numero di gruppi da creare è un output stesso
inventato dal dottor Naismith. Basti pensare che la linea            dell’analisi, nel senso che non è una decisione presa a priori
del tiro da tre punti, con i profondi sconvolgimenti che             dal ricercatore.
comporta nelle strategie di gioco, è stata introdotta nel               Nella letteratura statistica esistono un gran numero di
basket internazionale solamente dal 1984.                            algoritmi di cluster analysis, ciascuno caratterizzato da
   In questo contesto è ovvio e universalmente riconosciuto          potenzialità e limiti. Bianchi, Facchinetti e Zuccolotto
che la tradizionale suddivisione in ruoli (il playmaker, regista     hanno proposto una strategia di applicazione congiunta di
del gioco; la guardia, di solito il giocatore con le migliori        una rete neurale detta Self-Organizing Map (SOM) e un
percentuali dal campo; l’ala piccola, che normalmente gioca          particolare algoritmo di clusterizzazione sfocata (fuzzy), al
sia dentro sia fuori del perimetro; l’ala grande, abile spalla a     fine di sfruttare le potenzialità di entrambi gli approcci. La
canestro, ma anche dalla media e lunga distanza; il centro,          SOM è una rete neurale artificiale ad apprendimento non
detto anche pivot, il “lungo” del quintetto, con il compito          supervisionato, che applica una regola di apprendimento
principale di difendere il ferro e catturare rimbalzi) possa in      competitiva basata sulla vicinanza dei soggetti nello spazio
qualche occasione perdere di significato. Come sottolineato          delle variabili (uno spazio di 7 dimensioni, in questo
da coach Giovanni Manca (www.basketinside.com, 26-27                 caso, visto che per ogni giocatore sono state considerate 7
maggio 2017), “il tempo cambia le cose, e questo è il motivo per     statistiche di gioco). Il risultato della SOM è la mappatura
cui ingabbiare la pallacanestro in queste sole cinque posizioni      dello spazio originario in un gran numero di punti di
sarebbe decisamente riduttivo: al giorno d’oggi i ruoli sono         riferimento e l’assegnazione dei giocatori al punto di

12 - il Gatto Di Schrödinger
S TAT I S T I C A
riferimento più vicino.                                             Tendenzialmente sono al di sotto della media per quanto
   Successivamente i punti di riferimento individuati dalla         riguarda rimbalzi e stoppate, poiché il loro punto di forza è
SOM per ciascun giocatore sono stati suddivisi in cluster. È        lontano dal canestro. Esempi di giocatori in questo cluster:
stato applicato a questo fine un algoritmo cosiddetto fuzzy,        Damian Lillard, Kyrie Irving, Dwyane Wade.
che assegna i soggetti ai vari gruppi attraverso la definizione       •     Scoring Rebounder (SR) – A questo cluster
di coefficienti di appartenenza. Se per un dato soggetto il         appartengono giocatori con statistiche medie elevate
coefficiente di appartenenza a un cluster è pari al 100%,           principalmente dal punto di vista dei punti segnati e dei
significa che tale soggetto ben si riconosce nel profilo            rimbalzi. Si tratta di giocatori particolarmente abili sotto
medio del cluster stesso. Viceversa, per soggetti con profili       canestro, anche in low-post, sia dal punto di vista offensivo
che si collocano in posizione intermedia tra diversi cluster,       che difensivo. Esempi di giocatori in questo cluster: Marc
si ottengono coefficienti di appartenenza, ad esempio, per il       Gasol, Carmelo Anthony, Karl-Anthony Towns, Anthony
20% ad un cluster e per l’80% ad un altro. La classificazione       Davis, Blake Griffin.
di questi soggetti si dice essere sfocata. Tale tipo di tecnica è
                                                                       •     Paint Protector (PP) – Punto di forza dei giocatori
risultata particolarmente utile nel caso di studio in oggetto,
                                                                    PP sono le eccellenti capacità difensive. In questo cluster
vista l’esistenza di diversi giocatori con caratteristiche
                                                                    infatti vi sono giocatori con medie particolarmente elevate
molto peculiari e difficilmente categorizzabili in un gruppo
                                                                    per rimbalzi, stoppate e palle rubate. Di solito svolgono
definito.
                                                                    una partita più atletica e giocano più vicino al canestro
   Dopo varie considerazioni, che hanno chiamato in causa           su entrambe le estremità del campo. Esempi di giocatori
anche valutazioni tecniche sui profili di gioco, oltre che          in questo cluster: DeAndre Jordan, Andrew Bogut, Steven
strettamente statistiche, sono stati definiti 5 cluster con le      Adams, Kenneth Faried.
caratteristiche illustrate di seguito:
                                                                      •     Role Player (RP) – A questo cluster appartengono
   •     All-Around All Star (AAS) - I giocatori appartenenti       giocatori che tendono ad avere performance elevate su una
a questa categoria sono eccezionali in molti aspetti del gioco,     variabile, restando sotto la media sulle altre. Si tratta di
con statistiche significativamente più alte delle medie della       giocatori molto specializzati, che possono essere utilizzati
Lega nella maggior parte delle variabili. I giocatori AAS           per potenziare in modo puntuale una data abilità di squadra.
possono fare la differenza per le loro squadre in molti modi        Esempi di giocatori in questo cluster: Marco Belinelli, J.J.
diversi. Di solito segnano un gran numero di punti, ma              Redick, Harrison Barnes, Jabari Parker, Avery Bradley.
presentano contemporaneamente grandi abilità anche su
altre fasi di gioco, come il passaggio, i rimbalzi, la difesa.
Esempi di giocatori in questo cluster: LeBron James, Kevin            I cluster descritti individuano profili di gioco medi. La
Durant, Paul George, Stephen Curry, James Harden.                   procedura fuzzy in realtà consente di effettuare valutazioni
                                                                    più puntuali relativamente ai giocatori singoli.
   •     Scoring Backcourt (SB) - I giocatori SB sono
caratterizzati da notevoli capacità offensive. Hanno                  A titolo di esempio, possiamo riportare il confronto tra
statistiche elevate dal lato dei punti segnati, ma di solito        Damian Lillard e DeAndre Jordan, che presentano due
combinano a questo anche buone capacità di passaggio.               profili di gioco molto differenti (Figura 3).

                                                                                                           Figura 3: Statistiche
                                                                                                         di Damian Lillard e
                                                                                                           DeAndre Jordan

                                                                                            NUMERO 15 - MAGGIO 2018 -              13
S TAT I S T I C A

     Figura 4: Rappresentazione bidimensionale (tramite MultiDimensional Scaling) dello spazio risultante dalla SOM
                        e individuazione della posizione di Damian Lillard e DeAndre Jordan

   I due giocatori sono stati mappati dalla SOM in punti            molto chiara dall’osservazione dei grafici radiali riportati in
molto distanti l’uno dall’altro (Figura 4, sui bordi superiore      Figura 6.
e inferiore dell’area centrale della mappa), il che riflette la        La ricerca qui presentata è tuttora in corso di
grande differenza tra i loro profili statistici, dovuta ai loro     approfondimento, in quanto l’acquisizione di nuovi dati
diversi modi di giocare.                                            relativi ai campionati successivi può contribuire a rendere i
   Ciò è confermato anche da valori molto bassi dei                 risultati più robusti o a correggere le inevitabili inesattezze.
coefficienti di appartenenza reciproci (la misura in cui            Inoltre è possibile rendere l’analisi dinamica al fine di
ciascun giocatore può essere considerato appartenente al            monitorare l’evoluzione nel tempo di profili e modalità di
cluster dell’altro) assegnati dalla procedura di clusterizzazione   gioco. Infine, è necessario sottolineare che i cluster ottenuti
fuzzy: 18% e 11% per Lillard e Jordan, rispettivamente.             sono relativi ai 240 giocatori analizzati, quindi ripetendo
                                                                    l’analisi su altri giocatori (magari provenienti da campionati
   Sebbene abbia un moderato coefficiente di appartenenza           profondamente diversi da quello NBA) è molto verosimile
al cluster RP (23%), Lillard è indubbiamente assegnato alla         che i risultati cambino. La potenzialità dell’utilizzo di
categoria SB, con un coefficiente pari al 58%. Infatti, è un        tecniche statistiche per individuare i nuovi ruoli sta proprio
giocatore che può segnare punti in modo significativo e             nella capacità degli algoritmi di fornire risultati che si
generare molti assist. Gioca lontano dal canestro e ha bassi        adattano in maniera spontanea ai dati analizzati, senza
valori nei rimbalzi e nelle stoppate.                               necessariamente inquadrare in griglie statiche situazioni
   Dall’altro lato, Jordan è assegnato, con un alto coefficiente    estremamente diverse tra loro.
di appartenenza (72%) al ruolo PP, che lo caratterizza come
giocatore in grado di proteggere efficacemente il canestro.
                                                                      4.2 Giocatori clutch e giocatori choke
   A questo punto diviene particolarmente interessante
esplorare la zona di mappa compresa tra i punti a cui sono            Black Mamba, questo il noto soprannome di Kobe
stati assegnati Lillard e Jordan. In questa zona troviamo ad        Bryant, era il killer letale che nessuno avrebbe voluto
esempio, procedendo dal basso verso l’alto, Karl-Anthony            incontrare nei finali di partita. 733 sono i tiri decisivi che
Towns e Carmelo Anthony (Figura 5).                                 ha segnato nella sua carriera. Ma cosa significa essere un
                                                                    giocatore clutch? È sufficiente contare il numero di canestri
 L’evoluzione dei profili di gioco che accompagna il                che hanno deciso all’ultimo secondo le sorti della partita?
movimento lungo lo spazio mappato dalla SOM appare                  Beh – obietterete voi (giustamente) – bisogna vedere anche

14 - il Gatto Di Schrödinger
S TAT I S T I C A

     Figura 5: Rappresentazione bidimensionale (tramite MultiDimensional Scaling) dello spazio risultante dalla SOM
     e individuazione della posizione di Damian Lillard, DeAndre Jordan, Karl-Anthony Towns e Carmelo Anthony

      Figura 6: Grafici radiali di Damian Lillard, DeAndre Jordan, Karl-Anthony Towns e Carmelo Anthony relativamente
                                                    alle 7 statistiche di gioco

quanti ne ha sbagliati. Ma non è tutto qui. Non si può          of Sports Science & Coaching). L’idea di base è che se una
dimenticare coach Jimmy McGinty (Gene Hackman)                  data situazione di gioco fa registrare stabilmente percentuali
quando, nel film “Le Riserve”, dice al quarterback Shane        di successo inferiori a un’altra, esiste qualche fattore che
Falco (Keanu Reeves) che “un vincente vuole sempre la palla     determina tale differenza. Tra i fattori possibili, ve ne sono
quando la partita è sul filo”… Quindi conta anche capire se     alcuni di tipo tecnico (maggiore pressione difensiva) e altri
il giocatore cerca il tiro nei momenti delicati o preferisce    di tipo psicologico. Riunendo queste possibili cause (pur
lasciarlo ai compagni. Inoltre, quali sono le situazioni        eterogenee) nell’unica accezione di “situazione di gioco
nelle quali il giocatore è sottoposto a particolare pressione   caratterizzata da elevata pressione”, è possibile isolare i
psicologica? Di certo non solo il finale di partita. Insomma,   momenti in cui tali situazioni si presentano. Lo studio,
la questione è decisamente complessa.                           pubblicato in una prestigiosa rivista internazionale, aveva
   Un altro studio BDsports ha tentato di rispondere a tutte    l’obiettivo prima di tutto di individuare quali fossero
queste domande analizzando quasi centomila tiri a canestro      le situazioni ad elevata pressione, poi fornire una misura
e valutando la variazione di performance in corrispondenza      dell’abilità dei giocatori in questi momenti. Il punto di
delle situazioni di gioco in cui sono avvenuti (Zuccolotto      partenza per isolare le situazioni delicate è stato il giudizio di
P., Manisera M., Sandri M., 2018, International Journal         esperti del settore, che hanno fornito una prima indicazione

                                                                                          NUMERO 15 - MAGGIO 2018 -             15
S TAT I S T I C A

riguardo le variabili su cui fosse preferibile puntare la lente     tiri a canestro). L’analisi è stata svolta per i due dataset
d’ingrandimento. Successivamente, l’identificazione è               separatamente, al fine di confrontare i risultati.
stata affinata grazie all’utilizzo di algoritmi di intelligenza        Secondo il giudizio degli esperti, le situazioni che possono
artificiale detti alberi di regressione e classificazione (CART),   generare elevata pressone sul giocatore al momento del tiro,
che hanno consentito di individuare, all’interno del                sono riconducibili a 5 momenti principali: (1) quando
framework precedentemente definito, le situazioni di gioco          il tiro è effettuato vicino allo scadere dei 24 secondi, (2)
che presentano le più significative variazioni di performance.      quando il margine di punti rispetto all’avversario è ridotto,
I dati analizzati sono stati tutti i tiri a canestro effettuati     (3) quando la squadra si trova in un momento di difficoltà,
durante due campionati ben diversi per tipologia e livello          (4) quando il giocatore che sta tirando ha sbagliato il suo
professionale: il campionato di serie A2 italiano 2016/2017         tiro precedente, (5) quando il quarto o il match sta per
(480 partite, un totale di 438 giocatori coinvolti, 69688           terminare. Analisi preliminari con tecniche di regressione
tiri a canestro) e le Olimpiadi di Rio de Janeiro dell’agosto       non-parametrica hanno confermato alcune di queste
2016 (38 partite, un totale di 144 giocatori coinvolti, 6470        indicazioni. In particolare, è stato rilevato un forte effetto

                                                                                                                      Figura 7:
                                                                                                                Andamento della
                                                                                                                  probabilità di
                                                                                                                 successo dei tiri
                                                                                                                 in funzione del
                                                                                                                 cronometro dei
                                                                                                                   24 secondi

   In Figura 7 sono mostrati gli andamenti delle probabilità        probabilità all’inizio dell’azione. Questo è probabilmente
stimate di successo dei tiri (con un intervallo di tolleranza       dovuto al fatto che non si tratta di tiri in contropiede (è
definito con tecniche cosiddette bootstrap), separatamente          molto difficile che un giocatore in contropiede decida di
per i tiri da 2 (pannelli di sinistra) e 3 (pannelli di destra)     fermarsi e tirare da oltre la linea dei 3 punti), ma di tiri
punti, nonché per il campionato di serie A2 (grafici blu) e il      tentati allo scadere del tempo complessivo di gioco. Le linee
Torneo Olimpico (grafici verdi). Appare immediatamente              grigie indicano la densità di tiro e mostrano che la maggior
evidente la similitudine dei risultati ottenuti con i due           frequenza è tra 12 e 8 secondi allo scadere.
dataset. Per i tiri da 2 punti, vi è un andamento nettamente
decrescente al diminuire del tempo disponibile. I tiri                 In una seconda fase, la tecnica statistica denominata
effettuati all’inizio dei 24 secondi (normalmente tiri in           CART è stata utilizzata per delineare con maggior dettaglio
contropiede) hanno una probabilità di successo superiore al         le situazioni più delicate e definire la probabilità di successo
60%, mentre i tiri degli ultimi secondi di poco superiore al        dei tiri in tali circostanze. Per quanto attiene al primo
40%. Leggermente diversa la situazione per i tiri da 3 punti,       punto, le situazioni da monitorare sono risultate essere
dove è confermata la diminuita probabilità di successo vicino       quelle riportate in Tabella 1, con risultati sostanzialmente
allo scadere del tempo, ma si riscontra anche una bassa             analoghi sui due dataset considerati.

16 - il Gatto Di Schrödinger
S TAT I S T I C A

           Tabella 1: Situazioni con alterata probabilità di successo dei tiri a canestro, identificate tramite CART

  Riguardo il secondo punto, sempre tramite la tecnica         situazioni che l’algoritmo ha isolato, talvolta in interazione
CART, è stato ottenuto un albero in grado di stimare le        tra loro, separatamente per i tiri da 2 e 3 punti e per i tiri
diverse probabilità di successo in corrispondenza delle        liberi (Figura 8).

                   Figura 8: Situazioni con modificata probabilità di successo (Campionato A2 italiano)

                                                                                       NUMERO 15 - MAGGIO 2018 -           17
S TAT I S T I C A

  L’albero propone bipartizioni successive.                         determinata dal fatto che vi sia stato un reset del cronometro
   In corrispondenza di ogni bipartizione è indicata la             ai 14 secondi (probabilità di successo 60.35%) oppure
variabile che la genera e le modalità che caratterizzano il         no (probabilità di successo 46.78% e 55.01% a seconda
ramo di sinistra. Quindi, ad esempio, la prima bipartizione         della differenza di punti rispetto all’avversario). Situazione
viene effettuata a seconda del tipo di tiro: nel ramo di sinistra   analoga anche se meno complessa per i tiri da 3 punti, che
vengono raggruppati i tiri da 2 e 3 punti (2P;3P), nel ramo         hanno una probabilità di successo che varia da 29.39% nel
di destra i tiri liberi. Scendendo nel ramo di destra (quindi       caso di tiri negli ultimi 2 secondi dell’azione al 38.44% per
limitatamente ai tiri liberi), si trova che vi è una differente     i tiri effettuati nei primi 500 secondi di ogni quarto, con il
probabilità di successo a seconda della riuscita o meno del         cronometro di azione tra 10 e 17 secondi. Interessante notare
tiro precedente dello stesso giocatore: probabilità di successo     che negli ultimi 100 secondi di ogni quarto la probabilità si
pari a 74.81% se il tiro precedente ha segnato canestro             attesta ad un valore apprezzabilmente più basso (31.19%).
(Made) e 71.15% se il tiro precedente è stato sbagliato.            I risultati presentati in Figura 10 sono relativi ai dati del
Scendendo nel ramo dei tiri da 2 e 3 punti, la bipartizione         Campionato A2 italiano, ma l’analisi del Torneo Olimpico
successiva separa ulteriormente le due tipologie di tiri. Per i     conduce a conclusioni sostanzialmente analoghe.
tiri da 2 punti (ramo di sinistra), le probabilità di successo         L’ultima fase di analisi è stata dedicata alla valutazione
vanno da un minimo di 40.86% (tiri effettuati negli                 delle performance dei singoli giocatori nelle situazioni
ultimi 2 secondi dell’azione) a un massimo di 65.8% (tiri           di alta pressione. Per ogni situazione selezionata è stato
effettuati entro i primi 8 secondi dell’azione). Interessante       possibile produrre un grafico sul genere di quello presentato
notare che per i tiri di tipo early-middle (cronometro tra          a scopo esemplificativo in Figura 9, relativo ai soli tiri da 2
10 e 17 secondi) vi è una notevole differenza di probabilità        punti e alla situazione in cui il tiro avviene negli ultimi 2

          Figura 9: Abilità dei giocatori nei tiri tentati negli ultimi 2 secondi dell’azione (Campionato A2 italiano)

     Il grafico riporta sull’asse orizzontale l’abilità dei         nella situazione in analisi e di colore associato alla sua
  giocatori nei tiri da due punti, standardizzata in modo che       propensione a tirare nella situazione stessa (colore rosso: il
  lo zero indichi l’abilità media dei giocatori del campionato      giocatore prende il rischio di tirare, colore blu: il giocatore
  analizzato. Sull’asse verticale è registrata la differenza di     tende a evitare il tiro nella situazione analizzata). Sono
  performance nella situazione di alta pressione analizzata         riportati nel grafico solo i giocatori che hanno effettuato
  (tiro negli ultimi 2 secondi) rispetto alla performance           almeno 20 tiri del tipo analizzato. Quindi, ad esempio,
  media del giocatore. Ogni giocatore è indicato sul grafico        Andrew Joseph Pacher ha un’abilità superiore alla media
  con una bolla di ampiezza pari al numero di tiri effettuati       nei tiri da due punti, ha tentato all’incirca tra 30 e 40

18 - il Gatto Di Schrödinger
S TAT I S T I C A

tiri negli ultimi due secondi dell’azione, registrando un           Corrispondentemente, un canestro sbagliato penalizza
ulteriore miglioramento della sua performance in questa             tanto più la misura di performance quanto più elevata era
circostanza. Tuttavia ha una propensione al tiro piuttosto          la probabilità di successo associata al momento in cui il tiro
bassa. David Brkic ha un’abilità elevata che, però, risente di      è stato effettuato. Le misure, corrette in questo modo per
un peggioramento quando il tiro è effettuato negli ultimi           tenere conto delle situazioni di alta pressione, ottenute per
2 secondi dell’azione. La sua propensione al tiro in questa         i giocatori del Torneo Olimpico (limitatamente a quelli che
circostanza è elevata.                                              hanno effettuato almeno 100 tiri a canestro) sono visualizzate
   Infine l’articolo propone una nuova misura complessiva           in Figura 10, dove troviamo l’abilità nei tiri da 2 e 3 punti
di abilità dei giocatori al tiro, che tiene conto della             negli assi orizzontale e verticale rispettivamente. I giocatori
situazione in cui il tiro viene tentato. Nella misura proposta      sono indicati nel grafico come bolle di ampiezza pari al
dagli autori, ogni successo o insuccesso è pesato in modo           numero di tiri tentati e colore proporzionale all’abilità nei
differente a seconda della situazione in cui il tiro si è svolto.   tiri liberi. Quindi, ad esempio, Kevin Durant ha manifestato
Pertanto, un canestro riuscito in un momento in cui la              durante il Torneo Olimpico un’eccezionale abilità nei tiri da
probabilità di successo era bassa perché si trattava di una         3 punti. Molto buona la performance nei tiri liberi, di poco
situazione di elevata pressione, viene pesato maggiormente          sopra alle attese medie quella nei tiri da 2 punti.
di un canestro riuscito in una situazione di gioco normale.

                                                                                             Figura 10: Misure corrette di abilità
                                                                                          dei giocatori al tiro (Torneo Olimpico)

  4.3 Alti e bassi                                                  sono concentrate invece sulla variabilità delle prestazioni
   Nella misurazione delle variabili latenti, bisogna prima di      nel tempo. In particolare, secondo taluni autori, gli alti
tutto identificare con chiarezza che cosa si sta misurando. Tale    e bassi nelle prestazioni non devono essere trattati come
puntualizzazione, che può sembrare a prima vista un’ovvietà,        fluttuazioni casuali, ma meritano un’analisi separata che
deve essere tenuta in grande considerazione. Nel caso in cui        richiami l’attenzione anche sulle differenze intra-individuali
la variabile latente da misurare sia la performance sportiva,       e sugli effetti che la squadra esercita sull’andamento delle
diversi studi psicologici hanno evidenziato che tale aspetto        fluttuazioni stesse. Anche restringendo l’attenzione alla
può fare riferimento a una molteplicità di concetti differenti,     sola performance nel tiro, è ben noto che i giocatori sono
come ad esempio quello di performance massima (cosa una             soggetti a variabilità nelle prestazioni. Nel gergo sportivo si
individuo può fare), da affiancare a quello di performance          usa spesso il termine hot hand (mano calda) per indicare lo
tipica (cosa un individuo farà). Alcune linee di ricerca si         stato in cui un giocatore tende a centrare molti più canestri

                                                                                            NUMERO 15 - MAGGIO 2018 -            19
Puoi anche leggere