Apologia della ragione scientifica - II: strumenti per decidere - Mondo Digitale

Pagina creata da Serena Pellegrino
 
CONTINUA A LEGGERE
Apologia della ragione scientifica - II: strumenti per decidere - Mondo Digitale
Apologia della ragione scientifica - II:
             strumenti per decidere

                                  Angelo Luvison

     Sommario. Svariati Paesi, inclusa l’Italia, si trovano a fronteggiare
     tempi duri e scenari complessi. La società civile sembra scossa da
     fenomeni di caos ed esclusione – fra cui il famigerato digital divide –
     molte economie sono in recessione, moltissimi giovani sono
     classificati come NEET (Not [engaged] in Education, Employment or
     Training), ecc. La soluzione alla crisi non si trova in ricette pronte
     all’uso; è necessario piuttosto focalizzarsi su: ricerca e innovazione,
     formazione e istruzione scientifiche d’eccellenza, nonché sullo
     sviluppo delle conoscenze relative. Le basi si trovano in strumenti
     quali: razionalità scientifica, probabilità e statistica bayesiana,
     pensiero logico. Nel nostro Paese, questo compito non è facile, ma
     dovremmo almeno tentare. L’articolo mostra diversi significativi
     esempi del cosiddetto “pensiero scientifico critico”, sempre più
     richiesto da aziende high tech per le nuove posizioni di lavoro – si
     pensi anche ai big data – derivate da ICT, smart grid, green economy,
     advanced manufacturing, ecc.

     Abstract. Today, a number of countries, Italy included, are facing
     very hard times. The social living leans towards chaos and exclusion
     – let alone the notorious digital divide – many economies have
     already plummeted, a high percentage of young persons belongs to
     the NEET (Not [engaged] in Education, Employment or Training)
     group, and so on. The solution cannot be based on ready-to-use
     recipes. Instead, a long-term strategy is needed to focus on: research
     and innovation; scientific training and education of excellence; and,
     therefore, development of the ensuing skills. The basis for that lies in
     the ability to master tools such as: scientific reasoning, probability and
     Bayesian statistics, mathematical logic. A task not at all easy in our
     country, but we should at least try. The paper shows a few meaningful
     examples of the so-called “scientific critical thinking”, increasingly
     required by high-tech companies, especially for the new jobs – think
     of big data – e.g., from ICT, smart grid, green economy and advanced
     manufacturing.

Keywords: Problem solving, Mathematical oddities, Ubiquitous Euler’s e,
Benford’s law, Analytics
Apologia della ragione scientifica - II: strumenti per decidere - Mondo Digitale
Apologia della ragione scientifica - II: strumenti per decidere

1. Introduzione

                              La matematica è la porta e la chiave delle scienze.
     Trascurare la matematica è un’offesa al sapere, poiché chi la ignora non può
                                   conoscere le altre scienze o le cose del mondo
                                                                  Ruggero Bacone

La cultura tecnico-scientifica italiana negli ultimi decenni non sembra godere di
grande prestigio, e spesso neppure di buona cittadinanza, presso i non addetti
ai lavori. È l’effetto dell’ostilità all’educazione scientifica radicata nella tradizione
italiana, a partire da personalità pur notevoli come Benedetto Croce e Giovanni
Gentile – avversari in politica ma con radici filosofiche comuni – in poi.
Incancellabile dalla memoria è, ad esempio, l’episodio (1911) in cui Croce
sbeffeggia il grande matematico ed epistemologo Federigo Enriques come
dilettante incompetente in campo filosofico, oltre a qualificarlo di “ingegno
minuto”, caratteristica che sarebbe comune a tutti gli scienziati.
Le motivazioni e le conseguenze di questa polarizzazione della cultura italiana
hanno per effetto la ricerca della contrapposizione, anziché di un rapporto
armonico che riconosca la fondamentale unità dei saperi. Unità intesa non in
modo retorico o ingenuo, bensì rispettosa dello statuto epistemologico
individuale di ogni scienza metodologicamente fondata.
Scienza e ragione, fra l’altro, sono fortemente connesse in quanto la scienza è lo
sviluppo culminante del pensiero razionale. Un esempio della scarsa influenza
nella politica e nella società di scienza e ragione è il caso “stamina”: nemmeno
l’unanime appello del mondo scientifico biomedicale, guidato dalla senatrice a
vita Elena Cattaneo, contro questa ingannevole ricetta per una malattia
gravissima ha tuttora convinto larghi strati dell’opinione pubblica, del sistema
politico, del mondo giudiziario.
Altri temi sui quali, soprattutto in Italia, l’irrazionalità si esprime ai massimi livelli
sono quelli affini delle biotecnologie, dell’ingegneria genetica e, soprattutto,
degli OGM (Organismi Geneticamente Modificati) in agricoltura (cibo e
coltivazioni). Sorprende la disinformazione mediatica capeggiata da gastronomi,
agronomi e associazioni di consumatori “bio”, fomentati da pensatori modesti
ma egregi uomini d’affari ed eccellenti imprenditori di sé stessi. Tutti costoro,
seguaci di una “sociologia naïf”, oltre che di mass media e talk show, godono
del supporto ideologico ispirato da guru internazionali. Fra questi ultimi,
un’attivista politica e ambientalista indiana è abituale frequentatrice di
programmi televisivi, durante i quali i suoi strali si appuntano, in particolare, sul
golden rice, un riso GM-modificato, che invece potrebbe fare un gran bene
all’infanzia nelle aree più povere e depresse del mondo. Risulta che tale filosofa-
ambientalista sia anche consulente di istituzioni pubbliche. Al contrario, le
argomentazioni sostenute da studiosi seri e competenti – fra i quali Gilberto
Corbellini, Dario Bressanini, Antonio Pascale – hanno scarsa presa sull’opinione
pubblica prigioniera di credenze ingannevoli. Per una visione scientifica e

                                                                                             2
Mondo Digitale                                                           Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

documentata dell’intera questione, senza nulla concedere alla retorica o ai
pregiudizi, si rinvia agli articoli, ancora della senatrice Cattaneo, usciti su Il Sole
24 Ore nel luglio 2014.
Parafrasando Francisco Goya, questi e altri casi ci parlano, quale più quale
meno, di una ragione dormiente che partorisce mostri. In molte occasioni, gli
scienziati sembrano costituire, invece, il bersaglio prediletto di buona parte dei
media e degli opinion maker.
Svariati Paesi, inclusa l’Italia, si trovano a fronteggiare tempi duri e scenari
complessi. La società civile sembra scossa da fenomeni di caos ed esclusione
– fra cui il famigerato digital divide – molte economie sono in recessione,
moltissimi giovani sono classificati come NEET (Not [engaged] in Education,
Employment or Training), ecc. La soluzione alla crisi non si trova in ricette pronte
all’uso; è necessario piuttosto focalizzarsi su: ricerca e innovazione, formazione
e istruzione scientifiche d’eccellenza, nonché sullo sviluppo delle conoscenze
relative.
Questo articolo, in continuità con il precedente [1], verte sull’importanza di
un’adeguata preparazione tecnico-scientifica, partendo dal fatto prima
sottolineato che la scienza nel nostro Paese è penalizzata rispetto a una cultura
tradizionalmente orientata all’idealismo in tutte le sue declinazioni o
qualificazioni (“vetero-”, “neo-”, ecc.). La tesi non è certamente nuova né
originale, talché è oggetto di preoccupazione diffusa, come il lettore potrà
agevolmente osservare scorrendo la vasta letteratura in proposito.
Anche nei settori più propriamente tecnici si deve riscontrare che non vi sono
ancora segnali concreti di inversione di tendenza da parte dei nostri decisori
politici, se si escludono annunci episodici o scontati riferimenti a modelli di
migliori pratiche, quali la Silicon Valley e l’Università di Stanford, popolate bensì
da ricercatori e ingegneri di origine italiana. Eppure, è accertato che l’offerta di
professioni qualificate giunge oggi dalle imprese a maggiore contenuto
tecnologico.
Venendo alle infrastrutture più avanzate, secondo l’Autorità per le garanzie nelle
telecomunicazioni, le prestazioni delle connessioni a banda larga su rete fissa in
Italia (47a con una velocità media di 5,2 Mbit/s) risultano inferiori alle best
practice internazionali. Ricordiamo che fino alla metà degli anni Novanta del
secolo scorso si investiva in modo sostanzioso nelle fibre ottiche e nei relativi
apparati: quei tempi sembrano ormai definitivamente andati.
Lo scenario di tecnologie e servizi ICT (Information and Communications
Technology) sta diventando sempre più articolato e complesso, con
macrotendenze così sintetizzabili: 1) il numero di dispositivi connessi a Internet
(IoT, Internet of Things) nel 2020 supererà di parecchie volte la popolazione
mondiale; 2) il cloud computing, spingendo su architetture aperte, richiederà
standard altrettanto aperti e software di tipo open source; 3) strumenti e
tecniche quantitative giocheranno un ruolo fondamentale nei big data,
soddisfacendo requisiti crescenti di grandezza, complessità e velocità; a questo
proposito, la teoria delle reti complesse [2], [3] ci potrà aiutare. Inoltre,
l’esplosione della connettività di rete, caratterizzante questo nuovo scenario ICT,

                                                                                          3
Mondo Digitale                                                         Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

provocherà una radicale trasformazione del business. Purtroppo, non sembra
che l’Italia attuale sia sufficientemente attrezzata in capacità di innovazione per
fronteggiare un contesto globale caratterizzato da aspra competizione.
Naturalmente, non possiamo trascurare le poche lodevoli eccezioni che hanno
permesso di costruire un Paese moderno, avanzato, industriale, che fa
funzionare le infrastrutture di supporto all’intera economia nazionale. Ed è da
sottolineare con forza che le eccezioni nazionali sono state permesse in virtù
dell’alta formazione e dell’istruzione erogate da prestigiosi istituti tecnici, dalle
facoltà scientifiche, dalle scuole di ingegneria e dai politecnici italiani. Ma
occorre andare avanti per riprendere a crescere.
Il fenomeno big data, cioè delle grandi moli – o serie – di dati non strutturati
prodotti dai moderni sistemi di transazione, interazione, monitoraggio e
localizzazione, è oggetto di particolare attenzione da parte di aziende e imprese
high tech per generare valore economico tanto per sé stesse quanto per i propri
clienti [4]: “tutto mi parla di te” sembra essere il Leitmotiv di chi segue le nostre
tracce in Rete.
Non sorprende quindi che aziende d’avanguardia ad alto contenuto
tecnologico, come Google, Apple, Amazon, Microsoft e IBM, ricerchino persone
smart (abili, “sveglie”, “in gamba”), sottoponendo test, rompicapo, quiz di
critical thinking e pensiero creativo nelle interviste per l’assunzione [5], [6]. In
molte università americane si offrono corsi di master per formare esperti di dati e
analisti [7], cioè per coloro che in generale operano in settori di business,
economia e finanza, utilizzando modelli analitici (o analytics). Sono anche offerti
insegnamenti universitari di algorithmic thinking in corsi di computer science
con rompicapi di tipo algoritmico, che coinvolgono, implicitamente o
esplicitamente, procedure più o meno codificate per risolvere problemi
decisionali [8].
La nuova disciplina emergente va sotto il nome di data science, e i suoi adepti
sono data scientist. Il saper prendere decisioni ponderate e intelligenti sui dati è
diventato uno degli skill più importanti in tutte le aree delle attività con alto
contenuto tecnologico. Il processo per apprendere le necessarie tecnicità
strumentali è molto impegnativo, essendo richieste conoscenze concernenti una
gran varietà di argomenti e tecnologie.
Colloqui di lavoro del tipo indicato sono anche condotti in modo da valutare la
capacità del candidato a riflettere, ragionare e analizzare informazioni in
maniera critica ed efficace per arrivare a una decisione corretta (problem
solving). Alcuni dei test proposti sollecitano l’attitudine al ragionamento
probabilistico-bayesiano, altri a quello logico, altri ancora alla mentalità
interdisciplinare. In ogni caso, il denominatore comune va ricercato nel minimo
indispensabile di competenze scientifiche e matematiche, già discusse in [1]1.

1 Lo sconcertante problema delle tre porte, trattato esaustivamente in quell’occasione, è illustrato come test
d’intelligenza nel romanzo Resistere non serve a niente di Walter Siti, vincitore del Premio Strega 2013,
ambientato nel mondo di banchieri e broker finanziari. C’è da dire che il problema è stato anche citato in altri
romanzi (p. es. Lo strano caso del cane ucciso a mezzanotte di Mark Haddon) così come è stato proposto nel
cinema (21 con l’attore Kevin Spacey). Peraltro, la dimostrazione in [1] della sua non intuitiva soluzione sembra
particolarmente convincente, a detta degli amici che hanno avuto la bontà e la pazienza di esaminarla.

                                                                                                                    4
Mondo Digitale                                                                              Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

In questo articolo di survey si riprende la stessa metodologia di [1] basata su
concetti di razionalità scientifica, probabilità e statistica, pensiero logico,
calandola nel contesto degli skill e degli strumenti sempre più richiesti da
imprese d’avanguardia, con esempi rivolti a contesti reali. Riassumendo quanto
prima detto, tali contesti derivano dall’offerta di nuove posizioni di lavoro per
esperti di dati e di analisi – sia qualitative sia quantitative – (i già citati scienziati
di dati), in seguito all’esplosione dei big data e quindi, in ultima istanza, in tutti i
comparti dell’economia avanzata e della società in cui l’ICT gioca un ruolo
dominante. A titolo di esempio, oltre all’ICT stessa, ricordiamo i principali ambiti
applicativi: smart city, smart grid, green economy, advanced manufacturing,
sanità, formazione e istruzione online (MOOC, Massive Open Online Course). I
modelli analitici utilizzati sono prevalentemente predittivi e orientati alle
decisioni, che devono perciò seguire processi metodologico-argomentativi
rigorosi di scientific critical thinking (pensiero scientifico critico). Processi e
decisioni che esigono peraltro una non trascurabile componente di creatività per
arrivare a trovare soluzioni nuove a modelli di business in grado di fronteggiare i
cambiamenti e le trasformazioni in atto.
Di singolari e fortuite coincidenze, statisticamente sorprendenti, si sono occupati
saggisti e scrittori come Carl Jung, Arthur Koestler, Primo Levi, esperti di
probabilità come Persi Diaconis, David Hand, Frederick Mosteller2, e divulgatori
matematici come Alex Bellos, Ennio Peres. Ciò significa che l’argomento delle
coincidenze, di per sé affascinate e avvincente, merita un approfondimento
(paragrafo 2) sia pure nei limiti di scopo della presente trattazione. Il tema,
peraltro, è propedeutico a molti argomenti dopo sviluppati.
La soluzione di test, casi, problemi dipende dalla loro corretta formulazione. Nei
paragrafi 3 e 4, si forniscono esempi di come, inquadrando un problema in modo
improprio, si possa arrivare a decisioni incongrue. Gli strumenti principali sono la regola
(o teorema) di Bayes nonché tutto il modo logico di ragionare che ne consegue.
Riferendosi ad applicazioni interdisciplinari, interessante è considerare la pervasività
del numero irrazionale e = 2,7182818… di Eulero in problemi di probabilità
apparentemente irrelati3. Senza dire dei metodi di calcolo comunemente adottati da
ingegneri elettrotecnici ed elettronici, dove la e è diffusissima. Il paragrafo 5 ne
riporta diversi esempi provenienti dai campi più disparati: calcolo del throughput di
protocolli di comunicazione; scelta ottimale fra molti candidati (segretaria, moglie/
marito); estrazione di carte da mazzi diversi; ecc.
Il paragrafo 6 esamina una di quelle stranezze che capitano spesso in probabilità,
la legge di Benford, indicandone i settori applicativi, oltre che i poco noti legami
con un’altra curiosità matematica, la successione dei numeri di Fibonacci.
Completano la rassegna le conclusioni nel paragrafo 7 e tre riquadri (strumenti
di probabilità, crescita esponenziale, vincite sorprendenti alla lotteria) che
approfondiscono o integrano alcuni aspetti illustrati nel testo.

2A chi diceva “ci sono le bugie, le bugie sfacciate e le statistiche”, Mosteller rispondeva piccato “è facile mentire
con le statistiche, ma è ancora più facile mentire senza”.

3Il numero e è una costante, il cui simbolo è in onore di Eulero, ma non è da confondere con la “costante di
Eulero-Mascheroni”, che è un altro bell’oggetto matematico, un po’ misterioso, che qui non consideriamo.

                                                                                                                        5
Mondo Digitale                                                                                  Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

2. Coincidenze impossibili?

                                                         Il fato se la ride delle probabilità
                                                            Edward George Bulwer-Lytton

        Con un campione sufficientemente grande, qualunque stranezza è possibile
         “Legge dei numeri molto grandi” di Persi Diaconis e Frederick Mosteller

Non è affatto intuitivo comprendere – o riuscire a far comprendere – che di
fronte a “un numero sufficientemente elevato di casi” anche gli eventi più strani,
cioè di minor probabilità, possano accadere. D’altro canto, è diffusa la tendenza
ostinata, o pareidolia in linguaggio psicologico, a vedere schemi e regolarità in
sequenze puramente casuali di dati. Con pareidolia s’intende un processo
psichico consistente nella elaborazione fantastica di percezioni reali incomplete,
spiegabile con sentimenti o processi associativi, e che porta a immagini illusorie
apparentemente dotate di una nitidezza materiale (per esempio, l’illusione che si
ha, guardando le nuvole, di vedervi montagne coperte di neve, battaglie, ecc.).
Pareidolia è quindi il contrario della logica dimostrativa intessuta di pro e contro
di una data tesi.
Per una di quelle curiose e felici concomitanze (sincronicità secondo Carl Jung,
singolarità secondo altri), che si verificano con non troppa infrequenza, mentre
stavo scorrendo (marzo 2012) il libro Coincidenze [9], il suo autore Ennio Peres
mi telefonò per chiedermi un contributo al mensile Linus. È da notare che con
Peres non ci siamo mai parlati telefonicamente, né prima né dopo: i nostri (rari)
contatti sono avvenuti e avvengono solo per email. Non si creda però a un caso
di telepatia, quanto piuttosto a un evento che rientra tranquillamente nella sfera
delle probabilità. Come osserva acutamente il matematico Persi Diaconis, “una
giornata veramente insolita è una in cui non accade niente di insolito”.
In definitiva quando i casi sono tantissimi – o le combinazioni di eventi
moltissime – tutto può accadere. Ma in un mondo governato dalle probabilità
non vi può essere certezza; di grande perspicacia è la sentenza: “Al mondo di
sicuro ci sono solo la morte e le tasse”, attribuita – forse arbitrariamente – a
Benjamin Franklin.
Nel seguito del paragrafo, si illustra la probabilità dell’evoluzione biologica,
mentre il riquadro 1 riassume un certo numero di strumenti fondamentali – testi,
formule, teoremi – utili e d’uso comune in calcolo delle probabilità.

2.1. La vita e il caso
Charles Darwin ha stabilito i fondamenti della moderna biologia evolutiva con
due concetti fondamentali: tutte le specie sono collegate le une alle altre tramite
un antenato comune, e la selezione naturale riflette lo scambio (interplay) tra
l’informazione ereditaria (in termini moderni, geni) e l’ambiente i cui le specie
evolvono. Il percorso della discendenza di specie da un antenato comune è
tradizionalmente rappresentato con un albero filogenetico. Analogamente,
anche le storie dei geni possono essere descritte come alberi, benché possano

                                                                                                6
Mondo Digitale                                                              Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

differire significativamente dalla storia delle specie perché i geni sono influenzati
da eventi evolutivi quali la duplicazione, la perdita o il trasferimento laterale.
Vediamo cosa succede in un caso di selezione, detto “Collo di bottiglia selettivo
nei meccanismi di singolarità”4. Questo meccanismo si applica a una qualsiasi
situazione in cui possibilità diverse siano sottoposte a un processo di selezione
che permette la sopravvivenza di una sola di esse. La più familiare di tali
situazioni si presenta nella selezione naturale darwiniana, in cui vari organismi
possono competere per le risorse disponibili all’interno di ecosistemi; in questa
lotta per l’esistenza, consegue alla fine il successo l’organismo meglio adattato
all’ambiente e più capace degli altri a riprodursi nelle condizioni ambientali
prevalenti. Si possono trovare, o simulare, molti altri casi di un processo
fondamentalmente simile, a seconda della natura delle entità in competizione fra
loro e di quella dei criteri di selezione. Così come si fa negli esperimenti di
bioingegneria, molecole replicanti soggette a mutazioni possono essere
costrette a passare per una strozzatura predisposta in modo tale da lasciar
passare solo quelle molecole che presentano un’attività catalitica
predeterminata, selezionando infine il più efficiente fra i catalizzatori rimasti.
Per definizione, un processo di selezione di questo tipo è ristretto alle varianti
reali che sono soggette a esso. Potrebbero benissimo esistere un organismo o
una molecola più adatti di quello o quella selezionati, solo che, se la variante
richiesta non viene proposta, non può essere ovviamente selezionata. Quando,
come spesso accade, hanno origine per caso più varianti, la probabilità che una
di esse venga offerta per la selezione dipende dal numero di opportunità che
essa ha di presentarsi.
Questa relazione può essere calcolata direttamente. Poniamo che p sia la
probabilità dell’evento al primo tentativo, allora la probabilità che esso non abbia
luogo è di 1 – p in un singolo tentativo e di (1 – p) n in n tentativi. La probabilità
P(n) che l’evento si verifichi se vengono date n occasioni è quindi di 1 – (1 – p) n.
È interessante notare che il calcoli di P(n), essendo la sua relazione bene
approssimata da n x p per n grande, può essere effettuato in modo piuttosto
semplice. Alcuni valori rappresentativi di P(n) sono mostrati in tabella 1.
Ciò che con questo calcolo si intende illustrare è che il caso non esclude
l’inevitabilità. Persino eventi altamente improbabili accadranno con una certezza
quasi assoluta qualora si forniscano loro abbastanza occasioni. Un’interessante
regola empirica è che, se si moltiplica il reciproco della probabilità dell’evento
singolo per un po’ meno di sette, si ottiene il numero di casi necessari per avere
una probabilità di verificarsi del 99,9%.

4   Il resto di questo sottoparagrafo si basa sostanzialmente su [10].

                                                                                         7
Mondo Digitale                                                           Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

Gioco                            Probabilità                      Valore di n
                                 P(n) per n =1                    per P(n) = 99,9%
Lancio di una moneta             1/2                              10

Lancio di un dado                1/6                              38

Roulette (con un solo            1/37                             252
zero)

Lotteria (sette cifre)           1/107                            69 x 106
Mutazioni puntiformi             1/(3 x 109)                      20 x 109
(errori di duplicazione)         per divisione cellulare          divisioni

Tabella 1. Dal caso alla necessità. Gli esempi illustrano il numero n di occasioni richieste
affinché un evento di probabilità p abbia il 99,9% di probabilità di accadere. Le stime
sono basate sulla formula P(n) = 1 – (1 – p) n, nella quale P(n) è la probabilità di
occorrenza dell’evento in n prove. (Fonte: [10], con rielaborazioni).

Come indicato nella tabella, addirittura un numero di sette cifre della lotteria
uscirà in 999 casi su 1000 con 69 milioni di estrazioni. Questo dato usualmente
non è noto agli acquirenti dei biglietti della lotteria, ma ha implicazioni
profondamente significative per la storia della vita. Essa permette la possibilità
di un’ottimizzazione selettiva in circostanze date, purché la gamma delle
possibili varianti possa essere esplorata in modo esauriente. Il motto
dell’evoluzione sembra essere festina lente, laddove procede inesorabile senza
mai chiedersi a che cosa una mutazione possa servire. Né un evoluzionista si
pone questa domanda, ma si chiede piuttosto “che cosa è successo?”.
Si noti che il meccanismo sottostante alla tabella 1 è di crescita esponenziale
[1]: un suo approfondimento si trova nel riquadro 2.

3. Le trappole cognitive della mente

   La vita a volte fa in modo che ciò che sembra prevedibile non accada mai e che
                                                  l'imprevedibile diventi la tua vita.
                          Viggo Mortensen, nel film Appaloosa (2008) di Ed Harris

Gli esempi di probabilità seguenti non necessitano di calcoli complessi, ma
implicano sottigliezze non indifferenti dal punto di vista concettuale. Infatti,
mostrano che, ricorrendo a soluzioni istintive basate sull’intuizione, si arriva
spesso a risultati fallaci. In molti casi, non è vero che “la probabilità è senso
comune ridotto a calcolo”, come sosteneva il pur grandissimo Laplace.

                                                                                               8
Mondo Digitale                                                                Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

Purtroppo, in questa materia le scorciatoie alla via maestra si possono praticare
solo dopo che la si padroneggia più che bene.
Gli studi empirici [11] del Nobel Daniel Kahneman e colleghi, di grande
rilevanza non solo nel contesto della psicologia applicata all’economia, hanno
inaugurato un fertile filone di ricerche nella teoria delle decisioni (per una loro
concisa illustrazione si rinvia a [1]). In estrema sintesi, la tesi sostenuta da
Kahneman è che l’Homo oeconomicus è tutt’altro che razionale quando deve
prendere decisioni strategiche, tesi basata su decine di esperimenti volti a
dimostrare il presunto “collasso, o scacco, della ragione”.
3.1. Interviste “rischiose”
Questo paragrafo potrebbe essere scherzosamente intitolato “Quando il calcolo
delle probabilità ti può salvare la pelle”.
L’eccessivo rischio finanziario, per non dire d’altre cause, non è certamente una
caratteristica recente né una peculiarità di questi ultimi sette-otto anni. Già il
caso di poco precedente, la bolla speculativa della new economy all’inizio del
2000, è istruttivo sotto questo profilo: allora ci fu chi comprò per milioni di dollari
startup, con pochissimi dipendenti, che non offrivano prodotti né tecnologie né
servizi, se non un ambizioso business plan. Non ci si può certo stupire se vi
furono poi fallimenti a catena.
Una leggenda metropolitana narra che nei ruggenti anni di quel periodo
consulenti di banche di investimento e società finanziarie in Wall Street
facessero ricorso a una tecnica un po’ troppo spiccia per valutare i candidati
all’assunzione e saggiarne la velocità di reazione in situazioni di rischio [5].
Come è noto, molti nordamericani sono tuttora affascinati dall’epopea del Far
West e dalle armi, nonché dalla roulette russa, gioco reso popolare dal film Il
cacciatore di Michael Cimino con una memorabile interpretazione di Robert De
Niro.
“Giochiamo alla roulette russa” – esordiva il fantasioso reclutatore – “Giovanotto,
sei legato alla sedia. Qui c’è una pistola a tamburo, a sei colpi, tutti vuoti.
Introduco due pallottole in camere adiacenti. Chiudo il cilindro e lo faccio
ruotare. Ti punto la pistola alla testa e premo il grilletto. Click. Sei ancora vivo.
Che fortuna! Ora, prima di discutere il tuo curriculum, tirerò nuovamente il
grilletto: preferisci: a) che faccia ruotare prima il tamburo, o b) che prema subito
il grilletto?”.
Non è certamente opportuno cercare di risolvere il problema, venato di un
umorismo un po’ macabro, per via sperimentale: con il ragionamento basato
sulle probabilità emerge che è più conveniente (sic!) farsi sparare un altro colpo
subito, piuttosto che dopo aver fatto girare il tamburo.
Infatti, essendoci due pallottole, quattro camere su sei sono vuote. Ogni volta
che l’intervistatore ruota il cilindro e preme il grilletto, si hanno quattro su sei, o
due su tre, probabilità di sopravvivere, cioè il 67%.
I quattro colpi vuoti sono tutti contigui. Se all’inizio l’intervistatore preme il
grilletto e il giovanotto sopravvive, significa che uno delle camere vuote gli ha
salvato la vita. Per tre di queste quattro camere vuote, la camera successiva

                                                                                          9
Mondo Digitale                                                         Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

sarà ancora vuota. La rimanente (quarta) camera vuota è proprio prima di una
delle due pallottole. Questo significa che, se non si ruota il cilindro, si hanno tre
su quattro probabilità di salvare la pelle, cioè il 75%. Il 75% è maggiore del 67%,
perciò la strategia ottimale per il giovane intervistato è di chiedere di non ruotare
più il tamburo.
3.2. Il paradosso del razzista, ovvero quando l’ignoranza (statistica)
genera paura
Il ragionamento per risolvere correttamente questo caso e il successivo utilizza
la regola di Bayes, approfondita nel riquadro 1.
In una città vive un nero ogni dieci abitanti (la probabilità di essere nero è del
10%). Una persona denuncia di essere stata aggredita da un uomo di pelle
scura. La polizia simula più volte la scena, nelle stesse condizioni di luce, con
persone diverse nella parte dell’aggressore. Nell’80% dei casi l’uomo indica
correttamente se il simulatore è bianco o nero (cioè, il test è preciso all’80%). Ma
nel 20% si sbaglia. Domanda: quant’è giustificata la sua convinzione che il vero
colpevole sia nero?
All’80%, sarà la risposta più frequente. Invece, non è così! Per fare una stima
corretta bisogna tener conto di quanti neri ci sono in città. Il 10%, abbiamo
detto. Dunque, su 100 persone 10 sono nere. Di queste, 2 verranno identificate
erroneamente come bianche e 8 correttamente come nere. Dei rimanenti 90
bianchi, 18 verranno identificati erroneamente come neri. La probabilità che
l’aggressore sia nero è dunque solo di 8/26, dal momento che ne identifica 26
come neri ma solo 8 lo sono effettivamente. Il valore 8/26 è quasi il 31%, altro
che l’80%!
Si aggiunga che se i neri fossero non il 10% ma, per esempio, l’1% (cifra assai
più vicina alla realtà degli immigrati in Italia) la probabilità di avere ragione per
l’aggredito crollerebbe a poco meno del 4%. Invece, con l’aumentare del
numero dei neri le probabilità dell’aggredito di avere ragione aumenterebbero
significativamente. Fin quasi alla certezza assoluta. Ma allora egli vivrebbe in
una città in cui tutti (a parte lui) sono neri.
Tirando le somme, la lezione da trarre è che dobbiamo guardare ai fatti, alla
scienza, non alla paura.
Questo paradosso ci porta direttamente alla “fallacia dell’accusa”, un caso
giudiziario esemplare nella giurisprudenza USA e, quindi, oggetto di studio nelle
scuole di legge statunitensi.
3.3. “Lo Stato di California contro i Collins”, ovvero la fallacia
dell’accusa
People v. Collins, un procedimento legale in California nel quale si è fatto uso
del calcolo delle probabilità, fornisce un eccellente esempio di come
caratterizzando in modo impreciso il contesto del problema possa portare a una
decisione errata [7].
La storia è rapidamente detta. Un’anziana, mentre camminava in un viale di un
sobborgo di Los Angeles, venne assalita e derubata. Un testimone dichiarò di

                                                                                        10
Mondo Digitale                                                       Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

aver visto una donna bianca con capelli biondi raccolti a coda di cavallo correre
per il viale ed entrare in un’auto (parzialmente) gialla guidata da un nero con
baffi e barba. Una coppia – i Collins, appunto – corrispondente all’incirca alla
descrizione fu arrestata e successivamente processata. Al processo l’accusa
convocò, come teste, un giovane docente di probabilità della sede locale (Long
Beach) dell’Università statale di California5 , che prese in considerazione le sei
caratteristiche, indicate dall’accusa stessa: uomo nero con barba – probabilità
di un 1/10; uomo con baffi – 1/4; donna con capelli biondi – 1/3; donna con
coda a cavallo – 1/10; automobile parzialmente gialla – 1/10; coppia interetnica
in auto – 1/1.000. Applicando la regola del prodotto, il professore ottenne
immediatamente la probabilità di 1/12.000.000 che la coppia fosse in possesso
delle caratteristiche indicate dalla testimone.
La giuria emise un verdetto di colpevolezza, confermata in appello, ma il ricorso
finale alla Corte Suprema della California rovesciò il giudizio, a causa
dell’insufficiente fondatezza nei valori numerici dei sei fattori di colpevolezza e
l’ovvia mancanza della loro indipendenza statistica.
Ma c’è un elemento ancora più importante. Anche se la conclusione dell’accusa
fosse stata corretta da un punto di vista aritmetico (valori realistici e
indipendenza statistica), ciò non avrebbe provato irrefutabilmente la
colpevolezza dei Collins. Il punto chiave non è la probabilità che la coppia
accusata corrisponda alla descrizione della testimone, ma la probabilità che vi
siano altre coppie corrispondenti alla descrizione. La probabilità di almeno
un’altra coppia, su 12 milioni, in linea con la descrizione risulta essere almeno
del 41% (si può usare la regola di Bayes con la distribuzione di probabilità
binomiale o, essendo il numero delle coppie molto alto e 1 su 12 milioni molto
piccolo, l’approssimazione con la funzione di distribuzione di probabilità di
Poisson – si vedano [14], [15] e anche il riquadro 1). Questo secondo calcolo fu
condotto da Laurence Tribe [12], allora giovane assistente (law clerk) del
giudice capo. Tribe avrebbe poi intrapreso una brillante carriera accademica a
Harvard, avendo come studente e assistente Barack Obama, oltre a numerosi
altri allievi di successo.
L’ovvia morale della storia è che una scorretta impostazione del problema non
può che condurre a decisioni sbagliate.
C’è però un “però”. Il procedimento basato sulla regola di Bayes è
indubitabilmente convincente e senza pecche dal punto di vista probabilistico, a
differenza del metodo che assume l’indipendenza statistica delle probabilità
singole e seguito in prima istanza. Tuttavia, anche la decisione della Suprema
Corte sarebbe potuta essere diversa, qualora fossero emerse dal dibattimento
altre evidenze o prove significative contro i Collins, aumentandone così la
probabilità a posteriori di colpevolezza.

5Parlando di curiose e fortuite coincidenze, è interessante notare [12] che l’accusatore Ray Sinetar era cognato
di Ed Thorp il geniale matematico, amico di Claude Shannon. Abbiamo già incontrato Thorp nel lavoro [13] sul
primo vero computer “indossabile” realizzato per vincere alla roulette, e sulla teoria dell’informazione applicata
ai giochi d’azzardo. Forse, l’ingenuità dell’accusatore fu di rivolgersi a un docente poco esperto, anziché al
proprio cognato, ben più versato nelle probabilità.

                                                                                                                     11
Mondo Digitale                                                                               Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

Si può notare che il metodo di calcolo qui adottato è lo stesso del paradosso del
razzista (paragrafo 3.2) e dei test medici nell’articolo [1]. Proprio come i risultati
dei test medici possono essere equivocati se non si applica (correttamente)
Bayes, la fallacia dell’accusatore riguarda il fraintendimento di informazioni
probabilistiche: l’errore risulta dallo scambio della “probabilità di essere in
possesso delle caratteristiche di colpevolezza” con la “probabilità di essere
colpevoli, stante il fatto che si presentano le caratteristiche di colpevolezza”.
Nel 1994 il Federal Judicial Center statunitense ha pubblicato e distribuito a tutti
i giudici federali il Reference Manual on Scientific Evidence, una corposa guida
introduttiva all’applicazione di metodi scientifici in campo forense. Il Reference
Manual è rapidamente diventato un best seller, tant’è che oggi è giunto alla
terza edizione. Non risulta che qualcosa di analogo sia stato predisposto per i
magistrati italiani.

4. L’approccio bayesiano

          Puoi trovare la verità con la logica solo se l’hai già trovata senza di essa
                                                                Gilbert K. Chesterton

                                       Come detto, il teorema – o regola – di Bayes è
                                       uno strumento potente di calcolo, consentendo
                                       d i a g g i o r n a re ( o v v i a m e n t e i n t e r m i n i
                                       probabilistici) l’informazione che aumenta sulla
                                       base dell’esperienza. Infatti, anche se al
                                       crescere delle osservazioni a favore, un evento
                                       non diventa sempre più vero, diventa tuttavia
                                       “più verosimile”, cioè più probabile.
                                   Il teorema di Bayes costituisce il punto di
                                   partenza per l’approccio soggettivo alle
                                   probabilità – o Bayesianism (ragionamento
                                   bayesiano) come si tende a dire oggi – basato
                                   sulla interpretazione della probabilità come
   Thomas Bayes (1701 - 1761)      “grado  di convinzione (soggettiva)”. L’origine è
                                   bensì la regola bayesiana (usata da tutti gli
                                  esperti del settore), ma il bayesianesimo va
oltre il metodo di calcolo, essendo inteso come una concezione paradigmatica
delle probabilità: il “probabilismo”. In questo ambito, tuttora insuperabili sono i
due volumi Teoria delle probabilità (1970) di Bruno de Finetti, grande
matematico del Novecento.

4.1. L’analisi bayesiana dei big data
Saper prendere decisioni fondate su criteri probabilistico-bayesiani è un mezzo
utilissimo per governare – e non subire – l’incertezza nei diversi campi di
applicazione. A questo scopo è indispensabile separare ciò che è

                                                                                                        12
Mondo Digitale                                                                   Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

“segnale” (informazione utile) da quanto è “rumore” (disturbo), obiettivo primario
di ogni tipo di comunicazione. Con tecniche sia qualitative sia quantitative, Nate
Silver, statistico ed esperto di politica, ha correttamente previsto l’esito elettorale
in tutti i 50 Stati delle ultime elezioni presidenziali USA nel 2012 [16],
dimostrando le potenzialità applicative della metodologia [17]. Tant’è che,
secondo molti opinionisti, i big data associati all’analisi bayesiana sono da
ritenere i veri vincitori delle ultime elezioni americane: Obama e il suo staff
hanno saputo leggere nel cuore degli elettori che interagivano tra di loro –
tramite personale computer e/o smartphone – scambiandosi pareri e opinioni.
Le informazioni utili prodotte da queste interazioni sono state in quantità
impressionante.
Se da un lato algoritmi data driven – alimentati cioè dalle masse imponenti di
dati – dimostrano di poter essere realizzati con sempre maggiore efficacia,
dall’altro lato si rende necessario lo sviluppo di nuovi strumenti matematici. La
disciplina detta analytics (che potremmo tentare di rendere in italiano con
“analiticità”), essendo rivolta a scoprire e sfruttare le regolarità nei dati, si basa
sull’applicazione di statistica, programmazione software, ottimizzazione
matematica.
Nel trattare i big data è necessario un pacchetto di competenze di analytics
quali: 1) basi dati per gestire e visualizzare masse imponenti di dati non
strutturati; 2) conoscenza di tecniche di apprendimento automatico, di reti
neurali e di inferenza statistica; 3) modelli predittivi per valutare l’affidabilità delle
conclusioni. Si comprende allora come il paradigma bayesiano, e, casomai, la
legge di Benford (cfr. il paragrafo 6), possano avere un ruolo non marginale in
questo nuovo importante settore.
4.2. C’era una volta un tacchino “induttivista”…
                                     Hope for the best, prepare for the worst
                                            Esempio di pragmatismo British

                                          William Feller [14] raccomanda, giustamente,
                                          grande cautela nel caricare di significati metafisici
                                          la regola di Bayes (si veda anche il riquadro 1). A
                                          questo proposito, Feller cita Platone che con
                                          argomentazioni di tipo induttivo cercava di
                                          dimostrare l’esistenza di Atlantide, nonché quei
                                          filosofi settecenteschi che pretendevano di demolire
                                          la meccanica newtoniana.
                            Un istruttivo esempio di azzardata applicazione
                            filosofica è la metafora del “tacchino induttivista”
nella forma ideata da Bertrand Russell.
La storia 6 riguarda un tacchino sempre più convinto della benevolenza
dell’allevatore che lo nutre, fino a quando questi non gli tira il collo. Fin dal primo
giorno il tacchino osserva che, nell'allevamento dove è stato portato, gli viene

6   Il testo seguente è adattato da Wikipedia.

                                                                                                  13
Mondo Digitale                                                                  Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

dato il cibo alle 9 del mattino. E da buon induttivista non è precipitoso nel trarre
conclusioni dalle sue osservazioni; ne compie molte altre in una vasta gamma di
circostanze: di mercoledì e di giovedì, nei giorni caldi e nei giorni freddi, sia che
piova sia che splenda il sole. Così arricchisce ogni giorno il suo elenco di una
proposizione osservativa nelle condizioni più disparate, finché non è
pienamente soddisfatto Allora elabora un’inferenza induttiva come questa: “Mi
danno il cibo alle 9 del mattino”. Sfortunatamente, però, la sua conclusione si
rivela incontestabilmente falsa alla vigilia del Thanksgiving Day, quando finisce
in pentola, cotto a puntino.
Aveva già capito tutto Ennio Flaiano che nel Diario degli errori commentava
amaramente: “Aumentano gli anni e diminuiscano le probabilità di diventare
immortali”.
Con logica opposta alla logica dimostrativa, i catastrofisti, millenaristi,
apocalittici di tutte le latitudini non tengono conto dei sistematici fallimenti delle
loro profezie sulla fine del mondo, evento (quasi) certo, ma non prevedibile a
priori. La fine del mondo è stata vaticinata e con impressionante regolarità nel
corso della storia umana, sempre con grande cassa di risonanza da parte dei
mezzi di comunicazione di massa: oltre agli organi del corpo, si è forse evoluta
nell’umanità l’esigenza di pronosticare il futuro senza argomentazioni valide.
Coloro che annunciano catastrofi cosmiche diventano interessanti soltanto se si
oppongono alla ragione. Anche una delle ultime profezie, quella attribuita
(erroneamente) all’ignaro popolo maya, è andata, com’era del tutto ovvio,
disattesa. Sembra ancora quanto mai attuale l’ammonimento di Orazio: “Non
cercar di sapere quel che avverrà domani”. Corre peraltro l’obbligo di osservare
che i profeti dell’apocalisse nel lunghissimo termine avranno sicuramente
ragione, quando il mondo finirà.
In sintesi, l’approccio basato sull’induzione non offre certezze assolute, ma
consente valutazioni attente, oculate e pragmatiche sulla base degli assiomi
della probabilità. Russell e molti altri hanno correttamente evidenziato i limiti del
ragionamento esclusivamente basato sull’esperienza. Ma usare la mancanza di
certezze assolute per ricusare le argomentazioni scientifiche sarebbe un limite
ancora peggiore, perché non consentirebbe alcun progresso. L’assunto corretto
è che l’esperienza è madre di scienza e che l’uso della ragione si può
migliorare, purché tenacemente e costantemente esercitato. Il probabilismo ben
temprato con Bayes e strumenti simili ci offre modelli interpretativi della realtà,
che non si stupiscono di cigni neri, fenomeni naturali catastrofici, atti terroristici,
crolli economico-finanziari, vincite strabilianti al gioco d’azzardo e altri eventi
estremi, sia positivi sia negativi.
4.3. Sulla percezione dei rischi
L’approccio bayesiano è fondamentale anche nella valutazione dei rischi. “Il
rischio è, tecnicamente, la probabilità che si verifichi un evento indesiderato.
Quanto più grande è la probabilità e quanto più è indesiderato l’evento,
maggiore è il rischio” è la definizione semplice, elegante, ineccepibile, proposta
da Simona Morini [18].

                                                                                          14
Mondo Digitale                                                         Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

Anche se il rischio è vissuto nell’opinione comune con scarsa o nulla razionalità,
i tecnici, al contrario, sono capaci di articolare applicazioni e innovazioni che
riducono i rischi, senza bisogno di ricorrere al famigerato “principio di
precauzione” tanto caro ad ambientalisti, filosofi continentali e neoluddisti in
genere. Il principio di precauzione, nella sua formulazione più radicale,
condurrebbe alla stasi completa perché pretende la garanzia dell’assenza
completa di rischi. Applicandolo alla lettera, non dovremmo neppure mangiare o
uscire di casa.
Invece, l’analisi dei rischi, basata su una ponderazione oculata delle probabilità
(probabilismo, Bayesian assesment, rational critical thinking), è quanto è
necessario per contemperare tanto lo sviluppo e la crescita dell’economia
quanto l’attenzione alla natura. I rischi si possono – e si devono – controllare,
mitigare, minimizzare, ma non certo azzerare.
A protezione dai rischi ci sarebbero le assicurazioni, tuttavia: “Ci sono cose
peggiori della morte. Se hai passato una serata con un assicuratore, sai
esattamente cosa intendo”, ammonisce un pungente Woody Allen.

5. L’ubiquità del numero e di Eulero: la regola del 37%
Forse il lettore sarà sorpreso, tanto quanto lo sono stato io, a scoprire come il
numero irrazionale e = 2,7182818… si materializzi, quasi per magia, in problemi
di probabilità, apparentemente diversi: calcolo del throughput in sistemi di
telecomunicazione; scelta del migliore candidato (segretaria, moglie/marito,…);
estrazione di due carte successivamente sempre differenti da due mazzi diversi;
ecc. La ragione di base è che il numero e fa capolino in un gran numero di
relazioni matematiche (riquadro 1). Nella fattispecie, si presenta laddove per
molti problemi in ambiti probabilistici diversi il calcolo combinatorio è uno
strumento fondamentale e, quindi, unificante. Questo calcolo, riguardando
ordinamenti, configurazioni e combinazioni di elementi distinti, risponde a
domande del tipo: “In quanti modi è possibile…?”, “Quanti/quante sono...?”.
Ebbene, possono risultare tante, tantissime combinazioni che, non raramente,
sono in numero sorprendentemente alto (riquadro 2).
Né si deve dimenticare la relazione, giudicata da molti la più bella della
matematica, ovvero l’identità di Eulero: eiπ + 1= 0, dove i, per definizione, è
l’unità immaginaria,          ovvero eiπ = – 1. Da quest’ultima identità, che ra-
ppresenta la rotazione di un vettore di π radianti su un piano cartesiano7 ,
discende la metodologia comunemente impiegata in elettrotecnica, elettronica e
telecomunicazioni per l’analisi o la sintesi di sistemi. Si tratta del ben noto
calcolo operazionale basato sulla notazione di Oliver Heaviside, dove però la i è
solitamente sostituita dalla j per evitare confusioni con il simbolo della corrente
elettrica.

7
   In probabilità, oltre a e, anche π emerge con impressionante frequenza. Per esempio, il “problema dell’ago di
Buffon” stabilisce una relazione tra un esperimento puramente casuale, cioè una simulazione aleatoria, e π. (Il
conte di Buffon è il grande naturalista francese ricordato anche per la lapidaria sentenza: “Le style c'est
l'homme même – Lo stile è l’uomo stesso”).

                                                                                                                   15
Mondo Digitale                                                                             Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

5.1. Sistemi di comunicazione Aloha
I sistemi Aloha si basano su protocolli di comunicazione per l’accesso multiplo a
un mezzo condiviso da parte di n utilizzatori. Sono stati proposti e sviluppati – in
particolare da Norman Abramson – negli anni Settanta del secolo scorso per
consentire l’accesso radio alle sedi dell’Università delle Hawaii, sparpagliate su
diverse isole. La variante a slot del protocollo è quella che garantisce la
massima efficienza (o throughput), riportato in tabella 2 [19].
Il calcolo, che qui vi risparmiamo, facendo elegante uso degli strumenti indicati
nel riquadro 1 – distribuzione binomiale e formula limite per la e – conduce a un
throughput massimo del 37% circa, precisamente 1/e = 0,367879…, allorché il
numero di stazioni del sistema tende a infinito. Con 100 stazioni l’efficienza
massima è un po’ superiore, cioè 0,370, e 0,372 con 50. Un numero di stazioni
anche solo di qualche decina fornisce prestazioni vicine al caso (peggiore) di
infinite stazioni. Inoltre, sempre in [19] è dimostrato che, qualsiasi sia n, il
massimo è raggiunto quando il numero medio di tentativi di trasmissione da
parte delle stazioni è 1.

Numero n di            1        2        5         10       20      50      100     ∞
stazioni

Throughput             1        0,5      0,41      0,387    0,377   0,372   0,370   0,368
massimo

Tabella 2. Protocollo Slotted Aloha: throughput massimo al crescere del numero n di
stazioni. (Da [19]).

Il throughput massimo del protocollo, al variare di n, è anche calcolabile
analiticamente mediante la formula (1 – 1/n) (n – 1) [19], il cui limite (per n
tendente all’infinito) è appunto 1/e.
5.2. Il problema della dote
Si tratta del problema (della dote o della segretaria o dell’anima gemella, ecc.)
di sapersi fermare al momento giusto in una ricerca sequenziale (strategia di
optimal stopping), problema affrontato da molti studiosi – fra cui il noto esperto
di giochi matematici Martin Gardner.
Consideriamo la versione data, come il solito, da Mosteller [20]. Un re, per
provare la saggezza di un suo giovane consigliere, gli offre l’occasione di
sposare la damigella di corte in possesso della dote maggiore. L’ammontare di
tutte le doti è scritto su altrettanti foglietti di carta che vengono opportunamente
mischiati. Un foglietto è estratto a sorte e il consigliere deve scegliere se la
corrispondente dote sia la più alta o meno. Decidendo di sì, prende in sposa la
damigella (con la relativa dote) se coglie nel segno; altrimenti, non ottiene
alcunché. Se non opta per l’ammontare scritto sul primo foglietto, può

                                                                                            16
Mondo Digitale                                                              Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

scegliere o rifiutare il successivo, e così via finché non sceglie una damigella
oppure l’elenco è giunto al termine. Naturalmente, una volta che il consigliere
decide di andare avanti, non può più tornare a una dote già rifiutata. In tutto,
partecipano 100 nobili fanciulle, ciascuna con una differente dote: qual è la
scelta ottimale da seguire per massimizzare la probabilità che la damigella
prescelta sia la più ricca?
In generale, la questione è se vi sia o no una chance maggiore di 1/100,
essendo cento le damigelle. Il più delle volte, si fanno poche prove prima di
scegliere, quando addirittura non ci si ferma alla prima che capita, rischiando
però grosso. La soluzione del problema – basata sulla tabella 3 – pur elegante,
non è intuitiva né facilmente prevedibile.

n                s               probabilità        n             s      probabilità
                                 massima                                 massima
1                1               1,00               10            4      0,399

2                1               0,50               20            8      0,384

3                2               0,50               50            19     0,374

4                2               0,458              100           38     0,371

5                3               0,433              ∞             n/e    1/e (~ 0,368)

Tabella 3. Problema della dote con n candidate: valori s di scelta ottimale e corris-
pondente probabilità massima di vincita. (Da [20]).

La tabella in prima colonna riporta il numero n = 1, 2, 3,… di doti (“candidate” a
essere prescelte), in seconda la candidata s corrispondente alla probabilità
massima di successo, la quale è espressa nella terza colonna. Da essa, risulta
chiara la strategia ottimale: per n = 100, si lasci passare la 37° candidata e si
scelga poi la prima dote che risulta la più alta rispetto a tutte le precedenti.
Per valori di n ancora maggiori la regola – o algoritmo di scelta – è di far passare
approssimativamente la frazione 1/e della distinta e scegliere poi la dote
migliore di tutte quelle già viste: la probabilità di vincita è prossima a 1/e, il
massimo teoricamente possibile.
Questo gioco, che a prima vista sembrerebbe garantire solo una probabilità di
vincere pari a 1/n, ha un esito sorprendente, in quanto la semplice strategia
delineata assicura una probabilità di vincita di oltre 1/3 anche per valori
grandissimi di n.
Naturalmente, la conseguenza di questi risultati è che un’analisi accurata e
attenta nella scelta del partner può ripagare coloro che sono tuttora single.
Come diceva Oscar Wilde, la felicità di un uomo sposato dipende dalle donne

                                                                                         17
Mondo Digitale                                                          Dicembre 2014
Apologia della ragione scientifica - II: strumenti per decidere

che non ha sposato (in modo meno sessista, oggi si direbbe che la felicità di chi
è sposato dipende da coloro che non ha sposato).
Ancora una volta è opportuno ribadire che massimizzare la probabilità non
significa la certezza di vincita (si ricordi anche il problema dell’auto e delle tre
porte in [1]). E poi, Roberto “Freak” Antoni – già componente di spicco del
gruppo rock demenziale degli Skiantos – non ci ha forse spiegato che “la
fortuna è cieca, ma la sfortuna ci vede benissimo”? Va bene, non diceva proprio
la “sfortuna”, ma il senso è quello.
5.3. “To match” or “not to match”?
Questo rientra nella categoria dei problemi di
match (accoppiamento, corrispondenza,
abbinamento) o coincidence, per esempio, in
giochi di carte [14], [20]. Gli accoppiamenti
possono presentarsi in ciascuna delle n posizioni
e in diversi posti simultaneamente. Il problema
risale a Pierre Rémond de Montmort (1708), che
lo risolse nel 1713, quasi contemporaneamente a
Nicholas Bernoulli; fu poi generalizzato da
Laplace e molti altri studiosi.
In una partita a carte, due amici con due normali mazzi di 52 carte,
accuratamente mescolati, girano ciascuno una carta sul tavolo. Procedono così
sino alla fine del mazzo. Se durante tutto lo svolgimento del gioco non escono
mai contemporaneamente due carte uguali, tanto in seme quanto in valore,
vince chi ha puntato su no-match; se invece, almeno una volta, escono due
carte esattamente uguali, vince l’altro, che ha puntato su match. Su quale
evento conviene puntare?
Soluzione. Di n! permutazioni di n oggetti, quelle complete o “dismutazioni” (in
inglese derangement, confusione)8 sono circa n!/e, mentre nelle restanti si
presenta almeno una coincidenza. Quindi scommettendo su no-match si vince
con probabilità e – 1 = 0,36789…, mentre la probabilità di vincere puntando su
match è maggiore, cioè 1 – e – 1 = 0,63212...
L’esperimento precedente può essere formulato anche in altri modi folcloristici.
In particolare, i due mazzi possono essere sostituiti da n lettere e altrettante
buste, sulle quali una segretaria per dispetto del principale si diverte a
realizzare associazioni completamente casuali. In alternativa, si possono
immaginare i cappelli depositati in un guardaroba, poi mescolati e distribuiti
casualmente agli ospiti. Se una persona ottiene il proprio cappello, si parla di
abbinamento corretto.
È interessante analizzare la dipendenza da n della probabilità di match, per
esempio, come si rapporta il caso di 8 persone con quello di 10.000. Questa
probabilità, fatto assai sorprendente, è praticamente indipendente da n e vale,
in prima approssimazione, un po’ meno di 2/3 [14].

8 Dati n elementi, una permutazione completa (dismutazione, derangement) è una permutazione tale che
nessuno degli elementi appaia nella posizione originale (http://en.wikipedia.org/wiki/Derangement).

                                                                                                       18
Mondo Digitale                                                                   Dicembre 2014
Puoi anche leggere