CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine

Pagina creata da Andrea Biondi
 
CONTINUA A LEGGERE
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
CONTENUTI E RISORSE
PER CAPIRE IL MONDO CON I DATI
Una raccolta dei nostri migliori contenuti gratuiti

 DATA SUMMER
 Dormire, ma
 1 ora Dormire Serie TV Mare
 in arancione
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
CHI SIAMO

Dataninja è un’azienda data-driven nata da un gruppo di lavoro basato
in Italia e attivo in Europa dal 2012.
La nostra missione è aiutare le persone a vivere e lavorare meglio
usando i dati, e lo facciamo attraverso percorsi di formazione coin-
volgenti, prodotti educativi e contenuti divulgativi basati sui dati.
Trovi i nostri corsi online sulla piattaforma school.dataninja.it
I contenuti di questo ebook sono stati pubblicati originariamente sul
magazine o nella nostra newsletter settimanale.

Dataninja è stata fondata da Andrea Nelson Mauro, Donata Colum-
bro, Alessio Cimarelli e Nicola Bruno.

Alla realizzazione di questo ebook hanno contribuito Alice Corona
(contenuti) e Alessandro Rizzo (grafica).

 Attribuzione - Non commerciale - Condividi allo stesso modo
 4.0 Internazionale (CC BY-NC-SA 4.0)
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
INDICE

Capitolo 1. Dietro ai dati, le persone 5

Capitolo 2. Da data consumer a data conscious. Spunti 21
per leggere dati e visualizzazioni con spirito critico

Capitolo 3. Lavorare con i dati: la parola a chi dei numeri 43
ci ha fatto una professione

Capitolo 4. Data4Fun: divertirsi e giocare con i dati 59
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
5

Capitolo 1

Dietro ai dati, le persone

In questa sezione troverai articoli che affrontano una questione
fondamentale per chi lavora con i dati: il fatto che, sebbene vengano
dipinti come oggettivi e assoluti, i dati sono sempre frutto del lavoro
umano, che inevitabilmente porta sempre con sé dei limiti. Limiti
dovuti agli strumenti tecnici usati per misurare, ma anche, e in maniera
più insidiosa, ai pre-condizionamenti socio-culturali di chi si mette a
misurare e descrivere il mondo.

INDICE

 1. Cosa vuol dire occuparsi di dati con un approccio femminista 6

 2. Cosa sono i thick data e come usarli in tempi di crisi 13

 3. La disparità di genere, spiegata con i dati (che non ci sono) 17
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
Capitolo 1 • Dietro ai dati, le persone 6

Cosa vuol dire occuparsi
di dati con un approccio
femminista
25 giugno 2020 | Alice Corona

Lavorare con i dati attraverso un approccio femminista non vuol dire
necessariamente occuparsi di donne o di questioni di genere: vuol dire
occuparsi del potere. In particolare, di chi lo detiene e di chi no.
Nella pratica cosa significa essere una o un femminista dei dati?
Vediamolo assieme.

Lavorare con i dati attraverso un approccio Nella pratica, però, cosa significa essere una o
femminista non vuol dire necessariamente oc- un femminista dei dati? Ci sono molti modi per
cuparsi di donne o di questioni di genere: vuol essere data feminist in ognuna delle varie fasi
dire occuparsi del potere. In particolare, di chi lo del lavoro con i dati. Dalla fase di ricerca e rac-
detiene e di chi no. Questo è il messaggio chiave colta dati a quella della comunicazione e visua-
del libro Data Feminism di Catherine D’Igna- lizzazione, fino a ciò che avviene dopo la pub-
zio e Lauren F. Klein, da cui prende ispirazione blicazione di un lavoro. In questo pezzo però ci
la prima parte di quest’articolo. focalizzeremo solo sulla raccolta dati.

 Appunti disegnati da
 @elviavasc | @sketchnotes_are_awesome per il secondo capitolo del libro Data Feminism
 di Catherine D’Ignazio e Lauren F. Klein.
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
Capitolo 1 • Dietro ai dati, le persone 7

 minicidio in Messico, arrivando a raccogliere
_Data feminism durante informazioni su oltre 5mila storie e diventando
la raccolta dei dati: la fonte più affidabile sul tema.
 Anche le mappe del progetto Anti Eviction
cosa sono i counterdata Mapping Project (AEMP) rappresentano un
 chiaro esempio di counterdata. Il progetto è
Tra tutte le possibilità suggerite da D’Ignazio e nato per restituire spessore ai dati sugli sfratti
Klein per fare data feminism, ce n’è una che è a San Francisco. Sebbene infatti le istituzioni
accessibile a chiunque, anche a chi non si sente avessero statistiche sul numero degli sfratti,
particolarmente data nerd ma comunque ha a queste informazioni erano pubblicate senza al-
cuore una causa: la raccolta di quelli che le au- cun tipo di contesto che permettesse davvero di
trici definiscono “counterdata”. capire le dinamiche di potere che stanno dietro
 agli sfratti o di raccontare le storie individuali
I counterdata sono tutti quei “contro-dati” che
 delle persone coinvolte. Grazie a una raccolta
offrono una visione alternativa rispetto a quella
 dati più qualitativa e centrata sulle persone, il
dei dati ufficialmente raccolti, per esempio con-
 gruppo AEMP è riuscito per esempio a far emer-
teggiando ciò che non viene altrimenti conside-
 gere il ruolo delle compagnie tech di Silicon
rato nelle statistiche istituzionali.
 Valley, come Google, nell’esplosione degli
Un caso di raccolta di counterdata è il lavoro sfratti cosiddetti “no-fault”, ovvero senza
dell’attivista messicana María Salguero che, morosità o colpe del locatore.
da sola, dal 2016 sta mappando i casi di fem-

 Il 69% degli sfratti “no fault” ha riguardato abitazioni entro 4 isolati da una fermata di “Tech
 Bus”, il sistema di bus privati che trasporta i dipendenti delle aziende di Silicon Valley dalle
 loro case ai luoghi di lavoro.
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
Capitolo 1 • Dietro ai dati, le persone 8

I dati sugli assassini causati dalla polizia negli ma non aveva alcun dataset su quante volte e
Stati Uniti sono un esempio invece di come i in che circostanze la polizia facesse ricorso ad
counterdata, grazie alla forza dell’attivismo di un uso mortale di forza bruta. Così, tra ricerca,
moltissime organizzazioni, possano entrare a far crowdsourcing e richieste FOIA, Brian Burghart
parte del dibattito pubblico e della ricerca acca- e la sua squadra sono riusciti a mettere in piedi
demica, spingendo poi le istituzioni a colmare il il database più comprensivo al mondo sul tema,
vuoto e raccogliere i dati loro stesse. Il database con oltre 26mila episodi documentati di perso-
di Fatal Encounters è nato su iniziativa di un ne morte negli USA durante un’interazione con
giornalista, accortosi di come tutte le volte che la polizia, dal 2000 ad oggi. E grazie al suo sforzo
una morte per mano della polizia finiva sui gior- e a quello parallelo di altri attivisti e giornalisti,
nali non c’era alcun modo per contestualizzarla: dal 2015, anche l’FBI ha dichiarato che si sareb-
si trattava di un episodio isolato? O del millesi- be impegnata a raccogliere dati sull’impiego di
mo dell’anno? Raccontare queste morti senza forza, fatale o meno, ad opera delle forze dell’or-
conoscerne i numeri complessivi o i possibili dine.
pattern nelle caratteristiche delle vittime signi-
ficava ignorare una storia ad altissimo interesse
pubblico. Al tempo, l’FBI pubblicava in maniera
centralizzata statistiche su tutti i tipi di crimini,

 Le prime righe, delle oltre 26 mila, del dataset Fatal Encounter sulle vittime della violenze
 della polizia negli USA
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
Capitolo 1 • Dietro ai dati, le persone 9

Infine, non si può chiudere questa sezione mancanza di dati ufficiali, il team di Obiezione
senza citare il progetto counterdata italiano e Respinta ha creato un sistema in cui chiunque
femminista Obiezione Respinta. In Italia – uf- può segnalare la sua esperienza con ospedali e
ficialmente per motivi di privacy – mancano i farmacie, dando così vita in maniera collettiva
dati sugli obiettori di coscienza nelle strutture a un database su medici e farmacisti che osta-
sanitarie pubbliche. Diventa quindi impossibile colano il diritto all’aborto. Un database costru-
denunciare la pervasività del fenomeno a livello ito dal basso che va a colmare un vuoto di dati
complessivo e strutturale. Soprattutto, questa “dall’alto”, con lo scopo di informare e allo stes-
mancanza di dati ha un impatto reale e concreto so tempo “sanzionare tutti quei luoghi che ci
nella vita di chi chiede accesso a soluzioni abor- privano del diritto di scegliere e di autode-
tive, spesso con urgenza. Per ovviare a questa terminarci“.

 Screenshot della mappa collettiva del sito Obiezione Respinta.

 pandemia, al di fuori di questa narrazione do-
_Femminismi, minante.
counterdata e pandemia Già nelle prima settimane di lockdown, l’ Atlan-
 tic se ne era accorto: la pandemia è un disa-
COVID19 stro per il femminismo e i dati ci offrono degli
 indizi. Le donne sono quelle che probabilmente,
Durante la pandemia COVID19 si è parlato del per stereotipi culturali o ineguaglianze salariali,
primo evento data-informed della storia, più spesso rinunceranno al lavoro per badare
con i dati a farla da protagonista in ogni conte- ai figli a casa da scuola. Durante una pandemia
sto: dai bollettini giornalieri della Protezione Ci- l’intero sistema sanitario si concentra sul virus, a
vile alle chat di Whatsapp. Mi verrebbe da stima- scapito di altri settori della sanità pubblica. Tra
re però che, nella stragrande maggioranza dei le varie conseguenze di ciò, l’esperienza ebola
lavori data driven di questi mesi, i dataset uti- in Africa ha dimostrato che le pandemie hanno
lizzati sono stati su un unico tema: l’andamento un impatto disastroso sulla mortalità legata a
della pandemia, tra mortalità e letalità, conta- complicazioni durante il parto. Chi monitorerà
giati e guariti, modelli di previsione e indice R0. questi numeri? E poi, quale sarà il bilancio delle
 vittime di violenza domestica dopo mesi di con-
Per quanto tutto ciò sia stato utile, un approccio
 vivenze forzate? Tutti esempi di possibili coun-
femminista ai dati ci costringe a riflettere anche
 terdata da raccogliere e raccontare, per denun-
su altri temi e possibili counterdata legati alla
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
Capitolo 1 • Dietro ai dati, le persone 10

ciare le ineguaglianze nelle conseguenze della Nel dossier, i ricercatori hanno raccolto i dati
pandemia. sulle dimensioni delle abitazioni, le differen-
Il lockdown non ha fatto emergere solo le di- ze di reddito o la partecipazione culturale per
seguaglianze di genere, ma anche quelle eco- mostrare come “le diseguaglianze tagliano la
nomiche. Lo ha raccontato bene l’inchiesta Di- città in due: da una parte i quartieri benestanti,
seguaglianze al tempo del coronavirus del dall’altra quelli fragili”.
centro studi Genova Che Osa.

 Esempio di scheda sui quartieri di Genova del dossier Diseguaglianze al tempo del
 coronavirus

Quello che a mio parere è stato tra i migliori pro- zato sulle comunità “ai margini” o sulle dinami-
getti con un approccio femminista e intersezio- che di potere e oppressione attivate dai sistemi
nalista ai dati sulla pandemia è il blog “COVID di controllo del virus. Leggiamo così del dilem-
from the margins”, coordinato dalla Big Data ma nel rendere visibili i migranti durante la
from the South Research Initiative. pandemia, dei rischi connaturati al sistema
In esso, una serie di contributi raccontano l’im- di welfare indiano basato su dati biometrici,
patto della pandemia con uno sguardo focaliz- o delle sfide del lockdown per la comunità
 LGBTQ+.
Capitolo 1 • Dietro ai dati, le persone 11

 Pagina principale del blog COVID from the margins.

Per chiudere, un esempio di data feminism che dei team. La più evidente già da ora è la dise-
si occupa di colmare un imperdonabile vuoto guaglianze di genere: su 271 persone apparte-
nei dati sul potere ai tempi del COVID: Nel dub- nenti alle 17 task force mappate, solo 80 sono
bio… Task Forse! donne. Ma, con l’aggiunta di nuovi dati nella
L’iniziativa civica, dell’associazione Ondata, piattaforma, le disuguaglianze che possono
cerca di tener traccia di tutte le task force istitu- emergere saranno anche altre: quante persone
ite dal governo per far fronte all’emergenza sa- provenienti da background umanistici? Quante
nitaria e di tutte le persone che ne hanno fatto provengono dalle diverse regioni italiane? Che
parte. Dati fondamentali, ma non pubblicati in professioni svolgono? Quante provengono da
maniera trasparente dalle istituzioni. comunità minoritarie? Perché, se c’è una cosa
 che decenni di femminismo ci hanno insegnato,
Il progetto si basa sul contributo di cittadine e
 è che la diversità di prospettive è un elemen-
cittadini, che posso utilizzare la piattaforma in
 to imprescindibile per un lavoro di squadra
cui sono pubblicati i dati per suggerire nuove
 inclusivo e d’impatto.
informazioni o completare quelle esistenti. Una
vera e propria mappatura del potere fatta dal
basso. I dati raccolti saranno essenziali per di-
mostrare le disuguaglianze esistenti all’interno
Capitolo 1 • Dietro ai dati, le persone 12

 Pagina di monitoraggi della Task force per la fase 2, sulla piattaforma Nel dubbio… Task
 Forse!

_Qualche spunto per
diventare femminista
dei dati
Se volete iniziare un progetto di raccolta dati
femminista e siete a corto di idee, potete scor-
rere la lista pubblicata da The Library of Mis-
sing Datasets: un elenco di tutti i dataset che
dovrebbero esistere, perché rilevanti per le co-
munità e le persone più vulnerabili, ma che non
esistono. Sono dataset mancanti perché maga-
ri l’investimento necessario a raccoglierli non
supera un’analisi istituzionale di costi-benefici,
per esempio se riguardano un gruppo minorita-
rio della popolazione.
Oppure sono dati che mancano di proposito,
perché a chi è al potere interessa tenerli nasco-
sti, come potrebbe essere il caso degli assassini
ad opera della polizia USA.
Capitolo 1 • Dietro ai dati, le persone 13

Cosa sono i thick data e
come usarli in tempi di crisi
28 maggio 2020 | Donata Columbro

Il limite dei dati ufficiali della pandemia potrebbe essere mitigato
dall’osservazione etnografica e la raccolta di dati qualititativi: facciamo entrare
i thick data nelle normali procedure di analisi e ricerca.

Stiamo raccogliendo dati su scala mondiale, Wang, la prima ad averne parlato nel mondo
nazionale, regionale, comunale, abbiamo tutto, business, definisce come dati che emergono da
cosa potrebbe mai andare storto nella ge- metodi della ricerca qualitativa ed etnografica
stione di una crisi sanitaria globale? con l’obiettivo di rivelare le emozioni e le storie
Molte cose, se non si guarda abbastanza in pro- delle persone.
fondità. Se a fianco delle statistiche ufficiali non Letteralmente, dati che aggiungono spessore
viene fatta osservazione sul campo, raccolta o densità a un fenomeno osservato con lenti
delle testimonianze da parte di chi è in prima quantitative.
linea, analisi a livello locale. Parliamo sempre
di dati, ma di piccole dimensioni, capaci di farci
vedere nuove sfaccettature di uno stesso argo-
mento: sono i thick data, che l’etnografa Tricia
Capitolo 1 • Dietro ai dati, le persone 14

_Dai dati ufficiali ai thick In più, chi ha guardato questi dati ogni giorno,
 da vicino, ad un certo punto si è accorto di un
data, una cronologia altro problema, oltre agli errori e alle impreci-
 sioni di cui abbiamo già detto: quello che i dati
 raccontavano non era rappresentativo della
Dall’inizio della pandemia in Italia la Protezio- realtà.
ne civile e i sistemi sanitari regionali hanno co-
 Soprattutto nelle zone più colpite della Lombar-
minciato a raccogliere dati per capire cosa stava
 dia, come la provincia di Bergamo, i sindaci e i
succedendo e valutare le decisioni da prendere
 cittadini hanno cominciato a percepire che quei
per contenere il virus: casi positivi, casi totali,
 numeri dei decessi comunicati in modo ufficiale
decessi, persone in ospedale, sono i numeri
 non corrispondevano a quanto vedevano acca-
che vediamo ogni giorno nel bollettino del-
 dere sotto i loro occhi.
la Protezione civile.
 E poi, oltre alle sensazioni, una piccola prova
Questi dati, accumulati nel tempo, servono in
 empirica: le pagine dei necrologi dell’Eco di
teoria a valutare l’efficacia di misure come quel-
 Bergamo più che triplicate nel mese di febbraio.
le del lockdown e del distanziamento fisico,
 Qualcosa non tornava.
adottate ormai in tutti i paesi colpiti dal virus –
con poche eccezioni. L’intuizione di Isaia Invernizzi, giornalista del
 quotidiano locale, è stata quella di mettere da
Il limite di questi dati lo abbiamo visto quasi su-
 parte le statistiche ufficiali sulla pandemia e cer-
bito: le persone che hanno presentato sintomi
 carne altre, per confermare le testimonianze di
– anche quando in diretto contatto con infetti –
 chi diceva sottovoce, sperando di sbagliare, “i
non sono state testate, le regioni hanno sistemi
 morti sono molti di più”. Dalla sua parte aveva
di raccolta e pubblicazione non omogenei che
 i sindaci che avevano sotto mano i numeri dei
difficilmente permettono il confronto, i dati a
 decessi nel proprio territorio.
livello comunale non sono disponibili per tutte
le regioni e quando ne viene richiesto l’accesso Parte quindi un’indagine sulla mortalità nei pri-
non si ottiene una vera e propria risposta uti- mi tre mesi del 2020 con un confronto negli anni
le. precedenti e purtroppo emerge che i morti sono
 più del doppio rispetto ai morti ufficiali.

 INTWIG @in_twig • 26 marzo

 Parte una #indagine con @webecodibergamo per valutare l’impatto reale
 del #Covid19 a #Bergamo analizzando il numero dei decessi nei 243 comuni
 della provincia avvenuti nei primi tre mesi del 2020 per confrontare la mortalità
 rispetto agli anni precedenti @EasyInve @AldoCristadoro
Capitolo 1 • Dietro ai dati, le persone 15

 Comune di Bergamo @ComunediBergamo • 1 aprile

 Un dovere in un momento come questo: se vogliamo davvero capire la
 situazione sul territorio dobbiamo costruire dati affidabili (quelli ufficiali non lo
 sono) per consentire alle autorità sanitarie e agli esperti di costruire analisi e
 strategie. Grazie a @EasyInve e @in_twig.

 Isaia Invernizzi @EasyInve • 26 marzo

 “L’allarme che avevo lanciato insieme agli altri sindaci mi sembra
 fondato - spiega il sindaco di #Bergamo @giorgio_gori -. Questi dati
 aiutano a capire l’esatta dimensione del contagio”. Grazie a
 @ComunediBergamo per aver sostenuto l’indagine.

A livello nazionale i dati di Istat sulla mortalità il rapporto sull’impatto dell’epidemia sulla
dei comuni più colpiti dal virus diventano pub- mortalità.
blici il 1 aprile e il 4 maggio viene pubblicato
 Penso al governo indiano che aveva deciso di
_I thick data come guida usare un’app per tracciare i contagiati, dimenti-
 candosi di come le persone si comportano negli
Quando Tricia Wang ha nominato i “thick data” ospedali”, ci racconta. Per due mesi il numero di
sul palco della TED nel 2017 ha detto che “usare telefono associato ai contagiati era quello dei
solo i big data aumenta la possibilità di perdersi propri parenti, segnalati come “positivi al virus”
qualcosa, mentre ci dà l’impressione di sapere anche senza essere mai stati testati. Una volta
tutto”. Wang aveva condotto una ricerca etno- in ospedale infatti i familiari segnalavano il pro-
grafica per conto di Nokia in Asia, ma le sue in- prio numero ai medici per conoscere le condi-
tuizioni, dopo anni passati a fare “osservazione zioni di salute dei propri cari, ma quel numero
partecipante”, come gli antropologi, non ven- veniva erroneamente caricato sull’app come
nero considerate da Nokia, che preferì lasciarsi appartenente ai contagiati.
guidare da sondaggi e ricerche di mercato su I thick data sono quindi “preziosi dati di carat-
larga scala – e tutti sappiamo come è andata a tere personale, come storie, interazioni ed emo-
finire per l’azienda finlandese. zioni che non possono essere quantificate”. In
In una crisi sanitaria i thick data ci aiutano a India ascoltare le testimonianze dagli ospedali
capire aspetti della pandemia che altrimen- avrebbe evitato due mesi di dati raccolti inutil-
ti rischiamo di accantonare perché relativi a mente.
esperienze dei singoli o legati a un contesto “I nostri sistemi di big data hanno bisogno di
locale. persone come gli etnografi e i ricercatori per
È d’accordo anche Giulio Quaggiotto, respon- raccogliere i cosiddetti dati densi”, diceva Wang
sabile del settore Innovazione nella regione nel 2017. “Abbiamo anche bisogno che sia in-
dell’Asia-Pacifico per l’UNDP, che del tema è un centivato il dialogo tra i dati quantitativi e qua-
esperto in relazione alla cooperazione in- litativi per individuare insight e significati a ciò
ternazionale: “Si può assolutamente parlare di che accade”, scrive oggi Alice Avallone in un
thick data anche in questo caso. pezzo sull’urgenza di avere “umanisti dei
 dati”.
Capitolo 1 • Dietro ai dati, le persone 16

 Stanno raccogliendo dati e testimonianze dal
_I thick data post crisi basso per capire come accompagnare questa
 transizione, che probabilmente sarà lunga?
Stiamo vivendo una crisi che ha altri aspetti ol- Forse non in tutti i settori.
tre quello sanitario. Ci sono state molte iniziative private, come
C’è quello economico, quello sociale, educativo, quelle di Design For Emergency, con una ri-
ed è per questo che il governo ha istituito delle cerca sulle emozioni degli italiani avviata già nei
task force per analizzare i modi migliori per ac- primi mesi del lockdown, e la CoviDesignJam
compagnare la transizione dal blocco totale alla organizzata a maggio da Digital Entity e Nois3
graduale riapertura. Ma questi gruppi di esperti per “progettare le relazioni del futuro”, ma al
stanno usando un approccio thick data? momento non siamo a conoscenza di iniziative
 istituzionali.

 Fonte: From big to thick data: how do we make sense of the impacts of Covid 19?

 La visualizzazione dell’indagine di Design For Emergency.
Eppure questi due ultimi casi sono un’ottima raccolta dati, mettersi nei panni degli altri, testa-
ispirazione, perché l’approccio dei thick data re e poi prendere decisioni. Anche in fase 2.
assomiglia a quello del design thinking: ascolto,
Capitolo 1 • Dietro ai dati, le persone 17

La disparità di genere,
spiegata con i dati
(che non ci sono)
5 marzo 2020 | Donata Columbro

Senza i dati sulle donne il mondo è progettato per l’essere umano di default, il
maschio. Ecco il gender data bias raccontato dalla giornalista Caroline Criado
Perez.

Questo libro “è tutto quello che abbiamo sem- fermato in ogni pagina dai dati che Criado Perez
pre saputo e sentito sulla disparità di genere ma ha raccolto per dimostrare che viviamo in un
BASATO SUI DATI!”. mondo progettato per l’essere umano di de-
 fault: il maschio.
Il tono dei messaggi che ho mandato alle mie
amiche durante la lettura del libro di Caroline
Criado Perez era più o meno questo, maiuscole
comprese.
Anche se, in realtà, Invisible Women. Exposing
Data Bias in a World Designed for Men (usci-
to in Italia per Einaudi con il titolo Invisibili)
racconta proprio di dati che non ci sono, non
vengono raccolti o presi in considerazione.
In ogni settore: dall’arte alla medicina, dalla pro-
gettazione degli spazi pubblici alla prevenzione
della violenza sulle donne.
Criado Perez è un’attivista inglese, diventa-
ta popolare con una campagna di successo su
Change.org per portare il volto di Jane Austen
sulle banconote da 10 sterline dopo che la Ban-
ca di Inghilterra aveva deciso di sostituire l’eco-
nomista Elizabeth Fry – unico volto femminile
sulle banconote oltre alla Regina – con Winston
Churchill.
L’attenzione all’assenza delle donne è sempre
stata oggetto delle sue battaglie e del suo inte-
resse, anche come giornalista. La copertina del libro Invisible Women.
 Exposing Data Bias in a World Designed for
Tutto quello che non funziona o che mette le Men (Caroline Criado Perez, 2019).
donne in una posizione sfavorevole rispetto agli
uomini (bianchi, caucasici) sembra essere con-
Capitolo 1 • Dietro ai dati, le persone 18

 viene detto da sempre che il motivo per cui vi
_Spazi pubblici che è più coda davanti alle toilette è la nostra vani-
 tà, amiamo truccarci e sistemarci allo specchio.
discriminano le donne Ma la verità è un’altra: i bagni pubblici sono pro-
 gettati per gli uomini. In un ambiente come un
Quando si raccolgono i dati, però, le cose cam- teatro, un cinema, lo spazio destinato ai bagni è
biano: uno studio effettuato a Vienna negli anni uguale in metri quadri tra uomini e donne, ma
Novanta ha dimostrato che dopo i 10 anni la se un bagno maschile ha sia gli orinatoi che i ga-
presenza delle bambine nei giardini pub- binetti la quantità di persone che possono usu-
blici e nelle aree gioco diminuisce in modo fruirne è maggiore per metro quadrato rispetto
significativo. a un bagno per le donne. Ecco un bel caso di
Ma invece di pensare semplicemente che le disparità “nascosta” dai dati che non vengono
bambine avrebbero dovuto vincere la timidez- presi in considerazione. Criado Perez mette an-
za, le autorità locali hanno capito che c’era qual- che in discussione l’assunto secondo cui se non
cosa di sbagliato nella progettazione dei parchi. ci sono donne in un certo ambito lavorativo è
Così hanno cominciato a raccogliere altri dati, perché non sono brave abbastanza: basti sape-
scoprendo che il problema risiedeva negli spa- re che le audizioni “alla cieca” nelle orchestre
zi troppo ampi, in cui le ragazze si sentono in hanno aumentato del 50% la proporzione di
competizione con i maschi, ma anche troppo donne assunte.
insicure per accedere in spazi dove vi è già una Criado Perez mette anche in discussione l’as-
presenza di coetanei. Se un parco viene invece sunto secondo cui se non ci sono donne in un
suddiviso in aree giochi più piccole ecco che la certo ambito lavorativo è perché non sono
presenza femminile aumenta. brave abbastanza: basti sapere che le audizio-
Un altro caso è la progettazione dei bagni ni “alla cieca” nelle orchestre hanno aumentato
pubblici: le donne ci impiegano 2,3 volte più del 50% la proporzione di donne assunte.
degli uomini a espletare i propri bisogni e ci

 Fonte: Mona Chalabi per il Guardian.
Capitolo 1 • Dietro ai dati, le persone 19

 »» i dati includono contenuti prodotti da es-
_Cos’è un data bias seri umani che possono contenere bias
e quali sono le sue contro alcuni gruppi di persone.
 Secondo Criado Perez le conseguenze di questo
conseguenze bias sono in ogni ambito, anche dove non cre-
 diamo possano esistere differenze tra uomini e
 donne. E il motivo è che i dati su queste diffe-
Questo data bias di cui si parla nel libro pena-
 renze non ci sono, o non vengono presi in con-
lizza le donne a livello professionale e nella vita
 siderazione.
pubblica, ma può costare anche in termini di
salute ed è in alcuni casi questione di vita o di Uno dei primi esempi presentati del libro è la
morte, come dimostra nella sezione tutta dedi- pulizia delle strade in Svezia dopo una ne-
cata alla medicina. vicata: i passaggi per le auto sono liberati
 prima rispetto ai marciapiedi, e questo pe-
Il bias in statistica è una deviazione dal valore
 nalizza le donne. Sì, perché le donne hanno
medio. Come ricorda Annamaria Testa in
 più probabilità di andare a piedi o usare i mezzi
questo articolo il termine deriva dal francese
 pubblici per spostarsi – due terzi dei passeggeri
biais, che significa “obliquo, inclinato” e che a
 dei trasporti pubblici sono donne in Francia, per
sua volta deriva dal latino e, prima ancora, dal
 esempio – e soprattutto la loro traiettoria rara-
greco epikársios, obliquo.
 mente è una linea retta casa-lavoro, ma com-
Un bias nel campo dei dati porta a percezioni prende diverse deviazioni relative alla cura e
errate, perché i dati a disposizione non sono alla gestione dei figli o dei genitori anziani. Uno
rappresentativi della popolazione o del feno- studio ha dimostrato che il 79% degli infortuni
meno di studi. dei pedoni avviene d’inverno e di questi il 69%
Come spiega Prabhakar Krishnamurthy in Un- riguarda le donne, per un costo di 3,2 milioni di
derstanding Data Bias esistono anche questi sterline per la sanità svedese. Quello che Criado
due casi: Perez sostiene per tutto il libro è che il prezzo
 »» I dati non includono variabili che rappre- per non prendere in considerazione le donne è
 sentano in modo appropriato il fenomeno molto più alto rispetto a un atteggiamento che
 che vogliamo prevedere le includa.

 struale, che colpisce il 90% delle donne. Il corpo
_Il corpo umano delle donne presenta troppe variabili per poter
di default è quello essere incluso negli studi accademici, e nemme-
 no per essere coinvolto nei test dei medicinali.
maschile Questo presenta serie conseguenze sulla salu-
 te delle donne: se hai mai ascoltato i racconti di
 un’amica che abbia provato a ottenere una dia-
L’anatomia si studia sul corpo degli uomini. An-
 gnosi di endometriosi per i suoi “dolori da ciclo”,
che qui, c’è un dato a dimostrarlo: con un’ana-
 specialista dopo specialista, rimandata a casa
lisi sui libri di testo raccomandate dalle venti
 con antidolorifici e un consiglio sul “rilassarsi”,
università più prestigiose di Europa, Stati Uniti
 sai di cosa stiamo parlando.
e Canada, su 16329 immagini usate per rap-
presentare il corpo umano quello degli uo- In più: in Gran Bretagna le donne hanno il 50%
mini è presente tre volte di più rispetto al di probabilità in più di ricevere una diagno-
corpo femminile, considerato “una devia- si sbagliata dopo un attacco di cuore, perché
zione”. in genere “colpisce gli uomini”. Criado Perez
 smonta anche questo dato. Il fatto è che nelle
Questo influisce sullo sviluppo di tutti i rami del-
 donne i sintomi sono diversi rispetto a quelli
la medicina: ci sono cinque volte più studi sulla
 degli uomini e quindi non vengono presi in con-
disfunzione erettile che sulla sindrome preme-
 siderazione.
Capitolo 1 • Dietro ai dati, le persone 20

_Cambiamento di
prospettiva
Prima di leggere questo libro di Criado Pe-
rez non avevo mai preso in considerazione la
mancanza di dati – sul 50% della popolazione!
– come causa della cattiva progettazione di toi-
lette, fermate dell’autobus (sì, ci sono esempi
anche su questo, per la prevenzione delle mo-
lestie sessuali) e altri spazi pubblici. Ed ero ben
consapevole della discriminazione delle donne
sul lavoro, ma davo per scontato che fosse un
atteggiamento “culturale”, o del singolo, della
cattiva volontà di alcune aziende. Il fatto che ci
siano dati che provano ogni discriminazione e
le fanno risalire a “errori” di progettazione an-
che molto lontani nel tempo da un certo punto
di vista mi rassicura: non sono scelte delibe-
rate, vi è una mancanza di prospettiva che
include il genere femminile perché non ci sia-
mo fatti le domande giuste – o non ce ne siamo
fatte, e basta.
Questo libro ci dice che se hai dei dati a dispo-
sizione ne stai escludendo altri: non sono mai
stati raccolti? chi escludono? cosa puoi fare per
avere una visione più comprensiva della realtà?
Mai fermarsi e pensare che “basato sui dati” sia
la risposta giusta.
21

Capitolo 2

Da data consumer
a data conscious.
Spunti per leggere dati e
visualizzazioni con spirito
critico
In questa sezione troverai articoli che ti aiuteranno a interpretare
correttamente statistiche, grafici e mappe. Sebbene i testi proposti
riguardino tutti dei casi studio specifici, potrai facilmente astrarre i principi
generali da applicare in futuro ogni volta che incontri dati e visualizzazioni.
Perché è importante usare sempre il tuo senso critico di fronte a chi
snocciola dati e visualizzazioni, sia che lo faccia in buona fede che con
intento manipolatorio.

INDICE

 1. Guida al data-checking: 3 modi per informarsi meglio con i 22
 dati

 2. Stiamo vivendo il primo evento data-informed della storia. 26
 Ma non siamo ancora pronti

 3. Nuovo coronavirus, i dati ufficiali sull’Italia sono affidabili? 29

 4. Come raccontare le elezioni con grafici e mappe 33

 5. La mappa con i roghi dell’Australia: c’è qualcosa che non 40
 funziona in questa data visualization?
Capitolo 2 • Da data consumer a data conscious 22

Guida al data-checking: 3
modi per informarsi meglio
con i dati
23 luglio 2020 | Nicola Bruno

Il limite dei dati ufficiali della pandemia potrebbe essere mitigato
dall’osservazione etnografica e la raccolta di dati qualititativi: facciamo entrare
i thick data nelle normali procedure di analisi e ricerca.

“La data visualization si porta dietro un’aura di Esistono altre fonti che confermano questi dati?
certezza: le linee pulite, le forme geometriche Di fronte a un dato, una tabella o una data vi-
e le fonti rispettabili trasmettono autorità. Ma sualization dovremmo sempre porci queste do-
queste convenzioni possono danneggiarci…” mande.
Così afferma Catherine D’Ignazio, ricercatri- Eppure, troppo spesso, ancora non avviene tut-
ce al MIT, tra le maggiori esperte di data-literacy to ciò.
al mondo.
 In piena emergenza coronavirus ha fatto molto
Proprio questa “aura di certezza” sta diventando discutere il caso di Worldometer, aggregatore
il perfetto cavallo di Troia per campagne di pro- di statistiche live, utilizzato da moltissime te-
paganda e disinformazione. Che ormai non ci state intorno al mondo, dal New York Times al
arrivano più solo sotto forma di “notizie false” o Financial Times, fino ad arrivare alle nostre La
foto-montaggi, ma anche di dati, tabelle e visua- Repubblica e Ansa.
lizzazioni ingannevoli.
 Un’inchiesta della CNN ha rivelato non solo la
Per iniziare a informarsi meglio con i dati, in Da- presenza di dati sbagliati su Worldometer, ma
taninja ci piace unire due approcci: anche la difficoltà a capire chi ci fosse dietro al
 »» fact-checking: la capacità di stabilire l’at- progetto – probabilmente un italiano con resi-
 tendibilità di un contenuto o una fonte denza a Bologna, ma di più non si sa, perché i
 »» data literacy: la capacità di saper leggere, fondatori hanno ben nascosto le proprie tracce.
 analizzare e comunicare con i dati Nessuna testata del calibro del New York Times
Il risultato è un approccio che chiamiamo da- o del Financial Times pubblicherebbe mai una
ta-checking e che abbiamo iniziato a sperimen- notizia proveniente da un blog sconosciuto, che
tare in alcuni workshop e progetti educational. non dichiara chi c’è dietro. Perché lo stesso non
 avviene (ancora) con i dati?
Nella sua versione base, il data-checking sug-
gerisce di prestare attenzione a tre questioni: L’attendibilità delle fonti va verificata in parti-
 colar modo quando ci troviamo di fronte a da-
1/ AFFIDABILITÀ
 ta-mix, come ad esempio la famosa dashboard
Qual è la fonte primaria? della John Hopkins University che ha incluso tra
Chi c’è dietro? Che interessi persegue? le proprie fonti Worldometer senza una verifica
Sono disponibili meta-dati che permettono di della sua attendibilità, contribuendo così a dif-
capire come e quando i dati sono stati raccolti fondere i suoi dati poco affidabili.
ed elaborati?
Capitolo 2 • Da data consumer a data conscious 23

2/ CORRETTEZZA Prendiamo i famosi “35 euro” dati come “sti-
Come per le dichiarazioni o le fotografie, anche pendio giornaliero” ai “profughi”. Anzi, “regala-
per i dati si può partire da informazioni autenti- ti” secondo questo tweet del leader della Lega
che e attendibili, ma piegarle a una particolare Matteo Salvini:
lettura di parte.

 Matteo Salvini @matteosalvinimi • 17 set 2017

 #Salvini: Mi vergogno di un governo che dà 280 euro al mese ai disabili e regala
 35 euro al giorno a chi sbarca domani. #Pontida17

Il dato dei 35 euro è corretto: si tratta di una fra vada in tasca al migrante. La maggior parte
stima effettuata dal Ministero dell’Interno su (32,5 euro) vanno a chi si occupa della gestione
quanto costi in media al giorno l’accoglienza di dell’accoglienza; solo 2,5 euro possono essere
un migrante adulto. dati come “pocket money” nelle mani del richie-
È del tutto scorretto, però, dire che questa ci- dente protezione internazionale.
Capitolo 2 • Da data consumer a data conscious 24

Simile a questo uso scorretto dei dati è poi il In questo caso si sfruttano le potenzialità visive e
cherry-picking, letteralmente “raccogliere le narrative della data-visualization: un colore, una
ciliege” facendo attenzione a prendere solo forma, una rappresentazione sono portatrici di
quelle più buone. Una tentazione molto facile messaggi che ci parlano in maniera diretta, an-
quando si analizzano lunghe serie di dati e se ne che senza leggere bene i dati o le informazioni.
estrapola solo una parte per far passare un pre- Gli esempi di #horrorchart purtroppo sono
ciso messaggio. sempre più frequenti, come ad esempio questa
3/ FUNZIONALITÀ visualizzazione – molto di parte – sugli effetti
Un dato può mentire non solo perché non è at- dell’Obama-care, in cui è stato troncato l’asse
tendibile, oppure perché è riportato fuori con- delle X per far apparire più lontano l’obiettivo
testo, ma anche perché ci viene presentato in finale.
maniera ingannevole.

Per comunicare in maniera funzionale i dati bi- Altre indicazioni sono presenti in questo inte-
sognerebbe sempre attenersi ad alcune regole ressante video di Filippo Mastroianni.
base, come ad esempio: Ovviamente non è facile distriscarsi tra i livelli di
 »» non troncare l’asse delle x (come fatto nel- attendibilità/correttezza/funzionalità, soprattut-
 la visualizzazione sopra) to ora che la data-visualization sta diventando
 »» rendere costanti i valori degli assi uno dei tanti campi di battaglia del marketing
 politico (e non solo).
 »» non fermarsi ai valori assoluti (soprattutto
 in una mappa) Ma è un esercizio che dobbiamo iniziare a fare
 sempre più spesso.
 »» evitare le rappresentazioni poco pertinen-
 ti (come ad esempio i grafici a torta)
 »» usare i colori in modo appropriato
 »» preferire visualizzazioni di facile compren-
 sione a quelle più d’impatto ma meno ef-
 ficaci
Capitolo 2 • Da data consumer a data conscious 25

Questa mappa twittata da Trump è sia atten- zionale (la visualizzazione coropletica è perfetta
dibile (i dati sono quelli ufficiali delle contee per rappresentare la distribuzione geografica di
dove Trump ha vinto contro Clinton) che fun- un dato).

Ma è del tutto scorretta per il messaggio che Tru- anzi, a vedere i voti assoluti, Trump ne ha ricevu-
mp vorrebbe dare: non visualizza i valori assolu- ti meno della Clinton.
ti dei voti ricevuti, ma solo la loro distribuzione;

 Mappa tratta dal libro di Alberto Cairo “How charts lie”.

Ecco perché non possiamo più permetterci di una rappresentazione su un altra e, soprattutto,
fermarci solo a “guardare” i dati o le loro visua- se è credibile il messaggio finale che vorrebbe
lizzazioni; dobbiamo sempre chiederci chi c’è trasmetterci.
dietro, che fonti ha usato, perché ha preferito
Capitolo 2 • Da data consumer a data conscious 26

Stiamo vivendo il primo
evento data-informed
della storia. Ma non siamo
ancora pronti
7 maggio 2020 | Nicola Bruno

Dal bollettino serale della Protezione civile alle infografiche casalinghe
condivise su Whatsapp, l’emergenza coronavirus ci ha catapultati in un mondo
di dati, grafici e tabelle.

Tra gli effetti secondari dell’emergenza corona- »» La scala logaritmica e R0
virus, c’è stato quello di averci calato per tre lun- »» Le mappe del contagio
ghi mesi in un mondo di dati, grafici e tabelle.
 »» Le infografiche fai-da-te ricevute via
 »» Il rito quotidiano delle 18 con i dati della WhatsApp
 Protezione Civile
 »» I politici che hanno “bisogno di certezze
 »» La tabella giallo-verde-rossa-arancio- dalla scienza”
 ne fissa sulle prime pagine dei quotidiani
 »» La “curva” da appiattire

 Dati sul contagio da #covid19 nella città di New York rielaborati da Accurat, lo studio fondato
 da Giorgia Lupi. Fonte: Fast Company
Capitolo 2 • Da data consumer a data conscious 27

La quarantena ci ha fatto scoprire un nuovo journalism” con i “contenuti generati
centro di gravità permanente: i dati. E questo è dagli utenti”
avvenuto a diversi livelli: da quello decisionale »» La “Rivoluzione Verde” in Iran del 2009 ci
della politica e della sanità, passando per le mi- ha aperto le porte dei video amatoriali
gliori inchieste giornalistiche, fino ad arrivare per aggirare la censura di stato
alle nostre piccole scelte quotidiane (“vado o
 »» Il terremoto ad Haiti del 2010 è stato il pri-
non vado a fare la spesa dopo i dati bruttissimi
 mo “Twitter event” della storia digitale
di ieri?”).
 »» La “Primavera Araba” del 2011 ha portato
Come mi ha detto la collega Francesca Folda:
 Facebook e gli altri social media al cen-
 “Sono rimasta stupita nel notare come – rispet- tro delle piazze della protesta
to a 15 anni fa quando si impazziva a trovare
 »» Le elezioni Usa del 2016 ci hanno fatto
dati internazionali che non risalissero a più di
 aprire gli occhi sulle “fake news” e sui ri-
5 anni prima – oggi in questa crisi abbiamo
 schi di polarizzazione degli algoritmi svi-
una mole di dati centralizzati, dettagliati a
 luppati dalle grandi piattaforme.
livello globale mai vista prima. Ecco, questo
mi ha fatto pensare che se la guerra del Golfo Ora, il connubio coronavirus-dati ci ha fatto
ha segnato il nascere dell’all-news e altri grandi toccare con mano cosa vuol dire vivere in un
fatti di attualità hanno segnato il via del mobi- mondo data-informed. E cioè un mondo in cui
le journalism, del citizen journalism etc, questa i dati sono influenzano molte delle nostre deci-
pandemia è la prima crisi in cui il giornalismo è sioni.
data driven, in tempo reale e a livello globale”. È vero: oggi abbiamo fantastici database ag-
In effetti, tutte le grandi crisi produco- giornati in tempo reale, bellissime visualiz-
no sempre un passo in avanti nel mondo zazioni alla portata di tutti, dashboard cu-
dell’informazione: ratissime e più consapevolezza sui modelli
 matematici.
 »» Il modello delle reti all-news in stile CNN
 è nato proprio con la Guerra del Golfo del E questo ci aiuta sicuramente a informarci me-
 1991 glio, a far prevalere i fatti sulle emozioni, a far-
 ci passare in pochi secondi dal micro (la nostra
 »» Gli attentati del 5 Luglio 2005 a Londra
 città o addirittura il marciapiede) al macro (la
 hanno segnato una svolta per il “citizen
 situazione nel mondo).

 La mappatura dei marciapiedi di Milano e il distanziamento sociale. Fonte: Systematica
Capitolo 2 • Da data consumer a data conscious 28

 parziali, modificati in corso d’opera, blinda-
_Sappiamo leggere i ti in impietosi file pdf, a volte accompagnati
 da inquietanti asterischi.
dati?
 Anche gli scienziati e i giornalisti – che sui dati
 dovrebbero essere più avanti rispetto ai politici
Al tempo stesso, però, l’emergenza coronavirus – hanno dato il proprio contributo, condividen-
ha fatto emergere anche una totale mancanza do “grafici dell’orrore” che hanno fatto saltare
di cultura dei dati. A cominciare dalle istitu- più di un dataninja sulla tastiera.
zioni che in questi mesi hanno pubblicato dati

 Come i grafici possono mentire: il totale di un grafico a torta dovrebbe essere sempre 100%
 (via Filippo Mastroianni)

A proliferare in questo buco nero è poi stata Da una parte ciò è un bene: favorisce la velocità
tutta la macchina della disinformazione: dalle di adozione di un’innovazione, facendola uscire
tabelle virali su WhatsApp alle simulazioni dalle nicchie e portando i suoi benefici a tutti.
imprecise sui dati Istat, passando per le info- Dall’altra parte, però, si rischia di creare un effet-
grafiche senza ombra di fonte, i complotti e to boomerang se questa adozione non è accom-
le illazioni razziste basate su analisi caserec- pagnata da una piena consapevolezza.
ce, i dati ufficiali estrapolati fuori contesto,
 Rispetto al passato ora abbiamo però un van-
i “numeri smentiti”, le percentuali sballate, i
 taggio: sappiamo che bisogna colmare al più
metri di distanza ripresi da studi poi ritrat-
 presto la mancanza di una cultura dei dati. E
tati.
 proprio per questo a Dataninja siamo al lavo-
Tutta questa disinformazione si è alimen- ro per diffondere la data-literacy a tutti i livelli:
tata e ha viaggiato più velocemente anche da quelli professionali con i corsi della nostra
grazie a una scarsa cultura dei dati. School, fino ai contesti educativi con un proget-
L’abbiamo già visto con tutte le innovazioni del to di media e data literacy rivolto alle scuole se-
passato: nella prima fase molti si appropriano di condarie di tutta Italia.
nuovi strumenti senza conoscerli troppo.
Capitolo 2 • Da data consumer a data conscious 29

Nuovo coronavirus, i dati
ufficiali sull’Italia sono
affidabili?
26 marzo 2020 | Alessio Cimarelli

Una breve sintesi della storia e dei problemi dei principali indicatori usati
per tracciare l’andamento dell’epidemia da coronavirus in Italia: contagiati,
ricoverati in terapia intensiva, deceduti.

L’11 marzo scorso l’Organizzazione Mondiale demia in un bollettino quotidiano a partire
della Sanità ha dichiarato lo status di pande- dal 24 febbraio, poi pubblicato anche in for-
mia per la diffusione del virus SARS-CoV-2 nel mato aperto nel repository Github ufficiale a
mondo. In Europa il primo paese ad affrontare partire dal 7 marzo. Più o meno da allora si con-
quella che era ancora un’epidemia è stata l’Italia dividono e discutono analisi e visualizzazioni di
con la dichiarazione dello stato di emergen- questi dati a tutti i livelli, da quelli istituzionali, a
za sanitaria del 31 gennaio. quelli accademici, a quelli amatoriali.
Il 23 febbraio il Governo promulga le prime mi- Gli indicatori che destano più interesse sono
sure urgenti in materia di contenimento, il numero di positivi, di ricoveri, di ricoveri
mentre il Dipartimento della Protezione Civile in terapia intensiva, di decessi.
comincia a fornire i dati che quantificano l’epi-

 Tutti i numeri dell’epidemia in Italia nella dashboard ufficiale della Protezione Civile.
Capitolo 2 • Da data consumer a data conscious 30

 Negli ultimi giorni, però, sono emersi molti
_L’andamento nel tempo dubbi sull’affidabilità dei dati disponibili, con-
 fermati anche dallo stesso capo della Pro-
dell’epidemia tezione Civile, Angelo Borrelli: “il rapporto
 di un malato certificato ogni dieci non censiti
In Italia (ma non solo), l’analisi più gettonata è credibile”. Tanto che anche alcuni giornalisti
è quella dell’andamento nel tempo di que- si sono chiesti quanto siano davvero utili le
sti indicatori, in cerca di un segnale di picco (o conferenze stampa quotidiane.
flesso, a seconda che si guardano i dati giorna- In questo articolo voglio fare una breve sin-
lieri o quelli cumulati) dell’epidemia, cioè quel tesi della storia di questi indicatori, così da
momento oltre il quale la situazione andrà mi- far emergere un quadro più chiaro rispetto alla
gliorando. discreta confusione degli ultimi tempi.
Una semplice occhiata a gruppi come Phy-
sicistsAgainstSARSCoV2 o a pagine come
Coronavirus – Dati e Analisi Scientifiche e
StatGroup-19 mostra l’enorme produzione di
analisi, grafici e modelli descrittivi o previsio-
nali di questi giorni e il gran numero di persone
coinvolte.

 Una rappresentazione qualitativa degli effetti di diverse politiche di sanità pubblica sulla
 diffusione del contagio. In verde il cosiddetto picco del contagio, dopo il quale il numero di
 nuovi infetti giornalieri inizia a diminuire. Fonte: Tomas Pueyo.
Capitolo 2 • Da data consumer a data conscious 31

 Ci sono molti problemi a confrontare i dati
_Numero di positivi anche da un giorno all’altro. Il suggerimen-
 to è di non dare peso alle previsioni basate su
Inizialmente l’indicatore ritenuto più utile era il questo indicatore che ancora girano, come ben
numero di positivi, poi però si è capito che le sintetizzato dal prof. Giuseppe De Nicolao.
modalità di somministrazione dei tamponi Ci sono tentativi di stimare il numero com-
erano troppo limitate, arbitrarie, opache e plessivo di contagiati e la loro evoluzione,
ballerine e quindi si è accantonato, come anche nell’ambito di un confronto tra i paesi
ben sintetizzato da Il Post. europei, ma solo in maniera indiretta.

 capacità del sistema di far fronte al gran numero
_Ricoveri in terapia di malati, piuttosto che a un vero rallentamento
 dell’epidemia.
intensiva
 È utile quindi più per capire quanto gli ospe-
 dali sono in sofferenza, e non tanto per fare
Poi si è passati ai ricoveri in terapia intensiva, previsioni sull’andamento dell’epidemia.
ma si è presto capito che l’andamento di que-
 Discorso simile per i ricoverati normali, quindi
sto numero dipende moltissimo dagli effetti
 che non transitano necessariamente in terapia
di saturazione dei reparti ospedalieri.
 intensiva o sub-intensiva.
Qualsiasi flessione della crescita di questo indi-
catore è più probabilmente da attribuire all’in-

 Per compensare questa sottostima del nume-
_Numero di decessi ro di decessi per/con COVID-19 a fine marzo il
 Ministero della Salute prima e l’ISTAT poco
Ci si è allora concentrati sul numero di decessi dopo hanno iniziato a rilasciare i dati della mor-
(e in alcuni casi sulla somma di terapie intensi- talità per qualsiasi causa, cioè il numero di de-
ve e decessi), ma recentemente si è capito che cessi registrati alle anagrafi comunali indipen-
anche questo numero dipende fortemen- dentemente dalla causa di morte.
te dalle modalità di somministrazione dei Si tratta sicuramente di una sovrastima perché
tamponi, che sembra vengano fatti sempre non tutti i decessi possono essere attribuibili
meno post mortem, a maggior ragione se il all’epidemia, ma il confronto dell’attuale morta-
decesso avviene fuori dagli ospedali. lità delle varie regioni italiane con quella degli
Si torna quindi alle problematiche già viste per anni passati mostra un aumento considerevole,
il numero di positivi, così anche qui il suggeri- soprattutto al Nord, come già anticipato da
mento è di non dare troppo peso alle previsio- alcune inchieste giornalistiche pionieristi-
ni basate sui decessi e prendere con le pinze le che.
loro conclusioni.

 o grazie al supporto del sistema sanitario. Pur-
_Numero di guariti troppo è emerso che nemmeno questo nu-
 mero, così come rilasciato, indica davvero
Anche se non è molto utile per tracciare la dina- le persone contagiate, ammalatesi e poi
mica dell’epidemia, il numero di guariti rimane guarite, a causa di problemi derivanti dalle
comunque importante, perché quantifica chi ha modalità di raccolta dei dati a livello locale.
superato indenne la malattia, spontaneamente
Capitolo 2 • Da data consumer a data conscious 32

 di farli solo ai sintomatici gravi o a rischio non
_Modalità di permette di avere un quadro del reale an-
somministrazione dei damento dell’epidemia, a maggior ragione se
 il vettore più importante del virus è il porta-
tamponi tore asintomatico (che ha quindi il virus SARS-
 CoV-2, è contagioso, ma non ha mai o non ha
 ancora sviluppato la malattia COVID-19 o ne è
Ci sono altri indicatori ancora utili per tracciare appena uscito). Senza contare che ogni regione
l’andamento dell’epidemia? Al momento sem- ha i suoi protocolli specifici che possono esse-
bra di no, purtroppo le modalità di sommini- re anche molto eterogenei, come è il caso del
strazione dei tamponi (ai sospetti, ai ricoverati, Veneto.
ai deceduti) non sono affidabili, l’indicazione

“ Finché le modalità di somministrazione dei tamponi
 non cambiano, qualsiasi analisi dell’andamento
 di questi indicatori ha un valore predittivo molto
 limitato, se non nullo.

In attesa di un cambio di queste modalità (es. confronti tra i territori soffrono della stes-
tamponi su campioni statisticamente significati- sa incertezza: la letalità (numero di decessi
vi della popolazione, a tutti i deceduti per qual- sul numero di contagiati), la mortalità (numero
siasi motivo, a tutti quelli sospetti con un’attività di decessi sulla popolazione esposta), la preva-
di contact-tracing, ecc.), le uniche analisi con lenza (numero di contagiati sulla popolazione
un minimo di senso sono forse quelle su ter- esposta), l’incidenza (numero di nuovi conta-
ritori lontani dalla saturazione, quindi tutti giati sulla popolazione esposta). Stessa sorte
quelli in iniziale o piena fase esponenziale. Non per molte visualizzazioni, mappe, infografi-
la Lombardia, né i dati nazionali, per capirci. che e dashboard: per quanto apparentemente
Purtroppo anche altri indicatori potenzial- complete e ben fatte, il loro valore informativo,
mente utili per tracciare l’epidemia e fare almeno per l’Italia, appare quanto mai limitato.

 portante che l’attenzione sulla qualità del dato
_Cosa fare allora di tutte sia sempre altissima, sia da parte delle istituzio-
le analisi delle ultime ni che lo producono, sia da parte di chiunque
 quel dato vuole usarlo per lavoro o per infor-
settimane? marsi.

Alla luce delle problematiche descritte, alcuni
degli autori più attivi hanno iniziato a fare un
passo indietro, altri invece hanno chiarito i li-
miti di quanto fatto, pur ribadendone il valore.
Purtroppo dati inaffidabili non possono che
produrre analisi inaffidabili, per questo è im-
Capitolo 2 • Da data consumer a data conscious 33

Come raccontare le elezioni
con grafici e mappe
29 gennaio 2020 | Alice Corona

Ecco cosa possiamo imparare dalle #Elezioni2020 in Emilia Romagna.

La mattina del 27 gennaio sono stata tra i molti ha passato la notte a snocciolare dati, mappe e
italiani che si sono svegliati con l’ansia di con- grafici.
trollare i risultati del voto in Emilia Romagna. In questo post provo a tirare un po’ le somme
Per deformazione professionale la performan- di ciò che ho visto girare in rete in questi giorni.
ce che mi interessava non era solo quella dei
candidati e dei partiti, ma anche quella di chi

 grafiche risponde velocemente alla prima do-
_Raccontare gli stessi manda che un qualsiasi lettore si pone: chi ha
 vinto nel mio comune? Ma questo tipo di rap-
dati con grafici diversi presentazione semplifica molto la complessità
 di quanto avvenuto, lasciando molte domande
Tutta la mia riflessione parte da due domande: in sospeso e non stimolando alcun pensiero
come possiamo raccontare i dati elettorali cam- critico nel lettore. Il voto in Emilia Romagna si è
biando angolo narrativo? Come cambia la no- caricato di un alto significato simbolico proprio
stra percezione della realtà quando guardiamo per la storia della regione, governata ininter-
i dati attraverso mappe più complesse, ricche di rottamente da partiti di (centro) sinistra fin dal
sfumature? 1970, quando nascono le regioni. È inevitabile
Una mappa elettorale che ci dice solamente chi valutare il risultato del 2020 alla luce di quelli
ha vinto e chi ha perso nelle diverse aree geo- precedenti.

 Esempio di classica mappa elettorale. Fonte: SkyTg24.
Puoi anche leggere