CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI - Una raccolta dei nostri migliori contenuti gratuiti - Dataninja Magazine
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
CONTENUTI E RISORSE PER CAPIRE IL MONDO CON I DATI Una raccolta dei nostri migliori contenuti gratuiti DATA SUMMER Dormire, ma 1 ora Dormire Serie TV Mare in arancione
CHI SIAMO Dataninja è un’azienda data-driven nata da un gruppo di lavoro basato in Italia e attivo in Europa dal 2012. La nostra missione è aiutare le persone a vivere e lavorare meglio usando i dati, e lo facciamo attraverso percorsi di formazione coin- volgenti, prodotti educativi e contenuti divulgativi basati sui dati. Trovi i nostri corsi online sulla piattaforma school.dataninja.it I contenuti di questo ebook sono stati pubblicati originariamente sul magazine o nella nostra newsletter settimanale. Dataninja è stata fondata da Andrea Nelson Mauro, Donata Colum- bro, Alessio Cimarelli e Nicola Bruno. Alla realizzazione di questo ebook hanno contribuito Alice Corona (contenuti) e Alessandro Rizzo (grafica). Attribuzione - Non commerciale - Condividi allo stesso modo 4.0 Internazionale (CC BY-NC-SA 4.0)
INDICE Capitolo 1. Dietro ai dati, le persone 5 Capitolo 2. Da data consumer a data conscious. Spunti 21 per leggere dati e visualizzazioni con spirito critico Capitolo 3. Lavorare con i dati: la parola a chi dei numeri 43 ci ha fatto una professione Capitolo 4. Data4Fun: divertirsi e giocare con i dati 59
5 Capitolo 1 Dietro ai dati, le persone In questa sezione troverai articoli che affrontano una questione fondamentale per chi lavora con i dati: il fatto che, sebbene vengano dipinti come oggettivi e assoluti, i dati sono sempre frutto del lavoro umano, che inevitabilmente porta sempre con sé dei limiti. Limiti dovuti agli strumenti tecnici usati per misurare, ma anche, e in maniera più insidiosa, ai pre-condizionamenti socio-culturali di chi si mette a misurare e descrivere il mondo. INDICE 1. Cosa vuol dire occuparsi di dati con un approccio femminista 6 2. Cosa sono i thick data e come usarli in tempi di crisi 13 3. La disparità di genere, spiegata con i dati (che non ci sono) 17
Capitolo 1 • Dietro ai dati, le persone 6 Cosa vuol dire occuparsi di dati con un approccio femminista 25 giugno 2020 | Alice Corona Lavorare con i dati attraverso un approccio femminista non vuol dire necessariamente occuparsi di donne o di questioni di genere: vuol dire occuparsi del potere. In particolare, di chi lo detiene e di chi no. Nella pratica cosa significa essere una o un femminista dei dati? Vediamolo assieme. Lavorare con i dati attraverso un approccio Nella pratica, però, cosa significa essere una o femminista non vuol dire necessariamente oc- un femminista dei dati? Ci sono molti modi per cuparsi di donne o di questioni di genere: vuol essere data feminist in ognuna delle varie fasi dire occuparsi del potere. In particolare, di chi lo del lavoro con i dati. Dalla fase di ricerca e rac- detiene e di chi no. Questo è il messaggio chiave colta dati a quella della comunicazione e visua- del libro Data Feminism di Catherine D’Igna- lizzazione, fino a ciò che avviene dopo la pub- zio e Lauren F. Klein, da cui prende ispirazione blicazione di un lavoro. In questo pezzo però ci la prima parte di quest’articolo. focalizzeremo solo sulla raccolta dati. Appunti disegnati da @elviavasc | @sketchnotes_are_awesome per il secondo capitolo del libro Data Feminism di Catherine D’Ignazio e Lauren F. Klein.
Capitolo 1 • Dietro ai dati, le persone 7 minicidio in Messico, arrivando a raccogliere _Data feminism durante informazioni su oltre 5mila storie e diventando la raccolta dei dati: la fonte più affidabile sul tema. Anche le mappe del progetto Anti Eviction cosa sono i counterdata Mapping Project (AEMP) rappresentano un chiaro esempio di counterdata. Il progetto è Tra tutte le possibilità suggerite da D’Ignazio e nato per restituire spessore ai dati sugli sfratti Klein per fare data feminism, ce n’è una che è a San Francisco. Sebbene infatti le istituzioni accessibile a chiunque, anche a chi non si sente avessero statistiche sul numero degli sfratti, particolarmente data nerd ma comunque ha a queste informazioni erano pubblicate senza al- cuore una causa: la raccolta di quelli che le au- cun tipo di contesto che permettesse davvero di trici definiscono “counterdata”. capire le dinamiche di potere che stanno dietro agli sfratti o di raccontare le storie individuali I counterdata sono tutti quei “contro-dati” che delle persone coinvolte. Grazie a una raccolta offrono una visione alternativa rispetto a quella dati più qualitativa e centrata sulle persone, il dei dati ufficialmente raccolti, per esempio con- gruppo AEMP è riuscito per esempio a far emer- teggiando ciò che non viene altrimenti conside- gere il ruolo delle compagnie tech di Silicon rato nelle statistiche istituzionali. Valley, come Google, nell’esplosione degli Un caso di raccolta di counterdata è il lavoro sfratti cosiddetti “no-fault”, ovvero senza dell’attivista messicana María Salguero che, morosità o colpe del locatore. da sola, dal 2016 sta mappando i casi di fem- Il 69% degli sfratti “no fault” ha riguardato abitazioni entro 4 isolati da una fermata di “Tech Bus”, il sistema di bus privati che trasporta i dipendenti delle aziende di Silicon Valley dalle loro case ai luoghi di lavoro.
Capitolo 1 • Dietro ai dati, le persone 8 I dati sugli assassini causati dalla polizia negli ma non aveva alcun dataset su quante volte e Stati Uniti sono un esempio invece di come i in che circostanze la polizia facesse ricorso ad counterdata, grazie alla forza dell’attivismo di un uso mortale di forza bruta. Così, tra ricerca, moltissime organizzazioni, possano entrare a far crowdsourcing e richieste FOIA, Brian Burghart parte del dibattito pubblico e della ricerca acca- e la sua squadra sono riusciti a mettere in piedi demica, spingendo poi le istituzioni a colmare il il database più comprensivo al mondo sul tema, vuoto e raccogliere i dati loro stesse. Il database con oltre 26mila episodi documentati di perso- di Fatal Encounters è nato su iniziativa di un ne morte negli USA durante un’interazione con giornalista, accortosi di come tutte le volte che la polizia, dal 2000 ad oggi. E grazie al suo sforzo una morte per mano della polizia finiva sui gior- e a quello parallelo di altri attivisti e giornalisti, nali non c’era alcun modo per contestualizzarla: dal 2015, anche l’FBI ha dichiarato che si sareb- si trattava di un episodio isolato? O del millesi- be impegnata a raccogliere dati sull’impiego di mo dell’anno? Raccontare queste morti senza forza, fatale o meno, ad opera delle forze dell’or- conoscerne i numeri complessivi o i possibili dine. pattern nelle caratteristiche delle vittime signi- ficava ignorare una storia ad altissimo interesse pubblico. Al tempo, l’FBI pubblicava in maniera centralizzata statistiche su tutti i tipi di crimini, Le prime righe, delle oltre 26 mila, del dataset Fatal Encounter sulle vittime della violenze della polizia negli USA
Capitolo 1 • Dietro ai dati, le persone 9 Infine, non si può chiudere questa sezione mancanza di dati ufficiali, il team di Obiezione senza citare il progetto counterdata italiano e Respinta ha creato un sistema in cui chiunque femminista Obiezione Respinta. In Italia – uf- può segnalare la sua esperienza con ospedali e ficialmente per motivi di privacy – mancano i farmacie, dando così vita in maniera collettiva dati sugli obiettori di coscienza nelle strutture a un database su medici e farmacisti che osta- sanitarie pubbliche. Diventa quindi impossibile colano il diritto all’aborto. Un database costru- denunciare la pervasività del fenomeno a livello ito dal basso che va a colmare un vuoto di dati complessivo e strutturale. Soprattutto, questa “dall’alto”, con lo scopo di informare e allo stes- mancanza di dati ha un impatto reale e concreto so tempo “sanzionare tutti quei luoghi che ci nella vita di chi chiede accesso a soluzioni abor- privano del diritto di scegliere e di autode- tive, spesso con urgenza. Per ovviare a questa terminarci“. Screenshot della mappa collettiva del sito Obiezione Respinta. pandemia, al di fuori di questa narrazione do- _Femminismi, minante. counterdata e pandemia Già nelle prima settimane di lockdown, l’ Atlan- tic se ne era accorto: la pandemia è un disa- COVID19 stro per il femminismo e i dati ci offrono degli indizi. Le donne sono quelle che probabilmente, Durante la pandemia COVID19 si è parlato del per stereotipi culturali o ineguaglianze salariali, primo evento data-informed della storia, più spesso rinunceranno al lavoro per badare con i dati a farla da protagonista in ogni conte- ai figli a casa da scuola. Durante una pandemia sto: dai bollettini giornalieri della Protezione Ci- l’intero sistema sanitario si concentra sul virus, a vile alle chat di Whatsapp. Mi verrebbe da stima- scapito di altri settori della sanità pubblica. Tra re però che, nella stragrande maggioranza dei le varie conseguenze di ciò, l’esperienza ebola lavori data driven di questi mesi, i dataset uti- in Africa ha dimostrato che le pandemie hanno lizzati sono stati su un unico tema: l’andamento un impatto disastroso sulla mortalità legata a della pandemia, tra mortalità e letalità, conta- complicazioni durante il parto. Chi monitorerà giati e guariti, modelli di previsione e indice R0. questi numeri? E poi, quale sarà il bilancio delle vittime di violenza domestica dopo mesi di con- Per quanto tutto ciò sia stato utile, un approccio vivenze forzate? Tutti esempi di possibili coun- femminista ai dati ci costringe a riflettere anche terdata da raccogliere e raccontare, per denun- su altri temi e possibili counterdata legati alla
Capitolo 1 • Dietro ai dati, le persone 10 ciare le ineguaglianze nelle conseguenze della Nel dossier, i ricercatori hanno raccolto i dati pandemia. sulle dimensioni delle abitazioni, le differen- Il lockdown non ha fatto emergere solo le di- ze di reddito o la partecipazione culturale per seguaglianze di genere, ma anche quelle eco- mostrare come “le diseguaglianze tagliano la nomiche. Lo ha raccontato bene l’inchiesta Di- città in due: da una parte i quartieri benestanti, seguaglianze al tempo del coronavirus del dall’altra quelli fragili”. centro studi Genova Che Osa. Esempio di scheda sui quartieri di Genova del dossier Diseguaglianze al tempo del coronavirus Quello che a mio parere è stato tra i migliori pro- zato sulle comunità “ai margini” o sulle dinami- getti con un approccio femminista e intersezio- che di potere e oppressione attivate dai sistemi nalista ai dati sulla pandemia è il blog “COVID di controllo del virus. Leggiamo così del dilem- from the margins”, coordinato dalla Big Data ma nel rendere visibili i migranti durante la from the South Research Initiative. pandemia, dei rischi connaturati al sistema In esso, una serie di contributi raccontano l’im- di welfare indiano basato su dati biometrici, patto della pandemia con uno sguardo focaliz- o delle sfide del lockdown per la comunità LGBTQ+.
Capitolo 1 • Dietro ai dati, le persone 11 Pagina principale del blog COVID from the margins. Per chiudere, un esempio di data feminism che dei team. La più evidente già da ora è la dise- si occupa di colmare un imperdonabile vuoto guaglianze di genere: su 271 persone apparte- nei dati sul potere ai tempi del COVID: Nel dub- nenti alle 17 task force mappate, solo 80 sono bio… Task Forse! donne. Ma, con l’aggiunta di nuovi dati nella L’iniziativa civica, dell’associazione Ondata, piattaforma, le disuguaglianze che possono cerca di tener traccia di tutte le task force istitu- emergere saranno anche altre: quante persone ite dal governo per far fronte all’emergenza sa- provenienti da background umanistici? Quante nitaria e di tutte le persone che ne hanno fatto provengono dalle diverse regioni italiane? Che parte. Dati fondamentali, ma non pubblicati in professioni svolgono? Quante provengono da maniera trasparente dalle istituzioni. comunità minoritarie? Perché, se c’è una cosa che decenni di femminismo ci hanno insegnato, Il progetto si basa sul contributo di cittadine e è che la diversità di prospettive è un elemen- cittadini, che posso utilizzare la piattaforma in to imprescindibile per un lavoro di squadra cui sono pubblicati i dati per suggerire nuove inclusivo e d’impatto. informazioni o completare quelle esistenti. Una vera e propria mappatura del potere fatta dal basso. I dati raccolti saranno essenziali per di- mostrare le disuguaglianze esistenti all’interno
Capitolo 1 • Dietro ai dati, le persone 12 Pagina di monitoraggi della Task force per la fase 2, sulla piattaforma Nel dubbio… Task Forse! _Qualche spunto per diventare femminista dei dati Se volete iniziare un progetto di raccolta dati femminista e siete a corto di idee, potete scor- rere la lista pubblicata da The Library of Mis- sing Datasets: un elenco di tutti i dataset che dovrebbero esistere, perché rilevanti per le co- munità e le persone più vulnerabili, ma che non esistono. Sono dataset mancanti perché maga- ri l’investimento necessario a raccoglierli non supera un’analisi istituzionale di costi-benefici, per esempio se riguardano un gruppo minorita- rio della popolazione. Oppure sono dati che mancano di proposito, perché a chi è al potere interessa tenerli nasco- sti, come potrebbe essere il caso degli assassini ad opera della polizia USA.
Capitolo 1 • Dietro ai dati, le persone 13 Cosa sono i thick data e come usarli in tempi di crisi 28 maggio 2020 | Donata Columbro Il limite dei dati ufficiali della pandemia potrebbe essere mitigato dall’osservazione etnografica e la raccolta di dati qualititativi: facciamo entrare i thick data nelle normali procedure di analisi e ricerca. Stiamo raccogliendo dati su scala mondiale, Wang, la prima ad averne parlato nel mondo nazionale, regionale, comunale, abbiamo tutto, business, definisce come dati che emergono da cosa potrebbe mai andare storto nella ge- metodi della ricerca qualitativa ed etnografica stione di una crisi sanitaria globale? con l’obiettivo di rivelare le emozioni e le storie Molte cose, se non si guarda abbastanza in pro- delle persone. fondità. Se a fianco delle statistiche ufficiali non Letteralmente, dati che aggiungono spessore viene fatta osservazione sul campo, raccolta o densità a un fenomeno osservato con lenti delle testimonianze da parte di chi è in prima quantitative. linea, analisi a livello locale. Parliamo sempre di dati, ma di piccole dimensioni, capaci di farci vedere nuove sfaccettature di uno stesso argo- mento: sono i thick data, che l’etnografa Tricia
Capitolo 1 • Dietro ai dati, le persone 14 _Dai dati ufficiali ai thick In più, chi ha guardato questi dati ogni giorno, da vicino, ad un certo punto si è accorto di un data, una cronologia altro problema, oltre agli errori e alle impreci- sioni di cui abbiamo già detto: quello che i dati raccontavano non era rappresentativo della Dall’inizio della pandemia in Italia la Protezio- realtà. ne civile e i sistemi sanitari regionali hanno co- Soprattutto nelle zone più colpite della Lombar- minciato a raccogliere dati per capire cosa stava dia, come la provincia di Bergamo, i sindaci e i succedendo e valutare le decisioni da prendere cittadini hanno cominciato a percepire che quei per contenere il virus: casi positivi, casi totali, numeri dei decessi comunicati in modo ufficiale decessi, persone in ospedale, sono i numeri non corrispondevano a quanto vedevano acca- che vediamo ogni giorno nel bollettino del- dere sotto i loro occhi. la Protezione civile. E poi, oltre alle sensazioni, una piccola prova Questi dati, accumulati nel tempo, servono in empirica: le pagine dei necrologi dell’Eco di teoria a valutare l’efficacia di misure come quel- Bergamo più che triplicate nel mese di febbraio. le del lockdown e del distanziamento fisico, Qualcosa non tornava. adottate ormai in tutti i paesi colpiti dal virus – con poche eccezioni. L’intuizione di Isaia Invernizzi, giornalista del quotidiano locale, è stata quella di mettere da Il limite di questi dati lo abbiamo visto quasi su- parte le statistiche ufficiali sulla pandemia e cer- bito: le persone che hanno presentato sintomi carne altre, per confermare le testimonianze di – anche quando in diretto contatto con infetti – chi diceva sottovoce, sperando di sbagliare, “i non sono state testate, le regioni hanno sistemi morti sono molti di più”. Dalla sua parte aveva di raccolta e pubblicazione non omogenei che i sindaci che avevano sotto mano i numeri dei difficilmente permettono il confronto, i dati a decessi nel proprio territorio. livello comunale non sono disponibili per tutte le regioni e quando ne viene richiesto l’accesso Parte quindi un’indagine sulla mortalità nei pri- non si ottiene una vera e propria risposta uti- mi tre mesi del 2020 con un confronto negli anni le. precedenti e purtroppo emerge che i morti sono più del doppio rispetto ai morti ufficiali. INTWIG @in_twig • 26 marzo Parte una #indagine con @webecodibergamo per valutare l’impatto reale del #Covid19 a #Bergamo analizzando il numero dei decessi nei 243 comuni della provincia avvenuti nei primi tre mesi del 2020 per confrontare la mortalità rispetto agli anni precedenti @EasyInve @AldoCristadoro
Capitolo 1 • Dietro ai dati, le persone 15 Comune di Bergamo @ComunediBergamo • 1 aprile Un dovere in un momento come questo: se vogliamo davvero capire la situazione sul territorio dobbiamo costruire dati affidabili (quelli ufficiali non lo sono) per consentire alle autorità sanitarie e agli esperti di costruire analisi e strategie. Grazie a @EasyInve e @in_twig. Isaia Invernizzi @EasyInve • 26 marzo “L’allarme che avevo lanciato insieme agli altri sindaci mi sembra fondato - spiega il sindaco di #Bergamo @giorgio_gori -. Questi dati aiutano a capire l’esatta dimensione del contagio”. Grazie a @ComunediBergamo per aver sostenuto l’indagine. A livello nazionale i dati di Istat sulla mortalità il rapporto sull’impatto dell’epidemia sulla dei comuni più colpiti dal virus diventano pub- mortalità. blici il 1 aprile e il 4 maggio viene pubblicato Penso al governo indiano che aveva deciso di _I thick data come guida usare un’app per tracciare i contagiati, dimenti- candosi di come le persone si comportano negli Quando Tricia Wang ha nominato i “thick data” ospedali”, ci racconta. Per due mesi il numero di sul palco della TED nel 2017 ha detto che “usare telefono associato ai contagiati era quello dei solo i big data aumenta la possibilità di perdersi propri parenti, segnalati come “positivi al virus” qualcosa, mentre ci dà l’impressione di sapere anche senza essere mai stati testati. Una volta tutto”. Wang aveva condotto una ricerca etno- in ospedale infatti i familiari segnalavano il pro- grafica per conto di Nokia in Asia, ma le sue in- prio numero ai medici per conoscere le condi- tuizioni, dopo anni passati a fare “osservazione zioni di salute dei propri cari, ma quel numero partecipante”, come gli antropologi, non ven- veniva erroneamente caricato sull’app come nero considerate da Nokia, che preferì lasciarsi appartenente ai contagiati. guidare da sondaggi e ricerche di mercato su I thick data sono quindi “preziosi dati di carat- larga scala – e tutti sappiamo come è andata a tere personale, come storie, interazioni ed emo- finire per l’azienda finlandese. zioni che non possono essere quantificate”. In In una crisi sanitaria i thick data ci aiutano a India ascoltare le testimonianze dagli ospedali capire aspetti della pandemia che altrimen- avrebbe evitato due mesi di dati raccolti inutil- ti rischiamo di accantonare perché relativi a mente. esperienze dei singoli o legati a un contesto “I nostri sistemi di big data hanno bisogno di locale. persone come gli etnografi e i ricercatori per È d’accordo anche Giulio Quaggiotto, respon- raccogliere i cosiddetti dati densi”, diceva Wang sabile del settore Innovazione nella regione nel 2017. “Abbiamo anche bisogno che sia in- dell’Asia-Pacifico per l’UNDP, che del tema è un centivato il dialogo tra i dati quantitativi e qua- esperto in relazione alla cooperazione in- litativi per individuare insight e significati a ciò ternazionale: “Si può assolutamente parlare di che accade”, scrive oggi Alice Avallone in un thick data anche in questo caso. pezzo sull’urgenza di avere “umanisti dei dati”.
Capitolo 1 • Dietro ai dati, le persone 16 Stanno raccogliendo dati e testimonianze dal _I thick data post crisi basso per capire come accompagnare questa transizione, che probabilmente sarà lunga? Stiamo vivendo una crisi che ha altri aspetti ol- Forse non in tutti i settori. tre quello sanitario. Ci sono state molte iniziative private, come C’è quello economico, quello sociale, educativo, quelle di Design For Emergency, con una ri- ed è per questo che il governo ha istituito delle cerca sulle emozioni degli italiani avviata già nei task force per analizzare i modi migliori per ac- primi mesi del lockdown, e la CoviDesignJam compagnare la transizione dal blocco totale alla organizzata a maggio da Digital Entity e Nois3 graduale riapertura. Ma questi gruppi di esperti per “progettare le relazioni del futuro”, ma al stanno usando un approccio thick data? momento non siamo a conoscenza di iniziative istituzionali. Fonte: From big to thick data: how do we make sense of the impacts of Covid 19? La visualizzazione dell’indagine di Design For Emergency. Eppure questi due ultimi casi sono un’ottima raccolta dati, mettersi nei panni degli altri, testa- ispirazione, perché l’approccio dei thick data re e poi prendere decisioni. Anche in fase 2. assomiglia a quello del design thinking: ascolto,
Capitolo 1 • Dietro ai dati, le persone 17 La disparità di genere, spiegata con i dati (che non ci sono) 5 marzo 2020 | Donata Columbro Senza i dati sulle donne il mondo è progettato per l’essere umano di default, il maschio. Ecco il gender data bias raccontato dalla giornalista Caroline Criado Perez. Questo libro “è tutto quello che abbiamo sem- fermato in ogni pagina dai dati che Criado Perez pre saputo e sentito sulla disparità di genere ma ha raccolto per dimostrare che viviamo in un BASATO SUI DATI!”. mondo progettato per l’essere umano di de- fault: il maschio. Il tono dei messaggi che ho mandato alle mie amiche durante la lettura del libro di Caroline Criado Perez era più o meno questo, maiuscole comprese. Anche se, in realtà, Invisible Women. Exposing Data Bias in a World Designed for Men (usci- to in Italia per Einaudi con il titolo Invisibili) racconta proprio di dati che non ci sono, non vengono raccolti o presi in considerazione. In ogni settore: dall’arte alla medicina, dalla pro- gettazione degli spazi pubblici alla prevenzione della violenza sulle donne. Criado Perez è un’attivista inglese, diventa- ta popolare con una campagna di successo su Change.org per portare il volto di Jane Austen sulle banconote da 10 sterline dopo che la Ban- ca di Inghilterra aveva deciso di sostituire l’eco- nomista Elizabeth Fry – unico volto femminile sulle banconote oltre alla Regina – con Winston Churchill. L’attenzione all’assenza delle donne è sempre stata oggetto delle sue battaglie e del suo inte- resse, anche come giornalista. La copertina del libro Invisible Women. Exposing Data Bias in a World Designed for Tutto quello che non funziona o che mette le Men (Caroline Criado Perez, 2019). donne in una posizione sfavorevole rispetto agli uomini (bianchi, caucasici) sembra essere con-
Capitolo 1 • Dietro ai dati, le persone 18 viene detto da sempre che il motivo per cui vi _Spazi pubblici che è più coda davanti alle toilette è la nostra vani- tà, amiamo truccarci e sistemarci allo specchio. discriminano le donne Ma la verità è un’altra: i bagni pubblici sono pro- gettati per gli uomini. In un ambiente come un Quando si raccolgono i dati, però, le cose cam- teatro, un cinema, lo spazio destinato ai bagni è biano: uno studio effettuato a Vienna negli anni uguale in metri quadri tra uomini e donne, ma Novanta ha dimostrato che dopo i 10 anni la se un bagno maschile ha sia gli orinatoi che i ga- presenza delle bambine nei giardini pub- binetti la quantità di persone che possono usu- blici e nelle aree gioco diminuisce in modo fruirne è maggiore per metro quadrato rispetto significativo. a un bagno per le donne. Ecco un bel caso di Ma invece di pensare semplicemente che le disparità “nascosta” dai dati che non vengono bambine avrebbero dovuto vincere la timidez- presi in considerazione. Criado Perez mette an- za, le autorità locali hanno capito che c’era qual- che in discussione l’assunto secondo cui se non cosa di sbagliato nella progettazione dei parchi. ci sono donne in un certo ambito lavorativo è Così hanno cominciato a raccogliere altri dati, perché non sono brave abbastanza: basti sape- scoprendo che il problema risiedeva negli spa- re che le audizioni “alla cieca” nelle orchestre zi troppo ampi, in cui le ragazze si sentono in hanno aumentato del 50% la proporzione di competizione con i maschi, ma anche troppo donne assunte. insicure per accedere in spazi dove vi è già una Criado Perez mette anche in discussione l’as- presenza di coetanei. Se un parco viene invece sunto secondo cui se non ci sono donne in un suddiviso in aree giochi più piccole ecco che la certo ambito lavorativo è perché non sono presenza femminile aumenta. brave abbastanza: basti sapere che le audizio- Un altro caso è la progettazione dei bagni ni “alla cieca” nelle orchestre hanno aumentato pubblici: le donne ci impiegano 2,3 volte più del 50% la proporzione di donne assunte. degli uomini a espletare i propri bisogni e ci Fonte: Mona Chalabi per il Guardian.
Capitolo 1 • Dietro ai dati, le persone 19 »» i dati includono contenuti prodotti da es- _Cos’è un data bias seri umani che possono contenere bias e quali sono le sue contro alcuni gruppi di persone. Secondo Criado Perez le conseguenze di questo conseguenze bias sono in ogni ambito, anche dove non cre- diamo possano esistere differenze tra uomini e donne. E il motivo è che i dati su queste diffe- Questo data bias di cui si parla nel libro pena- renze non ci sono, o non vengono presi in con- lizza le donne a livello professionale e nella vita siderazione. pubblica, ma può costare anche in termini di salute ed è in alcuni casi questione di vita o di Uno dei primi esempi presentati del libro è la morte, come dimostra nella sezione tutta dedi- pulizia delle strade in Svezia dopo una ne- cata alla medicina. vicata: i passaggi per le auto sono liberati prima rispetto ai marciapiedi, e questo pe- Il bias in statistica è una deviazione dal valore nalizza le donne. Sì, perché le donne hanno medio. Come ricorda Annamaria Testa in più probabilità di andare a piedi o usare i mezzi questo articolo il termine deriva dal francese pubblici per spostarsi – due terzi dei passeggeri biais, che significa “obliquo, inclinato” e che a dei trasporti pubblici sono donne in Francia, per sua volta deriva dal latino e, prima ancora, dal esempio – e soprattutto la loro traiettoria rara- greco epikársios, obliquo. mente è una linea retta casa-lavoro, ma com- Un bias nel campo dei dati porta a percezioni prende diverse deviazioni relative alla cura e errate, perché i dati a disposizione non sono alla gestione dei figli o dei genitori anziani. Uno rappresentativi della popolazione o del feno- studio ha dimostrato che il 79% degli infortuni meno di studi. dei pedoni avviene d’inverno e di questi il 69% Come spiega Prabhakar Krishnamurthy in Un- riguarda le donne, per un costo di 3,2 milioni di derstanding Data Bias esistono anche questi sterline per la sanità svedese. Quello che Criado due casi: Perez sostiene per tutto il libro è che il prezzo »» I dati non includono variabili che rappre- per non prendere in considerazione le donne è sentano in modo appropriato il fenomeno molto più alto rispetto a un atteggiamento che che vogliamo prevedere le includa. struale, che colpisce il 90% delle donne. Il corpo _Il corpo umano delle donne presenta troppe variabili per poter di default è quello essere incluso negli studi accademici, e nemme- no per essere coinvolto nei test dei medicinali. maschile Questo presenta serie conseguenze sulla salu- te delle donne: se hai mai ascoltato i racconti di un’amica che abbia provato a ottenere una dia- L’anatomia si studia sul corpo degli uomini. An- gnosi di endometriosi per i suoi “dolori da ciclo”, che qui, c’è un dato a dimostrarlo: con un’ana- specialista dopo specialista, rimandata a casa lisi sui libri di testo raccomandate dalle venti con antidolorifici e un consiglio sul “rilassarsi”, università più prestigiose di Europa, Stati Uniti sai di cosa stiamo parlando. e Canada, su 16329 immagini usate per rap- presentare il corpo umano quello degli uo- In più: in Gran Bretagna le donne hanno il 50% mini è presente tre volte di più rispetto al di probabilità in più di ricevere una diagno- corpo femminile, considerato “una devia- si sbagliata dopo un attacco di cuore, perché zione”. in genere “colpisce gli uomini”. Criado Perez smonta anche questo dato. Il fatto è che nelle Questo influisce sullo sviluppo di tutti i rami del- donne i sintomi sono diversi rispetto a quelli la medicina: ci sono cinque volte più studi sulla degli uomini e quindi non vengono presi in con- disfunzione erettile che sulla sindrome preme- siderazione.
Capitolo 1 • Dietro ai dati, le persone 20 _Cambiamento di prospettiva Prima di leggere questo libro di Criado Pe- rez non avevo mai preso in considerazione la mancanza di dati – sul 50% della popolazione! – come causa della cattiva progettazione di toi- lette, fermate dell’autobus (sì, ci sono esempi anche su questo, per la prevenzione delle mo- lestie sessuali) e altri spazi pubblici. Ed ero ben consapevole della discriminazione delle donne sul lavoro, ma davo per scontato che fosse un atteggiamento “culturale”, o del singolo, della cattiva volontà di alcune aziende. Il fatto che ci siano dati che provano ogni discriminazione e le fanno risalire a “errori” di progettazione an- che molto lontani nel tempo da un certo punto di vista mi rassicura: non sono scelte delibe- rate, vi è una mancanza di prospettiva che include il genere femminile perché non ci sia- mo fatti le domande giuste – o non ce ne siamo fatte, e basta. Questo libro ci dice che se hai dei dati a dispo- sizione ne stai escludendo altri: non sono mai stati raccolti? chi escludono? cosa puoi fare per avere una visione più comprensiva della realtà? Mai fermarsi e pensare che “basato sui dati” sia la risposta giusta.
21 Capitolo 2 Da data consumer a data conscious. Spunti per leggere dati e visualizzazioni con spirito critico In questa sezione troverai articoli che ti aiuteranno a interpretare correttamente statistiche, grafici e mappe. Sebbene i testi proposti riguardino tutti dei casi studio specifici, potrai facilmente astrarre i principi generali da applicare in futuro ogni volta che incontri dati e visualizzazioni. Perché è importante usare sempre il tuo senso critico di fronte a chi snocciola dati e visualizzazioni, sia che lo faccia in buona fede che con intento manipolatorio. INDICE 1. Guida al data-checking: 3 modi per informarsi meglio con i 22 dati 2. Stiamo vivendo il primo evento data-informed della storia. 26 Ma non siamo ancora pronti 3. Nuovo coronavirus, i dati ufficiali sull’Italia sono affidabili? 29 4. Come raccontare le elezioni con grafici e mappe 33 5. La mappa con i roghi dell’Australia: c’è qualcosa che non 40 funziona in questa data visualization?
Capitolo 2 • Da data consumer a data conscious 22 Guida al data-checking: 3 modi per informarsi meglio con i dati 23 luglio 2020 | Nicola Bruno Il limite dei dati ufficiali della pandemia potrebbe essere mitigato dall’osservazione etnografica e la raccolta di dati qualititativi: facciamo entrare i thick data nelle normali procedure di analisi e ricerca. “La data visualization si porta dietro un’aura di Esistono altre fonti che confermano questi dati? certezza: le linee pulite, le forme geometriche Di fronte a un dato, una tabella o una data vi- e le fonti rispettabili trasmettono autorità. Ma sualization dovremmo sempre porci queste do- queste convenzioni possono danneggiarci…” mande. Così afferma Catherine D’Ignazio, ricercatri- Eppure, troppo spesso, ancora non avviene tut- ce al MIT, tra le maggiori esperte di data-literacy to ciò. al mondo. In piena emergenza coronavirus ha fatto molto Proprio questa “aura di certezza” sta diventando discutere il caso di Worldometer, aggregatore il perfetto cavallo di Troia per campagne di pro- di statistiche live, utilizzato da moltissime te- paganda e disinformazione. Che ormai non ci state intorno al mondo, dal New York Times al arrivano più solo sotto forma di “notizie false” o Financial Times, fino ad arrivare alle nostre La foto-montaggi, ma anche di dati, tabelle e visua- Repubblica e Ansa. lizzazioni ingannevoli. Un’inchiesta della CNN ha rivelato non solo la Per iniziare a informarsi meglio con i dati, in Da- presenza di dati sbagliati su Worldometer, ma taninja ci piace unire due approcci: anche la difficoltà a capire chi ci fosse dietro al »» fact-checking: la capacità di stabilire l’at- progetto – probabilmente un italiano con resi- tendibilità di un contenuto o una fonte denza a Bologna, ma di più non si sa, perché i »» data literacy: la capacità di saper leggere, fondatori hanno ben nascosto le proprie tracce. analizzare e comunicare con i dati Nessuna testata del calibro del New York Times Il risultato è un approccio che chiamiamo da- o del Financial Times pubblicherebbe mai una ta-checking e che abbiamo iniziato a sperimen- notizia proveniente da un blog sconosciuto, che tare in alcuni workshop e progetti educational. non dichiara chi c’è dietro. Perché lo stesso non avviene (ancora) con i dati? Nella sua versione base, il data-checking sug- gerisce di prestare attenzione a tre questioni: L’attendibilità delle fonti va verificata in parti- colar modo quando ci troviamo di fronte a da- 1/ AFFIDABILITÀ ta-mix, come ad esempio la famosa dashboard Qual è la fonte primaria? della John Hopkins University che ha incluso tra Chi c’è dietro? Che interessi persegue? le proprie fonti Worldometer senza una verifica Sono disponibili meta-dati che permettono di della sua attendibilità, contribuendo così a dif- capire come e quando i dati sono stati raccolti fondere i suoi dati poco affidabili. ed elaborati?
Capitolo 2 • Da data consumer a data conscious 23 2/ CORRETTEZZA Prendiamo i famosi “35 euro” dati come “sti- Come per le dichiarazioni o le fotografie, anche pendio giornaliero” ai “profughi”. Anzi, “regala- per i dati si può partire da informazioni autenti- ti” secondo questo tweet del leader della Lega che e attendibili, ma piegarle a una particolare Matteo Salvini: lettura di parte. Matteo Salvini @matteosalvinimi • 17 set 2017 #Salvini: Mi vergogno di un governo che dà 280 euro al mese ai disabili e regala 35 euro al giorno a chi sbarca domani. #Pontida17 Il dato dei 35 euro è corretto: si tratta di una fra vada in tasca al migrante. La maggior parte stima effettuata dal Ministero dell’Interno su (32,5 euro) vanno a chi si occupa della gestione quanto costi in media al giorno l’accoglienza di dell’accoglienza; solo 2,5 euro possono essere un migrante adulto. dati come “pocket money” nelle mani del richie- È del tutto scorretto, però, dire che questa ci- dente protezione internazionale.
Capitolo 2 • Da data consumer a data conscious 24 Simile a questo uso scorretto dei dati è poi il In questo caso si sfruttano le potenzialità visive e cherry-picking, letteralmente “raccogliere le narrative della data-visualization: un colore, una ciliege” facendo attenzione a prendere solo forma, una rappresentazione sono portatrici di quelle più buone. Una tentazione molto facile messaggi che ci parlano in maniera diretta, an- quando si analizzano lunghe serie di dati e se ne che senza leggere bene i dati o le informazioni. estrapola solo una parte per far passare un pre- Gli esempi di #horrorchart purtroppo sono ciso messaggio. sempre più frequenti, come ad esempio questa 3/ FUNZIONALITÀ visualizzazione – molto di parte – sugli effetti Un dato può mentire non solo perché non è at- dell’Obama-care, in cui è stato troncato l’asse tendibile, oppure perché è riportato fuori con- delle X per far apparire più lontano l’obiettivo testo, ma anche perché ci viene presentato in finale. maniera ingannevole. Per comunicare in maniera funzionale i dati bi- Altre indicazioni sono presenti in questo inte- sognerebbe sempre attenersi ad alcune regole ressante video di Filippo Mastroianni. base, come ad esempio: Ovviamente non è facile distriscarsi tra i livelli di »» non troncare l’asse delle x (come fatto nel- attendibilità/correttezza/funzionalità, soprattut- la visualizzazione sopra) to ora che la data-visualization sta diventando »» rendere costanti i valori degli assi uno dei tanti campi di battaglia del marketing politico (e non solo). »» non fermarsi ai valori assoluti (soprattutto in una mappa) Ma è un esercizio che dobbiamo iniziare a fare sempre più spesso. »» evitare le rappresentazioni poco pertinen- ti (come ad esempio i grafici a torta) »» usare i colori in modo appropriato »» preferire visualizzazioni di facile compren- sione a quelle più d’impatto ma meno ef- ficaci
Capitolo 2 • Da data consumer a data conscious 25 Questa mappa twittata da Trump è sia atten- zionale (la visualizzazione coropletica è perfetta dibile (i dati sono quelli ufficiali delle contee per rappresentare la distribuzione geografica di dove Trump ha vinto contro Clinton) che fun- un dato). Ma è del tutto scorretta per il messaggio che Tru- anzi, a vedere i voti assoluti, Trump ne ha ricevu- mp vorrebbe dare: non visualizza i valori assolu- ti meno della Clinton. ti dei voti ricevuti, ma solo la loro distribuzione; Mappa tratta dal libro di Alberto Cairo “How charts lie”. Ecco perché non possiamo più permetterci di una rappresentazione su un altra e, soprattutto, fermarci solo a “guardare” i dati o le loro visua- se è credibile il messaggio finale che vorrebbe lizzazioni; dobbiamo sempre chiederci chi c’è trasmetterci. dietro, che fonti ha usato, perché ha preferito
Capitolo 2 • Da data consumer a data conscious 26 Stiamo vivendo il primo evento data-informed della storia. Ma non siamo ancora pronti 7 maggio 2020 | Nicola Bruno Dal bollettino serale della Protezione civile alle infografiche casalinghe condivise su Whatsapp, l’emergenza coronavirus ci ha catapultati in un mondo di dati, grafici e tabelle. Tra gli effetti secondari dell’emergenza corona- »» La scala logaritmica e R0 virus, c’è stato quello di averci calato per tre lun- »» Le mappe del contagio ghi mesi in un mondo di dati, grafici e tabelle. »» Le infografiche fai-da-te ricevute via »» Il rito quotidiano delle 18 con i dati della WhatsApp Protezione Civile »» I politici che hanno “bisogno di certezze »» La tabella giallo-verde-rossa-arancio- dalla scienza” ne fissa sulle prime pagine dei quotidiani »» La “curva” da appiattire Dati sul contagio da #covid19 nella città di New York rielaborati da Accurat, lo studio fondato da Giorgia Lupi. Fonte: Fast Company
Capitolo 2 • Da data consumer a data conscious 27 La quarantena ci ha fatto scoprire un nuovo journalism” con i “contenuti generati centro di gravità permanente: i dati. E questo è dagli utenti” avvenuto a diversi livelli: da quello decisionale »» La “Rivoluzione Verde” in Iran del 2009 ci della politica e della sanità, passando per le mi- ha aperto le porte dei video amatoriali gliori inchieste giornalistiche, fino ad arrivare per aggirare la censura di stato alle nostre piccole scelte quotidiane (“vado o »» Il terremoto ad Haiti del 2010 è stato il pri- non vado a fare la spesa dopo i dati bruttissimi mo “Twitter event” della storia digitale di ieri?”). »» La “Primavera Araba” del 2011 ha portato Come mi ha detto la collega Francesca Folda: Facebook e gli altri social media al cen- “Sono rimasta stupita nel notare come – rispet- tro delle piazze della protesta to a 15 anni fa quando si impazziva a trovare »» Le elezioni Usa del 2016 ci hanno fatto dati internazionali che non risalissero a più di aprire gli occhi sulle “fake news” e sui ri- 5 anni prima – oggi in questa crisi abbiamo schi di polarizzazione degli algoritmi svi- una mole di dati centralizzati, dettagliati a luppati dalle grandi piattaforme. livello globale mai vista prima. Ecco, questo mi ha fatto pensare che se la guerra del Golfo Ora, il connubio coronavirus-dati ci ha fatto ha segnato il nascere dell’all-news e altri grandi toccare con mano cosa vuol dire vivere in un fatti di attualità hanno segnato il via del mobi- mondo data-informed. E cioè un mondo in cui le journalism, del citizen journalism etc, questa i dati sono influenzano molte delle nostre deci- pandemia è la prima crisi in cui il giornalismo è sioni. data driven, in tempo reale e a livello globale”. È vero: oggi abbiamo fantastici database ag- In effetti, tutte le grandi crisi produco- giornati in tempo reale, bellissime visualiz- no sempre un passo in avanti nel mondo zazioni alla portata di tutti, dashboard cu- dell’informazione: ratissime e più consapevolezza sui modelli matematici. »» Il modello delle reti all-news in stile CNN è nato proprio con la Guerra del Golfo del E questo ci aiuta sicuramente a informarci me- 1991 glio, a far prevalere i fatti sulle emozioni, a far- ci passare in pochi secondi dal micro (la nostra »» Gli attentati del 5 Luglio 2005 a Londra città o addirittura il marciapiede) al macro (la hanno segnato una svolta per il “citizen situazione nel mondo). La mappatura dei marciapiedi di Milano e il distanziamento sociale. Fonte: Systematica
Capitolo 2 • Da data consumer a data conscious 28 parziali, modificati in corso d’opera, blinda- _Sappiamo leggere i ti in impietosi file pdf, a volte accompagnati da inquietanti asterischi. dati? Anche gli scienziati e i giornalisti – che sui dati dovrebbero essere più avanti rispetto ai politici Al tempo stesso, però, l’emergenza coronavirus – hanno dato il proprio contributo, condividen- ha fatto emergere anche una totale mancanza do “grafici dell’orrore” che hanno fatto saltare di cultura dei dati. A cominciare dalle istitu- più di un dataninja sulla tastiera. zioni che in questi mesi hanno pubblicato dati Come i grafici possono mentire: il totale di un grafico a torta dovrebbe essere sempre 100% (via Filippo Mastroianni) A proliferare in questo buco nero è poi stata Da una parte ciò è un bene: favorisce la velocità tutta la macchina della disinformazione: dalle di adozione di un’innovazione, facendola uscire tabelle virali su WhatsApp alle simulazioni dalle nicchie e portando i suoi benefici a tutti. imprecise sui dati Istat, passando per le info- Dall’altra parte, però, si rischia di creare un effet- grafiche senza ombra di fonte, i complotti e to boomerang se questa adozione non è accom- le illazioni razziste basate su analisi caserec- pagnata da una piena consapevolezza. ce, i dati ufficiali estrapolati fuori contesto, Rispetto al passato ora abbiamo però un van- i “numeri smentiti”, le percentuali sballate, i taggio: sappiamo che bisogna colmare al più metri di distanza ripresi da studi poi ritrat- presto la mancanza di una cultura dei dati. E tati. proprio per questo a Dataninja siamo al lavo- Tutta questa disinformazione si è alimen- ro per diffondere la data-literacy a tutti i livelli: tata e ha viaggiato più velocemente anche da quelli professionali con i corsi della nostra grazie a una scarsa cultura dei dati. School, fino ai contesti educativi con un proget- L’abbiamo già visto con tutte le innovazioni del to di media e data literacy rivolto alle scuole se- passato: nella prima fase molti si appropriano di condarie di tutta Italia. nuovi strumenti senza conoscerli troppo.
Capitolo 2 • Da data consumer a data conscious 29 Nuovo coronavirus, i dati ufficiali sull’Italia sono affidabili? 26 marzo 2020 | Alessio Cimarelli Una breve sintesi della storia e dei problemi dei principali indicatori usati per tracciare l’andamento dell’epidemia da coronavirus in Italia: contagiati, ricoverati in terapia intensiva, deceduti. L’11 marzo scorso l’Organizzazione Mondiale demia in un bollettino quotidiano a partire della Sanità ha dichiarato lo status di pande- dal 24 febbraio, poi pubblicato anche in for- mia per la diffusione del virus SARS-CoV-2 nel mato aperto nel repository Github ufficiale a mondo. In Europa il primo paese ad affrontare partire dal 7 marzo. Più o meno da allora si con- quella che era ancora un’epidemia è stata l’Italia dividono e discutono analisi e visualizzazioni di con la dichiarazione dello stato di emergen- questi dati a tutti i livelli, da quelli istituzionali, a za sanitaria del 31 gennaio. quelli accademici, a quelli amatoriali. Il 23 febbraio il Governo promulga le prime mi- Gli indicatori che destano più interesse sono sure urgenti in materia di contenimento, il numero di positivi, di ricoveri, di ricoveri mentre il Dipartimento della Protezione Civile in terapia intensiva, di decessi. comincia a fornire i dati che quantificano l’epi- Tutti i numeri dell’epidemia in Italia nella dashboard ufficiale della Protezione Civile.
Capitolo 2 • Da data consumer a data conscious 30 Negli ultimi giorni, però, sono emersi molti _L’andamento nel tempo dubbi sull’affidabilità dei dati disponibili, con- fermati anche dallo stesso capo della Pro- dell’epidemia tezione Civile, Angelo Borrelli: “il rapporto di un malato certificato ogni dieci non censiti In Italia (ma non solo), l’analisi più gettonata è credibile”. Tanto che anche alcuni giornalisti è quella dell’andamento nel tempo di que- si sono chiesti quanto siano davvero utili le sti indicatori, in cerca di un segnale di picco (o conferenze stampa quotidiane. flesso, a seconda che si guardano i dati giorna- In questo articolo voglio fare una breve sin- lieri o quelli cumulati) dell’epidemia, cioè quel tesi della storia di questi indicatori, così da momento oltre il quale la situazione andrà mi- far emergere un quadro più chiaro rispetto alla gliorando. discreta confusione degli ultimi tempi. Una semplice occhiata a gruppi come Phy- sicistsAgainstSARSCoV2 o a pagine come Coronavirus – Dati e Analisi Scientifiche e StatGroup-19 mostra l’enorme produzione di analisi, grafici e modelli descrittivi o previsio- nali di questi giorni e il gran numero di persone coinvolte. Una rappresentazione qualitativa degli effetti di diverse politiche di sanità pubblica sulla diffusione del contagio. In verde il cosiddetto picco del contagio, dopo il quale il numero di nuovi infetti giornalieri inizia a diminuire. Fonte: Tomas Pueyo.
Capitolo 2 • Da data consumer a data conscious 31 Ci sono molti problemi a confrontare i dati _Numero di positivi anche da un giorno all’altro. Il suggerimen- to è di non dare peso alle previsioni basate su Inizialmente l’indicatore ritenuto più utile era il questo indicatore che ancora girano, come ben numero di positivi, poi però si è capito che le sintetizzato dal prof. Giuseppe De Nicolao. modalità di somministrazione dei tamponi Ci sono tentativi di stimare il numero com- erano troppo limitate, arbitrarie, opache e plessivo di contagiati e la loro evoluzione, ballerine e quindi si è accantonato, come anche nell’ambito di un confronto tra i paesi ben sintetizzato da Il Post. europei, ma solo in maniera indiretta. capacità del sistema di far fronte al gran numero _Ricoveri in terapia di malati, piuttosto che a un vero rallentamento dell’epidemia. intensiva È utile quindi più per capire quanto gli ospe- dali sono in sofferenza, e non tanto per fare Poi si è passati ai ricoveri in terapia intensiva, previsioni sull’andamento dell’epidemia. ma si è presto capito che l’andamento di que- Discorso simile per i ricoverati normali, quindi sto numero dipende moltissimo dagli effetti che non transitano necessariamente in terapia di saturazione dei reparti ospedalieri. intensiva o sub-intensiva. Qualsiasi flessione della crescita di questo indi- catore è più probabilmente da attribuire all’in- Per compensare questa sottostima del nume- _Numero di decessi ro di decessi per/con COVID-19 a fine marzo il Ministero della Salute prima e l’ISTAT poco Ci si è allora concentrati sul numero di decessi dopo hanno iniziato a rilasciare i dati della mor- (e in alcuni casi sulla somma di terapie intensi- talità per qualsiasi causa, cioè il numero di de- ve e decessi), ma recentemente si è capito che cessi registrati alle anagrafi comunali indipen- anche questo numero dipende fortemen- dentemente dalla causa di morte. te dalle modalità di somministrazione dei Si tratta sicuramente di una sovrastima perché tamponi, che sembra vengano fatti sempre non tutti i decessi possono essere attribuibili meno post mortem, a maggior ragione se il all’epidemia, ma il confronto dell’attuale morta- decesso avviene fuori dagli ospedali. lità delle varie regioni italiane con quella degli Si torna quindi alle problematiche già viste per anni passati mostra un aumento considerevole, il numero di positivi, così anche qui il suggeri- soprattutto al Nord, come già anticipato da mento è di non dare troppo peso alle previsio- alcune inchieste giornalistiche pionieristi- ni basate sui decessi e prendere con le pinze le che. loro conclusioni. o grazie al supporto del sistema sanitario. Pur- _Numero di guariti troppo è emerso che nemmeno questo nu- mero, così come rilasciato, indica davvero Anche se non è molto utile per tracciare la dina- le persone contagiate, ammalatesi e poi mica dell’epidemia, il numero di guariti rimane guarite, a causa di problemi derivanti dalle comunque importante, perché quantifica chi ha modalità di raccolta dei dati a livello locale. superato indenne la malattia, spontaneamente
Capitolo 2 • Da data consumer a data conscious 32 di farli solo ai sintomatici gravi o a rischio non _Modalità di permette di avere un quadro del reale an- somministrazione dei damento dell’epidemia, a maggior ragione se il vettore più importante del virus è il porta- tamponi tore asintomatico (che ha quindi il virus SARS- CoV-2, è contagioso, ma non ha mai o non ha ancora sviluppato la malattia COVID-19 o ne è Ci sono altri indicatori ancora utili per tracciare appena uscito). Senza contare che ogni regione l’andamento dell’epidemia? Al momento sem- ha i suoi protocolli specifici che possono esse- bra di no, purtroppo le modalità di sommini- re anche molto eterogenei, come è il caso del strazione dei tamponi (ai sospetti, ai ricoverati, Veneto. ai deceduti) non sono affidabili, l’indicazione “ Finché le modalità di somministrazione dei tamponi non cambiano, qualsiasi analisi dell’andamento di questi indicatori ha un valore predittivo molto limitato, se non nullo. In attesa di un cambio di queste modalità (es. confronti tra i territori soffrono della stes- tamponi su campioni statisticamente significati- sa incertezza: la letalità (numero di decessi vi della popolazione, a tutti i deceduti per qual- sul numero di contagiati), la mortalità (numero siasi motivo, a tutti quelli sospetti con un’attività di decessi sulla popolazione esposta), la preva- di contact-tracing, ecc.), le uniche analisi con lenza (numero di contagiati sulla popolazione un minimo di senso sono forse quelle su ter- esposta), l’incidenza (numero di nuovi conta- ritori lontani dalla saturazione, quindi tutti giati sulla popolazione esposta). Stessa sorte quelli in iniziale o piena fase esponenziale. Non per molte visualizzazioni, mappe, infografi- la Lombardia, né i dati nazionali, per capirci. che e dashboard: per quanto apparentemente Purtroppo anche altri indicatori potenzial- complete e ben fatte, il loro valore informativo, mente utili per tracciare l’epidemia e fare almeno per l’Italia, appare quanto mai limitato. portante che l’attenzione sulla qualità del dato _Cosa fare allora di tutte sia sempre altissima, sia da parte delle istituzio- le analisi delle ultime ni che lo producono, sia da parte di chiunque quel dato vuole usarlo per lavoro o per infor- settimane? marsi. Alla luce delle problematiche descritte, alcuni degli autori più attivi hanno iniziato a fare un passo indietro, altri invece hanno chiarito i li- miti di quanto fatto, pur ribadendone il valore. Purtroppo dati inaffidabili non possono che produrre analisi inaffidabili, per questo è im-
Capitolo 2 • Da data consumer a data conscious 33 Come raccontare le elezioni con grafici e mappe 29 gennaio 2020 | Alice Corona Ecco cosa possiamo imparare dalle #Elezioni2020 in Emilia Romagna. La mattina del 27 gennaio sono stata tra i molti ha passato la notte a snocciolare dati, mappe e italiani che si sono svegliati con l’ansia di con- grafici. trollare i risultati del voto in Emilia Romagna. In questo post provo a tirare un po’ le somme Per deformazione professionale la performan- di ciò che ho visto girare in rete in questi giorni. ce che mi interessava non era solo quella dei candidati e dei partiti, ma anche quella di chi grafiche risponde velocemente alla prima do- _Raccontare gli stessi manda che un qualsiasi lettore si pone: chi ha vinto nel mio comune? Ma questo tipo di rap- dati con grafici diversi presentazione semplifica molto la complessità di quanto avvenuto, lasciando molte domande Tutta la mia riflessione parte da due domande: in sospeso e non stimolando alcun pensiero come possiamo raccontare i dati elettorali cam- critico nel lettore. Il voto in Emilia Romagna si è biando angolo narrativo? Come cambia la no- caricato di un alto significato simbolico proprio stra percezione della realtà quando guardiamo per la storia della regione, governata ininter- i dati attraverso mappe più complesse, ricche di rottamente da partiti di (centro) sinistra fin dal sfumature? 1970, quando nascono le regioni. È inevitabile Una mappa elettorale che ci dice solamente chi valutare il risultato del 2020 alla luce di quelli ha vinto e chi ha perso nelle diverse aree geo- precedenti. Esempio di classica mappa elettorale. Fonte: SkyTg24.
Puoi anche leggere