Big data UN'INDAGINE SU MEDICI ITALIANI - Forward
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
Big data U N ’ I N DAG I N E S U M E D I C I I TA L I A N I Il Pensiero Scientifico Editore
2 | forward B I G DATA — R E P O RT © 2017 Il Pensiero Scientifico Editore Elaborazioni statistiche a cura di Daria Scacciatelli Il contenuto di questa pubblicazione non riflette necessariamente il punto di vista delle organizzazioni che hanno reso possibile la survey o delle società scientifiche organizzatrici degli eventi nel corso dei quali la ricerca è stata svolta.
R E P O RT — B I G DATA forward | 3 INTRODUZIONE Approfondire il tema dei big data è stata una scelta sarà possibile trarre. Non a caso, il programma quasi obbligata per un progetto nato per riflettere statunitense prima citato già nel nome indica una sulla sanità in cambiamento. Se ne parla molto, traiettoria: big data to knowledge. non solo in campo medico, ma alla ricchezza della Come nelle tre survey che hanno preceduto documentazione offerta alla consultazione non l’indagine sulla competenza in tema di big data, corrisponde un’adeguata consapevolezza dei termini è stato predisposto un questionario che è stato della questione da parte dei professionisti che somministrato a un campione di professionisti lavorano nella sanità. Sembra che, dei big data, sia sanitari composto da epidemiologi, medici considerata soprattutto una delle loro caratteristiche: di medicina generale e oncologi. La survey quella relativa al volume. Collegata a un altro era composta da 13 item a scelta multipla; 10 aspetto, la relativa veridicità, è comprensibile prevedevano la possibilità di dare una sola risposta, che quella di essere sommersi dalle informazioni mentre in 3 casi la persona intervistata poteva sia vista prevalentemente come una prospettiva selezionare più di una opzione tra quelle proposte. inquietante. La compilazione del questionario era ovviamente Eppure, i motivi per non essere del tutto tranquilli facoltativa e in forma anonima. non mancherebbero neanche se lo sguardo fosse più I questionari sono stati distribuiti dagli operatori in equilibrato e libero da pregiudizi. Come leggiamo occasione di alcuni congressi di rilevanza nazionale nelle pagine che il Governo degli Stati Uniti ha che hanno coinvolto medici delle diverse discipline: dedicato ai big data, la variabilità delle fonti è un fattore che di per sé genera complessità: l’attività • XVIII Congresso nazionale dell’Associazione di ricerca, le cure primarie e quelle ospedaliere, italiana oncologia medica (Aiom) tenutosi a l’assistenza farmaceutica, le registrazioni negli Roma dal 28 al 30 ottobre 2016, archivi più anonimi come quelli sui dispositivi • XXXIII Congresso nazionale della Società più personali come gli smartphone: tutto produce italiana di medicina generale e delle cure dati in una quantità che non solo è talmente vasta primarie (Simg) svoltosi a Roma dal 24 al 26 da richiedere un impegno particolare per renderla novembre 2016, gestibile, ma è anche disordinata e quasi ovunque ancora non bene organizzata. • XL Congresso nazionale della Associazione italiana di epidemiologia (AIE) svoltosi a In campo biomedico, accumuliamo dati attraverso Torino dal 19 al 21 ottobre 2016. i risultati degli esami diagnostici e di imaging, gli esiti delle prestazioni e degli interventi sanitari, L’elaborazione delle risposte ha previsto analisi il consumo di medicinali, l’archiviazione delle descrittive, comprendenti il calcolo delle frequenze rilevazioni ambientali, i comportamenti e le assolute e percentuali; le analisi descrittive sono abitudini di vita che possono avere un’influenza state condotte sia sul totale dei rispondenti, sia per sulla salute. Il volume di dati raccolti, se bene area professionale di appartenenza. Le eventuali organizzati e adeguatamente analizzati, può dipendenze tra le variabili, che intervengono nei arricchire il singolo dato in misura esponenziale: diversi quesiti, sono state valutate attraverso il test infatti, quanto maggiore è la base di dati, tanto più del chi-quadro e a tal fine è stato considerato un saranno ricche le informazioni che dal confronto livello di significatività del 5%.
4 | forward B I G DATA — R E P O RT 1. DESCRIZIONE DEL CAMPIONE Il questionario è stato compilato da 674 Il confronto indica più disponibili a rispondere professionisti su 2150 (31,3% del totale) iscritti ai al questionario gli epidemiologi (46,7% dei vari convegni in cui la survey è stata presentata. partecipanti alla rilevazione su i presenti al congresso), seguiti dai medici di medicina generale I questionari restituiti sono tutti correttamente (32,6%) e dagli oncologi (27,8%). Quella dei compilati; non vi sono dunque, su tale campione, medici di medicina generale è l’area di appartenenza dati mancanti. Le tabelle e i grafici seguenti più rappresentata nel campione, con il 48,4% rappresentano i dati riguardanti le caratteristiche sul totale dei rispondenti, seguita dall’area degli anagrafiche e professionali del personale sanitario oncologi che rappresenta il 41,2%, mentre il dato che ha partecipato all’indagine, rilevati nella terza e più basso si registra presso l’area degli epidemiologi ultima parte del questionario. con il 10,4% [e figura 1]. I dati relativi alla specializzazione di appartenenza, La rappresentanza di genere dei rispondenti confrontati con quelli degli iscritti ai vari convegni [e tabella 2] risulta equilibrata, con una leggera ai quali il questionario è stato presentato, sono prevalenza delle femmine che costituiscono il rappresentati in e tabella 1. 51,8% del totale [e figura 2]. TA B E L L A 1 FIGURA 1 Specialità professionali. Distribuzione per area di appartenenza. Percentuali Partecipanti Iscritti di partecipanti alla rilevazione ai convegni sugli iscritti 48,4% Medici Medici di medicina generale 326 1000 32,6 di medicina generale Oncologi 278 1000 27,8 41,2% Epidemiologi 70 150 46,7 Oncologi Totale 674 2150 31,3 10,4% Epidemiologi TA B E L L A 2 FIGURA 2 Genere dei rispondenti. Distribuzione per genere. Frequenza Percentuali Femmine 349 51,8 Maschi 325 48,2 51,8% Femmine Totale 674 100,0 48,2% Maschi
R E P O RT — B I G DATA forward | 5 L’età dichiarata dai rispondenti, come evidenziato Per quanto riguarda la collocazione territoriale nella e tabella 3, vede il maggior numero di dei rispondenti [e tabella 4], chi ha compilato il soggetti con età compresa tra i 18 e i 40 anni questionario lavora soprattutto nel nord e nel centro (39,3%) e da coloro che hanno un’età compresa Italia, rispettivamente il 34,9% e il 33,2% degli tra i 41 e i 60 anni (37,7%). Solo il 23,0% intervistati. Nel sud dell’Italia lavora il 23,4% dei appartiene alla classe degli ultrasessantenni rispondenti; dalle Isole proviene un numero minore [e figura 3]. di partecipanti al sondaggio: l’8,5% [e figura 4]. TA B E L L A 3 TA B E L L A 4 Distribuzione dei rispondenti per classi di età. Ripartizione geografica della regione di lavoro dei rispondenti. Frequenza Percentuali Frequenza Percentuali [18, 40] 265 39,3 Nord 235 34,9 [41, 60] 254 37,7 Centro 224 33,2 Oltre 60 155 23,0 Sud 158 23,4 Totale 674 100,0 Isole 57 8,5 Totale 674 100,0 FIGURA 3 Distribuzione per classi di età. 39,3% 37,7% 23,0% [18, 40] [41, 60] Oltre 60 FIGURA 4 Distribuzione per regione geografica di lavoro. 34,9% 33,2% 23,4% 8,5% Nord Centro Sud Isole
6 | forward B I G DATA — R E P O RT 2 . A N A L I S I D E I R I S U LTAT I La definizione classica di big data è legata alle famose D. 1 3V, che richiamano le caratteristiche più rilevanti di Con il termine big data si fa generalmente riferimento a dati caratterizzati da: questo tipo di applicazioni, ovvero: volume, variabilità Frequenza Percentuale e velocità. Nell’item e D.1 si chiedeva ai rispondenti se fossero a conoscenza di queste caratteristiche. Alto volume, alta variabilità, 334 49,6 alta velocità di produzione (3V) Metà dei rispondenti conosce il classico paradigma delle 3V; l’altra metà del campione si divide tra chi Elevata sensibilità, elevata specificità, 174 25,8 elevata semplicità d’uso (3S) sostiene che gli elementi caratterizzanti dei big data siano elevata sensibilità, specificità e semplicità d’uso Elevato margine di errore, elevata 31 4,6 (25,8%) o alta precisione, produttività e peculiarità efficienza, elevata efficacia (3E) (20,0%). Solo il 4,6% dei soggetti intervistati sostiene Alta precisione, alta produttività, 135 20,0 che a caratterizzare i big data siano elevato margine alta peculiarità (3P) di errore, elevata efficienza ed efficacia [e figura 5]. Totale 674 100,0 Come si può osservare in e figura 6, le distribuzioni delle risposte date all’item e D.1 per area di FIGURA 5 appartenenza sono risultate differenti tra loro; il test Con il termine big data si fa generalmente riferimento a dati del chi-quadro ha infatti evidenziato un’associazione caratterizzati da: significativa. I più preparati sembrano essere gli 49,6% 25,8% epidemiologi: la quasi totalità di questi professionisti Alto volume, alta variabilità, Elevata sensibilità, elevata specificità, alta velocità di produzione (3V) elevata semplicità d’uso (3S) (92,9%) sostiene, infatti, che gli elementi caratterizzanti i big data siano legati alle 3V. I più incerti sembrano i medici di medicina generale, che si distribuiscono tra chi sostiene che i big data siano legati alle 3V (37,7%), alle 3S (30,4%) o alle 3P (25,5%). Gli oncologi appaiono mediamente preparati, più della metà dei rispondenti (52,5%) conosce le tre caratteristiche peculiari dei big data. 20,0% 4,6% Alta precisione, alta produttività, Elevato margine di errore, elevata alta peculiarità (3P) efficienza, elevata efficacia (3E) FIGURA 6 Distribuzione congiunta D.1 per area di appartenenza. 37,7% 30,4% 6,4% 25,5% 52,5% 26,6% 2,9% 18,0% 92,9% 1,4% 2,9% 2,9% Alto volume, Elevata sensibilità, Elevato margine di errore, Alta precisione, alta variabilità, elevata specificità, elevata efficienza, alta produttività, alta velocità di produzione (3V) elevata semplicità d’uso (3S) elevata efficacia (3E) alta peculiarità (3P) Medici di medicina generale Oncologi Epidemiologi
R E P O RT — B I G DATA forward | 7 Esiste un’associazione tra le risposte dell’item D. 2 e D.1 e l’area geografica di lavoro dei rispondenti: Considerate le caratteristiche, quale di queste fonti può contribuire appaiono più preparati i professionisti del Nord al flusso di big data? e del Centro Italia, per loro si ha infatti la più alta Frequenza Percentuali percentuale di risposte corrette. È stata riscontrata Dati di acquisto nei supermercati 70 10,4 anche una dipendenza significativa con l’età dei memorizzati su carte di credito rispondenti: a conoscere il legame tra big data e le o carte fedeltà 3V sono soprattutto i soggetti più giovani, con età Comportamenti di lettura 94 13,9 inferiore a 60 anni. su dispositivi digitali come Kindle Eterogenee sono le fonti di generazione di dati Qualità dell’aria monitorata 54 8,0 nei centri cittadini dai rilevatori potenzialmente utilizzabili, per esempio: i dati di di inquinamento acquisto dei supermercati memorizzati sulle carte di credito e sulle fidelity card, i comportamenti Tutte le precedenti 456 67,7 di lettura registrati su dispositivi digitali come ad Totale 674 100,0 esempio il Kindle, oppure i dati relativi alla qualità dell’aria rilevati dalle centraline antinquinamento. L’item e D.2 voleva indagare sulla conoscenza FIGURA 7 Considerate le caratteristiche, quale di queste fonti da parte dei rispondenti delle principali fonti di può contribuire al flusso di big data? generazione dei big data. 10,4% 13,9% Dati di acquisto nei supermercati Comportamenti di lettura La maggior parte dei soggetti intervistati (67,7%) è memorizzati su carte di credito su dispositivi digitali cosciente dell’eterogeneità delle fonti di generazione o carte fedeltà come Kindle dei dati. Il 13,9% crede che a contribuire al flusso dei big data siano solo i dati dei comportamenti di lettura registrati ad esempio dai Kindle; il 10,4% ritiene invece che siano i dati di acquisto dei supermercati memorizzati su carte di credito o carte fedeltà. Solo l’8,0% pensa che il flusso dei big data si alimenti con i dati ambientali registrati dalle centraline presenti nelle città [e figura 7]. Non è stata riscontrata alcuna associazione significativa tra le risposte date all’item e D.2 67,7% 8,0% e l’area di appartenenza dei rispondenti; Tutte le precedenti Qualità dell’aria monitorata nei centri cittadini le distribuzioni delle risposte possono essere dai rilevatori di inquinamento osservate in e figura 8. FIGURA 8 Distribuzione congiunta D.2 per area di appartenenza. 12,3% 14,4% 8,6% 64,7% 7,9% 15,8% 7,9% 68,3% 11,4% 4,3% 5,7% 78,6% Dati di acquisto nei supermercati Comportamenti di lettura Qualità dell’aria monitorata Tutte le precedenti memorizzati su carte di credito su dispositivi digitali nei centri cittadini dai rilevatori o carte fedeltà come Kindle di inquinamento Medici di medicina generale Oncologi Epidemiologi
8 | forward B I G DATA — R E P O RT L’item e D.3 voleva sapere dai rispondenti quali sono D. 3 le fonti che contribuiscono all’alimentazione dei big In ambito sanitario, a proposito di quali fonti possiamo parlare di big data? data in ambito sanitario. Frequenza Percentuali Dalle analisi emerge che la metà dei rispondenti (50,6%) ritiene che la fonte principale di generazione Singoli registri di farmaci 51 7,6 di big data in ambito sanitario siano le cartelle Cartelle cliniche elettroniche dei 341 50,6 cliniche elettroniche dei cittadini; discreta è anche cittadini (electronic health record) la percentuale di quei professionisti che indicano Risultati di studi controllati 192 28,5 come possibile fonte i risultati degli studi controllati randomizzati randomizzati (28,5%) o degli studi osservazionali (13,4%). Solo il 7,6% dei rispondenti indica i singoli Risultati di studi osservazionali 90 13,4 registri di farmaci [e figura 9]. Totale 674 100,0 È stata riscontrata un’associazione significativa tra le risposte date all’item e D.3 e l’area di appartenenza FIGURA 9 dei rispondenti [e figura 10]: gli epidemiologi sono In ambito sanitario, a proposito di quali fonti i più convinti che il futuro dei big data in ambito possiamo parlare di big data? sanitario sia legato alle cartelle cliniche elettroniche 7,6% 50,6% Singoli registri di farmaci Cartelle cliniche elettroniche dei cittadini (85,7%); i medici di medicina generale dei cittadini (electronic health record) e gli oncologi si dividono tra electronic health record e risultati di studi controllati randomizzati o di studi osservazionali. Le risposte date all’item e D.3 sono risultate inoltre statisticamente dipendenti dall’area geografica di lavoro. Ad esempio, per i professionisti del Nord le fonti generatrici di big data in ambito sanitario sono le cartelle cliniche elettroniche; mentre per quelli del Centro e Sud Italia sono i risultati degli studi controllati randomizzati. 13,4% 28,5% Risultati di studi Risultati di studi Una serie di tre item a risposta multipla, dal e D.4 osservazionali controllati randomizzati al e D.6, chiedevano ai rispondenti di indicare gli ambiti disciplinari della sanità dove l’utilizzo dei big data sembra più promettente, quali sono le applicazioni dei big data analytics più convincenti e quali progetti supporterebbero se fossero chiamati a investire in queste nuove tecnologie. FIGURA 10 Distribuzione congiunta D.3 per area di appartenenza. 7,1% 52,8% 24,2% 16,0% 7,9% 39,2% 40,3% 12,6% 8,6% 85,7% 1,4% 4,3% Singoli registri di farmaci Cartelle cliniche elettroniche Risultati di studi Risultati di studi dei cittadini controllati randomizzati osservazionali (electronic health record) Medici di medicina generale Oncologi Epidemiologi
R E P O RT — B I G DATA forward | 9 D. 4 A suo parere, in quali ambiti disciplinari della sanità l’utilizzo di big data sembra più promettente? Percentuali Percentuali sul totale sul totale Frequenza delle risposte dei rispondenti In ambito organizzativo 158 22,1 23,4 e amministrativo Nella determinazione 219 30,6 32,5 delle politiche sanitarie In ambito epidemiologico 205 28,6 30,4 In ambito clinico 134 18,7 19,9 Totale 716 100,0 105,0 D. 5 Quali applicazioni dei big data analytics le sembrano più convincenti? Percentuali Percentuali sul totale sul totale Frequenza delle risposte dei rispondenti Migliorare il servizio ai pazienti 214 29,2 31,8 analizzando l’analisi del web sentiment Monitorare preventivamente 98 13,4 14,5 la diffusione di malattie infettive Tenere sotto controllo efficacia 243 33,1 36,1 e sicurezza delle prestazioni ospedaliere Rendere più efficiente 179 24,4 26,6 la sorveglianza degli effetti dei medicinali Totale 734 100,0 108,9 D. 6 Se fosse chiamato a investire, su quali di queste progettualità impegnerebbe risorse? Percentuali Percentuali sul totale sul totale Frequenza delle risposte dei rispondenti Clinical data (cartelle cliniche 258 36,8 38,3 elettroniche, sistemi di archiviazione di imaging, ecc.) Clinical references (database 233 33,2 34,6 informativi per il personale sanitario, archivio di linee-guida, percorsi diagnostico terapeutici, sistemi esperti di drug information, ecc.) Genomic data 84 12,0 12,5 Organizational data (sistemi 126 18,0 18,7 di gestione amministrativa a partire dalle cartelle cliniche elettroniche) Totale 701 100,0 104,0
10 | forward B I G DATA — R E P O RT Dall’analisi delle risposte emerge chiaramente che Le applicazioni con più alto numero di risposte i rispondenti sono coscienti della molteplicità dei riguardano l’efficacia e la sicurezza delle prestazioni campi d’impiego dei big data, dividendosi quasi ospedaliere (33,1% sul totale delle risposte, 36,1% equamente tra tutte le riposte proposte: il 30,6% sul totale dei rispondenti), il miglioramento (32,5% sul totale dei rispondenti) sostiene che del servizio ai pazienti attraverso l’analisi del l’ambito applicativo più promettente sia quello delle web sentiment (29,2% sul totale delle risposte, politiche sanitarie, il 28,6% (30,4% sul totale dei 31,8% sul totale dei rispondenti) e il fatto di rispondenti) che sia invece quello dell’epidemiologia, rendere più efficiente la farmacovigilanza (24,4% il 22,1% (23,4% sul totale dei rispondenti) che sia sul totale delle risposte, 26,6% sul totale dei quello organizzativo e amministrativo, il 18,7% rispondenti); l’applicazione che convince di meno (19,9% sul totale dei rispondenti) che sia quello è il monitoraggio preventivo della diffusione delle clinico [e figura 11]. malattie infettive (13,4% sul totale delle risposte, 14,5% sul totale dei rispondenti) [e figura 12]. F I G U R A 11 A suo parere, in quali ambiti disciplinari della sanità l’utilizzo di big data sembra più promettente? 22,1% 30,6% 28,6% 18,7% 23,4% 32,5% 30,4% 19,9% In ambito organizzativo Nella determinazione In ambito epidemiologico In ambito clinico e amministrativo delle politiche sanitarie Percentuale sul totale delle risposte Percentuale sul totale dei rispondenti F I G U R A 12 Quali applicazioni dei big data analytics le sembrano più convincenti? 29,2% 13,4% 33,1% 24,4% 31,8% 14,5% 36,1% 26,6% Migliorare il servizio ai pazienti Monitorare preventivamente Tenere sotto controllo Rendere più efficiente analizzando l’analisi la diffusione efficacia e sicurezza la sorveglianza degli effetti del web sentiment di malattie infettive delle prestazioni ospedaliere dei medicinali Percentuale sul totale delle risposte Percentuale sul totale dei rispondenti
R E P O RT — B I G DATA forward | 11 I progetti ritenuti più interessanti dai soggetti intervistati riguardano i clinical data (36,8% sul totale delle risposte, 38,3% sul totale dei rispondenti) e i clinical references (33,2% sul totale delle risposte, 34,6% sul totale dei rispondenti). Meno appetibili sono risultati i progetti legati agli organizational data (18,0% sul totale delle risposte, 18,7% sul totale dei rispondenti) e ai genomic data (12,0% sul totale delle risposte, 12,5% sul totale dei rispondenti) [e figura 13]. La domanda e D.7 chiedeva ai rispondenti di indicare il progetto in grado di sfruttare efficacemente le potenzialità dei big data. F I G U R A 13 Se fosse chiamato a investire, su quali di queste progettualità impegnerebbe risorse? 36,8% 33,2% 12,0% 18,0% 38,3% 34,6% 12,5% 18,7% Clinical data Clinical references Genomic data Organizational data (cartelle cliniche elettroniche, (database informativi per il (sistemi di gestione sistemi di archiviazione personale sanitario, archivio di amministrativa a partire di imaging, ecc.) linee-guida, percorsi diagnostico dalle cartelle cliniche terapeutici, sistemi esperti elettroniche) di drug information, ecc.) Percentuale sul totale delle risposte Percentuale sul totale dei rispondenti D. 7 Tra le cose di seguito elencate, quale le piacerebbe di più veder realizzata? Frequenza Percentuali Una serie di mappe interattive su web 94 13,9 che aiuti i cittadini a valutare la qualità della performance di strutture sanitarie diverse in una stessa area geografica Un’applicazione web che metta in relazione 268 39,8 diversi professionisti a partire dall’analisi della loro prevalente attività clinica o di ricerca Un’app che, automaticamente, permetta 147 21,8 a ciascuno di vedere integrati i propri dati sanitari con quelli derivanti dalle abitudini alimentari e dagli stili di vita (fitness, ecc.) Un sistema di monitoraggio del rischio 165 24,5 attraverso la rilevazione di dati ambientali, comportamentali e sanitari Totale 674 100,0
12 | forward B I G DATA — R E P O RT Rispetto all’item e D.7, la maggior parte dei FIGURA 14 rispondenti (39,8%) ha mostrato interesse per Tra le cose di seguito elencate, quale le piacerebbe di più veder realizzata? la realizzazione di un’applicazione che possa mettere in relazione i diversi professionisti sulla 13,9% 39,8% Una serie di mappe interattive su web Un’applicazione web che metta in base della loro attività clinica o di ricerca. Il 24,5% che aiuti i cittadini a valutare la qualità relazione diversi professionisti a partire è incuriosito dalla possibile realizzazione di un della performance di strutture sanitarie dall’analisi della loro prevalente sistema di monitoraggio del rischio basato su dati diverse in una stessa area geografica attività clinica o di ricerca ambientali, comportamentali e sanitari, mentre il 21,8% è attratto dall’idea di un’app che integri i dati sanitari con quelli derivanti dalle abitudini alimentari e dagli stili di vita. Solo al 13,9% piacerebbe veder realizzate mappe interattive per guidare i cittadini nella valutazione della qualità delle performance di diverse strutture sanitarie del medesimo territorio [e figura 14]. Osservando la e figura 15 è possibile notare come vi sia una significativa differenza delle risposte 24,5% 21,8% Un sistema di monitoraggio Un’app che, automaticamente, date a questo item dai tre gruppi di professionisti: del rischio attraverso la rilevazione permetta a ciascuno di vedere ad esempio, i più interessati a un sistema di di dati ambientali, integrati i propri dati sanitari monitoraggio del rischio basato su dati ambientali, comportamentali e sanitari con quelli derivanti dalle abitudini alimentari e dagli stili di vita comportamentali e sanitari sono gli epidemiologi. (fitness, ecc.) Oncologi e medici di medicina generale sembrano più attratti da un’applicazione web che metta in relazione i diversi professionisti sulla base della loro prevalente attività clinica o di ricerca. Nell’item e D.8 si chiedeva ai rispondenti un parere rispetto all’utilizzo d’informazioni su salute e sanità scambiate dai cittadini sui social media. FIGURA 15 Distribuzione congiunta D.7 per area di appartenenza. 12,0% 42,9% 22,1% 23,0% 17,6% 41,7% 21,6% 19,1% 8,6% 17,1% 21,4% 52,9% Una serie di mappe interattive Un’applicazione web che metta Un’app che, automaticamente, Un sistema di monitoraggio su web che aiuti i cittadini a in relazione diversi professionisti permetta a ciascuno di vedere del rischio attraverso valutare la qualità a partire dall’analisi della loro integrati i propri dati sanitari la rilevazione di dati ambientali, della performance prevalente attività clinica con quelli derivanti comportamentali e sanitari di strutture sanitarie diverse o di ricerca dalle abitudini alimentari in una stessa area geografica e dagli stili di vita (fitness, ecc.) Medici di medicina generale Oncologi Epidemiologi
R E P O RT — B I G DATA forward | 13 Dall’esame delle risposte emerge come circa la FIGURA 16 metà dei rispondenti (44,2%) ritenga interessante La considerazione del punto di vista dei cittadini sulla salute e sulla sanità attraverso i social media le sembra: l’impiego di informazioni derivate dai social media, anche se esposte a distorsioni legate alla 24,0% 44,2% Difficilmente realizzabile perché Interessante ma esposta a distorsioni rappresentatività del campione. Il 21,8% considera troppo condizionata da un irriducibile per le difficoltà di considerare tale fonte molto promettente, soprattutto nell’ambito “rumore di fondo” della rete rappresentativo qualsiasi campione della digital epidemiology; il 24,0% è scettico e di popolazione tratto da internet sostiene che tale utilizzo sia difficilmente realizzabile a causa dell’irriducibile rumore di fondo della rete; mentre circa il 10% dei professionisti intervistati non è in grado di esprimersi poiché non utilizza canali social [e figura 16]. Non è stata riscontrata nessuna associazione tra le risposte date all’item e D.8 e l’area di appartenenza dei rispondenti: le differenze riscontrate sono del tutto casuali [e figura 17]. 9,9% 21,8% Non so rispondere perché non Molto promettente, soprattutto conosco Twitter e uso Facebook solo nell’ambito delle applicazioni per essere in contatto con gli amici della digital epidemiology D. 8 La considerazione del punto di vista dei cittadini sulla salute e sulla sanità attraverso i social media (Facebook, Twitter, YouTube, ecc.) le sembra: Frequenza Percentuali Difficilmente realizzabile perché troppo 162 24,0 condizionata da un irriducibile “rumore di fondo” della rete Interessante ma esposta a distorsioni per le 298 44,2 difficoltà di considerare rappresentativo qualsiasi campione di popolazione tratto da internet Molto promettente, soprattutto nell’ambito 147 21,8 delle applicazioni della digital epidemiology Non so rispondere perché non conosco Twitter 67 9,9 e uso Facebook solo per essere in contatto con gli amici Totale 674 100,0 FIGURA 17 Distribuzione congiunta D.8 per area di appartenenza. 27,9% 39,6% 22,1% 10,4% 20,1% 50,0% 20,5% 9,4% 21,4% 42,9% 25,7% 10,0% Difficilmente realizzabile Interessante ma esposta Molto promettente, Non so rispondere perché troppo condizionata a distorsioni per le difficoltà soprattutto nell’ambito perché non conosco Twitter da un irriducibile di considerare rappresentativo delle applicazioni e uso Facebook solo per essere “rumore di fondo” della rete qualsiasi campione della digital epidemiology in contatto con gli amici di popolazione tratto da internet Medici di medicina generale Oncologi Epidemiologi
14 | forward B I G DATA — R E P O RT L’item e D.9 riguardava il problema cruciale D. 9 della riservatezza dei dati. Il punto di partenza La riservatezza dei dati è una questione controversa. A suo parere: per affrontarlo non si semplifica con i big data; Frequenza Percentuali è necessario stabilire i livelli di riservatezza dei dati, individuare e classificare quelli più sensibili e È un problema centrale 136 20,2 individuando delle soluzioni di accesso sicuro. e difficilmente risolvibile La quasi totalità dei rispondenti (86,9%) è È una questione rilevante che può 193 28,6 essere risolta adottando regole consapevole del ruolo della riservatezza dei dati: molto stringenti il 38,1% ritiene che il problema della riservatezza debba essere affrontato coinvolgendo maggiormente È una questione importante 257 38,1 che deve essere affrontata i cittadini; il 28,6% pensa invece che possa essere coinvolgendo maggiormente superato solo adottando delle regole molto stringenti; i cittadini il 20,2% crede che il problema della riservatezza È una questione sopravvalutata 88 13,1 sia difficilmente risolvibile. Il rimanente 13,1% del campione sostiene che la riservatezza dei dati sia Totale 674 100,0 invece una questione sopravvalutata [e figura 18]. Com’è possibile osservare in e figura 19, le risposte FIGURA 18 La riservatezza dei dati è una questione controversa. sulla riservatezza dei dati sono risultate dipendenti A suo parere: dall’area di appartenenza dei rispondenti: tutti i 20,2% 28,6% professionisti intervistati sono concordi su di un È un problema centrale È una questione rilevante necessario coinvolgimento dei cittadini. Ad apparire e difficilmente risolvibile che può essere risolta adottando più scettica è una discreta parte dei medici di medina regole molto stringenti generale, per loro infatti il problema è centrale e di non facile risoluzione. Quasi un terzo degli epidemiologi ritiene invece che la riservatezza dei dati sia una questione sopravvalutata. 13,1% 38,1% È una questione sopravvalutata È una questione importante che deve essere affrontata coinvolgendo maggiormente i cittadini FIGURA 19 Distribuzione congiunta D.9 per area di appartenenza. 24,5% 28,8% 34,4% 12,3% 18,3% 29,9% 41,4% 10,4% 7,1% 22,9% 42,9% 27,1% È un problema centrale È una questione rilevante È una questione importante È una questione e difficilmente risolvibile che può essere risolta che deve essere affrontata sopravvalutata adottando regole coinvolgendo maggiormente molto stringenti i cittadini Medici di medicina generale Oncologi Epidemiologi
R E P O RT — B I G DATA forward | 15 Con l’item e D.10 si chiedeva ai rispondenti di D. 1 0 indicare cosa sia necessario per favorire l’utilizzo A suo giudizio, cosa è necessario per favorire l’utilizzo dei big data in sanità? (indicare la sola risposta ritenuta più convincente) dei big data in sanità. Dall’analisi delle risposte Frequenza Percentuali appare una platea piuttosto divisa: per il 30,8% degli intervistati sarebbe necessario che al dato sia Serve che al “dato” sia assegnato 214 31,8 assegnato il giusto valore nella pratica assistenziale; il giusto valore nella pratica rispettivamente per il 30,4% e il 20,6%, dovrebbe assistenziale invece svilupparsi una sanità che si programmi sulla Serve una sanità che premi 116 17,2 base dell’analisi dei dati o che si basi su una cultura gli operatori che basano le proprie dei dati; infine, per 17,2% servirebbe una sanità scelte sull’analisi dei dati che premi gli operatori che basano le proprie scelte Serve una sanità che faccia 205 30,4 sull’analisi dei dati [e figura 20]. programmazione basandosi sull’analisi dei dati Esiste una differenza significativa tra le risposte date Serve una sanità che si basi 139 20,6 dai professionisti delle diverse aree: ad esempio, la su una “cultura dei dati” maggior parte degli oncologi si divide tra chi ritiene che occorra assegnare al dato il giusto valore nella Totale 674 100,0 pratica assistenziale (30,2%) e chi sostiene che sia necessaria una sanità che si programmi sulla base FIGURA 20 dell’analisi dei dati (35,3%). Gli epidemiologi A suo giudizio, cosa è necessario per favorire l’utilizzo sostengono invece che sia necessaria una sanità che si dei big data in sanità? programmi sull’analisi di questi dati (38,6%) e una 31,8% 17,2% sanità basata sulla cultura del dato (35,7%). I medici Serve che al “dato” sia assegnato Serve una sanità che premi il giusto valore nella pratica gli operatori che basano di medicina generale si dividono fra tre opportunità: assistenziale le proprie scelte sull’analisi dei dati assegnare al dato il giusto valore nella pratica assistenziale (35,0%), spingere per una sanità che si programmi basandosi sull’analisi dei dati (24,5%) e che premi gli operatori che basano le proprie scelte sull’analisi dei dati (22,4%) [e figura 21]. 20,6% 30,4% Serve una sanità che si basi Serve una sanità che faccia su una “cultura dei dati” programmazione basandosi sull’analisi dei dati FIGURA 21 Distribuzione congiunta D.10 per area di appartenenza. 35,0% 22,4% 24,5% 18,1% 30,2% 14,7% 35,3% 19,8% 22,9% 2,9% 38,6% 35,7% Serve che al “dato” Serve una sanità Serve una sanità Serve una sanità sia assegnato il giusto valore che premi gli operatori che faccia programmazione che si basi su una nella pratica assistenziale che basano le proprie scelte basandosi sull’analisi “cultura dei dati” sull’analisi dei dati dei dati Medici di medicina generale Oncologi Epidemiologi
16 | forward B I G DATA — R E P O RT 3. DISCUSSIONE La considerazione dei risultati dell’indagine mette di quello relativamente meno promettente e, fronte a una prima evidenza: si sente molto parlare specularmente, ritenute più probabili le ricadute di big data ma non sempre si sa cosa intendiamo sulla definizione delle politiche sanitarie e con questa espressione. Le risposte alla prima sull’organizzazione. Anche se (domanda 5) si domanda del questionario mettevano il medico di riconosce il risultato ottenuta dalla data analytics fronte a 12 caratteristiche raggruppate, ad arte, per nel migliorare il servizio ai pazienti e rendere più le iniziali delle diverse parole. La quasi totalità degli efficiente la farmacovigilanza. Quindi, aspetti epidemiologi che ha risposto non ha avuto dubbi molto vicini alla clinica e al rapporto tra medico e nell’indicare in volume-variabilità-velocità di produzione malato. Solo il 12,5% dei professionisti che hanno le qualità che distinguono i big data. Solo in un caso partecipato al sondaggio impegnerebbe risorse su due, invece, i 278 oncologi hanno colto nel segno. sulla ricerca nell’ambito dei genomic data. Come Grande incertezza da parte degli oltre 300 medici di già rilevato dall’indagine svolta sulla medicina di medicina generale che molto più dei loro colleghi precisione, c’è una sorprendente distanza tra gli associano ai big data caratteristiche quali sensibilità- investimenti istituzionali e la convinzione dell’utilità specificità-semplicità d’uso o precisione-produttività- di questi studi da parte dei medici. Confrontando le peculiarità. Colpisce l’associazione significativa tra risposte alle domande 5 e 7 si nota un attrito. conoscenza dell’argomento e residenza nelle regioni Da una parte, l’interesse a usare i big data per tenere settentrionali, aspetto meno prevedibile della sotto controllo efficacia e sicurezza delle prestazioni relazione tra la preparazione sul tema e l’età (i medici ospedaliere, prospettiva da seguire per il 36,1% degli meno giovani dispongono di un’informazione meno intervistati. Dall’altra, la mancanza di interesse a che completa). Certamente, quello dell’epidemiologia questi dati siano utilizzati per mettere i cittadini in è un ambito in cui il dato è oggetto di studio più condizione di valutare le performance ospedaliere frequente e strumento di lavoro quotidiano. Anche (13,9% nella domanda 7). se, a una maggiore competenza, non corrisponde necessariamente una minore perplessità rispetto ai Il monitoraggio del rischio tramite la rilevazione rischi connessi a un ricorso più frequente ai big data di dati ambientali, comportamentali e sanitari è nell’attività di ricerca. Una curiosità: dei 12 termini poco attraente per i clinici e molto di più per gli proposti nelle 4 opzioni di risposta, solo uno aveva epidemiologi (20% vs 52%) e questi ultimi ritengono un’esplicita valenza negativa (errore) e la risposta promettente l’uso del social web e le metodologie che lo contemplava è risultata di gran lunga la meno della digital epidemiology. prescelta. In definitiva, il “dato” è una sorta di convitato di Epidemiologi più accorti anche nell’individuare le pietra, presenza minacciosa e paradossalmente molto fonti di big data: solo in 3 su 70 sono caduti nella spesso anche muta. “Serve una sanità che si basi sulla trappola, indicando nei dispositivi di lettura come cultura del dato”, chiede un epidemiologo su tre. il Kindle una fonte esclusiva di big data e, ancora “Serve che al dato sia assegnato il giusto valore nella più significativo, scegliendo solo in un caso gli studi pratica assistenziale”, sostengono i medici oncologi controllati randomizzati (rct). Al contrario, il 40% e di medicina generale: ma qual è il “giusto” valore? degli oncologi crede che gli rct possano contribuire L’aggettivo è usato in accezione positiva o con una all’afflusso di big data: ma come faranno a rendere nota critica? compatibile questa convinzione con la “velocità di produzione”, caratteristica anche per loro essenziale Tra i due estremi – gli entusiasti e chi alza il dei big data? sopracciglio avanzando dubbi sull’utilità pratica dei big data in medicina – c’è l’evidenza dei grandi Non è facile orientarsi tra le risposte alle domande investimenti per aumentare la raccolta e l’uso delle 4, 5, 6 e 7, trovando gli elementi utili a una informazioni. Un articolo del Financial Times ben comprensione dello stato dell’arte e dei possibili descriveva il contrasto tra promesse e remore legate, sviluppi. Sembra che l’ambito clinico sia considerato soprattutto, alla protezione della riservatezza1.
R E P O RT — B I G DATA A forward forwar | 17 7,1 milioni di pazienti in tutto il mondo utilizzano dispositivi di monitoraggio remoto* 75% Più del 47,9% è il tasso di crescita annuo composto stimato degli ospedali del numero di pazienti raccoglie dati monitorati in remoto che sui pazienti nel 2021 raggiungerà i 50,2 milioni* 80% L’ dei dati sanitari non è 1000 letture al secondo strutturato e viene archiviato o 86.400 al giorno in centinaia di forme diverse vengono erogate come analisi di laboratorio, dai sistemi immagini e appunti di monitoraggio dei medici del paziente L’assistenza sanitaria è di fronte alla sfida rappresentata La capacità di analizzare il flusso da flussi di grandi quantità di dati di vario genere, dei big data in tempo reale non strutturati e in crescita esponenziale. per contribuire a prevedere l’insorgenza Flussi continui in tempo reale provenienti da sensori della malattia e dare una risposta istantanea interconnessi, monitor e strumenti più veloci offre una nuova prospettiva che aiuterà della capacità di analisi di un medico o di un infermiere. a trasformare l’assistenza sanitaria. * dati Berg insight, 2017
18 | forward B I G DATA — R E P O RT La ricerca collaborativa tra Birmingham children l’esito delle cure. L’attesa dei risultati non è a lunga hospital e McLaren applied technologies, uno dei scadenza; per il 75% dei manager i frutti possono grandi attori della Formula 1, è vicina a ottimizzare essere raccolti entro il primo anno e per l’87% entro i dati della frequenza cardiaca e respiratoria in i primi tre anni dall’avvio del programma. In un rapporto ai livelli di ossigeno per un migliore contesto orientato agli esiti, la soddisfazione del controllo dell’asma. È un progetto che vale £ 1,8 paziente è la cosa che conta maggiormente (59%): milioni. Sempre in Gran Bretagna e sempre nel più della riduzione dei tempi di attesa e della mondo dell’automobilismo, l’Imperial College di durata dei ricoveri (56%). I maggiori sviluppi sono Londra cerca di sfruttare i sensori della F1 per la nell’interoperabilità dei dati, nella unificazione diagnosi di disturbi neurologici. Di esperienze simili tra patient registries e physician directories e nella se ne potrebbero raccontare a centinaia. predittività. L’armonizzazione dei dati dalle diverse fonti è la premessa per un uso critico dei dati e per lo Un rapporto del McKinsey global institute stimava sviluppo di strumenti di analytics efficaci e di facile che un uso saggio dei big data potrebbe generare un utilizzazione. Più di un manager su 3 è convinto che risparmio di circa 100 miliardi di dollari l’anno per quello sui big data sia un investimento capace di il servizio sanitario statunitense: “A game changer in dare vantaggi tangibili: quasi uno su 2 ritiene che nel healthcare”, titolava Forbes2. Nella prevenzione, per prossimo futuro si spenderà più per la formazione esempio, grazie ai dati raccolti con gli smartphone delle macchine che per quella delle risorse umane. e relativi alla rilevazione dello stato di forma fisica, alle abitudini alimentari, fino allo stato psicologico Conclusioni tenuto sotto controllo con la tracciatura di emozioni È difficile tirare le fila su una questione così e sentimenti sui social media. Nella diagnosi, complessa e in costante divenire. Quello che soprattutto per l’impegno a rendere interoperabile sicuramente emerge dall’approfondimento di Forward i sistemi di archiviazione dei dati, dalle cartelle e dalla rilevazione del sentiment dei clinici e degli cliniche elettroniche ai record delle assicurazioni, epidemiologi è un generale disorientamento: non fino ai dati generati dai sensori che indossiamo. mancano le aspettative, non solo da parte delle Nella terapia, sia per i molto pubblicizzati progressi imprese e dei dirigenti sanitari. Restano i dubbi: nella genomica sia per le prospettive che secondo legati al trade-off tra vantaggi e rischi, in tema alcuni potrebbero offrire i sistemi di deep learning di ridefinizione dei ruoli e delle competenze del basati sul perfezionamento degli algoritmi sempre personale sanitario, come anche riguardo i percorsi meglio informati dai dati stessi via via raccolti. dell’assistenza e della ricerca epidemiologica e clinica Fino al follow-up dell’assistenza che potrebbe che potrebbero indubbiamente risultare ridisegnati. essere rivoluzionato dalla diffusione di app utili a L’importanza di un dialogo tra il mondo della sanità massimizzare l’aderenza alle prescrizioni così come e quello della information technology è sempre più a garantire il monitoraggio costante del paziente da evidente: un confronto che serva a mettere in luce parte del medico. le criticità, a sciogliere i nodi, a chiarire le aree di L’ingresso dei big data nell’assistenza al paziente opacità e di dubbio. comporterebbe un cambiamento radicale dell’essere Fermo restando che proprio l’incertezza si candida a medico: supportato da super-computer capaci essere la costante della medicina dei prossimi anni. di combinare intelligenza artificiale e sofisticati software analitici in grado di portare ai massimi livelli di qualità la performance clinica, oppure disoccupato3. Allo stesso tempo, i big data si candidano a modificare in maniera dirompente non solo le dinamiche organizzative dei sistemi sanitari ma anche – a fronte di investimenti rilevanti – a rivoluzionarne i bilanci, razionalizzando la spesa e riducendo i costi. Probabilmente è questo il 1. Viňa G. Big data promise exponential change in healthcare. quadro che permette di capire il timore dei clinici e Financial Times 2016; 29 novembre. l’entusiasmo dei decision maker sanitari. 2. Marr B. Big data: a game changer in healthcare. Forbes 2016; 24 maggio. Un’indagine svolta da Accenture consulting4 su 61 3. Obermeyer Z, Emanuel EJ. Predicting the future – Big data, machine learning, and clinical medicine. N Engl J Med executive della sanità ha dato indicazioni interessanti. 2016;375:1216-9. Vedi anche: Predire il futuro. Intervista a Ziad Il 93% dei manager consultati ha implementato Obermeyer. Recenti Prog Med 2016; Suppl Forward4; S12 con successo sistemi di data analytics per migliorare 4. www.accenture.com
Big data 1. Con il termine big data si fa generalmente riferimento Clinical references (database informativi per il personale a dati caratterizzati da: sanitario, archivio di linee-guida, percorsi diagnostico- [una sola risposta] terapeutici, sistemi esperti di drug information, ecc.) alto volume, alta variabilità, alta velocità Genomic data di produzione (3V) Organizational data (sistemi di gestione amministrativa elevata sensibilità, specificità e semplicità d’uso (3S) a partire dalle cartelle cliniche elettroniche) elevato margine di errore, elevata efficienza e efficacia (3E) 7. Tra le cose di seguito elencate, quale le piacerebbe di più veder realizzata? alta precisione, produttività, peculiarità (3P) Una serie di mappe interattive su web che aiuti i cittadini Considerate le caratteristiche, quale di queste fonti a valutare la qualità della performance di strutture 2. può contribuire al flusso di big data? sanitarie diverse in una stessa area geografica [una sola risposta] Un’applicazione web che metta in relazione diversi Dati di acquisto nei supermercati memorizzati professionisti a partire dall’analisi della loro prevalente su carte di credito o carte fedeltà attività clinica o di ricerca Comportamenti di lettura su dispositivi digitali Una app che, automaticamente, permetta a ciascuno di come Kindle vedere integrati i propri dati sanitari con quelli derivanti Qualità dell’aria monitorata nei centri cittadini dai dalle abitudini alimentari e dagli stili di vita (fitness, ecc.) rilevatori di inquinamento Un sistema di monitoraggio del rischio attraverso la Tutte le precedenti rilevazione di dati ambientali, comportamentali e sanitari In ambito sanitario, a proposito di quali fonti possiamo 8. La considerazione del punto di vista dei cittadini sulla 3. parlare di big data? salute e sulla sanità attraverso i social media (Facebook, [una sola risposta] Twitter, YouTube, ecc.) le sembra: Singoli registri di farmaci difficilmente realizzabile perché troppo condizionata da Cartelle cliniche elettroniche dei cittadini un irriducibile “rumore di fondo” della rete (electronic health records) interessante ma esposta a distorsioni per le difficoltà Risultati di studi controllati randomizzati di considerare rappresentativo qualsiasi campione di Risultati di studi osservazionali popolazione tratto da internet molto promettente, soprattutto nell’ambito delle applicazioni della digital epidemiology 4. A suo parere, in quali ambiti disciplinari della sanità non so rispondere perché non conosco Twitter e uso l’utilizzo di big data sembra più promettente? Facebook solo per essere in contatto con gli amici In ambito organizzativo e amministrativo Nella determinazione delle politiche sanitarie La riservatezza dei dati è una questione controversa. In ambito epidemiologico 9. A suo parere: In ambito clinico è un problema centrale e difficilmente risolvibile è una questione rilevante che può essere risolta 5. Quali applicazioni dei big data analytics le sembrano più adottando regole molto stringenti convincenti? è una questione importante che deve essere affrontata Migliorare il servizio ai pazienti analizzando coinvolgendo maggiormente i cittadini l’analisi del web sentiment è una questione sopravvalutata Monitorare preventivamente la diffusione di malattie infettive Tenere sotto controllo efficacia e sicurezza 10. A suo giudizio, cosa è necessario per favorire l’utilizzo dei big data in sanità? delle prestazioni ospedaliere [indicare la sola risposta ritenuta più convincente] Rendere più efficiente la sorveglianza degli effetti dei medicinali Serve che al “dato” sia assegnato il giusto valore nella pratica assistenziale Serve una sanità che premi gli operatori che basano le 6. Se fosse chiamato a investire, su quali di queste progettualità impegnerebbe risorse? proprie scelte sull’analisi dei dati Serve una sanità che faccia programmazione basandosi Clinical data (cartelle cliniche elettroniche, sull’analisi dei dati sistemi di archiviazione di imaging, ecc.) Serve una sanità che si basi su una “cultura dei dati” > Sesso Maschio Femmina > Età ..................... > Luogo di lavoro Nord Centro Sud Isole
Il progetto Forward è realizzato anche grazie al contributo non condizionato di
Puoi anche leggere