Pubblica amministrazione - Appunti per uno stato dell'arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane ...
←
→
Trascrizione del contenuto della pagina
Se il tuo browser non visualizza correttamente la pagina, ti preghiamo di leggere il contenuto della pagina quaggiù
9 *Federico Morando Dati aperti della pubblica amministrazione Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane DOI: 10.14609/Ti_1_16_1i Parole chiave: Dati aperti, informazione detenuta dal settore pubblico, licenze di diritto d'autore e connessi, immobili, linked data, dati geografici Abstract Le Pubbliche Amministrazioni (PA) accumulano dati. Lo fanno per poter funzionare e per dimostrare di aver ben funzionato. La rivoluzione digitale rende trascurabile il costo di mettere a disposizione tali dati per il riutilizzo ed aumenta il costo opportunità di limitarne l'uso alla finalità per cui sono stati raccolti. La normativa incentiva tale riutilizzo, ed esistono numerosi standard tecnici e buone pratiche utili a renderlo anche praticamente fattibile e sostenibile. In sintesi, la pubblicazione di dati aperti è oggi una buona pratica, ma anche un dovere per le PA. Il presente articolo amplia ed organizza i concetti di cui sopra, nell'ottica di fornire gli elementi per comprendere lo stato dell'arte dei dati aperti (intesi come approccio all'amministrazione pubblica, campo di ricerca e movimento). Dal punto di vista normativo, ci si sofferma sul contesto europeo ed italiano. Dal punto di vista tecnico, si offrono alcuni approfondimenti relativi al formalismo “linked data”. Il lavoro prosegue esemplificando più in dettaglio il caso dei dati pubblici relativi al patrimonio immobiliare delle PA italiane. Tale esempio è significativo in quanto al confine tra il mondo dei dati aperti per il riutilizzo tradizionalmente intesi e quello della trasparenza amministrativa; inoltre, la presenza di riferimenti territoriali nei dati (come minimo, il numero civico) fornisce una chiave per l'incrocio con altri dataset. Un’analisi delle pratiche di apertura di tali dati offre anche ottimi spunti per illustrare i limiti di una pubblicazione priva del necessario coordinamento e delle indispensabili linee guida tecniche. * Presidente e AD, Synapta SRL. Fellow, Centro Nexa su Internet e Società - DAUIN, Politecnico di Torino
10 Federico Morando INTRODUZIONE Le Pubbliche Amministrazioni (PA) – così come ogni organizzazione complessa – accumulano dati. Li accumulano per poter funzionare e per dimostrare di aver ben funzionato. Ciò avviene da tempo immemorabile, tanto che ne abbiamo traccia in documenti redatti in scrittura cuneiforme. Tuttavia, qualcosa è cambiato nella natura di questa prodigiosa mole di informazioni negli ultimi decenni: si tratta, sempre più spesso, di informazioni in formato digitale. Questa caratteristica determina conseguenze dirompenti, poiché riduce il costo del riutilizzo di tali dati, e al contempo aumenta il costo opportunità (le occasioni sprecate) relativo a tenere tali dati “chiusi in un cassetto”. La normativa comunitaria, nazionale e locale pone numerosi incentivi alla messa a disposizione dei dati, e gli standard tecnici, per renderli interoperabili e dunque effettivamente riutilizzabili, sono sempre più diffusi e facilmente implementabili. La pubblicazione di dati pubblici “aperti” è così diventata uno dei pilastri dell’Open Government, nonché una delle parole chiave dell’amministrazione della cosa pubblica. Le sezioni del presente articolo sono strutturate nel modo seguente. La prima sezione definisce analiticamente il concetto di “dati aperti”, ed è seguita da un approfondimento relativo alle licenze di diritto d’autore e diritti connessi per la messa a disposizione dei dati. La terza sezione è dedicata all’apertura dei dati in prospettiva tecnologica, ed è seguita da un approfondimento relativo all’interoperabilità semantica. Il lavoro si chiude con un focus relativo ai dati aperti sul patrimonio immobiliare pubblico e con alcune considerazioni conclusive. DATI APERTI In questo lavoro, la definizione di dati aperti è basata sul progetto Open Definition, il cui obiettivo è di rendere preciso “il significato di ‘aperto’, in espressioni quali ‘dati aperti’ e ‘contenuti aperti’”. La Definition può essere riassunta dicendo che “Aperto significa che chiunque è libero di accedere, usare, modificare e condividere – a condizioni che, al massimo, preservino l’indicazione della provenienza e l’apertura stessa.” O, ancor più sinteticamente: “Dati e contenuti aperti possono essere liberamente utilizzati, modificati e condivisi da chiunque per qualunque scopo.” L’apertura può poi essere declinata in accessibilità pratica, apertura giuridica, apertura tecnica. Avere accesso aperto ad un’opera implica che l’intero lavoro è accessibile online senza costi aggiuntivi rispetto ad un eventuale costo di riproduzione una tantum. Inoltre, non devono esserci vincoli legali o tecnici che restringano il suo riutilizzo, se non per quanto descritto sotto. LICENZE PER I DATI APERTI È generalmente riconosciuto (es. da Krötzsch e Speiser (2011), p. 356, con ulteriori riferimenti) ed ho già discusso altrove (Morando (2013b)) che la distribuzione di dati aperti richiede anche l’associazione di una licenza agli stessi. In altre parole, i dati aperti devono essere pubblicati utilizzando licenze aperte. Ciò a causa dell’attuale modello di funzionamento automatico del diritto d’autore (“copyright default”), ovvero l’insieme di diritti che il vigente regime di “diritto d’autore” (inteso in senso lato, comprendendo il diritto d’autore strictu sensu, il copyright, i diritti connessi, ed il diritto sui generis sulle banche di dati) garantisce automaticamente agli autori stessi. Questo “copyright default” implica che “tutti i diritti sono riservati” per la massima durata consentita dalla legge (tipicamente, la vita dell’autore più 70 anni). Inoltre, nessuna formalità è richiesta per godere di questi diritti, neppure la semplice rivendicazione della loro esistenza. Peraltro, anche se in
Dati aperti della pubblica amministrazione 11 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane linea di principio la protezione garantita alle banche di dati non creative tramite il diritto sui generis è più breve della tutela autoriale (durando 15 anni), anche tale diritto nasce automaticamente in capo al costitutore della banca. Inoltre, il più breve termine della protezione delle banche dati è rinnovato automaticamente ad ogni rilevante investimento nell’aggiornarle, il che – considerando che i database sono oggi frequentemente distribuiti come servizi online – è aggravato dal fatto che può essere difficile, nella pratica, anche solo avere accesso ad una versione vecchia di 15 anni dei dati in questione, versione che in linea di principio potrebbe essere liberamente riusabile (al contrario, ciò potrebbe applicarsi ai vecchi CD utilizzati per distribuire le basi di dati nell’era pre-Internet). Senza entrare in ulteriori dettagli, si può dunque affermare che i riutilizzatori dei dati debbano tipicamente assumere che qualsiasi cosa (salvo un singolo dato, o liste banali la cui ricreazione sarebbe comunque semplice) sia in qualche modo protetta da diritti di proprietà intellettuale. (L’eccezione più significativa, che merita una menzione per ulteriori approfondimenti che qui non possono trovare spazio, è rappresentata da database con un’unica fonte, laddove la creazione dei dati e la creazione della banca di dati non possono essere scissi: per ulteriori informazioni, cfr. Hugenholtz (2004)). Dopo aver riassunto le ragioni che rendono l’uso di licenze aperte necessario – o, almeno, molto appropriato – per la pubblicazione di dati aperti, si possono discutere più in dettaglio le caratteristiche che una licenza deve possedere al fine di essere considerata “aperta”. Secondo la Open Definition, sono le seguenti. La licenza dovrebbe essere compatibile con altre licenze aperte. Le sue clausole devono inoltre soddisfare varie condizioni: essa deve permettere il libero utilizzo del lavoro posto in licenza, inclusa la sua distribuzione, modifica (ovvero, la creazione di lavori derivati), scomposizione o compilazione (ovvero, le condizioni devono applicarsi anche a porzioni del materiale dato in licenza, e devono permettere la distribuzione assieme ad altri materiali). Inoltre la licenza non può essere vincolata ad una specifica finalità, ovvero il riutilizzo deve essere possibile per qualsiasi uso (lecito) in qualsiasi campo. Non si possono imporre costi o royalties (rispetto al primo riutilizzo, mentre il riutilizzo commerciale del materiale stesso, o delle sue opere derivate, dev’essere sempre possibile). I soli vincoli accettabili sono clausole di attribuzione che prescrivano la menzione degli autori, contributori, titolari dei diritti, sponsor, ecc., ed il requisito che le versioni modificate siano chiaramente descritte come tali, al fine di garantire l’integrità dei dati lungo la catena dei riutilizzi. Inoltre, sono ammesse clausole del tipo condividi-allo-stesso-modo, ovvero: le licenze possono richiedere l’uso della stessa licenza o di una licenza compatibile per la distribuzione di materiali derivati. Si rimanda al testo completo della Open Definition per ulteriori dettagli.1 Nel momento in cui una Pubblica Amministrazione si trova effettivamente a scegliere una licenza per i propri dati, essa deve ponderare diversi elementi, tra i quali l’opportunità di scegliere gli strumenti più standard, seguendo una raccomandazione inclusa nella Direttiva Europea relativa al riutilizzo dell’informazione del settore pubblico (si veda il considerando 26 della Direttiva 2013/37/EU: “Le eventuali licenze per il riutilizzo di informazioni del settore pubblico dovrebbero comunque imporre il minor numero possibile di restrizioni al riutilizzo, limitandole, ad esempio, all’indicazione della fonte. 1 Cfr. http://opendefinition.org/od/2.1/en/ per la più recente versione della Definizione al momento di scrivere queste righe.
12 Federico Morando Al riguardo dovrebbero svolgere un ruolo importante le licenze aperte disponibili in linea, che conferiscono diritti di riutilizzo più ampi senza limitazioni tecnologiche, finanziarie o geografiche e che si basano su formati di dati aperti. È pertanto opportuno che gli Stati membri incoraggino l’uso di licenze aperte che dovranno infine divenire prassi comune in tutta l’Unione”). Una prima opzione potrebbe consistere nell’uso di licenze sviluppate per il Software Libero ed Open Source. Tuttavia, questo approccio non è molto diffuso, poiché le licenze di questo genere sono strumenti molto specializzati ed utilizzarle per licenziare oggetti diversi dai programmi per elaboratore è tipicamente inopportuno. Un’altra opzione potrebbe consistere nell’uso di una delle licenze della suite offerta da Creative Commons (CC), che ben servono un’ampia gamma di scopi. Queste licenze offrono ai detentori dei diritti un menù di moduli, dai quali scegliere la combinazione più congeniale, a partire dai seguenti elementi: “Attribuzione” (BY); “Non-Commerciale” (NC); “NienteOpereDerivate” (ND), che permette solo la creazione di copie identiche; e “ConvidiAlloStessoModo” (SA), in virtù del quale l’autore impone ai creatori di opere derivate l’uso della stessa licenza adottata per l’opera originaria (il cosiddetto effetto “virale” o “copyleft”).2 Dalle combinazioni (non assurde) degli elementi precedenti emergono sei differenti licenze, due delle quali possono essere definite “licenze aperte”: CC BY e CC BY-SA. Oltre a queste licenze standard, CC offre uno strumento di rinuncia ai diritti o dedica al pubblico dominio (che in subordine diventa una licenza molto permissiva, nei sistemi giuridici in cui non si possa rinunciare ad alcuni diritti): Creative Commons Zero (CC0). Malgrado la disponibilità di licenze pubbliche standard, quali quelle offerte da Creative Commons (ed altre da Open Data Commons), molti governi nazionali hanno deciso di sviluppare le proprie licenze (aperte) per la pubblicazione ed il riuso di Public Sector Information. Uno dei primi paesi a farlo (anche a causa della scelta di CC riguardante il diritto sui generis sulle banche di dati che ho discusso altrove, cfr. Morando (2013b)) fu il Regno Unito, con la sua licenza “Click Use” e l’attuale evoluzione che non richiede esplicita accettazione, la Open Government License (OGL). La OGL è sostanzialmente equivalente ad una licenza CC di tipo Attribuzione, ma include alcune specifiche previsioni concernenti il “Crown copyright” ed altre clausole che prendono in considerazione le preoccupazioni standard di un funzionario pubblico, quali la proibizione del rilascio di informazioni in una forma tale da suggerire in qualche modo uno status di ufficialità delle stesse. L’approccio adottato in UK con la OGL è stato quasi immediatamente seguito in tutto il mondo (ed in Europa in particolare). Per esempio, la Francia ha adottato la sua License Ouverte, mentre l’Italia ha prodotto la Italian Open Data License (IODL), che è stata lanciata in versione beta come licenza non-commerciale, per poi arrivare (passando per una versione 1.0 di tipo copyleft) all’attuale e più permissiva versione 2.0, che richiede la semplice attribuzione dei dati alla fonte. 2 È possibile trovare più informazioni pratiche sulle licenze CC all’indirizzo http://www.creativecommons.it. Per un commento più teorico ed imparziale, si veda invece (la prima parte del lavoro di) Elkin-Koren (2006).
Dati aperti della pubblica amministrazione 13 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane TECNOLOGIA: FORMATI E FORMALISMI La Open Definition ha due requisiti tecnici principali: processabilità automatica e formato aperto. Il primo consiste nel richiedere che il materiale sia fornito in una forma che possa essere facilmente processata da un computer, sicché i singoli elementi di un lavoro – es. una singola cella in una tabella – possano essere facilmente letti e modificati.3 Il secondo richiede che il formato di serializzazione dei dati sia completamente documentato e la sua implementazione non sia soggetta a brevetti o altre royalties. Inoltre – con un requisito che è più stringente della maggior parte delle definizioni di formato aperto – dev’essere già disponibile almeno un’implementazione open source della specifica, e questa deve permettere il pieno processamento dei dati.4 Tim Berners-Lee ha suggerito uno schema a 5-stelle per la messa a disposizione di dati aperti, indicando i linked open data (v. sotto) come l’approccio di riferimento per la pubblicazione.5 Fonte: http://5stardata.info/en/ 3 Crf. Art. 2, comma c-bis, del D.Lgs. 24 gennaio 2006, n. 36, e successive modificazioni (attuazione della Direttiva 2003/98/CE), che definisce “formato leggibile meccanicamente: un formato di file strutturato in modo tale da consentire alle applicazioni software di individuare, riconoscere ed estrarre facilmente dati specifici, comprese dichiarazioni individuali di fatto e la loro struttura interna”. 4 Cfr. Art. 68, comma 3, lettera a), del D.Lgs. 7 marzo 2005, n. 82, e successive modificazioni, ai sensi del quale si intende per formato dei dati di tipo aperto “un formato di dati reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi”, il che può essere interpretato come equivalente alla Open Definition, ma anche in modi meno stringenti. 5 Questo approccio è stato descritto originariamente in Berners-Lee T. (2006).
14 Federico Morando Seguendo questo modello, i detentori dei dati (e, in particolare, i detentori di informazioni del settore pubblico) possono pubblicare i propri dati secondo i seguenti approcci: 1) dati aperti di base: pubblicazione dei dati sul Web, in qualunque formato, es., file PDF (compresi quelli immagine), purché soggetti ad una licenza aperta; 2) dati aperti strutturati in formato proprietario: come in 1), ma pubblicati come dati processabili automaticamente, es., foglio di calcolo di Excel; 3) dati aperti strutturati in formato aperto: come in 2), ma pubblicati in un formato aperto, es., CSV, XML o JSON; 4) dati RDF: come in 3), ma utilizzando URI (v. sotto) per denotare le entità, sicché terze parti possano facilmente far riferimento ai dati pubblicati; 5) linked open data: come in 4), ma collegando anche i dati ad altri dati RDF, per fornire un contesto. Come si evince dalla lista, gli approcci summenzionati sono in una scala crescente di sofisticatezza tecnica e riutilizzabilità, nel senso che diventa sempre più facile costruire programmi per riutilizzare i dati, ma anche che la produzione dei dati stessi è in una scala crescente di complessità e costo. Secondo Tim Berners-Lee, o seguendo le raccomandazioni della Commissione Europea o dell’Agenzia per l’Italia Digitale,6 il modo ideale di pubblicare open data è dunque l’approccio linked open data. VERSO UNA VERA INTEROPERABILITÀ SEMANTICA I cosiddetti linked data (letteralmente, “dati collegati,” ma l’espressione è raramente utilizzata in italiano) sono dati strutturati secondo il formalismo Resource Description Framework7 (RDF): la conoscenza viene rappresentata sotto forma di “triple” soggetto-predicato-oggetto, e ogni entità viene rappresentata da un identificativo univoco, che è anche un URI8 che risponde a chiamate HTTP. Questa tecnologia nasce ed è fortemente spinta dal W3C come standard9 per favorire l’interoperabilità tra fonti di dati eterogenee sul Web. Tale interoperabilità non viene garantita da una semantica condivisa ex ante, ma dall’uso di un formalismo concettualmente semplice, dall’esistenza di identificatori per loro natura globali (gli URI), e dalla facilità di riutilizzare vocabolari e tassonomie esistenti, eventualmente anche “annotando” ex post o dall’esterno dati che risiedono su altri sistemi e sono pubblicati da entità tra loro del tutto indipendenti. 6 Cfr. AgID (2012). 7 Per un’introduzione, cfr. https://www.w3.org/RDF/. 8 Banalizzando, il concetto di URI è analogo al più familiare URL HTTP, sostanziale sinonimo di “indirizzo Web”, poiché un URL è appunto utilizzato per recuperare contenuti sul Web. L’URI, tuttavia, è un concetto più astratto e rappresenta prima di tutto un identificativo univoco di una risorsa (entità, concetto), che poi viene “risolto”, anche al fine di puntare ad un URL, che fornisca informazioni utili sulla risorsa stessa (una pagina Web che la descriva ad un essere umano, oppure delle triple RDF che la descrivano in modo processabile automaticamente per un programma per elaboratore; diversi “agenti” possono ricevere URL diversi, chiamando lo stesso URI, grazie al processo noto come “content negotiation”). Per approfondire, si può partire dalla pagina Wikipedia https://en.wikipedia.org/wiki/Uniform_Resource_Identifier. 9 Elenco delle specifiche tecniche disponibile all’URL: https://www.w3.org/standards/techs/rdf. Per una informale introduzione ai concetti chiave, cfr. Berners-Lee T. (2006).
Dati aperti della pubblica amministrazione 15 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane È anche opportuno sottolineare che questo approccio, nato per abilitare il Web dei Dati,10 si rivela particolarmente utile in contesti organizzativi o aziendali complessi, in cui vi siano molte fonti di dati non sottoposte ad una forte governance unitaria ex ante. La pubblica amministrazione, dunque, può rappresentare un caso d’uso particolarmente idoneo, non solo per la pubblicazione di dati aperti, ma anche per finalità di interoperabilità ed interscambio di dati dentro una singola amministrazione medio/grande o tra amministrazioni. Infatti, quando i dati sono strutturati secondo il formalismo linked data, diventa banale collegare tra loro diversi database o estrarne nuova conoscenza, anche facendo leva su informazioni pubblicate da terze parti. È di particolare interesse il caso in cui l’incrocio delle banche dati interne passi tramite l’integrazione / arricchimento dei dati esistenti tramite fonti di dati esterne, ad esempio, geo-referenziando alcune informazioni usando una banca dati esterna, per poi proiettare gli stessi dati su una cartografia già esistente internamente. I linked data rappresentano anche un potente strumento di data curation, grazie alla scoperta di nuove chiavi di corrispondenza tra database esistenti, ma anche grazie al fatto che esplicitare i collegamenti tra diverse basi di dati permette di analizzare e gestire incoerenze e conflitti. Per raggiungere un crescente grado di interoperabilità semantica, è necessario che, ogniqualvolta ciò sia possibile, il formalismo RFD sia abbinato alla scelta di vocabolari standard, come Dublin Core o Friend of a Friend, o ancora Schema.org, nonché a sistemi di organizzazione della conoscenza come SKOS, ulteriori tassonomie come Eurovoc, nonché modelli di metadatazione standard a livello di dataset, come DCAT. Tutto ciò al fine di permettere l’interoperabilità tra i dataset prodotti da authority di diverso ambito. Il formalismo RDF ed il linguaggio di interrogazione dei dati SPARQL sono strumenti generici, creati per descrivere ed accedere a dati di qualunque tipo. Ciò detto, e considerando la rilevanza dei dati geospaziali ed il loro ruolo come livello di riferimento che connette altre fonti di informazione, può essere opportuno menzionare che esiste uno specifico sotto-insieme di standard per rappresentare l’informazione geografica come linked data. In particolare, GeoSPARQL11 è uno standard dell’Open Geospatial Consortium (OGC) per rappresentare ed interrogare dati geospaziali collegati. I dati possono essere salvati in un grafo RDF utilizzando, ad esempio, il Geography Markup Language (GML) o la serializzazione testuale well-known text (WKT), e sono disponibili varie modalità per interrogarli, ad es. utilizzando relazioni / rappresentazioni topologiche come Simple Features, RCC8, o DE-9IM/Egenhofer. In considerazione del fatto, menzionato sopra, che il livello geospaziale è uno dei piani più utili al fine di incrociare tra loro dataset pubblici di provenienza differente, il lavoro si chiude con un esempio di (parziale ed imperfetta, ma già significativa) apertura di dati pubblici relativi al patrimonio immobiliare. 10 Anche soggetti privati concorrono – ovviamente nel proprio interesse – ad implementare progressivamente un Web che contenga sempre più dati strutturati; ad esempio, Google e Facebook supportano questo approccio tramite Schema.org e l’Open Graph Protocol, anche al fine di facilitare l’ingestione di dati provenienti dal Web, integrandoli nelle loro piattaforme. I Linked Data sono anche al centro di piattaforme come Watson di IBM o simili progetti di cognitive computing. 11 Specifiche disponibili su http://www.opengeospatial.org/standards/geosparql.
16 Federico Morando IL CASO DEI DATI SUL PATRIMONIO IMMOBILIARE PUBBLICO Il caso dei dati pubblici aperti relativi al patrimonio immobiliare delle PA è degno di nota, in quanto l’apertura di tali dati è obbligatoria per legge ai sensi della normativa relativa alla trasparenza amministrativa, ma gli stessi dati sono anche suscettibili di varie forme di riutilizzo per finalità differenti (es., business intelligence). Inoltre, la presenza di riferimenti territoriali nei dati (come minimo, il numero civico; spesso, riferimenti catastali strutturati) fornisce una chiave per l’incrocio con altri data set. L’unico comma dell’art. 30 del D.Lgs. n. 33/2013 (“Decreto Trasparenza”), rubricato “Obblighi di pubblicazione concernenti i beni immobili e la gestione del patrimonio,” prevede12 che “[l]e pubbliche amministrazioni pubblic[hi]no le informazioni identificative degli immobili posseduti, nonché i canoni di locazione o di affitto versati o percepiti.” Tale previsione dev’essere messa in pratica all’interno dell’apposita voce “Beni immobili e gestione patrimonio” della sezione “Amministrazione Trasparente” nel sito Web di ogni PA.13 Per quanto la previsione paia largamente autoesplicativa, l’analisi dell’implementazione di questa norma dalla prospettiva del riutilizzatore per fini di ricerca o commerciali offre ottimi spunti per illustrare le potenzialità della pubblicazione in open data, ma anche i limiti di una pubblicazione priva del necessario coordinamento e delle indispensabili linee guida tecniche. Dal punto di vista delle potenzialità della pubblicazione, ai vantaggi legati alla trasparenza dell’agire della pubblica amministrazione, vanno aggiunti quelli informativi e gestionali che si possono ottenere incrociando i dati con altri dati aperti e/o proprietari già disponibili. A questo proposito, pare opportuno ed efficace rimandare ad un esempio concreto relativo ad un business case del progetto europeo proDataMarket.14 Si tratta del caso di Statsbygg, azienda pubblica responsabile della gestione e sviluppo del patrimonio immobiliare del governo norvegese. Il caso in questione mostra come l’incrocio tra i dataset delle fonti rappresentate nella figura seguente abbia portato ad un significativo incremento nella qualità dei dati ed altri vantaggi in termini di innovazione a valle. 12 La bozza di decreto di riordino della disciplina di accesso ai dati delle Pubbliche Amministrazioni, noto come “Decreto Madia” (in attuazione dell’art. 7 della legge delega n. 124 del 2015 per la “revisione e semplificazione delle disposizioni in materia di prevenzione della corruzione, pubblicità e trasparenza”) prevede, al momento di scrivere queste righe, una modifica all’Art. 30, che estende l’obbligo di pubblicazione agli immobili in qualunque modo “detenuti”, oltre che a quelli “posseduti” dagli enti. Non paiono comunque previste modifiche sostanziali a questo obbligo di pubblicazione. La vera novità, invece, consiste nell’art 9-bis e nel meccanismo di pubblicazione delle informazioni sul Patrimonio della PA, che a tendere avverrà tramite un’omonima banca dati nazionale, detenuta dal MEF-DT: si vedano le Considerazioni conclusive del presente articolo per un approfondimento. 13 Per “Pubbliche Amministrazioni” il Decreto Trasparenza intende (stando all’art. 11, c. 1, dello stesso) tutte le amministrazioni dello Stato, ivi compresi gli istituti e le scuole di ogni ordine e grado e le istituzioni educative, le aziende ed amministrazioni dello Stato ad ordinamento autonomo, le Regioni, le Province, i Comuni, le Comunità montane e loro consorzi e associazioni, le istituzioni universitarie, gli Istituti autonomi case popolari, le Camere di commercio, industria, artigianato e agricoltura e loro associazioni, tutti gli enti pubblici non economici nazionali, regionali e locali, le amministrazioni, le aziende e gli enti del Servizio sanitario nazionale, alcune altre agenzie (l’ARAN e le Agenzie di cui al d.lgs. n. 300/1999), nonché alcuni casi più specifici (ad es., il CONI). Senza voler approfondire l’ambito di applicazione, in tutti i casi di cui lo scrivente è a conoscenza, le autorità amministrative indipendenti di garanzia, vigilanza e regolazione si sono comportate come se la normativa si applicasse loro. Infine, val la pena menzionare che le già citate proposte di riforma (supra, nota 12) prevedono anche una modifica dell’ambito soggettivo di applicazione della norma, sicché la stessa si estenderebbe esplicitamente (per quanto compatibile) alle seguenti categorie di enti: (a) agli enti pubblici economici, alle autorità portuali e agli ordini professionali; (b) alle società in controllo pubblico , salvo quelle quotate; (c) alle associazioni, alle fondazioni e agli enti di diritto privato finanziate primariamente o i cui organi di amministrazione o indirizzo siano designati da pubbliche amministrazioni. Alcuni obblighi si estenderebbero anche alle società in partecipazione pubblica, alle associazioni, alle fondazioni e agli enti di diritto privato che esercitano funzioni amministrative, attività di produzione di beni e servizi a favore delle amministrazioni pubbliche, ecc. 14 Cfr. Shi et al. (2015) ed il sito del progetto proDataMarket (Grant number: 644497), in particolare: http://blog.prodatamarket.eu/2015/08/prodatamarket-business-cases-at-ruleml2015-industry-track/.
Dati aperti della pubblica amministrazione 17 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane Fonte: Slide #7 della presentazione “Industry@RuleML2015: Norwegian State of Estate: A Reporting Service for the State-owned Properties in Norway”15 Venendo a ciò che, rispetto al caso della pubblicazione dei dati sul patrimonio immobiliare della PA italiana, può essere migliorato, gli esempi non mancano. Tra questi, per ciò che concerne la descrizione analitica delle “informazioni identificative” degli immobili, l’analisi delle prassi delle maggiori amministrazioni italiane mostra come la norma non sia sempre applicata, oppure sia a volte interpretata in modo discordante. Nei prossimi paragrafi, si descriveranno i risultati di un’analisi effettuata nel periodo compreso tra luglio 2014 e gennaio 2015,16 che ha preso in oggetto tutti i comuni capoluogo di provincia, nonché gli altri comuni con un numero di abitanti maggiore o uguale a 100.000, per un totale di 119 enti.17 Nell’analisi, l’obbligo di pubblicazione relativo a “Beni immobili e la gestione patrimonio” è stato suddiviso in tre parti: (a) Patrimonio immobiliare, (b) Canoni di locazione attivi, (c) Canoni di locazione passivi. In sintesi, circa ¾ delle amministrazioni hanno pubblicato i propri dati, ma meno del 20% delle amministrazioni lo ha fatto in modalità tecnicamente aperte (machine readable ed in formati aperti). 15 Disponibile su http://www.slideshare.net/ruleml2012/industryruleml2015-norwegian-state-of-estate-a-reporting-service-for- the-stateowned-properties-in-norway (under a CC Attribution License). 16 Le rilevazioni sono state effettuate e/o verificate da Roberta Bruno, nel periodo compreso tra Ottobre 2014 e Gennaio 2015, col supporto tecnico di Alessio Melandri. 17 I dati disponibili al momento di effettuare l’analisi erano quelli ISTAT del Bilancio demografico mensile, aggiornati al 30/06/2014, come riportati da https://it.wikipedia.org/wiki/Comuni_d%27Italia_per_popolazione.
18 Federico Morando Anche se le differenze sono minime, i dati sul patrimonio in senso stretto sono stati pubblicati marginalmente meglio di quelli relativi alle locazioni, e tra queste le locazioni attive leggermente meglio di quelle passive: Dati utilizzabili Dati assenti Dati inutilizzabili Dati con 3+ stelle Patrimonio 75% 18% 8% 19% immobiliare Canoni di locazione 73% 20% 7% 18% attivi Canoni di locazione 71% 26% 3% 17% passivi La prima colonna indica la percentuale di informazioni fruibili dal punto di vista di un essere umano. La seconda e la terza colonna suddividono le informazioni non-fruibili tra assenti (non sono presenti file o sono vuoti) e formalmente presenti, ma non pertinenti o illeggibili. La colonna “Dati con 3+ stelle” indica la percentuale di database che possono essere classificati a 3 o più stelle secondo il modello “five star Open Data” (ovvero, nel caso specifico, sono disponibili in formato CSV, ODS, XML, o HTML tabellare). Tutte le percentuali sono calcolate sui 119 casi analizzati. Ciò che più ostacola il riutilizzo dei dati, tuttavia, non è il formato, bensì l’assenza di un tracciato record standard: ad esempio, viene normalmente fornita una qualche “informazione identificativa” degli immobili, ma si ha un indirizzo completo solo nel 40% circa dei casi, e la presenza di dati catastali è attorno al 55% nel caso della descrizione del patrimonio, e scende attorno al 10% nella descrizione dei canoni di locazione (e, se questo potrebbe essere ovviato in alcuni casi incrociando il data set dei canoni attivi con quello del patrimonio, per i canoni passivi l’informazione è del tutto irreperibile PRESENZA INFORMAZIONI RELATIVE A: Indirizzo Canone Data Stipula Dati Catastali Superficie Canone Completo Periodicità Contratto Patrimonio 43% 55% 27% n.a. n.a n.a immobiliare Canoni di locazione 34% 13% 21% 76% 41% 19% attivi Canoni di locazione 37% 8% 24% 71% 37% 24% passivi Per ulteriori informazioni riguardo la ricerca di cui sopra, si rimanda al rapporto tecnico che la descrive: Canova et al. (2015). Ai fini del presente lavoro, si è inoltre condotto un aggiornamento qualitativo dell’analisi nel corso del mese di maggio 2016, focalizzandosi sulle città italiane più popolose. Tale analisi ha confermato dal punto vista qualitativo i risultati dello studio di inizio 2015: ad esempio, in alcuni casi, come a Milano, il dato catastale non è presente, né sono presenti altre informazioni sufficienti ad identificare univocamente la porzione di immobile posseduto o le relative dimensioni; in altri, come a Torino, il dataset è più ricco, ma l’unico formato disponibile è il PDF, rendendo difficoltosa ogni ulteriore rielaborazione.
Dati aperti della pubblica amministrazione 19 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane Una standardizzazione già implementata L’assenza di qualunque uniformità nei dati aperti relativi al patrimonio immobiliare pubblico italiano è paradossale, in quanto già la Legge finanziaria 201018 prevedeva quanto segue. Tutte le pubbliche amministrazioni, i loro consorzi ed associazioni, nonché le agenzie, etc., “che utilizzano o detengono, a qualunque titolo, immobili di proprietà dello Stato o di proprietà dei medesimi soggetti pubblici, trasmettono al Ministero dell’economia e delle finanze – Dipartimento del tesoro l’elenco identificativo dei predetti beni ai fini della redazione del rendiconto patrimoniale delle Amministrazioni pubbliche a valori di mercato. Entro il 31 luglio di ciascun anno successivo a quello di trasmissione del primo elenco, le amministrazioni [...] comunicano le eventuali variazioni intervenute. [...] Con provvedimento del Direttore dell’Agenzia del demanio sono stabilite le modalità delle comunicazioni e delle trasmissioni previste dal presente comma.” Allo scrivente non è noto quante amministrazioni diano seguito a questi obblighi di legge, ma le modalità di cui sopra sono pubbliche e molto dettagliate e concorrono a formare il progetto chiamato “Patrimonio della PA”. Esse chiariscono come siano oggetto di rilevazione sia i fabbricati che i terreni, nonché le tipologie di informazioni raccolte (sempre a livello di singolo identificativo catastale), che riguardano la classificazione tipologica del bene immobile e le finalità d’uso attuali, la localizzazione, le dimensioni, l’utilizzo, la presenza di eventuali vincoli culturali e paesaggistici, l’epoca di costruzione, nonché il valore iscritto a bilancio (e quello stimato di mercato e l’anno della relativa stima, se disponibili). Inoltre, la procedura prevede la possibilità di inserimento massivo dei dati, con import ed export in formato aperto (CSV).19 In altre parole, esiste già – anche se non è attualmente accessibile in modalità aperta – un database unico nazionale che contiene buona parte delle informazioni che le amministrazioni sono tenute a pubblicare, in modo meno organizzato (e con l’aggiunta di alcune informazioni relative ad affitti attivi e passivi) sui propri siti istituzionali. È inoltre interessante osservare come sul portale OpenDemanio, iniziativa di open government sui beni gestiti dall’Agenzia del Demanio, siano oggi disponibili le informazioni di cui sopra, limitatamente ai beni del patrimonio immobiliare dello Stato in gestione all’Agenzia stessa. Un pilota di apertura dei dati del progetto Patrimonio della PA è dunque già stato sostanzialmente implementato. Quantitativamente, tali beni rappresentano una piccola percentuale di quanto comunicato dalle amministrazioni: ad esempio, per il territorio del comune di Torino, vi sono meno di 400 beni all’interno dei file scaricabili all’indirizzo http://dati.agenziademanio.it/#/opendata (ovvero, i soli immobili gestiti dall’Agenzia), rispetto ai circa 6000 beni rispetto ai quali la Città di Torino comunica annualmente informazioni per il progetto Patrimonio della PA. L’iniziativa è tuttavia di particolare rilievo, sia perché offre comunque una grande mole di informazioni aperte certificate, sia poiché rappresenta un autorevole “precedente” di pubblicazione open data. Il portale OpenDemanio, infatti, riporta sin dall’homepage una definizione di dati aperti esplicitamente tratta dalla OpenDefinition, fa uso di licenze aperte standard (Creative Commons Attribuzione 3.0 Italia) e pubblica i dati in formato aperto e machine readable (CSV). Se questo esempio fosse seguito da tutte le amministrazioni anche per quel che riguarda la pubblicazione dei dati ai sensi del Decreto Trasparenza, la qualità degli open data sul patrimonio immobiliare della PA subirebbe un incremento drammatico. 18 Legge 23 dicembre 2009, n. 191, art. 2, comma 222, periodi undicesimo, dodicesimo, quattordicesimo e quindicesimo. 19 Per ulteriori dettagli operativi si rimanda alla pagina “FAQ - Rilevazione del Patrimonio della PA” (http://www.dt.tesoro.it/en/faq/faq_patrimonio.html).
20 Federico Morando CONSIDERAZIONI CONCLUSIVE Il presente lavoro si è posto l’obiettivo di raccogliere i concetti principali relativi al tema dei dati aperti in un testo sintetico ed indirizzato alla comunità di ricercatori e professionisti che svolgono, nel mondo universitario e dentro ed attorno alla Pubblica Amministrazione, un ruolo chiave nel processo di ammodernamento delle logiche di analisi e gestione dell’informazione territoriale. Riguardo il caso dei dati sul patrimonio immobiliare pubblico, una delle finalità di questo breve scritto è richiamare l’attenzione sull’esistenza di un sottoinsieme di tali dati già disponibili come dati aperti, favorendone il riutilizzo e, indirettamente, aumentando gli incentivi a pubblicarli ed i feedback relativi alla pubblicazione degli stessi. Nell’esperienza dello scrivente, infatti, le Pubbliche Amministrazioni tendono ad investire nella qualità dei dati soprattutto laddove vi siano riutilizzatori che la pretendono, il che è probabilmente ragionevole, in considerazione dei forti vincoli di bilancio e dei molti obblighi di pubblicazione posti in capo alle amministrazioni stesse. Pare inoltre opportuno concludere menzionando il fatto che molti dei problemi relativi a tali dati e descritti in questo articolo dovrebbero progressivamente essere superati in virtù del riordino della disciplina di accesso ai dati delle Pubbliche Amministrazioni, noto come “Decreto Madia”. La bozza disponibile al momento di scrivere queste righe, infatti, prevede all’art. 9-bis (Pubblicazione delle banche dati) che le pubbliche amministrazioni adempiano ad alcuni degli obblighi di pubblicazione mediante la comunicazione dei dati, delle informazioni o dei documenti all’amministrazione titolare della banca dati nazionale corrispondente. Nel caso specifico, si tratterebbe della banca dati “Patrimonio della PA”, detenuta dal Dipartimento del Tesoro del Ministero dell’Economia e delle Finanze.20 La pubblicazione in un’unica banca dati assicurerebbe l’uniformità di formato e, auspicabilmente, anche semantica, dopodiché la singola amministrazione potrebbe adempiere all’obbligo di pubblicazione sul proprio sito istituzionale con un semplice collegamento ipertestuale. Per quanto, nel lungo periodo, l’esistenza di una banca dati nazionale di riferimento paia un’ottima notizia per chi sia interessato al riutilizzo dei dati sul patrimonio della PA per ragioni di ricerca o di business, nel breve periodo, quanto descritto nel presente articolo riguardo la qualità degli open data relativi al patrimonio immobiliare pubblico attualmente disponibili rappresenta un caveat per chi avrà il compito di alimentare ed assicurare l’alimentazione del database “Patrimonio della PA”. In assenza di rigorose linee guida e/o di processi informatici guidati, nonché di un’opportuna governance, si potrebbe infatti rischiare di trasferire in una base di dati unitaria l’attuale Babele informativa degli open data sul patrimonio. Fortunatamente, le dettagliate linee guida già sviluppate dal Dipartimento del Tesoro in relazione al progetto Patrimonio della PA, nonché la buona pratica rappresentata dal progetto OpenDemanio lasciano ben sperare rispetto alla rapida pubblicazione come dati aperti di tutte queste informazioni. In attesa che ciò avvenga, sin da subito ed in modo unilaterale ciascuna PA potrebbe procedere a pubblicare nella propria sezione Amministrazione Trasparente il CSV che carica periodicamente sul portale dell’Agenzia del Demanio, arricchito dalle informazioni relative ad affitti attivi e passivi. 20 La banca dati è stata istituita dal già citato Art. 2, co. 222, della Legge n. 191 del 2009 e dall'Art. 17, co. 3-4 , Legge n. 90 del 2014, convertito, con modificazioni, dalla legge n. 114 del 2014.
Dati aperti della pubblica amministrazione 21 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane Bibliografia AgID (2012), Linee guida per l’interoperabilità semantica attraverso i Linked Open Data, versione 2.0, pubblicata il 12 Novembre 2012, disponibile su http://www.agid.gov.it/sites/default/files/documentazione_trasparenza/cdc-spc-gdl6- interoperabilitasemopendata_v2.0_0.pdf. Belisario E., Cogo G., Epifani S., Forghieri C. (2011). Come si fa Open Data? Istruzioni per l’uso per Enti e Amministrazioni Pubbliche. Berners-Lee T. (2006), Linked Data, W3C Design Issues series, disponibile su https://www.w3.org/DesignIssues/LinkedData.html. Biallo G. (2013) Dati geografici aperti: istruzioni per l’uso - Italia OpenGeoData, Open Knowledge Foundation Italia, Open data handbook, Retrived at http://opendatahandbook.org/, May 2013. Canova L., Iemma R., Morando F. (2015), #WikiTrasparenza – Chi apre davvero i dati sulle risorse pubbliche. Nexa Working Paper n. 2015-1, disponibile su http://nexa.polito.it/working-paper/2015-1. Elkin-Koren N. (2006), Exploring Creative Commons: A Skeptical View of a Worthy Pursuit, in Hugenholtz P. B. e Guibault L. (eds.), The Future of the Public Domain, Kluwer Law International, 2006. Hugenholtz P. B. (2004), Abuse of Database Right – Sole-source information banks under the EU Database Directive, presentato alla conferenza “Antitrust, Patent and Copyright”, École des Mines/UC Berkeley, Paris, January 15-16, 2004. Pubblicato in Lévêque F. and Shelanski H. (eds.), Antitrust, patents and copyright: EU and US perspectives, Cheltenham: Edward Elgar 2005, p. 203-219. Disponibile su http://www.ivir.nl/publicaties/download/953. Krötzsch M. e Speiser S. (2011), “ShareAlike Your Data: Self-referential Usage Policies for the Semantic Web.” ISWC , Ed. Aroyo S. L., Welty C., Alani H., Taylor J., Bernstein A., Kagal L., Noy N. e Blomqvist E. Springer Berlin / Heidelberg ISWC 2011: 354-369. Morando F. (2013a), Gli obblighi di pubblicazione concernenti l’uso delle risorse (artt. 26-27, 29-30). In: La trasparenza amministrativa dopo il d.lgs. 14 marzo 2013, n. 33 / Ponti B. Maggioli spa, pp. 239-257. ISBN 8838781028. Morando F. (2013b), Legal interoperability: making Open Government Data compatible with businesses and communities. In: JLIS.IT, vol. 4 n. 1, pp. 441-452. ISSN 2038-1026. Morando, F. et al. (2013), “Guida alla pubblicazione dei dati delle pubbliche amministrazioni”, Edizioni ETS srl, Pisa, pp. 9-83. ISBN 9788846735782. Rizzo G., Morando F., De Martin J.C. (2011), Open Data: la piattaforma di dati aperti per il Linked Data. In: Informatica e diritto n. 20, pp. 493-511. ISSN 0390-0975. Shi L., Pettersen B. E., Østhassel I, Nikolov N, Khorramhonarnama A., Berre A. J., Roman D., (2015) Norwegian State of Estate: A Reporting Service for the State-Owned Properties in Norway, in Rule Technologies: Foundations, Tools, and Applications: 9th International Symposium, RuleML 2015, Berlin, Germany, August 2-5, 2015, Proceedings, pp 456-464, Springer. Sitografia Il progetto Open Definition pone le basi per definire il concetto di “apertura” in relazione a dati e contenuti. http://opendefinition.org/ (Data ultima consultazione: 1/05/2016) Open Government License v. 3. http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3/ (Data ultima consultazione: 1/05/2016) Italian Open Data License v2.0. http://www.dati.gov.it/iodl/2.0/ (Data ultima consultazione: 1/05/2016) Il modello di pubblicazione di dati aperti a 5-stelle di Tim Berners-Lee illustrato per esempi. http://5stardata.info/en/ (Data ultima consultazione: 1/05/2016) Lo standard OGC GeoSPARQL per rappresentare ed interrogare linked data geospaziali. http://www.opengeospatial.org/standards/geosparql (Data ultima consultazione: 1/05/2016) Quest’opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale 3.0
Puoi anche leggere