Pubblica amministrazione - Appunti per uno stato dell'arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane ...

Pagina creata da Federico Filippi
 
CONTINUA A LEGGERE
Pubblica amministrazione - Appunti per uno stato dell'arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane ...
9

*Federico Morando                   Dati aperti della
                                    pubblica amministrazione
                                    Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al
                                    patrimonio immobiliare delle PA italiane
                                    DOI: 10.14609/Ti_1_16_1i

   Parole chiave: Dati aperti, informazione detenuta dal settore pubblico, licenze di diritto
   d'autore e connessi, immobili, linked data, dati geografici

   Abstract Le Pubbliche Amministrazioni (PA) accumulano dati. Lo fanno per poter funzionare e per
   dimostrare di aver ben funzionato. La rivoluzione digitale rende trascurabile il costo di mettere a
   disposizione tali dati per il riutilizzo ed aumenta il costo opportunità di limitarne l'uso alla finalità per cui
   sono stati raccolti. La normativa incentiva tale riutilizzo, ed esistono numerosi standard tecnici e buone
   pratiche utili a renderlo anche praticamente fattibile e sostenibile. In sintesi, la pubblicazione di dati aperti
   è oggi una buona pratica, ma anche un dovere per le PA.

   Il presente articolo amplia ed organizza i concetti di cui sopra, nell'ottica di fornire gli elementi per
   comprendere lo stato dell'arte dei dati aperti (intesi come approccio all'amministrazione pubblica, campo
   di ricerca e movimento). Dal punto di vista normativo, ci si sofferma sul contesto europeo ed italiano. Dal
   punto di vista tecnico, si offrono alcuni approfondimenti relativi al formalismo “linked data”.

   Il lavoro prosegue esemplificando più in dettaglio il caso dei dati pubblici relativi al patrimonio immobiliare
   delle PA italiane. Tale esempio è significativo in quanto al confine tra il mondo dei dati aperti per il riutilizzo
   tradizionalmente intesi e quello della trasparenza amministrativa; inoltre, la presenza di riferimenti territoriali
   nei dati (come minimo, il numero civico) fornisce una chiave per l'incrocio con altri dataset. Un’analisi delle
   pratiche di apertura di tali dati offre anche ottimi spunti per illustrare i limiti di una pubblicazione priva del
   necessario coordinamento e delle indispensabili linee guida tecniche.

   *   Presidente e AD, Synapta SRL. Fellow, Centro Nexa su Internet e Società - DAUIN, Politecnico di Torino
Pubblica amministrazione - Appunti per uno stato dell'arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane ...
10      Federico Morando

INTRODUZIONE
          Le Pubbliche Amministrazioni (PA) – così come ogni organizzazione complessa – accumulano dati. Li
          accumulano per poter funzionare e per dimostrare di aver ben funzionato. Ciò avviene da tempo
          immemorabile, tanto che ne abbiamo traccia in documenti redatti in scrittura cuneiforme. Tuttavia,
          qualcosa è cambiato nella natura di questa prodigiosa mole di informazioni negli ultimi decenni: si
          tratta, sempre più spesso, di informazioni in formato digitale. Questa caratteristica determina
          conseguenze dirompenti, poiché riduce il costo del riutilizzo di tali dati, e al contempo aumenta il
          costo opportunità (le occasioni sprecate) relativo a tenere tali dati “chiusi in un cassetto”. La
          normativa comunitaria, nazionale e locale pone numerosi incentivi alla messa a disposizione dei dati,
          e gli standard tecnici, per renderli interoperabili e dunque effettivamente riutilizzabili, sono sempre
          più diffusi e facilmente implementabili.

          La pubblicazione di dati pubblici “aperti” è così diventata uno dei pilastri dell’Open Government,
          nonché una delle parole chiave dell’amministrazione della cosa pubblica.

          Le sezioni del presente articolo sono strutturate nel modo seguente. La prima sezione definisce
          analiticamente il concetto di “dati aperti”, ed è seguita da un approfondimento relativo alle licenze
          di diritto d’autore e diritti connessi per la messa a disposizione dei dati. La terza sezione è dedicata
          all’apertura dei dati in prospettiva tecnologica, ed è seguita da un approfondimento relativo
          all’interoperabilità semantica. Il lavoro si chiude con un focus relativo ai dati aperti sul patrimonio
          immobiliare pubblico e con alcune considerazioni conclusive.

DATI APERTI
          In questo lavoro, la definizione di dati aperti è basata sul progetto Open Definition, il cui obiettivo è
          di rendere preciso “il significato di ‘aperto’, in espressioni quali ‘dati aperti’ e ‘contenuti aperti’”. La
          Definition può essere riassunta dicendo che “Aperto significa che chiunque è libero di accedere,
          usare, modificare e condividere – a condizioni che, al massimo, preservino l’indicazione della
          provenienza e l’apertura stessa.” O, ancor più sinteticamente: “Dati e contenuti aperti possono essere
          liberamente utilizzati, modificati e condivisi da chiunque per qualunque scopo.”
          L’apertura può poi essere declinata in accessibilità pratica, apertura giuridica, apertura tecnica.
          Avere accesso aperto ad un’opera implica che l’intero lavoro è accessibile online senza costi
          aggiuntivi rispetto ad un eventuale costo di riproduzione una tantum. Inoltre, non devono esserci
          vincoli legali o tecnici che restringano il suo riutilizzo, se non per quanto descritto sotto.

LICENZE PER I DATI APERTI
          È generalmente riconosciuto (es. da Krötzsch e Speiser (2011), p. 356, con ulteriori riferimenti) ed
          ho già discusso altrove (Morando (2013b)) che la distribuzione di dati aperti richiede anche
          l’associazione di una licenza agli stessi. In altre parole, i dati aperti devono essere pubblicati
          utilizzando licenze aperte. Ciò a causa dell’attuale modello di funzionamento automatico del diritto
          d’autore (“copyright default”), ovvero l’insieme di diritti che il vigente regime di “diritto d’autore”
          (inteso in senso lato, comprendendo il diritto d’autore strictu sensu, il copyright, i diritti connessi, ed
          il diritto sui generis sulle banche di dati) garantisce automaticamente agli autori stessi.

          Questo “copyright default” implica che “tutti i diritti sono riservati” per la massima durata consentita
          dalla legge (tipicamente, la vita dell’autore più 70 anni). Inoltre, nessuna formalità è richiesta per
          godere di questi diritti, neppure la semplice rivendicazione della loro esistenza. Peraltro, anche se in
Dati aperti della pubblica amministrazione             11
                                 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane

linea di principio la protezione garantita alle banche di dati non creative tramite il diritto sui generis
è più breve della tutela autoriale (durando 15 anni), anche tale diritto nasce automaticamente in capo
al costitutore della banca. Inoltre, il più breve termine della protezione delle banche dati è rinnovato
automaticamente ad ogni rilevante investimento nell’aggiornarle, il che – considerando che i database
sono oggi frequentemente distribuiti come servizi online – è aggravato dal fatto che può essere
difficile, nella pratica, anche solo avere accesso ad una versione vecchia di 15 anni dei dati in
questione, versione che in linea di principio potrebbe essere liberamente riusabile (al contrario, ciò
potrebbe applicarsi ai vecchi CD utilizzati per distribuire le basi di dati nell’era pre-Internet).
Senza entrare in ulteriori dettagli, si può dunque affermare che i riutilizzatori dei dati debbano
tipicamente assumere che qualsiasi cosa (salvo un singolo dato, o liste banali la cui ricreazione
sarebbe comunque semplice) sia in qualche modo protetta da diritti di proprietà intellettuale.
(L’eccezione più significativa, che merita una menzione per ulteriori approfondimenti che qui non
possono trovare spazio, è rappresentata da database con un’unica fonte, laddove la creazione dei
dati e la creazione della banca di dati non possono essere scissi: per ulteriori informazioni, cfr.
Hugenholtz (2004)).
Dopo aver riassunto le ragioni che rendono l’uso di licenze aperte necessario – o, almeno, molto
appropriato – per la pubblicazione di dati aperti, si possono discutere più in dettaglio le
caratteristiche che una licenza deve possedere al fine di essere considerata “aperta”. Secondo la
Open Definition, sono le seguenti.
La licenza dovrebbe essere compatibile con altre licenze aperte. Le sue clausole devono inoltre
soddisfare varie condizioni: essa deve permettere il libero utilizzo del lavoro posto in licenza, inclusa
la sua distribuzione, modifica (ovvero, la creazione di lavori derivati), scomposizione o compilazione
(ovvero, le condizioni devono applicarsi anche a porzioni del materiale dato in licenza, e devono
permettere la distribuzione assieme ad altri materiali). Inoltre la licenza non può essere vincolata ad
una specifica finalità, ovvero il riutilizzo deve essere possibile per qualsiasi uso (lecito) in qualsiasi
campo. Non si possono imporre costi o royalties (rispetto al primo riutilizzo, mentre il riutilizzo
commerciale del materiale stesso, o delle sue opere derivate, dev’essere sempre possibile).
I soli vincoli accettabili sono clausole di attribuzione che prescrivano la menzione degli autori,
contributori, titolari dei diritti, sponsor, ecc., ed il requisito che le versioni modificate siano
chiaramente descritte come tali, al fine di garantire l’integrità dei dati lungo la catena dei riutilizzi.
Inoltre, sono ammesse clausole del tipo condividi-allo-stesso-modo, ovvero: le licenze possono
richiedere l’uso della stessa licenza o di una licenza compatibile per la distribuzione di materiali
derivati. Si rimanda al testo completo della Open Definition per ulteriori dettagli.1

Nel momento in cui una Pubblica Amministrazione si trova effettivamente a scegliere una licenza per
i propri dati, essa deve ponderare diversi elementi, tra i quali l’opportunità di scegliere gli strumenti
più standard, seguendo una raccomandazione inclusa nella Direttiva Europea relativa al riutilizzo
dell’informazione del settore pubblico (si veda il considerando 26 della Direttiva 2013/37/EU: “Le
eventuali licenze per il riutilizzo di informazioni del settore pubblico dovrebbero comunque imporre
il minor numero possibile di restrizioni al riutilizzo, limitandole, ad esempio, all’indicazione della fonte.

1   Cfr. http://opendefinition.org/od/2.1/en/ per la più recente versione della Definizione al momento di scrivere queste righe.
12   Federico Morando

       Al riguardo dovrebbero svolgere un ruolo importante le licenze aperte disponibili in linea, che
       conferiscono diritti di riutilizzo più ampi senza limitazioni tecnologiche, finanziarie o geografiche e
       che si basano su formati di dati aperti. È pertanto opportuno che gli Stati membri incoraggino l’uso
       di licenze aperte che dovranno infine divenire prassi comune in tutta l’Unione”).

       Una prima opzione potrebbe consistere nell’uso di licenze sviluppate per il Software Libero ed Open
       Source. Tuttavia, questo approccio non è molto diffuso, poiché le licenze di questo genere sono
       strumenti molto specializzati ed utilizzarle per licenziare oggetti diversi dai programmi per elaboratore
       è tipicamente inopportuno.

       Un’altra opzione potrebbe consistere nell’uso di una delle licenze della suite offerta da Creative
       Commons (CC), che ben servono un’ampia gamma di scopi. Queste licenze offrono ai detentori dei
       diritti un menù di moduli, dai quali scegliere la combinazione più congeniale, a partire dai seguenti
       elementi: “Attribuzione” (BY); “Non-Commerciale” (NC); “NienteOpereDerivate” (ND), che permette
       solo la creazione di copie identiche; e “ConvidiAlloStessoModo” (SA), in virtù del quale l’autore impone
       ai creatori di opere derivate l’uso della stessa licenza adottata per l’opera originaria (il cosiddetto
       effetto “virale” o “copyleft”).2 Dalle combinazioni (non assurde) degli elementi precedenti emergono
       sei differenti licenze, due delle quali possono essere definite “licenze aperte”: CC BY e CC BY-SA.
       Oltre a queste licenze standard, CC offre uno strumento di rinuncia ai diritti o dedica al pubblico
       dominio (che in subordine diventa una licenza molto permissiva, nei sistemi giuridici in cui non si
       possa rinunciare ad alcuni diritti): Creative Commons Zero (CC0).

       Malgrado la disponibilità di licenze pubbliche standard, quali quelle offerte da Creative Commons (ed
       altre da Open Data Commons), molti governi nazionali hanno deciso di sviluppare le proprie licenze
       (aperte) per la pubblicazione ed il riuso di Public Sector Information. Uno dei primi paesi a farlo (anche
       a causa della scelta di CC riguardante il diritto sui generis sulle banche di dati che ho discusso altrove,
       cfr. Morando (2013b)) fu il Regno Unito, con la sua licenza “Click Use” e l’attuale evoluzione che non
       richiede esplicita accettazione, la Open Government License (OGL). La OGL è sostanzialmente
       equivalente ad una licenza CC di tipo Attribuzione, ma include alcune specifiche previsioni
       concernenti il “Crown copyright” ed altre clausole che prendono in considerazione le preoccupazioni
       standard di un funzionario pubblico, quali la proibizione del rilascio di informazioni in una forma tale
       da suggerire in qualche modo uno status di ufficialità delle stesse. L’approccio adottato in UK con la
       OGL è stato quasi immediatamente seguito in tutto il mondo (ed in Europa in particolare). Per
       esempio, la Francia ha adottato la sua License Ouverte, mentre l’Italia ha prodotto la Italian Open
       Data License (IODL), che è stata lanciata in versione beta come licenza non-commerciale, per poi
       arrivare (passando per una versione 1.0 di tipo copyleft) all’attuale e più permissiva versione 2.0, che
       richiede la semplice attribuzione dei dati alla fonte.

       2   È possibile trovare più informazioni pratiche sulle licenze CC all’indirizzo http://www.creativecommons.it. Per un commento
           più teorico ed imparziale, si veda invece (la prima parte del lavoro di) Elkin-Koren (2006).
Dati aperti della pubblica amministrazione             13
                                          Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane

TECNOLOGIA: FORMATI E FORMALISMI
        La Open Definition ha due requisiti tecnici principali: processabilità automatica e formato aperto. Il
        primo consiste nel richiedere che il materiale sia fornito in una forma che possa essere facilmente
        processata da un computer, sicché i singoli elementi di un lavoro – es. una singola cella in una tabella
        – possano essere facilmente letti e modificati.3 Il secondo richiede che il formato di serializzazione
        dei dati sia completamente documentato e la sua implementazione non sia soggetta a brevetti o
        altre royalties. Inoltre – con un requisito che è più stringente della maggior parte delle definizioni di
        formato aperto – dev’essere già disponibile almeno un’implementazione open source della specifica,
        e questa deve permettere il pieno processamento dei dati.4

        Tim Berners-Lee ha suggerito uno schema a 5-stelle per la messa a disposizione di dati aperti,
        indicando i linked open data (v. sotto) come l’approccio di riferimento per la pubblicazione.5

                                                              Fonte: http://5stardata.info/en/

        3   Crf. Art. 2, comma c-bis, del D.Lgs. 24 gennaio 2006, n. 36, e successive modificazioni (attuazione della Direttiva 2003/98/CE),
            che definisce “formato leggibile meccanicamente: un formato di file strutturato in modo tale da consentire alle applicazioni
            software di individuare, riconoscere ed estrarre facilmente dati specifici, comprese dichiarazioni individuali di fatto e la loro
            struttura interna”.

        4   Cfr. Art. 68, comma 3, lettera a), del D.Lgs. 7 marzo 2005, n. 82, e successive modificazioni, ai sensi del quale si intende per
            formato dei dati di tipo aperto “un formato di dati reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti
            tecnologici necessari per la fruizione dei dati stessi”, il che può essere interpretato come equivalente alla Open Definition,
            ma anche in modi meno stringenti.

        5   Questo approccio è stato descritto originariamente in Berners-Lee T. (2006).
14     Federico Morando

         Seguendo questo modello, i detentori dei dati (e, in particolare, i detentori di informazioni del settore
         pubblico) possono pubblicare i propri dati secondo i seguenti approcci:

         1) dati aperti di base: pubblicazione dei dati sul Web, in qualunque formato, es., file PDF (compresi
            quelli immagine), purché soggetti ad una licenza aperta;

         2) dati aperti strutturati in formato proprietario: come in 1), ma pubblicati come dati processabili
            automaticamente, es., foglio di calcolo di Excel;
         3) dati aperti strutturati in formato aperto: come in 2), ma pubblicati in un formato aperto, es., CSV,
            XML o JSON;
         4) dati RDF: come in 3), ma utilizzando URI (v. sotto) per denotare le entità, sicché terze parti possano
            facilmente far riferimento ai dati pubblicati;
         5) linked open data: come in 4), ma collegando anche i dati ad altri dati RDF, per fornire un contesto.

         Come si evince dalla lista, gli approcci summenzionati sono in una scala crescente di sofisticatezza
         tecnica e riutilizzabilità, nel senso che diventa sempre più facile costruire programmi per riutilizzare
         i dati, ma anche che la produzione dei dati stessi è in una scala crescente di complessità e costo.

         Secondo Tim Berners-Lee, o seguendo le raccomandazioni della Commissione Europea o dell’Agenzia
         per l’Italia Digitale,6 il modo ideale di pubblicare open data è dunque l’approccio linked open data.

VERSO UNA VERA INTEROPERABILITÀ SEMANTICA
         I cosiddetti linked data (letteralmente, “dati collegati,” ma l’espressione è raramente utilizzata in
         italiano) sono dati strutturati secondo il formalismo Resource Description Framework7 (RDF): la
         conoscenza viene rappresentata sotto forma di “triple” soggetto-predicato-oggetto, e ogni entità
         viene rappresentata da un identificativo univoco, che è anche un URI8 che risponde a chiamate HTTP.
         Questa tecnologia nasce ed è fortemente spinta dal W3C come standard9 per favorire
         l’interoperabilità tra fonti di dati eterogenee sul Web. Tale interoperabilità non viene garantita da una
         semantica condivisa ex ante, ma dall’uso di un formalismo concettualmente semplice, dall’esistenza
         di identificatori per loro natura globali (gli URI), e dalla facilità di riutilizzare vocabolari e tassonomie
         esistenti, eventualmente anche “annotando” ex post o dall’esterno dati che risiedono su altri sistemi
         e sono pubblicati da entità tra loro del tutto indipendenti.

         6   Cfr. AgID (2012).

         7   Per un’introduzione, cfr. https://www.w3.org/RDF/.

         8   Banalizzando, il concetto di URI è analogo al più familiare URL HTTP, sostanziale sinonimo di “indirizzo Web”, poiché un URL è
             appunto utilizzato per recuperare contenuti sul Web. L’URI, tuttavia, è un concetto più astratto e rappresenta prima di tutto
             un identificativo univoco di una risorsa (entità, concetto), che poi viene “risolto”, anche al fine di puntare ad un URL, che
             fornisca informazioni utili sulla risorsa stessa (una pagina Web che la descriva ad un essere umano, oppure delle triple RDF
             che la descrivano in modo processabile automaticamente per un programma per elaboratore; diversi “agenti” possono
             ricevere URL diversi, chiamando lo stesso URI, grazie al processo noto come “content negotiation”). Per approfondire, si può
             partire dalla pagina Wikipedia https://en.wikipedia.org/wiki/Uniform_Resource_Identifier.

         9   Elenco delle specifiche tecniche disponibile all’URL: https://www.w3.org/standards/techs/rdf. Per una informale introduzione
             ai concetti chiave, cfr. Berners-Lee T. (2006).
Dati aperti della pubblica amministrazione             15
                                   Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane

È anche opportuno sottolineare che questo approccio, nato per abilitare il Web dei Dati,10 si rivela
particolarmente utile in contesti organizzativi o aziendali complessi, in cui vi siano molte fonti di dati
non sottoposte ad una forte governance unitaria ex ante. La pubblica amministrazione, dunque, può
rappresentare un caso d’uso particolarmente idoneo, non solo per la pubblicazione di dati aperti,
ma anche per finalità di interoperabilità ed interscambio di dati dentro una singola amministrazione
medio/grande o tra amministrazioni. Infatti, quando i dati sono strutturati secondo il formalismo linked
data, diventa banale collegare tra loro diversi database o estrarne nuova conoscenza, anche facendo
leva su informazioni pubblicate da terze parti. È di particolare interesse il caso in cui l’incrocio delle
banche dati interne passi tramite l’integrazione / arricchimento dei dati esistenti tramite fonti di
dati esterne, ad esempio, geo-referenziando alcune informazioni usando una banca dati esterna,
per poi proiettare gli stessi dati su una cartografia già esistente internamente.

I linked data rappresentano anche un potente strumento di data curation, grazie alla scoperta di
nuove chiavi di corrispondenza tra database esistenti, ma anche grazie al fatto che esplicitare i
collegamenti tra diverse basi di dati permette di analizzare e gestire incoerenze e conflitti.

Per raggiungere un crescente grado di interoperabilità semantica, è necessario che, ogniqualvolta
ciò sia possibile, il formalismo RFD sia abbinato alla scelta di vocabolari standard, come Dublin Core
o Friend of a Friend, o ancora Schema.org, nonché a sistemi di organizzazione della conoscenza
come SKOS, ulteriori tassonomie come Eurovoc, nonché modelli di metadatazione standard a livello
di dataset, come DCAT. Tutto ciò al fine di permettere l’interoperabilità tra i dataset prodotti da
authority di diverso ambito.

Il formalismo RDF ed il linguaggio di interrogazione dei dati SPARQL sono strumenti generici, creati
per descrivere ed accedere a dati di qualunque tipo. Ciò detto, e considerando la rilevanza dei dati
geospaziali ed il loro ruolo come livello di riferimento che connette altre fonti di informazione, può
essere opportuno menzionare che esiste uno specifico sotto-insieme di standard per rappresentare
l’informazione geografica come linked data.

In particolare, GeoSPARQL11 è uno standard dell’Open Geospatial Consortium (OGC) per
rappresentare ed interrogare dati geospaziali collegati. I dati possono essere salvati in un grafo RDF
utilizzando, ad esempio, il Geography Markup Language (GML) o la serializzazione testuale well-known
text (WKT), e sono disponibili varie modalità per interrogarli, ad es. utilizzando relazioni /
rappresentazioni topologiche come Simple Features, RCC8, o DE-9IM/Egenhofer.

In considerazione del fatto, menzionato sopra, che il livello geospaziale è uno dei piani più utili al fine
di incrociare tra loro dataset pubblici di provenienza differente, il lavoro si chiude con un esempio di
(parziale ed imperfetta, ma già significativa) apertura di dati pubblici relativi al patrimonio immobiliare.

10 Anche soggetti privati concorrono – ovviamente nel proprio interesse – ad implementare progressivamente un Web che
   contenga sempre più dati strutturati; ad esempio, Google e Facebook supportano questo approccio tramite Schema.org e
   l’Open Graph Protocol, anche al fine di facilitare l’ingestione di dati provenienti dal Web, integrandoli nelle loro piattaforme. I
   Linked Data sono anche al centro di piattaforme come Watson di IBM o simili progetti di cognitive computing.

11 Specifiche disponibili su http://www.opengeospatial.org/standards/geosparql.
16     Federico Morando

IL CASO DEI DATI SUL PATRIMONIO IMMOBILIARE PUBBLICO
         Il caso dei dati pubblici aperti relativi al patrimonio immobiliare delle PA è degno di nota, in quanto
         l’apertura di tali dati è obbligatoria per legge ai sensi della normativa relativa alla trasparenza
         amministrativa, ma gli stessi dati sono anche suscettibili di varie forme di riutilizzo per finalità differenti
         (es., business intelligence). Inoltre, la presenza di riferimenti territoriali nei dati (come minimo, il numero
         civico; spesso, riferimenti catastali strutturati) fornisce una chiave per l’incrocio con altri data set.

         L’unico comma dell’art. 30 del D.Lgs. n. 33/2013 (“Decreto Trasparenza”), rubricato “Obblighi di
         pubblicazione concernenti i beni immobili e la gestione del patrimonio,” prevede12 che “[l]e pubbliche
         amministrazioni pubblic[hi]no le informazioni identificative degli immobili posseduti, nonché i canoni
         di locazione o di affitto versati o percepiti.” Tale previsione dev’essere messa in pratica all’interno
         dell’apposita voce “Beni immobili e gestione patrimonio” della sezione “Amministrazione Trasparente”
         nel sito Web di ogni PA.13

         Per quanto la previsione paia largamente autoesplicativa, l’analisi dell’implementazione di questa
         norma dalla prospettiva del riutilizzatore per fini di ricerca o commerciali offre ottimi spunti per
         illustrare le potenzialità della pubblicazione in open data, ma anche i limiti di una pubblicazione priva
         del necessario coordinamento e delle indispensabili linee guida tecniche.

         Dal punto di vista delle potenzialità della pubblicazione, ai vantaggi legati alla trasparenza dell’agire
         della pubblica amministrazione, vanno aggiunti quelli informativi e gestionali che si possono ottenere
         incrociando i dati con altri dati aperti e/o proprietari già disponibili. A questo proposito, pare
         opportuno ed efficace rimandare ad un esempio concreto relativo ad un business case del progetto
         europeo proDataMarket.14 Si tratta del caso di Statsbygg, azienda pubblica responsabile della
         gestione e sviluppo del patrimonio immobiliare del governo norvegese. Il caso in questione mostra
         come l’incrocio tra i dataset delle fonti rappresentate nella figura seguente abbia portato ad un
         significativo incremento nella qualità dei dati ed altri vantaggi in termini di innovazione a valle.

         12 La bozza di decreto di riordino della disciplina di accesso ai dati delle Pubbliche Amministrazioni, noto come “Decreto Madia” (in
            attuazione dell’art. 7 della legge delega n. 124 del 2015 per la “revisione e semplificazione delle disposizioni in materia di
            prevenzione della corruzione, pubblicità e trasparenza”) prevede, al momento di scrivere queste righe, una modifica all’Art. 30,
            che estende l’obbligo di pubblicazione agli immobili in qualunque modo “detenuti”, oltre che a quelli “posseduti” dagli enti. Non
            paiono comunque previste modifiche sostanziali a questo obbligo di pubblicazione. La vera novità, invece, consiste nell’art 9-bis
            e nel meccanismo di pubblicazione delle informazioni sul Patrimonio della PA, che a tendere avverrà tramite un’omonima banca
            dati nazionale, detenuta dal MEF-DT: si vedano le Considerazioni conclusive del presente articolo per un approfondimento.

         13 Per “Pubbliche Amministrazioni” il Decreto Trasparenza intende (stando all’art. 11, c. 1, dello stesso) tutte le amministrazioni
            dello Stato, ivi compresi gli istituti e le scuole di ogni ordine e grado e le istituzioni educative, le aziende ed amministrazioni
            dello Stato ad ordinamento autonomo, le Regioni, le Province, i Comuni, le Comunità montane e loro consorzi e associazioni,
            le istituzioni universitarie, gli Istituti autonomi case popolari, le Camere di commercio, industria, artigianato e agricoltura e
            loro associazioni, tutti gli enti pubblici non economici nazionali, regionali e locali, le amministrazioni, le aziende e gli enti del
            Servizio sanitario nazionale, alcune altre agenzie (l’ARAN e le Agenzie di cui al d.lgs. n. 300/1999), nonché alcuni casi più
            specifici (ad es., il CONI). Senza voler approfondire l’ambito di applicazione, in tutti i casi di cui lo scrivente è a conoscenza, le
            autorità amministrative indipendenti di garanzia, vigilanza e regolazione si sono comportate come se la normativa si applicasse
            loro. Infine, val la pena menzionare che le già citate proposte di riforma (supra, nota 12) prevedono anche una modifica
            dell’ambito soggettivo di applicazione della norma, sicché la stessa si estenderebbe esplicitamente (per quanto compatibile)
            alle seguenti categorie di enti: (a) agli enti pubblici economici, alle autorità portuali e agli ordini professionali; (b) alle società
            in controllo pubblico , salvo quelle quotate; (c) alle associazioni, alle fondazioni e agli enti di diritto privato finanziate
            primariamente o i cui organi di amministrazione o indirizzo siano designati da pubbliche amministrazioni. Alcuni obblighi si
            estenderebbero anche alle società in partecipazione pubblica, alle associazioni, alle fondazioni e agli enti di diritto privato
            che esercitano funzioni amministrative, attività di produzione di beni e servizi a favore delle amministrazioni pubbliche, ecc.

         14 Cfr. Shi et al. (2015) ed il sito del progetto proDataMarket (Grant number: 644497), in particolare:
            http://blog.prodatamarket.eu/2015/08/prodatamarket-business-cases-at-ruleml2015-industry-track/.
Dati aperti della pubblica amministrazione             17
                                 Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane

                                 Fonte: Slide #7 della presentazione “Industry@RuleML2015:
                  Norwegian State of Estate: A Reporting Service for the State-owned Properties in Norway”15

Venendo a ciò che, rispetto al caso della pubblicazione dei dati sul patrimonio immobiliare della PA
italiana, può essere migliorato, gli esempi non mancano. Tra questi, per ciò che concerne la
descrizione analitica delle “informazioni identificative” degli immobili, l’analisi delle prassi delle
maggiori amministrazioni italiane mostra come la norma non sia sempre applicata, oppure sia a volte
interpretata in modo discordante.
Nei prossimi paragrafi, si descriveranno i risultati di un’analisi effettuata nel periodo compreso tra
luglio 2014 e gennaio 2015,16 che ha preso in oggetto tutti i comuni capoluogo di provincia, nonché
gli altri comuni con un numero di abitanti maggiore o uguale a 100.000, per un totale di 119 enti.17
Nell’analisi, l’obbligo di pubblicazione relativo a “Beni immobili e la gestione patrimonio” è stato
suddiviso in tre parti: (a) Patrimonio immobiliare, (b) Canoni di locazione attivi, (c) Canoni di locazione
passivi.
In sintesi, circa ¾ delle amministrazioni hanno pubblicato i propri dati, ma meno del 20% delle
amministrazioni lo ha fatto in modalità tecnicamente aperte (machine readable ed in formati aperti).

15 Disponibile su http://www.slideshare.net/ruleml2012/industryruleml2015-norwegian-state-of-estate-a-reporting-service-for-
   the-stateowned-properties-in-norway (under a CC Attribution License).

16 Le rilevazioni sono state effettuate e/o verificate da Roberta Bruno, nel periodo compreso tra Ottobre 2014 e Gennaio 2015,
   col supporto tecnico di Alessio Melandri.

17 I dati disponibili al momento di effettuare l’analisi erano quelli ISTAT del Bilancio demografico mensile, aggiornati al
   30/06/2014, come riportati da https://it.wikipedia.org/wiki/Comuni_d%27Italia_per_popolazione.
18   Federico Morando

       Anche se le differenze sono minime, i dati sul patrimonio in senso stretto sono stati pubblicati
       marginalmente meglio di quelli relativi alle locazioni, e tra queste le locazioni attive leggermente
       meglio di quelle passive:

                                     Dati utilizzabili             Dati assenti           Dati inutilizzabili         Dati con 3+ stelle

       Patrimonio
                                           75%                        18%                         8%                        19%
       immobiliare

       Canoni di locazione
                                           73%                        20%                         7%                        18%
       attivi

       Canoni di locazione
                                           71%                        26%                         3%                        17%
       passivi

       La prima colonna indica la percentuale di informazioni fruibili dal punto di vista di un essere umano. La seconda e la terza colonna
       suddividono le informazioni non-fruibili tra assenti (non sono presenti file o sono vuoti) e formalmente presenti, ma non pertinenti
       o illeggibili. La colonna “Dati con 3+ stelle” indica la percentuale di database che possono essere classificati a 3 o più stelle
       secondo il modello “five star Open Data” (ovvero, nel caso specifico, sono disponibili in formato CSV, ODS, XML, o HTML tabellare).
       Tutte le percentuali sono calcolate sui 119 casi analizzati.

       Ciò che più ostacola il riutilizzo dei dati, tuttavia, non è il formato, bensì l’assenza di un tracciato
       record standard: ad esempio, viene normalmente fornita una qualche “informazione identificativa”
       degli immobili, ma si ha un indirizzo completo solo nel 40% circa dei casi, e la presenza di dati catastali
       è attorno al 55% nel caso della descrizione del patrimonio, e scende attorno al 10% nella descrizione
       dei canoni di locazione (e, se questo potrebbe essere ovviato in alcuni casi incrociando il data set
       dei canoni attivi con quello del patrimonio, per i canoni passivi l’informazione è del tutto irreperibile

                                                 PRESENZA INFORMAZIONI RELATIVE A:

                                  Indirizzo                                                                Canone           Data Stipula
                                                  Dati Catastali      Superficie         Canone
                                  Completo                                                                Periodicità        Contratto

        Patrimonio
                                     43%                 55%             27%               n.a.                 n.a              n.a
        immobiliare

        Canoni di locazione
                                     34%                 13%             21%               76%                  41%             19%
        attivi

        Canoni di locazione
                                     37%                 8%              24%               71%                  37%             24%
        passivi

       Per ulteriori informazioni riguardo la ricerca di cui sopra, si rimanda al rapporto tecnico che la
       descrive: Canova et al. (2015). Ai fini del presente lavoro, si è inoltre condotto un aggiornamento
       qualitativo dell’analisi nel corso del mese di maggio 2016, focalizzandosi sulle città italiane più
       popolose. Tale analisi ha confermato dal punto vista qualitativo i risultati dello studio di inizio 2015:
       ad esempio, in alcuni casi, come a Milano, il dato catastale non è presente, né sono presenti altre
       informazioni sufficienti ad identificare univocamente la porzione di immobile posseduto o le relative
       dimensioni; in altri, come a Torino, il dataset è più ricco, ma l’unico formato disponibile è il PDF,
       rendendo difficoltosa ogni ulteriore rielaborazione.
Dati aperti della pubblica amministrazione             19
                                  Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane

Una standardizzazione già implementata

L’assenza di qualunque uniformità nei dati aperti relativi al patrimonio immobiliare pubblico italiano
è paradossale, in quanto già la Legge finanziaria 201018 prevedeva quanto segue. Tutte le pubbliche
amministrazioni, i loro consorzi ed associazioni, nonché le agenzie, etc., “che utilizzano o detengono,
a qualunque titolo, immobili di proprietà dello Stato o di proprietà dei medesimi soggetti pubblici,
trasmettono al Ministero dell’economia e delle finanze – Dipartimento del tesoro l’elenco identificativo
dei predetti beni ai fini della redazione del rendiconto patrimoniale delle Amministrazioni pubbliche
a valori di mercato. Entro il 31 luglio di ciascun anno successivo a quello di trasmissione del primo
elenco, le amministrazioni [...] comunicano le eventuali variazioni intervenute. [...] Con provvedimento
del Direttore dell’Agenzia del demanio sono stabilite le modalità delle comunicazioni e delle
trasmissioni previste dal presente comma.”

Allo scrivente non è noto quante amministrazioni diano seguito a questi obblighi di legge, ma le
modalità di cui sopra sono pubbliche e molto dettagliate e concorrono a formare il progetto chiamato
“Patrimonio della PA”. Esse chiariscono come siano oggetto di rilevazione sia i fabbricati che i terreni,
nonché le tipologie di informazioni raccolte (sempre a livello di singolo identificativo catastale), che
riguardano la classificazione tipologica del bene immobile e le finalità d’uso attuali, la localizzazione,
le dimensioni, l’utilizzo, la presenza di eventuali vincoli culturali e paesaggistici, l’epoca di costruzione,
nonché il valore iscritto a bilancio (e quello stimato di mercato e l’anno della relativa stima, se
disponibili). Inoltre, la procedura prevede la possibilità di inserimento massivo dei dati, con import
ed export in formato aperto (CSV).19

In altre parole, esiste già – anche se non è attualmente accessibile in modalità aperta – un database
unico nazionale che contiene buona parte delle informazioni che le amministrazioni sono tenute a
pubblicare, in modo meno organizzato (e con l’aggiunta di alcune informazioni relative ad affitti attivi
e passivi) sui propri siti istituzionali. È inoltre interessante osservare come sul portale OpenDemanio,
iniziativa di open government sui beni gestiti dall’Agenzia del Demanio, siano oggi disponibili le
informazioni di cui sopra, limitatamente ai beni del patrimonio immobiliare dello Stato in gestione
all’Agenzia stessa. Un pilota di apertura dei dati del progetto Patrimonio della PA è dunque già stato
sostanzialmente implementato. Quantitativamente, tali beni rappresentano una piccola percentuale di
quanto comunicato dalle amministrazioni: ad esempio, per il territorio del comune di Torino, vi sono
meno di 400 beni all’interno dei file scaricabili all’indirizzo http://dati.agenziademanio.it/#/opendata
(ovvero, i soli immobili gestiti dall’Agenzia), rispetto ai circa 6000 beni rispetto ai quali la Città di
Torino comunica annualmente informazioni per il progetto Patrimonio della PA. L’iniziativa è tuttavia
di particolare rilievo, sia perché offre comunque una grande mole di informazioni aperte certificate,
sia poiché rappresenta un autorevole “precedente” di pubblicazione open data. Il portale
OpenDemanio, infatti, riporta sin dall’homepage una definizione di dati aperti esplicitamente tratta
dalla OpenDefinition, fa uso di licenze aperte standard (Creative Commons Attribuzione 3.0 Italia) e
pubblica i dati in formato aperto e machine readable (CSV). Se questo esempio fosse seguito da tutte
le amministrazioni anche per quel che riguarda la pubblicazione dei dati ai sensi del Decreto
Trasparenza, la qualità degli open data sul patrimonio immobiliare della PA subirebbe un incremento
drammatico.

18 Legge 23 dicembre 2009, n. 191, art. 2, comma 222, periodi undicesimo, dodicesimo, quattordicesimo e quindicesimo.

19 Per ulteriori dettagli operativi si rimanda alla pagina “FAQ - Rilevazione del Patrimonio della PA”
   (http://www.dt.tesoro.it/en/faq/faq_patrimonio.html).
20     Federico Morando

CONSIDERAZIONI CONCLUSIVE
         Il presente lavoro si è posto l’obiettivo di raccogliere i concetti principali relativi al tema dei dati
         aperti in un testo sintetico ed indirizzato alla comunità di ricercatori e professionisti che svolgono,
         nel mondo universitario e dentro ed attorno alla Pubblica Amministrazione, un ruolo chiave nel
         processo di ammodernamento delle logiche di analisi e gestione dell’informazione territoriale.

         Riguardo il caso dei dati sul patrimonio immobiliare pubblico, una delle finalità di questo breve scritto
         è richiamare l’attenzione sull’esistenza di un sottoinsieme di tali dati già disponibili come dati aperti,
         favorendone il riutilizzo e, indirettamente, aumentando gli incentivi a pubblicarli ed i feedback relativi
         alla pubblicazione degli stessi. Nell’esperienza dello scrivente, infatti, le Pubbliche Amministrazioni
         tendono ad investire nella qualità dei dati soprattutto laddove vi siano riutilizzatori che la pretendono,
         il che è probabilmente ragionevole, in considerazione dei forti vincoli di bilancio e dei molti obblighi
         di pubblicazione posti in capo alle amministrazioni stesse.

         Pare inoltre opportuno concludere menzionando il fatto che molti dei problemi relativi a tali dati e
         descritti in questo articolo dovrebbero progressivamente essere superati in virtù del riordino della
         disciplina di accesso ai dati delle Pubbliche Amministrazioni, noto come “Decreto Madia”. La bozza
         disponibile al momento di scrivere queste righe, infatti, prevede all’art. 9-bis (Pubblicazione delle
         banche dati) che le pubbliche amministrazioni adempiano ad alcuni degli obblighi di pubblicazione
         mediante la comunicazione dei dati, delle informazioni o dei documenti all’amministrazione titolare
         della banca dati nazionale corrispondente. Nel caso specifico, si tratterebbe della banca dati
         “Patrimonio della PA”, detenuta dal Dipartimento del Tesoro del Ministero dell’Economia e delle
         Finanze.20 La pubblicazione in un’unica banca dati assicurerebbe l’uniformità di formato e,
         auspicabilmente, anche semantica, dopodiché la singola amministrazione potrebbe adempiere
         all’obbligo di pubblicazione sul proprio sito istituzionale con un semplice collegamento ipertestuale.

         Per quanto, nel lungo periodo, l’esistenza di una banca dati nazionale di riferimento paia un’ottima
         notizia per chi sia interessato al riutilizzo dei dati sul patrimonio della PA per ragioni di ricerca o di
         business, nel breve periodo, quanto descritto nel presente articolo riguardo la qualità degli open
         data relativi al patrimonio immobiliare pubblico attualmente disponibili rappresenta un caveat per
         chi avrà il compito di alimentare ed assicurare l’alimentazione del database “Patrimonio della PA”. In
         assenza di rigorose linee guida e/o di processi informatici guidati, nonché di un’opportuna
         governance, si potrebbe infatti rischiare di trasferire in una base di dati unitaria l’attuale Babele
         informativa degli open data sul patrimonio. Fortunatamente, le dettagliate linee guida già sviluppate
         dal Dipartimento del Tesoro in relazione al progetto Patrimonio della PA, nonché la buona pratica
         rappresentata dal progetto OpenDemanio lasciano ben sperare rispetto alla rapida pubblicazione
         come dati aperti di tutte queste informazioni.

         In attesa che ciò avvenga, sin da subito ed in modo unilaterale ciascuna PA potrebbe procedere a
         pubblicare nella propria sezione Amministrazione Trasparente il CSV che carica periodicamente sul
         portale dell’Agenzia del Demanio, arricchito dalle informazioni relative ad affitti attivi e passivi.

         20 La banca dati è stata istituita dal già citato Art. 2, co. 222, della Legge n. 191 del 2009 e dall'Art. 17, co. 3-4 , Legge n. 90 del
            2014, convertito, con modificazioni, dalla legge n. 114 del 2014.
Dati aperti della pubblica amministrazione             21
                                         Appunti per uno stato dell’arte nel 2016 e focus sui dati relativi al patrimonio immobiliare delle PA italiane

Bibliografia

AgID (2012), Linee guida per l’interoperabilità semantica attraverso i Linked Open Data, versione 2.0, pubblicata il 12
Novembre 2012, disponibile su http://www.agid.gov.it/sites/default/files/documentazione_trasparenza/cdc-spc-gdl6-
interoperabilitasemopendata_v2.0_0.pdf.

Belisario E., Cogo G., Epifani S., Forghieri C. (2011). Come si fa Open Data? Istruzioni per l’uso per Enti e Amministrazioni Pubbliche.

Berners-Lee T. (2006), Linked Data, W3C Design Issues series, disponibile su https://www.w3.org/DesignIssues/LinkedData.html.

Biallo G. (2013) Dati geografici aperti: istruzioni per l’uso - Italia OpenGeoData, Open Knowledge Foundation Italia, Open data
handbook, Retrived at http://opendatahandbook.org/, May 2013.

Canova L., Iemma R., Morando F. (2015), #WikiTrasparenza – Chi apre davvero i dati sulle risorse pubbliche. Nexa Working Paper
n. 2015-1, disponibile su http://nexa.polito.it/working-paper/2015-1.

Elkin-Koren N. (2006), Exploring Creative Commons: A Skeptical View of a Worthy Pursuit, in Hugenholtz P. B. e Guibault L. (eds.),
The Future of the Public Domain, Kluwer Law International, 2006.

Hugenholtz P. B. (2004), Abuse of Database Right – Sole-source information banks under the EU Database Directive, presentato
alla conferenza “Antitrust, Patent and Copyright”, École des Mines/UC Berkeley, Paris, January 15-16, 2004. Pubblicato in Lévêque
F. and Shelanski H. (eds.), Antitrust, patents and copyright: EU and US perspectives, Cheltenham: Edward Elgar 2005, p. 203-219.
Disponibile su http://www.ivir.nl/publicaties/download/953.

Krötzsch M. e Speiser S. (2011), “ShareAlike Your Data: Self-referential Usage Policies for the Semantic Web.” ISWC , Ed. Aroyo S.
L., Welty C., Alani H., Taylor J., Bernstein A., Kagal L., Noy N. e Blomqvist E. Springer Berlin / Heidelberg ISWC 2011: 354-369.

Morando F. (2013a), Gli obblighi di pubblicazione concernenti l’uso delle risorse (artt. 26-27, 29-30). In: La trasparenza
amministrativa dopo il d.lgs. 14 marzo 2013, n. 33 / Ponti B. Maggioli spa, pp. 239-257. ISBN 8838781028.

Morando F. (2013b), Legal interoperability: making Open Government Data compatible with businesses and communities. In: JLIS.IT,
vol. 4 n. 1, pp. 441-452. ISSN 2038-1026.

Morando, F. et al. (2013), “Guida alla pubblicazione dei dati delle pubbliche amministrazioni”, Edizioni ETS srl, Pisa, pp. 9-83. ISBN
9788846735782.

Rizzo G., Morando F., De Martin J.C. (2011), Open Data: la piattaforma di dati aperti per il Linked Data. In: Informatica e diritto n. 20,
pp. 493-511. ISSN 0390-0975.

Shi L., Pettersen B. E., Østhassel I, Nikolov N, Khorramhonarnama A., Berre A. J., Roman D., (2015) Norwegian State of Estate: A
Reporting Service for the State-Owned Properties in Norway, in Rule Technologies: Foundations, Tools, and Applications: 9th
International Symposium, RuleML 2015, Berlin, Germany, August 2-5, 2015, Proceedings, pp 456-464, Springer.

Sitografia

Il progetto Open Definition pone le basi per definire il concetto di “apertura” in relazione a dati e contenuti.
http://opendefinition.org/ (Data ultima consultazione: 1/05/2016)

Open Government License v. 3. http://www.nationalarchives.gov.uk/doc/open-government-licence/version/3/
(Data ultima consultazione: 1/05/2016)

Italian Open Data License v2.0. http://www.dati.gov.it/iodl/2.0/ (Data ultima consultazione: 1/05/2016)

Il modello di pubblicazione di dati aperti a 5-stelle di Tim Berners-Lee illustrato per esempi. http://5stardata.info/en/
(Data ultima consultazione: 1/05/2016)

Lo standard OGC GeoSPARQL per rappresentare ed interrogare linked data geospaziali.
http://www.opengeospatial.org/standards/geosparql (Data ultima consultazione: 1/05/2016)

Quest’opera è distribuita con
Licenza Creative Commons Attribuzione - Non commerciale 3.0
Puoi anche leggere