Magazzini Digitali, NBN, BNCF in Google Books - Seminario Conservare il digitale: gestione e salvaguardia, verso nuove frontiere di servizi 27 ...

Pagina creata da Veronica Gargiulo
 
CONTINUA A LEGGERE
Magazzini Digitali, NBN, BNCF in Google Books - Seminario Conservare il digitale: gestione e salvaguardia, verso nuove frontiere di servizi 27 ...
Magazzini Digitali, NBN, BNCF in Google Books
                                    Seminario
Conservare il digitale: gestione e salvaguardia, verso nuove frontiere di servizi
                                27 aprile 2010
                        Biblioteca Nazionale Braidense

                         Giovanni Bergamin
                Biblioteca Nazionale Centrale Firenze
Magazzini Digitali, NBN, BNCF in Google Books - Seminario Conservare il digitale: gestione e salvaguardia, verso nuove frontiere di servizi 27 ...
Magazzini Digitali

dal prototipo al servizio
Non più un prototipo, ma la realizzazione di una infrastruttura

 Si tratta ora di realizzare una infrastruttura per il servizio
  nazionale di deposito legale delle pubblicazioni digitali (approvata e
  finanziata dalla Direzione Generale Beni Librari )
 Lettera d’intenti firmata il 19 gennaio 2010 tra:
        Nazionale di Firenze e Nazionale di Roma soggetti depositari
         (previsti dalla Legge 106/2004 -- Deposito legale)
        Biblioteca Marciana per il “dark archive”
        Fondazione Rinascimento Digitale (promotore e finanziatore del
         progetto Magazzini Digitali)
 Comprende l’avvio del servizio e mantenimento per 3 anni
Il prototipo realizzato a partire dal 2006
dal 2009 ospita le tesi di dottorato digitali inviate alle Biblioteche
                         nazionali centrali
Indici generati
                     Accesso
                                    Indici generati
automaticamente       utente        automaticamente

            Nodo = Un insieme di
            computer (unità di
            mememorizzazione)
            autonomi dal punto
            di vista della
            acquisizione dei dati

           Visto unitariamente da
                chi deposita
                  e da chi accede
          htttp://depositolegale.it
Perché depositolegale.it ?

                 http://www.depositolegale.it

 http://memoria.depositolegale.it/http://td.unibo.it/ar/tesi234.ht
  m

 http://memoria.depositolegale.it/doi:10.1045/789

 http://memoria.depositolegale.it/urn:nbn:it:34-6789
Le applicazioni e i supporti passano,
         i dati e i metadati restano (o possono restare)

 I dati (i file contenenti dati) sono ospitati in file-contenitore
  conformi a ISO 28500:2009 -- WARC
 I metadati (i file contenenti metadati) sono ospitati in file-
  contenitore conformi a MPEG21-DIDL (ISO 21000-2:2003)
 In questo momento tutti i file sono ospitati su hard disk
  gestiti da “normalissimi” computer
La sicurezza si può comprare, la responsabilità invece no

                                                                Roma
Firenze
                Le apparecchiature sono in housing
                presso 3 differenti data center
                certificati ISO 27001 -- gestiti da 3
                soggetti differenti

                                         Tutti i servizi sono
                                         erogati direttamente
          2x3 repliche dello             dalle istituzioni
          stesso file (dati e            responsabili
          metadati)
                                             Dark Archive -- Venezia
Alcuni punti di partenza

 In un sistema informatico il malfunzionamento è la regola non
  l’eccezione
 La ridondanza di oggetti poco costosi, ben conosciuti perché usati
  quotidianamente garantisce la continuità del servizio
 La semplicità del disegno e la totale apertura dei componenti hardware e
  software garantisce costi ragionevoli:
     di manutenzione
     di ’aggiornamento verso altri “oggetti d’uso quotidiano”
 Il controllo costante, l’individuazione rapida dell’errore e la possibilità di
  garantire livelli accettabili di servizio mentre si rimuovono i
  malfunzionamenti sono gli ingredienti fondamentali di un buon sistema
  informatico
La nostra definizione di riferimento per
             servizio di conservazione a lungo termine
                                 A

 servizio pubblico fornito da depositi digitali accreditati o
  affidabili (trusted o trustworthy digital repositories).
       per servizio pubblico = un servizio ritenuto essenziale e
        strategico da una determinata comunità e accessibile
        senza barriere di tipo economico, tecnologico ecc
       depositi digitali accreditati = standard per la certificazione
        Trustworthy Repositories Audit & Certification (TRAC)
./.
La nostra definizione di riferimento per
        servizio di conservazione a lungo termine
                            B

Il servizio assicura a lungo termine per una
 comunità di riferimento la :
  Vitalità
  Traducibilità (da parte di un elaboratore)
  Autenticità (Identità + Integrità)
  Fruibilità (da parte di un essere umano)
Delle risorse depositate
Tre direzioni

 Tesi di dottorato digitali
 Sperimentazione art 37 DPR 252 2006
         periodici elettronici italiani (editoria commerciale)  modello di accordo
          con l’editore che definisce le modalità di deposito, di trattamento e di
          accesso)
         estensione del modello tesi (su base volontaria) agli altri archivi ad accesso
          aperto
 Sostenibilità:
         servizi per il perpetual access?
         servizi per il persistent storage?
nbn

   Abbiamo davvero bisogno di un
“Numero di Bibliografia Nazionale” per le
            risorse digitali?
Come nasce l’NBN

dalla metà degli anni 90 sono stati proposti sistemi
 di citazione della risorsa digitale basati sul nome
 della risorsa (URN – Uniform Resource Name).
Obiettivi:
  applicare il principio della “rubrica telefonica”:
  mettere in relazione i numeri di telefono -- che come
   gli indirizzi internet possono cambiare -- con i nomi
   che invece rimangono stabili nel tempo (si parla in
   questo caso anche di identificatori persistenti)
RFC 3188

Grazie al lavoro delle biblioteche nazionali
 europee (in particolare della biblioteca
 nazionale finlandese)
 nel 2001 è stata accolta in ambito
 internazionale la proposta di un identificatore
 persistente basato sul numero di bibliografia
 nazionale
Qualche esempio

urn:nbn:hu-6982
urn:nbn:de:101:1-2010012009
3 obiettivi

 Come registrare l’associazione URN-URL (come
  gestire la “rubrica”)
 Come “risolvere” un URN
 Come garantire la persistenza (… non è un
  problema tecnologico ma di impegno istituzionale):
       Del nome
       Dell’associazione
       Della risorsa
L’accordo CNR MiBAC

Dal dire (la presentazione sulla stampa)

Al fare … sperimentazione per un anno
  BNCF, BNCR e ICCU (SBN) come nodo
   centrale
  Biblioteca del CNR come “nodo delegato”
Quello che NBN non può essere

un catalogo centralizzato
 un archivio centralizzato
un’alternativa al DOI
Uno dei tanti servizi

che dovrà essere in grado di interoperare con:
     altre infrastrutture di registrazione e risoluzione (es.
      DOI);
     SBN (Servizio Bibliotecario Nazionale);
     Repository istituzionali
     servizi di conservazione e di accesso nel lungo
      periodo
     motori di ricerca
     ...
BNCF in Google Books

    ... ma non solo
L’annuncio

1 milione di libri in pubblico dominio (fino al
 1870)
Firenze, Roma (ma non solo)
Completamento della conversione del
 retrospettivo
L’uso dei libri digitalizzati

dovranno restare in pubblico dominio
le bibioteche avranno la possibilità di
 trasferire da Google in un proprio archivio:
  i “master” ad alta risoluzione
  l’ocr
  i metadati tecnici (anche strutturali)
le biblioteche non hanno limitazioni nell’uso
grazie
Puoi anche leggere