La conservazione delle e-mail

Pagina creata da Jacopo Amato
 
CONTINUA A LEGGERE
La conservazione delle e-mail

                                   SILVIO SALZA
             Università degli Studi di Roma “La Sapienza”
                               salza@dis.uniroma1.it

6ª CONFERENZA ORGANIZZATIVA DEGLI ARCHIVI DELLE UNIVERSITÀ ITALIANE
                                 Padova 28 ottobre 2009

    SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
 6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   1
L’irresistibile ascesa dell’e-mail

•   1971 – Prima e-mail inviata tra due computer (sono nella
    stessa stanza, ma transita attraverso la rete Arpanet)

•   1980-1990 – La posta elettronica si consolida come
    strumento di comunicazione nella comunità scientifica

•   1990-2000 – Nasce il Web, Internet si apre al grande
    pubblico, e con essa l’uso della posta elettronica

•   2000-2010 – Internet supera il miliardo di utenti e l’e-mail
    diviene la più diffusa forma di comunicazione scritta

•   2009- .…. – Altre forme di comunicazione (messaggistica
    istantanea) insidiano il predominio dell’e-mail

           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   2
Una rivoluzione negli archivi?

•   Un grande flusso di informazioni si sposta dal parlato
    (telefono) allo scritto (posta elettronica)
•   Le telefonate non possono essere archiviate (almeno si
    spera…), ma le e-mail sì!
•   Rispetto al passato, l’archiviazione delle e-mail può dare un
    contributo determinante per la ricostruzione degli eventi
•   L’uso del telefono nella seconda metà del ‘900 ha ci ha
    privato della memoria di molta della comunicazione rapida

    Potremmo parlare di ritorno al passato nella comunicazione
      scritta: a Londra e Parigi alla fine dell’800 la posta veniva
     recapitata in mezza giornata; poi il telefono e l’inefficienza
            dei servizi postali hanno modificato le abitudini

           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   3
Vettore o documento?

•   Grazie al meccanismo degli allegati, il messaggio di posta
    elettronica ha una doppia valenza:

      A. È un vettore che permette di fissare tempi e dettagli di
         spedizione e consegna dei documenti che vengono
         trasmessi come allegati
      B. È un documento esso stesso, quando si considera
         l’informazione contenuta nel corpo del messaggio

y Limitarsi alla prima visione è molto riduttivo:
    – Si cerca di ignorare consuetudini ormai consolidate
        nell’uso dello strumento
    – Si rischia di ingessare il processo di comunicazione
    – Si rischia di trascurare la conservazione di informazioni
        importanti
            SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
         6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   4
La posta elettronica nella PA
•   L’uso della posta elettronica è incoraggiato nella PA ed è stato
    sponsorizzato da tutti i ministri della Funzione Pubblica
•   Da questa rivoluzione ci si attendono risparmi mirabolanti
•   Il Codice dell’Amministrazione Digitale fornisce importanti
    presupposti:
    – Prevede l’e-mail per la comunicazione tra pubbliche
      amministrazioni
    – Istituisce la Posta Elettronica Certificata
•   Tuttavia …..
    – Le buone intenzioni quasi sempre si infrangono sulle barriere
      normative che nessuno si dà la pena di rimuovere
    – Raramente ci si preoccupa che i presupposti all’uso della
      posta elettronica siano effettivamente garantiti
    – Uno di questi è risolvere il problema dell’archiviazione
           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   5
Perché archiviare la posta elettronica?
•   Obblighi normativi
     – Messaggi con valenza formale possono essere soggetti a
       obblighi di conservazione
     – L’e-mail è un documento elettronico, o, come minimo, ne può
       essere il vettore
     – Alcune informazioni potrebbero dover essere esibite in sede
       di controversia legale (negli USA la mancata esibizione è
       equiparata all’occultamento volontario)
•   Incentivazione dell’uso dello strumento
     – La garanzia che i messaggi sono archiviati ne promuove
       l’uso anche per comunicazioni formali
     – Abbattimento dei costi e dei tempi

    Se veramente vogliamo sostituire la corrispondenza cartacea
    con la posta elettronica dobbiamo prima creare i presupposti
           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   6
Perché archiviare la posta elettronica (2)
•   Importanza strategica
     – I messaggi contengono informazioni di rilevanza strategica
       per le organizzazioni (private e pubbliche)
     – Si stima che la posta elettronica contenga addirittura il 75%
       della proprietà intellettuale delle aziende.
•   Integrazione con il workflow
     – L’integrazione dell’e-mail nel workflow snellisce e introduce
       efficienza e velocizza le procedure amministrative
     – Accesso ai messaggi archiviati tramite paradigmi di ricerca
       sofisticati ed efficaci
•   Conservazione storica (last but not least)
     – Preservare la memoria storica è un obbligo verso la civiltà
       e la cultura

           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   7
Il problema dei volumi
•   Troppi messaggi
     – Ogni giorno nel mondo vengono inviati più di 200 miliardi di
       messaggi di posta elettronica
•   Troppe schifezze
     – Spam: disgustosa e misteriosa carne in scatola (mystery
       meat), da uno sketch cult dei Monty Python (1970)
     – Oggi ben oltre il 60% dei messaggi sono spam
•   Ma anche il resto ….
    – Tolto lo spam (magari!), non tutto quello che resta è degno
      di attenzione
    – Molti messaggi sono privi di interesse
    – Nel processo di archiviazione è molto difficile individuare i
      messaggi significativi
           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   8
Un documento un po’ particolare

I messaggi di e-mail sono figli di Internet, nel bene e nel male
•   Aspetti positivi
     – Internet deve garantire l’interoperabilità: nella torre di
       Babele sono indispensabili regole precise
     – Struttura e modalità di gestione dei messaggi regolate da
       precisi standard internazionali
     – I messaggi contengono al loro interno una messe di
       informazioni da cui estrarre metadati
•   Aspetti negativi
     – Internet è libera e senza controllo per definizione: nessuno
       garantisce che le regole siano osservate
     – L’assenza di controllo introduce anche problemi di
       autenticità e integrità

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   9
Struttura dei messaggi

                                                                             Dati su mittente,
                                   INTESTAZIONE                              destinatario, processo
                                                                             di consegna e struttura
Messaggio in                            PARTE 1                              del messaggio
formato standard
RFC 2822/MIME
                                                                               Testo del messaggio
                                                                               e allegati
                                        PARTE n

       La struttura precisa dei messaggi ben si presta ad una
        automazione delle procedure di archiviazione, sia per
         l’individuazione e la gestione dei contenuti che per
            l’estrazione dei metadati e la classificazione

             SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
          6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009      10
Il processo di archiviazione

Comporta la soluzione di tutta una serie di problemi:

•   Cattura
     – Selezione e individuazione dei messaggi da archiviare
•   Classificazione e metadatazione
     – Estrazione automatica e intervento degli utenti
•   Gestione dei formati
     – Occorre garantire la interpretabilità dei formati nel tempo
•   Gestione dell’autenticità e dell’integrità
     – Superare le scarse garanzie fornite da Internet
•   Conservazione
     – Garantire integrità e leggibilità nel tempo

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   11
Cattura dei messaggi

•   Cattura lato server
     – I messaggi sono catturati non appena giungono nel server
     – Possono essere usate regole di selezione e filtraggio
     – Idonea per conservazione “di massa”
•   Cattura lato client
     – Gli utenti sono coinvolti nel processo di selezione e cattura
       dei messaggi
•   Schema misto
     – Basata sulla selezione preliminare lato server
     – Gli utenti devono successivamente fornire il consenso e
       scegliere la classificazione e i metadati tra un ventaglio
       prospettato

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   12
Cosa catturare

•   Tutto
     – Facile da implementare
     – Alta percentuale di mail inutili
     – Difficile la ricerca
     – Problemi di privacy nelle aziende

•   Solo i messaggi selezionati
     – Limitata efficacia dei filtri e dei sistemi di selezione
       automatici
     – Il coinvolgimento degli utenti può essere problematico
       (problemi di tempo, soggettività, malafede …)

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   13
Estrazione dei metadati

Diverse tipologie di metadati possono essere estratte
automaticamente dalla testata del messaggio (header)
•    Messaggio
     – Message ID, subject, sender, recipients
•    Consegna
     – Data, ora e altre informazioni relative al processo di
        consegna
•    Thread
     – Connessioni logiche tra i messaggi (risposta, inoltro,
        ricevute)
•    MIME
     – Struttura del messaggio e formati degli allegati

         SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
      6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   14
Classificazione dei messaggi

Possibili diverse opzioni (e le loro combinazioni):

•   Classificazione automatica
    – Basata su strumenti automatici di classificazione
    – Sfruttano le informazioni contenute nell’intestazione
        (es. mittente, oggetto …) e nel testo (parole chiave)
    – Necessaria, almeno come primo livello, nella cattura
        lato server
•   Intervento dell’utente
    – Destinatario, mittente e archivista controllano o
        provvedono alla classificazione
    – Può limitarsi alla selezione tra alternative suggerite
        da strumenti automatici

        SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
     6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   15
Il problema dei formati
•   Messaggi in formato standard RFC 2822/MIME
    – Il corpo può essere in testo semplice o in html
    – Una corretta restituzione dipende dalla codifica dei
        caratteri, in genere ISO-88591 UTF8 (ma non sempre)
    – Frequenti errori (es. caratteri accentati)
•   Gli allegati possono avere formato qualsiasi
    – Per la visualizzazione di un allegato è necessario
        disporre dell’applicazione che lo ha creato o di una
        compatibile

    Mantenere l’integrità degli allegati significa garantirne la
    restituzione in forma identica a quella in cui sono stati
     creati, e nella quale l’autore li ha concepiti e percepiti

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   16
Autenticità ed integrità

•   I problemi
    – La sicurezza dell’e-mail è un punto dolente
    – Tecniche di contraffazione relativamente semplici
    – Difficile stabilire autenticità e integrità
    – Problemi anche per la riservatezza dei contenuti
•   Le soluzioni
    – Autenticazione tramite certificati digitali (firma digitale)
    – Forme di autenticazione ‘debole’ sono più che sufficienti
        in molte circostanze
    – Lo standard S-MIME e quasi i tutti i client supportano
        firma e cifratura
    – La cifratura pone i noti problemi in sede di archiviazione

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   17
La Posta Elettronica Certificata (PEC)

•   Prevista dal Codice dell’Amministrazione Digitale e
    attualmente operativa
•   Basata su una rete di provider certificati (stile firma digitale)
•   Richiede l’uso di caselle certificate: tutte le PA centrali sono
    obbligate ad avere caselle di PEC
•   La PEC garantisce autenticità ed integrità:
    – Prova dell’invio del messaggio (non ripudio)
    – Prova della ricezione del messaggio
    – Integrità del contenuto (impronta digitale del messaggio)

      È uno strumento utile ed efficace, ma un’estensione
       generalizzata della PEC può non essere opportuna
      e rischia di ingessare la comunicazione tramite e-mail

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   18
Scenari di conservazione

•   Conservazione di breve e medio periodo
    – Orizzonte temporale inferiore a 10 anni
    – Relativamente semplice garantire la leggibilità di
      messaggi ed allegati
    – Occorre comunque censire tutti i formati archiviati e
      garantire la disponibilità delle relative applicazioni
•   Conservazione di lungo periodo
    – Orizzonte temporale superiore a 10 anni
    – Non è pensabile garantire la disponibilità delle
      applicazioni
    – Problemi anche relativi alla memorizzazione digitale
    – Si spera di poter contare nel medio termine su centri di
      servizio a livello regionale o nazionale
          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   19
Conservazione di lungo periodo

•   Conservazione del messaggio originale
    – Conservare comunque una copia del messaggio nel suo
      formato originale (RFC 2822/MIME)
    – Mantiene l’originalità del messaggio ma non garantisce
      la leggibilità degli allegati
•   Conversione degli allegati
    – Estrazione degli allegati e loro archiviazione come
      oggetti collegati ma indipendenti
    – Conversione in formati che garantiscano la leggibilità nel
      tempo
    – Per tutti gli oggetti stampabili possono essere usati i
      cosiddetti formati di stampa
    – La conformità agli originali dovrebbe essere attestata in
      sede di archiviazione
           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   20
Conservazione degli oggetti digitali

•   Carenze normative: il punto di riferimento resta ancora la
    deliberazione Cnipa 11/2004 (supporti ottici)
•   Cosa manca:
    – Regole sulla qualità di supporti e registrazioni
    – Criteri per stabilire la loro durata
    – La cultura del ‘processo di qualità’
•   Il processo di conservazione è comunque così complesso
    che non ha senso gestirlo su piccola e media scala

         Una via d’uscita (sia per i privati che per la PA)
       può essere la creazione la centri di servizio a livello
         regionale o nazionale, nell’ambito di un sistema
       molto rigoroso di regolamentazione e certificazione

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   21
E-mail e protocollo informatico

•   Nella PA il processo di archiviazione inizia con il protocollo
    – Il protocollo informatico riguarda oggi prevalentemente
        immagini scannerizzate di documenti cartacei
    – Rrichiesto un consistente intervento umano
•   La protocollazione dei messaggi di e-mail offre larghi spazi
    ad una gestione largamente automatizzata
    – Messaggi in entrata
        − Estrazione automatica dei metadati
        − Selezione fra proposte alternative
    – Messaggi in uscita
        − Integrazione della funzione nei client di e-mail
        − Generazione di messaggi con segnatura di
           protocollo

           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   22
Il problema della privacy

•   La tutela della posta elettronica è assimilata alla tutela della
    corrispondenza
    – Il contenuto dei messaggi di posta elettronica – come
         pure i dati esteriori delle comunicazioni e i file allegati –
         riguardano forme di corrispondenza assistite da garanzie
         di segretezza tutelate anche costituzionalmente
    – … un'ulteriore protezione deriva dalle norme penali a
         tutela dell'inviolabilità dei segreti
    – Linee guida Garante: deliberazione 13/2007
•   Limiti restrittivi sulla durata della conservazione
•   L’eventuale uso “promiscuo” della posta aziendale viene
    attribuito all’assenza di policy che la regolamentino

           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   23
Privacy: come tutelarsi
La definizione di regole precise cui sia data adeguata pubblicità
può rendere possibile la gestione automatizzata dell’e-mail
•   Caselle associate agli uffici e alle funzioni e condivise tra più
    dipendenti
•   Ulteriori indirizzi destinati all’uso privato dei singoli dipendenti:
    ma contrasta con l’articolo 314 del CP (peculato)!!
•   Regole chiare per il routing delle e-mail in caso di assenza
•   Sistema di deleghe per l’accesso alla casella di posta in caso di
    necessità
•   Avvertimento ai destinatari circa la natura non personale dei
    messaggi

     Si consiglia alle PA di dotarsi di un adeguato disciplinare
     sull’uso di Internet ed e-maiil; alcune PA lo hanno già fatto

            SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
         6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   24
Prodotti di mercato

•   Ampio mercato di prodotti per l’archiviazione della e-mail
•   Fatturato annuo che supera il mezzo miliardo di dollari
•   Caratteristiche dei prodotti
    – Integrazione con client e sistemi per gestione dell’e-mail
        (MS Exchannge e Outlook, IBM Lotus Domino)
    – Supporto alla classificazione dei messaggi
    – Possibilità di definire regole articolate per la
        conservazione o la cancellazione delle e-mail
    – Integrazione con i sistemi documentali e di gestione dei
        contenuti
•   Può essere necessario realizzare comunque un ulteriore
    strato di software applicativo

          SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
       6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   25
Conclusioni

•   Molte ragioni valide per predisporre l’archiviazione della
    posta elettronica
•   Presupposto fondamentale ad un ampia diffusione della
    posta elettronica anche nelle comunicazioni formali
•   L’e-mail come documento ha molti aspetti positivi:
    –   Standardizzazione del formato
    –   Automazione della classificazione e metadatazione
•   Il problema del formato degli allegati: ma vale per tutti i
    documenti informatici
•   Problematica gestione degli aspetti di privacy: in parte
    risolti da disciplinari che definiscano le policy

           SILVIO SALZA - Università di Roma “La Sapienza” – La conservazione delle e-mail
        6ª Conferenza organizzativa degli archivi delle università italiane – Padova 28-10-2009   26
Puoi anche leggere