SISTEMI E APPLICAZIONI PER L'AMMINISTRAZIONE DIGITALE

Pagina creata da Filippo Crippa
 
CONTINUA A LEGGERE
Università degli Studi di Macerata
                                          Dipartimento di Giurisprudenza
                          Scienze dell’amministrazione pubblica e privata (Classe LM-63)

                       SISTEMI E APPLICAZIONI PER
                      L’AMMINISTRAZIONE DIGITALE
                                “LA RAPPRESENTAZIONE DIGITALE
                                     DELLE INFORMAZIONI”
                                             Lezione n. 1 – parte seconda
                                             Mercoledì 30 settembre 2015

A.A. 2015-2016 - primo semestre biennio                                                    Luca Ricciotti PhD
Sistemi e applicazioni per
Introduzione                                                                                    l’amministrazione digitale

                                                    Il computer
                                      è in grado di elaborare e memorizzare
                                         solo informazioni di tipo binario
                                        ovvero costituite da sequenze di bit
                                                    (“0” ed “1”)

                                              Qualsiasi contenuto
                                  (documenti, immagini, audio, video etc. etc.)
                                deve quindi essere “convertito” in sequenze di bit
                                    per poter essere elaborato dal computer

              1 bit
      informazione 1 → “0”
      informazione 2 → “1”
              2 bit
     informazione 1 → “00”    Esiste una relazione tra il numero di bit che si hanno a
     informazione 2 → “01”    disopsizione e il numero di informazioni che si possono
     informazione 3 → “10”
     informazione 4 → “11”
                                             rappresentare con quei bit
              3 bit                   con 1 bit è possibile rappresentare 21 = 2 informazioni
     informazione 1 → “000”           con 2 bit è possibile rappresentare 22 = 4 informazioni
     informazione 2 → “001”           con 3 bit è possibile rappresentare 23 = 8 informazioni
     informazione 3 → “010”
                                     con 4 bit è possibile rappresentare 24 = 16 informazioni
     informazione 4 → “011”
     informazione 5 → “100”          con 5 bit è possibile rappresentare 25 = 32 informazioni
     informazione 6 → “101”          con 6 bit è possibile rappresentare 26 = 64 informazioni
     informazione 7 → “110”         con 7 bit è possibile rappresentare 27 = 128 informazioni
     informazione 8 → “111”         con 8 bit è possibile rappresentare 28 = 256 informazioni
Sistemi e applicazioni per
L’ordine di memorizzazione delle informazioni                                                          l’amministrazione digitale
                                  Le informazioni di dimensione superiore al byte
                                   (ad esempio, word, double word o quad word)
                                      possono essere memorizzate all’interno
                                   della memoria centrale secondo due modalità
                                 che differiscono per l’ordine dei byte (endianness)

                               Modalità “big endian”                               Modalità “little endian”
                     (usata dai processori Motorola, IBM, SUN e sui      (usata dai processori Intel e sulle piattaforme
                                    protocolli internet)                                    Digital)
                       La memorizzazione inizia dal byte più               La memorizzazione inizia dal byte meno
                     significativo (MSB, most significant byte)          significativo (LSB, less significant byte)) per
                           per terminare con quello meno                     terminare con quello più significativo
                      significativo (LSB, less significant byte).                 (MSB, most significant byte).
                    Il più importante viene memorizzato nella            Il più importante viene memorizzato nella
                     cella di memoria con indirizzo più basso.              cella di memoria con indirizzo più alto.
                     Il meno importante viene memorizzanto                 Il meno importante viene memorizzanto
                     nella cella di memoria con indirizzo più              nella cella di memoria con indirizzo più
                                       alto                                                 basso

                     Osservando il contenuto della memoria centrale        Osservando il contenuto della memoria centrale
                      con indirizzi crescenti da sinistra verso destra      con indirizzi crescenti da sinistra verso destra
                      i byte vengono memorizzati nello stesso ordine       i byte vengono memorizzati nell’ordine inverso
Sistemi e applicazioni per
Segnale “analogico” e “digitale”                                                                      l’amministrazione digitale

                             Oggi viviamo in una società in cui tutti contenuti sono diventati digitali
                            …le foto che scattiamo, la musica che ascoltiamo, i film che guardiamo, le
                                       telefonate che facciamo, i documenti che creiamo…
                                    sono sempre di più solo in formato digitale (born digital)

                                                                                                           Segnale digitale
                             Segnale analogico
                                                                                                            (es. un CD audio)
                          (es. vecchia audiocassetta)
                                                                              Un segnale è digitale quando la variazione nel tempo avviene in modo
 Un segnale è analogico quando varia con continuità nel tempo e quindi
                                                                              discreto e quindi assume nel tempo solo due possibili valori: un valore
   assume nel tempo tutti gli infiniti valori compresi tra il suo valore
                                                                              “basso” che corrisponde a “0” ed un valore “alto” che corrisponde ad
                   minimo ed il suo valore massimo
                                                                                              “1”, discriminati da un valore di soglia

                 Copia di un segnale analogico                                                    Copia di un segnale digitale

                     Mai identica rispetto all’originale                                             Quasi identica rispetto all’origina le
                   (nonostante l’impianto sia professionle)                                       (nonostante il degrado) ma sempre leggibile
                        Degrado del contenuto audio
                                                                       vantaggi                                  come “0” e “1”
                       (ogni volta che si fa una copia)                                                     Replicabilità illimitata
Sistemi e applicazioni per
Rappresentazione “digitale” dei documenti di testo (1-4)                                                                                            l’amministrazione digitale
                                                                          I documenti di testo
                                                             sono principalmente costituiti da caratteri:
                                                                 la loro rappresentazione «digitale»
                                                                       all’interno del computer
                                                       è strettamente legata ai caratteri di cui sono composti
                                                                         Ciascun carattere
                                                          viene rappresentato come una sequenza di bit:
                                                      l’associazione tra un carattere e la sequenza di bit che
                                                         lo rappresenta viene stabilita da uno dei diversi
                                                              sistemi di codifica dei carattere in uso

                                                                       Sistema di codifica dei caratteri (charset)
                                                                           (“character encoding” codifica di carattere)
                                                        E’ un meccanismo che associa a ciascun carattere di un determinato
                                                       repertorio (character repertoire) una determinata codifica (ad esempio,
                                                       un numero naturale, una sequenza di bit, una combinazione di punti e
                                                                  linee, etc.) che ne costituisce la rappresentazione

                                                 carattere             punto di codice                                                                  codifica
                                               (character)                (code point)                                                                  (encoding)

                                                                                                              codifica di carattere
                                                                 A

                                                                                                               (character code)
                                                                                             U+0041                                       11001011
   Associazione tra carattere e codifica                                                                                                                                 Associazione tra carattere e codifica
                   Fase 1                                                                                                                                                               Fase 2
                                                                                         U+0065
   Gli elementi del repertorio di caratteri                      B                                                                              11001011
                                                                                                                                                                     attraverso la codifica di carattere (character
 vengono associati a dei numeri interi non                                                                                                                              encoding) a ciascun punto di codice è
 negativi detti punti di codice (code point)                                                                                             11001011                        associata una determinata codifica
                                                             C                             U+0065

                                                      repertorio di caratteri   insieme dei punti di codice                           insieme delle codifiche
                                                      (character repertoire)         (code point set)                                       (encoding)
Sistemi e applicazioni per
Rappresentazione “digitale” dei documenti di testo (2-4)                                                                                 l’amministrazione digitale

                                                        La codifica di carattere ASCII standard (ISO 646)
               (American Standard Code for Information Interchange - codifica americana standard per l’interscambio delle informazioni)

                                                                                   Utilizza 7 bit per rappresentare ciascun
   Nata nel 1963 è stata per tantissimi anni la                                     carattere (128 informazioni diverse).
                                                                                                                                              Essendo stata concepita in America, la
  principale codifica utilizzata nei calcolatori.                                  Scelta per rappresentare tutte le lettere                tabella ASCII standard non comprende le
      Nel 1965 venne ufficializzata come                                           dell’alfabeto anglosassone (minuscole/                   lettere accentate (sconosciute nella lingua
     codifica US-ASCII o ASCII standard.                                       maiuscole (52), numeri (da 0 fino a 9), segni                                  inglese)
                                                                               di interpunzione e vari, altri caratteri speciali
     Nel 1972 divenne lo standard ISO 646                                              ($, &, %, @, #, etc.) e numerosi
                                                                                             caratteri di controllo

  car.   codep.   codifica   car.   codep.   codifica   car.   codep.   codifica   car.   codep.   codifica           I code point da 0 a 31 (venivano utilizzati in passato
  NUL      0      0000000    SP      32      0100000    @       64      1000000     `      96      1100000            per le telescriventi e le stampanti ) e code point 127
  SOH      1                  !      33                 A       65                  a      97
                                                                                                                                   (comando di eliminazione)
                  0000001                    0100001                    1000001                    1100001
  STX      2      0000010     "      34      0100010    B       66      1000010     b      98      1100010
  ETX
  EOT
           3
           4
                  0000011
                  0000100
                              #
                              $
                                     35
                                     36
                                             0100011
                                             0100100
                                                        C
                                                        D
                                                                67
                                                                68
                                                                        1000011
                                                                        1000100
                                                                                    c
                                                                                    d
                                                                                           99
                                                                                           100
                                                                                                   1100011
                                                                                                   1100100                        sono caratteri non stampabili
  ENQ
  ACK
           5
           6
                  0000101
                  0000110
                             %
                             &
                                     37
                                     38
                                             0100101
                                             0100110
                                                        E
                                                        F
                                                                69
                                                                70
                                                                        1000101
                                                                        1000110
                                                                                    e
                                                                                    f
                                                                                           101
                                                                                           102
                                                                                                   1100101
                                                                                                   1100110                    e sono denominati codici di controllo
  BEL      7      0000111     ‘      39      0100111    G       71      1000111     g      103     1100111
   BS      8      0001000     (      40      0101000    H       72      1001000     h      104     1101000
   HT
   LF
           9
          10
                  0001001
                  0001010
                              )
                              *
                                     41
                                     42
                                             0101001
                                             0101010
                                                        I
                                                        J
                                                                73
                                                                74
                                                                        1001001
                                                                        1001010
                                                                                    i
                                                                                    j
                                                                                           105
                                                                                           106
                                                                                                   1101001
                                                                                                   1101010
                                                                                                                       I code point dal 32 al 126 sono caratteri stampabili
   VT
   FF
          11
          12
                  0001011
                  0001100
                              +
                              ,
                                     43
                                     44
                                             0101011
                                             0101100
                                                        K
                                                        L
                                                                75
                                                                76
                                                                        1001011
                                                                        1001100
                                                                                    k
                                                                                    l
                                                                                           107
                                                                                           108
                                                                                                   1101011
                                                                                                   1101100
                                                                                                                         In totale i caratteri ASCII stampabili sono 95
   CR     13      0001101     -      45      0101101    M       77      1001101     m      109     1101101
   SO     14      0001110     .      46      0101110    N       78      1001110     n      110     1101110
    SI    15      0001111     /      47      0101111    O       79      1001111     o      111     1101111      i       n       f       o       r       m       a       t        i      c       a
  DLE     16      0010000    0       48      0110000    P       80      1010000     p      112     1110000    1101001 1101110 1100110 1101111 1110010 1101101 1100001 1110100 1101001 1100011 1100001
  DC1     17      0010001    1       49      0110001    Q       81      1010001     q      113     1110001
  DC2     18      0010010    2       50      0110010    R       82      1010010     r      114     1110010
  DC3     19      0010011    3       51      0110011    S       83      1010011     s      115     1110011
  DC4
  NAK
          20
          21
                  0010100
                  0010101
                             4
                             5
                                     52
                                     53
                                             0110100
                                             0110101
                                                        T
                                                        U
                                                                84
                                                                85
                                                                        1010100
                                                                        1010101
                                                                                    t
                                                                                    u
                                                                                           116
                                                                                           117
                                                                                                   1110100
                                                                                                   1110101
                                                                                                                      Il sistema di posta elettronica e il sistema dei nomi
  SYN
  ETB
          22      0010110    6
                             7
                                     54      0110110    V
                                                        W
                                                                86      1010110     v
                                                                                    w
                                                                                           118     1110110            di dominio (Domain Name System, DNS), si basano
          23      0010111            55      0110111            87      1010111            119     1110111
  CAN     24      0011000    8       56      0111000    X       88      1011000     x      120     1111000                  ancor oggi sulla codifica ASCII standard.
  EM      25      0011001    9       57      0111001    Y       89      1011001     y      121     1111001
  SUB     26      0011010     :      58      0111010    Z       90      1011010     z      122     1111010             Per questo motivo non sono possibili indirizzi di
  ESC     27      0011011     ;      59      0111011    [       91      1011011     {      123     1111011
   FS     28      0011100    <       60      0111100    \       92      1011100     |      124     1111100             posta elettronica né nomi di dominio contenenti
   GS                        =                          ]                           }
          29                         61                         93                         125
                                                                                                                             lettere accentate (es. www.università.it)
                  0011101                    0111101                    1011101                    1111101
   RS     30      0011110    >       62      0111110    ^       94      1011110     ~      126     1111110
   US     31      0011111    ?       63      0111111    _       95      1011111    DEL     127     1111111
Sistemi e applicazioni per
Rappresentazione “digitale” dei documenti di testo (3-4)                                                              l’amministrazione digitale

                                          Famiglia delle codifiche di carattere ASCII estese
    (extended ASCII o high ASCII - nate per compensare i limiti della codifica ASCII standard -solo 95 caratteri stampabili- che non era
                       sufficiente per rappresentare caratteri presenti in altre lingue che utilizzano l’alfabeto latino)

                                                                                                                      Lo standard ISO 8859 prevede 15 diverse
                                                                                                                     estensioni, comprese quelle per gli alfabeti
                                                            Considerata l’estrema varietà e numerosità
                                                                                                                    diversi dal latino, ma esistono anche ulteriori
    Utilizza 8 bit per rappresentare ciascun                dei caratteri specifici di ogni linguaggio, i
                                                                                                                    estensioni non riconosciute dall’ISO e create
      carattere (256 informazioni diverse)                   nuovi 128 code point disponibili furono
                                                                                                                     per esempio dalla Microsoft per i computer
    permettendo di aggiungere ulteriori 128                 utilizzati in maniera diversa da ogni Paese
                                                                                                                    con sistemi operativi Windows o dalla Apple
 caratteri rispetto alla codifica ASCII standard             dando origine a diverse codifiche ASCII
                                                                                                                          per i propri computer Macintosh.
                                                                               estese
                                                                                                                      Queste codifiche proprietarie prendono il
                                                                                                                                  nome di code page

                 Estensioni proprietarie e “codepage”                                                            Codifiche ISO/IEC 8859
           (Introdotti nei mini-computer e mainframe delle università)                  L’ISO ha sviluppato anch’essa una famiglia di codifiche (a 8 bit – 256
                                                                                              caratteri) di carattere ASCII estese denominata ISO 8859.
     IBM introdusse dei codici ASCII estesi (a 8 bit – 256 caratteri)
              chiamandoli set di caratteri code page (CP)                               I primi 128 caratteri corrispondono a quelli dell’ASCII standard (ISO
                    e diversificandoli con numeri.                                      646); gli altri 128 variano in base alla sottocodifica dell’8859 utilizzata.
                             Ricordiamo:                                                 Lo standard non è quindi unico ma è suddiviso in più parti separate
                                                                                           (ISO/IEC 8859-1, ISO/IEC 8859-2, etc.), ognuna delle quali può
    il CP 437 utilizzato nei primi PC IBM e nel sistema op. MS-DOS                           informalmente essere pensata come uno standard autonomo.
           il CP 850 utilizzato per le lingue europee occidentali                                 I code point da 128 a 159 sono caratteri di controllo
        il CP 1252 utilizzato di default dal sistema op. Windows                                  I code point da 160 a 255 sono caratteri addizionali

                                   - ISO 8859-1 Latin-1 Western European        - ISO 8859-9 Latin-5 Turkish
                                   - ISO 8859-2 Latin-2 Central European        - ISO 8859-10 Latin-6 Nordic (riarrangiamento dell’8859-4)
                                   - ISO 8859-3 Latin-3 South European          - ISO 8859-11 Latin/Thai
                                   - ISO 8859-4 Latin-4 North European          - ISO 8859-12 Latin/Devanagari (abbandonato)
                                   - ISO 8859-5 Latin/Cyrillic                  - ISO 8859-13 Latin-7 Baltic Rim
                                   - ISO 8859-6 Latin/Arabic                    - ISO 8859-14 Latin-8 Celtic
                                   - ISO 8859-7 Latin/Greek                     - ISO 8859-15 Latin-9 (revisione dell’8859-1)
                                   - ISO 8859-8 Latin/Hebrew                    - ISO 8859-16 Latin-10 South-Eastern European
Sistemi e applicazioni per
Rappresentazione “digitale” dei documenti di testo (4-4)                                           l’amministrazione digitale

                                                             La codifica Unicode
    (nata per compensare i limiti delle codifiche ISO 8859 (95 + 95 caratteri stampabili) che non sono sufficienti per rappresentare tutte le
     lingue del mondo ed uniformare lo scambio di e-mail e documenti tra paesi che utilizzano sistemi di codifica dei caratteri differenti)
 Nel 1986 standard ISO 2022 (poco utilizzato)
                                                     Il sistema di codifica dei caratteri           Nella codifica Unicode vi è una
    Nel 1993 ISO 10646 (UCS – Universal                                                       corrispondenza    univoca tra il carattere e il
                                                           introdotto con Unicode
                  Character Set)
                                                risolve in maniera definitiva il problema      code   point, ma  il code point può essere
   Nel 2002 (Unicode 3.2) codificava 95156        delle differenti codifiche di carattere.  codificato   in  una varietà di schemi diversi,
  caratteri differenti); nel 2006 (Unicode 5.0)                                             come   l’UTF-7,   l’UCS-2,   l’UCS-4, l’UTF-8 e
                                                Unicode non assegna a ciascun carattere una          l’UTF-16,   chiamati  formati di
  codificava oltre 100.000 caratteri differenti
                                                  codifica unica ma prevede che vi sia la    trasformazione od anche schemi di codifica
  Il 17 giugno 2015 si è giunti alla Unicode       possibilità di scelta fra più codifiche    (che utilizzano un numero di bit differenti)
     8.0 con ulteriori caratteri supportati

          Unicode prevede un totale di 1.114.112 code point (17 “piani” composti
          ciascuno da 216 code point) dei quali fino ad oggi ne sono stati assegnati
                                       circa 100.000

          I primi 256 code point di Unicode coincidono con quelli dell’ISO-8859-1
           e, pertanto, è assicurata una piena compatibilità sia con tale sistema di
                   codifica dei caratteri che con la codifica ASCII standard
Sistemi e applicazioni per
Rappresentazione “digitale” delle immagini (1-3)                                                             l’amministrazione digitale

                                       I formati per le immagini possono essere classificati
                            sulla base della tecnologia utilizzata per rappresentare l’immagine stessa.
                               Tre sono le principali categorie di formati: bitmap, vettoriali e ibridi
                                                                                                           Formati di tipo vector
                            Formati di tipo bitmap                                Gli elementi che costituiscono le immagini vengono descritti mediante
                                                                                figure geometriche quali punti, linee e curve;; tali figure geometriche sono
  Le immagini di tipo bitmap (o raster) organizzano le informazioni in una           definite attraverso formule matematiche che contengono tutte le
   griglia rettangolare (raster) di pixel (contrazione dei termini picture ed                       istruzioni necessarie per tracciarle
 element), ciascuno dei quali è rappresentato con un certo numero di bit a
            seconda dello spazio dei colori che si intende utilizzare              (es. per un segmento vengono memorizzate solo le coordinate del punto
                                                                                  iniziale e di quello finale, per un cerchio solo le coordinate del centro e la
     (bianco e nero, scala di grigi, colori a 16 bit, colori a 24 bit, etc.)                                   lunghezza del raggio).
 I pixel sono dei veri e propri elementi delle immagini e vengono disposti e                  La grafica vettoriale è orientata agli oggetti
                    colorati in modo da creare un motivo                          (ogni oggetto è composto da singoli elementi con precise proprietà).
                                                                                  Le immagini vettoriali sono scalabili (indipendenti dalla risoluzione)

                                                                 Formati di tipo ibrido
     Combinano i dati vettoriali e raster in un’unica immagine, consentendo di combinare i vantaggi sia dell’una che dell’altra tipologia di formato
Sistemi e applicazioni per
Rappresentazione “digitale” delle immagini (2-3)                                                                          l’amministrazione digitale

     Formati di tipo bitmap

                      La qualità di una immagine bitmap aumenta
               all’aumentare della risoluzione e della profondità di colore.
           Un’immagine con una dimensione di 600 × 800 ed una profondità di 8 bit
          (e quindi 28 = 256 possibili colori per ogni pixel) sarà meno fotorealistica di
             un’immagine della stessa dimensione ma con una profondità di 16 bit                                 Immagine bitmap in bianco e nero (1 bit)
                    (e quindi con 216 = 65.536 possibili colori per ogni pixel)

         Le immagini bitmap si prestano meglio alla visualizzazione su video, in
        quanto gli stessi monitor e televisori sono formati da una griglia di pixel.
      Le immagini bitmap possono essere ingrandite (a video o in stampa) soltanto
      ingrandendo la dimensione del pixel, che può in alcuni casi diventare visibile
              fino a mostrare la tipica struttura a mosaico (pixelizzazione).
        Per questo motivo i formati di tipo bitmap si dicono dipendenti dalla risoluzione

                          La dimensione delle immagini bitmap                                                        000000 011110 010010 011110 000000
             può essere misurata in termini di pixel orizzontali e verticali.
      Si definisce dimensione in pixel di un’immagine il prodotto tra il numero di
             pixel della base e il numero di pixel dell’altezza dell’immagine

                           Profondità del colore
                                                                     - 1 bpp, corrispondente a 21 = 2 colori (bianco e nero);
                   Si intende Il numero di bit che viene             - 3 bpp, corrispondente a 23 = 8 colori (scala di grigi a 8 livelli);
                  utilizzato per rappresentare il colore di          - 4 bpp, corrispondente a 24 = 16 colori (scala di grigi a 16 livelli o 16 colori);
                               ciascun pixel .                       - 8 bpp, corrispondente a 28 = 256 colori (scala di grigi a 256 livelli o 256 colori);
                                                                     - 16 bpp, corrispondente a 216 colori = 65.536 colori (highcolor);
                      Si misura in bit per pixel (bpp).              - 24 bpp, corrispondente a 224 = 16.777.216 colori (truecolor, circa 16 milioni di colori);
                                                                     - 32 bpp, corrispondente a 232 = 4.294.967.296 (circa 4 miliardi di sfumature diverse);
                  Aumentando la profondità del colore                - 48 bpp, corrispondente a 248 = 281.474.976.710.656 colori.
                    aumenta la qualità dell’immagine
Sistemi e applicazioni per
Rappresentazione “digitale” delle immagini (3-3)                                                     l’amministrazione digitale

                      Dimensione del file di immagine bitmap
                     dfile =dimensione in pixel × profondità di colore

                     Esempio di fotografia digitale a 8 Mpixel
               con profondità di colore a 24 bit (16 milioni di colori)
  dfile = 3264 × 2448 × 24 bit = 3264 × 2448 × 3 byte = 23.970.816 byte = 22,86 MiB

                                Formati compressi
                           riducono le dimensioni dei file
                         comprimendoli in modo opportuno

                                                      lossless (senza perdita di qualità) – tiff, gif, png
                                                      Salvano le immagini comprimendo la loro dimensione
                                                in maniera che nessun dato dell’immagine stessa venga trascurato.
                                                  Le immagini possono essere rielaborate anche migliaia di volte
                                                      senza che avvenga il minimo decadimento qualitativo.
                                                   La qualità dell’immagine rimane la stessa di quella originale

                                                              lossy (con perdita di qualità) - jpg
                                                      Salvano le immagini comprimendo la loro dimensione
                                         trascurando alcuni dettagli in modo da ridurre ulteriormente le dimensioni.
                                     Non è possibile riottenere esattamente l’immagine originale dall’immagine compressa.
                                            Le immagini compresse hanno una dimensione notevolmente inferiore
                                                           rispetto alle stesse immagini di tipo lossless
Sistemi e applicazioni per
Rappresentazione “digitale” dei contenuti video                                                      l’amministrazione digitale
                      Un contenuto video può essere considerato come una sequenza di immagini statiche,
                                 chiamate fotogrammi o frame, visualizzate in rapida successione.
                 Il numero di frame al secondo viene detto frame rate ed è misurato in fps (frame per second);
                  tale numero è variabile, ma si è visto che per ottenere la sensazione di un movimento fluido
                                             non si può scendere al di sotto dei 25 fps.
                                Il sistema PAL (utilizzato in Italia) prevede un frame rate di 25 fps
                        Il sistema NTSC (utilizzato in USA e Giappone) prevede un frame rate di 30 fps

                            Dimensione minima di un file video
 dfile =dimensione del singolo fotogramma × profondità di colore × frame rate × durata del video

 Esempio di video a 352 x 240 con profondità di colore a 24 bit (16 milioni di colori)
                        della durata di 1 ora con sistema PAL
        dfile = 352 × 240 × 24 bit = 352 × 240 × 3 byte = 247,5 KiB (1 frame)
                       d = 247,5 KiB × 25 B = 6,04 MiB (1 secondo)
                      d = 6,04 MiB × 3600 B = 21,24 GiB (1 ora)

                       Sono indispensabili delle tecniche di compressione dati
                             per poter elaborare le immagini prodotte

                                                            intraframe
                                   Eliminano i dati duplicati all’interno di uno stesso fotogramma
                                                                                                      MPEG2, MPEG4, DIVX,
                                                                                                        XVID, MKV etc.
                                                            interframe
                                     Eliminano i dati ripetuti presenti in fotogrammi successivi
Sistemi e applicazioni per
Rappresentazione “digitale” dei contenuti audio (1-3)                                             l’amministrazione digitale
             All’interno del computer i contenuti audio vengono rappresentati in formato digitale,
                                           ovvero come sequenze di bit.
                  La trasformazione di un segnale audio analogico in digitale (digitalizzazione)
                                 viene effettuata attraverso le due operazioni di
                              campionamento e quantizzazione (o discretizzazione).
             Queste due operazioni vengono realizzate da un dispositivo denominato convertitore
                     analogico digitale (Analogue to Digital Converter, ADC) o campionatore

                                        Processo di conversione analogico digitale

                              Il convertitore “scompone”” il segnale audio in molti pezzettini
                            (campioni) e ad ognuno viene attribuito un valore formato da una
                                                     sequenza di bit.
                           Tutti i bit sono immagazzinati su un supporto (es. CD) dal quale può
                                  essere fatto poi il processo inverso denominato playback
                          (il segnale digitale viene riconvertito in analogico mediante un convertitore digitale-
                                               analogico (Digital to Analogue Converter, DAC)
Sistemi e applicazioni per
Rappresentazione “digitale” dei contenuti audio (2-3)                                                       l’amministrazione digitale

                              Campionamento                                                                   Quantizzazione
     Permette di trasformare un segnale audio analogico tempo-continuo          La quantizzazione è il procedimento di conversione di un valore analogico
                  nel corrispondente segnale tempo-discreto.                        (infinitamente preciso) in un valore digitale (finitamente preciso),
    Questa fase consiste nel misurare o “campionare” il segnale analogico                              ovvero in una sequenza di bit.
         (che è di tipo tempo-continuo) ad istanti di tempo prefissati          Il numero di bit che viene utilizzato per rappresentare ciascun campione
    (generalmente equidistanziati) in modo da ottenere un segnale di tipo          viene definito risoluzione o profondità di suono e si misura in bit per
  tempo-discreto che assume lo stesso valore di quello originale nei punti di      campione (bpc); essa determina l’accuratezza con quale è effettuata
                               campionamento                                                         ciascuna misurazione o campione

         Il numero di volte che il segnale analogico è misurato                    Se il convertitore (ADC) mette a disposizione una risoluzione di 3 bit
 o “campionato” in un secondo viene detto frequenza di campionamento              avremo a disposizione 23 = 8 possibili configurazioni binarie (da 000 a
       (sample rate) e indica il numero di campioni per secondo.                 111) per rappresentare tutti i possibili livelli del segnale da digitalizzare.
       La frequenza di campionamento viene misurata in Hertz                        In questo modo si ottengono pochissimi valori per un segnale che,
                   (Hz, migliaia di cicli per secondo).                         invece, potrebbe possedere moltissime possibilità di variazione dinamica.
             All’aumentare della frequenza di campionamento                          Più aumentano i bit a disposizione e maggiore è la qualità audio.
     si ottiene una migliore approssimazione del segnale in ingresso                    Con 16 bit (molto in uso) si hanno 65.536 diversi livelli (216)
Sistemi e applicazioni per
Rappresentazione “digitale” dei contenuti audio (3-3)                                                     l’amministrazione digitale

                                                        Dimensione del file audio
                                dfile = frequenza di campionamento × risoluzione × numero dei canali × durata

                                     Esempio di registrazione audio digitale (mono) di 1 minuto,
                                     con frequenza di 8 kHz e risoluzione pari a 8 bit/campione
                                dfile = 8000 × 8 × 1 × 60 = 3.840.000 bit = 480.000 byte = 468,75 KiB

                                                      Bitrate (velocità del flusso di bit)
                                       E’ il numero di bit utilizzati nella codifica di un secondo di audio.
                                     E’ un parametro che fornisce una stima della qualità audio digitale.
                                È dato dal prodotto dei tre elementi frequenza di campionamento, risoluzione e
                                              numero di canali ed è espresso in bit per secondo (bps)

   Fattori che determinano la
          qualità audio

                          frequenza di campionamento
                          il numero di campioni per secondo
                 (es: 44.100 Hz, ovvero 44.100 campioni al secondo)                                              Frequenza di
                                                                                                                                Risoluzione
                                                                                                                                              Numero di
                                                                                                                campionamento                   canali
                                                                                             Qualità CD            44.100 Hz       16 bit       stereo
                             risoluzione o profondità                                        Qualità radio         22.050 Hz       16 bit       mono
                                                                                             Qualità telefono      11.025 Hz       16 bit       mono
                            la dimensione dei campioni
                              (es: 16 bit per campione)
                                                                                                                    WAVE
                                                                                               E’ il formato dei file audio prodotti mediante
                                il numero di canali                                                     i processi di campionamento e
                                                                                                               discretizzazione
                     1 = mono, 2 = stereo … Dolby 5.1 ed altri
“LA RAPPRESENTAZIONE DIGITALE
                                       DELLE INFORMAZIONI”
                                          Lezione n. 1 – parte seconda
                                          Mercoledì 30 settembre 2015

                                              luca.ricciotti@unimc.it

A.A. 2015-2016 - primo semestre biennio                                  Luca Ricciotti Phd
Puoi anche leggere