MP3 e il Mercato dell'Audio Digital Compression (ADC)

Pagina creata da Alberto Piccolo
 
CONTINUA A LEGGERE
MP3 e il Mercato dell'Audio Digital Compression (ADC)
MP3 e il Mercato dell’Audio
Digital Compression (ADC)

Domenico Luchetta, Fabrizio Milan, Luca Motta, Lorenzo Santilli, Chiara Franzoni

 Sintesi

La tramissione veloce di file audio in formato digitale è resa possibile dalla compressione dei dati
operata attraverso appositi algoritmi. Esistono diversi algoritmi alternativi, di cui alcuni standard,
sviluppati in momenti diversi e soggetti a regimi di proprietà intellettuale diversi. Il caso ripercorre le
tappe dello sviluppo del formato più popolare –l’MP3- i principali formati concorrenti e i regimi di
proprietà intellettuale a cui i diversi formati sono soggetti.

Parole chiave: Audio Digital Compression, standard, mercato della musica digitale, strategie di
licensing

Condizioni d’uso:

            Gli Innovation Studies Business Cases (ISBuC) sono materiale didattico creato nell’ambito
delle attività di ricerca dell’Innovation Studies Group del Politecnico di Torino e sono rilasciati sotto
una licenza Creative Commons 2.5 Italia, che consente a chiunque l’uso e la riproduzione libera e
illimitata, a condizione di mantenere il documento nella sua forma originale e garantire l’attribuzione
agli autori.
Gli ISBuC sono creati per finalità puramente didattiche. Le informazioni contenute nel presente
documento provengono da fonti pubblicamente accessibili e citate nel testo. Le informazioni
contenute possono essere imprecise, semplificate, incomplete o inaccurate. In nessun caso il
seguente documento deve essere inteso come materiale informativo o commerciale sulle istituzioni,
enti, imprese e società a cui si riferisce. Tutte le opinioni espresse sono quelle degli autori e non
necessariamente riflettono quelle dell’Innovation Studies Group o del Politecnico di Torino.
L’utilizzo del presente materiale costituisce condizione implicita di accettazione delle suddette
condizioni. Gli autori declinano ogni responsabilità per usi distorti delle informazioni, o comunque
diversi da quello didattico.
Download, informazioni e condizioni d’uso: http://www.is.polito.it/business_cases.html

Prima pubblicazione: Febbraio 2008
ISBuC Innovation Studies Business Cases

MP3 e il Mercato dell’ADC

MP3 e il Mercato dell’Audio Digital Compression
(ADC)

La storia

    Il 14 luglio 1995, Jürgen Zeller, in seguito ad una votazione realizzata all’interno del
    suo gruppo di lavoro al Fraunhofer Institute, lancia quest’annuncio a tutti i suoi
    colleghi:

    Date: Fri, 14Jul1995 12:29:49 +0200
    Subject: Layer3 file extension: .mp3
    Hi all,
    this is the overwhelming result of our poll:everyone voted for .mp3 as extension for
    ISO MPEG Audio Layer 3!
    As a consequence, everyone please mind that for WWW pages, shareware,demos, and
    so on, the .bit extension is not to be used anymore.
    There is a reason for that, believe me :-)
    Jürgen Zeller

    L’annuncio del battesimo ufficiale della nuova tecnologia, in seguito destinata ad
    acquisire enorme popolarità nel mondo di internet, arriva al termine di anni di lavoro
    sui formati di compressione audio, condotti all’interno dei consorzi di ricerca MPEG.

    Il successo e la diffusione dei formati di compressione, di cui l’MP3 è in assoluto il più
    diffuso, sono stati l’antefatto fondamentale per consentire la diffusione prima di
    musica, e immagini e poi di video e delle loro combinazioni attraverso la rete, e hanno
    rappresentato quindi la tecnologia abilitante alla base del commercio digitale di media e
    dell’industria creativa, del peer-to-peer, del voip e di altri mercati emergenti fra le
    applicazioni basate su internet.

    La necessità di comprimere file molto lunghi era apparsa subito come un problema
    tecnologico cruciale a cominciare dall’ambito informatico, in cui era necessario salvare
    programmi di dimensioni molto grandi rispetto alla capienza delle memorie in uso. Con
    lo sviluppo della telematica e la trasmissione a distanza dei file, divenne fortissima
    l'esigenza di trasmettere in tempi brevi le immagini, dapprima fisse e poi in
    movimento; e poiché un'immagine richiede una grande quantità di bit per essere
    codificata e molto tempo per essere trasmessa, si pensò alla compressione come al
    modo più opportuno per risolvere il problema.

    Per quanto riguarda le immagini, l'International Standard Organization (ISO), l'ente
    internazionale che fissa gli standard industriali a livello mondiale, aveva istituito un
    gruppo di lavoro denominato JPEG (Joint Photographic Expert Group) con il compito di
    definire un formato europeo di digitalizzazione, compressione e decompressione di
    immagini fotografiche, che aveva dato luogo allo standard JPEG, tuttora usato
principalmente per le foto, con risultati in termini di compressione superiori al formato
GIF. Nel 1987 i governi europei manifestarono la ferma volontà di ripetere l’iniziativa
per quanto riguardava la compressione di formati audio e video, promuovendo la
costituzione di un progetto EUREKA. Le iniziative EUREKA, nate nel corso di una
Conferenza Ministeriale fra l'allora Comunità Europea e 17 Paesi dell'Europa
Occidentale tenutasi a Parigi il 17 luglio del 1985, sono consorzi di ricerca finanziati a
livello comunitario espressamente volti ad accrescere la produttività e la competitività
dell'economia e dell'industria europea sul mercato civile mondiale, tramite la
promozione di progetti di R&S. Basate sul principio bottom-up, le iniziative EUREKA
offrono tipicamente ai partecipanti la possibilità di indirizzare i progetti orientati al
mercato nella direzione delle proprie esigenze, con motivazioni di carattere
commerciale e tecnologico. Raccogliendo l’invito dei governi europei, nel 1987, i gruppi
pubblici e privati maggiormente impegnati nella ricerca sulle trasmissioni digitali audio
(broadcasters, gestori di reti, imprese di elettronica di consumo e istutiti di ricerca) si
allearono in un consorzio dando vita al Progetto EUREKA EU-147, chiamato “Digital
Audio Broadcasting” o “DAB”. Fra gli interessati alla compressione digitale audio, si
contavano grandi società europee come AEG, Bosch, Phillips e Thompson, oltre
all'Università di Erlangen-Nuremberg ed al Fraunhofer Institute. Il team di ricerca del
Fraunhofer (Fraunhofer IIS), condotto dal Prof Heinz Gerhäuser, utilizzando l’algoritmo
LC-ATC (Low Complexity Adaptive Transform Coding) come base per le ricerche,
cominciò a costruire un codec real-time funzionante utilizzando diversi Digital Signal
Processors (DSPs). Fino a quel momento infatti, LC-ATC esisteva solo in fase di
simulazione e non poteva essere testato accuratamente. Nel 1989 Karlheinz
Brandenburg, un dottorando dell’università di Erlangen-Nuremberg, completò
l’algoritmo OCF (Optimum Coding in (the) Frequency Domain), descritto da Fraunhofer
come padre di molte delle caratteristiche del futuro codificatore MP3. OCF analizzava e
rimuoveva i suoni al di sotto o al di sopra della soglia dell’udito umano.

Nel 1989 vennero diffuse le prime specifiche del futuro standard, note come
International Standard IS0 11172, con la sigla in breve Mpeg-1. Queste specifiche
includevano anche il trattamento dell’audio, inteso come parte naturalemente
complementare alle registrazioni video. Poco tempo dopo comparvero sul mercato le
prime implementazioni pratiche della compressione audio. Nel 1991, incorporando i
contributi provenienti da Università di Hannover, AT&T, e Thomson, il team di
Fraunhofer migliorò l'algoritmo di OCF producendo un nuovo e più potente codificatore
audio, chiamato ASPEC (Adaptive Spectral Perceptual Entropy Coding). ASPEC venne
candidato per la codifica audio del futuro standard MPEG. ISO in totale ricevette 14
proposte ed incoraggiò i partecipanti ad unire e potenziare i loro contributi, che
terminarono in quattro proposte consorziate. Fra questi, ISO scelse come tecnologie
migliori ASPEC e MUSICAM (con MUSICAM in leggero vantaggio) e le invitò ad unirsi
per creare una famiglia di tre schemi di codificazione, dove il Layer 1 era una variante
di complessità bassa di MUSICAM, il Layer 2 era una versione ottimizzata di MUSICAM
ed il Layer 3 era basato principalmente su ASPEC. A causa della sua complessità più
bassa, DAB scelse il Layer 2 come configurazione audio per i suoi servizi di
radiodiffusione audio digitali. Anche se la complessità di ASPEC era più alta, i
codificatori offrivano la massima efficienza di codifica e divennero perciò candidati
naturali per il trasporto della voce ad alta qualità sulle linee telefoniche ISDN.

Nel 1992 l'ISO pubblicò le specifiche audio di Mpeg-1 (11172-3): in cui sono previsti
tre diversi algoritmi di compressione e decompressione dei segnale, detti Layer:

         Layer 1 con fattore di compressione 4:1
         Layer 2 con fattore di compressione compreso tra 6:1 e 8:1
         Layer 3 con fattore di compressione compreso tra 12:1 e 14:1

I tre Layer sono compatibili fall-back, ossia un decoder Layer 3 è in grado di "leggere"
anche file codificati con Layer 1 e Layer 2, e un Layer 2 può "leggere" file Layer 1. Dal
1993 in poi l’MP3 (MPEG-1/MPEG-2 Layer 3) diventa uno standard ISO.

                                               2
Nel 1997 diventa operativo l'International Standard 1S0 13818, detto Mpeg-2,
   anch'esso diviso in tre Layer, e che presenta, rispetto alla release precedente,
   significative innovazioni. Per quanto riguarda l'audio, la novità consisteva nel fatto che
   la codifica non era più effettuata a partire dai due canali stereo tradizionali destro e
   sinistro, ma diventava multicanale, per consentire l'implementazione dell'Home
   Cinema, versione domestica dei Dolby Stereo cinematografico, che richiede 5+1 canali:
   anteriore destro, anteriore centrale, anteriore sinistro, posteriore sinistro e destro per
   gli effetti speciali, più un canale dedicato al subwoofer per la riproduzione dei bassi.
   Una seconda novità riguardava la frequenza di campionamento dei segnali, che veniva
   abbassata da 44,1 KHz a 24 KHz. In questo modo gli algoritmi di compressione e
   decompressione si semplificano notevolmente, a tutto vantaggio della velocità di
   trasmissione dei file compressi, seppur al prezzo di una piccola perdita in fedeltà
   dell’audio.

   In seguito, nel 2001 verrà introdotta una nuova versione della tecnologia, MP3 Pro, in
   grado di memorizzare il doppio delle canzoni rispetto a MP3 a parità di qualità
   percepita, offrendo inoltre il supporto per il DRM (Digital Right Management) ed
   accogliendo così le richieste delle case discografiche. Nel 2004 infine verrà lanciato MP3
   Surround, che aggiunge il supporto al suono surround multicanale.

   Il Layer 3, successivamente denominato MP3, si rivelò straordinariamente adatto per
   far viaggiare file musicali su canali di trasmissione a capacità limitata, e quindi lenti,
   come quelli Internet. In assenza di compressione, i segnali audio di qualità pari a quella
   di un CD (risoluzione a 16-bit) sono registrati con una frequenza di campionamento di
   44.1 kHz al secondo. In questa forma, una canzione di tre minuti richiederebbe molte
   ore di connessione, per essere trasferita interamente. A seguito della compressione, il
   trasferimento, anche su banda relativamente limitata, può avvenire in pochi aminuti.

   Per poter operare una simile compressione, il formato MP3 si basa su un concetto
   semplice: filtrare un brano musicale digitale ed eliminare tutte le informazioni non
   necessarie riducendo in questo modo lo spazio. L'orecchio umano è infatti uno
   strumento dal funzionamento pressocchè perfetto, ma soggetto ad una serie di limiti,
   evidenziati dagli studi preliminari sulla percezione umana. Sebbene la banda passante
   dell'orecchio umano percepisce frequenze che si estendono dai 20 Hz ai 20.000,
   l’orecchio risulta dispoporzionatamente sensibile alla gamma media dei suoni, dai 700
   ai 6.000 Hz, da cui estrae la maggioranza delle percezioni uditive. Oltre alla percezione
   uditiva, gli studi di psicoacustica rivelarono che l’orecchio umano è soggetto a
   mascheramento, ossia alla sovrapposizione di suoni deboli con suoni forti. Nei casi in
   cui il suono più alto copre totalmente quello più basso, ad esempio nelle composizioni
   musicali in cui più strumenti differenti si sovrappongano tra loro, una parte delle
   informazioni risulta quindi sostanzialemnte superflua. Nella compressione MP3, lo
   studio del mascheramento permette di eliminare le informazioni dei suoni più deboli,
   che, non venendo comunque percepite dall'orecchio, risulterebbero praticamente
   ininfluenti e quindi inutilmente dispendiose in termini di spazio occupato in memoria.
   L’effetto collaterale di questo aspetto e’ che la compressione di file comporta quindi una
   perdita di informaizoni, che la rende irreversibile.

Thomson e la guerra degli algoritmi di compressione

   A partire dal 1991, il Fraunhofer Institute aveva cominciato a brevettare un processo di
   codifica digitale per segnali audio. Nel corso del progetto EUREKA, diverse tecnologie
   complementari e sostitute vennero brevettate dai partner del progetto. Per evitare
   problemi di infringement e in previsione del processo di standardizzazione, AT&T e
   Fraunhofer firmarono un accordo di ricerca congiunto, che regolava i potenziali conflitti
   di proprietà intellettuale [1]. Parallelamente si fece strada l’idea che sarebbe stato
   opportuno raggruppare i brevetti fondamentali per svolgere le operazioni di codifica e
                                                  3
decodifica ed includerli in un unico patent pool da licenziare eventualmente in soluzione
unica.

Quest’idea fu raccolta e promossa da Thomson, che avviò una serie di investimenti
specifici, quando ancora il valore delle tecnologie sviluppate era tutt’altro che chiaro.
Attorno al 1995, Thomson cominciò a brevettare alcuni processi e componenti, frutto
delle sue attività di ricerca nel gruppo del Fraunhofer. Fra le tecnologie sviluppate nel
progetto EUREKA che risultarono preferite e vennero pertanto incluse nello standard
ISO, un numero cospicuo erano di proprietà del Fraunhofer Institute. Di conseguenza,
Thomson stipulò una serie di contratti che le riservavano la gestione in esclusiva dei
brevetti sulle tecnologie di compressione dal Fraunhofer, che intendeva sfruttare sul
mercato di massa. In seguito aggiunse al portafoglio anche i diritti allo sfruttamento
delle licenze dei brevetti dello svedese Coding Technologies (co-inventori di mp3 Pro)
e di Agere Systems (co-inventore di mp3 Surround), raggruppando il gruppo più
cospicuo di brevetti dell’MP3. Nel frattempo, il formato MP3 si stava diffondendo
rapidamente e veniva licenziato fra gli altri da clienti illustri quali Apple, Microsoft, Intel,
Samsung e Siemens. Nel 1998, alla vigilia della rivoluzione digitale e dell’esplosione del
mercato della musica portatile, Thomson licenziò alla statunitense RIO e alla coreana
Saehan Information Systems il pacchetto di brevetti per la codifica MP3, che venne
inclusa rispettivamente nel Diamond Multimedia e nell’MpMan, i primi lettori portatili di
MP3 (Figura 1). Questi lettori furono i primi ad adottare memorie flash rigide per
archiviare e riprodurre file musicali compressi, scaricati da internet o convertiti dalle
tracce CD. Nel 2000 saranno poi lanciati i lettori portatili di tracce MP3 masterizzate su
CD. I concorrenti che nel frattempo stavano entrando nel mercato dei lettori di musica
digitale dovettero in qualche modo garantire la compatibilità con il formato MP3.

Il portafoglio gestito da Thomson comprende tre tipologie di brevetti: la prima tipologia
riguarda la codifica in digitale di un segnale audio (o di un insieme di segnali audio da
più canali); la seconda tipologia comprende le tecniche di riduzione del rumore e dei
disturbi, mentre la terza tipologia riguarda la compressione dei campioni prodotti, la
loro trasmissione, la decodifica e l’eventuale correzione degli errori. Nel complesso i
brevetti definiscono un insieme di algoritmi e processi fra loro complementari, ma non
necessariamente completi. Ci sono infatti altri portafogli di brevetti non inclusi nel pool
licenziato da Thomson, che riguardano tuttavia tecnologie in tutto o in parte
complementari. Questi brevetti sono posseduti da altre aziende, tra le quali vanno
segnalate soprattutto l’italiana Sisvel S.p.A. e la multinazionale francese Alcatel-Lucent,
mentre altre imprese come France Telecom , AT&T e Phillips detengono alcuni brevetti
minori, che tipicamente concedono in gestione a una delle due precedenti.

Mentre Thomson licenzia i brevetti relativi alle metodologie da applicare per la
manipolazione dei segnali audio, aziende come la Sisvel S.p.A. detengono brevetti
relativi ai dispositivi che realizzano questi algoritmi, riportando degli schemi funzionali
di circuiti elettronici per il filtraggio di segnali. Alcune particolarità dei circuiti descritti
nei brevetti di Sisvel permettono anche di realizzare determinate specifiche richieste
dall’ISO per la realizzazione del formato MPEG-1 (o MP3). Per alcuni tipi di operazioni, i
brevetti di Thomson, Alcatel/Lucent e Sisvel potrebbero pertanto dover essere
impiegati in modo congiunto e complementare. Ad esempio, le aziende che producono
dispositivi di riproduzione dei file in formato MP3, possono essere esposte al rischio di
infringement, se licenziano solo i brevetti di Thomson, ma non quelli di Alcatel/Lucent e
Sisval, per quanto concerne l’utilizzo dei blocchi funzionali nella codifica o decodifica dei
file in formato MP3. La recente battaglia legale di Alcatel-Lucent contro Microsoft per la
presunta violazione dei brevetti di Alcatel-Lucent [2] [4] nella Consolle XBox 360 offre
un esempio recente di questo potenziale problema.

La strategia di licensing di Thomson dipende dalla tipologia d’uso che viene richiesta
per il formato MP3: politiche diverse vengono applicate per l’utilizzo software e
hardware, per il mercato dei giochi e per quello della musica digitale. Per quanto
riguarda il software, si applicano royalty di 0.75$ per unità di decodificatore prodotta e
2.50$/5.00$ per unità di codificatore. Le tariffe per l’hardware sono simili, con la

                                                  4
differenza che, nel caso dei codificatori, il prezzo per unità scende a 1.75$. Per quanto
riguarda i giochi, le cifre sono uniformate a 2.500$ a titolo, includendo quindi sia la
parte di decodifica che la parte di codifica (che spesso non è distribuita perchè i
campioni audio vengono in gran parte riprodotti e raramente sono codificati durante
l’esecuzione). Per quanto riguarda il mercato della distribuzione di musica in formato
elettronico, le royalty sono fissate in percentuale sulle vendite e si aggirano attorno al
2.0% del prezzo. Nel 2007 si contavano oltre 470 licenze MP3 attive nel mondo,
incluso Microsoft per i software, NEC Corporation, Nokia e Motorola, per i dispositivi
hardware. Fra i licenziatari compaiono anche aziende apparentemente non collegate
con il mercato dell’audio, ad esempio Bloomberg o Reuters LCC, che, verosimilmente,
sfruttano la compressione audio MPEG-1 per le loro trasmissioni.

Attirate dal successo del formato di codifica audio MP3 e dalle enormi potenzialità in
termini di profitto per chi ne deteneva la proprietà intellettuale, molte imprese operanti
nel settore dell’informatica o dell’elettronica di consumo hanno studiato e messo a
punto formati e algoritmi di compressione concorrenti, i quali sono in grado di produrre
risultati complessivamente comparabili, sia in termini di bit-rate di codifica, che in
termini di qualità audio percepita. I principali formati concorrenti dell’MP3 sono:
Windows Media Audio (WMA), Advanced Audio Coding (AAC) e Ogg Vorbis (OGG).
Ciascuno di questi è gestito secondo una diversa politica di sfruttamento della proprietà
intellettuale. Il primo è un formato completamente proprietario; il secondo è il risultato
di un patent-pooling cui hanno partecipato diversi attori e che ancora oggi permette di
entrare nel gruppo dei depositari; l’ultimo è completamente libero, aperto e non
brevettato.

Windows Media Audio (WMA)

Realizzato da Microsoft alla fine degli Anni 90 per l’utilizzo nel suo sistema operativo,
ha avuto uno sviluppo improntato alla diffusione nel mercato dei negozi on-line di
musica e per questo motivo oltre ad integrare 2 codec (uno lossy e uno lossless) è
predisposto per la compatibilità con un sistema di Digital Rigths Management (DRM),
particolarmente utile ai distributori di musica in rete e contenuti in streaming. La
protezione DRM di WMA, ad esempio per la fruizione di file musicali provenienti dalla
rete, si ottiene includendo il file WMA all’interno di un file Advanced Systems Format
(ASF, sempre proprietario Microsoft), ossia un contenitore di file multimediali, utilizzato
principalmente per lo streaming, il quale a sua volta contiene il servizio DRM per
dispositivi portatili denominato Janus. Inizialmente l’uso di questo servizio
presupponeva che il dispositivo non supportasse formati di codifica alternativi a quelli
utilizzati in Windows, come l’Ogg Vorbis, restrizione che è stata poi eliminata in seguito
ad una disputa legale in merito a questioni di anti-trust. Attualmente questo sistema di
regolazione dei DRM è molto diffuso tra i lettori portatili di file audio, ma anche su
alcune piattaforme che prevedono l’esecuzione di brani musicali in streaming che il
distributore desidera rilasciare in forma protetta. Gli utilizzatori di questo formato
comprendono [5]:

    1. Online Music Stores: MSN music, Wal-Mart Music Downloads, CinemaNow,
       Napster, Musicmatch

    2. Venditori di contenuti multimediali: America Online, Disney

    3. Produttori di lettori di musica digitale: Creative, Dell, iRiver, Rio, Samsung

    4. Produttori di chip: BridgeCo AG, Equator Technologies Inc., Imagination
       Technologies, Micronas, Motorola Inc., Sigma Designs Inc. and SigmaTel Inc.

I codec WMA e il lettore Windows Media Player che legge sia questo formato che l’MP3
sono incorporati nel pacchetto Windows. A differenza del formato MP3, in cui i brevetti
fondamentali sono assegnati a diverse imprese, il formato WMA è completamente

                                               5
proprietario Microsoft, la quale ne detiene i brevetti negli Stati Uniti e in Europa, e per
questo motivo chiunque desideri avvalersi di un qualsiasi tipo di implementazione
(hardware, software, o anche semplicemente in streaming) deve sottoscrivere una
licenza di accordo con (e solo con) la multinazionale americana. L’accordo può essere
stipulato in diverse modalità, distinguendo fra imprese che intendono integrare la
tecnologia di compressione audio in prodotti intermedi (interim), cioè in componenti
hardware come processori DSP (Digital Signal Processor) o applicazioni software che
verranno vendute e andranno poi a completare prodotti finali più complessi, e quelle
che invece producono dispositivi o applicazioni che verranno direttamente venduti sul
mercato finale. Nel primo caso, le licenze prevedono somme fisse: 10,000$, per la
concessione del codice sorgente per il codificatore audio WMA e tutta la
documentazione, incluse le librerie, il decodificatore vocale ed il codice per
l’incapsulamento nel contenitore ASF. Per quanto riguarda i decodificatori, una licenza
costa 5,000$. Il DRM comporta un costo aggiuntivo di 15,000$ per dispositivi portatili e
10,000 per apparati di rete, ricevitori e trasmettitori.
 Nel caso invece della vendita di prodotti finali, si applicano royalties in proporzione
 diversa a seconda che il dispositivo sia un encoder o un decoder e le royalty crescono
 con il numero di canali utilizzati per la diffusione audio. Ad esempio, per un dispositivo
 con al massimo 2 canali si chiedono 0,10$ per decodificatore, fino a un massimo di
 400,000$ annui per sistemi embedded e 20,000$ per software non-basati su
 Windows. Per i codificatori la cifra unitaria è di 0,20$, quella annuale massima è di
 800,000$ e quella per il software non-Windows di 200,000$. Nel caso invece di
 decodificatore/codificatore si ha applica una royalty unica di 0,25$, fino a un massimo
 di 1,000,000$ per dispositivi o 210,000$ per software non-Windows. Infine per
 integrare il DRM su prodotti di consumo si versa per ogni unità venduta una cifra di
 0,10$ con acquisizione di licenza indiretta, 0,20$ con licenza diretta e di 0,05$ per
 apparati di rete, ricevitori e trasmettitori.

Advanced Audio Coding (AAC)

L’AAC asce con l’intento di superare e migliorare l’MP3, viene sviluppato grazie al
contributo di numerose aziende tra cui Dolby, Fraunhofer, AT&T, Sony e Nokia e
rappresenta un’evoluzione dell’MP3 stesso. Ha incontrato una notevole diffusione,
soprattutto grazie al legame con Apple, che ha deciso di inserirlo nella piattaforma
audio QuickTime e di utilizzarlo come formato audio unico per il suo lettore musicale I-
Pod e per la vendita di file musicali su i-Tunes. Questi file sono normalmente rilasciati
da Apple sotto un particolare meccanismo di gestione dei diritti d’autore, denominato
FairPlay, che li rende tali da poter essere letti solamente dai decodificatori di Apple.
L’acquirente può chedere il rilascio di file privi da questo vincolo pagando una somma
supplementare di 0,30$ per unità.
L’AAC è uno standard ISO dal 2005 ed è noto indifferentemente come MPEG-2 Part 7 o
MPEG-4 Part 3, ma è denominato comunemente MPEG-4 AAC. Il pacchetto di brevetti
che lo contiene è un patent-pooling, a cui aderiscono diverse compagnie e che ancora
oggi permette a chiunque di aggiungere eventuali parti, previa verifica tecnica (di
essenzialità) da parte di un’apposita commissione e previo versamento di una quota
fissa di partecipazione al pooling di 8,000$, più eventuali partecipazioni ai costi
comuni. Il pooling è gestito da gestito da Via Licensing, una sussidiaria indipendente di
Dolby Laboratories, gestione di diritti della proprietà intellettuale.
I file audio AAC possono essere distribuiti gratuitamente senza il versamento di alcuna
royalty sia in streaming che su supporto fisico, mentre per la produzione e la vendita
di codificatori e/o decodificatori è previsto il pagamento di fees o royalties. La
stipulazione di un accordo di licenza permette lo sfruttamento della tecnologia, ma non
include la concessione del codice sorgente. La licenza per beni intermedi copre solo il
produttore, mentre non copre l’utilizzatore a valle del un bene che incorpora l’AAC, il
quale dovrà a sua volta essere soggetto al pagamento di una licenza. Gli accordi di
licenza prevedono una quota iniziale forfettaria di 15,000$ per 5 anni, in aggiunta alle
fees richieste sui singoli componenti. Le royalty sui beni di consumo non-intermedi
(software e devices) decrescono al crescere delle unità prodotte: da 0.50$ a 0.12$ per

                                               6
un decoder o encoder e da 1$ a 0.24$ per un codec, fino a un massimo di 25,000$
    per decoder o 250,000$ per licenziante. I prezzi per i produttori di beni intermedi sono
    flat rate di 20$ per tutti gli encoder prodotti e 2$ per i decoder.

    Ogg Vorbis

    A differenza dei precedenti, Ogg Vorbis è un algoritmo di codifica libero composto da
    Vorbis, un algoritmo lossy, più un contenitore (Ogg), da cui il nome di “Ogg Vorbis”.
    Ogg è il stato creato a partire dal 1998 per iniziativa di Christopher Montgomery dalla
    Xiph.Org Foundation, come reazione all’annuncio dell’introduzione delle licenze
    onerose sul formato MP3 ed è quindi il risultato dello sforzo congiunto della Xiph open
    source community. Nello spirito delle comunità Open Source, non ci sono brevetti che
    proteggono l’Ogg, ma lo sfruttamento e’ soggetto a diritti d’autore regolati da speciali
    licenze. Conseguentemente, gli sviluppatori di software possono usare il formato Ogg
    senza costi né royalty, ma devono accettare i termini delle licenze, i quali tipicamente
    impongono limitazioni ai termini di sfruttamento successivo dei lavori derivati.
    I diversi componenti di questo formato di compressione sono tutti rilasciati
    gratuitamente, ma sono soggetti a regimi di proprietà intellettuale differenti. La
    documentazione relativa al codice sorgente è rilasciata gratuitamente e senza alcun
    tipo di restrizione. I tools di sviluppo (utility software) sono rilasciati sotto GPL (GNU
    General Public License) e sono quindi gratuiti e consentono qualsiasi tipo di
    sfruttamento (anche commerciale), a condizione che i lavori derivati siano rilasciati con
    codice sorgente. Le librerie e il Software Development Kit sono invece rilasciati sotto
    una licenza BSD-like, cioè gratuita, ma tale da permettere lo sfruttamento
    commerciale dei lavori derivati, a condizione di garantire l’attribuzione. Gli utilizzatori
    del kit possono quindi reimplementare il software seguendo le specifiche di Vorbis per
    produrre software proprietario chiuso.

Riferimenti bibliografici

    [1] Blind K. “Patent Pools. A solution to patent conflicts in standardization and an
    instrument for technology transfer: the MP3 case”, SIIT Conf. Proceedings, 2003.

    [2] Joseph L. Hall, II et al, “Perceptual coding of audio signals”, USPTO Patent n.
    5341457, 23 August 1994.

    [3] Jurgen Herre, Dieter Seitzer, "Process for reducing data in the transmission and/or
    storage of digital signals from several dependent channels, EPO Patent n.
    KR970011743B, 16 July 1997.

    [4] James David Johnston, “Rate loop processor for perceptual encoder/decoder”,
    USPTO Patent n. RE39080, 25 April 2006.

    [5] Zazzerini G. “Promoting Technological Standards Through IPRs Management:
    Taking Advantage of Licenses, Società Italiana di Marketing, 2005, mimeo.

                                                   7
Figure

   Figura 1. Primi lettori MP3 (1998): Diamond Multimedia di RIO (sinistra) e MpMan di
   Saehan Information Systems (destra).

                                              8
Puoi anche leggere