INFORMATICA INFORMA TICA MUSICALE - Prof. Sylviane Sapir S apir
CODIFICA
E
COMPRESSIONE
DELL’AUDIO DIGITALE
Luca Monteveri
INTRODUZIONE L’audio audio digit digitale ale è la tecno tecnolog logia ia che viene viene utili utilizza zzata ta per per regis registr trare are,, memori memorizza zzare re,, gener generare are e manipolare suoni mediante segnali audio codificati in forma digitale. La rapprese rappresentazi ntazione one digitale digitale dell’a dell’audio udio,, a differen differenza za di quella quella analogica analogica,, non raffigur raffigura a la curva continua dell’ampiezza con una curva dall’andamento analogo, come ad esempio la variazione del campo magnetico in un nastro o l’andamento dei solchi di un vinile, ma assegna dei numeri che rappresentano il valore dell’ampiezza in istanti di tempo successivi e regolari.
Vantaggi La conversion conversione e del segnale audio in un formato formato digitale digitale permette una comoda comoda rielabor rielaborazion azione, e, processamento processamento e trasmissione di un segnale audio, perché la manipolazione manipolazione consiste unicamente in operazioni operazioni matematiche effettuate su valori numerici, invece che nell’utilizzo nell’utilizzo di dispositivi elettronici applicati al segnale.
A differenza dei supporti analogici, fare copie dei dati non comporta una degradazione della qualità del segnale, poiché anche in questo caso si tratta di copie di semplici numeri. Un aspetto non possibile lavorando con supporti analogici è la possibilità di correggere errori introdotti dai supporti di memorizzazione e dai dispositivi di trasmissione, mediante codifiche a rilevazione e correzione d’errore.
Svantaggi ccorre un sistema di comunicazione tra l’interno e l’esterno dell’elaboratore per trasformare il dato digitale in pressione sonora ed essere ascoltato, introducendo quindi ritardi temporali. !ella rappresentazione analogica invece un’onda sonora rimane comunque una forma d’onda che mantiene le caratteristiche del segnale originale, semplificando il processo di trasduzione. "noltre, un segnale digitale di qualità comparabile a quella di un segnale analogico necessita grande capacità di memoria e velocità di elaborazione e trasmissione, comportando anche costi maggiori. #uesto svantaggio ha portato allo sviluppo di tecniche di compressione dei dati permettendo all’audio digitale di venire impiegato nella multimedialità e di venire trasmesso via "nternet.
PROCESSO DI CONVERSIONE Un sistema audio digitale inizia con un convertitore A$% &analog to digital converter '. #uesto dispositivo campiona il segnale a una specifica frequenza e converte il valore di ampiezza in dato digitale con una risoluzione in bit prestabilita. (rima di campionare il segnale occorre filtrare le frequenze inferiori alla frequenza di !)quist &pari alla metà della frequenza di campionamento' per evitare fenomeni di aliasing, secondo il teorema del campionamento di !)quist*+hannon, il quale sostiene che per digitalizzare un segnale che contiene componenti di frequenza fino a x hertz, bisogna campionare ad un tasso di campionamento di almeno 2x campioni al secondo. !el campo dell’audio e in particolare della musica i segnali possono raggiungere -/z, quindi occorre una frequenza di campionamento maggiore di 0-/z. "l %$ audio, ad esempio, utilizza una frequenza di campionamento di 00.1 /z e 12 bit di risoluzione per ogni canale stereo.
!
Pulse-Code Modulation La modulazione a codice di impulsi &(%3' è un metodo di rappresentazione digitale di un segnale analogico. L’ampiezza del segnale analogico è campionata a intervalli regolari, ed ogni campione viene poi quantizzato. Un tipo specifico di (%3 è la L(%3 &Linear pulse-code modulation', in cui gli intervalli di quantizzazione sono lineari. 4iene utilizzata nella codifica dei %$ audio. 5li algoritmi A*la6 e 7*la6 utilizzano invece livelli di quantizzazione proporzionali all’ampiezza del segnale.
Esempio di quantizzazione lineare a 4 bit (16 valori).
8utti i valori che rientrano in una regione di quantizzazione verranno convertiti nello stesso codice. #uesto introduce il cosiddetto errore di quantizzazione, corrispondente in ampiezza alla metà della dimensione di una regione di quantizzazione e affine al rumore bianco, in quanto si pu9 considerare casuale in frequenza. All’aumentare del numero di bit diminuisce il rumore di quantizzazione, perché le regioni diminuiscono di ampiezza. (er evitare la degradazione dei segnali deboli dovuta all’errore di quantizzazione pu9 essere utilizzata una quantizzazione non lineare: il numero di bit &e quindi di regioni' rimane lo stesso, ma la dimensione delle regioni corrispondenti alle ampiezze deboli diminuisce, mentre aumenta quella
"
delle ampiezze forti. "n questo modo il guadagno in qualità alle ampiezze deboli è compensato da una perdita di qualità alle ampiezze forti.
i!!erenza tra quantizzazione lineare e non lineare
Formati audio in PCM ;A4 &;indo6s', A"<< &3acintosh' e AU sono formati di audio non compresso molto conosciuti ed utilizzati. " file risultanti sono di dimensioni consistenti, ma non richiedono una potenza di calcolo elevata per essere riprodotti. =ssendo la loro codifica lossless, cioè senza perdita di informazioni, vengono molto utilizzati nel campo dell’audio professionale * grazie anche alla loro relativa semplicità e velocità di manipolazione.
"l formato ;A4 è diviso in >chun?s@ &blocchi', ognuno dei quali descrive una caratteristica del file. " chun? sono quasi tutti a bit.
#
0 caratteri, >B"<<@ &"esource #nterc$ange %ile %ormat) $imensione del file 0 caratteri, >;A4=@ +ubchun? <38: specificano le caratteristiche del file 6ave &frequenza di campionamento, numero di canali, profondità di bitC'
+ubchun? $A8A: contengono i campioni audio
Un file ;A4 stereo campionato a 00.1?/z, 12bitDs occupa il seguente spazio: se!ondo: 001-- E b)te F GG. ?H. =ssendo stereo questo valore va raddoppiato, quindi lo spazio
occupato è 1I2.0 ?H. minuto: 1I2.0 E 2- F 1-JG0 ?H, che corrispondono a 1-.1 3H.
$
Digitali""a"ione !ome #arte del #ro!esso PCM %erte forme di (%3 combinano l’elaborazione e la codifica del segnaleK implementazioni recenti di queste tecniche applicano il processo direttamente al segnale digitale. ●
DPCM (i!!erential pulse-code modulation): codifica i valori della (%3 come differenze tra due
campioni adiacenti, oppure effettuando una predizione della differenza seguendo un modello matematico. #uesta tecnica permette una riduzione di circa il J nel numero di bit
●
in un campione. $DPCM (&daptive di!!erential pulse-code modulation): variante della $(%3 che rende variabile
●
il passo di campionamento, riducendo ulteriormente la larghezza di banda. Modula"ione Delta : è un tipo di $(%3 che utilizza un solo bit per sample, richiedendo quindi che ogni valore campionato differisca dal precedente di M1 o *1. L’occupazione della banda è N della classica (%3.
Cenni sulla !om#ressione dei dati audio !el processamento del segnale, la compressione del dato comporta la codifica dell’informazione utilizzando un numero di bit minore rispetto alla rappresentazione digitale originale. "l vantaggio principale della compressione è la riduzione delle risorse necessarie per la memorizzazione e la trasmissione dei dati, ma allo stesso tempo richiede una potenza di calcolo maggiore la decodifica di un file compresso, al punto che il tempo e i mezzi per la decompressione possono comportare un’inconvenienza maggiore rispetto allo spazio di archiviazione risparmiato. !el caso dei file audio si ha un costo anche in termini di qualità dell’audio.
Com#ressione %ossless !ella compressione senza perdita, l’informazione contenuta nel file compresso è identica a quella nel file originale. !el campo audio viene utilizzata per scopi di archiviazione o produzioneK altrimenti è utile in situazioni in cui è importante che il dato originale sia identico a quello decompresso, come in programmi eseguibili, documenti testuali e codici sorgente. La compressione lossless utilizza generalmente algoritmi come la codifica di /uffman, in cui i caratteri di un file sono ordinati per la loro frequenza di apparizione e codificati di conseguenza. 4iene utilizzata ad esempio nella compressione dei formati O"( e come complemento dei codec P(=5 e 3(. =sempi di formati audio lossless sono Apple Lossless,
%
Com#ressione %oss& !ella compressione con perdita, il file decompresso avrà una precisione minore nella rappresentazione dell’informazione, ma abbastanza simile allQoriginale da non comportare perdita di informazioni indispensabili. #uesto perché gli algoritmi di compressione scartano le informazioni poco rilevanti, mantenendo quelle necessarie. !el campo audio si utilizzano modelli psicoacustici per determinare quali siano le informazioni necessarie e quelle che è possibile eliminare, come ad esempio fenomeni di mascheramento o frequenze troppo alte e troppo basse per essere udite. #uesto tipo di compressione viene maggiormente utilizzato nel campo multimediale, streaming su internet di audio, video, immagini e nella telefonia.
=sempi di formati audio loss) sono 3(, ;3A, gg 4orbis.
&