L’UV-22 migliora l’audio digitale ma è al pari dell’analogico?

L'argomento di quest'oggi è il risultato di una richiesta effettuata da uno dei nostri utenti qualche tempo addietro. Parliamo di questo, dunque, perchè il nostro sito è on-demand e ce lo avete chiesto in un commento qualche tempo addietro. parlavamo dei convertitori Sigma-Delta nell'ambito di un corso pubblicato su queste pagine. Ricordate il nostro corso di microprogrammazione? Ecco a voi l'UV-22.

Quello di cui parliamo oggi è un argomento variegato che non potremo necessariamente affrontare nel dettaglio e con la dovizia di particolari che richiede ma al quale viene rivolta particolare attenzione sia sul piano tecnico sia sul piano dei risultati.
La riproduzione dell'audio, soprattutto in termini di qualità, appassiona soggetti diversi: dai tecnici del suono fino agli ingegneri che progettano i sistemi. Ma non sono gli unici perché tanti ancora sono fermamente convinti del fatto che l'audio digitale non possa in alcun modo sostituire (o essere paragonato a) quello analogico.
Tante sono le tecniche immaginate nel corso del tempo per ovviare a questo divario e per fare in modo che la riproduzione dell'audio digitale diventasse sempre più di qualità.
Tra le tante tecniche e tra i tanti algoritmi, l'UV-22 ha avuto ed ha tutt'oggi, soprattutto in termini di evoluzione, un ruolo fondamentale.

Ma per capire tutto questo bisogna introdurre il concetto di dithering e, successivamente, quello di noise shaping.

Come si può facilmente dedurre, le tecniche rappresentano una maniera per ridurre il numero di bit impiegati al fine di minimizzare il contributo dell'errore di quantizzazione, se non eliminarlo del tutto.

Il dither si è dimostrata una tecnica molto efficace e, come vedremo più avanti, aggiungendo del “semplice” rumore si ottengono ottimi risultati.
Dal momento che si tratta di aggiungere rumore al segnale, uno degli inconvenienti potrebbe essere l'introduzione di colorazioni spettrali ovvero componenti di frequenza non presenti all'ingresso o meglio sul segnale originario. Per poter essere una tecnica davvero funzionante e davvero efficace, tali colorazioni devono essere nulle o quanto meno non apprezzabili, che in termini di audio si può tradurre o in un livello energetico oppure in una frequenza di riferimento.

Il noise shaping agisce, dunque, come dicevamo, facendo in modo che l'errore di quantizzazione  si trovi in feedback col sistema. Esso può quindi essere filtrato.
Per poter comprendere questo, viene di solito utilizzata un'equazione che spiega il funzionamento del nodo sommatore che aggiunge al campione n-simo del segnale il campione (n-1)-simo:

y(n) = x(n)+E(x(n-1))

Dal momento che ciascun campione viene rappresentato con un certo numero di bit, la riduzione della risoluzione ovvero della profondità di rappresentazione introduce un errore di quantizzazione risultante che sarà aggiunto al campione successivo ottenendo che l'errore stesso sia confrontato con la componente d'errore presente al campione successivo.
Naturalmente i sistemi che possono risolvere questa situazione sono null'altro che filtri passa basso a singolo polo, quindi con pendenza pari a 6 dB per ottava o 10 dB per decade.
Sebbene questo sia l'esempio tipico, è sempre possibile immaginare di utilizzare filtri sempre più complessi che utilizzano più campioni utili e che restituiscono la descrizione di un noise shaper di ordine sempre più elevato.

Per poter essere davvero efficace il processo di sagomatura spettrale del rumore, evitando l'insorgenza di componenti di errore deterministiche o comunque prevedibili, deve consentire il dithering; in caso contrario la sagomatura del rumore finisce per essere semplicemente una sagomatura di una distorsione che sposta le componenti energetiche su bande di frequenza differenti.

Cosa c'entra tutto questo con l'audio?

Si tratta dell'applicazione che più ci interessa, dal momento che l'applicazione "centrale" è stata l'audio. Come tutti sappiamo, l'orecchio umano non è sensibile a tutte le frequenze allo stesso modo. Per esempio, oltre 20 kHz non è più in grado di sentire alcun suono. Inoltre, a bassi livelli di ascolto, è meno sensibile ad alcune frequenze rispetto ad altre.
Alti livelli energetici a determinate frequenze possono essere utilizzati per nascondere livelli energetici a più basse frequenze limitrofe, dal momento che la sensazione pressoria sul timpano "maschera" le seconde.
Tutti questi effetti, spiegati in maniera schematica tramite la rappresentazione di Fletcher-Munson, sono alla base di tutta la rappresentazione audio che esiste oggi.

Sebbene quanto detto finora sia in linea generale valido, è anche vero che non tutti gli algoritmi riducono la profondità di rappresentazione. In particolare, UV-22 e UV-22HR della Apogee, ad esempio, sono di riduzione da 24 a 16 bit e utilizzano dither colorato tramite un semplice pre-filtraggio del rumore.

L'idea di base è, dunque, basilare: condensare il più possibile i dati in maniera tale da ottenere una qualità migliore rispetto a quella che si ottiene con la risoluzione tipica di rappresentazione su CD. Non un'idea terribilmente nuova ma sicuramente una traccia che ha guidato lo sviluppo per diverso tempo.
Il dither "plain" ha preceduto la sua variante "noise", un processo che poi è stato denominato "noise shaping", evolvendosi poi in "bit mapping".
Per verificarne la qualità e l'utilità, sono stati effettuati diversi test di ascolto indipendenti l'uno dall'altro che hanno confermato come queste tecniche alterino il plafond di rumore presente.

Ci sono voluti cinque anni per perfezionare la tecnica ma l'Encoding UV22 Super CD di Apogee divenne realtà. UV22 è dunque un algoritmo, un processo matematico che lavora sul suono e ne preserva la qualità 20-bit source. L'effetto finale che si riesce ad ottenere è quello di un suono udibile anche su registrazioni da 16 bit.

La tecnica funziona tramite l'addizione al bistream originale di componenti che non sono udibili ma anzi ad alta frequenza e rappresentano una sorta di "bias" sul segnale, una sorta di "clump" di energia che si localizza intorno ai 22 kHz.

La maggior parte di questa componente in un tape recorder analogico serve a smussare le componenti non lineari sul nastro con il risultato di riuscire ad elevare la qualità standard di registrazione fino e anche oltre ai 20 bit.

E se tutto questo non bastasse, sappiate che questa portante non udibile smussa le asperità dei bordi della forma d'onda agendo anche nel meno costoso dei riproduttori CD. Un algoritmo che, dunque, è stato implementato in dispositivi che oggi non sono più tanto utilizzati, dal momento che a tutti noi, ormai, piace sempre di più la musica digitale online. Ma anche lì la qualità è un fattore al quale non rinunciamo e tante delle tecniche sviluppate all'epoca si sono evolute in maniera tale da garantire ottimi risultati anche su sistemi più "moderni".

Tecnicamente, dicevamo, si basa tutto sul rumore. Idealmente la base di rumore di un sistema digitale è di circa 6 dB per bit. Pertanto possiamo immaginare che un sistema come il CD a 16 bit abbia una componente di rumore pari a -96 dB. Ed estendendo il discorso di un sistema a 20 bit è facile arrivare a -120 dB. Decisamente troppo per un sistema che funzioni e che produca suoni accettabili.
Una sorgente a 20 bit implica due cose: un rumore di fondo molto basso ed un'alta risoluzione ma, nel mondo reale, è la risoluzione che conta ed è proprio questa che viene spinta grazie all'utilizzo sapiente del rumore nell'algoritmo.

Le caratteristiche che vengono esaltate e le features di cui questo algoritmo gode sono le seguenti:

  • mantenimento del dettaglio, del sound stage e del tonal balance a 20-bit;
  • nessuna colorazione;
  • noise floor costante;
  • nessun decoder richiesto;
  • effetto diretto su qualsiasi playback player.

Quando la tecnica ha fatto il suo esordio sui dispositivi, i commenti sono stati pressoché entusiasti sia da parte dei professionisti del settore, da Gateway Mastering a Telarc International, che hanno elogiato sia gli effetti di riverbero sia la diffusione stereo; gli utenti finali hanno potuto apprezzarne i risultati.

Per darvi un'idea di un sistema dotato di questo algoritmo, ecco alcune caratteristiche tipiche. Naturalmente molto dipende dal tipo di sistema con cui avete a che fare però sappiate che lo scopo di un algoritmo di questo tipo è l'implementazione su sistemi simili a questo.
Parliamo, questo è chiaro, di una interfaccia audio professionale completamente controllata digitalmente con:

  • 36 canali audio simultanei, di cui alcuni ingressi e uscite analogiche;
  • 4 preamplificatorei microfonici trasparenti, con gain di 75dB;
  • 2 ingressi e 2 uscite S/PDIF ottiche e coassiali;
  • connettività FireWire;
  • selezione della sorgente di clock;
  • selezione del formato digitale ottico in ingresso e in uscita (S/PDIF o ADAT/SMUX).

Ed ovviamente le tecnologie di Apogee come "SoftLimit", "Intelliclock" e "UV-22".

In sintesi, si tratta di un vero e proprio capolavoro della tecnica che ha permesso un grande sviluppo ed applicazioni commerciali anche su larga scala. Un successo di grandi proporzioni. Davvero ammirevole.

E voi, che esperienza avete con l'audio?
Siete più per l'audio digitale o per quello analogico?

Scarica subito una copia gratis

6 Commenti

  1. Avatar photo Boris L. 15 Settembre 2014
  2. Avatar photo Piero Boccadoro 15 Settembre 2014
  3. Avatar photo Giorgio B. 16 Settembre 2014
  4. Avatar photo Piero Boccadoro 21 Settembre 2014
  5. Avatar photo Gius_Res 6 Ottobre 2014
  6. Avatar photo Piero Boccadoro 8 Ottobre 2014

Scrivi un commento

Seguici anche sul tuo Social Network preferito!

Send this to a friend