Sull'udibilità dell'alta risoluzione
Inviato: 14/01/2025, 10:20
Da anni ci si interroga sulla necessità o meno di rendere le catene audio hi-fi in grado di riprodurre materiale ad alta risoluzione.
Nel campo digitale, con alta risoluzione ("alta" rispetto alla "qualità CD") ci si riferisce a due proprietà di una registrazione:
- profondità di bit superiori a 16 bit;
- uso di sample rate a 96 kHz o superiori (ci sarebbero anche i 48 kHz ma non trovano ampio uso in audio).
Nel mondo anlosassone, si parla di "high definition" che tradotto letteralmente sarebbe "alta definizione". Per qualche motivo da noi quest'ultima dicitura si è applicata al video, mentre si parla di "alta risoluzione" in campo audio.
In genere, le due cose vanno assieme: i formati più comuni sono 24 bit 96 kHz (in breve 24/96), 24/192, o quello che commercialmente è stato definito DXD: 24/352.8 o 32/352.8. In realtà i 32 bit sono "utili" solo a fini computazionali: sostanzialmente nessun sistema analogico raggiunge o supera la risoluzione equivalente a 24 bit.
Si può considerare alta risoluzione anche il DSD (SACD) che garantisce, convertito in analogico, una risoluzione superiore al CD. Forzando un pochino le definizioni, il DSD può essere visto come un formato a bassa profondità di bit (1) ma altissimo sample rate (2822.4 kHz). In realtà il DSD non è prodotto con il classico campionamento digitale e potrebbe essere fuorviante interpretarlo in termini di profondità di bit e sample rate. Ci insegna, in un certo senso, che entrambi i fattori contribuiscono all'accuratezza con cui un segnale a banda limitata può essere riprodotto. Prima o poi riprendo il discorso su PCM e DSD iniziato qui su un altro thread.
Si parlò molto di alta risoluzione quando Neil Young tentò di promuovere un player portatile (Pono) in grado di riprodurre audio non compresso ad alta risoluzione. All'epoca non c'erano ancora i servizi di streaming e spopolavano i lettori MP3, spesso "nutriti" con file compressi a basso bitrate, talvolta con codec datati o non ottimali. È vero quindi che la qualità media dell'audio riprodotto in mobilità risultasse insoddisfacente, mentre è discutibile che spingere i formati high-res fosse la soluzione al problema.
Chris "Monty" Mongomery, creatore di OGG Vorbis e parte della stessa fondazione dietro lo sviluppo di FLAC scrisse in risposta una nota argomentando che i file high-res fossero un'idea "very silly" (molto sciocca) e non realmente necessaria a riprodurre audio di qualità.
Si può discutere del fatto che l'alta risoluzione sia utile o meno, ma c'è anche una questione collegata e non totalmente sovrapponibile: l'alta risoluzione è distinguibile?
Diversi studi pubblicati sul JAES e altrove hanno tentato di rispondere alla domanda. Meyer e Moran (2007) sembrarono dimostrare che l'ascoltatore non è in grado di distinguere un segnale HD da lo stesso segnale passato per una conversione intermedia a qualità CD. Non entro nei dettagli, perché la metodologia di M&M è stata più volte criticata (legittimamente) e lo studio non si può considerare conclusivo.
Una meta-analisi (Reiss, 2016) ha tentato di combinare diversi studi, concludendo che esiste un effetto piccolo ma significativo di distinguibilità della riproduzione high-res da quella a risoluzione standard.
Con calma mi piacerebbe addentrarmi in questo studio.
Come prime note, rileviamo che:
- gli autori concludono che "la fedeltà di riproduzione percepita può essere influenzata da sistemi che operano al di là della risoluzione standard";
- gli autori rilevano che l'effetto è significativo per sample rate più elevati, mentre non sembra esserlo per la profondità di bit;
- nel riassumere il proprio lavoro, parlano di distinguibilità ma non vi attribuiscono un "segno", in altre parole non dicono se nei casi in cui è distinguibile, l'alta risoluzione risulti "più fedele";
- a leggere la metodologia, sembra che gli autori invece considerino il "segno", ovvero valutino se l'alta risoluzione sia effettivamente percepita come più fedele o migliore.
La metodologia dello studio sembra ragionevole, l'esposizione invece non è delle migliori.
Penso sia interessante andare a vedere quali sono gli studi "primari" che contribuiscono di più al risultato e analizzarli più a fondo per capire in quali termini si manifesta questa distinguibilità.
Nel campo digitale, con alta risoluzione ("alta" rispetto alla "qualità CD") ci si riferisce a due proprietà di una registrazione:
- profondità di bit superiori a 16 bit;
- uso di sample rate a 96 kHz o superiori (ci sarebbero anche i 48 kHz ma non trovano ampio uso in audio).
Nel mondo anlosassone, si parla di "high definition" che tradotto letteralmente sarebbe "alta definizione". Per qualche motivo da noi quest'ultima dicitura si è applicata al video, mentre si parla di "alta risoluzione" in campo audio.
In genere, le due cose vanno assieme: i formati più comuni sono 24 bit 96 kHz (in breve 24/96), 24/192, o quello che commercialmente è stato definito DXD: 24/352.8 o 32/352.8. In realtà i 32 bit sono "utili" solo a fini computazionali: sostanzialmente nessun sistema analogico raggiunge o supera la risoluzione equivalente a 24 bit.
Si può considerare alta risoluzione anche il DSD (SACD) che garantisce, convertito in analogico, una risoluzione superiore al CD. Forzando un pochino le definizioni, il DSD può essere visto come un formato a bassa profondità di bit (1) ma altissimo sample rate (2822.4 kHz). In realtà il DSD non è prodotto con il classico campionamento digitale e potrebbe essere fuorviante interpretarlo in termini di profondità di bit e sample rate. Ci insegna, in un certo senso, che entrambi i fattori contribuiscono all'accuratezza con cui un segnale a banda limitata può essere riprodotto. Prima o poi riprendo il discorso su PCM e DSD iniziato qui su un altro thread.
Si parlò molto di alta risoluzione quando Neil Young tentò di promuovere un player portatile (Pono) in grado di riprodurre audio non compresso ad alta risoluzione. All'epoca non c'erano ancora i servizi di streaming e spopolavano i lettori MP3, spesso "nutriti" con file compressi a basso bitrate, talvolta con codec datati o non ottimali. È vero quindi che la qualità media dell'audio riprodotto in mobilità risultasse insoddisfacente, mentre è discutibile che spingere i formati high-res fosse la soluzione al problema.
Chris "Monty" Mongomery, creatore di OGG Vorbis e parte della stessa fondazione dietro lo sviluppo di FLAC scrisse in risposta una nota argomentando che i file high-res fossero un'idea "very silly" (molto sciocca) e non realmente necessaria a riprodurre audio di qualità.
Si può discutere del fatto che l'alta risoluzione sia utile o meno, ma c'è anche una questione collegata e non totalmente sovrapponibile: l'alta risoluzione è distinguibile?
Diversi studi pubblicati sul JAES e altrove hanno tentato di rispondere alla domanda. Meyer e Moran (2007) sembrarono dimostrare che l'ascoltatore non è in grado di distinguere un segnale HD da lo stesso segnale passato per una conversione intermedia a qualità CD. Non entro nei dettagli, perché la metodologia di M&M è stata più volte criticata (legittimamente) e lo studio non si può considerare conclusivo.
Una meta-analisi (Reiss, 2016) ha tentato di combinare diversi studi, concludendo che esiste un effetto piccolo ma significativo di distinguibilità della riproduzione high-res da quella a risoluzione standard.
Con calma mi piacerebbe addentrarmi in questo studio.
Come prime note, rileviamo che:
- gli autori concludono che "la fedeltà di riproduzione percepita può essere influenzata da sistemi che operano al di là della risoluzione standard";
- gli autori rilevano che l'effetto è significativo per sample rate più elevati, mentre non sembra esserlo per la profondità di bit;
- nel riassumere il proprio lavoro, parlano di distinguibilità ma non vi attribuiscono un "segno", in altre parole non dicono se nei casi in cui è distinguibile, l'alta risoluzione risulti "più fedele";
- a leggere la metodologia, sembra che gli autori invece considerino il "segno", ovvero valutino se l'alta risoluzione sia effettivamente percepita come più fedele o migliore.
La metodologia dello studio sembra ragionevole, l'esposizione invece non è delle migliori.
Penso sia interessante andare a vedere quali sono gli studi "primari" che contribuiscono di più al risultato e analizzarli più a fondo per capire in quali termini si manifesta questa distinguibilità.