Dither: digitales Schmiermittel. Smarte Tricks und Kniffe in der Audiotechnik.
Ohne zusätzliche Tricks und Kniffe funktioniert kaum ein technisches Grundprinzip. So schützte der Fliehkraftregler James Watts Dampfmaschine davor zu überdrehen und sich in ihre Einzelteile zu zerlegen. Diese Regel gilt auch für den Audiobereich. Die smarten Helfer fristen meist ein Schattendasein, zu Unrecht. Denn ohne sie würde vieles überhaupt nicht funktionieren oder zumindest nicht zuverlässig und präzis. Ob Schallplatte, Tonband oder digitales Medium, ohne die hier vorgestellten Hilfs- oder Unterstützungstechnologien könnten wir Musik nicht in der gewohnten Qualität über unsere Audio Systeme geniessen. Lassen Sie uns einen Ausflug in meist unbekannte Details der Audiotechnik unternehmen. Ist es überhaupt interessant, sich mit solchen „Nebensächlichkeiten“ zu befassen? Auf jeden Fall, denn dieses durchaus spannende Detailwissen hilft die Funktionsweise analoger und digitaler Musikspeicherung besser zu verstehen und Mythen und Fehlurteile zu erkennen.
Bild1: Die Kugelgewichte des mit der Dampfmaschine gekoppelten Fliehkraftreglers werden mit zunehmender Drehzahl der Dampfmaschine durch die Fliehkraft nach aussen gedrückt. Über die Hebelkonstruktion wird der Dampfeinlass gedrosselt. Die Drehzahl der Maschine wird so in Grenzen gehalten, ein Überdrehen verhindert. Ohne diese Hilfseinrichtung wäre der Betrieb einer Dampfmaschine riskant. Grösser = auf Bild klicken.
Magnetbandaufzeichnung – dank HF-Vormagnetisierung eine Erfolgsgeschichte
Die Tonspeicherung auf Magnetband hat die Aufnahmetechnik nachhaltig geprägt und war über Jahrzehnte die zentrale Technologie in der Musikproduktion. Nach Einführung der Magnetbandtechnik, die neue Bearbeitungsmöglichkeiten bot, war die Schallplatte (mechanische Schallspeicherung) nur noch ein Distributionsmedium. Wie der Name sagt, ist Magnetismus die Grundlage der Bandaufzeichnungstechnik mit den damit einhergehenden physikalischen Eigenschaften. Die auf einem Kunststoffträger aufgebrachten ferromagnetischen Partikel werden vom Aufnahmetonkopf entsprechend der elektrischen Signalwellenform ausgerichtet. Der Grad der Ausrichtung ist abhängig von der anliegenden Feldstärke (entsprechend dem Signalpegel/Lautstärke und Frequenz). Dieser nicht lineare Vorgang folgt der Remanenz-Kurve, die sich wiederum aus der Hysterese ableitet. Die Neuausrichtung der Magnetpartikel erfolgt nicht vollständig linear zum angelegten Magnetfeld. Das Beharrungsvermögen (Remanenz) des Ferromagnetikums erzeugt eine verzerrte Aufzeichnung des Musiksignals (Bild 2).
Bild 2: Auf Grund der ferromagnetischen Beharrlichkeit (Remanenz) wird die angelegte Tonschwingung nicht unverzerrt gespeichert werden. Grösser = auf Bild klicken.
Wird nun dem am Aufnahmekopf anliegenden niederfrequenten Musiksignal ein sinusförmiger Hochfrequenz-Vormagnetisierungsstrom überlagert, kann die Aufzeichnung des niederfrequenten Signals lineararisiert werden. Wegen der Krümmung der Remanenzkurve in der Nähe des Ursprungs und des Nulldurchgangs wird die sinusförmige HF-Schwingung zunächst genauso verzerrt, wie früher die Niederfrequenz. Die niederfrequente Schwingung wird dadurch aber nahezu linear aufgezeichnet. Erst mit diesem unspektakulären technischen Trick konnte die Musikaufzeichnung auf Magnetband auf ein klanglich überzeugendes Niveau gehoben werden.
Bild 2: Ein dem Tonsignal beigemischtes hochfrequentes Sinussignal lineararisiert die Aufzeichnung des niederfrequenten Nutzsignals. Grösser = auf Bild klicken.
Die Schneidekennlinie – ohne die geht nichts
Die Schallplattenrille speichert die Information des rechten und linken Kanals in Seiten- und Tiefenschrift. Bei tiefen Frequenzen ist die Rillenauslenkung am grössten und nimmt zu höheren Frequenzen hin kontinuierlich ab, entsprechend den Schalldruckpegeln der Musik. Je grösser die Rillenauslenkung, desto geringer ist die Spielzeit. Zu hohen Frequenzen hin nimmt der Schallpegel so stark ab, dass der Schneidestichel kaum noch ausgelenkt wird. Darum werden beim Schneiden der Schallplatte die Bässe pegelmässig abgesenkt (um die Rillenauslenkung zu reduzieren, zu Gunsten einer längerern Spielzeit) und die Höhen angehoben (damit die oberen Frequenzanteile nicht im Rauschen untergehen). Bei der Wiedergabe wird spiegelbildlich zur entsprechenden Schneidekennlinie korrigiert. Technisch wird dies mit Filterelementen erreicht. Im Weiteren wird der Bass unterhalb von ca. 90Hz in mono geschnitten (Seitenschnitt), um zu verhindern, dass der Schneidestichel bei grossen Bassauslenkungen ausserhalb des Lack-Masters ins Negative schneidet.
Aber erst nachdem die Recording Industry Association of America (RIAA) verbindliche Normen für den Grad der Absenkung/Anhebung und die Einsatzfrequenzen sowie Zeitkonstanten der Filter normiert hat, konnte eine klanglich kohärente Aufzeichnung und Wiedergabe erreicht werden. Diese Normierung betraf die Studiogeräte bei der Produktion und die Heimgeräte bei der Wiedergabe gleichermassen. Ohne die RIAA Schiede- und Wiedergabekennlinie wäre die LP in der heutigen Qualität und Spieldauer nicht machbar.
Bild 3: Die RIAA Schneidekennlinie definiert den Grad der Pegelabsenkung, respektive -Anhebung beim Schneiden der Schallplattenrille. Es erfolgt ein Korrektur von fast 40dB über den gesamten Frequenzbereich. Berücksichtigt man den Gesamtdynamikumfang der Schallplatte von rund 60 bis 65dB, dann erkennt man, wie bedeutend die Schneidekennlinie ist. Grösser = auf Bild klicken.
Auch digitale Systeme können trickreich verbessert werden.
Linearitätsprobleme und Verzerrungen begleiten die Audiotechnik auf Schritt und Tritt. Zwar konnten mit der Digitaltechnik die Fehlergrössen deutlich reduziert werden, doch verschwunden ist die Problematik auch in der digitalen Welt nicht. Sie sind nur komplett anders geartet als in der analogen Domäne. Bei einem analogen System nehmen die Verzerrungen mit zunehmender Lautstärke des Signals zu. Bei der Digitaltechnik ist dies umgekehrt. Die leisen und feinen Signalanteile sind hier das Problem. Ist ein Signal kleiner als das kleinstwertigste Bit (LSB) entstehen Rundungsfehler, die Quantisierungsverzerrungen. Diese Fehler sind extrem leise und betreffen das LSB (Bereich -90 bis -96dB bei einem 16 Bit System).
Quantisierungsverzerrungen werden oft auch als Quantisierungsrauschen bezeichnet, was genau genommen eine falsche Bezeichnung ist. Quantisierungsverzerrungen stehen in Bezug zur Musik (sind korreliert), leiten sich aus ihr ab. Rauschen ist nicht korreliert, hat also keinen Bezug zur Musik, die Rauschenergie ist zufällig verteilt.
Bild 4: Blick auf das kleinstwertigste Bit. Der Rundungsfehler beträgt maximal ½ LSB. Die in der Grafik angedeutete analoge Schwingung ist knapp grösser als eine Quantisierungsstufe (1Bit). Grösser = auf Bild klicken.
Zu Beginn des Digital Zeitalters 1983, war man der Ansicht diese Quantisierungsverzerrungen seien unhörbar, da a) extrem leise und b) durch die Musik verdeckt. Ein Irrtum, wie sich herausstellte. Die Quantisierungsverzerrungen sind zwar extrem leise, aber das Störspektrum korreliert mit der Musik und wird daher als sehr störend empfunden. Zwar sind die Quantisierungsverzerrungen nicht direkt wahrnehmbar, sind aber einer der Gründe für den oft bemängelten klinischen Klang der Digitaltechnik.
Bild 5: Zum besseren Verständnis der Materie: hier ein 16 Bit System mit 65‘536 Stufen über die positive und negative Halbwelle. Das LSB ist das 16 Bit. Der Nulldurchgang ist in der Mitte beim +LSB und –LSB. Bei einem voll ausgesteuerten Signal sind die Rundungsfehler (ohne Dither) extrem klein bei 0.0012% (16Bit) und 0.000005% (24Bit). Mit abnehmendem Pegel steigen die Verzerrungswerte (siehe Bilder 7-9). Grösser = auf Bild klicken.
Fügt man nun dem kleinstwertigsten Bit Rauschen – Dither – hinzu, werden die Quantisierungsverzerrungen grösstenteils eliminiert. Dither ist digitales Rauschen bestehend aus zufälligen Werten aus einem Bereich in der Grössenordnung einer Quantisierungsstufe (LSB/1Bit). Es gibt verschiedene Dither-Typen mit unterschiedlichen Wahrscheinlichkeitsverteilungen. Das minimale Rauschen (rechteckig > RPDF-Dither oder dreieckförmig > TPDF-Dither), das für eine vollständige Linearisierung der Kennlinie hinzugefügt werden muss, ist über genau eine Stufenhöhe verteilt = LSB. Dadurch wird bei der Quantisierung zufällig auf- oder abgerundet, mit einer Wahrscheinlichkeit, die linear davon abhängt, auf welcher Höhe der Signalwert zwischen zwei Stufen steht. Der A/D-Wandler erzeugt so zu zusätzliche binäre 0/1 Wechsel, die ohne Dither nicht erzeugt würden. Mit Dither sind somit Auflösungen unterhalb des LSB möglich.
Bild 6: Dither muss bei jeder nicht trivialen digitalen Operation hinzugefügt werden, also bei der Quantisierung im AD-Konverter, bei Pegelumrechnungen, ändern der Bitrate/Samplingfrequenz usw. Grösser = auf Bild klicken.
Somit macht ein Prozess, wie in Bild 6 gezeigt durchaus Sinn, da die in einem 20/24 Bit System vorhandenen klanglichen Vorzüge auch im 16 Bit Format bis zu einem gewissen Grad noch vorhanden sind. Dies zeigt sich in der Praxis auch darin, dass exzellente Produktionen, im CD-Format veröffentlicht, manchmal besser klingen als mässige Aufnahmen im HD-Format. Was nur die alte Regel bestätigt, dass ein Tonmeister sein Handwerk verstehen muss und ein Label einen hohen Qualitätsanspruch haben muss. Ein Trägerformat kann nur transportieren was von „vorne“ reinkommt. Im Umkehrschluss muss der Träger das was „vorne“ reinkommt ohne Abstriche und Kompromisse transportieren.
Praxisbeispiel
Die folgenden Bilder – die wir bereits im vorherigen Blog vom 24.8.2016 „Audio Transparenz. Sind hochpräzise Audio Systeme Fluch oder Segen?“ – gezeigt haben, veranschaulichen Quantisierungsverzerrungen und die Wirkung von Dither am Beispiel eines Kleinsignals bei -80dB.
Bild 7 zeigt eine Sinusschwingung von 1000 Hertz (24/96), bei extrem geringem Pegel von minus 80 dB (dies ist 10 bis 20dB leiser als mit analoger Technik möglich ist). Mit 24 Bit Wortlänge lässt sich dieses Signal perfekt aufzeichnen, nicht aber mit 16 Bit. Bei einem analogen System steigen die Verzerrungen mit zunehmender Lautstärke des Signals. Bei der Digitaltechnik ist dies umgekehrt. Die leisen und feinen Signalanteile sind hier das Problem. Ist ein Signal kleiner als das kleinste Bit (LSB) entstehen Rundungsfehler, die Quantisierungsverzerrungen. Diese Fehler sind extrem leise und betreffen das LSB (Bereich -90 bis -96dB). Grösser = auf Bild klicken
Bild 8 zeigt die Sinusschwingung von Bild 7, runtergerechnet auf 16 Bit ohne hinzufügen von Dither (= Truncation). Die Rundungsfehler sind sichtbar. Das Sinussignal ist klar hörbar, aber von lästigen Störgeräuschen im Vordergrund überlagert (Hinweis auf Demo CDs im Anhang). Einem Signal bei -80db stehen nur noch 3 Bit zur Verfügung. Grösser = auf Bild klicken
Bild 9: Hier wurde die Sinusschwingung von Bild 7 auf 16 Bit durch Hinzufügen von Dither runtergerechnet (Dreick-Dither > TPDF). Die Verzerrungen wurden mit digitalem Rauschen (Dither) entzerrt, d.h. Verzerrungen gegen Rauschen eingetauscht und die verstümmelten Signalanteile teilweise wiederhergestellt. Die Unterschiede sind auf den Demo-CDs gut hörbar. Durch Dithern gehen 3 bis 6 dB Dynamikumfang verloren, für das CD Format mit Dreieck-Dither gilt somit ein Dynamikumfang von 93dB. Grösser = auf Bild klicken
Bild10: Hier die Quantisierungsverzerrungen und deren Eliminierung durch Dither in einer anderen Darstellung. Links:ein 1kHz Ton bei -90dBFS ohne Dithering. Es sind deutliche Quantisierungsverzerrungen rechts vom Nutzsignal (sehr leises Signal) sichtbar. Rechts: 1kHz Ton bei -90dBFS mit Dithering. Die Störkomponenten sind weg, sichtbar der hinzugekommene Rauschpegel.
**
Anhang:
Demo CDs die sich unter anderem mit dem Thema Dither und Quantisierungsverzerrungen befassen und das Problem durch anheben der sehr geringen Pegel hörbar machen:
Chesky Records hat eine Test CD/Sampler veröffentlich mit Hörbeispielen zum Thema Quantisierungsverzerrungen und Linearisierung mit Dither. Die CD ist im Handel und auch als Download auf HDTracks.com erhältlich: Best Of Chesky: Classics, Jazz & Audiophile Test Disc, Vol. 3 – Chesky 111.
Audio 8/2016 Heft CD > Details siehe Blog vom 24.8.2016