Dr. Sound: Vermessung im HiFi-Bereich

Viele Daten umgeben uns, wenn unser Interesse um ein bestimmtes Gerät kreist. Für viele sind diese Angaben meist nur Zahlen auf dem Papier, deren Interpretation einiges an Grundwissen verlangt. In unserer neuen Reihe wollen wir Licht ins Halbdunkel bringen und Messwerte an ausgewählten Beispielen anschaulich erklären.

Am Anfang steht die Klärung der Einheit, in der die meisten Daten zu lesen sind. Also richten wir kurz den Blick auf die elektrisch-physikalische Einheit Volt (V), die bildlich gesprochen den Antrieb der Elektronen vom Minuspol zum Pluspol beschreibt. Sie ist die elektrische Einheit, die den wichtigsten Audiomessungen zugrunde liegt. Die großen zahlenmäßigen Schwankungen für die Einheit Volt, die im Audiobereich vorkommen, sind als solche schwer zu überblicken. Aus diesem Grund bedient sich die Technik einer Verhältniseinheit, die mit einer logarithmischen Werteintegration hervorragend dazu geeignet ist – des Dezibels (dB).

Als Definition für den Spannungspegel gilt: Ein Volt entspricht null Dezibel Volt (dBV), diese Angabe sagt aus, dass sich die Pegelverhältnisse auf ein Volt beziehen.

Folgende Beispiele verdeutlichen die Betragsänderung von absoluten Spannungspegeln, also dem Verhältnis zwischen Volt und Dezibel im semiprofessionellen Bereich und der HiFi-Elektronik

Für den Audiobereich und den damit verbundenen Cinch-Anschluss ergeben sich bestimmte Festlegungen für den Spannungspegel. So wurde einmal für den semiprofessionellen Konsumenten- oder HiFi-Bereich ein mittlerer Übergabepegel von minus zehn Dezibel Volt festgelegt, ein Wert, der heute nur noch wenig Bedeutung hat. Eine Vollaussteuerung wäre dann bei null Dezibel Volt erreicht. Werte, die darüber hinausreichen, können in nachgeschalteten Geräten zur Übersteuerung der Elektronik führen.

Im Zeitalter der digitalen Technik haben sich die Pegelbereiche der Übertragung erhöht. So kann an einem CD-Player, der ein vollausgesteuertes Signal ausgibt, ein Spannungspegel von sechs Dezibel Volt erreicht werden, ein Wert, der nach der Dezibel-Rechnung für Spannungspegel damit doppelt so groß ist wie für null Dezibel Volt.

Auf diesem Screenshot ist die computergestützte Messgeräteoberfläche des Audio
Precision APx 585 zu sehen

Messsignal und Musik

Wie stehen diese Signale in Korrespondenz zur Musik?

Da alle Produktionen zum größten Teil ihren Weg über digitale Medien zum Konsumenten finden, sind hier einige Dinge besonders interessant: Auf der digitalen Ebene ist die oberste Aussteuerungsgrenze null Dezibel FS, wobei das „FS“ für das englische Full Scale, also den vollen Messbereich steht. Über diesen Wert hinaus sind keine Signale weiter verwertbar. Eine Filmtonmischung und audiophile Musikproduktionen sind in ihrer dynamischen Struktur so angelegt, dass die statistische Häufigkeit der klanglichen Ereignisse und der musikalischen Inhalte in einem Bereich von –20 bis minus zehn Dezibel Full Scale am größten ist. Höhere Pegel bis zur Aussteuerungsgrenze werden nur von dramaturgisch sinnvollen Ereignissen und musikalischen Steigerungen erreicht. Dies bildet für uns die Grundlage und den Ausgangspunkt für die meisten technischen Messungen an Geräten der Audiotechnik. Da also der Pegelbereich 20 dB vor Vollaussteuerung den Bereich bildet, dem wir mit unseren Ohren programmabhängig die größte Aufmerksamkeit widmen, ist dieser auch wichtig für eine Analyse des Signal-Rauschabstandes (SNR).

Das Ohr ist bei unterschiedlichen Lautheiten auch unterschiedlich empfindlich für die Wahrnehmung von Frequenzen. In der Nähe der Hörschwelle ist das Ohr weniger empfindsam für tiefe Frequenzen; rechts in der Grafik zu sehen, bei mittellauter Musik ist die Empfindlichkeit größer

Ein Beispiel

Wir messen an einem Vollverstärker an einer definierten Last einen SNR mit einem relativen Pegel von 83 dB, und das 20 dB vor Vollaussteuerung. Im Datenblatt des Herstellers ist der SNR mit 103 dB angegeben, und das ist auch korrekt, weil dieser Wert mit einem vollausgesteuerten Signal erstellt wurde. Nur in der Praxis werden solche  Signale selten vorkommen. Wenn nun zu unserem Ergebnis von 83 dB die 20 dB addiert werden, erhalten wir auch 103 dB – rein rechnerisch. Die Realität weicht manchmal aufgrund von Unzulänglichkeiten im Schaltungsdesign davon ab. Unsere Messmethode ist verlässlicher, da sie der musikalischen und filmtechnischen Produktionsrealität näher ist und dadurch kritischer der heimischen Rezeption folgt. Zusätzlich bestimmen wir das dynamische Verhalten nach der Messvorschrift AES 17 der Audio  Engineering Society, die weltweit agiert und aus der Praxis der Tonmeister und Toningenieure schöpft. Dieses Ergebnis kann vom SNR abweichen, weil die Messung einem anderen technisch-physikalischen Ablauf folgt. Bestimmt werden all diese Größen mit einem Audio Precision 585 Multichannel Audio Analyzer oder alternativ mit einem Rohde & Schwarz UPV Audio Analyzer.

Die A-Bewertungskurve in der technischen Akustik entspricht dem menschlichen Hören bei sehr geringen Lautheiten. Bei praxisnahen Schallpegeln ist die C-Bewertung aussagekräftiger

Bewertungskurve

Warum gibt es Angaben, die mit einem „A“ gekennzeichnet sind? Dabei handelt sich um eine sogenannte A-Bewertung, die dem frequenzabhängigen Lautheitsempfinden des Menschen nachempfunden ist und sich aus der Bauakustik nicht mehr wegdenken lässt. (Daneben gibt es noch andere, davon abweichende Bewertungen mit Kennzeichnungen wie „B“ oder „C“.) Da dieses Empfinden aber von der Schallenergie abhängig ist, die unser Ohr erreicht, gibt es hier Abweichungen in der Akzeptanz dieser Bewertung. Bild 1 zeigt die menschliche Lautheitsempfindung nach Fletcher und Munson, in Bild 2 ist der Frequenzgang der A-Bewertungskurve zu erkennen. In gewissen Grenzen sieht man, dass die Kurven nahezu spiegelbildlich zueinanderpassen. Zu sehen ist aber auch, dass Frequenzen unterhalb von 100 Hertz (Hz) schon mit 20 dB gedämpfter abgebildet werden, ebenso wie Frequenzen oberhalb von sieben Kilohertz (kHz), die bis 20 kHz mit zehn Dezibel Dämpfung erscheinen. Diese Bewertung eignet sich auch, um Störsignale durch mangelnde Masseführung und Netzteilschwächen, wie Brummen oder Oberwellen, zu verschleiern. Denn je nach Abhörlautstärke können diese Artefakte zutage treten. Um sie offenzulegen, messen wir ohne diese marketingfreundliche A-Bewertung, der sich viele Hersteller nicht mehr entziehen können. Kein Hersteller kommt übrigens auf die Idee, seine Audiofrequenzgänge ebenfalls mit einer A-Bewertung zu versehen, denn das würde dem marketingfreundlichen linearen Ideal nicht dienen!

Dieses Schaltbild zeigt das Anschlussprinzip für ein DUT (Device Unter Test) am Audio-Precision-APx-System für Analog- und HDMI-Messungen

Eine Fortsetzung folgt und zwar mit der Erklärung zum richtigen Lesen unserer Messdiagramme. Wir zeigen Ihnen, welche Werte wirklich wichtig sind und welche nur auf dem Papier eine Bedeutung haben. Im Folgenden beschäftigen wir uns mit einem brandheißen Thema.

Wer oder was ist Jitter?

Lange Zeit war die digitale Audiowelt absolut unantastbar, der Glaube an die Fehlerfreiheit der neuen Ära schien nicht erschütterbar zu sein. Die ersten Zweifler ereiferten sich jedoch bald über die empfundene Kühle der Wiedergabe, dann kam auch noch der Begriff der Undefiniertheit hinzu und schon verlor das digitale Audiolager an Anhängern. Ein Grund dafür ist der sogenannte Jitter.

Wie ein Phantom geisterten die abenteuerlichsten Beobachtungen durch die Foren der Audiowelt. Wir wollen einen Blick auf diese Eigenheit der digitalen Übertragung werfen und zeigen, wie dieser Fehler messbar und interpretierbar ist.

Ein korrekt ausgelesenes und wiedergegebenes Digitalsignal erzeugt ein sauberes Analogsignal. Das andere Bild zeigt ein duch Jitter im Digitalsignal verzerrtes wiedergegebenes Analogsignal

Jitter – der Begriff

Das aus der englischen Sprache stammende Wort beschreibt Schwankung, Fluktuation oder Zittern. Ein digitales Signal, wie das im Hi-Fi-Bereich übliche S/P-DIF-Signal, das viele Geräte der Unterhaltungselektronik annehmen oder ausgeben, besteht aus verschiedenen Komponenten. Die zwei wichtigsten Teile sind die Taktung des Signals und die Datenpakete. Kurz und knapp erklärt verursacht der Jitter, dass die sample-genaue Taktung nicht mehr akkurat mit den Sample-Daten der Abtastung in Verbindung gebracht werden kann. Als Sample bezeichnet man eine Probe, die zu einem definierten Zeitpunkt einem Musiksignal entnommen wurde. Das heißt: Auf einer CD befinden sich 44 100-Mal pro Sekunde Proben, die aus einem analogen Signal aufgezeichnet wurden. Dabei können diese Proben nur Werte einer vorgegebenen Quantisierungsstufe, bei einem 16-Bit-Datenwort einer CD ist das eine von 65 536 Stufen (wie bei einer Treppe), annehmen, die dann auch wieder bei der Wiedergabe genau an der gleichen zugehörigen Zeitposition reproduzierbar wird. Kommt es aufgrund von Auslesefehlern des digitalen Signals zu Problemen bei der Rekonstruktion des Dateninhaltes durch fehlerhaft interpretierte Zeittaktinformationen, dann hat schon der Jitter zugeschlagen. Dies kann schon durch gestörte oder schwache Signale verursacht werden. Man spricht vom Übertragungsjitter, daneben gibt es noch den A/D-Wandler-Jitter bei der Aufnahme oder den geräteinternen Jitter durch mangelhafte Laufwerke. Das sind die bekanntesten Arten, die immer durch die genannte Ursache entstehen: Die übermittelte Dateninformation kann nicht mit der zugehörigen Auslesezeitpunktinformation an jeder Stelle in Verbindung gebracht werden.

Das erste Bild zeigt ein digitales S/P-DIF an einem Oszilloskop an. Zoomt man in das Rechtecksignal aus dem ersten Bild hinein, ist zu erkennen, dass die Flanken gar nicht mehr so senkrecht verlaufen

Klang unter dem Jitter-Einfluss?

Mit dem zeitlichen Betrag der Taktschwankung oder ihres Pegels gegenüber der Solltaktung kann sich der Klang verschlechtern. Je stärker eine Abweichung zwischen der analogen Signalwellenform und der rekonstruierten Wiedergabewellenform ist, desto deutlicher sind die Verzerrungen durch Jitter wahrnehmbar. Bekannt ist, dass hochaufgelöste Datenströme, also mit 24 Bit oder mehr, weniger vom Jitter verschlechtert werden, weil der durch den Jitter bedingte Pegelfehler kleiner ausfällt als bei 16-Bit-Daten. Neben dem zyklischen ist der zufällige Jitter durch seine unberechenbare Verteilung mit seinen zufälligen Verzerrungen eher ein Auslöser für zusätzliches Rauschen. Weiterhin wird dem Jitter eine Verschlechterung der Impulswiedergabe und damit der räumlichen Abbildung zugeschrieben. Auch ein konturloser Bassbereich oder ein zum Zischeln neigender Präsenzbereich kann eine Folge sein.

Die Grafik illustriert, wie eine gestörte oder verrauschte Signalflanke die Bestimmung des Anstiegs in der Hysterese erschwert und es damit zu Auslesefehlern des Digitalsignales kommt. Eine Folge: Jitter

Was können wir messen?

Messen können wir mit dem Audio Precision System 2720 verschiedene Arten von Jitter-Symptomen an den digitalen Ausgängen eines Hi-Fi-Gerätes, die entweder durch die Schnittstelle selbst oder durch die geräteinterne Taktung entstehen können. Dazu gehört das Jitter-Histogramm.

Es zeigt, in welchem Zeitbereich und mit welchem Pegel Schwankungen des Taktsignals auftreten. Die Auswertung findet dabei in einem vorgegebenen Zeitbereich statt und erfolgt bei uns über eine große Bandbreite von 50 Hz bis 100 kHz, somit ist sichergestellt, dass alle signaldeterminierenden Anteile erfasst werden, weil diese auf die jeweilige Empfänger-
schaltung rückwirken.

Zyklischer Jitter zeigt sich in Wellenbergen, die sich links und rechts der mittleren Nulllinie aufbauen, und steht hier als ein Beispiel für negative Auswirkungen auf die Audiowiedergabe

Wichtig beim Lesen aller Histogramme ist, dass der Pegel des Störsignals möglichst klein bleibt, denn die Stärke der Störung kann einflussreicher sein als große Taktschwankungen mit verschwindend
geringem Pegelanteil.

Datenblockjitter oder auch Cell-by-Cell-Jitter-Messung (siehe Bild rechts): Die Kurven in Cyan zeigen zwei aufeinanderfolgende 24-Bit-Datenblöcke an, sie beginnen jeweils mit einem Synchronimpuls. Die grüne Kurve darüber zeigt die unregelmäßigen Taktschwankungen innerhalb der Übertragung an, die im Idealfall als horizontale Linie erscheinen sollte.

Ein taktstabiles Signal mit unkritischem Rauschen bildet einen Gipfel über der Nulllinie und sorgt in den seltensten Fällen für Auswirkungen auf das Audiosignal

In der folgenden Ausgabe erklären wir, welche weiteren objektiven Werte wir bestimmen und wie diese zu interpretieren und
zu werten sind.

In dieser Messgrafik einer Cell-by-Cell-Jitter-Messung sind zwei vollständige 24-Bit-Datenwörter eines Digitalsignales zu erkennen, die grüne Kurve zeigt den Jitter an

Bildquellen:

  • Verhältnis-Volt&Dezibel: Bild: Auerbach Verlag
  • _Likihifi_Vorlage-quer: Bild: Auerbach Verlag
  • Lautstärke-Fletcher&Munson: Bild: Auerbach Verlag
  • Bewertungskurven: Bild: Auerbach Verlag
  • DUT: Bild: Auerbach Verlag
  • Digitalsignal-Analogsignal: Bild: Auerbach Verlag
  • F0002TEK+F0007TEK: Bild: Auerbach Verlag
  • Hysterese: Bild: Auerbach Verlag
  • SCHLECHTNum-Jitter_smart: Bild: Auerbach Verlag
  • GUTMarantzSACD-JitterNUm: Bild: Auerbach Verlag
  • Datenblockjitter: Bild: Auerbach Verlag
  • einstieg: Bild: Auerbach Verlag