Grundsätzliches zu Dolby Surround

Roland · 24. Januar 2004

Hallo Surround-Fans!

Für Alle die schon immer wissen wollten:

Wie funktioniert Dolby-Surround?

Dazu müssen wir erst einmal wissen:

Wie funktioniert Stereo?

Zuerst einmal ein bißchen Theorie:

Wiedergabe über 2 unabhängige Kanäle gleichen Formats.

Noch zu den Zeiten der Beatles wurde das sogenannte Ping-Pong-Stereo eingesetzt. Dieses beinhaltet zwei Kanäle mit unterschiedlichen Signalen, die sich nur im Informationsgehalt und der Amplitude (Lautstärke) unterscheiden. Das nennt sich auch Amplituden-Stereophonie.
Beispiel: Ist ein Signal in beiden Kanälen vorhanden, aber in einem Kanal lauter, so meint man, daß das Objekt, welches das Signal erzeugt, näher an dem Ohr ist, wo es lauter ist.

Ein Schritt weiter ist die Amplituden-Phasen-Stereophonie. Bei dieser ist neben der Amplituden-Information auch eine Zeit-Information, die Phasenlage des Signals, in den beiden Kanälen vorhanden.
Betrachten wir jetzt nicht die Lautstärke, sondern die Phasen-Information, d.h. die Zeit-Information.
Kommt ein Schallereignis an einem Ohr früher an, als an dem anderen, so meint man ebenfalls, daß das Objekt mehr auf der Seite steht, an der es früher an einem Ohr ankam. Der Mensch ist in der Lage, Zeitunterschiede von wenigen Mikrosekunden aufzulösen.
Ein Beispiel mag dieses wieder verdeutlichen.
Vorab ein wenig Theorie: Schall legt in normaler Luft und normalem Luftdruck (MSL) 333 Meter/Sekunde zurück. Das sind etwa 3ms/m = 30us/cm.
Ohren sind bei einem normalen Menschen etwa 15 cm auseinander. Nehmen wir einmal an, eine Schallquelle ist 5 Meter von einer Person entfernt und einen Meter rechtwinklig aus der Mitte herausgestellt. Dann beträgt der Unterschied der beiden Strecken zu den Ohren etwa 2 cm, also ein Zeitunterschied von 60us. Das ist absolut zu hören und zu orten.
Mit Hilfe der Amplitude und der Phase sind also Signale von vorderen Richtungen eindeutig in der Lage erhörbar.
Doch wie sieht es mit Signalen von hinten aus.
Dazu ein Exkurs in die Physiognomie:
Die Ohrmuscheln im Wesentlichen mit den Gehörgängen sind so geformt, daß Signale, die aus hinteren Richtungen kommen, um die Muscheln herumgeführt werden müssen. Da ergibt, daß diese Signale geringfügig im Frequenzgang beeinflußt werden. Da wir mit der Zeit gelernt haben, wie sich bestimmte Geräusche anhören müssen, ist es nun nahezu ersichtlich, woher der Schall kommt. Der Mensch muß also erst hören lernen. Das allein reicht aber nicht aus. In der Praxis ist es so, daß der Kopf nie stillgehalten wird und nahezu immer bewegt wird. Durch leichte, aber unbewußte, Bewegungen um die Hochachse ändert sich der Abstand der Ohren gegeneinander in Bezug zu der rückwärtigen Schallquelle. Daraus detektiert der Mensch eine hinten liegende Schallquelle. Analoges ergibt sich für die Richtungen Unten und Oben, die wir hier aber nicht weiter betrachten werden.

Nun endlich zum Surround-Sound:
5.1 Surround-Sound ist ein sechskanaliges Verfahren, bei dem im Idealfall in jeder Ecke eines Quadrates ein Lautsprecher steht. Der Zuhörer ist in der Mitte dieses Quadrates. Zusätzlich ist ein Center-Lautsprecher vorne in der Mitte angeordnet. Alle diese fünf Lautsprecher stahlen Signale des gesamten hörbaren Frequenzspektrums aus, also alle fünf Kanäle sind unabhängig voneinander und haben alle den vollen Frequenzumfang. Zusätzlich gibt es einen Kanal für tiefe Frequenzen. Über diesen Kanal werden alle tiefen Signale aus den fünf anderen Kanälen übertragen. Daher brauchen in diesem Kanal nur Basslautsprecher zu sein, in den anderen fünf Kanälen dafür keine Super-Tiefbass-Lautsprecher. Also ist 5.1 so etwas wie eine Quadrofonie-Anlage mit zusätzlichem Mittenlautsprecher und einem Tiefbasslautsprecher.
Jetzt habe ich nicht die Ganze Wahrheit erzählt. Erstens: sind die 4 Hauptlautsprecher nicht auf den Ecken eines Quadrates, sondern auf einem Kreis liegend gleich weit von seinem Nachbarn voneinander entfernt angeordnet und der Center-Lautsprecher ist vorne in der Mitte zwischen den beiden Front-Lautsprechern ebenfalls auf diesem Kreis angeordnet. Diese Anordnung hat zur Folge, daß ALLE Lautsprecher gleich weit von dem Zuhörer entfernt sind und nicht nur die vier Hauptlautsprecher (sonst wäre der Center-Lautsprecher etwas näher an der Person als die beiden Frontlautsprecher). Wo der Basslautsprecher angeordnet wird, ist eher unerheblich, da aus der Physik bekannt ist, daß tiefe Frequenzen nicht so leicht ortbar sind. Zweitens: wird das Signal aus den hinteren Lautsprechern etwas verzögert wiedergegeben. Dieses geschieht mehr oder weniger aus Gehörphysiologischen Gründen. Dieses soll im Groben für die Arbeitsweise von 5.1 genügen. Wichtig ist hier noch einmal, festzuhalten, daß man für 5.1 also sechs einzelne Wiedergabekanäle benötigt.

Wie funktioniert nun Dolby-Surround-Pro-Logic (im folgenden DD genannt):
Es war das Bestreben der Entwickler, ein fünfkanaliges System (DD) mit Hilfe von bestehenden Wiedergabeverfahren zu übertragen. Das bestehende einfache Verfahren war STEREO. Durch dieses Stereo (wir erinnern uns, es sind zwei Kanäle) wird nun das DD hindurchgepresst, im wahrsten Sinne des Wortes.
DD besteht in Wirklichkeit aus vier mehr oder weniger abhängigen Kanälen:

Vorne LINKS = FL
Vorne RECHTS = FR
Vorne MITTE = C
Hinten Links und Rechts = RL und RR , diese beiden Kanäle haben exakt das gleiche Signal
und werden oft auch als Surround-Kanal bezeichnet.
Hinten können wir also keine unterschiedlichen Signale wiedergeben

Diese vier Kanäle werden nun mit Hilfe einer Matrix auf die beiden Stereo-Kanäle aufgeteilt:

Betrachten wir jetzt die vier Kanäle im einzelnen:

FL: dieser Kanal wird einfach im linken Stereo-Kanal untergebracht, und nur dort! Ist das Signal im Kanal FL mit 100% Vollaussteuerung, also mit 1 für 100%, vorhanden, so ist dieses Signal auch im linken Stereo-Kanal mit 1 vorhanden.

FR: für diesen Kanal gilt gleiches, nur alles für Rechts.

C: für den Center-Kanal müssen wir etwas Theorie machen: Wir nehmen mal an, wir haben ein Signal in einem Kanal mit Vollaussteuerung, es hat also 100% oder eben 1. Wenn wir dieses Signal auch in einem anderen Kanal haben, es also zwei mal vorhanden ist, so haben wir zwei mal das gleiche Signal, also 200% oder eben 2. Wir haben dann eine Verdoppelung des Signals. In der Elektroakustik wird eine Verdoppelung des Originalsignales (in diesem Falle) mit 6 dB angegeben. Ist also das gleiche Signal mit gleicher Amplitude zwei mal vorhanden, und wir wollen dieses Signal aber nur mit der Lautheit von 100%, also mit 1, hören, so muß jedes der beiden Signale um einen Betrag von 3 dB verringert werden (oder es muß um -3 dB verstärkt werden).
Nun wieder zurück zu DD.
Für das FL-Signal haben wir schon den linken Stereo-Kanal verbraten. Für das FR-Signal den rechten Stereo-Kanal verbraucht. Wo soll der Ton, der im DD-Center-Kanal ist, untergebracht werden. Da haben wir einen Trick zur Hand. Das Center-Signal wird im linken und im rechten Stereo-Kanal untergebracht. Es ist im linken und im rechten Kanal gleich laut. ABER: jetzt haben wir ein Problem. Das Center-Signal ist zwei mal vorhanden. Richtig! In jedem Stereo-Kanal, also im rechten und im linken senken wir das Center-Signal jeweils genau um 3 dB ab. Wenn wir jetzt eine sogenannte Summenbildung aus den beiden Stereo-Kanälen machen, voila! haben wir wieder unser 100%-Center-Kanal-Signal wiedergewonnen.
Doch das nächste Problem taucht am Horizont auf. Wir bekommen wir das FL-Signal und das Center-Signal und ebenfalls das FR-Signal und das Center-Signal voneinander getrennt. Wir erinnern uns: In dem linken Stereo-Kanal war ja schon das FL-Signal untergebracht, für rechts gilt das gleiche analog.
Da greifen wir wieder in die mathematische Trickkiste:
Wir schauen gleichzeitig in den linken und in den rechten Stereo-Kanal. Alle Signale, die in beiden Kanälen gleich sind, können nur zu dem Center-Kanal gehören. Also, alles was rechts und links gleich ist , ist der Center-Signal. Dieses haben wir jetzt eindeutig bestimmt. Und alles was zum Center-Signal gehört, geben wir erstens: um 6 dB reduziert auf den Verstärker für den Mitten-Lautsprecher (wir erinnern uns, wir haben ja das Center-Signal zwei mal, also müssen wir das um 6 dB reduzieren) und zweitens: das drehen wir in der Phase um 180 Grad und mischen es wieder jeweils dem linken Stereo-Kanal und gleichzeitig dem rechten Stereo-Kanal hinzu (hier machen wir im Grunde eine Subtraktion des Center-Signales von jeweils den Stereo-Kanälen).
Da wir jetzt von den Stereo-Kanälen jeweils das Center-Signal abgezogen haben, haben wir, der geneigte Leser wird es jetzt schon erahnen, wieder die originalen FL- und FR-Signale einzeln vorliegen. Diese werden an die FL- und FR-Verstärker weitergeleitet.

So, wir haben bis hier her die FL-, FR- und das Center-Signal aus den beiden Stereo-Kanälen wiedergewonnen.
Aber wo haben wir das rückwärtige Signal für RL und RR, welche ja genau gleich sind?
Da greifen wir noch etwas tiefer in die Trickkiste der Mathematik:
RL und RR bezeichne ich ab hier nur mit "Hinten".
Das Hinten wird in beiden Stereo-Kanälen gleichzeitig und gleich laut mit 100%, also mit gleicher Amplitude 1, untergebracht. Aber im linken Stereo-Kanal um +90 Grad gedreht, also hier +0,5 verschoben! Und im rechten Stereo-Kanal um -90 Grad gedreht, also hier -0,5 verschoben! Würden die beiden Stereo-Kanäle nur das Hinten beinhalten und würden wir die beiden Kanäle zusammenführen, also eine Summation dieser beiden Kanäle durchführen, so wäre das Ergebnis .... NULL. Weil ja +0,5 und -0,5 = 0 ist. Bei der Wiedergabe müssen wir also den linken Stereo-Kanal wieder um -90 Grad und den rechten Stereo-Kanal um +90 Grad in der Phase drehen und mit dem linken Stereo-Kanal zusammenführen. Wir denken wieder daran, daß zwei Kanäle mit gleichem Signal zusammengeführt wieder um 6 dB zu Laut ist! Also wird hier wieder um 6 dB abgesenkt (oder um -6 dB verstärkt). Dieses Signal führen wir den beiden Verstärkern für RL und RR gleichzeitig zu.
Aber wir haben ein Problem!
So gut wie immer enthalten die beiden Stereo-Kanäle nie das Hinten alleine!
Wir erinnern uns:
Im linken Stereo-Kanal ist bereits FL mit 100% und Center mit 100% -3 dB vorhanden
Im rechten Stereo-Kanal ist bereits FR mit 100% und Center mit 100% -3 dB vorhanden
Jetzt kommen im:
linken Stereo-Kanal noch das Hinten mit 100% -3 dB + 90 Grad phasengedreht dazu und im
rechten Stereo-Kanal noch das Hinten mit 100% -3 dB - 90 Grad phasengedreht dazu!

Stereo-Links enthält: FL + -3 dB C + -3 dB RL+RR
Stereo-Rechts enthält: FR + -3 dB C - -3 dB RL+RR (das Minus hinter dem C kommt durch die -90 Grad Phasenverschiebung des "Hinten")

Das wäre eigentlich das Ende der Geschichte! Aber die Physik ist etwas komplizierter! Durch Randbedingungen sind die einzelnen Signale FL, FR, C, RL, RR nicht absolut voneinander zu trennen! Daher werden Verfahren zur dynamischen Trennung dieser Signale herangezogen. Zusätzlich werden die Signale RL und RR in der Bandbreite begrenzt (100Hz - 7kHz)(wir erinnern uns, es ist das "Hinten") und um 15 ms verzögert in den Stereo-Kanälen untergebracht. (15 Millisekunden ergeben etwa 5 Meter) Das macht man aus Rücksicht auf Standard-Wohnzimmer, in denen die hinteren Lautsprecher nicht 5 Meter hinter dem Sofa angeordnet werden können (eine fiese Anmerkung des Autors: bei mir muß ich die Verzögerung wieder rausnehmen!).
Das alles ist im Prinzip die Funktionsweise einer Dolby-Surround-Pro-Logic-Matrix.

So, wir wären am Ende .... mit der gesamten Geschichte.

Aber wir wollten ja über den Aufwand bei der Erstellung des Rohmaterials und der Bearbeitung des Tones reden.

Wie macht man nun Dolby-Surround-Ton!

Erstens: es wird ein Audio-Editor mit mindestens fünf getrennten Spuren benötigt.
Dieser Editor muß die Signale auch um exakt 3 dB absenken können.
Dieser Editor muß die Signale phasenverschieben können.

Jetzt kommt der eigentliche Aufwand!
Da wir Hobbyisten am Aufnahmeort so gut wie nie wirklich fünf oder mehr Mikrofone aufstellen und die Schallereignisse gleichzeitig getrennt voneinander aufzeichnen, müssen wir uns behelfen.

Das Stereo-Signal, welches unsere Kamera liefert, teilen wir mehr oder weniger stark auf die fünf Spuren im Editor auf. Je nachdem, aus welcher Ecke wir den Originalton später bei der Wiedergabe hören wollen. Es hat sich gezeigt, daß das meistens der Center-Kanal ist. Auf die Spur für den Center-Kanal kommt also die Mono-Summe des Stereosignales hin (fast 100%). Auf die Spuren für Vorne-Links und Vorne Rechts kommen also jeweils die Differenzen des Stereo-Signales (je nachdem, welchen Effekt wir hier wollen, auch bis nahezu 100%). Auf die beiden verbleibenden Spuren für Hinten-Links und Hinten-Rechts kommt nichts bis nahezu 100% des Stereo-Signales von der Kamera. Hier müssen wir schon aufpassen! Wenn wir schon das Originalsignal vorne zu nahezu 100% angeordnet haben, so dürfen wir Hinten nicht übertreiben! Außer: man war an einem Ort mit einem Schallereignis, welches die ganze Gegend gleichmäßig beschallt hat, und eher keine Richtungsinformation lieferte. Die Konsequenzen der Abmischung des Originalsignales möchte ich hier jetzt im Einzelnen nicht ausdiskutieren. Wenn jemand so was vorhat, dann kann er sich das im Einzelnen für jede Szene und jeden Augenblick selbst überlegen. Die Ansätze habe ich hier gelegt. Natürlich kann man jetzt mit dem Original-Signal spielen und auch unnatürliche Wiedergabeereignisse absichtlich herbeiführen. Die Möglichkeiten sind hier schier Unendlich.
Aber wir haben noch nicht über den beigemixten Ton gesprochen.
Also Kommentar, Musik, Toneffekte, Atmo. Das kann man sich ebenfalls selbst ausrechnen, wie dort zu verfahren ist. Ein Beispiel sei hier nur erwähnt. einfache Kommentare würden dann logischerweise vom Center-Kanal wiedergegeben, für einen schönen vollen Raumsound dann auch anteilig auf die FL- und FR-Kanäle.

So. Eigentlich wären wir hier jetzt wirklich am Ende.
Aber welchen Editor benutzt man denn nun, um das alles zu bewerkstelligen?
Ganz einfach: wenn man es zu Fuß machen will, einen Editor, der die simplen Voraussetzungen wie oben angegeben, erfüllt.
Oder man leistet sich den Luxus, einen Editor zu fahren, der mit einen Quasi-Joystick gesteuert wird und die einzelnen Signale, getrennt voneinander, virtuell beeinflussen kann.

Wer sich schon einmal theoretisch und / oder praktisch mit all dieser Problematik auseinander gesetzt hat, schaut sich die Kinofilme unter ganz neuen Gesichtspunkten an. Ich habe schon jede Menge Fehler entdeckt, oder unschöne, oder unpassige und unstimmige Dinge zuhauf erfahren müssen. Bis jetzt habe ich aus dieser Sichtweise noch KEINEN Film, kein Surround-Demo, keinen Beitrag in Surround usw. gesehen, der absolut richtig war. Es sind in JEDEM dieser Darbietungen Fehler noch und nöcher drin.
Ich sage es, und Ihr könnt mich für Wahr nehmen und drauf festnageln. Nix war ohne Fehler!!!!! Absolut.

Nur ein Beispiel, unter Tausenden:

Film "Jumandji"

Szene:

Ein Junge rechts im Bild, ein Mädchen links, Breite etwa 5 Meter von der Kamera weg (Anfangsposition).

Zwischen den Beiden ist ein Löwe. Etwa 20 Meter von der Kamera weg, in Bildmitte.

Der Löwe brüllt, ist aus allen drei Lautsprechern vorne zu hören.
Die Kinder sprechen miteinander. Auch diese sind vorne zu hören.

Jetzt Kamerafahrt. Die Kamera fährt durch die beiden Kinder hindurch. Wohlgemerkt, die Kamera zoomt nicht, sondern der Kamera-Dolly fährt zwischen den Kindern durch. Während der Kamerafahrt erzählen die Kinder weiter. Was meint Ihr, wo die Kinder zu hören sind, wenn die Kamera physikalisch etwa 3 Meter vor dem Löwen stehen bleibt? Richtig erraten. IMMER NOCH VON VORN. Und während die Kamera fährt, nähert sich die Kamera
1. zuerst den Kindern an, also muß zuerst der Ton der Kinder geringfügig lauter werden, danach, nach Durchfahrt dann wieder leiser.
2. Der Löwe muß, bei gleichmäßiger Fahrt vorausgesetzt, im Verhältnis immer lauter werden.
3. Umweltgeräusche müssen mitziehen, je nach Position, was fast immer unterbleibt.

Diese Szene ist noch einfach! Bei beschleunigter Kamerapositionsänderung muß der Ton auch nichtlinear mitziehen!
Jetzt kann man sagen, das ist so vom Regisseur gewollt, daß da nix mitzieht. Bei Dialogen, bei denen die Kameraposition ständig wechselt, würde der Ton unruhig werden, ja, logisch. Auch darüber läßt sich kräftig diskutieren.
Es gibt noch unendlich viele Beispiele, Argumente, Gegenargumente etc. pp.

Entweder wir lassen es dabei bewenden, denken uns unser Teil darüber und Schwamm drüber. Jeder kann das machen, was er will.

Aber die im Kino verlangen für solchen Mist echt richtig Geld!!!!!

Und ich wiederhole mich noch mal. Ich habe noch keine Produktion ohne Fehler gesehen!!!!

Ich hoffe, dieser kleine Exkurs hat euch einen unterhaltsamen Einblick in die Welt des Schalles gegeben.

Anregungen und Verbesserungsvorschläge werden gern entgegengenommen.

Roland · 24. Januar 2004

Hallo Surround-Fans!

Für die Berechnung der Lautsprecheraufstellung einer Dolby-Surround-Anlage eine kleine Planungshilfe.

Die findet Ihr unter:

www.rolandneumann.de/cinema/dolby_surround_diagramm.jpg

Viel Spaß bei der Ausführung.