Zum Inhalt springen

Brother Johns Encodingwissen

Wechseln zu: Inhalt, Abkürzungen

Anamorphes Quellvideo

In diesem Abschnitt beschäftigen wir uns mit ein bisschen Theorie und hauptsächlich mit dem Bild der DVD, das uns als Quelle dient. Zu wissen, wie genau die DVD Video speichert, ist zentral, um nicht zum Schluss mit Eierköpfen im Encoding dazustehen.

Was ist eigentlich ein Pixel?

Im Computeralltag gehen wir ohne nachzufragen davon aus, dass ein Pixel ein fest definiertes Etwas ist. Das stimmt auch soweit, dass es sich dabei um die kleinste ansprechbare Einheit eines Bildschirms oder Pixelbildes handelt. Was nicht so klar ist und den Grund für das Anamorph-Problem bildet, ist die Form eines Pixels.

Für die Computerwelt gilt heutzutage, dass Pixel immer quadratisch sind. Für die DVD dagegen gilt, dass Pixel niemals quadratisch sind, sondern rechteckig, meistens breiter als hoch. Da wir die Welt aus Sicht des Computerpixels sehen, ist das Bild auf der DVD in verzerrter Form gespeichert. Wenn wir es in seiner ursprünglichen Auflösung unverändert anzeigen, hat das Eierköpfe zur Folge.

Da auch unser Zielformat MPEG-4 mit unterschiedlich geformten Pixeln arbeiten kann, reicht die Frage nach der Auflösung des Bildes nicht aus. Wir müssen gleichzeitig immer auch nach der Form der Pixel fragen. In den Details kann das in Stress ausarten, wie wir gleich sehen werden.

Dass ein Computermonitor ausschließlich quadratische Pixel darstellen kann, gilt genau genommen nur für Flachbildschirme (TFT). Röhrenmonitore (CRT) sind theoretisch zu jeder beliebigen Auflösung und Pixelform fähig. Nur arbeiten alle Standard-Desktopauflösungen mit quadratischen Pixeln.

Fast alle. Eine populäre Ausnahme ist die 1280×1024 auf einem CRT. Die Bildröhre des Monitors hat ein Seitenverhältnis (Breite:Höhe) von 1,33:1. Die 1280er Auflösung kommt auf ein Seitenverhältnis von 1,25:1. Die Abmessungen der Röhre und die Auflösung passen nicht zusammen, was zu rechteckigen Pixeln führt.

Heißt das nicht, dass man eigentlich alles leicht gequetscht sieht, wenn man am CRT mit 1280×1024 arbeitet? Ja. Die richtige, nicht verzerrte (quadratische) Auflösung wäre 1280×960. Das gilt nicht bei TFTs. Für die Modelle mit 1280×1024 als nativer Auflösung hat man die Abmessungen des Panels angepasst, so dass wieder quadratische Pixel entstehen.

Begriffsdefinitionen

So staubig und lästig es sein mag: Ein zentraler Punkt, um nicht rasant in größte Verwirrung zu stürzen, ist, sich erst einmal über eine Reihe von Begriffen klar zu werden.

Seitenverhältnis
Im Englischen Aspect Ratio, woher die typische Abkürzung AR stammt. Beschreibt die Form eines Videobilds oder Pixels als Verhältnis von Breite zu Höhe, das entweder in der Notation b:h (z.B. 16:9) oder x:1 (z.B. 1,78:1) angegeben wird. Oft sieht man auch die reine Kommazahl ohne den Zusatz :1. Es gibt mehrere Arten von Seitenverhältnissen.
Display Aspect Ratio (DAR)

Das DAR beschreibt das Seitenverhältnis des kompletten Bildes, stellt also das Verhältnis von horizontaler Auflösung (Breite) zu vertikaler Auflösung (Höhe) dar. Was genau »komplettes Bild« bedeutet, ist nicht festgelegt.

Beispiel: Ein Bild mit der Auflösung 640×480 und quadratischen Pixeln (z.B. ein klassisches DivX-Encoding) hat ein DAR von 640:480, was gekürzt 4:3 entspricht oder als Kommazahl 1,33:1.

Die Xvid-VfW-Oberfläche hat das DAR früher »Picture Aspect Ratio« genannt. Das ist schon lange korrigiert, kann aber in älteren Anleitungen noch auftauchen. Bitte davon nicht verwirren lassen.

Pixel Aspect Ratio (PAR)

Das PAR beschreibt das Seitenverhältnis eines einzelnen Pixels. Im Gegensatz dazu, was einem der gesunde Menschenverstand auf Anhieb einredet, ist dieser Wert nicht identisch mit dem DAR. Unser 640×480-Beispiel von oben hat ein PAR von 1:1 – die Pixel sind exakt quadratisch.

Das PAR ist unser Seitenverhältnis der Wahl, mit dem wir beim DVD-Backup tatsächlich arbeiten.

Sample Aspect Ratio (SAR)
Hierbei handelt es sich im eine alternative Bezeichnung für das PAR, die aus dem H.264-Standard stammt. Außer dem Namen gibt es keinen Unterschied zwischen PAR und SAR.
Anamorphes Video

Es gibt zwei Definitionen für den Begriff »anamorph«, die wir leider beide kennen müssen.

  • Digitale Definition: Anamorph heißt jedes verzerrt gespeicherte Videobild. Das trifft auf alle Videos mit einem PAR ungleich 1:1 (d.h. nicht-quadratischen Pixeln) zu. Die Stärke der Verzerrung spielt keine Rolle.
  • Analoge Definition (aus der analogen Profi-Videotechnik stammend): Anamorph heißt nur genau eine spezielle Variante des verzerrten Bildes, nämlich das, was auf der DVD mit »16:9 anamorph« bezeichnet wird.

Für unser digitales MPEG-4-Endprodukt ist die analoge Definition Unsinn, weil nur die Frage »quadratisch oder nicht« relevant ist. Die Stärke der Verzerrung spielt keine Rolle. Entsprechend hat sich dafür der Begriff »anamorph« in der digitalen Definition eingebürgert. Für die DVD wird aber sehr verbreitet die analoge Definition verwendet. Das führt dazu, dass eine 4:3-DVD »nicht-anamorph« heißt, obwohl sie trotzdem keine quadratischen Pixel hat.

In freier Wildbahn werden die beiden Definitionen wild durcheinander gewürfelt. Deswegen sollten wir uns immer zuerst darüber klar werden, was im jeweiligen Zusammenhang gemeint ist. Für das Encodingwissen gilt ausschließlich die digitale Regel, d.h. jedes Video mit nicht-quadratischen Pixeln heißt »anamorph«. Bei DVDs spreche ich passend dazu nicht von anamorphen und nicht anamorphen Filmen, sondern immer von 16:9 und 4:3. So lässt sich die Begriffsverwirrung hoffentlich in Grenzen halten.

Sinn des verzerrten Bildes

Wenn es so viele Probleme verursacht, warum wird das Video dann überhaupt verzerrt gespeichert? Das liegt hauptsächlich an zwei Dingen.

Die Auflösung der PAL-DVD hat ein DAR von 1,25. Für die meisten Kinofilme, die in der Region zwischen 1,78 und 2,35 liegen, ist das ein extrem ungünstiger Wert. Bei unverzerrter Speicherung könnte im schlechtesten Fall nur etwa die Hälfte der verfügbaren vertikalen Auflösung ausgenutzt werden, um nicht links und rechts einen Teil des Bildes abschneiden zu müssen.

Das Bild verzerrt zu speichern, bietet die Möglichkeit, eine große Vielfalt von Seitenverhältnissen in der DVD-Auflösung unterzubringen und trotzdem so wenig wie möglich wertvolle vertikale Auflösung zu opfern.

Das Bild der DVD

Das Bild einer PAL-DVD ist mit einer Auflösung von 720×576 gespeichert. Für NTSC gelten 720×480. Die Auflösung ist fix, egal welchen Film wir darin verpacken. Wir können nur zwischen zwei Arten der Verzerrung wählen: 4:3 (wenig verzerrt) und 16:9 (stark verzerrt, entsprechend der analogen Definition von »anamorph«). Daraus ergibt sich: Mit einer DVD als Quelle müssen wir immer eine Verzerrung berücksichtigen, denn das Bild hat nie das richtige Wiedergabe-Seitenverhältnis.

Betrachten wir das Bild der DVD etwas mehr im Detail. Als Beispiel nehmen wir Die fabelhafte Welt der Amélie. Der Film ist mit einem Seitenverhältnis von 2,35 gedreht, muss aber mit dem vorgegebenen 1,78 einer 16:9-DVD auskommen. Die ungenutzte Auflösung wird einfach mit schwarzen Balken aufgefüllt, so dass Frame Nummer 27.661 so aussieht (alle folgenden Screenshots sind verkleinert):

DVD-Frame horizontal gestaucht: 720x576 mit je 70 Pixel Balken oben und unten.

Möglich wäre es auch, das gleiche Bild in einer 4:3-DVD unterzubringen. Das würde weniger Verzerrung, größere Balken und weniger wertvolle vertikale Auflösung bedeuten. In der Anfangszeit der DVD wurden solche Sünden häufiger begangen (die erste Ausgabe von Titanic z.B.). Heutzutage begegnet man so etwas auf professionellen DVDs zum Glück nicht mehr.

Beim Abspielen muss nun das Video entzerrt werden. Dazu streckt der Decoder das Bild horizontal so weit, bis das Seitenverhältnis passt. Für eine 16:9-PAL-DVD ergeben sich 1047 Pixel in der Horizontalen. Unser Amélie-Beispiel sieht dann so aus:

Entzerrtes Frame 1047x576

Für Filme, die nicht im Widescreen-Format gedreht sind, sieht die Sache ähnlich aus. Nehmen wir die Simpsons als Beispiel, die passend für den traditionellen Fernseher mit einem AR von 1,33 produziert werden. Dieses Verhältnis kommt der Auflösung der DVD (AR 1,25) recht nahe und wird deshalb mit der 4:3-Verzerrungsvariante gespeichert. Das sieht dann so aus:

DVD-Frame horizontal gestaucht: 720x576 (keine Balken)

Schwarze Balken gibt es bei 4:3-Material, wenn überhaupt, nur minimal. Im Beispiel sind nur die Ränder des Bildes ein wenig unsauber.

Falls jemand ins Grübeln kommt. Das Bild stammt aus Season 4: Maggies Mission-Impossible-Einlage in A Streetcar Named Marge. Welche Framenummer, habe ich nicht aufgepasst.

Bei der Wiedergabe passiert das gleiche wie im 16:9-Fall. Der Decoder streckt das Bild auf die korrekte Breite.

Entzerrtes Frame 785x576

Im Vergleich zur Amélie muss man die beiden Maggie-Versionen schon genauer unter die Lupe nehmen, um den Unterschied zu sehen. Am deutlichsten wird die Verzerrung an den Augen, die simpsonstypisch kreisrund sein müssen.

Zentrale Bedeutung des PAR

Jetzt stellt sich sicherlich die Frage, wie man die zur Wiedergabe nötige horizontale Auflösung ermittelt. Dafür ist das Pixel Aspect Ratio zuständig. Erinnern wir uns: das PAR beschreibt die korrekte Form eines einzelnen Pixels zum Zeitpunkt der Wiedergabe. Man könnte auch sagen, das PAR beschreibt, wie rechteckig die Pixel sein müssen. Es gibt nur vier Werte. Für PAL und NTSC je einen für 16:9 und 4:3.

PAR nach MPEG-4
  PAL NTSC
4:3 12/11 10/11
16:9 16/11 40/33

Mit dem richtigen Wert aus dieser Tabelle lassen sich die Pixel des Bildes so weit in die Breite ziehen, dass das Seitenverhältnis passt. Allerdings kann ein Computermonitor ausschließlich quadratische Pixel darstellen. Anstatt also die Form der Pixel zu verändern, erhöhen wir in der Horizontalen die Anzahl der Pixel, um den gleichen Entzerrungseffekt zu erhalten.

Die passende horizontale Auflösung auszurechnen, ist anhand der Tabelle sehr einfach. Wir müssen nur den zur DVD passenden Wert ablesen und in diese Formel einsetzen:

hor. Wiedergabeauflösung = hor. DVD-Auflösung×PAR

Für die Amélie müsste die Rechnung dem Beispiel oben zufolge 1047 Pixel ergeben. Und das tut sie auch.

hor. Wiedergabeauflösung = 720×16/11 ≈ 1047,27

Wer aufmerksam mitrechnet, dürfte spätestens jetzt die Stirn runzeln. Unsere Zielauflösung enthält 1047×436 Pixel echtes Bild (ohne Balken), was einem Seitenverhältnis (hier das Display Aspect Ratio, DAR) von 2,40 entspricht. Trotzdem heißt es oben, der Film wäre in 2,35 gedreht?

Das stimmt auch. Der Unterschied entsteht, weil wir mit den Werten in der PAR-Tabelle dem MPEG-4-Standard folgen (der sich wiederum sehr eng an ITU-R BT.601 anlehnt). Dieser fordert ein etwas breiteres Bild als die weithin bekannten Werte. Die folgende Tabelle bietet einen Vergleich von ITU/MPEG-4-DAR und allgemein bekanntem »Standard-DAR«.

bekanntes DAR DAR nach MPEG-4
1,33 (4:3) 1,36
1,78 (16:9) 1,82
1,85 1,89
2,35 2,40

Um keine Zweifel aufkommen zu lassen: Diese Art der Entzerrung ist zu empfehlen, und zwar unabhängig vom Wiedergabegerät. Die ITU-Empfehlung zu ignorieren ist nur dann sinnvoll, wenn wir genau wissen, dass unsere DVD nicht nach dem Standard gemastert wurde.

Wie genau die einzelnen PARs zustande kommen und welche Bedeutung das generische Nicht-ITU-PAR tatsächlich hat, damit beschäftigt sich das Spezialkapitel zur ITU-R BT.601 ausführlich. Für das DVD-Backup bringen uns diese Details keinen unmittelbaren Nutzen, weshalb ich das Kapitel eher als Bettlektüre hinterher vorschlage.

Kaffeepause

Die eine Hälfte des Anamorph-Themas ist geschafft. Im nächsten Kapitel beschäftigen wir uns damit, ob und wie wir das verzerrte Bild im encodierten Film beibehalten. Und obwohl das etwas leichtere Kost ist als dieses Kapitel, ist eine Kaffeepause an dieser Stelle eine gute Idee. Immerhin gehört die Anamorph-Thematik neben Interlacing zum schwierigsten, was digitales Video zu bieten hat.