Zum Inhalt springen

Brother Johns Encodingwissen

Wechseln zu: Inhalt, Abkürzungen

Anamorphes Quellvideo

In diesem Kapitel beschäftigen wir uns mit ein bisschen Theorie und hauptsächlich mit dem Bild der DVD, das uns als Quelle dient. Zu wissen, wie genau die DVD Video speichert, ist zentral, um nicht zum Schluss mit Eierköpfen im Encoding dazustehen.

Begriffsdefinitionen

So staubig und lästig es sein mag: Ein zentraler Punkt, um nicht rasant in größte Verwirrung zu stürzen, ist, sich erst einmal über eine Reihe von Begriffen klar zu werden.

Seitenverhältnis
Im Englischen Aspect Ratio, woher die typische Abkürzung AR stammt. Beschreibt die Form eines Videobilds, die entweder in der Notation b:h (z.B. 16:9) oder x:1 (z.B. 1,78:1) angegeben wird. Oft sieht man auch die reine Kommazahl ohne den Zusatz :1. Es gibt mehrere Arten von Seitenverhältnissen.
Display Aspect Ratio (DAR)
Das DAR beschreibt das Seitenverhältnis des kompletten Bildes, stellt also das Verhältnis von Breite zu Höhe dar. Ein Bild mit der Auflösung 640 × 480 Pixel hat (im nicht-anamorphen Fall) ein DAR von 640:480, was gekürzt 4:3 entspricht oder als Kommazahl 1,33:1.
Die Xvid-VfW-Oberfläche hat das DAR früher »Picture Aspect Ratio« genannt (ist inzwischen korrigiert). Bitte davon nicht verwirren lassen.
Pixel Aspect Ratio (PAR)
Das PAR beschreibt das Seitenverhältnis eines einzelnen Pixels. Im Gegensatz dazu, was einem der gesunde Menschenverstand auf Anhieb einredet, ist dieser Wert nicht identisch mit dem DAR. Unser 640 × 480-Beispiel von oben hat ein PAR von 1:1 – die Pixel sind exakt quadratisch.
Vom x264-Encoder wird das PAR als »Sample Aspect Ratio« (SAR) bezeichnet. Bitte auch hiervon nicht verwirren lassen.
Anamorphes Video
Bezeichnet ein Videobild mit nicht-quadratischen Pixeln, also einem PAR ungleich 1:1. In der professionellen, v.a. analogen, Videotechnik ist exakt festgelegt, welche Pixelform für PAL und NTSC anamorph heißt. Alle anderen Verzerrungen werden nicht als anamorph bezeichnet.
Da dieser enge Rahmen für die komplett digitale MPEG-4-Welt kaum von Bedeutung ist, verwenden wir im Encodingwissen eine weiter gefasst Definition für das encodierte Video. Anamorph bedeutet hier tatsächlich lediglich PAR ist nicht 1; weniger technisch ausgedrückt: Das Video ist nicht im korrekten Wiedergabe-Seitenverhältnis, also verzerrt, gespeichert. Wie die Verzerrung genau aussieht, bleibt offen und deshalb frei wählbar.
Bei DVDs spreche ich nicht von anamorphen und nicht anamorphen Filmen, sondern immer von 4:3 und 16:9. So lässt sich die Begriffsverwirrung hoffentlich in Grenzen halten. In freier Wildbahn sollten wir uns beim Begriff »anamorph« immer zuerst darüber klar werden, was in dem Zusammenhang genau gemeint ist.

Sinn des verzerrten Bildes

Wenn es so viele Probleme verursacht, warum wird das Video dann überhaupt verzerrt gespeichert? Das liegt hauptsächlich an zwei Dingen.

Die Auflösung der PAL-DVD hat ein DAR von 1,25. Für die meisten Kinofilme, die in der Region zwischen 1,78 und 2,35 liegen, ist das ein extrem ungünstiger Wert. Bei unverzerrter Speicherung könnte im schlechtesten Fall nur etwa die Hälfte der verfügbaren vertikalen Auflösung ausgenutzt werden, um nicht links und rechts einen Teil des Bildes abschneiden zu müssen.

Das Bild verzerrt zu speichern, bietet die Möglichkeit, eine große Vielfalt von Seitenverhältnissen in der DVD-Auflösung unterzubringen und trotzdem so wenig wie möglich wertvolle vertikale Auflösung zu opfern.

Das Bild der DVD

Das Bild einer PAL-DVD ist mit einer Auflösung von 720 × 576 gespeichert ist. Für NTSC gelten 720 × 480. Die Auflösung ist fix, egal welchen Film wir darin verpacken. Wir können nur zwischen zwei Arten der Verzerrung wählen: 4:3 (wenig verzerrt) und 16:9 (stark verzerrt, entsprechend der professionellen Definition von »anamorph«) Daraus ergibt sich: Mit einer DVD als Quelle müssen wir immer eine Verzerrung berücksichtigen, denn das Bild hat nie das richtige Wiedergabe-Seitenverhältnis.

Betrachten wir das Bild der DVD etwas mehr im Detail. Als Beispiel nehmen wir Die fabelhafte Welt der Amélie, die praktischerweise nicht kopiergeschützt ist. Der Film ist mit einem Seitenverhältnis von 2,35 gedreht, muss aber mit dem vorgegebenen 1,78 einer 16:9-DVD auskommen. Die ungenutzte Auflösung wird einfach mit schwarzen Balken aufgefüllt, so dass Frame Nummer 27.661 so aussieht (alle folgenden Screenshots sind verkleinert):

DVD-Frame horizontal gestaucht: 720x576 mit je 70 Pixel Balken oben und unten.

Möglich wäre es auch, das gleiche Bild in einer 4:3-DVD unterzubringen. Das würde weniger Verzerrung, größere Balken und weniger wertvolle vertikale Auflösung bedeuten. In der Anfangszeit der DVD wurden solche Sünden häufiger begangen (die erste Ausgabe von Titanic z.B.). Heutzutage begegnet man so etwas auf professionellen DVDs zum Glück nicht mehr.

Beim Abspielen muss nun das Video entzerrt werden. Dazu streckt der Decoder das Bild horizontal so weit, bis das Seitenverhältnis passt. Für eine 16:9-PAL-DVD ergeben sich 1047 Pixel in der Horizontalen. Unser Amélie-Beispiel sieht dann so aus:

Entzerrtes Frame 1047x576

Für Filme, die nicht im Widescreen-Format gedreht sind, sieht die Sache ähnlich aus. Nehmen wir die Simpsons als Beispiel, die passend für den traditionellen Fernseher mit einem AR von 1,33 produziert werden. Dieses Verhältnis kommt der Auflösung der DVD (AR 1,25) recht nahe und wird deshalb mit der 4:3-Verzerrungsvariante gespeichert. Das sieht dann so aus:

DVD-Frame horizontal gestaucht: 720x576 (keine Balken)

Schwarze Balken gibt es bei 4:3-Material, wenn überhaupt, nur minimal. Im Beispiel sind nur die Ränder des Bildes ein wenig unsauber.

Falls jemand ins Grübeln kommt. Das Bild stammt aus Season 4: Maggies Mission-Impossible-Einlage in A Streetcar Named Marge. Welche Framenummer, habe ich nicht aufgepasst.

Bei der Wiedergabe passiert das gleiche wie im 16:9-Fall. Der Decoder streckt das Bild auf die korrekte Breite.

Entzerrtes Frame 785x576

Im Vergleich zur Amélie muss man die beiden Maggie-Versionen schon genauer unter die Lupe nehmen, um den Unterschied zu sehen. Am deutlichsten wird die Verzerrung an den Augen, die simpsonstypisch kreisrund sein müssen.

Zentrale Bedeutung des PAR

Jetzt stellt sich sicherlich die Frage, wie man die zur Wiedergabe nötige horizontale Auflösung ermittelt. Dafür ist das Pixel Aspect Ratio zuständig. Erinnern wir uns: das PAR beschreibt die korrekte Form eines einzelnen Pixels zum Zeitpunkt der Wiedergabe. Man könnte auch sagen, das PAR beschreibt, wie rechteckig die Pixel sein müssen. Es gibt nur vier Werte. Für PAL und NTSC je einen für 16:9 und 4:3.

PAR nach MPEG-4
  PAL NTSC
4:3 12/11 10/11
16:9 16/11 40/33

Mit dem richtigen Wert aus dieser Tabelle lassen sich die Pixel des Bildes so weit in die Breite ziehen, dass das Seitenverhältnis passt. Allerdings kann ein Computermonitor ausschließlich quadratische Pixel darstellen. Anstatt also die Form der Pixel zu verändern, erhöhen wir in der Horizontalen die Anzahl der Pixel, um den gleichen Entzerrungseffekt zu erhalten.

Dass ein Computermonitor ausschließlich quadratische Pixel darstellen kann, gilt genau genommen nur für TFTs. Röhrenmonitore (CRT) sind theoretisch zu jeder beliebigen Auflösung und Pixelform fähig. Nur arbeiten alle Standard-Desktopauflösungen mit quadratischen Pixeln.

Fast alle. Eine populäre Ausnahme ist die 1280 × 1024 auf einem CRT. Die Bildröhre des Monitors hat ein Seitenverhältnis von 1,33. Die 1280er Auflösung kommt auf ein Seitenverhältnis von 1,25. Die Abmessungen der Röhre und die Auflösung passen nicht zusammen, was zu rechteckigen Pixeln führt.

Heißt das nicht, dass man eigentlich alles leicht gequetscht sieht, wenn man am CRT mit 1280 × 1024 arbeitet? Ja. Die richtige, nicht verzerrte (quadratische), Auflösung wäre 1280 × 960. Das gilt nicht bei TFTs. Für die Modelle mit 1280 × 1024 als nativer Auflösung hat man die Abmessungen des Panels angepasst, so dass wieder quadratische Pixel entstehen.

Ok, zurück zu unserem Film. Die passende horizontale Auflösung auszurechnen, ist anhand der Tabelle sehr einfach. Wir müssen nur den zur DVD passenden Wert ablesen und in diese Formel einsetzen:

hor. Wiedergabeauflösung = hor. DVD-Auflösung × PAR

Für die Amélie müsste die Rechnung dem Beispiel oben zufolge 1047 Pixel ergeben. Und das tut sie auch.

hor. Wiedergabeauflösung = 720 × 16/11 = 1047,27

Wer aufmerksam mitrechnet, dürfte spätestens jetzt die Stirn runzeln. Unsere Zielauflösung enthält 1047 × 436 Pixel echtes Bild (ohne Balken), was einem Seitenverhältnis (hier das Display Aspect Ratio, DAR) von 2,40 entspricht. Trotzdem heißt es oben, der Film wäre in 2,35 gedreht?

Das stimmt auch. Der Unterschied entsteht, weil wir mit den Werten in der PAR-Tabelle dem MPEG-4-Standard folgen (der sich wiederum sehr eng an ITU-R BT.601 anlehnt). Dieser fordert ein etwas breiteres Bild als die weithin bekannten Werte. Die folgende Tabelle bietet einen Vergleich von »Standard-DAR« und ITU/MPEG-4-DAR.

bekanntes DAR DAR nach MPEG-4
1,33 (4:3) 1,36
1,78 (16:9) 1,82
1,85 1,89
2,35 2,40

Um keine Zweifel aufkommen zu lassen: Diese Art der Entzerrung ist zu empfehlen, und zwar unabhängig vom Wiedergabegerät. Die ITU-Empfehlung zu ignorieren ist nur dann sinnvoll, wenn wir genau wissen, dass unsere DVD nicht nach dem Standard gemastert wurde.

Wie genau die einzelnen PARs zustande kommen und welche Bedeutung das generische Nicht-ITU-PAR tatsächlich hat, damit beschäftigt sich das Spezialkapitel zur ITU-R BT.601 ausführlich. Für das DVD-Backup bringen uns diese Details keinen unmittelbaren Nutzen, weshalb ich das Kapitel eher als Bettlektüre hinterher vorschlage.

Kaffeepause

Die eine Hälfte des Anamorph-Themas ist geschafft. Im nächsten Kapitel beschäftigen wir uns damit, ob und wie wir das verzerrte Bild im encodierten Film beibehalten. Und obwohl das etwas leichtere Kost ist als dieses Kapitel, ist eine Kaffeepause an dieser Stelle eine gute Idee. Immerhin gehört die Anamorph-Thematik neben Interlacing zum schwierigsten, was digitales Video zu bieten hat.