Nicht nur auf der DVD, sondern auch im fertigen MPEG-4-Film wird anamorphe Speicherung immer beliebter. Da die Methode noch relativ neu ist, und um entscheiden zu können, wann ein anamorphes MPEG-4-Bild überhaupt sinnvoll ist, brauchen wir vor dem Praxisteil ein paar Hintergrundinfos.
Was nun an Zahlen folgt, kann ein wenig von den idealen Werten aus dem letzten Kapitel abweichen. Schuld daran ist eine Eigenart des Encodingverfahrens. MPEG-4-Codecs arbeiten nicht mit einzelnen Pixeln, sondern mit 16 × 16 Pixel großen Makroblocks. Auflösungen, die sich nicht komplett in vollständige Makroblocks aufteilen lassen, werfen zwar keinen modernen Codec aus der Bahn, senken aber die Effizienz der Kompression und damit die Qualität. Deswegen sollte die Zielauflösung immer sowohl horizontal als auch vertikal glatt durch 16 teilbar sein (Mod16-Kriterium).
Dass anamorphes MPEG-4 immer beliebter wird, obwohl es einige Tücken birgt, hat einen einfachen Grund: Bildqualität. Als Beispiel taugt Die wunderbare Welt der Amélie wieder bestens, deren korrektes Wiedergabe-DAR abzüglicher der Balken in der 2,35er-Region liegt. Croppen wir die Balken unter Berücksichtigung des Mod16-Kriteriums, bleiben von den 720 × 576 Pixeln der DVD noch 704 × 432 übrig, was einem Seitenverhältnis von 1,63 entspricht und heftige Eierköpfe beim Anschauen zur Folge hat. Um das zu beheben, sind zwei Möglichkeiten denkbar.
Horizontal Strecken. Das ist die gleiche Methode, die auch der DVD-Player anwendet. Um korrekt zu entzerren, müssen wir mit Hilfe des ITU-PARs das Bild auf 1024 × 432 Pixel in die Breite ziehen, womit wir allerdings eine beachtliche Anzahl Pixel pro Bild encodieren, die im Originalbild gar nicht vorhanden waren und deshalb keine echten Informationen tragen. Die Verschwendung ist beachtlich. Das gecroppte Originalbild enthält
704 × 432 = 304.128 Pixel.
Das entzerrte Bild enthält
(1024 – 704) × 432 = 138.240 zusätzliche Pixel.
Das heißt, wir encodieren 45 % mehr als eigentlich nötig, was an sich noch nicht extrem schlimm wäre. Allerdings enthalten diese 45 % zusätzliches Bild genau 0 % zusätzliche Details. Dazu kommt, dass das sehr große Bild die CPU beim Abspielen nicht gerade wenig beansprucht. Ältere Rechner stoßen da schnell an ihre Grenzen. Zum anderen sind diese Abmessungen selbst für ein 2-CD-Encoding schlicht zu groß, um gute Qualität zu erreichen.
Als Lösung bietet sich das anamorphe Bild an. Es verwirft keine wichtigen vertikalen Informationen und hält die Bildgröße in einem akzeptablen Rahmen. Inzwischen ist auch die Unterstützung von Encoder- und Decoderseite gut genug, so dass man anamorphe Encodings als alltagstauglich ansehen kann. Lediglich Standalone-Player verstehen anamorphes MPEG-4 nicht.
Als Haupteinsatzgebiet bietet sich klar das hochqualitative Encoding an, das die volle Auflösung (bis auf die schwarzen Balken) einer DVD beibehält. Stark komprimierte 1-CD-Filme profitieren weniger, da sie sowieso Details in Form von Auflösung opfern müssen, um weit genug geschrumpft werden zu können. Mein erster Eindruck ist, dass in diesem Bereich der Unterschied zwischen anamorph und nicht-anamorph nur gering ausfällt. Ein paar intensivere Tests könnten allerdings nicht schaden, um das zu bestätigen.
Ein anamorphes MPEG-4-Video kann grundsätzlich auf drei verschiedene Arten erzeugt werden, immer mit der DVD als Quelle im Hinterkopf.
Klar die sinnvollste Möglichkeit ist Cropping ohne Resizing, worauf wir uns im Rest des Encodingwissens auch konzentrieren. Die Frage stellt sich nun, wie wir dem Decoder mitteilen, dass er es mit einem anamorphen Bild zu tun hat.
Was der Decoder für eine korrekte Entzerrung benötigt ist die Angabe des passenden Wiedergabe-Seitenverhältnisses. Zur Erinnerung: Uns stehen zwei – im Ergbenis grundsätzlich identische – Möglichkeiten zur Verfügung, um ein Seitenverhältnis anzugeben.
Für DVD-Quellen ist das PAR interessanter als das DAR. Der Nachteil des DAR liegt darin, dass es sich ändert, je nachdem, wie viel schwarze Balken wir wegschneiden müssen. Das heißt, das DAR kann für jeden Film unterschiedlich sein und muss natürlich jedes Mal neu berechnet werden. Praktisch liegen die Werte zwar eng beieinander, nur sollten wir uns darauf nicht blind verlassen.
Im Gegensatz dazu gibt es für das PAR nur vier mögliche Werte, und zwar 16:9 und 4:3 jeweils für PAL und NTSC. Da uns DGIndex alle nötigen Informationen liefert, brauchen wir an der passenden Stelle nur diese Infos einsetzen. Das Cropping allein ändert nichts an der Form der einzelnen Pixel. Die sehen also im encodierten Video genauso aus wie auf der Quell-DVD.
Ein klassisches, nicht anamorph encodiertes, DVD-Backup hat immer ein PAR von 1:1 und ein DAR von »Bildbreite zu Bildhöhe«.
Sehen wir uns das an einer kleinen Grafik an, die ein Videobild aus 4 × 4 Pixeln darstellen soll, wie es korrekt entzerrt beim Abspielen aussieht. Das Bild ist nicht quadratisch, da DVD-Pixel eine rechteckige Form haben.
Die Form des gesamten Bilds und die Form eines einzelnen Pixels lässt sich leicht berechnen:
DAR = x:y; PAR = a:b.
Beispiel für eine 16:9-PAL-DVD:
DAR = 1047:576; PAR = 16:11.
Jetzt bearbeiten wir das Bild, indem wir schwarze Balken entfernen. Nehmen wir an, eine Pixelreihe oben und eine Pixelreihe unten, was eine neue Grafik ergibt.
Es gilt noch immer wie oben, allerdings mit kleinerem y:
DAR = x:y; PAR = a:b.
Und für die 16:9-PAL-DVD:
DAR = 1047:432; PAR = 16:11.
Durch das Cropping nimmt natürlich die Höhe des Bildes ab, y wird kleiner. Dadurch verändert sich auch der Wert des DAR, im Beispiel von 1,82 auf 2,42. Auf das PAR hat das Cropping dagegen keine Auswirkung, denn das veränderte DAR beruht nur auf einer verringerten Anzahl Pixelreihen pro Bild, a und b und damit die Form der verbleibenden Pixel, wird nicht angetastet.
Die sinnvollste und einfachste Methode ist, dem Decoder das PAR mitzuteilen, damit er das Video richtig strecken kann. Dafür setzen wir ein AR-Flag in der Zieldatei, das wir uns vereinfacht als standardisiertes Feld vorstellen können, in dem die Angabe zum Seitenverhältnis steht. Der Decoder kennt die Stelle, an der das Flag gespeichert ist, und liest den Wert von dort.
Ein AR-Flag können wir an zwei Stellen setzen.
Im MPEG-4-Videostream. Das ist die Stelle, an die die AR-Information eigentlich gehört. Schließlich ist das Seitenverhältnis eindeutig eine Eigenschaft der Videospur – eine recht zentrale noch dazu. Deshalb sollte – wenn wir eine AR-Info speichern – die immer mindestens im Videostream zu finden sein. Als praktischer Vorteil kommt dazu, dass das MPEG-4-AR-Flag kaum verloren geht, egal was wir in Zukunft vielleicht mit dem Film anstellen.
Da es nur äußerst beschränkt möglich ist, nach dem Encoding noch das Flag im Videostream zu setzen, muss der Encoder selbst diese Funktion anbieten. XviD und x264 tun das, DivX leider nicht. Egal welcher Encoder, das MPEG-4-Flag ist immer das PAR.
Im Container. Das sollten wir als zusätzliche Möglichkeit ansehen, nicht als Ausrede, das Seitenverhältnis nicht im MPEG-4-Stream zu speichern. Bei einem Film mit ausschließlich im Container gesetzten Flag reicht ein sorgloses Re-Muxing, um die AR-Info zu verlieren.
MP4 bietet uns die Möglichkeit, das PAR anzugeben. Matroska dagegen besteht auf dem DAR. Im AVI-Container müssen wir auf ein AR-Flag ganz verzichten.
Sämtliche Flags nützen uns überhaupt nichts, wenn der Decoder keine Unterstützung mitbringt, um mindestens eines davon zu lesen und anzuwenden. Eigentlich sollte hier jetzt eine kleine Tabelle mit einer Übersicht folgen, welcher Decoder welche Art Flag erkennt. Nur hat sich schnell gezeigt, dass heute deutlich mehr Parameter mitspielen als noch vor einem Jahr. Bis ich deshalb die Zeit und Lust finde, einen ausführlichen Test zu veranstalten, empfehle ich zur Wiedergabe: