Brother Johns gesammeltes Encodingwissen
Das beste Beispiel für anamorphes Video ist die DVD. Das dort gespeicherte Bild hat für PAL immer die Abmessungen 720 × 576 Pixel. Das entspricht einem Seitenverhältnis von 720 : 576 = 1,25 = 5:4. Nun besitzt der Film aber eigentlich ein Seitenverhältnis von 16:9 (für 4:3 siehe unten). Das Video ist auf der DVD verzerrt gespeichert: anamorph.
Ursprünglich war der Begriff anamorph nur für eine genau definierte Art der verzerrten Speicherung vorgesehen, was in der professionellen Videotechnik auch nach wie vor so gehandhabt wird. Deshalb nennt Gordian Knot im Resolution-Register 4:3-Filme non anamorphic, weil sie zwar nicht im korrekten Seitenverhältnis auf der DVD liegen, andererseits aber auch nicht unter die »professionelle« Definition von »anamorph« fallen. Die trifft nur auf 16:9-DVDs zu.
Da dieser enge Rahmen für die volldigitale MPEG-4-Welt kaum von Bedeutung ist, verwendet das Encodingwissen eine weiter gefasst Definition für das encodierte Video. Anamorph heißt hier lediglich nicht im korrekten Wiedergabe-Seitenverhältnis, also verzerrt, gespeichert. Wie die Verzerrung genau aussieht, bleibt offen und deshalb frei wählbar.
Dass anamorphes MPEG-4 immer beliebter wird, obwohl es einige Tücken birgt, hat einen einfachen Grund: Bildqualität. Sehen wir uns als kleines Beispiel einen DVD-Film im Seitenverhältnis (Aspect Ratio, kurz AR) 2,35 : 1 an, z. B. die Lord-of-the-Rings-Trilogie. Ursprüngliche Bildabmessungen sind DVD-konforme 720 × 576. Nach dem Wegschneiden der schwarzen Balken sollten noch 720 × 432 Pixel übrig bleiben, was einem AR von 1,67 : 1 entspricht. Das bedeutet heftige Eierköpfe beim Anschauen. Um das zu beheben, sind zwei Möglichkeiten denkbar.
Beide Methoden haben ihre Nachteile. Das nach dem Strecken sehr große Bild beansprucht die CPU beim Abspielen nicht gerade wenig. Ältere Rechner stoßen da schnell an ihre Grenzen. Zum anderen sind diese Abmessungen selbst für ein 2-CD-Encoding schlicht zu groß, um gute Qualität zu erreichen. Auch Stauchen ist nicht optimal, denn dummerweise ist das menschliche Auge gerade für die vertikale Auflösung empfindlicher als für die horizontale. Die Standardmethode beschneidet das Bild also ausgerechnet in der wichtigeren Dimension.
Als Lösung bietet sich das anamorphe Bild an. Es verwirft keine wichtigen vertikalen Informationen und hält die Bildgröße in einem akzeptablen Rahmen. Inzwischen ist auch die Unterstützung von Encoder- und Decoderseite gut genug, so dass man anamorphe Encodings als alltagstauglich ansehen kann. Lediglich Standalone-Player dürften größtenteils außen vor bleiben.
Als Haupteinsatzgebiet bietet sich klar das hochqualitative Encoding an, das die volle Auflösung (evtl. bis auf die schwarzen Balken) einer 16:9-DVD beibehält.
Für 4:3-Material ist ein anamorphes Bild weniger sinnvoll, da sich ein korrekt entzerrtes 4:3-Bild von 720 × 576 auf entweder 768 × 576 oder 720 × 544 verändert. Das bedeutet im Unterschied zur Originalauflösung keine große Veränderung und deshalb kaum Vorteile für das anamorphe Bild.
Auch stark komprimierte 1-CD-Filme profitieren weniger, da sie sowieso Details in Form von Auflösung opfern müssen, um weit genug geschrumpft werden zu können. Mein erster Eindruck ist, dass in diesem Bereich der Unterschied zwischen anamorph und nicht-anamorph nur gering ausfällt. Ein paar intensivere Tests könnten allerdings nicht schaden, um das zu bestätigen.
Ein anamorphes MPEG-4-Video kann grundsätzlich auf drei verschiedene Arten erzeugt werden, immer mit der 16:9-DVD als Quelle im Hinterkopf.
Alle drei Varianten können wir mit Gordian Knot verwirklichen. Der Weg von der DVD zum MPEG-4-Video bleibt dabei größtenteils gleich. Nur bei der Berechnung der Zielauflösung und der Codec-Konfiguration ergeben sich Abweichungen. Dazu mehr im nächsten Kapitel.
Uns stehen zwei – grundsätzlich gleichwertige – Möglichkeiten zur Verfügung, um ein Seitenverhältnis anzugeben.
Für DVD-Quellen ist das PAR interessanter als das DAR. Der Nachteil des DAR liegt darin, dass es sich ändert, je nachdem, wie viel schwarze Balken wir wegschneiden müssen. Das heißt, das DAR kann für jeden Film unterschiedlich sein und muss natürlich jedes Mal neu berechnet werden. Praktisch liegen die Werte zwar eng beieinander, nur sollten wir uns darauf nicht blind verlassen.
Im Gegensatz dazu gibt es für das PAR nur vier mögliche Werte, und zwar 16:9 und 4:3 jeweils für PAL und NTSC. Da uns DGIndex alle nötigen Informationen liefert, brauchen wir an der passenden Stelle nur diese Infos einsetzen. Das Cropping und Resizing, das wir in diesem Kapitel verwenden, ändert nichts an der Form der einzelnen Pixel. Die sehen also im encodierten Video genauso aus wie auf der Quell-DVD.
Ein klassisches, nicht anamorph encodiertes, Video hat immer ein PAR von 1:1 und ein DAR von »Bildbreite zu Bildhöhe«.
Sehen wir uns das an einer kleinen Grafik an, die ein Videobild aus 4 × 4 Pixeln darstellen soll, wie es korrekt entzerrt beim Abspielen aussieht. Das Bild ist nicht quadratisch, da DVD-Pixel eine rechteckige Form haben.
Die Form des gesamten Bilds und die Form eines einzelnen Pixels lässt sich leicht berechnen:
DAR = x : y; PAR = a : b.
Beispiel für eine 16:9-PAL-DVD:
DAR = 1047 : 576; PAR = 16 : 11.
Jetzt bearbeiten wir das Bild, indem wir schwarze Balken entfernen. Nehmen wir an, eine Pixelreihe oben und eine Pixelreihe unten, was eine neue Grafik ergibt.
Es gilt noch immer wie oben, allerdings mit kleinerem y:
DAR = x : y; PAR = a : b.
Und für die 16:9-PAL-DVD:
DAR = 1047 : 432; PAR = 16 : 11.
Durch das Cropping nimmt natürlich die Höhe des Bildes ab, y wird kleiner. Dadurch verändert sich auch der Wert des DAR, im Beispiel von 1,82 auf 2,42. Auf das PAR hat das Cropping dagegen keine Auswirkung, denn das veränderte DAR beruht nur auf einer verringerten Anzahl Pixelreihen pro Bild, a und b und damit die Form der verbleibenden Pixel wird nicht angetastet.
Die zwei Grafiken spiegeln die Realität übrigens nur unvollständig wider, denn ein Computermonitor hat immer quadratische Pixel. Deshalb muss für die eigentliche Wiedergabe ein rechteckiges DVD-Pixel natürlich in mehrere quadratische Computerpixel umgerechnet werden, was das Beispiel der 16:9-DVD zeigt.
Warum diese komischen Zahlen im Beispiel? Sollte es statt 1,82 und 2,42 nicht 1,78 (echtes 16:9) und 2,35 heißen? Das ist richtig, solange wir uns in der analogen Welt des Fernsehers bewegen. Für eine korrekte Darstellung am Computerbildschirm sollten wir aber nach dem Standard ITU-R BT.601 arbeiten, was im Vergleich zu den gewohnten Werten ein etwas breiteres Bild ergibt.