Das Anamorph-Kapitel weiter vorne hat es allein schon in sich, wenn man zum ersten Mal damit in Kontakt kommt. Die Hintergründe und die Diskussion um die verschiedenen Pixel Aspect Ratios dort auch noch anzusprechen, würde den Rahmen deutlich sprengen. Deswegen beschäftigen wir uns erst jetzt damit.
Die Empfehlung Nummer BT.601 der ITU-Organisation, die so viel Verwirrung stiftet, hat die Konvertierung analogen Filmmaterials in ein digitales Format zum Thema. Warum sollte uns das eigentlich interessieren? Schließlich haben wir eine DVD – ein vollständig digitales Medium – als Quelle und erzeugen eine genauso vollständig digitale Zieldatei. Trotzdem spielt Analog eine entscheidende Rolle, denn
Beginnen wir deshalb ganz vorn bei der Umwandlung von analog nach digital.
Etwas vereinfacht dargestellt arbeitet PAL mit 576 analogen Zeilen (Scanlines), NTSC mit 486. Es liegt nahe, Zeilenanzahl mit Pixelanzahl gleichzusetzen, und genau so erfolgt auch die vertikale Analog-Digital-Konvertierung.
Wenn wir von quadratischen Pixeln ausgehen, lässt sich daraus leicht die digitale horizontale Auflösung errechnen, ohne noch einmal auf die analoge Welt zurückzugreifen. Wir wissen, dass die DVD nur 16:9 und 4:3 als Seitenverhältnis zulässt. Außerdem kennen wir die vertikale digitale Auflösung. Entsprechend rechnen wir z.B. für 4:3 PAL:
hor. Auflösung = 576 × (4/3) = 768 Pixel.
Für die anderen drei Fälle setzen wir jeweils die passenden Werte ein und erhalten diese vier Standardauflösungen.
PAL | NTSC | |
---|---|---|
4:3 | 768 × 576 | 648 × 486 |
16:9 | 1024 × 576 | 864 × 486 |
Wichtig ist diese Tabelle für die Berechnung der Seitenverhältnisse weiter unten. Zu den Eigenschaften des analogen Videosignals passt sie nicht, denn »analoge Pixel« – wenn man überhaupt von so etwas sprechen kann – sind nicht quadratisch, sondern rechteckig; breiter als hoch.
Diese Tatsache ist zumindest ein Grund für die verzerrte Auflösung der DVD. Aber das nur am Rande. Wir stehen noch immer vor dem Problem, die »echte« horizontale Auflösung zu ermitteln. Eine natürliche Aufteilung in diskrete Werte wie in der Vertikalen existiert nicht. Eine analoge Scanline ist eine Wellenform von einigen Mikrosekunden Dauer und ohne jede offensichtliche Unterteilung.
Um diskrete (digitale) Werte zu erhalten, müssen wir das analoge Signal in bestimmten Zeitabständen abtasten und den ermittelten Wert als Pixel speichern. Das nennt man Sampling, und die Geschwindigkeit der Abtastung heißt Samplingrate. Um ein TV-Bild sinnvoll zu digitalisieren, sind mehrere Millionen Abtastungen pro Sekunde nötig. Für die genauen Werte hilft uns die ITU-Empfehlung weiter.
Der Elektronenstrahl eines PAL-Fernseher benötigt 52 µs Zeit, um eine Scanline zu zeichnen. Aus der ITU-R BT.601 ergibt sich eine Samplingrate von 13,5 MHz (Megahertz = Millionen Abtastungen pro Sekunde). Damit erhalten wir 52 µs × 13,5 MHz = 702 horizontale Pixel, was einer aktiven Auflösung von 702 × 576 Pixeln entspricht. Aktiv heißt, das komplette Bild, wie es einmal auf dem analogen Film vorhanden war, soll innerhalb dieser 702 Pixel liegen.
Die Auflösung einer PAL-DVD ist auf 720 × 576 Pixel festgelegt. Zwar erlaubt der Standard auch ein paar andere Auflösungen, die praktisch aber nur geringe Bedeutung haben. Der Grund für die abweichende Breite der aktiven ITU-Auflösung ist der Fernseher, dessen Konstruktion zu einem Overscan-Bereich führt. Das heißt, ein dünner Streifen Bild ragt über den Rand des Bildschirms hinaus. Da der Zuschauer diesen Bereich natürlich nicht sieht, sollte darin auch kein wichtiges Bild enthalten sein.
Grafisch stellt sich die Situation wie im folgenden Bild dar. Die graue Fläche ist die DVD-Auflösung, die dünne rote Linie kennzeichnet das aktive ITU-Bild.
An dieser Stelle benötigen wir unsere Tabelle mit den quadratischen Auflösungen, denn Computerpixel sind nie (fast nie) rechteckig. Mit einem 16:9-Bild stehen wir dann vor der Situation, 1024 × 576 quadratische Pixel in 702 × 576 rechteckigen Pixeln unterbringen zu müssen. Vertikal kein Problem, da die Auflösungen exakt übereinstimmen. Horizontal kommen wir allerdings nicht darum herum, die 1024 vorhandenen Pixel in 702 aktive Pixel zu quetschen. Machbar ist das ohne weiteres, lediglich produzieren wir als Nebeneffekt ein verzerrtes (horizontal gestauchtes) Bild. Mit einem 4:3-Bild spielen wir genau das gleiche durch, mit dem einzigen Unterschied, ein weniger verzerrtes Bild zu erhalten.
Beim Abspielen brauchen wir dann eine Angabe über den Verzerrungsfaktor, um das Bild wieder auf die richtige Breite strecken zu können. Dieser Faktor ist das Pixel Aspect Ratio (PAR). Für 16:9 PAL sagt uns der PAR-Wert von ca. 1,46, dass wir das Bild auf 146 % auseinanderziehen müssen, um ein korrektes Seitenverhältnis zu erhalten.
Das PAR selbst zu errechnen, ist mit dem Wissen über die ITU-Empfehlung einfach. Wir packen dazu die Information »Wie verhält sich die korrekte zur gestauchten Breite« in eine mathematische Schreibweise, was nichts anders als der Quotient aus korrekter und gestauchter Breite ist. Entsprechend ergibt sich für den 4:3- und 16:9-Fall:
Um beim Abspielen die richtige Breite zu erhalten, müssen wir die gestauchte Breite mit dem PAR multiplizieren. Aber Achtung! Auch wenn nur 702 Pixel aktiv sind, hat die DVD trotzdem eine Auflösung von 720 Pixeln. Auch die 18 nicht aktiven Pixel müssen gestreckt werden, denn halbe Sachen sind nicht erlaubt. Entweder strecken wir das komplette Bild oder wir lassen es ganz bleiben.
4:3-Breite = 720 × 128/117 = 787,69 Pixel
16:9-Breite = 720 × 512/351 = 1050,26 Pixel
Damit sollte auch klar werden, warum nach ITU-Norm das Bild ein wenig breiter als die Standard-DARs 4:3 oder 16:9 ausfällt. Das sind genau die 18 nicht aktiven Pixel, die gestreckt exakt die Abweichung zum Standard-DAR (19,69 bzw. 26,26 Pixel) ergeben. Damit entspricht auch der aktive Teil der endgültigen Auflösung genau der Ausgangssituation: 768 × 576 und 1024 × 576.
Die Situation für NTSC stellt sich ähnlich dar. Den quadratischen Auflösungen 648 × 486 und 864 × 486 steht nach ITU ein aktiver Bereich von 710,85 × 486 entgegen. Ja, exakt so. Die krummen horizontalen Pixel müssen für die Praxis natürlich auf 711 aufgerundet werden. Damit sich die Rundungsfehler nicht summieren, rechnen wir trotzdem mit den exakten 710,85.
Genau genommen summiert sich nichts Wesentliches. Als letzter Schritt vor der eigentlichen Darstellung am Bildschirm muss sowieso aufs nächste volle Pixel gerundet werden, was den minimalen rechnerischen Unterschied zwischen 710,85 und 711 ausgleicht.
Unschöner sind die 480 vertikalen DVD-Pixel, die für die 486 aktiven Pixel nicht ausreichen. Wir stehen grafisch also vor folgender Situation, die auf den ersten Blick schon spürbar komplizierter als bei PAL aussieht. Die graue Fläche stellt wieder die DVD-Auflösung dar, der rote Rahmen den aktiven ITU-Bereich.
Prinzipiell wäre es möglich, vertikal genauso zu verfahren wie horizontal, also 486 tatsächliche Pixel in 480 DVD-Pixel zu quetschen und zusätzlich zum horizontalen mit einem vertikalen PAR zu arbeiten. Das ist genauso lästig wie es klingt, deswegen hat man sich für ein einfacheres Verfahren entschieden. Was nicht passt, wird passend gemacht! Wir schneiden ganz einfach oben und unten je drei Pixel ab und gut ist. Da die Ränder des Bildes schon im rein analogen Umfeld typischerweise Rauschen anstatt aktives Bild enthalten, stören die fehlenden Pixel nicht. Natürlich bringt das Cropping eine minimale Abweichung des DAR mit sich, die aber vernachlässigt werden kann. Die Ungenauigkeit in der Darstellung, die sich allein aus der Technik der Fernsehbildröhre ergibt, ist deutlich größer.
Damit befinden wir uns tatsächlich in einer Situation, die derjenigen für PAL entspricht. Die vertikale Auflösung passt und horizontal stopfen wir die Originalpixel in die aktiven Pixel. Für 4:3 ergibt sich dabei die etwas seltsame Situation, 648 Pixel in 710,85 Pixel »quetschen« zu müssen. Nicht verwirren lassen. Das ändert am Vorgehen überhaupt nichts, lediglich das PAR wird (ganz automatisch) kleiner als 1. Hier sind die Berechnungen, die analog zu PAL funktionieren.
Beim Abspielen multiplizieren wir wieder die horizontale DVD-Auflösung mit dem PAR.
4:3-Breite = 720 × 4320/4739 = 656,34 Pixel
16:9-Breite = 720 × 5760/4739 = 875,12 Pixel
Auch hier entsprechen die gestreckten nicht-aktiven Pixel dem Unterschied zum Standard-DAR – bis auf die minimale Abweichung durch die abgeschnittenen sechs vertikalen Pixel.
Fassen wir zusammen: PAL und NTSC entscheiden sich nicht wesentlich, lediglich hantieren wir bei NTSC mit unschöneren Zahlen. Beide Formate ergeben nach ITU ein etwas breiteres Bild als vom Standard-DAR gewohnt, was an den verbleibenden nicht aktiven Pixeln liegt. Am TV sehen wir trotzdem ungefähr den Standard-DAR, da die zusätzliche Breite im Overscan-Bereich verschwindet. Für die korrekte Wiedergabe müssen wir insgesamt vier PAR-Werte im Kopf behalten.
PAL | NTSC | |
---|---|---|
4:3 | 128/117 | 4320/4739 |
16:9 | 512/351 | 5760/4739 |
Wem einmal die PARs 72/79 für 4:3 und 96/79 für 16:9 über den Weg laufen, das sind die Werte für NTSC, gerechnet mit 711 aktiven Pixeln.
Der aufmerksame Leser wundert sich bestimmt schon längst wieder. Die ITU-PAR-Tabelle hier stimmt doch mit der Tabelle aus dem Anamorph-Kapitel nicht überein! Die sieht nämlich so aus:
PAL | NTSC | |
---|---|---|
4:3 | 12/11 | 10/11 |
16:9 | 16/11 | 40/33 |
So unterschiedlich die Brüche auf den ersten Blick anmuten: wenn man sie ausdividiert, kommt bei beiden Tabellen fast das Gleiche heraus. Die Abweichung ist mit 2 – 3 Pixeln (etwa 0,3 %) so gering, dass sie unsichtbar bleibt. Ob wir deshalb mit dem exakten PAR oder den vereinfachten Werten arbeiten, ist irrelevant.
Die vereinfachte Tabelle entstammt dem MPEG-4-Standard. Im H.264-Teil, den man von der ITU-Homepage kostenlos herunterladen kann, stehen die Zahlen so im Kapitel E.2.1 in Tabelle E-1. Leider ist der Rest des MPEG-4-Standards nicht frei verfügbar, weshalb ich im für Xvid und DivX relevanten Part 2 (MPEG-4 Visual) nicht selbst nachschauen kann. Dass die gleichen Zahlen auch dort genannt werden, darauf lässt mich eine Äußerung Koepis im Doom9-Forum schließen.
Bleibt die Frage, warum die Angaben im MPEG-4-Standard überhaupt von den exakten ITU-Werten abweichen. Darüber bin ich mir selbst nicht im klaren. Fakt ist jedenfalls, dass sowohl der 3ivx- als auch der Xvid-Encoder die vereinfachte Tabelle für ihre Standard-PAR-Auswahl verwenden. Zusammen mit den simplen Zahlen, die man gut im Kopf behalten kann, ist das Grund genug, die einfache Tabelle für die Praxis zu empfehlen.
Mit ITU-PAR meine ich im Folgenden immer die exakten und vereinfachten Werte gleichermaßen. Natürlich könnte man zwischen den beiden genauso unterscheiden wie zwischen ITU-PAR und generischem PAR. Wegen der nur minimalen Abweichung halte ich das aber für übertriebene Haarspalterei.
Dass die ITU-R BT.601 genau die Rechnung anstellt, wie oben beschrieben, liegt an ihrer Konzentration auf die analoge Welt, besonders auf analoge Abspielgeräte mit Overscan-Bereich. Denn um genau diesen Overscan-Bereich dreht sich die ganze Empfehlung.
Der Film einer ITU-DVD ist am TV-Bildschirm vollständig zu sehen. Zwar versteckt der Fernseher die Ränder des Videos im unsichtbaren Overscan-Bereich, jedoch enthalten die sowieso kein aktives Bild, so dass nichts verloren geht.
Das stimmt jedenfalls ungefähr. Die Größe des Overscans ist nicht immer und überall gleich. Also muss ITU mit einem Schätzwert arbeiten.
Geht man von einem digitalen Wiedergabemedium aus – oder allgemeiner von einem Wiedergabemedium ohne Overscan – verliert die ITU-Empfehlung ihren Sinn. Eine nach ITU gemasterte DVD kann dann sogar nachteilig sein, weil sie möglicherweise links und rechts sichtbare dünne schwarze Balken enthält.
Das generische PAR legt genau dieses digitale Szenario zu Grunde. Die Berechnung funktioniert genauso wie weiter oben für ITU beschrieben, nur dass wir uns um einen aktiven Bereich keine Gedanken machen. Aktiv ist die komplette Auflösung der DVD: 720 × 576 bzw. 720 × 480. Entsprechend rechnen wir nicht mit 702 oder 710,85 im Nenner, sondern mit 720. Das ergibt schlussendlich folgende PAR-Tabelle:
PAL | NTSC | |
---|---|---|
4:3 | 16/15 | 9/10 |
16:9 | 64/45 | 6/5 |
So weit sind sich die Verfechter sämtlicher Lehren auch einig. Aber nur so weit, und kein bisschen weiter.
Die große Frage beim DVD-Backup besteht nun darin, welches PAR wir benutzen sollten. Der Streit darum wird heftig geführt, bleibt nicht immer ganz sachlich und geht meiner Meinung nach meistens am Kern des Problems vorbei. Erst einmal müssen wir zwei Dinge klarstellen.
Immer unter der Voraussetzung, dass wir das ursprüngliche Seitenverhältnis so exakt wie möglich wieder herstellen wollen, existiert genau ein entscheidender Faktor, der über das richtige PAR entscheidet:
Mit welchem PAR arbeitet die jeweilige DVD?
Eigentlich ist die Überlegung so simpel, dass überhaupt keine Diskussion entstehen sollte. Wenn Person A einen Film horizontal auf die Hälfte staucht und Person B das ursprüngliche Bild wieder herstellen will, dann muss Person B den Film auf 200 % auseinander ziehen. Und wenn Person C einen anderen Film auf drei Viertel seiner Breite quetscht, dann muss Person B diesen Film auf 133 % auseinander ziehen. Im zweiten Fall stur auf 200 % zu beharren, wäre blödsinnig. Genauso verhalten sich aber sowohl die Hardcore-Verfechter des ITU-PAR als auch die Hardcore-Verfechter des generischen PAR. Da wird seitenlang gestritten und am eigentlichen Kern des Problems geradeaus vorbeidiskutiert.
Das richtige PAR ist dasjenige, das im Masteringprozess benutzt wurde.
An dieser Stelle muss eine sinnvolle Diskussion ansetzen, denn so klar die Grundaussage auch ist, die praktische Umsetzung bereitet Probleme. Das PAR ist nämlich nirgendwo auf der DVD vermerkt, es existiert also keine Möglichkeit, den richtigen Wert einfach abzulesen. Genauso unmöglich erscheint es bei kommerziellen DVDs, den Masteringtechniker ausfindig zu machen und nachzufragen. Es bleibt also nur die Trial-and-Error-Methode: Wir entzerren das Bild mit den verschiedenen PARs und messen nach, ob Kreise auch wirklich rund erscheinen.
Das ist zu kompliziert und zeitaufwändig für die tägliche Praxis? Stimmt. Möglicherweise können wir aber mit ein wenig Überlegung einer der beiden Tabellen den Vorzug geben. Um das Ergebnis vorweg zu nehmen:
Das ITU-PAR zu wählen, ist die logische Alternative.
Warum?
Für DVDs mit vertikalen Balken erscheint es unsinnig, generisches PAR anzunehmen. Aus welchem Grund sollte jemand zwar 720 Pixel als aktiv ansehen, dann aber trotzdem nicht die volle Breite ausnutzen? Solche DVDs würde ich deswegen immer ohne zu zögern nach ITU entzerren, zumal die Balken oft verdächtig genau im Bereich der 2 × 9 nicht aktiven PAL-Pixel liegen.
Gerade neuere DVDs nutzen immer häufiger die komplette DVD-Auflösung aus. Trotzdem erscheint es in der Regel sinnvoller, auch hier das ITU-PAR anzuwenden. Denn dass beim Mastering ITU angewendet und die inaktive Fläche anstatt mit Schwarz mit zusätzlichem Bild gefüllt wurde, ist aus einigen Gründen wahrscheinlicher.
Das alles beweist nichts eindeutig und endgültig. Es lässt allerdings die Aussage äußerst wahrscheinlich erscheinen, dass die überwiegende Mehrheit der DVDs entsprechend ITU-R BT.601 gemastert wird. Wer nicht jede DVD vor dem Encoding exakt vermessen will, dem rate ich deshalb immer zu den ITU-Werten, denn die Wahrscheinlichkeit, damit richtig zu liegen, ist hoch.
Lohnt sich der ganze Glaubenskrieg eigentlich wirklich? Das tut er dann, wenn zwischen ITU-PAR und generischem PAR ein deutlich sichtbarer Unterschied besteht. Die Abweichung zu den exakten ITU-Werten berechnet sich im 16:9-Fall wie unten. Mit den 4:3-Werten würden wir genau die gleichen Ergebnisse erhalten.
PAL-Abweichung = 512/351 / 64/45 = 2,56 %
NTSC-Abweichung = 5760/4739 / 6/5 = 1,29 %
Für klassische Encodings mit quadratischen Pixeln haben wir einen Aspect Error bis 2,5 % als unproblematisch definiert. NTSC liegt also klar in dem Bereich, an den wir beim klassischen Encoding keinen weiteren Gedanken verschwenden würden. PAL testet die Grenze zwar an, aber um das Kapitel über die nicht-anamorphe Zielauflösung zu zitieren: »Geringe Fehler – etwa bis 2,5 % – sind unproblematisch, weil die Verzerrung zu klein bleibt, um spürbar zu werden.«
Aha. Ab in etwa 2,5 % können wir also langsam damit rechnen, dass die Abweichung sichtbar werden könnte. Nach Katastrophenfall klingt das keineswegs. Auch sind die 2,5 % vorsichtig angesetzt. Gordian Knot z.B. warnt erst bei über 3,5 % vor einer kritischen Abweichung.
Die komplette PAR-Diskussion hat also schon ihre Berechtigung. Nur geht in Grabenkämpfen und zwischen technischen Details oft die Perspektive verloren. Wir streiten uns um Abweichungen, für die wir an anderer Stelle seit Jahren nur ein Schulterzucken übrig haben. So richtig will es mir nicht einleuchten, warum ein Unterschied, den wir bisher nicht sehen konnten, plötzlich so durchschlagend wichtig sein sollte.
Um die ITU-Dokumente kostenlos herunterzuladen, muss man sich zuerst im ITU Bookshop für 3 Free Recs anmelden. Die erhaltenen Login-Daten gelten für drei Downloads.