Zum Inhalt springen
Brother Johns Encodingwissen Wechseln zu: Inhalt, Abkürzungen

Die Bedeutung der ITU-R BT.601 für das PAR

Das Anamorph-Kapitel weiter vorne hat es allein schon in sich, wenn man zum ersten Mal damit in Kontakt kommt. Die Hintergründe und die Diskussion um die verschiedenen Pixel Aspect Ratios dort auch noch anzusprechen, würde den Rahmen deutlich sprengen. Deswegen beschäftigen wir uns erst jetzt damit.

Ich möchte behaupten, dass dieses Kapitel mit Abstand die schwerste Kost im Encodingwissen ist. Den Überblick über die Seitenverhältnis-Thematik mit allen ihren Ausläufern zu behalten, ist eine echte Herausforderung. Um das ein wenig zu erleichtern, der Inhalt dieses Kapitels in drei Stichpunkten zusammengefasst:

  1. Die Norm namens ITU-R BT.601 (auch »Rec. 601«, früher »CCIR 601«) ist der zentrale Baustein für das Seitenverhältnis der DVD. Sie legt fest, dass das eigentliche Videobild ein wenig kleiner sein muss als die gesamte DVD-Auflösung.
  2. Computerpixel sind quadratisch, DVD-Pixel rechteckig. Dieser Unterschied muss fürs Encoding berücksichtigt werden.
  3. Es gibt insgesamt drei Varianten, das DVD-Seitenverhältnis zu berechnen. Auf der einzelnen DVD ist nirgendwo vermerkt, welche Variante bei der Produktion verwendet wurde.

Analog/Digital-Wandlung

Die von der ITU-Organisation, Abteilung »Radiocommunication«, herausgegebene Empfehlung Nummer BT.601, die so viel Verwirrung stiftet, hat die Konvertierung analogen Fernsehmaterials in ein digitales Format und wieder zurück zum Thema. Warum sollte uns das eigentlich interessieren? Schließlich haben wir eine DVD – ein vollständig digitales Medium – als Quelle und erzeugen eine genauso vollständig digitale Zieldatei. Trotzdem spielt Analog und dessen Normen eine entscheidende Rolle, denn

Beginnen wir deshalb ganz vorn bei der Umwandlung von analog nach digital. Das analoge Fernsehbild wird von einem Elektronenstrahl aufgebaut, der wie in der folgenden Abbildung über den Monitor streicht.

PAL: 574 Scanlines + je 1/2 Scanline oben und unten. NTSC: 484 + 2 halbe Scanlines.

Der Elektronenstrahl setzt oben in der Mitte an und zeichnet die erste Zeile (rote durchgezogene Linie), wird abgeschaltet und zum Anfang der nächsten Zeile versetzt (graue gestrichelte Linie), wo er wieder aktiv wird und die nächste Zeile zeichnet. Das geht immer so weiter, bis ganz unten in der Mitte das Ende erreicht ist.

Die europäische Fernsehformat PAL arbeitet mit 574 ganzen Zeilen (Scanlines). Dazu kommt die halbe Scanline oben und die halbe unten. Das amerikanische NTSC funktioniert genauso mit 484 vollständigen Scanlines.

Diese Darstellung ist vereinfacht und entspricht nicht ganz der Realität. Ein analoges Bild ist immer interlaced, d.h. es setzt sich aus zwei Halbbildern zusammen, die unabhängig voneinander gezeichnet werden. Deswegen bitte die Abbildung von oben nicht als die exakte praktische Arbeitsweise eines TV-Monitors missverstehen!

Vertikale A/D-Wandlung

Für die digitale Welt benötigen wir diskrete, d.h. abzählbare, Werte, die sich als eine Anzahl von Pixeln darstellen lassen. In der vertikalen Dimension haben wir mit den Scanlines schon analog eine solche Unterteilung. Es liegt nahe, Zeilenanzahl mit Pixelanzahl gleichzusetzen, und genau so erfolgt auch die vertikale Analog/Digital-Konvertierung.

Unschön sind lediglich die beiden halben Scanlines, die nicht so recht ins digitale Konzept einer rechteckigen Auflösung passen wollen. Das wird ganz pragmatisch gelöst, indem man die halben Zeilen einfach als vollständig behandelt und die jeweils fehlende Hälfte mit Schwarz auffüllt.

Damit erhalten wir eine vertikale Pixelanzahl von 576 (574 + 2) für PAL und 486 (484 + 2) für NTSC.

Horizontale A/D-Wandlung

Die horizontale Auflösung lässt sich nicht so einfach und eindeutig wie die vertikale ermitteln, denn eine analoge Scanline ist eine Wellenform von einigen Mikrosekunden Dauer und ohne jede offensichtliche Unterteilung. Um diskrete (digitale) Werte zu erhalten, müssen wir das analoge Signal in bestimmten Zeitabständen abtasten und den ermittelten Wert als Pixel speichern. Das nennt man Sampling. Die Geschwindigkeit der Abtastung heißt Samplingrate und wird in Hertz (Hz = Abtastungen pro Sekunde) gemessen. Dabei gibt es kein absolutes Richtig oder Falsch. Prinzipiell können wir eine Scanline in beliebig viele Pixel unterteilen, ob das nun 10 oder 10.000 sind.

Um ein TV-Bild sinnvoll zu digitalisieren, sind auf jeden Fall mehrere Millionen Samplingvorgänge pro Sekunde (Megahertz, MHz) nötig. Und an dieser Stelle kommt die ITU-R BT.601 ins Spiel, denn die sagt uns, dass wir eine Scanline mit 13,5 MHz abtasten sollen. Das gilt sowohl für PAL als auch NTSC. Diese einheitliche Rate vereinfacht es, universelle Hardware-A/D-Wandler zu bauen, was wohl der Hintergedanke der ITU-Empfehlung war.

Leider passt der Wert nicht exakt auf die 720 horizontalen Pixel der DVD. Für PAL ergeben sich 702 Pixel, für NTSC 710,85. Das sehen wir uns weiter unten noch genauer an. Zuerst benötigen wir jedoch einen Ausflug in die Welt der Pixelformen.

Pixelformen

Meistens wird ein Pixel als ein festgelegtes, immer gleiches Etwas angesehen. Damit kommen wir bei DVD-Video allerdings nicht weiter. Unser Ideal sind quadratische Pixel, weil sich mit denen am schönsten umgehen lässt und sie von nahezu jeder üblichen Auflösung eines Computermonitors verwendet werden. DVD-Pixel dagegen sind niemals quadratisch, sondern rechteckig; meistens breiter als hoch. In der Praxis zwingt uns das dazu, immer darauf zu achten, mit welcher Pixelform wir es gerade zu tun haben. Versäumen wir das, ist das Ergebnis ein verzerrtes Bild. Die folgende Abbildung zeigt die typischen Formen eines Pixels im Vergleich.

Vergleich zwischen »DVD-Pixeln« und quadratischen PC-Pixeln: PAL 4:3 ist ein wenig breiter als quadratisch, NTSC 4:3 ein wenig schmäler. PAL 16:9 ist deutlich breiter als quadratisch, NTSC 16:9 etwas weniger deutlich.

Für die Berechnungen weiter unten müssen wir das analoge Bild in eine digitale Auflösung mit unseren idealen quadratischen Pixeln umrechnen. Wir wissen, dass die DVD nur 16:9 und 4:3 als Seitenverhältnis des gesamten Bilds zulässt. Außerdem kennen wir die vertikale digitale Auflösung (PAL 576, NTSC 486). Daraus können wir ganz einfach die horizontale Pixelanzahl bei quadratischen Pixeln errechnen, ohne noch einmal auf die analoge Welt oder die ITU-Empfehlung zurückgreifen zu müssen. Wir rechnen z.B. für 4:3 PAL:

hor. Auflösung = 576 × (4/3) = 768 Pixel.

Für die anderen drei Fälle setzen wir jeweils die passenden Werte ein und erhalten diese vier »quadratischen« Standardauflösungen:

  PAL NTSC
4:3 768×576 648×486
16:9 1024×576 864×486

Damit haben wir alles Nötige, um uns in die Tiefen der Pixel-Seitenverhältnisse zu stürzen.

Anwendung der ITU-R BT.601

PAR-Berechnung für PAL

Der Elektronenstrahl eines PAL-Fernsehers benötigt 52 µs Zeit, um eine Scanline zu zeichnen. Mit der ITU-Samplingrate von 13,5 MHz erhalten wir 52 µs × 13,5 MHz = 702 horizontale Pixel, was insgesamt einer aktiven digitalen Auflösung von 702×576 Pixeln entspricht. Aktiv heißt, das komplette Bild, wie es einmal im analogen Signal vorhanden war, liegt innerhalb dieser 702 Pixel.

Die Auflösung einer PAL-DVD ist auf 720×576 Pixel festgelegt. Zwar erlaubt der Standard auch ein paar andere Varianten, die praktisch aber nur geringe Bedeutung haben. Unser aktives Bild ist also kleiner als die DVD-Auflösung. Grafisch stellt sich die Situation wie in der folgenden Abbildung dar. Die graue Fläche ist die DVD-Auflösung, die dünne rote Linie kennzeichnet das aktive ITU-Bild.

horizontal: 702 aktiv, 720 gesamt; vertikal: 576 aktiv, 576 gesamt

Wir müssen nun 702×576 aktive Pixel in 720×576 vorhandenen Pixeln unterbringen. Vertikal kein Problem, da die Auflösungen exakt übereinstimmen. Horizontal dagegen bleiben 18 ungenutzte Pixel übrig. Der Einfachheit halber zentrieren wir das ITU-Bild innerhalb der DVD-Auflösung, so dass links und rechts jeweils ein 9 Pixel breiter Balken entsteht, den wir in der einfachsten Variante mit Schwarz auffüllen.

Interessant wird es bei der Wiedergabe, denn jetzt kommen die verschiedenen Pixelformen ins Spiel. Was wir nun erarbeiten wollen, lässt sich auf zwei Arten ausdrücken. Wir benötigen

Das sind zwei verschiedene Sichtweisen ein und desselben Problems, d.h. es ist egal, welchen Standpunkt wir einnehmen. In jedem Fall ist der gesuchte Wert das so genannte Pixel Aspect Ratio, kurz PAR (alternativ bekannt als Sample Aspect Ratio, SAR). Der Einfachheit halber bleiben wir beim Computermonitor mit seinen quadratischen Pixeln. Im Bild unten sehen wir die nötige Entzerrung für eine 16:9-PAL-DVD.

(Quelle: 702×576 bzw. 720×576) -> Entzerrung mit PAR 16:9 PAL -> (Ziel: 1024×576 bzw. 1050×576)

Wie kommen die gezeigten Werte zustande? Dafür benötigen wir unsere Tabelle mit den quadratischen Auflösungen, die wir weiter oben berechnet haben. Daraus kennen wir für 16:9 PAL die »quadratische« Auflösung (PAR 1:1) von 1024×576 Pixeln, die das korrekt zurechtgezogene Bild zum Zeitpunkt der Wiedergabe darstellt und ein Seitenverhältnis von exakt 16:9 aufweist. Bei der 16:9-PAL-DVD ist für den aktiven Teil der Auflösung von 702×576 ebenfalls ein Seitenverhältnis von exakt 16:9 definiert; die Pixel sind also rechteckig (PAR ungleich 1:1).

Das PAR zu errechnen, ist mit diesen Informationen einfach. Wir packen dazu die Frage »Wie verhält sich die korrekte zur gestauchten Breite?« in eine mathematische Schreibweise, was nichts anders als der Quotient aus korrekter und gestauchter Breite ist. Entsprechend ergibt sich für den 16:9- und 4:3-Fall:

16:9-PAR = 1024/702 = 512/351 = 1,4587; 4:3-PAR = 768/702 = 128/117 = 1,0940

Diese Werte können wir entsprechend den zwei Sichtweisen von oben verschieden interpretieren.

  • Die Pixel einer 16:9-PAL-DVD sind ca. 1,46 mal so breit wie hoch.
  • Das Bild einer 16:9-PAL-DVD muss für die unverzerrte Wiedergabe auf ca. 146% in die Breite gezogen werden.

Beide Sichtweisen führen zu absolut identischen Ergebnissen.

Um beim Abspielen die richtige Breite zu erhalten, multiplizieren wir die DVD-Breite mit dem PAR. Aber Achtung! Auch wenn nur 702 Pixel aktiv sind, hat die DVD trotzdem eine Auflösung von 720 Pixeln. Auch die 18 nicht aktiven Pixel müssen gestreckt werden, denn halbe Sachen sind nicht erlaubt.

16:9-Breite = 720×512/351 = 1050,26 Pixel
4:3-Breite = 720×128/117 = 787,69 Pixel

Damit sollte klar werden, warum nach ITU-Norm das Bild ein wenig breiter als die Standard-DARs 4:3 oder 16:9 ausfällt. Das sind genau die 18 nicht aktiven Pixel, die in gestreckter Form exakt die Abweichung zum Standard-DAR ergeben (19,69 bzw. 16,26 Pixel). Damit entspricht auch der aktive Teil der endgültigen Auflösung genau der Ausgangssituation: 1024×576 und 768×576.

PAR-Berechnung für NTSC

Die Situation für NTSC stellt sich ähnlich dar. Eine NTSC-Scanline ist 52+59/90 µs lang und wird mit 13,5 MHz ITU-Samplingrate abgetastet. Damit erhalten wir 52,656 µs × 13,5 MHz = 710,85 horizontale Pixel. Da wir exakt rechnen wollen, verwenden wir diesen krummen Wert. Die gesamte aktive Auflösung ist also 710,85×486.

Genau genommen ist es egal, ob wir auf 711 aufrunden oder nicht. Als letzter Schritt vor der eigentlichen Darstellung am digitalen Bildschirm muss sowieso aufs nächste volle Pixel gerundet werden, was den minimalen rechnerischen Unterschied zwischen 710,85 und 711 ausgleicht. In der analogen Welt liegt die Rundungsdifferenz einwandfrei innerhalb der für NTSC erlaubten Toleranzgrenzen.

Für die NTSC-DVD gilt eine Standardauflösung von 720×480. Horizontal besteht also kein Unterschied zu PAL, denn 710,85 aktive Pixel lassen sich problemlos in 720 vorhandenen Pixeln unterbringen. Unschöner sind die 480 vertikalen DVD-Pixel, die für die 486 aktiven Pixel nicht ausreichen. Wir stehen grafisch also vor folgender Situation, die auf den ersten Blick doch spürbar komplizierter als bei PAL aussieht. Die graue Fläche stellt wieder die DVD-Auflösung dar, der rote Rahmen den aktiven ITU-Bereich.

horizontal: 710,85 aktiv, 720 gesamt; vertikal: 486 aktiv, 480 gesamt

Prinzipiell wäre es möglich, vertikal ähnlich zu verfahren wie horizontal, also 486 tatsächliche Pixel in 480 DVD-Pixel zu quetschen und zusätzlich zum horizontalen mit einem vertikalen PAR zu arbeiten. Das ist genauso lästig wie es klingt, deswegen hat man sich für ein einfacheres Verfahren entschieden. Was nicht passt, wird passend gemacht! Wir schneiden ganz einfach oben und unten je drei Pixel ab und gut ist.

Natürlich bringt das Cropping eine minimale Abweichung des DAR mit sich, die aber fürs Abspielen unwichtig ist. Die digitale Wiedergabe ist zu jedem beliebigen Seitenverhältnis fähig und am analogen Fernseher müssen während der Digital/Analog-Wandlung so oder so die fehlenden Zeilen ergänzt werden, um ein gültiges NTSC-Signal zu erzeugen.

Bei allen Rechnungen daran denken: Die in der Höhe abgeschnittenen Pixelzeilen führen dazu, dass die aktive Auflösung einer NTSC-DVD niemals 16:9 bzw. 4:3 ist, sondern 9:5 bzw. 27:20.

Damit befinden wir uns tatsächlich in einer Situation, die derjenigen bei PAL entspricht. Die vertikale Auflösung stimmt und horizontal berechnen wir das PAR als Verzerrungsfaktor. Sehen wir uns die nötige Entzerrung an der folgenden Abbildung an.

(Quelle: 710,85×480 bzw. 720×480) -> Entzerrung mit PAR 16:9 NTSC -> (Ziel: 864×480 bzw. 875×480)

Aus unserer Tabelle lesen wir die benötigte »quadratische« Auflösung ab: 864×486. Die Abweichung zur vertikalen Auflösung spielt an dieser Stelle keine Rolle, und wir berechnen genauso wie bei PAL die PAR-Werte.

4:3-PAR = 648/710,85 = 4320/4739 = 0,9116; 16:9-PAR = 864/710,85 = 5760/4739 = 1,2154

Beim Abspielen multiplizieren wir wieder die horizontale DVD-Auflösung mit dem PAR.

16:9-Breite = 720×5760/4739 = 875,12 Pixel
4:3-Breite = 720×4320/4739 = 656,34 Pixel

Auch hier entsprechen die gestreckten nicht-aktiven Pixel dem Unterschied zum Standard-DAR – bis auf die minimale Abweichung durch die abgeschnittenen sechs vertikalen Pixel.

Zusammenfassung

Fassen wir zusammen: PAL und NTSC unterscheiden sich nicht wesentlich, lediglich hantieren wir bei NTSC mit unschöneren Zahlen. Beide Formate ergeben nach ITU ein etwas breiteres Bild als vom Standard-DAR gewohnt, was an den verbleibenden nicht aktiven Pixeln liegt. Für die korrekte Wiedergabe müssen wir insgesamt vier PAR-Werte im Kopf behalten.

PAR nach ITU-R BT.601
  PAL NTSC
4:3 128/117 4320/4739
16:9 512/351 5760/4739

Wem einmal die PARs 72/79 (4:3) und 96/79 (16:9) über den Weg laufen, das sind die NTSC-Werte gerechnet mit 711 aktiven Pixeln.

Die PAR-Tabelle nach MPEG-4

Der aufmerksame Leser wundert sich bestimmt schon längst wieder. Die ITU-PAR-Tabelle stimmt doch mit der Tabelle aus dem Anamorph-Kapitel nicht überein! Die sieht nämlich so aus:

PAR nach MPEG-4
  PAL NTSC
4:3 12/11 10/11
16:9 16/11 40/33

Die Zahlen entstammen dem MPEG-4-Standard. Im H.264-Dokument stehen sie in Tabelle E-1. MPEG-4 Visual definiert die gleichen Werte in Tabelle 6-12. So unterschiedlich die Brüche auf den ersten Blick anmuten: wenn man sie ausdividiert, kommt bei ITU- und MPEG-Tabelle fast das Gleiche heraus. Die Abweichung ist mit 2–3 Pixeln (etwa 0,3%) so gering, dass sie unsichtbar ist.

Bleibt die Frage, warum die Zahlen überhaupt von den ITU-Werten abweichen. Das kann letztendlich nur die MPEG beantworten. Auffällig ist jedenfalls, dass das MPEG-4-PAR überall von horizontal 704 aktiven Pixeln ausgeht. Diese Zahl ist glatt durch 16 teilbar, was eine Verbindung zum Mod16-Kriterium nahe legt. Außerdem sind 704×576 (PAL) bzw. 704×480 (NTSC) alternative DVD-Auflösungen, die gerne für digitale TV-Sendungen verwendet werden.

Was auch immer der tatsächliche Hintergrund sein mag: Fakt ist, dass sowohl der Xvid- als auch der DivX-Encoder die MPEG-4-Tabelle für ihre Standard-PAR-Auswahl verwenden. Zusammen mit den simplen Zahlen, die man gut im Kopf behalten kann, ist das Grund genug, die MPEG-4-Tabelle für die Praxis zu empfehlen.

ITU-PAR oder Generisches PAR?

Mit ITU-PAR meine ich im Folgenden immer auch die MPEG-4-Werte. Natürlich könnte man zwischen den beiden genauso unterscheiden wie zwischen ITU-PAR und Generischem PAR. Wegen der nur minimalen Abweichung halte ich das aber für übertriebene Haarspalterei.

Begriff des Generischen PAR

Neben ITU-PAR und MPEG-4-PAR gibt es noch eine weitere Variante, das Generische PAR. Das geht von der Überlegung aus, dass die ITU-Empfehlung ein Relikt aus der analogen Vergangenheit ist und in der modernen digitalen Welt nicht mehr benötigt wird. Seit Jahren tobt nun ein mit religiöser Hingabe geführter Streit darum, welche PAR-Rechnung der absolute Schluss der Weisheit wäre.

Eine analoge Fernsehkamera am Anfang der Verarbeitungskette ist der Grundgedanke hinter der ITU-R BT.601, denn nur dann haben wir es mit der einen Art Quelle zu tun, auf die sich die Empfehlung bezieht: ein analoges NTSC- bzw. PAL-Signal. Schon auf analoge Kinofilme mag die BT.601 nicht mehr so richtig passen, und in der modernen Welt mit digitalem Quellmaterial verliert sie völlig ihren Sinn.

Das Generische PAR legt ein digitales Szenario zu Grunde und geht von der berechtigten Annahme aus, dass man die vorhandene DVD-Auflösung auch vollständig nutzen sollte. Wenn man überhaupt von einem aktiven Bereich sprechen kann, dann umfasst der die komplette Auflösung: 720×576 bzw. 720×480. Vom digitalen Standpunkt aus gesehen ist dieses Vorgehen tatsächlich viel einleuchtender als die Verrenkungen der ITU-Empfehlung.

Hintergedanken von ITU-PAR und Generischem PAR
  ITU-PAR Generisches PAR
vorgesehene Quelle analoge TV-Kamera digitale Quelle
Verbreitungsmedium digital (z.B. DVD, DVB) digital (z.B. DVD, DVB)
typisches Abspielgerät analoger Fernseher digital/analog gleichermaßen
Verhältnis zur DVD-Auflösung aktiver Bereich kleiner als DVD-Auflösung aktiv ist gesamte DVD-Auflösung

Die generische Berechnung funktioniert genauso wie weiter oben für ITU beschrieben, nur dass wir die volle DVD-Auflösung als aktiv ansehen. Entsprechend rechnen wir nicht mit 702 oder 710,85 im Nenner, sondern mit 720. Bei NTSC verwenden wir außerdem immer 480 vertikale Pixel, ohne die eigentliche NTSC-Höhe von 486 Pixeln zu berücksichtigen. Das entspricht dem Gedanken, die analoge Welt hinter uns zu lassen, denn digitale NTSC-Produktionen arbeiten üblicherweise sowieso nur mit der 480er Höhe. Schlussendlich erhalten wir folgende PAR-Tabelle:

Generisches PAR
  PAL NTSC
4:3 16/15 8/9
16:9 64/45 32/27

Darüber sind sich die Verfechter sämtlicher Lehren auch einig. Aber nur so weit, und kein bisschen weiter.

Diskussion: ITU ist sinnvoller

Die große Frage beim DVD-Backup besteht nun darin, welches PAR wir benutzen sollten. Der Streit darum wird heftig geführt, bleibt nicht immer ganz sachlich und geht meiner Meinung nach meistens am Kern des Problems vorbei. Erst einmal müssen wir zwei Dinge klarstellen, mit denen in Diskussionen immer wieder argumentiert wird.

Immer unter der Voraussetzung, dass wir das ursprüngliche Seitenverhältnis so exakt wie möglich wieder herstellen wollen, existiert genau ein entscheidender Faktor, der über das richtige PAR entscheidet:

Mit welchem PAR arbeitet die jeweilige DVD?

Eigentlich ist die Überlegung so simpel, dass überhaupt keine Diskussion entstehen sollte. Wenn Person A einen Film horizontal auf die Hälfte staucht und Person B das ursprüngliche Bild wieder herstellen will, dann muss Person B den Film auf 200% auseinander ziehen. Und wenn Person C einen anderen Film auf drei Viertel seiner Breite quetscht, dann muss Person B diesen Film auf 133% auseinander ziehen. Im zweiten Fall stur auf 200% zu beharren, wäre blödsinnig, wie die folgenden Beispielbilder zeigen.

Genauso blödsinnig verhalten sich aber sowohl die Hardcore-Verfechter des ITU-PAR als auch die Hardcore-Verfechter des Generischen PAR. Da wird seitenlang gestritten und am eigentlichen Kern des Problems geradeaus vorbeidiskutiert.

Das richtige PAR ist dasjenige, das im Produktionsprozess benutzt wurde.

An dieser Stelle muss eine sinnvolle Diskussion ansetzen, denn so klar die Grundaussage auch ist, die praktische Umsetzung bereitet Probleme. Das PAR ist nämlich nirgendwo auf der DVD vermerkt, es existiert also keine Möglichkeit, den richtigen Wert einfach abzulesen. Genauso unmöglich erscheint es bei kommerziellen DVDs, sämtliche Techniker der kompletten Verarbeitungskette ausfindig zu machen und nachzufragen. Es bleibt also nur die Trial-and-Error-Methode: Wir entzerren das Bild mit den verschiedenen PARs und messen nach, ob Kreise auch wirklich rund erscheinen.

Das ist zu kompliziert und zeitaufwändig für die tägliche Praxis und obendrein höchst fehleranfällig? Stimmt. Möglicherweise können wir aber mit ein wenig Überlegung einer der beiden Varianten den Vorzug geben. Um das Ergebnis vorweg zu nehmen:

Das ITU-PAR zu wählen, ist die logischere Alternative.

Warum?

Für DVDs mit vertikalen Balken erscheint es unsinnig, Generisches PAR anzunehmen. Aus welchem Grund sollte jemand zwar 720 Pixel als aktiv ansehen, dann aber trotzdem nicht die volle Breite ausnutzen? Solche DVDs würde ich deswegen immer ohne zu zögern nach ITU entzerren, zumal die Balken oft verdächtig genau im Bereich der 2×9 nicht aktiven PAL-Pixel liegen.

Gerade neuere DVDs nutzen immer häufiger die komplette DVD-Auflösung aus. Trotzdem erscheint es in der Regel sinnvoller, auch hier das ITU-PAR anzuwenden. Denn dass beim Mastering ITU angewendet und die inaktive Fläche anstatt mit Schwarz mit zusätzlichem Bild gefüllt wurde, ist aus einigen Gründen wahrscheinlicher.

Das alles beweist nichts eindeutig und endgültig. Es lässt allerdings die Aussage wahrscheinlich erscheinen, dass die Mehrheit der DVDs entsprechend ITU-R BT.601 gemastert wird. Wer nicht jede DVD vor dem Encoding exakt vermessen will, dem rate ich deshalb zu den ITU-Werten.

Das gilt nicht für die neuen hochauflösenden Formate wie Blu-ray oder HDTV. Da denen von Anfang ein ein vollständig digitales Szenario zugrunde liegt, ist das Generische PAR die einzig sinnvolle Wahl. Die große Mehrheit der HD-Quellen umgeht das Problem sowieso, indem sie quadratische Pixel verwendet.

Lohnt sich der ganze Glaubenskrieg eigentlich wirklich? Das tut er dann, wenn zwischen ITU-PAR und Generischem PAR ein deutlich sichtbarer Unterschied besteht. Die Abweichung zu den exakten ITU-Werten berechnet sich im 16:9-Fall wie unten. Mit den 4:3-Werten würden wir genau die gleichen Ergebnisse erhalten.

PAL-Abweichung = 512/351 / 64/45 = 2,56%
NTSC-Abweichung = 5760/4739 / 32/27 = 1,03%

Für klassische Encodings mit quadratischen Pixeln haben wir einen Aspect Error bis 2,5% als unproblematisch definiert. NTSC liegt also klar in dem Bereich, an den wir beim klassischen Encoding keinen weiteren Gedanken verschwenden würden. PAL testet die Grenze zwar an, aber um das Kapitel über die nicht-anamorphe Zielauflösung zu zitieren: »Geringe Fehler – etwa bis 2,5% – sind unproblematisch, weil die Verzerrung zu klein bleibt, um spürbar zu werden.«

Aha. Ab in etwa 2,5% können wir also langsam damit rechnen, dass die Abweichung sichtbar werden könnte. Nach Katastrophenfall klingt das keineswegs. Auch sind die 2,5% vorsichtig angesetzt. Das klassische Encoding-Frontend Gordian Knot z.B. warnt erst bei über 3,5% vor einer kritischen Abweichung.

Die komplette PAR-Diskussion hat also schon ihre Berechtigung. Nur geht in Grabenkämpfen und zwischen technischen Details oft die Perspektive verloren. Wir streiten uns um Abweichungen, für die wir an anderer Stelle seit Jahren nur ein Schulterzucken übrig haben. So richtig will es mir nicht einleuchten, warum ein Unterschied, den wir bisher nicht sehen konnten, plötzlich so durchschlagend wichtig sein sollte.

Weiterführende Links

Um ITU-R-Dokumente kostenlos herunterzuladen, muss man sich zuerst im ITU Bookshop für 3 Free Recs anmelden. Die erhaltenen Login-Daten gelten für drei Downloads.