Brother Johns Encodingwissen

Zum Inhalt springen
Wechseln zu: Inhaltsverzeichnis, Abkürzungsverzeichnis

Die passende Zielauflösung

Resizing heißt der Vorgang, den Film auf die richtige Zielauflösung zu skalieren. Besonders einfach ist das, wenn wir ein modernes anamorphes Encoding erstellen, denn dann findet kein Resizing statt. Wir schneiden nur – wie im letzten Kapitel erklärt – die schwarzen Balken rund um das Video weg und überlassen es dem Decoder, beim Abspielen das Bild korrekt anzuzeigen. Nur beim klassischen nicht-anamorphen Encoding müssen wir das Bild nach den Regeln in diesem Kapitel skalieren. Für anamorphe Encodings ist zumindest der Abschnitt über den Zusammenhang zwischen Auflösung und Qualität wichtig. Anhand dessen können wir entscheiden, ob der Speicherplatz für ein anamorphes Bild überhaupt ausreicht.

Ein Beispiel

Nehmen wir wieder Die fabelhafte Welt der Amélie als Beispiel. Von der ursprünglichen PAL-Auflösung von 720 × 576 Pixeln bleiben nach dem Cropping (je 4 Pixel links und rechts, je 72 Pixel oben und unten) noch 712 × 432 Pixel übrig. Angenommen, wir entscheiden uns im fertigen Encoding für eine horizontale Auflösung von 608 Pixeln. Das entspricht 85,4 % der ursprünglichen 712 Pixel. Die Höhe um den gleichen Faktor geschrumpft ergibt eine Zielauflösung von 608 × 369 Pixeln, und Frame Nummer 160.932 sieht so aus:

Vertikal verzerrtes Bild

Sofort fällt auf, dass diese extrem langgezogene Kopfform kaum der Realität entsprechen kann. Was wir bisher nicht bedacht haben, ist das verzerrt gespeicherte Bild der DVD. Berücksichtigen wir das korrekt, erhalten wir eine Zielauflösung von 608 × 256 Pixeln.

Bild mit korrektem Seitenverhältnis

Das sieht nicht nur deutlich natürlicher aus, sondern ist auch korrekt.

Berechnung der Zielauflösung

Die passende Zielauflösung zu berechnen, ist schon deswegen nicht schwer, weil uns das Encoding-Frontend diese Arbeit abnimmt. Doch auch manuell stellen sich uns keine größeren Hürden in den Weg.

Zusätzlich zur eigentlichen Rechnung müssen wir auch das Mod16-Kriterium aus dem letzten Kapitel im Kopf behalten. Die Zielauflösung muss in beiden Dimensionen glatt durch 16 teilbar sein.

Um die endgültige Auflösung zu ermitteln, wählen wir zuerst die Zielbreite: 608 Pixel (38 × 16). Welche Breite sinnvoll ist, hängt hauptsächlich davon ab, wie stark wir den Film schrumpfen wollen. Genaueres dazu weiter unten auf dieser Seite. Die passende vertikale Auflösung erhalten wir mit dieser Formel:

Zielhöhe = Zielbreite / (AR nach Cropping x PAR)

Eingesetzt und ausgerechnet ergibt das Ganze 253,6 Pixel in der Vertikalen.

Zielhöhe = 608 / (712/432 x 16/11) = 253,6

Dass ein Bildschirm natürlich natürlich keine Bruchteile von Pixeln darstellen kann, brauchen wir nicht extra zu beachten, weil die Zielhöhe sowieso das Mod16-Kriterium einhalten muss. Entsprechend runden wir das Ergebnis der Formel noch auf das nächste Vielfache von 16 und erhalten 256 (16 × 16).

Abweichung vom optimalen AR (Aspect Error)

Wie dankbar der Codec für das Mod16-Kriterium auch ist, wir erkaufen das mit einem Nachteil. Da wir die Auflösung nicht pixelgenau zurechtrücken können, entsteht eine Abweichung zum eigentlich richtigen Ergebnis. Das Runden auf Mod16 verursacht in unserem Beispiel einen Fehler von knapp 1 %. Die ursprüngliche Verzerrung ist nicht ganz exakt korrigiert worden. Da wir eine zu hohe vertikale Auflösung gewählt haben, enthält das Bild minimale Eierköpfe.

Geringe Fehler – etwa bis 2,5 % – sind unproblematisch, weil die Verzerrung zu klein bleibt, um spürbar zu werden. Das Mod16-Kriterium bietet eine ausreichend feine Abstufung, um größere Abweichungen zu vermeiden. Wer den Fehler doch selbst berechnen möchte, hier ist die Formel:

Fehler in % = ((Mod16-Zielhöhe / korrekte Zielhöhe) - 1) * 100

Um den AR-Fehler komplett zu vermeiden, gibt es zwei Möglichkeiten.

Auflösung und Qualität

Mit diesem Wissen ausgerüstet, können wir nun daran gehen, eine günstige Auflösung zu wählen. Günstig bedeutet: eine Auflösung, die gute Qualität bietet. Dazu benötigen wir einen Qualitätsindikator.

BPF als Qualitätsindikator

Nein, nicht die Bitrate. Obwohl man sofort an die Bitrate denkt, wenn man einen digitalen Film sieht, interessiert uns die während des gesamten Backupprozesses überhaupt nicht. Die Angabe, wie viele Bits dem Codec im Durchschnitt pro Sekunde zur Verfügung stehen, ist viel zu ungenau, um eine brauchbare Aussage über die Qualität zu liefern. Viel interessanter ist die relative Bitrate, besser bekannt als BPF-Wert. Der gibt an, wie viele Bits zum Encodieren eines einzelnen Pixels durchschnittlich zur Verfügung stehen. Das heißt, er berücksichtigt alle direkt berechenbaren Einflussfaktoren (Zielgröße, Filmlänge, Framerate, Auflösung). Allerdings sagt er nur bedingt Definitives über die endgültig sichtbare Qualität aus. Ein Drama mit vielen langen Dialogen und hauptsächlich langsamen Szenen braucht für die gleiche sichtbare Qualität einen niedrigeren Wert als ein schneller Actionstreifen. Sehr nachtlastige Filme geben sich auch mit einem niedrigeren Wert zufrieden, da Szenen im hellen Tageslicht viel mehr Details enthalten und deshalb auch mehr Bits benötigen. Deshalb kann der BPF-Wert immer nur ein Anhaltspunkt für die sichtbare Qualität sein.

Berechnet wird die relative Bitrate mit dieser Formel:

BPF = (Videogröße in Byte x 8) / (Zielbreite x Zielhöhe x Anzahl Frames)

Die Videogröße bezeichnet dabei nicht die Zielgröße des gesamten Films, sondern nur die Größe der reinen Videospur.

Videogröße = Gesamtzielgröße – Tonspuren – Untertitel – Containeroverhead

Da sich der Containeroverhead nicht in eine einfache Formel packen lässt, ist eine manuelle Berechnung reine Quälerei. Das Encoding-Frontend nimmt uns die Arbeit sowieso ab.

Als kleines Beispiel bleiben wir bei der Amélie, und zwar in dieser Konfiguration:

BPF = (884.405.248 x 8) / (608 x 256 x 178.308) = 0,255

Damit wissen wir, dass ein einzelnes Pixel im Schnitt mit einem Viertel Bit Speicherplatz auskommen muss. Das allein bringt uns noch nicht weiter. Um BPF-Werte in sinnvolle und weniger sinnvolle Kategorien aufzuteilen, braucht es Erfahrungswerte.

Sinnvolle BPF-Werte

Erfahrungswerte existieren auch. Für MPEG-4-ASP-Codecs (Xvid, DivX) und MPEG-4-AVC-Codecs (x264) hat sich jeweils ein Bereich herauskristallisiert, in dem sich die relative Bitrate bewegen sollte.

  MPEG-4 ASP MPEG-4 AVC
Untergrenze 0,20 0,15
Obergrenze 0,40 0,35

Grundsätzlich kann man sagen: Unterschreiten wir den sinnvollen Bereich deutlich, äußert sich das in schlechter Bildqualität, v. a. hässliche Makroblock-Artefakte werden dann sichtbar. Deutlich darüber erzeugt nur eine größere Datei bei kaum noch höherer Qualität. 1-CD-Encodings orientieren sich in Richtung der der Untergrenze, Encodings für zwei oder mehr CDs in Richtung der Obergrenze. Über anamorphe Auflösungen eine Aussage zu treffen, ist schwieriger. Da es sich dabei um hochqualitative Backups handelt, würde ich sie in die Mitte mit einer Tendenz nach oben einordnen.

Nie vergessen sollten wir den Richtwertcharakter des BPF-Werts. Die Werte in der Tabelle sind Anhaltspunkte, keine in Stein gemeißelten Grenzen, und Ausreißer können durchaus vorkommen: z. B. ein Film, der mit 0,15 höchsten Ansprüchen genügt; oder ein anderer, der erst ab 0,45 keine sichtbaren Makroblocks mehr aufweist. Um solche Spezialfälle in den Griff zu bekommen, brauchen wir einen genaueren Qualitätsindikator, den Kompressionstest. Da der jedoch stark vom Encoding-Frontend abhängt, beschäftigen wir uns damit im Praxisteil des Encodingwissens.

Wahl einer sinnvollen Auflösung

Mit all diesem Wissen ausgerüstet, können wir nun für jeden Film eine passende Zielauflösung ermitteln, die einen akzeptablen AR-Fehler mit einer sinnvollen relativen Bitrate verbindet.

Je kleiner die Auflösung, desto weniger Details enthält ein Einzelbild unabhängig von jeder Kompression. Abgespielt wird der Film aber wahrscheinlich weiterhin im Vollbild. Es ist zwar kein Problem, ein Bild so weit zu strecken, dass es den ganzen Bildschirm ausfüllt, nur lassen sich dadurch die Details nicht zurückgewinnen. Deshalb führt eine kleinere Auflösung zwar zu einem höheren BPF-Wert, gleichzeitig aber auch zu einem Detail- und damit Qualitätsverlust. Um den nicht zu groß werden zu lassen, sollten wir Auflösungen unter 512 Pixel in der Horizontalen lieber vermeiden.

Ein Maximum ist einfacher definiert. Spätestens, wenn sowohl Höhe als auch Breite die gecroppte Originalauflösung erreicht haben, verliert eine weitere Steigerung ihren Sinn, weil wir dann in beiden Dimensionen Pseudodetails erfinden, die auf der DVD nie vorhanden waren. Schöner lässt sich Bitrate nicht verschwenden.

Für einen PAL-Film im 16:9-Format bedeutet diese Regel eine maximale horizontale Auflösung von um die 1024 Pixel. Das ist verdammt viel, weshalb uns in der Regel schon deutlich vorher der beschränkte Speicherplatz einen Strich durch die Rechnung macht. Zusätzlich braucht ein größeres Bild auch mehr Rechenleistung beim Abspielen. Für die Realität heißt das, dass wir uns meistens in der Region zwischen 640 und 720 horizontalen Pixeln bewegen.

Einfacher stellt sich die Wahl für anamorphe Encodings dar. Entweder reicht der Speicherplatz für einen sinnvollen BPF-Wert aus, oder wir müssen uns vom anamorphen Bild verabschieden.

Doch die Auflösung ist nicht die einzige Schraube, an der sich drehen lässt. Um den BPF-Wert zu beeinflussen, können wir auch:

Das wichtigste an der Auflösungswahl ist, die Grenzen als die fließenden Richtlinien zu sehen, die sie sind. Mit wachsender Erfahrung weiß man irgendwann sowieso intuitiv, welcher Film ein paar mehr Bits nötig hat und welchen man ein bisschen mehr quetschen kann.

< Anamorphes MPEG-4 | Seitenanfang | Codec-Konfiguration >