Zum Inhalt springen

Brother Johns Encodingwissen

Wechseln zu: Inhalt, Abkürzungen

Die passende Zielauflösung

Resizing heißt der Vorgang, den Film auf die richtige Zielauflösung zu skalieren. Besonders einfach ist das, wenn wir ein modernes anamorphes Encoding erstellen, denn dann findet kein Resizing statt. Wir schneiden nur – wie ein Kapitel weiter vorn erklärt – die schwarzen Balken rund um das Video weg und überlassen es dem Decoder, beim Abspielen das Bild korrekt anzuzeigen. Nur beim klassischen nicht-anamorphen Encoding müssen wir das Bild nach den Regeln in diesem Kapitel skalieren. Für anamorphe Encodings ist zumindest der Abschnitt über den Zusammenhang zwischen Auflösung und Qualität wichtig. Anhand dessen können wir entscheiden, ob der Speicherplatz für ein anamorphes Bild überhaupt ausreicht.

Ein Beispiel

Nehmen wir wieder Die fabelhafte Welt der Amélie als Beispiel. Von der ursprünglichen PAL-Auflösung von 720×576 Pixeln bleiben nach dem Cropping (je 4 Pixel links und rechts, je 72 Pixel oben und unten) noch 712×432 Pixel übrig. Angenommen, wir entscheiden uns im fertigen Encoding für eine horizontale Auflösung von 608 Pixeln. Das entspricht 85,4% der ursprünglichen 712 Pixel. Die Höhe um den gleichen Faktor geschrumpft ergibt eine Zielauflösung von 608×369 Pixeln, und Frame Nummer 160.932 sieht so aus:

Vertikal verzerrtes Bild

Sofort fällt auf, dass diese extrem langgezogene Kopfform kaum der Realität entsprechen kann. Was wir bisher nicht bedacht haben, ist das verzerrt gespeicherte Bild der DVD. Berücksichtigen wir das korrekt, erhalten wir eine Zielauflösung von 608×256 Pixeln.

Bild mit korrektem Seitenverhältnis

Das sieht nicht nur deutlich natürlicher aus, sondern ist auch korrekt.

Berechnung der Zielauflösung

Die passende Zielauflösung zu berechnen, ist schon deswegen nicht schwer, weil uns das Encoding-Frontend diese Arbeit abnimmt. Doch auch manuell stellen sich uns keine größeren Hürden in den Weg.

Zusätzlich zur eigentlichen Rechnung müssen wir auch das Mod16-Kriterium im Kopf behalten. Die Zielauflösung muss in beiden Dimensionen glatt durch 16 teilbar sein.

Um die endgültige Auflösung zu ermitteln, wählen wir zuerst die Zielbreite: 608 Pixel (38×16). Welche Breite sinnvoll ist, hängt hauptsächlich davon ab, wie stark wir den Film schrumpfen wollen. Genaueres dazu weiter unten auf dieser Seite. Die passende vertikale Auflösung erhalten wir mit dieser Formel:

Zielhöhe = Zielbreite / (AR nach Cropping x PAR)

Eingesetzt und ausgerechnet ergibt das Ganze 253,6 Pixel in der Vertikalen.

Zielhöhe = 608 / (712/432 x 16/11) = 253,6

Dass ein Bildschirm natürlich natürlich keine Bruchteile von Pixeln darstellen kann, brauchen wir nicht extra zu beachten, weil die Zielhöhe sowieso das Mod16-Kriterium einhalten muss. Entsprechend runden wir das Ergebnis der Formel noch auf das nächste Vielfache von 16 und erhalten 256 (16×16).

Abweichung vom optimalen AR: Aspect Error

Wie dankbar der Codec für das Mod16-Kriterium auch ist, wir erkaufen das mit einem Nachteil. Da wir die Auflösung nicht pixelgenau zurechtrücken können, entsteht eine Abweichung zum eigentlich richtigen Ergebnis. Das Runden auf mod16 verursacht in unserem Beispiel einen Fehler von knapp 1%. Die ursprüngliche Verzerrung ist nicht ganz exakt korrigiert worden. Da wir eine zu hohe vertikale Auflösung gewählt haben, enthält das Bild minimale Eierköpfe.

Geringe Fehler – etwa bis 2,5% – sind unproblematisch, weil die Verzerrung zu klein bleibt, um spürbar zu werden. Das Mod16-Kriterium bietet eine ausreichend feine Abstufung, um größere Abweichungen zu vermeiden. Wer den Fehler doch selbst berechnen möchte, hier ist die Formel:

Fehler in % = ((Mod16-Zielhöhe / korrekte Zielhöhe) - 1) * 100

Um den AR-Fehler komplett zu vermeiden, gibt es zwei Möglichkeiten.

Auflösung und Qualität

Mit diesem Wissen ausgerüstet, können wir nun daran gehen, eine günstige Auflösung zu wählen. Günstig bedeutet: eine Auflösung, die (neben einem geringen AR-Fehler) gute Qualität bietet. Dazu benötigen wir einen Qualitätsindikator.

Qualitätsindikatoren

Im Wesentlichen stehen uns drei Indikatoren zur Verfügung. Welche das sind und welche Aussagekraft sie besitzen, das zeigt die folgende Tabelle.

Indikator Aussagekraft
Bitrate nutzlos
relative Bitrate (BPF) erster Grobeindruck
Kompressionstest guter individueller Anhaltspunkt

Obwohl man sofort an die Bitrate (meistens in kbit/s angegeben) denkt, wenn man einen digitalen Film sieht, interessiert uns die während des gesamten Backupprozesses überhaupt nicht. Die Angabe, wie viele Bits dem Encoder im Durchschnitt pro Sekunde zur Verfügung stehen, ist viel zu ungenau, um eine brauchbare Aussage über die Qualität zu liefern. Deswegen stimmt das »nutzlos« in der Tabelle ganz genau.

Interessanter ist die relative Bitrate, besser bekannt als BPF-Wert. Der gibt an, wie viele Bits zum Encodieren eines einzelnen Pixels in jedem einzelnen Bild durchschnittlich zur Verfügung stehen. Das heißt, er berücksichtigt alle direkt berechenbaren Einflussfaktoren (Zielgröße, Filmlänge, Framerate, Auflösung). Allerdings sagt er kaum Definitives über die endgültig sichtbare Qualität aus. Ein Drama mit vielen langen Dialogen und hauptsächlich langsamen Szenen braucht für die gleiche sichtbare Qualität einen niedrigeren Wert als ein schneller Actionstreifen. Sehr nachtlastige Filme geben sich auch mit einem niedrigeren Wert zufrieden, da Szenen im hellen Tageslicht viel mehr Details enthalten und deshalb auch mehr Bits benötigen. Um einen ersten groben Eindruck zu bekommen, ist der BPF-Wert ganz nützlich. Deshalb können wir uns gerne daran orientieren, wenn ihn das Encoding-Frontend sowieso anzeigt. Wenn nicht, auch nicht so wild.

Die individuellen Eigenschaften jedes Films berücksichtigt nur der Kompressionstest. Der Test nimmt in regelmäßigen Abständen kurze Schnipsel aus dem Film und encodiert die mit maximaler Qualität. Das Ergebnis ist ein guter Anhaltspunkt für die tatsächlich sichtbare Qualität des Encodings.

Wahl einer sinnvollen Auflösung

Mit der relativen Bitrate als Indikator ausgerüstet, können wir nun daran gehen, eine sinnvolle Auflösung zu wählen. Dabei geht es erst einmal darum, grob die Parameter des Encodings einzustellen, so dass sie in einem sinnvollen Bereich liegen. Hinterher führen wir sowieso noch einen Kompressionstest durch, der uns genauer darüber Aufschluss gibt, wie gut die erste Wahl war. Wenn sich dabei herausstellt, dass wir daneben gelegen waren, passen wir eben noch einmal an.

Je kleiner die Auflösung, desto weniger Details enthält ein Einzelbild unabhängig von jeder Kompression. Abgespielt wird der Film aber wahrscheinlich weiterhin im Vollbild. Es ist zwar kein Problem, ein Bild so weit zu strecken, dass es den ganzen Bildschirm ausfüllt, nur lassen sich dadurch die Details nicht zurückgewinnen. Deshalb führt eine kleinere Auflösung zwar zu einer weniger heftigen Kompression und vermeidet dadurch möglicherweise Makroblock-Artefakte; das erkaufen wir jedoch mit einem Detail- und damit Qualitätsverlust. Um den nicht zu groß werden zu lassen, sollten wir Auflösungen deutlich unter 600 Pixel in der Horizontalen besser vermeiden.

Ein Maximum ist einfacher definiert. Spätestens, wenn sowohl Höhe als auch Breite die zugeschnittene Originalauflösung erreicht haben, verliert eine weitere Steigerung ihren Sinn, weil wir dann in beiden Dimensionen Pseudodetails erfinden, die auf der DVD nie vorhanden waren. Schöner lässt sich Bitrate nicht verschwenden. Für einen PAL-Film im 16:9-Format bedeutet diese Regel eine maximale horizontale Auflösung um die 1024 Pixel. Das ist verdammt viel, weshalb uns in der Regel schon deutlich vorher der beschränkte Speicherplatz einen Strich durch die Rechnung macht. Zusätzlich braucht ein größeres Bild auch mehr Rechenleistung beim Abspielen. Für die Realität heißt das, dass mehr als die originalen 720 horizontalen Pixeln kaum vorkommen.

Und damit zu ein paar konkreten Anhaltspunkten für die Auflösungswahl. Haben wir den BPF-Wert zur Verfügung, sollten wir ihn verwenden. Ansonsten können wir uns an der Fläche der Zielauflösung orientieren, so wie in der Tabelle zu sehen. Ungewöhnlich lange/kurze Filmlängen oder ungewöhnlich große/kleine Audiospuren sollten wir dabei natürlich zusätzlich berücksichtigen.

Zielgröße BPF-Wert Auflösung (Fläche)
1 CD Xvid/DivX: nicht unter 0,20
x264: nicht unter 0,15
ca. 160.000 Pixel
2 CDs darf sich ruhig Richtung 0,30 orientieren ca. 230.000 Pixel, aber nicht wesentlich mehr als 720 Pixel horizontal
½ DVD darf die 0,30 ruhig überschreiten irrelevant, da sich anamorphes Encoding ohne Resizing anbietet

Die Auflösung ist nicht die einzige Schraube, an der sich drehen lässt. Wir können auch:

Ohne BPF-Wert ist es nur mit Erfahrung möglich, die Auswirkungen dieser Anpassungen abzuschätzen. Die Tabelle oben geht für 1-CD-Encodings von einer einzelnen kleinen Audiospur aus und für 2-CD-Encodings von einer großen (möglicherweise AC3) bzw. zwei kleineren. Die richtig hohen Zielgrößen sollten nahezu immer den Platz für anamorphes Bild und mindestens eine AC3 bieten.

Das wichtigste an der Auflösungswahl ist, die Grenzen als die fließenden Richtlinien zu sehen, die sie sind. Mit wachsender Erfahrung weiß man irgendwann intuitiv, welcher Film ein paar mehr Bits nötig hat und welchen man ein bisschen mehr quetschen kann. Außerdem ist sowieso alles vorläufig. Nach dem Kompressionstest haben wir einen Indikator, der uns deutlich mehr als einen groben Anhaltspunkt bietet. Da der Test sich zwischen den Encoding-Frontends ein Stück unterscheidet, besprechen wir den später im Praxisteil zu StaxRip und Gordian Knot.