Resizing heißt der Vorgang, den Film auf die richtige Zielauflösung zu skalieren. Besonders einfach ist das, wenn wir ein modernes anamorphes Encoding erstellen, denn dann findet kein Resizing statt. Wir schneiden nur – wie ein Kapitel weiter vorn erklärt – die schwarzen Balken rund um das Video weg und überlassen es dem Decoder, beim Abspielen das Bild korrekt anzuzeigen. Beim klassischen nicht-anamorphen Encoding müssen wir das Bild nach den Regeln in diesem Kapitel skalieren. Für anamorphe Encodings ist zumindest der Abschnitt über den Zusammenhang zwischen Auflösung und Qualität wichtig. Anhand dessen können wir entscheiden, ob der Speicherplatz für ein anamorphes Bild überhaupt ausreicht.
Nehmen wir wieder Die fabelhafte Welt der Amélie als Beispiel. Von der ursprünglichen PAL-Auflösung von 720×576 Pixeln bleiben nach dem Cropping (je 4 Pixel links und rechts, je 72 Pixel oben und unten) noch 712×432 Pixel übrig. Angenommen, wir entscheiden uns im fertigen Encoding für eine horizontale Auflösung von 608 Pixeln. Das entspricht 85,4% der ursprünglichen 712 Pixel. Die Höhe um den gleichen Faktor geschrumpft ergibt eine Zielauflösung von 608×369 Pixeln und sieht so aus:
Sofort fällt auf, dass diese extrem langgezogene Kopfform kaum der Realität entsprechen kann. Was wir bisher nicht bedacht haben, ist das verzerrt gespeicherte Bild der DVD. Berücksichtigen wir das, erhalten wir eine korrekte Zielauflösung von 608×256 Pixeln.
Die passende Zielauflösung zu berechnen, ist schon deswegen nicht schwer, weil uns das Encoding-Frontend diese Arbeit abnimmt. Doch auch manuell stellen sich uns keine größeren Hürden in den Weg.
Zusätzlich zur eigentlichen Rechnung müssen wir auch das Mod16-Kriterium im Kopf behalten. Die Zielauflösung soll in beiden Dimensionen glatt durch 16 teilbar sein.
Um die endgültige Auflösung zu ermitteln, wählen wir zuerst die Zielbreite: 608 Pixel (38×16). Welche Breite sinnvoll ist, hängt hauptsächlich davon ab, wie stark wir den Film schrumpfen wollen. Genaueres dazu weiter unten auf dieser Seite. Die passende vertikale Auflösung erhalten wir mit dieser Formel:
Eingesetzt und ausgerechnet ergibt das 253,6 Pixel in der Vertikalen.
Dass ein Bildschirm natürlich natürlich keine Bruchteile von Pixeln darstellen kann, brauchen wir nicht extra zu beachten, weil die Zielhöhe sowieso das Mod16-Kriterium einhalten soll. Entsprechend runden wir das Ergebnis der Formel noch auf das nächste Vielfache von 16 und erhalten 256 (16×16).
Wie dankbar der Codec für das Mod16-Kriterium auch ist, wir erkaufen das mit einem Nachteil. Da wir die Auflösung nicht pixelgenau zurechtrücken können, entsteht eine Abweichung zum eigentlich richtigen Ergebnis. Das Runden auf mod16 verursacht in unserem Beispiel einen Fehler von knapp 1%. Die ursprüngliche Verzerrung ist nicht ganz exakt korrigiert worden. Da wir eine zu hohe vertikale Auflösung gewählt haben, enthält das Bild minimale Eierköpfe.
Geringe Fehler – etwa bis 2,5% – sind unproblematisch, weil die Verzerrung zu klein bleibt, um spürbar zu werden. Das Mod16-Kriterium bietet eine ausreichend feine Abstufung, um größere Abweichungen zu vermeiden. Wer den Fehler doch selbst berechnen möchte, hier ist die Formel:
Um den AR-Fehler komplett zu vermeiden, gibt es zwei Möglichkeiten.
Mit diesem Wissen ausgerüstet, können wir nun daran gehen, eine günstige Auflösung zu wählen. Günstig bedeutet: eine Auflösung, die (neben einem geringen AR-Fehler) gute Qualität bietet. Für ein 1-Pass-Encoding ist das einfach. Die günstige Auflösung ist diejenige, die das gewünschte Niveau an Details erhält. Beim 2-Pass-Encoding müssen wir Auflösung, Zielgröße und Qualität gegeneinander abwägen. Dazu benötigen wir einen Qualitätsindikator.
Im Wesentlichen stehen uns drei Indikatoren zur Verfügung. Welche das sind und welche Aussagekraft sie besitzen, das zeigt die folgende Tabelle.
Indikator | Aussagekraft |
---|---|
Bitrate | nutzlos |
relative Bitrate (BPF) | erster Grobeindruck |
Kompressionstest | guter individueller Anhaltspunkt |
Obwohl man sofort an die Bitrate (meistens in kbit/s angegeben) denkt, wenn man einen digitalen Film sieht, interessiert uns die während des gesamten Backupprozesses überhaupt nicht. Die Angabe, wie viele Bits dem Encoder im Durchschnitt pro Sekunde zur Verfügung stehen, ist viel zu ungenau, um eine brauchbare Aussage über die Qualität zu liefern.
Interessanter ist die relative Bitrate, besser bekannt als BPF-Wert. Der gibt an, wie viele Bits zum Encodieren eines einzelnen Pixels in jedem Bild durchschnittlich zur Verfügung stehen. Das heißt, er berücksichtigt alle direkt berechenbaren Einflussfaktoren (Zielgröße, Filmlänge, Framerate, Auflösung). Allerdings sagt er kaum Definitives über die endgültig sichtbare Qualität aus. Ein Drama mit vielen langen Dialogen und hauptsächlich langsamen Szenen braucht für die gleiche sichtbare Qualität einen niedrigeren Wert als ein schneller Actionstreifen. Sehr nachtlastige Filme geben sich auch mit einem niedrigeren Wert zufrieden, da Szenen im hellen Tageslicht viel mehr Details enthalten und deshalb auch mehr Bits benötigen. Um einen ersten groben Eindruck zu bekommen, ist der BPF-Wert ganz nützlich. Deshalb können wir uns gerne daran orientieren, wenn ihn das Encoding-Frontend sowieso anzeigt. Wenn nicht, auch nicht so wild.
Die individuellen Eigenschaften jedes Films berücksichtigt nur der Kompressionstest. Der Test nimmt in regelmäßigen Abständen kurze Schnipsel aus dem Film und encodiert die mit maximaler Qualität. Das Ergebnis ist ein guter Anhaltspunkt für die tatsächlich sichtbare Qualität des Encodings.
Mit der relativen Bitrate als Indikator ausgerüstet, können wir nun daran gehen, eine sinnvolle Auflösung zu wählen. Dabei geht es erst einmal darum, grob die Parameter des Encodings einzustellen, so dass sie in einem sinnvollen Bereich liegen. Hinterher führen wir sowieso noch einen Kompressionstest durch, der uns genauer darüber Aufschluss gibt, wie gut die erste Wahl war. Wenn sich dabei herausstellt, dass wir daneben gelegen waren, passen wir eben noch einmal an.
Je kleiner die Auflösung, desto weniger Details enthält ein Einzelbild unabhängig von jeder Kompression. Abgespielt wird der Film aber wahrscheinlich weiterhin im Vollbild. Es ist zwar kein Problem, ein Bild so weit zu strecken, dass es den ganzen Bildschirm ausfüllt, nur lassen sich dadurch die Details nicht zurückgewinnen. Deshalb führt eine kleinere Auflösung zwar zu einer weniger heftigen Kompression und vermeidet dadurch möglicherweise Makroblock-Artefakte; das erkaufen wir jedoch mit einem Detail- und damit Qualitätsverlust. Um den nicht zu groß werden zu lassen, sollten wir Auflösungen deutlich unter 600 Pixel in der Horizontalen besser vermeiden.
Ein Maximum ist einfacher definiert. Spätestens, wenn sowohl Höhe als auch Breite die zugeschnittene Originalauflösung erreicht haben, verliert eine weitere Steigerung ihren Sinn, weil wir dann in beiden Dimensionen Pseudodetails erfinden, die auf der DVD nie vorhanden waren. Schöner lässt sich Bitrate nicht verschwenden. Für einen PAL-Film im 16:9-Format bedeutet diese Regel eine maximale horizontale Auflösung um die 1024 Pixel. Das ist verdammt viel, weshalb uns in der Regel schon deutlich vorher der beschränkte Speicherplatz einen Strich durch die Rechnung macht. Zusätzlich braucht ein größeres Bild auch mehr Rechenleistung beim Abspielen. Für die Realität heißt das, dass mehr als die originalen 720 horizontalen Pixeln kaum vorkommen.
Und damit zu ein paar konkreten Anhaltspunkten für die Auflösungswahl. Haben wir den BPF-Wert zur Verfügung, sollten wir ihn verwenden. Ansonsten können wir uns an der Fläche der Zielauflösung orientieren, so wie in der Tabelle zu sehen. Ungewöhnlich lange/kurze Filmlängen oder ungewöhnlich große/kleine Audiospuren sollten wir dabei natürlich zusätzlich berücksichtigen.
Zielgröße | BPF-Wert | Auflösung (Fläche) |
---|---|---|
1 CD | Xvid/DivX: nicht unter 0,20 x264: nicht unter 0,15 |
ca. 160.000 Pixel |
2 CDs | darf sich ruhig Richtung 0,30 orientieren | ca. 230.000 Pixel, aber nicht wesentlich mehr als 720 Pixel horizontal |
½ DVD | darf die 0,30 ruhig überschreiten | irrelevant, da sich anamorphes Encoding ohne Resizing anbietet |
Die Auflösung ist nicht die einzige Schraube, an der sich drehen lässt. Wir können auch:
Ohne BPF-Wert ist es nur mit Erfahrung möglich, die Auswirkungen dieser Anpassungen abzuschätzen. Die Tabelle oben geht für 1-CD-Encodings von einer einzelnen kleinen Audiospur aus und für 2-CD-Encodings von einer großen (möglicherweise AC-3) bzw. zwei kleineren. Die richtig hohen Zielgrößen sollten nahezu immer den Platz für anamorphes Bild und mindestens eine AC-3 bieten.
Das wichtigste an der Auflösungswahl ist, die Grenzen als die fließenden Richtlinien zu sehen, die sie sind. Mit wachsender Erfahrung weiß man irgendwann intuitiv, welcher Film ein paar mehr Bits nötig hat und welchen man ein bisschen mehr quetschen kann. Außerdem ist sowieso alles vorläufig. Nach dem Kompressionstest haben wir einen Indikator, der uns deutlich mehr als einen groben Anhaltspunkt bietet. Da der genaue Ablauf des Tests von der Software abhängt, besprechen wir den später im StaxRip-Kapitel des Praxisteil.