Brother Johns gesammeltes Encodingwissen

Transcoding mit der BeSweetGUI

Sound decodieren und bearbeiten

Wir starten die BeSweetGUI und wechseln mit den Buttons rechts auf die BeSweet-Seite, wenn die nicht sowieso schon eingestellt ist. Im oberen Bereich des Programmfensters können wir die Tonspur auswählen, die wir transcodieren wollen.

Sollte der Pfad zur BeSweet.exe noch nicht eingetragen sein, erledigen wir das bei BeSweet.exe. Unsere Quell-Audiodatei wählen wir unter Input. Die BeSweetGUI erzeugt automatisch einen Namen für die Zieldatei, der sich natürlich anpassen lässt. Vorsicht, die GUI ist bei der Dateiauswahl etwas eigenwillig programmiert. Wir müssen im Öffnen-Dialog die gewünschte Datei doppelklicken und dann mit Ok den Dialog schließen, damit die Dateinamen korrekt übernommen werden. Wenn das erledigt ist, wählen wir weiter unten im Fenster das Format der Zieldatei.

Unter Output lässt sich das Format einstellen. Falls wir die Samplerate umwandeln oder Boost zur Dynamikkompression verwenden wollen, muss der Haken bei der passenden Option gesetzt sein. Was die beiden Funktionen tun, dazu unten mehr.

Mit den Buttons am rechten Fensterrand können wir zu den Seiten umschalten, auf denen wir die weitere Konfiguration vornehmen. Es sind nur die Buttons verfügbar, deren Funktionen im Bild oben aktiviert wurden.
Da wir ein DVD -Backup anlegen ist die Quelldatei sehr wahrscheinlich eine AC3. Dann kümmern wir uns auf der Azid1-Seite zuerst um die Konfiguration von Azid. Azid ist dafür zuständig, die Quell-AC3 zu decodieren und eventuell deren 6-Kanäle auf Stereo umzurechnen.

Anmerkung: Die Bezeichnungen der Tonformate sind etwas irreführend. 6-Kanal und 5.1 bezeichnet das selbe. Nur zählt man einmal alle Kanäle (vorne links und rechts, hinten links und rechts, Center und LFE), wogegen bei der 5.1-Schreibweise der Basskanal (LFE) extra dargestellt wird.

Für 5.1-nach-Stereo-Konvertierung sollte die Azid1-Seite so aussehen:

LFE to LR Channels bestimmt, mit welchem Pegel der Basskanal in die vorderen beiden Kanäle gemixt werden soll. Um ein Zuviel an Bass zu vermeiden, stellen wir hier -3db ein. Die 2/0 bei Decode (Front/Rear) stehen für »umrechnen auf Stereo«.
Bleibt die Einstellung der Dynamic Compression. Als Dynamik des Sounds bezeichnet man die Unterschiede zwischen lauten und leisen Passagen. Je höher die Dynamik, desto höher ist der Lautstärken-Unterschied zwischen leisen und lauten Passagen. Die Audio-Spur eines Films hat von Natur aus eine recht hohe Dynamik. Das wird ganz klar, wenn wir uns den Showdown mit knatternden Maschinengewehren und die geflüsterte Liebesszene im Vergleich vorstellen.
Um keine nervig leise Zieldatei zu bekommen, gleichen wir mit der Dynamic Compression die Unterschiede in der Lautstärke an, d. h. im Extremfall hört sich das Flüstern genauso laut an wie die Maschinengewehr-Salve. Mit der Einstellung normal treiben wir es lange nicht so weit und erreichen eine für Stereo angemessene Dynamik-Kompression.

Behalten wir den 6-Kanal-Ton bei (bei AAC, AC3 und vielleicht Vorbis), sieht die Azid1-Seite so aus:

Die 3/2 bei Decode (Front/Rear) weist Azid an, alle 6 Kanäle beizubehalten. Um den Sound nicht unnötig zu verfälschen, sollten wir eine geringere Dynamic Compression als für Stereo nehmen. Da mir die Dynamik der AC3 manchmal einfach zu hoch ist, bevorzuge ich eine leichte Kompression. Man könnte sie auch ganz deaktivieren.

Auf der Azid2-Seite aktivieren wir immer die Dialog Normalization Reduction. 5.1-AC3-Dateien enthalten in den BSI-Infos eine Angabe, wie weit die subjektiv empfundene Lautstärke der Dialogspur (Center-Kanal) unter dem maximalen Pegel liegt. Die DNR-Funktion ändert den Dialogpegel unter Berücksichtigung der BSI-Info auf -31 dB. Eine Normalisierung wird dadurch nicht beeinträchtigt, da DNR vor allen Normalisierungsfunktionen angewendet wird.
Wichtig ist DNR nur dann, wenn verschiedene 5.1-AC3s mit unterschiedlichen Dialog­leveln in eine einzelne Zieldatei transcodiert werden sollen, um die unterschiedlichen Level anzugleichen. Beim Transcoding nur einer AC3 (oder mehrerer AC3s mit gleichem Dialoglevel) wirkt sich die Funktion nicht aus. Außerdem sind Stereo-AC3s nicht betroffen, da die keinen Center-Kanal enthalten.

Wer die Dynamikkompression selbst konfigurieren möchte, nimmt anstatt Azids Dynamic Compression Boost (Achtung! Nicht beides zusammen verwenden!). Dazu wechseln wir auf die Boost-Seite.

Boost hat es in sich. Wir können damit das letzte bisschen Dynamik aus der Tonspur herauskomprimieren, was in meinen Ohren schon nicht besonders gut klingt. Dazu kommt die Gefahr, durch zu viel Kompression Störgeräusche im Sound zu erzeugen. Deshalb sollten wir uns gut überlegen, ob der Einsatz von Boost wirklich nötig ist. Der Weg über Azids Dynamic Compression ist meistens der bessere. Ich habe Boost noch nie verwendet und das bis jetzt auch noch nicht bereut.
Wenn's denn sein soll, LigH schlägt im Doom9/Gleitz-Forum Folgendes vor: Compression Mode LigH mit einem Boost Factor um 3 macht Sinn, wenn der ursprüngliche Ton schon Stereo ist. Für 6-Kanal ist dagegen Dg mit Boost-Factor um 4 sinnvoller. Tera eignet sich eher für Experimente.
Der Limit Factor setzt den maximal erlaubten Pegel des Audiostroms. Das hat mit Normalisierung nichts zu tun, sondern definiert nur einen Grenzwert, den die Lautstärke nicht überschreiten darf. Die gezeigten 0.95 (entspricht 95 %) sind eine sichere Wahl. Das heißt nicht, dass die endgültige Zieldatei nicht lauter als 95 % werden könnte, denn Limit Factor ist ein Boost-interner Wert. Die globale Pegelgrenze definieren wir später beim Normalisieren.

Auf der SSRC-Seite können wir die Samplefrequenz des Sounds ändern. Für ein DVD-Backup können wir die Funktion vernachlässigen. Sollte beim AAC-Transcoding eine Umrechnung nötig sein, erledigt BeSweet das automatisch.

Weiter geht's auf die BeSweet-Seite.

Bei (1) kontrollieren wir noch einmal, ob Haken und Ausgabeformat richtig gewählt sind. Um nach dem Transcoding feststellen zu können, ob Fehler aufgetreten sind, sollten wir noch die Log File Options aktivieren.

Damit kommen wir zu (2). Delay ist der Wert, um den die Audiospur zum Video verschoben sein muss, um exakt synchron zu werden. Diese Angabe steht im Dateinamen, »DELAY 8ms« in unserem Fall. Diesen Wert (incl. negativem Vorzeichen, wenn vorhanden!) übernehmen wir in das gelbe Feld. Ein Haken bei DVD2AVI übernimmt den Delaywert automatisch aus dem Dateinamen. Das funktioniert allerdings nur richtig, wenn dort auch eine Angabe im Format »DELAY XXms« vorhanden ist.
Das Delay an dieser Stelle schon zu berücksichtigen ist nicht zwingend. Wenn wir später Audio und Video muxen, können wir es auch dort angeben. Wichtig ist, nur eine der beiden Methoden zu verwenden. Wer das Delay mit BeSweet abhandelt, darf es später nicht noch ein zweites Mal berücksichtigen. Anders herum genauso: Wer es nicht in BeSweet abhandelt, muss es dann später beim Muxen tun.

Schließlich müssen wir den Sound noch normalisieren, d. h. die Lautstärke auf 100 % oder knapp darunter anheben. Durch die Dynamic Compression haben wir zwar schon die Lautstärke-Unterschiede innerhalb der Tonspur angeglichen, insgesamt ist sie aber immer noch viel zu leise. Deshalb stellen wir HybridGain (3) ein. Die Ausnahme bildet AAC, für das PreGain die richtige Wahl ist. Der Unterschied kommt daher, dass HybridGain gleich am Anfang des Transcodings je nach Quelldatei einen festen Wert auf die Lautstärke aufschlägt und die Differenz zu 100 % in einem PostGain-Tag in der Datei speichert. Der Audiodecoder muss dann später beim Abspielen des Films diesen Tag auslesen und die Lautstärke entsprechend erhöhen. Leider gibt es noch keinen AAC-Decoder, der mit PostGain-Tags umgehen kann. Deshalb muss für dieses Format BeSweet die komplette Arbeit erledigen.

Über den Start-Button rechts (AC3 to OGG, die Beschriftung passt sich jeweils den Audioformaten an) könnten wir die Konvertierung starten – halt! Später. Erst müssen wir noch den passenden Encoder konfigurieren.

Wave und MP2-Encoding

Diese beiden Möglichkeiten empfehlen sich nicht. Das ältere MP2-Format ist höchstens für (S)VCDs interessant, mit denen wir uns hier nicht beschäftigen. Und decodierte Waves taugen als Basis, um den Sound intensiver weiterzuverarbeiten, fürs direkte Muxing dagegen schon wegen der Größe überhaupt nicht.

AAC mit dem Nero-Encoder

Um den Nero-Encoder verwenden zu können, kopieren wir erst die Aac.dll und aacenc32.dll aus C:\Programme\Gemeinsame Dateien\Ahead\AudioPlugins in den BeSweet-Ordner, bei älteren Nero-Versionen auch die NeroIPP.dll aus C:\Programme\Gemeinsame Dateien\Ahead\Lib.
Die Konfiguration erledigen wir auf der DTS / AAC / MP4-Seite.

Stereo dürfte sich selbst erklären. Wollen wir 6-Kanal-Ton und arbeiten mit einer älteren Nero-Version bis 6.0.0.11, wählen wir 5.1 (OLD), bei neueren Neros nehmen wir 5.1 (NEW).
Bei ausgeschaltetem Show Configuration Dialog übernimmt Nero ohne Nachfrage die Einstellungen vom letzten Encoding. Ist die Option aktiviert, öffnet sich der Einstellungen-Dialog des Codecs. Das passiert allerdings erst einige Minuten nach dem Encoding-Start, wenn der Normalisierungsdurchlauf abgeschlossen ist.

Als AAC Profile stellen wir HE (High Efficiency) ein. Variable Bitrate regelt die Qualität/Dateigröße. Für Stereo-Ton liefert uns das Streaming-Profil kompakte 75 kbit/s, das ist wenig genug. Für 6 Kanäle können wir circa diese Bitraten erwarten:

Tape 115
Radio 128
Internet 160
Streaming210

Dabei klingt Tape immer noch gut. Meistens verwende ich Internet.
HE funktioniert übrigens nicht mit höheren Einstellungen als Streaming. Nero schaltet dann automatisch auf LC um.

Vorbis-Encoding

Die Vorbis-Einstellungen sind simpel. Wir müssen uns nur für den gewünschten Quality-Level entscheiden. 0.200 ergibt etwa 80 kbit/s und ist als sichere Untergrenze recht brauchbar. 0.500 liefert uns etwa 135 – 140 kbit/s und taugt gut als Obergrenze.
Nicht empfehlenswert ist 6-Kanal-Vorbis, da dieser Modus nicht ausgereift ist und hohe Bitraten benötigt, um gute Qualität zu erreichen. Wenn für 5.1-Vorbis Platz vorhanden ist, reicht es auch für die Original-AC3.

MP3 mit dem Lame-Encoder

Lame encodiert den Sound in MP3. Wer sich (nicht nur über MP3) ein bisschen einlesen möchte, sollte einmal bei Hydrogen Audio vorbeischauen.

Mehr als die Alt Presets brauchen wir nicht. Die bieten für jeden Film eine passende Einstellungen und sind sehr intensiv getestet. Für einen normalen 2-CD-Rip eignet sich die alt-preset fast standard-Einstellung gut. Wer mit einem schnellen Rechner ausgestattet ist, kann das fast weglassen, um noch ein bisschen mehr Qualität heraus zu kitzeln. Der Unterschied ist aber marginal, dafür läuft fast standard mehr als doppelt so schnell. Das Preset erzeugt eine MP3-Datei mit variabler Bitrate und einwandfreier Qualität, deren Bitrate bei etwa 140 – 160 kbit liegt. Mehr ist wirklich nicht nötig. Gerade für 1-CD-Rips kann das Standard-Preset aber schon einmal zu viel sein, dann müssen wir die Bitrate weiter drücken. Alt Preset abr 128 dürfte sich dafür gut eignen.

Abr steht für average bitrate, d. h. die Bitrate ist variabel, ihr Durchschnitt wird vom Encoder aber auf den angegebenen kbit-Wert getrimmt wird. Schließlich können wir noch cbr auswählen. Das steht für constant bitrate, d. h. die Bitrate ist für die komplette Datei festgelegt und ändert sich nicht. Variable Bitrate erzeugt bei gleich großen Dateien bessere Qualität, deswegen sollten wir an CBR nicht zu viele Gedanken verschwenden.

AC3-Encoding

BeSweets AC3-Encoder kann zwar mit kommerziellen Lösungen nicht mithalten, ist aber lange nicht mehr so schlecht, wie er einmal war. Wir haben also durchaus die Möglichkeit, anständige AC3s zu erzeugen.
Wichtig ist, dass ac3enc die Normalisierungseinstellungen auf der BeSweet-Seite ignoriert. Deshalb müssen wir das Azid erledigen lassen, indem wir die Funktion Normalize to auf der Azid1-Seite verwenden und die Normalisierung auf der BeSweet-Seite komplett ausschalten.

Der Ziel-AC3 eine DVD-übliche Bitrate von 384 oder 448 kbit/s zu gönnen, macht wenig Sinn. Dann hätten wir gleich das Original beibehalten können. Tiefer als die bei Bitrate eingetragenen 224 kbit/s sollten wir für 6-Kanal-Dateien allerdings nicht gehen, um die Einbußen bei der Qualität gering zu halten. AC3 ist nun mal nicht für niedrige Bitraten ausgelegt. Create 5.1 AC3 behält die sechs Kanäle der Quelldatei bei. Stereo-AC3s zu encodieren oder gar originale Stereo-AC3s zu verkleinern, ist unsinnig. Schon MP3 ist für 2-Kanal-Material besser geeignet, von Vorbis oder AAC ganz zu schweigen.

Transcoding starten

Damit sind alle Einstellungen abgeschlossen. Wir wechseln zurück auf die BeSweet-Seite und starten den kompletten Transcoding-Vorgang mit dem Start-Button. (Bei AAC daran denken, dass der Codec-Dialog erst nach der Normalisierung auftaucht.) Je nach Rechenleistung kann das eine Zeit lang dauern. Den ganzen Vorgang wiederholen wir für evtl. weitere Audiospuren.

Zwar hätten wir das Audio-Transcoding auch mit Gordian Knot erledigen können, allerdings stehen uns dort lange nicht alle Optionen von BeSweet zur Verfügung. Außerdem lässt sich das Video schöner kalkulieren, wenn die Größen der Audiospuren schon exakt feststehen.

<< Sound konvertieren   |   Seitenanfang   |   BeLight >>