Die Audiocodecs
Das Audiocodec-Universum ist etwas komplexer als das der Videocodecs oder Container. Grundsätzlich stehen wir immer vor der Entscheidung, die Original-Audiospur der Quelle unverändert beizubehalten oder in ein anderes Format zu transcodieren. Da damit meistens Qualität verloren geht, will ein Transcoding gut überlegt sein – auch wenn der Verlust oft unhörbar bleibt.
Die meisten Audioformate sind genauso wie die Videoformate mit Patenten vermint, weshalb wir von den Encoder-Webseiten oft nur den Quellcode erhalten. Genaue Downloadadressen für direkt nutzbare Encoder-Binaries folgen später im Kapitel Die nötige Software.
MP3: Der LAME-Encoder
MP3-Encoding in der Praxis bedeutet ganz selbstverständlich den LAME-Encoder. Es gibt keinen weiter entwickelten MP3-Codec und kaum einen Grund, LAME nicht zu verwenden. Für Audiocodecs im Allgemeinen und LAME im Besonderen gilt, keine Experimente mit obskuren Optionen anzustellen, sondern sich an die gut getesteten Standardeinstellungen zu halten. Gäbe es Optionen, die die Qualität spürbar erhöhen würden, dann wären die schon längst in den »professionellen« Empfehlungen enthalten. Konkrete Konfigurationen sehen wir uns im Praxisteil an.
Natürlich ändert LAME nichts am grundsätzlichen Nachteil von MP3, der Beschränkung auf Stereo. Wenn das kein Problem darstellt und wir keine ultra-niedrige Bitrate haben wollen, ist LAME-MP3 für die Region um 100–130 kbit/s nach wie vor eine solide Wahl.
AAC: Nero, Quicktime und Fhg
MPEG-4 AAC ist besonders interessant, weil es problemlos mit Multikanal-Ton umgehen kann und sich außerdem gut für eine niedrige Bitrate eignet. Die tatsächliche Qualität hängt natürlich stark vom Encoder ab. Interessanterweise steht hier ausnahmsweise kein Open-Source-Projekt an der Spitze der Entwicklung, sondern die proprietären Encoder von Apple, Nero und dem Fraunhofer Institut.
Der Hydrogenaudio-Hörtest vom Juli 2011 bestätigt die drei Spitzenreiter. Zwar bezieht sich der Test auf Stereo-Musik und nicht auf Multikanal-Filmtonspuren, dürfte aber im Wesentlichen übertragbar sein.
- Der Nero AAC Codec ist bei Videoenthusiasten traditionell das Tool der Wahl. Das liegt zum einen daran, dass Nero bei seiner Einführung 2006 der einzige brauchbare Multikanal-AAC-Encoder überhaupt war. Zum anderen produziert er einwandfreie Qualität und seine Beliebtheit hat dazu geführt, dass er von Encodingfrontends und anderen Tools praktisch immer unterstützt wird. Die neuste Version stammt allerdings schon vom Februar 2010. Ob und wie Nero die Entwicklung des Encoders noch vorantreiben wird, ist nicht klar.
- Apple Quicktime beinhaltet den vielleicht besten aktuellen AAC-Encoder, der auch ständig weiterentwickelt wird. Inzwischen gibt es mit Qaac auch die Möglichkeit, den Encoder unter Windows bequem per Kommanozeile zu nutzen anstatt sich mit der Quicktime-Oberfläche herumzuärgern.
- FhgAacEnc bezeichnet den AAC-Encoder des Fraunhofer Instituts, der zusammen mit Winamp vertrieben wird. Er ist noch recht neu und nicht intensiv getestet, macht aber einen guten Eindruck. Als seinen größten Nachteil schätze ich im Moment ein, dass er im VBR-Modus nur sehr grobe Qualitätsabstufungen zulässt. Angesichts der sehr guten Alternativen stellt sich schon die Frage, warum man mit dieser Einschränkung leben sollte. Im Praxisteil werden wir uns deshalb (vorerst?) auf Nero und Quicktime konzentrieren.
Bei allen drei Encodern sollten wir für hochwertigen 6-Kanal-Ton um die 250 kbit/s einplanen. Wenn der Platz eng wird, geht aber auch deutlich weniger. Mit Nero habe ich schon sechs Kanäle in etwa 130 kbit/s untergebracht. Das geht natürlich nicht ohne spürbare Einbußen, läuft aber trotzdem noch aufs qualitative Mittelfeld hinaus.
Vorbis: Xiph.org und aoTuV
Vorbis zeichnet sich dadurch aus, dass libvorbis – die Referenzimplementierung von Xiph.org – auch den üblichen Encoder darstellt. Praktisch überall, wo Vorbis draufsteht, steckt libvorbis drin. Das gilt für den offiziellen Kommandozeilen-Encoder oggenc genauso wie für BeSweet oder FFmpeg.
Ein bisschen Vielfalt gibt es dann doch, nämlich
- Vanilla libvorbis, also die unveränderte Version direkt von Xiph.org.
- aoTuV libvorbis, was für Aoyumi’s tuned Vorbis steht. Aoyumi kümmert sich besonders um niedrige Bitraten (unter 70 kbit/s für Stereo). In unregelmäßigen Abständen werden seine Anpassungen in den »offiziellen« libvorbis übernommen.
Im Frühjahr 2010 hat libvorbis die lange erwartete brauchbare Multikanal-Unterstützung erhalten. Wie bei den AAC-Encodern sollten wir für hochwertigen 6-Kanal-Ton etwa 250 kbit/s ansetzen. Wie weit wir tatsächlich noch ohne zu massive Qualitätsverluste nach unten gehen könnten, kann ich mangels Tests leider nicht sagen. Für hochqualitative 5.1-Encodings ist Vorbis jedenfalls inzwischen eine echte Alternative zu AAC.
FLAC
Beim verlustlosen FLAC sieht es ganz ähnlich aus wie bei Vorbis. Wir benutzen den Referenzencoder. Es gibt zwar weitere Implementierungen wie z.B. Flake oder FLACCL, doch die haben alle Einschränkungen, die sie für unsere Zwecke uninteressant machen.
FLAC ist bestens geeignet, um die übermäßig großen verlustlosen Audiospuren der Blu-ray – TrueHD, DTS-HD MA oder unkomprimiertes LPCM – ohne jeden Qualitätsverlust auf eine sinnvolle Größe einzudampfen. Ist dagegen die Quelle schon verlustbehaftet, produziert FLAC i.d.R. zu große Dateien.
Dolby und DTS
AC-3, E-AC-3, TrueHD und DTS mit seinen Varianten sind allesamt ineffizient und als Zielformate nicht geeignet. Außerdem existiert lediglich für AC-3 ein frei zugänglicher und qualitativ brauchbarer Encoder: Aften. Deshalb werden wir uns mit dem Dolby/DTS-Encoding nicht beschäftigen.
Trotzdem ist es nicht unüblich, im fertigen Encoding Dolby/DTS einzusetzen; und zwar dann, wenn wir die Originaltonspur unverändert von der Disc übernehmen. Besonders für hochqualitative Encodings sparen wir uns so den Qualitätsverlust durch das Transcoding. Und dank billigem Plattenplatz (oder DVD-Platz, falls wir noch auf Scheibe speichern) lässt sich auch die hohe Originalbitrate verkraften.
Empfehlung
Welches Audioformat wir nehmen können, hängt wie immer von der gewünschten Kompatibilität beim Abspielen ab. AAC ist weit verbreitet und damit eine relativ sichere Wahl. Außerdem lässt es sich problemlos im Matroska- und MP4-Container unterbringen.
Das ist wenig überraschend und wenig spannend. Viel interessanter: Sollten wir überhaupt transcodieren oder lieber das Original behalten? Das kommt darauf an.
- Bei der DVD als Quelle ist die gesparte Dateigröße zwischen Original-AC-3 und 6-Kanal-AAC oder -Vorbis relativ gering. Deshalb übernehme ich DVD-Tonspuren meistens unverändert ins Encoding.
- Die massiv großen Tonspuren der Blu-ray können dagegen ein Transcoding vertragen. Besonders wenig stellt sich die Frage, wenn wir TrueHD oder DTS-HD MA in deutlich kleineres FLAC umwandeln, denn schließlich bleibt bei den verlustlosen Formaten die Qualität exakt gleich.
Weiterführende Links
- RareWares: Downloadseite für Audiosoftware
- Alexander Vigovskys AC-3-Decoder
- Universal-Decoder: ffdshow
Kommentare
Kommentar von Alex | 13.2.2012
Eine Frage mal zu Vorbis. Da das Format von Anfang an für VBR designed wurde, würde mich mal eine Qualitätsstufe interessieren, die noch akzeptabel ist. Ich habe mal gelesen, das der audiophilste Hörer spätestens bei Qualtität 7 keinen Unterschied mehr hört, aber das ergibt Datenraten um 500kb/s, was etwas übertrieben scheint. Hast du da schon Ergebnisse?
Ich habe leider (noch) nicht die Hardware, um das vernünftig beurteilen zu können.
Kommentar von Brother John | 13.2.2012
Landläufig und für Stereo-Musik ist q5 das Äquivalent zu V2 bei Lame. Also die absolut megasichere Einstellung, wo auch die goldensten Ohren auf genialem Gerät und unter besten Umgebungsbedingungen im ABX-Vergleich keinen Unterschied mehr hören. Für Tonspuren ist das meistens deutlich Overkill.
Kompetent beurteilen kann ichs auch nicht. Meine Ohren sind nicht trainiert und das 5.1-System ist auch nicht komplett aufgebaut. Ich hab mich auf q3 für 5.1-DVD-Quelle und q4 für 5.1-Blu-ray-Quelle eingeschossen. Ich bin mir auch ohne Test ziemlich sicher, dass ich q3 niemals raushören könnte. HD-Encodings sind andererseits eh so groß, dass das bisschen mehr Bitrate durch q4 nicht ins Gewicht fällt.
Kommentar von Dev | 14.4.2012
Bruder John,
hast du Erfahrung mit transkodierten Audio Streams, als Bsp. bei einer DVD von DTS -> FLAC, ob die Kanäle von AVR-Receivern weiterhin "verstanden" werden?
Mein Setup sieht wie folgt aus. PS3 und ein ASUS O-Play als Player, beide über Toslink an einem 7.1 AVR Receiver angeschlossen, PC als Streaming-Host. Nun würde mich interessieren ob der AVR Receiver auch die transkodierten Streams von den Playern richtig geliefert bekommt oder ob es so einem Surround-Setup nicht zuträglich ist die Tonspur zu transkodieren.
Gruß
Dev
Kommentar von Brother John | 14.4.2012
Hi Dev,
mit dem Abspielen außerhalb des PCs hab ich so gut wie keine Erfahrung. Wenn du Audio digital an irgend ein Gerät schickst, muss dieses Geräte fähig sein, das entspr. Audioformat zu verarbeiten. Wie das bei deinem Setup aussieht, kann ich leider nicht sagen.
Kommentar von Dev | 14.4.2012
Hi John,
also dann bleibt das originale Format erhalten. Dann bin ich da auf der sicheren Seite. Zumal 5.1 Sound anteilig nicht so viel Platz nimmt.
Gruß
Kommentar von abc | 16.6.2012
Hallo,
die meisten CD-Player können nur eine handvoll Formate abspielen. Da wären: wma(?), wav, avi, mp3.
Da hätte ich eine Frage: Ich will eine pure Audio-CD machen, die aber von den meisten CD-Playern abgespielt werden sollte. Ich weiß aber nicht, welches Format ich da auswählen soll. Das Format sollte möglichst platzsparend sein, aber dennoch ein qualitativ gutes Soundergebnis bringen. Ich persönlich tendiere zu mp3, das bedeutet allerdings, dass ich die Audiodateien konvertieren müsste. Die Audiodatei ist im Format "MPEG AAC Audio (mp4a)". Jetzt weiß ich aber nicht, welche Bitrate ich auswählen soll, damit die Qualität möglichst erhalten bleibt, ich weiß natürlich, dass, umso höher die Bitrate, umso höher ist die Qualität. Soweit ich aber weiß, ist es nicht möglich, Video/Audio künstlich "hochzukonvertieren", da sonst Rauschen (?) entsteht. Welche Bitrate empfehlen Sie mir? Und allgemein, würden Sie auch mp3 nehmen?
lg
Kommentar von Brother John | 18.6.2012
Am absolut kompatibelsten ist Red-Book-Audio, also eine »echte« Audio-CD, denn das geht auf *jedem* CD-Player – solange er mit gebrannten Medien umgehen kann. Auf Standard-Rohlinge passen 80 Minuten Laufzeit.
Alles andere kommt darauf an, was der einzelne spezielle Player unterstützt. MP3 dürfte am verbreitetsten sein, aber ich kenne mich mit Hardware-Wiedergabe nicht aus. Ich würde mit Lame -V 3 anfangen zu testen, oder --cbr 192, wenn der/die Player kein VBR unterstützen. Dateigrößen dürften typischerweise grob bei 3–5 MB pro Lied liegen.
Kommentar von abc | 18.6.2012
Vielen Dank für die schnelle Antwort.
Ich habe übrigens noch ein gutes Programm zum konvertieren von Videos und Audio gefunden: es heißt "Avidemux", es ist kostenlos und open-source, außerdem ist es für Win,MacOs und für Linux erhältlich. Eigentlich ist ein ein Tool zum schneiden von Videos, aber man kann mit ein paar Klicks Audio von Video trennen und/oder beides konvertieren (diverste Formate, es werden allerdings externe Programme wie LAME verwenden, ein Blick lohnt sich!). Website: avidemux.org
Können Sie sich ja mal anschauen und vielleicht unter "Software" / "Alternative Frontends" übernehmen.
Lg
P.S.: Sind Sie der Entwickler von "StaxRip"? Es erscheint nämlich, wenn man das Programm startet, eine Meldung, dass man sich bitte Ihre Anleitung hier durchliest...
Kommentar von Brother John | 19.6.2012
Avidemux würde ich nicht wirklich als Frontend ansehen. Da fehlt so einiges an Automatik & Co. Als modernes VirtualDub ist es gar nicht übel.
Autor von StaxRip ist stax76: http://staxmedia.sourceforge.net/. Ich bin »nur« Dokumenteur. Im deutschen Sprachraum gibt es keine vergleichbare Doku, deswegen hatte stax die Funktion eingebaut, dass StaxRip beim ersten Start auf deutschen Systemen den Link zum Encodingwissen zeigt. Ich hatte natürlich nix dagegen. :)