Wie funktioniert die digitale Audiodatenkomprimierung?

Wie funktioniert die digitale Audiodatenkomprimierung?

In der Welt der HiFi-Audio- und Audioproduktion ist die Datenkompression eine der wichtigsten Metriken, die von Hörern und Erstellern verwendet werden, um die Qualität ihrer Audiodateien zu bezeichnen.

Wie funktioniert die digitale Audiodatenkomprimierung? Bei der Audiodatenkomprimierung werden Bits aus einer digitalen Audiodatei entfernt, um ihre Größe zu reduzieren. Die verlustbehaftete Komprimierung entfernt „unwesentliche Details“ irreversibel (insbesondere Frequenzinhalte). Die verlustfreie Komprimierung beseitigt „statistische Redundanzen“, um die Dateigröße reversibel zu reduzieren, ohne das Audio zu beeinträchtigen.

In diesem Artikel besprechen wir, wie die Audiodatenkomprimierung funktioniert, wie sie sich auf den resultierenden Klang von Audiodateien auswirkt und warum sie verwendet wird.


Warum müssen wir digitale Audiodateien komprimieren?

Die digitale Audiodatenkomprimierung ist ein leistungsstarkes Werkzeug, um die Dateigröße massiv zu reduzieren und so den einfachen Austausch von Musik und Aufnahmen über das Internet zu erleichtern. Einfach ausgedrückt, ohne digitale Audiokompression würde die moderne Audio-Streaming-Landschaft nicht existieren.

Ich sollte erwähnen, dass Audio, ob analog oder digital, unkomprimiert, verlustbehaftet-komprimiert oder verlustfrei komprimiert, nur eine Darstellung von Klang ist. Eine Audio-Single muss über einen Schallkopf (Lautsprecher, Kopfhörer) wiedergegeben und an unsere Ohren übertragen werden, um gehört zu werden.

Die Audiokomprimierung zielt darauf ab, die Anzahl der Bits zu reduzieren, die an der genauen Wiedergabe eines Sounds beteiligt sind. Es ist wichtig, sich daran zu erinnern, dass eine digitale Datei – sei es Audio, Video, Software, ein Word-Dokument oder was auch immer – nur eine Folge von Binärziffern (Bits) ist. Die Komprimierung zielt darauf ab, unnötige Bits zu entfernen und gleichzeitig einen genauen Klang beizubehalten.

Unkomprimierte Audiodateien sind riesig! Beispielsweise hat eine WAV-Datei in CD-Qualität (44,1 kHz, 16 Bit) eine Dateigröße von ca. 10 MB pro Minute. Verlustbehaftete komprimierte Audioformate wie MP3 reduzieren diese Größe oft um das Fünffache.

Beim Teilen und Streamen von Audiodateien über das Internet beanspruchen unkomprimierte Dateien viel Bandbreite und Speicherplatz für Endbenutzer. Diese technologischen Anforderungen, zusammen mit den technologischen Einschränkungen der Zeit, sind der Grund, warum das komprimierte MP3-Format in den frühen 2000er Jahren für das Teilen von Online-Musik so beliebt wurde.


Wie funktioniert die Audiokomprimierung?

Eine wichtige Frage für Produzenten und Hörer ist, wie digitale Audiodatenkompression funktioniert? Was bedeutet es, wenn eine Audiodatei verlustfrei ist – wie lässt sich das mit verlustbehafteter Komprimierung oder gar keiner Komprimierung vergleichen?

Die Audiodatenkomprimierung funktioniert, indem die Bits, die wir nicht benötigen, aus einer Sounddatei entfernt werden. Es gibt zwei Haupttypen der Audiokomprimierung: verlustfrei und verlustbehaftet.

Verlustfreie Audiokomprimierung

Bei der verlustfreien Komprimierung gehen keine Daten dauerhaft durch Komprimierung verloren. Anstatt Geräusche zu entfernen, die wir entweder nicht hören oder nur schwer wahrnehmen können, entfernt die verlustfreie Komprimierung redundante Daten.

Das beliebteste verlustfreie Audioformat ist FLAC. Andere verlustfreie Audioformate sind:

  • ALAC (Apple Lossless)
  • WMA verlustfrei (Windows Media Audio verlustfrei)
  • WavPack
  • Monkey’s Audio
  • SHN (Kürzen)

Verlustbehaftete Audiokomprimierung

Weitaus häufiger ist jedoch die verlustbehaftete Komprimierung. Dies wird durch jede Komprimierungsmethode definiert, die einige Informationen irreversibel aus der ursprünglichen Darstellung entfernt.

Das beliebteste verlustbehaftete Format ist MP3. Andere verlustbehaftete Audioformate sind:

  • AAC (Advanced Audio Codec)
  • Vorbis
  • WMA verlustbehaftet (Windows Media Audio verlustbehaftet)
  • Musepack
  • Opus

Wie entscheiden verlustbehaftete Komprimierungsmethoden, welche Daten entfernt und welche behalten werden sollen?

Erstens kann das menschliche Ohr nicht das gesamte Schallspektrum hören, und verlustbehaftete Kompressionsprozesse entfernen Geräusche außerhalb unseres Hörbereichs. Dieser Bereich beträgt 20 Hz und 20 kHz.

Obwohl wir Frequenzen im Bereich von 20 Hz – 20.000 Hz hören können, sind wir am empfindlichsten für einen kleineren Bereich, der im Allgemeinen als 100 Hz bis etwa 6 kHz angegeben wird. Daher können theoretisch auch leise Inhalte im Low-End und High-End entfernt werden, ohne die Gesamtklangqualität spürbar zu beeinträchtigen.

Hier sind zum Beispiel die Beziehungen zwischen der Bitrate und den High-End-Frequenzgrenzwerten für MP3-Dateien (unter der Annahme von Zweikanal-/Stereo-Audio mit einer Abtastrate von 44,1 kHz und einer Bittiefe von 16 Bit):


Bitfrequenz High-End-Frequenzabschaltung Dateigröße
320 kbit/s ~20,5 kHz 2,4 MB/min
256 kbit/s ~20 kHz 1,92 MB/min
192 kbit/s ~18 kHz 1,44 MB/min
160 kbps ~17 kHz 1,2 MB/min
128 Kbps ~16 kHz 960 kB/min
96 kbit/s ~15 kHz 720 kB/min
64 kbit/s ~11 kHz 480 kB/min
32 kbit/s ~5 kHz 240 kB/min

Beachten Sie, dass aus technischen Gründen im Zusammenhang mit dem Skalierungsfaktor Band 21 des MP3-Kodierungsformats alle MP3-Dateien einen Tiefpassfilter haben, der auf 16 kHz eingestellt ist. Selbst wenn die Datei theoretisch digitale Audioinformationen bei diesen hohen Frequenzen speichern kann, werden sie im Allgemeinen trotzdem abgerollt.

Verlustbehaftete Kompressionsmethoden verwenden auch einen sauberen psychoakustischen Hack, der als auditive Maskierung bekannt ist.


Auditive Maskierung

In Prozessen wie MP3 wird die auditive Maskierung (auch bekannt als Klangmaskierung) verwendet, um das Phänomen zu nutzen, dass schwächere Tonsignale in Gegenwart von starken, lauten Tonsignalen nicht wahrnehmbar sind. Zum Beispiel können laute Instrumente in Orchestermusik weichere, leisere Klänge im Mix „maskieren“.

Daher ist es sicher, diese Tonsignale zu entfernen, solange sie in Bezug auf die rechte maskierte Schwelle entfernt werden. Das MP3-Format tut genau das, mit einem Algorithmus, der „maskierte“ Informationen aus den digitalen Daten findet und entfernt, um Speicherplatz freizugeben.

Diese Schwelle ist jedoch nichtlinear und variiert zwischen Personen und zwischen bestimmten Geräuschen (nämlich der Amplitude des lauten Geräuschs).

MP3 macht das richtig. Selbst bei einem Komprimierungsverhältnis von sechs zu eins können erfahrene Zuhörer nicht zwischen einer komprimierten MP3-Spur und ihren ursprünglichen Audioclips unterscheiden (Quelle).

Tatsächlich ist Audio der Bereich, in dem verlustbehaftete Komprimierung am erfolgreichsten ist. Die meisten verlustbehafteten Komprimierungsmethoden in Bildern und Videos verschlechtern die visuelle Qualität merklich. Die verlustbehaftete Komprimierung ist für andere Dateien, bei denen alle Daten beibehalten werden müssen (z. B. eine Tabellenkalkulation oder ein Word-Dokument), äußerst ungeeignet.

Durch die Kombination der intensiven Studien der Psychoakustik und der Informatik haben Ingenieure einen effizienten und nicht wahrnehmbaren verlustbehafteten Kompressionsalgorithmus entwickelt.


Sollte ich komprimiertes Audio für meine Projekte verwenden?

Das Argument zwischen verlustbehafteter Komprimierung und verlustfreier Komprimierung (oder sogar unkomprimiertem) Audio hängt davon ab, wofür Sie Ihre Audiodateien verwenden möchten.

Verlustbehaftete Komprimierung hat ihre Nachteile. Da einige Daten zerstört werden, sind verlustbehaftete komprimierte Audioformate wie MP3 nicht für die Aufnahme von Stems und Takes geeignet, um einen Master-Mix zu erstellen. Wenn Sie beispielsweise Gesang oder Instrumente in einem verlustbehafteten Format aufnehmen und dies kontinuierlich codiert wird, wenn destruktive Änderungen vorgenommen werden, beeinträchtigen Sie langsam die Klangqualität Ihrer Datei.

Während der Produktion sollten Sie verlustfreies Audio (wie FLAC oder ALAC) oder ein unkomprimiertes Audioformat verwenden. Das beliebteste Format für die Produktion ist WAV – das während der Kodierung keine Komprimierung verwendet.

Sobald wir jedoch erwägen, Ihr Projekt an einen Zuhörer zu liefern, ist eine qualitativ hochwertige MP3-Datei mehr als in Ordnung. Sie würden gut in 320kbps kodieren, da niedrige Bitraten die Klangqualität beeinträchtigen können.


Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert