MPEG

I-Frame, P-Frame und B-Frame der MPEG-Kompression

Hochauflösender I-Frame, stärker komprimierter P-Frame mit gespeicherten Veränderungen und B-Frame, der aus vorherigen und nachfolgenden Frames berechnet wird. Beispiel aus dem Film „Freitags um 3“ / Allary-Film, TV & Media.für ZDF / arte

M-JPEG

Bis zu diesem Punkt entsprechen die auf der vorherigen Codec-Seite beschriebenen Vorgänge dem Vorläufer vieler Videocodecs, dem sogenannten M-JPEG. Dabei wird jedes einzelne Filmbild für sich datenreduziert, in der Abfolge werden aber weiterhin alle Einzelbilder gespeichert.

M-JPEG war und ist besonders für frühe digitale Schnittsysteme interessant, weil jedes einzelne Bild direkt adressierbar bleibt. Das erleichtert den Schnitt, benötigt aber deutlich mehr Speicherplatz als moderne Interframe-Codecs.

Intraframe und Interframe

Bei MPEG werden die einzelnen, bereits komprimierten Bilder als Bildfolge noch einmal effizienter reduziert. Dabei wird nicht nur innerhalb eines einzelnen Bildes komprimiert, sondern auch zwischen mehreren aufeinanderfolgenden Bildern verglichen.

Man unterscheidet deshalb zwischen Intraframe-Kompression, bei der jedes Bild für sich bearbeitet wird, und Interframe-Kompression, bei der Veränderungen zwischen mehreren Bildern ausgewertet werden.

Redundanzreduktion

Ein wichtiger Ansatz von MPEG besteht darin, identische oder nahezu identische Bildinformationen nicht immer wieder neu zu speichern. Wenn etwa hinter einer Fernsehmoderatorin über längere Zeit derselbe unbewegte Studiohintergrund zu sehen ist, muss dieser nicht in jedem Bild vollständig neu gespeichert werden.

Stattdessen hält der Codec vor allem die Veränderungen fest, also beispielsweise die Bewegung der Moderatorin. Damit der Encoder sinnvoll arbeiten kann, versucht er, Bewegungen und Ähnlichkeiten von Bildblöcken von Bild zu Bild zu analysieren.

Blockbasierte Bewegungsschätzung

Um eine möglichst wirksame Datenreduktion zu ermöglichen, arbeitet MPEG mit verschiedenen Bildtypen. Ein I-Frame ist ein vollständiges Einzelbild und dient als Referenz. Darauf folgen stärker komprimierte P-Frames und B-Frames.

P-Frames enthalten vor allem Veränderungen gegenüber vorherigen Referenzbildern. B-Frames können Informationen aus vorherigen und nachfolgenden Bildern nutzen. Eine solche Abfolge aus I-, P- und B-Frames nennt man GOP, also „Group of Pictures“.

Bei einfachen Motiven mit wenig Bewegung funktioniert dieses Verfahren sehr gut. Schwieriger wird es bei Kamerafahrten, Schwenks, schnellen Bewegungen, Rauch, Wasser, Laub oder vielen feinen Strukturen. Dann muss der Encoder sehr viel mehr Bildveränderungen berechnen.

Bewegungsvektoren

Bei Sport, Tanz, Schwenks, Zooms oder Kamerafahrten geraten stark komprimierende Codecs leichter an ihre Grenzen. Sichtbar wird das oft durch Blockbildung, Unschärfen, Flimmern oder unsaubere Kanten in den Bereichen der stärksten Bewegung.

Dabei wird das Bild in Blöcke zerlegt. Der Encoder versucht zu erkennen, in welche Richtung und mit welcher Geschwindigkeit sich diese Blöcke verschieben. Diese Informationen nennt man Bewegungsvektoren.

Im Encoder entstehen dabei Differenzbilder, in denen vor allem die veränderten Bildanteile gespeichert werden. Unveränderte Bereiche werden aus vorherigen oder nachfolgenden Referenzbildern rekonstruiert.

MPEG-1 und MPEG-2

MPEG-1 war ein früher Standard für stark reduzierte Videodaten und spielte vor allem bei Video-CDs und frühen digitalen Anwendungen eine Rolle. MPEG-2 wurde ab den 1990er Jahren deutlich wichtiger, weil es höhere Auflösungen, bessere Bildqualität, 16:9-Formate und mehrere Tonspuren ermöglichte.

MPEG-2 wurde unter anderem für DVD, digitales Fernsehen und HDV verwendet. Gerade bei HDV zeigen sich die Grenzen des Verfahrens: schnelle Bewegungen, Schwenks oder detailreiche Motive können zu sichtbaren Kompressionsartefakten führen.

MPEG-2 unterstützt unterschiedliche Profile und Farbabtastungen, darunter auch 4:2:2 für professionelle Anwendungen. Dennoch gilt es aus heutiger Sicht als weniger effizient als moderne Codecs wie H.264, H.265/HEVC oder AV1.

Audio und MP3

Auch im Audiobereich werden Daten reduziert. Unkomprimierter Ton mit 48 kHz, 16 Bit und zwei Kanälen benötigt rund 1,5 Mbit/s. Für viele Anwendungen war und ist das deutlich mehr, als für Speicherung oder Übertragung sinnvoll ist.

Der Audio Layer 3 des MPEG-1-Standards wurde als MP3 bekannt und lange zum wichtigsten Format für komprimierte Audiodateien. Heute wird MP3 weiterhin breit unterstützt, wurde in vielen Bereichen aber durch effizientere Verfahren wie AAC, Opus oder verlustfreie Formate ergänzt.

Fazit

Bei der MPEG-Kodierung ist der Rechenaufwand deutlich höher als beim späteren Abspielen. Innerhalb der Standards gibt es viele Varianten, Profile, Levels und Datenraten. Die Qualität hängt stark davon ab, wie sorgfältig kodiert wird und wie komplex das Bildmaterial ist.

Die richtigen Einstellungen beim Kodieren zu finden, bleibt eine eigene Kunst. Sie hängen vom Zielmedium ab: DVD, Blu-ray, Fernsehausstrahlung, Streaming, Archivierung oder digitale Kinodistribution stellen jeweils andere Anforderungen.

MPEG-2 war ein entscheidender Schritt in der Geschichte der digitalen Videokompression. Die grundlegende Idee, nur relevante Bildinformationen und Veränderungen zu speichern, prägt jedoch auch moderne Codecs bis heute.