Vorlesung Informatik 1 - Teil B: Theorie

4.1 MPEG-1

Wichtiger Begriff: Farbunterabtastung (Chroma Subsampling)

  • Ursprünglich aus dem Fernsehen kommende Verfahren, 
  • Aufteilung in YUV, auch  Y CR CB  
  • 4:4:4 - keine Unterabtastung, jedes Pixel enthält YUV, oder auch RGB, je nach Format.
    Beispiele: Kamera-Signal (HDCAM SR, SDI), filmische Postproduction
  • 4:2:2 - in einer Zeile wird U und V nur für jedes zweite Pixel abgetastet, aber jede Zeile wird abgetastet.
    Beispiel: Digi Betacam (Archiv der HdM), DVC Pro, ProRes, XDCAM)
  • 4:2:0 -   U,V wird nur für jedes zweite Pixel einer Zeile und nur für jede zweite Zeile abgetastet
    Beispiele: MPEG-2 (H.262), MPEG-4 AVC (H.264), DVD, Blue-ray Disc

MPEG: Moving Pictures Expert Group 

Gremium der ISO (International Standardization Organization) 

ca. 300 Experten, treffen sich seit 1988  3-4 Mal im Jahr 

Standards: MPEG-1, MPEG-2 MPEG-4,  H.264 (AVC) und H.265 (HVEC) 


Alternativen:  VP8/VP9 (WebM von Google)
                      Theora (Ogg): nicht mehr relevant


MPEG-1: 1992 als Standard ISO 11172

  • Kompression von Video mit Datenraten bis zu 1,5 MBit/sek. (CD-ROM)
  • Max. 768x576 Pixel (PAL), 14 verschiedene Seitenverhältnisse
  • YCRCB Farbformat
  • GOP Group of Pictures:
    • I-frame: intraframe codiert (Standbild), ähnlich JPEG,
    • P-frame: vorangegangenen Bildern codiert, mittlere Kompression,
    • B-frame: aus vorangegangenen und folgenden Bildern codiert große Kompression.
  • Interframe-Kompression: Blockmatching mit vorwärts- und Rückwärts-Prädiktion, DPCM, DCT, Quantisierung und Huffman Codierung,

Ton:

  • Audio Layer 1 (MP1): digitale Compakt-Kassette von Philips.
  • Audio Layer 2 (MP2): Musicam - Übertragung von Ton über zwei ISDN-Kanäle (2x256 kbit/sek.), europaweiter Standard für die Zuspielung von Audio (Musik-Taxi).
  •  Audio Layer 3 (MP3): Audio Codec von der Fraunhofer Gesellschaft in Erlangen (Karlheins Brandenburg).
    Wurde als MPEG-2 Audio Layer 3 in verbesserter Version standardisiert. Seit 2018 patentfrei.

MP3 Verfahren im Überblick

  • Kopplung (Differenzbildung) des Stereosignals, um die Korrelation zu nutzen,
  • Aufteilung in 18 Frequenzbänder bis 18 kHz.
  • DCT für jedes Band
  • Adaptive Quantisierung der DCT Koeffizienten unter Nutzung eines psychoakustischen Modells (Maskierung): aufeinanderfolgende Töne mit ähnlicher Frequenz werden z.B. vom Menschen als ein Ton wahrgenommen, der maskierte Ton wird deshalb mit geringer Bitrate gespeichert.
  • Huffman Codierung
 

Lehrvideo (YouTube)