Diplomarbeit über Bildqualitätsbeurteilung  
     
Homepage
 
Vorwort
Zusammenfassung
Inhalt
Einleitung / Kapitel 1
Kapitel 2
Kapitel 3
Kapitel 4
Kapitel 5
Kapitel 6
Kapitel 7
Kapitel 8
Kapitel 9
Kapitel 10
Kapitel 11
Kapitel 11
Abkürzungen
Literaturverzeichnis

Untersuchung verschiedener Codecs

Einleitung

Nachdem ein Testalgorithmus verfügbar war, mit dem subjektive Tests zumindest zum Teil ersetzt werden können, sollte die Bildqualität des Optibase MPEG 1 Codecs getestet werden. Es sollten verschiedene Konstellationen in Bezug auf die GOPs (Group of Pictures), die horizontalen und vertikalen Vorfilter und die Datenrate untersucht werden. Weiterhin sollte in Zusammenarbeit mit der SRG den von ihnen verwendeten MPEG 2 Codec von Philips getestet und Vergleiche angestellt werden. Als dritte Testplattform sollte das Telepoly-Equipment (TIK) verwendet werden, um auch dort verschiedene Konstellationen auszutesten.

Als Testmaterial dienten selbsterstellte Fernsehmitschnitte (digitalisiert mit einem Framegrabber in einer SUN-Workstation), die einen repräsentativen Querschnitt von verschiedenstem Bildmaterial darstellen sollten. Zusätzlich wurden von der SRG freundlicherweise einige offizielle MPEG-Testsequenzen zur Verfügung gestellt.

Die Originalbilder sollten mit den Ausgangsbildern der oben genannten Codecs verglichen werden und es sollte eine Bewertung durchgeführt werden.

Versuchsaufbau

Da die Sequenzen der SRG auf Betacam vorhanden waren, diente als Zuspieler für diese ein Betacam SP Videorecorder von SONY. Die selbsterstellten Bilder wurden von einem Kathrein Satellitenempfänger abgenommen. Auf dem Signalpfad konnte leider nur in FBAS-Qualität gefahren werden, da das der kleinste gemeinsame Nenner aller beteiligten Geräte war. Bild 11.1 zeigt den Versuchsaufbau.

Versuchsablauf

MPEG 2 Codec der SRG

Nach einem Besuch bei Herrn Tschäppät bei der SRG hat sich leider sehr schnell herausgestellt, dass der Philips Codec nicht untersucht werden konnte. Erstens war es zu dem Zeitpunkt nicht mehr möglich, Tests durchzuführen, da schon der reguläre Sendebetrieb begonnen hatte. Zweitens war es auch nicht möglich, einen freien Kanal des Systems zu benutzen, da sich alle im Hot-Standby-Modus" befanden. Und drittens standen keine Set-Top-Boxen zur Verfügung, mit denen man das in Betrieb befindliche System hätte wenigstens subjektiv bewerten können, da die SRG selbst noch nicht beliefert worden war. Da diese Tests nun unterlassen werden mussten, wurde sozusagen als Ersatz ein Casablanca-Videoschnittsystem von Herrn Ørum zur Verfügung gestellt. Dieses basiert zwar nicht auf MPEG 2 sondern auf einem Motion-JPEG Verfahren, aber es hätte sich trotzdem geeignet, um mit dem Algorithmus die Bildqualität beurteilen zu lassen und dabei verschiedene Konfigurationen auszuprobieren. Leider gab es aber auch hier noch andere Schwierigkeiten, die unter 11.3.5 erläutert werden.

MPEG-Testsequenz

Testsequenzen können erzeugt werden, um bekannte typische Artefakte eines Übertragungssystems sichtbar zu machen. Ein Beispiel sind die bekannten Testbilder für analoges Fernsehen. Für digitales Fernsehen ist eine Testsequenz am Institut für Nachrichtentechnik der TU Braunschweig in Zusammenarbeit mit der Firma Rohde und Schwarz entwickelt worden.

Bild 11.2 zeigt ein Standbild dieser Testsequenz.

Das Testbild ist in acht Bereiche unterteilt [38]:

  • Bildbereich 1: Dieser Bereich ist in zehn Einzelfelder unterteilt, mit deren Hilfe eine Aussage über die Signalvorverarbeitung wie horizontale bzw. vertikale Unterabtastung und Filterung gemacht werden kann. Jeweils fünf Felder bestehen aus Schwarz/Weiss-Mustern, weitere fünf setzen sich aus Grün/Magenta-Mustern zusammen. Die Chrominanzkomponenten CR und CB weisen dabei den kleinsten zulässigen Wert für Grün und den grössten zulässigen Wert für Magenta auf. Beide Farben enthalten den gleichen Luminanzwert, um bei der Vorverarbeitung eine vollständige Trennung von Chrominanz und Luminanz zu erreichen.
  • Bildbereich 2: Anhand der Grenze zwischen der gleichmässigen Grauzone links und der strukturierten Grauzone rechts lässt sich der globale Quantisierungsfaktor abschätzen.
  • Bildbereich 3: Auf die Quantisierung der DCT-Koeffizienten geringerer Ordnung kann durch Artefakte in den vertikalen und horizontalen Graukeilen geschlossen werden.
  • Bildbereich 4: Dieser Bereich besteht aus Luminanz- und Chrominanzkanten, die in der linken Hälfte statisch und in der rechten Hälfte bewegt sind. An den Kanten treten verstärkt sichtbare Quantisierungsfehler auf.
  • Bildbereich 5: Dieser Bereich ist besonders kritisch, und weist häufig Artefakte auf, obwohl im übrigen Bild kaum noch Fehler zu sehen sind. Die Sektorenräder oben links rotieren, alle anderen bewegen sich gleichförmig in horizontaler Richtung mit unterschiedlichen Geschwindigkeiten. Alle Sektorenräder bewegen sich je zur Hälfte vor einer grauen Fläche und vor einem künstlich verrauschten Hintergrund.
  • Bildbereich 6: In diesem Bereich liegen sechs senkrechte weisse Streifen, in denen schrägliegende rote Balken von links nach rechts mit abnehmender Periode auftreten, um Fehler sichtbar zu machen, die durch die Prädiktion entstanden sind.
  • Bildbereich 7: Zwei rote Keile, die von der Bildober- bzw. Bildunterkante zur Mitte der linken Bildkante spitz zulaufen, lassen erkennen, ob Randbereiche der Sequenz beim Codiervorgang ausgetastet wurden, um Daten einzusparen.
  • Bildbereich 8: Dies ist ein EBU-Farbbalken, mit dem Farbfehler erkannt werden können.

Die Sequenz eignet sich gut, um Quantisierungsfehler aufzudecken. Die Auswirkung von Beeinträchtigungen auf verschiedene DCT-Koeffizienten kann anhand der entstehenden Artefakte dargestellt werden. Es besteht jedoch keine Korrelation der Erkenntnisse aus der Testsequenz mit den Ergebnissen aus subjektiven Tests mit Testpersonen.

Diese Testsequenz wurde zum subjektiven Test der 3 Codecs herangezogen und es war sehr interessant zu sehen, was zum Teil mit solch komplexen Signalen geschieht. Am deutlichsten sind die Schwächen bei Testsignalen mit hohen Ortsfrequenzen (Rauschen) sichtbar. Da alle Codecs (je nach eingestellter Datenrate) die hohen Frequenzen früher oder später abschneiden, sind an diesen Bildstellen deutlich Artefakte zu sehen (Bild 11.4).

Cellstack

Die ersten Versuche konnten mit einem Cellstack Master vom TIK durchgeführt werden. Optischer Ein- und Ausgang wurden kurzgeschlossen, so dass das Eingangssignal Motion-JPEG codiert und hinterher sofort wieder decodiert wurde. Die durchschnittliche Datenrate betrug einmal 6 und einmal 9 MBit/s.

Es wurden verschiedene Szenen des SRG-Testbandes ausgewählt sowie die selbsterstellten Sequenzen dazugenommen. Mit dem Genlock wurden Standbilder produziert, die einmal direkt und beim zweiten Mal als Ausgangssignal des Cellstack digitalisiert wurden.

In untenstehender Tabelle sind die rechnerischen Ergebnisse (Variante a und b, RMS und die subjektiven Eindrücke) zusammengefasst.

Bildname

RMS

JND a

JND b

MOS 1)

JND alt

NDR 1 (Bilder der Serie A)

163

1

1

1

1

NDR 2 (Bild 11.5 und 11.6)

129

1

1

1

1

Barcelona 1 (Serie B)

68

1

1

1

1

Barcelona 2

77

2

1

1

1

Testbild

111

4

3

5

1

Text

18

3

4

5

1

Raumstation

58

4

3

4

1

Verhandlungen

82

4

5

5

1

Tabelle 4 Werte für Cellstack [ 1) MOS der Videolabor-Crew]

Es ist schwer zu sagen, ob Variante a oder b des JND-Algorithmus die bessere Bewertung liefert. Es liefern beide ähnliche Resultate wie schon in Kapitel 10 festgestellt. Es ist jedoch offensichtlich, dass sie um einiges besser mit dem MOS korrelieren als der RMS-Wert.

Optibase MPEG 1 Codec (PC-basiert)

Der Ablauf der Tests verlief genau wie oben für den Cellstack beschrieben. Nach einigen Versuchen wurde festgelegt, eine GOP von 12 zu wählen und keine Vorfilter zu benutzen. In einem zweiten Durchgang wurde eine GOP von 1 gewählt (nur I-Bilder), was beim subjektiven Eindruck aber keine Änderung bewirkt hat.

Leider hat sich beim Framegrabben herausgestellt, dass nicht so ohne weiteres ein objektiver Vergleich des Originalbildes mit dem durch den Codec verarbeiteten Bild möglich war, da das Bild nach links oben verschoben war und rechts und unten einen schwarzen Balken hatte (Bilder 11.8 und 11.9).

Da der Vorgang auf den ersten Blick wie eine einfache Translation ausgesehen hat, wäre es eine mögliche Lösung gewesen, diese einfach rückgängig zu machen bis die beiden Bilder wieder deckungsgleich übereinander zu liegen kommen. Danach müsste der Bildausschnitt leicht verkleinert werden und der Vergleich könnte vorgenommen werden.

Nach einer genaueren Untersuchung der beiden Bilder mit dem Programm AVS hat sich aber ergeben, dass der Codec nicht nur eine einfache Verschiebung vornimmt, sondern eine viel kompliziertere Operation durchführt. Die resultierende Abbildungsvorschrift (bezogen auf die linke obere Ecke) wurde mit Mathematica aus 4 Bildpunkten geschätzt und visuell mit Differenzbildern in AVS überprüft:

Eine SVD (Singular Value Decomposition) der Vorschrift (11.1) veranschaulicht, dass das Bild nach der Verschiebung nach links um 15,9 Pixel und nach oben um 8,8 Pixel anisotropisch gestreckt wird (in y-Richtung um den Faktor 1,00602 und in x-Richtung um 1,0136), wobei das Koordinatensystem im Vergleich zum ursprünglichen um -17,9 Grad gedreht ist (Bild 11.11).

Es ist offensichtlich, dass das Problem mit einer einfachen Rückverschiebung nicht behoben wäre. Vielmehr braucht es eine Vorrichtung, die zuerst die beiden Bilder wieder deckungsgleich übereinander bringt. Dies könnte auf verschiedene Arten vor sich gehen:

  • Entweder wird in jedes zu testende Bild eine spezielle Synchronisation eingebaut, die es dem Vergleichsalgorithmus hinterher erlaubt, die Bilder vor den Berechnungen wieder dekkungsgleich zu arrangieren. Das Problem bei dieser Methode dürfte sein, eine Synchronisation zu finden, die vom Codec nicht verändert wird.
  • Eine andere Möglichkeit bestünde darin, vor jedem Codectest ein spezielles Testbild durchlaufen zu lassen und anhand dieses Testbildes die Veränderungen einmal zu berechnen. Unter der Annahme dass ein Codec mit jeder Sequenz dieselbe Veränderung vornimmt, müssten alle weiteren Testbilder nur noch rücktransformiert werden, wenn die Abbildungsvorschrift einmal gefunden ist. Ein geeignetes Testbild wäre zum Beispiel ein weisser Hintergrund mit 9 Kreisen (Bild 11.12).

Wenn nicht wie hier nur Standbilder betrachtet werden, ist zusätzlich darauf zu achten, dass in einer Sequenz die richtigen Bilder miteinander verglichen werden. Dies würde zusätzlich nocheine zeitliche Synchronisation erfordern.

Versuchsweise wurde das Originalbild mit einer um (-16, -9) Pixeln verschobenen Version des gleichen Bildes rechnerisch verglichen. Obwohl es sich subjektiv um absolut die gleiche Bildqualität gehandelt hat (der schwarze Rand fällt nicht gross ins Gewicht), war der JND-Wert so schlecht, dass ein Ergebnis eines Vergleichs von 2 Bildern wie oben gezeigt absolut ohne Aussagekraft wäre.

Casablanca

Die Bilder, die am Ausgang des nichtlinearen Videoschnittsystems Casablanca herauskamen, waren zwar qualitativ um einiges besser als die des Cellstack und bei maximaler Datenrate von 28 MBit/s auch besser als die des MPEG 1 Codecs, leider war das Bild diesmal aber unter anderem nach rechts verschoben, so dass ebenfalls kein rechnerischer Vergleich möglich war. Die Bilder 11.13 und 11.14 zeigen die Unterschiede.

Schlussfolgerungen

Den in Kapitel 10 vorgestellten Ergebnissen lässt sich eine Verbesserung der Bildqualitätsbeurteilung von Variante b gegenüber des in [37] implementierten Algorithmus entnehmen. Da in [37] keine Notenbewertung vorgenommen worden ist, wurde die gleiche Umrechnungsskala angewandt, wie sie bei Variante a und b zum Einsatz kam, damit ein Vergleich angestellt werden konnte. Werden nur die Effekte von JPEG betrachtet, ist der Unterschied gering, jedoch im Praxistest mit den Cellstacks ist eine deutliche Verbesserung der objektiven Beurteilung nach Variante b gegenüber der anderen festzustellen.

Es hat sich im Verlauf der Tests herausgestellt, dass alle Verfahren noch ungenügend sind, wenn keine natürlichen" Bilder wie die (bis auf Bild 11.7 und 11.8) hier verwendeten getestet werden, sondern technische Skizzen oder Schriften auf einem Hintergrund.

An den beiden oben genannten Feststellungen erkennt man, dass es auf jeden Fall noch einer Verfeinerung des HVS bedarf, das dem implementierten Algorithmus zugrunde liegt. Weiter muss das Modell mindesetens noch um die Bewertung der Farbwerte erweitert werden, wie es zum Teil auch schon gemacht und implementiert wurde [27].

Ausserdem wäre es unter Umständen nocheinmal eine Verbesserung, wenn man (genügend Rechenleistung vorausgesetzt), die Richtungsfilter wie von Lubin vorgeschlagen mit acht phasenabhängigen Filtern durchführen würde, anstatt mit drei phasenunabhängigen.

Eine genauere Auswertung als die hier vorgestellte wird erst möglich sein, wenn grossangelegte subjektive Tests einen genauen MOS liefern und diese Ergebnisse mit den rechnerischen Werten verglichen werden. Es ist anzunehmen, dass unter solchen Bedingungen das Ergebnis der Bildbeurteilung nach Variante b deutlich bessere Werte liefern wird als eine Version ohne Orientierungsfilter.

 
Homepage
Zurück Top Weiter
 
Diese Seite verwendet keine Frames !
e-mail: Alexander Braun Diese Seite wurde auf einem A4000 gestaltet 31. Juli 1998