Inhalt

Digitale Bildgebung und ihre Angriffspunkte für forensische Analyse

von Benedikt Lorch und Franziska Schirrmacher.

Fotos und Videos werden weitläufig als wahrheitsgetreue Aufnahme eines tatsächlich vorgekommenen Ereignisses angesehen. Dementsprechend liegt es nahe, einer solchen Aufnahme Glauben zu schenken und auf die Echtheit des abgebildeten Inhalts zu vertrauen.
Die Überzeugungskraft von Bildern haben auch Akteure mit zwielichtigen Interessen erkannt. Diese Akteure manipulieren Bildinhalte mit dem Ziel den Betrachter zu täuschen. Mit der Verbreitung von Bildbearbeitungssoftware wird es immer einfacher, ein Foto oder Video auf realistische Art zu modifizieren.

Einige Berufsfelder verlassen sich auf die Echtheit von Bildern. Wird eine Bildfälschung irrtümlich als Original eingestuft, kann dies weitreichende Folgen für die Beteiligten haben. Ein paar Beispiele:

  • Einem Journalisten wird aus einer unbekannten Quelle eine Aufnahme zugespielt. Da er der Quelle nicht vertrauen kann, möchte er die Echtheit des Bildes überprüfen. Fällt der Journalist auf einen Schwindel herein, ist sein Ruf möglicherweise ruiniert.
  • Bei einer Versicherung meldet ein Kunde einen Schaden. Der Schadensmeldung ist ein Foto des Schadens beigelegt, das die Versicherung auf ihre Glaubwürdigkeit überprüft. Fällt die Versicherung auf eine betrügerische Masche herein, zahlt sie dem Betrüger eine ungerechtfertigte Schadenssumme aus.
  • Bei einem polizeilichen Ermittlungsverfahren wird auf der Festplatte eines Verdächtigen eine Aufnahme mit rechtswidrigem Inhalt gefunden, deren Echtheit von Experten geprüft werden soll. Stellt sich diese Aufnahme als unecht heraus, verläuft die Ermittlung möglicherweise in eine falsche Richtung.

Um Bildaufnahmen auf ihre Echtheit zu überprüfen, haben Forscher aus der Multimediaforensik in den vergangenen Jahren eine breite Palette an Ansätzen entwickelt. Diese Werkzeuge helfen einem forensischen Analysten bei der Suche nach Spuren, die Hinweise über die Verarbeitung eines Bildes zurück bis zur Aufnahme verraten.

In vielen Anwendungsszenarien liegen dem Analysten neben dem zu untersuchenden Bild wenige bis keine Zusatzinformationen vor. Dieses Szenario wird auch als passive Authentizitätsprüfung bezeichnet, da der Experte nicht in den Bildgebungsprozess eingreifen kann. Im Gegensatz zum passiven geht der aktive Ansatz davon aus, dass die Kamera bei der Aufnahme eine Art Wasserzeichen oder Signatur in das Bild einbettet, dessen Integrität später Aufschluss über mögliche Manipulationen gibt. Allerdings setzt dies voraus, dass jede Kamera eine entsprechende Signatur in ihre Bilder einbettet, was in der Praxis nicht umgesetzt wurde.

Interessanterweise beinhaltet ein Foto in der Regel eine Vielzahl von Spuren, die eine Manipulation verraten und Information über die Herkunft des Bildes geben können. Einige dieser Spuren lassen sich mit dem bloßen Auge überprüfen, andere hingegen benötigen spezielle Werkzeuge. Um zu wissen, wo man nach diesen Spuren suchen muss, ist es hilfreich, die Entstehung eines digitalen Bildes nachzuvollziehen.

Wie entsteht ein digitales Foto?

Die Bildgebung umfasst die Abbildung einer Szene aus der dreidimensionalen Welt auf ein zweidimensionales Foto, das in Form von Nullen und Einsen auf einem Datenträger gespeichert wird. Die Bildgebung läuft in jeder herkömmlichen Digitalkamera ähnlich ab. In der obenstehenden Grafik sind die einzelnen Schritte als Blöcke dargestellt.

Zunächst trifft Licht aus der fotografierten Szene durch das Objektiv in die Kamera. Das Objektiv bildet einfallende Lichtstrahlen auf den Kamerasensor ab. Durch Verschieben der Linsen innerhalb des Objektivs kann die Schärfeebene eingestellt werden.

Der Kamerasensor ist in eine Vielzahl von Zellen aufgeteilt. Kurz gesagt misst jede Zelle die Helligkeit des einfallende Lichts und wandelt die gemessene Helligkeit in einen digitalen Wert um.

Um neben Helligkeit auch Farben rekonstruieren zu können, liegt über jeder Pixelzelle ein Farbfilter. Folglich nehmen einige Zellen nur rötliches Licht auf, andere nur grünes oder blaues. Die fehlenden Farbinformationen müssen nachträglich geschätzt werden.

Bevor der Benutzer das aufgenommene Foto zu sehen bekommt, sind noch einige weitere Verarbeitungsschritte nötig. Diese werden unter dem Begriff „kamerainterne Verarbeitung“ zusammengefasst und können sich von Hersteller zu Hersteller unterscheiden. Zu den Verarbeitungsschritten zählen Farbkorrekturen und Weißabgleich, Rauschunterdrückung, Tone Mapping und das Nachschärfen von Kanten.

Das fertige Bild wird zusammen mit Metadaten als Datei gespeichert. Die meisten Kameras speichern Fotos im JPEG-Format.

Prüfansätze

Einige der Verarbeitungsschritte hinterlassen charakteristische Spuren auf dem digitalen Bild. Diese Spuren geben einem Analysten Angriffspunkte, um die Echtheit einer Aufnahme zu überprüfen.

Um eine überzeugende Fälschung zu erzeugen, müsste ein Fälscher sicherstellen, dass die durch den Eingriff hinterlassenen Spuren konsistent mit den Spuren der Aufnahme übereinstimmen. Folglich deuten Inkonsistenzen zwischen Spuren in unterschiedlichen Bildbereichen auf eine Bildmanipulation hin.

Besonders interessant sind auch Abbildungsfehler, da diese charakteristisch Spuren für das Aufnahmegerät beinhalten und so Rückschlüsse auf das Aufnahmegerät oder dessen Konfiguration zulassen.

Physikalische Szeneneigenschaften

Geometrie

Die Abbildung der dreidimensionalen Welt auf den zweidimensionalen Sensor folgt den Regeln der perspektivischen Projektion. Dies bedeutet, dass gerade Linien in der echten Welt auf gerade Linien in der Bildebene abgebildet werden. Der Einfachheit soll davon ausgegangen werden, dass durch das Objektiv keine Verzerrung erzeugt wird.
Ist auf dem zu analysierenden Foto ein dann Objekt zu sehen, das normalerweise gerade Kanten aufweist, sind diese Kanten auch als gerade Linien im Bild zu erkennen. Alles andere wäre ein Hinweis auf eine mögliche Fälschung.

Beleuchtung

Beim Einfügen eines Objekts in einen neue Szene muss der Fälscher sicherstellen, dass die Beleuchtungseigenschaften des eingefügten Objekts mit der restlichen Szene übereinstimmen. Zeigen beispielsweise die Schatten von zwei abgebildeten Objekten in unterschiedliche Richtungen, erregt dies den Verdacht des Betrachters.
Bei einem an einem sonnigen Tag im Freien aufgenommenen Foto kann man typischerweise davon ausgehen, dass die Szene von der Sonne als dominierende Lichtquelle beleuchtet wurde. Aus der Richtung eines Schattens kann eine Analyst dann die ungefähre Position einer Lichtquelle schätzen. Um die Szene auf ihre Konsistenz zu prüfen, berechnet der Analyst die Position der Lichtquelle von mehreren Objekten und ihren Schatten. Stellt sich dabei heraus, dass die Lichtquelle nicht an der gleichen Stelle sondern an unterschiedlichen Positionen gestanden haben muss, ist diese Inkonsistenz ein Indiz für eine Manipulation.
Neben Schatten bieten sich auch Helligkeitsverläufe oder Spiegelung an glänzenden Oberflächen zur Berechnung der Beleuchtungsrichtung an.

Abbildungsfehler der Linse: Chromatische Aberration

Das Kameraobjektiv bildet die Szene auf den Kamerasensor ab. Obwohl Objektive aus einer ausgeklügelten Kombination von Linsen bestehen, tritt bei der Abbildung eine Reihe von Abbildungsfehlern auf. Diese lassen sich in geometrische Verzeichnung, ungewollte Schärfeverläufe (sphärische Aberration, Astigmatismus, Koma) und Farbverzerrungen unterscheiden.
Farbverzerrungen äußern sich in Form von Farbsäumen an Übergängen zwischen hellen und dunklen Objekten. Dieser Effekt entsteht durch die Brechung unterschiedlicher Lichtfarben und wird als „chromatische Aberration“ bezeichnet. Die Stärke der Farbverzerrung nimmt mit steigendem Abstand zum optischen Zentrum zu.
Inkonsistenzen in chromatischer Aberration können auch ein manipuliertes Bild verraten. Ein Analyst kann diese Inkonsistenzen aufdecken, indem er den erwarteten Farbversatz vom gesamten Bild modelliert. Anschließend vergleicht er, ob einzelne Bildregionen mit dem global geschätzten Modell übereinstimmen. Weicht eine Region deutlich vom globalen Modell ab, deutet dies auf eine Manipulation hin.

Sensorrauschen

Unter idealen Bedingungen sollte jede Pixelzelle bei gleichem einfallenden Licht den gleichen Helligkeitswert erzeugen. Aufgrund von herstellungsbedingten Ungenauigkeiten registrieren manche Zellen allerdings permanent mehr Photonen und andere Zellen weniger. Verfügt man über eine große Anzahl von Aufnahmen aus einer Kamera, kann man berechnen, welche Zellen im Durchschnitt mehr und welche niedrigere Helligkeitswerte erzeugen. Dieses dabei entstehende Muster ist einzigartig und wird deshalb gerne als Fingerabdruck der Digitalkamera bezeichnet. Der Fingerabdruck kann verwendet werden, um ein Foto seinem Aufnahmegerät zuzuordnen. Auch bei der Lokalisierung von Manipulationen kann der Fingerabdruck helfen: Stimmt das Foto in den meisten Teilen mit dem Fingerabdruck überein, in einigen Regionen aber nicht, so könnten diese Regionen manipuliert worden sein.

Verarbeitung: Demosaicking

Für jeden Pixel wird entweder ein Rot-, ein Grün- oder ein Blauwert gemessen. Die Helligkeitswerte der zwei verbleibenden Farben müssen aus benachbarten Messwerten nachträglich geschätzt werden. Die Berechnung der fehlenden aus benachbarten Messwerten wird auch Interpolation genannt. Nach dieser kann man mit statistischen Verfahren analysieren, dass einige der Farbwerte mit ihren Nachbarn (aus deren Kombination sie erzeugt wurden) korrelieren. Aufgrund des sich wiederholenden Farbfilters werden sich auch die Art der Korrelationen wiederholen, sodass ein periodisches Muster entsteht.

Kennt man die Periodizität der Muster, kann man dadurch das Interpolationsverfahren erraten. Stimmen die Interpolationsartefakte in Teilen des Bildes nicht mit dem Rest überein, deutet dies auf eine Manipulation hin.

Kompression

Die meisten Kameras speichern das fertige Bild im JPEG-Dateiformat ab. Dieser Standard wurde 1992 von der Joint Photographic Experts Group entwickelt und hat sich bis heute als das vermutlich verbreitetste Bildformat gehalten. JPEG ist ein verlustbehaftetes Kompressionsverfahren, das Speicherplatz auf Kosten der Bildqualität einspart. Kamerahersteller können zwischen diesen beiden Größen abwägen und das Kompressionsverfahren auf ihre Produkte abstimmen. Dabei stellt sich heraus, dass sowohl die Wahl der Qualitätsstufe (in Form von sogenannten Quantisierungstabellen) als auch Details bei der Implementierung der Kompression (z.B. Wahl von Rundungsoperatoren) Rückschlüsse auf den Hersteller zulassen.

Aufgrund der weiten Verbreitung des JPEG-Formats wurde eine Vielzahl von weiteren Werkzeugen entwickelt, um JPEG-komprimierte Bilder zu untersuchen. Besonders beliebt ist die Suche nach Spuren von erneuter Kompression. Die Arbeitshypothese ist, dass Originalbilder genau einmal beim Speichern durch die Kamera komprimiert werden. Nach der Bearbeitung in einem Bildbearbeitungsprogramm wird das Bild beim Speichern jedoch ein zweites Mal komprimiert. Demnach deuten Spuren einer zweiten Kompression auf eine Manipulation hin.

Zusammenfassung

Kenntnisse über die Entstehung eines digitalen Bildes können ausgenutzt werden, um Schlüsse über den Ursprung eines Fotos zu ziehen oder Manipulationen aufzudecken. Jeder Verarbeitungsschritt bietet dem Analysten Angriffspunkte, um die Konsistenz des Verarbeitungsschrittes zu überprüfen. Unstimmigkeiten deuten auf eine Manipulation hin. Abbildungsfehler können Rückschlüsse auf den Ursprung des Bildes zulassen.

Weiterführende Literatur

Hany Farid. 2016. Photo Forensics. MIT Press.