Das Videotelefonat zwischen Berlins Bürgermeisterin Franziska Giffey und Vitali Klitschko war ein Deepfake, denn er war es nicht. Was diese Technik kann und wie man sie entlarvt.

Es sollte ein ganz normales Videotelefonat mit Kiews Bürgermeister Vitali Klitschko werden, wie es seit dem Ukraine-Krieg schon des Öfteren stattgefunden hat. Bis der Mann am anderen Ende der Leitung Franziska Giffey fragte, ob Berlin bei der Ausrichtung eines Christopher Street Days in Kiew helfen könne. Die regierende Bürgermeisterin von Berlin schöpfte Verdacht, dass etwas nicht stimmen konnte. Dann brach das Video ab. Die Person, mit der Giffey fast eine halbe Stunde sprach, sah zwar aus und hörte sich auch an wie Klitschko – aber er war es nicht. Laut Wirtschaftswoche steht noch kein Tatverdächtiger fest.

Ganz neu sind solche "Deepfakes" nicht. Schon bei den US-Präsidentschaftswahlen im November 2021 kursierte ein Video der Demokratin Nancy Pelosi in den sozialen Netzwerken, auf dem es so aussieht, als würde die Sprecherin des Repräsentantenhauses lallen. Das Video wurde im Nachhinein manipuliert. Der Effekt entstand mit Hilfe einer Bearbeitungssoftware durch eine veränderte Abspielgeschwindigkeit.

Was sind Deepfakes?

Dabei handelt es sich um gefälschte Bilder, Videos oder Audiodateien, die mit Hilfe von künstlicher Intelligenz (KI) realistisch und authentisch wirken sollen. Die KI sorgt dafür, dass die Stimme echt klingt sowie die Mimik, die Mundbewegungen und die gesprochene Sprache zueinander passen.

Wie können Deepfakes im Alltag auftauchen?

Die europäische Strafverfolgungsbehörde Europol hat von den unterschiedlichsten Einsatzmöglichkeiten von Deepfakes gewarnt, die alle Menschen betreffen können. Besonders die organisierte Kriminalität macht sich die Technologie zu nutze.

Die unechten Dateien können entweder für Erpressungs- und Betrugsdelikte verwendet werden, um Dokumente zu fälschen oder Finanzmärkte zu manipulieren. Außerdem können sie zur Desinformation der öffentlichen Meinung oder zu gesellschaftlichen oder politischen Unruhen führen.

Laut Europol wird die Gefahr beispielsweise real, wenn sich ein Fremder durch die neue Technik am Telefon wie der eigene Chef anhört und eine Überweisung fordert.

Sind Deepfakes strafbar?

Ja, denn das Persönlichkeitsrecht der abgebildeten Person, das in Artikel 2 des Grundgesetzes verankert ist, wird dabei verletzt, wie der Bayerische Rundfunk mitteilt. Es gibt vielfältige Straftatbestände. Wenn zum Beispiel jemand das Gesicht einer Person in einen pornografischen Film schneidet, verletzt er neben dem Persönlichkeitsrecht, die persönliche Ehre und das Recht am eigenen Bild. §22 des Kunsturheberrechtsgesetzes schreibt vor, dass die Nutzung von Bildnissen einer Person nur mit deren Einwilligung erfolgen darf. Wer dagegen verstößt, muss mir einer Freiheitsstrafe von bis zu einem Jahr oder einer Geldstrafe rechnen.

Außerdem kann der Täter oder die Täterin wegen Beleidigung, übler Nachrede oder Verleumdung zur Rechenschaft gezogen werden.

Betroffene können eine einstweilige Verfügung erwirken, damit die Verbreitung eines Deepfakes unterbunden wird. Außerdem sind Schadensersatzansprüche gegen die Person möglich, die das Video veröffentlicht hat.

Wie kann man Deepfakes erkennen?

Wichtig sei es erst einmal zu wissen, dass es die Möglichkeit dieser gefälschten Dateien überhaupt gebe, sodass man nicht mehr jedem Video oder jeder Sprachaufnahme von vornherein vertraue, sagt das Bundesamt für Sicherheit in der Informationstechnik (BSI). Stattdessen solle man die Aussagen immer kritisch hinterfragen.

Allerdings gibt es auch technische Hinweise auf Deepfakes. Zum Beispiel können bei Bild- und Videoaufnahmen Konturen verwaschen, die Mimik nur begrenzt oder die Belichtung unnatürlich sein. Zudem könne die Stimme monoton oder metallisch, sowie die Aussprache falsch oder unnatürlich klingen oder mit Verzögerung auftreten. Auch ungewöhnliche Geräusche können ein Hinweis sein.

"Man erkennt sie meist an typischen Fehlern wie verschwurbelten Haaren und komisch geformten Ohren", erklärt Pina Merkert vom IT-Fachmagazin c't. Künstliche Intelligenz werde zwar stetig besser, brauche dafür aber eine geeignete Datenbasis. Wenn Menschen beim Reden oft gefilmt würden, könne die KI Augen, Nase, Mund und Lippen einfacher darstellen. Bei Bereichen, die nicht oft zu sehen oder verdeckt seien, wie der Mund-Innenraum oder die Ohren fehlen der Technologie die Grundlage, um echt wirkende Bilder zu erstellen.

Merkert rät dazu, sich verschiedene Beispiele von Deepfakes auf den gängigen Videoportalen anzusehen, um ein Gefühl dafür zu bekommen: "Die sind leicht zu finden, weil die Mehrzahl ja nicht in böser Absicht, sondern einfach als Gag mit Promis produziert wurde."

Wie das BSI weiter erklärt, arbeiten Wissenschaftlerinnen und Wissenschaftler gerade an zahlreichen Methoden, die manipulierte Dateien automatisch erkennen.