Firmen wie Google oder Microsoft haben bei Künstlicher Intelligenz das Monopol – und somit die Macht. Ein IT-Professor an der LMU München stellt sich ihnen entgegen.

Schon vor mehr als einem Jahrzehnt hat Björn Ommer, 43, einige Job-Angebote aus dem Silicon Valley ausgeschlagen. Bei der Frage nach dem Warum lacht er verhalten. Für einen Moment wirkt er verlegen am Telefon. "Ich wollte mich nicht von finanziell getriebenen Chefs und Firmen einschränken lassen", sagt er. Ommer ist Informatikprofessor an der Ludwig-Maximilians-Universität in München (LMU) und der Erfinder der Software für den Bildgenerator Stable Diffusion. Dieser gehört inzwischen zu den beliebtesten Bildgeneratoren der Welt.

Mehrere Jahre tüftelte Ommer daran, Maschinen das Sehen beizubringen, wie er es nennt. Also einen Text in Bilder zu übersetzen. Mit Stable Diffusion ist ihm das gelungen. Der Generator kann aus Texteingaben nie da gewesene Bilder erstellen. In Sekundenschnelle aus dem Nichts – mithilfe von Künstlicher Intelligenz. Es reicht, eine Idee auszuformulieren. Noch vor einiger Zeit waren KI-Systeme kaum in der Lage, gut erkennbare Gesichter zu erzeugen; inzwischen sind ihre Werke häufig nur schwer von Fotos zu unterscheiden.

Der Bildgenerator Stable Diffusion erstellt innerhalb weniger Sekunden alle erdenklichen Motive. Hier Porträts von Angela Merkel im Stil des Künstlers Gustav Klimt. Foto: Stable Diffusion/Lara Voelter

Ein Porträt Angela Merkels im Stil des Künstlers Gustav Klimt. Ein Löwenpaar, das Kate Winslet und Leonardo DiCaprio am Bug der Titanic imitiert. Eine Katze, die in einen Pelzmantel gehüllt E-Gitarre auf einer Bühne spielt. Nur einige Stable-Diffusion-Kreationen, die das Internet ausspuckt, wenn man nach den Schöpfungen des Bildgenerators sucht.

Stable Diffusion zählt zu den populärsten Bildgeneratoren der Welt

Generative Künstliche Intelligenz wie Stable Diffusion setzt Algorithmen des maschinellen Lernens ein, um Maschinen dazu zu bringen, neue Inhalte zu erschaffen – auf Basis einer Datenbank aus unzähligen echten Bildern. Mithilfe dieser Inhalte erkennen Computer die zugrunde liegenden Muster und können daraus Neues erschaffen.

Stable Diffusion zählt neben Midjourney und Dall-E 2 mittlerweile zu den meistgenutzten Bildgeneratoren weltweit. Dall-E 2 wurde von der kalifornischen Firma OpenAI auf den Markt gebracht, sie hat auch den Chatbot ChatGTP entwickelt und wird unter anderem von Microsoft finanziert. Midjourney stammt vom gleichnamigen US-Unternehmen, über das wenig bekannt ist. Es bezeichnet sich als unabhängiges Forschungsbüro, das keine Investoren hat. Laut seinem Gründer David Holz ist es inzwischen profitabel.

Ommer und sein Team besaßen keine Supercomputer und keine Milliarden, um ihre KI-Algorithmen zu trainieren. Um zu sparen, setzten sie auf kleinere, aber besonders intelligente Systeme. Trotzdem war Geld für den Erfolg entscheidend. Das Start-up Stability AI unterstützte sie schließlich finanziell und ermöglichte ihnen, ihr KI-Modell in eines der leistungsfähigsten der Welt zu verwandeln.

Normalerweise brauchen generative Programme extrem viel Rechenleistung. Daher funktionieren sie nur online: Die eigentlichen Rechenvorgänge laufen auf Serverfarmen und Hochleistungsrechnern – mehrheitlich in den USA. Bei Stable Diffusion ist das anders, denn die Software kommt mit wenigen Gigabyte aus. Hintergrund hierfür ist: Der Bildgenerator lässt kaum wahrnehmbare Details weg; etwa die Form einzelner Grashalme auf einer Wiese. Solche Petitessen benötigen viel Rechenpower.

Björn Ommer hat den Code kostenlos ins Internet gestellt

Revolutionär ist, dass Ommer den Programmiercode für die Software im August 2022 frei ins Internet gestellt hat – als sogenannte Open Source. Das bedeutet, Nutzerinnen und Nutzer müssen nicht dafür bezahlen und können den Code auch weiterentwickeln und damit experimentieren.

Björn Ommer betont, er habe den Bildgenerator mit der Forschungsgruppe, die er leitet, erfunden – nicht allein. Und dass sein Team und er den Code zunächst nur an Wissenschaftlerinnen und Wissenschaftler weitergegeben hätten, um ihnen einen Vorsprung zu verschaffen. Später stellte die Münchner Forschungsgruppe den Code auch der Allgemeinheit zur Verfügung. Kostenlos. Ommer verdient daran also nichts.

Denn er ist überzeugt: Forschung sollte für alle zugänglich sein. Bei generativer Künstlicher Intelligenz spricht er von einer "kritischen Technologie" – sowohl auf wirtschaftlicher als auch gesellschaftlicher Ebene. Er sagt: "So wie wir vorgegangen sind, war es wahrscheinlich die bessere Lösung, um rechtzeitig einen Diskurs darüber zu starten, was die Gesellschaft bei generativer KI möchte – und was nicht."

Software, die kostet, ist ebenso manipulierbar wie Open Source

Die Entscheidung, den Programmiercode für den Bildgenerator frei ins Netz zu stellen, wurde laut Ommer auch kritisiert. Wenn eine Software kostenlos im Internet stehe, könne sie viel schneller missbraucht werden, etwa um Fake News zu verbreiten, habe es immer wieder geheißen. Ommer sagt, ihm und seinem Team sei klar gewesen, dass der Code trotz einiger Sicherheitssperren noch nicht ausgereift gewesen sei, als sie ihn veröffentlichten.

Aber er hält es für einen Trugschluss zu denken, Software, die Geld kostet, sei weniger manipulierbar. Er sagt: "Die Software nicht frei zur Verfügung zu stellen und das als Sicherheitsmerkmal zu verkaufen, zieht nicht. Letztendlich kann sie genauso geleakt oder nachprogrammiert werden." In den letzten Monaten sei genau das eingetreten. So wurde etwa der Code des KI-Chatbots LLaMA bereits nach wenigen Tagen geleakt und im Internet frei zum Herunterladen bereitgestellt.

Björn Ommer hält es für problematisch, dass bislang nur einige wenige Firmen in der Lage sind, generative Algorithmen zu trainieren, weiterzuentwickeln und zu regulieren. Seiner Meinung nach machen sich Deutschland und eine Vielzahl anderer Länder dadurch komplett abhängig von mächtigen US-Firmen. Und auch in der öffentlichen Diskussion um KI und ihre Regulierung werden die Forderungen nach europäischen oder gar deutschen KI-Modellen immer dringlicher.

So sagte die Vorsitzende des Deutschen Ethikrates, Alena Buyx, in einem Gespräch mit unserer Redaktion: "Es erstaunt mich, dass die EU die Tech-Konzerne mehr oder weniger einfach gewähren ließ." Es müsse etwas dagegen getan werden, dass die EU abhängig sei von einer Handvoll Digitalkonzernen, die alle aus China und den USA stammten. Der Deutsche Ethikrat halte europäische Lösungen und Alternativen für dringend nötig. "Und wenn wir damit nicht jetzt beginnen, dann ist der Zug wirklich komplett abgefahren."

Ommer stellt sich dem Machtmonopol von US-Unternehmen entgegen

Unternehmen wie Microsoft, Apple oder Google können es sich leisten, Algorithmen in tausenden von Rechnern mit riesigen Datenmengen zu füttern. Doch mit welchen Daten trainieren sie ihre Systeme? Sie hüten sich davor, das offenzulegen. Zu groß dürfte die Angst sein, sich Probleme einzuhandeln und andere am Gewinn beteiligen zu müssen. Beispielsweise dann, wenn sie Urheberrechte verletzen, weil sie ihre Systeme mit Bildern von Kunstschaffenden trainieren. Ommer findet, Künstler sollten sich aktiv dagegen aussprechen können, dass Maschinen mit Abbildern ihrer Werke gefüttert werden.

Mit seinem Anliegen, Künstliche Intelligenz zu demokratisieren und Technologie nicht wenigen großen Firmen mit gigantischem Kapital und immensen Server-Ressourcen zu überlassen, stellt sich Björn Ommer dem Machtmonopol milliardenschwerer US-amerikanischer Tech-Konzerne entgegen. Wenngleich er von ihnen zunächst belächelt wurde. Mit gerade einmal 28 Jahren hatte er eine Professur für Informatik in Heidelberg dem Silicon Valley vorgezogen. Seine Unabhängigkeit war ihm wichtiger als eine Karriere bei einem Tech-Riesen. Und das gilt auch für seine Forschung.

KI hat sich in den vergangenen Jahren rasend schnell zu einem mächtigen Instrument gemausert. Was jedoch konstant geblieben ist: Ommers Wunsch, Maschinen das Sehen noch besser beizubringen, auszuloten, wo ihre Grenzen liegen, und Künstliche Intelligenz zu einer Verbündeten zu machen. Für die Allgemeinheit, nicht für Tech-Konzerne. In München, in Europa – nicht nur im Silicon Valley.