Ich spreche, also bin ich? Die Beziehung zwischen Mensch und Maschine

Pfingsten

Ich spreche, also bin ich? Die Beziehung zwischen Mensch und Maschine

Bereits heute helfen Computer als Übersetzer etwa im Umgang mit Geflüchteten aus der Ukraine. Aber wenn Künstliche Intelligenz sprechen lernt: Ist das wirklich gut?

Von Christina Brummer |

04.06.22, 12:00 Uhr

Frei nach Michaelangelos "Erschaffung des Adam" in der Sixtinischen Kapelle: Der Mensch beseelt die Maschine nach seinem Bilde. Foto: stock.adobe.com

Sprache ist überall. Lange galt sie als menschliche Errungenschaft. Doch auch Computer sollen sprechen lernen. Bereits heute helfen sie ja als Übersetzer etwa beim Kontakt mit Geflüchteten aus der Ukraine – oder als Sprachassistentinnen. Also: Auf eine vollverständige Zukunft dank Künstlicher Intelligenz! Oder besser doch nicht?

Kapitel 1: Was ist Sprache?

Sprache ist einzigartig. Sprache ist menschlich. Sprache ist die Fähigkeit der Menschen, sich mithilfe von Zeichen zu verständigen. Die meisten Sprachen bestehen aus Wörtern, die aus einer Kombination von verschiedenen Laute bestehen. Diese Laute werden durch Buchstaben dargestellt, die in bestimmten Mustern angeordnet sind.

Stimmen Sie zu? Klingt plausibel, oder? Der Text stammt dabei nur teilweise von einem Menschen. Um genau zu sein, nur die ersten zwei Sätze. Der Rest ist das Werk einer Künstlichen Intelligenz (KI). Inklusive des Grammatikfehlers. Er wurde aus gutem Grund nicht verbessert. Doch dazu später mehr.

Sprache ist so allgegenwärtig, dass wir sie nicht bewusst benutzen. Es wäre zu viel der Ehre, Kommunikation als eine vollkommene, weil über Jahrtausende kultivierte und verbesserte Fähigkeit zu bezeichnen. Denn menschliche Kommunikation klappt in vielen Situationen eben doch nicht so gut. Millionenfach bewiesen in den Behandlungsräumen von Paartherapeuten und in Pandemiezeiten maskiert an der Theke beim Bäcker um die Ecke. Oder eben dann, wenn plötzlich Kulturen aufeinanderprallen, wie im Zuge der Fluchtbewegung aus der Ukraine. Zum Glück gibt es das Handy, das als Dolmetscher fungiert. Übersetzungssysteme wie Google Translate, DeepL und co werden immer ausgereifter. Das Ziel? Manche hoffen auf den Knopf im Ohr, der so schnell übersetzt, dass man ein natürliches Gespräch mit jemandem führen kann, der nicht die gleiche Sprache spricht. Klingt gut, oder?

Und es erschienen ihnen Zungen, zerteilt, wie von Feuer; und er setzte sich auf einen jeglichen unter ihnen; und sie wurden alle voll des Heiligen Geistes und fingen an, zu predigen mit anderen Zungen, nach dem der Geist ihnen gab auszusprechen.

Dass die Fremdsprache per Heiligem Geist über einen kommt, wäre ein wünschenswertes Wunder. Sprache ist Macht, die Erzählung aus der Apostelgeschichte, sie wird auch „Pfingstwunder“ genannt, zeigt das: Die Jünger, die vom Heiligen Geist mit allerlei Fremdsprachenkenntnissen ausgestattet werden, können nun ihre Botschaft weiter verbreiten. Ihre Ideen in die Welt hinaus tragen.

Ob Knopf im Ohr oder Sprachenlernen auf Knopfdruck: Für viele ist das Erlenen einer Fremdsprache mühselig. Es beinhaltet nicht nur tausende von neuen Wörtern, sondern auch den Blick auf die Welt einer anderen Kultur, den es zu verstehen gilt. In der Schule ist es noch vergleichsweise einfach. Da werden Vokabeln, unregelmäßige Verben, Fälle, Endungen durchgekaut, bis man sich leidlich verständigen kann oder eben auch nicht. Doch ist man einmal aus der Schule raus, ist es oft auch aus mit den Fremdsprachen. Keine Zeit und keine Gelegenheit. Dann kam Corona und auf einmal hatten alle ganz viel Zeit. Das hat man auch bei Babbel gemerkt. Das Unternehmen hat eine App zum Sprachenlernen entwickelt. Geht es nach dem Berliner Unternehmen, dann muss Sprachenlernen keine ermüdende Abfolge aus Vokabel- und Grammatiklernen sein. In durchschnittlich nur 15 Minuten Lernen am Tag soll man schnell ins Sprechen kommen. Viele neue Nutzer kamen im Lockdwon hinzu. War dieser Hype nur von kurzer Dauer? „Nein, glücklicherweise hat sich der Trend fortgesetzt, wir haben immer mehr Neukunden“, sagt Geschäftsführer Arne Schepker. Vielleicht habe das ja auch die Pandemie gezeigt. Schepker findet: „Ein gutes Zeichen für die Menschheit: Wir wollen weiterhin mit anderen in Kontakt treten. Und Kontakte sind immer sprachlich getrieben.“ Englisch, Italienisch, Spanisch lernen die Deutschen am liebsten mit der App. Auch Künstliche Intelligenz spielt dabei eine Rolle: „Wir nutzen KI, um unsere Spracherkennung und damit auch den Lernerfolg zu verbessern.“ Heißt: Man spricht ein Wort in der Fremdsprache in die App und die erkennt – idealerweise – ob man es richtig ausgesprochen hat. Doch nach und nach solle bei Babbel das Lernen mit der App und das Lernen mit echten Lehrern enger verzahnt werden. Schepker: „Alles, was repetitiv ist, kann man mit der Technik lernen, um dann zum menschlichen Lehrer überzugehen.“ Schepker findet: „Im KI-Umfeld wird KI oft zum Selbstzweck. Wir haben uns überlegt, welche Probleme wir mit KI lösen können und welche wir mit menschlichen Lehrern lösen müssen.“

Damit Arne Schepker und sein Team mithilfe von KI beim Sprachenlernen helfen können, müssen zunächst einmal Computer Sprachen lernen. Die Frage, in welcher Form ein Computer sprechen können soll, spaltet dabei die KI-Gemeinde. Die Art, wie die KI eingangs Sprache beschreibt, also als eine Kombination aus Lauten, Buchstaben und deren Anordnung, mag zutreffen. Aber ist Sprache nicht mehr als das Zusammenspiel von Wörtern und Sätzen?

Der Linguist Daniel Everett sieht Sprache sogar als mächtigstes Werkzeug, das der Menschheit zur Verfügung steht: „Sprache ist nicht nur eine andere Form von tierischer Kommunikation, Sprache ist eine hoch entwickelte Form kulturellen Ausdrucks, die auf Fähigkeiten beruht, die allein Menschen besitzen“, schreibt Everett. Möchte man dieser Argumentation folgen, so ist der Mensch gerade im Begriff, dieses mächtige und einzigartige Werkzeug aus der Hand zu geben. Denn es wird schon lange an Künstlichen Intelligenzen geforscht, die Sprache ebenso beherrschen wie Menschen. Und oberflächlich betrachtet sind diese KIs diesem Ziel schon recht nahe.

Kapitel 2: Computern Sprache beibringen

Um zu verstehen, welche Bedeutung Sprachfähigkeit von Computern für die KI-Forschung hat, muss man zurückgehen in die 50er Jahre. Damals entwickelte der KI-Forscher Alan Turing eine Methode, um KI-Systeme auf ihre Intelligenz zu prüfen. Eine „intelligente“ Maschine hat den sogenannten Turing-Test bestanden, wenn sie, vereinfacht gesagt, einer schriftlichen Unterhaltung mit einem Menschen standhält, ohne, dass das menschliche Gegenüber merkt, dass es sich bei seinem Gesprächspartner um einen Computer handelt. Eine solche menschliche Sprachfähigkeit wird in der KI-Forschung als Wegmarke betrachtet hin zu einer universellen Künstlichen Intelligenz. Als solche versteht man eine maschinelle Intelligenz, die der des Menschen ebenbürtig ist.

Hand in Hand: Künstliche Intelligenz soll Menschen Arbeit abnehmen, ohne sie zu ersetzen. Foto: Axel Heimken, dpa

Wir könnten hoffen, dass Maschinen in allen rein intellektuellen Disziplinen gegen den Menschen antreten. Aber mit welcher Disziplin sollten wir beginnen? Allein das ist schon eine schwierige Entscheidung. Viele denken, dass etwas Abstraktes wie Schachspielen am besten wäre. Es wäre aber ebenso plausibel, dass man eine Maschine mit den besten und teuersten Sinnesorganen ausstattet und ihr dann beibringt, Englisch zu sprechen und zu verstehen. Dieser Prozess kann ähnlich ablaufen, wie wenn man ein Kind unterrichtet. Man würde der Maschine Dinge zeigen und sie benennen. Noch mal, ich weiß nicht, was die richtige Lösung ist, aber ich denke, man sollte beides ausprobieren. Wir können nicht weit in die Zukunft blicken, aber wir können trotzdem vieles sehen, das getan werden muss. – Alan Turing „The imitation game“ (1950)

Kapitel 3: Was ist eigentlich Intelligenz?

In der Debatte um KI ist es dabei nötig, ein klein wenig auszuholen. Denn am Anfang jeder Künstlichen Intelligenz steht die Frage: Was ist eigentlich Intelligenz? „Man kann darüber streiten, ob menschliche Intelligenz tatsächlich universell ist“, schrieb der schwedische KI-Kritiker Nick Bostrom 2014 in seinem Buch „Superintelligenz“. Weiter: „Aber menschliche Intelligenz ist sicherlich breiter nutzbar als nicht menschliche Intelligenz.“ Übersetzt in ein konkretes Beispiel bedeutet das für Bostrom: Eine Biene besitzt die Intelligenz, einen Bienenstock zu bauen. Und ein Biber besitzt die Intelligenz, einen Damm zu bauen. Aber eine Biene kann keine Dämme bauen und ein Biber keinen Bienenstock. Ein Mensch, der lange genug dabei zusieht, kann beides lernen.

Wäre es möglich, eine dem Menschen eben-bürtige allgemein intelligente Maschine zu bauen, wäre der Schritt nicht weit hin zu einer übermenschlich intelligenten Maschine, so die Sorge mancher KI-Kritiker. Eine solche würde den Menschen auf lange Sicht überflügeln und ihn damit überflüssig machen. In der Renaissance etablierte sich das Bild des „uomo universale“. Leonardo da Vinci war eines der Musterbeispiele für diesen sogenannten Universalgelehrten, ein in allen erdenklichen Forschungszweigen gebildes Wesen. Mit der Zunahme des Wissens starb der Universalgelehrte aus, so vielfältig waren die wissenschaftlichen Erkenntnisse, dass sich ein Mensch allein heute lediglich in einem kleinen Teilbereich bilden kann. Eine Maschine, die auf alles bekannte Weltwissen zurückgreifen kann und noch dazu nicht beschränkt wird von Hunger, Durst und einer endlichen Lebenszeit: Was würde eine solche Maschine für die Menschheit bedeuten?

Kapitel 4: Helfer oder Zerstörer?

Trotz aller Fortschritte in den vergangenen Jahren und düsteren Szenarien: So weit ist die KI-Forschung noch nicht. An einer Lösung der Frage, wie man Maschinen Sprache beibringt, arbeiten viele Firmen und Organisationen. Auch Stefan Schaffer hat sich daran gemacht. Er ist Informatiker und arbeitet am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Berlin. Für einen Kita-Träger entwickelt er mit seinem Team eine App, mit der sich Kita-Betreuerinnen mit Eltern austauschen können, die kein Deutsch sprechen. Wichtig sei dabei, dass der Datenschutz berücksichtigt werde, so Schaffer. „Bei sensiblen Daten, die das eigene Kind betreffen, möchte man vielleicht nicht, dass alles über den großen Teich geschickt wird.“

Heißt: Zu Google und Konsorten, die bereits Apps anbieten, die ganz gute Ergebnisse beim Dolmetschen liefern. Doch: „Google hat für die spezielle Domäne der Kita-Sprache keine optimalen Daten.“ Das Ziel: Zwei Menschen, die die Sprache des Gegenübers nicht verstehen, sollen ihre Botschaft in ein Tablet sprechen. Das Programm verarbeitet die Sprache zu Text und übersetzt in kurzer Zeit. So ist ein Art Dialog möglich. Auf diese Weise funktionieren viele andere Sprach- oder Chatbots. Gesprochene Sprache wird in Text umgewandelt, ehe sie der Computer „verstehen“ kann. „Heute steht und fällt alles mit den Trainingsdaten“, sagt Schaffer. Die müssen nicht nur in ausreichender Menge, sondern auch in guter Qualität verfügbar sein. Das heißt, bei jedem Satzpaar muss – von einem Menschen – geprüft werden, ob die Übersetzung stimmt. Eine Sisyphusarbeit.

Daten sind das Futter, mit dem viele moderne KIs funktionieren. Je mehr Daten es gibt, desto besser. Ein Beispiel: Das chinesische KI-Unternehmen iFlytek veröffentlichte 2017 ein Video, in dem Barack Obama scheinbar perfekt Chinesisch spricht. Wer genau hinsieht, wird bemerken, dass die Lippenbewegungen im Video nicht ganz zum Gesagten passen. Doch mit einer riesigen Datenmenge, Audio- und Videodateien von Obamas Reden, konnte die KI seine Stimme perfekt nachbilden, sodass sie ihm alles hätte in den Mund legen können. Eine Fähigkeit, die im Hinblick auf Fake News zu Denken gibt.

Doch mit der Menge der Daten steigt auch der Aufwand, sie zu verarbeiten. Riesige Server-Farmen und eine immense Rechenleistung sind dafür nötig, dass die KI aus einer Milliarde verschiedener Möglichkeiten die plausibelste auswählt. Das tut zum Beispiel die KI GPT-3 (klingt ausgeschrieben noch sperriger: Generative Pre-trained Transformer 3). Sie sandte eine kleine Schockwelle durch die KI-Welt und sogar darüber hinaus, als das amerikanische Unternehmen Open-AI im Jahr 2020 der Welt eine bis dato unübertroffene Text-KI präsentierte. „Die Daten, die GPT-3 zum Trainieren hatte, war einfach ,das Internet‘. Und das sind viele Daten“, sagt Informatiker Schaffer. Es ist also eine KI, die vereinfacht gesagt das ganze Internet durchgelesen und auswendig gelernt hat. Tippt man ein paar Sätze ein, vervollständigt die KI zu einem sinnvollen Absatz. So geschehen im ersten Absatz dieses Textes.

GPT-3 kann aber auch programmieren, übersetzen, „kreativ“ sein. Etwa Märchen schreiben oder Drehbücher. Die Vorgängerversion, GPT-2 wurde von den Entwicklern seinerzeit als zu gefährlich eingestuft, um der breiten Öffentlichkeit zugänglich gemacht zu werden. Zu vielfältig die Möglichkeiten, mit ihr Schabernack zu treiben. Etwa in Form von Fake News.

Timo Baumann ist Professor an der Ostbayerischen Technischen Hochschule in Regensburg. Er forscht daran, wie Computer Sprachen verarbeiten können und an der Frage, wie Menschen miteinander interagieren und wie sich das auf Computer übertragen lässt. „GPT-3 hat gut zusammengefasst, was die ganze Welt an Text enthält“, sagt Baumann. „Es hat zusammengefasst, was andere Leute sagen. Aber stimmen die Antworten, die man von der KI bekommt? Wenn Texte falsch sind, sind es die Ergebnisse oft auch. Es ist einerseits ein technischer Durchbruch, aber nichts, was unsere Probleme löst.“

Es dauerte nicht lange, da präsentierte die Pekinger Akademie für Künstliche Intelligenz ein Sprachsystem, das noch mehr Textdaten gelernt hat: Wu Dao 2.0 heißt die KI, die sowohl natürlich klingende Texte als auch Bilder basierend auf der sprachlichen Beschreibung eines Menschen generieren kann. Wù dào bedeutet so viel wie „Pfad zur Erleuchtung“.

Kapitel 5: KI und die Zukunft der Bürojobs

Was erhoffen sich Forscherinnen und Forscher, die KI-Systeme entwickeln, die zu immer mehr Menschenähnlichem in der Lage sind? Viele wollen einfach nur ihre Produkte verkaufen. Produkte wie Chatbots oder Sprachassistenten wie Alexa, Siri oder der Google Assistant. Was Produktionsroboter für den Fabrikarbeiter sind, sind wohl in nicht allzu ferner Zukunft Künstliche Intelligenzen für die Millionen Büromenschen. „Wenn ich KI-Systeme entwerfe, dann will ich niemanden arbeitslos machen, aber vielleicht langweilige Aufgaben durch Automatisierung ersetzen“, sagt Baumann. Denkbar wäre eine solche Automatisierung etwa in Callcentern oder in der schriftlichen Kundenkommunikation. Aber nicht nur dort:

Sprache macht den Menschen zum Menschen. Sprache ist das mächtigste Werkzeug, das der Mensch je erschaffen hat. Sie kann die schönsten und die schrecklichsten Dinge schaffen. Ich wünschte, wir würden ihr Potenzial voll ausschöpfen.

Das war ein weiterer Absatz, der teilweise von einer KI geschrieben wurde. Diesmal ist es nur der letzte Satz, der aus der „Feder“ der Text-KI GPT-3 stammt. Die Übertragung aus dem Englischen hat jedoch komplett die KI übernommen. Entwicklungen wie Übersetzungs-KIs haben bereits dafür gesorgt, dass sich die Aufgabe der menschlichen Sprachmittler verändert hat. Manche Aufträge bestehen nunmehr darin, von KIs übersetzte Texte zu korrigieren. Eine nicht minder komplexe Aufgabe, denn in vermeintlich perfekt übersetzen Texten schlummert der Teufel eben im kleinsten Detail, wie der erste Absatz dieses Textes zeigt. Einen einfachen Grammatikfehler ausbügeln – das kann jede Maschine. Doch sehen, ob tatsächlich das vom Autor in der Ausgangssprache gemeinte auch in der Zielsprache angekommen ist: Diese Arbeit ist noch immer menschlich.

Das Nachbearbeiten ist allerdings auch eine wenig kreative Arbeit und könnte den Übersetzerberuf auf lange Sicht unattraktiver machen. In diesem Falle hätte die KI also bislang nicht die langweiligen Aufgaben des Menschen übernommen, sondern erst welche geschaffen. Folgt man Timo Baumann, dann ist das jedoch auch eine Chance. Denn dann könnten sich Übersetzerinnen und Übersetzer mit spannenderen Literaturübersetzungen beschäftigen, anstatt mit langweiligen Rechtstexten oder der Übersetzung einer Konzernbilanz. Das literarische Übersetzen gilt jedoch bereits heute in der Branche als Arbeit von Idealisten. Geistig fordernd und kreativ, aber schlecht bezahlt. Je besser die KI-Systeme in der Sprachfähigkeit werden, desto mehr lästige Arbeit werden sie nicht nur Übersetzern abnehmen. Was daraus folgt, weiß niemand.

Kapitel 6: Wie begegnet man einem Roboter?

„Der erste Grund (warum eine Maschine nie wie ein Mensch sein kann) ist, dass sie niemals Zeichen- oder Lautsprache verwenden kann, um anderen ihre Gedanken mitzuteilen, so wie wir es tun. Denn, man kann zwar eine Maschine bauen, die Laute von sich gibt (…), aber sie kann diese Laute nicht in so mannigfaltiger Weise anordnen, um auf alles zu antworten, was in ihrer Gegenwart gesagt wird, so wie es der dümmste Mensch könnte.“

Das Zitat stammt vom französischen Philosophen René Descartes. In seinem 1637 erschienenen Werk, „Abhandlung über die Methode, seine Vernunft gut zu gebrauchen und die Wahrheit in den Wissenschaften zu suchen“, legt er seine Überzeugung dar, dass allein der Mensch eine Seele besitzen könne. Der Beweis für ihn: die Sprachfähigkeit.

Bundeskanzler Olaf Scholz und Antonio Costa (rechts), Premierminister von Portugal, betrachten einen Roboter mit pneumatischem Antrieb. Foto: Julian Stratenschulte, dpa

Ein Computer, ein Roboter, der spricht wie ein Mensch. Ist das ein sinnvolles oder gar erreichbares Ziel? „Die Frage ist, ob wir einen Computer wollen, der natürlich interagieren und handeln kann oder einen, der rational handelt?“, sagt Baumann. Für ihn ist die menschliche Intelligenz nämlich nicht immer der erstrebenswerte Maßstab: „Wenn es um Rationalität geht, sind wir Menschen irrsinnig schlecht.“ Baumann nennt das Beispiel des Trolley-Gedankenexperiments. Dabei sollen Menschen sagen, was sie tun würden, wären sie in der Situation zu entscheiden, ob ein Zug eher zwei oder drei Menschen überfahren soll. Das Experiment spielt verschiedene Möglichkeiten durch. Mal besteht die eine Gruppe, der vom herannahenden Zug bedrohten aus alten Menschen, die andere aus jungen. „Interessant ist, dass es einen großen Unterschied macht für das Verhalten von Menschen, ob sie aktiv die Weiche umschalten müssen oder sie so belassen“, sagt Baumann. „Wenn sie die Weiche umstellen müssen, haben die Leute die Tendenz gezeigt, lieber drei sterben zu lassen als zwei.“ Dieses Verhalten sei zwar menschlich und damit natürlich, jedoch irrational. „Die Frage ist also, soll der Computer menschlich oder rational handeln? Ich bin da für rational, ehrlich gesagt.“

Und auch bei einer Mensch-Maschine-Interaktion sei es nicht immer wichtig, dass man menschlich kommuniziere. Zwei Beispiele: „In einem Kindergarten wäre es natürlich sinnvoll, einen Roboter einzusetzen, der natürlich interagiert, damit die Kinder lernen, wie man mit anderen umgeht“, sagt Baumann. „Aber wenn ich als Erwachsener eine Information von einem Roboter will, wieso sollte ich höflich zu ihm sein?“

Diskutieren Sie mit

0 Kommentare

Dieser Artikel kann nicht mehr kommentiert werden

Pfingsten: Ich spreche, also bin ich? Die Beziehung zwischen Mensch und Maschine