LMU-Studie: KI kann keine bayerischen Dialekte – Mundarten Schwäbisch, Fränkisch und Bairisch zu schwer

Bayern

Ja sappralott! KI kann keine bayerischen Dialekte – auch kein Schwäbisch

In Bayern gibt es rund 60 verschiedene Dialekte. Sie sind ein echtes bayerisches Kulturgut. Eine Studie zeigt nun aber: Die KI kommt nicht damit klar.

Von Julia Mondry |

24.08.25, 07:59 Uhr

Eine Studie der Ludwig-Maximilians-Universität München bestätigt, dass Künstliche Intelligenzen nicht mit bayerischen Dialekten zurechtkommen. Foto: picture alliance, dpa (Symbolbild)

„Bevor i mi aufreg, isch mr ’s liebr egal!“ - das sagt der Schwabe, um sich Nerven zu sparen. Eine neue Studie der Ludwig-Maximilians-Universität München (LMU) kann diesen Satz durchaus in den Schwaben auslösen. Die Forscher fanden heraus, dass künstliche Sprachprogramme nicht mit bayerischen Dialekten zurechtkommen.

LMU-Studie: Projekt zur Spracherkennung durch KI

Die Forschung ist ein gemeinsames Projekt des Zentrums für Informations- und Sprachverarbeitung der LMU und des Bayerischen Rundfunks (BR). Alle Daten, die in die Künstlichen Intelligenzen (KI) eingespeist wurden, stammen aus der Sendung „Betthupferl“ des BR. Die Gute-Nacht-Geschichten werden am Wochenende in den unterschiedlichen Mundarten des Sendegebiets ausgestrahlt. Teil der Forschung waren alle drei Dialektgruppen Bayerns:

Schwäbisch
Fränkisch: Unterfränkisch, Mittelfränkisch, Oberfränkisch
Bairisch: Oberbairisch, Niederbairisch, Oberpfälzisch

Die Sprachmodelle erhielten den Auftrag, die Sendungen zu transkribieren, also das Gesprochene in Geschriebenes umzuwandeln. Um zu überprüfen, wie die Modelle mit den Dialekten umgehen, wurden zusätzlich Proben mit hochdeutschen Aufnahmen durchgeführt.

München: Künstliche Intelligenz kann nicht mit bayerischen Dialekten umgehen

Das Projekt wurde mit drei unterschiedlichen Sprachmodellfamilien durchgeführt. Ein Teil davon war unter anderem Whisper von OpenAI, den Entwicklern der bekannten Chat-KI ChatGPT. Whisper zeigte unter anderem gute Ergebnisse bei der Verarbeitung von Aufnahmen in Schweizerdeutsch, so die Forscher der LMU.

In Sachen Dialekt braucht die KI Nachhilfe. Foto: Daniel Karmann, dpa (Symbolbild)

Das Ergebnis: Die KIs machen bei der Verarbeitung der Aufnahmen, die im Dialekt gesprochen wurden, deutlich mehr Fehler beim Transkribieren als bei hochdeutschen Aufnahmen. In einer Mitteilung des BR zu dem Projekt heißt es, dass oft der Sinn des im Dialekt gesprochenen Satzes verloren gehe.

KI kann keinen Dialekt: Wie es weitergeht

Die Ergebnisse des Forschungsprojekts wurden erst kürzlich auf der Interspeech-Fachkonferenz vorgestellt. Die Konferenz fand Anfang dieser Woche in Rotterdam, Niederlande, statt.

Das Projekt zeigt, dass künstliche Sprachmodelle noch nicht ausreichend mit Daten, die im Dialekt gesprochen werden, trainiert worden sind. Um die Ergebnisse zu verbessern, müssen die Modelle mit mehr Daten trainiert werden. In Zukunft können KI-Programme dann dabei helfen, in Dialekt gesprochene Sendungen zu untertiteln, so der BR in seiner Mitteilung.

Diskutieren Sie mit

XXX 0 Kommentare

hier kommen komentare rein

Um kommentieren zu können, müssen Sie angemeldet sein.

Anmelden

Sie haben noch kein Konto? Kostenfrei registrieren