„Bevor i mi aufreg, isch mr ’s liebr egal!“ - das sagt der Schwabe, um sich Nerven zu sparen. Eine neue Studie der Ludwig-Maximilians-Universität München (LMU) kann diesen Satz durchaus in den Schwaben auslösen. Die Forscher fanden heraus, dass künstliche Sprachprogramme nicht mit bayerischen Dialekten zurechtkommen.
LMU-Studie: Projekt zur Spracherkennung durch KI
Die Forschung ist ein gemeinsames Projekt des Zentrums für Informations- und Sprachverarbeitung der LMU und des Bayerischen Rundfunks (BR). Alle Daten, die in die Künstlichen Intelligenzen (KI) eingespeist wurden, stammen aus der Sendung „Betthupferl“ des BR. Die Gute-Nacht-Geschichten werden am Wochenende in den unterschiedlichen Mundarten des Sendegebiets ausgestrahlt. Teil der Forschung waren alle drei Dialektgruppen Bayerns:
- Schwäbisch
- Fränkisch: Unterfränkisch, Mittelfränkisch, Oberfränkisch
- Bairisch: Oberbairisch, Niederbairisch, Oberpfälzisch
Die Sprachmodelle erhielten den Auftrag, die Sendungen zu transkribieren, also das Gesprochene in Geschriebenes umzuwandeln. Um zu überprüfen, wie die Modelle mit den Dialekten umgehen, wurden zusätzlich Proben mit hochdeutschen Aufnahmen durchgeführt.
München: Künstliche Intelligenz kann nicht mit bayerischen Dialekten umgehen
Das Projekt wurde mit drei unterschiedlichen Sprachmodellfamilien durchgeführt. Ein Teil davon war unter anderem Whisper von OpenAI, den Entwicklern der bekannten Chat-KI ChatGPT. Whisper zeigte unter anderem gute Ergebnisse bei der Verarbeitung von Aufnahmen in Schweizerdeutsch, so die Forscher der LMU.
Das Ergebnis: Die KIs machen bei der Verarbeitung der Aufnahmen, die im Dialekt gesprochen wurden, deutlich mehr Fehler beim Transkribieren als bei hochdeutschen Aufnahmen. In einer Mitteilung des BR zu dem Projekt heißt es, dass oft der Sinn des im Dialekt gesprochenen Satzes verloren gehe.
KI kann keinen Dialekt: Wie es weitergeht
Die Ergebnisse des Forschungsprojekts wurden erst kürzlich auf der Interspeech-Fachkonferenz vorgestellt. Die Konferenz fand Anfang dieser Woche in Rotterdam, Niederlande, statt.
Das Projekt zeigt, dass künstliche Sprachmodelle noch nicht ausreichend mit Daten, die im Dialekt gesprochen werden, trainiert worden sind. Um die Ergebnisse zu verbessern, müssen die Modelle mit mehr Daten trainiert werden. In Zukunft können KI-Programme dann dabei helfen, in Dialekt gesprochene Sendungen zu untertiteln, so der BR in seiner Mitteilung.
Um kommentieren zu können, müssen Sie angemeldet sein.
AnmeldenSie haben noch kein Konto? Kostenfrei registrieren