Startseite
Icon Pfeil nach unten
Bayern
Icon Pfeil nach unten

LMU-Studie: KI kann keine bayerischen Dialekte – Mundarten Schwäbisch, Fränkisch und Bairisch zu schwer

Bayern

Ja sappralott! KI kann keine bayerischen Dialekte – auch kein Schwäbisch

  • |
  • |
  • |
  • |
    Eine Studie der Ludwig-Maximilians-Universität München bestätigt, dass Künstliche Intelligenzen nicht mit bayerischen Dialekten zurechtkommen.
    Eine Studie der Ludwig-Maximilians-Universität München bestätigt, dass Künstliche Intelligenzen nicht mit bayerischen Dialekten zurechtkommen. Foto: picture alliance, dpa (Symbolbild)

    „Bevor i mi aufreg, isch mr ’s liebr egal!“ - das sagt der Schwabe, um sich Nerven zu sparen. Eine neue Studie der Ludwig-Maximilians-Universität München (LMU) kann diesen Satz durchaus in den Schwaben auslösen. Die Forscher fanden heraus, dass künstliche Sprachprogramme nicht mit bayerischen Dialekten zurechtkommen.

    LMU-Studie: Projekt zur Spracherkennung durch KI

    Die Forschung ist ein gemeinsames Projekt des Zentrums für Informations- und Sprachverarbeitung der LMU und des Bayerischen Rundfunks (BR). Alle Daten, die in die Künstlichen Intelligenzen (KI) eingespeist wurden, stammen aus der Sendung „Betthupferl“ des BR. Die Gute-Nacht-Geschichten werden am Wochenende in den unterschiedlichen Mundarten des Sendegebiets ausgestrahlt. Teil der Forschung waren alle drei Dialektgruppen Bayerns:

    • Schwäbisch
    • Fränkisch: Unterfränkisch, Mittelfränkisch, Oberfränkisch
    • Bairisch: Oberbairisch, Niederbairisch, Oberpfälzisch

    Die Sprachmodelle erhielten den Auftrag, die Sendungen zu transkribieren, also das Gesprochene in Geschriebenes umzuwandeln. Um zu überprüfen, wie die Modelle mit den Dialekten umgehen, wurden zusätzlich Proben mit hochdeutschen Aufnahmen durchgeführt.

    München: Künstliche Intelligenz kann nicht mit bayerischen Dialekten umgehen

    Das Projekt wurde mit drei unterschiedlichen Sprachmodellfamilien durchgeführt. Ein Teil davon war unter anderem Whisper von OpenAI, den Entwicklern der bekannten Chat-KI ChatGPT. Whisper zeigte unter anderem gute Ergebnisse bei der Verarbeitung von Aufnahmen in Schweizerdeutsch, so die Forscher der LMU.

    In Sachen Dialekt braucht die KI Nachhilfe.
    In Sachen Dialekt braucht die KI Nachhilfe. Foto: Daniel Karmann, dpa (Symbolbild)

    Das Ergebnis: Die KIs machen bei der Verarbeitung der Aufnahmen, die im Dialekt gesprochen wurden, deutlich mehr Fehler beim Transkribieren als bei hochdeutschen Aufnahmen. In einer Mitteilung des BR zu dem Projekt heißt es, dass oft der Sinn des im Dialekt gesprochenen Satzes verloren gehe.

    KI kann keinen Dialekt: Wie es weitergeht

    Die Ergebnisse des Forschungsprojekts wurden erst kürzlich auf der Interspeech-Fachkonferenz vorgestellt. Die Konferenz fand Anfang dieser Woche in Rotterdam, Niederlande, statt.

    Das Projekt zeigt, dass künstliche Sprachmodelle noch nicht ausreichend mit Daten, die im Dialekt gesprochen werden, trainiert worden sind. Um die Ergebnisse zu verbessern, müssen die Modelle mit mehr Daten trainiert werden. In Zukunft können KI-Programme dann dabei helfen, in Dialekt gesprochene Sendungen zu untertiteln, so der BR in seiner Mitteilung.

    Diskutieren Sie mit
    XXX 0 Kommentare
    hier kommen komentare rein

    Um kommentieren zu können, müssen Sie angemeldet sein.

    Anmelden

    Sie haben noch kein Konto? Kostenfrei registrieren