Heast, Google

originally published in Der STANDARD on 23.8.2022

Bezwinger der Sprachbarriere, Wunderkind der neuen Zeit – in Wiener Manier kommt Skepsis auf, denn wir kennen nur ein Wunderkind, und das ziert die Mozartkugel. Kaffeehaus ist ein Lebensgefühl, das kann man nicht übersetzen, oder spricht Google Wienerisch?

Hamlet war nicht der Erste mit einer Identitätskrise. Und trotzdem, seine Selbsterfahrung ist eine der wenigen, die Eingang ins schulische Curriculum gefunden haben. Aus Shakespeares Feder stammt Hamlets philosophische Sinnfrage „Sein oder Nichtsein“, wel-che seither Menschen aus aller Welt beschäftigt. Alle außer die Wiener, auch die fragen nach dem Sinn – aber eben auf Wienerisch: „Wos frogst’n so deppat?“

Sprache vermittelt Identitätsempfinden. Und das ist selten leichter herauszuhören als beim „Mundln“, wo bei einem Reparaturseidl gern das eine oder andere literarische Gustostückerl geteilt wird. Dabei wird schnell klar, dass ein G’mischter Satz nichts mit Germanistik zu tun hat. Obwohl man oft vom Wiener Dialekt spricht, ist Wienerisch aber eigentlich ein Soziolekt, erklärt Computerlinguist Friedrich Neubarth vom Österreichischen Forschungsinstitut für Artificial Intelligence (ÖFAI). Das heißt: Man assoziiert es mit einer bestimmten sozialen Gruppe. Im Gegensatz dazu wird der Dialekt eher mit einer geografischen Region verknüpft, ist also nicht so sehr mit sozialem Prestige behaftet. Wenn das Wienerische also so gut erforscht ist, können es dann auch künstliche Intelligenzen (KIs) übersetzen?

Tippt man im Übersetzer von Google „Hawara“ ein, wird der wienerische Begriff für Kumpel stattdessen aus dem Kurdischen mit „heulen“ übersetzt. Die Schreibweise „Haberer“ übrigens aus dem Lateinischen mit „er hatte“. Die literarische Wiener Wuchtel „Oida“ erkennt der Google-Übersetzer als spanisch, übersetzt mit der Vergangenheitsform von hören „gehört“.

Muster aus Übersetzungen

Die künstliche Intelligenz hinter Google Translate lernt Muster mithilfe von Datensätzen bereits übersetzter Wörter aus dem Inter- net. „Dialekte, die hauptsächlich gesprochen werden und keine einheitliche Orthografie haben, sind da eine Schwierigkeit für Übersetzungssoftwares“, sagt Computerlinguist Neubarth. „Wienerisch auf Deutsch zu übersetzen ist daher nicht trivial, denn man müsste die verschiedenen Schreibweisen erst normalisieren.“ Anhand der misslichen Beispielübersetzungen könnte man also folgern, dass es Google an Daten mangelt, um den Wiener Dialekt ins Hochdeutsche zu übersetzen.

Im Mai 2022 hat der Konzern verkündet, dass seine Übersetzungssoftware 24 neue Sprachen gelernt hat, darunter auch „Sierra Leonean Krio“, einen englischen Dialekt gesprochen von etwa vier Millionen Menschen in Sierra Leone. „Bei der jüngsten Einführung neuer Sprachen für Google Translate haben wir eng mit lokalen Behörden und Gemeinden zusammengearbeitet, um sicherzustellen, dass diese neuen Sprachen korrekt dargestellt werden“, sagt Wolfgang Fasching-Kapfenberger, Pressesprecher bei Google Austria, im Gespräch mit dem STANDARD. Es ist also nicht nur eine Frage des Könnens, sondern auch des Wollens, ob eine KI die notwendigen Daten- sätze zur Verfügung hat, um eine Sprache zu übersetzen. Wobei die allein zahlenmäßig geringere Wichtigkeit des Wienerischen mit jener des Dialekts der westafrikanischen Republik natürlich nicht vergleichbar ist.

Bei der Datengewinnung setzt Google neben Maschinen auch auf Menschen: Mit der Initiative Translate Contribute versucht Google Translate, der Umgangssprache mächtig zu werden, braucht dazu aber die Hilfe der „Weanerinnen“ und „Weaner“ beziehungsweise solcher, die Wienerisch beherrschen. Fasching-Kapfenberger sagt, dass die Genauigkeit der Google-Übersetzungen mittels des Translate-Contribute-Features von Muttersprachlern überprüft und verbessert werden kann. Es sei allerdings schwierig festzustellen, wie häufig Google den freiwilligen Übersetzern umgangssprachliche Ausdrücke offeriert, da die zu übersetzenden Phrasen wiederum aus internetbasierten Datensätzen stammen. Bei einem kleinen Selbstexperiment kamen auf zehn zu übersetzende Phrasen keine Wortgruppen mit Dialekteinschlag.

Künstlicher Intelligenz ist es also möglich, Dialekte zu lernen und zu übersetzen, es ist allerdings kein „Bemmerl“. Das gilt nicht nur für Softwares, sondern auch für Zugereiste, die sich gleichzeitig mit Grant und sprachlichen Eigenheiten auseinandersetzen müssen. Darum bieten die Wiener Volkshochschulen (VHS) auch Kurse zum Wiener Dialekt an. Während an eine Übersetzungssoftware oft der strenge Maßstab der exakten Translation angelegt wird, merkt Nadja Pospisil, Mediensprecherin der VHS, an, dass bestimmte lokale Färbungen nicht zwangsläufig übersetzbar sind, die Beschäftigung mit Dialekten aber ein gegenseitiges Verständnis und letztlich die Lust am Sprechen und Verstehen fördert. Den Wiener Charme und das Identitätsempfinden kann man schwer übersetzen, aber das Interesse, es zu leben und zu lernen, ist groß: „Der Wiener Dialekt erfreut sich großer Beliebtheit, da er durch Wortwitz besticht und viele Menschen mehr über den Ursprung oder die Bedeutung von Formulierungen erfahren wollen“, sagt Pospisil.

Ich versteh nur Wienerisch

Die sprachliche Kompetenz von KI-Syste- men aufzubessern ist im Gegensatz zum Lebensgefühlübersetzen ein Leichte(re)s. Eine Al- ternative zu Googles Übersetzer, spezialisiert auf die Sprachsynthese des Wienerischen, gibt es von der ÖFAI. Die Übersetzungssoftware bietet zudem eine „mundlnde“ Sprachausgabe, die jedoch rein auf Übersetzungen von Hochdeutsch auf Wienerisch beschränkt ist. Unter der Voraussetzung genügender Daten und steigenden Bedarfs könnte auch Google Translate Wienerisch sprechen, es tut es zum jetzigen Zeitpunkt nur noch nicht. Und das ist wahrscheinlich das Wienerischste, das es machen könnte, weil: „Wiasdas mochst, is foisch.“