Direkt zum Hauptbereich

google translate - funktioniert das?

google translate screenshot wir sind es ja gewohnt, dass maschinen uns zu diensten sind. wir nutzen sie ganz selbstverständlich und fragen uns meist nicht, wie sie funktionieren. das ist i.d.r eh zu kompliziert und für den gebrauch nicht von relevanz. höchstens dann, wenn ein ding oder service nicht mehr das tut, was es/ er tun soll, schauen wir genauer hin.

google translate ist den meisten internet-usern wahrscheinlich ein begriff, viele werden diesen dienst schon genutzt haben. über die qualität der übersetzungen lässt sich streiten, selten sind sie perfekt oder wenigstens korrekt - allerdings erschließt sich dem nutzer oft der inhalt und manches mal vielleicht auch der sinn eines übersetzten textes.

nun, ich lehne mich hier mal ein wenig aus dem fenster und behaupte, dass es nie gelingen wird, texte korrekt von künstlichen intelligenzen (ki) übersetzen zu lassen ... ich lehne mich ein wenig zurück und behaupte, dass es nicht in diesem jahrhundert gelingen wird.

der obige absatz ist ein gutes beispiel, um das problem zu umreißen. sie werden den inhalt und den damit verknüpften sinn sicher verstanden haben. eine ki wird das nie können - sie wird nie verstehen können, weder vordergründige noch zwischen den zeilen oder sich hinter aphorismen versteckende inhalte. doch wer nicht versteht, wird nicht korrekt in eine andere sprache übersetzen können - je größer die kulturellen unterschiede zwischen ausgangs- und zielsprache, desto schwieriger ist der übersetzungsprozess.

aber selbst dann, wenn sich zwei muttersprachler ein und derselben sprache unterhalten, kommt es zu missverständnissen, die aus unterschiedlichen interpretationen des gesprochenen resultieren. wenn ich ihnen z.b. das wort "maus" nenne, dann denken sie vielleicht eher an die computermaus als an das kleine felltier, meine 75-jährige nachbarin wird aber mit sicherheit letzteres damit verbinden. der grund hierfür ist natürlich in der tatsache zu finden, dass wir uns wenigstens teile des edv-fachjargons angeeignet und diese in unsere alltagssprache integriert haben. fachsprache aus anderen bereichen, z.b. der medizin, verstehen wir dagegen nicht oder nur zum geringen teil, sofern wir nicht damit vertraut sind.

zusammengefasst bedeutet dies, dass eine korrekte übersetzung neben dem erforderlichen vokabular, eines zumindest rudimenteren verständnis' des kontextes und der mit den sprachen verbundenen kulturellen eigenheiten bedarf.

kehren wir zurück zu unserem beispiel-satz und lassen ihn von google ins eglische übersetzen:

nun, ich lehne mich hier mal ein wenig aus dem fenster und behaupte, dass es nie gelingen wird, texte korrekt von künstlichen intelligenzen (ki) übersetzen zu lassen ... ich lehne mich ein wenig zurück und behaupte, dass es nicht in diesem jahrhundert gelingen wird.

google macht daraus:

Now, here I lean a little bit out of the window and say that it will never succeed texts, correctly of artificial intelligence (AI) to translate ... I lean back a bit and say that it will not succeed in this century.

und zurück ins deutsche:

Nun, hier bin schlank ein wenig aus dem Fenster und sage, dass es nie gelingen, Texte, richtig von künstlicher Intelligenz (AI) zu übersetzen ... Ich lehne mich etwas zurück und sagen, dass es nicht in diesem Jahrhundert erfolgreich zu sein.

immerhin ist google bei der groß- und kleinschreibung besser als ich ;-) - nun, ich denke obiges beispiel veranschaulicht recht gut, mit welchen problemen die ki in puncto übersetzung zu kämpfen hat - und das bei zwei sprachen, die sich rel. nahe stehen. versuchen sie selbiges experiment doch mal mit hebräisch...

die funktionsweise von google translate

lange zeit hat man versucht, der ki grammatikalische regeln und entsprechende zusammenhänge beizubringen, um ihr so ein verständnis des aufbaus der zu übersetzenden texte zu vermitteln. das hat nie wirklich funktioniert, weil die regeln sehr komplex sind aber vor allem die ausnahmen von diesen regeln bislang jedes system in die knie zwang. hinzu kommt, dass sich sprache und der damit verbundene sprachliche kontext ständig verändert. google geht deshalb einen anderen weg.

google verfügt über eine immense ressource: den annähernd gesamten datenbestand, der via internet abrufbar ist sowie viele anderen dokumente, beispielsweise aus google books. google nutzt nun diese daten, um zu lernen, wie wir - sie und ich, also internet-user und -autoren - texte übersetzen. das bedeutet, dass google der eigenen ki nicht die regeln beizubringen versucht, nach denen sätze gebildet und richtig übersetz werden, sondern anhand der vorhandenen enormen datenbestände die ergebnisse früherer menschlicher übersetzungsprozesse verwendet. die übersetzung via google ist also nicht algorithmen- sondern datenbasiert. google kann diesen weg gehen, weil - wie bereits erwähnt - erstens der zugriff auf sehr große datenmengen möglich ist und zweitens eine global verteilte infrastruktur enormer rechenleistung diese datenmassen in quasi echtzeit auswerten kann.

interessant in diesem zusammenhang ist auch dieses interview mit peter norvig. und folgendes video aus dem hause goolge klärt in gewohnt spielerischer manier über die funktionsweise von google translate auf. beides kommt übrigens in englisch - aber sie können es sich ja übersetzen lassen ;-)

Kommentare

Kommentar veröffentlichen