Google Übersetzer & Co

In diesem zweiteiligen Blog-Artikel gehen wir der Frage nach, warum es einfacher ist, wissenschaftliche Texte zu übersetzen, als sie Korrektur zu lesen.

Wenn Sie als Autor schon einmal in der Situation waren, dass einer Ihrer Aufsätze übersetzt werden musste, kommt Ihnen vielleicht folgende Überlegung bekannt vor: „Wäre es nicht zeitsparender und einfacher für alle, wenn ich meinen Aufsatz erst einmal von Google Übersetzer verarbeiten ließe? Dann müsste ich ihn anschließend nur noch Korrektur lesen lassen.”

Dieses Verfahren hat vordergründig betrachtet in der Tat einige Vorteile:

  • Korrekturlesen erfordert normalerweise weniger Zeit als das Übersetzen. Wenn Ihr Abgabetermin also sehr knapp ist, würden Sie einen bis zwei Tage gewinnen, in denen Sie Ihrem Aufsatz den letzten Schliff geben könnten.
  • Korrekturlesen ist normalerweise preiswerter als Übersetzen. Bei einem knappen Budget kann es auch preislich attraktiver erscheinen, den ganzen Aufsatz nur Korrektur lesen und nicht erst übersetzen zu lassen.
  • Und wenn die Technologie heute schon so leistungsfähig ist – was spricht dagegen, sie auch zu nutzen?
  • Zeit ist für uns alle kostbar. Warum sollten Sie also die Zeit des Übersetzers verschwenden, indem Sie ihn einen ganzen Aufsatz übersetzen lassen, wenn Sie ihm genauso gut einen maschinell übersetzten Text  geben könnten, den er nur noch Korrektur lesen muss?

All diese Argumente lassen sich nicht pauschal von der Hand weisen. Aber in dem nun folgenden zweiteiligen Beitrag möchten wir Ihnen aufzeigen, warum die sogenannte maschinelle Übersetzung (also Google Übersetzer & Co.) bei wissenschaftlichen Texten ein völlig sinnloses Unterfangen ist und dass sie am Ende sogar allen Beteiligten mehr Arbeit machen kann, als sie erspart. Im ersten Teil werden wir die Funktionsweise von Google Übersetzer, des beliebtesten derzeit existierenden Werkzeugs für die maschinelle Übersetzung, beleuchten. Anschließend werden wir ein konkretes Problem betrachten, das sich gerade bei wissenschaftlichen Texten auf der Ebene der einzelnen Wörter stellt. Im zweiten Teil dieses Blogbeitrags werden uns mit Fragen der Satzstruktur und insbesondere mit der Frage beschäftigen, wie ein Text durch maschinelle Übersetzung so verworren werden kann, dass er sich anschließend kaum noch fehlerfrei Korrektur lesen lässt.

Alle Wege führen über das Englische

Zunächst stellen wir Ihnen einen Begriff vor. Er wirft ein erstes Schlaglicht auf den Unterschied zwischen dem Korrektorat eines Textes, der von einem menschlichen Übersetzer erstellt wurde, und dem Korrektorat eines maschinell übersetzten Textes. Das Überarbeiten eines maschinell übersetzten Textes nämlich wird in der Übersetzungsbranche nicht als „Korrektorat“ oder „Korrekturlesen“ bezeichnet. Sondern als „Post-Editing“. Damit wird auch dem Laien deutlich gemacht, dass es sich bei diesem Vorgang um etwas grundsätzlich so Verschiedenes handelt, dass es eine andere Bezeichnung verdient. Der Korrektor richtet sein Augenmerk oftmals auf Schreib- oder Tippfehler, auf die Konsistenz der Terminologie oder auf stilistische Belange. Beim Post-Editing hingegen muss der Bearbeiter vielfach mit Annahmen über die Intentionen des Quelltextes arbeiten, falls dieser uneindeutig oder komplett unklar ist.

Woran aber liegt es, dass ein maschinell übersetzter Text mehrdeutiger oder unklarer sein kann als eine von Menschen angefertigte Übersetzung? Für die Antwort hierauf werden wir uns anschauen, wie – zumindest in einem zentralen Punkt – das weltweit am häufigsten eingesetzte Übersetzungs-Tool vorgeht. Dabei wird sichtbar werden, warum dieses Tool möglicherweise hervorragend zum Übersetzen jener E-Mail geeignet ist, in der Sie einem britischen oder französischen Kollegen schreiben, dass Sie ein bestimmtes Konferenzhotel buchen möchten, dass das Tool aber kläglich vor der Aufgabe versagt, Ihren nächsten Zeitschriftenaufsatz zu übersetzen.

Wenn Sie Google Übersetzer Ihren Text anvertrauen, greift die Software für die Übersetzung auf statistische Verfahren zurück und prüft alle ihr zur Verfügung stehenden übersetzten Dokumente darauf, ob sie für ein Element in der Ausgangssprache eine optimal geeignete Entsprechung in der Zielsprache enthalten. In der Theorie klingt das gut. Es funktioniert auch bei einfachen Sätzen noch ganz passabel, vor allem wenn eine der beteiligten Sprachen das Englische ist. Sehen wir uns deshalb an, was passiert, wenn wir eine relativ einfache, auf Deutsch verfasste E-Mail zu dem erwähnten Thema von Google Übersetzer ins Englische und Französische übertragen lassen.

Deutsch Englisch Französisch
Lieber John,

ich schaue gerade nach Hotels in Amsterdam. Hast du schon ein Zimmer reserviert? Das Konferenzhotel ist mir zu teuer – es wäre schön, wenn wir im selben Hotel wären, dann könnten wir zusammen hinfahren.

 

Viele Grüße

Max

Dear John,

I just look for hotels in Amsterdam. Have you made a reservation? The conference hotel is too expensive – it would be nice if we were in the same hotel, we could go together.

 

Best wishes,

Max

 

Dear John,

Je regarde juste pour hôtels à Amsterdam. Avez-vous fait une réservation? Cet hôtel de conférence est trop cher – ce serait bien si nous étions dans le même hôtel, nous pourrions aller ensemble.

 

Meilleures salutations,

Max

 

Die englische Fassung ist gar nicht so schlecht. Im ersten Satz wird zwar das Simple Present („I just look for …“) statt des üblichen Present Progressive („I am looking for”) oder Present Perfect Progressive („I’ve been looking for …“) verwendet, aber die Aussage ist klar und der britische Kollege dürfte keine Probleme haben, diese E-Mail zu verstehen.

Jetzt schauen wir uns an, was bei der Übersetzung ins Französische passiert. Das Hauptproblem liegt im zweiten Satz. Hier heißt es im Deutschen: „Hast du schon ein Zimmer reserviert?” Der deutsche Schreiber verwendet also die informelle Du-Anrede. Im Französischen wird daraus das formelle „Avez-vous“, das jedoch einem Gegenüber vorbehalten ist, den man eben nicht mit Vornamen anredet. Wie kommt Google Übersetzer auf diese Lösung? Der Grund ist einfach: Beim Übersetzen innerhalb eines Sprachenpaars, an dem Englisch nicht beteiligt ist, übersetzt Google Übersetzer zunächst ins Englische und erst dann in die eigentliche Zielsprache (also hier Deutsch -> Englisch -> Französisch). Da aber das englische „you“ zweideutig ist und sowohl „tu“ als auch „vous“ bedeuten kann, muss Google Übersetzer sich für eine Möglichkeit entscheiden. Und wählt prompt die falsche. Man stelle sich denselben Mechanismus in einem größeren, abstrakteren Maßstab vor: Ein eindeutiges deutsches Wort wird durch ein mehrdeutiges englisches Wort ersetzt und dieses wird dann in ein drittes Wort in der gewünschten Zielsprache (hier Französisch) übersetzt. Es eröffnet sich ein erhebliches Potenzial für sprachliche Missgriffe. Doch auch wenn Englisch zum Sprachenpaar der Übersetzung dazugehört, muss die Maschine ständig Entscheidungen zum Satzbau und zu einzelnen Wörtern treffen. Als Nächstes werden wir das Sprachenpaar Deutsch-Englisch und speziell die Probleme betrachten, die sich beim Übersetzen wissenschaftlicher Texte stellen.

Verschärfung des Problems bei wissenschaftlichen Texten: Fachbegriffe

Im wissenschaftlichen Kontext verdient ein weiterer Punkt der Funktionsweise von Google Übersetzer unsere Aufmerksamkeit: Die Software stützt ihre Entscheidungen auf statistische Häufigkeiten. Viele wissenschaftliche Texte zeichnen sich aber gerade durch eine Fachsprache aus, die von Experten verstanden wird, die aber in der Alltagskommunikation ungebräuchlich ist. Ein einfaches Beispiel auf der Wortebene mag genügen – das deutsche Wort „Gestalt“. Es bedeutet in der Alltagssprache so etwas wie die sichtbare Erscheinung oder Form von etwas und kann im Englischen mit „figure“ oder „shape“ wiedergegeben werden. So übersetzt Google Übersetzer „Gestalt“ in dem Satz „Hast du die Gestalt gesehen?” denn auch korrekt mit „figure“. Im Kontext der Psychologie allerdings ist „Gestalt“ ein Fachbegriff, der im Englischen unübersetzt bleibt, beispielsweise in „gestalt psychology“. Der fachsprachliche Satz:

„Es werden bevorzugt Gestalten wahrgenommen, die in einer einprägsamen (Prägnanztendenz) und einfachen Struktur (= ‚Gute Gestalt’) resultieren.“[1]

wird von Google Übersetzer wie folgt ins Englische gebracht:

„Preference is given to figures which result in a memorable (preeminence tendency) and simple structure (‚good figure’).“

Bekommt nun ein Korrektor diesen englischen Satz zur Prüfung, könnte er sich aufgrund des Fachkontextes fragen, ob mit „figure“ vielleicht beide Male „Gestalt“ gemeint ist. Hierfür kommt es allerdings darauf an, wie gut er das Fach kennt und ob er weiß, dass „Gestalt“ in seiner Alltagsbedeutung normalerweise im Englischen mit „figure“ übersetzt wird. Es ist aber auch möglich, dass der Korrektor das Fehlen des Fachterminus an dieser Stelle gar nicht bemerkt oder dass er annimmt, der Autor habe das Wort „figure“ statt „gestalt“ im Englischen mit Absicht gewählt. Auf diese Weise könnten aus dem Zieltext unbemerkt Fachbegriffe verschwinden. Ein Rezensent könnte dann dem Autor ankreiden, er kenne sich offensichtlich im Fach nicht gut genug aus, um dessen korrekte Terminologie zu verwenden. Hätte jedoch der Autor von vornherein Wert darauf gelegt, dass sein Aufsatz von einem professionellen Übersetzer mit Erfahrung im Fach Psychologie übersetzt wird, wäre das Risiko einer Fehlübersetzung von „Gestalt“ gegen Null gegangen. Die beschriebenen Probleme entstehen aber nur dann, wenn ein Korrektor einen schlecht übersetzten Text erhält, in dem die Fachbegriffe unklar oder als solche nicht mehr zu erkennen sind.

Mit diesem ersten Teil  haben wir Ihnen, so hoffen wir, eine Vorstellung von der Funktionsweise der maschinellen Übersetzung vermittelt und die Schwierigkeiten aufgezeigt, die vor allem beim Übersetzen zwischen zwei Sprachen auftreten, zu denen das Englische nicht gehört. Wir haben außerdem begründet, warum unserer Ansicht nach die auf statistische Häufigkeiten gestützte maschinelle Übersetzung besonders ungeeignet ist für wissenschaftliche Texte, in denen Begriffe häufig mit einer anderen Bedeutung als in der Alltagskommunikation verwendet werden. Im zweiten Teil dieses Beitrags werden wir Satzstrukturen analysieren, wie sie Google Übersetzer erzeugt. Hiervon ausgehend werden wir fragen, inwieweit auch ein Text, der einem Post-Editing unterzogen wurde, auf der Bedeutungsebene von dem abweichen kann, was im Originaltext intendiert war.

[1] Wikipedia-Artikel „Gestaltpsychologie“. Letzter Zugriff: 24. November 2016, https://de.wikipedia.org/wiki/Gestaltpsychologie

Sie fanden diesen Beitrag interessant? Hier können Sie ihn mit Ihren KollegInnen teilen:

After you have typed in some text, hit ENTER to start searching...