Maschinelle Übersetzer: DeepL macht Google Translate Konkurrenz

Originalartikel

Backup

<html> <div class=„meldung_wrapper druckversion“>

          <!-- RSPEAK_STOP -->
  
      
          
      
      
  
  <!-- RSPEAK_STOP -->
  <figure class="aufmacherbild"><img src="https://1.f.ix.de/scale/geometry/695/q75/imgs/18/2/2/6/6/8/7/0/Bildschirmfoto_von__2017-08-28_14-53-08_-5c0e3248351fdec0.png"/><figcaption><p class="caption">An dieser &#220;bersetzung haben wir nichts auszusetzen.</p>
          </figcaption></figure><!-- RSPEAK_START --><!-- RSPEAK_START --><p class="meldung_anrisstext"><strong>Linguee hei&#223;t jetzt DeepL und geht mit einem neuen maschinellen &#220;bersetzer auf den Markt. Der basiert auf tiefen Convolutional Networks und d&#252;rfte effizienter &#252;bersetzen als Google Translate, das rekurrente Netze einsetzt.</strong></p>
          <p>Das Startup DeepL (ehemals Linguee) ist am Montag mit seinem maschinellen &#220;bersetzer online gegangen. <b>Die kostenlose Webseite &#252;bersetzt in Echtzeit sieben Sprachen [1]</b> und konkurriert damit mit <b>Google Translate, das aber 103 Sprachen beherrscht [2]</b>.</p>

<p>Linguee bot bisher eine Suchmaschine f&#252;r &#220;bersetzungen an, mit der die jetzt umbenannte Firma die n&#246;tigen Trainingsdaten f&#252;r ihren &#220;bersetzungsdienst gesammelt hat. In einem Blindtest sollen Nutzer die &#220;bersetzungen von DeepL drei Mal h&#228;ufiger als beste &#220;bersetzung gew&#228;hlt haben als die der Konkurrenz von <b>Google [3]</b>, <b>Microsoft [4]</b> und Facebook. Im direkten Vergleich produziert der neue &#220;bersetzer tats&#228;chlich &#220;bersetzungen auf gleichem Niveau - er macht aber auch &#228;hnliche Fehler.</p> <h2>Convolutional Network statt RNN</h2> <p>Im Gegensatz zu Google Translate setzt DeepL nicht auf rekurrente neuronale Netze. Stattdessen kommen Convolutional Networks zum Einsatz, wie sie bei der Bilderkennung &#252;blich sind. Der Vorteil davon: Convolutional Networks verarbeiten alle W&#246;rter parallel und es gibt bereits hoch optimierte Bibliotheken f&#252;r die Berechnung.</p> <p>DeepL will die genaue Struktur seiner neuronalen Netze nicht offen legen, verwies aber auf Nachfrage von heise online auf <b>ein Paper von Facebook [5]</b> und <b>ein Paper von Googles Forschungsabteilung [6]</b>, die auch gute Ergebnisse beim maschinellen &#220;bersetzen mit Convolutional Networks erzielt haben.</p> <p> <!– RSPEAK_STOP –>

	<img src="https://1.f.ix.de/imgs/18/2/2/6/6/8/7/0/Bildschirmfoto_von__2017-08-28_14-56-39_-ee5e2a1539676b6c.png" width="316" height="400" alt="Gehring et al" data-zoom-src="/imgs/18/2/2/6/6/8/7/0/Bildschirmfoto_von__2017-08-28_14-56-39_-dd86de746f4a8cb6.png"/><br/>
	
		Facebooks Forschungsgruppe kombiniert Convolution, GLUs und Attention. DeepL nutzt nach eigenen Angaben eine &#228;hnliche Technik.
	


	<br/>
	Bild: <b>Gehring et al [7]</b> 


<!-- RSPEAK_START -->

</p> <p>Bei nat&#252;rlicher Sprache h&#228;ngt die Bedeutung von W&#246;rtern vom Kontext des Satzes ab, in dem sie genannt werden. Rekurrente neuronale Netze lesen den ganzen Satz von vorne nach hinten (und oft zus&#228;tzlich von hinten nach vorne) und speichern in ihrem Internen Zustand Informationen, um W&#246;rter im richtigen Kontext zu &#252;bersetzen.</p> <p>Die Convolutional Networks imitieren diese Struktur &#252;ber Residual-Verbindungen und viele Schichten. Dabei entsteht eine sehr &#228;hnliche Struktur, die sich nur darin unterscheidet, dass die Convolutional Networks eine feste Menge von Eingaben ber&#252;cksichtigen, w&#228;hrend rekurrente Netze theoretisch mit beliebig langen Eingaben rechnen k&#246;nnen. In der Praxis f&#228;llt diese Beschr&#228;nkung aber wohl nicht stark ins Gewicht; der Geschwindigkeitsvorteil durch die M&#246;glichkeit einer parallelen Berechnung &#252;berwiegt.</p> <p>Wirklich besser werden die Convolutional Networks aber erst durch einen Aufmerksamkeits-Mechanismus, der auf mehreren Ebenen gleichzeitig wirken kann. Google Translate nutzt auch einen Aufmerksamkeits-Mechanismus, allerdings nur an der Schnittstelle zwischen Encoder- und Decoder-Netzwerk, um sicherzustellen, dass sich die Bedeutung aller W&#246;rter des Ursprungssatzes auch im &#252;bersetzten Satz findet. Einen solchen Mechanismus auf verschiedenen Ebenen gleichzeitig einzusetzen erlaubt den Netzwerken einzelne Aspekte der Wortbedeutung genauer zu extrahieren - zumindest folgern das die Forscher aus den besseren BLEU-Scores.</p> <h2>Beam-Search</h2> <p>Neuronale Netze erzeugen selten direkt eine bestimmte Ausgabe. Stattdessen berechnen sie &#252;blicherweise eine Ausgabe in Format einer Wahrscheinlichkeitsverteilung &#252;ber alle m&#246;glichen Ausgaben. Statt f&#252;r jedes Wort des &#252;bersetzen Satzes immer das wahrscheinlichste n&#228;chste Wort zu w&#228;hlen setzt DeepL einen Beam-Search-Algorithmus ein. Der Algorithmus multipliziert die Wahrscheinlichkeiten f&#252;r alle m&#246;glichen S&#228;tze, w&#228;hlt aber in jedem Schritt nur eine kleine Gruppe wahrscheinlicher S&#228;tze aus, die er um ein Wort verl&#228;ngert. Das versetzt das System in die Lage auch mal ein leicht unwahrscheinlicheres Wort zu w&#228;hlen, falls dadurch der gesamte Rest des Satzes besser passt.</p> <p>Vermutlich enth&#228;lt das von DeepL trainierte System keine v&#246;llig neue Technik. Die Kombination aus Convolutional Netzwork, Aufmerksamkeit und Beam Search entspricht aber dem Stand neuester Forschungsergebnisse. Damit d&#252;rfte DeepL zumindest bei der Effizienz einen Vorteil gegen&#252;ber der aktuell eingesetzten Version von Google Translate haben. Schade nur, dass DeepL sein System nicht so freigiebig erkl&#228;rt wie die Konkurrenz.<!– AUTHOR-DATA-MARKER-BEGIN –>

<!– RSPEAK_STOP –> (<b>jme [8]</b>) <br class=„clear“/><!– RSPEAK_START –><!– AUTHOR-DATA-MARKER-END –></p>

      </div><hr/><p class="size80">
          <strong>URL dieses Artikels:</strong><br/>
          https://www.heise.de/newsticker/meldung/Maschinelle-Uebersetzer-DeepL-macht-Google-Translate-Konkurrenz-3813882.html
      </p>
          <p class="size80">
              <strong>Links in diesem Artikel:</strong><br/>
                  &#160;&#160;[1]&#160;https://www.deepl.com/translate<br/>
                  &#160;&#160;[2]&#160;https://www.heise.de/newsticker/meldung/Google-Translate-KI-uebersetzt-dank-selbst-erlernter-Sprache-3502351.html<br/>
                  &#160;&#160;[3]&#160;https://translate.google.de/<br/>
                  &#160;&#160;[4]&#160;https://www.bing.com/translator<br/>
                  &#160;&#160;[5]&#160;https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequence-learning.pdf<br/>
                  &#160;&#160;[6]&#160;https://arxiv.org/pdf/1706.03762.pdf<br/>
                  &#160;&#160;[7]&#160;https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequence-learning.pdf<br/>
                  &#160;&#160;[8]&#160;mailto:jme@heise.de<br/></p>

</html>