Qgelm

Maschinelle Übersetzer: DeepL macht Google Translate Konkurrenz

Originalartikel

Backup

<html> <div class=„meldung_wrapper druckversion“>

          <!-- RSPEAK_STOP -->
  
      
          
      
      
  
  <!-- RSPEAK_STOP -->
  <figure class="aufmacherbild"><img src="https://1.f.ix.de/scale/geometry/695/q75/imgs/18/2/2/6/6/8/7/0/Bildschirmfoto_von__2017-08-28_14-53-08_-5c0e3248351fdec0.png"/><figcaption><p class="caption">An dieser &#220;bersetzung haben wir nichts auszusetzen.</p>
          </figcaption></figure><!-- RSPEAK_START --><!-- RSPEAK_START --><p class="meldung_anrisstext"><strong>Linguee hei&#223;t jetzt DeepL und geht mit einem neuen maschinellen &#220;bersetzer auf den Markt. Der basiert auf tiefen Convolutional Networks und d&#252;rfte effizienter &#252;bersetzen als Google Translate, das rekurrente Netze einsetzt.</strong></p>
          <p>Das Startup DeepL (ehemals Linguee) ist am Montag mit seinem maschinellen &#220;bersetzer online gegangen. <b>Die kostenlose Webseite &#252;bersetzt in Echtzeit sieben Sprachen [1]</b> und konkurriert damit mit <b>Google Translate, das aber 103 Sprachen beherrscht [2]</b>.</p>

<p>Linguee bot bisher eine Suchmaschine f&#252;r &#220;bersetzungen an, mit der die jetzt umbenannte Firma die n&#246;tigen Trainingsdaten f&#252;r ihren &#220;bersetzungsdienst gesammelt hat. In einem Blindtest sollen Nutzer die &#220;bersetzungen von DeepL drei Mal h&#228;ufiger als beste &#220;bersetzung gew&#228;hlt haben als die der Konkurrenz von <b>Google [3]</b>, <b>Microsoft [4]</b> und Facebook. Im direkten Vergleich produziert der neue &#220;bersetzer tats&#228;chlich &#220;bersetzungen auf gleichem Niveau - er macht aber auch &#228;hnliche Fehler.</p> <h2>Convolutional Network statt RNN</h2> <p>Im Gegensatz zu Google Translate setzt DeepL nicht auf rekurrente neuronale Netze. Stattdessen kommen Convolutional Networks zum Einsatz, wie sie bei der Bilderkennung &#252;blich sind. Der Vorteil davon: Convolutional Networks verarbeiten alle W&#246;rter parallel und es gibt bereits hoch optimierte Bibliotheken f&#252;r die Berechnung.</p> <p>DeepL will die genaue Struktur seiner neuronalen Netze nicht offen legen, verwies aber auf Nachfrage von heise online auf <b>ein Paper von Facebook [5]</b> und <b>ein Paper von Googles Forschungsabteilung [6]</b>, die auch gute Ergebnisse beim maschinellen &#220;bersetzen mit Convolutional Networks erzielt haben.</p> <p> <!– RSPEAK_STOP –>

	<img src="https://1.f.ix.de/imgs/18/2/2/6/6/8/7/0/Bildschirmfoto_von__2017-08-28_14-56-39_-ee5e2a1539676b6c.png" width="316" height="400" alt="Gehring et al" data-zoom-src="/imgs/18/2/2/6/6/8/7/0/Bildschirmfoto_von__2017-08-28_14-56-39_-dd86de746f4a8cb6.png"/><br/>
	
		Facebooks Forschungsgruppe kombiniert Convolution, GLUs und Attention. DeepL nutzt nach eigenen Angaben eine &#228;hnliche Technik.
	


	<br/>
	Bild: <b>Gehring et al [7]</b> 


<!-- RSPEAK_START -->

</p> <p>Bei nat&#252;rlicher Sprache h&#228;ngt die Bedeutung von W&#246;rtern vom Kontext des Satzes ab, in dem sie genannt werden. Rekurrente neuronale Netze lesen den ganzen Satz von vorne nach hinten (und oft zus&#228;tzlich von hinten nach vorne) und speichern in ihrem Internen Zustand Informationen, um W&#246;rter im richtigen Kontext zu &#252;bersetzen.</p> <p>Die Convolutional Networks imitieren diese Struktur &#252;ber Residual-Verbindungen und viele Schichten. Dabei entsteht eine sehr &#228;hnliche Struktur, die sich nur darin unterscheidet, dass die Convolutional Networks eine feste Menge von Eingaben ber&#252;cksichtigen, w&#228;hrend rekurrente Netze theoretisch mit beliebig langen Eingaben rechnen k&#246;nnen. In der Praxis f&#228;llt diese Beschr&#228;nkung aber wohl nicht stark ins Gewicht; der Geschwindigkeitsvorteil durch die M&#246;glichkeit einer parallelen Berechnung &#252;berwiegt.</p> <p>Wirklich besser werden die Convolutional Networks aber erst durch einen Aufmerksamkeits-Mechanismus, der auf mehreren Ebenen gleichzeitig wirken kann. Google Translate nutzt auch einen Aufmerksamkeits-Mechanismus, allerdings nur an der Schnittstelle zwischen Encoder- und Decoder-Netzwerk, um sicherzustellen, dass sich die Bedeutung aller W&#246;rter des Ursprungssatzes auch im &#252;bersetzten Satz findet. Einen solchen Mechanismus auf verschiedenen Ebenen gleichzeitig einzusetzen erlaubt den Netzwerken einzelne Aspekte der Wortbedeutung genauer zu extrahieren - zumindest folgern das die Forscher aus den besseren BLEU-Scores.</p> <h2>Beam-Search</h2> <p>Neuronale Netze erzeugen selten direkt eine bestimmte Ausgabe. Stattdessen berechnen sie &#252;blicherweise eine Ausgabe in Format einer Wahrscheinlichkeitsverteilung &#252;ber alle m&#246;glichen Ausgaben. Statt f&#252;r jedes Wort des &#252;bersetzen Satzes immer das wahrscheinlichste n&#228;chste Wort zu w&#228;hlen setzt DeepL einen Beam-Search-Algorithmus ein. Der Algorithmus multipliziert die Wahrscheinlichkeiten f&#252;r alle m&#246;glichen S&#228;tze, w&#228;hlt aber in jedem Schritt nur eine kleine Gruppe wahrscheinlicher S&#228;tze aus, die er um ein Wort verl&#228;ngert. Das versetzt das System in die Lage auch mal ein leicht unwahrscheinlicheres Wort zu w&#228;hlen, falls dadurch der gesamte Rest des Satzes besser passt.</p> <p>Vermutlich enth&#228;lt das von DeepL trainierte System keine v&#246;llig neue Technik. Die Kombination aus Convolutional Netzwork, Aufmerksamkeit und Beam Search entspricht aber dem Stand neuester Forschungsergebnisse. Damit d&#252;rfte DeepL zumindest bei der Effizienz einen Vorteil gegen&#252;ber der aktuell eingesetzten Version von Google Translate haben. Schade nur, dass DeepL sein System nicht so freigiebig erkl&#228;rt wie die Konkurrenz.<!– AUTHOR-DATA-MARKER-BEGIN –>

<!– RSPEAK_STOP –> (<b>jme [8]</b>) <br class=„clear“/><!– RSPEAK_START –><!– AUTHOR-DATA-MARKER-END –></p>

      </div><hr/><p class="size80">
          <strong>URL dieses Artikels:</strong><br/>
          https://www.heise.de/newsticker/meldung/Maschinelle-Uebersetzer-DeepL-macht-Google-Translate-Konkurrenz-3813882.html
      </p>
          <p class="size80">
              <strong>Links in diesem Artikel:</strong><br/>
                  &#160;&#160;[1]&#160;https://www.deepl.com/translate<br/>
                  &#160;&#160;[2]&#160;https://www.heise.de/newsticker/meldung/Google-Translate-KI-uebersetzt-dank-selbst-erlernter-Sprache-3502351.html<br/>
                  &#160;&#160;[3]&#160;https://translate.google.de/<br/>
                  &#160;&#160;[4]&#160;https://www.bing.com/translator<br/>
                  &#160;&#160;[5]&#160;https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequence-learning.pdf<br/>
                  &#160;&#160;[6]&#160;https://arxiv.org/pdf/1706.03762.pdf<br/>
                  &#160;&#160;[7]&#160;https://s3.amazonaws.com/fairseq/papers/convolutional-sequence-to-sequence-learning.pdf<br/>
                  &#160;&#160;[8]&#160;mailto:jme@heise.de<br/></p>

</html>

Cookies helfen bei der Bereitstellung von Inhalten. Diese Website verwendet Cookies. Mit der Nutzung der Website erklären Sie sich damit einverstanden, dass Cookies auf Ihrem Computer gespeichert werden. Außerdem bestätigen Sie, dass Sie unsere Datenschutzerklärung gelesen und verstanden haben. Wenn Sie nicht einverstanden sind, verlassen Sie die Website.Weitere Information