Khmer – weitere Sprache bei Google Translate

Die 66. Sprache des Online-Übersetzungsdienstes Google Translate wurde die Amtssprache Kambodschas Khmer.

Khmer
– ISO 639-1: kmKhmer: das Sprachgebiet
– Austroasiatische Sprache
– 15,6 Mio. Sprecher
– Kambodscha (Zentral-Khmer), Thailand (Nord-Khmer), Vietnam
– Zahlreiche Übernahmen aus Sanskrit und Pali, insbesondere abstrakte Wörter, Einfluss des Französischen
– Eiheimische Wörter meistens einsilbig
– Kennt keine Deklination oder Konjugation, Wortbildung mit Hilfe von Präfixen, Infixen und Verdoppelungen
– Älteste Inschrift aus dem 7. Jh.
– Vielfältige literarische Tradition: buddhistisches und hinduistisches Schrifttum und Dichtertum, historische königliche Chroniken
– Keine tonale Sprache
– Viele Strukturähnlichkeiten mit dem nicht verwandten Thailändischen, mit dem es mehrere Jahrhunderte koexistierte
– Khmer-Schrift abgeleitet von der indischen Schrift Brahmi


Google Translate ermöglicht die Eingabe von Khmer-Wörtern mit Hilfe von einer virtuellen Tastatur, und führt des Weiteren für diejenigen, die die Khmerschrift nicht beherrschen, eine phonetische Transkription an.

Aus dem Khmer zu übersetzen ist für das System eine Herausforderung: Zum einen stehen im Internet relativ wenige Dokumente für eine Sprachstrukturanalyse zur Verfügung, eine weitere Schwierigkeit besteht in der Erkennung der Wortgrenzen, da sie in dieser Sprache nicht mit Leerzeichen gekennzeichnet sind.