Fünf neue Sprachen bei Google Translate: Armenisch, Aserbaidschanisch, Baskisch, Georgisch, Urdu

Armenisch, Aserbaidschanisch, Baskisch, Georgisch und Urdu sind die neuesten Sprachen im Portfolio der Online-Übersetzungsmaschine Google Translate. Neben dem europäischen Baskischen werden alle anderen Sprachen in Asien gesprochen und haben zusammen um die 100 Millionen Sprecher. Die Gesamtanzahl der aktuell bei Google Translate angebotenen Sprachen erreicht damit 57.

Grundfakten über die neuen Sprachen

Armenisch

– Sprachcode ISO 639-1: hy (Hajeren)
– Selbstständiger Zweig der indoeuropäischen Sprachen
– Ca. 6,5 Mio. Sprecher, davon über 3 Mio. in Armenien
– Ostarmenisch – Amtssprache in Armenien, Minderheiten in Iran; Westarmenisch – Sprache der Minderheiten in der Türkei, im Libanon, Irak, in Syrien usw.
– Agglutinierende Sprache mit 6 bzw. 7 grammatischen Fällen, Genus wird nicht unterschieden
– Keine Längenunterscheidung der Vokale
– Wortschatz beeinflusst vom Persischen, Griechischen, von kaukasischen Sprachen, dem Französischen und Russischen
– 5.–11. Jahrhundert älteste Literaturdenkmäler (Grabar – heute Kirchensprache)
– Im 19. Jh. entsteht die neuere Schriftsprache Aschcharhabar.
– Gestaltung der armenischen Schrift im Jahr 405–406, seit dem 12. Jh. auf 39 Zeichen erweitert
– 1922–1924 Rechtschreibreform (nur in Armenien)

Aserbaidschanisch

– Sprachcode ISO 639-1: az (Aseri)
– Oghusischer Zweig der Turksprachen
– Nördliche Varietät – 7,5 Mio. Sprecher in Aserbaidschan (Nationalsprache mit 6,1 Mio., davon 4 Mio. monolingualen Sprechern), Iran, Minderheiten in Armenien und Georgien, 8 Mio. Sprecher als Zweitsprache; südliche Varietät – 12,6 Mio. Sprecher, hauptsächlich im Iran (11,2 Mio.)
– Einfluss des Persischen, Arabischen, Mongolischen, Russischen
– Vokalharmonie
– Älteste Texte aus dem 14. Jh., damals noch als Türkisch bezeichnet – einheitliche Sprache des Osmanischen Reiches, 15.–16. Jh. Abspaltung, Einfluss des Tschagataischen
– Bis zur 1. Hälfte des 19. Jh. Bestandteil von Persien – Zweisprachigkeit der schreib- und lesekundigen Aserbaidschaner, danach moderne Poesie
– Vor dem Jahr 1917 Lingua franca in Transkaukasien
– Heutige (nördliche) Schriftsprache basiert auf der Sprache der Kulturmitarbeiter in Baku Anfang des 20. Jahrhunderts, dialektübergreifend, ohne Osmanismen
– 1923 – in der nördlichen Varietät arabische durch lateinische Schrift ersetzt, seit dem Ende der 30er Jahre in der kyrillischen Schrift geschrieben, seit dem Jahr 1991 Wiedereinführung der lateinischen Schrift; südliche Varietät in lateinischer Schrift oder arabischer Schrift (Irak) bzw. kyrillischer Schrift (Afghanistan) geschrieben.

Baskisch

– Sprachcode ISO 639-1: eu (Euskara)
– Isolierte Sprache unbekannter Herkunft
– 660 Tsd. Sprecher in Spanien (lokale Amtssprache in der Autonomen Gemeinschaft Baskenland) und Frankreich (Department Pyrénées-Atlantiques), 2,7 Mio. Personen baskischstämmiger ethnischer Herkunft
– Agglutinierende Sprache, keine Genusunterscheidung
– Zahlen im Vigesimalsystem
– Phonetische Orthografie in lateinischer Schrift
– Laute vom Spanischen bzw. Französischen beeinflusst, Entlehnungen im Wortschatz aus dem Lateinischen, Arabischen, aus romanischen und keltischen Sprachen
– Erste schriftliche Aufzeichnung aus dem 11. Jh., älteste Literaturdenkmäler aus dem 16. Jh.
– 1587 – erste Grammatik
– Bis zum 19. Jh. überwiegend religiöse Texte
– 1919 – Akademie der baskischen Sprache gegründet, 1968 Standardisierung der Sprache (Euskara Batua)

Georgisch

– Sprachcode ISO 639-1: ka (Kartuli ena)
– Südlicher Zweig der kaukasischen Sprachen
– Über 4 Mio. Sprecher, absolute Mehrheit lebt in Georgien, des Weiteren in Aserbaidschan, Minderheiten im Iran und in der Türkei
– Agglutinierende Sprache
– Wortbildung durch Zusammensetzung und Ableitung, Übernahmen aus dem Griechischen, Armenischen, Arabischen, Persischen, Russischen, aus europäischen Sprachen
– Zahlen im Vigesimalsystem
– Die heutige von links nach rechts geschriebene phonologische Schrift Mchedruli mit 33 Buchstaben stabilisierte sich im 18. Jh., knüpft an eine ältere Schrift an, die im 5. Jh. eingeführt wurde. Großbuchstaben werden in der Regel nicht verwendet.
– 5.–12. Jh. altgeorgische Schriftsprache – umfangreiche Literatur, Höhepunkt Rustavelis Heldenepos
– Seit dem 12. Jh. Neugeorgisch – hauptsächlich weltliche Literatur
– 19. Jh. – Entstehung der heutigen Form des Georgischen

Urdu

– Sprachcode ISO 639-1: ur (Urdu)
– Indoarische Sprache, „poetischere“ Variante des Hindustanischen (Soziolekte Urdu und Hindi)
– 10,7 Mio. Muttersprachler in Pakistan (Amtssprache), 104 Mio. Pakistani sprechen Urdu als Nationalsprache; insgesamt 60,6 Mio. Muttersprachler weltweit, davon 48 Mio. in Indien (Amtssprache in 6 Bundesstaaten)
– Starker Einfluss des Persischen und Arabischen, Entlehnungen aus dem Portugiesischen
– Wird in angepasster arabischer Schrift geschrieben
– Literaturdenkmäler seit dem 14. Jh.
– 1952 – Demonstration von Bengalen gegen Urdu als die einzige Amtssprache Pakistans

Alle 5 Sprachen sind noch in der Alpha-Version und können nur in der englischen Version von Google Translate ausgewählt werden. Vor einigen Tagen wurde außerdem die Funktion Text-to-speech (Sprachausgabe der Übersetzung) auf insgesamt 34 Sprachen von Google Translate erweitert.