Sprachunterstützung für benutzerdefinierte Modelle

AutoML Translation-Modelle werden für die folgenden Sprachenpaare unterstützt. Wird eine Sprache unterstützt, bietet Google dafür ein NMÜ-Modell (neuronale maschinelle Übersetzung). Dieses Modell wird von AutoML Translation beim Training als Basis für das Erstellen eines benutzerdefinierten Modells verwendet.

Die Pfeile geben an, welche Quell- und Zielsprachen für die Übersetzung unterstützt werden. Zum Beispiel wird die Übersetzung vom Englischen ins Deutsche und vom Deutschen ins Englische unterstützt.

Sprachenpaar Sprachcodes
Afrikaans <-> Englisch af <-> en
Albanisch <-> Englisch sq <-> en
Arabisch <-> Englisch ar <-> en
Aserbaidschanisch <-> Englisch az <-> en
Bengalisch <-> Englisch bn <-> en
Bulgarisch <-> Englisch bg <-> en
Katalanisch <-> Englisch ca <-> en
Chinesisch (vereinfacht) <-> Englisch zh-CN* <-> en
Chinesisch (traditionell) <-> Englisch zh-TW <-> en
Kroatisch <-> Englisch hr <-> en
Tschechisch <-> Englisch cs <-> en
Dänisch <-> Englisch da <-> en
Niederländisch <-> Englisch nl <-> en
Estnisch <-> Englisch et <-> en
Philippinisch <-> Englisch fil <-> en
Finnisch <-> Englisch fi <-> en
Französisch <-> Englisch fr <-> en
Galizisch <-> Englisch gl <-> en
Georgisch <-> Englisch ka <-> en
Deutsch <-> Englisch de <-> en
Griechisch <-> Englisch el <-> en
Gujarati <-> Englisch gu <-> en
Haitianisches Kreolisch <-> Englisch ht <-> en
Hebräisch <-> Englisch iw <-> en
Hindi <-> Englisch hi <-> en
Ungarisch <-> Englisch hu <-> en
Isländisch <-> Englisch is <-> en
Indonesisch <-> Englisch id <-> en
Italienisch <-> Englisch it <-> en
Japanisch <-> Englisch ja <-> en
Javanisch <-> Englisch jv <-> en
Khmer <-> Englisch km <-> en
Koreanisch <-> Englisch ko <-> en
Lettisch <-> Englisch lv <-> en
Litauisch <-> Englisch lt <-> en
Malaiisch <-> Englisch ms <-> en
Marathi <-> Englisch mr <-> en
Myanmar (Birmanisch) <-> Englisch my <-> en
Nepali <-> Englisch ne <-> en
Norwegisch <-> Englisch no <-> en
Paschtunisch <-> Englisch ps <-> en
Persisch <-> Englisch fa <-> en
Polnisch <-> Englisch pl <-> en
Portugiesisch <-> Englisch pt <-> en
Punjabi <-> Englisch pa <-> en
Rumänisch <-> Englisch ro <-> en
Russisch <-> Englisch ru <-> en
Serbisch <-> Englisch sr <-> en
Slowakisch <-> Englisch sk <-> en
Slowenisch <-> Englisch sl <-> en
Spanisch <-> Englisch es <-> en
Swahili <-> Englisch sw <-> en
Schwedisch <-> Englisch sv <-> en
Tamilisch <-> Englisch ta <-> en
Telugu <-> Englisch te <-> en
Thai <-> Englisch th <-> en
Türkisch <-> Englisch tr <-> en
Ukrainisch <-> Englisch uk <-> en
Urdu <-> Englisch ur <-> en
Usbekisch <-> Englisch uz <-> en
Vietnamesisch <-> Englisch vi <-> en
Walisisch <-> Englisch cy <-> en
Zulu <-> Englisch zu <-> en

* Chinesisch (vereinfacht) kann entweder durch zh-CN oder zh angegeben werden.

Unterstützte Codes für Sprachvarianten

Für Übersetzungen stehen die weiter unten aufgeführten Sprachcodes zur Verfügung. Diese sind Varianten der in der vorherigen Tabelle unterstützten Sprachen. Sie können diese Codes beim Erstellen von Datasets als Quell- oder Zielsprache verwenden.

Google bietet für diese Sprachen keine NMÜ-Basismodelle. Stattdessen verwendet AutoML Translation zum Trainieren benutzerdefinierte Modelle das zugehörige Basismodell der Sprachvariante.

Die Verwendung dieser Codes ist beispielsweise hilfreich, wenn Sie Inhalte für einen bestimmten Dialekt oder eine bestimmte Region übersetzen. Angenommen, Sie haben lokalisierte Daten für zh-HK, für die Sie ein benutzerdefiniertes Modell erstellen. Für Übersetzungen können Sie den Sprachcode zh-HK angeben, der auf Ihr benutzerdefiniertes Modell verweist und exaktere Übersetzungen für diese Sprache liefert.

In der folgenden Tabelle sind die Sprachcodes, eine entsprechende Beschreibung und das jeweils zugehörige Basismodell aufgeführt, das AutoML Translation beim Trainieren benutzerdefinierter Modelle verwendet.

Sprachcode Beschreibung Basismodell
zh-HK Hongkong (traditionell) zh-TW