Sprachunterstützung für benutzerdefinierte Modelle

AutoML Translation-Modelle werden für die folgenden Sprachenpaare unterstützt. Eine unterstützte Sprache bedeutet, dass Google über ein bestehendes Modell für neuronale maschinelle Übersetzung (Transmfeld) verfügt, das AutoML Translation als Basis zum Erstellen eines benutzerdefinierten Modells während des Trainings verwendet.

Die Pfeile geben an, welche Quell- und Zielsprachen für die Übersetzung unterstützt werden. Zum Beispiel wird die Übersetzung vom Englischen ins Deutsche und vom Deutschen ins Englische unterstützt.

Sprachenpaar Sprachcodes
Afrikaans <-> Englisch af <-> en
Albanisch <-> Englisch sq <-> en
Arabisch <-> Englisch ar <-> en
Aserbaidschanisch <-> Englisch az <-> en
Bengalisch <-> Englisch bn <-> en
Bulgarisch <-> Englisch bg <-> en
Katalanisch <-> Englisch ca <-> en
Chinesisch (vereinfacht) <-> Englisch zh-CN* <-> en
Chinesisch (traditionell) <-> Englisch zh-TW <-> en
Kroatisch <-> Englisch hr <-> en
Tschechisch <-> Englisch cs <-> en
Dänisch <-> Englisch da <-> en
Niederländisch <-> Englisch nl <-> en
Estnisch <-> Englisch et <-> en
Finnisch <-> Englisch fi <-> en
Französisch <-> Englisch fr <-> en
Galizisch <-> Englisch gl <-> en
Georgisch <-> Englisch ka <-> en
Deutsch <-> Englisch de <-> en
Griechisch <-> Englisch el <-> en
Gujarati <-> Englisch gu <-> en
Haitianisches Kreolisch <-> Englisch ht <-> en
Hebräisch <-> Englisch iw <-> en
Hindi <-> Englisch hi <-> en
Ungarisch <-> Englisch hu <-> en
Isländisch <-> Englisch is <-> en
Indonesisch <-> Englisch id <-> en
Italienisch <-> Englisch it <-> en
Japanisch <-> Englisch ja <-> en
Koreanisch <-> Englisch ko <-> en
Lettisch <-> Englisch lv <-> en
Litauisch <-> Englisch lt <-> en
Malaiisch <-> Englisch ms <-> en
Marathi <-> Englisch mr <-> en
Norwegisch <-> Englisch no <-> en
Persisch <-> Englisch fa <-> en
Polnisch <-> Englisch pl <-> en
Portugiesisch <-> Englisch pt <-> en
Punjabi <-> Englisch pa <-> en
Rumänisch <-> Englisch ro <-> en
Russisch <-> Englisch ru <-> en
Serbisch <-> Englisch sr <-> en
Slowakisch <-> Englisch sk <-> en
Slowenisch <-> Englisch sl <-> en
Spanisch <-> Englisch es <-> en
Swahili <-> Englisch sw <-> en
Schwedisch <-> Englisch sv <-> en
Thai <-> Englisch th <-> en
Türkisch <-> Englisch tr <-> en
Ukrainisch <-> Englisch uk <-> en
Urdu <-> Englisch ur <-> en
Vietnamesisch <-> Englisch vi <-> en
Walisisch <-> Englisch cy <-> en

* Chinesisch (vereinfacht) kann entweder durch zh-CN oder durch zh angegeben werden.

Unterstützte Codes für Sprachvarianten

Sie können die folgenden Sprachcodes verwenden, bei denen es sich um Varianten der in der vorherigen Tabelle unterstützten Sprachen handelt. Sie können diese Codes beim Erstellen von Datasets als Quell- oder Zielsprache verwenden.

Google verfügt über keine Basis-VM-Modelle für diese Sprachen. Stattdessen verwendet AutoML Translation das mit der Sprachvariante verknüpfte Basismodell zum Trainieren benutzerdefinierter Modelle.

Die Verwendung dieser Codes ist beispielsweise nützlich, wenn Sie Inhalte für einen bestimmten Dialekt oder eine bestimmte Region übersetzen. Angenommen, Sie haben lokalisierte Daten für zh-HK gespeichert, für die Sie ein benutzerdefiniertes Modell erstellen. Für Übersetzungen können Sie den Sprachcode zh-HK angeben, der auf Ihr benutzerdefiniertes Modell verweist, um genauere Übersetzungen für diese Sprache zu erstellen.

In der folgenden Tabelle sind die Sprachcodes, ihre Beschreibungen und die zugehörigen Basismodelle aufgeführt, die AutoML Translation beim Trainieren benutzerdefinierter Modelle verwendet.

Sprachcode Beschreibung Basismodell
zh-HK Hongkong (traditionell) zh-TW