AutoML Translation モデルは、以下の言語ペアの翻訳に対してサポートされています。サポート対象言語とは、Google がその言語用の既存の NMT(ニューラル機械翻訳)モデルを有し、AutoML Translation がトレーニング中にカスタムモデルを作成するためのベースとして既存の NMT を使用することを意味します。
矢印は、翻訳できるソース言語とターゲット言語を示しています。たとえば、英語からドイツ語、ドイツ語から英語の両方がサポートされています。
言語ペア | 言語コード |
---|---|
アフリカーンス語 <-> 英語 | af <-> en |
アルバニア語 <-> 英語 | sq <-> en |
アラビア語 <-> 英語 | ar <-> en |
アゼルバイジャン語 <-> 英語 | az <-> en |
ベンガル語 <-> 英語 | bn <-> en |
ブルガリア語 <-> 英語 | bg <-> en |
カタルーニャ語 <-> 英語 | ca <-> en |
中国語(簡体)<-> 英語 | zh-CN * <-> en |
中国語(繁体)<-> 英語 | zh-TW <-> en |
クロアチア語 <-> 英語 | hr <-> en |
チェコ語 <-> 英語 | cs <-> en |
デンマーク語 <-> 英語 | da <-> en |
オランダ語 <-> 英語 | nl <-> en |
エストニア語 <-> 英語 | et <-> en |
フィリピン語 <-> 英語 | fil <-> en |
フィンランド語 <-> 英語 | fi <-> en |
フランス語 <-> 英語 | fr <-> en |
ガリシア語 <-> 英語 | gl <-> en |
グルジア語 <-> 英語 | ka <-> en |
ドイツ語 <-> 英語 | de <-> en |
ギリシャ語 <-> 英語 | el <-> en |
グジャラト語 <-> 英語 | gu <-> en |
クレオール語(ハイチ)<-> 英語 | ht <-> en |
ヘブライ語 <-> 英語 | iw <-> en |
ヒンディー語 <-> 英語 | hi <-> en |
ハンガリー語 <-> 英語 | hu <-> en |
アイスランド語 <-> 英語 | is <-> en |
インドネシア語 <-> 英語 | id <-> en |
イタリア語 <-> 英語 | it <-> en |
日本語 <-> 英語 | ja <-> en |
ジャワ語 <-> 英語 | jv <-> en |
クメール語 <-> 英語 | km <-> en |
韓国語 <-> 英語 | ko <-> en |
ラトビア語 <-> 英語 | lv <-> en |
リトアニア語 <-> 英語 | lt <-> en |
マレー語 <-> 英語 | ms <-> en |
マラーティー語 <-> 英語 | mr <-> en |
ミャンマー語(ビルマ語)<-> 英語 | my <-> en |
ネパール語 <-> 英語 | ne <-> en |
ノルウェー語 <-> 英語 | no <-> en |
パシュト語 <-> 英語 | ps <-> en |
ペルシャ語 <-> 英語 | fa <-> en |
ポーランド語 <-> 英語 | pl <-> en |
ポルトガル語 <-> 英語 | pt <-> en |
パンジャブ語 <-> 英語 | pa <-> en |
ルーマニア語 <-> 英語 | ro <-> en |
ロシア語 <-> 英語 | ru <-> en |
セルビア語 <-> 英語 | sr <-> en |
スロバキア語 <-> 英語 | sk <-> en |
スロベニア語 <-> 英語 | sl <-> en |
スペイン語 <-> 英語 | es <-> en |
スワヒリ語 <-> 英語 | sw <-> en |
スウェーデン語 <-> 英語 | sv <-> en |
タミル語 <-> 英語 | ta <-> en |
テルグ語 <-> 英語 | te <-> en |
タイ語 <-> 英語 | th <-> en |
トルコ語 <-> 英語 | tr <-> en |
ウクライナ語 <-> 英語 | uk <-> en |
ウルドゥー語 <-> 英語 | ur <-> en |
ウズベク語 <-> 英語 | uz <-> en |
ベトナム語 <-> 英語 | vi <-> en |
ウェールズ語 <-> 英語 | cy <-> en |
ズールー語 <-> 英語 | zu <-> en |
* 簡体字中国語は zh-CN
または zh
のいずれかで指定できます。
言語のバリエーションでサポートされているコード
前の表でサポートされている言語のバリエーションである以下の言語コードを使用できます。データセットを作成するときに、これらのコードを原文の言語またはターゲット言語として使用できます。
Google では、これらの言語のベース NMT モデルを有していません。代わりに、AutoML Translation では、言語のバリエーションに関連付けられたベースモデルを、カスタムモデルのトレーニングに使用します。
これらのコードを使用すると、たとえば、特定の方言や地域のコンテンツを翻訳する際に便利です。たとえば、カスタムモデルを作成する zh-HK
のローカライズしたデータがあるとします。翻訳を行う際には、zh-HK
の言語コードを指定できます。そうすることで、カスタムモデルに注意が向くようになり、そのロケールに対してより正確な翻訳が生成されます。
次の表に、AutoML Translation がカスタムモデルをトレーニングするときに使用する言語コード、その説明、関連する基本モデルを示します。
言語コード | 説明 | ベースモデル |
---|---|---|
zh-HK |
香港(繁体) | zh-TW |