カスタムモデルへの言語サポート

AutoML Translation モデルは、以下の言語ペアの翻訳に対してサポートされています。サポート対象言語とは、Google がその言語用の既存の NMT(ニューラル機械翻訳)モデルを有し、AutoML Translation がトレーニング中にカスタムモデルを作成するためのベースとして既存の NMT を使用することを意味します。

矢印は、翻訳できるソース言語とターゲット言語を示しています。たとえば、英語からドイツ語、ドイツ語から英語の両方がサポートされています。

言語ペア 言語コード
アフリカーンス語 <-> 英語 af <-> en
アルバニア語 <-> 英語 sq <-> en
アラビア語 <-> 英語 ar <-> en
アゼルバイジャン語 <-> 英語 az <-> en
ベンガル語 <-> 英語 bn <-> en
ブルガリア語 <-> 英語 bg <-> en
カタルーニャ語 <-> 英語 ca <-> en
中国語(簡体)<-> 英語 zh-CN * <-> en
中国語(繁体)<-> 英語 zh-TW <-> en
クロアチア語 <-> 英語 hr <-> en
チェコ語 <-> 英語 cs <-> en
デンマーク語 <-> 英語 da <-> en
オランダ語 <-> 英語 nl <-> en
エストニア語 <-> 英語 et <-> en
フィリピン語 <-> 英語 fil <-> en
フィンランド語 <-> 英語 fi <-> en
フランス語 <-> 英語 fr <-> en
ガリシア語 <-> 英語 gl <-> en
グルジア語 <-> 英語 ka <-> en
ドイツ語 <-> 英語 de <-> en
ギリシャ語 <-> 英語 el <-> en
グジャラト語 <-> 英語 gu <-> en
クレオール語(ハイチ)<-> 英語 ht <-> en
ヘブライ語 <-> 英語 iw <-> en
ヒンディー語 <-> 英語 hi <-> en
ハンガリー語 <-> 英語 hu <-> en
アイスランド語 <-> 英語 is <-> en
インドネシア語 <-> 英語 id <-> en
イタリア語 <-> 英語 it <-> en
日本語 <-> 英語 ja <-> en
ジャワ語 <-> 英語 jv <-> en
クメール語 <-> 英語 km <-> en
韓国語 <-> 英語 ko <-> en
ラトビア語 <-> 英語 lv <-> en
リトアニア語 <-> 英語 lt <-> en
マレー語 <-> 英語 ms <-> en
マラーティー語 <-> 英語 mr <-> en
ミャンマー語(ビルマ語)<-> 英語 my <-> en
ネパール語 <-> 英語 ne <-> en
ノルウェー語 <-> 英語 no <-> en
パシュト語 <-> 英語 ps <-> en
ペルシャ語 <-> 英語 fa <-> en
ポーランド語 <-> 英語 pl <-> en
ポルトガル語 <-> 英語 pt <-> en
パンジャブ語 <-> 英語 pa <-> en
ルーマニア語 <-> 英語 ro <-> en
ロシア語 <-> 英語 ru <-> en
セルビア語 <-> 英語 sr <-> en
スロバキア語 <-> 英語 sk <-> en
スロベニア語 <-> 英語 sl <-> en
スペイン語 <-> 英語 es <-> en
スワヒリ語 <-> 英語 sw <-> en
スウェーデン語 <-> 英語 sv <-> en
タミル語 <-> 英語 ta <-> en
テルグ語 <-> 英語 te <-> en
タイ語 <-> 英語 th <-> en
トルコ語 <-> 英語 tr <-> en
ウクライナ語 <-> 英語 uk <-> en
ウルドゥー語 <-> 英語 ur <-> en
ウズベク語 <-> 英語 uz <-> en
ベトナム語 <-> 英語 vi <-> en
ウェールズ語 <-> 英語 cy <-> en
ズールー語 <-> 英語 zu <-> en

* 簡体字中国語は zh-CN または zh のいずれかで指定できます。

言語のバリエーションでサポートされているコード

前の表でサポートされている言語のバリエーションである以下の言語コードを使用できます。データセットを作成するときに、これらのコードを原文の言語またはターゲット言語として使用できます。

Google では、これらの言語のベース NMT モデルを有していません。代わりに、AutoML Translation では、言語のバリエーションに関連付けられたベースモデルを、カスタムモデルのトレーニングに使用します。

これらのコードを使用すると、たとえば、特定の方言や地域のコンテンツを翻訳する際に便利です。たとえば、カスタムモデルを作成する zh-HK のローカライズしたデータがあるとします。翻訳を行う際には、zh-HK の言語コードを指定できます。そうすることで、カスタムモデルに注意が向くようになり、そのロケールに対してより正確な翻訳が生成されます。

次の表に、AutoML Translation がカスタムモデルをトレーニングするときに使用する言語コード、その説明、関連する基本モデルを示します。

言語コード 説明 ベースモデル
zh-HK 香港(繁体) zh-TW