分野固有の用語や名前付きエンティティを一貫して翻訳する必要がある場合は、用語集を作成します。用語集は、複数の言語に対応する用語を含むカスタム辞書です。機械翻訳中に、Translation Hub は一致するソース言語の用語を関連するターゲット言語の用語に自動的に置き換えます。
用語集を使用すると、特定の用語やエンティティによる翻訳方法を細かく調整できます。たとえば、用語集のエントリを含めると、プロダクト名(「Google Home」など)が翻訳されないようにできます。
用語集を作成したら、その用語集をポータルに追加して、ポータル ユーザーが使用できるようにします。
用語集と他の翻訳リソースの比較
用語集以外にも、ポータル ユーザーの翻訳に役立つリソースが用意されています。次のセクションでは、各リソースの違いについて説明します。
- 翻訳メモリはセグメントで一致しますが、用語集は用語で一致します。翻訳メモリを使用して、インポートした、ポストエディット中に取得した、または両方による人間がレビューした翻訳を再利用します。翻訳メモリには、必要な数のセグメントペアを必要な数だけ含めることができます。
- カスタムモデルは、センテンスのペアを使用してトレーニングされ、包括的な用語集や翻訳メモリがない場合でも、機械翻訳を改善するのに役立ちます。特定の分野や文章のスタイルに合わせて機械翻訳を調整する場合は、AutoML Translation を使用して、より適合する予測を生成するカスタムモデルを構築します。
ポータル ユーザーは、これらのリソースを組み合わせて使用することで、翻訳の質を向上させることができます。Translation Hub が翻訳中にリソースを適用する方法の詳細については、ドキュメントの翻訳をご覧ください。
ストップ語
Translation Hub では、用語集に含まれている用語が無視されます。これらの用語をストップ語と呼びます。Translation Hub はストップ語の翻訳を行いますが、一致する用語集のエントリを無視します。すべてのストップ語のリストについては、用語集のストップ語をご覧ください。
始める前に
用語集を作成するには、対応する言語の用語を含むファイルが必要です。ソースファイルの形式は、作成する用語集のタイプ、単一方向または多言語用語セットによって異なります。
用語集エントリでは大文字と小文字が区別されます。大文字と小文字を区別しないエントリの場合は、用語集に両方の形式を含めてください。
単一方向
単一方向の用語集では、用語の翻訳をソース言語とターゲット言語のペアとして指定します。これらの用語集は一方向に機能します。たとえば、英語からスペイン語への単一方向の用語集は、スペイン語から英語への翻訳には適用されません。
TSV(タブ区切り値)、CSV(カンマ区切り値)、TMX(Translation Memory eXchange)ファイルを指定できます。TSV ファイルと CSV ファイルの場合、ソース言語とターゲット言語を識別するヘッダー行を含めないでください。これらは、用語集を作成するときに指定します。TMX ファイルの場合は、TMX バージョン 1.4 標準を使用します。
用語集の詳細と例については、Cloud Translation ドキュメントの用語集の作成と使用をご覧ください。
多言語の用語セット
多言語の用語セットには、複数の言語での多言語の用語セットがあり、CSV ファイルで定義する必要があります。各行には、さまざまな言語の対応する用語が含まれています。これらの用語集は双方向です。ヘッダー行では、対応する言語コードによって各列の言語を識別する必要があります。
用語集の詳細と例については、Cloud Translation ドキュメントの用語集の作成と使用をご覧ください。
用語集の制限事項
Translation Hub では、ソースファイルのサイズと各用語集エントリのサイズに上限が設定されています。詳細については、割り当てと上限をご覧ください。
用語集を作成
用語集は、Google Cloud コンソールを使用して作成します。以前に Cloud Translation API を使用してリソースを作成したことがある場合は、Translation Hub によりそのリソースが利用可能になります。これらのリソースをポータルに割り当てることができます。
Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。
[Add resource] をクリックします。
[リソースを追加] ペインで、[用語集] タブを選択します。
用語集の名前を指定します。
用語集の種類を選択します。
ローカルの用語集ファイルを Cloud Storage にアップロードするか、Cloud Storage から既存の用語集ファイルを選択します。
用語集の言語を指定します。
[追加] をクリックして用語集を作成します。
ポータルに用語集を追加する
用語集を作成したら、ポータル ユーザーが翻訳をリクエストする際にその用語集を使用できるように、ポータルに追加します。
Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。
リソースのリストから、1 つ以上のポータルに追加する用語集を 1 つ以上選択します。
[Assign to Portal] をクリックすると、[Assign resource to Portal] ペインが開きます。
[ポータル] フィールドで、用語集を追加する 1 つ以上のポータルを選択します。
[割り当て] をクリックします。
[リソース] ページで、各リソースの [ポータル名] 列を表示して、追加を確認できます。
次のステップ
- ポータル ユーザーが翻訳をリクエストする方法を学習する。