用語の翻訳方法を管理する

ドメイン固有の用語と名前付きエンティティを一貫して翻訳する必要がある場合は、用語集を作成します。用語集は、2 つ以上の言語に対応する用語を含むカスタム辞書です。機械翻訳中に、Translation Hub は一致するソース言語の用語を関連するターゲット言語の用語に自動的に置き換えます。

用語集を使用すると、特定の用語やエンティティによる翻訳方法を細かく調整できます。たとえば、用語集のエントリを追加して、プロダクト名(「Google Home」など)が翻訳されないようにすることができます。

用語集を作成したら、ポータルに追加して、ポータル ユーザーが使用できるようにします。

用語集と他の翻訳リソースの比較

用語集に加えて、ポータル ユーザーの翻訳を支援するための他のリソースを提供できます。以降のセクションでは、各リソースの違いについて説明します。

  • 翻訳メモリはセグメントで照合されますが、用語集は用語で照合されます。翻訳メモリを使用して、インポートした、ポストエディット中に取得した、または両方による人間がレビューした翻訳を再利用します。翻訳メモリには、必要な数のセグメントペアを必要な数だけ含めることができます。
  • カスタムモデルは、センテンスのペアを使用してトレーニングされ、包括的な用語集や翻訳メモリがない場合でも、機械翻訳を改善するのに役立ちます。特定の分野や文章のスタイルに合わせて機械翻訳をチューニングする場合は、AutoML Translation を使用して、より適合する予測を生成するカスタムモデルを構築します。

ポータル ユーザーは、これらのリソースを組み合わせて使用することで、翻訳の品質を向上させることができます。Translation Hub が翻訳中にリソースを適用する方法の詳細については、ドキュメントを翻訳するをご覧ください。

ストップ語

Translation Hub では、用語集に含まれている用語が無視されます。これらの用語をストップ語と呼びます。Translation Hub はストップ語を翻訳しますが、一致する用語集エントリは無視されます。すべてのストップ語のリストについては、用語集のストップ語をご覧ください。

始める前に

用語集に用語を入力するには、対応する言語の用語を含むファイルが必要です。ソースファイルの形式は、作成する用語集のタイプ、単一方向または多言語用語セットによって異なります。

用語集のエントリでは大文字と小文字が区別されます。大文字と小文字を区別しないエントリの場合は、用語集に両方のフォームを含めます。

単一指向性

単一方向の用語集では、用語の翻訳をソース言語とターゲット言語のペアとして指定します。これらの用語集は一方通行で機能します。たとえば、英語からスペイン語への単一方向の用語集は、スペイン語から英語への翻訳には適用されません。

TSV(タブ区切り値)、CSV(カンマ区切り値)、TMX(Translation Memory eXchange)ファイルを指定できます。TSV ファイルと CSV ファイルの場合、ソース言語とターゲット言語を識別するヘッダー行を含めないでください。これらは、用語集を作成するときに指定します。TMX ファイルの場合は、TMX バージョン 1.4 標準を使用します。

用語集の詳細と例については、Cloud Translation ドキュメントの用語集の作成と使用をご覧ください。

多言語の用語セット

多言語の用語セットには、複数の言語での多言語の用語セットがあり、CSV ファイルで定義する必要があります。各行には、異なる言語に対応する用語が含まれます。これらの用語集は双方向です。ヘッダー行には、各列の言語を対応する言語コードで指定する必要があります。

用語集の詳細と例については、Cloud Translation ドキュメントの用語集の作成と使用をご覧ください。

用語集の制限

Translation Hub では、ソースファイルのサイズと各用語集エントリのサイズに上限が設定されています。詳細については、割り当てと上限をご覧ください。

用語集を作成

用語集は Google Cloud コンソールを使用して作成します。以前に Cloud Translation API を使用してリソースを作成した場合は、Translation Hub でそのリソースを使用できます。これらのリソースをポータルに割り当てることができます。

  1. Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

    [リソース] ページに移動

  2. [Add resource] をクリックします。

  3. [リソースを追加] ペインで、[用語集] タブを選択します。

  4. 用語集の名前を指定します。

  5. 用語集の種類を選択します。

  6. ローカルの用語集ファイルを Cloud Storage にアップロードするか、Cloud Storage から既存の用語集ファイルを選択します。

  7. 用語集の言語を指定します。

  8. [追加] をクリックして用語集を作成します。

ポータルに用語集を追加する

用語集を作成したら、ポータルに追加して、ポータル ユーザーが翻訳をリクエストするときに使用できるようにします。

  1. Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

    [リソース] ページに移動

  2. リソースのリストから、1 つ以上の用語集を選択して、1 つ以上のポータルに追加します。

  3. [Assign to Portal] をクリックすると、[Assign resource to Portal] ペインが開きます。

  4. [ポータル] フィールドで、用語集を追加する 1 つ以上のポータルを選択します。

  5. [割り当て] をクリックします。

    [リソース] ページで、各リソースの [ポータル名] 列を表示して、追加を確認できます。

次のステップ