人間がレビューした翻訳を保存して再利用する

翻訳メモリ（高度な階層のみ）は、人間がレビューした翻訳のリポジトリです。ポータルユーザーは翻訳ジョブに翻訳メモリを適用して、ソース言語のセグメントとの完全一致を対応するターゲット言語のセグメントに置き換えることができます。翻訳メモリは、人間がレビューした翻訳を再利用し、一貫した翻訳を維持するために役立ちます。

空の翻訳メモリから始めることも、独自の翻訳をインポートすることもできます。ポストエディットプロセスの一環として、Translation Hub はポストエディットされた翻訳を翻訳メモリに入力します。

Translation Hub は、最新のポストエディットされた翻訳のみをメモリに保持します。たとえば、ポータルユーザーが、Translation Hub が翻訳メモリを使用して翻訳したセグメントを編集すると、Translation Hub は既存のセグメントを新しく編集したセグメントに置き換えます。置換を防ぐには、翻訳メモリを読み取り専用に設定します。

翻訳メモリと他の翻訳リソースの比較

翻訳メモリに加えて、ポータルユーザーの翻訳を支援するための他のリソースを提供できます。以降のセクションでは、各リソースの違いについて説明します。

用語集は用語で照合されますが、翻訳メモリはセグメントで照合されます。用語集は、分野固有の用語やエンティティの翻訳に使用できます。用語集にはサイズの制限があります。翻訳メモリには、必要な数のセグメントペアを必要な数だけ含めることができます。
カスタムモデルは、センテンスのペアを使用してトレーニングされ、包括的な用語集や翻訳メモリがない場合でも、機械翻訳を改善するのに役立ちます。特定の分野や文章のスタイルに合わせて機械翻訳をチューニングする場合は、AutoML Translation を使用して、より適合する予測を生成するカスタムモデルを構築します。

ポータルユーザーは、これらのリソースを組み合わせて使用することで、翻訳の品質を向上させることができます。Translation Hub が翻訳中にリソースを適用する方法の詳細については、ドキュメントを翻訳するをご覧ください。

始める前に

翻訳メモリを作成するときに、既存の翻訳をインポートすることを選択できます。インポートする場合は、Translation Memory eXchange（TMX）バージョン 1.4 形式で翻訳してください。TMX は、ソースとターゲットの翻訳を提供する標準的な XML 形式です。次の例に、必要な TMX 構造を示します。

<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
  <header segtype="sentence" o-tmf="UTF-8"
  adminlang="en" srclang="en" datatype="PlainText"/>
  <body>
    <tu>
      <tuv xml:lang="en">
        <seg>Hello world!</seg>
      </tuv>
      <tuv xml:lang="es">
        <seg>¡Hola Mundo!</seg>
      </tuv>
    </tu>
  </body>
</tmx>

セグメンテーションとマッチング

TMX ファイル内のソース言語エントリをセンテンスでセグメント化します。翻訳プロセス中、Translation Hub はセンテンス単位でコンテンツを分割します。次に Translation Hub は、このセグメントを翻訳メモリ内のセグメントと比較します。セグメントが完全一致する場合、Translation Hub は対応する翻訳を使用します。

ソース言語セグメントとして部分的なセンテンスや複数のセンテンスが含まれている場合、Translation Hub はそのセグメントと一致しません。その結果、マッチ率が予想よりも低くなる可能性があります。

翻訳メモリを作成する

管理者は Google Cloud コンソールを使用して翻訳メモリを作成します。翻訳メモリを作成した後は、ポストエディットまたは自己編集プロセスでのみ変更できます。たとえば、別のファイルをインポートして、既存の翻訳メモリを変更または追加することはできません。

Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

[リソース] ページに移動
[Add resource] をクリックします。
[リソースを追加] ペインで、[翻訳メモリ] タブを選択します。
翻訳メモリの名前を指定します。
[空の翻訳メモリを作成する] を選択して空の翻訳メモリを作成するか、[翻訳メモリを作成してデータをインポートする] を選択して既存の翻訳をインポートします。
1. 既存の翻訳をインポートするには、ローカル TMX ファイルを Cloud Storage にアップロードするか、Cloud Storage から既存の TMX ファイルを選択します。
[追加] をクリックして翻訳メモリを作成します。

ポータルに翻訳メモリを追加する

翻訳メモリを作成したら、既存のポータルに追加して、ポータルユーザーが翻訳をリクエストする際に使用できるようにします。

Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

[リソース] ページに移動
リソースのリストから、1 つ以上の翻訳メモリを選択して、1 つ以上のポータルに追加します。
[Assign to Portal] をクリックすると、[Assign resource to Portal] ペインが開きます。
[ポータル] フィールドで、翻訳メモリを追加する 1 つ以上のポータルを選択します。
[割り当て] をクリックします。

[リソース] ページで、各リソースの [ポータル名] 列を表示して、追加を確認できます。

デフォルトの翻訳メモリを設定する

ポータルユーザーが翻訳をリクエストしたときに、Translation Hub が自動的に選択するデフォルトの翻訳メモリを設定できます。

デフォルトの翻訳メモリは、人間がレビューした翻訳のセットを一貫して適用する場合、ポストエディット中に編集を取得する場合、またはその両方に役立ちます。ユーザーは、翻訳メモリを選択したり、どの翻訳メモリを使用するかを覚えておく必要はありません。別の翻訳メモリを選択することも、翻訳メモリを使用しないこともできます。ポータルユーザーは、ポストエディットをリクエストするときなど、最初の翻訳後にこの選択を変更することはできません。

始める前に、ポータルにデフォルトとして設定する翻訳メモリを追加する必要があります。

Google Cloud Console の [Translation Hub] セクションで、[ポータル] ページに移動します。

[ポータル] ページに移動
デフォルトの翻訳メモリを指定するポータルを選択します。
[翻訳メモリ] セクションで、デフォルトとして設定する翻訳メモリを探して、 [その他] > [デフォルトに設定] を選択します。

既存のデフォルトがある場合、Translation Hub はそれをデフォルトとして削除し、選択した翻訳メモリをデフォルトとして設定します。

デフォルトの翻訳メモリを削除する

Google Cloud Console の [Translation Hub] セクションで、[ポータル] ページに移動します。

[ポータル] ページに移動
削除するデフォルトの翻訳メモリを含むポータルを選択します。
[翻訳] セクションで、デフォルトとして削除する翻訳メモリを見つけて、 [その他] > [デフォルトの設定解除] を選択します。

参考情報

翻訳メモリを読み取り専用に設定する方法を学習する。