人間がレビューした翻訳を保存して再利用する

翻訳メモリ(高度な階層のみ)は、人間がレビューした翻訳のリポジトリです。ポータル ユーザーは翻訳ジョブに翻訳メモリを適用し、ソース言語のセグメントと完全に一致するターゲット言語を対応するターゲット言語のセグメントに置き換えることができます。翻訳メモリは、人間がレビューした翻訳を再利用し、一貫した翻訳を維持する場合に便利です。

空の翻訳メモリから始めることも、独自の翻訳をインポートすることもできます。 ポストエディット プロセスの一環として、Translation Hub はポストエディットした翻訳を翻訳メモリに入力します。

Translation Hub は、編集後に最新の翻訳のみをメモリに保持します。 たとえば、ポータル ユーザーが、Translation Hub が翻訳メモリを使用して翻訳したセグメントを編集すると、Translation Hub は既存のセグメントを新しく編集したセグメントに置き換えます。置換を防止するために、翻訳メモリを読み取り専用に設定できます。

翻訳メモリと他の翻訳リソースの比較

翻訳メモリに加えて、ポータル ユーザーの翻訳を支援するための他のリソースを提供できます。次のセクションでは、各リソースの違いについて説明します。

  • 用語集は用語に一致しますが、翻訳メモリはセグメントに一致します。分野固有の用語やエンティティを翻訳するには、用語集を使用します。 用語集にはサイズの制限があります。翻訳メモリには、必要な数のセグメントペアを必要な数だけ含めることができます。
  • カスタムモデルは、センテンスのペアを使用してトレーニングされ、包括的な用語集や翻訳メモリがない場合でも、機械翻訳を改善するのに役立ちます。特定の分野や文章のスタイルに合わせて機械翻訳を調整する場合は、AutoML Translation を使用して、より適合する予測を生成するカスタムモデルを構築します。

ポータル ユーザーは、これらのリソースを組み合わせて使用することで、翻訳の質を向上させることができます。Translation Hub が翻訳中にリソースを適用する方法の詳細については、ドキュメントの翻訳をご覧ください。

始める前に

翻訳メモリを作成するときに、既存の翻訳をインポートすることを選択できます。インポートする場合は、Translation Memory eXchange(TMX)バージョン 1.4 形式で翻訳してください。TMX は、ソースとターゲットの翻訳を提供する標準的な XML 形式です。次の例に、必要な TMX 構造を示します。

<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
  <header segtype="sentence" o-tmf="UTF-8"
  adminlang="en" srclang="en" datatype="PlainText"/>
  <body>
    <tu>
      <tuv xml:lang="en">
        <seg>Hello world!</seg>
      </tuv>
      <tuv xml:lang="es">
        <seg>¡Hola Mundo!</seg>
      </tuv>
    </tu>
  </body>
</tmx>

セグメンテーションとマッチング

TMX ファイルでソース言語のエントリを文ごとに分割します。翻訳プロセス中、Translation Hub はセンテンス単位でコンテンツを分割します。 次に Translation Hub は、このセグメントを翻訳メモリ内のセグメントと比較します。セグメントが完全一致の場合、Translation Hub は対応する翻訳を使用します。

ソース言語セグメントとして部分的なセンテンスや複数のセンテンスが含まれている場合、Translation Hub はそのセグメントと一致しません。その結果、マッチ率が想定よりも低くなる可能性があります。

翻訳メモリを作成する

管理者は Google Cloud コンソールを使用して翻訳メモリを作成します。翻訳メモリを作成した後は、ポストエディット プロセスまたは自己編集プロセスでのみ変更できます。たとえば、別のファイルをインポートして、既存の翻訳メモリに変更や追加を行うことはできません。

  1. Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

    [リソース] ページに移動

  2. [Add resource] をクリックします。

  3. [リソースを追加] ペインで、[翻訳メモリ] タブを選択します。

  4. 翻訳メモリの名前を指定します。

  5. [空の翻訳メモリを作成する] を選択して空の翻訳メモリを作成するか、[翻訳メモリを作成してデータをインポートする] を選択して既存の翻訳をインポートします。

    1. 既存の翻訳をインポートするには、ローカルの TMX ファイルを Cloud Storage にアップロードするか、Cloud Storage から既存の TMX ファイルを選択します。
  6. [追加] をクリックして翻訳メモリを作成します。

ポータルに翻訳メモリを追加する

翻訳メモリを作成したら、そのメモリを既存のポータルに追加して、ポータル ユーザーが翻訳をリクエストする際にそのメモリを使用できるようにします。

  1. Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

    [リソース] ページに移動

  2. リソースのリストから、1 つ以上の翻訳メモリを選択して、1 つ以上のポータルに追加します。

  3. [Assign to Portal] をクリックすると、[Assign resource to Portal] ペインが開きます。

  4. [ポータル] フィールドで、翻訳メモリを追加する 1 つ以上のポータルを選択します。

  5. [割り当て] をクリックします。

    [リソース] ページで、各リソースの [ポータル名] 列を表示して、追加を確認できます。

デフォルトの翻訳メモリを設定する

ポータル ユーザーが翻訳をリクエストしたときに、Translation Hub が自動的に選択するデフォルトの翻訳メモリを設定できます。

デフォルトの翻訳メモリは、人間がレビューした翻訳のセットを一貫して適用する場合、ポストエディット中に編集を取得する場合、またはその両方に役立ちます。 ユーザーは、翻訳メモリや使用する翻訳メモリを選択する必要がありません。別の翻訳メモリを選択するか、まったく選択しないこともできます。ポータル ユーザーは、ポストエディットをリクエストする場合と同様に、最初の翻訳後にこの選択を変更することはできません。

始める前に、ポータルのデフォルトとして設定する翻訳メモリを追加する必要があります。

  1. Google Cloud Console の [Translation Hub] セクションで、[ポータル] ページに移動します。

    [ポータル] ページに移動

  2. デフォルトの翻訳メモリを指定するポータルを選択します。

  3. [翻訳メモリ] セクションで、デフォルトとして設定する翻訳メモリを探して、 [その他] > [デフォルトに設定] を選択します。

    既存のデフォルトがある場合、Translation Hub はそれをデフォルトとして削除し、選択した翻訳メモリをデフォルトとして設定します。

デフォルトの翻訳メモリを削除する

  1. Google Cloud Console の [Translation Hub] セクションで、[ポータル] ページに移動します。

    [ポータル] ページに移動

  2. 削除するデフォルトの翻訳メモリが含まれているポータルを選択します。

  3. [翻訳] セクションで、デフォルトとして削除する翻訳メモリを見つけて、 [その他] > [デフォルトの設定解除] を選択します。

補足資料