翻訳メモリ

コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

翻訳メモリには、セグメントのペア(ソース言語のセグメントと翻訳されたセグメントのペア)が保存されます。翻訳メモリに入力するには、既存の翻訳をインポートするか、ポストエディット プロセスで編集結果を送信します。

翻訳メモリを使用すると、人が編集した翻訳結果を将来の翻訳リクエストで再利用できます。ビジネス ユーザーが翻訳メモリを選択すると、翻訳中にソース言語のセグメントと完全に一致するターゲット言語セグメントが置き換えられます。

用語集の操作

用語集は、ドメイン固有の用語やエンティティを翻訳するものです。用語集のサイズには上限があるため、大規模なセグメント(完全な文など)の翻訳を目的としたものではありません。翻訳には用語集と翻訳メモリの両方を使用できます。両方を使用する場合、Translation Hub は最初に翻訳メモリを処理します。残りの未翻訳セグメントは、用語集を使用して機械翻訳で処理されます。つまり、重複がある場合、翻訳メモリが用語集よりも優先されます。

ソースファイル

翻訳をインポートするには、既存の翻訳が Translation Memory eXchange(TMX)バージョン 1.4 形式である必要があります。TMX は、原文と訳文を提供する標準的な XML 形式です。次の例に、必要な TMX 構造を示します。

<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
  <header segtype="sentence" o-tmf="UTF-8"
  adminlang="en" srclang="en" datatype="PlainText"/>
  <body>
    <tu>
      <tuv xml:lang="en">
        <seg>Hello world!</seg>
      </tuv>
      <tuv xml:lang="es">
        <seg>¡Hola Mundo!</seg>
      </tuv>
    </tu>
  </body>
</tmx>

Translation Hub では、TMX ファイルのサイズに上限があります。詳細については、割り当てと上限をご覧ください。

セグメンテーションとマッチング

翻訳プロセス中、Translation Hub はセンテンス単位でコンテンツを分割します。このセグメントを翻訳メモリ内のセグメントと比較します。セグメントが一致した場合、Translation Hub は翻訳を使用します。たとえば、ソース言語のセグメントに不完全なセンテンスまたは複数のセンテンスが含まれていると、その部分に完全に一致するものがないため、全体のマッチ率が期待値よりも低くなります。その場合は、TMX ファイル内のソース言語のセグメントがセンテンスでセグメント化されていることを確認します。

翻訳メモリの履歴

翻訳メモリは最新の翻訳のみを保持します。たとえば、翻訳メモリによって翻訳されたセグメントを翻訳者が編集した場合、Translation Hub は既存のセグメントを新しく編集されたセグメントでオーバーライドします。

翻訳メモリを設定する

管理者は Cloud Console を使用して、既存の翻訳をインポートするか、空の翻訳メモリを作成できます。空の翻訳メモリを作成すると、ポストエディットのプロセスから編集を収集し、翻訳メモリを作成できます。

翻訳メモリを作成する

翻訳メモリを作成するには、Cloud Console を使用します。

  1. Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

    [リソース] ページに移動

  2. [リソースの追加] をクリックします。[リソースの追加] ペインが開きます。

    1. [Translation memories] タブを選択します。

    2. 翻訳メモリ ID に、翻訳メモリの名前を入力します。ユーザーが使用する翻訳メモリを選択すると、この名前がビジネス ユーザーに表示されます。

    3. 空の翻訳メモリを作成するか、TMX ファイルから既存の翻訳をインポートするかを選択します。TMX ファイルは Cloud Storage バケットに保存する必要があります。また、ここでアップロードすることもできます。

    4. [追加] をクリックします。

ポータルに翻訳メモリを割り当てる

翻訳メモリを作成したら、ビジネス ユーザーが使用できるように、翻訳メモリを既存のポータルに割り当てる必要があります。ビジネス ユーザーが翻訳をリクエストするとき、翻訳中に使用する翻訳メモリを選択できます。

  1. Google Cloud Console の [Translation Hub] セクションで、[リソース] ページに移動します。

    [リソース] ページに移動

  2. アセットのリストから、1 つ以上のポータルに割り当てる翻訳メモリを選択します。

  3. [Assign to Portal] をクリックすると、[Assign resource to Portal] ペインが開きます。

  4. ポータルのプルダウンから、選択した翻訳メモリを割り当てるポータルを選択します。

    翻訳メモリは、高度な階層のポータルにのみ割り当てることができます。

  5. [割り当て] をクリックします。

    [リソース] ページで、各翻訳メモリの [Portal names] 列を表示して、割り当てを確認できます。

次のステップ

ビジネス ユーザーは、翻訳をリクエストするときに、ポータルに割り当てられた翻訳メモリを選択できます。ポストエディット プロセスで翻訳者が送信した編集内容は、同じ翻訳メモリに保存されます。ビジネス ユーザーが翻訳メモリを指定しない場合、編集は保存されません。