保存并重复使用人工审核的翻译

翻译记忆库(仅限高级层级)是包含人工审核者翻译的代码库。门户用户可以对其翻译作业应用翻译记忆库,以便将源语言段中的完全匹配内容替换为对应的目标语言段。翻译记忆库有助于重复使用经过人工审核的翻译并保持一致的翻译。

您可以先使用空的翻译记忆库,也可以导入自己的翻译。 在后期编辑过程中,Translation Hub 会使用后编辑的译文填充您的翻译记忆库。

Translation Hub 只会将编辑后的最新翻译保留在内存中。例如,如果门户用户修改了 Translation Hub 使用翻译记忆库翻译的细分,Translation Hub 会将现有细分替换为新修改的细分。为防止替换,您可以将翻译记忆库设置为只读。

翻译记忆库与其他翻译资源的对比情况

除了翻译记忆库之外,您还可以提供其他资源来帮助门户用户进行翻译。以下部分介绍了每种资源之间的差异。

  • 术语表匹配术语,而翻译记忆库用于匹配句段。使用术语库翻译特定领域的术语或实体。术语表也有大小限制;翻译记忆库可以包含任意数量的语言段对,数量不限。
  • 自定义模型是用您的句子对进行训练的,当您没有全面的术语库或翻译记忆库时,可以帮助您改进机器翻译。如果您希望针对特定领域和写作风格调整机器翻译,请使用 AutoML Translation 构建自定义模型,从而生成更符合的预测。

门户用户可以组合使用这些资源来帮助提高翻译质量。如需详细了解 Translation Hub 在翻译过程中如何应用资源,请参阅翻译文档

准备工作

创建翻译记忆库时,您可以选择导入现有翻译。如果提供,请提供 Translation Memory eXchange (TMX) 1.4 版格式的翻译。TMX 是一种用于提供源翻译和目标翻译的标准 XML 格式。以下示例展示了所需的 TMX 结构:

<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
  <header segtype="sentence" o-tmf="UTF-8"
  adminlang="en" srclang="en" datatype="PlainText"/>
  <body>
    <tu>
      <tuv xml:lang="en">
        <seg>Hello world!</seg>
      </tuv>
      <tuv xml:lang="es">
        <seg>¡Hola Mundo!</seg>
      </tuv>
    </tu>
  </body>
</tmx>

分段和匹配

在 TMX 文件中按句子细分您的源语言条目。在翻译过程中,Translation Hub 会按句子细分您的内容。然后,Translation Hub 会将这些句段与翻译记忆库中的句段进行比较。如果句段完全匹配,Translation Hub 将使用相应的翻译。

如果您将一个不完整的句子或多个句子添加为源语言句段,Translation Hub 不会匹配该句段。因此,您的匹配率可能会低于预期。

创建翻译记忆库

管理员可以使用 Google Cloud 控制台创建翻译记忆库。创建翻译记忆库后,只能通过后期编辑或自行编辑过程对其进行修改。例如,您不能导入其他文件来修改或附加到现有翻译记忆库。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。

    转到“资源”页面

  2. 点击 添加资源

  3. 添加资源窗格中,选择翻译记忆标签页。

  4. 指定翻译记忆库的名称。

  5. 选择创建空翻译记忆库以创建空的翻译记忆库,或选择创建翻译记忆库并导入数据以导入现有翻译。

    1. 如需导入现有翻译,请将本地 TMX 文件上传到 Cloud Storage,或从 Cloud Storage 选择现有 TMX 文件。
  6. 点击添加即可创建翻译记忆库。

向门户添加翻译记忆库

创建翻译记忆库后,请将其添加到现有门户,以便门户用户可以在请求翻译时开始使用该记忆库。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。

    转到“资源”页面

  2. 从资源列表中,选择一个或多个要添加到一个或多个门户的翻译记忆库。

  3. 点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。

  4. 从门户字段中,选择一个或多个门户要添加翻译记忆库。

  5. 点击分配

    资源页面上,您可以查看每项资源的门户名称列,以确认添加。

设置默认翻译记忆库

您可以设置在门户用户请求翻译时 Translation Hub 自动选择的默认翻译记忆库。

默认翻译记忆库有助于持续应用一组人工审核的翻译和/或后期编辑期间的修改记录。用户无需记住选择翻译记忆库或使用哪种。 他们仍然可以选择其他翻译记忆库,或者全不选。门户用户无法在初始翻译之后(例如请求后期修改时)更改此选择。

在开始之前,您必须添加翻译记忆库(将设置为门户的默认翻译记忆库)。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。

    前往“门户”页面

  2. 选择要指定默认翻译记忆库的门户。

  3. 翻译记忆库部分,找到要设置为默认值的翻译记忆库,然后依次选择 更多 > 设为默认

    如果您已有默认翻译记忆库,Translation Hub 会将其移除,并将您选择的翻译记忆库设置为默认值。

移除默认翻译记忆库

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。

    前往“门户”页面

  2. 选择包含要移除的默认翻译记忆库的门户。

  3. 翻译记忆库部分,找到要移除的翻译记忆库作为默认设置,然后依次选择 更多 > 取消设为默认

其他资源