翻译记忆库(仅限高级层级)是包含人工审核者翻译的代码库。门户用户可以对其翻译作业应用翻译记忆库,以便将源语言段中的完全匹配内容替换为对应的目标语言段。翻译记忆库有助于重复使用经过人工审核的翻译并保持一致的翻译。
您可以先使用空的翻译记忆库,也可以导入自己的翻译。 在后期编辑过程中,Translation Hub 会使用后编辑的译文填充您的翻译记忆库。
Translation Hub 只会将编辑后的最新翻译保留在内存中。例如,如果门户用户修改了 Translation Hub 使用翻译记忆库翻译的细分,Translation Hub 会将现有细分替换为新修改的细分。为防止替换,您可以将翻译记忆库设置为只读。
翻译记忆库与其他翻译资源的对比情况
除了翻译记忆库之外,您还可以提供其他资源来帮助门户用户进行翻译。以下部分介绍了每种资源之间的差异。
- 术语表匹配术语,而翻译记忆库用于匹配句段。使用术语库翻译特定领域的术语或实体。术语表也有大小限制;翻译记忆库可以包含任意数量的语言段对,数量不限。
- 自定义模型是用您的句子对进行训练的,当您没有全面的术语库或翻译记忆库时,可以帮助您改进机器翻译。如果您希望针对特定领域和写作风格调整机器翻译,请使用 AutoML Translation 构建自定义模型,从而生成更符合的预测。
门户用户可以组合使用这些资源来帮助提高翻译质量。如需详细了解 Translation Hub 在翻译过程中如何应用资源,请参阅翻译文档。
准备工作
创建翻译记忆库时,您可以选择导入现有翻译。如果提供,请提供 Translation Memory eXchange (TMX) 1.4 版格式的翻译。TMX 是一种用于提供源翻译和目标翻译的标准 XML 格式。以下示例展示了所需的 TMX 结构:
<?xml version='1.0' encoding='utf-8'?>
<!DOCTYPE tmx SYSTEM "tmx14.dtd">
<tmx version="1.4">
<header segtype="sentence" o-tmf="UTF-8"
adminlang="en" srclang="en" datatype="PlainText"/>
<body>
<tu>
<tuv xml:lang="en">
<seg>Hello world!</seg>
</tuv>
<tuv xml:lang="es">
<seg>¡Hola Mundo!</seg>
</tuv>
</tu>
</body>
</tmx>
分段和匹配
在 TMX 文件中按句子细分您的源语言条目。在翻译过程中,Translation Hub 会按句子细分您的内容。然后,Translation Hub 会将这些句段与翻译记忆库中的句段进行比较。如果句段完全匹配,Translation Hub 将使用相应的翻译。
如果您将一个不完整的句子或多个句子添加为源语言句段,Translation Hub 不会匹配该句段。因此,您的匹配率可能会低于预期。
创建翻译记忆库
管理员可以使用 Google Cloud 控制台创建翻译记忆库。创建翻译记忆库后,只能通过后期编辑或自行编辑过程对其进行修改。例如,您不能导入其他文件来修改或附加到现有翻译记忆库。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
点击 添加资源。
在添加资源窗格中,选择翻译记忆标签页。
指定翻译记忆库的名称。
选择创建空翻译记忆库以创建空的翻译记忆库,或选择创建翻译记忆库并导入数据以导入现有翻译。
- 如需导入现有翻译,请将本地 TMX 文件上传到 Cloud Storage,或从 Cloud Storage 选择现有 TMX 文件。
点击添加即可创建翻译记忆库。
向门户添加翻译记忆库
创建翻译记忆库后,请将其添加到现有门户,以便门户用户可以在请求翻译时开始使用该记忆库。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
从资源列表中,选择一个或多个要添加到一个或多个门户的翻译记忆库。
点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。
从门户字段中,选择一个或多个门户要添加翻译记忆库。
点击分配。
在资源页面上,您可以查看每项资源的门户名称列,以确认添加。
设置默认翻译记忆库
您可以设置在门户用户请求翻译时 Translation Hub 自动选择的默认翻译记忆库。
默认翻译记忆库有助于持续应用一组人工审核的翻译和/或后期编辑期间的修改记录。用户无需记住选择翻译记忆库或使用哪种。 他们仍然可以选择其他翻译记忆库,或者全不选。门户用户无法在初始翻译之后(例如请求后期修改时)更改此选择。
在开始之前,您必须添加翻译记忆库(将设置为门户的默认翻译记忆库)。
在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。
选择要指定默认翻译记忆库的门户。
在翻译记忆库部分,找到要设置为默认值的翻译记忆库,然后依次选择
更多 > 设为默认。如果您已有默认翻译记忆库,Translation Hub 会将其移除,并将您选择的翻译记忆库设置为默认值。
移除默认翻译记忆库
在 Google Cloud 控制台的 Translation Hub 部分,前往门户页面。
选择包含要移除的默认翻译记忆库的门户。
在翻译记忆库部分,找到要移除的翻译记忆库作为默认设置,然后依次选择
更多 > 取消设为默认。
其他资源
- 了解如何将翻译记忆库设置为只读。