控制字词的翻译方式

如果必须以一致的方式翻译特定于网域的术语和命名实体,请创建术语表。术语表是一种自定义字典,其中包含两种或更多种语言的对应术语。在机器翻译过程中,Translation Hub 会自动将匹配的源语言术语替换为关联的目标语言术语。

使用术语表可微调特定术语或实体的翻译方式。例如,您可以添加一个术语表条目,以防止产品名称(例如“Google Home”)被翻译。

创建术语库后,将其添加到门户,以便门户用户可以使用。

术语表与其他翻译资源的比较

除了术语表之外,您还可以提供其他资源来帮助门户用户进行翻译。以下部分介绍了每种资源之间的区别。

  • 翻译记忆库会匹配句段,而术语库会匹配术语。使用翻译记忆库可重复使用人工审核的翻译,这些翻译可能是导入的,也可能是在后期编辑过程中捕获的,或者两者兼而有之。翻译记忆库可以包含任意数量的句段对,并支持任意数量的语言。
  • 自定义模型是使用您的句子对进行训练的,当您没有全面的词汇表或翻译记忆库时,它们可以帮助您改进机器翻译。如果您想针对特定领域和写作风格调整机器翻译,请使用 AutoML Translation 构建可生成更贴合要求的预测结果的自定义模型。

门户用户可以结合使用这些资源,以帮助提高翻译质量。如需详细了解 Translation Hub 在翻译期间如何应用资源,请参阅翻译文档

无效搜索字词

Translation Hub 会忽略术语表中包含的一些术语;这些术语称为无效搜索字词。Translation Hub 仍会翻译无效搜索字词,但会忽略任何匹配的术语表条目。如需查看所有无效搜索字词的列表,请参阅术语表无效搜索字词

准备工作

如需填充词汇表,您需要一个包含相应语言的术语的文件。源文件的格式取决于您创建的词汇表类型:单向等效术语集

术语表条目区分大小写。对于不区分大小写的条目,请在术语表中添加这两种形式。

单向

单向术语表以源语言和目标语言对的形式指定术语的所需翻译。这些术语表以单向方式运作。例如,英语到西班牙语的单向术语表不适用于西班牙语到英语的翻译。

您可以提供 TSV(制表符分隔值)、CSV(逗号分隔值)或 TMX(Translation Memory eXchange)文件。对于 TSV 和 CSV 文件,请勿添加标题行来标识源语言和目标语言。您可以在创建术语库时指定它们。对于 TMX 文件,请使用 TMX 1.4 版标准。

如需了解术语库的详情和示例,请参阅 Cloud Translation 文档中的创建和使用术语库

等效术语集

等效术语集包含多种语言的等效术语,必须在 CSV 文件中定义。每行包含不同语言的对应术语。这些术语表是双向的。标题行必须通过相应的语言代码来标识每一列的语言。

如需了解术语库的详情和示例,请参阅 Cloud Translation 文档中的创建和使用术语库

术语库限制

Translation Hub 对源文件的大小和每个词汇表条目的大小都设置了限制。如需了解详情,请参阅配额和限制

创建术语表

您可以使用 Google Cloud 控制台创建词汇表。如果您之前通过 Cloud Translation API 创建过资源,Translation Hub 会向您提供这些资源。您可以将这些资源分配给门户。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往资源页面。

    转到“资源”页面

  2. 点击 添加资源

  3. 添加资源窗格中,选择术语表标签页。

  4. 为术语库指定名称。

  5. 选择术语表类型。

  6. 将本地词汇表文件上传到 Cloud Storage,或从 Cloud Storage 中选择现有词汇表文件。

  7. 指定词汇表语言。

  8. 点击添加以创建词汇表。

向门户添加术语表

创建术语库后,请将其添加到门户,以便门户用户在申请翻译时使用这些术语库。

  1. 在 Google Cloud 控制台的 Translation Hub 部分,前往资源页面。

    转到“资源”页面

  2. 从资源列表中,选择要添加到一个或多个门户的术语库。

  3. 点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。

  4. 在“门户”字段中,选择要将词汇表添加到的一个或多个门户。

  5. 点击分配

    资源页面上,您可以通过查看每个资源的门户名称列来确认添加。

后续步骤