如果必须以一致的方式翻译特定于网域的术语和命名实体,请创建术语表。术语表是一种自定义字典,包含两种或更多种语言的对应术语。在机器翻译过程中,Translation Hub 会自动将匹配的源语言术语替换为关联的目标语言术语。
您可以使用术语表来微调特定术语或实体的翻译方式。例如,您可以添加术语表条目,以防止产品名称(例如“Google Home”)被翻译。
创建术语表后,请将其添加到门户,以便门户用户使用。
术语表与其他翻译资源的对比
除了术语表之外,您还可以提供其他资源来帮助门户用户进行翻译。以下部分介绍了每种资源之间的区别。
- 翻译记忆库会按句段进行匹配,而术语表会按术语进行匹配。使用翻译记忆库可重复使用导入的译文、在后期编辑过程中捕获的译文,或二者兼有。翻译记忆库可以包含任意数量的句段对,并且可以使用任意数量的语言。
- 自定义模型是使用您的句子对进行训练的,当您没有全面的术语表或译文存储库时,它们可以帮助您改进机器翻译。如果您想针对特定领域和写作风格优化机器翻译,请使用 AutoML Translation 构建自定义模型,以生成更贴合的预测结果。
门户用户可以组合使用这些资源,以帮助提高翻译质量。如需详细了解 Translation Hub 如何在翻译过程中应用资源,请参阅翻译文档。
无效搜索字词
Translation Hub 会忽略术语表中包含的一些术语:这些术语称为无效搜索字词。Translation Hub 仍会翻译无效搜索字词,但会忽略任何匹配的术语表条目。如需查看所有无效搜索字词的列表,请参阅术语表无效搜索字词。
准备工作
如需填充术语表,您需要一个包含相应语言术语的文件。源文件的格式取决于您创建的术语表类型:单向或等同术语集。
术语表条目区分大小写。对于不区分大小写的条目,请在术语表中添加这两种形式。
单向
单向术语表以源语言和目标语言对的形式指定术语的所需翻译。这些术语表的运作方式是单向的。例如,英语到西班牙语的单向术语表不适用于西班牙语到英语的翻译。
您可以提供 TSV(制表符分隔值)、CSV(逗号分隔值)或 TMX(Translation Memory eXchange)文件。对于 TSV 和 CSV 文件,请勿添加标题行来标识源语言和目标语言。您可以在创建术语表时指定这些字词。对于 TMX 文件,请使用 TMX 1.4 版标准。
如需了解术语表的详细信息和示例,请参阅 Cloud Translation 文档中的创建和使用术语表。
等效术语集
等效术语集包含多种语言的等效术语,并且必须在 CSV 文件中定义。每行包含不同语言的对应术语。这些术语表是双向的。标题行必须通过相应的语言代码标识每一列对应的语言。
如需了解术语表的详细信息和示例,请参阅 Cloud Translation 文档中的创建和使用术语表。
术语库限制
Translation Hub 对源文件的大小和每个术语表条目的大小设置了限制。如需了解详情,请参阅配额和限制。
创建术语表
您可以使用 Google Cloud 控制台创建术语表。如果您之前通过 Cloud Translation API 创建了资源,Translation Hub 会将其提供给您。您可以将这些资源分配给门户。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
点击 添加资源。
在添加资源窗格中,选择术语表标签页。
为该术语表指定名称。
选择术语表类型。
将本地术语表文件上传到 Cloud Storage,或从 Cloud Storage 中选择现有术语表文件。
指定术语表语言。
点击添加以创建术语表。
向门户添加术语表
创建术语表后,将其添加到门户,以便门户用户在申请翻译时使用。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
从资源列表中,选择要添加到一个或多个门户的一个或多个术语表。
点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。
在“门户”字段中,选择一个或多个要将该术语表添加到的门户。
点击分配。
在资源页面上,您可以通过查看每个资源的门户名称列来确认添加操作。
后续步骤
- 了解门户用户如何申请翻译。