如果特定领域的术语和命名实体必须一致地翻译,请创建术语表。术语表是一种自定义字典,其中包含两种或更多种语言的对应术语。在机器翻译过程中,Translation Hub 会自动将匹配的源语言术语替换为与其关联的目标语言术语。
使用术语库微调某些术语或实体的翻译方式。例如,您可以添加一个术语表条目,以防止产品名称(如“Google Home”)被翻译。
创建术语表后,请将其添加到门户,以供门户用户使用。
术语表与其他翻译资源的对比情况
除了术语表之外,您还可以提供其他资源,以帮助门户用户进行翻译。以下部分介绍了每种资源之间的差异。
- 翻译记忆库按片段进行匹配,而术语库按术语进行匹配。使用翻译记忆库,可以重复使用导入的和/或后期编辑期间捕获的经过人工审核的翻译。翻译记忆库可以根据需要包含任意数量的语言段对。
- 自定义模型是用您的句子对进行训练的,当您没有全面的术语库或翻译记忆库时,可以帮助您改进机器翻译。如果您希望针对特定领域和写作风格调整机器翻译,请使用 AutoML Translation 构建自定义模型,从而生成更符合的预测。
门户用户可以组合使用这些资源来帮助提高翻译质量。如需详细了解 Translation Hub 在翻译过程中如何应用资源,请参阅翻译文档。
无效搜索字词
Translation Hub 会忽略术语表中包含的一些术语;这些术语称为“无效术语”。Translation Hub 仍会翻译无效字词,但会忽略所有匹配的术语库条目。如需查看所有无效搜索字词的列表,请参阅术语库。
准备工作
如需填充术语表,您需要一个包含对应语言术语的文件。源文件的格式取决于您创建的术语库类型:单向术语集或等效术语集。
术语表条目区分大小写。对于不区分大小写的条目,请在术语库中同时包含这两种形式。
单向
单向术语表将术语指定为源语言和目标语言对所需的翻译。这些术语表是单向的。例如,英语到西班牙语的单向术语表不适用于从西班牙语到英语的翻译。
您可以提供 TSV(制表符分隔值)、CSV(逗号分隔值)或 TMX(Translation Memory eXchange)文件。对于 TSV 和 CSV 文件,请勿添加标题行来标识源语言和目标语言。您可以在创建术语表时指定它们。对于 TMX 文件,请使用 TMX 1.4 版标准。
如需了解术语表的详细信息和示例,请参阅 Cloud Translation 文档中的创建和使用术语表。
等效术语集
等效术语集包含多种语言的等效术语,必须在 CSV 文件中定义。每一行都包含不同语言的对应术语。这些术语表是双向的。标题行必须通过相应的语言代码标识每一列对应的语言。
如需了解术语表的详细信息和示例,请参阅 Cloud Translation 文档中的创建和使用术语表。
术语表限制
Translation Hub 对源文件和每个术语表条目的大小设置了限制。如需了解详情,请参阅配额和限制。
创建术语表
您可以使用 Google Cloud 控制台创建术语表。如果您之前通过 Cloud Translation API 创建了资源,Translation Hub 会为您提供这些资源。您可以将这些资源分配给门户。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
点击 添加资源。
在添加资源窗格中,选择术语库标签页。
指定术语表的名称。
选择术语库类型。
将本地术语表文件上传到 Cloud Storage,或从 Cloud Storage 中选择现有的术语表文件。
指定术语库语言。
点击添加以创建术语库。
向门户添加术语表
创建术语表后,将其添加到门户,以便门户用户在请求翻译时可以使用这些术语表。
在 Google Cloud 控制台的 Translation Hub 部分,转到资源页面。
从资源列表中,选择一个或多个要添加到一个或多个门户的术语表。
点击分配给门户 (Assign resource to portal),以打开将资源分配给门户 (Assign resource to portal) 窗格。
在门户字段中,选择一个或多个要添加术语表的门户。
点击分配。
在资源页面上,您可以查看每项资源的门户名称列,以确认添加。
后续步骤
- 了解门户用户如何请求翻译。