Vertex AI Matching Engine 概览

使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Vertex AI Matching Engine 提供业界领先的大规模、低延迟、矢量数据库(又称矢量相似度匹配或近似最邻近服务)。

Matching Engine 提供的工具可用于构建与语义相似项匹配的用例。更具体地说,给定一个查询项,Matching Engine 会从一个大型候选项语料库中查找与其在语义上最相似的项。这种搜索语义相似度或语义相关项的能力具有许多实际用例,是诸如以下应用的重要部分:

  • 商品推荐引擎
  • 搜索引擎
  • 广告定位系统
  • 图片分类或图片搜索
  • 文本分类
  • 问题回答
  • 聊天机器人

用于构建语义匹配系统的先进范式是计算项的向量表示。这些向量表示通常称为嵌入。嵌入是使用机器学习模型计算的。模型经过训练,可以学习类似样本接近、不同样本距离很远的嵌入空间。嵌入空间中两项越接近,它们越相似。

下图显示了如何将此技术应用于从数据库中查找与输入查询在语义上最匹配的图书的问题。要使用此方法响应查询,系统必须首先将每个数据库项映射到嵌入,然后将查询映射到嵌入空间。然后,系统必须在所有数据库嵌入中查找最接近查询的内容;这是最近邻搜索问题(有时也称为矢量相似度搜索)。

查询和数据库点。

使用嵌入的情形不限于字词或文本。使用机器学习模型(通常是深度学习模型)可以针对多种类型的数据(例如照片、音频、影片和用户偏好)生成语义嵌入。

概括来讲,语义匹配可以简化为两个关键步骤:

  • 生成项的嵌入表示
  • 对嵌入执行最近邻搜索。

Vertex AI Matching Engine 是一个矢量数据库,该数据库利用嵌入矢量的独有特征来高效地对其编制索引,以便轻松地执行可调整的搜索操作并检索类似嵌入。它可以对包含超过 10 亿个嵌入矢量的索引以较高的每秒查询次数 (QPS) 进行大规模、低延迟且具备经济效益的查询。

配额

了解 Vertex AI 匹配引擎配额以及如何申请增加配额

后续步骤