AlloyDB AI 是 AlloyDB for PostgreSQL 和 AlloyDB Omni 附带的一组功能,可让您将机器学习 (ML) 模型的语义和预测能力应用于您的数据。本页简要介绍了 AlloyDB 提供的依托机器学习技术的 AI 函数。
存储、编入索引和查询向量
标准的 pgvector
PostgreSQL 扩展已针对 AlloyDB 进行了自定义,并称为 vector
。它支持将生成的嵌入存储在向量列中。该扩展还添加了对标量量化功能的支持,以创建 IVF
索引。您还可以创建可与常规 pgvector
搭配使用的 IVFFlat
索引或 HSNW
索引。
如需详细了解如何存储矢量,请参阅存储矢量。
除了自定义的 vector
扩展程序之外,AlloyDB 还包含 alloydb_scann
扩展程序,该扩展程序可实现由 ScaNN 算法提供支持的高效最近邻索引。
如需详细了解如何创建索引和查询矢量,请参阅创建索引和查询矢量。
优化向量查询性能
您可以调整索引,以便在每秒查询次数 (QPS) 和查询的召回率之间取得平衡。如需详细了解如何调整索引,请参阅调整矢量查询性能。
生成嵌入和文本预测
AlloyDB AI 通过用于查询模型的两个函数扩展了 PostgreSQL 语法,使用 google_ml_integration
扩展程序:
调用预测以在事务中使用 SQL 调用模型。
生成嵌入以使 LLM 将文本提示转换为数值向量。
您可以使用
embedding()
函数查询 Vertex AI 模型,而google_ml.embedding()
函数可用于查询已注册的 Vertex AI、托管的模型和第三方模型。然后,您可以将这些向量嵌入作为输入应用于
pgvector
函数。这包括根据文本样本的相对语义距离对其进行比较和排序的方法。
使用 Vertex AI 在云端使用模型
您可以配置 AlloyDB 以与 Vertex AI 搭配使用。
这会为您的应用带来以下好处:
您的应用可以使用 Vertex AI Model Garden 中存储的任何可访问的模型来调用预测。
您的应用可以使用
text-embedding-005
英语模型 LLM 生成嵌入。