使用 AlloyDB AI 构建生成式 AI 应用

AlloyDB AI 是 AlloyDB for PostgreSQL 和 AlloyDB Omni 附带的一组功能,可让您将机器学习 (ML) 模型的语义和预测能力应用于您的数据。本页简要介绍了 AlloyDB 提供的依托机器学习技术的 AI 函数。

存储、编入索引和查询向量

标准的 pgvector PostgreSQL 扩展已针对 AlloyDB 进行了自定义,并称为 vector。它支持将生成的嵌入存储在向量列中。该扩展还添加了对标量量化功能的支持,以创建 IVF 索引。您还可以创建可与常规 pgvector 搭配使用的 IVFFlat 索引或 HSNW 索引。

如需详细了解如何存储矢量,请参阅存储矢量

除了自定义的 vector 扩展程序之外,AlloyDB 还包含 alloydb_scann 扩展程序,该扩展程序可实现由 ScaNN 算法提供支持的高效最近邻索引。

如需详细了解如何创建索引和查询矢量,请参阅创建索引和查询矢量

优化向量查询性能

您可以调整索引,以便在每秒查询次数 (QPS) 和查询的召回率之间取得平衡。如需详细了解如何调整索引,请参阅调整矢量查询性能

生成嵌入和文本预测

AlloyDB AI 通过用于查询模型的两个函数扩展了 PostgreSQL 语法,使用 google_ml_integration 扩展程序:

  • 调用预测以在事务中使用 SQL 调用模型。

  • 生成嵌入以使 LLM 将文本提示转换为数值向量。

    您可以使用 embedding() 函数查询 Vertex AI 模型,而 google_ml.embedding() 函数可用于查询已注册的 Vertex AI、托管的模型和第三方模型。

    然后,您可以将这些向量嵌入作为输入应用于 pgvector 函数。这包括根据文本样本的相对语义距离对其进行比较和排序的方法。

使用 Vertex AI 在云端使用模型

您可以配置 AlloyDB 以与 Vertex AI 搭配使用

这会为您的应用带来以下好处:

后续步骤