准备工作

在开始使用 Vector Search 之前,您需要选择嵌入模型、准备数据并确定要使用的端点类型。本页面提供了一些有关如何执行这些操作的信息。

准备嵌入

如需使用 Vector Search,您需要准备好嵌入。如果您已有嵌入,请跳到选择端点

如需创建嵌入,请执行以下操作:

  1. 选择嵌入模型:提供了许多外部嵌入模型,分别具有不同特征。根据您的应用场景,选择以下类型的模型之一:

    • 现成可用:如果您想要仅按文本或图片的相关性,在语义上将文本与文本或文本与图片进行匹配。这是一个标准应用场景,因此您无需训练或调优模型。对于此应用场景,建议使用 Vertex AI 上的生成式 AI

    • 用于嵌入的自定义模型:如果您希望根据自己的数据或特定应用场景在语义上进行匹配。

  2. 准备数据:清理和预处理数据,以确保数据采用嵌入模型可以使用的格式。

  3. 训练嵌入模型(使用自定义模型):如果您选择使用自定义嵌入模型(调优),则需要基于您自己的数据训练该模型。这可能是一个耗时的过程,具体取决于数据的大小和复杂程度。如果您使用 Model Garden 中的预训练模型,则可以跳过此步骤。

  4. 生成嵌入:训练模型后,使用它为数据生成嵌入。

选择端点

创建索引后,您需要将其部署到端点。如需了解详情,请参阅部署和管理公共索引端点以及在 VPC 网络中部署和管理索引端点。在创建索引之前,确定所需的端点类型会很有帮助。

您可以将查询索引部署到以下其中一项:

  • 公共端点:如果部署到公共端点,则无需设置网络。公共网络的延迟时间稍长,但设置速度更快,更易于维护。

  • 专用端点:如果您想使用 VPC,则必须先设置网络。Vector Search 支持两种类型的专用网络。

后续步骤

生成嵌入并确定部署索引的位置后,下一步是配置索引。