此页面由 Cloud Translation API 翻译。

开始前的准备工作

在开始使用 Vector Search 之前，您需要选择嵌入模型、准备数据并确定要使用的端点类型。本页面提供了一些有关如何执行这些操作的信息。

准备嵌入

如需使用 Vector Search，您需要准备好嵌入。如果您已有嵌入，请跳到选择端点。

如需创建嵌入，请执行以下操作：

选择嵌入模型：提供了许多外部嵌入模型，分别具有不同特征。

Vector Search 支持密集嵌入、稀疏嵌入和混合搜索。混合搜索会根据您为这些嵌入类型指定的权重使用密集嵌入和稀疏嵌入。

根据您的应用场景，选择以下类型的模型之一：
- 现成可用：如果您想要仅按文本或图片的相关性，在语义上将文本与文本或文本与图片进行匹配。这是一个标准应用场景，因此您无需训练或调优模型。对于此应用场景，建议使用 Vertex AI 上的生成式 AI。 Vertex AI 上的生成式 AI 使用密集嵌入模型。
- 用于嵌入的自定义模型：如果您希望根据自己的数据或特定应用场景进行匹配。
准备数据：清理和预处理数据，以确保数据采用嵌入模型可以使用的格式。
训练嵌入模型（使用自定义模型）：如果您选择使用自定义嵌入模型（调优），则需要基于您自己的数据训练该模型。这可能是一个耗时的过程，具体取决于数据的大小和复杂程度。如果您使用 Model Garden 中的预训练模型，则可以跳过此步骤。
生成嵌入：训练模型后，使用它为数据生成嵌入。

创建索引后，您需要将其部署到端点。如需了解详情，请参阅部署和管理公共索引端点以及在 VPC 网络中部署和管理索引端点。在创建索引之前，确定所需的端点类型会很有帮助。

您可以将查询索引部署到以下其中一项：

公共端点：如果部署到公共端点，则无需设置网络。公共网络的延迟时间稍长，但设置速度更快，更易于维护。
专用端点：如果您想使用 VPC，则必须先设置网络。Vector Search 支持两种类型的专用网络。
- VPC 网络对等互连连接，可缩短网络延迟时间。
- Private Service Connect 允许跨属于不同群组、团队、项目或组织的 VPC 网络以不公开方式使用服务。

生成嵌入并确定部署索引的位置后，下一步是配置索引。