事前準備

開始使用向量搜尋之前,您必須選擇嵌入模型、準備資料,並決定要使用的端點類型。本頁面將提供相關資訊。

準備嵌入項目

如要使用 Vector Search,您必須先準備好嵌入項目。如果您已擁有嵌入項目,請直接跳至「選擇端點」

如要建立嵌入資料,請按照下列步驟操作:

  1. 選擇嵌入模型:有許多外部嵌入模型可供選擇,每個模型提供的功能各不相同。

    Vector Search 支援密集嵌入、稀疏嵌入和混合搜尋。混合搜尋會根據您為這些嵌入類型指定的權重,使用密集和稀疏嵌入。

    視用途而定,選擇下列其中一種模型類型:

    • 可立即使用:如果您想根據文字或圖片的相關性,將文字與文字或文字與圖片進行語義比對。這是標準用途,因此您不必訓練或調整模型。Vertex AI 生成式 AI 是這個用途的建議選項。Vertex AI 的生成式 AI 會使用密集嵌入模型。

    • 自訂嵌入模型:如果您想根據自己的資料或特定用途進行比對。

  2. 準備資料:清理及預先處理資料,確保資料格式可供嵌入模型使用。

  3. 如果使用自訂模型,請訓練嵌入模型:如果您選擇使用自訂嵌入模型 (調整),就必須使用資料訓練該模型。這項程序可能會耗時,具體取決於資料的大小和複雜度。如果您使用的是 Model Garden 中的預先訓練模型,可以略過這個步驟。

  4. 產生嵌入資料:模型訓練完畢後,請使用該模型產生資料的嵌入資料。

選擇端點

建立索引後,您會將其部署至端點。詳情請參閱「部署及管理公開索引端點」和「在 VPC 網路中部署及管理索引端點」。建議您在建立索引前,先決定所需的端點類型。

您可以將查詢索引部署至下列任一位置:

  • 公開端點:如果您部署至公開端點,就不需要設定網路。公開網路的延遲時間稍長,但設定速度較快,也較容易維護。

  • 私人端點:如要使用虛擬私有雲,您必須先設定網路。向量搜尋支援兩種類型的私人網路。

後續步驟

產生嵌入資料並決定要部署索引的位置後,下一步就是設定索引。