本指南說明如何使用 Vertex AI Text Embeddings API 建立文字嵌入。本頁面涵蓋下列主題: Vertex AI 文字嵌入 API 會使用文字的密集向量表示法。這些嵌入是使用類似於大型語言模型的深度學習方法建立。稀疏向量通常會將字詞直接對應至數字,但密集向量的設計目的是表示一段文字的意義。這樣一來,即使段落中沒有使用與查詢相同的字詞,您也能搜尋到符合查詢意涵的段落。 這些嵌入內容的主要特徵包括: 如要瞭解詳情,請參閱下列資源: In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
In the Google Cloud console, on the project selector page,
select or create a Google Cloud project.
Enable the Vertex AI API.
您可以使用下列模型取得文字嵌入: 如要取得最佳嵌入品質,請使用 請只使用支援模型表格中列出的模型名稱。請勿指定沒有 您可以使用 Vertex AI API 或 Python 適用的 Vertex AI SDK,取得文字片段的文字嵌入。 每個要求最多可包含 250 個輸入文字,以及總共 20,000 個輸入權杖。如果要求超過權杖限制,系統會傳回 400 錯誤。每段輸入文字最多只能有 2048 個符記,超出上限的符記會遭到截斷。如要停用無聲截斷功能,請將 詳情請參閱「文字嵌入限制」。 根據預設,所有模型都會產生完整長度的嵌入向量。對於 下列範例使用
詳情請參閱
SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
生成嵌入後,您可以將其新增至向量資料庫,例如 Vector Search。這可實現低延遲擷取,且隨著資料量增加,這點就越顯重要。 如要進一步瞭解 Vector Search,請參閱「Vector Search 總覽」。
事前準備
支援的模型
模型名稱
說明
輸出維度
序列長度上限
支援的文字語言
gemini-embedding-001
在英文、多語言和程式碼工作方面表現優異。這項模型整合了先前的專用模型 (例如
text-embedding-005
和 text-multilingual-embedding-002
),並在各自領域中展現更出色的效能。詳情請參閱我們的技術報告。最多 3072 個
2048 個符記
支援的文字語言
text-embedding-005
專精於英文和程式碼工作。
最多 768 個
2048 個符記
英文
text-multilingual-embedding-002
擅長處理多語言工作。
最多 768 個
2048 個符記
支援的文字語言
gemini-embedding-001
,這是我們設計的大型模型,可提供最高效能。請注意,gemini-embedding-001
每個要求僅支援一個執行個體。@version
後置字元的模型名稱,也不要使用 @latest
,因為這些格式無效。取得某段文字的文字嵌入
API 上限
autoTruncate
設為 false
。選擇嵌入維度
gemini-embedding-001
,這個向量有 3072 個維度,對於其他模型,則有 768 個維度。如要控管輸出嵌入向量的大小,可以使用 output_dimensionality
參數。較小的輸出維度可節省儲存空間,並提高下游應用程式的運算效率,但可能會降低品質。gemini-embedding-001
模型。Python
安裝
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
將嵌入項目新增至向量資料庫
後續步驟
text-embedding-005
和 text-multilingual-embedding-002
背後的相關研究,請參閱研究論文「Gecko:從大型語言模型提煉出的多功能文字嵌入」。
取得文字嵌入
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-19 (世界標準時間)。