本指南說明如何使用 Vertex AI Model Optimizer 動態端點,自動選擇最符合需求的 Gemini 模型,簡化模型選取程序。本文涵蓋下列主題: 如要進一步瞭解 Model Optimizer 的定價,請參閱「定價」。 Model Optimizer 可讓您:
模型最佳化工具會將要求轉送至下列模型: 模型最佳化工具支援 Gemini 模型支援的所有語言。(請參閱「Gemini 支援的語言」) 模型最佳化工具支援僅限文字的用途,包括: 如要瞭解限制和處理方式,請參閱「處理不支援的功能」。 如要開始使用模型最佳化工具,請參閱快速入門 Colab 筆記本。
詳情請參閱
SDK 參考說明文件。
設定環境變數,透過 Vertex AI 使用 Gen AI SDK:
Model Optimizer 僅支援文字輸入和輸出。不過,要求可能包含不支援的不同模式或工具。以下各節將說明 Model Optimizer 如何處理這些不支援的功能。 如果要求包含附有多模態資料 (例如影片、圖片或音訊) 的提示,系統會擲回 Model Optimizer 只支援要求函式宣告。如果要求包含其他工具類型,包括 如要傳送 Model Optimizer 使用體驗的相關意見,請填寫意見回饋問卷調查。 如有關於 Model Optimizer 的問題、技術問題或意見回饋,請與 model-optimizer-support@google.com 聯絡。 如要直接與開發團隊聯絡,可以加入 Vertex AI 模型最佳化工具意見交流群組,瞭解產品並協助我們改善功能,讓功能更符合您的需求。該群組的活動包括: 我們大約每 6 到 8 週會提供一次活動。您可以自由選擇參與多少活動,或隨時完全退出。
如要加入這個群組,請填寫 Vertex AI Model Optimizer 討論群組申請表單。
優點
支援的模型
語言支援
支援應用實例
開始使用
使用 Vertex AI Model Optimizer
Python
安裝
pip install --upgrade google-genai
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True
處理不支援的功能
多模態要求
INVALID_ARGUMENT
錯誤。不支援的工具
google_maps
、google_search
、enterprise_web_search
、retrieval
或 browse
,系統會擲回 INVALID_ARGUMENT
錯誤。提供意見
顧客討論群組
Vertex AI Model Optimizer
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-19 (世界標準時間)。