部署和端點

Vertex AI 上的 Google 和合作夥伴模型,以及生成式 AI 功能,會以特定區域端點和全域端點的形式公開。全域端點涵蓋全球,與單一區域相比,可用性和可靠性更高。

請注意,模型端點無法保證區域可用性或區域內 ML 處理作業。如要瞭解資料落地,請參閱「資料落地」。

全域端點

為要求選取全域端點,可提高整體可用性,同時減少資源耗盡 (429) 錯誤。如有機器學習處理需求,請勿使用全域端點,因為發出要求時,您無法控管或瞭解機器學習處理要求傳送至哪個區域。

支援的模型

在特定區域,下列 Google 模型支援使用全域端點。如要瞭解哪些區域支援全域端點,請參閱Google 模型端點位置表中的「全球」分頁。

如要瞭解合作夥伴模型全球端點的可用性,請參閱Google Cloud 合作夥伴模型端點位置表中的「全球」分頁。

使用全域端點

如要使用全域端點,請從端點名稱中排除位置,並將資源位置設為 global。舉例來說,下列是全域端點網址:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

如果是 Google Gen AI SDK,請建立使用 global 位置的用戶端:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

如要使用 Vertex AI SDK for Python,請使用 global 位置初始化 SDK:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

限制

使用全球端點時,無法使用下列功能:

  • 調整
  • 批次預測
  • 檢索增強生成 (RAG) 語料庫 (支援 RAG 要求)

搭配佈建輸送量使用全域端點時,僅適用於下列模型:

型號 最新支援的模型版本
Gemini 2.5 Flash (預先發布版) gemini-2.5-flash-preview-09-2025
Gemini 2.5 Flash-Lite (預先發布版) gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash Image 預先發布版 (預先發布版) gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Google 模型端點位置

下列區域提供 Generative AI on Vertex AI 的 Google 模型端點。

美國

美國俄亥俄州哥倫布 (us-east5) 德州達拉斯 (us-south1) 愛荷華州 (us-central1) 內華達州拉斯維加斯 (us-west4) 美國南卡羅來納州蒙克斯科納 (us-east1) 北維吉尼亞州 (us-east4) 奧勒岡州 (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3 (預先發布版)
(veo-3.0-generate-preview)
Veo 3 Fast (預先發布版)
(veo-3.0-fast-generate-preview)

加拿大

蒙特婁 (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)

南美洲

巴西聖保羅 (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)

歐洲

荷蘭 (europe-west4) 法國巴黎 (europe-west9) 英國倫敦 (europe-west2) 德國法蘭克福 (europe-west3) 比利時 (europe-west1) 瑞士蘇黎世 (europe-west6) 西班牙馬德里 (europe-southwest1) 義大利米蘭 (europe-west8) 芬蘭 (europe-north1) 波蘭華沙 (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)

亞太地區

日本東京 (asia-northeast1) 澳洲雪梨 (australia-southeast1) 新加坡 (asia-southeast1) 韓國首爾 (asia-northeast3) 台灣 (asia-east1) 中國香港 (asia-east2) 印度孟買 (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)

中東

沙烏地阿拉伯達曼 (me-central2) 卡達杜哈 (me-central1) 以色列特拉維夫 (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)

全球

全球 (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini Embeddings
(gemini-embedding-001)
文字嵌入
多模態專用的 Embeddings
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 編輯和自訂
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra 生成實驗功能
(imagen-4.0-ultra-generate-001)

* 只有在使用單一可用區佈建輸送量時,才能使用這個區域,且這個區域不支援監督式微調。

Google Cloud 合作夥伴模型端點位置

Google 會從您指定的區域提供要求。對於部分模型,Google 也提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱 Vertex AI 合作夥伴模型 (適用於 MaaS) 的「區域和全域端點」一節。

Vertex AI 的生成式 AI 合作夥伴模型端點適用於下列區域:

美國

美國俄亥俄州哥倫布 (us-east5) 德州達拉斯 (us-south1) 愛荷華州 (us-central1) 內華達州拉斯維加斯 (us-west4) 美國南卡羅來納州蒙克斯科納 (us-east1) 北維吉尼亞州 (us-east4) 奧勒岡州 (us-west1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

歐洲

荷蘭 (europe-west4) 比利時 (europe-west1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

亞太地區

新加坡 (asia-southeast1) 台灣 (asia-east1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

全球

全球 (global)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4.5
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

Google Cloud 開放式模型端點位置

Google 會從您指定的區域提供要求。對於部分模型,Google 也提供全球端點,以提升整體可用性並降低錯誤率。全域端點的配額可能與區域端點不同,且不支援資料落地規定。詳情請參閱 Vertex AI 模型即服務 (MaaS) 開放模型的「區域和全域端點」一節。

Vertex AI 中的生成式 AI 開放模型端點適用於下列區域:

美國

美國俄亥俄州哥倫布 (us-east5) 德州達拉斯 (us-south1) 愛荷華州 (us-central1) 內華達州拉斯維加斯 (us-west4) 美國南卡羅來納州蒙克斯科納 (us-east1) 北維吉尼亞州 (us-east4) 奧勒岡州 (us-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)

歐洲

荷蘭 (europe-west4) 比利時 (europe-west1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)

亞太地區

新加坡 (asia-southeast1) 台灣 (asia-east1)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)

全球

全球 (global)
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E (預先發布版)
Llama 4 Scout 17B-16E (預先發布版)
Llama 3.3 70B (預先發布版)
Llama 3.2 90B (預先發布版)
Llama 3.1 405B
Llama 3.1 70B (預先發布版)
Llama 3.1 8B (預先發布版)

後續步驟