部署和端点

Vertex AI 上的 Google 及合作伙伴模型以及生成式 AI 功能以特定区域级端点和全球端点的形式公开。全球端点覆盖全球,与单区域相比,可提供更高的可用性和可靠性。

请注意,模型端点不保证区域可用性或区域内机器学习处理功能。如需了解数据驻留,请参阅数据驻留

全球端点

为请求选择全球端点可以提高整体可用性,同时减少资源耗尽 (429) 错误。如果您有机器学习处理要求,请勿使用全球端点,因为在发出请求时,您无法控制或知道自己的机器学习处理请求会发送到哪个区域。

支持的模型

以下 Google 模型支持在指定区域中使用全球端点。如需详细了解哪些区域支持全球端点,请参阅 Google 模型端点位置表中的全球标签页。

如需了解合作伙伴模型的全球端点可用性,请参阅 Google Cloud 合作伙伴模型端点位置表中的全球标签页。

使用全球端点

如需使用全球端点,请清除端点名称中的相应位置,并将资源位置配置为 global。例如,下面就是一个全球端点网址:

https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent

对于 Google Gen AI SDK,请创建一个使用 global 位置的客户端:

client = genai.Client(
    vertexai=True, project='PROJECT_ID', location='global'
)

对于 Vertex AI SDK for Python,请使用 global 位置初始化 SDK:

import vertexai
from vertexai.generative_models import GenerativeModel

vertexai.init(project='PROJECT_ID', location='global')

限制

使用全球端点时,以下功能不可用:

  • 调优
  • 批量预测
  • 检索增强生成 (RAG) 语料库(支持 RAG 请求)

只有以下模型支持将全球端点与预配吞吐量搭配使用:

模型 支持的最新模型版本
Gemini 2.5 Flash Image 预览版(预览版 gemini-2.5-flash-image-preview
Gemini 2.5 Flash-Lite gemini-2.5-flash-lite
Gemini 2.5 Pro gemini-2.5-pro
Gemini 2.5 Flash gemini-2.5-flash
Gemini 2.0 Flash gemini-2.0-flash-001
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite-001

Google 模型端点位置

Vertex AI 上的生成式 AI 的 Google 模型端点在以下区域提供。

美国

俄亥俄州哥伦布市 (us-east5) 德克萨斯州达拉斯 (us-south1) 爱荷华 (us-central1) 内华达州拉斯维加斯 (us-west4) 美国南卡罗来纳州蒙克斯科纳 (us-east1) 北弗吉尼亚 (us-east4) 俄勒冈 (us-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)
Veo 2
(veo-2.0-generate-001)
Veo 3
(veo-3.0-generate-001)
Veo 3 Fast
(veo-3.0-fast-generate-001)
Veo 3(预览版)
(veo-3.0-generate-preview)
Veo 3 Fast(预览版)
(veo-3.0-fast-generate-preview)

加拿大

蒙特利尔 (northamerica-northeast1)
Gemini 2.5 Flash
(gemini-2.5-flash)
*
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)

南美洲

巴西圣保罗 (southamerica-east1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)

欧洲

荷兰 (europe-west4) 法国巴黎 (europe-west9) 英国伦敦 (europe-west2) 德国法兰克福 (europe-west3) 比利时 (europe-west1) 瑞士苏黎世 (europe-west6) 西班牙马德里 (europe-southwest1) 意大利米兰 (europe-west8) 芬兰 (europe-north1) 波兰华沙 (europe-central2)
Gemini 2.5 Flash
(gemini-2.5-flash)
+ * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
imagen-3.0-generate-002
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)

亚太地区

日本东京 (asia-northeast1) 澳大利亚悉尼 (australia-southeast1) 新加坡 (asia-southeast1) 韩国首尔 (asia-northeast3) 台湾 (asia-east1) 中国香港 (asia-east2) 印度孟买 (asia-south1)
Gemini 2.5 Flash
(gemini-2.5-flash)
* * * * *
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)

中东

沙特阿拉伯达曼 (me-central2) 卡塔尔多哈 (me-central1) 以色列特拉维夫 (me-west1)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)

全球

全球 (global)
Gemini 2.5 Flash
(gemini-2.5-flash)
Gemini 2.5 Pro
(gemini-2.5-pro)
Gemini 2.5 Flash-Lite
(gemini-2.5-flash-lite)
Gemini 2.0 Flash
(gemini-2.0-flash-001)
Gemini 2.0 Flash-Lite
(gemini-2.0-flash-lite-001)
Gemini 1.5 Pro
(gemini-1.5-pro-002)
Gemini 1.5 Flash
(gemini-1.5-flash-002)
Gemini Embeddings
(gemini-embedding-001)
Embeddings for Text
Embeddings for Multimodal
Imagen for Captioning & VQA
Imagen
(imagegeneration@002)
Imagen 2
(imagegeneration@005)
Imagen 2
(imagegeneration@006)
Imagen 3
(imagen-3.0-generate-001)
Imagen 3 Fast
(imagen-3.0-fast-generate-001)
Imagen 3 修改和自定义
(imagen-3.0-capability-001)
Imagen 3
(imagen-3.0-generate-002)
Imagen 4
(imagen-4.0-generate-001)
Imagen 4
(imagen-4.0-fast-generate-001)
Imagen 4 Ultra Generate 实验版
(imagen-4.0-ultra-generate-001)

*该区域仅在使用单可用区预配吞吐量时可用,并且该区域不支持监督式微调。

+该区域不支持监督式微调。

Google Cloud 合作伙伴模型端点位置

Google 会从您指定的区域处理请求。对于部分模型,Google 还提供全球端点,以提高整体可用性并降低错误率。全球端点的配额可以独立于区域级端点而单独计算,并且不支持数据驻留要求。如需了解详情,请参阅 Vertex AI 中以 MaaS 形式提供的合作伙伴模型中的“区域级端点和全球端点”部分。

Vertex AI 上的生成式 AI 的合作伙伴模型端点在以下区域提供:

美国

俄亥俄州哥伦布市 (us-east5) 德克萨斯州达拉斯 (us-south1) 爱荷华 (us-central1) 内华达州拉斯维加斯 (us-west4) 美国南卡罗来纳州蒙克斯科纳 (us-east1) 北弗吉尼亚 (us-east4) 俄勒冈 (us-west1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
Llama 3.3 70B(预览版)
Llama 3.2 90B(预览版)
Llama 3.1 405B
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

欧洲

荷兰 (europe-west4) 比利时 (europe-west1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
Llama 3.3 70B(预览版)
Llama 3.2 90B(预览版)
Llama 3.1 405B
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

亚太地区

新加坡 (asia-southeast1) 台湾 (asia-east1)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
Llama 3.3 70B(预览版)
Llama 3.2 90B(预览版)
Llama 3.1 405B
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

全球

全球 (global)
Anthropic 的 Claude Opus 4.1
Anthropic 的 Claude Opus 4
Anthropic 的 Claude Sonnet 4
Anthropic 的 Claude 3.7 Sonnet
Anthropic 的 Claude 3.5 Haiku
Anthropic 的 Claude 3 Haiku
DeepSeek R1 (0528)
Llama 4 Maverick 17B-128E(预览版)
Llama 4 Scout 17B-16E(预览版)
Llama 3.3 70B(预览版)
Llama 3.2 90B(预览版)
Llama 3.1 405B
Llama 3.1 70B(预览版)
Llama 3.1 8B(预览版)
Mistral OCR (25.05)
Mistral Small 3.1 (25.03)
Mistral Large
Codestral

后续步骤