Vertex AI 上的 Google 及合作伙伴模型以及生成式 AI 功能以特定区域级端点和全球端点的形式公开。全球端点覆盖全球,与单区域相比,可提供更高的可用性和可靠性。
请注意,模型端点不保证区域可用性或区域内机器学习处理功能。如需了解数据驻留,请参阅数据驻留。
全球端点
为请求选择全球端点可以提高整体可用性,同时减少资源耗尽 (429) 错误。如果您有机器学习处理要求,请勿使用全球端点,因为在发出请求时,您无法控制或知道自己的机器学习处理请求会发送到哪个区域。
支持的模型
以下 Google 模型支持在指定区域中使用全球端点。如需详细了解哪些区域支持全球端点,请参阅 Google 模型端点位置表中的全球标签页。
- Gemini 2.5 Flash Image 预览版
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
如需了解合作伙伴模型的全球端点可用性,请参阅 Google Cloud 合作伙伴模型端点位置表中的全球标签页。
使用全球端点
如需使用全球端点,请清除端点名称中的相应位置,并将资源位置配置为 global
。例如,下面就是一个全球端点网址:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
对于 Google Gen AI SDK,请创建一个使用 global
位置的客户端:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
对于 Vertex AI SDK for Python,请使用 global
位置初始化 SDK:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
限制
使用全球端点时,以下功能不可用:
- 调优
- 批量预测
- 检索增强生成 (RAG) 语料库(支持 RAG 请求)
只有以下模型支持将全球端点与预配吞吐量搭配使用:
模型 | 支持的最新模型版本 |
---|---|
Gemini 2.5 Flash Image 预览版(预览版) | gemini-2.5-flash-image-preview |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Google 模型端点位置
Vertex AI 上的生成式 AI 的 Google 模型端点在以下区域提供。
美国
俄亥俄州哥伦布市 (us-east5) | 德克萨斯州达拉斯 (us-south1) | 爱荷华 (us-central1) | 内华达州拉斯维加斯 (us-west4) | 美国南卡罗来纳州蒙克斯科纳 (us-east1) | 北弗吉尼亚 (us-east4) | 俄勒冈 (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings for Text | |||||||
Embeddings for Multimodal | |||||||
Imagen for Captioning & VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 Fast
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3(预览版)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast(预览版)
( veo-3.0-fast-generate-preview ) |
加拿大
蒙特利尔 (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings for Text | |
Embeddings for Multimodal | |
Imagen for Captioning & VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
南美洲
巴西圣保罗 (southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings for Text | |
Embeddings for Multimodal | |
Imagen for Captioning & VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
欧洲
荷兰 (europe-west4) | 法国巴黎 (europe-west9) | 英国伦敦 (europe-west2) | 德国法兰克福 (europe-west3) | 比利时 (europe-west1) | 瑞士苏黎世 (europe-west6) | 西班牙马德里 (europe-southwest1) | 意大利米兰 (europe-west8) | 芬兰 (europe-north1) | 波兰华沙 (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
+ | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
||||||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Embeddings for Text | ||||||||||
Embeddings for Multimodal | ||||||||||
Imagen for Captioning & VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
亚太地区
日本东京 (asia-northeast1) | 澳大利亚悉尼 (australia-southeast1) | 新加坡 (asia-southeast1) | 韩国首尔 (asia-northeast3) | 台湾 (asia-east1) | 中国香港 (asia-east2) | 印度孟买 (asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | ||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Embeddings for Text | |||||||
Embeddings for Multimodal | |||||||
Imagen for Captioning & VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
中东
沙特阿拉伯达曼 (me-central2) | 卡塔尔多哈 (me-central1) | 以色列特拉维夫 (me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||
Gemini Embeddings ( gemini-embedding-001 ) |
|||
Embeddings for Text | |||
Embeddings for Multimodal | |||
Imagen for Captioning & VQA | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
|||
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
|||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||
Imagen 4
( imagen-4.0-generate-001 ) |
|||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
全球
全球 (global) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Embeddings for Text | |
Embeddings for Multimodal | |
Imagen for Captioning & VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Imagen 3 修改和自定义 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Imagen 4 Ultra Generate 实验版
( imagen-4.0-ultra-generate-001 ) |
*该区域仅在使用单可用区预配吞吐量时可用,并且该区域不支持监督式微调。
+该区域不支持监督式微调。
Google Cloud 合作伙伴模型端点位置
Google 会从您指定的区域处理请求。对于部分模型,Google 还提供全球端点,以提高整体可用性并降低错误率。全球端点的配额可以独立于区域级端点而单独计算,并且不支持数据驻留要求。如需了解详情,请参阅 Vertex AI 中以 MaaS 形式提供的合作伙伴模型中的“区域级端点和全球端点”部分。
Vertex AI 上的生成式 AI 的合作伙伴模型端点在以下区域提供:
美国
俄亥俄州哥伦布市 (us-east5) | 德克萨斯州达拉斯 (us-south1) | 爱荷华 (us-central1) | 内华达州拉斯维加斯 (us-west4) | 美国南卡罗来纳州蒙克斯科纳 (us-east1) | 北弗吉尼亚 (us-east4) | 俄勒冈 (us-west1) | |
---|---|---|---|---|---|---|---|
Anthropic 的 Claude Opus 4.1 | |||||||
Anthropic 的 Claude Opus 4 | |||||||
Anthropic 的 Claude Sonnet 4 | |||||||
Anthropic 的 Claude 3.7 Sonnet | |||||||
Anthropic 的 Claude 3.5 Haiku | |||||||
Anthropic 的 Claude 3 Haiku | |||||||
DeepSeek R1 (0528) | |||||||
Llama 4 Maverick 17B-128E(预览版) | |||||||
Llama 4 Scout 17B-16E(预览版) | |||||||
Llama 3.3 70B(预览版) | |||||||
Llama 3.2 90B(预览版) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B(预览版) | |||||||
Llama 3.1 8B(预览版) | |||||||
Mistral OCR (25.05) | |||||||
Mistral Small 3.1 (25.03) | |||||||
Mistral Large | |||||||
Codestral |
欧洲
荷兰 (europe-west4) | 比利时 (europe-west1) | ||
---|---|---|---|
Anthropic 的 Claude Opus 4.1 | |||
Anthropic 的 Claude Opus 4 | |||
Anthropic 的 Claude Sonnet 4 | |||
Anthropic 的 Claude 3.7 Sonnet | |||
Anthropic 的 Claude 3.5 Haiku | |||
Anthropic 的 Claude 3 Haiku | |||
DeepSeek R1 (0528) | |||
Llama 4 Maverick 17B-128E(预览版) | |||
Llama 4 Scout 17B-16E(预览版) | |||
Llama 3.3 70B(预览版) | |||
Llama 3.2 90B(预览版) | |||
Llama 3.1 405B | |||
Llama 3.1 70B(预览版) | |||
Llama 3.1 8B(预览版) | |||
Mistral OCR (25.05) | |||
Mistral Small 3.1 (25.03) | |||
Mistral Large | |||
Codestral |
亚太地区
新加坡 (asia-southeast1) | 台湾 (asia-east1) | |
---|---|---|
Anthropic 的 Claude Opus 4.1 | ||
Anthropic 的 Claude Opus 4 | ||
Anthropic 的 Claude Sonnet 4 | ||
Anthropic 的 Claude 3.7 Sonnet | ||
Anthropic 的 Claude 3.5 Haiku | ||
Anthropic 的 Claude 3 Haiku | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E(预览版) | ||
Llama 4 Scout 17B-16E(预览版) | ||
Llama 3.3 70B(预览版) | ||
Llama 3.2 90B(预览版) | ||
Llama 3.1 405B | ||
Llama 3.1 70B(预览版) | ||
Llama 3.1 8B(预览版) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large | ||
Codestral |
全球
全球 (global) | ||
---|---|---|
Anthropic 的 Claude Opus 4.1 | ||
Anthropic 的 Claude Opus 4 | ||
Anthropic 的 Claude Sonnet 4 | ||
Anthropic 的 Claude 3.7 Sonnet | ||
Anthropic 的 Claude 3.5 Haiku | ||
Anthropic 的 Claude 3 Haiku | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E(预览版) | ||
Llama 4 Scout 17B-16E(预览版) | ||
Llama 3.3 70B(预览版) | ||
Llama 3.2 90B(预览版) | ||
Llama 3.1 405B | ||
Llama 3.1 70B(预览版) | ||
Llama 3.1 8B(预览版) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25.03) | ||
Mistral Large | ||
Codestral |
后续步骤
- 如需查看演示全球端点的笔记本教程,请参阅 Vertex AI 全球端点简介。
- 详细了解 Vertex AI 上的生成式 AI 数据驻留。
- 了解 Google Cloud 区域。
- 详细了解各种功能的安全控制措施。
- 了解提供 Vertex AI 上的生成式 AI 支持的模型。请参阅生成式 AI 基础模型参考文档。
- 了解 Vertex AI 位置。