Os modelos da Google e de parceiros, bem como as funcionalidades de IA generativa na Vertex AI, são expostos como endpoints regionais específicos e um endpoint global. Os pontos finais globais abrangem todo o mundo e oferecem maior disponibilidade e fiabilidade do que as regiões únicas.
Tenha em atenção que os pontos finais de modelos não garantem a disponibilidade de regiões nem o processamento de ML na região. Para informações sobre a residência de dados, consulte o artigo Residência de dados.
Ponto final global
Selecionar um ponto final global para os seus pedidos pode melhorar a disponibilidade geral e reduzir os erros de recursos esgotados (429). Não use o ponto final global se tiver requisitos de processamento de ML, porque não pode controlar nem saber para que região os seus pedidos de processamento de ML são enviados quando é feito um pedido.
Modelos suportados
A utilização do ponto final global é suportada para os seguintes modelos Google nas regiões especificadas. Para ver detalhes sobre as regiões que suportam o ponto final global, consulte o separador Global na tabela de localizações dos pontos finais dos modelos Google.
- Pré-visualização de imagens do Gemini 2.5 Flash
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
- Gemini 2.0 Flash-Lite
Para obter informações sobre a disponibilidade global de pontos finais para modelos de parceiros, consulte o separador Global na Google Cloud tabela de localizações de pontos finais de modelos de parceiros.
Use o ponto final global
Para usar o ponto final global, exclua a localização do nome do ponto final e configure a localização do recurso para global
. Por exemplo, o seguinte é o URL do ponto final global:
https://aiplatform.googleapis.com/v1/projects/test-project/locations/global/publishers/google/models/gemini-2.0-flash-001:generateContent
Para o SDK de IA gen da Google, crie um cliente que use a localização global
:
client = genai.Client(
vertexai=True, project='PROJECT_ID', location='global'
)
Para o SDK Vertex AI para Python,
inicialize o SDK com a localização global
:
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project='PROJECT_ID', location='global')
Limitações
As seguintes capacidades não estão disponíveis quando usa o ponto final global:
- Afinação
- Previsão em lote
- Corpus de geração aumentada por obtenção (RAG) (os pedidos RAG são suportados)
A utilização do ponto final global com débito processado é disponível apenas para os seguintes modelos:
Modelo | Versão do modelo suportada mais recente |
---|---|
Pré-visualização de imagens do Gemini 2.5 Flash (pré-visualização) | gemini-2.5-flash-image-preview |
Gemini 2.5 Flash-Lite | gemini-2.5-flash-lite |
Gemini 2.5 Pro | gemini-2.5-pro |
Gemini 2.5 Flash | gemini-2.5-flash |
Gemini 2.0 Flash | gemini-2.0-flash-001 |
Gemini 2.0 Flash-Lite | gemini-2.0-flash-lite-001 |
Localizações de pontos finais de modelos Google
Os pontos finais dos modelos Google para IA generativa na Vertex AI estão disponíveis nas seguintes regiões.
Estados Unidos
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Virgínia do Norte (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Incorporações para texto | |||||||
Incorporações para multimodal | |||||||
Imagen para legendagem e VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
|||||||
Veo 2
( veo-2.0-generate-001 ) |
|||||||
Veo 3
( veo-3.0-generate-001 ) |
|||||||
Veo 3 Fast
( veo-3.0-fast-generate-001 ) |
|||||||
Veo 3 (pré-visualização)
( veo-3.0-generate-preview ) |
|||||||
Veo 3 Fast (pré-visualização)
( veo-3.0-fast-generate-preview ) |
Canadá
Montreal (northamerica-northeast1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* |
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Incorporações para texto | |
Incorporações para multimodal | |
Imagen para legendagem e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
América do Sul
São Paulo, Brasil (southamerica-east1) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Incorporações para texto | |
Incorporações para multimodal | |
Imagen para legendagem e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
Europa
Países Baixos (europe-west4) | Paris, França (europe-west9) | Londres, Reino Unido (europe-west2) | Frankfurt, Alemanha (europe-west3) | Bélgica (europe-west1) | Zurique, Suíça (europe-west6) | Madrid, Espanha (europe-southwest1) | Milão, Itália (europe-west8) | Finlândia (europe-north1) | Varsóvia, Polónia (europe-central2) | |
---|---|---|---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
+ | * | * | |||||||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
||||||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
||||||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
||||||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
||||||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
||||||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
||||||||||
Gemini Embeddings ( gemini-embedding-001 ) |
||||||||||
Incorporações para texto | ||||||||||
Incorporações para multimodal | ||||||||||
Imagen para legendagem e VQA | ||||||||||
Imagen ( imagegeneration@002 ) |
||||||||||
Imagen 2 ( imagegeneration@005 ) |
||||||||||
Imagen 2 ( imagegeneration@006 ) |
||||||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
||||||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
||||||||||
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
||||||||||
Imagen 3imagen-3.0-generate-002 |
||||||||||
Imagen 4
( imagen-4.0-generate-001 ) |
||||||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
||||||||||
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
Ásia-Pacífico
Tóquio, Japão (asia-northeast1) | Sydney, Austrália (australia-southeast1) | Singapura (asia-southeast1) | Seul, Coreia (asia-northeast3) | Taiwan (asia-east1) | Hong Kong, China (asia-east2) | Mumbai, Índia (asia-south1) | |
---|---|---|---|---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
* | * | * | * | * | ||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||||||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||||||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||||||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||||||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||||||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||||||
Gemini Embeddings ( gemini-embedding-001 ) |
|||||||
Incorporações para texto | |||||||
Incorporações para multimodal | |||||||
Imagen para legendagem e VQA | |||||||
Imagen ( imagegeneration@002 ) |
|||||||
Imagen 2 ( imagegeneration@005 ) |
|||||||
Imagen 2 ( imagegeneration@006 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||||||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||||||
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|||||||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||||||
Imagen 4
( imagen-4.0-generate-001 ) |
|||||||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||||||
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
Médio Oriente
Dammam, Arábia Saudita (me-central2) | Doha, Catar (me-central1) | Telavive, Israel (me-west1) | |
---|---|---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|||
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|||
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|||
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|||
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|||
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|||
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|||
Gemini Embeddings ( gemini-embedding-001 ) |
|||
Incorporações para texto | |||
Incorporações para multimodal | |||
Imagen para legendagem e VQA | |||
Imagen ( imagegeneration@002 ) |
|||
Imagen 2 ( imagegeneration@005 ) |
|||
Imagen 2 ( imagegeneration@006 ) |
|||
Imagen 3 ( imagen-3.0-generate-001 ) |
|||
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|||
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|||
Imagen 3 ( imagen-3.0-generate-002 ) |
|||
Imagen 4
( imagen-4.0-generate-001 ) |
|||
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|||
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
Global
Global (global) | |
---|---|
Gemini 2.5 Flash ( gemini-2.5-flash ) |
|
Gemini 2.5 Pro ( gemini-2.5-pro ) |
|
Gemini 2.5 Flash-Lite ( gemini-2.5-flash-lite ) |
|
Gemini 2.0 Flash ( gemini-2.0-flash-001 ) |
|
Gemini 2.0 Flash-Lite ( gemini-2.0-flash-lite-001 ) |
|
Gemini 1.5 Pro ( gemini-1.5-pro-002 ) |
|
Gemini 1.5 Flash ( gemini-1.5-flash-002 ) |
|
Gemini Embeddings ( gemini-embedding-001 ) |
|
Incorporações para texto | |
Incorporações para multimodal | |
Imagen para legendagem e VQA | |
Imagen ( imagegeneration@002 ) |
|
Imagen 2 ( imagegeneration@005 ) |
|
Imagen 2 ( imagegeneration@006 ) |
|
Imagen 3 ( imagen-3.0-generate-001 ) |
|
Imagen 3 Fast ( imagen-3.0-fast-generate-001 ) |
|
Edição e personalização do Imagen 3 ( imagen-3.0-capability-001 ) |
|
Imagen 3 ( imagen-3.0-generate-002 ) |
|
Imagen 4
( imagen-4.0-generate-001 ) |
|
Imagen 4
( imagen-4.0-fast-generate-001 ) |
|
Geração experimental do Imagen 4 Ultra
( imagen-4.0-ultra-generate-001 ) |
* A região só está disponível quando usa o débito processado de zona única e o ajuste fino supervisionado não é suportado nesta região.
+ A otimização precisa supervisionada não é suportada nesta região.
Google Cloud localizações de pontos finais do modelo de parceiro
A Google publica pedidos da região que especificou. Para alguns modelos, a Google também oferece um ponto final global para melhorar a disponibilidade geral e reduzir as taxas de erro. O ponto final global pode ter um conjunto separado de quotas do ponto final regional e não suporta requisitos de residência de dados. Para mais informações, consulte a secção "Ponto final regional e global" em Modelos de parceiros da Vertex AI para MaaS.
Os pontos finais dos modelos de parceiros para IA generativa no Vertex AI estão disponíveis nas seguintes regiões:
Estados Unidos
Columbus, Ohio (us-east5) | Dallas, Texas (us-south1) | Iowa (us-central1) | Las Vegas, Nevada (us-west4) | Moncks Corner, Carolina do Sul (us-east1) | Virgínia do Norte (us-east4) | Oregon (us-west1) | |
---|---|---|---|---|---|---|---|
Claude Opus 4.1 da Anthropic | |||||||
Claude Opus 4 da Anthropic | |||||||
Claude Sonnet 4 da Anthropic | |||||||
Claude 3.7 Sonnet da Anthropic | |||||||
Claude 3.5 Haiku da Anthropic | |||||||
Claude 3 Haiku da Anthropic | |||||||
DeepSeek R1 (0528) | |||||||
Llama 4 Maverick 17B-128E (pré-visualização) | |||||||
Llama 4 Scout 17B-16E (pré-visualização) | |||||||
Llama 3.3 70B (pré-visualização) | |||||||
Llama 3.2 90B (pré-visualização) | |||||||
Llama 3.1 405B | |||||||
Llama 3.1 70B (pré-visualização) | |||||||
Llama 3.1 8B (pré-visualização) | |||||||
Mistral OCR (25.05) | |||||||
Mistral Small 3.1 (25/03) | |||||||
Mistral Large | |||||||
Codestral |
Europa
Países Baixos (europe-west4) | Bélgica (europe-west1) | ||
---|---|---|---|
Claude Opus 4.1 da Anthropic | |||
Claude Opus 4 da Anthropic | |||
Claude Sonnet 4 da Anthropic | |||
Claude 3.7 Sonnet da Anthropic | |||
Claude 3.5 Haiku da Anthropic | |||
Claude 3 Haiku da Anthropic | |||
DeepSeek R1 (0528) | |||
Llama 4 Maverick 17B-128E (pré-visualização) | |||
Llama 4 Scout 17B-16E (pré-visualização) | |||
Llama 3.3 70B (pré-visualização) | |||
Llama 3.2 90B (pré-visualização) | |||
Llama 3.1 405B | |||
Llama 3.1 70B (pré-visualização) | |||
Llama 3.1 8B (pré-visualização) | |||
Mistral OCR (25.05) | |||
Mistral Small 3.1 (25/03) | |||
Mistral Large | |||
Codestral |
Ásia-Pacífico
Singapura (asia-southeast1) | Taiwan (asia-east1) | |
---|---|---|
Claude Opus 4.1 da Anthropic | ||
Claude Opus 4 da Anthropic | ||
Claude Sonnet 4 da Anthropic | ||
Claude 3.7 Sonnet da Anthropic | ||
Claude 3.5 Haiku da Anthropic | ||
Claude 3 Haiku da Anthropic | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (pré-visualização) | ||
Llama 4 Scout 17B-16E (pré-visualização) | ||
Llama 3.3 70B (pré-visualização) | ||
Llama 3.2 90B (pré-visualização) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (pré-visualização) | ||
Llama 3.1 8B (pré-visualização) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large | ||
Codestral |
Global
Global (global) | ||
---|---|---|
Claude Opus 4.1 da Anthropic | ||
Claude Opus 4 da Anthropic | ||
Claude Sonnet 4 da Anthropic | ||
Claude 3.7 Sonnet da Anthropic | ||
Claude 3.5 Haiku da Anthropic | ||
Claude 3 Haiku da Anthropic | ||
DeepSeek R1 (0528) | ||
Llama 4 Maverick 17B-128E (pré-visualização) | ||
Llama 4 Scout 17B-16E (pré-visualização) | ||
Llama 3.3 70B (pré-visualização) | ||
Llama 3.2 90B (pré-visualização) | ||
Llama 3.1 405B | ||
Llama 3.1 70B (pré-visualização) | ||
Llama 3.1 8B (pré-visualização) | ||
Mistral OCR (25.05) | ||
Mistral Small 3.1 (25/03) | ||
Mistral Large | ||
Codestral |
O que se segue?
- Para um tutorial de bloco de notas que demonstra o ponto final global, consulte o artigo Introdução ao ponto final global do Vertex AI.
- Saiba mais sobre a residência de dados da IA generativa na Vertex AI.
- Saiba mais sobre as Google Cloud regiões.
- Saiba mais sobre os controlos de segurança por funcionalidade.
- Saiba mais sobre os modelos que oferecem suporte de IA generativa na Vertex AI. Consulte a referência do modelo base da IA generativa.
- Saiba mais sobre as localizações do Vertex AI.