O Google Cloud usa cotas para garantir a imparcialidade e reduzir
picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas
se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um
serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o
número de projetos que podem ser criados. As cotas protegem a comunidade de
usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam
você a gerenciar seus próprios recursos do Google Cloud.
O sistema de cotas do Cloud faz o seguinte:
Monitora o consumo de produtos e serviços do Google Cloud.
Restringe o consumo desses recursos.
Fornece um meio de solicitar mudanças no valor da cota
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota
permite, o sistema bloqueia o acesso ao recurso e a tarefa que
você está tentando executar falha.
As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta
a cota disponível em outro. Em um projeto do Google Cloud, as cotas
são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites para os recursos da Vertex AI. Esses limites não estão relacionados ao sistema de cotas. Não é possível alterar os limites.
Solicitar cotas
As cotas a seguir se aplicam às solicitações da Vertex AI para um determinado
projeto e região. Por exemplo, em um único projeto, é possível ter até
30.000 solicitações de previsão on-line por minuto em uma região e outras 30.000
em outra região.
Tipo de solicitação
Solicitações por minuto
Solicitações do gerenciamento de recursos (CRUD, na sigla em inglês)1
600
Solicitações de envio de jobs ou operações de longa duração (LRO, na sigla em inglês)
60
Solicitações de previsão on-line2
30.000
Capacidade de processamento da solicitação de previsão on-line
1,5 GB
Solicitações de explicação on-line
600
Solicitações de leitura da série temporal do TensorBoard da Vertex AI
60.000
Solicitações de metadados de ML (CRUD, na sigla em inglês)
12.000
Solicitações da Vizier da Vertex AI (CRUD, na sigla em inglês)
6.000
Solicitações de disponibilização on-line do Vertex AI Feature Store
300.000
Solicitações do Vertex ML Metadata
12.000
Número de tokens de contagem ou solicitações de tokens de computação
3.000
1 As solicitações de gerenciamento de recursos incluem qualquer solicitação que não seja um
job, uma LRO, uma solicitação de previsão on-line, uma
solicitação do Vertex AI Vizier, uma solicitação de metadados de ML, uma solicitação de leitura da API Timeseries Insights do TensorBoard da Vertex AI,
uma solicitação do Vertex AI Feature Store,
uma solicitação de streaming do Vertex AI Feature Store ou uma
solicitação da Pesquisa de vetor .
2 Essa cota se aplica apenas a endpoints públicos. Os endpoints particulares
têm solicitações ilimitadas por minuto.
Os jobs ou as LROs incluem as seguintes solicitações:
Criar ou excluir um conjunto de dados.
Importe ou exporte dados de ou para um conjunto de dados.
Crie um endpoint.
Crie ou exclua um job personalizado.
Crie ou exclua um job de rotulagem de dados.
Crie ou exclua um job de ajuste de hiperparâmetros.
Crie ou exclua um job de previsão em lote.
Crie ou exclua um modelo.
Faça upload, exclua ou exporte um modelo.
Crie ou exclua um modelo de ambiente de execução do notebook.
Atribua, exclua, inicie ou faça upgrade de um ambiente de execução do notebook.
Crie, exclua ou atualize um monitor de modelo.
Crie ou exclua um job de monitoramento de modelo.
Para informações sobre cotas para modelos de IA generativa, consulte
IA generativa em cotas e limites da Vertex AI .
Cotas de modelos do AutoML
As cotas a seguir se aplicam a cada tipo de dados e objetivo em projetos
e regiões. Por exemplo, é possível implantar 10 modelos de
classificação de imagens do AutoML e 10 modelos de detecção de objetos de imagem do AutoML em uma região e um
projeto específicos, totalizando 20 modelos implantados.
Imagem
Classificação
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de treinamento simultâneos com o Explainable AI
2
Jobs de previsão em lote simultâneos
5
Jobs de implantação de modelo simultâneo
5
Jobs de cancelamento de implantação de modelos simultâneos
5
Número de modelos implantados
10
Detecção de objetos
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Número de modelos implantados
10
Tabular
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Número de modelos implantados
30
Texto A partir de 15 de setembro de 2024, só será possível personalizar
a classificação, a extração de entidades,
e os objetivos de análise de sentimento por meio da migração para os comandos e os ajustes do Vertex AI Gemini. O treinamento ou atualização
de modelos do AutoML na Vertex AI para classificação de texto, extração de entidades e objetivos de análise de sentimento
não estarão mais disponíveis. É possível continuar usando os modelos de AutoML Text na Vertex AI
até 15 de junho de 2025. Para uma comparação entre o AutoML Text e o Gemini, consulte Gemini para usuários de texto do AutoML . Para mais informações sobre como o Gemini oferece uma experiência do usuário aprimorada com
recursos aprimorados de comandos, consulte Introdução aos ajustes .
Para começar a ajustar, consulte Ajuste de modelos de texto do Gemini .
Classificação
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Número de modelos implantados
10
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Número de modelos implantados
10
Análise de sentimento
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Número de modelos implantados
10
Vídeo
Reconhecimento de ação
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Classificação
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Rastreamento de objetos
Cota
Valor
Jobs de treinamento simultâneos
5
Jobs de previsão em lote simultâneos
5
Limites de modelos do AutoML
Os limites a seguir se aplicam a cada tipo de dados para um determinado projeto e região. Por
exemplo, em um projeto e uma região específicos, é possível incluir no máximo
1.000.000 imagens em uma entrada de solicitação em lote.
Imagem
Tipo de limite
Valor
Tamanho do arquivo de imagem
Máximo: 30 MB
Imagens por conjunto de dados
Máximo: 1.000.000
Rótulos por conjunto de dados
Mínimo: 2 Máximo: 5.000
Imagens por rótulo
Mínimo: 10 Recomendado: 1.000
Tamanho do arquivo CSV de entrada em lote
Máximo: 100 MB
Número de imagens na entrada em lote
Máximo: 1.000.000
Tabular
Tipo de limite
Valor
Tamanho máximo
100 GB
Número de linhas
Entre 1.000 e 200.000.000 linhas
Quantidade de colunas
entre 2 e 1.000 colunas.
Número de importações de conjuntos de dados em execução simultânea
5 importações
Tamanho do arquivo CSV
Máximo: 10 GB por arquivo, até o total máximo de 100 GB
Texto A partir de 15 de setembro de 2024, só será possível personalizar
a classificação, a extração de entidades,
e os objetivos de análise de sentimento por meio da migração para os comandos e os ajustes do Vertex AI Gemini. O treinamento ou atualização
de modelos do AutoML na Vertex AI para classificação de texto, extração de entidades e objetivos de análise de sentimento
não estarão mais disponíveis. É possível continuar usando os modelos de AutoML Text na Vertex AI
até 15 de junho de 2025. Para uma comparação entre o AutoML Text e o Gemini, consulte Gemini para usuários de texto do AutoML . Para mais informações sobre como o Gemini oferece uma experiência do usuário aprimorada com
recursos aprimorados de comandos, consulte Introdução aos ajustes .
Para começar a ajustar, consulte Ajuste de modelos de texto do Gemini .
As contagens de caracteres consideram os caracteres como UTF-8.
Tipo de limite
Classificação
Extração de entidade
Análise de sentimento
Itens de treinamento
10 a 1.000.000
50 a 100.000
10 a 100.000
Rótulos por conjunto de dados
2 a 5.000
1 a 100
2 a 11
Comprimento do nome do rótulo
1 a 32
1 a 32
Número inteiro de 0 a 10
Duração do período anotado
N/A
1 a 100 caracteres
N/A
Itens de treinamento por rótulo
10 a 1.000.000
100 a 100.000
10 a 100.000
Tamanho do item de treinamento
10 MB
5.000.000 caracteres
128 KB (texto), 20 MB (PDF)
10 a 300.000 caracteres (texto)
128 KB (texto), 2 MB (PDF)
60.000 caracteres
Item enviado para previsão
128 KB (texto), 2 MB (PDF)
60.000 caracteres
20 MB
128 KB (texto), 2 MB (PDF)
60.000 caracteres
Itens por solicitação em lote
10.000
10.000
10.000
Vídeo
Tipo de limite
Valor
Duração máxima do vídeo
3 horas
Tamanho máximo do arquivo de vídeo
50 GB
Mínimos de rótulos por conjunto de dados
2
Mínimo de vídeos por rótulo
10 (1.000 é a recomendação)
Tamanho do arquivo CSV de entrada em lote
Máximo: 100 MB
Número de segmentos de vídeo na entrada em lote
Máximo: 1.000
Cotas de modelos treinados e personalizados
As cotas a seguir se aplicam a modelos treinadores personalizados da Vertex AI para um determinado projeto e região.
Observação: as CPUs e GPUs não são contabilizadas nas cotas do Compute Engine. Elas são contabilizadas separadamente e não podem ser usadas juntas.
Treinamento
Cota
Valor
Pipelines de treinamento personalizado simultâneos
2.000
Número de CPUs N1 e E2 simultâneas para treinamento, por região Região Valor us-west1
2.200
us-west2
20
us-west3
2.200
us-west4
20
us-central1
2.200
us-east1
2.200
us-east4
20
us-east5
450
us-south1
450
northamerica-northeast1
2.200
northamerica-northeast2
20
southamerica-east1
20
southamerica-west1
20
europe-west2
2.200
europe-west1
2.200
europe-west4
2.200
europe-west6
20
europe-west3
2.200
europe-north1europe-central2
20
europe-west8
20
europe-west9
450
europe-southwest1asia-south1
20
asia-southeast1
2.200
asia-southeast2
2.200
asia-east2
2.200
asia-east1
2.200
asia-northeast1
2.200
asia-northeast2
20
australia-southeast1
2.200
australia-southeast2
20
asia-northeast3
2.200
me-west1
450
me-central1
450
me-central2
450
europe-west12
450
africa-south1
450
Número de CPUs N2 simultâneas para treinamento, por região Região Valor us-west1
20
us-west2
20
us-west3
20
us-west4
20
us-central1
450
us-east1
20
us-east4
20
us-east5
450
us-south1
20
northamerica-northeast1
20
northamerica-northeast2
20
southamerica-east1
20
southamerica-west1
20
europe-west2
20
europe-west1
20
europe-west4
450
europe-west6
20
europe-west3
20
europe-north1europe-central2
20
europe-west8
20
europe-west9
450
europe-southwest1asia-south1
20
asia-southeast1
20
asia-southeast2
20
asia-east2
20
asia-east1
450
asia-northeast1
20
asia-northeast2
20
australia-southeast1
20
australia-southeast2
20
asia-northeast3
20
me-west1
20
me-central1
450
me-central2
450
europe-west12
450
africa-south1
450
Número de CPUs M1 simultâneas para treinamento, por região Região Valor us-west1
0
us-west2
0
us-west3
0
us-west4
0
us-central1
0
us-east1
0
us-east4
0
us-east5
0
us-south1
0
northamerica-northeast1
0
northamerica-northeast2
0
southamerica-east1
0
southamerica-west1
0
europe-west2
0
europe-west1
0
europe-west4
0
europe-west6
0
europe-west3
0
europe-north1europe-central2
0
europe-west8
0
europe-west9
0
europe-southwest1asia-south1
0
asia-southeast1
0
asia-southeast2
0
asia-east2
0
asia-east1
0
asia-northeast1
0
asia-northeast2
0
australia-southeast1
0
australia-southeast2
0
asia-northeast3
0
me-west1
0
me-central1
0
me-central2
0
europe-west12
0
africa-south1
0
Número de CPUs C2 simultâneas para treinamento, por região Região Valor us-west1
20
us-west2
20
us-west3
20
us-west4
20
us-central1
450
us-east1
20
us-east4
20
us-east5
450
us-south1
20
northamerica-northeast1
20
northamerica-northeast2
20
southamerica-east1
20
southamerica-west1
20
europe-west2
20
europe-west1
20
europe-west4
450
europe-west6
20
europe-west3
20
europe-north1europe-central2
20
europe-west8
20
europe-west9
450
europe-southwest1asia-south1
20
asia-southeast1
20
asia-southeast2
20
asia-east2
20
asia-east1
450
asia-northeast1
20
asia-northeast2
20
australia-southeast1
20
australia-southeast2
20
asia-northeast3
20
me-west1
20
me-central1
20
me-central2
20
europe-west12
20
africa-south1
20
Número de CPUs A2 simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
Ilimitado
us-east1
Ilimitado
us-east4
Ilimitado
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
Ilimitado
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Ilimitado
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Ilimitado
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de CPUs A3 simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
Ilimitado
us-east1
Indisponível
us-east4
Indisponível
us-east5
Ilimitado
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
Ilimitado
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Ilimitado
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs P4 simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
6
us-west3
Indisponível
us-west4
Indisponível
us-central1
6
us-east1
Indisponível
us-east4
1
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
6
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
6
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
6
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
6
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs T4 simultâneas para treinamento, por região Região Valor us-west1
2
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
12
us-east1
2
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
6
europe-west1
Indisponível
europe-west4
2
europe-west6
Indisponível
europe-west3
0
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
1
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
6
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
1
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs L4 simultâneas para treinamento, por região Região Valor us-west1
0
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
0
us-east1
0
us-east4
0
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
0
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
0
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
0
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs P100 simultâneas para treinamento, por região Região Valor us-west1
30
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
56
us-east1
30
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
30
europe-west4
Indisponível
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
30
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
6
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs V100 simultâneas para treinamento, por região Região Valor us-west1
6
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
6
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
6
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
6
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs A100 simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
8
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
8
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
8
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs A100 de 80 GB simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
0
us-east1
Indisponível
us-east4
0
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
0
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
0
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Se você tiver interesse, consulte a documentação de cotas .
Número de GPUs H100 simultâneas para treinamento, por região Região Valor us-west1
0
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
0
us-east1
Indisponível
us-east4
0
us-east5
0
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
0
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Se você tiver interesse, consulte a documentação de cotas .
Número de núcleos simultâneos de TPU V2 para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
8
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
8
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
8
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de núcleos de pod simultâneos de TPU V2 para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
Indisponível
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
Indisponível
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de núcleos de TPU V3 simultâneos para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
8
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
8
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
8
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de núcleos de pod simultâneos da TPU V3 para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
Indisponível
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
Indisponível
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Uso HDD (GB) durante o treinamento, por região Região Valor us-west1
180.000
us-west2
3.600
us-west3
180.000
us-west4
3.600
us-central1
180.000
us-east1
180.000
us-east4
3.600
us-east5
3.600
us-south1
180.000
northamerica-northeast1
180.000
northamerica-northeast2
3.600
southamerica-east1
3.600
southamerica-west1
3.600
europe-west2
180.000
europe-west1
180.000
europe-west4
180.000
europe-west6
3.600
europe-west3
180.000
europe-north1europe-central2
3.600
europe-west8
3.600
europe-west9
180.000
europe-southwest1asia-south1
3.600
asia-southeast1
180.000
asia-southeast2
180.000
asia-east2
180.000
asia-east1
180.000
asia-northeast1
180.000
asia-northeast2
3.600
australia-southeast1
180.000
australia-southeast2
3.600
asia-northeast3
180.000
me-west1
180.000
me-central1
3.600
me-central2
3.600
europe-west12
3.600
africa-south1
3.600
Uso do SSD (GB) durante o treinamento, por região Região Valor us-west1
75.000
us-west2
450
us-west3
75.000
us-west4
450
us-central1
75.000
us-east1
75.000
us-east4
450
us-east5
450
us-south1
75.000
northamerica-northeast1
75.000
northamerica-northeast2
450
southamerica-east1
450
southamerica-west1
450
europe-west2
75.000
europe-west1
75.000
europe-west4
75.000
europe-west6
450
europe-west3
75.000
europe-north1europe-central2
450
europe-west8
450
europe-west9
75.000
europe-southwest1asia-south1
450
asia-southeast1
75.000
asia-southeast2
75.000
asia-east2
75.000
asia-east1
75.000
asia-northeast1
75.000
asia-northeast2
450
australia-southeast1
75.000
australia-southeast2
450
asia-northeast3
75.000
me-west1
75.000
me-central1
450
me-central2
450
europe-west12
450
africa-south1
450
Disponibilização
Cota
Valor
Número de modelos personalizados implantados
100
Número de CPUs simultâneas para veiculação, por região Região Valor us-west1
2.200
us-west2
2.200
us-west3
2.200
us-west4
16
us-central1
2.200
us-east1
2.200
us-east4
2.200
us-east5
16
us-south1
450
northamerica-northeast1
2.200
northamerica-northeast2
450
southamerica-east1
2.200
southamerica-west1
450
europe-west2
2.200
europe-west1
2.200
europe-west4
2.200
europe-west6
2.200
europe-west3
2.200
europe-north1europe-central2
16
europe-west8
16
europe-west9
16
europe-southwest1asia-south1
16
asia-southeast1
2.200
asia-southeast2
2.200
asia-east2
2.200
asia-east1
2.200
asia-northeast1
2.200
asia-northeast2
16
australia-southeast1
2.200
australia-southeast2
16
asia-northeast3
2.200
me-west1
450
me-central1
16
me-central2
16
europe-west12
16
africa-south1
16
Número de GPUs P100 simultâneas para treinamento, por região Região Valor us-west1
30
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
56
us-east1
30
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
30
europe-west4
Indisponível
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
30
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs P4 simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
6
us-west3
Indisponível
us-west4
Indisponível
us-central1
6
us-east1
Indisponível
us-east4
6
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
6
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
6
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
6
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
6
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs T4 simultâneas para treinamento, por região Região Valor us-west1
12
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
12
us-east1
12
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
12
europe-west1
Indisponível
europe-west4
12
europe-west6
Indisponível
europe-west3
0
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
6
asia-southeast2
Indisponível
asia-east2
12
asia-east1
6
asia-northeast1
6
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
6
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs L4 simultâneas para treinamento, por região Região Valor us-west1
28
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
28
us-east1
28
us-east4
28
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
28
europe-west1
28
europe-west4
28
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
28
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
28
asia-northeast1
28
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs V100 simultâneas para treinamento, por região Região Valor us-west1
6
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
6
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
6
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs A100 simultâneas para treinamento, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
14
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
14
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
14
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
14
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
14
me-west1
1
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de GPUs A100 de 80 GB simultâneas para disponibilização, por região Região Valor us-west1
Indisponível
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
0
us-east1
Indisponível
us-east4
0
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
0
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
0
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Número de ícones de TPU v5e para exibição, por região Região Valor us-west1
4
us-west2
Indisponível
us-west3
Indisponível
us-west4
Indisponível
us-central1
Indisponível
us-east1
Indisponível
us-east4
Indisponível
us-east5
Indisponível
us-south1
Indisponível
northamerica-northeast1
Indisponível
northamerica-northeast2
Indisponível
southamerica-east1
Indisponível
southamerica-west1
Indisponível
europe-west2
Indisponível
europe-west1
Indisponível
europe-west4
Indisponível
europe-west6
Indisponível
europe-west3
Indisponível
europe-north1europe-central2
Indisponível
europe-west8
Indisponível
europe-west9
Indisponível
europe-southwest1asia-south1
Indisponível
asia-southeast1
Indisponível
asia-southeast2
Indisponível
asia-east2
Indisponível
asia-east1
Indisponível
asia-northeast1
Indisponível
asia-northeast2
Indisponível
australia-southeast1
Indisponível
australia-southeast2
Indisponível
asia-northeast3
Indisponível
me-west1
Indisponível
me-central1
Indisponível
me-central2
Indisponível
europe-west12
Indisponível
africa-south1
Indisponível
Vertex AI Feature Store
Nesta seção, listamos as cotas e os limites para o seguinte:
Vertex AI Feature Store
As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um
único projeto, é possível ter 200 nós de exibição on-line em us-central1
e
outros 50 nós em us-east4
.
Cota
Valor
Solicitações de veiculação on-line por minuto
300.000
Número máximo de instâncias FeatureOnlineStore
10
Número máximo de solicitações de pesquisa por minuto
6.000.000
O número máximo de nós de veiculação on-line em todas as instâncias de FeatureOnlineStore
otimizadas no projeto
80
Número máximo de FeatureView
instâncias em todas as FeatureOnlineStore
instâncias
30
A Vertex AI Feature Store também tem os seguintes limites: Não é possível solicitar um aumento em nenhum dos limites na tabela a seguir:
Limite
Valor
Número máximo de FeatureGroup
recursos em um projeto e local
250
Número máximo de Feature
recursos em um FeatureGroup
10.000
Tamanho máximo dos dados de elementos por entidade
5 MB
Número de IDs de entidade por solicitação de veiculação on-line (FetchFeatureValues
)
1
Limite de armazenamento de um nó de exibição on-line otimizado
200 GB
Vertex AI Feature Store (legado)
As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um único projeto, é possível ter 75 jobs em lote simultâneos em us-central1
e outros 75 jobs em europe-west4
.
Cota
Valor
Solicitações de veiculação on-line por minuto
300.000
Solicitações de ingestão de streaming por minuto
60.000
Capacidade de processamento de gravação de ingestão de streaming por minuto
1,2 GB
Solicitações de criação de recursos por minuto
100
Nós de exibição on-line em todas as featurestores
30
Jobs em lote simultâneos (ingestão, veiculação e exclusão de valores de atributos combinados)
75
Solicitações simultâneas para excluir valores de recursos
1
Tipos de entidade em todas as featurestores
75
O Feature Store da Vertex AI também tem os seguintes limites. Não é possível solicitar um aumento em nenhum dos limites na tabela a seguir:
Limite
Valor
Limite de armazenamento de um nó de exibição on-line
5 TB
Total de dados na loja off-line
Ilimitado
Recursos por tipo de entidade
5.000
Número de solicitações de criação, atualização e exclusão de featurestores por dia, por projeto e por região
500
Para ingestão de streaming, o tamanho por solicitação
1 MB
Para leitura de streaming, o número de entidades que podem ser incluídas por solicitação
100
Para importação em lote, o número de arquivos que podem ser incluídos por
solicitação
5.000 para Avro ou 500 para CSV
Para exibição e exportações em lote, o número de recursos que é possível solicitar
5.000
Para ingestão de lote e de streaming, o carimbo de data/hora mais antigo para o qual os dados do recurso podem ser ingeridos
4.000 dias a partir da data atual
O limite de retenção de dados no Feature Store da Vertex AI tem o seguinte valor padrão, que você pode substituir:
Padrões de retenção de dados
Valor padrão
Retenção de dados no armazenamento off-line (carimbo de data/hora do valor do atributo mais antigo após o qual
os valores são excluídos)
4.000 dias a partir da data atual
Retenção de dados no armazenamento on-line (carimbo de data/hora do valor do atributo mais antigo após o qual
os valores são excluídos)
4.000 dias a partir da data atual
É possível modificar o limite de retenção de dados das seguintes maneiras:
Para substituir o limite de retenção de dados do armazenamento on-line, defina o parâmetro online_storage_ttl_days
ao criar ou atualizar um featurestore.
Para substituir o limite de retenção de dados do armazenamento off-line, defina o parâmetro offline_storage_ttl_days
ao criar ou atualizar um tipo de entidade.
.
Vector Search
As cotas a seguir se aplicam à Pesquisa de vetores para um determinado
projeto em cada região.
Cota
Valor
Operações simultâneas de criação de índice
5
Operações de atualização de índice simultâneas
5
Número de nós de índice implantados
50
Número de nós N2D implantados no índice
5
Número de índices
100
Solicitações de atualização de streaming por minuto
6.000
Capacidade de atualização de streaming (em KB) por minuto
120.000
Os limites a seguir se aplicam ao Vertex ML Metadata para um determinado projeto em cada região.
Limite
Valor
Tamanho máximo serializado do campo de metadados em um recurso
204.800 bytes
Tamanho máximo serializado dos esquemas de metadados
204.800 bytes
Vertex AI Pipelines
As cotas e limites a seguir se aplicam ao Vertex AI Pipelines para um
determinado projeto em cada região.
Cota
Valor
Como executar tarefas de pipeline em paralelo*
600
Execuções de pipeline simultâneas*
300
* Solicitações de execução de pipeline e tarefas que ultrapassam esse limite são enfileiradas até que os recursos estejam disponíveis.
O Vertex AI Pipelines tem os limites a seguir. Ao contrário das cotas,
não é possível solicitar um aumento.
Limite
Valor
Número de tarefas de pipeline por job
10.000
Artefatos de entrada e saída por tarefa de pipeline
100
Artefatos de entrada e saída por job de pipeline
10.000
Tamanho máximo do payload JSON que contém parâmetros de saída e artefatos por tarefa de pipeline
131.072 bytes
Tempo máximo de execução de uma tarefa de pipeline**
7 dias
* As tarefas de pipeline que forem executadas além desse limite serão canceladas.
Otimização da decisão na Vertex AI
As cotas e limites a seguir se aplicam à otimização de decisão da Vertex AI para um determinado projeto em cada região.
Cota
Valor
Resolver solicitação por minuto
30
Cotas e limites do Colab Enterprise
As cotas e os limites do Colab Enterprise são listados separadamente. Consulte Cotas e limites do Colab Enterprise .
Aumento de cotas
Se você quiser expandir alguma cota da Vertex AI,
use o Console do Google Cloud para solicitar um aumento de cota.
Para mais informações sobre como enviar uma solicitação de aumento de cota, consulte as
seções a seguir sobre Como trabalhar com cotas :
A seguir