Cotas e limites da Vertex AI

Uma cota restringe quanto de um determinado recurso compartilhado do Google Cloud o projeto do Google Cloud pode usar, incluindo hardware, software e componentes de rede. Dessa forma, as cotas fazem parte de um sistema que:

  • monitora o uso ou o consumo de produtos e serviços do Google Cloud;
  • restringe o consumo desses recursos por motivos, que garantem imparcialidade e reduzem picos de uso;
  • mantém as configurações que aplicam automaticamente restrições prescritas;
  • fornece um meio de solicitar ou faz alterações na cota.

Na maioria dos casos, quando uma cota é excedida, o sistema bloqueia imediatamente o acesso ao recurso relevante do Google. Além disso, a tarefa que você está tentando executar falha. Na maioria dos casos, as cotas se aplicam a todos os projetos do Google Cloud. Além disso, elas são compartilhadas entre todos os aplicativos e endereços IP que usam esse projeto.

Também há limites para os recursos da Vertex AI. Esses limites não estão relacionados ao sistema de cotas. Não é possível alterar os limites.

Solicitar cotas

As cotas a seguir se aplicam às solicitações da Vertex AI para um determinado projeto e região. Por exemplo, em um único projeto, é possível ter até 30.000 solicitações de previsão on-line por minuto em uma região e outras 30.000 em outra região.

Tipo de solicitação Solicitações por minuto
Solicitações do gerenciamento de recursos (CRUD, na sigla em inglês)1 600
Solicitações de envio de jobs ou operações de longa duração (LRO, na sigla em inglês) 60
Solicitações de previsão on-line2 30.000
Capacidade de processamento da solicitação de previsão on-line 1,5 GB
Solicitações de explicação on-line 600
Solicitações de leitura da série temporal do TensorBoard da Vertex AI 60.000
Solicitações de metadados de ML (CRUD, na sigla em inglês) 12.000
Solicitações da Vizier da Vertex AI (CRUD, na sigla em inglês) 6.000
Solicitações de disponibilização on-line do Vertex AI Feature Store 300.000
Solicitações do Vertex ML Metadata 12.000
Número de tokens de contagem ou solicitações de tokens de computação 3.000

1As solicitações de gerenciamento de recursos incluem qualquer solicitação que não seja um job, uma LRO, uma solicitação de previsão on-line, uma solicitação do Vertex AI Vizier, uma solicitação de metadados de ML, uma solicitação de leitura da API Timeseries Insights do TensorBoard da Vertex AI, uma solicitação do Vertex AI Feature Store, uma solicitação de streaming do Vertex AI Feature Store ou uma solicitação da Pesquisa de vetor.

2 Essa cota se aplica apenas a endpoints públicos. Os endpoints particulares têm solicitações ilimitadas por minuto.

Os jobs ou as LROs incluem as seguintes solicitações:

  • Criar ou excluir um conjunto de dados.
  • Importe ou exporte dados de ou para um conjunto de dados.
  • Crie um endpoint.
  • Crie ou exclua um job personalizado.
  • Crie ou exclua um job de rotulagem de dados.
  • Crie ou exclua um job de ajuste de hiperparâmetros.
  • Crie ou exclua um job de previsão em lote.
  • Crie ou exclua um modelo.
  • Faça upload, exclua ou exporte um modelo.
  • Crie ou exclua um modelo de ambiente de execução do notebook.
  • Atribua, exclua, inicie ou faça upgrade de um ambiente de execução do notebook.
  • Crie, exclua ou atualize um monitor de modelo.
  • Crie ou exclua um job de monitoramento de modelo.


Para informações sobre cotas para modelos de IA generativa, consulte IA generativa em cotas e limites da Vertex AI.

Cotas de modelos do AutoML

As cotas a seguir se aplicam a cada tipo de dados e objetivo em projetos e regiões. Por exemplo, é possível implantar 10 modelos de classificação de imagens do AutoML e 10 modelos de detecção de objetos de imagem do AutoML em uma região e um projeto específicos, totalizando 20 modelos implantados.

Imagem

Classificação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de treinamento simultâneos com o Explainable AI 2
Jobs de previsão em lote simultâneos 5
Jobs de implantação de modelo simultâneo 5
Jobs de cancelamento de implantação de modelos simultâneos 5
Número de modelos implantados 10

Detecção de objetos

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Tabular

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 30

Texto

Classificação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Extração de entidades

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Análise de sentimento

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Vídeo

Reconhecimento de ação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5

Classificação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5

Rastreamento de objetos

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5

Limites específicos do AutoML Video Intelligence

Veja a seguir as restrições atuais no uso do AutoML Video Intelligence.

Tipo de limites Valor
Duração máxima do vídeo 3 horas
Tamanho máximo do arquivo de vídeo 50 GB
Mínimos de rótulos por conjunto de dados 2
Mínimo de vídeos por rótulo 10 (1.000 é a recomendação)
Tamanho do arquivo CSV de entrada em lote Máximo 100 MB
Número de segmentos de vídeo na entrada em lote Máximo: 1.000

Cotas de modelos treinados e personalizados

As cotas a seguir se aplicam a modelos treinadores personalizados da Vertex AI para um determinado projeto e região.

Treinamento

Cota Valor
Pipelines de treinamento personalizado simultâneos 2.000
Número de CPUs N1 e E2 simultâneas para treinamento, por região
RegiãoValor
us-west1 2.200
us-west2 20
us-west3 2.200
us-west4 20
us-central1 2.200
us-east1 2.200
us-east4 20
us-south1 450
northamerica-northeast1 2.200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2.200
europe-west1 2.200
europe-west4 2.200
europe-west6 20
europe-west3 2.200
europe-north1europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1asia-south1 20
asia-southeast1 2.200
asia-southeast2 2.200
asia-east2 2.200
asia-east1 2.200
asia-northeast1 2.200
asia-northeast2 20
australia-southeast1 2.200
australia-southeast2 20
asia-northeast3 2.200
me-west1 450
Número de CPUs N2 simultâneas para treinamento, por região
RegiãoValor
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
Número de CPUs M1 simultâneas para treinamento, por região
RegiãoValor
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
Número de CPUs C2 simultâneas para treinamento, por região
RegiãoValor
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
Número de CPUs A2 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 96
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 96
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 96
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de CPUs A3 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 0
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 0
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 0
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs K80 simultâneas para treinamento, por região
RegiãoValor
us-west1 30
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 56
us-east1 30
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 56
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs P4 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 6
us-west3 Indisponível
us-west4 Indisponível
us-central1 6
us-east1 Indisponível
us-east4 1
us-south1 Indisponível
northamerica-northeast1 6
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 6
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 6
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs T4 simultâneas para treinamento, por região
RegiãoValor
us-west1 2
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 12
us-east1 2
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 6
europe-west1 Indisponível
europe-west4 2
europe-west6 Indisponível
europe-west3 0
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 1
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 6
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 1
me-west1 Indisponível
Número de GPUs L4 simultâneas para treinamento, por região
RegiãoValor
us-west1 0
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 0
us-east1 0
us-east4 0
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 0
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 0
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs P100 simultâneas para treinamento, por região
RegiãoValor
us-west1 30
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 56
us-east1 30
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 30
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 6
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs V100 simultâneas para treinamento, por região
RegiãoValor
us-west1 6
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 6
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 6
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs A100 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 8
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 8
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 8
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs A100 de 80 GB simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 0
us-east1 Indisponível
us-east4 0
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 0
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 0
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível

Se você tiver interesse, consulte a documentação de cotas.

Número de GPUs H100 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 0
us-east1 Indisponível
us-east4 0
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 0
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível

Se você tiver interesse, consulte a documentação de cotas.

Número de núcleos simultâneos de TPU V2 para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 8
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 8
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 8
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de núcleos de pod simultâneos de TPU V2 para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 Indisponível
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de núcleos de TPU V3 simultâneos para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 8
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 8
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 8
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de núcleos de pod simultâneos da TPU V3 para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 Indisponível
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Uso HDD (GB) durante o treinamento, por região
RegiãoValor
us-west1 180.000
us-west2 3.600
us-west3 180.000
us-west4 3.600
us-central1 180.000
us-east1 180.000
us-east4 3.600
us-south1 180.000
northamerica-northeast1 180.000
northamerica-northeast2 3.600
southamerica-east1 3.600
southamerica-west1 3.600
europe-west2 180.000
europe-west1 180.000
europe-west4 180.000
europe-west6 3.600
europe-west3 180.000
europe-north1europe-central2 3.600
europe-west8 3.600
europe-west9 180.000
europe-southwest1asia-south1 3.600
asia-southeast1 180.000
asia-southeast2 180.000
asia-east2 180.000
asia-east1 180.000
asia-northeast1 180.000
asia-northeast2 3.600
australia-southeast1 180.000
australia-southeast2 3.600
asia-northeast3 180.000
me-west1 180.000
Uso do SSD (GB) durante o treinamento, por região
RegiãoValor
us-west1 75.000
us-west2 450
us-west3 75.000
us-west4 450
us-central1 75.000
us-east1 75.000
us-east4 450
us-south1 75.000
northamerica-northeast1 75.000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75.000
europe-west1 75.000
europe-west4 75.000
europe-west6 450
europe-west3 75.000
europe-north1europe-central2 450
europe-west8 450
europe-west9 75.000
europe-southwest1asia-south1 450
asia-southeast1 75.000
asia-southeast2 75.000
asia-east2 75.000
asia-east1 75.000
asia-northeast1 75.000
asia-northeast2 450
australia-southeast1 75.000
australia-southeast2 450
asia-northeast3 75.000
me-west1 75.000

Disponibilização

Cota Valor
Número de modelos personalizados implantados 100
Número de CPUs simultâneas para veiculação, por região
RegiãoValor
us-west1 2.200
us-west2 2.200
us-west3 2.200
us-west4 16
us-central1 2.200
us-east1 2.200
us-east4 2.200
us-south1 450
northamerica-northeast1 2.200
northamerica-northeast2 450
southamerica-east1 2.200
southamerica-west1 450
europe-west2 2.200
europe-west1 2.200
europe-west4 2.200
europe-west6 2.200
europe-west3 2.200
europe-north1europe-central2 16
europe-west8 16
europe-west9 16
europe-southwest1asia-south1 16
asia-southeast1 2.200
asia-southeast2 2.200
asia-east2 2.200
asia-east1 2.200
asia-northeast1 2.200
asia-northeast2 16
australia-southeast1 2.200
australia-southeast2 16
asia-northeast3 2.200
me-west1 450
Número de GPUs K80 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 56
us-east1 30
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 56
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs P100 simultâneas para treinamento, por região
RegiãoValor
us-west1 30
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 56
us-east1 30
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 30
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs P4 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 6
us-west3 Indisponível
us-west4 Indisponível
us-central1 6
us-east1 Indisponível
us-east4 6
us-south1 Indisponível
northamerica-northeast1 6
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 6
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 6
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs T4 simultâneas para treinamento, por região
RegiãoValor
us-west1 12
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 12
us-east1 12
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 12
europe-west1 Indisponível
europe-west4 12
europe-west6 Indisponível
europe-west3 0
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 6
asia-southeast2 Indisponível
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 6
me-west1 Indisponível
Número de GPUs L4 simultâneas para treinamento, por região
RegiãoValor
us-west1 28
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 28
us-east1 28
us-east4 28
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 28
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 28
asia-northeast1 28
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs V100 simultâneas para treinamento, por região
RegiãoValor
us-west1 6
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 6
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de GPUs A100 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 14
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 14
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 14
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 14
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 14
me-west1 14
Número de GPUs A100 de 80 GB simultâneas para disponibilização, por região
RegiãoValor
us-west1 Indisponível
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 0
us-east1 Indisponível
us-east4 0
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 0
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 0
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível
Número de ícones de TPU v5e para exibição, por região
RegiãoValor
us-west1 4
us-west2 Indisponível
us-west3 Indisponível
us-west4 Indisponível
us-central1 Indisponível
us-east1 Indisponível
us-east4 Indisponível
us-south1 Indisponível
northamerica-northeast1 Indisponível
northamerica-northeast2 Indisponível
southamerica-east1 Indisponível
southamerica-west1 Indisponível
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 Indisponível
europe-west6 Indisponível
europe-west3 Indisponível
europe-north1europe-central2 Indisponível
europe-west8 Indisponível
europe-west9 Indisponível
europe-southwest1asia-south1 Indisponível
asia-southeast1 Indisponível
asia-southeast2 Indisponível
asia-east2 Indisponível
asia-east1 Indisponível
asia-northeast1 Indisponível
asia-northeast2 Indisponível
australia-southeast1 Indisponível
australia-southeast2 Indisponível
asia-northeast3 Indisponível
me-west1 Indisponível

Vertex AI Feature Store

Nesta seção, listamos as cotas e os limites para o seguinte:

Vertex AI Feature Store

As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um único projeto, é possível ter 200 nós de exibição on-line em us-central1 e outros 50 nós em us-east4.

Cota Valor
Solicitações de veiculação on-line por minuto 300.000
Número máximo de instâncias FeatureOnlineStore 10
Número máximo de solicitações de pesquisa por minuto 6.000.000
O número máximo de nós de veiculação on-line em todas as instâncias de FeatureOnlineStore otimizadas no projeto 80
Número máximo de FeatureView instâncias em todas as FeatureOnlineStore instâncias 30

A Vertex AI Feature Store também tem os seguintes limites: Não é possível solicitar um aumento em nenhum dos limites na tabela a seguir:

Limite Valor
Número máximo de FeatureGroup recursos em um projeto e local 250
Número máximo de Feature recursos em um FeatureGroup 10.000
Tamanho máximo dos dados de elementos por entidade 5 MB
Número de IDs de entidade por solicitação de veiculação on-line (FetchFeatureValues) 1

Feature Store da Vertex AI (legado)

As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um único projeto, é possível ter 75 jobs em lote simultâneos em us-central1 e outros 75 jobs em europe-west4.

Cota Valor
Solicitações de veiculação on-line por minuto 300.000
Solicitações de ingestão de streaming por minuto 60.000
Capacidade de processamento de gravação de ingestão de streaming por minuto 1,2 GB
Solicitações de criação de recursos por minuto 100
Nós de exibição on-line em todas as featurestores 30
Jobs em lote simultâneos (ingestão, veiculação e exclusão de valores de atributos combinados) 75
Solicitações simultâneas para excluir valores de recursos 1
Tipos de entidade em todas as featurestores 75

O Feature Store da Vertex AI também tem os seguintes limites. Não é possível solicitar um aumento em nenhum dos limites na tabela a seguir:

Limite Valor
Limite de armazenamento de um nó de exibição on-line 5 TB
Total de dados na loja off-line Ilimitado
Recursos por tipo de entidade 5.000
Número de solicitações de criação, atualização e exclusão de featurestores por dia, por projeto e por região 500
Para ingestão de streaming, o tamanho por solicitação 1 MB
Para leitura de streaming, o número de entidades que podem ser incluídas por solicitação 100
Para importação em lote, o número de arquivos que podem ser incluídos por solicitação 5.000 para Avro ou 500 para CSV
Para exibição e exportações em lote, o número de recursos que é possível solicitar 5.000
Para ingestão de lote e de streaming, o carimbo de data/hora mais antigo para o qual os dados do recurso podem ser ingeridos 4.000 dias a partir da data atual

O limite de retenção de dados no Feature Store da Vertex AI tem o seguinte valor padrão, que você pode substituir:

Padrões de retenção de dados Valor padrão
Retenção de dados no armazenamento off-line (carimbo de data/hora do valor do atributo mais antigo após o qual os valores são excluídos) 4.000 dias a partir da data atual
Retenção de dados no armazenamento on-line (carimbo de data/hora do valor do atributo mais antigo após o qual os valores são excluídos) 4.000 dias a partir da data atual

É possível modificar o limite de retenção de dados das seguintes maneiras:

  • Para substituir o limite de retenção de dados do armazenamento on-line, defina o parâmetro online_storage_ttl_days ao criar ou atualizar um featurestore.

  • Para substituir o limite de retenção de dados do armazenamento off-line, defina o parâmetro offline_storage_ttl_days ao criar ou atualizar um tipo de entidade.

.

Vector Search

As cotas a seguir se aplicam à Pesquisa de vetores para um determinado projeto em cada região.

Cota Valor
Operações simultâneas de criação de índice 5
Operações de atualização de índice simultâneas 5
Número de nós de índice implantados 50
Número de nós N2D implantados no índice 5
Número de índices 100
Solicitações de atualização de streaming por minuto 6.000
Capacidade de atualização de streaming (em KB) por minuto 120.000

Vertex AI Pipelines

As cotas e limites a seguir se aplicam ao Vertex AI Pipelines para um determinado projeto em cada região.

Cota Valor
Como executar tarefas de pipeline em paralelo* 600
Execuções de pipeline simultâneas* 300

* Solicitações de execução de pipeline/tarefas que ultrapassam esse limite são enfileiradas até que os recursos estejam disponíveis.

O Vertex AI Pipelines tem os limites a seguir. Ao contrário das cotas, não é possível solicitar um aumento.

Limite Valor
Número de tarefas de pipeline por job 10.000
Artefatos de entrada e saída por tarefa de pipeline 100
Artefatos de entrada e saída por job de pipeline 10.000
Tamanho máximo do payload JSON que contém parâmetros de saída e artefatos por tarefa de pipeline 131.072 bytes

Otimização da decisão na Vertex AI

As cotas e limites a seguir se aplicam à otimização de decisão da Vertex AI para um determinado projeto em cada região.

Cota Valor
Resolver solicitação por minuto 30

Cotas e limites do Colab Enterprise

As cotas e os limites do Colab Enterprise são listados separadamente. Consulte Cotas e limites do Colab Enterprise.

Aumento de cotas

Se você quiser expandir alguma cota da Vertex AI, use o Console do Google Cloud para solicitar um aumento de cota.

Para mais informações sobre como enviar uma solicitação de aumento de cota, consulte as seções a seguir sobre Como trabalhar com cotas:

A seguir