Cotas e limites

Nesta página, listamos as cotas padrão que se aplicam à Vertex AI. Suas cotas podem ser diferentes dos padrões se você tiver solicitado cotas maiores anteriormente.

Para mais informações sobre cotas no Google Cloud, incluindo como solicitar um aumento, consulte a documentação de cotas.

Solicitar cotas

As cotas a seguir se aplicam às solicitações da Vertex AI para um determinado projeto e região. Por exemplo, em um único projeto, é possível ter até 30.000 solicitações de previsão on-line por minuto em uma região e outras 30.000 em outra região.

Solicitar cotas Valor
Solicitações de gerenciamento de recursos* por minuto 600
Solicitações de job ou de operações de longa duração por minuto 60
Solicitações de previsões on-line por minuto 30.000
Solicitações de explicação on-line por minuto 600
Solicitações do Vizier por minuto 6.000
Solicitações de exibição on-line do Feature Store da Vertex AI por minuto 300.000
Solicitações Vertex ML Metadata por minuto 12.000

* As solicitações de gerenciamento de recursos incluem qualquer solicitação que não seja um job, operação de longa duração, solicitação de previsão on-line ou do Vizier.

Jobs ou operações de longa duração incluem estas solicitações:

  • Criar ou excluir um conjunto de dados
  • Importar ou exportar dados de um conjunto
  • Criar um endpoint
  • Criar ou excluir um job personalizado
  • Criar ou excluir um job de rotulagem de dados
  • Criar ou excluir um job de ajuste de hiperparâmetros
  • Criar ou excluir um job de previsão em lote
  • Criar ou excluir um modelo
  • Fazer upload, excluir ou exportar um modelo

Cotas de modelos do AutoML

As cotas a seguir se aplicam a cada tipo de dados e objetivo em projetos e regiões. Por exemplo, é possível implantar 10 modelos de classificação de imagens do AutoML e 10 modelos de detecção de objetos de imagem do AutoML em uma região e um projeto específicos, totalizando 20 modelos implantados.

Imagem

Classificação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de treinamento simultâneos com o Explainable AI 2
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Detecção de objetos

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Tabular

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 30

Texto

Classificação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Extração de entidades

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Análise de sentimento

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5
Número de modelos implantados 10

Vídeo

Reconhecimento de ação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5

Classificação

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5

Rastreamento de objetos

Cota Valor
Jobs de treinamento simultâneos 5
Jobs de previsão em lote simultâneos 5

Cotas de modelos treinados e personalizados

As cotas a seguir se aplicam a modelos treinadores personalizados da Vertex AI para um determinado projeto e região.

Treinamento

Número de CPUs N1 + E2 simultâneas para treinamento, por região
RegiãoValor
us-west1 450
us-central1 2.200
us-east1 450
us-east4 20
northamerica-northeast1 450
europe-west2 450
europe-west1 2.200
europe-west4 2.200
europe-west6 20
asia-southeast1 2.200
asia-east1 2.200
asia-northeast1 2.200
australia-southeast1 2.200
asia-northeast3 2.200
Número de CPUs A2 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 96
us-east1 Indisponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Indisponível
europe-west4 96
europe-west6 Indisponível
asia-southeast1 96
asia-east1 Indisponível
asia-northeast1 Não disponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de CPUs N2 simultâneas para treinamento, por região
RegiãoValor
us-west1 20
us-central1 450
us-east1 20
us-east4 20
northamerica-northeast1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
asia-southeast1 20
asia-east1 450
asia-northeast1 20
australia-southeast1 20
asia-northeast3 20
Número de CPUs C2 simultâneas para treinamento, por região
RegiãoValor
us-west1 20
us-central1 450
us-east1 20
us-east4 20
northamerica-northeast1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
asia-southeast1 20
asia-east1 450
asia-northeast1 20
australia-southeast1 20
asia-northeast3 20
Número de GPUs A100 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 8
us-east1 Indisponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Indisponível
europe-west4 8
europe-west6 Indisponível
asia-southeast1 8
asia-east1 Indisponível
asia-northeast1 Não disponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de GPUs K80 simultâneas para treinamento, por região
RegiãoValor
us-west1 30
us-central1 56
us-east1 30
us-east4 Indisponível
northamerica-northeast1 Não disponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Não disponível
asia-southeast1 Indisponível
asia-east1 56
asia-northeast1 Indisponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de GPUs P100 simultâneas para treinamento, por região
RegiãoValor
us-west1 30
us-central1 56
us-east1 30
us-east4 Indisponível
northamerica-northeast1 Não disponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Não disponível
asia-southeast1 Indisponível
asia-east1 30
asia-northeast1 Indisponível
australia-southeast1 6
asia-northeast3 Indisponível
Número de GPUs P4 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 6
us-east1 Indisponível
us-east4 1
northamerica-northeast1 6
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
asia-southeast1 6
asia-east1 Indisponível
asia-northeast1 Indisponível
australia-southeast1 6
asia-northeast3 Indisponível
Número de GPUs T4 simultâneas para treinamento, por região
RegiãoValor
us-west1 2
us-central1 12
us-east1 2
us-east4 Indisponível
northamerica-northeast1 Indisponível
europe-west2 6
europe-west1 Indisponível
europe-west4 2
europe-west6 Indisponível
asia-southeast1 1
asia-east1 Indisponível
asia-northeast1 6
australia-southeast1 Indisponível
asia-northeast3 1
Número de GPUs V100 simultâneas para treinamento, por região
RegiãoValor
us-west1 6
us-central1 6
us-east1 Indisponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
asia-southeast1 Indisponível
asia-east1 6
asia-northeast1 Indisponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de núcleos simultâneos de TPU V2 para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 8
us-east1 Indisponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Indisponível
europe-west4 8
europe-west6 Indisponível
asia-southeast1 Indisponível
asia-east1 8
asia-northeast1 Indisponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de núcleos de pod simultâneos de TPU V2 para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 Não disponível
us-east1 Não disponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Não disponível
europe-west4 Não disponível
europe-west6 Não disponível
asia-southeast1 Não disponível
asia-east1 Não disponível
asia-northeast1 Não disponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de núcleos de TPU V3 simultâneos para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 8
us-east1 Indisponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Indisponível
europe-west4 8
europe-west6 Indisponível
asia-southeast1 Indisponível
asia-east1 8
asia-northeast1 Indisponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de núcleos de pod simultâneos da TPU V3 para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 Não disponível
us-east1 Não disponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Não disponível
europe-west4 Não disponível
europe-west6 Não disponível
asia-southeast1 Não disponível
asia-east1 Não disponível
asia-northeast1 Não disponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Uso HDD (GB) durante o treinamento, por região
RegiãoValor
us-west1 180.000
us-central1 180.000
us-east1 180.000
us-east4 3.600
northamerica-northeast1 180.000
europe-west2 180.000
europe-west1 180.000
europe-west4 180.000
europe-west6 3.600
asia-southeast1 180.000
asia-east1 180.000
asia-northeast1 180.000
australia-southeast1 180.000
asia-northeast3 180.000
Uso do SSD (GB) durante o treinamento, por região
RegiãoValor
us-west1 75.000
us-central1 75.000
us-east1 75.000
us-east4 450
northamerica-northeast1 75.000
europe-west2 75.000
europe-west1 75.000
europe-west4 75.000
europe-west6 450
asia-southeast1 75.000
asia-east1 75.000
asia-northeast1 75.000
australia-southeast1 75.000
asia-northeast3 75.000

Disponibilização

Cota Valor
Número de modelos treinados e personalizados que foram implantados 100
Número de CPUs N1 simultâneas para veiculação, por região
RegiãoValor
us-west1 2.200
us-central1 2.200
us-east1 2.200
us-east4 2.200
northamerica-northeast1 2.200
europe-west2 2.200
europe-west1 2.200
europe-west4 2.200
europe-west6 2.200
asia-southeast1 2.200
asia-east1 2.200
asia-northeast1 2.200
australia-southeast1 2.200
asia-northeast3 2.200
Número de GPUs K80 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 56
us-east1 30
us-east4 Indisponível
northamerica-northeast1 Não disponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Não disponível
asia-southeast1 Indisponível
asia-east1 56
asia-northeast1 Indisponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de GPUs P100 simultâneas para treinamento, por região
RegiãoValor
us-west1 30
us-central1 56
us-east1 30
us-east4 Indisponível
northamerica-northeast1 Não disponível
europe-west2 Indisponível
europe-west1 30
europe-west4 Indisponível
europe-west6 Não disponível
asia-southeast1 Indisponível
asia-east1 30
asia-northeast1 Indisponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível
Número de GPUs P4 simultâneas para treinamento, por região
RegiãoValor
us-west1 Indisponível
us-central1 6
us-east1 Indisponível
us-east4 1
northamerica-northeast1 6
europe-west2 Indisponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
asia-southeast1 6
asia-east1 Indisponível
asia-northeast1 Indisponível
australia-southeast1 6
asia-northeast3 Indisponível
Número de GPUs T4 simultâneas para treinamento, por região
RegiãoValor
us-west1 2
us-central1 12
us-east1 2
us-east4 Indisponível
northamerica-northeast1 Indisponível
europe-west2 6
europe-west1 Indisponível
europe-west4 2
europe-west6 Indisponível
asia-southeast1 1
asia-east1 Indisponível
asia-northeast1 6
australia-southeast1 Indisponível
asia-northeast3 1
Número de GPUs V100 simultâneas para treinamento, por região
RegiãoValor
us-west1 6
us-central1 6
us-east1 Indisponível
us-east4 Não disponível
northamerica-northeast1 Não disponível
europe-west2 Não disponível
europe-west1 Indisponível
europe-west4 6
europe-west6 Indisponível
asia-southeast1 Não disponível
asia-east1 Não disponível
asia-northeast1 Não disponível
australia-southeast1 Não disponível
asia-northeast3 Indisponível

Feature Store da Vertex AI

As cotas a seguir se aplicam a um determinado projeto e região. Por exemplo, em um único projeto, é possível ter 75 jobs em lote simultâneos em us-central1 e outros 75 jobs em europe-west4.

Cota Valor
Solicitações de veiculação on-line por minuto 300.000
Solicitações de criação de recursos por minuto 100
Nós de exibição on-line em todas as featurestores 30
Jobs em lote simultâneos (ingestão e veiculação combinados) 75
Tipos de entidade em todas as featurestores 75

O Feature Store da Vertex AI também tem os seguintes limites: Ao contrário das cotas, não é possível solicitar um aumento para um limite.

Limite Valor
Retenção de dados (carimbo de data/hora mais antigo do recurso após o qual os valores são excluídos) 4.000 dias a partir da data atual
Recursos por tipo de entidade 5.000
Número de solicitações de criação, atualização e exclusão de featurestores por dia, por projeto e por região 500
Para leitura de streaming, o número de entidades que podem ser incluídas por solicitação 100
Para importação em lote, o número de arquivos que podem ser incluídos por solicitação 5.000 para Avro ou 500 para CSV

Mecanismo de correspondência Vertex AI

As cotas a seguir se aplicam ao Matching Engine da Vertex AI para um determinado projeto em cada região.

Cota Valor
Operações simultâneas de criação de índice 5
Operações de atualização de índice simultâneas 5
Número de nós de índice implantados 50

Pipelines de Vertex AI

As cotas e limites a seguir se aplicam ao Vertex AI Pipelines para um determinado projeto em cada região.

Cota Valor
Como executar tarefas de pipeline em paralelo 600
Job de pipeline simultâneo* 300

* As execuções de pipeline além desse limite serão enfileiradas até que os recursos estejam disponíveis.

O Vertex AI Pipelines também tem os limites a seguir. Ao contrário das cotas, não é possível solicitar um aumento para um limite.

Limite Valor
Número de tarefas de pipeline por job 10.000
Artefatos de entrada e saída por tarefa de pipeline 100

Aumento de cotas

Se você quiser aumentar alguma cota para a Vertex AI, use o Console do Google Cloud para solicitar um aumento de cota.

Para mais informações sobre como enviar uma solicitação de aumento de cota, consulte as seções a seguir sobre Como trabalhar com cotas: