Google Cloud usa quotas para ajudar a garantir a equidade e reduzir os picos na utilização e disponibilidade de recursos. Uma quota restringe a quantidade de um Google Cloud recurso que o seu Google Cloud projeto pode usar. As quotas aplicam-se a uma variedade de tipos de recursos, incluindo componentes de hardware, software e rede. Por exemplo, as quotas podem restringir o número de chamadas API para um serviço, o número de balanceadores de carga usados em simultâneo pelo seu projeto ou o número de projetos que pode criar. As quotas protegem a comunidade de Google Cloud utilizadores, impedindo a sobrecarga dos serviços. As quotas também ajudam a gerir os seus próprios Google Cloud recursos.
O sistema de quotas da nuvem faz o seguinte:
- Monitoriza o seu consumo de Google Cloud produtos e serviços
- Restringe o seu consumo desses recursos
- Oferece uma forma de pedir alterações ao valor da quota e automatizar os ajustes de quotas
Na maioria dos casos, quando tenta consumir mais de um recurso do que a respetiva quota permite, o sistema bloqueia o acesso ao recurso e a tarefa que está a tentar realizar falha.
Geralmente, as quotas aplicam-se ao nível do Google Cloud projeto A sua utilização de um recurso num projeto não afeta a sua quota disponível noutro projeto. Num Google Cloud projeto, as quotas são partilhadas por todas as aplicações e endereços IP.
Também existem limites nos recursos do Vertex AI. Estes limites não estão relacionados com o sistema de quotas. Não é possível alterar os limites.
Quotas de tarifas
As seguintes quotas aplicam-se aos pedidos da Vertex AI para um determinado projeto e região suportada. Por exemplo, num único projeto, pode ter até 30 000 pedidos de inferência online por minuto numa região e outros 30 000 pedidos de inferência online por minuto noutra região suportada.
Tipo de pedido | Pedidos por minuto |
---|---|
Pedidos de gestão de recursos (CRUD)1 | 600 |
Pedidos de envio de tarefas ou operações de longa duração (LRO) | 60 |
Pedidos de inferência online2 | 30 000 |
Débito do pedido de inferência online | 1,5 GB |
Pedidos de explicação online | 600 |
Pedidos de leitura de séries cronológicas do Vertex AI TensorBoard | 60 000 |
Pedidos de metadados de ML (CRUD) | 12 000 |
Pedidos de colocação em cache (CRUD) da IA generativa | 200 |
Pedidos do Vertex AI Vizier (CRUD) | 6000 |
Pedidos de publicação online do Vertex AI Feature Store | 300 000 |
Pedidos do Vertex ML Metadata | 12 000 |
Número de pedidos de tokens de contagem ou tokens de computação | 3000 |
1Os pedidos de gestão de recursos incluem qualquer pedido que não seja uma tarefa, um LRO, um pedido de inferência online, um pedido do Vertex AI Vizier, um pedido de metadados de ML, um pedido de leitura da API Vertex AI TensorBoard Timeseries Insights, um pedido do Vertex AI Feature Store, um pedido de streaming do Vertex AI Feature Store ou um pedido de pesquisa vetorial.
2 Esta quota aplica-se apenas a pontos finais públicos.
As tarefas ou os LROs incluem os seguintes pedidos:
- Criar ou eliminar um conjunto de dados.
- Importe ou exporte dados para ou a partir de um conjunto de dados.
- Crie um ponto final.
- Crie ou elimine uma tarefa personalizada.
- Crie ou elimine uma tarefa de etiquetagem de dados.
- Criar ou eliminar uma tarefa de hiperaperfeiçoamento dos parâmetros.
- Crie ou elimine uma tarefa de inferência em lote.
- Crie ou elimine um modelo.
- Carregue, elimine ou exporte um modelo.
- Crie ou elimine um modelo de tempo de execução do bloco de notas.
- Atribua, elimine, inicie ou atualize um tempo de execução do bloco de notas.
- Crie, elimine ou atualize um monitor de modelos.
- Crie ou elimine uma tarefa de monitorização de modelos.
Para informações sobre as quotas dos modelos de IA generativa, consulte o artigo
Quotas e limites da IA generativa no Vertex AI.
Quotas de modelos do AutoML
As seguintes quotas aplicam-se a cada tipo de dados e objetivo para um determinado projeto e região. Por exemplo, num projeto e numa região específicos, pode implementar 10 modelos de classificação de imagens do AutoML e 10 modelos de deteção de objetos de imagens do AutoML, o que dá um total de 20 modelos implementados.
Imagem
Classificação
Quota | Valor |
---|---|
Tarefas de preparação em simultâneo | 5 |
Tarefas de preparação simultâneas com IA explicável | 2 |
Tarefas de inferência em lote simultâneas | 5 |
Tarefas de implementação de modelos em simultâneo | 5 |
Tarefas de anulação da implementação de modelos em simultâneo | 5 |
Número de modelos implementados | 10 |
Deteção de objetos
Quota | Valor |
---|---|
Tarefas de preparação em simultâneo | 5 |
Tarefas de inferência em lote simultâneas | 5 |
Número de modelos implementados | 10 |
Tabular
Quota | Valor |
---|---|
Tarefas de preparação em simultâneo | 5 |
Tarefas de inferência em lote simultâneas | 5 |
Número de modelos implementados | 30 |
Registo de modelos Vertex AI
O tamanho máximo do modelo suportado pelo Registo de modelos Vertex AI é de 1 TB.
Limites de modelos do AutoML
Os seguintes limites aplicam-se a cada tipo de dados para um determinado projeto e região. Por exemplo, num projeto e numa região específicos, pode incluir um máximo de 1 000 000 de imagens numa entrada de pedido em lote.
Imagem
Tipo de limite | Valor |
---|---|
Tamanho do ficheiro de imagem | Máximo: 30 MB |
Imagens por conjunto de dados | Máximo: 1 000 000 |
Etiquetas por conjunto de dados | Mínimo: 2 Máximo: 5000 |
Imagens por etiqueta | Mínimo: 10 Recomendado: 1000 |
Tamanho do ficheiro CSV de entrada em lote | Máximo: 100 MB |
Número de imagens na entrada em lote | Máximo: 1 000 000 |
Tabular
Tipo de limite | Valor |
---|---|
Tamanho máximo | 100 GB |
Número de linhas | Entre 1000 e 100 000 000 de linhas |
Número de colunas | Entre 2 e 1000 colunas |
Número de importações de conjuntos de dados em execução em simultâneo | 5 importações |
Tamanho do ficheiro CSV | Máximo: 10 GB por ficheiro, até um valor total máximo de 100 GB |
Vídeo
Tipo de limite | Valor |
---|---|
Duração máxima do vídeo | 3 horas |
Tamanho máximo do ficheiro de vídeo | 50GB |
Número mínimo de etiquetas por conjunto de dados | 2 |
Número mínimo de vídeos por etiqueta | 10 (1000 é recomendado) |
Tamanho do ficheiro CSV de entrada em lote | Máximo: 100 MB |
Número de segmentos de vídeo na entrada em lote | Máximo: 1000 |
Quotas de modelos preparados personalizados
As seguintes quotas aplicam-se a modelos preparados de forma personalizada do Vertex AI para um determinado projeto e região.
Formação
Quota | Valor |
---|---|
Pipelines de preparação personalizada simultâneas | 2000 |
Número de CPUs N1 e E2 para preparação, por região | |
---|---|
Região | Valor |
us-west1 | 2200 |
us-west2 | 20 |
us-west3 | 2200 |
us-west4 | 20 |
us-central1 | 2200 |
us-east1 | 2200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2200 |
europe-west1 | 2200 |
europe-west4 | 2200 |
europe-west6 | 20 |
europe-west3 | 2200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2200 |
asia-south2 | 20 |
asia-southeast1 | 2200 |
asia-southeast2 | 2200 |
asia-east2 | 2200 |
asia-east1 | 2200 |
asia-northeast1 | 2200 |
asia-northeast2 | 20 |
australia-southeast1 | 2200 |
australia-southeast2 | 20 |
asia-northeast3 | 2200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Número de CPUs N2 para preparação, por região | |
---|---|
Região | Valor |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-south2 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Número de CPUs M1 para treino, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-south2 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Número de CPUs C2 para a preparação, por região | |
---|---|
Região | Valor |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-south2 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Número de CPUs A2 para preparação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | Ilimitado |
us-east1 | Ilimitado |
us-east4 | Ilimitado |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Ilimitado |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Ilimitado |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Ilimitado |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de CPUs A3 simultâneas para treino, por região | |
---|---|
Região | Valor |
us-west1 | Ilimitado |
us-west2 | Ilimitado |
us-west3 | Ilimitado |
us-west4 | Ilimitado |
us-central1 | Ilimitado |
us-east1 | Ilimitado |
us-east4 | Ilimitado |
us-east5 | Ilimitado |
us-south1 | Ilimitado |
northamerica-northeast1 | Ilimitado |
northamerica-northeast2 | Ilimitado |
southamerica-east1 | Ilimitado |
southamerica-west1 | Ilimitado |
europe-west2 | Ilimitado |
europe-west1 | Ilimitado |
europe-west4 | Ilimitado |
europe-west6 | Ilimitado |
europe-west3 | Ilimitado |
europe-north1 | Ilimitado |
europe-central2 | Ilimitado |
europe-west8 | Ilimitado |
europe-west9 | Ilimitado |
europe-southwest1 | Ilimitado |
asia-south1 | Ilimitado |
asia-south2 | Ilimitado |
asia-southeast1 | Ilimitado |
asia-southeast2 | Ilimitado |
asia-east2 | Ilimitado |
asia-east1 | Ilimitado |
asia-northeast1 | Ilimitado |
asia-northeast2 | Ilimitado |
australia-southeast1 | Ilimitado |
australia-southeast2 | Ilimitado |
asia-northeast3 | Ilimitado |
me-west1 | Ilimitado |
me-central1 | Ilimitado |
me-central2 | Ilimitado |
europe-west12 | Ilimitado |
africa-south1 | Ilimitado |
Número de GPUs H200 simultâneas para preparação, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | 8 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | 0 |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | 8 |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs P4 para preparação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | 6 |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 6 |
us-east1 | Não disponível |
us-east4 | 1 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 6 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 6 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | 6 |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs T4 para treino, por região | |
---|---|
Região | Valor |
us-west1 | 2 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | 6 |
europe-west1 | Não disponível |
europe-west4 | 2 |
europe-west6 | Não disponível |
europe-west3 | 0 |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | 6 |
asia-south2 | Não disponível |
asia-southeast1 | 1 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | 6 |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | 1 |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs L4 para preparação, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | 0 |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | 0 |
asia-south2 | Não disponível |
asia-southeast1 | 0 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | 0 |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | 0 |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs P100 para treino, por região | |
---|---|
Região | Valor |
us-west1 | 30 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | 30 |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | 30 |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | 6 |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs V100 para treino, por região | |
---|---|
Região | Valor |
us-west1 | 6 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 6 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 6 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | 6 |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs A100 para treino, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 8 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 8 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 8 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs A100 de 80 GB simultâneas para treino, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | 0 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 0 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Para mais informações, consulte o artigo Veja e faça a gestão das quotas.
Número de GPUs H100 concorrentes para preparação, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 0 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | 0 |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs B200 concorrentes para preparação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs GB200 simultâneas para preparação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs H100 Mega concorrentes para preparação, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 0 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | 0 |
asia-northeast2 | Não disponível |
australia-southeast1 | 0 |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Para mais informações, consulte o artigo Veja e faça a gestão das quotas.
Número de núcleos de TPU V2 para treino, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | 0 |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de núcleos do pod de TPU V2 para treino, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | Não disponível |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de núcleos de TPU v3 para treino, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | 0 |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de núcleos do agrupamento de TPUs v3 para treino, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | Não disponível |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Utilização do HDD (GB) durante o treino, por região | |
---|---|
Região | Valor |
us-west1 | 180 000 |
us-west2 | 3600 |
us-west3 | 180 000 |
us-west4 | 3600 |
us-central1 | 180 000 |
us-east1 | 180 000 |
us-east4 | 3600 |
us-east5 | 3600 |
us-south1 | 180 000 |
northamerica-northeast1 | 180 000 |
northamerica-northeast2 | 3600 |
southamerica-east1 | 3600 |
southamerica-west1 | 3600 |
europe-west2 | 180 000 |
europe-west1 | 180 000 |
europe-west4 | 180 000 |
europe-west6 | 3600 |
europe-west3 | 180 000 |
europe-north1 | 3600 |
europe-central2 | 180 000 |
europe-west8 | 3600 |
europe-west9 | 180 000 |
europe-southwest1 | 3600 |
asia-south1 | 180 000 |
asia-south2 | 3600 |
asia-southeast1 | 180 000 |
asia-southeast2 | 180 000 |
asia-east2 | 180 000 |
asia-east1 | 180 000 |
asia-northeast1 | 180 000 |
asia-northeast2 | 3600 |
australia-southeast1 | 180 000 |
australia-southeast2 | 3600 |
asia-northeast3 | 180 000 |
me-west1 | 180 000 |
me-central1 | 3600 |
me-central2 | 3600 |
europe-west12 | 3600 |
africa-south1 | 3600 |
Utilização do SSD (GB) durante o treino, por região | |
---|---|
Região | Valor |
us-west1 | 75 000 |
us-west2 | 450 |
us-west3 | 75 000 |
us-west4 | 450 |
us-central1 | 75 000 |
us-east1 | 75 000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75 000 |
northamerica-northeast1 | 75 000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75 000 |
europe-west1 | 75 000 |
europe-west4 | 75 000 |
europe-west6 | 450 |
europe-west3 | 75 000 |
europe-north1 | 450 |
europe-central2 | 75 000 |
europe-west8 | 450 |
europe-west9 | 75 000 |
europe-southwest1 | 450 |
asia-south1 | 75 000 |
asia-south2 | 450 |
asia-southeast1 | 75 000 |
asia-southeast2 | 75 000 |
asia-east2 | 75 000 |
asia-east1 | 75 000 |
asia-northeast1 | 75 000 |
asia-northeast2 | 450 |
australia-southeast1 | 75 000 |
australia-southeast2 | 450 |
asia-northeast3 | 75 000 |
me-west1 | 75 000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Utilização do Hyperdisk Balanced (GB) durante o treino, por região | |
---|---|
Região | Valor |
us-west1 | 75 000 |
us-west2 | 450 |
us-west3 | 450 |
us-west4 | 450 |
us-central1 | 75 000 |
us-east1 | 450 |
us-east4 | 75 000 |
us-east5 | 450 |
us-south1 | 75 000 |
northamerica-northeast1 | 450 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 450 |
europe-west1 | 75 000 |
europe-west4 | 75 000 |
europe-west6 | 450 |
europe-west3 | 450 |
europe-north1 | 450 |
europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 450 |
europe-southwest1 | 450 |
asia-south1 | 75 000 |
asia-south2 | 450 |
asia-southeast1 | 450 |
asia-southeast2 | 450 |
asia-east2 | 450 |
asia-east1 | 450 |
asia-northeast1 | 450 |
asia-northeast2 | 450 |
australia-southeast1 | 450 |
australia-southeast2 | 450 |
asia-northeast3 | 450 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
a servir
Quota | Valor |
---|---|
Número de réplicas de modelos personalizados implementadas | 100 |
Número de CPUs para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 2200 |
us-west2 | 2200 |
us-west3 | 2200 |
us-west4 | 16 |
us-central1 | 2200 |
us-east1 | 2200 |
us-east4 | 2200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2200 |
southamerica-west1 | 450 |
europe-west2 | 2200 |
europe-west1 | 2200 |
europe-west4 | 2200 |
europe-west6 | 2200 |
europe-west3 | 2200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2200 |
asia-south2 | 16 |
asia-southeast1 | 2200 |
asia-southeast2 | 2200 |
asia-east2 | 2200 |
asia-east1 | 2200 |
asia-northeast1 | 2200 |
asia-northeast2 | 16 |
australia-southeast1 | 2200 |
australia-southeast2 | 16 |
asia-northeast3 | 2200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Número de GPUs H200 simultâneas para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | 0 |
us-east5 | Não disponível |
us-south1 | 8 |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | 0 |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | 8 |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs P100 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 30 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | 30 |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | 30 |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs P4 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | 6 |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 6 |
us-east1 | Não disponível |
us-east4 | 6 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | 6 |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 6 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 6 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | 6 |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs T4 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 12 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | 12 |
europe-west1 | Não disponível |
europe-west4 | 12 |
europe-west6 | Não disponível |
europe-west3 | 0 |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | 6 |
asia-south2 | Não disponível |
asia-southeast1 | 6 |
asia-southeast2 | Não disponível |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | 6 |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs L4 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 28 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 28 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs V100 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 6 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 6 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 6 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs A100 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 14 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 14 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 14 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | 14 |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs A100 de 80 GB para publicação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 1 |
us-east1 | Não disponível |
us-east4 | 1 |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 1 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 1 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs B200 concorrentes para publicação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs GB200 simultâneas para publicação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | Não disponível |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs H100 para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 8 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | 16 |
us-east1 | Não disponível |
us-east4 | 0 |
us-east5 | 16 |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 16 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 16 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de GPUs H100 Mega para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 0 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | Não disponível |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 0 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | 0 |
asia-northeast2 | Não disponível |
australia-southeast1 | 0 |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de chips de TPU v5e para publicação, por região | |
---|---|
Região | Valor |
us-west1 | 4 |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | 0 |
us-central1 | 32 |
us-east1 | Não disponível |
us-east4 | Não disponível |
us-east5 | Não disponível |
us-south1 | 32 |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 32 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | 32 |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | Não disponível |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Número de chips TPU v6e para publicação, por região | |
---|---|
Região | Valor |
us-west1 | Não disponível |
us-west2 | Não disponível |
us-west3 | Não disponível |
us-west4 | Não disponível |
us-central1 | Não disponível |
us-east1 | 0 |
us-east4 | Não disponível |
us-east5 | 0 |
us-south1 | Não disponível |
northamerica-northeast1 | Não disponível |
northamerica-northeast2 | Não disponível |
southamerica-east1 | Não disponível |
southamerica-west1 | Não disponível |
europe-west2 | Não disponível |
europe-west1 | Não disponível |
europe-west4 | 8 |
europe-west6 | Não disponível |
europe-west3 | Não disponível |
europe-north1 | Não disponível |
europe-central2 | Não disponível |
europe-west8 | Não disponível |
europe-west9 | Não disponível |
europe-southwest1 | Não disponível |
asia-south1 | Não disponível |
asia-south2 | Não disponível |
asia-southeast1 | Não disponível |
asia-southeast2 | Não disponível |
asia-east2 | Não disponível |
asia-east1 | Não disponível |
asia-northeast1 | 0 |
asia-northeast2 | Não disponível |
australia-southeast1 | Não disponível |
australia-southeast2 | Não disponível |
asia-northeast3 | Não disponível |
me-west1 | Não disponível |
me-central1 | Não disponível |
me-central2 | Não disponível |
europe-west12 | Não disponível |
africa-south1 | Não disponível |
Limites de modelos personalizados
Os seguintes limites aplicam-se aos modelos preparados de forma personalizada do Vertex AI para um determinado projeto e região.
a servir
Limite | Valor |
---|---|
Número de réplicas por projeto | 200 |
Número de contentores por cluster | 25 000 |
Vertex AI Feature Store
Esta secção apresenta as quotas e os limites para o seguinte:
Vertex AI Feature Store
As seguintes quotas aplicam-se a um determinado projeto e região. Por exemplo, num único projeto, pode ter 200 nós de publicação online em us-central1
e outros 50 nós em us-east4
.
Quota | Valor |
---|---|
Pedidos de publicação online por minuto | 300 000 |
Número máximo de FeatureOnlineStore instâncias |
10 |
Número máximo de pedidos de pesquisa por minuto | 6 000 000 |
Número máximo de nós de publicação online em todas as instâncias do Optimized FeatureOnlineStore no projeto |
80 |
Número máximo de instâncias de FeatureView em todas as instâncias de FeatureOnlineStore |
30 |
O Vertex AI Feature Store também tem os seguintes limites. Não pode pedir um aumento de nenhum dos limites na tabela seguinte:
Limite | Valor |
---|---|
Número máximo de recursos FeatureGroup num projeto e numa localização |
250 |
Número máximo de recursos Feature num FeatureGroup |
10 000 |
Tamanho máximo dos dados de funcionalidades por entidade | 5 MB |
Número de IDs de entidades por pedido de publicação online (FetchFeatureValues ) |
1 |
Comprimento máximo de um ID de entidade | 4076 carateres |
Limite de armazenamento para um nó de publicação online otimizado | 200 GB |
Vertex AI Feature Store (antigo)
As seguintes quotas aplicam-se a um determinado projeto e região. Por exemplo, num único projeto, pode ter 75 tarefas em lote simultâneas no us-central1
e outras 75 tarefas no europe-west4
.
Quota | Valor |
---|---|
Pedidos de publicação online por minuto | 300 000 |
Pedidos de carregamento de streaming por minuto | 60 000 |
Débito de gravação da ingestão de streaming por minuto | 1,2 GB |
Pedidos de criação de funcionalidades por minuto | 100 |
Nós de publicação online em todas as featurestores | 30 |
Tarefas em lote simultâneas (combinação de carregamento, publicação e eliminação de valores de caraterísticas) | 75 |
Pedidos simultâneos para eliminar valores de atributos | 1 |
Tipos de entidades em todas as featurestores | 75 |
O Vertex AI Feature Store (antigo) também tem os seguintes limites. Não pode pedir um aumento de nenhum dos limites na tabela seguinte:
Limite | Valor |
---|---|
Limite de armazenamento para um nó de publicação online | 5 TB |
Total de dados na loja offline | Ilimitado |
Funcionalidades por tipo de entidade | 5000 |
Número de pedidos de criação, atualização e eliminação de featurestore por dia por projeto por região | 500 |
Para o carregamento de streaming, o tamanho por pedido | 1 MB |
Para a leitura de streaming, o número de entidades que podem ser incluídas por pedido | 100 |
Para a importação em lote, o número de ficheiros que podem ser incluídos por pedido | 5000 para Avro ou 500 para CSV |
Para a publicação e as exportações em lote, o número de funcionalidades que pode pedir | 5000 |
Para o carregamento em lote e o carregamento por stream, a data/hora mais antiga para a qual os dados de funcionalidades podem ser carregados | 4000 dias a partir da data atual |
O limite de retenção de dados no Vertex AI Feature Store (antigo) tem o seguinte valor predefinido, que pode substituir:
Predefinições de retenção de dados | Valor predefinido |
---|---|
Retenção de dados na loja offline (data/hora da funcionalidade mais antiga após a qual os valores são eliminados) | 4000 dias a partir da data atual |
Retenção de dados na loja online (data/hora da funcionalidade mais antiga após a qual os valores são eliminados) | 4000 dias a partir da data atual |
Pode substituir o limite de retenção de dados das seguintes formas:
Para substituir o limite de retenção de dados da loja online, defina o parâmetro
online_storage_ttl_days
ao criar ou atualizar um Feature Store.Para substituir o limite de retenção de dados da loja offline, defina o parâmetro
offline_storage_ttl_days
ao criar ou atualizar um tipo de entidade.
Vector Search
As seguintes quotas aplicam-se à pesquisa vetorial para um determinado projeto em cada região.
Quota | Valor |
---|---|
Operações de criação de índices simultâneas | 5 |
Operações de atualização de índice simultâneas | 5 |
Número de nós de índice implementados | 50 |
Número de nós N2D de índice implementados | 5 |
Número de índice | 100 |
Pedidos de atualização de streaming por minuto | 6000 |
Débito da atualização de streaming(em KB) por minuto | 120 000 |
Vertex ML Metadata
Os seguintes limites aplicam-se ao Vertex ML Metadata para um determinado projeto em cada região.
Limite | Valor |
---|---|
Tamanho máximo serializado do campo de metadados num recurso | 204 800 bytes |
Tamanho máximo de serialização dos esquemas de metadados | 204 800 bytes |
Vertex AI Pipelines
As seguintes quotas e limites aplicam-se ao Vertex AI Pipelines para um determinado projeto em cada região.
Quota | Valor |
---|---|
Executar tarefas de pipeline em paralelo* | 600 |
Execuções de pipelines simultâneas* | 300 |
* A execução de pipelines e os pedidos de tarefas que excedam este limite são colocados em fila até que os recursos estejam disponíveis.
Os Vertex AI Pipelines têm os seguintes limites. Tenha em atenção que, ao contrário das quotas, não pode pedir um aumento de um limite.
Limite | Valor |
---|---|
Número de tarefas de pipeline por trabalho | 10 000 |
Artefactos de entrada e saída por tarefa do pipeline | 100 |
Artefactos de entrada e saída por tarefa de pipeline | 10 000 |
Tamanho máximo do payload JSON que contém parâmetros de saída e artefactos por tarefa do pipeline | 131 072 bytes |
Tempo de execução máximo de uma tarefa de pipeline** | 7 dias |
* As tarefas de pipeline que estiverem em execução além deste limite são canceladas.
Quotas e limites do Colab Enterprise
As quotas e os limites do Colab Enterprise estão listados em separado. Consulte as quotas e os limites do Colab Enterprise.
Aumentos de quotas
Se quiser aumentar alguma das suas quotas para a Vertex AI, pode usar a Google Cloud consola para pedir um aumento da quota.
Para mais informações sobre o envio de uma solicitação de aumento da quota, consulte as seguintes secções do artigo Veja e faça a gestão das quotas:
Quotas por região e modelo
Veja e edite as quotas na Google Cloud consola
Para ver e editar as quotas na Google Cloud consola, faça o seguinte:- Aceda à página Quotas e limites do sistema.
- Para ajustar a quota, copie e cole a propriedade
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
no Filtro. Prima Enter. - Clique nos três pontos no final da linha e selecione Editar quota.
- Introduza um novo valor de quota no painel e clique em Enviar pedido.
Aceda a Quotas e limites do sistema
Veja as quotas de pedidos por minuto (RPM) por região e por modelo
Por predefinição, os modelos do Gemini 2.0 e posteriores usam a quota partilhada dinâmica (DSQ).
Escolha uma região para ver as quotas de cada modelo disponível:
Aumente as quotas
Se quiser aumentar alguma das suas quotas para a IA generativa na Vertex AI, pode usar a consola para pedir um aumento da quota. Google Cloud
Quotas do motor RAG
Para cada serviço realizar a geração aumentada de obtenção (RAG) através do motor RAG, aplicam-se as seguintes quotas, com a quota medida como pedidos por minuto (RPM).Serviço | Quota | Métrica |
---|---|---|
APIs de gestão de dados do motor RAG | 60 RPM | VertexRagDataService requests per minute per region |
RetrievalContexts API |
600 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1500 RPM | Online prediction requests per base model per minute per region per base_model Um filtro adicional que pode especificar é base_model: textembedding-gecko |
Serviço | Limite | Métrica |
---|---|---|
Pedidos ImportRagFiles simultâneos |
3 RPM | VertexRagService concurrent import requests per region |
Número máximo de ficheiros por pedido ImportRagFiles |
10 000 | VertexRagService import rag files requests per region |
Para ver mais limites de taxa e quotas, consulte os limites de taxa da IA generativa na Vertex AI.
Pedidos em lote
As quotas e os limites para tarefas de inferência em lote são os mesmos em todas as regiões.Limites de tarefas de inferência em lote simultâneas para modelos Gemini
Não existem limites de quota predefinidos na inferência em lote para os modelos Gemini. Em alternativa, o serviço de lotes oferece acesso a um grande conjunto partilhado de recursos, atribuídos dinamicamente com base na disponibilidade e na procura em tempo real do modelo por parte de todos os clientes desse modelo. Quando mais clientes estão ativos e saturam a capacidade do modelo, os seus pedidos em lote podem ser colocados em fila para capacidade.Quotas de tarefas de inferência em lote concorrentes para modelos não Gemini
A tabela seguinte lista as quotas para o número de tarefas de inferência em lote simultâneas, que não se aplicam aos modelos Gemini:Quota | Valor |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Quotas de modelos preparados personalizados
As seguintes quotas aplicam-se à IA generativa em modelos otimizados do Vertex AI para um determinado projeto e região:Quota | Valor |
---|---|
Restricted image training TPU V3 pod cores per region * supported Region - europe-west4 |
64 |
Restricted image training Nvidia A100 80GB GPUs per region * supported Region - us-central1 * supported Region - us-east4 |
8 2 |
Limites de incorporação de texto
Cada pedido pode ter até 250 textos de entrada (gerando 1 incorporação por texto de entrada) e 20 000 tokens por pedido. Apenas os primeiros 2048 tokens em cada texto de entrada são usados para calcular as incorporações. Paragemini-embedding-001
, a
quota é apresentada abaixo do nome
gemini-embedding
.
Tokens de entrada de conteúdo incorporado por minuto por modelo base
Ao contrário dos modelos de incorporação anteriores, que eram limitados principalmente pelas quotas de RPM, a quota do modelo de incorporação do Gemini limita o número de tokens que podem ser enviados por minuto por projeto.
Quota | Valor |
---|---|
Tokens de entrada de conteúdo incorporado por minuto | 5 000 000 |
Quotas de serviço do serviço de avaliação de IA gen
O serviço de avaliação de IA gen usa ogemini-2.0-flash
como um modelo de juiz predefinido
para métricas baseadas em modelos.
Um único pedido de avaliação para uma métrica baseada em modelos pode resultar em vários pedidos subjacentes ao serviço de avaliação de IA gen. A quota de cada modelo é calculada por projeto, o que significa que
todos os pedidos direcionados para gemini-2.0-flash
para inferência de modelos e
avaliação baseada em modelos contribuem para a quota.
As quotas para o serviço de avaliação de IA gen e o modelo de juiz subjacente são apresentadas na tabela seguinte:
Pedir quota | Quota predefinida |
---|---|
Pedidos por minuto do serviço de avaliação de IA gen | 1000 pedidos por projeto por região |
Pedidos de previsão online por minuto parabase_model: gemini-2.0-flash |
Consulte as cotas por região e modelo. |
Se receber um erro relacionado com quotas enquanto usa o serviço de avaliação de IA gen., pode ter de apresentar um pedido de aumento da quota. Consulte o artigo Veja e faça a gestão das cotas para mais informações.
Limite | Valor |
---|---|
Tempo limite do pedido de serviço de avaliação da IA gen | 60 segundos |
Quando usa o serviço de avaliação de IA gen pela primeira vez num novo projeto, pode verificar um atraso na configuração inicial de até dois minutos. Se o primeiro pedido falhar, aguarde alguns minutos e tente novamente. Normalmente, os pedidos de avaliação subsequentes são concluídos no prazo de 60 segundos.
O número máximo de tokens de entrada e saída para métricas baseadas em modelos depende do modelo usado como modelo de avaliação. Consulte os modelos Google para ver uma lista de modelos.
Quotas de avaliação da pipeline
Se receber um erro relacionado com quotas enquanto usa o serviço de pipelines de avaliação, pode ter de apresentar um pedido de aumento da quota. Consulte o artigo Veja e faça a gestão de quotas para mais informações. O serviço de pipelines de avaliação usa o Vertex AI Pipelines para executarPipelineJobs
. Consulte as quotas relevantes para o
Vertex AI Pipelines. Seguem-se as recomendações gerais de quotas:
Serviço | Quota | Recomendação |
---|---|---|
API Vertex AI | Tarefas de previsão em lote de MDI/CEs em simultâneo por região | Pointwise: 1 * num_concurrent_pipelines Pairwise: 2 * num_concurrent_pipelines |
API Vertex AI | Pedidos de avaliação por minuto por região | 1000 * num_concurrent_pipelines |
Tarefas | Quota | Modelo base | Recomendação |
---|---|---|---|
summarization question_answering |
Pedidos de previsão online por modelo base por minuto por região por base_model | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Agent Engine
Os seguintes limites aplicam-se ao Vertex AI Agent Engine para um determinado projeto em cada região:Descrição | Limite |
---|---|
Criar, eliminar ou atualizar o Vertex AI Agent Engine por minuto | 10 |
Criar, eliminar ou atualizar sessões do Vertex AI Agent Engine por minuto | 100 |
Query ou StreamQuery Vertex AI Agent Engine por minuto |
90 |
Anexe um evento às sessões do Vertex AI Agent Engine por minuto | 300 |
Número máximo de recursos do Vertex AI Agent Engine | 100 |
Criar, eliminar ou atualizar recursos de memória do Vertex AI Agent Engine por minuto | 100 |
Obtenha, liste ou recupere do banco de memória do Vertex AI Agent Engine por minuto | 300 |
Ambiente de sandbox (execução de código) executar pedidos por minuto | 1000 |
Entidades do ambiente de sandbox (execução de código) por região | 1000 |
Um agente A2A publica pedidos como sendMessage e cancelTask por minuto |
60 |
O agente A2A recebe pedidos como getTask e getCard por minuto |
600 |
Ligações bidirecionais em direto simultâneas com a API BidiStreamQuery por minuto |
10 |
Resolva problemas do código de erro 429
Para resolver problemas com o erro 429, consulte o artigo Código de erro 429.
O que se segue?
- Saiba mais sobre a IA generativa nas quotas e nos limites da Vertex AI.