Cotas e limites

Neste documento, listamos as cotas e os limites do sistema que se aplicam Media CDN do Google Cloud. As cotas especificam a quantidade de um recurso compartilhado e contável que você podem usar e são definidos pelos serviços do Google Cloud, como Media CDN do Google Cloud. Os limites do sistema são valores fixos que não podem ser alterados.

O Google Cloud usa cotas para garantir a imparcialidade e reduzir picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um recurso do Google Cloud o projeto do Google Cloud pode usar. As cotas se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o número de projetos que podem ser criados. As cotas protegem a comunidade de usuários do Google Cloud, impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos do Google Cloud.

O sistema de cotas do Cloud faz o seguinte:

  • Monitora o consumo de produtos e serviços do Google Cloud.
  • Restringe o consumo desses recursos.
  • Fornece um meio de solicitar mudanças no valor da cota

Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota permite, o sistema bloqueia o acesso ao recurso e a tarefa que você está tentando executar falha.

As cotas geralmente se aplicam ao projeto do nível Google Cloud. O uso de um recurso em um projeto não afeta a cota disponível em outro. Em um projeto do Google Cloud, as cotas são compartilhadas entre todos os aplicativos e endereços IP.

Também há limites do sistema para os recursos do Media CDN. Não é possível alterar os limites do sistema.

Limites

Os limites a seguir se aplicam ao Media CDN.

Configuração

Item Limites Observações
Número máximo de EdgeCacheService 20 por projeto Entre em contato com a equipe de vendas do Google Cloud se precisar aumentar esse limite.
Número máximo de EdgeCacheOrigin 30 por projeto Entre em contato com a equipe de vendas do Google Cloud se precisar aumentar esse limite.
Número máximo de EdgeCacheKeyset 10 por projeto Entre em contato com a equipe de vendas do Google Cloud se precisar aumentar esse limite.
Número máximo de RouteRules por EdgeCacheService 2000

Cada EdgeCacheService pode definir até 10 PathMatchers, e cada PathMatcher pode definir até 200 RouteRules.

Esse limite não pode ser aumentado.

Máximo de certificados SSL por serviço 5 Esse limite não pode ser aumentado. Consulte também a cota por projeto para certificados SSL.
Número máximo de chaves públicas por EdgeCacheKeyset 3 Esse limite não pode ser aumentado. Várias chaves em um conjunto de chaves são projetada para ativar a rotação de chaves. Remova as mais antigas e com o tempo.
Número máximo de chaves compartilhadas de validação por EdgeCacheKeyset 3 Esse limite não pode ser aumentado. Várias chaves em um conjunto de chaves são projetada para ativar a rotação de chaves. Remova as mais antigas e com o tempo.

Cabeçalhos, solicitações e respostas HTTP

Item Limites Observações
Tamanho máximo do cabeçalho da solicitação Aproximadamente 11 KiB Esse limite não pode ser aumentado.

O tamanho combinado do URL e do cabeçalho da solicitação é limitado a 15 KiB.

As solicitações são rejeitadas com uma resposta HTTP 431 para conexões HTTP/1.1.

As conexões HTTP/2 são fechadas sem que um código de resposta seja escrito.

Essas solicitações são registradas com um statusDetails de headers_too_long, se a geração de registros estiver ativada.

Tamanho máximo do corpo da solicitação 16 KiB As solicitações com um corpo acima desse limite são rejeitadas com um código de status HTTP 413 Content Too Large.
Tamanho máximo do cabeçalho da resposta Aproximadamente 128 KiB Esse limite não pode ser aumentado.

As respostas de origem com cabeçalhos que excedem esse limite resultam em uma solicitação HTTP 502 sendo enviados ao cliente. Eles são registrados com um statusDetails de backend_response_headers_too_long, se a geração de registros estiver ativada.

Tamanho máximo de objetos armazenáveis em cache 100 GiB Esse limite não pode ser aumentado.

Esse é o tamanho máximo de objetos na origem que o Media CDN pode armazenar em cache. Objetos maiores são tratados como não encacheáveis.

Tamanho máximo de resposta não armazenável em cache 500 MiB Esse limite não pode ser aumentado.

Esse é o número máximo de bytes em um corpo de resposta que O Media CDN faz o proxy quando um objeto não pode ser armazenado em cache. As respostas que não podem ser armazenadas em cache são truncadas depois que atingem o limite.

Conversão de cabeçalhos para minúsculas Sempre para Media CDN O Media CDN segue as convenções de HTTP/2 para letras caso de cabeçalhos de solicitação e resposta.

Seja qual for o protocolo usado, todos os cabeçalhos são convertidos em minúsculas.

Por exemplo, Host se torna host. Keep-Alive se torna keep-alive.

Os casos dos valores dos cabeçalhos não são alterados.

Limites de taxa de solicitações de API

Se você precisar de uma limitação de taxa mais alta para solicitações de API, revise o uso atual e solicitar um aumento.

Item Limites
Invalidações 10 por minuto a cada EdgeCacheService
Todas as chamadas que não estão no namespace networkservices 1.200 chamadas por minuto por projeto
Somente leitura: GetEdgeCache*, ListEdgeCache* 100 por minuto em cada projeto
Leitura/gravação: tudo o que há no networkservices namespace não marcado como somente leitura 100 por minuto em cada projeto

Tempos limite do cliente

Tempo limite Duração máxima Código de resposta Descrição
Maximum request duration 5 minutos HTTP 408 (Request Timeout) A duração máxima de uma única solicitação-resposta.
Header timeout 10 segundos HTTP 408 (Request Timeout) Quanto tempo o cliente tem para enviar o conjunto completo de cabeçalhos de solicitação.

Tempo limite da origem

  • connectTimeout e maxAttemptsTimeout limitam o tempo de duração do Media CDN para encontrar uma resposta utilizável.

    Ambos os tempos limite incluem o tempo que a origem leva para retornar cabeçalhos e determinar se é necessário usar um failover ou redirecionamento. connectTimeout é aplicado de forma independente para cada tentativa de origem, enquanto maxAttemptsTimeout inclui o tempo necessário para se conectar em todas as tentativas de origem, incluindo failovers e redirecionamentos. Seguir um redirecionamento conta como tentativa de conexão com a origem e conta para o conjunto maxAttempts para a origem configurada.

    Quando o Media CDN encontra uma resposta que não é de redirecionamento, como de uma origem de failover ou redirecionamento, os valores readTimeout e responseTimeout são aplicados. As origens redirecionadas usam connectTimeout, readTimeout, e responseTimeout configurados para o EdgeCacheOrigin que encontrou o redirecionamento.

  • responseTimeout e readTimeout controlam o tempo que uma resposta transmitida pode levar. Depois que o Media CDN determina que ele vai usar uma resposta upstream, nem connectTimeout nem maxAttemptsTimeout não importa. Nesse ponto, readTimeout e responseTimeout entram em vigor.

O Media CDN faz no máximo quatro tentativas de origem em todas as origens, independente do maxAttempts definido por cada EdgeCacheOrigin. O Media CDN usa o valor maxAttemptsTimeout do EdgeCacheOrigin. Os valores de tempo limite por tentativa (connectTimeout, readTimeout e responseTimeout) estão configurados para o EdgeCacheOrigin de cada tentativa.

A tabela a seguir descreve os campos de tempo limite:

Campo Padrão Descrição
connectTimeout 5 segundos

Tempo máximo que o Media CDN pode levar desde o início da solicitação à origem até determinar se a resposta é utilizável. Na prática, connectTimeout abrange o tempo que começa com a criação da solicitação e depois executa as verificações do Google, fazer handshakes de TLS, estabelecer uma conexão TCP/QUIC para conseguir os cabeçalhos de resposta que contêm o código de status HTTP.

O tempo limite precisa ser um valor entre 1 e 15 segundos.

maxAttemptsTimeout 15 segundos

O tempo máximo em todas as tentativas de conexão com a origem, incluindo origens de failover, antes de retornar um erro ao cliente. Um erro HTTP 504 retornado se o tempo limite for atingido antes que uma resposta seja retornada.

O tempo limite deve ser um valor entre 1 segundo e 30 segundos.

Esta configuração define a duração total para todas as origens tentativas de conexão, incluindo origens de failover, para limitar a tempo total que os clientes têm para esperar o conteúdo começar a transmitir. Somente o primeiro valor de maxAttemptsTimeout é usado, em que o primeiro é definido pela origem configurada para a rota.

readTimeout 15 segundos

O tempo máximo de espera entre as leituras de uma única resposta HTTP. O readTimeout é limitado pelo responseTimeout. Todas as leituras da resposta HTTP precisam ser concluídas até o prazo definido pelo responseTimeout. O tempo limite precisa ser um valor entre 1 e 30 segundos. Se esse tempo limite for atingido antes que a resposta seja concluída, ela será truncada e registrada.

responseTimeout 30 segundos

A duração máxima para permitir a conclusão de uma resposta.

O tempo limite precisa ser um valor entre 1 e 120 segundos.

A duração é medida a partir do momento em que os primeiros bytes do corpo são recebidos. Se esse tempo limite for atingido antes que a resposta seja concluída, o a resposta fique truncada e registrada.

Gerenciar cotas

OMedia CDN aplica cotas no uso de recursos por vários motivos. Por exemplo, as cotas protegem a comunidade de usuários Google Cloud , impedindo picos de uso inesperados. As cotas também ajudam os usuários que estão explorando o Google Cloud com o nível gratuito a permanecer na avaliação.

Todos os projetos começam com as mesmas cotas, que podem ser alteradas com uma solicitação de cota extra. Algumas cotas podem aumentar automaticamente dependendo do uso de um produto.

Permissões

Para ver cotas ou solicitar aumentos de cotas, os membros do gerenciamento de identidade e acesso (IAM, na sigla em inglês) precisam ter um dos papéis a seguir:

Tarefa Papel necessário
Verificar cotas para um projeto Uma das seguintes opções:
Modificar cotas, solicitar cota extra Uma das seguintes opções:

Verificar sua cota

Console

  1. No Console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"

  2. Para pesquisar a cota a ser atualizada, use a tabela de filtros. Se você não souber o nome da cota, use os links desta página.

gcloud

Com a Google Cloud CLI, execute o comando a seguir para verificar suas cotas. Substitua PROJECT_ID pelo seu código do projeto:

    gcloud compute project-info describe --project PROJECT_ID

Para verificar a cota utilizada em uma região, execute o comando a seguir:

    gcloud compute regions describe example-region
    

Erros ao exceder a cota

Se você exceder uma cota com um comando gcloud, o gcloud emitirá uma mensagem de erro quota exceeded e retornará com o código de saída 1.

Se você exceder uma cota com uma solicitação de API, o Google Cloud retornará o seguinte código de status HTTP: 413 Request Entity Too Large.

Solicitar cota adicional

Para ajustar a maioria das cotas, use o console do Google Cloud. Para mais informações, consulte Solicitar uma cota maior.

Console

  1. No Console do Google Cloud, acesse a página Cotas.

    Acessar "Cotas"

  2. Na página Cotas, selecione as que você quer alterar.
  3. Na parte superior da página, clique em Editar cotas.
  4. Em Nome, digite seu nome.
  5. Opcional: em Telefone, digite um número de telefone.
  6. Envie a solicitação. As solicitações de cota demoram de 24 a 48 horas para serem processadas.

Disponibilidade de recursos

Cada cota representa um número máximo para um tipo específico de recurso que é possível criar, desde que o recurso esteja disponível. É importante observar que as cotas não garantem a disponibilidade de recursos. Mesmo que você tenha cota disponível, não será possível criar um novo recurso se ele não estiver disponível.

Por exemplo, é possível ter cota suficiente para criar um novo endereço IP externo regional na região us-central1. No entanto, isso não é possível se não houver endereços IP externos disponíveis naquela região. A disponibilidade de recursos zonais também pode afetar sua capacidade de criar um novo recurso.

São raras as situações em que os recursos não estão disponíveis em uma região inteira. No entanto, os recursos dentro de uma zona podem ser usados periodicamente, normalmente sem impacto no contrato de nível de serviço (SLA) para o tipo de recurso. Para mais informações, leia o SLA relevante do recurso.