Como definir um número máximo de instâncias de contêiner

Nesta página, descrevemos como definir o número máximo de instâncias de contêiner que podem ser usadas para seu serviço do Cloud Run. Especificar o máximo de instâncias no Cloud Run permite limitar o escalonamento do serviço em resposta a solicitações recebidas. Use essa configuração como uma maneira de controlar seus custos ou limitar o número de conexões com um serviço de apoio, como um banco de dados.

Para especificar um número máximo de instâncias maior que 1.000 para o Cloud Run (totalmente gerenciado), primeiro é necessário solicitar um aumento de cota.

Para mais informações sobre como o Cloud Run faz o escalonamento automático das instâncias de contêiner, consulte Escalonamento automático de instâncias.

Como configurar e atualizar o número máximo de instâncias

Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.

Por padrão, as instâncias de contêiner podem ser escalonadas horizontalmente até 1.000 instâncias. É possível alterar esse padrão usando o Console do Cloud, a linha de comando gcloud ou um arquivo YAML ao criar um novo serviço ou implantar uma nova revisão:

Console

  1. Acessar o Cloud Run

  2. Clique em Criar serviço se estiver configurando um novo serviço em que fará uma implantação. Se você estiver configurando um serviço existente, clique nele e depois selecione Editar e implantar nova revisão.

  3. Em Configurações avançadas, clique em Contêiner.

    image

  4. No campo Número máximo de instâncias, especifique o número máximo de instâncias de contêiner que você quer, usando qualquer valor inteiro de 1 a 1000 ou mais, se você solicitou um aumento de cota.

  5. Clique em Criar ou Implantar.

Linha de comando

É possível atualizar o número máximo de instâncias de contêiner de um determinado serviço usando o seguinte comando:

gcloud run services update SERVICE --max-instances MAX-VALUE

Substitua:

  • SERVICE pelo nome do serviço;
  • MAX-VALUE pelo número máximo de instâncias de contêiner que você quer, usando qualquer valor inteiro de 1 a 1000 ou mais, se você solicitou um aumento de cota. Especifique default para limpar qualquer configuração máxima da instância.

Também é possível definir o número máximo de instâncias de contêiner durante a implantação usando o comando:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Substitua:

  • IMAGE_URL por uma referência à imagem de contêiner, por exemplo, gcr.io/myproject/my-image:latest;
  • MAX-VALUE pelo número máximo de instâncias de contêiner que você quer, usando qualquer valor inteiro de 1 a 1000 ou mais, se você solicitou um aumento de cota. Especifique default para limpar qualquer configuração máxima da instância.

YAML

É possível fazer o download e ver a configuração do serviço atual usando o comando gcloud run services describe --format export, que produz resultados limpos no formato YAML. Em seguida, modifique os campos descritos abaixo e faça upload do YAML modificado usando o comando gcloud beta run services replace. Modifique os campos somente conforme documentado.

  1. Para visualizar e fazer o download da configuração:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Atualize o atributo autoscaling.knative.dev/maxScale::

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    Substitua:

    • MAX-INSTANCE pelo número máximo que você quer.
  3. Substitua o serviço pela nova configuração usando o seguinte comando:

    gcloud beta run services replace service.yaml

Como ver o número máximo de configurações de instâncias

Para ver o número máximo atual de configurações de instâncias do serviço:

Console

  1. Acesse o Cloud Run

  2. Clique no serviço de seu interesse para abrir a página Detalhes do serviço.

  3. Clique na guia Revisões.

  4. No painel de detalhes à direita, o número máximo de configuração de instâncias está listado na guia "Contêiner".

Linha de comando

  1. Use o comando a seguir:

    gcloud run services describe SERVICE
  2. Localize o número máximo de configuração de instâncias na configuração retornada.