Saiba como definir o número máximo de instâncias de contêiner que podem ser usadas no serviço do Cloud Run for Anthos. Especificar o máximo de instâncias no Cloud Run permite limitar o escalonamento do serviço em resposta a solicitações recebidas. Use essa configuração como uma maneira de controlar custos ou de limitar o número de conexões com um serviço de apoio, como um banco de dados.
Para mais informações sobre como o Cloud Run for Anthos faz o escalonamento automático das instâncias de contêiner, consulte Escalonamento automático de instâncias.
Como configurar e atualizar o número máximo de instâncias
Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também receberão automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.
Por padrão, o número de instâncias de contêiner pode ser escalonado infinitamente. É possível definir um limite para o número máximo de instâncias usando o console do Google Cloud ou a Google Cloud CLI ao implantar um novo serviço ou atualizar um que já existe e implantar uma revisão:
Console
Acesse o Cloud Run for Anthos no console do Google Cloud:
Clique em Criar serviço se estiver configurando um novo serviço em que fará uma implantação. Se você estiver configurando um serviço atual, clique nele e em Editar e implantar uma nova revisão.
Em Configurações avançadas, clique em Contêiner.
No campo Número máximo de instâncias, especifique o número máximo desejado de instâncias de contêiner.
Clique em Avançar para acessar a próxima seção.
Na seção Configurar como este serviço é acionado, selecione qual conectividade você quer usar para invocar o serviço.
Clique em Criar para implantar a imagem no Cloud Run for Anthos e aguarde a conclusão da implantação.
Linha de comando
Para serviços existentes, defina o número máximo de instâncias de contêiner executando o comando
gcloud run services update
com o parâmetro--max-instances
:gcloud run services update SERVICE --max-instances MAX-VALUE
Substitua:
- SERVICE pelo nome do serviço;
- MAX-VALUE pelo número máximo de instâncias de contêiner
que você quer. Especifique
default
para limpar qualquer configuração máxima da instância.
Para novos serviços, defina o número máximo de instâncias de contêiner executando o comando
gcloud run deploy
com o parâmetro--max-instances
:gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE
Substitua:
- SERVICE pelo nome do serviço;
- IMAGE_URL por uma referência à imagem de contêiner. Por
exemplo,
gcr.io/myproject/my-image:latest
; - MAX-VALUE pelo número máximo de instâncias de contêiner
que você quer. Especifique
default
para limpar qualquer configuração máxima da instância.
YAML
Faça o download da configuração de um serviço existente para um
arquivo YAML com o comando gcloud run services describe
usando a
sinalização --format=export
.
Em seguida, modifique o arquivo YAML e implante
essas alterações com o comando gcloud beta run services replace
.
Modifique apenas os atributos especificados.
Faça o download da configuração do serviço em um arquivo chamado
service.yaml
no espaço de trabalho local:gcloud run services describe SERVICE --format export > service.yaml
Substitua SERVICE pelo nome do serviço do Cloud Run for Anthos.
No arquivo local, atualize o atributo
autoscaling.knative.dev/maxScale:
:spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
Replace
- MAX-INSTANCE pelo número máximo que você quer.
Substitua o serviço pela nova configuração usando o seguinte comando:
gcloud beta run services replace service.yaml