Número máximo de instâncias (serviços)

Nesta página, descrevemos como definir o número máximo de instâncias que podem ser usadas para o serviço do Cloud Run. Especificar o máximo de instâncias no Cloud Run permite limitar o escalonamento do serviço em resposta a solicitações recebidas, embora essa configuração máxima possa ser excedida por um breve período devido a circunstâncias como picos de tráfego. Use essa configuração como uma maneira de controlar custos ou de limitar o número de conexões com um serviço de apoio, como um banco de dados.

Para informações sobre os limites máximos de instâncias que podem ser aplicáveis ao seu serviço, consulte Limites máximos de instâncias.

Para mais informações sobre como o Cloud Run faz o escalonamento automático das instâncias de contêiner, consulte Escalonamento automático de instâncias.

Como configurar e atualizar o número máximo de instâncias

Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.

Por padrão, os serviços do Cloud Run são configurados para escalonar no máximo para 100 instâncias.

É possível alterar a configuração de número máximo de instâncias usando o console do Google Cloud, a linha de comando gcloud ou um arquivo YAML ao criar um novo serviço ou implantar um novo revisão.

Console

  1. No console do Google Cloud, acesse o Cloud Run:

    Acesse o Cloud Run

  2. Clique em Criar serviço se estiver configurando um novo serviço em que fará uma implantação. Se você estiver configurando um serviço atual, clique nele e em Editar e implantar nova revisão.

  3. Se você estiver configurando um novo serviço, preencha a página inicial de configurações do serviço conforme preferir e clique em Contêineres, volumes, rede, segurança para expandir a página de configurações do serviço.

  4. Clique na guia Contêiner.

    image

    • No campo Número máximo de instâncias, especifique o número máximo desejado de instâncias, usando qualquer valor inteiro de 1 ao limite máximo
  5. Clique em Criar ou Implantar.

Linha de comando

É possível atualizar o número máximo de instâncias de um determinado serviço usando o seguinte comando:

gcloud run services update SERVICE --max-instances MAX-VALUE

Substituir

  • SERVICE pelo nome do serviço;
  • MAX-VALUE pelo número máximo de instâncias de contêiner que você quer, usando qualquer valor inteiro de 1 ao limite máximo. Especifique default para limpar qualquer configuração máxima de instância e restaurar o padrão de 100 instâncias.

Também é possível definir o número máximo de instâncias durante a implantação usando o comando:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Substituir

  • IMAGE_URL por uma referência à imagem de contêiner. Por exemplo, us-docker.pkg.dev/cloudrun/container/hello:latest. Se você usa o Artifact Registry, o repositório REPO_NAME já precisará ter sido criado. O URL tem o formato REGION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
  • MAX-VALUE pelo número máximo de instâncias de contêiner que você quer.

YAML

É possível fazer o download e conferir as configurações de serviço usando o comando gcloud run services describe --format export, que produz resultados limpos no formato YAML. Em seguida, modifique os campos descritos abaixo e faça upload do YAML modificado usando o comando gcloud run services replace. Modifique os campos somente conforme documentado.

  1. Para visualizar e fazer o download da configuração:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Atualize o atributo autoscaling.knative.dev/maxScale::

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Substituir

    • SERVICE pelo nome do serviço do Cloud Run;
    • MAX-INSTANCE pelo número máximo que você quer.
    • REVISION por um novo nome de revisão ou excluí-lo (se houver). Se você fornecer um novo nome de revisão, ele precisará atender aos seguintes critérios:
      • Começa com SERVICE-
      • Contém apenas letras minúsculas, números e -
      • Não termina com um -
      • Não excede 63 caracteres
  3. Substitua o serviço pela nova configuração usando o seguinte comando:

    gcloud run services replace service.yaml

Terraform

Para saber como aplicar ou remover uma configuração do Terraform, consulte Comandos básicos do Terraform.

O recurso google_cloud_run_v2_service a seguir especifica um número máximo de instâncias de 10 em template.scaling. Substitua 10 pelo número máximo desejado de instâncias.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Limites máximos de instâncias

Por padrão, os serviços do Cloud Run são configurados para, no máximo, 100 instâncias.

O limite máximo real depende da região do serviço do Cloud Run e das configurações de CPU e memória.

A página de cotas mostra as cotas por valor de referência por região.

O número máximo de instâncias é determinado como o mínimo de:

  • referência de cota regional / solicitada várias de 1 CPU
  • referência de cota regional / solicitação múltipla de 2 GB de memória

Por exemplo, uma cota de referência de 1.000 instâncias com 4 GB de memória ou 2 CPUs receberá um limite efetivo de 500.

Se você quiser especificar um número máximo de instâncias maior que o máximo permitido na região do serviço do Cloud Run, será preciso solicitar um aumento de cota.

Ver configurações de instâncias máximas

Para ver as configurações atuais máximas de instâncias do serviço do Cloud Run, faça o seguinte:

Console

  1. No console do Google Cloud, acesse o Cloud Run:

    Acesse o Cloud Run

  2. Clique no serviço de seu interesse para abrir a página Detalhes do serviço.

  3. Clique na guia Revisões.

  4. No painel de detalhes à direita, o número máximo de configuração de instâncias está listado na guia Contêiner.

Linha de comando

  1. Use o comando a seguir:

    gcloud run services describe SERVICE
  2. Localize o número máximo de configuração de instâncias na configuração retornada.