Como definir a simultaneidade máxima

Para entender a configuração de simultaneidade máxima, leia o documento sobre conceitos de simultaneidade.

Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.

É possível definir a simultaneidade máxima usando o Console do Cloud, a linha de comando do gcloud ou um arquivo .yaml ao criar um novo serviço ou implantar uma nova revisão:

Console

  1. Acessar o Cloud Run

  2. Clique em Criar serviço se estiver configurando um novo serviço em que fará uma implantação. Se você estiver configurando um serviço atual, clique nele e em Editar e implantar nova revisão.

  3. Se você estiver configurando um novo serviço, preencha a página inicial de configurações de serviço conforme desejado e clique em Avançar > Configurações avançadas para acessar a página de configuração de serviço.

  4. Clique na guia Contêiner.

    imagem

  5. Defina o valor de simultaneidade máxima que você quer na caixa de texto Máximo de solicitações por contêiner.

  6. Clique em Criar ou Implantar.

Linha de comando

Para definir a simultaneidade máxima, use este comando:

gcloud run services update SERVICE --concurrency CONCURRENCY

Replace

  • SERVICE pelo nome do serviço;
  • CONCURRENCY pelo número máximo de solicitações simultâneas por instância de contêiner. Por exemplo, o comando a seguir define um máximo de 40 solicitações simultâneas:

    gcloud run services update SERVICE --concurrency 40

Alterar a simultaneidade máxima de um determinado serviço captura essa configuração em uma nova revisão.

Para reverter para a simultaneidade máxima padrão (80), use o comando

gcloud run services update SERVICE --concurrency default

Substitua SERVICE pelo nome do serviço que você está configurando.

YAML

É possível fazer o download e ver a configuração do serviço atual usando o comando gcloud run services describe --format export, que produz resultados limpos no formato YAML. Em seguida, modifique os campos descritos abaixo e faça upload do YAML modificado usando o comando gcloud beta run services replace. Modifique os campos somente conforme documentado.

  1. Para visualizar e fazer o download da configuração:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Atualize o atributo containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Substitua:

    • SERVICE pelo nome do serviço do Cloud Run;
    • IMAGE pelo URL da imagem do contêiner;
    • CONCURRENCY pelo número máximo de solicitações simultâneas por instância de contêiner.
  3. Substitua o serviço pela nova configuração usando o seguinte comando:

    gcloud beta run services replace service.yaml

Como visualizar configurações de simultaneidade

Para ver as configurações de simultaneidade atuais do seu serviço:

Console

  1. Acesse o Cloud Run

  2. Clique no serviço de seu interesse para abrir a página Detalhes do serviço.

  3. Clique na guia Revisões.

  4. No painel de detalhes à direita, a configuração de simultaneidade está listada na guia Contêiner.

Linha de comando

  1. Use o comando a seguir:

    gcloud run services describe SERVICE
  2. Localize a configuração de simultaneidade na configuração retornada.