Para entender o máximo de solicitações simultâneas por instância, leia o documento de conceitos.
Funções exigidas
Para receber as permissões necessárias para configurar e implantar os serviços do Cloud Run, peça ao administrador para conceder a você os seguintes papéis do IAM:
- 
  
  
    
      Desenvolvedor do Cloud Run  (roles/run.developer) no serviço Cloud Run
- 
  
  
    
      Usuário da conta de serviço  (roles/iam.serviceAccountUser) na identidade do serviço
Se você estiver implantando um serviço ou uma função do código-fonte, também precisará ter outros papéis concedidos a você no projeto e na conta de serviço do Cloud Build.
Para uma lista de papéis e permissões do IAM associados ao Cloud Run, consulte Papéis do IAM do Cloud Run e Permissões do IAM do Cloud Run. Se o serviço do Cloud Run interage com APIs doGoogle Cloud , como as bibliotecas de cliente do Cloud, consulte o guia de configuração de identidade de serviço. Para mais informações sobre como conceder papéis, consulte permissões de implantação e gerenciar acesso.
Configurar o máximo de solicitações simultâneas por instância
Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.
Para os serviços do Cloud Run, é possível definir o máximo de solicitações simultâneas por instância usando o Google Cloud console, a linha de comando gcloud ou um arquivo .yaml ao criar um novo serviço ou implantar uma nova revisão:
Console
- No Google Cloud console, acesse o Cloud Run: 
- Selecione Serviços no menu e clique em Implantar contêiner para configurar um novo serviço. Se você estiver configurando um serviço atual, clique nele e em Editar e implantar nova revisão. 
- Ao configurar um novo serviço, preencha a página inicial de configurações de serviço e clique em Contêineres, volumes, Rede e segurança para expandir essa página. 
- Clique na guia Contêiner.   - Defina o máximo de solicitações simultâneas por valor de instância na caixa de texto Máximo de solicitações por contêiner.
 
- Clique em Criar ou Implantar. 
gcloud
Para definir o máximo de solicitações simultâneas por instância, use o seguinte comando:
gcloud run services update SERVICE --concurrency CONCURRENCY
Substitua:
- SERVICE: o nome do serviço.
- CONCURRENCY: o número máximo de solicitações simultâneas por instância. Por exemplo, o comando a seguir define um máximo de 1 solicitações simultâneas: - gcloud run services update SERVICE --concurrency 1 
Alterar o número máximo de solicitações simultâneas por instância de um determinado serviço captura essa configuração em uma nova revisão.
Para reverter para o máximo de solicitações simultâneas padrão por instância (80), use o comando
gcloud run services update SERVICE --concurrency default
Substitua SERVICE pelo nome do serviço que você está configurando.
YAML
- Se você estiver criando um novo serviço, pule esta etapa. Se você estiver atualizando um serviço existente, faça o download da configuração YAML correspondente: - gcloud run services describe SERVICE --format export > service.yaml 
- Atualize o atributo - containerConcurrency:- apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: name: REVISION spec: containerConcurrency: CONCURRENCY - Substitua: - SERVICE: o nome do seu serviço do Cloud Run
- IMAGE_URL: uma referência à imagem de contêiner, por
exemplo, us-docker.pkg.dev/cloudrun/container/hello:latest. Se você usa o Artifact Registry, o repositório REPO_NAME já precisará ter sido criado. O URL segue o formatoLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG.
- CONCURRENCY: o número máximo de solicitações simultâneas por instância.
- REVISION por um novo nome de revisão ou excluí-lo (se houver). Se você fornecer um novo nome de revisão, ele precisará atender aos seguintes critérios:- Começa com SERVICE-
- Contém apenas letras minúsculas, números e -
- Não termina com um -
- Não excede 63 caracteres
 
- Começa com 
 
- Crie ou atualize o serviço usando o seguinte comando: - gcloud run services replace service.yaml 
Terraform
Para saber como aplicar ou remover uma configuração do Terraform, consulte Comandos básicos do Terraform.
Adicione o seguinte a um recursogoogle_cloud_run_v2_service
  na configuração do Terraform:Substitua 80 pelo número máximo desejado de solicitações simultâneas.
Ver configurações de simultaneidade
Para ver as configurações de simultaneidade atuais do serviço do Cloud Run:
Console
- No Google Cloud console, acesse o Cloud Run: 
- Clique no serviço de seu interesse para abrir a página Detalhes do serviço. 
- Clique na guia Revisões. 
- No painel de detalhes à direita, a configuração de simultaneidade está listada na guia Contêiner. 
gcloud
- Use o comando a seguir: - gcloud run services describe SERVICE 
- Localize a configuração de simultaneidade na configuração retornada.