Definir o máximo de solicitações simultâneas por instância
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Para entender o máximo de solicitações simultâneas por instância, leia o
documento de conceitos.
Funções exigidas
Para receber as permissões necessárias para configurar e implantar os serviços do Cloud Run,
peça ao administrador para conceder a você os
seguintes papéis do IAM:
Se você estiver implantando um serviço
ou uma função do código-fonte, também
precisará ter outros papéis concedidos a você no projeto e na
conta de serviço do Cloud Build.
Configurar o máximo de solicitações simultâneas por instância
Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.
Para os serviços do Cloud Run, é possível definir o máximo de solicitações simultâneas por instância usando o Google Cloud console, a linha de comando gcloud ou um arquivo .yaml ao criar um novo serviço ou
implantar uma nova revisão:
Selecione Serviços no menu e clique em Implantar contêiner para
configurar um novo serviço.
Se você estiver configurando um
serviço atual, clique nele e em Editar e implantar nova revisão.
Ao configurar um novo serviço, preencha a página inicial de configurações
de serviço e clique em Contêineres, volumes, Rede e segurança para
expandir essa página.
Clique na guia Contêiner.
Defina o máximo de solicitações simultâneas por valor de instância na caixa de texto Máximo de solicitações por contêiner.
Clique em Criar ou Implantar.
gcloud
Para definir o máximo de solicitações simultâneas por instância, use o seguinte comando:
CONCURRENCY: o número máximo de solicitações simultâneas por
instância. Por exemplo, o comando a seguir define um máximo de 1
solicitações simultâneas:
gcloudrunservicesupdateSERVICE--concurrency1
Alterar o número máximo de solicitações simultâneas por instância de um determinado serviço captura essa configuração em uma
nova revisão.
Para reverter para o máximo de solicitações simultâneas padrão por instância (80), use o comando
Substitua SERVICE pelo nome do serviço que você está configurando.
YAML
Se você estiver criando um novo serviço, pule esta etapa.
Se você estiver atualizando um serviço existente, faça o download da configuração YAML correspondente:
IMAGE_URL: uma referência à imagem de contêiner, por
exemplo, us-docker.pkg.dev/cloudrun/container/hello:latest. Se você usa o Artifact Registry, o repositórioREPO_NAME já precisará ter sido criado. O URL segue o formato LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
.
CONCURRENCY: o número máximo de solicitações simultâneas por
instância.
REVISION por um novo nome de revisão ou excluí-lo (se houver). Se você fornecer um novo nome de revisão, ele precisará atender aos seguintes critérios:
Começa com SERVICE-
Contém apenas letras minúsculas, números e -
Não termina com um -
Não excede 63 caracteres
Crie ou atualize o serviço usando o seguinte comando:
resource"google_cloud_run_v2_service""default"{name="cloudrun-service-concurrency"location="us-central1"deletion_protection=false # set to "true" in productiontemplate{containers{image="us-docker.pkg.dev/cloudrun/container/hello"} # Maximum concurrent requestsmax_instance_request_concurrency=80}}
Substitua 80 pelo número máximo desejado de solicitações simultâneas.
Ver configurações de simultaneidade
Para ver as configurações de simultaneidade atuais do
serviço do Cloud Run:
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[],[],null,["# Set maximum concurrent requests per instance\n\nTo understand the maximum concurrent requests per instance setting, read the\n[concept document](/run/docs/about-concurrency).\n\nRequired roles\n--------------\n\n\nTo get the permissions that\nyou need to configure and deploy Cloud Run services,\n\nask your administrator to grant you the\nfollowing IAM roles:\n\n- [Cloud Run Developer](/iam/docs/roles-permissions/run#run.developer) (`roles/run.developer`) on the Cloud Run service\n- [Service Account User](/iam/docs/roles-permissions/iam#iam.serviceAccountUser) (`roles/iam.serviceAccountUser`) on the service identity\n\n\nIf you are deploying a [service](/run/docs/deploying-source-code#required_roles)\nor [function](/run/docs/deploy-functions#required-roles) from source code, you\nmust also have additional roles granted to you on your project and\nCloud Build service account.\n\nFor a list of IAM roles and permissions that are associated with\nCloud Run, see\n[Cloud Run IAM roles](/run/docs/reference/iam/roles)\nand [Cloud Run IAM permissions](/run/docs/reference/iam/permissions).\nIf your Cloud Run service interfaces with\nGoogle Cloud APIs, such as Cloud Client Libraries, see the\n[service identity configuration guide](/run/docs/configuring/services/service-identity).\nFor more information about granting roles, see\n[deployment permissions](/run/docs/reference/iam/roles#additional-configuration)\nand [manage access](/iam/docs/granting-changing-revoking-access).\n\nConfigure maximum concurrent requests per instance\n--------------------------------------------------\n\nAny configuration change leads to the\ncreation of a new revision. Subsequent revisions will also automatically get\nthis configuration setting unless you make explicit updates to change it.\n\nFor Cloud Run services, you can set maximum concurrent requests\nper instance using the Google Cloud console, the\ngcloud command line, or using a .yaml file when you\n[create a new service](/run/docs/deploying#service) or\n[deploy a new revision](/run/docs/deploying#revision): \n\n### Console\n\n\n1. In the Google Cloud console, go to Cloud Run:\n\n [Go to Cloud Run](https://console.cloud.google.com/run)\n2. Select **Services** from the menu, and click **Deploy container** to\n configure a new service.\n If you are configuring an existing service, click the\n service, then click **Edit and deploy new revision**.\n\n3. If you are configuring a new service, fill out the initial service\n settings page, then click **Container(s), Volumes, Networking, Security** to expand the\n service configuration page.\n\n4. Click the **Container** tab.\n\n - Set the desired maximum concurrent requests per instance value in the text box *Maximum requests per container*.\n5. Click **Create** or **Deploy**.\n\n### gcloud\n\nTo set maximum concurrent requests per instance, use the following command:\n\n\u003cbr /\u003e\n\n```bash\ngcloud run services update SERVICE --concurrency CONCURRENCY\n```\n\n\u003cbr /\u003e\n\nReplace the following:\n\n- \u003cvar translate=\"no\"\u003eSERVICE\u003c/var\u003e: the name of your service.\n- \u003cvar translate=\"no\"\u003eCONCURRENCY\u003c/var\u003e: the maximum number of concurrent requests per\n instance. For example, the following sets a maximum of 1\n concurrent requests:\n\n ```bash\n gcloud run services update SERVICE --concurrency 1\n ```\n\nChanging the maximum concurrent requests per instance of a given service will capture this setting in a\nnew revision.\n\nTo revert to the default maximum concurrent requests per instance (`80`), use the command\n\n\u003cbr /\u003e\n\n```bash\ngcloud run services update SERVICE --concurrency default\n```\n\n\u003cbr /\u003e\n\nReplace \u003cvar translate=\"no\"\u003eSERVICE\u003c/var\u003e with the name of the service you are configuring.\n\n### YAML\n\n1. If you are creating a new service, skip this step.\n If you are updating an existing service, download its [YAML configuration](/run/docs/reference/yaml/v1):\n\n ```bash\n gcloud run services describe SERVICE --format export \u003e service.yaml\n ```\n2. Update the `containerConcurrency` attribute:\n\n ```yaml\n apiVersion: serving.knative.dev/v1\n kind: Service\n metadata:\n name: SERVICE\n spec:\n template:\n metadata:\n name: REVISION\n spec:\n containerConcurrency: CONCURRENCY\n ```\n\n Replace the following:\n - \u003cvar translate=\"no\"\u003eSERVICE\u003c/var\u003e: the name of your Cloud Run service\n - \u003cvar translate=\"no\"\u003eIMAGE_URL\u003c/var\u003e: a reference to the container image, for example, `us-docker.pkg.dev/cloudrun/container/hello:latest`. If you use Artifact Registry, the [repository](/artifact-registry/docs/repositories/create-repos#docker) \u003cvar translate=\"no\"\u003eREPO_NAME\u003c/var\u003e must already be created. The URL follows the format of \u003cvar translate=\"no\"\u003eLOCATION\u003c/var\u003e`-docker.pkg.dev/`\u003cvar translate=\"no\"\u003ePROJECT_ID\u003c/var\u003e`/`\u003cvar translate=\"no\"\u003eREPO_NAME\u003c/var\u003e`/`\u003cvar translate=\"no\"\u003ePATH\u003c/var\u003e`:`\u003cvar translate=\"no\"\u003eTAG\u003c/var\u003e .\n - \u003cvar translate=\"no\"\u003eCONCURRENCY\u003c/var\u003e: the maximum number of concurrent requests per instance.\n - \u003cvar translate=\"no\"\u003eREVISION\u003c/var\u003e with a new revision name or delete it (if present). If you supply a new revision name, it **must** meet the following criteria:\n - Starts with \u003cvar translate=\"no\"\u003eSERVICE\u003c/var\u003e`-`\n - Contains only lowercase letters, numbers and `-`\n - Does not end with a `-`\n - Does not exceed 63 characters\n3. Create or update the service using the following command:\n\n ```bash\n gcloud run services replace service.yaml\n ```\n\n### Terraform\n\n\nTo learn how to apply or remove a Terraform configuration, see\n[Basic Terraform commands](/docs/terraform/basic-commands).\nAdd the following to a [`google_cloud_run_v2_service`](https://registry.terraform.io/providers/hashicorp/google/latest/docs/resources/cloud_run_v2_service) resource in your Terraform configuration: \n\n\u003cbr /\u003e\n\n resource \"google_cloud_run_v2_service\" \"default\" {\n name = \"cloudrun-service-concurrency\"\n location = \"us-central1\"\n\n deletion_protection = false # set to \"true\" in production\n\n template {\n containers {\n image = \"us-docker.pkg.dev/cloudrun/container/hello\"\n }\n # Maximum concurrent requests\n max_instance_request_concurrency = 80\n }\n }\n\nReplace `80` with your desired maximum number of concurrent requests.\n\nView concurrency settings\n-------------------------\n\nTo view the current concurrency settings for your\nCloud Run service: \n\n### Console\n\n1. In the Google Cloud console, go to Cloud Run:\n\n [Go to Cloud Run](https://console.cloud.google.com/run)\n2. Click the service you are interested in to open the **Service details**\n page.\n\n3. Click the **Revisions** tab.\n\n4. In the details panel at the right, the concurrency setting\n is listed under the **Container** tab.\n\n### gcloud\n\n1. Use the following command:\n\n ```bash\n gcloud run services describe SERVICE\n ```\n2. Locate the concurrency setting in the returned\n configuration."]]