Para comprender la configuración de simultaneidad máxima, lee el documento sobre el concepto de simultaneidad.
Cualquier cambio en la configuración conlleva la creación de una revisión nueva. Las revisiones posteriores también adoptarán esta configuración de manera automática, a menos que realices actualizaciones explícitas para cambiarla.
Puedes configurar la simultaneidad máxima con Cloud Console, la línea de comandos de gcloud o un archivo .yaml cuando creas un servicio nuevo o implementas una revisión nueva:
Console
Haz clic en Crear servicio si quieres configurar un servicio nuevo en el que realizarás la implementación. Si quieres configurar un servicio existente, haz clic en el servicio y, luego, en Implementar y editar una nueva revisión.
En Configuración avanzada, haz clic en Contenedor.
Establece el valor de simultaneidad máxima deseado en el cuadro de texto Maximum requests per container (Máximo de solicitudes por contenedor).
Haz clic en Crear o Implementar.
Línea de comandos
Para configurar la simultaneidad máxima, usa el siguiente comando:
gcloud run services update SERVICE --concurrency CONCURRENCY
Reemplazar
- SERVICE por el nombre de tu servicio
CONCURRENCY por la cantidad máxima de solicitudes simultáneas por instancia de contenedor. Por ejemplo, lo siguiente establece un máximo de 40 solicitudes simultáneas:
gcloud run services update SERVICE --concurrency 40
Si cambias la simultaneidad máxima de un servicio determinado, las revisiones posteriores adoptarán esta configuración.
Para volver a la simultaneidad máxima predeterminada (250
), usa el comando siguiente:
gcloud run services update SERVICE --concurrency default
Reemplaza SERVICE por el nombre del servicio que estás configurando.
YAML
Puedes descargar y ver la configuración del servicio existente mediante el comando gcloud run services describe --format export
, que genera resultados limpios en formato YAML. Luego, puedes modificar los campos que se describen a continuación y subir el YAML modificado mediante el comando gcloud beta run services replace
.
Asegúrate de modificar los campos tal como se indica en la documentación.
Para ver y descargar la configuración, ejecuta el siguiente comando:
gcloud run services describe SERVICE --format export > service.yaml
Actualiza el atributo
containerConcurrency
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
Reemplaza los siguientes elementos:
- SERVICE por el nombre del servicio de Cloud Run
- IMAGE por la URL de la imagen de contenedor
- CONCURRENCY por la cantidad máxima de solicitudes simultáneas por instancia de contenedor
Reemplaza el servicio por la configuración nueva mediante el comando siguiente:
gcloud beta run services replace service.yaml