Configura la simultaneidad máxima

Para comprender la configuración de simultaneidad máxima, lee el documento sobre el concepto de simultaneidad.

Cualquier cambio en la configuración conlleva la creación de una revisión nueva. Las revisiones posteriores también adoptarán esta configuración de manera automática, a menos que realices actualizaciones explícitas para cambiarla.

Puedes configurar la simultaneidad máxima con Cloud Console, la línea de comandos de gcloud o un archivo .yaml cuando creas un servicio nuevo o implementas una revisión nueva:

Console

  1. Ir a Cloud Run

  2. Haz clic en Crear servicio si quieres configurar un servicio nuevo en el que realizarás la implementación. Si quieres configurar un servicio existente, haz clic en el servicio y, luego, en Implementar y editar una nueva revisión.

  3. En Configuración avanzada, haz clic en Contenedor.

    image

  4. Establece el valor de simultaneidad máxima deseado en el cuadro de texto Maximum requests per container (Máximo de solicitudes por contenedor).

  5. Haz clic en Crear o Implementar.

Línea de comandos

Para configurar la simultaneidad máxima, usa el siguiente comando:

gcloud run services update SERVICE --concurrency CONCURRENCY

Reemplazar

  • SERVICE por el nombre de tu servicio
  • CONCURRENCY por la cantidad máxima de solicitudes simultáneas por instancia de contenedor. Por ejemplo, lo siguiente establece un máximo de 40 solicitudes simultáneas:

    gcloud run services update SERVICE --concurrency 40

Si cambias la simultaneidad máxima de un servicio determinado, las revisiones posteriores adoptarán esta configuración.

Para volver a la simultaneidad máxima predeterminada (250), usa el comando siguiente:

gcloud run services update SERVICE --concurrency default

Reemplaza SERVICE por el nombre del servicio que estás configurando.

YAML

Puedes descargar y ver la configuración del servicio existente mediante el comando gcloud run services describe --format export, que genera resultados limpios en formato YAML. Luego, puedes modificar los campos que se describen a continuación y subir el YAML modificado mediante el comando gcloud beta run services replace. Asegúrate de modificar los campos tal como se indica en la documentación.

  1. Para ver y descargar la configuración, ejecuta el siguiente comando:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Actualiza el atributo containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containerConcurrency: CONCURRENCY

    Reemplaza los siguientes elementos:

    • SERVICE por el nombre del servicio de Cloud Run
    • IMAGE por la URL de la imagen de contenedor
    • CONCURRENCY por la cantidad máxima de solicitudes simultáneas por instancia de contenedor
  3. Reemplaza el servicio por la configuración nueva mediante el comando siguiente:

    gcloud beta run services replace service.yaml