Configura una cantidad máxima de instancias de contenedor

En esta página, se describe cómo configurar la cantidad máxima de instancias de contenedor que se pueden usar para el servicio de Cloud Run. Especificar un máximo de instancias en Cloud Run te permite limitar el escalamiento del servicio en respuesta a solicitudes entrantes. Usa esta configuración como una forma de controlar tus costos o limitar la cantidad de conexiones a un servicio de apoyo, como una base de datos.

Ten en cuenta que, a fin de especificar una cantidad máxima de instancias superior a 1,000 para Cloud Run (completamente administrado), primero debes solicitar un aumento de la cuota.

Para obtener más información sobre cómo Cloud Run realiza el ajuste de escala automático de las instancias de contenedor, consulta Ajuste de escala automático de instancias.

Configura y actualiza un máximo de instancias

Cualquier cambio en la configuración conlleva la creación de una revisión nueva. Las revisiones posteriores también adoptarán esta configuración de manera automática, a menos que realices actualizaciones explícitas para cambiarla.

De forma predeterminada, las instancias de contenedor pueden escalar horizontalmente hasta 1,000. Puedes cambiar esta configuración predeterminada mediante Cloud Console, la línea de comandos de gcloud o un archivo YAML cuando creas un servicio nuevo o implementas una revisión nueva:

Console

  1. Ir a Cloud Run

  2. Haz clic en Crear servicio si quieres configurar un servicio nuevo en el que realizarás la implementación. Si quieres configurar un servicio existente, haz clic en el servicio y, luego, en Edit and Deploy New Revision.

  3. Si estás configurando un servicio nuevo, llena la página de configuración inicial del servicio como desees y haz clic en Siguiente > Configuración avanzada para acceder a la página de configuración del servicio.

  4. Haz clic en la pestaña Contenedor.

    image

  5. En el campo Maximum number of instances (Número máximo de instancias), especifica la cantidad máxima deseada de instancias de contenedor mediante cualquier valor de número entero del 1 al 1000 o más si solicitaste un aumento de la cuota.

  6. Haz clic en Crear o Implementar.

Línea de comandos

Puedes actualizar la cantidad máxima de instancias de contenedor de un servicio determinado mediante el siguiente comando:

gcloud run services update SERVICE --max-instances MAX-VALUE

Reemplaza los siguientes elementos:

  • SERVICE por el nombre de tu servicio
  • MAX-VALUE por la cantidad máxima deseada de instancias de contenedor, mediante cualquier valor de número entero del 1 al 1000 o más si solicitaste un aumento de cuota. Especifica default para borrar cualquier configuración de un máximo de instancias

También puedes configurar la cantidad máxima de instancias de contenedor durante la implementación mediante el siguiente comando:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Reemplaza los siguientes elementos:

  • IMAGE_URL por una referencia a la imagen del contenedor, como gcr.io/myproject/my-image:latest
  • MAX-VALUE por la cantidad máxima deseada de instancias de contenedor, mediante cualquier valor de número entero del 1 al 1000 o más si solicitaste un aumento de cuota. Especifica default para borrar cualquier configuración de un máximo de instancias

YAML

Puedes descargar y ver la configuración del servicio existente mediante el comando gcloud run services describe --format export, que genera resultados limpios en formato YAML. Luego, puedes modificar los campos que se describen a continuación y subir el YAML modificado mediante el comando gcloud beta run services replace. Asegúrate de modificar los campos tal como se indica en la documentación.

  1. Para ver y descargar la configuración, ejecuta el siguiente comando:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Actualiza el atributo autoscaling.knative.dev/maxScale::

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    Reemplaza los siguientes elementos:

    • MAX-INSTANCE por la cantidad máxima deseada
  3. Reemplaza el servicio por la configuración nueva mediante el comando siguiente:

    gcloud beta run services replace service.yaml

Visualiza la configuración de instancias máximas

Si deseas ver la configuración de cantidad máxima actual para tu servicio, sigue estos pasos:

Console

  1. Ir a Cloud Run

  2. Haz clic en el servicio que te interesa para abrir la página Detalles del servicio.

  3. Hacer clic en la pestaña Revisions (Revisiones).

  4. En el panel de detalles a la derecha, la configuración de instancias máximas se muestra en la pestaña Contenedor.

Línea de comandos

  1. Usa el siguiente comando:

    gcloud run services describe SERVICE
  2. Busca la configuración de instancias máximas en la configuración que se muestra.