En esta página, se proporciona una descripción general de las opciones de configuración para los servicios de Cloud Run.
Evita los inicios en frío y reduce la latencia
Puedes evitar los inicios en frío para tu aplicación y reducir la latencia de esta si configuras una cantidad mínima de instancias. Ten en cuenta que establecer una cantidad mínima de instancias genera costos. Consulta Cómo establecer instancias mínimas para los servicios para obtener más información.
Capacidad
Puedes controlar la cantidad de memoria, CPU y concurrencia máxima que puede usar un servicio.
Usa la configuración de facturación para controlar cómo se te cobra, ya sea por solicitud y solo cuando la instancia procesa una solicitud, o por todo el ciclo de vida de la instancia.
Variables de entorno
Puedes crear pares clave-valor para usar con tu servicio de Cloud Run. Consulta Configura variables de entorno para los servicios para obtener más información.
Entorno de ejecución
Cloud Run tiene dos entornos de ejecución. Obtén información sobre las diferencias entre ambos entornos de ejecución
GPU
Si necesitas alojar cargas de trabajo de IA, como modelos de inferencia y entrenamiento de modelos, puedes configurar servicios de Cloud Run con GPU o sin ella.
Protégete contra niveles de solicitud altos
Puedes controlar cuántas instancias crea tu servicio de Cloud Run para atender solicitudes configurando instancias máximas y instancias mínimas. Esto puede ayudar a evitar los costos y protegerte contra los niveles de solicitud más altos.
Verificaciones de estado
Cloud Run te permite configurar dos tipos de sondeos de verificación de estado. Uno de los sondeos determina cuándo el contenedor está listo para aceptar tráfico, y el otro determina si se debe reiniciar el contenedor. Obtén más información sobre las verificaciones de estado de los contenedores.
Etiquetas
Las etiquetas de Cloud Run son pares clave-valor que puedes aplicar a los servicios, las revisiones y las funciones de Cloud Run. Las etiquetas te ayudan a organizar tus recursos de Cloud Run y a administrar los costos a gran escala con el nivel de detalle que necesitas.
Las etiquetas que estableciste anteriormente para tus funciones de Cloud Run con los comandos gcloud functions
o la API de Cloud Functions v2 se propagan a Cloud Run cuando implementas tus funciones en Cloud Run.
Escalamiento
De forma predeterminada, Cloud Run ajusta automáticamente la escala horizontal hasta una cantidad máxima especificada o predeterminada de instancias, según el tráfico y el uso de CPU. Sin embargo, en algunos casos de uso, es posible que desees establecer una cantidad específica de instancias con el ajuste de escala manual.
Secrets
Puedes usar Secret Manager con Cloud Run para almacenar de manera segura claves de API, contraseñas y otra información sensible. Consulta Configura secretos para obtener más información.
Identidad del servicio
La identidad del servicio de Cloud Run es la cuenta de servicio que se usa como la cuenta autenticada para acceder a las APIs deGoogle Cloud desde el contenedor de instancias de Cloud Run. Te recomendamos que crees una cuenta de servicio y determines el conjunto de permisos más mínimo que necesita la cuenta de servicio para acceder a recursos específicos de Google Cloud.
Tiempos de espera
Puedes establecer un tiempo de espera de la solicitud de Cloud Run que especifique el tiempo en el que se debe devolver una respuesta.
Recomendaciones
Consulta Optimiza con el Recomendador para conocer las optimizaciones que proporciona el Recomendador en Cloud Run.
División del tráfico
Cada vez que implementas o vuelves a implementar un servicio, se crea automáticamente una revisión nueva del servicio subyacente de Cloud Run. Consulta Afinidad de sesión y división de tráfico para obtener más detalles.
Etiqueta servicios
Las etiquetas son pares clave-valor que puedes aplicar a tus recursos para obtener un control de acceso detallado con la consola de Cloud Run.
Los administradores de etiquetas crean etiquetas para los recursos en Google Cloud a nivel de la organización o del proyecto. Las etiquetas proporcionan una forma de permitir o rechazar políticas de manera condicional en función de si un recurso tiene una etiqueta específica. Para obtener más información, consulta Servicios de etiquetado.
Activaciones de volúmenes
Los activadores de volúmenes de Cloud Run te permiten acceder a los datos compartidos almacenados en un sistema de archivos local, como el contenido de un bucket de almacenamiento o un servidor de archivos, desde tu contenedor. Puedes activar un bucket de Cloud Storage, un recurso compartido de NFS, como una instancia de Filestore, o un sistema de archivos en memoria proporcionado por Cloud Run.