Configurer les services Cloud Run

Cette page présente les options de configuration des services Cloud Run.

Éviter les démarrages à froid et réduire la latence

Vous pouvez éviter les démarrages à froid de votre application et en réduire la latence en définissant un nombre minimal d'instances. Notez que la définition d'un nombre minimal d'instances entraîne des coûts. Pour en savoir plus, consultez Définir un nombre minimal d'instances pour les services.

Capacité

Vous pouvez contrôler la quantité de mémoire, de CPU et de concurrence maximale qu'un service peut utiliser.

Utilisez les paramètres de facturation pour contrôler la façon dont vous êtes facturé : à la requête et uniquement lorsque l'instance traite une requête, ou pour l'intégralité du cycle de vie de l'instance.

Variables d'environnement

Vous pouvez créer des paires clé/valeur à utiliser avec votre service Cloud Run. Pour en savoir plus, consultez Configurer des variables d'environnement pour les services.

Environnement d'exécution

Cloud Run comporte deux environnements d'exécution. Découvrez les différences entre les deux environnements d'exécution.

GPU

Si vous devez héberger des charges de travail d'IA, telles que des modèles d'inférence et d'entraînement de modèles, vous pouvez configurer des services Cloud Run avec ou sans GPU.

Se protéger contre les niveaux de requêtes élevés

Vous pouvez contrôler le nombre d'instances que votre service Cloud Run crée pour traiter les requêtes en définissant le nombre maximal d'instances et le nombre minimal d'instances. Cela peut contribuer à réduire les coûts et à éviter des niveaux de requêtes anormalement élevés.

Vérifications d'état

Cloud Run vous permet de configurer deux types de tests de vérification de l'état#39;état. L'une des vérifications détermine quand les conteneurs sont prêts à accepter le trafic, et l'autre vérifie s'il faut redémarrer le conteneur. En savoir plus sur les vérifications de l'état des conteneurs

Étiquettes

Les libellés Cloud Run sont des paires clé/valeur que vous pouvez appliquer aux services, aux révisions et aux fonctions Cloud Run. Les libellés vous aident à organiser vos ressources Cloud Run et à gérer vos coûts à grande échelle avec la précision dont vous avez besoin.

Les libellés que vous avez définis précédemment pour vos fonctions Cloud Run à l'aide des commandes gcloud functions ou de l'API Cloud Functions v2 sont propagés à Cloud Run lorsque vous déployez vos fonctions dans Cloud Run.

Scaling

Par défaut, Cloud Run effectue automatiquement un scaling horizontal jusqu'à un nombre maximal d'instances spécifié ou par défaut, en fonction du trafic et de l'utilisation du processeur. Toutefois, dans certains cas d'utilisation, vous pouvez souhaiter définir un nombre spécifique d'instances à l'aide du scaling manuel.

Secrets

Vous pouvez utiliser Secret Manager avec Cloud Run pour stocker en toute sécurité des clés API, des mots de passe et d'autres informations sensibles. Pour en savoir plus, consultez Configurer des secrets.

Identité du service

L'identité de service Cloud Run est le compte de service utilisé comme compte authentifié pour accéder aux APIGoogle Cloud à partir de votre conteneur d'instances Cloud Run. Nous vous recommandons de créer un compte de service et de déterminer l'ensemble minimal d'autorisations dont il a besoin pour accéder à des ressources Google Cloudspécifiques.

Délais avant expiration

Vous pouvez définir un délai avant expiration des requêtes Cloud Run qui spécifie le délai au cours duquel une réponse doit être renvoyée.

Recommandations

Consultez Optimiser avec l'outil de recommandation pour découvrir les optimisations fournies par l'outil de recommandation sur Cloud Run.

Répartition du trafic

Chaque fois que vous déployez ou redéployez un service, une révision du service Cloud Run sous-jacent est automatiquement créée. Pour en savoir plus, consultez Affinité de session et répartition du trafic.

Services de tags

Les tags sont des paires clé/valeur que vous pouvez appliquer à vos ressources pour un contrôle d'accès précis à l'aide de la console Cloud Run.

Les administrateurs de tags créent des tags pour les ressources dans Google Cloud au niveau de l'organisation ou du projet. Les tags permettent d'autoriser ou de refuser des règles de manière conditionnelle selon qu'une ressource possède un tag spécifique ou non. Pour en savoir plus, consultez Services de tag.

Installations de volume

Les montages de volumes Cloud Run vous permettent d'accéder aux données partagées stockées dans un système de fichiers local, comme le contenu d'un bucket de stockage ou d'un serveur de fichiers, depuis votre conteneur. Vous pouvez installer un bucket Cloud Storage, un partage NFS comme une instance Filestore ou un système de fichiers en mémoire fourni par Cloud Run.