Auf dieser Seite finden Sie einen Überblick über die Konfigurationsoptionen für Cloud Run-Dienste.
Kaltstarts vermeiden und Latenz reduzieren
Sie können Kaltstarts für Ihre Anwendung vermeiden und die Anwendungslatenz reduzieren. Legen Sie dazu eine Mindestanzahl von Instanzen fest. Hinweis: Die Festlegung einer Mindestanzahl von Instanzen verursacht Kosten. Weitere Informationen finden Sie unter Mindestanzahl von Instanzen für Dienste festlegen.
Kapazität
Sie können die Menge an Arbeitsspeicher, CPU und maximaler Parallelität steuern, die ein Dienst verwenden kann.
Mit den Abrechnungseinstellungen können Sie festlegen, wie die Abrechnung erfolgt: pro Anfrage und nur dann, wenn die Instanz eine Anfrage verarbeitet, oder für den gesamten Lebenszyklus der Instanz.
Umgebungsvariablen
Sie können Schlüssel/Wert-Paare für die Verwendung mit Ihrem Cloud Run-Dienst erstellen. Weitere Informationen finden Sie unter Umgebungsvariablen für Dienste konfigurieren.
Ausführungsumgebung
Cloud Run hat zwei Ausführungsumgebungen. Informationen zu den Unterschieden zwischen den beiden Ausführungsumgebungen
GPU
Wenn Sie KI-Arbeitslasten wie Inferenzmodelle und Modelltraining hosten müssen, können Sie Cloud Run-Dienste mit oder ohne GPU konfigurieren.
Schutz vor hohem Anfragenaufkommen
Sie können steuern, wie viele Instanzen Ihr Cloud Run-Dienst zur Bereitstellung von Anfragen erstellt, indem Sie maximale Instanzen und minimale Instanzen festlegen. Dadurch können Sie die Kosten begrenzen und sich vor anomalen hohen Anfrageaufkommen schützen.
Systemdiagnosen
In Cloud Run können Sie zwei Arten von Systemdiagnoseprüfungen konfigurieren. Mit einer der Prüfungen wird ermittelt, wann der Container bereit ist, Traffic anzunehmen, und mit der anderen, ob der Container neu gestartet werden soll. Weitere Informationen zu Container-Systemdiagnosen
Labels
Cloud Run-Labels sind Schlüssel/Wert-Paare, die Sie auf Cloud Run-Dienste, Überarbeitungen und Cloud Run Functions anwenden können. Mit Labels können Sie Ihre Cloud Run-Ressourcen organisieren und Kosten in großem Umfang mit der erforderlichen Detailgenauigkeit verwalten.
Labels, die Sie zuvor für Ihre Cloud Run-Funktionen mit gcloud functions
-Befehlen oder der Cloud Functions V2 API festgelegt haben, werden in Cloud Run übernommen, wenn Sie Ihre Funktionen in Cloud Run bereitstellen.
Skalierung
Standardmäßig wird in Cloud Run automatisch auf eine angegebene oder standardmäßige maximale Anzahl von Instanzen skaliert, je nach Traffic und CPU-Auslastung. In einigen Anwendungsfällen ist es jedoch möglicherweise sinnvoll, eine bestimmte Anzahl von Instanzen mit manueller Skalierung festzulegen.
Secrets
Sie können Secret Manager mit Cloud Run verwenden, um API-Schlüssel, Passwörter und andere vertrauliche Informationen sicher zu speichern. Weitere Informationen finden Sie unter Secrets konfigurieren.
Dienstidentität
Die Cloud Run-Dienstidentität ist das Dienstkonto, das als authentifiziertes Konto für den Zugriff aufGoogle Cloud APIs über Ihren Cloud Run-Instanzcontainer verwendet wird. Wir empfehlen, ein Dienstkonto zu erstellen und den Mindestsatz an Berechtigungen festzulegen, die das Dienstkonto für den Zugriff auf bestimmte Google Cloud-Ressourcen benötigt.
Zeitlimits
Sie können ein Cloud Run-Zeitlimit für Anfragen festlegen, das angibt, innerhalb welcher Zeit eine Antwort zurückgegeben werden muss.
Empfehlungen
Unter Mit Recommender optimieren finden Sie Informationen zu den Optimierungen, die Recommender in Cloud Run bietet.
Traffic-Aufteilung
Jedes Mal, wenn Sie einen Dienst bereitstellen oder neu bereitstellen, wird automatisch eine neue Überarbeitung des zugrunde liegenden Cloud Run-Dienstes erstellt. Weitere Informationen finden Sie unter Sitzungsaffinität und Trafficaufteilung.
Tag-Dienste
Tags sind Schlüssel/Wert-Paare, die Sie für eine differenzierte Zugriffssteuerung auf Ihre Ressourcen anwenden können.
Tag-Administratoren erstellen Tags für Ressourcen in Google Cloud auf Organisations- oder Projektebene. Mit Tags können Sie Richtlinien auf Basis der Bedingung festlegen, ob eine Ressource ein bestimmtes Tag hat. Weitere Informationen finden Sie unter Tag-Dienste.
Volume-Bereitstellungen
Mit Cloud Run-Volumebereitstellungen können Sie von Ihrem Container aus auf freigegebene Daten zugreifen, die in einem lokalen Dateisystem gespeichert sind, z. B. in einem Speicher-Bucket oder auf einem Dateiserver. Sie können einen Cloud Storage-Bucket, eine NFS-Freigabe wie eine Filestore-Instanz oder ein von Cloud Run bereitgestelltes In-Memory-Dateisystem bereitstellen.