Cloud Run-Dienste konfigurieren

Auf dieser Seite finden Sie einen Überblick über die Konfigurationsoptionen für Cloud Run-Dienste.

Kaltstarts vermeiden und Latenz reduzieren

Sie können Kaltstarts für Ihre Anwendung vermeiden und die Anwendungslatenz reduzieren. Legen Sie dazu eine Mindestanzahl von Instanzen fest. Hinweis: Die Festlegung einer Mindestanzahl von Instanzen verursacht Kosten. Weitere Informationen finden Sie unter Mindestanzahl von Instanzen für Dienste festlegen.

Kapazität

Sie können die Menge an Arbeitsspeicher, CPU und maximaler Parallelität steuern, die ein Dienst verwenden kann.

Mit den Abrechnungseinstellungen können Sie festlegen, wie die Abrechnung erfolgt: pro Anfrage und nur dann, wenn die Instanz eine Anfrage verarbeitet, oder für den gesamten Lebenszyklus der Instanz.

Umgebungsvariablen

Sie können Schlüssel/Wert-Paare für die Verwendung mit Ihrem Cloud Run-Dienst erstellen. Weitere Informationen finden Sie unter Umgebungsvariablen für Dienste konfigurieren.

Ausführungsumgebung

Cloud Run hat zwei Ausführungsumgebungen. Informationen zu den Unterschieden zwischen den beiden Ausführungsumgebungen

GPU

Wenn Sie KI-Arbeitslasten wie Inferenzmodelle und Modelltraining hosten müssen, können Sie Cloud Run-Dienste mit oder ohne GPU konfigurieren.

Schutz vor hohem Anfragenaufkommen

Sie können steuern, wie viele Instanzen Ihr Cloud Run-Dienst zur Bereitstellung von Anfragen erstellt, indem Sie maximale Instanzen und minimale Instanzen festlegen. Dadurch können Sie die Kosten begrenzen und sich vor anomalen hohen Anfrageaufkommen schützen.

Systemdiagnosen

In Cloud Run können Sie zwei Arten von Systemdiagnoseprüfungen konfigurieren. Mit einer der Prüfungen wird ermittelt, wann der Container bereit ist, Traffic anzunehmen, und mit der anderen, ob der Container neu gestartet werden soll. Weitere Informationen zu Container-Systemdiagnosen

Labels

Cloud Run-Labels sind Schlüssel/Wert-Paare, die Sie auf Cloud Run-Dienste, Überarbeitungen und Cloud Run Functions anwenden können. Mit Labels können Sie Ihre Cloud Run-Ressourcen organisieren und Kosten in großem Umfang mit der erforderlichen Detailgenauigkeit verwalten.

Labels, die Sie zuvor für Ihre Cloud Run-Funktionen mit gcloud functions-Befehlen oder der Cloud Functions V2 API festgelegt haben, werden in Cloud Run übernommen, wenn Sie Ihre Funktionen in Cloud Run bereitstellen.

Skalierung

Standardmäßig wird in Cloud Run automatisch auf eine angegebene oder standardmäßige maximale Anzahl von Instanzen skaliert, je nach Traffic und CPU-Auslastung. In einigen Anwendungsfällen ist es jedoch möglicherweise sinnvoll, eine bestimmte Anzahl von Instanzen mit manueller Skalierung festzulegen.

Secrets

Sie können Secret Manager mit Cloud Run verwenden, um API-Schlüssel, Passwörter und andere vertrauliche Informationen sicher zu speichern. Weitere Informationen finden Sie unter Secrets konfigurieren.

Dienstidentität

Die Cloud Run-Dienstidentität ist das Dienstkonto, das als authentifiziertes Konto für den Zugriff aufGoogle Cloud APIs über Ihren Cloud Run-Instanzcontainer verwendet wird. Wir empfehlen, ein Dienstkonto zu erstellen und den Mindestsatz an Berechtigungen festzulegen, die das Dienstkonto für den Zugriff auf bestimmte Google Cloud-Ressourcen benötigt.

Zeitlimits

Sie können ein Cloud Run-Zeitlimit für Anfragen festlegen, das angibt, innerhalb welcher Zeit eine Antwort zurückgegeben werden muss.

Empfehlungen

Unter Mit Recommender optimieren finden Sie Informationen zu den Optimierungen, die Recommender in Cloud Run bietet.

Traffic-Aufteilung

Jedes Mal, wenn Sie einen Dienst bereitstellen oder neu bereitstellen, wird automatisch eine neue Überarbeitung des zugrunde liegenden Cloud Run-Dienstes erstellt. Weitere Informationen finden Sie unter Sitzungsaffinität und Trafficaufteilung.

Tag-Dienste

Tags sind Schlüssel/Wert-Paare, die Sie für eine differenzierte Zugriffssteuerung auf Ihre Ressourcen anwenden können.

Tag-Administratoren erstellen Tags für Ressourcen in Google Cloud auf Organisations- oder Projektebene. Mit Tags können Sie Richtlinien auf Basis der Bedingung festlegen, ob eine Ressource ein bestimmtes Tag hat. Weitere Informationen finden Sie unter Tag-Dienste.

Volume-Bereitstellungen

Mit Cloud Run-Volumebereitstellungen können Sie von Ihrem Container aus auf freigegebene Daten zugreifen, die in einem lokalen Dateisystem gespeichert sind, z. B. in einem Speicher-Bucket oder auf einem Dateiserver. Sie können einen Cloud Storage-Bucket, eine NFS-Freigabe wie eine Filestore-Instanz oder ein von Cloud Run bereitgestelltes In-Memory-Dateisystem bereitstellen.