Ressourcenmodell

Das folgende Diagramm zeigt das Cloud Run-Ressourcenmodell:

Cloud Run-Dienste und Überarbeitungen

Das Diagramm zeigt ein Google Cloud-Projekt mit zwei Cloud Run-Diensten, Service A und Service B, von denen jeder mehrere Überarbeitungen hat.

Im Diagramm erhält Service A viele Anfragen, was zum Starten und Ausführen mehrerer Container-Instanzen führt. Service B empfängt derzeit keine Anfragen, daher wird noch keine Container-Instanz gestartet.

Cloud Run-Dienste

Dienste sind die wichtigsten Ressourcen von Cloud Run. Jeder Dienst befindet sich in einer bestimmten GCP-Region (Cloud Run) oder in einem GKE-Cluster-Namespace (Cloud Run for Anthos in Google Cloud). Zu Redundanz- und Failover-Zwecken werden Dienste automatisch in mehreren Zonen der Region repliziert, in der sie sich befinden. Im Rahmen eines GCP-Projekts können viele Dienste in unterschiedlichen Regionen oder GKE-Clustern ausgeführt werden.

Jeder Dienst stellt einen eindeutigen Endpunkt bereit und skaliert die zugrunde liegende Infrastruktur automatisch, um eingehende Anfragen zu verarbeiten.

Cloud Run-Überarbeitungen

Bei jedem Deployment in einem Dienst wird eine Überarbeitung erstellt. Jede Überarbeitung umfasst ein bestimmtes Container-Image sowie Umgebungseinstellungen wie Umgebungsvariablen, Arbeitsspeicherlimits oder einen Gleichzeitigkeitswert.

Überarbeitungen können nach der Erstellung nicht mehr geändert werden. Wenn Sie beispielsweise ein Container-Image für einen neuen Cloud Run-Dienst bereitstellen, wird die erste Überarbeitung erstellt. Wenn Sie anschließend für denselben Dienst ein anderes Container-Image bereitstellen, wird eine zweite Überarbeitung erstellt. Wenn Sie anschließend eine Umgebungsvariable festlegen, wird eine dritte Überarbeitung erstellt und so weiter.

Anfragen werden automatisch so schnell wie möglich an die neueste fehlerfreie Dienstüberarbeitung weitergeleitet.

Cloud Run-Containerinstanzen

Jede Überarbeitung, die Anfragen empfängt, wird automatisch auf die Anzahl der Containerinstanzen skaliert, die zur Verarbeitung aller Anfragen nötig sind. Eine Containerinstanz kann viele Anfragen gleichzeitig empfangen. Mit der Gleichzeitigkeitseinstellung können Sie die maximale Anzahl von Anfragen festlegen, die parallel an eine bestimmte Containerinstanz gesendet werden können.