Ressourcenmodell

Das folgende Diagramm zeigt das Cloud Run for Anthos-Ressourcenmodell:

Diagramm: Cloud Run for Anthos-Dienste und -Überarbeitungen

Im Diagramm ist ein Google Cloud-Projekt mit zwei Cloud Run for Anthos-Diensten, Service A und Service B, zu sehen, von denen jeder mehrere Überarbeitungen hat.

Im Diagramm erhält Service A viele Anfragen, was zum Starten und Ausführen mehrerer Container-Instanzen führt. Service B empfängt derzeit keine Anfragen, daher wird noch keine Container-Instanz gestartet.

Cloud Run for Anthos-Dienste

Der Dienst ist die Hauptressource von Cloud Run for Anthos. Jeder Dienst befindet sich in einem bestimmten GKE-Cluster-Namespace.

Ein Google Cloud-Projekt kann viele Dienste in verschiedenen Regionen oder GKE-Clustern ausführen.

Jeder Dienst stellt einen eindeutigen Endpunkt bereit und skaliert die zugrunde liegende Infrastruktur automatisch, um eingehende Anfragen zu verarbeiten.

Cloud Run for Anthos-Überarbeitungen

Bei jedem Deployment in einem Dienst wird eine Überarbeitung erstellt. Jede Überarbeitung umfasst ein bestimmtes Container-Image sowie Umgebungseinstellungen wie Umgebungsvariablen, Arbeitsspeicherlimits oder einen Gleichzeitigkeitswert.

Überarbeitungen können nach der Erstellung nicht mehr geändert werden. Wenn Sie beispielsweise ein Container-Image für einen neuen Cloud Run for Anthos-Dienst bereitstellen, wird die erste Überarbeitung erstellt. Wenn Sie anschließend für denselben Dienst ein anderes Container-Image bereitstellen, wird eine zweite Überarbeitung erstellt. Wenn Sie anschließend eine Umgebungsvariable festlegen, wird eine dritte Überarbeitung erstellt und so weiter.

Anfragen werden automatisch so schnell wie möglich an die neueste fehlerfreie Dienstüberarbeitung weitergeleitet. Sie können den Traffic nach Bedarf auf verschiedene Versionen aufteilen.

Cloud Run for Anthos-Containerinstanzen

Jede Überarbeitung, die Anfragen empfängt, wird automatisch auf die Anzahl der Containerinstanzen skaliert, die zur Verarbeitung aller Anfragen nötig sind. Eine Containerinstanz kann viele Anfragen gleichzeitig empfangen. Mit der Gleichzeitigkeitseinstellung können Sie die maximale Anzahl von Anfragen festlegen, die parallel an eine bestimmte Containerinstanz gesendet werden können.