In diesem Dokument wird beschrieben, wie Sie die Ressourcen für einen Batchjob überwachen und optimieren können, indem Sie sich die Messwerte in Cloud Monitoring ansehen. Weitere Informationen zu den Ressourcen, auf denen ein Job ausgeführt wird, finden Sie unter Jobressourcen
Monitoring stellt für jeden Job grundlegende Messwerte wie die CPU bereit Auslastung und Netzwerkverkehr. Einige Messwerte, z. B. Speicher und Prozessauslastung; kann nur erfasst werden, wenn ein Job den Ops-Agent installiert. Messwerte für die Ressourcen eines Jobs helfen Ihnen, die Leistung und Auslastung zu bewerten der einzelnen Ressourcen. Anhand dieser Informationen können Sie Verbesserungen für zukünftige Iterationen des Jobs. So können Sie beispielsweise nicht genutzte Ressourcen entfernen, um die Kosten zu optimieren, oder belastete Ressourcen verbessern oder erhöhen, um die Leistung zu steigern.
Hinweise
- Wenn Sie Batch noch nicht verwendet haben, lesen Sie den Hilfeartikel Batch-Dateien erstellen und ausführen und aktivieren Sie Batch, indem Sie die Voraussetzungen für Projekte und Nutzer erfüllen.
- Optional: Um zusätzliche Messwerte für einen Job zu erfassen, erstellen und ausführen einen Job, der den Ops-Agent automatisch installiert.
- Aktivieren Sie die Monitoring API, falls noch nicht geschehen:
-
Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Monitoring Metric Viewer (
roles/monitoring.metricViewer
) für das Projekt zu erteilen, um die Berechtigungen zu erhalten, die Sie zum Aufrufen von Messwerten zur Observabiliät benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.
Messwerte für Jobressourcen aufrufen
VMs beobachten und überwachen in enthält die Compute Engine-Dokumentation relevante konzeptionelle Informationen über VM-Messwerte, Es werden jedoch verschiedene Methoden empfohlen, VM-Messwerte für Batchjobs. Insbesondere wird in der Compute Engine-Dokumentation erläutert, wie Sie Messwerte mithilfe der vordefinierten Monitoring-Dashboards für die Compute Engine oder der Compute Engine-Seiten in der Google Cloud Console aufrufen. Diese Methoden zeigen jedoch keine Informationen über VMs an, gelöscht wurden. Verwenden Sie diese Methoden daher nur, wenn Sie Messwerte für Batchjobs nur während der Ausführung ansehen möchten.
Messwerte für ausgeführte und abgeschlossene Batchjobs ansehen, mithilfe von Metrics Explorer-Diagrammen. Diagramme sind nur temporär, zu benutzerdefinierten Dashboards.
So erstellen Sie ein Diagramm für einen oder mehrere Messwerte:
- Optional: Wenn Sie das Diagramm speichern möchten, Benutzerdefiniertes Dashboard identifizieren oder erstellen für das Diagramm hinzu.
Erstellen Sie ein Metrics Explorer-Diagramm für einen oder mehrere Messwerte.
Ohne Filter enthalten alle VM-Messwerte in einem Diagramm Daten aus allen VMs in Ihrem Projekt. Optional können Sie das Diagramm so filtern, dass nur Messwerte aus allen oder bestimmten Batchjobs enthalten sind. Fügen Sie dazu den folgenden Filter hinzu:
group=RESOURCE_GROUP_NAME
Ersetzen Sie
RESOURCE_GROUP_NAME
durch den Namen einer Ressourcengruppe für Batchjobs. Weitere Informationen finden Sie in diesem Dokument unter Ressourcengruppen zum Filtern von Messwerten erstellen.
Ressourcengruppen zum Filtern von Messwerten erstellen
Sie können Ressourcengruppen als anpassbare Filter für Metrics Explorer-Diagramme verwenden. So erstellen Sie eine Ressourcengruppe für alle oder bestimmte Batchjobs in Ihrem Projekt:
Wählen Sie ein zu verwendendes Label aus. als Mitgliedschaftskriterien aus, je nachdem, welche Jobs Gruppe:
- Alle Batch-Jobs: Verwenden Sie das vordefinierte Label
batch-node
. Es wird automatisch auf alle Ressourcen für alle Batch-Jobs angewendet und hat einen Nullwert. Bestimmte Batch-Jobs: Verwenden Sie ein Label, das nur für bestimmte Batch-Jobs auf die Ressourcen angewendet wird.
Wenn Sie beispielsweise eine Gruppe basierend auf vollständigen oder teilweisen Jobnamen erstellen möchten, verwenden Sie den vordefinierten Labelnamen
batch-job-id
mit einem bestimmten Wert. Das Labelbatch-job-id
wird automatisch auf alle Ressourcen angewendet für alle Batchjobs und definiert mit dem Jobnamen.Wenn Sie ein benutzerdefiniertes Label verwenden, müssen Sie alternativ die Methode das benutzerdefinierte Label für alle Ressourcen der Batch-Jobs Sie in die Gruppe aufgenommen werden möchten, wenn Sie die Jobs erstellen.
- Alle Batch-Jobs: Verwenden Sie das vordefinierte Label
Achten Sie darauf, dass Ihr Projekt mindestens einen Job mit dem ausgewählten Label hat und dass dieser Job den Status
RUNNING
hat. Andernfalls wird dieses Label nicht als Option angezeigt, wenn Sie versuchen, die Ressourcengruppe zu erstellen.Erstellen Sie eine Ressourcengruppe. Gehen Sie so vor, wenn Sie die Mitgliedschaftskriterien angeben:
- Legen Sie den Typ auf Tag fest.
Geben Sie in das Feld Tag den Namen des ausgewählten Labels ein. Legen Sie dann basierend auf den Labelwerten, die die Gruppe enthalten soll, enthalten.
Wenn diese Gruppe beispielsweise alle Batchjobs enthalten soll, legen Sie
batch-node
als Tag und Existiert als Operator fest. Wenn diese Gruppe stattdessen Batchjobs mit Namen enthalten soll, die mittest
beginnen, legen Siebatch-job-id
als Tag, Starts with (Beginnt mit) als Operator undtest
als Value (Wert) fest.
Nächste Schritte
- Weitere Informationen zu Jobressourcenmesswerten:
- Weitere Methoden zum Überwachen und Optimieren von Batchjobs: