Jobressourcen durch Aufrufen von Messwerten überwachen und optimieren

In diesem Dokument wird beschrieben, wie Sie die Ressourcen für einen Batchjob überwachen und optimieren können, indem Sie sich die Messwerte in Cloud Monitoring ansehen. Weitere Informationen zu den Ressourcen, auf denen ein Job ausgeführt wird, finden Sie unter Jobressourcen

Monitoring stellt für jeden Job grundlegende Messwerte wie die CPU bereit Auslastung und Netzwerkverkehr. Einige Messwerte, z. B. Speicher und Prozessauslastung; kann nur erfasst werden, wenn ein Job den Ops-Agent installiert. Messwerte für die Ressourcen eines Jobs helfen Ihnen, die Leistung und Auslastung zu bewerten der einzelnen Ressourcen. Anhand dieser Informationen können Sie Verbesserungen für zukünftige Iterationen des Jobs. So können Sie beispielsweise nicht genutzte Ressourcen entfernen, um die Kosten zu optimieren, oder belastete Ressourcen verbessern oder erhöhen, um die Leistung zu steigern.

Hinweise

  1. Wenn Sie Batch noch nicht verwendet haben, lesen Sie den Hilfeartikel Batch-Dateien erstellen und ausführen und aktivieren Sie Batch, indem Sie die Voraussetzungen für Projekte und Nutzer erfüllen.
  2. Optional: Um zusätzliche Messwerte für einen Job zu erfassen, erstellen und ausführen einen Job, der den Ops-Agent automatisch installiert.
  3. Aktivieren Sie die Monitoring API, falls noch nicht geschehen:

    Enable the API

  4. Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle Monitoring Metric Viewer (roles/monitoring.metricViewer) für das Projekt zu erteilen, um die Berechtigungen zu erhalten, die Sie zum Aufrufen von Messwerten zur Observabiliät benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Messwerte für Jobressourcen aufrufen

VMs beobachten und überwachen in enthält die Compute Engine-Dokumentation relevante konzeptionelle Informationen über VM-Messwerte, Es werden jedoch verschiedene Methoden empfohlen, VM-Messwerte für Batchjobs. Insbesondere wird in der Compute Engine-Dokumentation erläutert, wie Sie Messwerte mithilfe der vordefinierten Monitoring-Dashboards für die Compute Engine oder der Compute Engine-Seiten in der Google Cloud Console aufrufen. Diese Methoden zeigen jedoch keine Informationen über VMs an, gelöscht wurden. Verwenden Sie diese Methoden daher nur, wenn Sie Messwerte für Batchjobs nur während der Ausführung ansehen möchten.

Messwerte für ausgeführte und abgeschlossene Batchjobs ansehen, mithilfe von Metrics Explorer-Diagrammen. Diagramme sind nur temporär, zu benutzerdefinierten Dashboards.

So erstellen Sie ein Diagramm für einen oder mehrere Messwerte:

  1. Optional: Wenn Sie das Diagramm speichern möchten, Benutzerdefiniertes Dashboard identifizieren oder erstellen für das Diagramm hinzu.
  2. Erstellen Sie ein Metrics Explorer-Diagramm für einen oder mehrere Messwerte.

    Ohne Filter enthalten alle VM-Messwerte in einem Diagramm Daten aus allen VMs in Ihrem Projekt. Optional können Sie das Diagramm so filtern, dass nur Messwerte aus allen oder bestimmten Batchjobs enthalten sind. Fügen Sie dazu den folgenden Filter hinzu:

    group=RESOURCE_GROUP_NAME
    

    Ersetzen Sie RESOURCE_GROUP_NAME durch den Namen einer Ressourcengruppe für Batchjobs. Weitere Informationen finden Sie in diesem Dokument unter Ressourcengruppen zum Filtern von Messwerten erstellen.

Ressourcengruppen zum Filtern von Messwerten erstellen

Sie können Ressourcengruppen als anpassbare Filter für Metrics Explorer-Diagramme verwenden. So erstellen Sie eine Ressourcengruppe für alle oder bestimmte Batchjobs in Ihrem Projekt:

  1. Wählen Sie ein zu verwendendes Label aus. als Mitgliedschaftskriterien aus, je nachdem, welche Jobs Gruppe:

    • Alle Batch-Jobs: Verwenden Sie das vordefinierte Label batch-node. Es wird automatisch auf alle Ressourcen für alle Batch-Jobs angewendet und hat einen Nullwert.
    • Bestimmte Batch-Jobs: Verwenden Sie ein Label, das nur für bestimmte Batch-Jobs auf die Ressourcen angewendet wird.

      Wenn Sie beispielsweise eine Gruppe basierend auf vollständigen oder teilweisen Jobnamen erstellen möchten, verwenden Sie den vordefinierten Labelnamen batch-job-id mit einem bestimmten Wert. Das Label batch-job-id wird automatisch auf alle Ressourcen angewendet für alle Batchjobs und definiert mit dem Jobnamen.

      Wenn Sie ein benutzerdefiniertes Label verwenden, müssen Sie alternativ die Methode das benutzerdefinierte Label für alle Ressourcen der Batch-Jobs Sie in die Gruppe aufgenommen werden möchten, wenn Sie die Jobs erstellen.

  2. Achten Sie darauf, dass Ihr Projekt mindestens einen Job mit dem ausgewählten Label hat und dass dieser Job den Status RUNNING hat. Andernfalls wird dieses Label nicht als Option angezeigt, wenn Sie versuchen, die Ressourcengruppe zu erstellen.

  3. Erstellen Sie eine Ressourcengruppe. Gehen Sie so vor, wenn Sie die Mitgliedschaftskriterien angeben:

    1. Legen Sie den Typ auf Tag fest.
    2. Geben Sie in das Feld Tag den Namen des ausgewählten Labels ein. Legen Sie dann basierend auf den Labelwerten, die die Gruppe enthalten soll, enthalten.

      Wenn diese Gruppe beispielsweise alle Batchjobs enthalten soll, legen Sie batch-node als Tag und Existiert als Operator fest. Wenn diese Gruppe stattdessen Batchjobs mit Namen enthalten soll, die mit test beginnen, legen Sie batch-job-id als Tag, Starts with (Beginnt mit) als Operator und test als Value (Wert) fest.

Nächste Schritte