Instanz überwachen

Sie können Cloud Bigtable mit Diagrammen, die in der Google Cloud Console verfügbar sind, oder programmatisch mit der Cloud Monitoring API verwenden.

In der Cloud Console sind Monitoring-Daten an den folgenden Stellen verfügbar:

  • Bigtable-Monitoring
  • Bigtable-Instanz – Übersicht
  • Cloud Monitoring der Operations-Suite von Google Cloud
  • Key Visualizer

Die Monitoring- und Instanzseiten bieten einen allgemeinen Überblick über Ihre Bigtable-Nutzung. Mit Key Visualizer können Sie Ihre Zugriffsmuster nach Zeilenschlüsseln aufschlüsseln und Fehler bei bestimmten Leistungsproblemen beheben.

Informationen zur CPU- und Laufwerknutzung

Unabhängig davon, mit welchen Tools Sie Ihre Instanz überwachen, müssen Sie die CPU- und Laufwerknutzung für jeden Cluster in der Instanz verfolgen. Wenn die CPU- oder Laufwerknutzung eines Clusters bestimmte Schwellenwerte überschreitet, wird die Leistung des Clusters beeinträchtigt und beim Lesen und Schreiben von Daten können Fehler zurückgegeben werden.

CPU-Auslastung

Die Knoten in Ihren Clustern verwenden CPU-Ressourcen für Lese-, Schreib- und Verwaltungsaufgaben. Wie sich die Anzahl der Knoten auf die Leistung eines Clusters auswirkt, wird unter Leistung bei typischer Arbeitslast genauer beschrieben.

Bigtable meldet folgende Messwerte zur CPU-Nutzung:

Messwert Beschreibung
Durchschnittliche CPU-Auslastung

Die durchschnittliche CPU-Auslastung aller Knoten im Cluster.

Die empfohlenen Maximalwerte bieten Spielraum für kurze Nutzungsspitzen.

Wenn ein Cluster den Höchstwert länger als ein paar Minuten überschreitet, sollten Sie dem Cluster Knoten hinzufügen.

CPU-Auslastung des am stärksten genutzten Knotens

Die CPU-Auslastung des aktivsten Knotens im Cluster.

Wenn der am stärksten genutzte Knoten auch bei vertretbarer durchschnittlicher CPU-Auslastung häufig über dem empfohlenen Wert liegt, wird unter Umständen auf einen kleinen Teil Ihrer Daten sehr viel häufiger zugegriffen als auf den Rest.

  • Sie ermitteln mit dem Key Visualizer-Tool Hotspots in Ihrer Tabelle, die zu Spitzen in der CPU-Auslastung führen können.
  • Überprüfen Sie, ob Ihr Schemadesign eine gleichmäßige Verteilung von Lese- und Schreibzugriffen auf die einzelnen Tabellen ermöglicht.

Je nach Konfiguration sollten dabei folgende Werte nicht überschritten werden:

Konfiguration Empfohlene Maximalwerte
Einzelner Cluster

70 % durchschnittliche CPU-Auslastung
90 % CPU-Auslastung des am stärksten genutzten Knotens

Beliebig viele Cluster mit Single-Cluster-Routing

70 % durchschnittliche CPU-Auslastung
90 % CPU-Auslastung des am stärksten genutzten Knotens

2 Cluster mit Multi-Cluster-Routing

35 % durchschnittliche CPU-Auslastung
45 % CPU-Auslastung des am stärksten genutzten Knotens

3 oder mehr Cluster mit Multi-Cluster-Routing

Abhängig von der Konfiguration. Allgemeine Anwendungsfälle finden Sie unter Beispiele für Replikationseinstellungen.

Laufwerknutzung

Bigtable speichert für jeden Cluster in Ihrer Instanz eine separate Kopie aller Tabellen in dieser Instanz.

Die Laufwerknutzung wird in binären Einheiten angegeben, z. B. in binären Gigabyte (GB), wobei 1 GB 230 Byte entspricht. Diese Maßeinheit wird auch als Gibibyte (GiB) bezeichnet.

Bigtable meldet folgende Messwerte zur Laufwerksnutzung:

Messwert Beschreibung
Speicherauslastung (Byte)

Die Menge der im Cluster gespeicherten Daten.

Dieser Wert wirkt sich auf Ihre Kosten aus. Außerdem müssen Sie möglicherweise wie unten beschrieben jedem Cluster Knoten hinzufügen, wenn sich die Datenmenge erhöht.

Speicherauslastung (Max. %)

Der Prozentsatz der verwendeten Speicherkapazität des Clusters. Die Kapazität hängt von der Anzahl der Knoten im Cluster ab.

Im Allgemeinen sollten Sie nicht mehr als 70 % des harten Grenzwerts für die Gesamtkapazität nutzen, damit Sie Platz für weitere Daten haben. Wenn Sie Ihrer Instanz keine großen Datenmengen hinzufügen möchten, können Sie bis zu 100 % des harten Grenzwerts ausnutzen.

Wenn Sie mehr als den empfohlenen Prozentsatz des Speicherlimits verwenden, fügen Sie dem Cluster Knoten hinzu. Sie können auch vorhandene Daten löschen. Allerdings belegen gelöschte Daten erst einmal mehr Speicherplatz und erst nach einer Verdichtung weniger.

Ausführliche Informationen zur Berechnung dieses Werts finden Sie unter Speicherplatz pro Knoten.

Laufwerksauslastung

Der Prozentsatz der maximal möglichen Bandbreite für HDD-Lese- und -Schreibzugriffe, den der Cluster belegt. Nur für HDD-Cluster verfügbar.

Wenn dieser Wert häufig bei 100 % liegt, könnte es zu erhöhter Latenz kommen. Fügen Sie dem Cluster in diesem Fall Knoten hinzu, um den Prozentsatz der Laufwerksauslastung zu reduzieren.

Leistungsübersicht einer Instanz abrufen

Auf der Übersichtsseite Ihrer Instanz können Sie den aktuellen Status der Cluster der Instanz sehen.

Auf der Übersichtsseite werden aktuelle Schlüsselmesswerte für jeden Cluster angezeigt:

Messwert Beschreibung
Durchschnitte CPU-Auslastung Die knotenweite durchschnittliche CPU-Auslastung im Cluster.
CPU-Auslastung des am stärksten genutzten Knotens

Die CPU-Auslastung des aktivsten Knotens im Cluster.

Eine Überschreitung des empfohlenen Höchstwerts für den aktivsten Knoten kann Latenz und andere Probleme für den Cluster hervorrufen.

Gelesene Zeilen Die Anzahl der gelesenen Zeilen pro Sekunde.
Geschriebene Zeilen Die Anzahl der geschriebenen Zeilen pro Sekunde.
Durchsatz für Lesevorgänge Die Anzahl der unkomprimierten Byte pro Sekunde der gesendeten Antwortdaten. Dieser Messwert bezieht sich auf die gesamte Datenmenge, die zurückgegeben wird, nachdem Filter angewendet wurden.
Durchsatz für Schreibvorgänge Die Anzahl der unkomprimierten Byte pro Sekunde, die beim Schreiben von Daten empfangen wurden.
Systemfehlerrate Der Prozentsatz der Anfragen, die aufseiten des Bigtable-Servers fehlgeschlagen sind.
Replikationslatenz für die Eingabe Die höchste Zeit in Sekunden, die beim 99. Perzentil zwischen einem Schreibvorgang in einen anderen Cluster und dessen Replikation in diesen Cluster verstreicht.
Replikationslatenz für die Ausgabe Die höchste Zeit in Sekunden, die beim 99. Perzentil zwischen einem Schreibvorgang in diesen Cluster und dessen Replikation in einen anderen Cluster verstreicht.

So erhalten Sie eine Übersicht über diese Schlüsselmesswerte:

  1. Öffnen Sie in der Cloud Console die Liste der Bigtable-Instanzen.

    Zur Liste der Instanzen

  2. Klicken Sie auf die Instanz, deren Messwerte Sie sehen möchten. In der Cloud Console werden die aktuellen Messwerte für die Cluster Ihrer Instanz angezeigt.

Leistung im Zeitverlauf überwachen

Den Leistungsverlauf Ihrer Bigtabel-Instanz finden Sie auf der Seite "Monitoring". Dort können Sie die Leistung jedes Clusters analysieren und die Messwerte für verschiedene Arten von Bigtable-Ressourcen aufschlüsseln. In den Diagrammen können Zeiträume von der letzten Stunde bis zu den letzten sechs Wochen angezeigt werden.

Diagramme für Bigtable-Ressourcen

Die Seite "Bigtable-Monitoring" enthält Diagramme für die folgenden Arten von Bigtable-Ressourcen:

  • Instanzen
  • Tabellen
  • Anwendungsprofile
  • Replikation

Diese Diagramme sind für die folgenden Messwerte verfügbar:

Messwert Verfügbar für Beschreibung
CPU-Auslastung Instanzen Die knotenweite durchschnittliche CPU-Auslastung im Cluster.
CPU-Auslastung (am stärksten genutzter Knoten) Instanzen

Die CPU-Auslastung des aktivsten Knotens im Cluster.

Eine Überschreitung des empfohlenen Höchstwerts für den aktivsten Knoten kann Latenz und andere Probleme für den Cluster hervorrufen.

Leselatenz Instanzen
Tabellen
Anwendungsprofile

Die Zeit, die eine Leseanfrage für die Rückgabe einer Antwort benötigt.

Die Messung der Leselatenz beginnt, wenn Bigtable die Anfrage empfängt, und endet, wenn das letzte Datenbyte an den Client gesendet wird. Bei Anfragen für große Datenmengen kann sich die Fähigkeit des Clients, die Antwort zu verarbeiten, auf die Leselatenz auswirken.

Schreiblatenz Instanzen
Tabellen
Anwendungsprofile

Die Zeit, die eine Schreibanfrage für die Rückgabe einer Antwort benötigt.

Nutzerfehlerrate Instanzen

Die vom Inhalt einer Anfrage ausgelöste Fehlerrate im Gegensatz zu Fehlern vonseiten des Bigtable-Servers. Die Nutzerfehlerrate enthält die folgenden Statuscodes:

  • INVALID_ARGUMENT
  • NOT_FOUND
  • PERMISSION_DENIED
  • RESOURCE_EXHAUSTED
  • OUT_OF_RANGE

Nutzerfehler sind oft auf ein Konfigurationsproblem zurückzuführen, zum Beispiel auf eine Anfrage, in der der Cluster, die Tabelle oder das Anwendungsprofil falsch angegeben werden.

Systemfehlerrate Instanzen Der Prozentsatz der Anfragen, die aufseiten des Bigtable-Servers fehlgeschlagen sind. Die Systemfehlerrate enthält die folgenden Statuscodes:
  • UNKNOWN
  • ABORTED
  • UNIMPLEMENTED
  • INTERNAL
  • UNAVAILABLE
Automatische Failovers Instanzen
Tabellen
Anwendungsprofile

Die Anzahl der Anfragen, die aufgrund eines Failover-Szenarios, z. B. kurzer Ausfall oder kurze Verzögerung, automatisch von einem Cluster zu einem anderen umgeleitet wurden. Eine automatische Umleitung erfolgt, wenn ein Anwendungsprofil Multi-Cluster-Routing verwendet.

In diesem Diagramm sind keine manuell umgeleiteten Anfragen enthalten.

Speicherauslastung (Byte) Instanzen
Tabellen

Die Menge der im Cluster gespeicherten Daten.

Bei diesem Messwert wird berücksichtigt, dass Bigtable die Daten bei der Speicherung komprimiert.

Speicherauslastung (Max. %) Instanzen

Der Prozentsatz der verwendeten Speicherkapazität des Clusters. Die Kapazität basiert auf der Anzahl der Knoten im Cluster.

Ausführliche Informationen zur Berechnung dieses Werts finden Sie unter Speicherauslastung pro Knoten.

Laufwerksauslastung Instanzen Der Prozentsatz der maximal möglichen Bandbreite für HDD-Lese- und -Schreibzugriffe, den der Cluster belegt. Nur für HDD-Cluster verfügbar.
Gelesene Zeilen Instanzen
Tabellen
Anwendungsprofile

Die Anzahl der gelesenen Zeilen pro Sekunde.

Dieser Messwert ist in Bezug auf den Gesamtdurchsatz von Bigtable aussagekräftiger als die Anzahl der Leseanfragen, weil eine einzelne Anfrage viele Zeilen lesen kann.

Geschriebene Zeilen Instanzen
Tabellen
Anwendungsprofile

Die Anzahl der geschriebenen Zeilen pro Sekunde.

Dieser Messwert ist in Bezug auf den Gesamtdurchsatz von Bigtable aussagekräftiger als die Anzahl der Schreibanfragen, weil eine einzelne Anfrage viele Zeilen schreiben kann.

Leseanfragen Instanzen
Tabellen
Anwendungsprofile
Die Zahl der zufälligen Ablesungen und Scanabfragen pro Sekunde.
Schreibanfragen Instanzen
Tabellen
Anwendungsprofile
Die Anzahl an Schreibanfragen pro Sekunde.
Durchsatz für Lesevorgänge Instanzen
Tabellen
Anwendungsprofile
Die Anzahl der unkomprimierten Byte pro Sekunde der gesendeten Antwortdaten. Dieser Messwert bezieht sich auf die gesamte Datenmenge, die zurückgegeben wird, nachdem Filter angewendet wurden.
Durchsatz für Schreibvorgänge Instanzen
Tabellen
Anwendungsprofile
Die Anzahl der unkomprimierten Byte pro Sekunde, die beim Schreiben von Daten empfangen wurden.
Knotenzahl Instanzen Die Anzahl der Knoten im Cluster.

So erhalten Sie Messwerte für diese Ressourcen:

  1. Öffnen Sie in der Cloud Console die Liste der Bigtable-Instanzen.

    Zur Liste der Instanzen

  2. Klicken Sie auf die Instanz, deren Messwerte Sie sehen möchten.

  3. Klicken Sie im linken Bereich auf Monitoring. Hier finden Sie eine Reihe von Diagrammen für die Instanz sowie eine tabellarische Ansicht der Instanzmesswerte. Standardmäßig zeigt die Cloud Console Messwerte für die letzte Stunde sowie separate Messwerte für jeden Cluster in der Instanz.

    Zur Anzeige aller Diagramme scrollen Sie durch den Bereich mit den Diagrammen.

    Klicken Sie auf Tabellen, um Messwerte auf Tabellenebene anzusehen.

    Klicken Sie auf Anwendungsprofile, um Messwerte für einzelne Anwendungsprofile anzusehen.

    Sie können sich auch die kombinierten Messwerte für die ganze Instanz ansehen. Rufen Sie dafür über den Diagrammen den Abschnitt Gruppieren nach auf und klicken Sie auf Instanz.

    Klicken Sie auf den Pfeil neben 1 Stunde, um Messwerte für einen längeren Zeitraum anzusehen. Wählen Sie einen vordefinierten Zeitraum aus oder geben Sie einen benutzerdefinierten Zeitraum ein und klicken Sie dann auf Anwenden.

Diagramme für die Replikation

Die Seite "Monitoring" enthält ein Diagramm, das die Replikationslatenz im Zeitverlauf anzeigt. Sie können sich die durchschnittliche Latenz für das Replizieren von Schreibvorgängen beim 50., 99. oder 100. Perzentil ansehen.

So sehen Sie die Replikationslatenz im Zeitverlauf:

  1. Öffnen Sie in der Cloud Console die Liste der Bigtable-Instanzen.

    Zur Liste der Instanzen

  2. Klicken Sie auf die Instanz, deren Messwerte Sie sehen möchten.

  3. Klicken Sie im linken Bereich auf Monitoring. Die Seite wird geöffnet, wobei der Tab Instanz ausgewählt ist.

  4. Klicken Sie auf den Tab Replikation. In der Cloud Console wird die Replikationslatenz im Zeitverlauf angezeigt. Standardmäßig sehen Sie dort die Replikationslatenz der letzten Stunde.

    Verwenden Sie das Menü Gruppieren nach, um zwischen Latenzdiagrammen zu wechseln, die nach Tabelle oder nach Cluster gruppiert sind.

    Verwenden Sie das Menü Perzentil, um ein anderes Perzentil anzusehen.

    Klicken Sie auf den Pfeil neben 1 Stunde, um Messwerte für einen längeren Zeitraum anzusehen. Wählen Sie einen vordefinierten Zeitraum aus oder geben Sie einen benutzerdefinierten Zeitraum ein und klicken Sie dann auf Anwenden.

Monitoring mit Cloud Monitoring

Bigtable exportiert Nutzungsmesswerte nach Cloud Monitoring. Sie können diese Messwerte auf verschiedene Arten verwenden:

So rufen Sie die Nutzungswerte im Metrics Explorer auf:

  1. Öffnen Sie in der Cloud Console die Seite "Monitoring".

    Zur Seite "Monitoring"

    Wählen Sie das Konto aus, mit dem Sie auf Google Cloud zugreifen, falls Sie dazu aufgefordert werden.

  2. Klicken Sie auf Ressourcen und dann auf Metrics Explorer.

  3. Geben Sie unter Ressourcentyp und Messwert suchen bigtable ein. Es erscheint eine Liste von Bigtable-Ressourcen und -Messwerten.

  4. Klicken Sie auf einen Messwert, um ein entsprechendes Diagramm aufzurufen.

Weitere Informationen zur Verwendung von Cloud Monitoring finden Sie in der Dokumentation zu Cloud Monitoring.

Eine vollständige Liste der Bigtable-Messwerte finden Sie unter Messwerte.

Nächste Schritte