SSD- oder HDD-Speicher wählen

Beim Erstellen einer Bigtable-Instanz wählen Sie aus, ob deren Cluster Daten auf Solid State Drives (SSD) oder Festplattenlaufwerken (HDD) speichern:

  • SSD-Speicherung ist die effizienteste und kostengünstigste Wahl für die meisten Anwendungsfälle.
  • HDD-Speicherung eignet sich manchmal für große Datasets, die nicht latenzempfindlich sind oder auf die selten zugegriffen wird.

Egal, welche Art der Speicherung Sie wählen, Ihre Daten werden auf einem verteilten, replizierten Dateisystem gespeichert, das sich über viele physische Laufwerke erstreckt.

Die Richtlinien auf dieser Seite helfen Ihnen dabei, zwischen SSD und HDD zu wählen.

Im Zweifel SSD wählen

Es gibt einige Gründe, warum SSD normalerweise die beste Speicherart für Ihren Bigtable-Cluster darstellt:

  • SSD ist deutlich schneller als HDD und die Leistung lässt sich besser vorhersehen. In einem Bigtable-Cluster bietet SSD-Speicher wesentlich geringere Latenzen für Lese- und Schreibvorgänge als HDD-Speicher.
  • Der Datendurchsatz bei HDD ist viel stärker begrenzt als der bei SSD. In einem Cluster mit HDD-Speicher ist es möglich, den maximalen Durchsatz zu erreichen, bevor die CPU-Auslastung 100 % erreicht. Das ist eine Situation, die Sie mit dem Messwert Laufwerkslast überwachen können. Für einen höheren Durchsatz müssen Sie mehr Knoten hinzufügen, aber die Kosten für die zusätzlichen Knoten könnten die Ersparnis für die Nutzung der HDD-Speicherung schnell übersteigen. Die SSD-Speicherung ist nicht derartig beschränkt, da sie einen viel höheren Durchsatz pro Knoten bietet. Ein Cluster, der SSD-Speicherung verwendet, erreicht grundsätzlich nur dann das Durchsatzmaximum, wenn er die gesamte verfügbare CPU- und Speicherleistung beansprucht.
  • Individuelle Zeilen lesen ist sehr langsam auf HDD. Wegen der Festplattensuchzeit unterstützt HDD nur 5 % der APS bei Lesevorgängen von SSD-Speicherung. Große Scans über mehrere Zeilen sind jedoch nicht so stark betroffen.
  • Die Kostenersparnis von HDD ist minimal im Vergleich zu den Kosten für die Knoten in Ihrem Bigtable-Cluster, außer Sie speichern große Datenmengen. Aus diesem Grund gilt die Faustregel, HDD nicht in Betracht zu ziehen, außer Sie speichern mindestens 10 TB Daten und Ihre Arbeitslast ist nicht latenzempfindlich.

Ein möglicher Nachteil von SSD-Speichern besteht darin, dass abhängig von der Menge der gespeicherten Daten mehr Knoten in Ihren Clustern erforderlich sind. In der Praxis benötigen Sie jedoch möglicherweise diese zusätzlichen Knoten sowieso, damit Ihre Cluster den eingehenden Traffic verarbeiten können, und nicht nur, um die Menge der gespeicherten Daten zu unterstützen.

Anwendungsfälle für HDD-Speicherung

HDD-Speicherung eignet sich für Anwendungsfälle, die alle der folgenden Kriterien erfüllen:

  • Sie gehen davon aus, mehr als 10 TB Daten speichern zu müssen.
  • Sie werden die Daten nicht verwenden, um eine an die Nutzer gerichtete Anwendung oder eine latenzempfindliche Anwendung zu stützen.
  • Die Arbeitslast fällt in eine der folgenden Kategorien:

    • Batch-Arbeitslasten mit Scans und Schreibvorgängen und nicht mehr als gelegentlichen zufälligen Lesevorgängen für eine kleine Anzahl von Zeilen oder für Lesevorgänge
    • Datenarchivierung, bei der Sie große Datenmengen schreiben und diese Daten selten lesen.

Wenn Sie beispielsweise umfangreiche Verlaufsdaten für eine große Anzahl von Remote-Sensing-Geräten speichern und dann die Daten für das Erstellen von Tagesberichten verwenden möchten, können die Kosteneinsparungen für den Festplattenspeicher den Kompromiss bei der Leistung möglicherweise rechtfertigen. Wenn Sie andererseits planen, die Daten für die Echtzeitanzeige in einem Dashboard zu verwenden, ist es wahrscheinlich nicht sinnvoll, HDD-Speicherung zu verwenden. Lesevorgänge wären in diesem Fall um einiges häufiger und sind mit HDD-Speicherung deutlich langsamer.

Zwischen SSD- und HDD-Speicherung wechseln

Bei der Erstellung einer Bigtable-Instanz ist die Entscheidung zwischen SSD- und HDD-Speicher für die Instanz dauerhaft. Sie können über die Google Cloud Console nicht den Speichertyp ändern, der für die Instanz verwendet wird.

Wenn Sie den Speichertyp ändern möchten, in dem eine Tabelle gespeichert ist, verwenden Sie die Sicherungsfunktion:

  1. Erstellen oder planen Sie eine Instanz, die den gewünschten Speichertyp verwendet.
  2. Erstellen Sie eine Sicherung der Tabelle.
  3. Stellen Sie die Sicherung aus einer Sicherung in einer neuen Tabelle in der anderen Instanz wieder her.

Nächste Schritte

Instanz mit SSD- oder HDD-Speicher erstellen