SSD ストレージか HDD ストレージかの選択

Cloud Bigtable インスタンスの作成時に、クラスタでのデータの保存先をソリッド ステート ドライブ(SSD)とハードディスク ドライブ(HDD)のどちらにするかを指定します。

  • SSD ストレージは、ほとんどのユースケースで最も効率的でコスト効果の高い選択肢です。
  • HDD ストレージは、非常に大きいデータセット(10 TB 超)で、レイテンシがあまり重要でない場合やアクセス頻度が低い場合に適切であることがあります。

どちらのタイプのストレージを選択した場合でも、多数の物理ドライブにわたって分散してレプリケーションされたファイル システムにデータが保存されます。

このページのガイドラインは、SSD か HDD かの選択に役立ちます。

判断に迷った場合は SSD ストレージを選択する

Cloud Bigtable クラスタで SSD ストレージを使用するのが通常は最適である理由を以下に示します。

  • SSD は HDD に比べて、動作がはるかに速いだけでなく、パフォーマンスの予測可能性にも優れています。Cloud Bigtable クラスタでは、全リクエストの 99% について、SSD ストレージにおける読み取りと書き込みのレイテンシはどちらも 6 ミリ秒です。一方、同じベンチマークでの HDD ストレージのレイテンシは、読み取りで 200 ミリ秒、書き込みで 50 ミリ秒です。
  • HDD のスループットには SSD のスループットより大きな制限があります。 HDD ストレージを使用しているクラスタでは、CPU 使用率が 100% になる前に最大スループットに達することがよくあります。スループットを向上させるには、より多くのノードを追加する必要があります。しかし、追加ノードのコストが、HDD ストレージの使用によるコスト削減を超えることがよくあります。SSD ストレージにはそのような制約はありません。ノードあたりのスループットははるかに高いため、通常、利用可能な CPU とメモリをすべて使用している場合にのみ、SSD ストレージを使用するクラスタのスループットは最大になります。
  • HDD での個々の行の読み取りは非常に低速です。 ディスクのシーク時間のために、HDD ストレージでは SSD ストレージの読み取り行数(1 秒あたり)の 5% しかサポートされていません。ただし、大きな複数行のスキャンでは、それほどの低下はありません。
  • HDD によるコスト削減は、非常に大きなデータを保存しない限り、Cloud Bigtable クラスタ内のノードのコストに比べてごくわずかです。 そのため、目安として、10 TB 以上のデータを保存する場合以外は、HDD ストレージの使用を検討する必要はありません。

SSD ストレージの欠点となりうる点として、保存するデータの量によってはクラスタで必要となるノード数が多くなることがあげられます。しかし、ノードを増やすことで、保存するデータの量をサポートできるだけでなく、クラスタが受信トラフィックに対応できます。

HDD ストレージのユースケース

HDD ストレージは、以下の条件を満たしているユースケースに適しています。

  • 10 TB 以上のデータを保存する予定である。
  • ユーザー向けやレイテンシの影響を受けやすいアプリケーションを支援するデータを使用しない。
  • ワークロードは次のいずれかのカテゴリに分類されます。

    • バッチ ワークロード。スキャンと書き込みが行われます。また、少数の行の読み込みがまれにランダムに行われます。
    • データ アーカイブ。大量のデータの書き込みが行われます。そのデータの読み取りはほとんど行われません。

たとえば、多数のリモート センシング装置の詳細な履歴データを保存し、そのデータを使用して日次レポートを生成する予定がある場合には、パフォーマンスが低下しても HDD ストレージのコスト削減が優先されることがあります。それに対して、そのデータを使用してリアルタイム ダッシュボードを表示する場合は、読み取りが頻繁に行われるため、読み取り速度が非常に遅い HDD ストレージの使用は適切とはいえません

SSD ストレージと HDD ストレージの切り替え

Cloud Bigtable のインスタンスやクラスタを作成した後に、そのクラスタでの SSD ストレージまたは HDD ストレージの選択を変更することはできません。Google Cloud Platform Console を使用して、クラスタで使用しているストレージのタイプを変更することはできません。

既存の HDD クラスタを SSD に(またはその逆に)変更する必要がある場合には、既存のインスタンスからデータをエクスポートし、新規インスタンスにデータをインポートします。また、Cloud Dataflow または Hadoop MapReduce ジョブを使用して、データをインスタンス間でコピーすることもできます。インスタンス全体の以降には時間がかかることに注意が必要です。また、インスタンスを移行する前に Cloud Bigtable クラスタへのノードの追加が必要となる場合があります。

次のステップ

SSD または HDD ストレージを持つインスタンスを作成します。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Bigtable ドキュメント