データセンター プロフェッショナルのための Google Cloud: ストレージ

この記事では、Google Cloud のストレージ サービスについて説明します。また、このサービスと従来のストレージ モデルとの関係についても説明します。以下のストレージ タイプと、クラウドでそれらに相当するものについて説明します。

  • ディスク ストレージ。直接接続ストレージ(DAS)、ネットワーク接続ストレージ(NAS)、ストレージ エリア ネットワーク(SAN)など
  • オブジェクト ストレージ
  • アーカイブ ストレージ: ディスクアレイ、磁気テープメディアなど

コアストレージ コンポーネント

このセクションでは、Google Cloud が提供するコアストレージ コンポーネントの概要を簡単に説明します。

ブロック ストレージ

Google Cloud には、2 つのブロック ストレージ タイプがあります。どちらのディスクタイプも、Google Cloud の Infrastructure as a Service(IaaS)プロダクトである Compute Engine と統合されており、Compute Engine 仮想マシン(VM)インスタンスにマウントできます。

  • 永続ディスク: ネットワーク接続されたボリュームであり、VM インスタンスに接続できます。
  • ローカル SSD: VM インスタンスが実行されている物理マシンに直接接続されています。

永続ディスク

永続ディスクは、仮想ブロック ストレージ ボリュームです。VM インスタンスを作成すると、インスタンスには、マシンのオペレーティング システムが含まれた単一のブート可能永続ディスクが付属します。VM のマシンタイプに応じて、最大で 128 台のボリューム、または 257 TB の永続ディスクを接続できます。

永続ディスクのパフォーマンスは、ディスクのタイプ、ディスクのサイズ、ディスクが接続される VM インスタンスの最大スループットによって異なります。各永続ディスクは HDD または SSD のいずれかにすることができます。通常、各タイプのパフォーマンス上の特性は、対応する物理的な要素に関連します。標準 HDD 永続ディスクは順次読み取り / 書き込みオペレーションに効率的で経済的です。一方、SSD 永続ディスクは高速なランダム IOPS に適しています。永続ディスクのパフォーマンスは、接続されている VM インスタンスのスループット制限に到達するまで、ディスクのサイズに従って高まります。

永続ディスクを含むマシンは、VM インスタンスを含むマシンと同じゾーンに配置され、Google のネットワーク ファブリックに接続されます。通常、Google のネットワークは秒あたり 1 ペタビットを超える全二分帯域幅を提供することができるため、それらのネットワーク接続された永続ディスクは従来のローカルで接続されたディスクと同等のスループットと I/O 特性を持つことができます。

永続ディスクは、それらが置かれているゾーン内では使用できますが、ゾーン間で複製されることはありません。永続ディスクに接続されている VM インスタンスがオフラインになると、その永続ディスクにはデータが保持されたままになりますが、アクセス不能になります。永続ディスクを使用するときに高可用性を確保するには、ワークロードが実行されているリージョンとゾーンの間の高可用性に配慮して設計する必要があります。リージョンとゾーンの詳細については、リージョンとゾーンをご覧ください。

ローカル SSD

ローカル SSD は、Compute Engine VM インスタンスと同じホストマシンに物理的に接続されています。標準永続ディスクまたは SSD 永続ディスクよりローカル SSD の方が高スループットで低レイテンシです。ただし、ローカル SSD にはいくつかの注意点があります。

  • ローカル SSD は永続ディスクよりも柔軟性がありません。永続ディスクとは異なり、ローカル SSD のサイズは 375 GB までに制限されています。特定の非共有コア VM インスタンスに接続できるボリュームは、最大で 8 つです。また、ローカル SSD を共有コア VM インスタンスに接続することはできません。さらに、ローカル SSD はブートデバイスとして使用できません。
  • 通常、ローカル SSD は永続的ではありません。VM インスタンスを再起動してもデータは存続しますが、インスタンスを停止すると、データは失われます。

オブジェクト ストレージ

Cloud Storage はオブジェクト ストレージを提供するホステッド サービスで、さまざまなサイズの大量のバイナリ オブジェクト(blob)を保存し、アクセスするために利用できます。Cloud Storage バケットは、Google Cloud で利用可能な、最もスケーラブルで耐久性の高いストレージ オプションです。ブロック ストレージが不要なアプリケーションの場合は、Cloud Storage バケットにデータを保存することを強くおすすめします。

Cloud Storage には、主に 4 つのストレージ クラスがあります。Cloud Storage のクラスを問わず、すべてのデータにすばやくアクセスでき、同じ API 呼び出しセットを利用できます。

  • Standard では、特定の場所で Cloud Storage クラスの中で最も高い可用性を実現できます。このクラスは、大規模なコンテンツ ストレージとメディア ファイル処理の両方に適しています。コンピューティング リソースと同じリージョンで使用する場合の、データ分析、機械学習、メディア処理などのコンピューティング ワークロードに適しています。
  • NearlineColdlineArchive では、バックアップ データ、障害復旧データ、アーカイブ データなど、頻繁にアクセスされないデータ用のコスト効果の良いストレージを使用できます。

サービスモデルの比較

このセクションでは、一般的なデータセンターのストレージ モデルと Google Cloud のストレージを比較して、クラウド サービスと従来のデータセンター テクノロジーの相違点について説明します。

直接接続型ストレージ(DAS)

データセンターでは、「直接接続型ストレージ(DAS)」は物理サーバーに直接接続された物理ボリュームで、「ローカル ディスク」と呼ばれることもよくあります。このボリュームは、ブートディスクと同様に内部で接続することも、外部ハードディスクと同様に外部で接続することもできます。ローカル ディスク上のデータに他のサーバーがアクセスできるようにする場合は、そのサーバーのオペレーティング システムがネットワークでディスクを共有できるように、明示的に許可する必要があります。

クラウドでは、ローカル ディスクと DAS は必ずしも同義ではありません。たとえば、Google Cloud ではローカル SSD と永続ディスクはどちらも、ローカル ディスクを必要とするワークロードをサポートします。

  • 永続ディスクは、バックグラウンドでネットワークに接続されていますが、デフォルトでは Compute Engine の DAS と似ています。どちらの永続ディスクタイプでも、各ユースケースで高いパフォーマンスを得られ、両方ともローカル SSD よりもコストが下がるため、大部分のワークロードに適しています。
  • ローカル SSD は従来の DAS とより直接的に似ており、ストレージとパフォーマンスの要件が高いワークロードに適しています。ただし、ローカル SSD は永続的ではありません。これらをブートディスクとして使用することはできません。永続的なローカル ストレージが必要なワークロードには使用しないでください。

ネットワーク接続型ストレージ(NAS)

データセンターでは、「ファイラー」とも呼ばれる「ネットワーク接続型ストレージ(NAS)」デバイスによって、アプリケーションはマシン間で共有されているファイルの読み取りや更新を行うことができます。通常、ファイラーでは、クライアント マシンがファイル システムをマウントし、ローカルでホストされているかのようにファイルにアクセスできるようにするプロトコルが使用されます。

Google Cloud は、ネイティブ ファイラー ソリューションの Filestore をサービスとして提供しており、Google Cloud 上で、さまざまな方法でファイラーを実行することもできます。詳細については、Compute Engine 上のファイル サーバーをご覧ください。

ストレージ エリア ネットワーク(SAN)

データセンターで「ストレージ エリア ネットワーク(SAN)」は、ブロックレベルのアクセスと内部管理層の両方を提供するリモート ストレージ ユニットであり、これを使用して、個々の論理ユニット番号(LUN)をリソースにプロビジョニングできます。SAN に接続する場合、ユーザーはファイラーの場合と同様に、ディスクが接続されたサーバーに接続するのではなく、SAN 自体をディスクとしてマウントします。

Google Cloud では、永続ディスクを使用して、SAN の使用が求められるワークロードをサポートできます。SAN のコンテキストで使用される場合、永続ディスクは論理ユニット番号(LUN)デバイスを介してアクセスする論理ディスク ボリュームと類似しており、同様の方法でプロビジョニングできます。LUN ベースの論理ディスク ボリュームの場合と同様に、複数の永続ディスクを単一の VM インスタンスにマウントできます。また、単一の読み取り専用永続ディスクを複数の VM インスタンスにマウントすることもできます。

永続ディスクは特定のゾーンに対してローカルであるため、必要であれば、マシンのアクセスを制限する手法として LUN ゾーニングを引き続き使用できます。

SAN を Google Cloud に移行すると、クラウド特有の利点をさらに得ることもできます。

  • 永続ディスクベースの SAN には、ストレージの上限がほとんどありません。物理ストレージの容量不足を心配せずに、新しい永続ディスクを状況に応じてプロビジョニングできます。ただし、個々の VM インスタンスは 128 台の永続ディスクまたは 64 TB のブロック ストレージに制限されています。
  • 所定の LUN に接続できる VM インスタンスの数を最適化するなど、物理ハードウェアの考慮事項を心配する必要はありません。
  • 永続ディスクはデフォルトでレプリケートされるため、最適な RAID レベルの選択について心配する必要はありません。

アーカイブ ストレージ

データセンターでは、業務上または法律上、長期間保持する必要のあるアーカイブ データに対して、磁気テープメディア、ストレージ ディスクアレイ、あるいはそれら両方など、標準の「アーカイブ ストレージ」を使用します。これらの各ストレージ タイプには、以下の欠点があります。

  • ストレージ ディスクアレイは費用が高くなる場合があります。ハードウェア自体の初期費用に加えて、バックアップ ポリシーにより、データをオフサイトに移動する必要がある場合、第 2 のデータセンターへのバックアップの保存が必要になることがあります。このような状況によって、そのデータセンターへの接続を確立して維持するための追加費用が発生します。
  • 磁気テープメディアはストレージ ディスクアレイよりも安価ですが、管理上のオーバーヘッドが増えます。テープ アーカイブを効率的に管理するには、テープの履歴を追跡できるカタログ サーバー、テープ ライブラリ、またライブラリとそれに付随するインポートやエクスポートを管理するための sysadmin が必要です。一部の企業では、テープを安全に定期集配できる外部ベンダーも必要です。

クラウドに移行すると、ハードウェアや人的資源に関するこのような費用が削減されます。たとえば、Google Cloud では、どちらの手法も Cloud Storage NearlineCloud Storage ColdlineCloud Storage アーカイブに置き換えることができます。これらは、段階的に「よりコールドな」ストレージ ソリューションを提供します。Cloud Storage Nearline は、アクセスする予定が 1 か月に 1 回以下のデータ向けに設計されています。Cloud Storage Coldline は、アクセスする予定が四半期に 1 回以下のデータ向けに設計されています。Cloud Storage Archive は、アクセスする予定が 1 年に 1 回以下のデータ向けに設計されています。

Cloud Storage Nearline、Cloud Storage Coldline、Cloud Storage Archive は、従来のアーカイブ ストレージ方式で生じている多数の問題を対処するのに役立ちます。たとえば、磁気テープメディアとは異なり、この 3 つのストレージ クラスはすべて耐久性と信頼性を備えています。テープが正常に機能しているかどうかを心配する必要はありません。また、オフサイトの施設からテープを取得したり、複数のテープにまたがるデータを解決したりすることを心配する必要はありません。さらに、データの複製を心配する必要はありません。Cloud Storage のすべてのクラスでは、デフォルトでデータが複製され、耐久性と可用性が確保されます。

また、Cloud Storage Nearline、Cloud Storage Coldline、Cloud Storage Archive では、オンサイト ストレージ ディスク アレイに匹敵する低レイテンシが提供され、データの最初のバイトを取得するのに、わずか数秒しかかかりません。 それにもかかわらず、ストレージ ディスクアレイとは異なり、ハードウェアの初期コストや、高額なメンテナンス契約料を支払う必要はありません。Cloud Storage では、使用した分だけ支払います。

さらに、Cloud Storage はいくつかの一般的なカタログ管理システムと統合されています。このモデルを利用し、現在のソフトウェアを引き続き使用しながら、新しいアーカイブ バックアップを Cloud Storage Nearline、Cloud Storage Coldline、Cloud Storage Archive に送信できます。詳細については、Cloud Storage のパートナーをご覧ください。

費用

永続ディスクとローカル SSD

Compute Engine 永続ディスクとローカル SSD は、1 か月あたりの GB 数で価格が決まります。永続ディスクとローカル SSD の料金の詳細については、永続ディスクの料金体系をご覧ください。

Cloud Storage Standard

Cloud Storage の料金モデルは、従来のデータセンター ストレージの料金モデルとは大きく異なります。データセンターでは、前もって NAS または SAN ストレージ ハードウェアを購入する必要があります。それとは異なり、Cloud Storage は使用量で課金されます。1 か月あたりのデータ保存量、下りネットワーク量、ロケーション間のデータ転送量、API リクエストの実行数に対して課金されます。メンテナンス費用や、独自のハードウェアを購入したために生じる可能性のあるハードウェア障害に伴う費用を心配する必要はありません。

Cloud Storage の料金の詳細については、Cloud Storage の料金をご覧ください。

Cloud Storage Nearline、Cloud Storage Coldline、Cloud Storage Archive

Cloud Storage Standard ストレージ クラスと同様に、Cloud Storage Nearline、Cloud Storage Coldline、Cloud Storage Archive は、1 か月あたりのデータ保存量、下りネットワーク量、ロケーション間のデータ転送量に対して課金されます。アーカイブ クラスでは、3 つのクラスともストレージ取得料金と最小ストレージ期間が設定されています。最小ストレージ期間が終了する前にデータを削除または変更した場合、残りの期間分も課金されます。たとえば、Cloud Storage Nearline で、オブジェクトを保存してから 5 日後にオブジェクトを削除すると、残り 25 日分のオブジェクト保存に対して課金されます。

Cloud Storage Nearline、Cloud Storage Coldline、Cloud Storage Archive の料金の詳細については、Cloud Storage の料金をご覧ください。

次のステップ

次へ: Google Cloud での管理