ストレージ戦略を選択して実装する

Last reviewed 2023-07-17 UTC

Google Cloud アーキテクチャフレームワークのこのドキュメントでは、ストレージに基づいてシステムをデプロイするためのベストプラクティスについて説明します。ストレージ戦略を選択する方法と、ストレージ、アクセスパターン、ワークロードを管理する方法について取り上げます。

データ交換を促進し、データのバックアップと保存を安全に行うには、ワークロード、1 秒あたりの入出力オペレーション（IOPS）、レイテンシ、取得頻度、場所、容量、形式（ブロック、ファイル、オブジェクト）に基づいてストレージプランを選択する必要があります。

Cloud Storage は、次のような信頼性の高い安全なオブジェクトストレージサービスを提供します。

組み込みの冗長性オプションによって機器の故障からデータが保護され、データセンターのメンテナンス中でもデータの可用性を確保。
次のようなデータ転送オプション:
ワークロードをサポートするストレージクラス。
Google が読み取りと書き込みを検証できる、すべての Cloud Storage オペレーションに対して計算されたチェックサム。

Google Cloud では、IOPS はプロビジョニングされた保存容量に応じてスケールします。Persistent Disk などのストレージタイプはゾーンストレージまたはリージョンストレージであるため、手動でのレプリケーションとバックアップが必要になります。反対にオブジェクトストレージは可用性が高く、1 つのリージョンやマルチリージョン全体で、自動でデータを複製します。

ストレージの種類

このセクションでは、システムをサポートするストレージタイプを選択するためのベストプラクティスについて説明します。

高性能ストレージニーズのオプションを評価する

高性能ストレージを必要とするコンピューティングアプリケーション向けの永続ディスクもしくはローカル SSD（ソリッドステートドライブ）を評価します。Cloud Storage は、バージョニング可能なイミュータブルオブジェクトストレージサービスです。Cloud Storage を Cloud CDN とともに使用すると、頻繁にアクセスされる静的オブジェクトで特に、コストを最適化できます。

Filestore は、高性能の共有スペースを必要とするマルチライトアプリケーションをサポートします。Filestore は、ネットワークファイルシステム（NFS）のマウントを介した POSIX のようなファイル操作を必要とする従来のアプリケーションと最新のアプリケーションもサポートします。

Cloud Storage は、データレイクの作成やアーカイブ要件への対処などのユースケースをサポートします。特に保持ポリシーを構成する際は、アクセスコストと検索コストによる Cloud Storage クラスの選択に基づいてトレードオフを決定します。詳細については、クラウドワークロードに最適なストレージ戦略の設計をご覧ください。

どのストレージオプションでも、デフォルトでは保存時と転送時に Google が所有し管理する鍵を使用してデータが暗号化されます。Persistent Disk や Cloud Storage などのストレージタイプの場合、独自の鍵を指定することも、鍵を Cloud Key Management Service（Cloud KMS）で管理することもできます。このような鍵を本番環境データで使用する前に、鍵の処理方法を確立してください。

Google Cloud サービスでストレージデザインをサポートする

ストレージ設計をサポートする Google Cloud サービスについては、次の表をご覧ください。

Google Cloud サービス	Description
Cloud Storage	世界中のどこからでも、いつでもデータを保存、取得でき、データの量に制限はありません。Cloud Storage は、ウェブサイトコンテンツの配信や、アーカイブおよび障害復旧を目的としたデータの保存、直接ダウンロードによるユーザーへの大規模なデータオブジェクトの配布など、複数のシナリオで利用できます。詳しくは以下をご覧ください。 Cloud Storage のベストプラクティスバケットのロケーションストレージクラス Cloud Storage FUSE
Persistent Disk	Google Cloud 向けの高性能なブロックストレージPersistent Disk は、Compute Engine または Google Kubernetes Engine（GKE）で実行されているインスタンスに接続可能な SSD ストレージとハードディスクドライブ（HDD）ストレージを提供します。リージョンディスクを使用すると、同じリージョン内の 2 つのゾーン間で耐久性の高いデータストレージとデータレプリケーションを実現できます。より高い IOPS と低レイテンシが必要なケースに対しては、Google Cloud は Cloud Filestore を提供します。ローカル SSD は、仮想マシンのインスタンスをホストするサーバーに物理的に接続されます。一時的なディスク容量としてローカル SSD を使用できます。
Filestore	データ用のファイルシステムインターフェースと共有ファイルシステムを必要とするアプリケーション向けのマネージドファイルストレージサービスです。Filestore を使用することにより、Compute Engine や GKE のインスタンスでマネージドネットワーク接続ストレージ（NAS）をシームレスに活用できるようになります。
Cloud Storage for Firebase	写真や動画のようなユーザー作成コンテンツを保存し配信する必要のあるアプリデベロッパー向けに構築されています。すべてのファイルは Cloud Storage バケットに保存されているので、Firebase と Google Cloud の両方からアクセスが可能です。

ストレージ戦略を選択する

アプリケーションの要件に合ったストレージ戦略を選択するには、次の表をご覧ください。

ユースケース	推奨事項
最小限のコストで大規模にデータを格納する必要があり、アクセスパフォーマンスが問題にならない。	Cloud Storage
即時ストレージを必要とするコンピューティングアプリケーションを実行している。詳細については、Persistent Disk とローカル SSD のパフォーマンスの最適化をご覧ください。	Persistent Disk またはローカル SSD
共有スペースに対する読み取りと書き込みのアクセス権が必要な高パフォーマンスワークロードを実行している。	Filestore
ハイパフォーマンスコンピューティング（HPC）またはハイスループットコンピューティング（HTC）のユースケース。	クラスタを利用して大規模なテクニカルコンピューティングをクラウドで実行する

ストレージアクセスのニーズに基づいてアクティブストレージまたはアーカイブストレージを選択する

ストレージクラスは、すべてのオブジェクトで使用されるメタデータです。配信頻度と可用性が高いデータの場合は、Standard Storage クラスを使用します。アクセス頻度が低く、やや可用性が低くてもよいデータには、Nearline Storage クラス、Coldline Storage クラス、Archive Storage クラスを使用します。ストレージクラスを選択する際の費用に関する考慮事項については、Cloud Storage の料金をご覧ください。

Cloud Storage についてストレージの場所とデータ保護に関するニーズを評価する

リージョンに配置された Cloud Storage バケットの場合、バケット内に含まれるデータはリージョン内のゾーン間で自動的に複製されます。ゾーン間でのデータレプリケーションは、リージョン内でゾーン障害が発生した場合にデータを保護します。

Cloud Storage にはリージョン間で冗長なロケーションも用意されています。つまり、データは地理的に離れた複数のデータセンターに複製されます。詳細については、バケットのロケーションをご覧ください。

Cloud CDN を使用して静的オブジェクトの配信を向上させる

オブジェクトの取得コストを最適化し、アクセスレイテンシを最小にするには、Cloud CDN を使用します。Cloud CDN は、Cloud Load Balancing の外部アプリケーションロードバランサを使用して、ルーティングとヘルスチェックを行い、エニーキャスト IP アドレスをサポートします。詳細については、クラウドバケットを使用して Cloud CDN を設定するをご覧ください。

ストレージアクセスパターンとワークロードタイプ

このセクションでは、システムをサポートするストレージアクセスパターンとワークロードタイプを選択する際のベストプラクティスについて説明します。

Persistent Disk を使用して高性能ストレージへのアクセスをサポートする

データアクセスパターンは、システムパフォーマンスをどのようにデザインするかによって変わります。Cloud Storage はスケーラブルなストレージを提供しますが、大量のデータに高いスループットでアクセスする必要のある重い計算ワークロードを実行する場合は、理想的な選択ではありません。高性能ストレージアクセスには、Persistent Disk を使用します。

リトライロジックの実装時に指数バックオフを使用する

5XX、408、429 エラーを処理するために、リトライロジックの実装時に指数バックオフを使用します。各 Cloud Storage バケットには、初期 I/O キャパシティが設定されています。詳細については、リクエストレートとアクセス配信のガイドラインをご覧ください。リトライ要求の段階的な立ち上げを計画する。

ストレージ管理

このセクションでは、システムをサポートするためのストレージ管理のベストプラクティスについて説明します。

すべてのバケットに固有の名前を設定する

すべてのバケット名を Cloud Storage 名前空間内で一意にします。バケット名には機密情報を含めないでください。推測しにくいバケット名とオブジェクト名を選択してください。詳細については、バケットの命名ガイドラインとオブジェクトの命名ガイドラインをご覧ください。

Cloud Storage バケットを非公開の状態に保持する

ビジネス上の理由がない限り、Cloud Storage バケットに匿名アクセスまたは一般アクセスができないようにしてください。詳細については、アクセス制御の概要をご覧ください。

ランダムなオブジェクト名を割り当てて、負荷を均等に分散する

ランダムなオブジェクト名を割り当てて、パフォーマンスを改善し、ホットスポットを回避します。可能であれば、オブジェクトの接頭辞をランダムにします。詳細については、命名規則を使って負荷をキーの範囲に均等に分散するをご覧ください。

公開アクセス防止を使用する

組織、フォルダ、プロジェクト、バケットレベルのアクセスを防止するには、公開アクセスの防止を使用します。詳しくは、公開アクセスの防止の使用をご覧ください。

次のステップ

Google Cloud データベースサービスと、次のようなベストプラクティスについて確認します。

データベースを選択して移行する。
データベースの暗号化を管理する。
データベースのネットワーキングとアクセスを管理する。

アーキテクチャフレームワークの他のカテゴリ（信頼性、オペレーショナルエクセレンス、セキュリティ、プライバシー、コンプライアンスなど）を確認する。