Cloud Storage とは

Cloud Storage は、デジタルデータをオフサイトのサーバーに保存するコンピュータ データ ストレージのモードの一つです。サーバーはサードパーティ プロバイダによって管理され、そのプロバイダがインフラストラクチャに保存されたデータのホスティング、管理、保護の責任を負います。プロバイダは、パブリックまたはプライベートのインターネット接続を介してサーバー上のデータに常にアクセスできるようにします。

Cloud Storage を使用すると、組織はデータを保存、アクセス、維持できるため、独自のデータセンターを所有、運用する必要がなくなり、資本支出モデルから運用支出モデルに移行できます。Cloud Storage はスケーラブルであるため、組織は必要に応じてデータ フットプリントを拡大または縮小できます。

Google Cloud では、組織がデータをクラウドに保存するためのさまざまなスケーラブルなオプションを提供しています。詳細は、Google Cloud での Cloud Storage をご覧ください。

Cloud Storage の仕組み

Cloud Storage は、ファイル、ビジネスデータ、動画、画像などのデータを保存するためにリモートサーバーを使用します。ユーザーがインターネット接続を介してデータをサーバーにアップロードすると、データは物理サーバー上の仮想マシンに保存されます。可用性と冗長性を確保するために、クラウド プロバイダは多くの場合、世界中にあるデータセンター内の複数の仮想マシンにデータを分散します。ストレージを増やす必要がある場合、クラウド プロバイダは負荷を処理するために追加の仮想マシンをスピンアップします。ユーザーは、インターネット接続と、アプリケーション プログラミング インターフェース(API)を介するウェブポータル、ブラウザ、モバイルアプリなどのソフトウェアを使用して Cloud Storage のデータにアクセスできます。

Cloud Storage には、4 つの異なるモデルがあります:

一般公開

パブリック Cloud Storage は、組織がサービス プロバイダのデータセンターに他の企業でも利用されているデータを保存するモデルです。パブリック Cloud Storage のデータは複数のリージョンに分散されており、多くの場合、サブスクリプションまたは従量課金制で提供されます。パブリック Cloud Storage は「弾力性」があると考えられるため、保存されるデータを組織のニーズに応じてスケールアップまたはスケールダウンできます。パブリック・クラウド・プロバイダは通常、スマートフォンやウェブポータルなど、あらゆるデバイスからデータを提供しています。

非公開

プライベート Cloud Storage は、組織が独自のサーバーとデータセンターを利用して、自社ネットワーク内にデータを保存するモデルです。また、組織はクラウド サービス プロバイダを利用して、他の組織が共有していない専用サーバーやプライベート接続を提供する方法もあります。プライベート クラウドは通常、データをより強力に管理する必要があり、コンプライアンスとセキュリティに関する厳格な要件がある組織で利用されます。

ハイブリッド

ハイブリッド クラウドモデルは、プライベート クラウド ストレージ モデルとパブリック クラウド ストレージ モデルを組み合わせたものです。ハイブリッド クラウド ストレージ モデルでは、組織はどのデータをどのクラウドに保存するかを決定できます。センシティブ データや厳格なコンプライアンス要件を満たす必要があるデータはプライベート クラウドに保存され、機密性の低いデータはパブリック クラウドに保存される可能性があります。ハイブリッド クラウド ストレージ モデルには通常、2 つのクラウドを統合するためのオーケストレーション レイヤがあります。ハイブリッド クラウドは柔軟性を備えており、組織は必要に応じてパブリック クラウドを使用して引き続きスケールアップできます。

マルチクラウド

マルチクラウド ストレージ モデルとは、組織が複数のクラウド サービス プロバイダ(パブリックまたはプライベート)から複数のクラウドモデルをセットアップすることを指します。組織がマルチクラウド モデルを選択する可能性があるのは、1 つのクラウド ベンダーが特定の専用アプリを提供する、組織が特定の国にデータを保存する必要がある、さまざまなチームが異なるクラウド上でトレーニングされている、組織がサービス提供者のサービスレベル契約に規定されていない異なる要件に対応する必要がある、といった場合です。マルチクラウド モデルは、組織に柔軟性と冗長性をもたらします。

Cloud Storage のメリット

総所有コスト

Cloud Storage を使用すると、組織は資本支出モデルから運用支出モデルに移行できるため、予算とリソースを迅速に調整できます。

柔軟性

Cloud Storage は弾力性とスケーラビリティを備えており、組織のニーズに応じてスケールアップ(ストレージの追加)またはスケールダウン(ストレージの削減)が可能です。

柔軟性

Cloud Storage では、データの保存とアクセス、リソースのデプロイと予算配分、IT インフラストラクチャの設計を柔軟に行うことができます。  

セキュリティ

ほとんどのクラウド プロバイダは、データセンターの物理的なセキュリティや、ソフトウェアおよびアプリケーション レベルの最先端のセキュリティなど、堅牢なセキュリティを提供しています。優れたクラウド プロバイダは、ゼロトラスト アーキテクチャ、ID とアクセス管理暗号化を提供します。

サステナビリティ

オンプレミスのデータセンターを運用する際の最大のコストの一つは、エネルギー消費のオーバーヘッドです。優れたクラウド プロバイダは、再生可能資源を通じて持続可能なエネルギーで運用しています。

冗長性

冗長性(異なるロケーションにある複数のサーバーにデータを複製する)はパブリック クラウドに固有の特性であり、組織がビジネスの継続性を維持しながら、障害復旧することを可能にします。

Cloud Storage のデメリット

コンプライアンス

金融や医療などの特定の業界では、データの保存とアクセス方法について厳格な要件が定められています。一部のパブリック クラウド プロバイダは、該当する規則や規制の遵守を維持するためのツールを提供しています。

レイテンシ

ネットワーク トラフィックの輻輳や低速なインターネット接続により、クラウドとの間のトラフィックが遅延する可能性があります。

制御

パブリック クラウドにデータを保存すると、そのデータのアクセスと管理に関する制御が一部不要となり、クラウド サービス プロバイダがそのデータをいつでも使用可能な状態に保つので、システムとセキュリティを維持できるようになります。

サービス停止

パブリック クラウド プロバイダは継続的な可用性を確保することを目指していますが、障害が発生して保存されたデータが利用できなくなることもあります。

Cloud Storage の使用方法

Cloud Storage は、個人や組織にメリットをもたらすさまざまなユースケースを提供します。個人が家計の予算をスプレッドシートに保存したり、大規模な組織が安全性の高いデータベースに複数年にわたる財務データを保存している場合でも、Cloud Storage を使用してあらゆる種類のデジタルデータを必要な期間保存できます。

バックアップ

データ バックアップは、Cloud Storage の最もシンプルで最も一般的な用途の一つです。本番環境データはバックアップ データと分離できるため、ランサムウェアなどのサイバー脅威が発生した場合に組織を保護するために 2 つのデータを隔てることができます。Cloud Storage を使用したデータ バックアップは、Google ドライブなどのデジタル フォルダにファイルを保存するのと同じくらい簡単で、ブロック ストレージを使用してギガバイト単位以上の重要なビジネスデータを維持するのと同じようなものです。

アーカイブ

組織が数十年の古い記録をデジタル化し、ガバナンスとコンプライアンスの目的でその記録を保持するようになるにつれて、古いデータをアーカイブする機能は Cloud Storage の重要な側面となっています。Google Cloud には、Coldline Storageアーカイブ ストレージなど、データをアーカイブするための複数の階層のストレージが用意されており、組織が必要とするときにいつでもアクセスできます。

障害復旧

データセンターや古い物理的記録が壊れるような災害(自然災害その他)は、過去の事業に支障をきたすような事象であってはなりません。Cloud Storage では障害復旧が可能なため、組織は厳しい状況でもビジネスを継続できます。

データ処理

Cloud Storage ではデジタルデータを即座に利用できるため、データは継続的によりいっそう有用なものになります。Cloud Storage を使用すると、ビジネス インテリジェンスのためのデータ分析や、大規模なデータセットへの ML と AI の適用などのデータ処理が可能になります。

コンテンツ配信

世界中に分散したサーバーに、大きな音声ファイルや動画ファイルなどのメディアデータのコピーを保管することで、メディア企業やエンターテイメント企業は、低レイテンシで常時利用可能なコンテンツを視聴者に提供できます。

Cloud Storage の種類

Cloud Storage には、オブジェクトファイルブロックの 3 つのタイプがあります。

オブジェクト

オブジェクト ストレージは、構造化されていない大量のデータを保存するためのデータ ストレージ アーキテクチャです。すべてのデータをオブジェクトとして割り当て、別々のストアハウスに保持し、メタデータや固有識別子とバンドルして、アクセスと取得を簡単に行えるようにします。

ファイル

ファイル ストレージは、ファイルとフォルダの階層形式でデータを整理します。ファイル ストレージはパーソナル コンピューティングでは一般的で、データはファイルとして保存され、それらのファイルはフォルダに整理されます。ファイル ストレージを使用すると、必要なときに個々のデータ項目を簡単に見つけて取得できます。ファイル ストレージは、ディレクトリやデータ リポジトリで最もよく使用されます。

ブロック

ブロック ストレージは、データをそれぞれ固有識別子を持つブロックに分割し、それらのブロックを別々の要素としてサーバー上に保存します。クラウド・ネットワークは、これらのブロックをシステムにとって最も効率的な場所に保存します。ブロック ストレージは、高いパフォーマンスやデータベースを必要とするワークロードなど、低レイテンシを必要とする大量のデータに最適です。

AI ワークロード向けのクラウド ストレージ

クラウド ストレージの役割は、現代では根本的に変わり、AI と ML のワークロードのスケーラブルなデータ基盤となっています。クラウド オブジェクト ストレージは、AI システムでは通常、ローカル ディスクと同等のベースラインとして扱われるようになりました。

AI / ML ワークロードの主な要件と機能は、次のとおりです。

非構造化データの処理: Cloud Storage は、膨大な量の非構造化データの処理に適したフルマネージド オブジェクト ストレージ サービスです。トレーニング、サービング、アーカイブなど、AI / ML ワークフローのあらゆるフェーズで必要となります。

スケーラビリティと費用対効果: オブジェクト ストレージは、膨大なデータセットを保存するために不可欠なストレージで、本質的に大量のデータを必要とする AI モデルに、エクサバイト規模でもシームレスなスケーラビリティを提供します。

スループットとレイテンシ: Cloud Storage はスケーリングに優れていますが、コンピューティングに超低レイテンシ(1 ミリ秒未満)を必要とするワークロードには、Managed Lustre などの他のシステムを利用する場合もあります。ただし、Cloud Storage では、数十ミリ秒程度のレイテンシは許容してトレーニング ジョブの総所有コスト(TCO)を削減するように構成することができます。

パフォーマンスの加速: SSD ベースのゾーン読み取りキャッシュである Anywhere Cache などの機能を利用して、Cloud Storage バケットのデータアクセス速度を加速し、GPU および TPU トレーニング ジョブの効率を向上させることができます。

次のステップ

$300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud