Hadoop や Spark のクラスタを Google Cloud Platform に移行する

これまで使っていた Apache Hadoop や Apache Spark のクラスタを、自社に適した方法で Google Cloud Platform に移行できます。

hadoop の移行

多様なシナリオに合わせた多様なオプション

Hadoop や Spark のクラスタをクラウドに移行すれば、大きなメリットが得られる可能性があります。しかし、オンプレミスの Hadoop の既存のワークロードにそぐわない選択をすると、ただでさえ切迫した IT リソースの負担をさらに増やすことになりかねません。その点、Google Cloud Platform なら、現在のニーズを満たしながら、将来にも目を向けた Hadoop 移行計画を策定することができます。仮想マシンへのリフト&シフトから、クラウドの規模と効率性を利用した新しいサービスの検討まで、GCP なら Hadoop や Spark のワークロードのクラウドへの移行を支援するさまざまなソリューションを提供できます。

リフト&シフト

Hadoop のクラスタのリフト&シフト

Hadoop や Spark の既存のデプロイメントを、再構築せずにそのまま Google Cloud Platform に短期間で移行できます。GCP のサービスとしてのコンピューティング インフラストラクチャである高速で柔軟な Compute Engine なら、Hadoop クラスタの理想的なプロビジョニングを行い、既存のディストリビューションを使用できます。Hadoop の管理者はクラスタの有用性に集中できるようになり、サーバーの調達やハードウェアに関する問題の解決をする必要はなくなります。

クラウドの規模と効率性の最適化

クラウドの規模と効率性の最適化

Google Cloud Platform の Hadoop と Spark のマネージド サービス、Cloud Dataproc に移行することで、Hadoop にかかるコストを削減できます。Cloud Storage を使用してストレージとコンピューティングを分離すると同時に、オンデマンドのエフェメラル クラスタの処理を検討するという、Hadoop エコシステムでのデータ処理の新しいアプローチをご検討ください。

データ処理パイプラインの最新化

データ処理パイプラインの最新化

データ処理の複雑性を排除できるクラウド マネージド サービスを検討することで、Hadoop の運用上のオーバーヘッドを削減できます。ストリーミング アナリティクスについては、Cloud Dataflow などのサーバーレスのオプションを使用してリアルタイムのストリーミング データのニーズに対処することをご検討ください。アナリティクスに焦点を当て、Apache Hive などの SQL 互換ソリューションを使用する Hadoop のユースケースについては、BigQuery をご検討ください。BigQuery は、Google のエンタープライズ規模のサーバーレス クラウド データ ウェアハウスです。

オンプレミスの各 Hadoop ワークロードに対応する Google Cloud Platform プロダクト

GCP でのクラウド データ レイクの構築

リソース

ドキュメント アイコン Sketch で作成しました。

オンプレミスの Hadoop インフラストラクチャの Google Cloud Platform への移行

動画アイコン Sketch で作成しました。

Cloud Next のプレゼンテーション: Google Cloud Platform へのオンプレミスの Hadoop インフラストラクチャの移行

ブログ ウェブサイト アイコン Sketch で作成しました。

新しいレポートで Cloud Dataproc の Spark と Hadoop のマネージド ソリューションの経済的な価値を検討

記事アイコン Sketch で作成しました。

Google Cloud Platform でのデータレイクの構築

Google Cloud

使ってみる

無料で体験

GCP を初めて使用する場合、あらゆる GCP プロダクトを $300 相当の無料クレジットでお試しいただけます。

さらにサポートが必要な場合

Google のエキスパートが、適切なソリューションの構築や、お客様のニーズに合ったパートナーを見つけるお手伝いをいたします。