ビッグデータ ソリューション

Google の統合ビッグデータ プラットフォームで大量データを活用

無料トライアル お問い合わせ

Google の規模で行うビッグデータ解析

今日のアプリケーションは、企業内の多様なソースからかつてないほど大量のデータを生成しています。その対象は拡大しており、今やあらゆる端末でデータを収集して重要な兆候を捉えることができるようになりつつあります。そして、蓄積されるデータ量は、目まぐるしい速さで増加しています。そのような生データは一切構造化されていませんが、業務環境や顧客について多くの情報が蓄積されている宝庫です。現在では、そうした情報を抽出できる大規模かつ効率的な方法があります。Google は創立当初からウェブ規模での解析とマシン インテリジェンスに取り組んでおり、これは Google の DNA とも言ってよいものです。Google Cloud Platform は、Google が過去 20 年近くにわたり使ってきた実績のある解析エンジンを採用し、ビジネスや業務環境に埋もれた分析情報を掘り起こします。

フルマネージドでサーバーレスのインサイト

Google Cloud Platform は、ウェブ規模のデータを分析する業界トップのプラットフォームです。使い慣れた SQL をベースとした、フルマネージドのサーバーレス アーキテクチャで、バックエンド インフラストラクチャの管理は一切必要ありません。Google のビッグデータ解析サービスは自動的にスケールするため、ユーザーはビジネス インサイトの分析に集中できます。

ペタバイト級のデータセットでも高速なクエリ処理

BigQuery は Google Cloud Platform のフルマネージド データ ウェアハウスで、大規模なデータに対して Google ならではの効率的なクエリ処理を実現します。従量制の利用しやすい料金設定で、Google の世界クラスのインフラストラクチャが提供するスケーラビリティとセキュリティをビジネス インサイトでフル活用できます。

バッチ処理とストリーム処理を統合

Cloud Dataflow は、ETL、バッチ処理、ストリーム分析などの幅広いデータ処理方法を開発、実行できる、革新的なフルマネージド型サービスです。バッチ処理と継続的なストリーム処理の両方で同じツールとプログラミング モデルを使用するため、切り替えコストはかかりません。

Spark と Hadoop をクラウドで利用

Spark、Hadoop / MapReduce、Hive、Pig などの優れたオープンソース ツールで標準化されている企業であれば、Cloud Dataproc への移行はスムーズです。Dataproc ではクラスタの作成やサイズ変更がいつでもできるため、データ パイプラインがクラスタの上限を超えてしまうことはありません。Compute Engine の基盤となるリソースに対して秒単位で課金されるため、実際に使用したリソースにしか料金はかかりません。また、分析が完了した時点で、料金がかからないようにすることができます。

マネージド データベース、オブジェクト ストレージ、アーカイブ

将来どのようなビジネス上の課題が浮上してくるかを具体的に予測するのは困難です。だからこそ、ビジネス環境に蓄積されたイベントや有益なメタデータは削除せず、将来インサイトで利用できるよう保存することが重要です。Google では、カテゴリを代表するアーカイブ プロダクトである Nearline など、マネージド SQL から多様な NoSQL オプションまで、グローバルで提供されるさまざまなストレージ プロダクトから選択できます。

マシン インテリジェンスの新たなステージ

Google が誇るウェブ規模の機械学習と解析機能を採用することで、ビジネスに関連する実世界のデータから長期的なビジネス チャンスを掘り起こすことができます。Google Cloud Platform を使用すれば、小規模なチームでも大容量データを収集し、機械学習ワークロードを実行して予測分析を行えます。機械学習の活用を広めるために、Google はマシン インテリジェンスのライブラリである TensorFlow をオープンソース化しました。また、Cloud Vision APICloud Speech APIGoogle Cloud Translation API など、すぐに使い始められる事前トレーニング済み API もクラウド機械学習サービスで複数公開しています。

イノベーションの活用

Google は、MapReduce、Bigtable、Dremel などのデータ処理技術の革新で業界をリードしてきました。そして現在、Google は業界トップのプログラミング ツールやモデルを含め、データ処理技術の最新世代を公開し、誰もが利用できるようにしています。

ビッグデータに関するガイド

ビッグデータ開発のための詳細なガイドとリソース

公開データセット

Google Cloud Platform にホスティングされている公開データセットから新たな発見や分析結果を得ることができます。

公開データセットを見る

商用データセット

Google Cloud Platform でホストされる商用データセットにアクセスして分析します。

商用データセットを見る

データ ライフサイクル

Google Cloud では、取得してから最終的に表示するまで、ライフサイクル全体でデータを管理できます。

記事を読む

データ ウェアハウスのプロ向けの BigQuery

Google BigQuery をデータ ウェアハウスとして使用する方法を学びます。

記事を読む

リレーショナル DB から BigQuery への ETL

分析のために OLTP リレーショナル データベースから Google BigQuery へデータを抽出して変換し、読み込む方法を学びます。

記事を読む

アナリティクスの大規模取り込み

アナリティクス イベントとログの大規模取り込みを最適化するためのアーキテクチャをご覧ください。

記事を読む

モバイルゲーム パイプライン

スマートフォン向けゲームのデータ処理について、架空のゲームを例としてご紹介します。

パイプラインの事例を見る

予測的デジタル マーケティング

フル機能のウェブサイト トラフィック解析ツールである Google アナリティクス プレミアムは BigQuery と統合されました。

記事を読む

財務時系列データにおける機械学習

機械学習を使って Google Cloud Platform で財務時系列データを解析する方法について説明します。

チュートリアルを読む

「Spotify が Google を選んだ理由の 1 つは、大規模データの分析サービスが他のクラウド プロバイダが提供するどのデータサービスよりも優れていたからです。」

— Wired、2016 年 2 月