ビッグデータ分析

包括的なデータ分析機能と機械学習機能を備えたサーバーレスなプラットフォームを用いて、データから実用的な情報を抽出します。

データ分析で可能な処理の再定義

あまり時間をかけずに問題の本質に迫ることが大切です。データ分析の複雑な部分は Google Cloud Platform(GCP)に任せてしまいましょう。サーバーレスで総合的なエンドツーエンドのデータ分析サービスのメリットを実感してください。規模、パフォーマンス、コスト効率における従来の限界を突破できます。

インフラストラクチャではなく分析に集中

GCP のフルマネージド型のサーバーレスなアプローチでは、ビッグデータ分析ソリューションのパフォーマンス、スケーラビリティ、可用性、セキュリティ、コンプライアンス ニーズなどが自動的に管理されるのでランニング コストがかかりません。そのためサーバーの管理よりもデータの分析に集中できます。また、革新的でわかりやすい料金体系により従量制の支払いが可能で、状況によっては秒単位またはクエリ単位で利用料金を支払うことができます。定額料金制と継続利用割引も用意されています。

妥協せずに開発期間を短縮可能

Google BigQuery を利用すると、ギガバイトないしペタバイト級のデータを ANSI SQL の下で驚くほど高速に分析できます。また、REST ベースの API に基づいて他のアプリケーションとの統合環境を簡単に実現でき、Java、Python、C#、Go、Node.js、PHP、Ruby など、おなじみのプログラミング言語を用いて分析アプリケーションを開発できます。Cloud Pub/Sub を利用すると、オープンな API に基づいて毎秒何百万ものイベントを世界中のあらゆる場所から収集し、それをあらゆる場所に公開できます。さらに Cloud Dataflow を利用すると、バッチとストリーミングのパイプライン開発を迅速に進められます。その際に、パイプラインの堅牢性、正確性、機能性が失われることはありません。

既存のツールやオープンソース ツールの有効活用

GCP はオープン アーキテクチャを採用し、よく利用されているオープンソース ツールとの統合が容易なため、価値創出までの期間を短縮できます。Apache Spark または Apache Hadoop のワークロードに関してコスト削減とパフォーマンス向上を図りたければ Cloud Dataproc に移行するとよいでしょう。よく利用されているオープンソース ツール(Apache Kafka など)やデータ形式(Apache Avro など)との統合は簡単で、GCP 内の Apache Beam 上に構築されたデータ パイプラインは、オープンソースのランタイム(Spark または Flink)を採用しても問題なく機能します。Apache Airflow 上に構築された Cloud Composer は、パブリック クラウドやオンプレミス環境をまたがるワークフロー オーケストレーションを簡素化します。おなじみのビジネス インテリジェンス(BI)ツールや可視化ツール(Tableau、Qlik、Looker、データポータル)を活用すれば、データから抽出した知見を簡単に共有できます。

どこでも誰でも AI を活用できる AI-Ready な基盤

Google は 20 年にわたって機械学習と AI の技術革新に取り組んでおり、お客様はお使いになっているアプリケーションに業界最先端のサービスを利用して予測分析を取り入れることができます。Cloud Dataprep は機械学習に必要なデータを準備する期間を短縮します。BigQuery ML は BigQuery 内の任意のサイズのデータセットに基づいて単純な SQL ベースの機械学習モデルを構築します。Cloud AutoML は Google API のカスタム機械学習モデルを有効利用してそのトレーニングを行います。Google Cloud Storage 内または BigQuery 内のビッグデータ セットを簡単な操作で相互に関連付けて、高度な TensorFlow モデルや Cloud Machine Learning Engine モデルを構築することもできます。

サーバーレスなビッグデータ プラットフォーム

OmniGraffle 7.7.1 で作成 2018-07-16 23:32:56 +0000 01_すべてのビッグデータ プロダクトの図 2 レイヤ 1 キャプチャ ゾーン内部 - 青 保存 ゾーン内部 - 青 BigQuery ストレージ (テーブル) BigQuery 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 Cloud Storage (ファイル) Cloud Storage 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 処理 ゾーン内部 - 青 Cloud Dataprep 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 ゾーン内部 - 青 分析 BigQuery 分析 BigQuery 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 ソリッドパス ML Engine クラウド機械学習 塗りつぶし-1 塗りつぶし-4 塗りつぶし-7 塗りつぶし-9 ソリッドパス ゾーン内部 - 青 使用 Cloud Datalab Cloud Datalab 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 塗りつぶし-16 塗りつぶし-18 ソリッドパス Cloud Composer (オーケストレーション) データ サイエンティスト Shape_1_ ビジネス アナリスト Shape_1_ データ ポータル XMLID_24_ XMLID_23_ XMLID_22_ bottom_1_ middle_1_ top_1_ layer1 g4550 path4508 path4491 path4506 Cloud Dataflow Cloud Dataflow 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 塗りつぶし-16 ソリッドパス アートボード-1 塗りつぶし-1 塗りつぶし-3 グループ-7 パス-1 塗りつぶし-5 塗りつぶし-8 塗りつぶし-10 グループ-14 パス-3 塗りつぶし-12 塗りつぶし-15 塗りつぶし-17 塗りつぶし-19 塗りつぶし-21 塗りつぶし-23 塗りつぶし-25 ページ-1 アートボード-1 グループ 塗りつぶし-1 塗りつぶし-2 塗りつぶし-3 塗りつぶし-4 塗りつぶし-5 塗りつぶし-6 アートボード-1 グループ-3 パス-1 塗りつぶし-1 塗りつぶし-4 アートボード-1 塗りつぶし-1 グループ-5 パス-1 塗りつぶし-3 塗りつぶし-6 塗りつぶし-9 アートボード-1 グループ-3 パス-1 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 塗りつぶし-16 塗りつぶし-18 塗りつぶし-20 塗りつぶし-22 塗りつぶし-24 塗りつぶし-26 塗りつぶし-28 塗りつぶし-30 塗りつぶし-32 塗りつぶし-34 塗りつぶし-36 塗りつぶし-38 塗りつぶし-40 塗りつぶし-42 塗りつぶし-44 塗りつぶし-46 塗りつぶし-48 塗りつぶし-50 塗りつぶし-52 塗りつぶし-54 塗りつぶし-56 塗りつぶし-58 塗りつぶし-60 塗りつぶし-62 塗りつぶし-64 塗りつぶし-66 塗りつぶし-68 塗りつぶし-70 塗りつぶし-72 塗りつぶし-74 塗りつぶし-76 塗りつぶし-78 塗りつぶし-80 塗りつぶし-82 塗りつぶし-84 グループ-88 パス-3 塗りつぶし-86 塗りつぶし-89 塗りつぶし-91 塗りつぶし-93 塗りつぶし-95 塗りつぶし-97 塗りつぶし-99 塗りつぶし-101 塗りつぶし-103 塗りつぶし-105 塗りつぶし-107 塗りつぶし-109 塗りつぶし-111 塗りつぶし-113 塗りつぶし-115 塗りつぶし-117 Persistent Disk 塗りつぶし-1 塗りつぶし-4 塗りつぶし-7 塗りつぶし-9 塗りつぶし-11 ソリッドパス Cloud Dataproc Cloud Dataproc 塗りつぶし-1 塗りつぶし-4 塗りつぶし-7 塗りつぶし-9 塗りつぶし-11 塗りつぶし-13 塗りつぶし-15 塗りつぶし-17 Cloud Bigtable Cloud Bigtable (NoSQL) Cloud Bigtable 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 塗りつぶし-16 塗りつぶし-18 塗りつぶし-20 塗りつぶし-22 path3269 path3271 path3273 path3275 path3277 polygon3279 Cloud Data Transfer 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 Cloud Pub/Sub 塗りつぶし-1 塗りつぶし-4 塗りつぶし-7 塗りつぶし-9 塗りつぶし-11 塗りつぶし-13 塗りつぶし-15 塗りつぶし-17 塗りつぶし-19 塗りつぶし-21 塗りつぶし-23 塗りつぶし-25 Google 広告 Google マーケティング プラットフォーム Firebase XMLID_158_ XMLID_8_ XMLID_3_ XMLID_2_ XMLID_1_ XMLID_23_ XMLID_67_ XMLID_36_ XMLID_109_ Stackdriver Layer_2 YouTube Cloud IoT Core Cloud IoT Core Cloud IoT Core 塗りつぶし-1 塗りつぶし-4 塗りつぶし-7 塗りつぶし-9 塗りつぶし-11 塗りつぶし-13 Cloud Dataflow Cloud Dataflow 塗りつぶし-1 塗りつぶし-4 塗りつぶし-6 塗りつぶし-8 塗りつぶし-10 塗りつぶし-12 塗りつぶし-14 塗りつぶし-16 ソリッドパス ソリッドパス Cloud Dataproc Cloud Dataproc 塗りつぶし-1 塗りつぶし-4 塗りつぶし-7 塗りつぶし-9 塗りつぶし-11 塗りつぶし-13 塗りつぶし-15 塗りつぶし-17

プロダクトとソリューション

ビジネス インテリジェンス

GCP とサードパーティの既存の BI ツールを利用すれば、誰でも情報を分析し、大量のデータから価値を引き出すことができます。

クラウドネイティブなデータ ウェアハウジング

BigQuery は、お客様のチームをインフラストラクチャの管理から解放します。BigQuery はスケーラビリティを備えたフルマネージド型のサーバーレスなデータ ウェアハウスです。

データレイク

膨大な量の構造化データ / 非構造化データを安全かつコスト効率と俊敏性の高い方法で保存、処理、分析できます。

Apache Hadoop または Apache Spark を基盤とするデータ処理

90 秒で立ち上げることができる Hadoop / Spark クラスタと秒単位の課金を導入して、システム運用を一変させましょう。

変化をもたらすデータ ソリューション

目的に合わせた分析を行うことで変化が生まれ、非営利団体の理念を実現に近づけます。

モノのインターネット

グローバル展開されたデバイスに簡単な操作で接続して IoT データを安全に管理、収集し、動作パラメータの変更をリアルタイムで分析して結果を適用できます。

機械学習と Cloud AI

カスタマイズした機械学習モデルを構築してトレーニングし、サービスとして提供します。あるいは Cloud AI API で提供されている事前に構築されたモデルを使用します。

マーケティング分析

マーケティング データを Google Cloud に統合すれば、ユーザー エクスペリエンスやキャンペーンの改善、ビジネス成果の予測精度の向上などの効果を期待できます。

ストリーム分析

世界中のあらゆる場所から何百万ものイベントをリアルタイムで収集、処理、分析し、分析結果をプロジェクトやアプリケーションに広くストリーミング配信できます。

ワークフロー オーケストレーション

パブリック クラウドやオンプレミス環境に広く展開されたワークフロー オーケストレーションを簡素化して統合します。

お客様の声

当社は今後、いかに必要なデータを収集できるかが意思決定の大きなポイントになってくると感じていました。そのため、どこまでも拡大し続けるデータに対応できるプラットフォームが必要でした。この理想を求めて辿り着いたソリューションが Google Cloud Platform — 特に Google BigQuery — です。

Nikunj Shanti 氏 AirAsia 最高デジタル責任者

zulily

e コマースを生業とするこの会社は、1 日 50 億件のクリックストリーム イベントを収集し、GCP 上のリアルタイム分析を利用して売上転換率の向上とユーザー エクスペリエンスの改善を図っています。

Snap Inc.

セキュリティと安定性を特に重視する Snapchat は、アプリを簡単かつ安全に開発するため、また 1 日 1 億人のユーザーに対応するために App Engine を利用しています。

Home Depot

現在、homedepot.com の 75% のサービスは Google Cloud から提供しており、Home Depot はショッピングのピーク時に跳ね上がる巨大なトラフィックを年間を通じて適切に管理することができています。

Google のパートナー

Google のビッグデータ パートナーは、企業のイノベーションの促進、スマートなスケーリング、セキュリティの確保を支援します。

Informatica パートナーロゴ Confluent パートナーロゴ Hortonworks パートナーロゴ Looker パートナーロゴ Accenture パートナーロゴ Sapient パートナーロゴ

リソース

チュートリアルを試し、クイックスタートを開始し、レビューを詳しく見てみましょう。

データと機械学習トレーニング

一般公開データセット

Google Cloud Platform ポッドキャスト

GCP データと ML Twitter

Google Cloud

使ってみる

無料で体験

GCP を初めてご利用の場合、あらゆる GCP プロダクトを $300 相当の無料クレジットでお試しいただけます。

さらにサポートが必要な場合

Google のエキスパートが、適切なソリューションの構築や、お客様のニーズに合ったパートナーを見つけるお手伝いをいたします。