Cloud OnAir

Cloud OnAir 番組レポート : BigQuery で実現する Smart Analytics Platform

cloudonair0904.png

Cloud OnAir は、Google Cloud の製品をわかりやすく解説し、最新の情報などをいち早く皆様にお伝えする Online 番組です。


10 月 24 日の放送では、「BigQuery で実現する Smart Analytics Platform」をテーマにお送りしました。Google Cloud のエンタープライズ向けのデータ ウェアハウスである BigQuery にフォーカスします。他のデータ ウェアハウス製品との違いや BigQuery の特徴・機能をご紹介するとともに、BigQuery を活用してどのようにデータの管理、分析が行えるようになるのかをご紹介します。

BigQuery の特徴

BigQuery は、サーバーレスでスケーラビリティに優れたエンタープライズ向けデータ ウェアハウスです。BigQuery の特徴を以下にまとめます。

  • ペタバイト規模のスケール 

ベタバイト単位でシームレスにスケールしてデータを保存および分析できます。また、ペタバイト規模のクエリの速度は年々アップしています。約 1 PB のデータに対して、2016 年には 245 秒かかっていたクエリ処理が、2019 年には 4 秒にまで短縮しています。

  • 機密性、可用性、耐久性

第三者の監査と認定に基づくコンプライアンス保証が行われています。 また、データカタログ、データアクセス制御、 機微情報の自動検知とマスキングといったガバナンスや機密性向上の機能を有します。

  • フルマネージドでサーバレス

ストレージは フルマネージドで 12 nines (99.9999999999%)の耐久性があり、それぞれの テーブルはゾーンをまたいで複製され、自動的にスケールします。

  • ストリーミング データのリアルタイム分析

強力なストリーミング取り込み機能を使用してリアルタイムにデータを取得、分析。秒間 10 万件のストリーミング データの取り込みが可能 です。BigQuery Streaming V2(ベータ版)では、デフォルトで、秒間 100 万件のストリーミング データの取り込みが可能 (プロジェクト単位)となります。

  • データ取り込みの自動化

BigQuery Data Transfer Service はスケジュールを設定することで、自動的、定期的に SaaS アプリケーションから BigQuery へデータを取り込みます。

  • ML、BI エンジン、GIS を標準搭載

    • BigQuery ML: BigQuery で標準 SQL クエリを使用して機械学習モデルを作成して実行できます。

    • AutoML Tables(ベータ版): 最先端のモデルを自動的に構築。コード記述も不要で、幅広いデータ型に対応しています。 

    • BigQuery BI Engine (ベータ版): BigQuery を BI ツールから利用する際に、1 秒以下でのクエリレスポンスを返し、より高い並列度をサポートするインメモリ分析サービスです。

    • BigQuery GIS: 地理データを可視化し、地理データの抽出やフィルタリング、面積や距離の計算など、地理データの分析が SQL で実施可能です。

BigQuery で実現する Smart Analytics Platform

番組後半では、BigQuery を中心にさまざまなプロダクトを連携した Smart Analytics Platform をご紹介します。番組ではデータの収集、処理、管理、可視化といった各フェーズの主要なプロダクトに焦点をあて、プロダクトの特徴とプロダクト間の連携について解説します。番組内で取り上げるプロダクトは以下となります。

番組で説明した資料はこちらで公開しています。

Cloud OnAir では、各回 Google Cloud のエンジニアがトピックを設け、Google Cloud の最新情報を解説しています。過去の番組、説明資料、さらには視聴者からの質問と回答はこちらよりご覧いただけます。 最新の情報を得るためにもまずはご登録をお願いします。