BigQuery の大規模データセットを Google スプレッドシートで分析
Google Cloud Japan Team
※この投稿は米国時間 2019 年 1 月 16 日に Google Cloud blog に投稿されたものの抄訳です。
企業が TB(テラバイト)クラスの複雑なデータを収集する際は、それらを保存し、その情報の意味を的確に理解するツールが必要になります。そのため私たちは、大規模データセットを扱うデータ アナリストを支援する BigQuery を開発しました。とはいえ、誰もがデータの専門家というわけではありません。私たちの場合も、多くはスプレッドシートを使ってアドホック分析を行っています。
データ アナリティクス業務の担当ではない従業員でも販売データの分析といったクエリを簡単に実行できるよう、私たちは BigQuery と Google スプレッドシートのパワーを組み合わせることにしました。それを可能にするのが BigQuery 向けのデータ コネクタであり、G Suite Business、Enterprise、Education の各エディションをご利用のお客様向けとして、今後数週間以内に提供が開始される予定です。
BigQuery データ コネクタを使用すると、BigQuery の大規模データセットを Google スプレッドシート内で分析、共有できるようになります。BigQuery の最大 1 万行のデータを、(データ アナリストに教えてもらったシンプルな SQL 文を使用して)Google スプレッドシートに接続し、スプレッドシートの「データ探索」機能を使用するか、グラフやピボット テーブルを作成することで、それらのデータを分析できます。通常の場合と同様に共有権限を管理し、データの閲覧や編集、共有を制限することも可能です。Google スプレッドシートでの「編集」アクセスや BigQuery テーブルへの「閲覧」アクセスが可能なユーザーは、データセットを更新できます。
このデータ コネクタを使用して以下を行うこともできます。
- 使い慣れた Google スプレッドシートのインターフェースを介した、パートナーやアナリスト、その他の関係者とのコラボレーション
- 追加の CSV エクスポートを行わなくても、信頼できる単一のソースを使用
- レポートおよびダッシュボード ワークフローの効率化
Yahoo! のデータ アナリストは、このデータ コネクタをワークフローの簡素化に役立てています。Verizon Media のエンジニアリング ディレクターである Nikhil Mishra 氏は、「私たちのアナリストは BigQuery データ コネクタを使用することで、Google スプレッドシートにデータを取り込む手順を大幅に減らし、作業時間とミスを削減しています」と述べています。
一歩進んだ使い方
Google スプレッドシートでの分析が最も有効なのは、データが最新の場合です。今後数週間以内に、Apps Script やマクロ レコーダーのようなツールを使って、接続した BigQuery データの自動更新をスケジューリングできるようになります。たとえば、1 日の初めにコンピュータの電源を入れると、最新のデータが整い、分析が可能な状態になるように Google スプレッドシートのデータが自動的に更新されます。Google スプレッドシートでのマクロの記録や実行の方法について興味がある方は、G Suite のこちらのブログ記事をご覧ください。- By Daniel Gundrum, Product Manager, G Suite