Google Cloud Platform

知見を容易に獲得 : Data Studio と Cloud Dataprep を正式リリース

image6_4mI2fGGe3xm.PNG

※この投稿は米国時間 2018 年 9 月 21 日に Google Cloud blog に投稿されたものの抄訳です。

私たち Google Cloud は、お客様の日常をより快適なものにするためにサービスを開発しています。お客様を取り巻く情報の世界を整理し、アクセスや理解ができるようにすることもその一環です。具体的なニーズはお客様のビジネスによって異なりますが、手持ちのデータを包括的な形で見たいという点ではほぼ共通だと言ってよいでしょう。とはいえ、専用の IT インフラストラクチャを管理するか、もしくは煩わしいデータ クリーニングを膨大な時間をかけて行わないかぎり、大抵のデータは使用できる状態になりません。

そこでこのたび、無料のビジネス インテリジェンス(BI)サービスである Google Data Studio と、Trifacta が運用するフルマネージドのデータ前処理サービスである Google Cloud Dataprep を正式にリリースしました。

Data Studio

お客様にもっと気楽にビジュアル アナリティクスを活用していただくため、私たちは 2016 年に Data Studio をローンチし、シンプルで使いやすい強力な BI プラットフォームの構築に着手しました。Data Studio を使用すれば、パートナー企業が開発した 100 以上のコネクタを介して、Google CloudGoogle Marketing Platform のソースはもちろん、500 を超えるデータ ソースのデータに簡単にアクセスして分析することが可能です。魅力的なダッシュボードやレポート上でデータを視覚化して気になる部分をインタラクティブに探ったり、ほかの人々と簡単に知見を共有したり、地球の反対側にいる同僚とリアルタイムでコラボレートしたりすることができるのです。こうした機能のおかげで、Data Studio は世界中で毎月 100 万以上の人々に使用されています。

実り多い 2 年間のパブリック ベータ期間中、私たちはお客様の声に注意深く耳を傾け、Data Studio の基幹機能を拡張してきました。小売り、金融サービス、保険、マーケティング、テクノロジー、ホスピタリティ、メディアなど多くの業界のお客様が、私たちへの質問や、サプライチェーン、マーケティング、セールス アナリティクス、データ ストーリーテリングなどのユース ケースを通じて貴重なヒントを提供してくださいました。また、Visualize 2030 コンテスト(国連サミットで採択された持続可能な発展のための 2030 アジェンダに基づく Google Cloud の取り組み)に応募されたデータ ストーリーからも大きなヒントを得ています。

お客様の評価

AirAsia Group(AirAsia)は、東南アジアにおける格安航空会社の先駆けとして 2001 年に設立されました。現在は、マレーシア、タイ、インドネシア、フィリピン、インドのハブ空港とアジア内外の 110 か所を結ぶ 222 以上の路線を運航しています。

AirAsia で CDO(最高データ責任者)を務める Nikunj Shanti 氏は、社内のデータフローを絶やさないことに Data Studio が役立っていると評価したうえで、次のように述べています。「未来の航空業界で生き残っていくためにはデータの民主化がカギを握ります。Data Studio と BigQuery データ ソースの統合は、社員全員が同じビューを共有することに貢献しています。このプラットフォームが過去 12 か月で急速に発展したおかげで、従来のシステムを廃止し、データ ダッシュボードとアドホックなビジュアライゼーション用のプラットフォームを 1 つに絞り込むことができました」

英国に本拠を置く Ocado は世界最大のオンライン専門スーパーとして知られており、サードパーティの小売業者向けに Ocado Smart Platform という販売および物流のシステムを提供しています。

「データと分析は、Ocado のリテール ビジネスと Ocado Smart Platform だけでなく、Ocado のソフトウェア エンジニアリング チームが成功を収めるうえで必要不可欠です。システムの信頼性と開発のサイクル タイムを重視して GCP ベースに標準化した結果、私たちは BI スタックを拡張して Data Studio と BigQuery の密接な連携を図れるようになりました。従来のツールはコストが高く、しかも高度なスキルが必要だったため、社内のチームは静的データで一度限りのダッシュボードやスプレッドシートを手作業で作っていました。Data Studio の導入後すぐに、私たちはシステムの健全性と生産性の指標をデータ エコシステムに導入し、セキュアなアクセスを確保したうえで、パフォーマンス データ ダッシュボードを公開しました。現在では、すべてのチームが自分たちのシステムとプロセスだけでなく、開発ユニット全体のデータを基に、リアルタイムでアドホックなビューを作成できるようになっています。これはすごいことです」(Ocado のプラットフォーム サービス責任者、Dan Nelson 氏)

PicMonkey は、魅力的な写真、ロゴ、ソーシャル メディアのグラフィックスを作成できるツールです。PicMonkey の強力で使いやすい写真編集機能やグラフィック デザイン ソフトウェアは、Facebook にもアプリの形で組み込まれています。

PicMonkey のブランド ディレクターである Karen Cooper 氏は、「以前はどのデジタル エクスペリエンスが最も効果的かを知るために人工的なシチュエーションを作り出していましたが、それだと現実離れした感じが否めませんでした。BigQuery と Data Studio を導入してからは、どの組み合わせがベストなのかがすばやくわかるようになりました。これは、一般消費者向けの製品を開発するうえで、とてつもなく大きな進歩です」と述べています。

Data Studio への継続的な投資

Data Studio のベータ ユーザーは製品の進化と将来ビジョンに影響を与えました。その具体例の 1 つが、私たちが最近 Data Studio に追加したアドホックなデータ探査コンポーネントである Data Studio Explorer です。このツールは BigQuery の UI に統合されているため、データセットやクエリ結果をほんの数クリックで視覚化できます。

YImxwLnI7SrEyieVXx1Ofk-JIIuPlCwx7whTCeVheSFjOd9lX3y2PqT_sGqAJ-mDTn1pW7kE9ui8ytyFU9L3EXoAZaH4ZuH_RLE6iz6B45vZ4DVT1nhH6ds477mgjkdqqmp8ahLX7n3a.PNG
BigQuery の UI から Data Studio Explorer を立ち上げるワークフローの例

別々のソースのデータを 1 つのグラフにまとめることも、Data Studio 内での右クリックだけで可能になりました。

image4_myQT5Rofr2f.GIF
別々のソースのデータを同じグラフにまとめることも右クリックだけで容易に

Data Studio は、BigQuery、Google スプレッドシート、Cloud SQL、Cloud Spanner、Cloud Storage といった Google Cloud でおなじみのデータ ソースだけでなく、Google Analytics、Display & Video 360、YouTube Analytics、Google Ads といった Google の広告やマーケティング向けのデータ ソースにも対応しています。さらに、パートナー企業によるコミュニティ コネクタのエコシステムを通じて、Salesforce、Facebook、Twitter など 500 種を超えるデータ ソースにもアクセスできます。レポート テンプレート ギャラリーは、関心のあるデータ ソースをフィルタのような方法で使用し、手っ取り早く視覚化するための出発点になります。また、カスタム ビジュアライゼーションをサポートする新たなコミュニティ機能も数週間後にリリースされます。これは、D3.js のようなサードパーティ ライブラリやカスタム JavaScript、CSS を使用して独自のビジュアライゼーションを構築できるようにするものです。

Data Studio の旅はまだ始まったばかりです。私たちはこれからも新機能をリリースし、製品を拡張していきます。皆さんは datastudio.google.com にアクセスしてデータ ソースに接続し、テンプレート ギャラリーを探索することから始めてください。いつもと同じように、質問新機能リクエストをお待ちしています。Data Studio は、私たちの製品であると同時に皆さんの製品でもあるのです。

Cloud Dataprep

データ処理のテクニックやツールは日々進化を遂げていますが、いまだに頭痛の種になっていることがあります。異常値、欠損値、不整合といった問題のある入力データの前処理です。問題をそのままにしてデータを処理すれば、結果にも問題が生じます。しかし、データをクリーニングして前処理するとなると、通常は開発者や専門家のもとで多くの時間と新たなコーディングが必要になります。

私たちはデータの前処理を重要視しており、お客様には BigQueryGoogle Cloud Dataflow などのクラウド データ分析ツールが持つ可能性をフルに引き出していただきたいと考えています。そこで、わかりやすくサーバーレスなビジュアル インターフェースで簡単かつスピーディにデータを前処理できる Google Cloud Dataprep を導入し、このたび正式にリリースしました。

Cloud Dataprep の正式リリース版には、ユーザー コミュニティから頻繁に寄せられたリクエストに沿って複数の新機能が追加されます。これらの新機能は前処理の中心的な作業(データの調査、クリーニング、エンリッチメント)を容易にします。

  • 新しい外観 : Cloud Dataprep のランディング ページがアップデートされ、最新のアクティビティが表示されるようになりました。新規ユーザーでも早く環境に慣れ、第一線で仕事ができるようになるはずです。

LbJ7rjAXFXUPGoCmqUOaQbnSSVrxenSOoteaTtqgI1LIMOuWHJmUxGDJu-qO6DOgy3EojThUOk9WHu1bsbBZPR2jtQqM_OBxbUAy48YIfM7GXbEC2skOLqXOE0iFcbIFpHa_24Ietci0.PNG

  • チーム ベースの前処理のサポート : フローの共有、リアルタイムでのレシピの共同作業、サンプルの再利用、誰が何をしたかを確認する監査証跡のレビューを通じて、チームによる共同作業で前処理に取り組めるようになりました。

DJMIaEXwokDABBgXyFNc6qz2ldjfA5do6DKxa7lDgs2FwhWDrCQyPoZWxX6XwqBNfSVsVePjVMmT2aSkrsPibpdLs_J-iz9nJY3lQ7B178-aemFpkjmvgMsiwZnQYaEmZLDSemYC1e7t.PNG

  • ビジネス アナリストのための強力な機能 : Google スプレッドシート風のピボットやユニオン、ソースとターゲットのスキーマ マッチングの改善、パラメータ ベースのデータセット処理により、ビジネス アナリストの生産性向上に寄与します。

image9oyub.GIF

Cloud Dataprep は、事前定義された数千ものジョブのスケジューリングや、アドホックなデータの前処理などを行う組織に常に使用されています。Foundation for Precision MedicineAlpha VertexUnacastCraveable Brands、Farmlogix などのお客様が、データをより簡単かつ迅速に処理するために Cloud Dataprep を活用しています。

Farmlogix の社長兼 CEO である Linda Mallers 氏は、同社が食品業界にデータを提供していることを説明したうえで、それを処理する Cloud Dataprep のメリットを次のように述べています。「レポート作成は私たちにとって不可分の業務なので、Google Cloud にお願いして私たちのニーズに合った環境にデータを移す作業を手伝ってもらいました。Cloud Dataprep by Trifacta は驚くほどユーザー フレンドリーです。機械学習に基づいたヒントにより、データ ラングリングの人手がかかる部分がかなり削減されました。おかげで私たちは、46 州、521 社の配給業者、10 万を超える農場とベンダーを代表する 1,000 の生産者グループを対象とする包括的な食品購入データの分析とマイニングを可能にしています。地域の持続可能な材料調達とサプライチェーンの新しい考え方を提示できているのはそのためです」

こちらの入門ガイドに従えば、データの調査、クリーニング、エンリッチメントをすぐに始められます。Cloud Dataprep はサーバーレスなので、すでにご利用の方はこれらの新機能をすぐに使用できますし、既存のジョブの変更は不要です。詳細は Cloud Dataprep のリリース ノートをご覧ください。また、ご質問については Stack Overflow の google-cloud-dataprep タグをご利用ください。

得られた知見で未来を見つめましょう

Data Studio および Cloud Dataprep と、フルマネージドで使いやすいエンタープライズ データ ウェアハウスである BigQuery との組み合わせは、Google Cloud のビジネス インテリジェンスマーケティング アナリティクス ソリューションの中核を担う存在です。私たちは今後も皆さんの経験やご意見を参考に機能開発と拡張を続けていきますので、この分野にご注目ください。それと同時に、Cloud Dataprep でお手元のデータの分析や機械学習への対応を行ったり、Data Studio で基幹データの調査と視覚化したりすることをお勧めします。

- By Sudhir Hasbe, Director, Product Management, Google Cloud Platform and Fausto Ibarra, Director of Product Management, Google Marketing Platform