データ分析に関する今月の新情報: データの金メダルを手に入れる
Google Cloud Japan Team
※この投稿は米国時間 2021 年 8 月 6 日に、Google Cloud blog に投稿されたものの抄訳です。
7 月末に東京でオリンピックが開幕し、私たちは優れた技とスポーツマンシップを祝うために集まった多様な国や文化の美しさを再確認しました。今月のブログでは、データに関する取り組みにおいて新たな高みに到達するためのヒントになる、主要データと分析のパフォーマンスに焦点を当てたいと思います。
それでは要点を見ていきましょう。
BigQuery ML 異常検出: 10 点満点の拡張分析
大規模に異常動作を特定することは、分析戦略の重要な要素です。BigQuery ML を使用すると、単一フレームのデータを処理する場合でも、時系列の進行を処理する場合でも、機械学習のパワーをデータ ウェアハウスに活用できます。
先月初めにリリースされたこのブログでは、BigQuery ML での異常検出に対する非時系列アプローチと時系列アプローチの両方について説明しました。
非時系列の異常検出
オートエンコーダ モデル(公開プレビュー中)
K 平均法モデル(すでに一般提供)
時系列の異常検出
ARIMA_PLUS 時系列モデル(すでに一般提供)
上記のアプローチにより、BigQuery に保存されているデータを使ってすばやく試験運用でき、特定の異常検出のニーズに最適なモデルを特定するのが簡単になります。適切なモデルが特定されたら、そのモデルを Vertex AI プラットフォームに移植してリアルタイムで分析したり、BigQuery でスケジュールしてバッチ処理を継続したりすることが簡単にできます。
アプリ解析: チームワークで勝利
Google は、現代の課題解決を目的としたテクノロジーとサービスの幅広いエコシステムを提供しています。このようなテクノロジーをデータ分析サービスと組み合わせてさらに詳細な分析情報を取得し、新しい機会を見出すことで、最適なソリューションが生まれることがあります。
Firebase はアプリ開発コミュニティで広く採用されており、多くの組織のアプリ戦略で技術的なバックボーンとなっています。今月、Google は、デザイン パターンを発表し、BigQuery と Looker で Crashlytics データ、CRM、問題追跡、サポート データを使用して、アプリの品質を向上させ、カスタマー エクスペリエンスを強化する機会を特定する方法を Firebase のお客様に紹介しました。
BigQuery 上での Crux: オールラウンドなデータ競争で金メダルを獲得
Crux Informatics は、多くの大企業にデータサービスを提供して、お客様がよりスマートなビジネス上の意思決定を行えるように支援しています。同社のサービスはすでに最新のスタックで運用されていて、最新のデータ ウェアハウスを探していませんでしたが、パフォーマンスと最適な価格設定モデルを備えた BigQuery は、魅力的な選択肢になりました。Crux は、ストリーミング分析を可能にする Dataflow などの低コストの取り込みと処理エンジンにも利点を見出しました。
そして、一元化された大規模なデータクラウドを構築する際には、今のデータ ストレージのニーズに合ったソリューションを選ぶだけでは不十分でした。それだけでなく、何千もの企業のデータ配信と運用の巨大なエコシステムをサポートできるよう、今後の取り組みを見据えてソリューションに投資する必要がありました。
Mark Etherington 氏, Crux Informatics 最高技術責任者
テクノロジーはチーム スポーツです。Crux は Google Cloud のサポートチームが迅速に対応し、支援する準備ができていることを知りました。これを受けて Crux は、Google Cloud のデータ分析サービスをより深いレベルで採用したため、絶えず進化し続けるデータ エコシステムを管理し、競争力を維持するための柔軟性を獲得できました。
Crux が BigQuery の採用を決定するまでの経緯について詳しくは、こちらのブログで読むことができます。
Google トレンド: クラシックからチャンピオンが誕生
6 月の Google トレンド データセットのリリースに続いて、そのデータを使用して意思決定を強化する方法の例をいくつか提供しました。
そのデータセットの簡単な要約として、Google Cloud、特に BigQuery では、Nielsen の指定マーケット エリア®(DMA)による上位 25 のトレンド用語へのアクセスを週単位で提供します。これらのトレンド用語は検索パターンに基づいており、これまでは Google トレンド ウェブサイトでのみ利用可能でした。
Google トレンドのデザイン パターンは、店舗の近くの地域のトレンドや、トレンド キーワードと商品をマッチングしてキャンペーンを特定する方法など、いくつかの一般的なビジネス ニーズに対応します。
Dataflow GPU: 高速ストリーミングを支える史上最強のパワー
Dataflow は、バッチワークロードとストリーミング ワークロードの両方をサポートするフルマネージド データ処理プラットフォームです。Dataflow は、無制限データをスケーリングして簡単に管理する機能により、Google Cloud の高速ニーズを伴う大規模なワークロードに最適なストリーミング ソリューションになっています。
しかし、その速さを利用して、高度なユースケースにさらに多くの処理能力を提供できるとしたらどうでしょうか。Google Cloud チームは、NVIDIA とパートナーシップを組んで Dataflow に GPU サポートを追加することで、それを実現しました。これにより、お客様は画像分析や予測などのコンピューティング負荷の高い処理を簡単に加速し、効率と速度を大幅に向上させることができます。
以下の時間をご覧ください。
Data Fusion: データ統合の優れたパフォーマンスを実況中継
Data Fusion を利用すると、Google Cloud のお客様は、あらゆる種類のデータ統合アクティビティを 1 か所で実行できるようになります。ETL や ELT、または単にクラウド アプリケーションと連携する場合でも、Data Fusion は、他の Google Cloud データ システムとの緊密な統合により、クリーンな UI と合理的なエクスペリエンスを提供します。このツールとそれが組織にもたらす機能についての Google チームのレビューをチェックしてください。