コンテンツに移動
データ分析

Google が 2023 年 Forrester Wave: Data Management for Analytics においてリーダーに選出

2023年4月26日
Google Cloud Japan Team

※この投稿は米国時間 2023 年 4 月 18 日に、Google Cloud blog に投稿されたものの抄訳です。

The Forrester Wave™: Data Management for Analytics Q1 2023 において、Google は Forrester Research によりリーダーに選出されました。これは、オープンデータ エコシステム、統合されたデータクラウド サービスや組み込みのインテリジェンスの分野で継続的なプロダクト イノベーションを実現してきた Google のビジョンとその実績の証であると考えています。

競争圧力と経済的圧力を制するために、組織は利用可能な膨大な量のデータを利用して情報に基づく意思決定を行い、ビジネス プロセスの効率を改善し、イノベーションを促進しようと模索しています。しかしながら、データ、ワークロード、ユーザーの量や種類が飛躍的に増加するなかで、データが秘める可能性を最大限に活用することはお客様の成功の実現には不可欠であると同時に、至難の業でもあります。Google はこの課題に真摯に向き合い、Forrester Wave におけるリーダーとしてふさわしい取り組みをしていく所存です。

The Forrester Wave: Data Management for Analytics, Q1 2023 レポート(無料)のダウンロードはこちらから。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image1_UmllZoe.max-600x600.png

このレポートの中で Forrester は、事前に定義された基準に照らして Data Management for Analytics(DMA)のプロバイダ 14 社が現在提供しているサービスと戦略の評価を実施しました。Google はリーダーに選出されただけでなく、ロードマップ実行能力、パフォーマンス、スケーラビリティ、データ セキュリティ、可視化など、11 の異なる評価基準で最高スコアを獲得しました。

Google は標準 SQL を使用する数百ペタバイトもの規模までスケール可能な、フルマネージドかつサーバーレスの [Data Management for Analytics] ソリューションを提供します。

The Forrester Wave™: Data Management for Analytics, Q1 2023

British TelecomVodafoneCarrefour など、世界中の何万もの企業が Google Cloud と提携し、オープンかつインテリジェントな統合型データ エコシステムによりイノベーションを促進しています。

統合されたデータ マネジメント

Google は、統合されたデータ プラットフォームを提供しているため、組織はデータ ライフサイクルのあらゆる段階を管理できます。これは、データ ウェアハウスやデータレイクにわたって分析ワークロードを管理するアプリケーションのためのオペレーショナル データベースの実行から、データドリブンな意思決定、AI や ML にまで至ります。Google 独自のプラットフォーム設計により、データ、人、ワークロードの集約が可能になります。Google のデータベースは、スケーラビリティに優れた分散ストレージ上に構築されており、完全に分散されたリソースと、Google 所有の高性能なグローバル ネットワークが用意されています。この組み合わせにより、Cloud SpannerCloud BigtableAlloyDB for PostgreSQLBigQueryDataprocDataflow といったデータクラウド プロダクト全体にわたり緊密に統合されたデータクラウド サービスを提供できます。

この 1 年間、Google はこうしたインテグレーションをさらに強化し、お客様が容易にイノベーションを加速できるようないくつかの機能をリリースしました。

  • トランザクションと分析プラットフォームの統合。変更ストリームを使用すると、お客様は SpannerBigtable データベースに対する書き込み、更新、削除を追跡し、BigQueryPub/SubCloud Storage などのダウンストリーム システムにレプリケートできます。Datastream for BigQuery は一般提供が開始され、AlloyDB、PostgreSQL、MySQL、Oracle などの運用データベース ソースから BigQuery に簡単に直接レプリケートし、ELT(抽出、読み込み、変換)パイプラインを設定することが可能になり、低レイテンシのデータ レプリケーションによってリアルタイムのインサイトを入手できるようになりました。

  • あらゆるタイプのデータの統合。BigLake を使用すると、お客様はあらゆるタイプのデータを使い、あらゆる場所で作業できるようになります。これにより、新しいテーブルタイプであるオブジェクト テーブルの実現が可能になりました。このテーブルタイプでは、非構造化データ向けに構造化されたインターフェースが提供されます。オブジェクト テーブルにより、お客様は画像、音声、ドキュメントに対してネイティブな分析や ML が実行できるようになり、世界中のデータチームに変革をもたらしています。データチームは、統合された 1 つの環境ですべてのデータを使用しながら制限のないイノベーションを実現しています。

  • ワークロードの統合。Google は、SQL 以外の言語でのプログラミングが必要なワークロード用の新しいデベロッパー拡張機能を導入しています。Apache Spark 用 BigQuery ストアド プロシージャを使用することで、お客様は直接、BigQuery 内から Spark プログラムを実行し、変換と取り込みを統合して、Spark のプロシージャを一連の SQL ステートメントのステップとして実行できるようになります。この統合により生産性が向上し、お客様は Spark ジョブの所要時間と消費されたリソースに対してのみ費用を支払うため、料金と請求の面でメリットが生じます。

データクラウド費用をさらに細かく管理できるよう、Google は BigQuery Editions を Standard、Enterprise、Enterprise Plus の 3 つの料金設定でご案内しています。個々のワークロードに合ったエディションを好きな組み合わせで選び、適切なコスト パフォーマンスを実現できます。

BigQuery Editions には、2 つのイノベーションが含まれています。1 つ目は、コンピューティング容量の自動スケーリングです。ワークロードの需要に応じてコンピューティング リソースをきめ細かくリアルタイムで管理できるようになり、費用は使用するコンピューティング容量分のみ発生します。2 つ目は、物理バイト課金です。高圧縮後のデータ ストレージ分のみ費用が発生するようになりました。圧縮ストレージの料金設定により、データ使用量の増加とストレージ費用の削減が同時に実現します。

オープンデータ エコシステム

Google Cloud は、業界屈指のオープンソースとオープン API のインテグレーションを提供しており、ポータビリティと柔軟性を確保し、ベンダー ロックインのリスクも軽減しています。Google は、PayPal、HSBC、Vodafone、Walmart をはじめ、その他数百のお客様が、データクラウドのトランスフォーメーションに向けた取り組みを加速するために、一連の Google 移行サービスをより一層、活用している様子を目の当たりにしています。たとえば、BigQuery Migration Service は、数百ものお客様が従来型データ ウェアハウスに含まれる 900 万を超えるコード ステートメントを BigQuery へ自動的に変換するのをサポートしました。また、包括的な Database Migration Program は適切な専門知識、評価、資金援助を提供して、クラウドへの移行の迅速化を実現します。お客様は PostgreSQL、MySQL、Redis といった最も一般的なオープンソース エンジンと完全互換性のあるマネージド サービスを活用することも可能です。

それだけではありません。Google は、他のクラウド内のデータに対する分析情報が取得でき、分析、ガバナンス、セキュリティが 1 つの画面上に集結された BigQuery Omni も提供しています。

Google は、これからも Google Cloud がデータの可能性を最大限に引き出し、デジタル トランスフォーメーションの障壁を取り除く最もオープンなデータクラウドであり続けられるように尽力していきます。この分野での最新のリリースにより実現可能になったことを一部ご紹介します。

  • PostgreSQL 環境のモダナイズ。Google は、AlloyDB Omni のテクノロジー プレビュー版を発表しました。AlloyDB Omni は、オンプレミス、エッジ、さまざまなクラウド環境、さらにはデベロッパーのノートパソコンでも実行できるように設計された AlloyDB のダウンロード版です。また、Database Migration Program の一環として、新ツール Database Migration Assessment(DMA)もご紹介しました。この新しいツールは、AlloyDB または Cloud SQL といった Google の PostgreSQL データベースへの移行に必要なプロセスを記したわかりやすいレポートを提供します。

  • オープン形式のデータレイクを構築。データのオープン性を支援するため、Google はデータレイクとデータ ウェアハウスを統合してデータサイロを解消する BigLake の一般提供を発表しました。BigLake のイノベーションでは、データレイクのオープンソース テーブル形式の標準になりつつある Apache Iceberg のサポートが追加されています。また、近日中に Delta Lake や Hudi などの形式もサポートする予定です。

  • データのある場所で分析を実行。データの保存場所に関係なく分析できるようにするため、Google は BigQuery Omni をリリースしました。先日、クロスクラウド転送やクラウド間での大量のクエリ結果の操作といった新機能を追加し、クラウド環境間でのデータの結合や分析を簡単に行えるようにしました。

同時に Google は、データクラウド パートナーのエコシステムの大幅な拡大を行い、さまざまな新しい領域におけるパートナー関連の投資を増やしています。今日では、900 以上のソフトウェア パートナーが Google のデータクラウドを使用してサービスを構築し、50 以上のデータ プラットフォーム パートナーが Google Cloud Ready - BigQuery の取り組みを通じて検証済みのインテグレーションを提供しています。Starburst といったパートナーは、BigQuery や Dataplex とのインテグレーションを強化し、データレイク、マルチクラウド、ハイブリッド クラウドなどのソースを含めデータの保存場所を問わず分析を可能にしています。

組み込みのインテリジェンス

AI は、Google の DNA に刻み込まれていると言っても過言ではないでしょう。Google はこの 20 年間、世界の情報を整理してあらゆる人々や企業に役立てるために AI の力を活用してきました。ML による検索アルゴリズムのパフォーマンス強化から、教師なし学習による YouTube のおすすめコンテンツの改良まで、市場で最も困難な課題の解決に絶えず AI を活用しています。

BigQuery ML では既存の SQL ツールやスキルで機械学習を使用できるため、データ アナリストも ML を簡単に利用できます。その使用率は 2022 年に 200% 以上増加しました。2019 年に BigQuery ML が一般提供されて以来、何億もの予測クエリやトレーニング クエリが実行されました。

Google は、今後も AI 技術において進化を続け、よりインテリジェントなデータクラウド サービスをお届けできるように努めます。ここでは、最近寄せられた事例をいくつかご紹介します。

  • BigQuery 推論エンジン。Google は、BigQuery ML 推論エンジンを発表しました。このエンジンにより、BigQuery で一般的なモデル形式を使用して予測を直接実行できるだけでなく、リモートでホストされるモデルや、Google の最先端の事前トレーニング済みモデルを使用して予測を実行することもできます。

  • データベース システムの最適化。Cloud SQL RecommenderAlloyDB Autopilot などの機能により、データベース管理者や DevOps チームが大規模なデータベース フリートのパフォーマンスと費用を容易に管理できるようにします。

  • データベースと AI のインテグレーション。Google は、AI や ML をプロダクトに取り入れることに加え、ML の経験を簡略化するために、SpannerAlloyDBBigQueryVertex AI に緊密に統合してきました。こうしたインテグレーションにより、AlloyDB や Spanner のユーザーは、SQL を使用してデータベース トランザクション内でモデルの推論を直接、行えるようになっています。

  • 簡略化した ML Ops。BigQuery ML を使用して BigQuery 内で作成されたモデルが、Vertex AI Model Registry に即座に表示されるようになりました。その後、これらのモデルを Vertex AI エンドポイントに直接デプロイして、リアルタイムで提供します。BigQuery ML と Vertex AI が統合されたことにより、Vertex AI Pipelines を使用してモデルのモニタリングとトレーニングを行い、予測の詳細な説明を表示することが可能となります。

もちろん、これらはすべて極めて要求の厳しいワークロードに対応することを想定して構築されたインフラストラクチャで提供されます。Google Cloud データベースと分析ソリューションは、大規模な運用に定評があります。たとえば、Spanner であれば毎秒 20 億のリクエストに常時対応していますし、BigQuery のお客様は毎秒 100 テラバイト以上のデータを分析しています。

Google は、お客様のデジタル トランスフォーメーションの実現に向けて今後も引き続きお客様とともにイノベーションを創出し、Forrester Wave™: Data Management for Analytics 2023 年 のリーダーとしてふさわしい役割を果たしたいと考えています。

Forrester Wave™: Data Management for Analytics, Q1 2023 レポート(無料)のダウンロードはこちらから。

Google Cloud ソリューションを使用して組織がデータクラウドを構築する方法についてご確認ください。


- プロダクト マネジメント担当シニア ディレクター Dave Nettleton
投稿先