コンテンツに移動
データ分析

Gemini in BigQuery で一般提供が開始された新機能を使ってみる

2024年9月12日
Deepak Dayama

Product Manager, Google Cloud

Honza Fedak

Director of Engineering, Google Cloud

※この投稿は米国時間 2024 年 8 月 29 日に、Google Cloud blog に投稿されたものの抄訳です。

Google 2024 年のデータと AI のトレンドに関するレポートによると、84% の組織が生成 AI によって分析情報へのアクセスが迅速化されると考えています。さらに注目すべきは、技術者ではないユーザーの 52% がすでに生成 AI を活用して価値ある分析情報を引き出しているという点です。

Google のデータクラウドにおける使命は、AI に関する数十年にわたる研究と投資を活かしてデータ マネジメントと分析に変革をもたらし、組織がエクスペリエンスを刷新して、独自のデータに基づいたデータ エージェントを構築できるようにすることです。Google Cloud Next 2024 では、Gemini in BigQuery のプレビュー版をご紹介しました。Gemini in BigQuery は、データの検出と探索、データの準備とエンジニアリング、データ ジャーニーに対応した分析と分析情報の生成に加え、ユーザーの生産性を高め費用を最適化するインテリジェントな推奨事項など、AI を活用したエクスペリエンスを提供します。

Gemini in BigQuery は、当社のクエリ生成プロセスを変革しました。BigQuery へのインテグレーションにより、SQL テンプレートを簡単に生成できるようになったため、重要な ML モデルのモニタリング クエリを含む、ラベルと特徴量エンジニアリングの効率が向上しました。Gemini は複雑なデータ構造を理解し、正確なクエリを実行できるため、ワークフローがこれまで以上にスムーズかつ迅速になりました。」- Julo、最高データ責任者、Martijn Wieriks

このたび、SQL コードの生成と説明、Python コードの生成、データ キャンバス、データ分析情報、パーティショニングとクラスタリングの推奨事項を含むいくつかの Gemini in BigQuery の機能が一般提供となったことをお知らせいたします。

では、Gemini in BigQuery で今すぐ使用できるいくつかの機能について詳しく見てみましょう。

Gemini in BigQuery の特長

Gemini in BigQuery は、ビジネスニーズに合わせて最適化された最先端のモデルにより、データ マネジメントと AI インフラストラクチャ全体に Google の優れた機能を提供します。

  • コンテキスト アウェア: 意図を解読し、目標を理解し、積極的に支援することでワークフローを加速化

  • データが基盤: ビジネスデータの継続的な学習とそれらへの適応を通じて、新たなチャンスを見つけ出すとともに問題を予測

  • 統合されたエクスペリエンス: BigQuery のインターフェースから直接アクセスでき、分析ワークフロー全体でシームレスなエクスペリエンスを提供

データ分析情報を使ってみる

データ分析は、まずデータを検出して、データアセットからどのような分析情報を得られるかを評価するところから始まります。自社のデータに特化した有益な質問のライブラリがあると想像してみてください。それも、自分では考えもつかなかった質問です。データ分析情報は、事前検証済みのすぐに実行できるクエリによって推測を排除し、即時の分析情報を提供します。たとえば、顧客離脱データが含まれるテーブルで作業している場合、データ分析情報により、特定の顧客セグメント内にある離脱に影響する要因を調査するよう促されることがあります。それは、自分では調査しようと思わなかった視点かもしれません。

これらの実用的なクエリは BigQuery Studio に組み込まれているため、必要なときに分析情報を入手して、ワンクリックで分析を進めることができます。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/1._Data_Insights.gif

ワンクリックで実行可能なテーブル用クエリを自然言語の分析情報として提示する Gemini in BigQuery

SQL Python のコード アシスタンスを使用して生産性を向上させる

Gemini for BigQuery は、関連するスキーマやメタデータを参照しながら、わかりやすい自然言語プロンプトを使用して SQL または Python のコードを記述、変更するのにも役立ちます。これにより、コードのエラーや不整合を減らすと同時に、コーディングの経験が少ないユーザーでも複雑で正確なクエリを作成できるようになります。

Gemini in BigQuery のおかげで、当社のデータチームは分析情報をより迅速に提供できるだけでなく、データ パイプラインと分析のサイクル時間も短縮できています。AI を使用した SQL コードの生成とテキスト エンベディングにより生産性が向上したため、影響の大きい取り組みに集中する時間を増やすことができました。最終的には、お客様に行動知能(BI)を提供するという当社の使命の達成を後押ししてくれるでしょう。」- Unerry, Inc.、チーフ データ サイエンティスト、岡安氏

Gemini in BigQuery は、データ内の構造と関係を理解します。そのため、わかりやすい自然言語プロンプトからカスタマイズされたコード提案を受け取ることができます。たとえば、次のように指示することができます。

  • 「テーブル内の各商品の総売り上げを計算する SQL クエリを生成してください。」

  • pandas を使用して、商品の売り上げと購入者レビュー件数を相関させる Python コードを記述してください。」

  • 「登録者タイプ別の平均貸し出し期間を計算してください。」

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/2._SQL_Code_Generation.gif

Gemini in BigQuery を使用した SQL コードの生成

Gemini in BigQuery は、複雑な SQL Python のクエリを理解するのに役立つ説明と分析情報も提供して、あらゆるスキルレベルのユーザーがコードの背後にあるロジックを理解できるようにします。これはとりわけ、SQL Python を使い始めたばかりのユーザーや、不慣れなデータセットを操作するユーザーにとって便利な機能です。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/3._SQL_Code_Explanation.gif

Gemini in BigQuery を使用した SQL コードの説明

自然言語による分析ワークフローの再構築

Gemini in BigQuery には、データ探索、キュレーション、ラングリング、分析、可視化のための革新的な自然言語ベースのインターフェースであるデータ キャンバスが組み込まれています。データ キャンバスを使うと、視覚表現を使用したワークフローを通じてデータ ジャーニーの探索や構築が行えるため、スムーズで直感的なデータ探索と分析が実現します。

「複数のクエリを必要とするあらゆる調査や探索において、データ キャンバスに勝るものはありません。データ キャンバスはチームの時間を節約し、心にゆとりを持たせてくれます。」- Wunderkind、分析担当バイス プレジデント、Scott Schaen

たとえば、小売店全体の収益を分析するために、シンプルな自然言語プロンプトを使用して、POS システムなどのさまざまなソースからデータを収集し、在庫、CRM、外部データと統合して、店舗の場所、商品カテゴリ、収益といった要素間の関係を明らかにしたり、関係者向けのレポート作成やデータの可視化を行ったりできます。これらすべてを、単一のユーザー インターフェース内で実行できます。BigQuery データ キャンバスの詳細については、こちらのブログをご参照ください。また、以下のデモもご覧ください。

https://storage.googleapis.com/gweb-cloudblog-publish/images/image4_V4N4GUB.max-1200x1200.png

分析を最適化して、パフォーマンスと処理速度を向上させる

データ量が増大するにつれ、データ管理者や分析の専門家は、容量の効率的な管理と、クエリ パフォーマンスの改善という課題に直面します。こうした課題に対処するために、Gemini in BigQuery は、AI によるテーブルのパーティショニングとクラスタリングの推奨事項を提供します。これらの推奨事項の目的は、クエリを変更することなくテーブルを最適化し、結果を高速化してクエリ費用を削減することです。

使ってみる

Gemini in BigQuery 機能の一般提供は、本日から数か月にわたって段階的にロールアウトされる予定です。まずは、SQL コードの生成と説明、Python コードの生成、データ キャンバス、データ分析情報、パーティショニングとクラスタリングの推奨事項が一般提供になります。

現時点では、一般提供(GA)機能は追加費用なしですべてのお客様にご利用いただけます。詳しくは、料金の詳細をご覧ください。

-Google Cloud、プロダクト マネージャー Deepak Dayama

-Google Cloud、エンジニアリング担当ディレクター Honza Fedak

投稿先