Google Cloud Next Tokyo:7/30、31 東京ビッグサイトにて開催!

データ サイエンス ソリューション

AI ワークフローのためのデータ、分析、ML の統合プラットフォーム

複雑な処理を統合されたデータと AI のプラットフォームに集約することで、データチームの負担を軽減します。Google Cloud の包括的なマネージド サービス スイートと統合されたワークフローにより、データ サイエンス ソリューションの構築、管理、スケーリングが容易になります。

概要

データ サイエンス ソリューションとは

データ サイエンス ソリューションは、ML、AI、統計モデリングを活用してビジネスの複雑な課題を解決し、業務効率を向上させる、テクノロジー主導の包括的なアプローチです。これにより、基本的なデータ分析から、ライフサイクル全体にわたるエンタープライズレベルでの実行へと焦点が移り、データ エンジニアリング、予測モデリング、MLOps のコアプロセスが強調され、元データを自動化された戦略的優位性へと転換します。

Google Cloud がデータ サイエンスに使われる理由

ビジネスのスピードとアジリティを向上させ、短期的および長期的な価値を提供します。 従来のアプローチでは、5 ~ 7 個のツールを組み合わせて使用する必要があることがよくありますが、Google Cloud のデータ サイエンス プラットフォームは、データの取り込みからモデルのデプロイまで、ライフサイクル全体を単一のマルチモーダル データ基盤でカバーし、統合されたガバナンスを確保します。

あらゆるビジネス課題に対応するデータ サイエンス ソリューション

収益の拡大、費用の削減、リスクの管理など、目標が何であれ、Google Cloud はデータモデルの本番運用を実現し、孤立した実験から実運用の MLOps パイプラインへの移行を支援するツールを提供します。

仕組み

  • パーソナライズと意思決定の迅速化: リアルタイムの AI / ML でカスタマー エクスペリエンスを向上
  • フルスタックのエンタープライズ統合: ライフサイクル全体を通じた堅牢な実行により、オープンソース AI を本番環境にデプロイ
  • スケーラブルなデータ処理: 統合された単一のデータコピー上で、BigQuery SQL や Spark などの複数のエンジンを活用

データ サイエンスの実践ガイド
このガイドでは、Google Cloud でのデータ サイエンス ワークフローの開始方法を紹介します
一般的な使用例

エンドツーエンドのデータ サイエンス ワークフローに対応した統合プラットフォーム

マルチモーダル データ基盤上に構築された、データ サイエンスと ML のライフサイクル全体をカバーし、統合ガバナンスを確保する統合ソリューション

BigQuery SQL や Apache Spark などの強力な分析エンジンを活用し、BigQuery ML または Gemini Enterprise Agent Platform を使用してモデルを構築しましょう。業界をリードする AI を活用した堅牢な MLOps と、AI ファーストの Colab Enterprise ノートブックで開発が簡素化されます。

データ サイエンス向けの統合ツール
    マルチモーダル データ基盤上に構築された、データ サイエンスと ML のライフサイクル全体をカバーし、統合ガバナンスを確保する統合ソリューション

    BigQuery SQL や Apache Spark などの強力な分析エンジンを活用し、BigQuery ML または Gemini Enterprise Agent Platform を使用してモデルを構築しましょう。業界をリードする AI を活用した堅牢な MLOps と、AI ファーストの Colab Enterprise ノートブックで開発が簡素化されます。

    データ サイエンス向けの統合ツール

      AI ファーストのノートブックを備えた一元化されたワークスペース

      エンタープライズ データ サイエンス向けノートブック ソリューション スイートから選択

      Colab Enterprise は、Gemini Enterprise Agent Platform および BigQuery と統合された安全なマネージド環境を提供します。Workbench では、カスタマイズ可能な JupyterLab インスタンスを利用でき、Cloud Workstations ではフル IDE が利用できます。さらに、拡張機能では、セルフホスト型のツールを Google Cloud サービスに直接接続できます。

      Gemini Enterprise Agent Platform での Colab Enterprise の概要
        エンタープライズ データ サイエンス向けノートブック ソリューション スイートから選択

        Colab Enterprise は、Gemini Enterprise Agent Platform および BigQuery と統合された安全なマネージド環境を提供します。Workbench では、カスタマイズ可能な JupyterLab インスタンスを利用でき、Cloud Workstations ではフル IDE が利用できます。さらに、拡張機能では、セルフホスト型のツールを Google Cloud サービスに直接接続できます。

        Gemini Enterprise Agent Platform での Colab Enterprise の概要

          データ サイエンス エージェントの統合

          データの探索、変換、ML モデリングを容易にするエージェント機能によるデータ サイエンス開発の加速

          平易な英語で大まかな目標を提示すると、データ サイエンス エージェントが、データの読み込み、探索、クリーニング、可視化、特徴量エンジニアリング、データの分割、モデルのトレーニング / 最適化、評価など、データ サイエンス モデリングのあらゆる要素を網羅する詳細なプランを生成します。

          データ サイエンス エージェント
            データの探索、変換、ML モデリングを容易にするエージェント機能によるデータ サイエンス開発の加速

            平易な英語で大まかな目標を提示すると、データ サイエンス エージェントが、データの読み込み、探索、クリーニング、可視化、特徴量エンジニアリング、データの分割、モデルのトレーニング / 最適化、評価など、データ サイエンス モデリングのあらゆる要素を網羅する詳細なプランを生成します。

            データ サイエンス エージェント

              AI を活用したデータ準備、サイロなし

              統合されたデータ基盤を活用することで、構造化データと非構造化データ(画像、ドキュメントなど)の両方を、SQL による分析と AI 関数による処理を使用して管理

              AI を活用したデータ準備機能によって、データのクリーニングと変換のための提案が得られます。また、データ エンジニアリング エージェントでは、自然言語の指示を通じて、取り込みやパイプラインの作成などのデータ エンジニアリング タスクを自動化できます。

              データ エンジニアリング エージェント
                統合されたデータ基盤を活用することで、構造化データと非構造化データ(画像、ドキュメントなど)の両方を、SQL による分析と AI 関数による処理を使用して管理

                AI を活用したデータ準備機能によって、データのクリーニングと変換のための提案が得られます。また、データ エンジニアリング エージェントでは、自然言語の指示を通じて、取り込みやパイプラインの作成などのデータ エンジニアリング タスクを自動化できます。

                データ エンジニアリング エージェント

                  複数のエンジンによる柔軟なデータ処理

                  統合されたデータのコピー

                  BigQuery の SQL エンジンでも、Apache Spark などのオープンソース フレームワークでも、任意の処理エンジンを選択して、単一の統合されたデータコピーを直接操作できます。これにより、システムごとに個別のデータコピーを保持する必要がなくなります。

                  マネージド Dataproc とサーバーレス Spark
                    統合されたデータのコピー

                    BigQuery の SQL エンジンでも、Apache Spark などのオープンソース フレームワークでも、任意の処理エンジンを選択して、単一の統合されたデータコピーを直接操作できます。これにより、システムごとに個別のデータコピーを保持する必要がなくなります。

                    マネージド Dataproc とサーバーレス Spark

                      Python 用 BigQuery DataFrames でデータ サイエンスをスケーリング

                      Python ネイティブ ライブラリを使いたい方へ

                      BigQuery DataFrames は、Python コードを最適化された SQL に変換して BigQuery エンジンで実行できる、pandas 的な API を提供します。これにより、SQL、PySpark、pandas スタイルの DataFrame など、用途に応じて適切なツールを柔軟に選択しながら、同じ基盤データを処理できます。

                      Python 用 BigQuery DataFrames でデータ サイエンスをスケーリング
                        Python ネイティブ ライブラリを使いたい方へ

                        BigQuery DataFrames は、Python コードを最適化された SQL に変換して BigQuery エンジンで実行できる、pandas 的な API を提供します。これにより、SQL、PySpark、pandas スタイルの DataFrame など、用途に応じて適切なツールを柔軟に選択しながら、同じ基盤データを処理できます。

                        Python 用 BigQuery DataFrames でデータ サイエンスをスケーリング

                          ML モデルの構築、トレーニング、チューニング、実行

                          BigQuery ML で SQL を使用してモデルを構築、トレーニング、評価、デプロイできるため、データ移動が不要

                          組み込みの事前トレーニング済みモデルや、Gemini を呼び出す SQL 関数を利用して、データを分析したり拡充したりできます。カスタムモデルの場合、Agent Platform は PyTorch、TensorFlow、その他の ML ライブラリをサポートしています。シームレスな統合により、BigQuery での特徴量エンジニアリング、Agent Platform でのカスタムモデルのトレーニング、SQL を使用した BigQuery での推論が可能になります。

                          BQML
                            BigQuery ML で SQL を使用してモデルを構築、トレーニング、評価、デプロイできるため、データ移動が不要

                            組み込みの事前トレーニング済みモデルや、Gemini を呼び出す SQL 関数を利用して、データを分析したり拡充したりできます。カスタムモデルの場合、Agent Platform は PyTorch、TensorFlow、その他の ML ライブラリをサポートしています。シームレスな統合により、BigQuery での特徴量エンジニアリング、Agent Platform でのカスタムモデルのトレーニング、SQL を使用した BigQuery での推論が可能になります。

                            BQML

                              統合された MLOps でモデルから本番環境へ

                              BigQuery と Gemini Enterprise Agent Platform の統合による MLOps の効率化

                              Gemini Enterprise Agent Platform Feature Store で特徴量を一元化し、トレーニングとサービングのスキューや冗長な作業を防止できます。また、AutoML を使用すると、表形式データのモデル構築を自動化できます。BigQuery ML のモデルでも Gemini Enterprise Agent Platform のモデルでも、すべてのモデルがプラットフォームの Model Registry に自動的に登録されます。これを基に、簡単にバージョン管理、評価、デプロイを行え、単一のプラットフォームでシームレスなエンドツーエンドのライフサイクルを構築できます。

                              MLOps を使用したエンドツーエンドのワークフロー
                                BigQuery と Gemini Enterprise Agent Platform の統合による MLOps の効率化

                                Gemini Enterprise Agent Platform Feature Store で特徴量を一元化し、トレーニングとサービングのスキューや冗長な作業を防止できます。また、AutoML を使用すると、表形式データのモデル構築を自動化できます。BigQuery ML のモデルでも Gemini Enterprise Agent Platform のモデルでも、すべてのモデルがプラットフォームの Model Registry に自動的に登録されます。これを基に、簡単にバージョン管理、評価、デプロイを行え、単一のプラットフォームでシームレスなエンドツーエンドのライフサイクルを構築できます。

                                MLOps を使用したエンドツーエンドのワークフロー

                                  Google Cloud で次のステップへ

                                  $300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

                                  開始にあたりサポートが必要な場合

                                  データ探索から MLOps まで、データ サイエンスに関する Google Cloud のリソースをご確認ください。

                                  ML ワークフロー全体を通じて、カスタム トレーニング モデルを開発する方法をご覧ください。

                                  段階的な説明、チュートリアル、実践的なコーディングを通じて、Google Cloud を試してみましょう。

                                  ビジネスケース

                                  成果主導の成功


                                  もっと見る

                                  レガシーからクラウドへ: PySpark から BigQuery DataFrames に移行した Deutsche Telekom の事例

                                  詳細

                                  「数か月から数分へ: AI を活用して 2,000 万件以上のユーザーレビューをインサイトに変換」

                                  詳細

                                  リアルタイムの AI / ML を活用して、パーソナライズされたカスタマー エクスペリエンスと効率的な運用を実現

                                  今すぐ見る

                                  • Deutsche Telekom のロゴ
                                  • Mattel のロゴ
                                  • Flipkart 社のロゴ
                                  • Snap のロゴ
                                  • Wayfair ロゴ
                                  業界における役割

                                  データ サイエンス チームのあらゆる役割に対応

                                  業界における役割

                                  よくある質問

                                  データ サイエンティストと ML エンジニア向け

                                  Colab Enterprise ノートブック、PyTorch や TensorFlow などのフレームワークのサポート、BigQuery DataFrames を通じて、デベロッパー エクスペリエンスを重視しています。チームはプロジェクト間でノートブック、データ接続、コンピューティング リソースを共有できるため、Google Cloud は真にコラボレーション可能なデータ サイエンス プラットフォームとなります。

                                  費用対効果とガバナンスを最大化します。統合プラットフォームは、組み込みのガバナンスにより、ツールの無秩序な増加とベンダー費用を削減します。モデルは、専任の MLOps チームを設けることなく、ノートブックから本番環境へとそのまま移行でき、こうした 3 倍 / 4 倍 / 10 倍のパフォーマンス向上を実現します。

                                  統合と柔軟性のメリットを活用できます。オープンソースの互換性(Apache Spark、Airflow、Kafka)と 1 つのデータコピーでのマルチエンジン処理をサポートしているため、フレームワークにおけるベンダー ロックインを回避できます。

                                  • Google Cloud プロダクト
                                  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
                                  Google Cloud