Google Cloud でのデータ サイエンス

データ マネジメント、分析、ML のツールを統合したプラットフォームで、データから AI へのワークフローを加速。

Google Cloud でのデータ サイエンスの実践ガイド

事例のご紹介

Google Cloud がデータ サイエンスに使われる理由

Google Cloud 統合データ / AI プラットフォーム

ビジネスのスピードとアジリティを向上させ、短期的および長期的な価値を提供します。

3 倍


データ移動を最小限に抑えて費用効率を向上

4 倍


モデルのトレーニング、ファインチューニング、デプロイを高速化

10 倍


AI の費用を削減、より達成可能な ROI 目標を設定

データ サイエンス向けの統合ツール

エンドツーエンドのデータ サイエンス ワークフローに対応した統合プラットフォーム

マルチモーダル データ基盤上に構築されたデータ サイエンスと ML のライフサイクル全体を対象とする統合ソリューションで、統合ガバナンスを確保できます。BigQuery SQL や Spark などの強力な分析エンジンを活用し、BigQuery ML または Vertex AI を使用してモデルを構築しましょう。業界をリードする AI を活用した堅牢な MLOps と、AI ファーストの Colab Enterprise ノートブックで開発が簡素化されます。

AI ファーストのノートブックを備えた一元化されたワークスペース

エンタープライズ データ サイエンス向けのノートブック ソリューション スイートから、ニーズに合わせた選択ができです。Colab Enterprise は、Vertex AI および BigQuery と統合された安全なマネージド環境を提供します。Vertex AI Workbench では、カスタマイズ可能な JupyterLab インスタンスを利用でき、Cloud Workstations はフル IDE がサポートします。さらに、拡張機能では、セルフホスト型のツールを Google Cloud サービスに直接接続できます。

データ サイエンス エージェント

データ サイエンス エージェントの統合

データの探索、変換、ML モデリングを容易にするエージェント機能で、データ サイエンス開発を加速しましょう。平易な英語で大まかな目標を提示すると、データ サイエンス エージェントが、データの読み込み、探索、クリーニング、可視化、特徴量エンジニアリング、データの分割、モデルのトレーニング / 最適化、評価など、データ サイエンス モデリングのあらゆる要素を網羅する詳細なプランを生成します。

AI を活用したデータ準備、サイロなし

統合されたデータ基盤を活用することで、構造化データと非構造化データ(画像、ドキュメントなど)の両方を、SQL による分析と AI 関数による処理を使用して管理します。AI を活用したデータ準備機能によって、データのクリーニングと変換のための提案が得られます。また、データ エンジニアリング エージェントでは、自然言語の指示を通じて、取り込みやパイプラインの作成などのデータ エンジニアリング タスクを自動化できます。

データ エンジニアリング エージェント
マネージド Dataproc とサーバーレス Spark

複数のエンジンによる柔軟なデータ処理

BigQuery の SQL エンジンでも、Apache Spark などのオープンソース フレームワークでも、任意の処理エンジンを選択して、単一の統合されたデータコピーを直接操作できます。これにより、システムごとに個別のデータコピーを保持する必要がなくなります。

Python 用 BigQuery DataFrames でデータ サイエンスをスケーリング

Python ネイティブ ライブラリを活用したいユーザーにも最適です。BigQuery DataFrames は、Python コードを最適化された SQL に変換して BigQuery エンジンで実行できる、pandas 的な API を提供します。これにより、SQL、PySpark、pandas スタイルの DataFrame など、どれでも適切なツールを柔軟に使用して、同じ基盤データを処理できます。

BigQuery DataFrames の動画
BQML

ML モデルの構築、トレーニング、チューニング、実行

BigQuery ML で SQL を使用してモデルを構築、トレーニング、評価、デプロイできるので、データ移動が省略されます。組み込みの事前トレーニング済みモデルや、Gemini を呼び出す SQL 関数を利用して、データを分析したり拡充したりできます。カスタムモデルの場合、Vertex AI は PyTorch、TensorFlow、その他の ML ライブラリをサポートしています。シームレスな統合により、BigQuery での特徴量エンジニアリング、Vertex AI でのカスタムモデルのトレーニング、SQL を使用した BigQuery での推論が可能になります。

エンベディングを生成してベクトル検索を有効にする

マルチモーダル エンベディングを生成して使用し、ベクトル検索を実行することで、マルチモーダル データのセマンティック理解と類似性に基づく検索が可能になります。これにより、個別の専用ベクトル データベースを管理することなく、高度なセマンティック検索、レコメンデーション、セグメンテーション システムを構築できます。

エンべディングおよびベクトル検索

統合された MLOps でモデルから本番環境へ

BigQuery と Vertex AI が統合され、MLOps の「ラストワンマイル」が効率化されます。Vertex AI Feature Store で機能が一元化され、トレーニングとサービングのスキューや冗長な作業を防止できます。また、Vertex AI AutoML を使用すると、表形式データのモデル構築を自動化できます。BigQuery ML のモデルでも Vertex AI のモデルでも、すべてのモデルが Vertex AI Model Registry に自動的に登録されます。これを基に、簡単にバージョン管理、評価、デプロイを行え、単一のプラットフォームでシームレスなエンドツーエンドのライフサイクルを構築できます。


  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud