データ サイエンティスト向けツール

ビッグデータと機械学習用のサーバーレス インフラストラクチャと使いやすいサービスやツール

サイエンティスト向け GCP データの画像

トレーニング用データの保存、処理、準備が簡単にでき、規模を問わずあらゆるデータに機械学習モデルを導入できます。Google のフルマネージド サービスとオープンソース ソフトウェアを利用すれば、データ サイエンティストもデータ エンジニアも、クラスタの処理に煩わされることなく、データを実用的な情報に変換する作業に専念できます。

学ぶ

コースや資料を検索して、データ サイエンスと機械学習に関する知識を増やしましょう。

Google の AI 教育

Google の機械学習のエキスパートが発信する情報や演習を活用してスキルの向上を図り、プロジェクトを前進させることができます。

Kaggle Learn

抽象的な説明よりも実践的なデータスキルを重視したコースで機械学習とデータ サイエンスの知識を身に付けられます。登録は無料です。

Qwiklab

実践演習でクラウドの技術とソフトウェアの操作を学習できます。

Google Cloud トレーニング

ビッグデータ ソリューションの設計、構築、分析、改善を担当するデータ プロフェッショナルを対象とした各種コースをご用意しています。

Coursera

実践的なデータを使用した包括的な ML 実習を通じて Google Cloud の機械学習を習得できます。

プロトタイプ

Google Cloud での迅速なプロトタイプ作成に役立つ、さまざまなツールやサンプルをご用意しています。
Colaboratory

Colaboratory

Colaboratory は、機械学習の教育や研究の促進を目的とした Google 研究プロジェクトです。これは無料で使える設定不要の Jupyter Notebook 環境で、すべてがクラウド上で実行されます。Colaboratory のノートブックは、Google ドキュメントや Google スプレッドシートと同じように共有できます。

クイックスタートに移動 
Cloud Datalab

Cloud Datalab

Google Cloud Platform でデータを探索、分析、変換、可視化して機械学習モデルを構築するためのツールです。Cloud Datalab は Compute Engine で動作し、複数のクラウド サービスと簡単に接続できます。

詳細 
ドキュメントを見る 
一般公開データセット

公開データセット

Google エンジニアがキュレートし、世界中のさまざまな分野の専門家がサポートする公開データのリポジトリです。これらのデータは、デプロイに先立つアルゴリズムの構築とテストに使用することも、他のデータセットとの結合による新しい分析情報の生成に使用することもできます。データは BigQuery と Cloud Storage でホストされるため、データに基づく構築もデータの使用も簡単です。

ドキュメントを見る 
Kaggle

Kaggle

Kaggle には、Python と R のコードを作成できる Kernel と呼ばれるブラウザ環境があり、無料で使用できます。何千もの一般公開データセット、コミュニティに所属するデータ サイエンティストが作成したサンプルコード、コラボレーション機能にシームレスにアクセスできます。

リポジトリを検索する 
一般公開データセットを参照する 
Jupyter

Jupyter

Google Cloud のフルマネージド ビッグデータ スタックと Jupyter ノートブックを組み合わせて使用すれば、面倒なインフラ設定なしで、おなじみのデータ サイエンス エクスペリエンスを実現できます。

ブログを読む 
チュートリアルを確認する 
Cloud Deep Learning

Cloud Deep Learning VM Image ベータ版

Deep Learning VM Image は、TensorFlow、scikit-learn、PyTorch といった一般的な機械学習フレームワーク向けに事前構成された Compute Engine イメージです。

ドキュメントを見る 

作成

データの取り込みからモデルのトレーニングに至るプロセスを効率化する各種ツールをご用意しています。

取り込み

Cloud Pub/Sub

Cloud Pub/Sub

Cloud Pub/Sub は、大規模なストリーム分析システムとイベント駆動型コンピューティング システム向けの、シンプルで信頼性の高いスケーラブルな基盤です。Google Cloud のストリーム分析ソリューションの一部をなすこのサービスは、イベント ストリームを取り込み、Cloud Dataflow に配信して処理を行うほか、データ ウェアハウジング ソリューションである BigQuery に配信して分析を行います。

ドキュメントを見る 
GitHub に移動 

処理

Cloud Dataflow

Cloud Dataflow

信頼性と表現力を損なうことなく、ストリーミング モードやバッチモードで取り込んだデータを変換または拡張します。

ドキュメントを見る 
クイックスタートに移動 
Cloud Dataprep

Cloud Dataprep

Cloud Dataprep は、分析用の構造化データと非構造化データを視覚的に探索、クリーニング、準備できるインテリジェント データ サービスです。Cloud Dataprep はサーバーレスで、規模に関係なく稼働します。デプロイや管理が必要なインフラストラクチャはありません。

ドキュメントを見る 
クイックスタートに移動

保存

BigQuery

BigQuery

BigQuery は、毎秒 100,000 行のストリーミング挿入をサポートし、標準 SQL を使用したリアルタイム データに関するアドホック分析を可能にするフルマネージドのデータ ウェアハウス サービスです。

チュートリアルを見る 
クイックスタートに移動 
Cloud Storage

Cloud Storage

Cloud Storage は、モデル トレーナー、トレーニング データ、保存済みモデル、予測の入出力データを保存する場所として使用できます。

ドキュメントを見る 
クイックスタートに移動 

探索

BigQuery

BigQuery

データのコピーや移動を行うことなく、データから迅速に分析情報を得ることができます。BigQuery は、それ自身のカラム型マネージド ストレージに加え、Cloud Storage、Cloud Bigtable、Google スプレッドシート、Google ドライブに保存されているデータをシームレスにクエリし、データの全体像を把握することを可能にします。

チュートリアルを検索 
クイックスタートに移動 
Cloud Datalab

Cloud Datalab

Cloud Datalab は Jupyter(旧 iPython)上に構築された対話型ツールで、Google Cloud Platform でデータを探索、分析、変換、可視化して機械学習モデルを構築するために作成されたものです。Compute Engine 上で動作し、さまざまなクラウド サービスに簡単に接続できるため、データ サイエンティスト本来の仕事に専念できます。

クイックスタートに移動 
チュートリアルを起動する 
Cloud ML Engine

Cloud ML Engine

TensorFlow、XGBoost、scikit-learn のカスタム機械学習モデルを使用してイベント ストリームを実行することにより、インテリジェンスの新たなレイヤをパイプラインに追加します。

トレーニングの概要を見る 
TensorFlow

TensorFlow

TensorFlow™ は高性能数値計算用のオープンソース ソフトウェア ライブラリです。アーキテクチャが柔軟なため、各種プラットフォーム(CPU、GPU、TPU)はもちろん、デスクトップからサーバー クラスタ、モバイル デバイス、エッジデバイスに簡単に演算機能を導入できます。

ドキュメントを見る 
機械学習集中講座を受講する 
ハードウェア アクセラレータ

ハードウェア アクセラレータ

Google Cloud のハードウェア アクセラレータには、ML ワークロードを実行したときの費用対効果が最も高くなる最適なアクセラレータを選択できる柔軟性があります。トレーニングや予測を行うワークロードを実行するアクセラレータをポートフォリオの中からお選びください。

Cloud TPU 
Cloud GPU 
Cloud CPU 
Facets

Facets

Facets には、機械学習データセットの理解と分析に役立つ 2 つの堅牢な可視化機能があります。Facets Overview ではデータセットの特徴それぞれの形状を把握し、Facets Dive では個々のデータセットを詳細に分析します。

Facets の詳細 

デプロイ

環境を選ばず機械学習モデルをデプロイできます。
Kubeflow

Kubeflow

Kubeflow は、Kubernetes 上での ML ワークフローのデプロイをシンプルかつ移植可能でスケーラブルなものにすることに特化したプロジェクトです。このプロジェクトの目標は、別のサービスを作成し直すことではなく、クラス最高のオープンソース ML システムをさまざまなインフラストラクチャに簡単に導入できるようにすることです。Kubernetes が稼働している場所ならどこでも Kubeflow を実行できます。

ブログ投稿を読む 
GitHub の Kubeflow のページに移動 
Cloud ML Engine

Cloud ML Engine

Cloud ML Engine にはオンライン予測サービスとバッチ予測サービスがあり、さまざまな ML フレームワークで利用できます。どこでトレーニングを行ったモデルでも本番環境に容易にデプロイでき、Docker コンテナや特殊な適応メカニズムも不要です。オンライン予測は scikit-learn、XGBoost、Keras、TensorFlow など複数のフレームワークに対応しており、分類、回帰、クラスタリング、次元数の削減の処理が行えます。

予測の概要を見る 

パートナー

AI に関する豊富な専門知識を活用して幅広いニーズやユースケースに対応した機械学習の組み込みを支援する Google Cloud Machine Learning パートナーが見つかります。業種やニーズに応じて、ご希望の開発パスを選択していただけます。Google のパートナーはモデルの開発から提供まで、すべての段階でサポートを提供します。これには、機械学習用のデータの準備、目的の処理に適したツールとプラットフォームの提供、既製の AI ソリューションの提供、カスタムモデルの開発が含まれます。
詳細 

データの準備(前処理)

トレーニング用データの準備を専門とするパートナーをご紹介します。

Figureeight Alteryx Imerit

データ サイエンス プラットフォーム

機械学習とデータ サイエンスに適したプラットフォームとツールをご紹介します。

H2O Anaconda R studio
Google Cloud

使ってみる

無料で体験

GCP を初めてご利用の場合、あらゆる GCP プロダクトを $300 相当の無料クレジットでお試しいただけます。

大規模プロジェクトで支援を必要としているお客様

Google のエキスパートが、適切なソリューションの構築や、お客様のニーズに合ったパートナーを見つけるお手伝いをいたします。