AI Platform Pipelines を使用した ML パイプラインの設定
このクイックスタートでは、AI Platform Pipelines について簡単に説明します。このガイドでは、TensorFlow Extended を使用して Kubeflow Pipelines を新しい Google Kubernetes Engine(GKE)クラスタにインストールし、サンプル パイプラインを実行します。
このトピックは、AI Platform Pipelines を初めて使用するユーザーを対象としています。
始める前に
このガイドに進む前に、Google Cloud プロジェクトが正しく設定され、AI Platform Pipelines をデプロイするための十分な権限があることを確認してください。
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
- 次の手順で、AI Platform Pipelines のデプロイに必要なロールが付与されているかどうかを確認します。
-
Cloud Shell セッションを開きます。
Cloud Shell は、Google Cloud Console の下部にあるフレームで開きます。
-
AI Platform Pipelines のデプロイには、プロジェクトの閲覧者(
roles/viewer
)と Kubernetes Engine 管理者(roles/container.admin
)のロールか、プロジェクトのオーナー(roles/owner
)のロールなどの同等の権限を含むロールが必要です。Cloud Shell で次のコマンドを実行して、閲覧者と Kubernetes Engine 管理者のロールを持つプリンシパルを一覧表示します。gcloud projects get-iam-policy PROJECT_ID \ --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \ --filter="bindings.role:roles/container.admin OR bindings.role:roles/viewer"
PROJECT_ID は、Google Cloud プロジェクトの ID に置き換えます。
このコマンドの出力を使用して、アカウントに閲覧者と Kubernetes Engine 管理者のロールがあることを確認します。
-
必要なロールが付与されていない場合は、Google Cloud プロジェクト管理者にお問い合わせください。
詳しくは、Identity and Access Management ロールの付与についてご覧ください。
-
AI Platform Pipelines インスタンスを設定する
新しい GKE クラスタに AI Platform Pipelines を設定するには、次の手順を実行します。
Google Cloud コンソール で AI Platform Pipelines を開きます。
[プロジェクトを選択] をクリックします。Google Cloud プロジェクトの選択を求めるダイアログが表示されます。
このクイックスタートで使用する Google Cloud プロジェクトを選択し、[開く] をクリックします。
AI Platform Pipelines ツールバーで、[新しいインスタンス] をクリックします。Kubeflow Pipelines が Google Cloud Marketplace で開きます。
[構成] をクリックします。Kubeflow Pipelines のデプロイを構成するためのフォームが開きます。
[新しいクラスタの作成] のリンクが表示されたら、[新しいクラスタの作成] をクリックします。それ以外の場合は、次の手順に進みます。
GKE クラスタを作成する [クラスタゾーン] として [us-central1-a] を選択します。
[次の Cloud APIs へのアクセスを許可する] をオンにし、GKE クラスタ上で実行されるアプリケーションに Google Cloud リソースへのアクセス権を付与します。このチェックボックスをオンにすると、
https://www.googleapis.com/auth/cloud-platform
アクセス スコープへのアクセス権がクラスタに付与されます。このアクセス スコープは、プロジェクトで有効にした Google Cloud リソースへの完全アクセス権を提供します。この方法でクラスタに Google Cloud リソースへのアクセス権を付与すると、Kubernetes シークレットを作成する手間が省けます。[クラスタを作成] をクリックして、GKE クラスタを作成します。このプロセスは完了するまでに数分かかります。
クラスタが作成されたら、次の情報を指定します。
- 名前空間: 名前空間として [デフォルト] を選択します。
- アプリ インスタンス名: インスタンス名として [pipelines-quickstart] を入力します。
[デプロイ] をクリックして、Kubeflow Pipelines を新しい GKE クラスタにデプロイします。
デプロイ プロセスの完了には数分かかります。デプロイ プロセスが完了したら、次のセクションに進みます。
サンプル パイプラインを実行する
新しい AI Platform Pipelines インスタンスでサンプル パイプラインを実行するには、次の手順を使用します。
Google Cloud コンソール で AI Platform Pipelines を開きます。
[pipelines-quickstart] という名前の AI Platform Pipelines クラスタを見つけて、[パイプライン ダッシュボードを開く] をクリックして Kubeflow Pipelines を開きます。Kubeflow Pipelines ダッシュボードが開き、[スタートガイド] ページが表示されます。
ダッシュボードの [スタートガイド] ページで Kubeflow Pipelines で提供されているデモやパイプライン チュートリアルの詳細、パイプラインの作成方法を確認できます。
左側のナビゲーション パネルで [パイプライン] をクリックします。
Kubeflow Pipelines では、サンプル パイプラインがいくつか用意されています。[[Tutorial] Data passing in python components] をクリックします。パイプラインのステップが表示されたグラフが開きます。
パイプラインを 1 回実行するには、[Create run] をクリックします。Kubeflow Pipelines では、実行はパイプラインの 1 回の実行になります。実行情報を入力するフォームが開きます。
[実行名] として、「Quickstart pipeline run」を入力します。
[開始] をクリックします。パイプライン ダッシュボードには、[テスト] ページで実行されるパイプラインのリストが表示されます。Kubeflow Pipelines ではテストを使用して、パイプラインの実行を論理グループにまとめることができます。
[Quickstart pipeline run] という名前の実行をクリックします。実行のグラフが表示されます。実行中の場合、各ステップが実行されるたびにグラフが変化します。
パイプラインのステップをクリックして、実行の入力、出力、ログなどを調べます。
これで、AI Platform Pipelines インスタンスでサンプル パイプラインを実行できました。
クリーンアップ
このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
Google Cloud アカウントへの余分な課金を回避するために、次の手順を行い、前のセクションで作成した AI Platform Pipelines インスタンスと GKE クラスタを削除します。Google Cloud コンソール で AI Platform Pipelines を開きます。
[pipelines-quickstart] という名前の AI Platform Pipelines インスタンスのチェックボックスをオンにします。
AI Platform Pipelines ツールバーの [削除] をクリックします。
[クラスタから Kubeflow Pipelines を削除] ダイアログで、[クラスタを削除] チェックボックスをオンにします。このチェックボックスをオンにすると、このクイックスタートで作成した GKE クラスタが削除されます。
[削除] をクリックして、AI Platform Pipelines インスタンスと GKE クラスタを削除します。
次のステップ
- AI Platform Pipelines の概要を読んで AI Platform Pipelines と ML パイプラインの詳細を確認する。
- ML プロセスをパイプラインとしてオーケストレートする。