AI Platform Pipelines を使用した ML パイプラインの設定

このクイックスタートでは、AI Platform Pipelines について簡単に説明します。このガイドでは、TensorFlow Extended を使用して Kubeflow Pipelines を新しい Google Kubernetes Engine(GKE)クラスタにインストールし、サンプル パイプラインを実行します。

このトピックは、AI Platform Pipelines を初めて使用するユーザーを対象としています。

始める前に

このガイドに進む前に、Google Cloud プロジェクトが正しく設定され、AI Platform Pipelines をデプロイするための十分な権限があることを確認してください。

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Make sure that billing is enabled for your Google Cloud project.

  6. 次の手順で、AI Platform Pipelines のデプロイに必要なロールが付与されているかどうかを確認します。
    1. Cloud Shell セッションを開きます。

      Cloud Shell を開く

      Cloud Shell は、Google Cloud Console の下部にあるフレームで開きます。

    2. AI Platform Pipelines のデプロイには、プロジェクトの閲覧者(roles/viewer)と Kubernetes Engine 管理者(roles/container.admin)のロールか、プロジェクトのオーナー(roles/owner)のロールなどの同等の権限を含むロールが必要です。Cloud Shell で次のコマンドを実行して、閲覧者と Kubernetes Engine 管理者のロールを持つプリンシパルを一覧表示します。

      gcloud projects get-iam-policy PROJECT_ID \
        --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \
        --filter="bindings.role:roles/container.admin OR bindings.role:roles/viewer"

      PROJECT_ID は、Google Cloud プロジェクトの ID に置き換えます。

      このコマンドの出力を使用して、アカウントに閲覧者と Kubernetes Engine 管理者のロールがあることを確認します。

    3. 必要なロールが付与されていない場合は、Google Cloud プロジェクト管理者にお問い合わせください。

      詳しくは、Identity and Access Management ロールの付与についてご覧ください。

AI Platform Pipelines インスタンスを設定する

新しい GKE クラスタに AI Platform Pipelines を設定するには、次の手順を実行します。

  1. Google Cloud コンソール で AI Platform Pipelines を開きます。

    AI Platform Pipelines に移動

  2. [プロジェクトを選択] をクリックします。Google Cloud プロジェクトの選択を求めるダイアログが表示されます。

  3. このクイックスタートで使用する Google Cloud プロジェクトを選択し、[開く] をクリックします。

  4. AI Platform Pipelines ツールバーで、[新しいインスタンス] をクリックします。Kubeflow Pipelines が Google Cloud Marketplace で開きます。

  5. [構成] をクリックします。Kubeflow Pipelines のデプロイを構成するためのフォームが開きます。

  6. [新しいクラスタの作成] のリンクが表示されたら、[新しいクラスタの作成] をクリックします。それ以外の場合は、次の手順に進みます。

  7. GKE クラスタを作成する [クラスタゾーン] として [us-central1-a] を選択します。

  8. [次の Cloud APIs へのアクセスを許可する] をオンにし、GKE クラスタ上で実行されるアプリケーションに Google Cloud リソースへのアクセス権を付与します。このチェックボックスをオンにすると、https://www.googleapis.com/auth/cloud-platform アクセス スコープへのアクセス権がクラスタに付与されます。このアクセス スコープは、プロジェクトで有効にした Google Cloud リソースへの完全アクセス権を提供します。この方法でクラスタに Google Cloud リソースへのアクセス権を付与すると、Kubernetes シークレットを作成する手間が省けます。

  9. [クラスタを作成] をクリックして、GKE クラスタを作成します。このプロセスは完了するまでに数分かかります。

  10. クラスタが作成されたら、次の情報を指定します。

    • 名前空間: 名前空間として [デフォルト] を選択します。
    • アプリ インスタンス名: インスタンス名として [pipelines-quickstart] を入力します。
  11. [デプロイ] をクリックして、Kubeflow Pipelines を新しい GKE クラスタにデプロイします。

デプロイ プロセスの完了には数分かかります。デプロイ プロセスが完了したら、次のセクションに進みます。

サンプル パイプラインを実行する

新しい AI Platform Pipelines インスタンスでサンプル パイプラインを実行するには、次の手順を使用します。

  1. Google Cloud コンソール で AI Platform Pipelines を開きます。

    AI Platform Pipelines に移動

  2. [pipelines-quickstart] という名前の AI Platform Pipelines クラスタを見つけて、[パイプライン ダッシュボードを開く] をクリックして Kubeflow Pipelines を開きます。Kubeflow Pipelines ダッシュボードが開き、[スタートガイド] ページが表示されます。

  3. ダッシュボードの [スタートガイド] ページで Kubeflow Pipelines で提供されているデモやパイプライン チュートリアルの詳細、パイプラインの作成方法を確認できます。

    左側のナビゲーション パネルで [パイプライン] をクリックします。

  4. Kubeflow Pipelines では、サンプル パイプラインがいくつか用意されています。[[Tutorial] Data passing in python components] をクリックします。パイプラインのステップが表示されたグラフが開きます。

  5. パイプラインを 1 回実行するには、[Create run] をクリックします。Kubeflow Pipelines では、実行はパイプラインの 1 回の実行になります。実行情報を入力するフォームが開きます。

  6. [実行名] として、「Quickstart pipeline run」を入力します。

  7. [開始] をクリックします。パイプライン ダッシュボードには、[テスト] ページで実行されるパイプラインのリストが表示されます。Kubeflow Pipelines ではテストを使用して、パイプラインの実行を論理グループにまとめることができます。

  8. [Quickstart pipeline run] という名前の実行をクリックします。実行のグラフが表示されます。実行中の場合、各ステップが実行されるたびにグラフが変化します。

  9. パイプラインのステップをクリックして、実行の入力、出力、ログなどを調べます。

これで、AI Platform Pipelines インスタンスでサンプル パイプラインを実行できました。

クリーンアップ

このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。

Google Cloud アカウントへの余分な課金を回避するために、次の手順を行い、前のセクションで作成した AI Platform Pipelines インスタンスと GKE クラスタを削除します。

  1. Google Cloud コンソール で AI Platform Pipelines を開きます。

    AI Platform Pipelines に移動

  2. [pipelines-quickstart] という名前の AI Platform Pipelines インスタンスのチェックボックスをオンにします。

  3. AI Platform Pipelines ツールバーの [削除] をクリックします。

  4. [クラスタから Kubeflow Pipelines を削除] ダイアログで、[クラスタを削除] チェックボックスをオンにします。このチェックボックスをオンにすると、このクイックスタートで作成した GKE クラスタが削除されます。

  5. [削除] をクリックして、AI Platform Pipelines インスタンスと GKE クラスタを削除します。

次のステップ