Model Garden でモデルの機能をテストする

Model Garden には、モデルの機能をすばやく表示してテストするためのオプションがいくつか用意されています。サポートされているモデルでは、デモ プレイグラウンドを試すか、Model Garden Spaces というデモ アプリケーションを起動して、他のユーザーと共有し、モデルの機能をデモできます。

プレイグラウンドは、あらかじめデプロイされた Vertex AI オンライン予測エンドポイントによって動作し、料金は発生しません。サポートされているモデルのモデルカードを開くと、[試す] パネルを使用して、テキスト プロンプトを送信してモデルの機能をすばやくテストできます。温度や出力トークン数など、よく使用されるパラメータの一部を設定することもできます。プレイグラウンドは、テキストの入力と出力のみに制限されています。

Space を起動すると、モデルをデプロイしてモデルのエンドポイントを使用するアプリを構築するよりもはるかに少ない手作業で、すぐに使用できるウェブ アプリケーションが作成されます。Model Garden は、選択したモデルを Vertex AI にデプロイし、デプロイされたモデルのエンドポイントを使用する Cloud Run インスタンスにサンプルアプリをデプロイします。アプリケーションは、既存のエンドポイントまたは MaaS エンドポイントを使用することもできます。

モデルを起動するには、サポートされているモデルのモデルカードを開き、[Try out Spaces] パネルで Space をクリックして起動します。デプロイに使用されるマシンと、アプリをホストする Cloud Run インスタンスに対して課金されます。

始める前に

このチュートリアルでは、 Google Cloud プロジェクトを設定し、Vertex AI API を有効にする必要があります。

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. プレイグラウンドを試す

    1. Google Cloud コンソールで、サポートされているモデルのモデルカード(Gemma 2 モデルカードなど)に移動します。

      Gemma 2 に移動

    2. [試してみる] パネルで次の操作を行います。

      1. [リージョン] で、デフォルトをそのまま使用するか、リージョンを選択します。
      2. [エンドポイント] で [デモ プレイグラウンド] を選択します。
      3. [プロンプト] ボックスに「Why is the sky blue?」と入力します。
      4. [詳細オプション] セクションを開き、デフォルトのパラメータを表示します。

      Gemma 2b-it の試用パネル

    3. [送信] をクリックします。出力は [送信] ボタンの下に表示されます。

    スペースを試す

    Gemini、Gemma、Llama、Stable Diffusion などのモデルを使用して Space を起動できます。サポートされているものの例を次に示します。

    IAM の権限

    Vertex AI を使用する既存の権限に加えて、Space を起動するには次の権限が必要です。

    アクション 必要な権限 目的
    追加の API を有効にする serviceusage.services.enable 次の API を有効にします。
    • Cloud Run Admin API(run.googleapis.com
    • Artifact Registry API(artifactregistry.googleapis.com
    • Cloud Build API(cloudbuild.googleapis.com
    • Cloud Logging API(logging.googleapis.com
    サービス アカウントに権限を付与する resourcemanager.projects.setIamPolicy Compute Engine のデフォルト サービス アカウントに次のロールを付与します。
    特定の権限をデプロイする
    • storage.buckets.create
    • run.services.create
    • artifactregistry.repositories.create
    • run.services.setIamPolicy
    デプロイ中に、一連のソースコードが Cloud Storage にアップロードされ、新しいサービスが作成されて Cloud Run にデプロイされます。コンテナ イメージのリポジトリを作成するには、artifactregistry.repositories.create が必要です。サービスを一般公開するには、run.services.setIamPolicy が必要です。

    プロジェクトのオーナーである場合は、追加の操作を行う必要はありません。Vertex AI Studio のガイドに沿って操作してください。プロジェクトのオーナーでない場合は、最初の 2 つのアクションを実行し、編集者roles/editor)ロールと Cloud Run 管理者roles/run.admin)ロールを付与するようプロジェクト管理者に依頼してください。

    スペースをリリースする

    Space を起動して、Gradio サンプル アプリケーションのモデルをテストし、試してみます。

    1. Google Cloud コンソールで、Model Garden に移動してモデルのモデルカードを表示します。

      Model Garden に移動

    2. 使用するモデルを選択します。サポートされているモデルには、Gemma 3 モデルカードなどの [Try out Spaces] パネルがあります。

      Gemma 3 に移動

    3. rocket_launch [実行] をクリックして Space を起動します。

      1. [認証が必要](Identity Aware Proxy 経由)または [公開アクセスを許可する] を選択できます。詳細については、最初のデプロイで API を有効にして権限を付与するをご覧ください。
      1. [新しいサービスを作成] をクリックして、デプロイを開始します。デプロイ ステータスはモデルカードでモニタリングできます。
    4. Space のステータスが [準備完了] に変わったら、Space をクリックしてデプロイの詳細を表示します。

      基本的な保護のため、ウェブ アプリケーションにはシークレット キーが必要です。このキーは、プロンプトを送信するときに URL に追加する必要があります。この秘密鍵は [秘密鍵] フィールドに表示されます。

      1. [開く] をクリックして、アプリの使用を開始します。アプリ内からモデルにプロンプトを送信し、そのレスポンスを表示できます。

      URL を共有して、他のユーザーもアプリを試せるようにすることができます。

      1. アプリへのアクセスを閉じるには、[アクセス制御] フィールドで [編集] をクリックします。

      Cloud Run アプリケーションの [セキュリティ] タブで、[認証が必要] を選択し、[保存] をクリックします。このアプリケーションは URL からアクセスできなくなります。URL にアクセスすると 403 エラー(禁止)が発生する。

    クリーンアップ

    このページで使用したリソースについて、 Google Cloud アカウントに課金されないようにするには、次の操作を行います。

    スペースを削除する

    Space をクリーンアップするには、モデルのリソースと Cloud Run のサンプル アプリケーションのリソースの両方を削除する必要があります。

    モデルリソースを削除する

    Gradio アプリ内からモデル エンドポイントを削除して、Vertex AI リソースをクリーンアップできます。次に、Cloud Run サービスを削除して、Gradio アプリを停止して削除する必要があります。

    Vertex AI リソースを手動で削除するには、モデルのデプロイを解除してリソースを削除するをご覧ください。

    Cloud Run サービスの削除

    サービスのすべてのリビジョンなど、サービスに関連するリソースを削除します。サービスを削除しても、Artifact Registry のコンテナ イメージなどのアイテムは削除されません。詳細については、Cloud Run ドキュメントのサービスを管理するをご覧ください。

    1. Google Cloud コンソールで、Cloud Run サービスのリストを表示します。

      Cloud Run に移動

    2. 削除するサービスを見つけて選択します。

    3. [削除] [削除] をクリックします。これにより、サービスのすべてのリビジョンが削除されます。

    プロジェクトの削除

    課金されないようにする最も簡単な方法は、チュートリアル用に作成したプロジェクトを削除することです。

    プロジェクトを削除するには:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    次のステップ

    Model Garden の概要をご覧ください。