デプロイされたアプリケーションを管理する

基本オペレーション

ReasoningEngine インスタンスの一覧の作成、ReasoningEngine インスタンスの取得、ReasoningEngine インスタンスの削除を行うことができます。

ReasoningEngine インスタンスの一覧を取得する

Vertex AI SDK for Python

次のコマンドは、指定されたプロジェクトとロケーションのすべての ReasoningEngine インスタンスを一覧表示します。

reasoning_engines.ReasoningEngine.list()

次のコードは、ReasoningEngine インスタンスのリストを display_name でフィルタします。

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

例:

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

次の curl コマンドを実行して、指定されたプロジェクトとロケーションのすべての ReasoningEngine インスタンスを一覧表示します。

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

ReasoningEngine インスタンスを取得する

ReasoningEngine インスタンスには一意の RESOURCE_ID 識別子があります。詳細については、アプリケーションをデプロイするをご覧ください。

Vertex AI SDK for Python

次のコードを使用すると、特定の ReasoningEngine リソースを取得できます。

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

また、リソース名全体を指定することもできます。

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

次の curl コマンドを実行して、特定の ReasoningEngine リソースを取得します。

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

ReasoningEngine インスタンスを更新する

Vertex AI SDK for Python

次のコードを使用すると、remote_app 変数に設定された ReasoningEngine インスタンスを更新できます。

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

引数は、アプリケーションをデプロイする場合と同じです。API リファレンスで詳細をご確認ください。

REST

次の curl コマンドを実行して、ReasoningEngine リソースの表示名と説明を更新します。

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

ReasoningEngine インスタンスを削除する

Vertex AI SDK for Python

次のコードを使用すると、remote_app 変数に設定された ReasoningEngine インスタンスを削除できます。

remote_app.delete()

REST

ReasoningEngine インスタンスには一意の RESOURCE_ID 識別子があります。詳細については、アプリケーションをデプロイするをご覧ください。

次の curl コマンドを実行して、特定の ReasoningEngine インスタンスを削除します。

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

LangchainAgent インスタンスをトレースする

LangchainAgent アプリケーションのトレースを有効にするには、アプリケーションを開発するときに enable_tracing=True を指定します。次に例を示します。

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

これにより、Google Cloud プロジェクトを設定するのプロジェクトの Cloud Trace にトレースが出力されます。

トレースの表示

トレースは Trace エクスプローラで確認できます。

Trace エクスプローラに移動

次のガントチャートは、アプリケーションを開発のサンプル アプリケーションのトレース結果を示しています。

クエリのサンプル トレース 

ガントチャートの最初の行はトレース用であり、トレース内の各スパンにそれぞれ 1 行が存在し、各サブオペレーションに要した時間が表示されます。

詳細については、Trace エクスプローラのドキュメントをご覧ください。

カスタム アプリケーションでトレースを有効にする

カスタム アプリケーションのトレース機能を有効にするには、Open Telemetry Google Cloud インテグレーションと、OpenInferenceOpenLLMetry などの計測化フレームワークを組み合わせて使用します。

割り当てと上限

一部の属性値は、割り当て上限に達すると切り捨てられることがあります。詳細については、Cloud Trace の割り当てをご覧ください。

費用

Cloud Trace には無料枠があります。無料枠を超える場合は、Cloud Trace の料金をご覧ください。