基本オペレーション
ReasoningEngine インスタンスの一覧の作成、ReasoningEngine インスタンスの取得、ReasoningEngine インスタンスの削除を行うことができます。
ReasoningEngine インスタンスの一覧を取得する
Vertex AI SDK for Python
次のコマンドは、指定されたプロジェクトとロケーションのすべての ReasoningEngine インスタンスを一覧表示します。
reasoning_engines.ReasoningEngine.list()
次のコードは、ReasoningEngine インスタンスのリストを display_name でフィルタします。
reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')
例:
reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')
REST
次の curl コマンドを実行して、指定されたプロジェクトとロケーションのすべての ReasoningEngine インスタンスを一覧表示します。
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEnginesReasoningEngine インスタンスを取得する
各 ReasoningEngine インスタンスには一意の RESOURCE_ID 識別子があります。詳細については、アプリケーションをデプロイするをご覧ください。
Vertex AI SDK for Python
次のコードを使用すると、特定の ReasoningEngine リソースを取得できます。
remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")
また、リソース名全体を指定することもできます。
remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
次の curl コマンドを実行して、特定の ReasoningEngine リソースを取得します。
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_IDReasoningEngine インスタンスを更新する
Vertex AI SDK for Python
次のコードを使用すると、remote_app 変数に設定された ReasoningEngine インスタンスを更新できます。
remote_app.update(
reasoning_engine=UPDATED_AGENT_INSTANCE, # Optional.
requirements=REQUIREMENTS, # Optional.
display_name="DISPLAY_NAME", # Optional.
description="DESCRIPTION", # Optional.
extra_packages=EXTRA_PACKAGES, # Optional.
)
引数は、アプリケーションをデプロイする場合と同じです。API リファレンスで詳細をご確認ください。
REST
次の curl コマンドを実行して、ReasoningEngine リソースの表示名と説明を更新します。
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'ReasoningEngine インスタンスを削除する
Vertex AI SDK for Python
次のコードを使用すると、remote_app 変数に設定された ReasoningEngine インスタンスを削除できます。
remote_app.delete()
REST
各 ReasoningEngine インスタンスには一意の RESOURCE_ID 識別子があります。詳細については、アプリケーションをデプロイするをご覧ください。
次の curl コマンドを実行して、特定の ReasoningEngine インスタンスを削除します。
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_IDLangchainAgent インスタンスをトレースする
LangchainAgent アプリケーションのトレースを有効にするには、アプリケーションを開発するときに enable_tracing=True を指定します。次に例を示します。
agent = reasoning_engines.LangchainAgent(
model=model, # Required.
tools=[get_exchange_rate], # Optional.
enable_tracing=True, # [New] Optional.
)
agent.query(input="What is the exchange rate from US dollars to Swedish currency?")
これにより、 Google Cloud プロジェクトを設定するのプロジェクトの Cloud Trace にトレースが出力されます。
トレースの表示
トレースは Trace エクスプローラで確認できます。
次のガントチャートは、アプリケーションを開発のサンプル アプリケーションのトレース結果を示しています。
ガントチャートの最初の行はトレース用であり、トレース内の各スパンにそれぞれ 1 行が存在し、各サブオペレーションに要した時間が表示されます。
詳細については、Trace エクスプローラのドキュメントをご覧ください。
カスタム アプリケーションでトレースを有効にする
カスタム アプリケーションのトレース機能を有効にするには、Open Telemetry Google Cloud インテグレーションと、OpenInference や OpenLLMetry などの計測化フレームワークを組み合わせて使用します。
割り当てと上限
一部の属性値は、割り当て上限に達すると切り捨てられることがあります。詳細については、Cloud Trace の割り当てをご覧ください。
費用
Cloud Trace には無料枠があります。無料枠を超える場合は、Cloud Trace の料金をご覧ください。