基本オペレーション
ReasoningEngine
インスタンスの一覧表示、ReasoningEngine
インスタンスの取得、ReasoningEngine
インスタンスの削除を行うことができます。
ReasoningEngine
インスタンスの一覧を取得する
Vertex AI SDK for Python
次のコマンドは、指定されたプロジェクトとロケーションのすべての ReasoningEngine
インスタンスを一覧表示します。
reasoning_engines.ReasoningEngine.list()
次のコードは、ReasoningEngine
インスタンスのリストを display_name
でフィルタします。
reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')
次に例を示します。
reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')
REST
次の curl
コマンドを実行して、指定されたプロジェクトとロケーションのすべての ReasoningEngine
インスタンスを一覧表示します。
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
ReasoningEngine
インスタンスを取得する
各 ReasoningEngine
インスタンスには一意の RESOURCE_ID
識別子があります。詳細については、アプリケーションをデプロイするをご覧ください。
Vertex AI SDK for Python
次のコードを使用すると、特定の ReasoningEngine
リソースを取得できます。
remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")
また、リソース名全体を指定することもできます。
remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
次の curl
コマンドを実行して、特定の ReasoningEngine
リソースを取得します。
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
ReasoningEngine
インスタンスを更新する
Vertex AI SDK for Python
次のコードを使用すると、remote_app
変数に設定された ReasoningEngine
インスタンスを更新できます。
remote_app.update(
reasoning_engine=UPDATED_AGENT_INSTANCE, # Optional.
requirements=REQUIREMENTS, # Optional.
display_name="DISPLAY_NAME", # Optional.
description="DESCRIPTION", # Optional.
extra_packages=EXTRA_PACKAGES, # Optional.
)
引数は、アプリケーションのデプロイの場合と同じです。詳細については、API リファレンスをご覧ください。
REST
次の curl
コマンドを実行して、ReasoningEngine
リソースの表示名と説明を更新します。
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'
ReasoningEngine
インスタンスを削除する
Vertex AI SDK for Python
次のコードを使用すると、remote_app
変数に設定された ReasoningEngine
インスタンスを削除できます。
remote_app.delete()
REST
各 ReasoningEngine
インスタンスには一意の RESOURCE_ID
識別子があります。詳細については、アプリケーションをデプロイするをご覧ください。
次の curl
コマンドを実行して、特定の ReasoningEngine
インスタンスを削除します。
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
LangchainAgent
インスタンスのトレーシング
LangchainAgent
アプリケーションのトレースを有効にするには、アプリケーションを開発するときに enable_tracing=True
を指定します。次に例を示します。
agent = reasoning_engines.LangchainAgent(
model=model, # Required.
tools=[get_exchange_rate], # Optional.
enable_tracing=True, # [New] Optional.
)
agent.query(input="What is the exchange rate from US dollars to Swedish currency?")
これにより、Google Cloud プロジェクトを設定するのプロジェクトの Cloud Trace にトレースが出力されます。
トレースの表示
トレースは Trace Explorer で確認できます。
次のガントチャートは、アプリケーションを開発するのサンプル アプリケーションのトレース結果を示しています。
Gantt グラフの最初の行はトレース用であり、トレース内の各スパンにそれぞれ 1 行が存在します。各サブオペレーションに要した時間が表示されます。
詳細については、Trace Explorer のドキュメントをご覧ください。
カスタム アプリケーションでトレースを有効にする
カスタム アプリケーションのトレースを行うには、Open Telemetry Google Cloud インテグレーションと、OpenInference や OpenLLMetry などの計測フレームワークを組み合わせて使用します。
割り当てと上限
一部の属性値は、割り当て上限に達すると切り捨てられることがあります。詳細については、Cloud Trace の割り当てをご覧ください。
費用
Cloud Trace には無料枠があります。無料枠を超える場合は、Cloud Trace の料金をご覧ください。