Operações básicas
É possível listar instâncias ReasoningEngine
, receber uma instância ReasoningEngine
ou excluir uma instância ReasoningEngine
.
Listar instâncias ReasoningEngine
SDK da Vertex AI para Python
O comando a seguir lista todas as instâncias de ReasoningEngine
para um determinado projeto
e local:
reasoning_engines.ReasoningEngine.list()
O código a seguir filtra a lista de instâncias ReasoningEngine
por display_name
:
reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')
Por exemplo,
reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')
REST
Execute o seguinte comando curl
para listar todas as instâncias de ReasoningEngine
de um determinado projeto e local:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Acessar uma instância de ReasoningEngine
Cada instância ReasoningEngine
tem um identificador RESOURCE_ID
exclusivo. Para saber mais, consulte
Implantar o aplicativo.
SDK da Vertex AI para Python
O código a seguir permite receber um recurso ReasoningEngine
específico:
remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")
Como alternativa, forneça o nome completo do recurso:
remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Execute o seguinte comando curl
para receber um recurso ReasoningEngine
específico:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Atualizar uma instância ReasoningEngine
SDK da Vertex AI para Python
O código a seguir permite atualizar uma instância ReasoningEngine
que
foi definida para a variável remote_app
:
remote_app.update(
reasoning_engine=UPDATED_AGENT_INSTANCE, # Optional.
requirements=REQUIREMENTS, # Optional.
display_name="DISPLAY_NAME", # Optional.
description="DESCRIPTION", # Optional.
extra_packages=EXTRA_PACKAGES, # Optional.
)
Os argumentos são os mesmos de quando você implanta o aplicativo. Confira os detalhes na referência da API.
REST
Execute o comando curl
abaixo para atualizar o nome de exibição e a descrição de um recurso ReasoningEngine
:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'
Excluir uma instância ReasoningEngine
SDK da Vertex AI para Python
O código a seguir permite excluir uma instância ReasoningEngine
que
foi definida para a variável remote_app
:
remote_app.delete()
REST
Cada instância ReasoningEngine
tem um identificador RESOURCE_ID
exclusivo. Para saber mais, consulte Implantar o aplicativo.
Execute o seguinte comando curl
para excluir uma instância ReasoningEngine
específica:
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Rastreamento para uma instância LangchainAgent
Para ativar o rastreamento de aplicativos LangchainAgent
, especifique
enable_tracing=True
ao
desenvolver o aplicativo. Exemplo:
agent = reasoning_engines.LangchainAgent(
model=model, # Required.
tools=[get_exchange_rate], # Optional.
enable_tracing=True, # [New] Optional.
)
agent.query(input="What is the exchange rate from US dollars to Swedish currency?")
Isso vai exportar os rastros para o Cloud Trace no projeto em Configurar seu projeto do Google Cloud.
Como visualizar traces
Os traces estão disponíveis no Explorador de trace.
O gráfico de Gantt a seguir mostra o resultado do trace do aplicativo de exemplo em Desenvolver um aplicativo:
A primeira linha no diagrama de Gantt é para o trace e existe uma linha para cada período no trace, descrevendo quanto tempo cada suboperação levou.
Para saber mais, consulte a documentação do Trace Explorer.
Ativar o rastreamento para um aplicativo personalizado
Para ativar o rastreamento de aplicativos personalizados, use a integração do Google Cloud com o OpenTelemetry em combinação com um framework de instrumentação, como OpenInference ou OpenLLMetry.
Cotas e limites
Alguns valores de atributo podem ser truncados quando atingem os limites de cota. Para mais detalhes, acesse Cota do Cloud Trace.
Custo
O Cloud Trace tem um nível gratuito. Para saber mais sobre o nível gratuito, acesse Preços do Cloud Trace.