Gerenciar o aplicativo implantado

Operações básicas

É possível listar instâncias ReasoningEngine, receber uma instância ReasoningEngine ou excluir uma instância ReasoningEngine.

Listar instâncias ReasoningEngine

SDK da Vertex AI para Python

O comando a seguir lista todas as instâncias de ReasoningEngine para um determinado projeto e local:

reasoning_engines.ReasoningEngine.list()

O código a seguir filtra a lista de instâncias ReasoningEngine por display_name:

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

Por exemplo,

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

Execute o seguinte comando curl para listar todas as instâncias de ReasoningEngine de um determinado projeto e local:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Acessar uma instância de ReasoningEngine

Cada instância ReasoningEngine tem um identificador RESOURCE_ID exclusivo. Para saber mais, consulte Implantar o aplicativo.

SDK da Vertex AI para Python

O código a seguir permite receber um recurso ReasoningEngine específico:

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

Como alternativa, forneça o nome completo do recurso:

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Execute o seguinte comando curl para receber um recurso ReasoningEngine específico:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Atualizar uma instância ReasoningEngine

SDK da Vertex AI para Python

O código a seguir permite atualizar uma instância ReasoningEngine que foi definida para a variável remote_app:

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

Os argumentos são os mesmos de quando você implanta o aplicativo. Confira os detalhes na referência da API.

REST

Execute o comando curl abaixo para atualizar o nome de exibição e a descrição de um recurso ReasoningEngine:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

Excluir uma instância ReasoningEngine

SDK da Vertex AI para Python

O código a seguir permite excluir uma instância ReasoningEngine que foi definida para a variável remote_app:

remote_app.delete()

REST

Cada instância ReasoningEngine tem um identificador RESOURCE_ID exclusivo. Para saber mais, consulte Implantar o aplicativo.

Execute o seguinte comando curl para excluir uma instância ReasoningEngine específica:

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Rastreamento para uma instância LangchainAgent

Para ativar o rastreamento de aplicativos LangchainAgent, especifique enable_tracing=True ao desenvolver o aplicativo. Exemplo:

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

Isso vai exportar os rastros para o Cloud Trace no projeto em Configurar seu projeto do Google Cloud.

Como visualizar traces

Os traces estão disponíveis no Explorador de trace.

Acessar o "Trace Explorer"

O gráfico de Gantt a seguir mostra o resultado do trace do aplicativo de exemplo em Desenvolver um aplicativo:

Exemplo de rastreamento de uma consulta 

A primeira linha no diagrama de Gantt é para o trace e existe uma linha para cada período no trace, descrevendo quanto tempo cada suboperação levou.

Para saber mais, consulte a documentação do Trace Explorer.

Ativar o rastreamento para um aplicativo personalizado

Para ativar o rastreamento de aplicativos personalizados, use a integração do Google Cloud com o OpenTelemetry em combinação com um framework de instrumentação, como OpenInference ou OpenLLMetry.

Cotas e limites

Alguns valores de atributo podem ser truncados quando atingem os limites de cota. Para mais detalhes, acesse Cota do Cloud Trace.

Custo

O Cloud Trace tem um nível gratuito. Para saber mais sobre o nível gratuito, acesse Preços do Cloud Trace.