Gestire l'applicazione di cui è stato eseguito il deployment

Operazioni di base

Puoi elencare le istanze ReasoningEngine, ottenere un'istanza ReasoningEngine o eliminare un'istanza ReasoningEngine.

Elenca le istanze ReasoningEngine

SDK Vertex AI per Python

Il seguente comando elenca tutte le istanze ReasoningEngine per un determinato progetto e una determinata località:

reasoning_engines.ReasoningEngine.list()

Il seguente codice filtra l'elenco di istanze ReasoningEngine in base a display_name:

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

Ad esempio,

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

Esegui il seguente comando curl per elencare tutte le istanze ReasoningEngine per un determinato progetto e una determinata località:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Ottenere un'istanza ReasoningEngine

Ogni istanza ReasoningEngine ha un identificatore RESOURCE_ID univoco. Per scoprire di più, consulta Eseguire il deployment dell'applicazione.

SDK Vertex AI per Python

Il seguente codice ti consente di ottenere una risorsa ReasoningEngine specifica:

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

In alternativa, puoi fornire l'intero nome della risorsa:

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Esegui il seguente comando curl per ottenere una risorsa ReasoningEngine specifica:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Aggiornare un'istanza ReasoningEngine

SDK Vertex AI per Python

Il seguente codice ti consente di aggiornare un'istanza ReasoningEngine impostata sulla variabile remote_app:

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

Gli argomenti sono gli stessi utilizzati per il deployment dell'applicazione. Puoi trovare i dettagli nel riferimento dell'API.

REST

Esegui il seguente comando curl per aggiornare il nome visualizzato e la descrizione di una risorsa ReasoningEngine:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

Eliminare un'istanza di ReasoningEngine

SDK Vertex AI per Python

Il seguente codice consente di eliminare un'istanza di ReasoningEngine impostata sulla variabile remote_app:

remote_app.delete()

REST

Ogni istanza ReasoningEngine ha un identificatore RESOURCE_ID univoco. Per scoprire di più, consulta Eseguire il deployment dell'applicazione.

Esegui il seguente comando curl per eliminare un'istanza ReasoningEngine specifica:

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Monitoraggio di un'istanza LangchainAgent

Per attivare il monitoraggio per le applicazioni LangchainAgent, specifica enable_tracing=True quando sviluppi l'applicazione. Ad esempio:

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

In questo modo, le tracce verranno esportate in Cloud Trace nel progetto in Configurare il progetto Google Cloud.

Visualizzazione delle tracce

Puoi trovare le tracce in Esplora tracce.

Vai a Trace Explorer

Il seguente grafico di Gantt mostra il risultato della traccia dell'applicazione di esempio di Sviluppare un'applicazione:

Traccia di esempio per una query 

La prima riga del grafico di Gantt è per la traccia ed esiste una riga per ogni intervallo nella traccia, che descrive il tempo impiegato da ogni sottooperazione.

Per saperne di più, consulta la documentazione di Trace Explorer.

Attivare il monitoraggio per un'applicazione personalizzata

Per attivare il monitoraggio per le applicazioni personalizzate, puoi utilizzare l'integrazione di OpenTelemetry Google Cloud in combinazione con un framework di strumenti come OpenInference o OpenLLMetry.

Quote e limiti

Alcuni valori degli attributi potrebbero essere troncati quando raggiungono i limiti di quota. Per i dettagli, consulta Quota di Cloud Trace.

Costo

Cloud Trace prevede un livello gratuito. Per i prezzi oltre il livello gratuito, consulta Prezzi di Cloud Trace.