Gestisci l'applicazione di cui è stato eseguito il deployment

Operazioni di base

Puoi elencare le istanze ReasoningEngine, ottenere un'istanza ReasoningEngine oppure un'istanza ReasoningEngine.

Elenca ReasoningEngine istanze

SDK Vertex AI per Python

Il seguente comando elenca tutte le istanze ReasoningEngine per un determinato progetto e una determinata località:

reasoning_engines.ReasoningEngine.list()

Il seguente codice filtra l'elenco di istanze ReasoningEngine per display_name:

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

Ad esempio,

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

Esegui il seguente comando curl per elencare tutte le istanze ReasoningEngine per un determinato progetto e una determinata località:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Ottieni un'istanza ReasoningEngine

Ogni istanza ReasoningEngine ha un valore RESOURCE_ID univoco identificativo dell'utente. Per scoprire di più, consulta Eseguire il deployment dell'applicazione.

SDK Vertex AI per Python

Il seguente codice ti consente di recuperare una risorsa ReasoningEngine specifica:

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

In alternativa, puoi fornire l'intero nome della risorsa:

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Esegui questo comando curl per ottenere una risorsa ReasoningEngine specifica:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Aggiornare un'istanza ReasoningEngine

SDK Vertex AI per Python

Il seguente codice ti consente di aggiornare un'istanza ReasoningEngine impostata sulla variabile remote_app:

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

Gli argomenti sono gli stessi di quando esegui il deployment dell'applicazione. Puoi trovare i dettagli nel riferimento dell'API.

REST

Esegui il seguente comando curl per aggiornare il nome visualizzato e la descrizione di una risorsa ReasoningEngine:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

Eliminare un'istanza di ReasoningEngine

SDK Vertex AI per Python

Il seguente codice consente di eliminare un'istanza di ReasoningEngine impostata sulla variabile remote_app:

remote_app.delete()

REST

Ogni istanza ReasoningEngine ha un identificatore RESOURCE_ID unico. Per scoprire di più, vedi Eseguire il deployment dell'applicazione.

Esegui il seguente comando curl per eliminare un'istanza ReasoningEngine specifica:

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Monitoraggio di un'istanza LangchainAgent

Per attivare il monitoraggio per le applicazioni LangchainAgent, specificaenable_tracing=True quando sviluppi l'applicazione. Per esempio:

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

Questa operazione esporterà le tracce in Cloud Trace nel progetto in Configura il progetto Google Cloud.

Visualizzazione delle tracce

Puoi trovare le tracce in Esplora tracce.

Vai a Esplora tracce

Il seguente diagramma di Gantt mostra il risultato della traccia dell'applicazione di esempio in Sviluppare un'applicazione:

Esempio di traccia per una query 

La prima riga del grafico di Gantt è per la traccia ed esiste una riga per ogni intervallo nella traccia, che descrive il tempo impiegato da ogni sottooperazione.

Per scoprire di più, consulta la documentazione di Esplora tracce.

Abilita il tracciamento per un'applicazione personalizzata

Per attivare il monitoraggio per le applicazioni personalizzate, puoi utilizzare l'integrazione di OpenTelemetry con Google Cloud in combinazione con un framework di misurazione come OpenInference o OpenLLMetry.

Quote e limiti

Alcuni valori degli attributi potrebbero essere troncati quando raggiungono i limiti di quota. Per vedi Quota di Cloud Trace.

Costo

Cloud Trace prevede un livello gratuito. Per i prezzi oltre il livello gratuito, consulta Prezzi di Cloud Trace.