Operazioni di base
Puoi elencare le istanze ReasoningEngine
, ottenere un'istanza ReasoningEngine
oppure
un'istanza ReasoningEngine
.
Elenca ReasoningEngine
istanze
SDK Vertex AI per Python
Il seguente comando elenca tutte le istanze ReasoningEngine
per un determinato progetto e una determinata località:
reasoning_engines.ReasoningEngine.list()
Il seguente codice filtra l'elenco di istanze ReasoningEngine
per display_name
:
reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')
Ad esempio,
reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')
REST
Esegui il seguente comando curl
per elencare tutte le istanze ReasoningEngine
per un determinato progetto e una determinata località:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Ottieni un'istanza ReasoningEngine
Ogni istanza ReasoningEngine
ha un valore RESOURCE_ID
univoco
identificativo dell'utente. Per scoprire di più, consulta Eseguire il deployment dell'applicazione.
SDK Vertex AI per Python
Il seguente codice ti consente di recuperare una risorsa ReasoningEngine
specifica:
remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")
In alternativa, puoi fornire l'intero nome della risorsa:
remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Esegui questo comando curl
per ottenere una risorsa ReasoningEngine
specifica:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Aggiornare un'istanza ReasoningEngine
SDK Vertex AI per Python
Il seguente codice ti consente di aggiornare un'istanza ReasoningEngine
impostata sulla variabile remote_app
:
remote_app.update(
reasoning_engine=UPDATED_AGENT_INSTANCE, # Optional.
requirements=REQUIREMENTS, # Optional.
display_name="DISPLAY_NAME", # Optional.
description="DESCRIPTION", # Optional.
extra_packages=EXTRA_PACKAGES, # Optional.
)
Gli argomenti sono gli stessi di quando esegui il deployment dell'applicazione. Puoi trovare i dettagli nel riferimento dell'API.
REST
Esegui il seguente comando curl
per aggiornare il nome visualizzato e la descrizione di una risorsa ReasoningEngine
:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'
Eliminare un'istanza di ReasoningEngine
SDK Vertex AI per Python
Il seguente codice consente di eliminare un'istanza di ReasoningEngine
impostata sulla variabile remote_app
:
remote_app.delete()
REST
Ogni istanza ReasoningEngine
ha un identificatore RESOURCE_ID
unico. Per scoprire di più, vedi Eseguire il deployment dell'applicazione.
Esegui il seguente comando curl
per eliminare un'istanza ReasoningEngine
specifica:
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Monitoraggio di un'istanza LangchainAgent
Per attivare il monitoraggio per le applicazioni LangchainAgent
, specificaenable_tracing=True
quando sviluppi l'applicazione. Per
esempio:
agent = reasoning_engines.LangchainAgent(
model=model, # Required.
tools=[get_exchange_rate], # Optional.
enable_tracing=True, # [New] Optional.
)
agent.query(input="What is the exchange rate from US dollars to Swedish currency?")
Questa operazione esporterà le tracce in Cloud Trace nel progetto in Configura il progetto Google Cloud.
Visualizzazione delle tracce
Puoi trovare le tracce in Esplora tracce.
Il seguente diagramma di Gantt mostra il risultato della traccia dell'applicazione di esempio in Sviluppare un'applicazione:
La prima riga del grafico di Gantt è per la traccia ed esiste una riga per ogni intervallo nella traccia, che descrive il tempo impiegato da ogni sottooperazione.
Per scoprire di più, consulta la documentazione di Esplora tracce.
Abilita il tracciamento per un'applicazione personalizzata
Per attivare il monitoraggio per le applicazioni personalizzate, puoi utilizzare l'integrazione di OpenTelemetry con Google Cloud in combinazione con un framework di misurazione come OpenInference o OpenLLMetry.
Quote e limiti
Alcuni valori degli attributi potrebbero essere troncati quando raggiungono i limiti di quota. Per vedi Quota di Cloud Trace.
Costo
Cloud Trace prevede un livello gratuito. Per i prezzi oltre il livello gratuito, consulta Prezzi di Cloud Trace.