Operazioni di base
Puoi elencare le istanze ReasoningEngine
, ottenere un'istanza ReasoningEngine
o eliminare un'istanza ReasoningEngine
.
Elenca le istanze ReasoningEngine
SDK Vertex AI per Python
Il seguente comando elenca tutte le istanze ReasoningEngine
per un determinato progetto e una determinata località:
reasoning_engines.ReasoningEngine.list()
Il seguente codice filtra l'elenco di istanze ReasoningEngine
in base a display_name
:
reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')
Ad esempio,
reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')
REST
Esegui il seguente comando curl
per elencare tutte le istanze ReasoningEngine
per un determinato progetto e una determinata località:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Ottenere un'istanza ReasoningEngine
Ogni istanza ReasoningEngine
ha un identificatore RESOURCE_ID
univoco. Per scoprire di più, consulta Eseguire il deployment dell'applicazione.
SDK Vertex AI per Python
Il seguente codice ti consente di ottenere una risorsa ReasoningEngine
specifica:
remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")
In alternativa, puoi fornire l'intero nome della risorsa:
remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Esegui il seguente comando curl
per ottenere una risorsa ReasoningEngine
specifica:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Aggiornare un'istanza ReasoningEngine
SDK Vertex AI per Python
Il seguente codice ti consente di aggiornare un'istanza ReasoningEngine
impostata sulla variabile remote_app
:
remote_app.update(
reasoning_engine=UPDATED_AGENT_INSTANCE, # Optional.
requirements=REQUIREMENTS, # Optional.
display_name="DISPLAY_NAME", # Optional.
description="DESCRIPTION", # Optional.
extra_packages=EXTRA_PACKAGES, # Optional.
)
Gli argomenti sono gli stessi utilizzati per il deployment dell'applicazione. Puoi trovare i dettagli nel riferimento dell'API.
REST
Esegui il seguente comando curl
per aggiornare il nome visualizzato e la descrizione di una risorsa ReasoningEngine
:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'
Eliminare un'istanza di ReasoningEngine
SDK Vertex AI per Python
Il seguente codice consente di eliminare un'istanza di ReasoningEngine
impostata sulla variabile remote_app
:
remote_app.delete()
REST
Ogni istanza ReasoningEngine
ha un identificatore RESOURCE_ID
univoco. Per scoprire di più, consulta Eseguire il deployment dell'applicazione.
Esegui il seguente comando curl
per eliminare un'istanza ReasoningEngine
specifica:
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
Monitoraggio di un'istanza LangchainAgent
Per attivare il monitoraggio per le applicazioni LangchainAgent
, specifica
enable_tracing=True
quando
sviluppi l'applicazione. Ad
esempio:
agent = reasoning_engines.LangchainAgent(
model=model, # Required.
tools=[get_exchange_rate], # Optional.
enable_tracing=True, # [New] Optional.
)
agent.query(input="What is the exchange rate from US dollars to Swedish currency?")
In questo modo, le tracce verranno esportate in Cloud Trace nel progetto in Configurare il progetto Google Cloud.
Visualizzazione delle tracce
Puoi trovare le tracce in Esplora tracce.
Il seguente grafico di Gantt mostra il risultato della traccia dell'applicazione di esempio di Sviluppare un'applicazione:
La prima riga del grafico di Gantt è per la traccia ed esiste una riga per ogni intervallo nella traccia, che descrive il tempo impiegato da ogni sottooperazione.
Per saperne di più, consulta la documentazione di Trace Explorer.
Attivare il monitoraggio per un'applicazione personalizzata
Per attivare il monitoraggio per le applicazioni personalizzate, puoi utilizzare l'integrazione di OpenTelemetry Google Cloud in combinazione con un framework di strumenti come OpenInference o OpenLLMetry.
Quote e limiti
Alcuni valori degli attributi potrebbero essere troncati quando raggiungono i limiti di quota. Per i dettagli, consulta Quota di Cloud Trace.
Costo
Cloud Trace prevede un livello gratuito. Per i prezzi oltre il livello gratuito, consulta Prezzi di Cloud Trace.