Grundlegende Vorgänge
Sie können ReasoningEngine
-Instanzen auflisten, eine ReasoningEngine
-Instanz abrufen oder eine ReasoningEngine
-Instanz löschen.
ReasoningEngine
-Instanzen auflisten
Vertex AI SDK für Python
Mit dem folgenden Befehl werden alle ReasoningEngine
-Instanzen für ein bestimmtes Projekt und einen bestimmten Standort aufgelistet:
reasoning_engines.ReasoningEngine.list()
Mit dem folgenden Code wird die Liste der ReasoningEngine
-Instanzen nach display_name
gefiltert:
reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')
Beispiel:
reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')
REST
Führen Sie den folgenden curl
-Befehl aus, um alle ReasoningEngine
-Instanzen für ein bestimmtes Projekt und einen bestimmten Standort aufzulisten:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
ReasoningEngine
-Instanz abrufen
Jede ReasoningEngine
-Instanz hat eine eindeutige RESOURCE_ID
-ID. Weitere Informationen finden Sie unter Anwendung bereitstellen.
Vertex AI SDK für Python
Mit dem folgenden Code können Sie eine bestimmte ReasoningEngine
-Ressource abrufen:
remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")
Alternativ können Sie den vollständigen Ressourcennamen angeben:
remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)
REST
Führen Sie den folgenden curl
-Befehl aus, um eine bestimmte ReasoningEngine
-Ressource abzurufen:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
ReasoningEngine
-Instanz aktualisieren
Vertex AI SDK für Python
Mit dem folgenden Code können Sie eine ReasoningEngine
-Instanz aktualisieren, die auf die Variable remote_app
festgelegt wurde:
remote_app.update(
reasoning_engine=UPDATED_AGENT_INSTANCE, # Optional.
requirements=REQUIREMENTS, # Optional.
display_name="DISPLAY_NAME", # Optional.
description="DESCRIPTION", # Optional.
extra_packages=EXTRA_PACKAGES, # Optional.
)
Die Argumente sind dieselben wie bei der Bereitstellung der Anwendung. Weitere Informationen finden Sie in der API-Referenz.
REST
Führen Sie den folgenden curl
-Befehl aus, um den Anzeigenamen und die Beschreibung einer ReasoningEngine
-Ressource zu aktualisieren:
curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'
ReasoningEngine
-Instanz löschen
Vertex AI SDK für Python
Mit dem folgenden Code können Sie eine ReasoningEngine
-Instanz löschen, die auf die Variable remote_app
festgelegt wurde:
remote_app.delete()
REST
Jede ReasoningEngine
-Instanz hat eine eindeutige RESOURCE_ID
-ID. Weitere Informationen finden Sie unter Anwendung bereitstellen.
Führen Sie den folgenden curl
-Befehl aus, um eine bestimmte ReasoningEngine
-Instanz zu löschen:
curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID
LangchainAgent
-Instanz erfassen
Wenn Sie das Tracing für LangchainAgent
-Anwendungen aktivieren möchten, geben Sie enable_tracing=True
an, wenn Sie die Anwendung entwickeln. Beispiel:
agent = reasoning_engines.LangchainAgent(
model=model, # Required.
tools=[get_exchange_rate], # Optional.
enable_tracing=True, # [New] Optional.
)
agent.query(input="What is the exchange rate from US dollars to Swedish currency?")
Dadurch werden Traces unter dem Projekt in Google Cloud-Projekt einrichten in Cloud Trace exportiert.
Traces anzeigen
Sie finden die Traces im Trace Explorer.
Das folgende Gantt-Diagramm zeigt das Trace-Ergebnis der Beispielanwendung aus Eine Anwendung entwickeln:
Die erste Zeile im Gantt-Diagramm steht für den Trace und es gibt eine Zeile für jeden Span im Trace, in der beschrieben wird, wie lange jede Teiloperation gedauert hat.
Weitere Informationen finden Sie in der Trace Explorer-Dokumentation.
Tracing für eine benutzerdefinierte Anwendung aktivieren
Wenn Sie Tracing für benutzerdefinierte Anwendungen aktivieren möchten, können Sie die OpenTelemetry-Google Cloud-Integration in Kombination mit einem Instrumentierungs-Framework wie OpenInference oder OpenLLMetry verwenden.
Kontingente und Limits
Einige Attributwerte werden möglicherweise gekürzt, wenn das Kontingent erreicht wird. Weitere Informationen finden Sie unter Cloud Trace-Kontingent.
Kosten
Cloud Trace ist in einer kostenlosen Stufe verfügbar. Informationen zu den Preisen über die kostenlose Stufe hinaus finden Sie unter Cloud Trace-Preise.