Bereitgestellte Anwendung verwalten

Grundlegende Vorgänge

Sie können ReasoningEngine-Instanzen auflisten, eine ReasoningEngine-Instanz abrufen oder eine ReasoningEngine-Instanz löschen.

ReasoningEngine-Instanzen auflisten

Vertex AI SDK für Python

Mit dem folgenden Befehl werden alle ReasoningEngine-Instanzen für ein bestimmtes Projekt und einen bestimmten Standort aufgelistet:

reasoning_engines.ReasoningEngine.list()

Mit dem folgenden Code wird die Liste der ReasoningEngine-Instanzen nach display_name gefiltert:

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

Beispiel:

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

Führen Sie den folgenden curl-Befehl aus, um alle ReasoningEngine-Instanzen für ein bestimmtes Projekt und einen bestimmten Standort aufzulisten:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

ReasoningEngine-Instanz abrufen

Jede ReasoningEngine-Instanz hat eine eindeutige RESOURCE_ID-ID. Weitere Informationen finden Sie unter Anwendung bereitstellen.

Vertex AI SDK für Python

Mit dem folgenden Code können Sie eine bestimmte ReasoningEngine-Ressource abrufen:

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

Alternativ können Sie den vollständigen Ressourcennamen angeben:

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Führen Sie den folgenden curl-Befehl aus, um eine bestimmte ReasoningEngine-Ressource abzurufen:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

ReasoningEngine-Instanz aktualisieren

Vertex AI SDK für Python

Mit dem folgenden Code können Sie eine ReasoningEngine-Instanz aktualisieren, die auf die Variable remote_app festgelegt wurde:

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

Die Argumente sind dieselben wie bei der Bereitstellung der Anwendung. Weitere Informationen finden Sie in der API-Referenz.

REST

Führen Sie den folgenden curl-Befehl aus, um den Anzeigenamen und die Beschreibung einer ReasoningEngine-Ressource zu aktualisieren:

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

ReasoningEngine-Instanz löschen

Vertex AI SDK für Python

Mit dem folgenden Code können Sie eine ReasoningEngine-Instanz löschen, die auf die Variable remote_app festgelegt wurde:

remote_app.delete()

REST

Jede ReasoningEngine-Instanz hat eine eindeutige RESOURCE_ID-ID. Weitere Informationen finden Sie unter Anwendung bereitstellen.

Führen Sie den folgenden curl-Befehl aus, um eine bestimmte ReasoningEngine-Instanz zu löschen:

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

LangchainAgent-Instanz erfassen

Wenn Sie das Tracing für LangchainAgent-Anwendungen aktivieren möchten, geben Sie enable_tracing=True an, wenn Sie die Anwendung entwickeln. Beispiel:

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

Dadurch werden Traces unter dem Projekt in Google Cloud-Projekt einrichten in Cloud Trace exportiert.

Traces anzeigen

Sie finden die Traces im Trace Explorer.

Trace Explorer aufrufen

Das folgende Gantt-Diagramm zeigt das Trace-Ergebnis der Beispielanwendung aus Eine Anwendung entwickeln:

Beispiel-Trace für eine Abfrage 

Die erste Zeile im Gantt-Diagramm steht für den Trace und es gibt eine Zeile für jeden Span im Trace, in der beschrieben wird, wie lange jede Teiloperation gedauert hat.

Weitere Informationen finden Sie in der Trace Explorer-Dokumentation.

Tracing für eine benutzerdefinierte Anwendung aktivieren

Wenn Sie Tracing für benutzerdefinierte Anwendungen aktivieren möchten, können Sie die OpenTelemetry-Google Cloud-Integration in Kombination mit einem Instrumentierungs-Framework wie OpenInference oder OpenLLMetry verwenden.

Kontingente und Limits

Einige Attributwerte werden möglicherweise gekürzt, wenn das Kontingent erreicht wird. Weitere Informationen finden Sie unter Cloud Trace-Kontingent.

Kosten

Cloud Trace ist in einer kostenlosen Stufe verfügbar. Informationen zu den Preisen über die kostenlose Stufe hinaus finden Sie unter Cloud Trace-Preise.