Die Reasoning Engine API bietet die verwaltete Laufzeit für Ihre benutzerdefinierten agentischen Workflows in Anwendungen mit generativer KI. Sie können eine Anwendung mit Orchestrierungs-Frameworks wie LangChain erstellen und mit Reasoning Engine bereitstellen. Dieser Dienst bietet alle Vorteile in Bezug auf Sicherheit, Datenschutz, Beobachtbarkeit und Skalierbarkeit, die durch die Einbindung von Vertex AI entstehen.
Weitere konzeptionelle Informationen zur Reasoning Engine finden Sie unter Anwendung bereitstellen.
Beschränkungen
- Die Reasoning Engine API unterstützt nur Python-Orchestrierungs-Frameworks.
- Die Reasoning Engine API wird nur in der Region
us-central1
unterstützt.
Beispielsyntax
Syntax zum Erstellen und Registrieren einer Ressourcen-Inferenzmaschine.
Python
class SimpleAdditionApp: def query() -> str: """ ... """ return ... reasoning_engine = reasoning_engines.ReasoningEngine.create( SimpleAdditionApp(), display_name="", description="", requirements=[...], extra_packages=[...], )
Parameterliste
Parameter | |
---|---|
display_name |
Erforderlich: Der Anzeigename von |
description |
Optional: Die Beschreibung von |
spec |
Erforderlich: Konfigurationen des |
package_spec |
Erforderlich: Eine vom Nutzer bereitgestellte Paketspezifikation, z. B. Pickled-Objekte und Paketanforderungen. |
class_methods |
Optional: Deklarationen für Methoden der Objektklasse. |
PackageSpec
„PackageSpec“ enthält den Verweis auf den Cloud Storage-URI, in dem die OpenAPI-YAML-Datei gespeichert ist.
Parameter | |
---|---|
pickle_object_gcs_uri |
Optional: Der Cloud Storage-URI des gepickleten Python-Objekts. |
dependency_files_gcs_uri |
Optional: Der Cloud Storage-URI der Abhängigkeitsdateien mit der Erweiterung |
requirements_gcs_uri |
Optional: Der Cloud Storage-URI der Datei |
python_version |
Optional: Die Python-Version. Zu den unterstützten Versionen gehören Python |
QueryReasoningEngine
Parameter | |
---|---|
input |
Die Argumente in |
Beispiele
Grundlegende App-Konfiguration bereitstellen
Im folgenden Beispiel wird eine Anwendung verwendet, die zwei Ganzzahlen addiert, und eine Remote-App mit Reasoning Engine:
Vertex AI SDK für Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI SDK for Python API.
Erweiterte App-Konfiguration bereitstellen
Dies ist ein fortgeschrittenes Beispiel, bei dem die Kette, Prompt-Vorlagen und die Gemini API von LangChain verwendet werden:
Vertex AI SDK für Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI SDK for Python API.
Reasoning Engine abfragen
Reasoning Engine abfragen
In diesem Beispiel wird die SimpleAdditionApp
-Klasse aus dem Beispiel zum Bereitstellen einer einfachen App-Konfiguration verwendet.
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll. Muss
us-central1
lauten. - REASONING_ENGINE_ID: Die ID der Inferenzmaschine.
- INPUT:
protobuf.struct:
Die Argumente ininput
müssen mit den Argumenten in derdef query(self, question: str)
-Methode übereinstimmen, die bei der Bereitstellung einer einfachen App-Konfiguration definiert wurden.
HTTP-Methode und URL:
POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID:query
JSON-Text der Anfrage:
{ "input": { INPUT } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID:query"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID:query" | Select-Object -Expand Content
Vertex AI SDK für Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI SDK for Python API.
Reasoning Engines auflisten
Reasoning Engines in einem Projekt auflisten
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Projekt-ID.
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll. Muss
us-central1
lauten.
HTTP-Methode und URL:
GET https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines
Senden Sie die Anfrage mithilfe einer der folgenden Optionen:
curl
Führen Sie folgenden Befehl aus:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines"
PowerShell
Führen Sie folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines" | Select-Object -Expand Content
Vertex AI SDK für Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI SDK for Python API.
Reasoning Engine abrufen
Details zu einer Reasoning Engine abrufen
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Projekt-ID.
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll. Muss
us-central1
lauten. - REASONING_ENGINE_ID: Die ID der Inferenzmaschine.
HTTP-Methode und URL:
GET https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID
Senden Sie die Anfrage mithilfe einer der folgenden Optionen:
curl
Führen Sie folgenden Befehl aus:
curl -X GET \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID"
PowerShell
Führen Sie folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method GET `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID" | Select-Object -Expand Content
Vertex AI SDK für Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI SDK for Python API.
Reasoning Engine löschen
Eine Reasoning Engine löschen.
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Projekt-ID.
- LOCATION: Die Region, in der die Anfrage verarbeitet werden soll. Muss
us-central1
lauten. - REASONING_ENGINE_ID: Die ID der Inferenzmaschine.
HTTP-Methode und URL:
DELETE https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID
Senden Sie die Anfrage mithilfe einer der folgenden Optionen:
curl
Führen Sie folgenden Befehl aus:
curl -X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
"https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID"
PowerShell
Führen Sie folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method DELETE `
-Headers $headers `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/REASONING_ENGINE_ID" | Select-Object -Expand Content
Vertex AI SDK für Python
Informationen zur Installation des Vertex AI SDK for Python finden Sie unter Vertex AI SDK for Python installieren. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI SDK for Python API.