Per eseguire il deployment dell'applicazione su Vertex AI, crea una nuova istanza
di ReasoningEngine
e passare nella classe dell'applicazione come parametro. Se
vuoi introdurre dipendenze dei pacchetti per la tua applicazione, usa
seguenti parametri:
requirements
: un elenco di pacchetti PyPI esterni delle dipendenze. Ogni riga deve essere una singola stringa. Per saperne di più, vedi Formato file dei requisiti.extra_packages
: un elenco delle dipendenze del pacchetto interno. Questi pacchetti le dipendenze sono file o directory locali che corrispondono i pacchetti Python richiesti dall'applicazione.
Tieni presente le seguenti limitazioni per l'API Reasoning Engine:
- L'API Reasoning Engine supporta solo i framework di orchestrazione Python.
- L'API Reasoning Engine è supportata solo nella regione
us-central1
.
Il codice seguente mostra come eseguire il deployment di un'applicazione:
DISPLAY_NAME = "Demo Langchain Application"
remote_app = reasoning_engines.ReasoningEngine.create(
reasoning_engines.LangchainAgent(
model=model,
tools=[get_exchange_rate],
model_kwargs=model_kwargs,
),
requirements=[
"google-cloud-aiplatform[reasoningengine,langchain]",
],
display_name=DISPLAY_NAME,
)
remote_app
Quando esegui il deployment di un'applicazione su Reasoning Engine, passa un nuovo oggetto
di riutilizzare un oggetto esistente. In questo modo eviterai di creare un oggetto
in cui sono stati inizializzati dati non selezionabili, come le connessioni ai database
nel suo metodo .set_up
.
L'esecuzione del deployment dell'applicazione richiede alcuni minuti. Crea container attiva i server HTTP sul backend. La latenza del deployment dipende tempo totale necessario per installare i pacchetti richiesti.
Dopo il deployment, remote_app
corrisponde a un'istanza di reasoning_engines.LangchainAgent
che è in esecuzione su Vertex AI e che
può essere sottoposto a query o eliminato. È
separato dalle istanze locali di
reasoning_engines.LangchainAgent
.
Ogni applicazione di cui è stato eseguito il deployment ha un identificatore univoco. Esegui questo comando
per ottenere l'identificatore resource_name
per la tua applicazione:
remote_app.resource_name
resource_name
ha il seguente formato:
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID".