Vertex AI Agent Engine (in precedenza noto come LangChain su Vertex AI o Vertex AI Reasoning Engine) è un Google Cloud servizio completamente gestito che consente agli sviluppatori di eseguire il deployment, gestire e scalare gli agenti AI in produzione. Agent Engine gestisce l'infrastruttura per scalare gli agenti in produzione, in modo da poterti concentrare sulla creazione di applicazioni intelligenti e di grande impatto. Vertex AI Agent Engine offre:
Completamente gestito: esegui il deployment e scala gli agenti con un runtime gestito che offre funzionalità di sicurezza robuste, tra cui la conformità a VPC-SC e funzionalità di gestione end-to-end complete. Ottieni l'accesso CRUD alle applicazioni multi-agente che utilizzano Google Cloud Trace (che supporta OpenTelemetry) per il monitoraggio delle prestazioni e il trafilamento. Per scoprire di più, consulta la sezione Eseguire il deployment di un agente.
Qualità e valutazione: assicurati la qualità dell'agente con il servizio integrato Vertex AI Rapid Evaluation.
Sviluppo semplificato: Agent Engine esegue l'astrazione delle attività di basso livello come lo sviluppo del server delle applicazioni e la configurazione dell'autenticazione e dell'IAM, consentendoti di concentrarti sulle funzionalità uniche del tuo agente, come il comportamento, gli strumenti e i parametri del modello. Inoltre, i tuoi agenti possono utilizzare qualsiasi modello e strumento, ad esempio le chiamate di funzione, in Vertex AI.
Indipendente dal framework: goditi la flessibilità durante il deployment degli agenti che crei utilizzando diversi framework Python, tra cui LangGraph, Langchain, AG2 e CrewAI. Se hai già un agente, puoi adattarlo per l'esecuzione su Agent Engine utilizzando il modello personalizzato nel nostro SDK. In caso contrario, puoi sviluppare un agente da zero utilizzando uno dei modelli specifici per il framework che forniamo.
Casi d'uso
Per scoprire di più su Agent Engine con esempi end-to-end, consulta le seguenti risorse:
Crea ed esegui il deployment su Agent Engine
Nota: per un'esperienza di sviluppo e di implementazione semplificata e basata su IDE con Agent Engine, valuta la possibilità di utilizzare agent-starter-pack. Fornisce modelli pronti all'uso, un'interfaccia utente integrata per la sperimentazione e semplifica il deployment, le operazioni, la valutazione, la personalizzazione e l'osservabilità.
Il flusso di lavoro per la creazione di un agente in Agent Engine è il seguente:
Passaggi | Descrizione |
---|---|
1. Configura l'ambiente | Configura il tuo progetto Google e installa la versione più recente dell'SDK Vertex AI per Python. |
2. Sviluppare un agente | Sviluppare un agente che può essere dispiegato su Agent Engine. |
3. Esegui il deployment dell'agente | Esegui il deployment dell'agente nel runtime gestito di Agent Engine. |
4. Utilizzare l'agente | Esegui una query sull'agente inviando una richiesta API. |
5. Gestire l'agente di cui è stato eseguito il deployment | Gestisci ed elimina gli agenti di cui hai eseguito il deployment in Agent Engine. |
I passaggi sono illustrati nel seguente diagramma:
Sicurezza aziendale
Agent Engine supporta i Controlli di servizio VPC per rafforzare la sicurezza dei dati e mitigare i rischi di esfiltrazione di dati. Quando i Controlli di servizio VPC sono configurati, l'agente di cui è stato eseguito il deployment mantiene l'accesso sicuro alle API e ai servizi Google, come l'API BigQuery, l'API Cloud SQL Admin e l'API Vertex AI, garantendo un funzionamento senza problemi all'interno del perimetro definito. È fondamentale che Controlli di servizio VPC blocchi efficacemente tutto l'accesso a internet pubblico, confinando il movimento dei dati ai confini della rete autorizzata e migliorando notevolmente la posizione di sicurezza dell'azienda.
Prezzi
I prezzi si basano sulle risorse di calcolo (ore vCPU) e di memoria (ore GiB) utilizzate dagli agenti di cui è stato eseguito il deployment nel runtime gestito di Agent Engine.
Prodotto | ID SKU | Prezzo |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | 0,0994 $/vCPU-ora |
Memoria del ReasoningEngine | 0B45-6103-6EC1 | 0,0105 $/GiB-ora |
Per ulteriori informazioni, consulta la sezione Prezzi.