Crea un'applicazione di AI generativa su Google Cloud
Google Cloud offre una gamma di prodotti e strumenti per la creazione di applicazioni di AI generativa con scalabilità, sicurezza e osservabilità di livello aziendale.
Usa questa pagina per conoscere le fasi dello sviluppo di un'applicazione di AI generativa, scegliere i prodotti e gli strumenti migliori per il tuo caso d'uso e accedere alla documentazione di cui hai bisogno per iniziare.
Apprendi le nozioni di base dello sviluppo dell'AI generativa
Quando utilizzare AI generativa o AI tradizionale
Panoramica dello sviluppo di un'applicazione di AI generativa
Scegli l'infrastruttura per la tua applicazione di AI generativa
Scopri quali prodotti, framework e strumenti sono i più adatti per creare la tua applicazione di AI generativa. I componenti comuni di un'applicazione di AI generativa ospitata nel cloud includono:
- Hosting di applicazioni:computing per ospitare la tua applicazione. La tua applicazione può utilizzare le librerie client e gli SDK di Google Cloud per comunicare con diversi prodotti Cloud.
- Hosting del modello:hosting scalabile e sicuro per un modello generativo.
- Modello: modello generativo per testo, chat, immagini, codice, incorporamenti e multimodale.
- Soluzione di grounding: ancora l'output del modello a fonti di informazioni aggiornate e verificabili.
- Database: archivia i dati dell'applicazione. Potresti riutilizzare il database esistente come soluzione di grounding, aumentando i prompt con una query SQL e/o memorizzando i tuoi dati come incorporamenti vettoriali utilizzando un'estensione come pgvector.
- Spazio di archiviazione:consente di archiviare file come immagini, video o frontend web statici. Potresti utilizzare Storage anche per i dati di grounding non elaborati (ad es. PDF) che in seguito convertirai in incorporamenti e archivierai in un database vettoriale.
Le sezioni seguenti illustrano in dettaglio ciascuno di questi componenti e ti aiutano a scegliere quali prodotti Google Cloud provare.
Infrastruttura di hosting delle applicazioni
Per iniziare:
Infrastruttura di hosting del modello
Per iniziare:
Modello
Per iniziare:
- Gemini
- Codey
- Immagini
- incorporamento-testo
- Vertex AI Model Garden (modelli open source)
- HuggingFace Model Hub (modelli open source)
Grounding
Per garantire risposte del modello informate e accurate, ti consigliamo di basare la tua applicazione di AI generativa con dati in tempo reale. Questo sistema è chiamato RAG (Retrieval Augmented Generation).
Puoi implementare il grounding con i tuoi dati in un database vettoriale, che è un formato ottimale per operazioni come la ricerca di somiglianze. Google Cloud offre più soluzioni di database vettoriali, per diversi casi d'uso.
Nota: puoi anche utilizzare database tradizionali (non vettoriali), semplicemente interrogando un database esistente come Cloud SQL o Firestore e utilizzando il risultato nel prompt del tuo modello.
Per iniziare:
- Vertex AI Agent Builder (in precedenza Enterprise Search, Gen AI App Builder, Discovery Engine)
- Vector Search (in precedenza Matching Engine)
- AlloyDB per PostgreSQL
- Cloud SQL
- BigQuery
Utilizzo delle API
Vertex AI Extensions (anteprima privata)
Componenti Langchain
grounding in Vertex AI
Inizia a creare
Configurare l'ambiente di sviluppo
Installa Google Cloud CLI
Installa l'estensione Cloud Code nel tuo IDE
Configura l'autenticazione
Configura LangChain
Progettare prompt e valutare i modelli
Introduzione alla progettazione dei prompt
Vertex AI Studio
Esempi di prompt di IA generativa
Ideazione con modelli generativi su Vertex AI
Valutazione dei modelli in Vertex AI
Esempi di codice
Chatbot web: rispondi a domande sul Google Store
Scopri come creare un chatbot per la risposta alle domande basato sul web, utilizzando Vertex AI Agent Builder e Firebase.
App di chat con Eventarc e Vertex AI
Scopri come creare un'applicazione Python Flask semplice che chiama un modello di base preaddestrato in Vertex AI.
Genera una campagna di marketing con Gemini
Crea un'app web per generare idee per le campagne di marketing utilizzando Gemini su Vertex AI, Cloud Run e Streamlit.
App per la risposta alle domande con "The Practitioner's Guide to MLOps"
Scopri come utilizzare Vertex AI Search e LangChain per creare prompt di modelli basati su una fonte di conoscenza verificabile (white paper Google Cloud).
Assistente per le richieste API Weather: chiamata di funzione con Gemini
Scopri come implementare la chiamata di funzione, il processo di utilizzo di un LLM per compilare un corpo della richiesta che puoi quindi inviare a un'API esterna.
Airport Assistant: app Gen AI Databases Retrieval
App di esempio per la generazione aumentata del recupero con AlloyDB per PostgreSQL e Vertex AI. (post del blog, codelab).
Indicazioni architettoniche e soluzioni già pronte
Infrastruttura per un'applicazione di IA generativa compatibile con RAG che utilizza Vertex AI
Utilizza questa architettura di riferimento per progettare l'infrastruttura necessaria per eseguire un'applicazione di IA generativa con RAG (Retrieval Augmented Generation) utilizzando Vertex AI e AlloyDB per PostgreSQL.
Infrastruttura per un'applicazione di AI generativa compatibile con RAG che utilizza GKE
Utilizza questa architettura di riferimento progetta l'infrastruttura per eseguire un'applicazione di AI generativa con RAG (Retrieval-Augmented Generation) utilizzando GKE, Cloud SQL e strumenti open source come Ray, Hugging Face e LangChain.
Progetta l'archiviazione per carichi di lavoro di AI e ML in Google Cloud
Questo documento fornisce indicazioni di progettazione su come utilizzare e integrare la varietà di opzioni di archiviazione offerte da Google Cloud per i principali carichi di lavoro di AI e ML.
Soluzione di avvio rapido: riassunto dei documenti
Esegui il deployment di un'applicazione di esempio con un solo clic per riassumere documenti lunghi con Vertex AI.
Soluzione di avvio rapido: RAG di IA generativa con Cloud SQL
Esegui il deployment di un'applicazione di esempio con un solo clic che utilizza gli incorporamenti vettoriali archiviati in Cloud SQL per migliorare l'accuratezza delle risposte da un'applicazione di chat.
Soluzione già pronta: knowledge base dell'IA generativa
Esegui il deployment di un'applicazione di esempio con un solo clic che estrae coppie di domande e risposte da un set di documenti, insieme a una pipeline che attiva l'applicazione quando viene caricato un documento.