Google Cloud offre una gamma di prodotti e strumenti per la creazione di applicazioni di AI generativa con scalabilità, sicurezza e osservabilità di livello aziendale.

Usa questa pagina per conoscere le fasi dello sviluppo di un'applicazione di AI generativa, scegliere i prodotti e gli strumenti migliori per il tuo caso d'uso e accedere alla documentazione di cui hai bisogno per iniziare.

Apprendi le nozioni di base dello sviluppo dell'AI generativa

Scopri come sviluppare un'applicazione di AI generativa.
Scopri di più sui casi d'uso e sui tipi di modelli comuni dell'AI generativa.
Identifica se AI generativa, AI tradizionale o una combinazione di entrambe potrebbe essere adatto al tuo caso d'uso aziendale.
Scopri come affrontare le sfide in ogni fase dello sviluppo di un'applicazione di AI generativa.

Scegli l'infrastruttura per la tua applicazione di AI generativa

Scopri quali prodotti, framework e strumenti sono i più adatti per creare la tua applicazione di AI generativa. I componenti comuni di un'applicazione di AI generativa ospitata nel cloud includono:

  1. Hosting di applicazioni:computing per ospitare la tua applicazione. La tua applicazione può utilizzare le librerie client e gli SDK di Google Cloud per comunicare con diversi prodotti Cloud.
  2. Hosting del modello:hosting scalabile e sicuro per un modello generativo.
  3. Modello: modello generativo per testo, chat, immagini, codice, incorporamenti e multimodale.
  4. Soluzione di grounding: ancora l'output del modello a fonti di informazioni aggiornate e verificabili.
  5. Database: archivia i dati dell'applicazione. Potresti riutilizzare il database esistente come soluzione di grounding, aumentando i prompt con una query SQL e/o memorizzando i tuoi dati come incorporamenti vettoriali utilizzando un'estensione come pgvector.
  6. Spazio di archiviazione:consente di archiviare file come immagini, video o frontend web statici. Potresti utilizzare Storage anche per i dati di grounding non elaborati (ad es. PDF) che in seguito convertirai in incorporamenti e archivierai in un database vettoriale.

Diagramma che mostra una panoramica generale di un'applicazione di AI generativa che ospita l'infrastruttura, che include un modello e la relativa infrastruttura di hosting, la soluzione di grounding, il database, lo spazio di archiviazione e l'hosting di applicazioni.

Le sezioni seguenti illustrano in dettaglio ciascuno di questi componenti e ti aiutano a scegliere quali prodotti Google Cloud provare.

Infrastruttura di hosting delle applicazioni

Scegli un prodotto per ospitare e gestire il carico di lavoro dell'applicazione, in modo da effettuare chiamate al modello generativo.
Albero decisionale che guida gli utenti nella scelta di un servizio appropriato per l'hosting di applicazioni.

Per iniziare:

Infrastruttura di hosting del modello

Google Cloud offre diversi modi per ospitare un modello generativo, dalla piattaforma Vertex AI di punta all'hosting personalizzabile e portatile su Google Kubernetes Engine.

Albero decisionale che guida gli utenti a scegliere il giusto modello di hosting di servizi cloud in base alle loro priorità e ai loro requisiti.

Per iniziare:

Modello

Google Cloud fornisce un set di modelli di base all'avanguardia tramite Vertex AI, tra cui Gemini. Puoi anche eseguire il deployment di un modello di terze parti su Vertex AI Model Garden o con hosting autonomo su GKE, Cloud Run o Compute Engine.

Albero decisionale che guida gli utenti a scegliere un servizio Vertex AI per generare testo o codice, con opzioni per l'utilizzo di incorporamenti di testo, immagini o video.

Per iniziare:

Grounding

Per garantire risposte del modello informate e accurate, ti consigliamo di basare la tua applicazione di AI generativa con dati in tempo reale. Questo sistema è chiamato RAG (Retrieval Augmented Generation).

Puoi implementare il grounding con i tuoi dati in un database vettoriale, che è un formato ottimale per operazioni come la ricerca di somiglianze. Google Cloud offre più soluzioni di database vettoriali, per diversi casi d'uso.

Nota: puoi anche utilizzare database tradizionali (non vettoriali), semplicemente interrogando un database esistente come Cloud SQL o Firestore e utilizzando il risultato nel prompt del tuo modello.

Albero decisionale che guida l'utente nella scelta della soluzione di database vettoriale adatta alle sue esigenze.

Per iniziare:

Utilizzo delle API

Invece di (o in aggiunta a) utilizzare i tuoi dati per il grounding, molti servizi online offrono API che puoi utilizzare per recuperare i dati di grounding al fine di aumentare il prompt del modello.
Crea, esegui il deployment e gestisci le estensioni che collegano modelli linguistici di grandi dimensioni (LLM) alle API dei sistemi esterni.
Esplora una varietà di caricatori di documenti e integrazioni API per le tue app di AI generativa, da YouTube a Google Scholar.
Se utilizzi modelli ospitati in Vertex AI, puoi basare le risposte del modello utilizzando Vertex AI Search, Ricerca Google o testo in linea/infile.

Inizia a creare

Configurare l'ambiente di sviluppo

Installa gli strumenti necessari per creare un'applicazione di AI generativa su Google Cloud.
Strumenti a riga di comando per la configurazione di un ambiente di sviluppo locale e per l'interazione con le API Cloud.
Visualizza la documentazione e gli esempi delle API nel tuo IDE e velocizza lo sviluppo locale di GKE e Cloud Run.
Scopri come eseguire l'autenticazione alle API Google Cloud dal tuo ambiente locale e dai carichi di lavoro ospitati.
LangChain è un framework open source per le app di AI generativa che ti consente di integrare un contesto nei tuoi prompt e agire in base alla risposta del modello.

Progettare prompt e valutare i modelli

Scopri le strategie per i prompt e sperimenta diversi modelli.
Scopri le strategie per progettare prompt per diversi tipi di dati, da testo e codice alla multimodale.
Scopri come progettare, testare e gestire i tuoi prompt in Vertex AI Studio.
Visualizza decine di esempi di prompt che riguardano casi d'uso, tra cui classificazione, ideazione e riassunto.
Esplora brevi esempi per generare, sviluppare e comunicare nuove idee.

Esempi di codice

Crea un fork di un esempio su GitHub e inizia a creare.

Scopri come creare un chatbot per la risposta alle domande basato sul web, utilizzando Vertex AI Agent Builder e Firebase.

Livello principiante Node.js

Scopri come creare un'applicazione Python Flask semplice che chiama un modello di base preaddestrato in Vertex AI.

Livello principiante Python

Crea un'app web per generare idee per le campagne di marketing utilizzando Gemini su Vertex AI, Cloud Run e Streamlit.

Livello principiante Python

Scopri come utilizzare Vertex AI Search e LangChain per creare prompt di modelli basati su una fonte di conoscenza verificabile (white paper Google Cloud).

Livello intermedio Python

Scopri come implementare la chiamata di funzione, il processo di utilizzo di un LLM per compilare un corpo della richiesta che puoi quindi inviare a un'API esterna.

Livello intermedio Python

App di esempio per la generazione aumentata del recupero con AlloyDB per PostgreSQL e Vertex AI. (post del blog, codelab).

Livello intermedio Python

Indicazioni architettoniche e soluzioni già pronte

Suggerimenti ed esempi di applicazioni di AI generativa sicure, efficienti, resilienti, ad alte prestazioni ed economicamente convenienti.

Utilizza questa architettura di riferimento per progettare l'infrastruttura necessaria per eseguire un'applicazione di IA generativa con RAG (Retrieval Augmented Generation) utilizzando Vertex AI e AlloyDB per PostgreSQL.

Intermedio

Utilizza questa architettura di riferimento progetta l'infrastruttura per eseguire un'applicazione di AI generativa con RAG (Retrieval-Augmented Generation) utilizzando GKE, Cloud SQL e strumenti open source come Ray, Hugging Face e LangChain.

Intermedio

Questo documento fornisce indicazioni di progettazione su come utilizzare e integrare la varietà di opzioni di archiviazione offerte da Google Cloud per i principali carichi di lavoro di AI e ML.

Avanzata

Esegui il deployment di un'applicazione di esempio con un solo clic per riassumere documenti lunghi con Vertex AI.

Intermedio

Esegui il deployment di un'applicazione di esempio con un solo clic che utilizza gli incorporamenti vettoriali archiviati in Cloud SQL per migliorare l'accuratezza delle risposte da un'applicazione di chat.

Intermedio

Esegui il deployment di un'applicazione di esempio con un solo clic che estrae coppie di domande e risposte da un set di documenti, insieme a una pipeline che attiva l'applicazione quando viene caricato un documento.

Intermedio