Crea un'applicazione di AI generativa su Google Cloud

Questa pagina è stata tradotta dall'API Cloud Translation.

Crea un'applicazione di AI generativa su Google Cloud

Google Cloud offre una gamma di prodotti e strumenti per la creazione di applicazioni di AI generativa con scalabilità, sicurezza e osservabilità di livello aziendale.

Usa questa pagina per conoscere le fasi dello sviluppo di un'applicazione di AI generativa, scegliere i prodotti e gli strumenti migliori per il tuo caso d'uso e accedere alla documentazione di cui hai bisogno per iniziare.

Apprendi le nozioni di base dello sviluppo dell'AI generativa

Scopri come sviluppare un'applicazione di AI generativa.

Scopri di più sui casi d'uso e sui tipi di modelli comuni dell'AI generativa.

Quando utilizzare AI generativa o AI tradizionale

Identifica se AI generativa, AI tradizionale o una combinazione di entrambe potrebbe essere adatto al tuo caso d'uso aziendale.

Panoramica dello sviluppo di un'applicazione di AI generativa

Scopri come affrontare le sfide in ogni fase dello sviluppo di un'applicazione di AI generativa.

Scegli l'infrastruttura per la tua applicazione di AI generativa

Scopri quali prodotti, framework e strumenti sono i più adatti per creare la tua applicazione di AI generativa. I componenti comuni di un'applicazione di AI generativa ospitata nel cloud includono:

Hosting di applicazioni:computing per ospitare la tua applicazione. La tua applicazione può utilizzare le librerie client e gli SDK di Google Cloud per comunicare con diversi prodotti Cloud.
Hosting del modello:hosting scalabile e sicuro per un modello generativo.
Modello: modello generativo per testo, chat, immagini, codice, incorporamenti e multimodale.
Soluzione di grounding: ancora l'output del modello a fonti di informazioni aggiornate e verificabili.
Database: archivia i dati dell'applicazione. Potresti riutilizzare il database esistente come soluzione di grounding, aumentando i prompt con una query SQL e/o memorizzando i tuoi dati come incorporamenti vettoriali utilizzando un'estensione come pgvector.
Spazio di archiviazione:consente di archiviare file come immagini, video o frontend web statici. Potresti utilizzare Storage anche per i dati di grounding non elaborati (ad es. PDF) che in seguito convertirai in incorporamenti e archivierai in un database vettoriale.

Diagramma che mostra una panoramica generale di un'applicazione di AI generativa che ospita l'infrastruttura, che include un modello e la relativa infrastruttura di hosting, la soluzione di grounding, il database, lo spazio di archiviazione e l'hosting di applicazioni.

Le sezioni seguenti illustrano in dettaglio ciascuno di questi componenti e ti aiutano a scegliere quali prodotti Google Cloud provare.

Infrastruttura di hosting delle applicazioni

Scegli un prodotto per ospitare e gestire il carico di lavoro dell'applicazione, in modo da effettuare chiamate al modello generativo.

Per iniziare:

Infrastruttura di hosting del modello

Google Cloud offre diversi modi per ospitare un modello generativo, dalla piattaforma Vertex AI di punta all'hosting personalizzabile e portatile su Google Kubernetes Engine.

Albero decisionale che guida gli utenti a scegliere il giusto modello di hosting di servizi cloud in base alle loro priorità e ai loro requisiti.

Per iniziare:

Modello

Google Cloud fornisce un set di modelli di base all'avanguardia tramite Vertex AI, tra cui Gemini. Puoi anche eseguire il deployment di un modello di terze parti su Vertex AI Model Garden o con hosting autonomo su GKE, Cloud Run o Compute Engine.

Albero decisionale che guida gli utenti a scegliere un servizio Vertex AI per generare testo o codice, con opzioni per l'utilizzo di incorporamenti di testo, immagini o video.

Per iniziare:

Gemini
Codey
Immagini
incorporamento-testo
Vertex AI Model Garden (modelli open source)
HuggingFace Model Hub (modelli open source)

Grounding

Per garantire risposte del modello informate e accurate, ti consigliamo di basare la tua applicazione di AI generativa con dati in tempo reale. Questo sistema è chiamato RAG (Retrieval Augmented Generation).

Puoi implementare il grounding con i tuoi dati in un database vettoriale, che è un formato ottimale per operazioni come la ricerca di somiglianze. Google Cloud offre più soluzioni di database vettoriali, per diversi casi d'uso.

Nota: puoi anche utilizzare database tradizionali (non vettoriali), semplicemente interrogando un database esistente come Cloud SQL o Firestore e utilizzando il risultato nel prompt del tuo modello.

Albero decisionale che guida l'utente nella scelta della soluzione di database vettoriale adatta alle sue esigenze.

Per iniziare:

Vertex AI Agent Builder (in precedenza Enterprise Search, Gen AI App Builder, Discovery Engine)
Vector Search (in precedenza Matching Engine)
AlloyDB per PostgreSQL
Cloud SQL
BigQuery

Utilizzo delle API

Invece di (o in aggiunta a) utilizzare i tuoi dati per il grounding, molti servizi online offrono API che puoi utilizzare per recuperare i dati di grounding al fine di aumentare il prompt del modello.

Vertex AI Extensions (anteprima privata)

Crea, esegui il deployment e gestisci le estensioni che collegano modelli linguistici di grandi dimensioni (LLM) alle API dei sistemi esterni.

Componenti Langchain

Esplora una varietà di caricatori di documenti e integrazioni API per le tue app di AI generativa, da YouTube a Google Scholar.

grounding in Vertex AI

Se utilizzi modelli ospitati in Vertex AI, puoi basare le risposte del modello utilizzando Vertex AI Search, Ricerca Google o testo in linea/infile.

Inizia a creare

Configurare l'ambiente di sviluppo

Installa gli strumenti necessari per creare un'applicazione di AI generativa su Google Cloud.

Installa Google Cloud CLI

Strumenti a riga di comando per la configurazione di un ambiente di sviluppo locale e per l'interazione con le API Cloud.

Installa l'estensione Cloud Code nel tuo IDE

Visualizza la documentazione e gli esempi delle API nel tuo IDE e velocizza lo sviluppo locale di GKE e Cloud Run.

Configura l'autenticazione

Scopri come eseguire l'autenticazione alle API Google Cloud dal tuo ambiente locale e dai carichi di lavoro ospitati.

Configura LangChain

LangChain è un framework open source per le app di AI generativa che ti consente di integrare un contesto nei tuoi prompt e agire in base alla risposta del modello.

Progettare prompt e valutare i modelli

Scopri le strategie per i prompt e sperimenta diversi modelli.

Introduzione alla progettazione dei prompt

Scopri le strategie per progettare prompt per diversi tipi di dati, da testo e codice alla multimodale.

Vertex AI Studio

Scopri come progettare, testare e gestire i tuoi prompt in Vertex AI Studio.

Esempi di prompt di IA generativa

Visualizza decine di esempi di prompt che riguardano casi d'uso, tra cui classificazione, ideazione e riassunto.

Ideazione con modelli generativi su Vertex AI

Esplora brevi esempi per generare, sviluppare e comunicare nuove idee.

Valutazione dei modelli in Vertex AI

Utilizza Vertex AI per eseguire valutazioni basate sulle metriche o valutazioni affiancate.

Esempi di codice

Crea un fork di un esempio su GitHub e inizia a creare.

Chatbot web: rispondi a domande sul Google Store

Scopri come creare un chatbot per la risposta alle domande basato sul web, utilizzando Vertex AI Agent Builder e Firebase.

App di chat con Eventarc e Vertex AI

Scopri come creare un'applicazione Python Flask semplice che chiama un modello di base preaddestrato in Vertex AI.

Genera una campagna di marketing con Gemini

Crea un'app web per generare idee per le campagne di marketing utilizzando Gemini su Vertex AI, Cloud Run e Streamlit.

App per la risposta alle domande con "The Practitioner's Guide to MLOps"

Scopri come utilizzare Vertex AI Search e LangChain per creare prompt di modelli basati su una fonte di conoscenza verificabile (white paper Google Cloud).

Assistente per le richieste API Weather: chiamata di funzione con Gemini

Scopri come implementare la chiamata di funzione, il processo di utilizzo di un LLM per compilare un corpo della richiesta che puoi quindi inviare a un'API esterna.

Airport Assistant: app Gen AI Databases Retrieval

App di esempio per la generazione aumentata del recupero con AlloyDB per PostgreSQL e Vertex AI. (post del blog, codelab).

Indicazioni architettoniche e soluzioni già pronte

Suggerimenti ed esempi di applicazioni di AI generativa sicure, efficienti, resilienti, ad alte prestazioni ed economicamente convenienti.