Questa guida introduce i concetti di base dell'AI generativa e il flusso di lavoro per la creazione di applicazioni su Vertex AI, trattando i seguenti argomenti:
Questa guida per principianti introduce le tecnologie di base dell'AI generativa e spiega come si combinano per alimentare chatbot e applicazioni.
L'AI generativa (nota anche come AI gen. o AI gen) è un campo del machine learning (ML) che sviluppa e utilizza modelli di ML per generare nuovi contenuti. I modelli di AI generativa sono spesso chiamati modelli linguistici di grandi dimensioni (LLM) a causa
delle loro grandi dimensioni e della capacità di comprendere e generare il linguaggio naturale.
Tuttavia, a seconda dei dati su cui vengono addestrati, questi modelli possono
comprendere e generare contenuti da più modalità, tra cui testo,
immagini, video e audio. I modelli che funzionano con più modalità di dati sono
chiamati modelli multimodali. Google fornisce la famiglia di modelli di AI generativa Gemini progettati per casi d'uso multimodali, in grado di elaborare informazioni da più modalità, tra cui immagini, video e testo. Affinché i modelli di AI generativa possano generare contenuti utili in
applicazioni reali, devono disporre delle seguenti funzionalità: Il seguente diagramma riassume il flusso di lavoro generale: Il flusso di lavoro dell'AI generativa inizia in genere con un prompt. Un prompt è una richiesta in linguaggio naturale inviata a un modello di AI generativa per ottenere una risposta. A seconda del modello, un prompt può contenere testo, immagini, video, audio, documenti o più modalità (multimodale). Ad esempio, un semplice prompt di testo potrebbe essere: La creazione di un prompt per ottenere la risposta desiderata dal modello è una pratica chiamata progettazione dei prompt. Sebbene la progettazione dei prompt sia un processo di tentativi ed errori, esistono principi e strategie di progettazione dei prompt che puoi utilizzare per spingere il modello a comportarsi nel modo desiderato. Vertex AI Studio offre uno strumento di gestione dei prompt per aiutarti a gestirli. I prompt vengono inviati a un modello di AI generativa per la generazione di risposte. Vertex AI offre una serie di modelli di base di AI generativa accessibili tramite un'API gestita. I modelli differiscono per dimensioni, modalità e costi. La tabella seguente fornisce una panoramica generale: Puoi esplorare i modelli di Google, nonché i modelli aperti e quelli dei partner di Google, in Model Garden. Puoi personalizzare il comportamento predefinito dei modelli di base di Google in modo che generino costantemente i risultati desiderati senza utilizzare prompt complessi. Questo processo di personalizzazione è chiamato ottimizzazione del modello. La messa a punto del modello ti aiuta a ridurre il costo e la latenza delle tue richieste consentendoti di semplificare i prompt. Vertex AI offre anche strumenti di valutazione dei modelli per aiutarti a valutare le prestazioni del modello ottimizzato. Una volta che il modello ottimizzato è pronto per la produzione, puoi eseguirne il deployment in un endpoint e monitorare le prestazioni come nei flussi di lavoro MLOps standard. Vertex AI offre diversi modi per consentire al modello di accedere ad API esterne e informazioni in tempo reale. Dopo aver generato la risposta, Vertex AI verifica se è necessario includere le citazioni. Se una parte significativa del testo della risposta proviene da una determinata fonte, questa viene aggiunta ai metadati della citazione nella risposta. L'ultimo livello di controlli a cui vengono sottoposti il prompt e la risposta prima di essere restituiti sono i filtri di sicurezza. Vertex AI controlla sia il prompt che la risposta per verificare in che misura il prompt o la risposta appartengono a una categoria di sicurezza. Se la soglia viene superata per una o più categorie, la risposta viene bloccata e Vertex AI restituisce una risposta di riserva. Se il prompt e la risposta superano i controlli del filtro di sicurezza, la risposta viene restituita. In genere, la risposta viene restituita tutta in una volta. Tuttavia, con Vertex AI puoi anche ricevere risposte in modo progressivo man mano che vengono generate attivando lo streaming. Prova una di queste guide rapide per iniziare a utilizzare l'AI generativa su
Vertex AI.
Utilizza l'SDK per inviare richieste all'API Vertex AI Gemini.
Testa i prompt senza alcuna configurazione richiesta.
Crea un'immagine con filigrana utilizzando Imagen su Vertex AI.
Concetti
Generazione di contenuti
Prompt
"Summarize the following article in three bullet points: [article text]"
Modelli di base
Famiglia di modelli
Caso d'uso principale
API Gemini
Ragionamento avanzato, chat multi-turno, generazione di codice e prompt multimodali (testo, immagini, video, audio).
API Imagen
Generazione, modifica e sottotitolaggio visivo di immagini di alta qualità.
MedLM (deprecato)
Risposte a domande mediche e riepilogo.
Personalizzazione dei modelli
Accedere a informazioni esterne
Opzione
Descrizione
Caso d'uso
Grounding
Collega le risposte del modello a una fonte attendibile, ad esempio i tuoi dati o la ricerca sul web.
Ridurre le allucinazioni e migliorare l'accuratezza dei fatti collegando le risposte a dati specifici.
Retrieval-Augmented Generation (RAG)
Collega i modelli a fonti di conoscenza esterne, come documenti e database.
Genera risposte più accurate e informative recuperando informazioni pertinenti da grandi knowledge base.
Chiamata di funzione
Consente al modello di interagire con API esterne.
Ricevi informazioni in tempo reale (ad es. meteo, quotazioni azionarie) o esegui attività nel mondo reale (ad es. prenotare un volo, inviare un'email).
Verifica delle citazioni
AI responsabile e sicurezza
Risposta
Inizia
Guida per principianti all'IA generativa
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-08-19 UTC.