Introduzione all'IA generativa

Questa guida per nuovi utenti ti introduce alle tecnologie di base dell'AI generativa e spiega come queste si integrano per potenziare chatbot e applicazioni. L'IA generativa (nota anche come genAI o genAI) è un campo del machine learning (ML) che sviluppa e utilizza modelli ML per generare nuovi contenuti.

I modelli di IA generativa sono spesso chiamati modelli linguistici di grandi dimensioni (LLM) per le loro grandi dimensioni e la loro capacità di comprendere e generare il linguaggio naturale. Tuttavia, a seconda dei dati con cui vengono addestrati i modelli, questi possono comprendere e generare contenuti da diverse modalità, tra cui testo, immagini, video e audio. I modelli che funzionano con diverse modalità di dati sono chiamati modelli multimodali.

Generazione di contenuti

Affinché i modelli di AI generativa generino contenuti utili nelle applicazioni reali, devono disporre delle seguenti funzionalità:

  • Scopri come eseguire nuove attività:

    I modelli di IA generativa sono progettati per eseguire attività generiche. Se vuoi che un modello esegua attività uniche per il tuo caso d'uso, devi poter essere personalizzato. Su Vertex AI, puoi personalizzare il tuo modello mediante l'ottimizzazione.

  • Accedere a informazioni esterne:

    I modelli di IA generativa vengono addestrati su grandi quantità di dati. Tuttavia, affinché questi modelli siano utili, devono poter accedere alle informazioni al di fuori dei dati di addestramento. Ad esempio, se vuoi creare un chatbot di assistenza clienti basato su un modello di AI generativa, il modello deve avere accesso alle informazioni sui prodotti e servizi che offri. In Vertex AI, le caratteristiche di grounding e chiamata di funzione consentono al modello di accedere alle informazioni esterne.

  • Bloccare contenuti dannosi:

    I modelli di IA generativa potrebbero generare output inaspettati, tra cui testo offensivo o insensibile. Per garantire la sicurezza e prevenire l'uso improprio, i modelli hanno bisogno di filtri di sicurezza per bloccare prompt e risposte ritenuti potenzialmente dannosi. Vertex AI ha funzionalità di sicurezza integrate che promuovono l'uso responsabile dei nostri servizi di IA generativa.

Il seguente diagramma mostra come queste diverse funzionalità interagiscono per generare i contenuti desiderati:

Diagramma del flusso di lavoro dell'IA generativa

Prompt

Prompt

Il flusso di lavoro dell'AI generativa in genere inizia dai prompt. Un prompt è una richiesta in linguaggio naturale inviata a un modello di AI generativa per ottenere una risposta. A seconda del modello, un prompt può contenere testo, immagini, video, audio, documenti e altre modalità o anche più modalità (multimodali).

Creare un prompt per ottenere la risposta desiderata dal modello è una pratica chiamata progettazione dei prompt. Sebbene la progettazione dei prompt sia un processo basato su tentativi ed errori, esistono dei principi e delle strategie di progettazione dei prompt che puoi utilizzare per spingere il modello a comportarsi nel modo desiderato. Vertex AI Studio offre uno strumento di gestione dei prompt per aiutarti a gestirli.

Modelli di base

Modelli di base

I prompt vengono inviati a un modello di AI generativa per la generazione di risposte. Vertex AI offre una varietà di modelli di base di IA generativa accessibili tramite un'API gestita, tra cui:

  • API Gemini: ragionamento avanzato, chat multiturno, generazione di codice e prompt multimodali.
  • API Imagen:generazione di immagini, modifica delle immagini e didascalie visive.
  • MedLM: risposta a domande mediche e riassunto. (GA privata)

I modelli differiscono per dimensioni, modalità e costo. In Model Garden puoi esplorare i modelli Google, nonché quelli aperti e quelli dei partner di Google.

Personalizzazione dei modelli

Personalizzazione dei modelli

Puoi personalizzare il comportamento predefinito dei modelli di base di Google in modo che generino in modo coerente i risultati desiderati senza utilizzare prompt complessi. Questo processo di personalizzazione è chiamato ottimizzazione del modello. L'ottimizzazione del modello consente di ridurre i costi e la latenza delle richieste semplificando i prompt.

Vertex AI offre anche strumenti di valutazione del modello per aiutarti a valutare le prestazioni del tuo modello ottimizzato. Quando il modello ottimizzato è pronto per la produzione, puoi eseguire il deployment in un endpoint e monitorare le prestazioni come nei flussi di lavoro MLOps standard.

Accedi a informazioni esterne

Aumento

Vertex AI offre diversi modi per concedere al modello l'accesso ad API esterne e a informazioni in tempo reale.

  • Grounding: collega le risposte del modello a una fonte attendibile, come i tuoi dati o la ricerca web, contribuendo a ridurre le allucinazioni.
  • RAG: collega i modelli a fonti di conoscenza esterne, come documenti e database, per generare risposte più accurate e informative.
  • Chiamate di funzione: consente al modello di interagire con API esterne per ottenere informazioni in tempo reale ed eseguire attività reali.

Verifica delle citazioni

Verifica delle citazioni

Dopo aver generato la risposta, Vertex AI controlla se nella risposta devono essere incluse delle citazioni. Se una quantità significativa del testo nella risposta proviene da una determinata fonte, questa viene aggiunta ai metadati della citazione nella risposta.

AI responsabile e sicurezza

AI responsabile e sicurezza

L'ultimo livello di controlli a cui vengono sottoposti il prompt e la risposta prima di essere restituiti sono i filtri di sicurezza. Vertex AI controlla sia il prompt che la risposta per verificare in che misura il prompt o la risposta appartengono a una categoria di sicurezza. Se la soglia viene superata per una o più categorie, la risposta viene bloccata e Vertex AI restituisce una risposta di riserva.

Risposta

Risposta

Se il prompt e la risposta superano i controlli del filtro di sicurezza, viene restituita la risposta. In genere, la risposta viene restituita collettivamente. Tuttavia, con Vertex AI puoi anche ricevere le risposte in modo progressivo man mano che vengono generate abilitando i flussi.

Inizia a utilizzare l'AI generativa su Vertex AI