Introduzione all'IA generativa

Questa guida per nuovi utenti illustra le tecnologie di base dell'AI generativa spiegando come si integrano tra loro per potenziare chatbot e applicazioni. L'IA generativa (nota anche come genAI o genAI) è un campo del machine learning (ML) che sviluppa e utilizza modelli di ML per la generazione di nuovi contenuti.

I modelli di IA generativa sono spesso chiamati modelli linguistici di grandi dimensioni (LLM) a causa le loro dimensioni e la loro capacità di comprendere e generare un linguaggio naturale. Tuttavia, a seconda dei dati su cui sono addestrati i modelli, questi possono comprendere e generare contenuti da diverse modalità, tra cui testo, immagini, video e audio. I modelli che funzionano con più modalità di dati vengono chiamati modelli multimodali.

Generazione di contenuti

Affinché i modelli di AI generativa generino contenuti utili nella di applicazioni reali, devono avere le seguenti capacità:

  • Scopri come eseguire nuove attività:

    I modelli di IA generativa sono progettati per eseguire attività generiche. Se desideri di eseguire attività specifiche per il tuo caso d'uso, devi avere in grado di personalizzare il modello. Attivato Vertex AI, puoi personalizzare il tuo modello mediante l'ottimizzazione.

  • Accedere a informazioni esterne:

    I modelli di IA generativa vengono addestrati su grandi quantità di dati. Tuttavia, per perché questi modelli siano utili, devono poter accedere alle informazioni al di fuori dei propri dati di addestramento. Ad esempio, se vuoi creare una un chatbot di assistenza clienti basato su un modello di AI generativa, deve avere accesso alle informazioni sui prodotti e servizi che offerta. In Vertex AI, si usano le chiamate di funzione e il grounding per aiutare il modello ad accedere alle informazioni esterne.

  • Bloccare contenuti dannosi:

    I modelli di IA generativa potrebbero generare output inaspettati, tra cui offensivo o insensibile. Per preservare la sicurezza ed evitare usi impropri, i modelli hanno bisogno di filtri di sicurezza per bloccare prompt e risposte che sono essere considerati potenzialmente dannosi. Vertex AI offre sicurezza integrata che promuovono l'uso responsabile dei nostri servizi di AI generativa.

Il seguente diagramma mostra come queste diverse funzionalità interagiscono tra loro generare i contenuti desiderati:

Diagramma del flusso di lavoro dell'IA generativa

Prompt

Prompt

Il flusso di lavoro dell'AI generativa in genere inizia dai prompt. Un prompt è un una richiesta di linguaggio naturale inviata a un modello di AI generativa per ottenere una risposta. A seconda sul modello, un prompt può contenere testo, immagini video, audio, documenti e altre modalità o anche più modalità (multimodali).

Creare un prompt per ottenere la risposta desiderata dal modello è una pratica chiamata progettazione dei prompt. Sebbene la progettazione dei prompt sia un processo basato su tentativi ed errori, ci sono i principi e le strategie di progettazione dei prompt utilizzabili per sollecitare affinché il modello si comporti nel modo desiderato. Vertex AI Studio offre uno strumento di gestione dei prompt per aiutarti per gestire i tuoi prompt.

Modelli di base

Modelli di base

I prompt vengono inviati a un modello di AI generativa per la generazione di risposte. Vertex AI ha una varietà di modelli di base di IA generativa accessibili tramite un'API gestita, tra cui:

  • API Gemini: ragionamento avanzato, chat in più passaggi generazione di codice e prompt multimodali.
  • API Imagen:generazione di immagini, modifica delle immagini e didascalie visive.
  • MedLM: risposta a domande mediche e riassunto. (GA privata)

I modelli differiscono per dimensioni, modalità e costo. Puoi esplorare le soluzioni Modelli, nonché modelli aperti e modelli dei partner di Google, in Model Garden.

Personalizzazione dei modelli

Personalizzazione dei modelli

Puoi personalizzare il comportamento predefinito dei modelli di base di Google in modo che in modo che generino costantemente i risultati desiderati senza utilizzare complessi personalizzati. Questo processo di personalizzazione è chiamato ottimizzazione del modello. Ottimizzazione del modello ti aiuta a ridurre i costi e la latenza delle richieste consentendoti di semplificheranno i tuoi prompt.

Vertex AI offre anche la valutazione del modello per aiutarti a valutare le prestazioni del modello ottimizzato. Dopo il giorno il modello ottimizzato è pronto per la produzione, puoi eseguire il deployment su un endpoint e monitorare come nei flussi di lavoro MLOps standard.

Accedi a informazioni esterne

Aumento

Vertex AI offre diversi modi per fornire l'accesso del modello alle API esterne e alle informazioni in tempo reale.

  • Circolazione: Collega le risposte del modello a una fonte di riferimento, come i tuoi dati o i dati web ricerche, contribuendo a ridurre le allucinazioni.
  • RAG: Collega i modelli a fonti di conoscenza esterne, come documenti e database, per generare risposte più accurate e informative.
  • Chiamata di funzione: Consente al modello di interagire con API esterne per ottenere informazioni in tempo reale ed eseguire attività reali.

Verifica delle citazioni

Verifica delle citazioni

Dopo aver generato la risposta, Vertex AI controlla se ci sono citazioni deve essere incluso nella risposta. Se una quantità significativa di testo nella risposta proviene da una particolare fonte, che viene aggiunta i metadati della citazione nella risposta.

AI responsabile e sicurezza

AI responsabile e sicurezza

L'ultimo livello di controlli a cui vengono sottoposti prima il prompt e la risposta restituire è la sicurezza filtri. Vertex AI controlla sia il prompt che la risposta per capire come in quanto il prompt o la risposta appartengono a un . Se la soglia viene superata per una o più categorie, il valore la risposta è bloccata e Vertex AI restituisce un fallback risposta.

Risposta

Risposta

Se il prompt e la risposta superano i controlli del filtro di sicurezza, la risposta viene restituito. In genere, la risposta viene restituita collettivamente. Tuttavia, con Vertex AI Inoltre, può ricevere le risposte in maniera progressiva man mano che vengono generate abilitando lo streaming.

Esperienze nella console di Vertex AI Studio

Quando usi Vertex AI Studio con la prova gratuita o senza accedere a Google Cloud, alcune funzionalità non sono disponibili. Per provare Vertex AI Studio, accetta la finestra dei Termini di servizio di Vertex AI Studio nella console Google Cloud.

Utilizza senza un account Google Cloud Utilizza con un account di prova gratuito di Google Cloud Utilizza con un account Google Cloud esistente
Accesso obbligatorio No
Query al minuto (QPM) 2 QPM per tutti i modelli multimodali Visualizzare i limiti di quota Visualizzare i limiti di quota
Crediti offerti 0 $ Fino a 300 € per 90 giorni 0 $
Galleria dei prompt No
Designer del prompt
Salva i prompt No
Cronologia dei prompt No
Parametri avanzati No No
Ottimizzazione No No
Utilizzo delle API No
Fatturazione obbligatoria No No
Come iniziare Vai a Vertex AI Studio Registrati per una prova gratuita Prova Vertex AI Studio nella console

Inizia a utilizzare l'AI generativa su Vertex AI