L'ottimizzazione del modello è un processo fondamentale per adattare Gemini a svolgere attività specifiche con maggiore precisione. L'ottimizzazione del modello funziona fornendo al modello un set di dati di addestramento contenente un insieme di esempi di attività successive specifiche.
Questa pagina fornisce una panoramica della regolazione del modello per Gemini, descrive le opzioni di regolazione disponibili per Gemini e ti aiuta a determinare quando utilizzare ciascuna opzione di regolazione.
Vantaggi dell'ottimizzazione del modello
L'ottimizzazione del modello è un modo efficace per personalizzare modelli di grandi dimensioni in base alle tue attività. È un passaggio chiave per migliorare la qualità e l'efficienza del modello. L'ottimizzazione del modello offre i seguenti vantaggi:
- Qualità superiore per le tue attività specifiche
- Maggiore robustezza del modello
- Latenza e costi di inferenza inferiori grazie a prompt più brevi
Ottimizzazione rispetto alla progettazione dei prompt
- Prompt con modelli Gemini pre-addestrati: i prompt sono l'arte di creare istruzioni efficaci per guidare i modelli di AI come Gemini nella generazione degli output che preferisci.
Si tratta di progettare prompt che comunichino chiaramente l'attività, il formato che vuoi e qualsiasi contesto pertinente. Puoi utilizzare le funzionalità di Gemini con una configurazione minima.
È ideale per:
- Dati etichettati limitati: se hai una quantità ridotta di dati etichettati o non puoi permetterti un processo di perfezionamento lungo.
- Prototipazione rapida: quando devi testare rapidamente un concetto o ottenere un valore di riferimento per le prestazioni senza investire molto nella messa a punto.
- Ottimizzazione personalizzata dei modelli Gemini: per risultati più personalizzati, Gemini ti consente di ottimizzare i suoi modelli sui tuoi set di dati specifici. Per creare un modello di AI che eccelle nel tuo dominio specifico, valuta la possibilità di eseguire il perfezionamento. Ciò comporta l'addestramento del modello di base sul tuo set di dati etichettato, adattando i relativi pesi all'attività e ai dati. Puoi adattare Gemini ai tuoi casi d'uso. La messa a punto è più efficace quando:
- Disponi di dati etichettati: un set di dati di dimensioni adeguate su cui addestrare il modello (ad esempio 100 o più esempi), che consente al modello di apprendere in modo approfondito le specifiche della tua attività.
- Attività complesse o uniche: per scenari in cui le strategie di prompt avanzate non sono sufficienti ed è essenziale un modello personalizzato in base ai tuoi dati.
Ti consigliamo di iniziare con i prompt per trovare quello ottimale. Poi, passa alla messa a punto (se necessario) per migliorare ulteriormente il rendimento o correggere gli errori ricorrenti. Sebbene l'aggiunta di altri esempi possa essere utile, è importante valutare dove il modello commette errori prima di aggiungere altri dati. Dati di alta qualità ed etichettati correttamente sono fondamentali per un buon rendimento e sono superiori alla quantità. Inoltre, i dati che utilizzi per la messa a punto devono riflettere la distribuzione, il formato e il contesto dei prompt che il modello incontrerà in produzione.
L'ottimizzazione offre i seguenti vantaggi rispetto alla progettazione dei prompt:
- Consente una personalizzazione approfondita del modello e offre prestazioni migliori per attività specifiche.
- Allinea il modello a sintassi, istruzioni e regole semantiche personalizzate specifiche del dominio.
- Offre risultati più coerenti e affidabili.
- In grado di gestire più esempi contemporaneamente.
- Risparmia sui costi durante l'inferenza rimuovendo esempi con pochi esempi e istruzioni lunghe nei prompt
Approcci di ottimizzazione
L'ottimizzazione efficiente dei parametri e la messa a punto completa sono due approcci per personalizzare i modelli di grandi dimensioni. Entrambi i metodi presentano vantaggi e implicazioni in termini di qualità del modello ed efficienza delle risorse.
L'ottimizzazione efficiente dei parametri
L'ottimizzazione efficiente dei parametri, chiamata anche ottimizzazione dell'adattatore, consente di adattare in modo efficiente i modelli di grandi dimensioni alle tue attività o al tuo dominio specifici. L'ottimizzazione efficiente dei parametri aggiorna un sottoinsieme relativamente piccolo dei parametri del modello durante il processo di ottimizzazione.
Per capire in che modo Vertex AI supporta l'ottimizzazione e l'erogazione degli adattatori, puoi trovare maggiori dettagli nel seguente white paper, Adaptation of Large Foundation Models.
Ottimizzazione completa
L'ottimizzazione completa aggiorna tutti i parametri del modello, rendendolo adatto per adattarlo a attività altamente complesse, con il potenziale di ottenere una qualità superiore. Tuttavia, l'ottimizzazione completa richiede risorse di calcolo più elevate sia per l'ottimizzazione sia per la pubblicazione, con un conseguente aumento dei costi complessivi.
Confronto tra l'ottimizzazione efficiente dei parametri e la messa a punto completa
L'ottimizzazione efficiente dei parametri è più efficiente in termini di risorse e costi rispetto all'ottimizzazione completa. Utilizza risorse di calcolo notevolmente inferiori per l'addestramento. È in grado di adattare il modello più rapidamente con un set di dati più piccolo. La flessibilità dell'ottimizzazione in base ai parametri offre una soluzione per l'apprendimento multi-task senza la necessità di un nuovo addestramento approfondito.
Metodi di ottimizzazione supportati
Vertex AI supporta la messa a punto supervisionata per personalizzare i modelli di base.
Ottimizzazione fine supervisionata
La messa a punto fine supervisionata migliora le prestazioni del modello insegnandogli una nuova abilità. I dati che contengono centinaia di esempi etichettati vengono utilizzati per insegnare al modello a imitare un comportamento o un'attività desiderati. Ogni esempio etichettato mostra quanto vuoi che il modello produca durante l'inferenza.
Quando esegui un job di ottimizzazione fine supervisionata, il modello apprende parametri aggiuntivi che lo aiutano a codificare le informazioni necessarie per eseguire l'attività desiderata o apprendere il comportamento desiderato. Questi parametri vengono utilizzati durante l'inferenza. L'output del job di ottimizzazione è un nuovo modello che combina i parametri appena appresi con il modello originale.
L'ottimizzazione fine supervisionata di un modello di testo è una buona opzione quando l'output del modello non è complesso ed è relativamente facile da definire. La messa a punto fine supervisionata è consigliata per la classificazione, l'analisi del sentiment, l'estrazione delle entità, il riepilogo di contenuti non complessi e la scrittura di query specifiche per dominio. Per i modelli di codice, l'ottimizzazione supervisionata è l'unica opzione.
Modelli che supportano l'ottimizzazione fine supervisionata
gemini-1.5-pro-002
(in GA)gemini-1.5-flash-002
(in GA)gemini-1.0-pro-002
(in anteprima, supporta solo la regolazione del testo)
Per ulteriori informazioni sull'utilizzo dell'ottimizzazione fine supervisionata con ciascun rispettivo modello, consulta le seguenti pagine: Ottimizzare i tipi di dati testo, immagine, audio e documento.
Passaggi successivi
- Per scoprire di più sulla funzionalità di comprensione dei documenti dei modelli Gemini, consulta la panoramica della comprensione dei documenti.
- Per iniziare l'ottimizzazione, consulta Ottimizzare i modelli Gemini mediante l'ottimizzazione fine supervisionata
- Per scoprire come la regolazione fine supervisionata può essere utilizzata in una soluzione che crea una knowledge base di AI generativa, consulta la soluzione Jump Start: Knowledge base di IA generativa.