Panoramica dell'ottimizzazione del modello per Gemini

L'ottimizzazione del modello è un processo fondamentale per adattare Gemini all'esecuzione di attività specifiche con maggiore precisione e precisione. L'ottimizzazione funziona fornendo un modello con un set di dati di addestramento che contiene un insieme di esempi di attività downstream specifiche.

Questa pagina fornisce una panoramica dell'ottimizzazione del modello per Gemini, descrive le opzioni di ottimizzazione disponibili per Gemini e ti aiuta a determinare quando utilizzare ciascuna opzione di ottimizzazione.

Vantaggi dell'ottimizzazione del modello

L'ottimizzazione è un modo efficace per personalizzare modelli di grandi dimensioni per le tue attività. È un passaggio fondamentale per migliorare la qualità e l'efficienza del modello. L'ottimizzazione del modello offre i seguenti vantaggi:

  • Qualità superiore per attività specifiche.
  • Maggiore robustezza del modello.
  • Latenza di inferenza e costi inferiori grazie a prompt più brevi.

Ottimizzazione rispetto alla progettazione dei prompt

L'ottimizzazione offre i seguenti vantaggi rispetto alla progettazione dei prompt.

  • Consente una personalizzazione approfondita del modello e migliora le prestazioni per attività specifiche.
  • Offre risultati più coerenti e affidabili.
  • In grado di gestire più esempi contemporaneamente.

Approcci di ottimizzazione

L'ottimizzazione efficiente dei parametri e l'ottimizzazione completa sono due approcci alla personalizzazione di modelli di grandi dimensioni. Entrambi i metodi presentano vantaggi e implicazioni in termini di qualità del modello ed efficienza delle risorse.

L'ottimizzazione efficiente dei parametri

L'ottimizzazione efficiente dei parametri, chiamata anche ottimizzazione degli adattatori, consente un adattamento efficiente dei modelli di grandi dimensioni alle tue attività o al tuo dominio specifici. L'ottimizzazione efficiente dei parametri aggiorna un sottoinsieme relativamente piccolo dei parametri del modello durante il processo di ottimizzazione.

Per capire in che modo Vertex AI supporta l'ottimizzazione e la pubblicazione degli adattatori, puoi trovare ulteriori dettagli nel seguente white paper, Adaptation of Large Foundation Models.

Messa a punto completa

L'ottimizzazione completa aggiorna tutti i parametri del modello, in modo da adattarlo ad attività altamente complesse con il potenziale di ottenere una qualità superiore. Tuttavia, l'ottimizzazione completa richiede risorse di calcolo più elevate per l'ottimizzazione e la gestione, con un conseguente aumento dei costi complessivi.

L'ottimizzazione efficiente dei parametri rispetto alla regolazione completa

L'ottimizzazione efficiente in termini di parametri è più efficiente in termini di risorse e costi rispetto all'ottimizzazione completa. Utilizza risorse di calcolo notevolmente inferiori per l'addestramento. È in grado di adattare il modello più velocemente con un set di dati più piccolo. La flessibilità dell'ottimizzazione efficiente dei parametri offre una soluzione per l'apprendimento multi-tasking senza la esigenza di un riaddestramento esteso.

Ottimizzazione dei modelli Gemini

I modelli Gemini (gemini-1.0-pro-002) supportano i seguenti metodi di ottimizzazione:

  • Ottimizzazione supervisionata efficiente dai parametri

    L'ottimizzazione supervisionata è ideale quando hai un'attività ben definita con dati etichettati disponibili. L'ottimizzazione supervisionata adatta il comportamento del modello con un set di dati etichettato. Questo processo regola le ponderazioni del modello per ridurre al minimo la differenza tra le sue previsioni e le etichette effettive.

Quota

La quota viene applicata al numero di job di ottimizzazione simultanei. Ogni progetto include una quota predefinita per eseguire almeno un job di ottimizzazione. Si tratta di una quota globale, condivisa tra tutte le regioni disponibili. Se vuoi eseguire più job contemporaneamente, devi richiedere una quota aggiuntiva per Global concurrent tuning jobs.

Passaggi successivi