Panoramica dell'ottimizzazione del modello per Gemini

L'ottimizzazione del modello è un processo fondamentale per adattare Gemini all'esecuzione di attività specifiche con maggiore precisione e precisione. L'ottimizzazione funziona fornendo un modello con un set di dati di addestramento che contiene un insieme di esempi di attività downstream specifiche.

Questa pagina fornisce una panoramica dell'ottimizzazione del modello per Gemini, descrive le opzioni di ottimizzazione disponibili per Gemini e ti aiuta a determinare quando deve essere utilizzata ogni opzione di ottimizzazione.

Vantaggi dell'ottimizzazione del modello

L'ottimizzazione è un modo efficace per personalizzare modelli di grandi dimensioni per le tue attività. È un passaggio fondamentale per migliorare la qualità e l'efficienza del modello. L'ottimizzazione del modello offre i seguenti vantaggi:

  • Qualità superiore per attività specifiche.
  • Maggiore robustezza del modello.
  • Latenza di inferenza e costi inferiori grazie a prompt più brevi.

Ottimizzazione rispetto alla progettazione dei prompt

L'ottimizzazione offre i seguenti vantaggi rispetto alla progettazione dei prompt.

  • Consente una personalizzazione approfondita del modello e migliora le prestazioni per attività specifiche.
  • Offre risultati più coerenti e affidabili.
  • In grado di gestire più esempi contemporaneamente.

L'ottimizzazione efficiente dei parametri

L'ottimizzazione efficiente dei parametri, chiamata anche ottimizzazione degli adattatori, consente un adattamento efficiente dei modelli di grandi dimensioni alle tue attività o al tuo dominio specifici. L'ottimizzazione efficiente dei parametri aggiorna un sottoinsieme relativamente piccolo dei parametri del modello durante il processo di ottimizzazione.

Per capire in che modo Vertex AI supporta l'ottimizzazione e la pubblicazione degli adattatori, puoi trovare ulteriori dettagli in questo white paper, Adaptation of Large Foundation Models.

L'ottimizzazione efficiente dei parametri rispetto alla regolazione completa

L'ottimizzazione efficiente dei parametri e l'ottimizzazione completa sono due approcci alla personalizzazione di modelli di grandi dimensioni. Entrambi i metodi presentano vantaggi e implicazioni in termini di qualità del modello ed efficienza delle risorse.

L'ottimizzazione completa aggiorna tutti i parametri del modello, in modo da adattarlo ad attività altamente complesse con il potenziale di ottenere una qualità superiore. Tuttavia, l'ottimizzazione completa richiede risorse di calcolo più elevate per l'ottimizzazione e la gestione, con un conseguente aumento dei costi complessivi.

L'ottimizzazione efficiente in termini di parametri è più efficiente in termini di risorse e costi rispetto all'ottimizzazione completa. Utilizza risorse di calcolo notevolmente inferiori per l'addestramento. È in grado di adattare il modello più velocemente con un set di dati più piccolo. La flessibilità dell'ottimizzazione efficiente dei parametri offre una soluzione per l'apprendimento multi-tasking senza la esigenza di un riaddestramento esteso.

Vertex AI supporta un'ottimizzazione efficiente dei parametri e completa per modelli diversi in scenari diversi.

Ottimizzazione dei modelli Gemini

I seguenti modelli Gemini supportano l'ottimizzazione supervisionata utilizzando un'ottimizzazione efficiente dei parametri:

  • gemini-1.0-pro-002

Il perfezionamento supervisionato è una buona opzione quando hai un'attività ben definita con dati etichettati disponibili. È particolarmente efficace per le applicazioni specifiche del dominio, in cui la lingua o i contenuti differiscono notevolmente dai dati su cui il modello di grandi dimensioni è stato originariamente addestrato.

L'ottimizzazione supervisionata adatta il comportamento del modello con un set di dati etichettato. Questo processo regola le ponderazioni del modello per ridurre al minimo la differenza tra le sue previsioni e le etichette effettive. Può migliorare le prestazioni del modello per i seguenti tipi di attività:

  • Classificazione
  • Analisi del sentiment
  • Estrazione di entità
  • Riassunto dei contenuti non complessi
  • Scrittura di query specifiche del dominio.

Quota per l'ottimizzazione dei modelli Gemini

La quota viene applicata al numero di job di ottimizzazione simultanei. Ogni progetto include una quota predefinita per eseguire almeno un job di ottimizzazione. Si tratta di una quota globale, condivisa tra tutte le regioni disponibili. Se vuoi eseguire più job contemporaneamente, devi richiedere una quota aggiuntiva per Global concurrent tuning jobs.