Panoramica dell'ottimizzazione del modello per Gemini

L'ottimizzazione del modello è un processo cruciale per adattare Gemini al fine di eseguire attività specifiche con maggiore precisione e accuratezza. L'ottimizzazione fornisce al modello un set di dati di addestramento che contiene un insieme di esempi di attività downstream specifiche.

Questa pagina fornisce una panoramica dell'ottimizzazione del modello per Gemini, descrive le opzioni di ottimizzazione disponibili per Gemini e ti aiuta a determinare quando utilizzare ogni opzione di ottimizzazione.

Vantaggi dell'ottimizzazione del modello

L'ottimizzazione del modello è un modo efficace per personalizzare i modelli di grandi dimensioni in base alle tue attività. È un passaggio fondamentale per migliorare la qualità e l'efficienza del modello. L'ottimizzazione del modello offre i seguenti vantaggi:

  • Qualità superiore per attività specifiche.
  • Maggiore robustezza del modello.
  • Riduzione della latenza e dei costi di inferenza grazie a prompt più brevi.

Ottimizzazione rispetto alla progettazione dei prompt

L'ottimizzazione offre i seguenti vantaggi rispetto alla progettazione dei prompt.

  • Consente una profonda personalizzazione del modello e migliora le prestazioni su attività specifiche.
  • Offre risultati più coerenti e affidabili.
  • In grado di gestire più esempi contemporaneamente.

Approcci all'ottimizzazione

L'ottimizzazione efficiente dei parametri e l'ottimizzazione completa sono due approcci alla personalizzazione di modelli di grandi dimensioni. Entrambi i metodi presentano vantaggi e implicazioni in termini di qualità del modello ed efficienza delle risorse.

L'ottimizzazione efficiente dei parametri

L'ottimizzazione efficiente dei parametri, chiamata anche ottimizzazione degli adattatori, consente di adattare in modo efficiente i modelli di grandi dimensioni alle tue attività o al tuo dominio specifici. L'ottimizzazione efficiente dei parametri aggiorna un sottoinsieme relativamente piccolo dei parametri del modello durante il processo di ottimizzazione.

Per capire in che modo Vertex AI supporta l'ottimizzazione e la pubblicazione degli adattatori, puoi trovare maggiori dettagli nel seguente white paper, Adaptation of Large Foundation Models.

Ottimizzazione completa

L'ottimizzazione completa aggiorna tutti i parametri del modello, rendendolo adatto all'adattamento del modello ad attività altamente complesse, con la possibilità di ottenere una qualità superiore. Tuttavia, l'ottimizzazione completa richiede risorse di calcolo più elevate sia per l'ottimizzazione che per la distribuzione, con conseguente aumento dei costi complessivi.

L'ottimizzazione efficiente dei parametri rispetto all'ottimizzazione completa

L'ottimizzazione efficiente dei parametri è più efficiente in termini di risorse ed economicamente conveniente rispetto all'ottimizzazione completa. Utilizza risorse di calcolo significativamente inferiori per l'addestramento. È in grado di adattare il modello più rapidamente con un set di dati più piccolo. La flessibilità dell'ottimizzazione efficiente dei parametri offre una soluzione per l'apprendimento multitasking senza la necessità di riaddestramento esteso.

Ottimizzazione dei modelli Gemini

I modelli Gemini (gemini-1.0-pro-002) supportano i seguenti metodi di ottimizzazione:

  • Ottimizzazione supervisionata (efficiente in termini di parametri)

    L'ottimizzazione supervisionata per i modelli Gemini migliora le prestazioni del modello insegnando una nuova competenza. I dati che contengono centinaia di esempi etichettati vengono usati per insegnare al modello a imitare un comportamento o un'attività desiderati. Ogni esempio etichettato mostra l'output del modello durante l'inferenza.

    L'ottimizzazione supervisionata è ideale quando hai un'attività ben definita con dati etichettati disponibili. L'ottimizzazione supervisionata adatta il comportamento del modello con un set di dati etichettato. Questo processo regola le ponderazioni del modello per ridurre al minimo la differenza tra le previsioni e le etichette effettive.

Quota

La quota viene applicata al numero di job di ottimizzazione simultanei. Ogni progetto include una quota predefinita per eseguire almeno un job di ottimizzazione. Si tratta di una quota globale, condivisa tra tutte le regioni disponibili. Se vuoi eseguire più job contemporaneamente, devi richiedere una quota aggiuntiva per Global concurrent tuning jobs.

Prezzi

L'ottimizzazione supervisionata per gemini-1.0-pro-002 è in anteprima.

  • Mentre l'ottimizzazione è in anteprima, l'ottimizzazione di un modello è senza costi.
  • Dopo aver ottimizzato un modello, si applicano comunque i costi di inferenza per il modello ottimizzato. I prezzi di inferenza sono gli stessi per ogni versione stabile di Gemini 1.0 Pro.

Per ulteriori informazioni, consulta i prezzi di Vertex AI e le versioni dei modelli stabili Gemini disponibili.

Passaggi successivi