Gemini per gli utenti di testo AutoML

Questa pagina fornisce confronti tra AutoML text e Gemini per aiutare gli utenti di AutoML text a capire come utilizzare Gemini.

Controlla le tabelle applicabili al tuo caso d'uso e per rivedere le modifiche che potrebbero influire sul flusso di lavoro.

Uso generale

Queste differenze si applicano a tutti gli utenti di Gemini.

Operazione AutoML Text Gemini
Formati dei dati di addestramento Puoi utilizzare file CSV o JSON Lines, ad eccezione dell'estrazione di entità di testo, per includere snippet di testo in linea o fare riferimento a documenti di tipo TXT. L'estrazione delle entità supporta solo i file JSON Lines. Puoi utilizzare solo file JSON Line. Ogni riga del file deve rappresentare un singolo esempio di addestramento. Puoi scaricare un set di dati di esempio per ottimizzare i modelli Gemini. I file devono essere archiviati in Cloud Storage.
Annotazione del set di dati Le annotazioni vengono raggruppate come un oggetto AnnotationSet. Puoi usare set di annotazioni diversi con lo stesso set di dati. Le annotazioni del set di dati non sono applicabili a Gemini.
Importazione del set di dati Specifica i valori di utilizzo dell'IA in una colonna facoltativa per i file CSV, nella stessa riga dei dati oppure come tag in JSON Lines nello stesso oggetto JSON dei dati. Se non specifichi i valori di utilizzo dell'AI, i dati vengono suddivisi automaticamente per l'addestramento, il test e la convalida.
Per l'analisi del sentiment, i file CSV devono includere il valore massimo del sentiment in nell'ultima colonna di ogni riga.
Devi avere due file JSONL separati, uno per l'addestramento e uno per la convalida. Il file di convalida è facoltativo. Il file di convalida deve contenere da 10 a 256 esempi.
Costi di archiviazione Quando crei un set di dati, i dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più. Quando crei un set di dati, i tuoi dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più
Etichettatura dati Fornisci le istruzioni per l'etichettatura utilizzando un URL. Le annotazioni fanno parte dell'oggetto Dataset e non possono essere manipolate utilizzando l'API. La funzionalità di etichettatura dei dati non è applicabile con Gemini.
Deployment del modello Crea un oggetto Endpoint, che fornisce risorse per la pubblicazione di previsioni online. Poi esegui il deployment del modello nell'endpoint. Per richiedere previsioni, chiama il metodo predict() . Dopo aver perfezionato Gemini, il modello viene archiviato in Vertex AI Model Registry e viene creato automaticamente un endpoint. Le previsioni online del modello ottimizzato possono essere richieste utilizzando l'SDK Python, l'API REST o la console. Per richiedere le previsioni, devi prima recuperare l'endpoint ottimizzato e poi utilizzare generate_content().
Utilizzo del numero o dell'ID progetto Sia project-number che project-id funzionano in Vertex AI. Gemini utilizza project-id.
Punteggi di confidenza AutoML Text supporta i punteggi di confidenza. Gemini non supporta i punteggi di confidenza.

Utenti dell'API

Per informazioni dettagliate sull'API, consulta la documentazione di riferimento dell'API Vertex AI per l'ottimizzazione dell'IA generativa.

Operazione o entità Dati di testo AutoML Gemini
Creazione del modello Crei un oggetto TrainingPipeline, che restituisce un un lavoro di addestramento lungo. Puoi creare un job di ottimizzazione supervisionato che restituisce il job di ottimizzazione.
Utilizzo della libreria client Esistono client API diversi per ogni risorsa API. Puoi creare un job di ottimizzazione supervisionata per Gemini utilizzando l'SDK Python, l'API REST o la console.
Richiesta di previsioni Richiedi le previsioni chiamando il metodo predict() nella risorsa Endpoint. Per richiedere le previsioni, devi prima recuperare l'endpoint ottimizzato e poi utilizzare il metodo generate_content.
Endpoint di previsione online Di seguito, sostituisci REGION con la regione del modello di previsione.
REGION-aiplatform.googleapis.com. Ad esempio:
us-central1-aiplatform.googleapis.com
Di seguito, sostituisci TUNING_JOB_REGION con la regione in cui viene eseguito il job di ottimizzazione.
TUNING_JOB_REGION-aiplatform.googleapis.com. Ad esempio:
us-central1-aiplatform.googleapis.com
File di schema e definizione Alcuni campi di richiesta e risposta sono definiti nei file di schema e definizione. I formati dei dati vengono definiti utilizzando file di schema predefiniti. Ciò consente una maggiore flessibilità per l'API e i formati dei dati. Il corpo della richiesta, i parametri del modello e il corpo della risposta sono gli stessi dei modelli Gemini non sintonizzati. Vedi le richieste di esempio.
Nome host aiplatform.googleapis.com aiplatform.googleapis.com
Nome host regionale Obbligatorio. Ad esempio:
us-central1-aiplatform.googleapis.com
Obbligatorio. Ad esempio:
us-central1-aiplatform.googleapis.com

Passaggi successivi