Utenti di Gemini per il testo AutoML

Questa pagina fornisce confronti tra AutoML text e Gemini per aiutare gli utenti di AutoML text a capire come utilizzare Gemini.

Controlla le tabelle che si applicano al tuo caso d'uso e esamina le modifiche che potrebbero influire sul tuo flusso di lavoro.

Uso generale

Queste differenze si applicano a tutti gli utenti di Gemini.

Operazione Dati di testo AutoML Gemini
Formati dei dati di addestramento Puoi utilizzare file CSV o JSON Lines, ad eccezione dell'estrazione di entità di testo, per includere snippet di testo in linea o fare riferimento a documenti di tipo TXT. L'estrazione delle entità supporta solo i file JSON Lines. Puoi utilizzare solo file JSON Line. Ogni riga del file deve rappresentare un singolo esempio di addestramento. Puoi scaricare un set di dati di esempio per ottimizzare i modelli Gemini. I file devono essere archiviati in Cloud Storage.
Annotazione del set di dati Le annotazioni sono raggruppate in un oggetto AnnotationSet. Puoi utilizzare set di annotazioni diversi con lo stesso set di dati. Le annotazioni dei set di dati non sono applicabili con Gemini.
Importazione set di dati Specifica i valori di utilizzo dell'IA in una colonna facoltativa per i file CSV, nella stessa riga dei dati oppure come tag in JSON Lines nello stesso oggetto JSON dei dati. Se non specifichi i valori di utilizzo dell'AI, i dati vengono suddivisi automaticamente per l'addestramento, il test e la convalida.
Per l'analisi del sentiment, i file CSV devono includere il valore massimo del sentiment nell'ultima colonna di ogni riga.
Devi avere due file JSONL separati, uno per l'addestramento e uno per la convalida. Il file di convalida è facoltativo. Il file di convalida deve contenere da 10 a 256 esempi.
Costi di archiviazione Quando crei un set di dati, i dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più. Quando crei un set di dati, i dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più
Etichettatura dati Fornisci le istruzioni per l'etichettatura utilizzando un URL. Le annotazioni fanno parte dell'oggetto Dataset e non possono essere manipolate utilizzando l'API. La funzionalità di etichettatura dei dati non è applicabile con Gemini.
Deployment del modello Crea un oggetto Endpoint, che fornisce risorse per la pubblicazione di previsioni online. Poi esegui il deployment del modello nell'endpoint. Per richiedere le previsioni, chiama il metodo predict(). Dopo aver perfezionato Gemini, il modello viene archiviato in Vertex AI Model Registry e viene creato automaticamente un endpoint. Le previsioni online del modello ottimizzato possono essere richieste utilizzando l'SDK Python, l'API REST o la console. Richiedi le previsioni recuperando prima l'endpoint ottimizzato e poi utilizzando il metodo generate_content().
Utilizzo del numero o dell'ID progetto Sia project-number sia project-id funzionano in Vertex AI. Gemini utilizza project-id.
Punteggi di confidenza Il testo AutoML supporta i punteggi di confidenza. Gemini non supporta i punteggi di attendibilità.

Utenti dell'API

Per informazioni dettagliate sull'API, consulta la documentazione di riferimento dell'API Vertex AI Generative AI Tuning.

Operazione o entità Dati di testo AutoML Gemini
Creazione del modello Creando un oggetto TrainingPipeline, viene restituito un job di addestramento. Creerai un job di ottimizzazione fine supervisionata che restituisce il job di ottimizzazione.
Utilizzo della libreria client Esistono client API diversi per ogni risorsa API. Puoi creare un job di ottimizzazione supervisionata per Gemini utilizzando l'SDK Python, l'API REST o la console.
Richiesta di previsioni Richiedi le previsioni chiamando il metodo predict() nella risorsa Endpoint. Richiedi le previsioni recuperando prima l'endpoint ottimizzato e poi utilizzando il metodo generate_content.
Endpoint di previsione online Di seguito, sostituisci REGION con la regione in cui si trova il tuo modello di previsione.
REGION-aiplatform.googleapis.com. Ad esempio:
us-central1-aiplatform.googleapis.com
Di seguito, sostituisci TUNING_JOB_REGION con la regione in cui viene eseguito il job di ottimizzazione.
TUNING_JOB_REGION-aiplatform.googleapis.com. Ad esempio:
us-central1-aiplatform.googleapis.com
File di schema e definizione Alcuni campi di richiesta e risposta sono definiti nei file di schema e definizione. I formati dei dati vengono definiti utilizzando file di schema predefiniti. Ciò consente una maggiore flessibilità per l'API e i formati dei dati. Il corpo della richiesta, i parametri del modello e il corpo della risposta sono gli stessi dei modelli Gemini non sintonizzati. Consulta le richieste di esempio.
Nome host aiplatform.googleapis.com aiplatform.googleapis.com
Nome host regionale Obbligatorio. Ad esempio:
us-central1-aiplatform.googleapis.com
Obbligatorio. Ad esempio:
us-central1-aiplatform.googleapis.com

Passaggi successivi