Gemini per gli utenti di testo AutoML

Questa pagina fornisce confronti tra testo AutoML e Gemini per aiutare AutoML e gli utenti sanno usare Gemini.

Controlla le tabelle applicabili al tuo caso d'uso e per rivedere le modifiche che potrebbero influire sul flusso di lavoro.

Uso generale

Queste differenze sono applicabili a tutti gli utenti di Gemini.

Operazione AutoML Text Gemini
Formati dei dati di addestramento Puoi utilizzare file CSV o JSON Lines, ad eccezione dell'estrazione delle entità di testo, per includi snippet di testo incorporati o di riferimento a documenti di tipo TXT. L'estrazione delle entità supporta solo i file JSON Lines. Puoi utilizzare solo file JSON Line. Ogni riga del file deve rappresentare un singolo esempio di addestramento. Puoi scaricare un set di dati di esempio per ottimizzare i modelli Gemini. I file devono essere archiviati in Cloud Storage.
Annotazione del set di dati Le annotazioni vengono raggruppate come un oggetto AnnotationSet. Puoi usare set di annotazioni diversi con lo stesso set di dati. Le annotazioni del set di dati non sono applicabili a Gemini.
Importazione del set di dati Puoi specificare i valori di utilizzo del machine learning in una colonna facoltativa per il formato CSV, nella stessa riga come dati; oppure come tag nelle righe JSON nello stesso oggetto JSON dei dati. Se non specifichi valori di utilizzo del ML, i dati vengono suddivisi automaticamente addestramento, test e convalida.
Per l'analisi del sentiment, i file CSV devono includere il valore massimo del sentiment in nell'ultima colonna di ogni riga.
Devi avere due file JSONL separati, uno per l'addestramento e uno per la convalida. Il file di convalida è facoltativo. Il file di convalida deve contenere 10-256 esempi.
Costi di archiviazione Quando crei un set di dati, i tuoi dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più. Quando crei un set di dati, i tuoi dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più
Etichettatura dati Le istruzioni per l'etichettatura vengono fornite utilizzando un URL. Le annotazioni fanno parte l'oggetto Dataset e non può essere manipolato con l'API. L'etichettatura dei dati non è applicabile a Gemini.
Deployment del modello Puoi creare un oggetto Endpoint, che fornisce risorse per per fornire previsioni online. Poi esegui il deployment del modello nell'endpoint. Per richiedere previsioni, chiama il metodo predict() . Dopo aver ottimizzato Gemini, il modello viene archiviato in Vertex AI Model Registry e viene creato automaticamente un endpoint. Le previsioni online dal modello ottimizzato possono essere richieste utilizzando l'SDK Python, l'API REST o la console. Per richiedere le previsioni, devi prima recuperare l'endpoint ottimizzato e poi utilizzare generate_content().
Utilizzo del numero di progetto o dell'ID progetto Sia project-number che project-id funzionano in Vertex AI. Gemini utilizza project-id.

Utenti API

Per informazioni dettagliate sull'API, consulta la documentazione di riferimento dell'API Vertex AI per l'ottimizzazione dell'IA generativa.

Operazione o entità AutoML Text Gemini
Creazione del modello Crei un oggetto TrainingPipeline, che restituisce un un lavoro di addestramento lungo. Puoi creare un job di ottimizzazione supervisionato che restituisce il job di ottimizzazione.
Utilizzo della libreria client Esistono client API diversi per ogni risorsa API. Puoi creare un job di ottimizzazione supervisionato per Gemini utilizzando l'SDK Python, l'API REST o la console.
Richiesta di previsioni Puoi richiedere previsioni chiamando il metodo predict() sulla risorsa Endpoint. Per richiedere le previsioni, devi prima recuperare l'endpoint ottimizzato e poi utilizzare il metodo generate_content.
Endpoint di previsione online Di seguito, sostituisci REGION con la regione del modello di previsione.
REGION-aiplatform.googleapis.com. Ad esempio:
us-central1-aiplatform.googleapis.com
Di seguito, sostituisci TUNING_JOB_REGION con la regione in cui viene eseguito il job di ottimizzazione.
TUNING_JOB_REGION-aiplatform.googleapis.com. Ad esempio:
us-central1-aiplatform.googleapis.com
File di schema e definizione Alcuni campi di richiesta e risposta sono definiti nello schema e nella definizione . I formati dei dati vengono definiti utilizzando file di schema predefiniti. Questo consente la flessibilità per l'API e i formati dei dati. Il corpo della richiesta, i parametri del modello e il corpo della risposta sono gli stessi dei modelli Gemini non ottimizzati. Vedi le richieste di esempio.
Nome host aiplatform.googleapis.com aiplatform.googleapis.com
Nome host regionale Obbligatorio. Ad esempio:
us-central1-aiplatform.googleapis.com
Obbligatorio. Ad esempio:
us-central1-aiplatform.googleapis.com

Passaggi successivi