Questa pagina fornisce confronti tra AutoML text e Gemini per aiutare gli utenti di AutoML text a capire come utilizzare Gemini.
Controlla le tabelle che si applicano al tuo caso d'uso e esamina le modifiche che potrebbero influire sul tuo flusso di lavoro.
Uso generale
Queste differenze si applicano a tutti gli utenti di Gemini.
Operazione | Dati di testo AutoML | Gemini |
---|---|---|
Formati dei dati di addestramento | Puoi utilizzare file CSV o JSON Lines, ad eccezione dell'estrazione di entità di testo, per includere snippet di testo in linea o fare riferimento a documenti di tipo TXT . L'estrazione delle entità supporta solo i file JSON Lines. |
Puoi utilizzare solo file JSON Line. Ogni riga del file deve rappresentare un singolo esempio di addestramento. Puoi scaricare un set di dati di esempio per ottimizzare i modelli Gemini. I file devono essere archiviati in Cloud Storage. |
Annotazione del set di dati |
Le annotazioni sono raggruppate in un oggetto AnnotationSet .
Puoi utilizzare set di annotazioni diversi con lo stesso set di dati.
|
Le annotazioni dei set di dati non sono applicabili con Gemini. |
Importazione set di dati | Specifica i valori di utilizzo dell'IA in una colonna facoltativa per i file CSV, nella stessa riga
dei dati oppure come tag in JSON Lines nello stesso oggetto JSON dei dati. Se
non specifichi i valori di utilizzo dell'AI, i dati vengono suddivisi automaticamente per
l'addestramento, il test e la convalida. Per l'analisi del sentiment, i file CSV devono includere il valore massimo del sentiment nell'ultima colonna di ogni riga. |
Devi avere due file JSONL separati, uno per l'addestramento e uno per la convalida. Il file di convalida è facoltativo. Il file di convalida deve contenere da 10 a 256 esempi. |
Costi di archiviazione | Quando crei un set di dati, i dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più. | Quando crei un set di dati, i dati vengono caricati in Cloud Storage nel tuo progetto. Per tale capacità di archiviazione ti viene addebitato un costo. Scopri di più |
Etichettatura dati |
Fornisci le istruzioni per l'etichettatura utilizzando un URL. Le annotazioni fanno parte
dell'oggetto Dataset e non possono essere manipolate utilizzando l'API.
|
La funzionalità di etichettatura dei dati non è applicabile con Gemini. |
Deployment del modello |
Crea un oggetto Endpoint, che fornisce risorse per la pubblicazione di previsioni online. Poi esegui il deployment del modello nell'endpoint.
Per richiedere le previsioni, chiama il metodo
predict() .
|
Dopo aver perfezionato Gemini, il modello viene archiviato in Vertex AI Model Registry e viene creato automaticamente un endpoint. Le previsioni online del modello ottimizzato possono essere richieste utilizzando l'SDK Python, l'API REST o la console. Richiedi le previsioni recuperando prima l'endpoint ottimizzato e poi utilizzando il metodo
generate_content() . |
Utilizzo del numero o dell'ID progetto |
Sia project-number sia
project-id funzionano in Vertex AI.
|
Gemini utilizza project-id . |
Punteggi di confidenza | Il testo AutoML supporta i punteggi di confidenza. | Gemini non supporta i punteggi di attendibilità. |
Utenti dell'API
Per informazioni dettagliate sull'API, consulta la documentazione di riferimento dell'API Vertex AI Generative AI Tuning.
Operazione o entità | Dati di testo AutoML | Gemini |
---|---|---|
Creazione del modello |
Creando un oggetto TrainingPipeline , viene restituito un
job di addestramento.
|
Creerai un job di ottimizzazione fine supervisionata che restituisce il job di ottimizzazione. |
Utilizzo della libreria client | Esistono client API diversi per ogni risorsa API. | Puoi creare un job di ottimizzazione supervisionata per Gemini utilizzando l'SDK Python, l'API REST o la console. |
Richiesta di previsioni |
Richiedi le previsioni chiamando il metodo
predict()
nella risorsa Endpoint.
|
Richiedi le previsioni recuperando prima l'endpoint ottimizzato e poi utilizzando il metodo generate_content . |
Endpoint di previsione online | Di seguito, sostituisci REGION con la regione in cui si trova il tuo modello di previsione.REGION-aiplatform.googleapis.com .
Ad esempio:us-central1-aiplatform.googleapis.com |
Di seguito, sostituisci TUNING_JOB_REGION con la regione in cui viene eseguito il job di ottimizzazione.TUNING_JOB_REGION-aiplatform.googleapis.com .
Ad esempio:us-central1-aiplatform.googleapis.com |
File di schema e definizione | Alcuni campi di richiesta e risposta sono definiti nei file di schema e definizione. I formati dei dati vengono definiti utilizzando file di schema predefiniti. Ciò consente una maggiore flessibilità per l'API e i formati dei dati. | Il corpo della richiesta, i parametri del modello e il corpo della risposta sono gli stessi dei modelli Gemini non sintonizzati. Consulta le richieste di esempio. |
Nome host | aiplatform.googleapis.com |
aiplatform.googleapis.com |
Nome host regionale | Obbligatorio. Ad esempio:us-central1-aiplatform.googleapis.com |
Obbligatorio. Ad esempio:us-central1-aiplatform.googleapis.com |
Passaggi successivi
Per iniziare a utilizzare l'ottimizzazione, consulta Ottimizzazione dei modelli di testo Gemini