Questa pagina è stata tradotta dall'API Cloud Translation.

Introduzione ai dati di testo: crea un set di dati per la classificazione del testo e importa i documenti

A partire dal 15 settembre 2024, potrai personalizzare solo gli scopi di classificazione, estrazione di entità e analisi del sentiment passando ai prompt e alla regolazione di Vertex AI Gemini. L'addestramento o l'aggiornamento dei modelli per Vertex AI AutoML per gli scopi di classificazione del testo, estrazione di entità e analisi del sentiment non sarà più disponibile. Puoi continuare a utilizzare Vertex AI AutoML esistente Modelli di testo fino al 15 giugno 2025. Per un confronto tra AutoML Text e Gemini, vedi Gemini per gli utenti di AutoML Text. Per saperne di più su come Gemini offre un'esperienza utente migliorata tramite funzionalità di richiesta avanzate, consulta Introduzione all'ottimizzazione. Per iniziare a utilizzare l'ottimizzazione, consulta Ottimizzazione dei modelli di testo Gemini

Utilizza la console Vertex AI per creare un set di dati per la classificazione del testo. Dopo aver creato il set di dati, utilizza il file CSV che hai copiato nel bucket Cloud Storage per importare i documenti nel set di dati.

Questo tutorial è composto da varie pagine:

Configurare il progetto e l'ambiente.
Creazione di un set di dati di classificazione del testo .
Addestramento di un modello di classificazione del testo AutoML.
Esegui il deployment del modello a un endpoint e invia una per la previsione.
È in corso la pulizia del progetto.

Per ogni pagina si presuppone che tu abbia già eseguito le istruzioni dalla pagine precedenti del tutorial.

Vai alla console Vertex AI.
Nella pagina Inizia a utilizzare Vertex AI, fai clic su Crea set di dati.
Specifica i dettagli del set di dati.
1. Specifica un nome per questo set di dati, ad esempio text_classification_tutorial.
2. Nella sezione Seleziona un tipo di dati e un obiettivo, fai clic su Testo e quindi seleziona Classificazione del testo (etichetta singola).
3. In Regione, seleziona us-central1.
  
  Questo tutorial utilizza us-central1, ma Vertex AI supporta altre regioni, ad esempio europe-west4.
4. Fai clic su Crea per creare il set di dati vuoto e poi importare i documenti.
Nella pagina di importazione, seleziona Seleziona file di importazione da Cloud Storage e specifica la posizione di Cloud Storage del tuo file CSV. Suggerimento: fai clic su Sfoglia e seleziona il file happiness.csv. Nella finestra di dialogo Seleziona oggetto e fai clic su Seleziona.

Per questo tutorial, il file CSV si trova all'indirizzo: gs://${BUCKET}/text/happiness.csv. Il bucket per questo tutorial si trova nella stessa regione del set di dati, ma puoi specificare i file che si trovano nei bucket di qualsiasi regione.
Mantieni la suddivisione dei dati Predefinita.

Vertex AI assegna automaticamente i documenti all'addestramento, di convalida e test. Per ulteriori informazioni, consulta Informazioni sulle suddivisioni di dati per i modelli AutoML.
Fai clic su Continua per avviare l'importazione.

Il processo di importazione richiederà alcuni minuti. Al termine dell'importazione, possono sfogliare tutti i documenti importati e le relative etichette associate nella scheda Sfoglia del set di dati.

Passaggi successivi

Segui la pagina successiva di questo tutorial per iniziare un Job di addestramento di modelli AutoML.

Indietro

Configurazione del progetto e dell'ambiente

Avanti

Addestra un modello di classificazione di testo AutoML