Introduzione ai dati di testo: crea un set di dati per la classificazione del testo e importa i documenti

Utilizza la console Vertex AI per creare un set di dati per la classificazione del testo. Dopo aver creato il set di dati, utilizza il file CSV che hai copiato nel bucket Cloud Storage per importare i documenti nel set di dati.

Questo tutorial è composto da diverse pagine:

  1. Configura il progetto e l'ambiente.

  2. Creazione di un set di dati per la classificazione del testo .

  3. Addestramento di un modello di classificazione del testo AutoML.

  4. Esegui il deployment del modello in un endpoint e invia una previsione.

  5. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni riportate nelle pagine precedenti del tutorial.

  1. Vai alla console Vertex AI.

  2. Nella pagina Inizia a utilizzare Vertex AI, fai clic su Crea set di dati.

  3. Specifica i dettagli del set di dati.

    1. Specifica un nome per il set di dati, ad esempio text_classification_tutorial.

    2. Nella sezione Seleziona un tipo di dati e un obiettivo, fai clic su Testo e poi seleziona Classificazione del testo (con etichetta singola).

    3. In Regione, seleziona us-central1.

      Questo tutorial utilizza us-central1, ma Vertex AI supporta altre regioni, ad esempio europe-west4.

    4. Fai clic su Crea per creare il set di dati vuoto e poi importare i documenti.

  4. Nella pagina di importazione, seleziona Seleziona file di importazione da Cloud Storage e specifica la posizione di Cloud Storage del tuo file CSV. Suggerimento: fai clic su Sfoglia, seleziona il file happiness.csv nella finestra di dialogo Seleziona oggetto e fai clic su Seleziona.

    Per questo tutorial, il file CSV si trova nel seguente percorso: gs://${BUCKET}/text/happiness.csv. Il bucket per questo tutorial si trova nella stessa regione del set di dati, ma puoi specificare i file che si trovano nei bucket di qualsiasi regione.

  5. Mantieni la suddivisione dei dati Predefinita.

    Vertex AI assegna automaticamente i documenti ai set di addestramento, convalida e test. Per ulteriori informazioni, consulta Informazioni sulle suddivisioni di dati per i modelli AutoML.

  6. Fai clic su Continua per avviare l'importazione.

    Il processo di importazione richiederà alcuni minuti. Al termine dell'importazione, puoi sfogliare tutti i documenti importati e le relative etichette associate nella scheda Sfoglia del set di dati.

Passaggi successivi

Vai alla pagina successiva di questo tutorial per avviare un job di addestramento del modello AutoML.