Hello text data: crea un set di dati di classificazione del testo e importa i documenti

Utilizzare la console Vertex AI per creare un set di dati di classificazione del testo. Dopo il giorno viene creato il set di dati, utilizza il file CSV che hai copiato bucket Cloud Storage per importare questi documenti nel set di dati.

Questo tutorial è composto da varie pagine:

  1. Configura il progetto e l'ambiente.

  2. Creazione di un set di dati di classificazione del testo .

  3. Addestramento di una classificazione di testo AutoML modello.

  4. Esegui il deployment del modello a un endpoint e invia una per la previsione.

  5. È in corso la pulizia del progetto.

Per ogni pagina si presuppone che tu abbia già eseguito le istruzioni dalla pagine precedenti del tutorial.

  1. Vai alla console Vertex AI.

  2. Nella pagina Inizia a utilizzare Vertex AI, fai clic su Crea del set di dati.

  3. Specifica i dettagli del set di dati.

    1. Specifica un nome per questo set di dati, ad esempio text_classification_tutorial.

    2. Nella sezione Seleziona un tipo di dati e un obiettivo, fai clic su Testo e quindi seleziona Classificazione del testo (etichetta singola).

    3. In corrispondenza di Regione, seleziona us-central1.

      Questo tutorial utilizza us-central1, ma Vertex AI supporta altre regioni, ad esempio europe-west4.

    4. Fai clic su Crea per creare il set di dati vuoto e poi importare i documenti.

  4. Nella pagina di importazione, scegli il pulsante Seleziona file di importazione da Cloud Storage e specificare la località di Cloud Storage il file CSV. Suggerimento: fai clic su Sfoglia e seleziona il file happiness.csv. Nella finestra di dialogo Seleziona oggetto e fai clic su Seleziona.

    Per questo tutorial, il file CSV si trova all'indirizzo: gs://${BUCKET}/text/happiness.csv. Il bucket per questo tutorial si trova nella stessa regione del set di dati, ma puoi specificare i file che si trovano in da qualsiasi regione.

  5. Mantieni la suddivisione dati Predefinita.

    Vertex AI assegna automaticamente i documenti all'addestramento, di convalida e test. Per ulteriori informazioni, consulta Informazioni sulle suddivisioni di dati per Modelli AutoML.

  6. Fai clic su Continua per avviare l'importazione.

    Il processo di importazione richiederà alcuni minuti. Al termine dell'importazione, possono sfogliare tutti i documenti importati e le relative etichette associate nella scheda Sfoglia del set di dati.

Passaggi successivi

Segui la pagina successiva di questo tutorial per iniziare un Job di addestramento di modelli AutoML.