Guida rapida: creazione di un modello di machine learning utilizzando AutoML Natural Language

Creazione di un modello di machine learning utilizzando AutoML Natural Language

Questa guida rapida illustra come utilizzare AutoML Natural Language per creare un modello di machine learning personalizzato. Puoi creare un modello per classificare i documenti, identificare le entità nei documenti o analizzare il sentiment prevalente in un documento.


Per indicazioni dettagliate su questa attività direttamente in Google Cloud Console, fai clic su Guida:

Procedura guidata


Nelle sezioni seguenti puoi seguire la stessa procedura utilizzata per fare clic su Procedura guidata.

Prima di iniziare

Configura il progetto

Prima di poter utilizzare AutoML Natural Language, devi creare un progetto Google Cloud e abilitare AutoML Natural Language per tale progetto.

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  4. Abilita le API Cloud AutoML and Storage.

    Abilita le API

  5. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  6. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  7. Abilita le API Cloud AutoML and Storage.

    Abilita le API

Obiettivi del modello

AutoML Natural Language può addestrare modelli personalizzati per quattro attività distinte, note come obiettivi del modello:

  • La classificazione a singola etichetta classifica i documenti assegnando loro un'etichetta.
  • La classificazione multi-etichetta consente di assegnare più etichette a un documento
  • L'estrazione delle entità identifica le entità nei documenti.
  • L'analisi del sentiment analizza il sentiment nei documenti.

Per questa guida rapida, puoi scegliere il tipo di modello da creare selezionando uno dei tre set di dati di esempio ospitati in un bucket Cloud Storage pubblico:

  • Per creare un modello di classificazione con etichetta singola, utilizza il set di dati "momenti felici" derivato dal set di dati open source Kaggle HappyDB. Il modello risultante classifica i momenti felici in categorie che riflettono le cause della felicità.

    I dati sono resi disponibili tramite una licenza Creative Commons CCO: Public Domain.

  • Per creare un modello per l'estrazione delle entità, utilizza un corpus di dati astratti della ricerca biomedica che menzionano centinaia di malattie e concetti. Il modello risultante identifica queste entità mediche in altri documenti.

    Questo set di dati è di dominio pubblico come "lavoro del governo degli Stati Uniti", in base ai termini del Copyright Act degli Stati Uniti.

  • Per creare un modello di analisi del sentiment, utilizza il set di dati aperto da FigureEight che analizza le menzioni di Twitter dell'allergia Claritin.

Crea un set di dati

  1. Apri l'interfaccia utente Natural Language di ML e seleziona Inizia nella casella corrispondente al tipo di modello che vuoi addestrare.

  2. Fai clic sul pulsante Nuovo set di dati nella barra del titolo.

  3. Inserisci un nome per il set di dati e seleziona l'obiettivo del modello che corrisponde al set di dati di esempio che hai scelto.

    Lascia il campo Località impostato su Globale.

  4. Nella sezione Importa elementi di testo, scegli Seleziona un file CSV in Cloud Storage e inserisci il percorso del set di dati che vuoi utilizzare nella casella di testo.

    • Per il set di dati"momenti felici": cloud-ml-data/NL-classification/happiness.csv
    • Per il set di dati di ricerca biomedica: cloud-ml-data/NL-entity/dataset.csv
    • Per il set di dati sul sentiment Clatin: cloud-ml-data/NL-sentiment/crowdflower-twitter-claritin-80-10-10.csv

    Il prefisso gs:// viene aggiunto automaticamente. In alternativa, puoi fare clic su Sfoglia e accedere al file CSV.

    Se scegli il set di dati sul sentiment, AutoML Natural Language richiede il valore massimo del sentiment. Il valore massimo per questo set di dati è 4.

  5. Fai clic su Crea set di dati.

    Tornerai alla pagina Set di dati; il set di dati mostrerà un'animazione in corso durante l'importazione dei documenti. Questo processo dovrebbe richiedere circa 10 minuti ogni 1000 documenti, ma potrebbe richiedere più tempo o meno.

    Una volta creato il set di dati, riceverai un messaggio all'indirizzo email associato al progetto.

Addestra il modello

Dopo aver importato correttamente i dati, seleziona il set di dati dalla relativa pagina di elenco per visualizzarne i dettagli. Il nome del set di dati selezionato viene visualizzato nella barra del titolo e la pagina elenca i singoli documenti nel set di dati con le relative etichette. La barra di navigazione a sinistra riassume il numero di documenti etichettati e senza etichetta e consente di filtrare l'elenco di documenti per etichetta.

Pagina degli elementi di testo

  1. Dopo aver rivisto il set di dati, fai clic sulla scheda Addestra appena sotto la barra del titolo.

  2. Fai clic su Inizia addestramento.

  3. Inserisci un nome per il nuovo modello e seleziona la casella di controllo Esegui il deployment del modello al termine dell'addestramento.

  4. Fai clic su Inizia addestramento.

L'addestramento di un modello può richiedere diverse ore. Una volta completato l'addestramento del modello, riceverai un messaggio all'indirizzo email associato al progetto.

Dopo l'addestramento, la parte inferiore della pagina Addestra mostra le metriche di alto livello per il modello, ad esempio precisione e richiamo. Per ulteriori dettagli, fai clic sulla scheda Valutazione.

Uso del modello personalizzato

Dopo aver completato l'addestramento del modello, puoi utilizzarlo per analizzare altri documenti. Fai clic sulla scheda Testa e utilizza subito sotto la barra del titolo. Inserisci il testo nella casella Testo di input o l'URL di un file PDF o TIFF in un bucket Cloud Storage, quindi fai clic su Previsione. AutoML Natural Language analizza il testo utilizzando il tuo modello e visualizza le annotazioni.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

Per evitare addebiti non necessari per Google Cloud Platform, utilizza Google Cloud Console per eliminare il progetto se non ti serve.

Passaggi successivi