Guida rapida: crea un modello ML utilizzando AutoML Natural Language

Crea un modello ML utilizzando AutoML Natural Language

Questa guida rapida mostra come utilizzare AutoML Natural Language per creare un modello di machine learning personalizzato. Puoi creare un modello per classificare i documenti, identificare le entità nei documenti o analizzare il sentiment prevalente in un documento.


Per seguire le indicazioni dettagliate per questa attività direttamente nella console Google Cloud, fai clic su Procedura guidata:

Procedura guidata


Prima di iniziare

Configura il progetto

Per poter utilizzare AutoML Natural Language, devi prima creare un progetto Google Cloud e abilitare AutoML Natural Language per quel progetto.

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella console di Google Cloud Console, nella pagina del selettore dei progetti, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud. Scopri come verificare se la fatturazione è abilitata per un progetto.

  4. Abilita le API Cloud AutoML and Storage.

    Abilita le API

  5. Nella console di Google Cloud Console, nella pagina del selettore dei progetti, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  6. Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud. Scopri come verificare se la fatturazione è abilitata per un progetto.

  7. Abilita le API Cloud AutoML and Storage.

    Abilita le API

Obiettivi del modello

AutoML Natural Language può addestrare modelli personalizzati per quattro attività distinte, note come obiettivi modello:

  • La classificazione a singola etichetta classifica i documenti assegnando loro un'etichetta
  • La classificazione multi-etichetta consente di assegnare più etichette a un documento.
  • L'estrazione delle entità identifica le entità nei documenti
  • L'analisi del sentiment analizza il sentiment nei documenti

Per questa guida rapida, puoi scegliere il tipo di modello da creare selezionando uno dei tre set di dati di esempio ospitati in un bucket Cloud Storage pubblico:

  • Per creare un modello di classificazione con etichetta singola, utilizza il set di dati "momenti felici" derivato dal set di dati open source Kaggle HappyDB. Il modello risultante classifica i momenti felici in categorie che riflettono le cause della felicità.

    I dati vengono resi disponibili tramite una licenza Creative Commons CCO: Public Domain.

  • Per creare un modello per l'estrazione di un'entità, utilizza un corpus di astratti di ricerca biomedica che menzionano centinaia di malattie e concetti. Il modello risultante identifica queste entità mediche in altri documenti.

    Questo set di dati è di dominio pubblico come "Opera del governo degli Stati Uniti" ai sensi dei termini del Copyright Act degli Stati Uniti.

  • Per creare un modello di analisi del sentiment, utilizza il set di dati aperto di FigureEight che analizza le menzioni di Twitter dell'allergico Claritin.

crea un set di dati

  1. Apri l'interfaccia utente di Natural Language di AutoML e seleziona Inizia nella casella corrispondente al tipo di modello che intendi addestrare.

  2. Fai clic sul pulsante Nuovo set di dati nella barra del titolo.

  3. Inserisci un nome per il set di dati e seleziona l'obiettivo del modello che corrisponde al set di dati di esempio che hai scelto.

    Lascia il campo Località impostato su Globale.

  4. Nella sezione Importa elementi di testo, scegli Seleziona un file CSV in Cloud Storage e inserisci il percorso del set di dati da utilizzare nella casella di testo.

    • Per il set di dati "momenti felici": cloud-ml-data/NL-classification/happiness.csv
    • Per il set di dati della ricerca biomedica: cloud-ml-data/NL-entity/dataset.csv
    • Per il set di dati sul sentiment di Claritin: cloud-ml-data/NL-sentiment/crowdflower-twitter-claritin-80-10-10.csv

    Il prefisso gs:// viene aggiunto automaticamente. In alternativa, puoi fare clic su Sfoglia e andare al file CSV.

    Se scegli il set di dati del sentiment, AutoML Natural Language richiede il valore di sentiment massimo. Il valore massimo per questo set di dati è 4.

  5. Fai clic su Crea set di dati.

    Tornerai alla pagina Set di dati; il tuo set di dati mostrerà un'animazione in corso durante l'importazione dei documenti. Questo processo dovrebbe richiedere circa 10 minuti ogni 1000 documenti, ma potrebbe richiedere più o meno tempo.

    Una volta creato il set di dati, riceverai un messaggio all'indirizzo email associato al progetto.

addestra il modello

Dopo aver importato i dati di addestramento, seleziona il set di dati dalla relativa pagina di elenco per visualizzare i dettagli del set di dati. Il nome del set di dati selezionato viene visualizzato nella barra del titolo, mentre la pagina elenca i singoli documenti nel set di dati con le relative etichette. La barra di navigazione a sinistra riassume il numero di documenti etichettati e non etichettati e ti consente di filtrare l'elenco di documenti per etichetta.

Pagina degli elementi di testo

  1. Quando hai finito di esaminare il set di dati, fai clic sulla scheda Addestra sotto la barra del titolo.

  2. Fai clic su Inizia addestramento.

  3. Inserisci un nome per il nuovo modello e seleziona la casella di controllo Esegui il deployment del modello al termine dell'addestramento.

  4. Fai clic su Inizia addestramento.

L'addestramento di un modello può richiedere diverse ore. Una volta completato l'addestramento del modello, riceverai un messaggio all'indirizzo email associato al progetto.

Dopo l'addestramento, la parte inferiore della pagina Addestra mostra le metriche di alto livello per il modello, come precisione e richiamo. Per visualizzare ulteriori dettagli, fai clic sulla scheda Valutazione.

Uso del modello personalizzato

Dopo aver completato l'addestramento del modello, puoi utilizzarlo per analizzare altri documenti. Fai clic sulla scheda Testa e utilizza appena sotto la barra del titolo. Inserisci il testo nella casella Testo di input o nell'URL di un file PDF o TIFF in un bucket Cloud Storage, quindi fai clic su Previsione. AutoML Natural Language analizza il testo utilizzando il tuo modello e visualizza le annotazioni.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:

Per evitare addebiti non necessari di Google Cloud Platform, utilizza la console Google Cloud per eliminare il tuo progetto se non ti serve.

Passaggi successivi