Crea un modello ML utilizzando AutoML Natural Language

Questa guida rapida illustra come utilizzare AutoML Natural Language per creare un modello di machine learning personalizzato. Puoi creare un modello per classificare i documenti, identificare le entità nei documenti o analizzare l'atteggiamento emotivo prevalente in un documento.

Prima di iniziare

Configura il progetto

Prima di poter utilizzare AutoML Natural Language, devi creare un progetto Google Cloud e attivare AutoML Natural Language per il progetto.

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  4. Abilita le API Cloud AutoML and Storage.

    Abilita le API

  5. Nella pagina del selettore di progetti della console Google Cloud, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  6. Assicurati che la fatturazione sia attivata per il tuo progetto Google Cloud.

  7. Abilita le API Cloud AutoML and Storage.

    Abilita le API

Obiettivi del modello

AutoML Natural Language può addestrare modelli personalizzati per quattro attività distinte, note come obiettivi del modello:

  • La classificazione con etichetta singola classifica i documenti assegnando loro un'etichetta
  • La classificazione con più etichette consente di assegnare più etichette a un documento
  • L'estrazione delle entità identifica le entità nei documenti
  • L'analisi del sentiment analizza gli atteggiamenti all'interno dei documenti

Per questa guida rapida, puoi scegliere il tipo di modello da creare selezionando uno dei tre set di dati di esempio ospitati in un bucket Cloud Storage pubblico:

  • Per creare un modello di classificazione con etichetta singola, utilizza il set di dati "Momenti felici" derivato dal set di dati open source Kaggle HappyDB. Il modello risultante classifica i momenti felici in categorie che riflettono le cause della felicità.

    I dati sono resi disponibili tramite una licenza Creative Commons CCO: dominio pubblico.

  • Per creare un modello di estrazione delle entità, utilizza un corpus di estratti della ricerca biomedica che menzionano centinaia di malattie e concetti. Il modello risultante identifica queste entità mediche in altri documenti.

    Questo set di dati è nel dominio pubblico come "Lavoro del governo degli Stati Uniti" secondo i termini del Copyright Act degli Stati Uniti.

  • Per creare un modello di analisi del sentiment, utilizza il set di dati aperto di FigureEight che analizza le menzioni del farmaco per allergie Claritin su Twitter.

crea un set di dati

  1. Apri l'interfaccia utente di AutoML Natural Language e seleziona Inizia nella casella corrispondente al tipo di modello che intendi addestrare.

  2. Fai clic sul pulsante Nuovo set di dati nella barra del titolo.

  3. Inserisci un nome per il set di dati e seleziona l'obiettivo del modello che corrisponde al set di dati di esempio che hai scelto.

    Lascia il campo Località impostato su Globale.

  4. Nella sezione Importa elementi di testo, scegli Seleziona un file CSV in Cloud Storage e inserisci il percorso del set di dati da utilizzare nella casella di testo.

    • Per il set di dati "Momenti felici": cloud-ml-data/NL-classification/happiness.csv
    • Per il set di dati di ricerca biomedica: cloud-ml-data/NL-entity/dataset.csv
    • Per il set di dati Claritin Sentiment: cloud-ml-data/NL-sentiment/crowdflower-twitter-claritin-80-10-10.csv

    Il prefisso gs:// viene aggiunto automaticamente. In alternativa, puoi fare clic su Sfoglia e andare al file CSV.

    Se scegli il set di dati sentiment, AutoML Natural Language richiede il valore di sentiment massimo. Il valore massimo per questo set di dati è 4.

  5. Fai clic su Crea set di dati.

    Tornerai alla pagina Set di dati. Il set di dati mostrerà un'animazione in corso durante l'importazione dei documenti. Questo processo dovrebbe richiedere circa 10 minuti ogni 1000 documenti, ma potrebbe richiedere più o meno tempo.

    Una volta creato correttamente il set di dati, riceverai un messaggio all'indirizzo email associato al tuo progetto.

addestra il modello

Dopo aver importato i dati di addestramento, seleziona il set di dati dalla pagina di elenco del set di dati per visualizzarne i dettagli. Il nome del set di dati selezionato viene visualizzato nella barra del titolo e la pagina elenca i singoli documenti nel set di dati insieme alle relative etichette. La barra di navigazione a sinistra riassume il numero di documenti etichettati e non etichettati e ti consente di filtrare l'elenco dei documenti per etichetta.

Pagina Elementi di testo

  1. Una volta completata la revisione del set di dati, fai clic sulla scheda Addestra appena sotto la barra del titolo.

  2. Fai clic su Inizia addestramento.

  3. Inserisci un nome per il nuovo modello e seleziona la casella di controllo Esegui il deployment del modello al termine dell'addestramento.

  4. Fai clic su Inizia addestramento.

L'addestramento di un modello può richiedere diverse ore. Una volta addestrato il modello, riceverai un messaggio all'indirizzo email associato al tuo progetto.

Dopo l'addestramento, nella parte inferiore della pagina Addestra vengono mostrate metriche di alto livello per il modello, come precisione e richiamo. Per visualizzare ulteriori dettagli, fai clic sulla scheda Valuta.

Uso del modello personalizzato

Dopo aver completato l'addestramento del modello, puoi utilizzarlo per analizzare altri documenti. Fai clic sulla scheda Testa e utilizza appena sotto la barra del titolo. Inserisci il testo nella casella Inserisci testo o l'URL di un file PDF o TIFF in un bucket Cloud Storage, quindi fai clic su Previsione. AutoML Natural Language analizza il testo utilizzando il tuo modello e visualizza le annotazioni.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:

Per evitare addebiti non necessari Google Cloud Platform, utilizza la console Google Cloud per eliminare il progetto se non ti serve.

Passaggi successivi