Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.
Guida rapida: crea un modello ML utilizzando AutoML Natural Language

Crea un modello ML utilizzando AutoML Natural Language

Questa guida rapida mostra come utilizzare AutoML Natural Language per creare un modello di machine learning personalizzato. Puoi creare un modello per classificare i documenti, identificare le entità nei documenti o analizzare il sentiment prevalente di un documento.


Per seguire le istruzioni dettagliate per questa attività direttamente nella console Google Cloud, fai clic su Procedura guidata:

Procedura guidata


Prima di iniziare

Configura il progetto

Prima di poter utilizzare AutoML Natural Language, devi creare un progetto Google Cloud e abilitare AutoML Natural Language per quel progetto.

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  4. Abilita le API Cloud AutoML and Storage.

    Abilita le API

  5. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  6. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  7. Abilita le API Cloud AutoML and Storage.

    Abilita le API

Obiettivi del modello

AutoML Natural Language può addestrare modelli personalizzati per quattro attività distinte, note come obiettivi del modello:

  • La classificazione a singola etichetta classifica i documenti assegnando loro un'etichetta
  • La classificazione multi-etichetta consente di assegnare più etichette a un documento
  • L'estrazione delle entità identifica le entità nei documenti
  • L'analisi del sentiment analizza il sentiment nei documenti

Per questa guida rapida, puoi scegliere il tipo di modello da creare selezionando uno dei tre set di dati di esempio ospitati in un bucket Cloud Storage pubblico:

  • Per creare un modello di classificazione con etichetta singola, utilizza il set di dati "momenti felici" derivato dal set di dati open source Kaggle HappyDB. Il modello risultante classifica i momenti felici in categorie che riflettono le cause della felicità.

    I dati vengono resi disponibili tramite una licenza CCO: Public Domain di Creative Commons.

  • Per creare un modello di estrazione delle entità, usa un corpus di ricerca astratta di biomedicina che menzioni centinaia di malattie e concetti. Il modello risultante identifica queste entità mediche in altri documenti.

    Questo set di dati è di dominio pubblico come "lavoro del governo degli Stati Uniti" in base ai termini del United States Copyright Act.

  • Per creare un modello di analisi del sentiment, utilizza il set di dati aperto di FiguraEight che analizza le menzioni di Twitter della medicina per allergie Claritin.

crea un set di dati

  1. Apri l'interfaccia utente di AutoML Natural Language e seleziona Inizia nella casella corrispondente al tipo di modello che intendi addestrare.

  2. Fai clic sul pulsante Nuovo set di dati nella barra del titolo.

  3. Inserisci un nome per il set di dati e seleziona l'obiettivo del modello che corrisponde al set di dati di esempio che hai scelto.

    Lascia il campo Località impostato su Globale.

  4. Nella sezione Importa elementi di testo, scegli Seleziona un file CSV in Cloud Storage e inserisci il percorso del set di dati da utilizzare nella casella di testo.

    • Per il set di dati "Momenti felici": cloud-ml-data/NL-classification/happiness.csv
    • Per il set di dati di ricerca biomedica: cloud-ml-data/NL-entity/dataset.csv
    • Per il set di dati sul sentiment Claritin: cloud-ml-data/NL-sentiment/crowdflower-twitter-claritin-80-10-10.csv

    Il prefisso gs:// viene aggiunto automaticamente. In alternativa, puoi fare clic su Sfoglia e passare al file CSV.

    Se scegli il set di dati sul sentiment, AutoML Natural Language richiede il valore di sentiment massimo. Il valore massimo per questo set di dati è 4.

  5. Fai clic su Crea set di dati.

    Tornerai alla pagina Set di dati; il set di dati mostrerà un'animazione in corso durante l'importazione dei documenti. Questo processo dovrebbe richiedere circa 10 minuti ogni 1000 documenti, ma potrebbe richiedere più o meno tempo.

    Una volta creato correttamente il set di dati, riceverai un messaggio all'indirizzo email associato al progetto.

addestra il modello

Dopo aver importato i dati di addestramento, seleziona il set di dati dalla relativa pagina dell'elenco per visualizzare i dettagli del set di dati. Il nome del set di dati selezionato viene visualizzato nella barra del titolo, quindi la pagina elenca i singoli documenti nel set di dati con le relative etichette. La barra di navigazione a sinistra riassume il numero di documenti etichettati e non etichettati e ti consente di filtrare l'elenco di documenti per etichetta.

Pagina elementi di testo

  1. Al termine della revisione del set di dati, fai clic sulla scheda Addestra sotto la barra del titolo.

  2. Fai clic su Inizia addestramento.

  3. Inserisci un nome per il nuovo modello e seleziona la casella di controllo Esegui il deployment del modello al termine dell'addestramento.

  4. Fai clic su Inizia addestramento.

L'addestramento di un modello può richiedere diverse ore. Una volta completato l'addestramento del modello, riceverai un messaggio all'indirizzo email associato al progetto.

Dopo l'addestramento, nella parte inferiore della pagina Addestra vengono mostrate metriche di alto livello per il modello, come precisione e identificazione. Per visualizzare ulteriori dettagli, fai clic sulla scheda Valuta.

Uso del modello personalizzato

Dopo aver completato l'addestramento del modello, puoi utilizzarlo per analizzare altri documenti. Fai clic sulla scheda Testa e utilizza appena sotto la barra del titolo. Inserisci il testo nella casella Testo di input o nell'URL di un file PDF o TIFF in un bucket Cloud Storage, quindi fai clic su Previsione. AutoML Natural Language analizza il testo utilizzando il tuo modello e visualizza le annotazioni.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:

Per evitare addebiti non necessari di Google Cloud Platform, utilizza la console Google Cloud per eliminare il tuo progetto quando non ti serve.

Passaggi successivi