Pubblico
Questo tutorial è pensato per iniziare a esplorare e sviluppare applicazioni con l'API Google Cloud Natural Language. È progettato per persone che hanno familiarità con la programmazione di base, anche se non hai molte conoscenze di programmazione, dovresti essere in grado di seguirlo. Dopo aver seguito questo tutorial, dovresti essere in grado di utilizzare la documentazione di riferimento per creare le tue applicazioni di base.
Questo tutorial illustra un'applicazione API Natural Language utilizzando il codice Python. Lo scopo qui non è spiegare le librerie client Python, ma spiegare come effettuare chiamate all'API Natural Language. Le applicazioni in Java e in Node.js sono sostanzialmente simili. Consulta gli esempi dell'API Natural Language per trovare esempi in altri linguaggi (incluso questo esempio all'interno del tutorial).
Prerequisiti
Questo tutorial ha diversi prerequisiti:
- Devi disporre di un account Google Cloud. Se non hai mai utilizzato la piattaforma, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
- Hai configurato un progetto API Cloud Natural Language nella console Google Cloud.
- Hai configurato l'ambiente utilizzando le Credenziali predefinite dell'applicazione.
- Hai familiarità con la programmazione di Python.
- Hai configurato l'ambiente di sviluppo Python. Ti consigliamo di installare sul sistema la versione più recente di Python,
pip
evirtualenv
. Per istruzioni, consulta la guida alla configurazione dell'ambiente di sviluppo in Python per la Google Cloud Platform. - Hai installato la libreria client di Google Cloud per Python
analisi del sentiment del documento
Questo tutorial illustra un'applicazione API Natural Language di base, utilizzando una richiesta analyzeSentiment
, che esegue l'analisi del sentiment sul testo.
L'analisi del sentiment tenta di determinare l'atteggiamento complessivo (positivo o
negativo) ed è rappresentato da valori numerici score
e magnitude
.
Per ulteriori informazioni su questi concetti, consulta
Nozioni di base su Natural Language.
Per prima cosa, mostreremo l'intero codice. (Tieni presente che abbiamo rimosso la maggior parte dei commenti da questo codice per mostrarti quanto è breve. Forniremo ulteriori commenti man mano che esamineremo il codice.)
Questa semplice applicazione esegue le seguenti attività:
- Importa le librerie necessarie per eseguire l'applicazione
- Recupera un file di testo e lo passa alla funzione
main()
- Legge il file di testo ed effettua una richiesta al servizio
- Analizza la risposta del servizio e la mostra all'utente
Esamineremo questi passaggi in maggiore dettaglio di seguito.
Importazione delle librerie
Importiamo argparse
, una libreria standard, per consentire all'applicazione di accettare i nomi file di input come argomenti.
Per utilizzare l'API Cloud Natural Language, sarà necessario importare anche il modulo
language
dalla libreria google-cloud-language
. Il modulo types
contiene le classi necessarie per creare le richieste.
Esecuzione dell'applicazione
In questo caso analizziamo semplicemente l'argomento passato per il nome file di testo e lo passiamo alla funzione analyze()
.
Autenticazione nell'API
Prima di comunicare con il servizio API Natural Language, devi autenticare il servizio utilizzando credenziali acquisite in precedenza. All'interno di un'applicazione, il modo più semplice per ottenere le credenziali è utilizzare le Credenziali predefinite dell'applicazione (ADC). Per impostazione predefinita, ADC tenterà di ottenere le credenziali dal file di ambiente GOOGLE_APPLICATION_CREDENTIALS
, che deve essere impostato in modo da puntare al file di chiavi JSON dell'account di servizio. Devi aver configurato l'account di servizio e l'ambiente per l'utilizzo di ADC nella Guida rapida. Per ulteriori informazioni, consulta Configurazione di un account di servizio.
La libreria client di Google Cloud per Python utilizza automaticamente le credenziali predefinite dell'applicazione.
Richiesta
Ora che il servizio API Natural Language è pronto, possiamo accedervi chiamando il metodo analyze_sentiment
dell'istanza LanguageServiceClient
.
La libreria client incapsula i dettagli relativi alle richieste e alle risposte all'API. Consulta la pagina Riferimento API Natural Language per informazioni complete sulla struttura specifica di questa richiesta.
Questo snippet di codice esegue le seguenti attività:
- Crea un'istanza di un'istanza
LanguageServiceClient
come client. - Legge il nome file contenente i dati di testo in una variabile.
- Crea un'istanza di un oggetto
Document
con i contenuti del file. - Chiama il metodo
analyze_sentiment
del cliente.
Analisi della risposta
Esaminiamo la risposta per estrarre i valori del sentiment score
per ogni
frase, i valori complessivi score
e magnitude
per l'intera recensione
e li mostriamo all'utente.
esegui l'esempio
Per eseguire l'anteprima, lo testeremo su una serie di recensioni di film (fasulli) per il film "Bladerunner".
Scarica gli esempi da Google Cloud Storage:
gsutil cp gs://cloud-samples-tests/natural-language/sentiment-samples.tgz .
In genere
gsutil
viene installato come parte di gcloud CLI. Per installare la versione più recente di gcloud CLI, consulta la documentazione di gcloud CLI.Decomprimi questi esempi, in modo da creare una cartella "reviews":
gunzip sentiment-samples.tgz tar -xvf sentiment-samples.tar
Esegui la nostra analisi del sentiment su uno dei file specificati:
python sentiment_analysis.py reviews/bladerunner-pos.txt Sentence 0 has a sentiment score of 0.8 Sentence 1 has a sentiment score of 0.9 Sentence 2 has a sentiment score of 0.8 Sentence 3 has a sentiment score of 0.2 Sentence 4 has a sentiment score of 0.1 Sentence 5 has a sentiment score of 0.4 Sentence 6 has a sentiment score of 0.3 Sentence 7 has a sentiment score of 0.4 Sentence 8 has a sentiment score of 0.2 Sentence 9 has a sentiment score of 0.9 Overall Sentiment: score of 0.5 with magnitude of 5.5
L'esempio riportato sopra indica una recensione relativamente positiva (punteggio 0.5
) e relativamente emotiva (magnitudine 5.5
).
L'esecuzione dell'analisi sugli altri esempi dovrebbe produrre valori simili a quelli mostrati di seguito:
python sentiment_analysis.py reviews/bladerunner-neg.txt ... Overall Sentiment: score of -0.6 with magnitude of 3.3 python sentiment_analysis.py reviews/bladerunner-mixed.txt ... Overall Sentiment: score of 0 with magnitude of 4.7 python sentiment_analysis.py reviews/bladerunner-neutral.txt ... Overall Sentiment: score of -0.1 with magnitude of 1.8
Tieni presente che le dimensioni sono tutte simili (indicando una quantità relativamente uguale di sentiment emotivamente significativo), tranne il caso "neutro", che indica una recensione con un sentiment emotivo non molto emotivo, positivo o negativo. Per ulteriori informazioni su punteggi e grandezza del sentiment e su come interpretare questi valori, consulta Interpretazione dei valori dell'analisi del sentiment.
Se vuoi esplorare l'analisi del sentiment con più dati, Stanford fornisce un set di dati relativo alle recensioni dei film di IMDB. Per recuperare queste recensioni di film:
- Scarica il set di dati relativo alle recensioni di film di grandi dimensioni.
- Decomprimi il file nella tua directory di lavoro. Le recensioni dei film sono suddivise
in directory
pos
eneg
all'interno delle directory di datitrain
etest
, in cui ogni file di testo contiene una recensione del film. - Esegui lo strumento
sentiment_analysis.py
su qualsiasi file di testo delle recensioni dei film.
Complimenti! Hai eseguito le prime attività di inferenza utilizzando l'API Google Cloud Natural Language.