Pubblico
Questo tutorial è progettato per consentirti di iniziare rapidamente a esplorare e sviluppare applicazioni con l'API Google Cloud Natural Language. È pensato per chi ha dimestichezza con la programmazione di base, anche se dovresti riuscire a seguire anche senza molte conoscenze in materia. Dopo aver seguito questo tutorial, dovresti essere in grado di utilizzare la documentazione di riferimento per creare le tue applicazioni di base.
Questo tutorial illustra la procedura per creare un'applicazione API Natural Language utilizzando codice Python. Lo scopo non è spiegare le librerie client Python, ma spiegare come effettuare chiamate all'API Natural Language. Le applicazioni in Java e Node.js sono essenzialmente simili. Consulta la sezione Samples dell'API Natural Language per esempi in altre lingue (incluso questo esempio nel tutorial).
Prerequisiti
Questo tutorial ha diversi prerequisiti:
- Devi disporre di un account Google Cloud. Se non conosci la piattaforma, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
- Hai configurato un progetto API Cloud Natural Language nella console Google Cloud.
- Hai configurato il tuo ambiente utilizzando le Credenziali predefinite dell'applicazione.
- Hai una conoscenza di base della programmazione in Python.
- Hai configurato il tuo ambiente di sviluppo Python. Ti consigliamo di installare sul tuo sistema la versione più recente di Python,
pip
evirtualenv
. Per le istruzioni, consulta la Guida alla configurazione dell'ambiente di sviluppo Python per la Google Cloud Platform. - Hai installato la libreria client Google Cloud per Python
Analisi del sentiment dei documenti
Questo tutorial illustra un'applicazione di base dell'API Natural Language, utilizzando una richiesta analyzeSentiment
che esegue l'analisi del sentiment sul testo.
L'analisi del sentiment tenta di determinare l'atteggiamento complessivo (positivo o
negativo) ed è rappresentata da valori numerici score
e magnitude
.
Per ulteriori informazioni su questi concetti, consulta le Nozioni di base su Natural Language.
Prima mostreremo l'intero codice. Tieni presente che abbiamo rimosso la maggior parte dei commenti da questo codice per mostrarti quanto sia breve. Forniremo ulteriori commenti man mano che esamineremo il codice.
Questa semplice applicazione esegue le seguenti attività:
- Importa le librerie necessarie per eseguire l'applicazione
- Prende un file di testo e lo passa alla funzione
main()
- Legge il file di testo ed effettua una richiesta al servizio
- Analizza la risposta del servizio e la mostra all'utente
Esamineremo questi passaggi in modo più dettagliato di seguito.
Importazione di librerie
Importiamo argparse
, una libreria standard, per consentire all'applicazione di accettare come argomenti i nomi dei file di input.
Per utilizzare l'API Cloud Natural Language, dovremo anche importare il modulo language
dalla libreria google-cloud-language
. Il modulo types
contiene le classi necessarie per la creazione delle richieste.
Eseguire l'applicazione
Qui analizziamo semplicemente l'argomento passato per il nome del file di testo e lo passiamo alla funzione analyze()
.
Autenticazione nell'API
Prima di comunicare con il servizio dell'API Natural Language, devi autenticare il servizio utilizzando le credenziali acquisite in precedenza. All'interno di un'applicazione, il modo più semplice per ottenere le credenziali è utilizzare le credenziali predefinite dell'applicazione (ADC). Per impostazione predefinita, ADC tenterà di ottenere le credenziali dal file di ambiente GOOGLE_APPLICATION_CREDENTIALS
, che deve essere impostato in modo da puntare al file della chiave JSON dell'account di servizio. Dovresti aver configurato l'account di servizio e l'ambiente per utilizzare ADC nella guida rapida. Per ulteriori informazioni, consulta Configurare un account di servizio.
La libreria client Google Cloud per Python utilizza automaticamente le credenziali predefinite dell'applicazione.
Effettuare la richiesta
Ora che il servizio dell'API Natural Language è pronto, possiamo accedervi chiamando il metodo analyze_sentiment
dell'istanza LanguageServiceClient
.
La libreria client incapsula i dettagli delle richieste e delle risposte all'API. Consulta la documentazione di riferimento dell'API Natural Language per informazioni complete sulla struttura specifica di una richiesta di questo tipo.
Questo snippet di codice esegue le seguenti attività:
- Crea un'istanza di
LanguageServiceClient
come client. - Legge il nome del file contenente i dati di testo in una variabile.
- Crea un oggetto
Document
con i contenuti del file. - Chiama il metodo
analyze_sentiment
del client.
Analisi della risposta
Esaminiamo la risposta per estrarre i valori score
del sentiment per ogni frase e i valori score
e magnitude
complessivi per l'intera recensione, che poi mostriamo all'utente.
Esegui il sample
Per eseguire il nostro esempio, lo testeremo su un insieme di recensioni (false) del film "Blade Runner".
Scarica i sample da Google Cloud Storage:
gcloud storage cp gs://cloud-samples-tests/natural-language/sentiment-samples.tgz .
Per installare la versione più recente di Google Cloud CLI, consulta la documentazione di gcloud CLI.
Decomprimi i sample, in modo da creare una cartella "reviews":
gunzip sentiment-samples.tgz tar -xvf sentiment-samples.tar
Esegui la nostra analisi del sentiment su uno dei file specificati:
python sentiment_analysis.py reviews/bladerunner-pos.txt Sentence 0 has a sentiment score of 0.8 Sentence 1 has a sentiment score of 0.9 Sentence 2 has a sentiment score of 0.8 Sentence 3 has a sentiment score of 0.2 Sentence 4 has a sentiment score of 0.1 Sentence 5 has a sentiment score of 0.4 Sentence 6 has a sentiment score of 0.3 Sentence 7 has a sentiment score of 0.4 Sentence 8 has a sentiment score of 0.2 Sentence 9 has a sentiment score of 0.9 Overall Sentiment: score of 0.5 with magnitude of 5.5
L'esempio riportato sopra indica una recensione relativamente positiva (punteggio 0.5
) e relativamente emotiva (intensità 5.5
).
L'esecuzione dell'analisi sugli altri esempi dovrebbe produrre valori simili a quelli riportati di seguito:
python sentiment_analysis.py reviews/bladerunner-neg.txt ... Overall Sentiment: score of -0.6 with magnitude of 3.3 python sentiment_analysis.py reviews/bladerunner-mixed.txt ... Overall Sentiment: score of 0 with magnitude of 4.7 python sentiment_analysis.py reviews/bladerunner-neutral.txt ... Overall Sentiment: score of -0.1 with magnitude of 1.8
Tieni presente che le intensità sono tutte simili (indicano una quantità relativamente uguale di sentiment emotivamente significativo) tranne per il caso "neutro", che indica una recensione con un sentiment emotivo non molto elevato, positivo o negativo. Per ulteriori informazioni su punteggi e intensità del sentiment e su come interpretare questi valori, consulta Interpretazione dei valori dell'analisi del sentiment.
Se vuoi esplorare l'analisi del sentiment con più dati, la Stanford University fornisce un dataset di recensioni di film di IMDB. Per recuperare queste recensioni di film:
- Scarica il set di dati di grandi dimensioni per le recensioni di film.
- Decomprimi il file nella directory di lavoro. Le recensioni dei film sono suddivise in directory
pos
eneg
all'interno delle directory di datitrain
etest
, con ogni file di testo contenente una recensione del film. - Esegui lo strumento
sentiment_analysis.py
su uno dei file di testo delle recensioni dei film.
Complimenti! Hai eseguito le tue prime attività di inferenza utilizzando l'API Cloud Natural Language di Google.