Tutorial sull'analisi del sentiment

Pubblico

Questo tutorial è stato pensato per consentirti di iniziare rapidamente a esplorare e lo sviluppo di applicazioni con l'API Google Cloud Natural Language. È pensato per chi ha dimestichezza con la programmazione di base, anche se dovresti riuscire a seguire la guida anche senza molte conoscenze in materia. Dopo aver attraversato questo tutorial, dovresti essere in grado di usare Documentazione di riferimento per creare la tua applicazioni di base.

Questo tutorial illustra i passaggi di un'applicazione API Natural Language mediante Python le API nel tuo codice. Lo scopo non è spiegare le librerie client Python, ma spiegare come effettuare chiamate all'API Natural Language. Le applicazioni in Java e Node.js sono essenzialmente simili. Consulta l'API Natural Language Campioni per i campioni in altre lingue (incluso questo esempio nella nel tutorial).

Prerequisiti

Questo tutorial ha diversi prerequisiti:

Analisi del sentiment dei documenti

Questo tutorial illustra un'applicazione API Natural Language di base, utilizzando una richiesta analyzeSentiment, che esegue l'analisi del sentiment sul testo. L'analisi del sentiment cerca di determinare l'atteggiamento complessivo (positivo o negativo) ed è rappresentato dai valori numerici score e magnitude. Per ulteriori informazioni su questi concetti, consulta le Nozioni di base su Natural Language.

Mostreremo prima l'intero codice. Tieni presente che abbiamo rimosso la maggior parte dei commenti questo codice per mostrarti la sua brevità. Forniremo ulteriori commenti esamineremo il codice.

Per ulteriori informazioni sull'installazione e sull'utilizzo della libreria client Google Cloud Natural Language per Python, consulta Librerie client dell'API Natural Language.
"""Demonstrates how to make a simple call to the Natural Language API."""

import argparse

from google.cloud import language_v1



def print_result(annotations):
    score = annotations.document_sentiment.score
    magnitude = annotations.document_sentiment.magnitude

    for index, sentence in enumerate(annotations.sentences):
        sentence_sentiment = sentence.sentiment.score
        print(f"Sentence {index} has a sentiment score of {sentence_sentiment}")

    print(f"Overall Sentiment: score of {score} with magnitude of {magnitude}")
    return 0




def analyze(movie_review_filename):
    """Run a sentiment analysis request on text within a passed filename."""
    client = language_v1.LanguageServiceClient()

    with open(movie_review_filename) as review_file:
        # Instantiates a plain text document.
        content = review_file.read()

    document = language_v1.Document(
        content=content, type_=language_v1.Document.Type.PLAIN_TEXT
    )
    annotations = client.analyze_sentiment(request={"document": document})

    # Print the results
    print_result(annotations)




if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
    )
    parser.add_argument(
        "movie_review_filename",
        help="The filename of the movie review you'd like to analyze.",
    )
    args = parser.parse_args()

    analyze(args.movie_review_filename)

Questa semplice applicazione esegue le seguenti attività:

  • Importa le librerie necessarie per eseguire l'applicazione
  • Prende un file di testo e lo passa alla funzione main()
  • Legge il file di testo ed effettua una richiesta al servizio
  • Analizza la risposta del servizio e la mostra all'utente

Esamineremo questi passaggi in modo più dettagliato di seguito.

Importazione delle librerie

Per ulteriori informazioni sull'installazione e sull'utilizzo della libreria client di Google Cloud Natural Language per Python, consulta Librerie client dell'API Natural Language.
import argparse

from google.cloud import language_v1

Importiamo argparse, una libreria standard, per consentire all'applicazione di accettare i nomi file di input come argomenti.

Per utilizzare l'API Cloud Natural Language, dovremo anche importare il modulo language dalla libreria google-cloud-language. Il modulo types contiene le classi necessarie per la creazione delle richieste.

Esecuzione dell'applicazione

if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
    )
    parser.add_argument(
        "movie_review_filename",
        help="The filename of the movie review you'd like to analyze.",
    )
    args = parser.parse_args()

    analyze(args.movie_review_filename)

Qui, analizziamo semplicemente l'argomento passato per il nome file di testo e lo passiamo la funzione analyze().

Autenticazione nell'API

Prima di comunicare con il servizio API Natural Language, è necessario di autenticare il servizio utilizzando le credenziali acquisite in precedenza. All'interno di un oggetto un'applicazione, il modo più semplice per ottenere le credenziali è usare Credenziali predefinite dell'applicazione (ADC). Per impostazione predefinita, l'ADC tenterà di ottenere le credenziali dal file di ambiente GOOGLE_APPLICATION_CREDENTIALS, che deve essere impostato in modo da puntare al file della chiave JSON dell'account di servizio. (Dovresti aver configurato il servizio e l'ambiente per utilizzare ADC nella Guida rapida. Per ulteriori informazioni, consulta Configurare un account di servizio.

La libreria client di Google Cloud per Python utilizza automaticamente l'applicazione credenziali predefinite.

Effettuare la richiesta

Ora che il servizio dell'API Natural Language è pronto, possiamo accedervi chiamando il metodo analyze_sentiment dell'istanza LanguageServiceClient.

La libreria client contiene i dettagli delle richieste e delle risposte all'API. Consulta le Riferimento all'API Natural Language per il completamento informazioni sulla struttura specifica della richiesta.

Per ulteriori informazioni sull'installazione e sull'utilizzo della libreria client di Google Cloud Natural Language per Python, consulta Librerie client dell'API Natural Language.
def analyze(movie_review_filename):
    """Run a sentiment analysis request on text within a passed filename."""
    client = language_v1.LanguageServiceClient()

    with open(movie_review_filename) as review_file:
        # Instantiates a plain text document.
        content = review_file.read()

    document = language_v1.Document(
        content=content, type_=language_v1.Document.Type.PLAIN_TEXT
    )
    annotations = client.analyze_sentiment(request={"document": document})

    # Print the results
    print_result(annotations)

Questo snippet di codice esegue le seguenti attività:

  1. Crea un'istanza di LanguageServiceClient come client.
  2. Legge il nome del file contenente i dati di testo in una variabile.
  3. Crea un'istanza per un oggetto Document con i contenuti del file.
  4. Chiama il metodo analyze_sentiment del client.

Analizzare la risposta

def print_result(annotations):
    score = annotations.document_sentiment.score
    magnitude = annotations.document_sentiment.magnitude

    for index, sentence in enumerate(annotations.sentences):
        sentence_sentiment = sentence.sentiment.score
        print(f"Sentence {index} has a sentiment score of {sentence_sentiment}")

    print(f"Overall Sentiment: score of {score} with magnitude of {magnitude}")
    return 0

Esaminiamo la risposta per estrarre i valori score del sentiment per ogni frase e i valori score e magnitude complessivi per l'intera recensione, che poi mostriamo all'utente.

Esegui l'esempio

Per eseguire il nostro esempio, lo testeremo su un insieme di recensioni (false) del film "Blade Runner".

  1. Scarica i sample da Google Cloud Storage:

    gcloud storage cp gs://cloud-samples-tests/natural-language/sentiment-samples.tgz .
    

    Per installare la versione più recente di Google Cloud CLI, consulta Documentazione di gcloud CLI.

  2. Decomprimi gli esempi per creare "recensioni" cartella:

    gunzip sentiment-samples.tgz
    tar -xvf sentiment-samples.tar
    
  3. Esegui la nostra analisi del sentiment su uno dei file specificati:

    python sentiment_analysis.py reviews/bladerunner-pos.txt
    Sentence 0 has a sentiment score of 0.8
    Sentence 1 has a sentiment score of 0.9
    Sentence 2 has a sentiment score of 0.8
    Sentence 3 has a sentiment score of 0.2
    Sentence 4 has a sentiment score of 0.1
    Sentence 5 has a sentiment score of 0.4
    Sentence 6 has a sentiment score of 0.3
    Sentence 7 has a sentiment score of 0.4
    Sentence 8 has a sentiment score of 0.2
    Sentence 9 has a sentiment score of 0.9
    Overall Sentiment: score of 0.5 with magnitude of 5.5
    

L'esempio riportato sopra indica una recensione relativamente positiva (punteggio 0.5) e relativamente emotiva (intensità 5.5).

L'analisi degli altri esempi dovrebbe produrre valori simili a quelli come mostrato di seguito:

python sentiment_analysis.py reviews/bladerunner-neg.txt
...
Overall Sentiment: score of -0.6 with magnitude of 3.3

python sentiment_analysis.py reviews/bladerunner-mixed.txt
...
Overall Sentiment: score of 0 with magnitude of 4.7

python sentiment_analysis.py reviews/bladerunner-neutral.txt
...
Overall Sentiment: score of -0.1 with magnitude of 1.8

Tieni presente che le grandezze sono tutte simili (indicano una quantità relativa uguale sentimenti emotivamente significativi) fatta eccezione per i sentiment "neutrali" caso, che indica una recensione con un sentiment non molto emotivo, positivo o negativo. (Per ulteriori informazioni sui punteggi e sulla grandezza del sentiment e su come interpretare questi valori, consulta Interpretazione dei valori dell'analisi del sentiment.)

Se vuoi esplorare l'analisi del sentiment con più dati, la Stanford University fornisce un dataset di recensioni di film di IMDB. Per recuperare queste recensioni di film:

  1. Scarica la recensione del film di grandi dimensioni del set di dati.
  2. Decomprimi il file nella directory di lavoro. Le recensioni dei film sono divise nelle directory pos e neg all'interno delle directory di dati train e test, con ogni file di testo contenente la recensione di un film.
  3. Esegui lo strumento sentiment_analysis.py sui file di testo delle recensioni dei film.

Complimenti! Hai eseguito le tue prime attività di inferenza utilizzando l'API Google Cloud Natural Language.