Halaman ini diterjemahkan oleh Cloud Translation API.

Tutorial Analisis Sentimen

Audiens

Tutorial ini dirancang untuk memungkinkan Anda secara cepat mulai menjelajahi dan mengembangkan aplikasi dengan Google Cloud Natural Language API. Tutorial ini dirancang untuk orang yang sudah memahami pemrograman dasar, meskipun tanpa banyak pengetahuan pemrograman, Anda seharusnya dapat mengikutinya. Setelah mempelajari tutorial ini, Anda akan dapat menggunakan Dokumentasi referensi untuk membuat aplikasi dasar Anda sendiri.

Tutorial ini menjelaskan langkah-langkah aplikasi Natural Language API menggunakan kode Python. Tujuannya di sini bukan untuk menjelaskan library klien Python, tetapi untuk menjelaskan cara melakukan panggilan ke Natural Language API. Aplikasi di Java dan Node.js pada dasarnya serupa. Lihat Contoh Natural Language API untuk contoh dalam bahasa lain (termasuk contoh ini dalam tutorial).

Prasyarat

Tutorial ini memiliki beberapa prasyarat:

Anda memiliki akun Google Cloud . Jika Anda baru menggunakan platform ini, buat akun untuk mengevaluasi performa produk kami dalam skenario dunia nyata. Pelanggan baru juga mendapatkan kredit gratis senilai $300 untuk menjalankan, menguji, dan men-deploy workload.
Anda telah menyiapkan project Cloud Natural Language API di konsol Google Cloud .
Anda telah menyiapkan lingkungan menggunakan Kredensial Default Aplikasi.
Anda memiliki pemahaman dasar tentang pemrograman Python.
Anda telah menyiapkan lingkungan pengembangan Python. Sebaiknya Anda menginstal Python versi terbaru, pip, dan virtualenv di sistem Anda. Untuk mendapatkan petunjuk, lihat Panduan Penyiapan Lingkungan Pengembangan Python untuk Google Cloud Platform.
Anda telah menginstal Library Klien Google Cloud untuk Python

Menganalisis sentimen dokumen

Tutorial ini akan memandu Anda membuat aplikasi Natural Language API dasar, menggunakan permintaan analyzeSentiment, yang melakukan analisis sentimen pada teks. Analisis sentimen mencoba menentukan sikap keseluruhan (positif atau negatif) dan diwakili oleh nilai numerik score dan magnitude. (Untuk mengetahui informasi selengkapnya tentang konsep ini, lihat Dasar-Dasar Bahasa Alami.)

Kita akan menampilkan seluruh kode terlebih dahulu. (Perhatikan bahwa kami telah menghapus sebagian besar komentar dari kode ini untuk menunjukkan betapa singkatnya kode tersebut. Kami akan memberikan lebih banyak komentar saat membahas kode ini.)

Untuk mengetahui informasi selengkapnya tentang cara menginstal dan menggunakan Library Klien Natural Language Google Cloud untuk Python, lihat Library Klien Natural Language API.

"""Demonstrates how to make a simple call to the Natural Language API."""

import argparse

from google.cloud import language_v1



def print_result(annotations):
    score = annotations.document_sentiment.score
    magnitude = annotations.document_sentiment.magnitude

    for index, sentence in enumerate(annotations.sentences):
        sentence_sentiment = sentence.sentiment.score
        print(f"Sentence {index} has a sentiment score of {sentence_sentiment}")

    print(f"Overall Sentiment: score of {score} with magnitude of {magnitude}")
    return 0




def analyze(movie_review_filename):
    """Run a sentiment analysis request on text within a passed filename."""
    client = language_v1.LanguageServiceClient()

    with open(movie_review_filename) as review_file:
        # Instantiates a plain text document.
        content = review_file.read()

    document = language_v1.Document(
        content=content, type_=language_v1.Document.Type.PLAIN_TEXT
    )
    annotations = client.analyze_sentiment(request={"document": document})

    # Print the results
    print_result(annotations)




if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
    )
    parser.add_argument(
        "movie_review_filename",
        help="The filename of the movie review you'd like to analyze.",
    )
    args = parser.parse_args()

    analyze(args.movie_review_filename)

Aplikasi sederhana ini melakukan tugas-tugas berikut:

Mengimpor library yang diperlukan untuk menjalankan aplikasi
Mengambil file teks dan meneruskannya ke fungsi main()
Membaca file teks dan membuat permintaan ke layanan
Mengurai respons dari layanan dan menampilkannya kepada pengguna

Kita akan membahas langkah-langkah ini secara lebih mendetail di bawah.

Mengimpor library

Untuk mengetahui informasi selengkapnya tentang cara menginstal dan menggunakan Library Klien Natural Language Google Cloud untuk Python, lihat Library Klien Natural Language API.

import argparse

from google.cloud import language_v1

Kita mengimpor argparse, library standar, untuk mengizinkan aplikasi menerima nama file input sebagai argumen.

Untuk menggunakan Cloud Natural Language API, kita juga perlu mengimpor modul language dari library google-cloud-language. Modul types berisi class yang diperlukan untuk membuat permintaan.

Menjalankan aplikasi

if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description=__doc__, formatter_class=argparse.RawDescriptionHelpFormatter
    )
    parser.add_argument(
        "movie_review_filename",
        help="The filename of the movie review you'd like to analyze.",
    )
    args = parser.parse_args()

    analyze(args.movie_review_filename)

Di sini, kita cukup mengurai argumen yang diteruskan untuk nama file teks dan meneruskannya ke fungsi analyze().

Mengautentikasi ke API

Sebelum berkomunikasi dengan layanan Natural Language API, Anda harus mengautentikasi layanan Anda menggunakan kredensial yang diperoleh sebelumnya. Dalam aplikasi, cara termudah untuk mendapatkan kredensial adalah dengan menggunakan Kredensial Default Aplikasi (ADC). Secara default, ADC akan mencoba mendapatkan kredensial dari file lingkungan GOOGLE_APPLICATION_CREDENTIALS, yang harus ditetapkan agar mengarah ke file kunci JSON akun layanan Anda. (Anda seharusnya telah menyiapkan akun layanan dan lingkungan untuk menggunakan ADC di Panduan memulai.) Lihat Menyiapkan Akun Layanan untuk mengetahui informasi selengkapnya.)

Library Klien Google Cloud untuk Python otomatis menggunakan kredensial default aplikasi.

Membuat permintaan

Setelah layanan Natural Language API kami siap, kita dapat mengakses layanan dengan memanggil metode analyze_sentiment dari instance LanguageServiceClient.

Library klien melakukan enkapsulasi detail permintaan dan respons ke API. Lihat Referensi Natural Language API untuk mengetahui informasi lengkap tentang struktur spesifik permintaan tersebut.

Untuk mengetahui informasi selengkapnya tentang cara menginstal dan menggunakan Library Klien Natural Language Google Cloud untuk Python, lihat Library Klien Natural Language API.

def analyze(movie_review_filename):
    """Run a sentiment analysis request on text within a passed filename."""
    client = language_v1.LanguageServiceClient()

    with open(movie_review_filename) as review_file:
        # Instantiates a plain text document.
        content = review_file.read()

    document = language_v1.Document(
        content=content, type_=language_v1.Document.Type.PLAIN_TEXT
    )
    annotations = client.analyze_sentiment(request={"document": document})

    # Print the results
    print_result(annotations)

Cuplikan kode ini melakukan tugas-tugas berikut:

Membuat instance LanguageServiceClient sebagai klien.
Membaca nama file yang berisi data teks ke dalam variabel.
Membuat instance objek Document dengan konten file.
Memanggil metode analyze_sentiment klien.

Mengurai respons

def print_result(annotations):
    score = annotations.document_sentiment.score
    magnitude = annotations.document_sentiment.magnitude

    for index, sentence in enumerate(annotations.sentences):
        sentence_sentiment = sentence.sentiment.score
        print(f"Sentence {index} has a sentiment score of {sentence_sentiment}")

    print(f"Overall Sentiment: score of {score} with magnitude of {magnitude}")
    return 0

Kita akan menelusuri respons untuk mengekstrak nilai sentimen score untuk setiap kalimat, serta nilai score dan magnitude secara keseluruhan untuk seluruh ulasan, dan menampilkannya kepada pengguna.

Menjalankan contoh

Untuk menjalankan contoh, kita akan mengujinya pada sekumpulan ulasan film (palsu) untuk film "Bladerunner".

Download sampel dari Google Cloud Storage:
```
gcloud storage cp gs://cloud-samples-tests/natural-language/sentiment-samples.tgz .
```
Untuk menginstal Google Cloud CLI versi terbaru, lihat dokumentasi gcloud CLI.

Ekstrak sampel tersebut, yang akan membuat folder "reviews":

gunzip sentiment-samples.tgz
tar -xvf sentiment-samples.tar

Jalankan analisis sentimen kami pada salah satu file yang ditentukan:

python sentiment_analysis.py reviews/bladerunner-pos.txt
Sentence 0 has a sentiment score of 0.8
Sentence 1 has a sentiment score of 0.9
Sentence 2 has a sentiment score of 0.8
Sentence 3 has a sentiment score of 0.2
Sentence 4 has a sentiment score of 0.1
Sentence 5 has a sentiment score of 0.4
Sentence 6 has a sentiment score of 0.3
Sentence 7 has a sentiment score of 0.4
Sentence 8 has a sentiment score of 0.2
Sentence 9 has a sentiment score of 0.9
Overall Sentiment: score of 0.5 with magnitude of 5.5

Contoh di atas akan menunjukkan ulasan yang relatif positif (skor 0.5), dan relatif emosional (besarnya 5.5).

Menjalankan analisis pada contoh lainnya akan menghasilkan nilai yang mirip dengan nilai yang ditampilkan di bawah:

python sentiment_analysis.py reviews/bladerunner-neg.txt
...
Overall Sentiment: score of -0.6 with magnitude of 3.3

python sentiment_analysis.py reviews/bladerunner-mixed.txt
...
Overall Sentiment: score of 0 with magnitude of 4.7

python sentiment_analysis.py reviews/bladerunner-neutral.txt
...
Overall Sentiment: score of -0.1 with magnitude of 1.8

Perhatikan bahwa besarnya sentimen semuanya serupa (menunjukkan jumlah sentimen yang signifikan secara emosional yang relatif sama), kecuali untuk kasus "netral", yang menunjukkan ulasan dengan sentimen emosional yang tidak terlalu banyak, baik positif maupun negatif. (Untuk mengetahui informasi selengkapnya tentang skor dan besaran sentimen, serta cara menafsirkan nilai ini, lihat Menafsirkan Nilai Analisis Sentimen.)

Jika Anda ingin mempelajari analisis sentimen dengan lebih banyak data, Stanford menyediakan set data ulasan film IMDB. Untuk mengambil ulasan film ini:

Download set data Large Movie Review.
Ekstrak file ke direktori kerja Anda. Ulasan film dibagi ke dalam direktori pos dan neg dalam direktori data train dan test, dengan setiap file teks berisi satu ulasan film.
Jalankan alat sentiment_analysis.py pada salah satu file teks ulasan film.

Selamat! Anda telah melakukan tugas inferensi pertama menggunakan Google Cloud Natural Language API.