Menampilkan jawaban secara bertahap

Halaman ini memperkenalkan metode jawaban streaming.

Metode jawaban streaming memiliki banyak fitur yang sama dengan metode jawaban ditambah satu fitur tambahan: streaming. Saat Anda menstreaming jawaban, jawaban yang dihasilkan akan dibagi menjadi beberapa bagian yang dikirim secara berurutan.

Streaming jawaban sangat berguna jika jawaban yang dihasilkan panjang, sehingga mengirim seluruh jawaban sekaligus akan menyebabkan penundaan. Streaming jawaban mengurangi tampilan latensi.

Batasan

Metode jawaban streaming memiliki fitur yang sama dengan metode jawaban dengan pengecualian berikut:

  • Jumlah langkah pengungkapan ulang adalah satu. Anda tidak dapat menonaktifkan penyusunan ulang, dan Anda juga tidak dapat mengubah jumlah maksimum langkah.

  • Hanya model Gemini yang dapat digunakan dengan metode jawaban streaming. Untuk mengetahui daftar model, lihat Model yang tersedia.

Menampilkan jawaban secara bertahap

Perintah berikut menunjukkan cara memanggil metode streaming answer dan menampilkan jawaban yang dihasilkan dalam bentuk serangkaian respons JSON. Biasanya, setiap respons berisi satu kalimat jawaban.

Perintah dasar ini hanya menampilkan input yang diperlukan. Opsi dibiarkan pada default-nya.

Untuk contoh opsi lainnya, lihat Mendapatkan jawaban dan tindak lanjut. Beberapa opsi jawaban tidak tersedia untuk streaming jawaban; lihat batasan di halaman ini.

REST

Untuk menelusuri dan mendapatkan hasil dengan jawaban yang dihasilkan yang di-streaming, lakukan hal berikut:

  1. Jalankan perintah curl berikut:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Ganti kode berikut:

    • PROJECT_ID: ID project Google Cloud Anda.
    • APP_ID: ID aplikasi Vertex AI Search yang ingin Anda buat kuerinya.
    • QUERY: string teks bebas yang berisi pertanyaan atau kueri penelusuran. Misalnya, "Database mana yang lebih cepat, bigquery atau spanner?".

Contoh lainnya

Perintah dasar yang ditampilkan di Menstreaming jawaban adalah perintah paling sederhana tanpa opsi yang ditentukan. Namun, Anda dapat menerapkan opsi yang sama yang tersedia dengan metode answer, dengan pengecualian batasan yang tercantum di halaman ini.

Jawaban streaming juga dapat digunakan dengan sesi tindak lanjut.