Menampilkan jawaban secara bertahap

Halaman ini memperkenalkan metode jawaban streaming.

Metode jawaban streaming memiliki banyak fitur yang sama dengan metode answer ditambah satu fitur tambahan: streaming. Saat Anda mengalirkan jawaban, jawaban yang dihasilkan akan dibagi menjadi beberapa bagian yang dikirim secara berurutan.

Jawaban streaming sangat berguna jika jawaban yang dihasilkan panjang, sehingga pengiriman seluruh jawaban sekaligus menyebabkan penundaan. Jawaban streaming mengurangi kemunculan latensi.

Batasan

Metode jawaban streaming memiliki fitur yang sama dengan metode jawaban dengan pengecualian berikut:

  • Jumlah langkah parafrasa adalah satu. Anda tidak dapat menonaktifkan pengubahan kalimat, dan Anda juga tidak dapat mengubah jumlah langkah maksimum.

  • Hanya model Gemini yang dapat digunakan dengan metode jawaban streaming. Untuk mengetahui daftar model, lihat Model yang tersedia.

Menampilkan jawaban secara bertahap

Perintah berikut menunjukkan cara memanggil metode streaming answer dan menampilkan jawaban yang dihasilkan dalam bentuk serangkaian respons JSON. Biasanya, setiap respons berisi satu kalimat jawaban.

Perintah dasar ini hanya menampilkan input yang diperlukan. Opsi dibiarkan pada defaultnya.

Untuk contoh opsi lainnya, lihat Mendapatkan jawaban dan tindak lanjut. Beberapa opsi jawaban tidak tersedia untuk streaming jawaban; lihat batasan di halaman ini.

REST

Untuk menelusuri dan mendapatkan hasil dengan jawaban yang dihasilkan secara streaming, lakukan hal berikut:

  1. Jalankan perintah curl berikut:

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    Ganti kode berikut:

    • PROJECT_ID: ID Google Cloud project Anda.
    • APP_ID: ID aplikasi Vertex AI Search yang ingin Anda kueri.
    • QUERY: string teks bebas yang berisi pertanyaan atau kueri penelusuran. Misalnya, "Database mana yang lebih cepat, bigquery atau spanner?".

Contoh lainnya

Perintah dasar yang ditampilkan di Streaming jawaban adalah perintah paling sederhana tanpa opsi yang ditentukan. Namun, Anda dapat menerapkan opsi yang sama yang tersedia dengan metode answer, kecuali batasan yang tercantum di halaman ini.

Jawaban streaming juga dapat digunakan dengan sesi lanjutan.