답변 스트리밍

이 페이지에서는 스트리밍 답변 메서드를 소개합니다.

스트리밍 답변 메서드에는 답변 메서드와 동일한 많은 기능과 더불어 스트리밍이라는 추가 기능이 하나 있습니다. 답변을 스트리밍하면 생성된 답변이 여러 부분으로 나뉘어 순차적으로 전송됩니다.

답변 스트리밍은 생성된 답변이 길어 전체 답변을 한 번에 전송하면 지연이 발생하는 경우에 특히 유용합니다. 답변을 스트리밍하면 지연 시간의 노출이 줄어듭니다.

제한사항

스트리밍 답변 메서드는 답변 메서드와 동일한 기능을 제공하지만 다음과 같은 예외가 있습니다.

  • 스트리밍 답변은 영어로만 지원됩니다.

  • 문구 변경 단계 수는 1입니다. 문구 변경을 사용 중지하거나 최대 단계 수를 변경할 수는 없습니다.

  • 스트리밍 답변의 그라운딩 점수를 가져오거나 올바르게 그라운딩된 답변만 반환하도록 선택할 수는 없습니다.

  • Gemini 모델만 스트리밍 대답 메서드와 함께 사용할 수 있습니다. 모델 목록은 사용 가능한 모델을 참고하세요.

답변 스트리밍

다음 명령어는 답변 스트리밍 메서드를 호출하고 생성된 답변을 일련의 JSON 응답 형식으로 반환하는 방법을 보여줍니다. 일반적으로 각 응답에는 답변 문장이 하나 포함됩니다.

이 기본 명령어는 필수 입력만 표시합니다. 옵션은 기본값으로 유지합니다.

다른 옵션의 예는 답변 및 후속 질문 가져오기를 참고하세요. 일부 답변 옵션은 답변 스트리밍에 사용할 수 없습니다. 이 페이지의 제한사항을 참고하세요.

REST

스트리밍된 생성된 답변으로 검색하고 결과를 얻으려면 다음 단계를 따르세요.

  1. 다음 curl 명령어를 실행합니다.

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    다음을 바꿉니다.

    • PROJECT_ID: Google Cloud 프로젝트의 ID입니다.
    • APP_ID: 쿼리할 Vertex AI Search 앱의 ID입니다.
    • QUERY: 질문 또는 검색어를 포함하는 자유 텍스트 문자열입니다. 예: 'BigQuery와 Spanner 중 어느 데이터베이스가 더 빠른가요?'

기타 예

답변 스트리밍에 표시된 기본 명령어는 지정된 옵션이 없는 가장 간단한 명령어입니다. 하지만 이 페이지에 나열된 제한사항을 제외하고 answer 메서드에서 사용할 수 있는 것과 동일한 옵션을 적용할 수 있습니다.

답변 스트리밍은 후속 세션에서도 사용할 수 있습니다.