답변 스트리밍

이 페이지에서는 스트리밍 답변 메서드를 소개합니다.

스트리밍 답변 메서드에는 answer 메서드와 동일한 기능이 많이 있으며 스트리밍이라는 추가 기능이 있습니다. 답변을 스트리밍하면 생성된 답변이 순서대로 전송되는 여러 부분으로 나뉩니다.

스트리밍 답변은 생성된 답변이 길어서 전체 답변을 한 번에 전송하면 지연이 발생하는 경우에 특히 유용합니다. 대답을 스트리밍하면 지연 시간이 줄어듭니다.

제한사항

스트리밍 답변 메서드는 다음과 같은 예외를 제외하고 답변 메서드와 동일한 기능을 제공합니다.

  • 바꿔쓰기 단계 수는 1입니다. 재작성을 사용 중지할 수 없으며 최대 단계 수를 변경할 수도 없습니다.

  • 스트리밍 대답 메서드는 Gemini 모델에만 사용할 수 있습니다. 모델 목록은 사용 가능한 모델을 참고하세요.

답변 스트리밍

다음 명령어는 스트리밍 답변 메서드를 호출하고 생성된 답변을 일련의 JSON 응답 형식으로 반환하는 방법을 보여줍니다. 일반적으로 각 대답에는 답변의 한 문장이 포함됩니다.

이 기본 명령어는 필수 입력만 표시합니다. 옵션은 기본값으로 유지합니다.

다른 옵션의 예는 답변 및 후속 질문 받기를 참고하세요. 일부 답변 옵션은 답변 스트리밍에 사용할 수 없습니다. 이 페이지의 제한사항을 참고하세요.

REST

스트리밍된 생성된 답변으로 검색하고 결과를 얻으려면 다음 단계를 따르세요.

  1. 다음 curl 명령어를 실행합니다.

    curl -X POST -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:streamAnswer" \
      -d '{
            "query": { "text": "QUERY"}
          }'
    

    다음을 바꿉니다.

    • PROJECT_ID: Google Cloud 프로젝트의 ID입니다.
    • APP_ID: 쿼리할 Vertex AI Search 앱의 ID입니다.
    • QUERY: 질문 또는 검색어를 포함하는 자유 텍스트 문자열입니다. 예: 'BigQuery와 Spanner 중 어떤 데이터베이스가 더 빠른가요?'

기타 예

답변 스트리밍에 표시된 기본 명령어는 옵션이 지정되지 않은 가장 간단한 명령어입니다. 하지만 이 페이지에 나열된 제한사항을 제외하고 answer 메서드에서 사용할 수 있는 동일한 옵션을 적용할 수 있습니다.

스트리밍 답변은 후속 세션과 함께 사용할 수도 있습니다.