비교 기능을 사용하면 다양한 프롬프트, 모델 또는 파라미터 설정에 따라 모델 출력이 어떻게 달라지는지 확인할 수 있습니다. 각 프롬프트와 그에 대한 응답을 나란히 표시하여 다음과 같은 방법으로 비교하고 분석할 수 있습니다.
- 새로운 프롬프트와 사용
- 저장된 다른 프롬프트와 사용
- 정답과 사용
시작하기 전에
비교 기능에 액세스하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 프롬프트 만들기 페이지로 이동합니다.
비교를 선택합니다. 비교 페이지가 표시됩니다.
비교 기능에서 프롬프트 만들기
비교 페이지에서 결과를 비교할 다른 프롬프트를 선택하기 전에 프롬프트를 만들 수 있습니다.
프롬프트를 만들려면 다음 단계를 수행합니다.
새 프롬프트 필드에 프롬프트를 입력합니다.
프롬프트 제출을 클릭합니다. 모델의 응답은 입력한 프롬프트 텍스트 아래에 표시됩니다.
새로 저장을 클릭합니다. 저장 프롬프트 대화상자가 표시됩니다.
프롬프트 이름 필드에 새 프롬프트 이름을 입력합니다.
리전 필드에서 리전을 선택하거나 기본 리전으로 둡니다.
고객 관리 암호화 키(CMEK)가 적용되는 경우 다음을 수행합니다.
- 고객 관리 암호화 키(CMEK) 체크박스를 선택합니다.
- Cloud KMS 키 선택 필드에서 키를 선택합니다.
저장을 클릭하면 저장된 프롬프트 비교 페이지에서 사용할 프롬프트 목록에 프롬프트가 저장됩니다.
프롬프트 제출을 클릭하여 프롬프트와 응답을 비교합니다.
프롬프트를 업데이트하고 업데이트된 버전을 새 프롬프트로 저장할 수 있습니다.
새 프롬프트와 비교
저장된 프롬프트를 새 프롬프트와 비교하려면 다음 단계를 따르세요.
- 새 프롬프트 비교를 클릭합니다. 비교 창이 표시됩니다.
- 선택사항: 모델 전환을 클릭하여 기본 모델과 다른 모델을 사용합니다.
- 선택사항: 출력을 펼칩니다.
- 선택사항: 모델이 JSON과 같은 특정 형식으로 출력되도록 하려면 구조화된 출력 전환 버튼을 클릭합니다. 구조화된 출력을 선택하면 그라운딩 옵션이 사용 중지됩니다. 구조화된 출력에서는 그라운딩이 지원되지 않기 때문입니다.
- 선택사항: 사고 예산을 다음 옵션 중 하나로 변경합니다.
- 자동: 필요한 경우에만 모델이 사고합니다. 모델은 해당 시점에 무엇이 필요한지에 따라 어느 정도로 사고하거나 상황을 분석할지 조정합니다.
- 수동: 사고 예산 토큰을 조정할 수 있습니다.
- 사용 안함: 사고 또는 예산이 사용되지 않습니다.
출력:
- 선택사항: 도구를 펼칩니다.
- 다음 옵션 중 하나를 선택합니다.
- 그라운딩: Google: Google 검색 또는 Google 지도를 사용하는 그라운딩입니다.
- 그라운딩: 내 데이터: Vertex AI RAG Engine, Vertex AI Search 또는 Elasticsearch를 사용하는 그라운딩입니다.
- 그라운딩: 내 데이터를 선택하는 경우 사용할 데이터 소스를 선택합니다.
도구:
- 선택사항: 고급을 펼칩니다.
- 리전을 선택합니다.
- 안전 필터 설정을 선택합니다. 대화상자가 나타납니다. 사용 안함을 기본값으로 유지하거나 다음 옵션 각각에 대해 소수 차단, 일부 차단 또는 대부분 차단을 지정할 수 있습니다.
- 증오심 표현: ID 또는 보호 속성을 대상으로 하는 부정적이거나 유해한 댓글입니다.
- 위험한 콘텐츠: 유해한 상품, 서비스, 활동을 홍보하거나 이에 대한 액세스를 지원합니다.
- 음란물: 성행위 또는 기타 외설적인 콘텐츠에 대한 언급이 포함되어 있습니다.
- 괴롭힘 콘텐츠: 다른 사람을 대상으로 위협하거나 괴롭히거나 모욕하는 악성 댓글입니다.
- 저장을 클릭하여 설정을 저장하고 대화상자를 닫습니다.
- 온도 필드에서 온도를 선택합니다. 온도는 토큰 선택의 무작위성을 제어합니다. 낮은 온도는 참 또는 정답이 예상되는 경우에 적합합니다. 온도가 높을수록 다양하거나 예기치 않은 결과가 발생할 수 있습니다.
- 출력 토큰 한도 필드에서 출력 토큰 한도를 선택합니다. 출력 토큰 한도에 따라 프롬프트 1개의 최대 텍스트 출력량이 달라집니다. 토큰 1개는 약 4자(영문 기준)입니다.
- 최대 응답 수 필드에서 최대 응답 수를 선택합니다. 프롬프트당 생성되는 최대 모델 응답 수입니다. 안전 필터 또는 기타 정책으로 인해 응답이 계속 차단될 수 있습니다.
- Top-P 필드에서 값을 선택합니다. Top-P는 모델이 출력용 토큰을 선택하는 방식을 변경합니다.
- 모델 응답 스트리밍 필드에서 전환 버튼을 클릭합니다. 선택하면 응답이 생성되는 대로 인쇄됩니다.
- 중지 시퀀스 추가 필드에 중지 시퀀스를 입력합니다. 각 시퀀스 후 Enter 키를 누르세요.
고급:
- 저장을 클릭하여 설정 변경사항을 저장합니다.
- 적용을 클릭합니다.
- 프롬프트 제출을 클릭하여 프롬프트와 응답을 비교합니다.
각 모델의 토큰 한도에 대한 자세한 내용은 사고 예산 관리를 참조하세요.
다른 저장된 프롬프트와 비교
저장된 프롬프트를 다른 저장된 프롬프트와 비교하려면 다음 단계를 따르세요.
- 저장된 프롬프트 비교를 클릭합니다. 기존 프롬프트 창이 표시됩니다.
비교할 기존 프롬프트를 최대 2개까지 선택하세요.
- 프롬프트 이름을 선택합니다. 목록에 프롬프트가 많은 경우 필터 필드를 클릭하고 필터링할 속성을 선택합니다. 값을 입력하고 Enter 키를 누릅니다.
- 적용을 클릭합니다. 비교 페이지에는 선택한 프롬프트가 비교를 위해 만든 다른 프롬프트 또는 선택한 프롬프트와 함께 표시됩니다.
프롬프트 제출을 클릭하여 프롬프트와 응답을 비교합니다.
정답과 비교
정답은 프롬프트에 선호되는 답변입니다. 다른 모든 모델 응답이 정답을 기준으로 평가됩니다.
저장된 프롬프트를 정답과 비교하려면 다음 단계를 따르세요.
- 정답을 클릭합니다. 정답 창이 표시됩니다.
- 정답을 입력하여 추가 평가 측정항목을 생성합니다.
- 저장을 클릭하여 정답을 저장합니다.
- 프롬프트 제출을 클릭하여 프롬프트와 응답을 비교합니다.
프롬프트를 정답과 비교할 때 생성되는 평가 측정항목은 선택한 리전의 영향을 받지 않습니다.
다음 단계
- 프롬프트 갤러리에서 프롬프트 예시 살펴보기
- 모델 평가에 관한 자세한 내용은 Gen AI Evaluation Service 개요를 참조하세요.