MedLM API

면책 조항: Vertex AI 기반 MedLM은 허용 목록 고객들에게 제공됩니다. 이번 허용 목록 GA 출시 버전(미국 전용 GA)은 의료용 Q&A와 의료 요약 용도에 중점을 둡니다. MedLM API를 사용하면 생성형 AI 금지 사용 정책 및 Google Cloud Platform 서비스별 약관에 동의하고 MedLM 사용과 관련해서 모든 규제 문의에 대해 공개적으로 소통하고 Google과 협력하는 데 동의하는 것으로 간주됩니다. 이 제품에서는 Google Cloud Platform 서비스 약관에 설명된 제한사항에 따라 데이터 처리 보안 약관에 설명된 대로 개인 데이터를 처리할 수 있습니다. 자세한 내용은 출시 단계 설명을 참조하세요. Google Cloud Platform 서비스 사용에 관해 Google과 비즈니스 제휴 계약을 체결한 경우 MedLM API를 사용해서 1996년 건강 보험 이동성 및 책임법(HIPAA) 또는 HIPAA 이하의 모든 개정 사항 또는 규정의 영향을 받는 보호 건강 정보를 처리할 수 있습니다.

주의사항:

MedLM에 대한 프로덕션 사용을 활성화하려면 고객이 먼저 Google 제품팀에 연락해서 사용을 논의해야 합니다.
MedLM은 의료 기기 용도로 설계되거나 개발되지 않았습니다. 항상 의료 전문가(HCP)를 통해 생성된 출력 정보를 확인해야 하며 이 정보만을 바탕으로 한 직접 진단을 피해야 합니다.
생성된 출력 정보는 항상 완전히 신뢰하지 못할 수 있습니다. LLM 및 생성형 AI의 특성으로 인해 출력 정보에는 잘못되었거나 편향적인(예를 들어, 고정 관념적이거나 기타 유해한 콘텐츠) 정보가 포함될 수 있으며, 검토가 필요합니다. 모든 요약 또는 답변 내용은 최종본이 아닌 초안으로 간주되어야 합니다.
Vertex AI가 Google Cloud Platform 서비스이용 정책 및 생성형 AI에 관한 금지된 사용 정책을 포함하여 Google 정책을 위반하는 콘텐츠를 감지하면 응답이 반환되지 않습니다.
Q&A 목적으로 HCP가 사용할 때 MedLM은 의료 훈련을 위한 교육적 지원이나 HCP의 기존 지식을 보완하기 위한 목적으로만 사용됩니다.
LLM 출력 정보는 프롬프트에 제시된 정확한 형식을 따르지 않을 수 있습니다. 각 필드에서 정보를 추출하기 위한 프롬프트 설계 시에는 해당 형식이 원본으로부터 벗어날 수 있다는 점을 고려해야 합니다(예: 필드 이름에 사용된 대시, 정확한 대소문자 표현 등).

MedLM은 의료 산업에 맞게 미세 조정된 기반 모델의 제품군입니다. Med-PaLM 2는 MedLM을 기반으로 Google 연구팀에서 개발된 텍스트 기반 모델 중 하나이며, 미국 의사 면허 시험(USMLE) 양식의 질문에 답할 수 있는 전문 응시자 수준에 도달한 최초의 AI 시스템이었습니다. 이러한 모델의 개발은 의학적 질문에 대한 답변과 요약본 작성과 같은 특정 고객 요구에 따라 이뤄졌습니다.

MedLM 모델 카드

MedLM 모델 카드에는 MedLM의 사용 목적, 데이터 개요, 안전 정보와 같은 모델 세부정보가 요약되어 있습니다. 다음 링크를 클릭하여 MedLM 모델 카드의 PDF 버전을 다운로드합니다.

MedLM 모델 카드 다운로드

사용 사례

질의 응답: 의료와 관련된 질문에 대한 임시 답변을 텍스트로 제공합니다.
요약: 원본 텍스트에서 관련 정보를 통합하는 방문 후 요약 또는 기록 및 물리적 검사 메모와 같은 짧은 버전의 문서를 작성합니다.

텍스트 프롬프트 설계에 대한 자세한 내용은 텍스트 프롬프트 설계를 참조하세요.

HTTP 요청

MedLM-medium(medlm-medium):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large(medlm-large):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

자세한 내용은 predict 메서드를 참조하세요.

모델 버전

MedLM은 다음 모델을 제공합니다.

MedLM-medium(medlm-medium)
MedLM-large(medlm-large)

다음 표에는 사용 가능한 정식 모델 버전이 포함되어 있습니다.

medlm-medium 모델	출시일
medlm-medium	2023년 12월 13일

medlm-large 모델	출시일
medlm-large	2023년 12월 13일

MedLM-medium 및 MedLM-large는 엔드포인트가 구분되어 있으며 사용 사례에 있어서 추가적인 유연성을 고객들에게 제공합니다. MedLM-medium은 고객들에게 더 나은 처리량을 제공하며 보다 최신 데이터를 포함합니다. MedLM-large는 이전 단계의 모델과 동일합니다. 두 모델 모두 제품 수명 주기에 따라 계속 업데이트될 예정입니다. 이 페이지에서 "MedLM"은 두 모델을 모두 의미합니다.

자세한 내용은 모델 버전 및 수명 주기를 참조하세요.

MedLM 안전 필터 및 속성

MedLM API를 통해 처리된 콘텐츠는 "유해한 카테고리"와 민감하다고 간주될 수 있는 주제가 포함된 안전 속성 목록에 대해 평가됩니다. "저는 언어 모델일 뿐이기 때문에 그것에 대해서는 도와드릴 수 없습니다"와 같은 폴백 응답이 표시되면 프롬프트 또는 응답으로 안전 필터가 트리거되었다는 의미입니다.

안전 기준점

Vertex AI Studio를 사용할 때는 조정 가능한 안전 필터 기준점을 사용해서 유해할 수 있는 응답이 표시될 가능성을 확인할 수 있습니다. 모델 응답은 괴롭힘, 증오심 표현, 위험한 콘텐츠 또는 음란물을 포함할 확률에 따라 차단됩니다. 안전 필터 설정은 Vertex AI Studio의 프롬프트 필드 오른쪽에 있습니다. block most, block some, block few 등 3가지 옵션 중에서 선택할 수 있습니다.

콘솔 이미지

신뢰도 및 심각도 기준점 테스트

Google의 안전 필터를 테스트하고 비즈니스에 맞는 신뢰도 기준을 정의할 수 있습니다. 이러한 기준점을 사용하면 Google의 사용 정책 또는 서비스 약관을 위반하는 콘텐츠를 감지하고 적절한 조치를 취할 수 있습니다.

신뢰도 점수는 예측일 뿐이므로 신뢰성 또는 정확성 점수를 의존해서는 안 됩니다. Google은 비즈니스 결정을 위해 이러한 점수를 해석하거나 사용할 책임이 없습니다.

권장사항

이 기술을 안전하고 책임감 있게 사용하려면 또한 내장된 기술적 보호 장치 외에도 사용 사례, 사용자, 비즈니스 컨텍스트에 따라 기타 위험 요소를 고려하는 것이 중요합니다.

다음 조치를 취하는 것이 좋습니다.

애플리케이션의 보안 위험을 평가합니다.
안전 위험을 완화할 수 있는 조정을 고려합니다.
사용 사례에 적합한 안전 테스트를 수행합니다.
사용자 피드백을 요청하고 콘텐츠를 모니터링합니다.

자세한 내용은 책임감 있는 AI에 대한 Google 권장사항을 참조하세요.

요청 본문

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

medlm-medium 및 medlm-large 모델에 다음 매개변수를 사용합니다. 자세한 내용은 텍스트 프롬프트 설계를 참조하세요.

매개변수	설명	사용 가능한 값
`content`	모델 응답을 생성하는 텍스트 입력입니다. 프롬프트에 프리앰블, 질문, 제안, 안내, 예시가 포함될 수 있습니다.	텍스트
`temperature`	온도(temperature)는 응답 생성 중 샘플링에 사용되며 `topP` 및 `topK`가 적용될 때 발생합니다. 온도는 토큰 선택의 무작위성 수준을 제어합니다. 온도가 낮을수록 자유롭거나 창의적인 답변과 거리가 먼 응답이 필요한 프롬프트에 적합하고, 온도가 높을수록 보다 다양하거나 창의적인 결과로 이어질 수 있습니다. 온도가 `0`이면 확률이 가장 높은 토큰이 항상 선택됩니다. 이 경우 특정 프롬프트에 대한 응답은 대부분 확정적이지만 여전히 약간의 변형이 가능합니다. 모델이 너무 일반적이거나, 너무 짧은 응답을 반환하거나 모델이 대체 응답을 제공할 경우에는 온도(temperature)를 높여보세요.	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	응답에서 생성될 수 있는 토큰의 최대 개수입니다. 토큰은 약 4자(영문 기준)입니다. 토큰 100개는 단어 약 60~80개에 해당합니다. 응답이 짧을수록 낮은 값을 지정하고 잠재적으로 응답이 길면 높은 값을 지정합니다.	medlm-medium의 경우 `1–8192` medlm-large의 경우 `1–1024`
`topK`	Top-K는 모델이 출력용 토큰을 선택하는 방식을 변경합니다. Top-K가 `1`이면 선택된 토큰이 모델의 어휘에 포함된 모든 토큰 중에서 가장 확률이 높다는 의미입니다(그리디 디코딩이라고도 함). 반면에 Top-K가 `3`이면 온도를 사용하여 가장 확률이 높은 3개 토큰 중에서 다음 토큰이 선택된다는 의미입니다. 각 토큰 선택 단계에서 확률이 가장 높은 Top-K 토큰이 샘플링됩니다. 그런 다음 Top-P를 기준으로 토큰을 추가로 필터링하고 온도 샘플링을 사용하여 최종 토큰을 선택합니다. 임의성이 낮은 응답에 낮은 값을 지정하고 임의성이 높은 응답에 높은 값을 지정합니다.	`1–40` `Default: 40`
`topP`	Top-P는 모델이 출력용 토큰을 선택하는 방식을 변경합니다. 토큰은 확률의 합이 Top-P 값과 같아질 때까지 확률이 가장 높은 것부터(Top-K 참조) 가장 낮은 것까지 선택됩니다. 예를 들어 토큰 A, B, C의 확률이 0.3, 0.2, 0.1이고 Top-P 값이 `0.5`이면 모델이 온도를 사용해서 다음 토큰으로 A 또는 B를 선택하고 C는 후보에서 제외합니다. 임의성이 낮은 응답에 낮은 값을 지정하고 임의성이 높은 응답에 높은 값을 지정합니다.	`0.0–1.0` `Default: 0.8`

샘플 요청

MedLM API를 사용할 때는 프롬프트 엔지니어링을 사용하는 것이 중요합니다. 예를 들어 각 프롬프트의 시작 지점에서 적절한 태스크별 지침을 제공하는 것이 좋습니다. 자세한 내용은 프롬프트 설계 소개를 참조하세요.

REST

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: 프로젝트 ID
MEDLM_MODEL: MedLM 모델(medlm-medium 또는 medlm-large)

HTTP 메서드 및 URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

JSON 요청 본문:

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하거나 gcloud CLI에 자동으로 로그인하는 Cloud Shell을 사용하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장합니다. 터미널에서 다음 명령어를 실행하여 현재 디렉터리에 이 파일을 만들거나 덮어씁니다.

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

그런 후 다음 명령어를 실행하여 REST 요청을 전송합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.