このページは Cloud Translation API によって翻訳されました。

MedLM API

免責事項: Vertex AI の MedLM は、許可リストに登録されたお客様にご利用いただけます。この許可リストに登録された一般提供リリース（米国限定の一般提供）では、医療関連の Q＆A と医療に関する要約の使用に重点を置いています。MedLM API を使用することにより、お客様は、生成 AI の禁止使用ポリシーおよび Google Cloud Platform のサービス固有の規約に同意して、MedLM の使用に関する規制上の問い合わせに対応するために、誠意を持って Google に通知し、調整することに同意するものとします。このプロダクトでは、Google Cloud Platform 利用規約に記載されている制限に従って、データ処理セキュリティ規約に概説されているとおり、個人データを処理できます。詳細については、リリースステージの説明をご覧ください。Google Cloud Platform サービスの使用を含む業務提携契約を Google と締結することを条件とし、MedLM API を使用して、1996 年の医療保険の相互運用性と説明責任に関する法律（HIPAA）および / または HIPAA に基づく修正もしくは規制の対象となる保護医療情報を処理できます。

注意:

お客様は、MedLM の本番環境での使用を有効にする前に、Google プロダクトチームに連絡して、使用方法について打ち合わせを行う必要があります。
MedLM は、医療機器として使用するために設計、開発されたものではありません。いかなる出力も医療従事者（HCP）によって確認される必要があり、直接診断を行うべきではありません。
生成された出力は、必ずしも完全に信頼できるとは限りません。LLM と生成 AI の性質上、出力には誤った情報や偏った情報（ステレオタイプや他の有害なコンテンツなど）が含まれている可能性があるため、確認する必要があります。すべての要約や回答は、最終版ではなく草稿とお考えください。
Vertex AI でポリシー（Google Cloud Platform 利用規定や生成 AI の使用禁止ポリシーなど）違反のコンテンツが検出された場合、レスポンスは返されません。
MedLM は、HCP が Q＆A の目的で使用する場合、医療トレーニング用の教育ツールとして使用することや、HCP の事前トレーニングを強化することを意図しています。
LLM の出力は、プロンプトで指定された形式に忠実に従うとは限りません。各フィールドの情報を抽出するプロンプトの設計では、元の形式から逸脱する（フィールド名のダッシュ、大文字と小文字の正確な区別など）可能性を考慮する必要があります。

MedLM は、医療業界向けにファインチューニングされた基盤モデルのファミリーです。Med-PaLM 2 は、MedLM を支える Google Research が開発したテキストベースのモデルの一つで、米国医師免許試験（USMLE）形式の質問に回答し、人間の専門家レベルに到達した最初の AI システムです。これらのモデルの開発は、医療関連の質問への回答や要約の下書きなど、特定のお客様のニーズに基づいています。

MedLM モデルカード

MedLM モデルカードには、MedLM の用途、データの概要、安全性に関する情報など、モデルの詳細が表示されます。MedLM モデルカードの PDF 版をダウンロードするには、次のリンクをクリックします。

MedLM モデルカードをダウンロードする

ユースケース

質問応答: 医療関連の質問に対して、回答のドラフトをテキストで提供します。
要約: 元のテキストから得た関連情報を組み込んだ短縮版ドキュメント（事後訪問の概要、病歴、身体検査のメモなど）のドラフトを作成します。

テキストプロンプトの設計について詳しくは、テキストプロンプトを設計するをご覧ください。

HTTP リクエスト

MedLM-medium（medlm-medium）:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large（medlm-large）:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

詳細については、predict メソッドをご覧ください。

モデルバージョン

MedLM では、次のモデルが用意されています。

MedLM-medium（medlm-medium）
MedLM-large（medlm-large）

次の表に、利用可能なモデルの安定版を示します。

medlm-medium モデル	リリース日
medlm-medium	2023 年 12 月 13 日

medlm-large モデル	リリース日
medlm-large	2023 年 12 月 13 日

MedLM-medium と MedLM-large には個別のエンドポイントがあり、お客様のユースケースに柔軟に対応します。MedLM-medium は、お客様により良いスループットを提供し、より新しいデータを保持しています。MedLM-large はプレビュー段階のものと同じモデルです。どちらのモデルも、プロダクトのライフサイクルの中で継続的に更新されます。このページでは、「MedLM」は両方のモデルを指します。

詳細については、モデルのバージョンとライフサイクルをご覧ください。

MedLM の安全フィルタと属性

MedLM API で処理されるコンテンツは、「有害なカテゴリ」や機密情報とみなされるトピックなど、安全属性のリストに照らして評価されます。「私は言語モデルにすぎないので、それについてはお手伝いできません」といった代替レスポンスが表示される場合は、プロンプトかレスポンスのいずれかによって、安全フィルタが作動していることを意味します。

安全性のしきい値

Vertex AI Studio を使用する場合は、調整可能な安全フィルタのしきい値を使用して、有害な可能性があるレスポンスが表示される可能性を確認できます。モデルのレスポンスは、ハラスメント、ヘイトスピーチ、危険なコンテンツ、性的描写が露骨なコンテンツが含まれている可能性に基づいてブロックされます。安全フィルタの設定は、Vertex AI Studio のプロンプトフィールドの右側にあります。block most、block some、block few の 3 つのオプションから選択できます。

コンソールの画像

信頼性と重大度のしきい値のテスト

Google の安全フィルタをテストし、ビジネスに適した信頼度のしきい値を定義できます。これらのしきい値を使用することで、Google の利用ポリシーや利用規約に違反するコンテンツを検出し、適切な措置を取ることができます。

信頼スコアは予測にすぎないため、信頼性や精度については信頼スコアを過信しないでください。Google は、ビジネス上の意思決定のためにこれらのスコアを解釈または使用することに対して責任を負いません。

リクエストの本文

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

medlm-medium モデルと medlm-large モデルでは、次のパラメータを使用します。詳細については、テキストプロンプトを設計するをご覧ください。

パラメータ	説明	使用できる値
`content`	モデルのレスポンスを生成するためのテキスト入力。プロンプトには、プリアンブル、質問、提案、指示、例を含めることができます。	テキスト
`temperature`	温度は、レスポンス生成時のサンプリングに使用されます。レスポンス生成は、`topP` と `topK` が適用された場合に発生します。温度は、トークン選択のランダム性の度合いを制御します。温度が低いほど、確定的で自由度や創造性を抑えたレスポンスが求められるプロンプトに適しています。一方、温度が高いと、より多様で創造的な結果を導くことができます。温度が `0` の場合、確率が最も高いトークンが常に選択されます。この場合、特定のプロンプトに対するレスポンスはほとんど確定的ですが、わずかに変動する可能性は残ります。モデルが返すレスポンスが一般的すぎたり、短すぎたり、フォールバック（代替）レスポンスが返ってきたりする場合は、Temperature を高くしてみてください。	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	レスポンスで生成できるトークンの最大数。1 トークンは約 4 文字です。100 トークンは約 60～80 語に相当します。レスポンスを短くしたい場合は小さい値を、長くしたい場合は大きい値を指定します。	`1–8192`（medlm-medium） `1–1024`（medlm-large）
`topK`	Top-K は、モデルが出力用にトークンを選択する方法を変更します。Top-K が `1` の場合、次に選択されるトークンは、モデルの語彙内のすべてのトークンで最も確率の高いものであることになります（グリーディデコードとも呼ばれます）。Top-K が `3` の場合は、最も確率が高い上位 3 つのトークンから次のトークン選択されることになります（温度を使用します）。トークン選択のそれぞれのステップで、最も高い確率を持つ Top-K のトークンがサンプリングされます。その後、トークンは Top-P に基づいてさらにフィルタリングされ、最終的なトークンは温度サンプリングを用いて選択されます。ランダムなレスポンスを減らしたい場合は小さい値を、ランダムなレスポンスを増やしたい場合は大きい値を指定します。	`1–40` `Default: 40`
`topP`	Top-P は、モデルが出力用にトークンを選択する方法を変更します。トークンは、確率の合計が Top-P 値に等しくなるまで、確率の高いもの（Top-K を参照）から低いものへと選択されます。たとえば、トークン A、B、C の確率が 0.3、0.2、0.1 であり、Top-P 値が `0.5` であるとします。この場合、モデルは温度を使用して A または B を次のトークンとして選択し、C は候補から除外します。ランダムなレスポンスを減らしたい場合は小さい値を、ランダムなレスポンスを増やしたい場合は大きい値を指定します。	`0.0–1.0` `Default: 0.8`

リクエストの例

MedLM API を使用する際は、プロンプトエンジニアリングを組み込むことが重要です。たとえば、各プロンプトの先頭には、タスク固有の適切な指示を記述することを強くおすすめします。詳細は、プロンプトデザインの概要をご覧ください。

REST

リクエストのデータを使用する前に、次のように置き換えます。

PROJECT_ID: 実際のプロジェクト ID。
MEDLM_MODEL: MedLM モデル（medlm-medium または medlm-large）。

HTTP メソッドと URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

リクエストの本文（JSON）:

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

リクエストを送信するには、次のいずれかのオプションを選択します。

curl

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ユーザーアカウントで gcloud CLI にログインしているか、Cloud Shell を使用して自動的に gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

リクエスト本文を request.json という名前のファイルに保存します。ターミナルで次のコマンドを実行して、このファイルを現在のディレクトリに作成または上書きします。

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

その後、次のコマンドを実行して REST リクエストを送信します。

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

注: 次のコマンドは、gcloud init または gcloud auth login を実行して、ご自分のユーザーアカウントで gcloud CLI にログインしていることを前提としています。gcloud auth list を実行すると、現在アクティブなアカウントを確認できます。

@'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
'@  | Out-File -FilePath request.json -Encoding utf8