MedLM API

免责声明：Vertex AI 上的 MedLM 在美国、巴西和新加坡面向有限的客户群正式发布 (GA)，在美国以外的地区面向有限的客户群提供预览版。此版本侧重于医学问答和医学综述使用。使用 MedLM API，即表示您同意生成式 AI 禁止使用政策和 Google Cloud Platform 服务专用条款，而且您同意善意通知 Google 并协调，以解决有关使用 MedLM 的任何监管问题。对于此产品，您可以按照数据处理安全条款中的说明处理个人数据，但受到 Google Cloud Platform 服务条款中所述限制的约束。如需了解详情，请参阅发布阶段说明。如果您与 Google 签订了涵盖 Google Cloud Platform 服务使用的业务伙伴协议，则 MedLM API 可用于处理受 1996 年《健康保险流通与责任法案》(HIPAA) 和/或 HIPAA 下的任何修订或法规约束的受保护健康信息。

注意：

在激活 MedLM 的生产环境用途之前，客户必须联系 Google 产品团队讨论使用情况。
MedLM 尚未设计或开发用于医疗设备。任何输出都应通过专业医护人员 (HCP) 验证，并且不应声明直接诊断。
生成的输出并不总是完全可靠的。由于 LLM 和生成式 AI 的性质，输出可能包含不正确或有偏见（例如刻板印象或其他有害内容）的信息，因此应进行审核。所有综述或答案都应被视为草稿，而非最终结果。
如果 Vertex AI 检测到违反我们政策（包括 Google Cloud Platform 使用限制政策和生成式 AI 使用限制政策）的内容，则不会返回回答。
当 HCP 将 MedLM 用于问答时，MedLM 仅用于用作医疗培训的教育工具，或者用于强化 HCP 的先前培训。
LLM 输出可能无法遵循提示中列出的确切格式。提取每个字段的信息的提示设计应考虑到，该格式可能与原始格式有所不同（例如，字段名称中的短划线、字母的确切大小写）。

MedLM 是面向医疗保健行业微调的一系列基础模型。 Med-PaLM 2 是 Google Research 开发的基于文本的模型，是支持 MedLM 的文本模型之一，是首个在解答医学许可检查 (USMLE) 类问题方面达到美国专家专家水平的 AI 系统。这些模型的发展取决于特定的客户需求，例如回答医学问题和草拟综述。

MedLM 模型卡片

MedLM 模型卡片概述了模型详情，例如 MedLM 的预期用途、数据概览和安全信息。点击以下链接可下载 MedLM 模型卡片的 PDF 版本：

下载 MedLM 模型卡片

使用场景

问答：以文本的形式提供医学相关问题的回答草稿。
汇总：草拟一个包含原始文本中相关信息的简短文档版本（例如访视后总结或病例和身体检查记录）。

如需详细了解如何设计文本提示，请参阅提示策略概览。

HTTP 请求

MedLM-medium (medlm-medium)：

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large (medlm-large)：

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

如需了解详情，请参阅 predict 方法。

模型版本

MedLM 提供以下模型：

MedLM-medium (medlm-medium)
MedLM-large (medlm-large)

下表包含可用的稳定模型版本：

medlm-medium 模型	发布日期
`medlm-medium`	2023 年 12 月 13 日

medlm-large 模型	发布日期
`medlm-large`	2023 年 12 月 13 日

MedLM-medium 和 MedLM-large 具有单独的端点，为客户提供了更大的应用场景灵活性。MedLM-medium 为客户提供更高的吞吐量，并包含最新的数据。MedLM-large 是与预览阶段相同的模型。这两个模型在产品生命周期内将继续刷新。在本页面中，“MedLM”指的是这两个模型。

如需了解详情，请参阅模型版本和生命周期。

MedLM 安全过滤器和属性

系统会通过一系列安全属性（包括“有害类别”和可能被视为敏感数据的主题）对通过 MedLM API 处理的内容进行评估。如果您看到后备回复，例如“我无法提供帮助，因为我只是语言模型”，则表示提示或回复触发了安全过滤器。

安全阈值

使用 Vertex AI Studio 时，您可以使用可调整的安全过滤器阈值来确定出现可能有害的回答的可能性。模型响应会因包含骚扰、仇恨言论、危险内容或露骨色情内容的可能性而被屏蔽。安全过滤器设置位于 Vertex AI Studio 中提示框的右侧。您可以从三个选项中进行选择：block most、block some 和 block few。

控制台图片

测试置信度和严重程度阈值

您可以测试 Google 的安全过滤器，并定义适合您的企业的置信度阈值。通过使用这些阈值，您可以采取全面的措施来检测违反 Google 使用政策或服务条款的内容，并采取适当的措施。

置信度得分只是预测值，您不应依赖得分来获取可靠性或准确性。Google 不负责解读或使用这些得分来做出业务决策。

请求正文

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

为 medlm-medium 和 medlm-large 模型使用以下参数。如需了解详情，请参阅设计文本提示。

参数	说明	可接受的值
`content`	用于生成模型响应的文本输入。提示可能包括序言、问题、建议、说明或示例。	文本
`temperature`	温度 (temperature) 在生成回复期间用于采样，在应用 `topP` 和 `topK` 时会生成回复。温度可以控制词元选择的随机性。较低的温度有利于需要更少开放性或创造性回复的提示，而较高的温度可以带来更具多样性或创造性的结果。温度为 `0` 表示始终选择概率最高的词元。在这种情况下，给定提示的回复大多是确定的，但可能仍然有少量变化。如果模型返回的回答过于笼统、过于简短，或者模型给出后备回复，请尝试提高温度。	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	回复中可生成的词元数量上限。词元约为 4 个字符。100 个词元对应大约 60-80 个单词。指定较低的值可获得较短的回复，指定较高的值可获得可能较长的回复。	`1–8192` 表示 medlm-medium `1–1024` 表示 medlm-large
`topK`	Top-K 可更改模型选择输出词元的方式。如果 top-K 设为 `1`，表示所选词元是模型词汇表的所有词元中概率最高的词元（也称为贪心解码）。如果 top-K 设为 `3`，则表示系统将从 3 个概率最高的词元（通过温度确定）中选择下一个词元。在每个词元选择步骤中，系统都会对概率最高的 top-K 词元进行采样。然后，系统会根据 top-P 进一步过滤词元，并使用温度采样选择最终的词元。指定较低的值可获得随机程度较低的回答，指定较高的值可获得随机程度较高的回答。	`1–40` `Default: 40`
`topP`	Top-P 可更改模型选择输出词元的方式。系统会按照概率从最高到最低的顺序选择 token，直到所选 token 的概率总和等于 top-P 值。例如，如果词元 A、B 和 C 的概率分别为 0.3、0.2 和 0.1，并且 top-P 值为 `0.5`，则模型将选择 A 或 B 作为下一个词元（通过温度确定），并会排除 C，将其作为候选词元。指定较低的值可获得随机程度较低的回答，指定较高的值可获得随机程度较高的回答。	`0.0–1.0` `Default: 0.8`

示例请求

使用 MedLM API 时，请务必结合提示工程。例如，我们强烈建议您在每个提示开头提供特定于任务的适当说明。如需了解详情，请参阅提示简介。

REST

在使用任何请求数据之前，请先进行以下替换：

PROJECT_ID：您的项目 ID。
MEDLM_MODEL：MedLM 模型，medlm-medium 或 medlm-large。

HTTP 方法和网址：

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

请求 JSON 正文：

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

如需发送请求，请选择以下方式之一：

curl

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI，或者使用了 Cloud Shell，这会使您自动登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。

将请求正文保存在名为 request.json 的文件中。在终端中运行以下命令，在当前目录中创建或覆盖此文件：

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

然后，执行以下命令以发送 REST 请求：

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

注意：以下命令假定您已使用您的用户账号通过运行 gcloud init 或 gcloud auth login 登录 gcloud CLI。您可以运行 gcloud auth list 来检查当前活跃的账号。