模型弃用 (MaaS)

经过一段时间后,MaaS 模型会被弃用,通常会被更新的模型版本取代。为了让您有时间测试并迁移到更新的型号,此页面列出了所有已弃用的型号及其关闭日期。

Claude 3.5 Sonnet v2

Claude 3.5 Sonnet v2 已于 2025 年 8 月 20 日弃用,并将于 2026 年 2 月 19 日关停。Claude 3.5 Sonnet v2 仅面向现有客户提供。

Claude 3.5 Sonnet v2 是用于处理实际的软件工程任务和智能体功能的先进模型。

在 Vertex AI 中试用 在 Model Garden 中查看模型卡片

属性 说明
模型 ID claude-3-5-sonnet-v2@20241022
token 数量上限
输入 token 数量上限 200,000
输出 token 数量上限 8,000
功能
技术规范
图片
  • 限制和规范:请参阅 Anthropic 文档中的视觉
文档
  • 限制和规范:请参阅 Anthropic 文档中的 PDF 支持
知识截点日期 2024 年 8 月
版本
  • claude-3-5-sonnet-v2@20241022
    • 发布阶段:正式版
    • 发布日期:2024 年 10 月 22 日
支持的区域

模型可用性

(包括固定配额和预配吞吐量)

美国

  • us-east5

欧洲

  • europe-west1

全球

  • global endpoint

ML 处理

美国

  • Multi-region

欧洲

  • Multi-region

配额限制

us-east5:

  • QPM: 90
  • TPM:540,000(输入和输出)
  • 上下文长度:200,000

europe-west1:

  • QPM: 55
  • TPM:330,000(输入和输出)
  • 上下文长度:200,000

全球端点:

  • QPM: 25
  • TPM:140,000(输入和输出)
  • 上下文长度:200,000

价格 请参阅价格

Claude 3.5 Sonnet

Claude 3.5 Sonnet 已于 2025 年 8 月 20 日弃用,并将于 2026 年 2 月 19 日关停。Claude 3.5 Sonnet 仅面向现有客户提供。

Claude 3.5 Sonnet 凭借 Anthropic 的中端模型 Claude 3 Sonnet 的速度和成本,在 Anthropic 的多种评估中优于 Anthropic 的 Claude 3 Opus。

在 Model Garden 中查看模型卡片

属性 说明
模型 ID claude-3-5-sonnet@20240620
token 数量上限
输入 token 数量上限 200,000
输出 token 数量上限 8,000
功能
技术规范
图片
  • 限制和规范:请参阅 Anthropic 文档中的视觉
文档
  • 限制和规范:请参阅 Anthropic 文档中的 PDF 支持
知识截点日期 2024 年 4 月
版本
  • claude-3-5-sonnet@20240620
    • 发布阶段:正式版
    • 发布日期:2024 年 6 月 20 日
支持的区域

模型可用性

(包括固定配额和预配吞吐量)

美国

  • us-east5

欧洲

  • europe-west1

亚太地区

  • asia-southeast1

ML 处理

美国

  • Multi-region

欧洲

  • Multi-region

亚太地区

  • asia-southeast1

配额限制

us-east5:

  • QPM:80
  • TPM:350,000(输入和输出)
  • 上下文长度:200,000

europe-west1:

  • QPM: 130
  • TPM:600,000(输入和输出)
  • 上下文长度:200,000

asia-southeast1:

  • QPM: 35
  • TPM:150,000(输入和输出)
  • 上下文长度:200,000

价格 请参阅价格

Jamba 1.5 Large

Jamba 1.5 Large 已于 2025 年 8 月 27 日弃用,并将于 2026 年 2 月 27 日关停。Jamba 1.5 Large 仅面向现有客户提供。

AI21 Labs 的 Jamba 1.5 Large 在质量、吞吐量和低成本方面取得了良好的平衡。

在 Model Garden 中查看模型卡片

属性 说明
模型 ID jamba-1.5-large
知识截点日期 2024 年 3 月
版本
  • jamba-1.5-large
    • 发布阶段:预览
    • 发布日期:2024 年 8 月 22 日
支持的区域

模型可用性

美国

  • us-central1

欧洲

  • europe-west4

ML 处理

美国

  • Multi-region

配额限制

us-central1:

  • QPM:20
  • TPM:20,000
  • 上下文长度:256,000

europe-west4:

  • QPM:20
  • TPM:20,000
  • 上下文长度:256,000

价格 请参阅价格

Jamba 1.5 Mini

Jamba 1.5 Mini 已于 2025 年 8 月 27 日起弃用,并将于 2026 年 2 月 27 日关停。Jamba 1.5 Mini 仅适用于现有客户。

AI21 Labs 的 Jamba 1.5 Mini 在质量、吞吐量和低成本方面取得了良好的平衡。

在 Model Garden 中查看模型卡片

属性 说明
模型 ID jamba-1.5-mini
知识截点日期 2024 年 3 月
版本
  • jamba-1.5-mini
    • 发布阶段:预览
    • 发布日期:2024 年 8 月 22 日
支持的区域

模型可用性

美国

  • us-central1

欧洲

  • europe-west4

ML 处理

美国

  • Multi-region

配额限制

us-central1:

  • QPM:50
  • TPM:60,000
  • 上下文长度:256,000

europe-west4:

  • QPM:50
  • TPM:60,000
  • 上下文长度:256,000

价格 请参阅价格

Mistral Nemo

Mistral Nemo 已于 2025 年 6 月 30 日弃用,并将于 2025 年 8 月 20 日关停。Mistral Nemo 仅适用于现有客户。

Mistral Nemo 是 Mistral AI 最具成本效益的专有模型。使用 Mistral Nemo 低延迟工作负载以及可批量完成的基本任务,例如分类、客户服务和文本生成。

在 Model Garden 中查看模型卡片

属性 说明
模型 ID mistral-nemo
版本
  • mistral-nemo
    • 发布阶段:已弃用
    • 发布日期:2024 年 7 月 24 日
支持的区域

模型可用性

美国

  • us-central1

欧洲

  • europe-west4

ML 处理

美国

  • Multi-region

欧洲

  • Multi-region

配额限制

us-central1:

  • QPM:60
  • TPM:400,000
  • 上下文长度:128,000

europe-west4:

  • QPM:60
  • TPM:400,000
  • 上下文长度:128,000

价格 请参阅价格

Claude 3 Opus

Anthropic 的 Claude 3 Opus 已于 2025 年 6 月 30 日弃用,并将于 2025 年 8 月 1 日关停。Claude 3 Opus 仅面向现有客户提供。

Anthropic 的 Claude 3 Opus 是一款强大的 AI 模型,在处理高度复杂的任务时可达到出色的性能。它能够处理开放式提示和背后可能的方案,具有出色的流利度和真人理解能力。Claude 3 Opus 针对以下应用场景进行了优化:

  • 任务自动化,例如互动式编码和规划,或在 API 和数据库之间执行复杂的操作。

  • 研究和开发任务,例如研究审核、头脑风暴和假设生成,以及产品测试。

  • 策略任务,例如图表和图形的高级分析、财务和市场趋势以及预测。

  • 视觉任务,例如处理图片以返回文本输出。此外,还可以分析图表、图形、技术图表、报告和其他直观内容。

在 Model Garden 中查看模型卡片

属性 说明
模型 ID claude-3-opus@20240229
token 数量上限
输入 token 数量上限 200,000
输出 token 数量上限 8,000
功能
技术规范
图片
  • 限制和规范:请参阅 Anthropic 文档中的视觉
文档
  • 限制和规范:请参阅 Anthropic 文档中的 PDF 支持
知识截点日期 2023 年 8 月
版本
  • claude-3-opus@20240229
    • 发布阶段:已弃用
    • 发布日期:2024 年 5 月 31 日
支持的区域

模型可用性

(包括固定配额和预配吞吐量)

美国

  • us-east5

ML 处理

美国

  • Multi-region

配额限制

us-east5:

  • QPM:20
  • TPM:105,000(输入和输出)
  • 上下文长度:200,000

价格 请参阅价格