模型淘汰 (MaaS)

一段時間後,MaaS 模型會遭到淘汰,通常會由新版模型取代。為提供充足時間供您測試及遷移至新版模型,這個頁面會列出所有已淘汰的模型,以及停用日期。

Claude 3.5 Sonnet v2

Claude 3.5 Sonnet v2 已於 2025 年 8 月 20 日淘汰,並將於 2026 年 2 月 19 日停用。Claude 3.5 Sonnet v2 僅供現有客戶使用。

Claude 3.5 Sonnet v2 是最先進的模型,能實際處理軟體工程任務和建構虛擬服務專員功能。

在 Vertex AI 中試用 在 Model Garden 中查看模型資訊卡

屬性 說明
模型 ID claude-3-5-sonnet-v2@20241022
權杖限制
輸入權杖數量上限 200,000
輸出權杖數量上限 8,000
功能
技術規格
圖片
  • 限制和規格:請參閱 Anthropic 說明文件中的「Vision
文件
  • 限制和規格:請參閱 Anthropic 說明文件中的「PDF 支援
知識截點日期 2024 年 8 月
版本
  • claude-3-5-sonnet-v2@20241022
    • 發布階段:正式發布
    • 發布日期:2024 年 10 月 22 日
支援的地區

模型適用情形

(包括固定配額和佈建輸送量)

美國

  • us-east5

歐洲

  • europe-west1

全球

  • global endpoint

機器學習處理作業

美國

  • Multi-region

歐洲

  • Multi-region

配額限制

us-east5:

  • QPM:90
  • TPM:540,000 (輸入和輸出)
  • 脈絡長度:200,000

europe-west1:

  • QPM:55
  • TPM:330,000 (輸入和輸出)
  • 脈絡長度:200,000

全域端點:

  • QPM:25
  • TPM:140,000 (輸入和輸出)
  • 脈絡長度:200,000

定價 請參閱定價

Claude 3.5 Sonnet

Claude 3.5 Sonnet 已於 2025 年 8 月 20 日淘汰,並將於 2026 年 2 月 19 日停用。Claude 3.5 Sonnet 僅適用於現有客戶。

在 Anthropic 進行的一系列評測中,Claude 3.5 Sonnet 的表現皆優於 Anthropic 的 Claude 3 Opus,而速度與成本方面的表現則等同於 Anthropic 的中階模型 Claude 3 Sonnet。

在 Model Garden 中查看模型資訊卡

屬性 說明
模型 ID claude-3-5-sonnet@20240620
權杖限制
輸入權杖數量上限 200,000
輸出權杖數量上限 8,000
功能
技術規格
圖片
  • 限制和規格:請參閱 Anthropic 說明文件中的「Vision
文件
  • 限制和規格:請參閱 Anthropic 說明文件中的「PDF 支援
知識截點日期 2024 年 4 月
版本
  • claude-3-5-sonnet@20240620
    • 發布階段:正式發布
    • 發布日期:2024 年 6 月 20 日
支援的地區

模型適用情形

(包括固定配額和佈建輸送量)

美國

  • us-east5

歐洲

  • europe-west1

亞太地區

  • asia-southeast1

機器學習處理作業

美國

  • Multi-region

歐洲

  • Multi-region

亞太地區

  • asia-southeast1

配額限制

us-east5:

  • QPM:80
  • TPM:350,000 (輸入和輸出)
  • 脈絡長度:200,000

europe-west1:

  • QPM:130
  • TPM:600,000 (輸入和輸出)
  • 脈絡長度:200,000

asia-southeast1:

  • QPM:35
  • TPM:150,000 (輸入和輸出)
  • 脈絡長度:200,000

定價 請參閱定價

Jamba 1.5 Large

Jamba 1.5 Large 已於 2025 年 8 月 27 日淘汰,並將於 2026 年 2 月 27 日全面停用。Jamba 1.5 Large 僅適用於現有客戶。

AI21 Labs 的 Jamba 1.5 Large 在品質、輸送量和低成本之間取得完美平衡。

在 Model Garden 中查看模型資訊卡

屬性 說明
模型 ID jamba-1.5-large
知識截點日期 2024 年 3 月
版本
  • jamba-1.5-large
    • 推出階段:預覽
    • 發布日期:2024 年 8 月 22 日
支援的地區

模型適用情形

美國

  • us-central1

歐洲

  • europe-west4

機器學習處理作業

美國

  • Multi-region

配額限制

us-central1:

  • QPM:20
  • TPM:20,000
  • 脈絡長度:256,000

europe-west4:

  • QPM:20
  • TPM:20,000
  • 脈絡長度:256,000

定價 請參閱定價

Jamba 1.5 Mini

Jamba 1.5 Mini 已於 2025 年 8 月 27 日淘汰,並將於 2026 年 2 月 27 日停用。Jamba 1.5 Mini 僅適用於現有客戶。

AI21 Labs 的 Jamba 1.5 Mini 在品質、輸送量和低成本之間取得良好平衡。

在 Model Garden 中查看模型資訊卡

屬性 說明
模型 ID jamba-1.5-mini
知識截點日期 2024 年 3 月
版本
  • jamba-1.5-mini
    • 推出階段:預覽
    • 發布日期:2024 年 8 月 22 日
支援的地區

模型適用情形

美國

  • us-central1

歐洲

  • europe-west4

機器學習處理作業

美國

  • Multi-region

配額限制

us-central1:

  • QPM:50
  • TPM:60,000
  • 脈絡長度:256,000

europe-west4:

  • QPM:50
  • TPM:60,000
  • 脈絡長度:256,000

定價 請參閱定價

Mistral Nemo

Mistral Nemo 已於 2025 年 6 月 30 日淘汰,並將於 2025 年 8 月 20 日停止運作。Mistral Nemo 僅適用於現有客戶。

Mistral Nemo 是 Mistral AI 最具成本效益的專有模型。使用 Mistral Nemo 處理低延遲工作負載,以及可大量執行的基本工作,例如分類、客戶服務和文字生成。

在 Model Garden 中查看模型資訊卡

屬性 說明
模型 ID mistral-nemo
版本
  • mistral-nemo
    • 推出階段:已淘汰
    • 發布日期:2024 年 7 月 24 日
支援的地區

模型適用情形

美國

  • us-central1

歐洲

  • europe-west4

機器學習處理作業

美國

  • Multi-region

歐洲

  • Multi-region

配額限制

us-central1:

  • 每分鐘查詢次數:60
  • TPM:400,000
  • 脈絡長度:128,000

europe-west4:

  • 每分鐘查詢次數:60
  • TPM:400,000
  • 脈絡長度:128,000

定價 請參閱定價

Claude 3 Opus

Anthropic 的 Claude 3 Opus 已於 2025 年 6 月 30 日淘汰,並將於 2025 年 8 月 1 日關閉。Claude 3 Opus 僅適用於現有客戶。

Anthropic 的 Claude 3 Opus 是功能強大的 AI 模型,能夠在執行高複雜度工作時取得最佳成效。這個模型具備令人驚豔的流暢度和類似人類的理解能力,可掌握開放式提示與不可視情境。Claude 3 Opus 適合用於下列用途:

  • 自動執行工作,例如互動式編碼和規劃,或跨 API 和資料庫執行複雜動作。

  • 研究和開發工作,例如研究審查、腦力激盪和假設生成,以及產品測試。

  • 策略工作,例如進階分析圖表、財務和市場趨勢,以及預測。

  • 視覺任務,例如處理圖片並傳回文字輸出內容。此外,還能分析圖表、技術圖、報表和其他視覺內容。

在 Model Garden 中查看模型資訊卡

屬性 說明
模型 ID claude-3-opus@20240229
權杖限制
輸入權杖數量上限 200,000
輸出權杖數量上限 8,000
功能
技術規格
圖片
  • 限制和規格:請參閱 Anthropic 說明文件中的「Vision
文件
  • 限制和規格:請參閱 Anthropic 說明文件中的「PDF 支援
知識截點日期 2023 年 8 月
版本
  • claude-3-opus@20240229
    • 推出階段:已淘汰
    • 發布日期:2024 年 5 月 31 日
支援的地區

模型適用情形

(包括固定配額和佈建輸送量)

美國

  • us-east5

機器學習處理作業

美國

  • Multi-region

配額限制

us-east5:

  • QPM:20
  • TPM:105,000 (輸入和輸出)
  • 脈絡長度:200,000

定價 請參閱定價