Einstellung von Modellen (MaaS)

Nach einer gewissen Zeit werden MaaS-Modelle eingestellt und in der Regel durch neuere Modellversionen ersetzt. Damit Sie genügend Zeit haben, neuere Modelle zu testen und zu migrieren, werden auf dieser Seite alle eingestellten Modelle zusammen mit dem Datum der Einstellung aufgeführt.

Claude 3.5 Sonnet v2

Claude 3.5 Sonnet v2 wird am 20. August 2025 eingestellt und am 19. Februar 2026 deaktiviert. Claude 3.5 Sonnet v2 ist nur für bestehende Kunden verfügbar.

Claude 3.5 Sonnet v2 ist ein hochmodernes Modell für reale Softwareentwicklungsaufgaben und für von KI-Agenten zu übernehmende Aufgaben.

In Vertex AI testen Modellkarte in Model Garden ansehen

Attribut Beschreibung
Modell-ID claude-3-5-sonnet-v2@20241022
Token limits
Maximale Anzahl eingegebener Tokens 200.000
Maximale Anzahl ausgegebener Tokens 8.000
Funktionen
Technische Daten
Bilder
  • Einschränkungen und Spezifikationen:Siehe Vision in der Dokumentation von Anthropic.
Dokumente
  • Einschränkungen und Spezifikationen:Siehe PDF-Unterstützung in der Dokumentation von Anthropic.
Wissensstichtag August 2024
Versionen
  • claude-3-5-sonnet-v2@20241022
    • Einführungsphase:Allgemein verfügbar
    • Veröffentlichungsdatum:22. Oktober 2024
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

USA

  • us-east5

Europa

  • europe-west1

Global

  • global endpoint

ML-Verarbeitung

USA

  • Multi-region

Europa

  • Multi-region

Kontingentlimits

us-east5:

  • QPM: 90
  • TPM: 540.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

europe-west1:

  • QPM: 55
  • TPM: 330.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

Globaler Endpunkt:

  • QPM: 25
  • TPM: 140.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.

Claude 3.5 Sonett

Claude 3.5 Sonnet wird seit dem 20. August 2025 nicht mehr unterstützt und am 19. Februar 2026 eingestellt. Claude 3.5 Sonnet ist nur für bestehende Kunden verfügbar.

Claude 3.5 Sonnet übertrifft Claude 3 Opus von Anthropic in einer Vielzahl von Bewertungen von Anthropic mit der Geschwindigkeit und den Kosten des Mid-Tier-Modells von Anthropic, Claude 3 Sonnet.

Modellkarte in Model Garden ansehen

Attribut Beschreibung
Modell-ID claude-3-5-sonnet@20240620
Token limits
Maximale Anzahl eingegebener Tokens 200.000
Maximale Anzahl ausgegebener Tokens 8.000
Funktionen
Technische Daten
Bilder
  • Einschränkungen und Spezifikationen:Siehe Vision in der Dokumentation von Anthropic.
Dokumente
  • Einschränkungen und Spezifikationen:Siehe PDF-Unterstützung in der Dokumentation von Anthropic.
Wissensstichtag April 2024
Versionen
  • claude-3-5-sonnet@20240620
    • Einführungsphase:Allgemein verfügbar
    • Veröffentlichungsdatum:20. Juni 2024
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

USA

  • us-east5

Europa

  • europe-west1

Asiatisch-pazifischer Raum

  • asia-southeast1

ML-Verarbeitung

USA

  • Multi-region

Europa

  • Multi-region

Asiatisch-pazifischer Raum

  • asia-southeast1

Kontingentlimits

us-east5:

  • QPM: 80
  • TPM: 350.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

europe-west1:

  • QPM: 130
  • TPM: 600.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

asia-southeast1:

  • QPM: 35
  • TPM: 150.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.

Jamba 1.5 Large

Jamba 1.5 Large wird am 27. August 2025 eingestellt und am 27. Februar 2026 deaktiviert. Jamba 1.5 Large ist nur für Bestandskunden verfügbar.

Jamba 1.5 Large von AI21 Labs bietet ein gutes Gleichgewicht zwischen Qualität, Durchsatz und niedrigen Kosten.

Modellkarte in Model Garden ansehen

Attribut Beschreibung
Modell-ID jamba-1.5-large
Wissensstichtag März 2024
Versionen
  • jamba-1.5-large
    • Einführungsphase:Vorabversion
    • Veröffentlichungsdatum:22. August 2024
Unterstützte Regionen

Modellverfügbarkeit

USA

  • us-central1

Europa

  • europe-west4

ML-Verarbeitung

USA

  • Multi-region

Kontingentlimits

us-central1:

  • QPM: 20
  • TPM: 20.000
  • Kontextlänge: 256.000

europe-west4:

  • QPM: 20
  • TPM: 20.000
  • Kontextlänge: 256.000

Preise Weitere Informationen finden Sie unter Preise.

Jamba 1.5 Mini

Jamba 1.5 Mini wird am 27. August 2025 eingestellt und am 27. Februar 2026 deaktiviert. Jamba 1.5 Mini ist nur für bestehende Kunden verfügbar.

Jamba 1.5 Mini von AI21 Labs bietet ein gutes Gleichgewicht zwischen Qualität, Durchsatz und niedrigen Kosten.

Modellkarte in Model Garden ansehen

Attribut Beschreibung
Modell-ID jamba-1.5-mini
Wissensstichtag März 2024
Versionen
  • jamba-1.5-mini
    • Einführungsphase:Vorabversion
    • Veröffentlichungsdatum:22. August 2024
Unterstützte Regionen

Modellverfügbarkeit

USA

  • us-central1

Europa

  • europe-west4

ML-Verarbeitung

USA

  • Multi-region

Kontingentlimits

us-central1:

  • QPM: 50
  • TPM: 60.000
  • Kontextlänge: 256.000

europe-west4:

  • QPM: 50
  • TPM: 60.000
  • Kontextlänge: 256.000

Preise Weitere Informationen finden Sie unter Preise.

Mistral Nemo

Mistral Nemo wird am 30. Juni 2025 eingestellt und am 20. August 2025 abgeschaltet. Mistral Nemo ist nur für bestehende Kunden verfügbar.

Mistral Nemo ist das kostengünstigste proprietäre Modell von Mistral AI. Verwenden Sie Mistral Nemo für Arbeitslasten mit niedriger Latenz und einfache Aufgaben, die im Bulk-Verfahren ausgeführt werden können, z. B. Klassifizierung, Kundensupport und Textgenerierung.

Modellkarte in Model Garden ansehen

Attribut Beschreibung
Modell-ID mistral-nemo
Versionen
  • mistral-nemo
    • Startphase:Wurde verworfen
    • Veröffentlichungsdatum:24. Juli 2024
Unterstützte Regionen

Modellverfügbarkeit

USA

  • us-central1

Europa

  • europe-west4

ML-Verarbeitung

USA

  • Multi-region

Europa

  • Multi-region

Kontingentlimits

us-central1:

  • QPM: 60
  • TPM: 400.000
  • Kontextlänge: 128.000

europe-west4:

  • QPM: 60
  • TPM: 400.000
  • Kontextlänge: 128.000

Preise Weitere Informationen finden Sie unter Preise.

Claude 3 Opus

Claude 3 Opus von Anthropic wird seit dem 30. Juni 2025 nicht mehr unterstützt und am 1. August 2025 eingestellt. Claude 3 Opus ist nur für Bestandskunden verfügbar.

Claude 3 Opus von Anthropic ist ein leistungsstarkes KI-Modell, das bei hochkomplexen Aufgaben Top-Level-Leistung bietet. Sie ist beeindruckend fließend und hat menschenähnliches Verständnis, um mit offenen Prompts und ungesehenen Szenarien zurechtzukommen. Claude 3 Opus ist für die folgenden Anwendungsfälle optimiert:

  • Aufgabenautomatisierung, z. B. interaktives Programmieren und Planen oder Ausführen komplexer Aktionen über APIs und Datenbanken hinweg.

  • Aufgaben im Bereich Forschung und Entwicklung, z. B. Recherche, Brainstorming und Hypothesengenerierung sowie Produkttests.

  • Strategieaufgaben wie erweiterte Analysen von Diagrammen und Grafiken, Finanzdaten und Markttrends sowie Prognosen.

  • Vision-Aufgaben, z. B. die Verarbeitung von Bildern, um eine Textausgabe zurückzugeben. Außerdem können Diagramme, Grafiken, technische Diagramme, Berichte und andere visuelle Inhalte analysiert werden.

Modellkarte in Model Garden ansehen

Attribut Beschreibung
Modell-ID claude-3-opus@20240229
Token limits
Maximale Anzahl eingegebener Tokens 200.000
Maximale Anzahl ausgegebener Tokens 8.000
Funktionen
Technische Daten
Bilder
  • Einschränkungen und Spezifikationen:Siehe Vision in der Dokumentation von Anthropic.
Dokumente
  • Einschränkungen und Spezifikationen:Siehe PDF-Unterstützung in der Dokumentation von Anthropic.
Wissensstichtag August 2023
Versionen
  • claude-3-opus@20240229
    • Startphase:Wurde verworfen
    • Veröffentlichungsdatum:31. Mai 2024
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich festes Kontingent und bereitgestellter Durchsatz)

USA

  • us-east5

ML-Verarbeitung

USA

  • Multi-region

Kontingentlimits

us-east5:

  • QPM: 20
  • TPM: 105.000 (Ein- und Ausgabe)
  • Kontextlänge: 200.000

Preise Weitere Informationen finden Sie unter Preise.