Gemini 2.5 Flash

Gemini 2.5 Flash ist unser bestes Modell in Bezug auf Preis und Leistung und bietet umfassende Funktionen. Gemini 2.5 Flash ist unser erstes Flash-Modell mit Denkfunktionen. Damit können Sie den Denkprozess sehen, den das Modell beim Generieren seiner Antwort durchläuft.

Noch detailliertere technische Informationen zu Gemini 2.5 Flash, z. B. Leistungsbenchmarks, Informationen zu unseren Trainingsdatensätzen, Bemühungen im Bereich Nachhaltigkeit, beabsichtigte Nutzung und Einschränkungen sowie unser Ansatz in Bezug auf Ethik und Sicherheit, finden Sie in unserem technischen Bericht zu unseren Gemini 2.5-Modellen und auf der Modellkarte für Gemini 2.5 Flash.

2.5 Flash

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-2.5-flash
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.535 (Standard)
Leistungsspektrum
Nutzungstypen
Maximale Eingabegröße 500 MB
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 3.000
  • Maximale Bildgröße: 7 MB
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 3.000
  • Maximale Anzahl von Seiten pro Datei: 1.000
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Spracherkennung für: Audiozusammenfassung, Transkription und Übersetzung
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)

  • Global
    • global
  • USA
    • us-central1
    • us-east1
    • us-east4
    • us-east5
    • us-south1
    • us-west1
    • us-west4
  • Europa
    • europe-central2
    • europe-north1
    • europe-southwest1
    • europe-west1
    • europe-west4
    • europe-west8

ML-Verarbeitung

  • USA
    • Mehrere Regionen
  • Kanada
    • northamerica-northeast1+
  • Europa
    • Mehrere Regionen
    • europe-west2* +
    • europe-west3* +
    • europe-west9* +
  • Asiatisch-pazifischer Raum
    • asia-northeast1* +
    • asia-northeast3* +
    • asia-south1* +
    • asia-southeast1+
    • australia-southeast1* +
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Januar 2025
Versionen
  • gemini-2.5-flash
    • Markteinführungsphase: GA
    • Veröffentlichungsdatum: 17. Juni 2025
    • Einstellungsdatum: 17. Juni 2026
  • gemini-live-2.5-flash
    • Markteinführungsphase: Private GA
    • Veröffentlichungsdatum: 17. Juni 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.
+ Überwachte Feinabstimmung nicht unterstützt
* Nur für 128.000 Kontextfenster verfügbar, überwachte Feinabstimmung nicht unterstützt

2.5 Flash

In Vertex AI ausprobieren (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-2.5-flash-preview-09-2025
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Code, Bilder, Audio, Video
  • Ausgaben:
    Text
Token limits
  • Maximale Eingabetokens: 1.048.576
  • Maximale Ausgabetokens: 65.535 (Standard)
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 3.000
  • Maximale Bildgröße: 7 MB
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 3.000
  • Maximale Anzahl von Seiten pro Datei: 1.000
  • Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB
  • Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Video
  • Maximale Videolänge (mit Audio): ca. 45 Minuten
  • Maximale Videolänge (ohne Audio): ca. 1 Stunde
  • Maximale Anzahl von Videos pro Prompt: 10
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens
  • Maximale Anzahl von Audiodateien pro Prompt: 1
  • Spracherkennung für: Audiozusammenfassung, Transkription und Übersetzung
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)

  • Global
    • global
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Januar 2025
Versionen
  • gemini-2.5-flash-preview-09-2025
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 25. September 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.

Bild

In Vertex AI ausprobieren (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.
Modell-ID gemini-2.5-flash-image-preview
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Bilder
  • Ausgaben:
    Text und Bild
Token limits
  • Maximale Eingabetokens: 32.768
  • Maximale Ausgabetokens: 32.768
Leistungsspektrum
Nutzungstypen
Maximale Eingabegröße 500 MB
Technische Spezifikationen
Bilder
  • Maximale Anzahl von Bildern pro Prompt: 3
  • Maximale Bildgröße: 7 MB
  • Maximale Anzahl von Ausgabebildern pro Prompt: 10
  • Unterstützte MIME-Typen:
    image/png, image/jpeg, image/webp
Dokumente
  • Maximale Anzahl von Dateien pro Prompt: 3
  • Maximale Anzahl von Seiten pro Datei: 3
  • Maximale Dateigröße pro Datei: 50 MB
  • Unterstützte MIME-Typen:
    application/pdf, text/plain
Parameterstandardwerte
  • Temperatur: 0,0–2,0 (Standardwert: 1,0)
  • topP: 0,0–1,0 (Standard 0,95)
  • topK: 64 (fest)
  • candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen

Modellverfügbarkeit

(einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)

  • Global
    • global
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Juni 2025
Versionen
  • gemini-2.5-flash-image-preview
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 26. August 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.

Native Audio für die Live API

Gemini 2.5 Flash mit nativen Audiofunktionen der Live API – unsere hochmoderne native Audiofunktion für die Live API. Zusätzlich zu den Standardfunktionen der Live API bietet dieses Vorschau-Modell:

  • Bessere Audioqualität:Die Audioqualität wurde deutlich verbessert und es fühlt sich an, als würden Sie mit einer echten Person sprechen.
  • Verbesserte Sprachqualität und Anpassungsfähigkeit:Die native Audiofunktion der Live API bietet natürlichere Sprachinteraktionen mit 30 HD-Stimmen> in 24 Sprachen.
  • Proactive Audio:Wenn Proactive Audio aktiviert ist, reagiert das Modell nur, wenn es relevant ist. Das Modell generiert proaktiv nur für Anfragen, die an das Gerät gerichtet sind, Texttranskripte und Audioantworten und reagiert nicht auf Anfragen, die nicht an das Gerät gerichtet sind.
  • Affektiver Dialog:Modelle, die die native Audio-Funktion der Live API verwenden, können die emotionalen Äußerungen von Nutzern verstehen und angemessen darauf reagieren, um nuanciertere Unterhaltungen zu ermöglichen.
  • Verbesserte Unterbrechungsfunktion:Sie können Gemini jetzt natürlicher und zuverlässiger unterbrechen, auch in lauten Umgebungen.
  • Robuste Funktionsaufrufe:Wir haben die Auslöserate verbessert, sodass Gemini die von Ihnen definierten Funktionen zur Unterstützung Ihrer Anwendungsfälle erfolgreich ausführen kann.
  • Genaue Transkription:Die Genauigkeit der Audio-zu-Text-Transkription wurde deutlich verbessert.
  • Nahtlose mehrsprachige Unterstützung:Sie können mit Gemini in mehreren Sprachen sprechen und Gemini wechselt mühelos zwischen den Sprachen, ohne dass eine Vorkonfiguration erforderlich ist. Sprache ist kein Hindernis mehr.

Weitere Informationen zur Live API finden Sie hier:

In Vertex AI ausprobieren

Modell-ID gemini-live-2.5-flash-preview-native-audio-09-2025
Unterstützte Ein- und Ausgaben
  • Eingaben:
    Text, Audio, Video
  • Ausgaben:
    Text, Audio
Token limits
  • Maximale Eingabetokens: 128.000
  • Maximale Ausgabetokens: 64.000
  • Kontextfenster: 32.000 Tokens (Standard), kann auf 128.000 Tokens aktualisiert werden
Leistungsspektrum
Nutzungstypen
Technische Spezifikationen
Video
  • Standardauflösung: 768 × 768
  • Unterstützte MIME-Typen:
    video/x-flv, video/quicktime, video/mpeg, video/mpegs, video/mpg, video/mp4, video/webm, video/wmv, video/3gpp
Audio
  • Maximale Länge des Gesprächs: Standardmäßig 10 Minuten, die verlängert werden können.
  • Erforderliches Audioeingabeformat: Rohes 16‑Bit-PCM-Audio mit 16 kHz, Little Endian
  • Erforderliches Audioausgabeformat: Rohes 16‑Bit-PCM-Audio mit 24 kHz, Little Endian
  • Unterstützte MIME-Typen:
    audio/x-aac, audio/flac, audio/mp3, audio/m4a, audio/mpeg, audio/mpga, audio/mp4, audio/opus, audio/pcm, audio/wav, audio/webm
Parameterstandardwerte
  • Empfindlichkeit zum Erkennen des Redebeginns: niedrig
  • Empfindlichkeit zum Erkennen des Redeendes: Hoch
  • Vorangehender Abstand: 0
  • Maximale Kontextgröße: 128.000
Unterstützte Regionen

Modellverfügbarkeit

  • USA
    • us-central1
Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag Januar 2025
Versionen
  • gemini-live-2.5-flash-preview-native-audio-09-17
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 18. September 2025
  • gemini-live-2.5-flash-preview-native-audio
    • Startphase: Öffentliche Vorschau
    • Veröffentlichungsdatum: 17. Juni 2025
    • Einstellungsdatum: 18. Oktober 2025
Sicherheitskontrollen
Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen Unterstützte Sprachen
Preise Weitere Informationen finden Sie unter Preise.