Diese Seite wurde von der Cloud Translation API übersetzt.

Gemini 2.5 Flash

Gemini 2.5 Flash ist unser bestes Modell in Bezug auf Preis und Leistung und bietet umfassende Funktionen. Gemini 2.5 Flash ist unser erstes Flash-Modell mit Denkfunktionen. Damit können Sie den Denkprozess sehen, den das Modell beim Generieren seiner Antwort durchläuft.

Noch detailliertere technische Informationen zu Gemini 2.5 Flash, z. B. Leistungsbenchmarks, Informationen zu unseren Trainingsdatensätzen, Bemühungen im Bereich Nachhaltigkeit, beabsichtigte Nutzung und Einschränkungen sowie unser Ansatz in Bezug auf Ethik und Sicherheit, finden Sie in unserem technischen Bericht zu unseren Gemini 2.5-Modellen und auf der Modellkarte für Gemini 2.5 Flash.

2.5 Flash

In Vertex AI testen Im Model Garden ansehen (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.

Technische Spezifikationen
Modell-ID	`gemini-2.5-flash`
Unterstützte Ein- und Ausgaben	Eingaben: Text, Code, Bilder, Audio, Video Ausgaben: Text
Token limits	Maximale Eingabetokens: 1.048.576 Maximale Ausgabetokens: 65.535 (Standard)
Leistungsspektrum	Unterstützt Fundierung mit der Google Suche Codeausführung Tuning Systemanweisungen Strukturierte Ausgabe Funktionsaufrufe Tokens zählen Live API Vorabversion Denken Kontext-Caching Vertex AI RAG Engine Chat-Vervollständigungen Nicht unterstützt
Nutzungstypen	Unterstützt Bereitgestellter Durchsatz Dynamisches freigegebenes Kontingent Batchvorhersage Nicht unterstützt Festes Kontingent
Maximale Eingabegröße	500 MB
	Bilder	Maximale Anzahl von Bildern pro Prompt: 3.000 Maximale Bildgröße: 7 MB Unterstützte MIME-Typen: `image/png`, `image/jpeg`, `image/webp`
	Dokumente	Maximale Anzahl von Dateien pro Prompt: 3.000 Maximale Anzahl von Seiten pro Datei: 1.000 Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB Unterstützte MIME-Typen: `application/pdf`, `text/plain`
	Video	Maximale Videolänge (mit Audio): ca. 45 Minuten Maximale Videolänge (ohne Audio): ca. 1 Stunde Maximale Anzahl von Videos pro Prompt: 10 Unterstützte MIME-Typen: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens Maximale Anzahl von Audiodateien pro Prompt: 1 Spracherkennung für: Audiozusammenfassung, Transkription und Übersetzung Unterstützte MIME-Typen: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Parameterstandardwerte	Temperatur: 0,0–2,0 (Standardwert: 1,0) topP: 0,0–1,0 (Standard 0,95) topK: 64 (fest) candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen
	Modellverfügbarkeit (einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)	Global global USA us-central1 us-east1 us-east4 us-east5 us-south1 us-west1 us-west4 Europa europe-central2 europe-north1 europe-southwest1 europe-west1 europe-west4 europe-west8
	ML-Verarbeitung	USA Mehrere Regionen Kanada northamerica-northeast1⁺ Europa Mehrere Regionen europe-west2^{* +} europe-west3^{* +} europe-west9^{* +} Asiatisch-pazifischer Raum asia-northeast1^{* +} asia-northeast3^{* +} asia-south1^{* +} asia-southeast1⁺ australia-southeast1^{* +}
	Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag	Januar 2025
Versionen	`gemini-2.5-flash` Markteinführungsphase: GA Veröffentlichungsdatum: 17. Juni 2025 Einstellungsdatum: 17. Juni 2026 `gemini-live-2.5-flash` Markteinführungsphase: Private GA Veröffentlichungsdatum: 17. Juni 2025
Sicherheitskontrollen
Sicherheitskontrollen	Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen	Unterstützte Sprachen
Preise	Weitere Informationen finden Sie unter Preise.

+ Überwachte Feinabstimmung nicht unterstützt
* Nur für 128.000 Kontextfenster verfügbar, überwachte Feinabstimmung nicht unterstützt

2.5 Flash

In Vertex AI ausprobieren (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.

Technische Spezifikationen
Modell-ID	`gemini-2.5-flash-preview-09-2025`
Unterstützte Ein- und Ausgaben	Eingaben: Text, Code, Bilder, Audio, Video Ausgaben: Text
Token limits	Maximale Eingabetokens: 1.048.576 Maximale Ausgabetokens: 65.535 (Standard)
Leistungsspektrum	Unterstützt Fundierung mit der Google Suche Codeausführung Systemanweisungen Strukturierte Ausgabe Funktionsaufrufe Tokens zählen Live API Vorabversion Denken Kontext-Caching Vertex AI RAG Engine Chat-Vervollständigungen Nicht unterstützt Tuning
Nutzungstypen	Unterstützt Bereitgestellter Durchsatz Dynamisches freigegebenes Kontingent Nicht unterstützt Festes Kontingent Batchvorhersage
	Bilder	Maximale Anzahl von Bildern pro Prompt: 3.000 Maximale Bildgröße: 7 MB Unterstützte MIME-Typen: `image/png`, `image/jpeg`, `image/webp`
	Dokumente	Maximale Anzahl von Dateien pro Prompt: 3.000 Maximale Anzahl von Seiten pro Datei: 1.000 Maximale Dateigröße pro Datei für API- oder Cloud Storage-Importe: 50 MB Maximale Dateigröße pro Datei für direkte Uploads über die Console: 7 MB Unterstützte MIME-Typen: `application/pdf`, `text/plain`
	Video	Maximale Videolänge (mit Audio): ca. 45 Minuten Maximale Videolänge (ohne Audio): ca. 1 Stunde Maximale Anzahl von Videos pro Prompt: 10 Unterstützte MIME-Typen: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Maximale Audiolänge pro Prompt: Etwa 8, 4 Stunden oder bis zu 1 Million Tokens Maximale Anzahl von Audiodateien pro Prompt: 1 Spracherkennung für: Audiozusammenfassung, Transkription und Übersetzung Unterstützte MIME-Typen: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Parameterstandardwerte	Temperatur: 0,0–2,0 (Standardwert: 1,0) topP: 0,0–1,0 (Standard 0,95) topK: 64 (fest) candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen
	Modellverfügbarkeit (einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)	Global global
	Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag	Januar 2025
Versionen	`gemini-2.5-flash-preview-09-2025` Startphase: Öffentliche Vorschau Veröffentlichungsdatum: 25. September 2025
Sicherheitskontrollen
Sicherheitskontrollen	Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen	Unterstützte Sprachen
Preise	Weitere Informationen finden Sie unter Preise.

Bild

Vorschau

Dieses Produkt oder Feature ist ein Angebot für eine Vorschau von generativer KI, das den „Nutzungsbedingungen des Pre-GA-Angebots“ der besonderen Nutzungsbedingungen von Google Cloud sowie den zusätzlichen Bedingungen für Vorschauprodukte der generativen KI unterliegt. Für dieses Angebot zur Vorschau generativer KI können Kunden es für Produktions- oder kommerzielle Zwecke verwenden oder generierte Ausgaben an Dritte weitergeben und personenbezogene Daten gemäß dem Zusatz zur Verarbeitung von Cloud-Daten verarbeiten, vorbehaltlich der in der Vereinbarung beschriebenen Verpflichtungen und Einschränkungen, gemäß der Sie auf Google Cloud zugreifen. Pre-GA-Produkte sind „wie gesehen“ verfügbar und bieten möglicherweise nur eingeschränkten Support. Weitere Informationen finden Sie unter Beschreibungen der Startphase.

In Vertex AI ausprobieren (Vorschau) Beispiel-App bereitstellen

Hinweis: Wenn Sie die Funktion „Beispiel-App bereitstellen“ verwenden möchten, benötigen Sie ein Google Cloud-Projekt mit aktivierter Abrechnung und aktivierter Vertex AI API.

Technische Spezifikationen
Modell-ID	`gemini-2.5-flash-image-preview`
Unterstützte Ein- und Ausgaben	Eingaben: Text, Bilder Ausgaben: Text und Bild
Token limits	Maximale Eingabetokens: 32.768 Maximale Ausgabetokens: 32.768
Leistungsspektrum	Unterstützt Systemanweisungen Tokens zählen Nicht unterstützt Fundierung mit der Google Suche Codeausführung Tuning Funktionsaufrufe Live API Vorabversion Denken Kontext-Caching Vertex AI RAG Engine Chat-Vervollständigungen
Nutzungstypen	Unterstützt Bereitgestellter Durchsatz Dynamisches freigegebenes Kontingent Nicht unterstützt Festes Kontingent Batchvorhersage
Maximale Eingabegröße	500 MB
	Bilder	Maximale Anzahl von Bildern pro Prompt: 3 Maximale Bildgröße: 7 MB Maximale Anzahl von Ausgabebildern pro Prompt: 10 Unterstützte MIME-Typen: `image/png`, `image/jpeg`, `image/webp`
	Dokumente	Maximale Anzahl von Dateien pro Prompt: 3 Maximale Anzahl von Seiten pro Datei: 3 Maximale Dateigröße pro Datei: 50 MB Unterstützte MIME-Typen: `application/pdf`, `text/plain`
	Parameterstandardwerte	Temperatur: 0,0–2,0 (Standardwert: 1,0) topP: 0,0–1,0 (Standard 0,95) topK: 64 (fest) candidateCount: 1–8 (Standardwert: 1)
Unterstützte Regionen
	Modellverfügbarkeit (einschließlich dynamisch gemeinsam genutztem Kontingent und bereitgestelltem Durchsatz)	Global global
	Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag	Juni 2025
Versionen	`gemini-2.5-flash-image-preview` Startphase: Öffentliche Vorschau Veröffentlichungsdatum: 26. August 2025
Sicherheitskontrollen
Sicherheitskontrollen	Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen	Unterstützte Sprachen
Preise	Weitere Informationen finden Sie unter Preise.

Native Audio für die Live API

Gemini 2.5 Flash mit nativen Audiofunktionen der Live API – unsere hochmoderne native Audiofunktion für die Live API. Zusätzlich zu den Standardfunktionen der Live API bietet dieses Vorschau-Modell:

Bessere Audioqualität:Die Audioqualität wurde deutlich verbessert und es fühlt sich an, als würden Sie mit einer echten Person sprechen.
Verbesserte Sprachqualität und Anpassungsfähigkeit:Die native Audiofunktion der Live API bietet natürlichere Sprachinteraktionen mit 30 HD-Stimmen> in 24 Sprachen.
Proactive Audio:Wenn Proactive Audio aktiviert ist, reagiert das Modell nur, wenn es relevant ist. Das Modell generiert proaktiv nur für Anfragen, die an das Gerät gerichtet sind, Texttranskripte und Audioantworten und reagiert nicht auf Anfragen, die nicht an das Gerät gerichtet sind.
Affektiver Dialog:Modelle, die die native Audio-Funktion der Live API verwenden, können die emotionalen Äußerungen von Nutzern verstehen und angemessen darauf reagieren, um nuanciertere Unterhaltungen zu ermöglichen.
Verbesserte Unterbrechungsfunktion:Sie können Gemini jetzt natürlicher und zuverlässiger unterbrechen, auch in lauten Umgebungen.
Robuste Funktionsaufrufe:Wir haben die Auslöserate verbessert, sodass Gemini die von Ihnen definierten Funktionen zur Unterstützung Ihrer Anwendungsfälle erfolgreich ausführen kann.
Genaue Transkription:Die Genauigkeit der Audio-zu-Text-Transkription wurde deutlich verbessert.
Nahtlose mehrsprachige Unterstützung:Sie können mit Gemini in mehreren Sprachen sprechen und Gemini wechselt mühelos zwischen den Sprachen, ohne dass eine Vorkonfiguration erforderlich ist. Sprache ist kein Hindernis mehr.

Weitere Informationen zur Live API finden Sie hier:

In Vertex AI ausprobieren

Technische Spezifikationen
Modell-ID	`gemini-live-2.5-flash-preview-native-audio-09-2025`
Unterstützte Ein- und Ausgaben	Eingaben: Text, Audio, Video Ausgaben: Text, Audio
Token limits	Maximale Eingabetokens: 128.000 Maximale Ausgabetokens: 64.000 Kontextfenster: 32.000 Tokens (Standard), kann auf 128.000 Tokens aktualisiert werden
Leistungsspektrum	Unterstützt Fundierung mit der Google Suche Systemanweisungen Funktionsaufrufe Live API Vorabversion Nicht unterstützt Codeausführung Tuning Strukturierte Ausgabe Denken Kontext-Caching Vertex AI RAG Engine Chat-Vervollständigungen
Nutzungstypen	Unterstützt Bis zu 1.000 gleichzeitige Sitzungen Nicht unterstützt Bereitgestellter Durchsatz Dynamisches freigegebenes Kontingent Batchvorhersage
	Video	Standardauflösung: 768 × 768 Unterstützte MIME-Typen: `video/x-flv`, `video/quicktime`, `video/mpeg`, `video/mpegs`, `video/mpg`, `video/mp4`, `video/webm`, `video/wmv`, `video/3gpp`
	Audio	Maximale Länge des Gesprächs: Standardmäßig 10 Minuten, die verlängert werden können. Erforderliches Audioeingabeformat: Rohes 16‑Bit-PCM-Audio mit 16 kHz, Little Endian Erforderliches Audioausgabeformat: Rohes 16‑Bit-PCM-Audio mit 24 kHz, Little Endian Unterstützte MIME-Typen: `audio/x-aac`, `audio/flac`, `audio/mp3`, `audio/m4a`, `audio/mpeg`, `audio/mpga`, `audio/mp4`, `audio/opus`, `audio/pcm`, `audio/wav`, `audio/webm`
	Parameterstandardwerte	Empfindlichkeit zum Erkennen des Redebeginns: niedrig Empfindlichkeit zum Erkennen des Redeendes: Hoch Vorangehender Abstand: 0 Maximale Kontextgröße: 128.000
Unterstützte Regionen
	Modellverfügbarkeit	USA us-central1
	Weitere Informationen finden Sie unter Datenstandort.
Wissensstichtag	Januar 2025
Versionen	`gemini-live-2.5-flash-preview-native-audio-09-17` Startphase: Öffentliche Vorschau Veröffentlichungsdatum: 18. September 2025 `gemini-live-2.5-flash-preview-native-audio` Startphase: Öffentliche Vorschau Veröffentlichungsdatum: 17. Juni 2025 Einstellungsdatum: 18. Oktober 2025
Sicherheitskontrollen
Sicherheitskontrollen	Weitere Informationen finden Sie unter Sicherheitskontrollen.
Unterstützte Sprachen	Unterstützte Sprachen
Preise	Weitere Informationen finden Sie unter Preise.

Gemini 2.5 Flash Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

2.5 Flash

2.5 Flash

Bild

Native Audio für die Live API

Gemini 2.5 Flash