Verfügbare Gemini-Modelle

Gemini ist eine Familie von Modellen, die Informationen aus mehreren Modalitäten verarbeiten, darunter Text, Bilder, Audio und Video. Gemini kann riesige Mengen an Informationen durchsuchen und analysieren, um diese multimodalen Datentypen nahtlos zu verstehen und zu verarbeiten. Weitere Informationen finden Sie unter Gemini – Übersicht.

Gemini 1.5 Flash ist die einfache, schnelle und kostengünstige Version der Gemini-Modellreihe. Gemini 1.5 Pro ist robuster.

Auf dieser Seite werden die Spezifikationen von Gemini-Modellen beschrieben, die Sie in Google Distributed Cloud (GDC) ohne Internetverbindung verwenden können.

Anwendungsfälle für Modelle

In der folgenden Tabelle sind die Anwendungsfälle für Modelle zusammengefasst, die in der Gemini API verfügbar sind.

Modell	Eingaben	Ausgaben	Anwendungsfall
Gemini 1.5 Pro	Text, Code, Bilder, Audio, Video, Video mit Audio, Dokumente	Text	Unterstützt Anwendungen, die eine höhere Antwortqualität erfordern.
Gemini 1.5 Flash	Text, Code, Bilder, Audio, Video, Video mit Audio, Dokumente	Text	Bietet Geschwindigkeit und Effizienz für kostengünstige Anwendungen.

Die folgenden Informationen enthalten Details zu den einzelnen Gemini-Modellen.

Funktion	Gemini 1.5 Pro,	Gemini 1.5 Flash
Beschreibung	Ein Allzweckmodell für multimodale Anwendungsfälle. Verwenden Sie dieses Modell, wenn Sie ein Modell benötigen, das eine große Anzahl von Anfragen und die Verarbeitung von Abfragen mit langem Kontext unterstützt.	Eine einfache, schnelle und kostengünstige Version, die für multimodale Anwendungsfälle entwickelt wurde. Verwenden Sie dieses Modell, wenn Sie ein Modell benötigen, das eine große Anzahl von Anfragen verarbeiten kann und kostengünstig ist.
Leistungsspektrum	Text-Prompts Multimodale Prompts: Bild Audio Video Dokumente	Text-Prompts Multimodale Prompts: Bild Audio Video Dokumente
Verlaufszeitraum	Bis zu 32.000 Tokens	Bis zu 32.000 Tokens
Maximale Anzahl von Bildern pro Prompt	100	100
Maximale Größe von Rohbildern	20 MB	20 MB
Maximale Größe eines Base64-codierten Bildes	7 MB	7 MB
Maximale Anzahl von Audiodateien pro Prompt	Kein Limit	Kein Limit
Maximale Audiolänge	15 Minuten	09 Minuten
Maximale Anzahl von Videos pro Prompt	10	10
Maximale Videolänge (nur Frames)	120 Sekunden	120 Sekunden
Maximale Videolänge (Frames und Audio)	100 Sekunden	100 Sekunden
Maximale Dateigröße für Dokumente	50 MB	50 MB
Maximale Anzahl von Dokumentdateien pro Anfrage	100	100
Maximale Anzahl von Seiten pro Dokument	100	100

Modell auswählen und Prompts erstellen

Sie müssen das Modell auswählen, mit dem die Antwort auf Anfragen zur Inhaltserstellung generiert werden soll. Das ausgewählte Modell beeinflusst die Ausgabe und wirkt sich auf die Kosten aus.

Die Gemini-Modell-Endpunkt-IDs in GDC sind:

Name	Modellendpunkt-ID
Gemini Flash	`gemini-1.5-flash`
Gemini Pro	`gemini-1.5-pro`

Anschließend müssen Sie Prompts erstellen, um Ausgaben von einem Modell zu erhalten. Sie können die Ausgaben verbessern, indem Sie dem Modell genaue Anweisungen, Beispiele und den erforderlichen Kontext oder spezielle Informationen geben. Weitere Informationen zu Prompts finden Sie unter Einführung in Prompts.

Verfügbare Gemini-Modelle Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Anwendungsfälle für Modelle

Modell auswählen und Prompts erstellen

Verfügbare Gemini-Modelle