Verfügbare Gemini-Modelle

Gemini ist eine Familie von Modellen, die Informationen aus mehreren Modalitäten verarbeiten, darunter Text, Bilder, Audio und Video. Gemini kann riesige Mengen an Informationen durchsuchen und analysieren, um diese multimodalen Datentypen nahtlos zu verstehen und zu verarbeiten. Weitere Informationen finden Sie unter Gemini – Übersicht.

Gemini 1.5 Flash ist die einfache, schnelle und kostengünstige Version der Gemini-Modellreihe. Gemini 1.5 Pro ist robuster.

Auf dieser Seite werden die Spezifikationen von Gemini-Modellen beschrieben, die Sie in Google Distributed Cloud (GDC) ohne Internetverbindung verwenden können.

Anwendungsfälle für Modelle

In der folgenden Tabelle sind die Anwendungsfälle für Modelle zusammengefasst, die in der Gemini API verfügbar sind.

Modell Eingaben Ausgaben Anwendungsfall
Gemini 1.5 Pro Text, Code, Bilder, Audio, Video, Video mit Audio, Dokumente Text Unterstützt Anwendungen, die eine höhere Antwortqualität erfordern.
Gemini 1.5 Flash Text, Code, Bilder, Audio, Video, Video mit Audio, Dokumente Text Bietet Geschwindigkeit und Effizienz für kostengünstige Anwendungen.

Die folgenden Informationen enthalten Details zu den einzelnen Gemini-Modellen.

Funktion Gemini 1.5 Pro, Gemini 1.5 Flash
Beschreibung Ein Allzweckmodell für multimodale Anwendungsfälle. Verwenden Sie dieses Modell, wenn Sie ein Modell benötigen, das eine große Anzahl von Anfragen und die Verarbeitung von Abfragen mit langem Kontext unterstützt. Eine einfache, schnelle und kostengünstige Version, die für multimodale Anwendungsfälle entwickelt wurde. Verwenden Sie dieses Modell, wenn Sie ein Modell benötigen, das eine große Anzahl von Anfragen verarbeiten kann und kostengünstig ist.
Leistungsspektrum
  • Text-Prompts
  • Multimodale Prompts:
    • Bild
    • Audio
    • Video
    • Dokumente
  • Text-Prompts
  • Multimodale Prompts:
    • Bild
    • Audio
    • Video
    • Dokumente
Verlaufszeitraum Bis zu 32.000 Tokens Bis zu 32.000 Tokens
Maximale Anzahl von Bildern pro Prompt 100 100
Maximale Größe von Rohbildern 20 MB 20 MB
Maximale Größe eines Base64-codierten Bildes 7 MB 7 MB
Maximale Anzahl von Audiodateien pro Prompt Kein Limit Kein Limit
Maximale Audiolänge 15 Minuten 09 Minuten
Maximale Anzahl von Videos pro Prompt 10 10
Maximale Videolänge (nur Frames) 120 Sekunden 120 Sekunden
Maximale Videolänge (Frames und Audio) 100 Sekunden 100 Sekunden
Maximale Dateigröße für Dokumente 50 MB 50 MB
Maximale Anzahl von Dokumentdateien pro Anfrage 100 100
Maximale Anzahl von Seiten pro Dokument 100 100

Modell auswählen und Prompts erstellen

Sie müssen das Modell auswählen, mit dem die Antwort auf Anfragen zur Inhaltserstellung generiert werden soll. Das ausgewählte Modell beeinflusst die Ausgabe und wirkt sich auf die Kosten aus.

Die Gemini-Modell-Endpunkt-IDs in GDC sind:

Name Modellendpunkt-ID
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

Anschließend müssen Sie Prompts erstellen, um Ausgaben von einem Modell zu erhalten. Sie können die Ausgaben verbessern, indem Sie dem Modell genaue Anweisungen, Beispiele und den erforderlichen Kontext oder spezielle Informationen geben. Weitere Informationen zu Prompts finden Sie unter Einführung in Prompts.