Gemini ist eine Familie von Modellen, die Informationen aus mehreren Modalitäten verarbeiten, darunter Text, Bilder, Audio und Video. Gemini kann riesige Mengen an Informationen durchsuchen und analysieren, um diese multimodalen Datentypen nahtlos zu verstehen und zu verarbeiten. Weitere Informationen finden Sie unter Gemini – Übersicht.
Gemini 1.5 Flash ist die einfache, schnelle und kostengünstige Version der Gemini-Modellreihe. Gemini 1.5 Pro ist robuster.
Auf dieser Seite werden die Spezifikationen von Gemini-Modellen beschrieben, die Sie in Google Distributed Cloud (GDC) ohne Internetverbindung verwenden können.
Anwendungsfälle für Modelle
In der folgenden Tabelle sind die Anwendungsfälle für Modelle zusammengefasst, die in der Gemini API verfügbar sind.
| Modell | Eingaben | Ausgaben | Anwendungsfall |
|---|---|---|---|
| Gemini 1.5 Pro | Text, Code, Bilder, Audio, Video, Video mit Audio, Dokumente | Text | Unterstützt Anwendungen, die eine höhere Antwortqualität erfordern. |
| Gemini 1.5 Flash | Text, Code, Bilder, Audio, Video, Video mit Audio, Dokumente | Text | Bietet Geschwindigkeit und Effizienz für kostengünstige Anwendungen. |
Die folgenden Informationen enthalten Details zu den einzelnen Gemini-Modellen.
| Funktion | Gemini 1.5 Pro, | Gemini 1.5 Flash |
|---|---|---|
| Beschreibung | Ein Allzweckmodell für multimodale Anwendungsfälle. Verwenden Sie dieses Modell, wenn Sie ein Modell benötigen, das eine große Anzahl von Anfragen und die Verarbeitung von Abfragen mit langem Kontext unterstützt. | Eine einfache, schnelle und kostengünstige Version, die für multimodale Anwendungsfälle entwickelt wurde. Verwenden Sie dieses Modell, wenn Sie ein Modell benötigen, das eine große Anzahl von Anfragen verarbeiten kann und kostengünstig ist. |
| Leistungsspektrum |
|
|
| Verlaufszeitraum | Bis zu 32.000 Tokens | Bis zu 32.000 Tokens |
| Maximale Anzahl von Bildern pro Prompt | 100 | 100 |
| Maximale Größe von Rohbildern | 20 MB | 20 MB |
| Maximale Größe eines Base64-codierten Bildes | 7 MB | 7 MB |
| Maximale Anzahl von Audiodateien pro Prompt | Kein Limit | Kein Limit |
| Maximale Audiolänge | 15 Minuten | 09 Minuten |
| Maximale Anzahl von Videos pro Prompt | 10 | 10 |
| Maximale Videolänge (nur Frames) | 120 Sekunden | 120 Sekunden |
| Maximale Videolänge (Frames und Audio) | 100 Sekunden | 100 Sekunden |
| Maximale Dateigröße für Dokumente | 50 MB | 50 MB |
| Maximale Anzahl von Dokumentdateien pro Anfrage | 100 | 100 |
| Maximale Anzahl von Seiten pro Dokument | 100 | 100 |
Modell auswählen und Prompts erstellen
Sie müssen das Modell auswählen, mit dem die Antwort auf Anfragen zur Inhaltserstellung generiert werden soll. Das ausgewählte Modell beeinflusst die Ausgabe und wirkt sich auf die Kosten aus.
Die Gemini-Modell-Endpunkt-IDs in GDC sind:
| Name | Modellendpunkt-ID |
|---|---|
| Gemini Flash | gemini-1.5-flash |
| Gemini Pro | gemini-1.5-pro |
Anschließend müssen Sie Prompts erstellen, um Ausgaben von einem Modell zu erhalten. Sie können die Ausgaben verbessern, indem Sie dem Modell genaue Anweisungen, Beispiele und den erforderlichen Kontext oder spezielle Informationen geben. Weitere Informationen zu Prompts finden Sie unter Einführung in Prompts.