Modèles Gemini disponibles

Gemini est une famille de modèles qui traitent des informations provenant de plusieurs modalités, y compris du texte, des images, de l'audio et des vidéos. Gemini peut explorer et analyser de grandes quantités d'informations pour comprendre et traiter ces types de données multimodales de manière fluide. Pour en savoir plus, consultez la présentation de Gemini.

Gemini 1.5 Flash est la version légère, rapide et économique de la famille de modèles Gemini. Gemini 1.5 Pro est conçu pour être plus robuste.

Cette page décrit les spécifications des modèles Gemini que vous pouvez utiliser sur Google Distributed Cloud (GDC) air-gapped.

Cas d'utilisation des modèles

Le tableau suivant récapitule les cas d'utilisation des modèles disponibles dans l'API Gemini.

Modèle	Entrées	Résultats	Cas d'utilisation
Gemini 1.5 Pro	Texte, code, images, audio, vidéo, vidéo avec audio, documents	Texte	Prend en charge les applications qui nécessitent une qualité de réponse améliorée.
Gemini 1.5 Flash	Texte, code, images, audio, vidéo, vidéo avec audio, documents	Texte	Offre rapidité et efficacité pour les applications économiques.

Les informations suivantes fournissent des détails sur chaque modèle Gemini.

Fonctionnalité	Gemini 1.5 Pro	Gemini 1.5 Flash
Description	Un modèle à usage général pour les cas d'utilisation multimodaux. À utiliser lorsque vous avez besoin d'un modèle capable de gérer un grand nombre de requêtes et de comprendre un contexte de grande taille.	Version légère, rapide et économique conçue pour les cas d'utilisation multimodaux. Utilisez-le lorsque vous avez besoin d'un modèle capable de gérer un grand nombre de requêtes et qui soit rentable.
Capacités	Requêtes textuelles Requêtes multimodales : Image Audio Vidéo Documents	Requêtes textuelles Requêtes multimodales : Image Audio Vidéo Documents
Fenêtre de contexte	Jusqu'à 32 000 jetons	Jusqu'à 32 000 jetons
Nombre maximal d'images par requête	100	100
Taille maximale de l'image brute	20 Mo	20 Mo
Taille maximale de l'image encodée en base64	7 Mo	7 Mo
Nombre maximal de fichiers audio par requête	Aucune limite	Aucune limite
Durée maximale du contenu audio	15 minutes	09 minutes
Nombre maximal de vidéos par requête	10	10
Durée maximale de la vidéo (images uniquement)	120 secondes	120 secondes
Durée maximale de la vidéo (images et audio)	100 secondes	100 secondes
Taille maximale des fichiers de documents	50 Mo	50 Mo
Nombre maximal de fichiers de documents par requête	100	100
Nombre maximal de pages par document	100	100

Choisir un modèle et créer des requêtes

Vous devez choisir le modèle à partir duquel vous souhaitez générer la réponse aux demandes de génération de contenu. Le modèle que vous sélectionnez a une incidence sur le résultat et le coût.

Voici les ID des points de terminaison des modèles Gemini dans GDC :

Nom	ID du point de terminaison du modèle
Gemini Flash	`gemini-1.5-flash`
Gemini Pro	`gemini-1.5-pro`

Vous devez ensuite créer des requêtes pour obtenir des résultats d'un modèle. Vous pouvez améliorer les résultats en fournissant au modèle des instructions précises, des exemples, ainsi que le contexte ou les informations spécialisées nécessaires. Pour en savoir plus sur les requêtes, consultez Présentation des requêtes.

Modèles Gemini disponibles Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Cas d'utilisation des modèles

Choisir un modèle et créer des requêtes

Modèles Gemini disponibles