Modèles Gemini disponibles

Gemini est une famille de modèles qui traitent des informations provenant de plusieurs modalités, y compris du texte, des images, de l'audio et des vidéos. Gemini peut explorer et analyser de grandes quantités d'informations pour comprendre et traiter ces types de données multimodales de manière fluide. Pour en savoir plus, consultez la présentation de Gemini.

Gemini 1.5 Flash est la version légère, rapide et économique de la famille de modèles Gemini. Gemini 1.5 Pro est conçu pour être plus robuste.

Cette page décrit les spécifications des modèles Gemini que vous pouvez utiliser sur Google Distributed Cloud (GDC) air-gapped.

Cas d'utilisation des modèles

Le tableau suivant récapitule les cas d'utilisation des modèles disponibles dans l'API Gemini.

Modèle Entrées Résultats Cas d'utilisation
Gemini 1.5 Pro Texte, code, images, audio, vidéo, vidéo avec audio, documents Texte Prend en charge les applications qui nécessitent une qualité de réponse améliorée.
Gemini 1.5 Flash Texte, code, images, audio, vidéo, vidéo avec audio, documents Texte Offre rapidité et efficacité pour les applications économiques.

Les informations suivantes fournissent des détails sur chaque modèle Gemini.

Fonctionnalité Gemini 1.5 Pro Gemini 1.5 Flash
Description Un modèle à usage général pour les cas d'utilisation multimodaux. À utiliser lorsque vous avez besoin d'un modèle capable de gérer un grand nombre de requêtes et de comprendre un contexte de grande taille. Version légère, rapide et économique conçue pour les cas d'utilisation multimodaux. Utilisez-le lorsque vous avez besoin d'un modèle capable de gérer un grand nombre de requêtes et qui soit rentable.
Capacités
  • Requêtes textuelles
  • Requêtes multimodales :
    • Image
    • Audio
    • Vidéo
    • Documents
  • Requêtes textuelles
  • Requêtes multimodales :
    • Image
    • Audio
    • Vidéo
    • Documents
Fenêtre de contexte Jusqu'à 32 000 jetons Jusqu'à 32 000 jetons
Nombre maximal d'images par requête 100 100
Taille maximale de l'image brute 20 Mo 20 Mo
Taille maximale de l'image encodée en base64 7 Mo 7 Mo
Nombre maximal de fichiers audio par requête Aucune limite Aucune limite
Durée maximale du contenu audio 15 minutes 09 minutes
Nombre maximal de vidéos par requête 10 10
Durée maximale de la vidéo (images uniquement) 120 secondes 120 secondes
Durée maximale de la vidéo (images et audio) 100 secondes 100 secondes
Taille maximale des fichiers de documents 50 Mo 50 Mo
Nombre maximal de fichiers de documents par requête 100 100
Nombre maximal de pages par document 100 100

Choisir un modèle et créer des requêtes

Vous devez choisir le modèle à partir duquel vous souhaitez générer la réponse aux demandes de génération de contenu. Le modèle que vous sélectionnez a une incidence sur le résultat et le coût.

Voici les ID des points de terminaison des modèles Gemini dans GDC :

Nom ID du point de terminaison du modèle
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

Vous devez ensuite créer des requêtes pour obtenir des résultats d'un modèle. Vous pouvez améliorer les résultats en fournissant au modèle des instructions précises, des exemples, ainsi que le contexte ou les informations spécialisées nécessaires. Pour en savoir plus sur les requêtes, consultez Présentation des requêtes.