Gemini est une famille de modèles qui traitent des informations provenant de plusieurs modalités, y compris du texte, des images, de l'audio et des vidéos. Gemini peut explorer et analyser de grandes quantités d'informations pour comprendre et traiter ces types de données multimodales de manière fluide. Pour en savoir plus, consultez la présentation de Gemini.
Gemini 1.5 Flash est la version légère, rapide et économique de la famille de modèles Gemini. Gemini 1.5 Pro est conçu pour être plus robuste.
Cette page décrit les spécifications des modèles Gemini que vous pouvez utiliser sur Google Distributed Cloud (GDC) air-gapped.
Cas d'utilisation des modèles
Le tableau suivant récapitule les cas d'utilisation des modèles disponibles dans l'API Gemini.
| Modèle | Entrées | Résultats | Cas d'utilisation |
|---|---|---|---|
| Gemini 1.5 Pro | Texte, code, images, audio, vidéo, vidéo avec audio, documents | Texte | Prend en charge les applications qui nécessitent une qualité de réponse améliorée. |
| Gemini 1.5 Flash | Texte, code, images, audio, vidéo, vidéo avec audio, documents | Texte | Offre rapidité et efficacité pour les applications économiques. |
Les informations suivantes fournissent des détails sur chaque modèle Gemini.
| Fonctionnalité | Gemini 1.5 Pro | Gemini 1.5 Flash |
|---|---|---|
| Description | Un modèle à usage général pour les cas d'utilisation multimodaux. À utiliser lorsque vous avez besoin d'un modèle capable de gérer un grand nombre de requêtes et de comprendre un contexte de grande taille. | Version légère, rapide et économique conçue pour les cas d'utilisation multimodaux. Utilisez-le lorsque vous avez besoin d'un modèle capable de gérer un grand nombre de requêtes et qui soit rentable. |
| Capacités |
|
|
| Fenêtre de contexte | Jusqu'à 32 000 jetons | Jusqu'à 32 000 jetons |
| Nombre maximal d'images par requête | 100 | 100 |
| Taille maximale de l'image brute | 20 Mo | 20 Mo |
| Taille maximale de l'image encodée en base64 | 7 Mo | 7 Mo |
| Nombre maximal de fichiers audio par requête | Aucune limite | Aucune limite |
| Durée maximale du contenu audio | 15 minutes | 09 minutes |
| Nombre maximal de vidéos par requête | 10 | 10 |
| Durée maximale de la vidéo (images uniquement) | 120 secondes | 120 secondes |
| Durée maximale de la vidéo (images et audio) | 100 secondes | 100 secondes |
| Taille maximale des fichiers de documents | 50 Mo | 50 Mo |
| Nombre maximal de fichiers de documents par requête | 100 | 100 |
| Nombre maximal de pages par document | 100 | 100 |
Choisir un modèle et créer des requêtes
Vous devez choisir le modèle à partir duquel vous souhaitez générer la réponse aux demandes de génération de contenu. Le modèle que vous sélectionnez a une incidence sur le résultat et le coût.
Voici les ID des points de terminaison des modèles Gemini dans GDC :
| Nom | ID du point de terminaison du modèle |
|---|---|
| Gemini Flash | gemini-1.5-flash |
| Gemini Pro | gemini-1.5-pro |
Vous devez ensuite créer des requêtes pour obtenir des résultats d'un modèle. Vous pouvez améliorer les résultats en fournissant au modèle des instructions précises, des exemples, ainsi que le contexte ou les informations spécialisées nécessaires. Pour en savoir plus sur les requêtes, consultez Présentation des requêtes.