Cette page a été traduite par l'API Cloud Translation.

Modèles Google

Modèles Gemini mis en avant

2.5 Pro

Notre modèle Gemini au raisonnement le plus avancé, conçu pour résoudre des problèmes complexes

Idéal pour la compréhension multimodale
Capable de traiter des requêtes complexes et de fournir des réponses complètes
Idéal pour le codage, en particulier pour le développement Web

2.5 Flash

Notre meilleur modèle en termes de rapport prix/performances, offrant des fonctionnalités polyvalentes

Compatibilité avec l'API Live incluse pour certains points de terminaison
Afficher le processus de réflexion du modèle dans la réponse
Équilibre entre prix et performances

2.5 Flash-Lite

Notre modèle le plus économique, qui prend en charge les tâches à haut débit

Le modèle le plus rapide de la gamme 2.5
Il dispose d'une fenêtre de contexte d'un million de jetons et d'une entrée multimodale, comme 2.5 Flash.
Surpasse 2.0 Flash sur la plupart des benchmarks d'évaluation

Modèles Gemini en disponibilité générale

diamond Gemini 2.5 Pro Notre modèle de raisonnement le plus avancé à ce jour

spark Gemini 2.5 Flash Notre meilleur modèle en termes de rapport prix/performances, offrant des fonctionnalités complètes

photo_spark Gemini 2.5 Flash Image Notre modèle standard mis à niveau pour des workflows créatifs rapides avec des fonctionnalités de génération d'images et de retouche conversationnelle en plusieurs étapes

performance_auto Gemini 2.5 Flash-Lite Notre modèle le plus économique, qui prend en charge les tâches à haut débit

spark Gemini 2.0 Flash Notre tout nouveau modèle multimodal, doté de fonctionnalités de nouvelle génération et de capacités améliorées

performance_auto Gemini 2.0 Flash-Lite Un modèle Gemini 2.0 Flash optimisé pour l'efficacité économique et la faible latence

Aperçu des modèles Gemini

mic_detect_auto API Live Gemini 2.5 Flash Notre modèle standard amélioré pour des expériences conversationnelles en temps réel avec des capacités de streaming

Modèles Gemma

Gemma 3n Derniers modèles ouverts, conçus pour une exécution efficace sur les appareils à faibles ressources, capables de gérer des entrées multimodales (texte, image, vidéo et audio), de générer des sorties de texte et entraînés avec des données dans plus de 140 langues parlées

Gemma 3 Troisième génération de nos modèles ouverts, capable de résoudre un large éventail de tâches avec des entrées de texte et d'image, compatible avec plus de 140 langues et dotée d'une longue fenêtre contextuelle de 128 K

Gemma 2 Deuxième génération de nos modèles ouverts, capable de générer, résumer et extraire du texte

Gemma Modèle ouvert léger de petite taille, capable de générer, résumer et extraire du texte

ShieldGemma 2 Modèles optimisés pour les instructions permettant d'évaluer la sécurité du texte et des images par rapport à un ensemble de règles de sécurité définies

PaliGemma Notre modèle ouvert de vision et de langage qui combine SigLIP et Gemma

CodeGemma Modèle ouvert puissant et léger, capable d'effectuer diverses tâches de codage, comme la complétion de code à trous, la génération de code, la compréhension du langage naturel, le raisonnement mathématique et le suivi d'instructions

TxGemma Génère des prédictions, des classifications ou du texte en fonction de données thérapeutiques. Il peut être utilisé pour créer efficacement des modèles d'IA pour des tâches thérapeutiques avec moins de données et moins de puissance de calcul.

MedGemma Collection de variantes de Gemma 3 entraînées pour la compréhension de texte et d'images médicales

MedSigLIP Variante de SigLIP entraînée pour encoder des images et du texte médicaux dans un espace d'embedding commun

T5Gemma Famille de modèles de recherche encodeur-décodeur légers, mais puissants, de Google

Modèles d'embeddings

width_normal Embeddings pour le texte Convertit les données textuelles en représentations vectorielles pour la recherche sémantique, la classification, le clustering et les tâches similaires

width_normal Embeddings multimodaux Génère des vecteurs à partir d'images, qui peuvent être utilisés pour des tâches en aval telles que la classification d'images, la recherche d'images et plus encore

Modèles Imagen en disponibilité générale

photo_spark Imagen 4 pour la génération Utilisez des requêtes textuelles pour générer des images inédites de meilleure qualité que celles de nos modèles de génération d'images précédents.

photo_spark Imagen 4 pour la génération rapide Utilisez des requêtes textuelles pour générer des images inédites de meilleure qualité et avec une latence plus faible que celles de nos modèles de génération d'images précédents.

photo_spark Imagen 4 pour la génération Ultra Utilisez des requêtes textuelles pour générer des images inédites de meilleure qualité et avec une meilleure conformité aux requêtes que celles de nos modèles de génération d'images précédents.

photo_spark Imagen 3 pour la génération Utilisez des requêtes textuelles pour générer des images inédites.

image_edit_auto Imagen 3 pour l'édition et la personnalisation Utilisez des requêtes textuelles pour modifier des images d'entrée existantes ou des parties d'une image avec un masque, ou pour générer de nouvelles images en fonction du contexte fourni par les images d'entrée de référence.

photo_spark Imagen 3 pour la génération rapide Utilisez des requêtes textuelles pour générer des images inédites avec une latence plus faible que celle de nos autres modèles de génération d'images.

subtitles Imagen pour le sous-titrage et la VQA Utilisez des requêtes textuelles pour générer des images inédites, modifier des images existantes, modifier des parties d'une image avec un masque et plus encore.

Prévisualiser les modèles Imagen

photo_spark Essai virtuel Générez des images de personnes portant des vêtements.

image_edit_auto Recontextualisation de produit Imagen sur Vertex AI Utilisez des requêtes textuelles pour modifier les images de produits en les plaçant dans différentes scènes ou en leur ajoutant des arrière-plans.

Modèles Veo

movie Veo 2 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos

movie Veo 3 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité que notre modèle de génération de vidéos précédent

movie Veo 3 Fast Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité et avec une latence plus faible que notre modèle de génération de vidéos précédent

Prévisualiser les modèles Veo

movie Aperçu de Veo 3 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité que notre modèle de génération de vidéos précédent.

movie Aperçu de Veo 3 Fast Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité et à latence plus faible que notre modèle de génération de vidéos précédent.

movie Aperçu de Veo 3.1 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité que notre modèle de génération de vidéos précédent.

movie Aperçu de Veo 3.1 Fast Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité et à latence plus faible que notre modèle de génération de vidéos précédent.

movie Aperçu de Veo 2 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos. Cette version du modèle est compatible avec le remplissage et l'extension d'image.

Modèles Veo expérimentaux

movie Veo 2 expérimental Modèle expérimental avec des fonctionnalités en cours de test.

Modèles MedLM

medical_information MedLM-medium Suite conforme à la loi HIPAA, qui repose sur des API et des modèles médicaux optimisés mis en œuvre par Google Research. Ce modèle aide les professionnels de la santé à répondre à des questions médicales et à résumer des documents médicaux et de santé.

clinical_notes MedLM-large-large Suite conforme à la loi HIPAA, qui repose sur des API et des modèles médicaux optimisés mis en œuvre par Google Research. Ce modèle aide les professionnels de la santé à répondre à des questions médicales et à résumer des documents médicaux et de santé.

Langues acceptées

Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Afrikaans (af), Albanais (sq), Amharique (am), Arabe (ar), Arménien (hy), Assamais (as), Azerbaïdjanais (az), Basque (eu), Biélorusse (be), Bengali (bn), Bosnien (bs), Bulgare (bg), Catalan (ca), Cebuano (ceb), Chinois (simplifié et traditionnel) (zh), Corse (co), Croate (hr), Tchèque (cs), Danois (da), Divehi (dv), Néerlandais (nl), Anglais (en), Espéranto (eo), Estonien (et), Filipino (Tagalog) (fil), Finnois (fi), Français (fr), Frison (fy), Galicien (gl), Géorgien (ka), Allemand (de), Grec (el), Gourmandji (gu), Créole haïtien (ht), Haoussa (ha), Hawaïen (haw), Hébreu (iw), Hindi (hi), Hmong (hmn), Hongrois (hu), Islandais (is), Igbo (ig), Indonésien (id), Irlandais (ga), Italien (it), Japonais (ja), Javanais (jv), Kannada (kn), Kazakh (kk), Khmer (km), Coréen (ko), Krio (kri), Kurde (ku), Kirghize (ky), Laotien (lo), Latin (la), Letton (lv), Lituanien (lt), Luxembourgeois (lb), Macédonien (mk), Malgache (mg), Malais (ms), Malayalam (ml), Maltais (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongol (mn), Birman (my), Népalais (ne), Norvégien (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Pachtou (ps), Persan (fa), Polonais (pl), Portugais (pt), Pendjabi (pa), Roumain (ro), Russe (ru), Samoan (sm), Gaélique écossais (gd), Serbe (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalais (si), Slovaque (sk), Slovène (sl), Somali (so), Espagnol (es), Soundanais (su), Swahili (sw), Suédois (sv), Tadjik (tg), Tamoul (ta), Télougou (te), Thaï (th), Turc (tr), Ukrainien (uk), Ourdou (ur), Ouïghour (ug), Ouzbek (uz), Vietnamien (vi), Gallois (cy), Xhosa (xh), Yiddish (yi), Yoruba (yo), et Zoulou (zu).

Gemma

Gemma et Gemma 2 ne sont disponibles qu'en anglais (en). Gemma 3 et Gemma 3n sont multilingues et compatibles avec plus de 140 langues.

Embeddings

Les modèles d'embeddings textuels multilingues sont compatibles avec les langues suivantes :

Afrikaans (af), Albanais (sq), Amharique (am), Arabe (ar), Arménien (hy), Azerbaïdjanais (az), Basque (eu), Biélorusse (be), Bengali (bn), Bulgare (bg), Catalan (ca), Cebuano (ceb), Chinois (simplifié et traditionnel) (zh), Corse (co), Tchèque (cs), Danois (da), Néerlandais (nl), Anglais (en), Espéranto (eo), Estonien (et), Filipino (Tagalog) (fil), Finnois (fi), Français (fr), Frison (fy), Galicien (gl), Géorgien (ka), Allemand (de), Grec (el), Goudjarati (gu), Créole haïtien (ht), Haoussa (ha), Hawaïen (haw), Hébreu (iw), Hindi (hi), Hmong (hmn), Hongrois (hu), Islandais (is), Igbo (ig), Indonésien (id), Irlandais (ga), Italien (it), Japonais (ja), Javanais (jv), Kannada (kn), Kazakh (kk), Khmer (km), Coréen (ko), Kurde (ku), Kirghize (ky), Laotien (lo), Latin (la), Letton (lv), Lituanien (lt), Luxembourgeois (lb), Macédonien (mk), Malgache (mg), Malais (ms), Malayalam (ml), Maltais (mt), Maori (mi), Marathi (mr), Mongol (mn), Birman (my), Népalais (ne), Nyanja (Chichewa) (ny), Norvégien (no), Pachtou (ps), Persan (fa), Polonais (pl), Portugais (pt), Pendjabi (pa), Roumain (ro), Russe (ru), Samoan (sm), Gaélique écossais (gd), Serbe (sr), Sotho (st), Shona (sn), Sindhi (sd), Cingalais (si), Slovaque (sk), Slovène (sl), Somali (so), Espagnol (es), Soundanais (su), Swahili (sw), Suédois (sv), Tadjik (tg), Tamil (ta), Télougou (te), Thaï (th), Turc (tr), Ukrainien (uk), Ourdou (ur), Ouzbek (uz), Vietnamien (vi), Gallois (cy), Xhosa (xh), Yiddish (hmn), Yoruba (yo), et Zoulou (zu).yi

Imagen 3

Imagen 3 est compatible avec les langues suivantes :

Anglais (en), chinois (simplifié et traditionnel) (zh), hindi (hi), japonais (ja), coréen (ko), portugais (pt) et espagnol (es).

MedLM

Le modèle MedLM est compatible avec l'anglais (en).

Explorer tous les modèles dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Vertex AI, accédez à Model Garden dans la console Google Cloud .

Accéder à la page "Jardin de modèles"

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Versions de modèle

Pour afficher toutes les versions de modèle, y compris les modèles anciens et abandonnés, consultez Versions et cycle de vie des modèles.

Étapes suivantes

Suivez un tutoriel de démarrage rapide sur Vertex AI Studio ou sur l'API Vertex AI.
Découvrez les modèles pré-entraînés dans Model Garden.
Découvrez comment contrôler l'accès à des modèles spécifiques dans Model Garden à l'aide d'une règle d'administration Model Garden.
En savoir plus sur les tarifs.