Modèles Google

Modèles Gemini mis en avant

Modèles Gemini en disponibilité générale

diamond Gemini 2.5 Pro Notre modèle de raisonnement le plus avancé à ce jour
spark Gemini 2.5 Flash Notre meilleur modèle en termes de rapport prix/performances, offrant des fonctionnalités complètes
performance_auto Gemini 2.5 Flash-Lite Notre modèle le plus économique, qui prend en charge les tâches à haut débit
spark Gemini 2.0 Flash Notre tout dernier modèle multimodal, doté de fonctionnalités de nouvelle génération et de capacités améliorées
performance_auto Gemini 2.0 Flash-Lite Un modèle Gemini 2.0 Flash optimisé pour l'efficacité et la faible latence

Aperçu des modèles Gemini

photo_spark Aperçu de l'image Gemini 2.5 Flash Notre modèle standard amélioré pour accélérer les workflows créatifs, doté de fonctionnalités de génération d'images et de modification conversationnelle multitour. et de machine learning.

Modèles Gemma

Gemma 3n Derniers modèles ouverts, conçus pour une exécution efficace sur les appareils à faibles ressources, capables de gérer des entrées multimodales (texte, image, vidéo et audio), et de générer des sorties de texte. Ils sont entraînés avec des données dans plus de 140 langues parlées.
Gemma 3 Troisième génération de nos modèles ouverts, capable de résoudre un large éventail de tâches avec des entrées de texte et d'image, prenant en charge plus de 140 langues et dotée d'une longue fenêtre contextuelle de 128 Ko
Gemma 2 Deuxième génération de nos modèles ouverts, capable de générer, résumer et extraire du texte
Gemma Modèle ouvert léger de petite taille, capable de générer, résumer et extraire du texte
ShieldGemma 2 Modèles ajustés aux instructions pour évaluer la sécurité du texte et des images par rapport à un ensemble de règles de sécurité définies
PaliGemma Notre modèle ouvert vision-langage qui combine SigLIP et Gemma
CodeGemma Modèle ouvert puissant et léger, capable d'effectuer diverses tâches de codage, comme la complétion de code, la génération de code, la compréhension du langage naturel, le raisonnement mathématique et le suivi d'instructions
TxGemma Génère des prédictions, des classifications ou du texte en fonction de données thérapeutiques. Il peut être utilisé pour créer efficacement des modèles d'IA pour des tâches thérapeutiques avec moins de données et moins de puissance de calcul.
MedGemma Collection de variantes de Gemma 3 entraînées pour la compréhension de texte et d'images médicales
MedSigLIP Variante de SigLIP entraînée pour encoder des images et du texte médicaux dans un espace d'embedding commun
T5Gemma Famille de modèles de recherche encodeur-décodeur légers, mais puissants, de Google

Modèles d'embeddings

width_normal Embeddings pour le texte Convertit les données textuelles en représentations vectorielles pour la recherche sémantique, la classification, le clustering et les tâches similaires
width_normal Embeddings multimodaux Génère des vecteurs à partir d'images, qui peuvent être utilisés pour des tâches en aval telles que la classification d'images, la recherche d'images et plus encore

Modèles Imagen disponibles

photo_spark Imagen 4 pour la génération Utilisez des requêtes textuelles pour générer des images inédites de meilleure qualité que celles de nos modèles de génération d'images précédents.
photo_spark Imagen 4 pour la génération rapide Utilisez des requêtes textuelles pour générer des images inédites de meilleure qualité et avec une latence plus faible que celles de nos modèles de génération d'images précédents.
photo_spark Imagen 4 pour la génération Ultra Utilisez des requêtes textuelles pour générer des images inédites de meilleure qualité et avec une meilleure conformité aux requêtes que celles de nos modèles de génération d'images précédents.
photo_spark Imagen 3 pour la génération Utilisez des requêtes textuelles pour générer des images inédites.
image_edit_auto Imagen 3 pour la retouche et la personnalisation Utilisez des requêtes textuelles pour retoucher des images d'entrée existantes ou des parties d'une image avec un masque, ou pour générer de nouvelles images en fonction du contexte fourni par les images d'entrée de référence.
photo_spark Imagen 3 pour la génération rapide Utilisez des requêtes textuelles pour générer des images inédites avec une latence plus faible que celle de nos autres modèles de génération d'images.
subtitles Imagen pour le sous-titrage et la VQA Utilisez des requêtes textuelles pour générer des images inédites, retoucher des images existantes, retoucher des parties d'une image avec un masque et plus encore.

Prévisualiser les modèles Imagen

photo_spark Essai virtuel Générez des images de personnes portant des vêtements.
image_edit_auto Recontextualisation de produit Imagen sur Vertex AI Utilisez des requêtes textuelles pour modifier les images de produits en les plaçant dans différentes scènes ou en leur ajoutant des arrière-plans.

Modèles Veo

movie Veo 2 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos
movie Veo 3 Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité que notre modèle de génération de vidéos précédent
movie Veo 3 Fast Utilisez des requêtes textuelles et des images pour générer de nouvelles vidéos de meilleure qualité et à latence plus faible que notre modèle de génération de vidéos précédent

Prévisualiser les modèles Veo

movie Aperçu de Veo 3 Utilisez des requêtes textuelles et des images pour générer des vidéos inédites de meilleure qualité que notre modèle de génération de vidéos précédent.
movie Aperçu de Veo 3 Fast Utilisez des requêtes textuelles et des images pour générer des vidéos inédites de meilleure qualité et à latence plus faible que notre modèle de génération de vidéos précédent.

Modèles MedLM

medical_information MedLM-medium Suite conforme à la loi HIPAA, qui repose sur des API et des modèles médicaux optimisés mis en œuvre par Google Research. Ce modèle aide les professionnels de la santé à répondre à des questions médicales et à résumer des documents médicaux et de santé.
clinical_notes MedLM-large-large Suite conforme à la loi HIPAA, qui repose sur des API et des modèles médicaux optimisés mis en œuvre par Google Research. Ce modèle aide les professionnels de la santé à répondre à des questions médicales et à résumer des documents médicaux et de santé.

Langues acceptées

Gemini

Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes :

Afrikaans (af), Albanais (sq), Amharique (am), Arabe (ar), Arménien (hy), Assamais (as), Azerbaïdjanais (az), Basque (eu), Biélorusse (be), Bengali (bn), Bosnien (bs), Bulgare (bg), Catalan (ca), Cebuano (ceb), Chinois (simplifié et traditionnel) (zh), Corse (co), Croate (hr), Tchèque (cs), Danois (da), Divehi (dv), Néerlandais (nl), Anglais (en), Espéranto (eo), Estonien (et), Filipino (Tagalog) (fil), Finnois (fi), Français (fr), Frison (fy), Galicien (gl), Géorgien (ka), Allemand (de), Grec (el), Goudjarati (gu), Créole haïtien (ht), Haoussa (ha), Hawaïen (haw), Hébreu (iw), Hindi (hi), Hmong (hmn), Hongrois (hu), Islandais (is), Igbo (ig), Indonésien (id), Irlandais (ga), Italien (it), Japonais (ja), Javanais (jv), Kannada (kn), Kazakh (kk), Khmer (km), Coréen (ko), Krio (kri), Kurde (ku), Kirghize (ky), Laotien (lo), Latin (la), Letton (lv), Lituanien (lt), Luxembourgeois (lb), Macédonien (mk), Malgache (mg), Malais (ms), Malayalam (ml), Maltais (mt), Maori (mi), Marathi (mr), Meiteilon (Manipuri) (mni-Mtei), Mongol (mn), Birman (my), Népalais (ne), Norvégien (no), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Pachtou (ps), Persan (fa), Polonais (pl), Portugais (pt), Pendjabi (pa), Roumain (ro), Russe (ru), Samoan (sm), Gaélique écossais (gd), Serbe (sr), Sesotho (st), Shona (sn), Sindhi (sd), Cingalais (si), Slovaque (sk), Slovène (sl), Somali (so), Espagnol (es), Soundanais (su), Swahili (sw), Suédois (sv), Tadjik (tg), Tamil (ta), Télougou (te), Thaï (th), Turc (tr), Ukrainien (uk), Ourdou (ur), Ouïghour (ug), Ouzbek (uz), Vietnamien (vi), Gallois (cy), Xhosa (xh), Yiddish (yi), Yoruba (yo), et Zoulou (zu).

Gemma

Gemma et Gemma 2 ne sont disponibles qu'en anglais (en). Gemma 3 et Gemma 3n sont multilingues et compatibles avec plus de 140 langues.

Embeddings

Les modèles d'embedding textuel multilingues sont compatibles avec les langues suivantes :

Afrikaans (af), Albanais (sq), Amharique (am), Arabe (ar), Arménien (hy), Azerbaïdjanais (az), Basque (eu), Biélorusse (be), Bengali (bn), Bulgare (bg), Catalan (ca), Cebuano (ceb), Chinois (simplifié et traditionnel) (zh), Corse (co), Tchèque (cs), Danois (da), Néerlandais (nl), Anglais (en), Espéranto (eo), Estonien (et), Philippin (tagalog) (fil), Finnois (fi), Français (fr), Frison (fy), Galicien (gl), Géorgien (ka), Allemand (de), Grec (el), Goudjarati (gu), Créole haïtien (ht), Haoussa (ha), Hawaïen (haw), Hébreu (iw), Hindi (hi), Hmong (hmn), Hongrois (hu), Islandais (is), Igbo (ig), Indonésien (id), Irlandais (ga), Italien (it), Japonais (ja), Javanais (jv), Kannada (kn), Kazakh (kk), Khmer (km), Coréen (ko), Kurde (ku), Kirghize (ky), Laotien (lo), Latin (la), Letton (lv), Lituanien (lt), Luxembourgeois (lb), Macédonien (mk), Malgache (mg), Malais (ms), Malayalam (ml), Maltais (mt), Maori (mi), Marathi (mr), Mongol (mn), Birman (my), Népalais (ne), Nyanja (chichewa) (ny), Norvégien (no), Pachtou (ps), Persan (fa), Polonais (pl), Portugais (pt), Pendjabi (pa), Roumain (ro), Russe (ru), Samoan (sm), Gaélique écossais (gd), Serbe (sr), Sotho (st), Shona (sn), Sindhi (sd), Cingalais (si), Slovaque (sk), Slovène (sl), Somali (so), Espagnol (es), Soundanais (su), Swahili (sw), Suédois (sv), Tadjik (tg), Tamil (ta), Télougou (te), Thaï (th), Turc (tr), Ukrainien (uk), Ourdou (ur), Ouzbek (uz), Vietnamien (vi), Gallois (cy), Xhosa (xh), Yiddish (hmn), Yoruba (yo), et Zoulou (zu).yi

Imagen 3

Imagen 3 est compatible avec les langues suivantes :

Anglais (en), chinois (simplifié et traditionnel) (zh), hindi (hi), japonais (ja), coréen (ko), portugais (pt) et espagnol (es).

MedLM

Le modèle MedLM est compatible avec l'anglais (en).

Explorer tous les modèles dans Model Garden

Model Garden est une plate-forme qui vous permet de découvrir, de tester, de personnaliser et de déployer des modèles de Google, puis de sélectionner des modèles et des éléments OSS. Pour explorer les modèles d'IA générative et les API disponibles sur Vertex AI, accédez à Model Garden dans la console Google Cloud .

Accéder à la page "Jardin de modèles"

Pour en savoir plus sur Model Garden, y compris sur les modèles et fonctionnalités disponibles, consultez la page Explorer les modèles d'IA dans Model Garden.

Versions de modèle

Pour afficher toutes les versions de modèle, y compris les modèles anciens et abandonnés, consultez Versions et cycle de vie des modèles.

Étapes suivantes