Présentation du réglage de modèle pour Gemini

Le réglage de modèle est un processus essentiel pour adapter Gemini afin d'effectuer des tâches spécifiques avec plus de précision. Pour affiner les réglages d'un modèle, fournissez-lui un ensemble de données d'entraînement contenant un ensemble d'exemples de tâches spécifiques en aval.

Cette page présente le réglage de modèle pour Gemini, décrit les options de réglage disponibles pour Gemini et vous aide à déterminer quand utiliser chaque option de réglage.

Avantages du réglage du modèle

Le réglage de modèles est un moyen efficace de personnaliser de grands modèles en fonction de vos tâches. Il s'agit d'une étape clé pour améliorer la qualité et l'efficacité du modèle. Le réglage du modèle offre les avantages suivants :

Meilleure qualité pour vos tâches spécifiques.
Amélioration de la robustesse du modèle.
Latence et coût d'inférence plus faibles en raison de requêtes plus courtes.

Optimisation par rapport à la conception de l'invite

Le réglage offre les avantages suivants par rapport à la conception d'invites.

Permet une personnalisation approfondie du modèle et de meilleures performances sur des tâches spécifiques.
Offre des résultats plus cohérents et fiables.
Permet de gérer plusieurs exemples à la fois.

Approches du réglage

Le réglage des paramètres avec optimisation et l'affinage complet sont deux approches de personnalisation des modèles volumineux. Les deux méthodes ont leurs avantages et leurs implications en termes de qualité du modèle et d'efficacité des ressources.

La méthode avec optimisation

Le réglage des paramètres avec optimisation, également appelé réglage des adaptateurs, permet d'adapter efficacement les modèles volumineux à vos tâches ou domaines spécifiques. Le réglage des paramètres avec optimisation met à jour un sous-ensemble relativement restreint des paramètres du modèle au cours du processus d'ajustement.

Pour comprendre comment Vertex AI gère le réglage et l'inférence des adaptateurs, vous trouverez plus de détails dans le livre blanc Adaptation of Large Foundation Models (Adaptation des grands modèles de fondation).

Affinage complet

L'affinage complet met à jour tous les paramètres du modèle, ce qui permet de l'adapter à des tâches très complexes, avec la possibilité d'obtenir une qualité supérieure. Cependant, l'affinage complet nécessite des ressources de calcul plus élevées pour le réglage et la diffusion, ce qui entraîne des coûts globaux plus élevés.

Paramètres avec optimisation par rapport à affinage complet

Le réglage des paramètres avec optimisation est plus économe en ressources et plus économique par rapport à l'affinage complet. Il utilise des ressources de calcul nettement inférieures pour l'entraînement. Il peut adapter le modèle plus rapidement avec un ensemble de données plus petit. La flexibilité du réglage des paramètres avec optimisation offre une solution d'apprentissage multitâche sans nécessiter de réentraînement approfondi.

Régler des modèles Gemini

Les modèles Gemini (gemini-1.0-pro-002) sont compatibles avec les méthodes de réglage suivantes :

Affinage supervisé (efficace en termes de paramètres)

Le l'affinage supervisé des modèles Gemini améliore les performances du modèle en lui apprenant une nouvelle compétence. Des données contenant des centaines d'exemples étiquetés sont utilisées pour apprendre au modèle à simuler un comportement ou une tâche souhaité. Chaque exemple étiqueté montre ce que vous souhaitez que le modèle génère lors de l'inférence.

L'affinage supervisé est idéal lorsque vous avez une tâche bien définie avec des données étiquetées disponibles. Il adapte le comportement du modèle à un ensemble de données étiquetées. Ce processus ajuste les pondérations du modèle afin de minimiser la différence entre ses prédictions et les étiquettes réelles.

Quota

Le quota est appliqué au nombre de jobs de réglage simultanés. Chaque projet est associé à un quota par défaut permettant d'exécuter au moins une tâche de réglage. Il s'agit d'un quota global, partagé entre toutes les régions disponibles. Si vous souhaitez exécuter plusieurs tâches simultanément, vous devez demander un quota supplémentaire pour Global concurrent tuning jobs.

Tarification

L'affinage supervisé pour gemini-1.0-pro-002 est en preview.

Tant que le réglage est en version bêta, il est gratuit.
Après le réglage d'un modèle, les coûts d'inférence du modèle réglé continuent de s'appliquer. Les tarifs d'inférence sont les mêmes pour chaque version stable de Gemini 1.0 Pro.

Pour en savoir plus, consultez les pages Tarifs de Vertex AI et Versions de modèles stables de Gemini disponibles.

Étapes suivantes

Pour savoir comment préparer les données de réglage, consultez Préparer les données d'affinage supervisé.
Pour savoir comment utiliser le réglage supervisé dans une solution qui crée une base de connaissances d'IA générative, consultez la page Solution de démarrage rapide : base de connaissances d'IA générative.