Optimiser les requêtes

Ce document explique comment utiliser l'optimiseur de requêtes Vertex AI pour maximiser automatiquement les performances d'un ensemble de requêtes en améliorant les instructions système.

L'optimiseur de requêtes Vertex AI peut vous aider à améliorer rapidement vos requêtes à grande échelle, sans avoir à réécrire manuellement les instructions système ni les requêtes individuelles. Cela est particulièrement utile lorsque vous souhaitez réutiliser dans un modèle les instructions système et les requêtes que vous avez écrites pour un autre modèle.

Nous proposons deux approches pour optimiser les requêtes :

  • L'optimiseur zero-shot est un optimiseur à faible latence en temps réel qui améliore un seul modèle d'instruction de prompt ou de système. Il est rapide et ne nécessite aucune configuration supplémentaire, si ce n'est de fournir votre requête ou instruction système d'origine.
  • L'optimiseur basé sur les données est un optimiseur itératif au niveau des tâches par lot qui améliore les requêtes en évaluant la réponse du modèle à des exemples de requêtes libellées par rapport à des métriques d'évaluation spécifiées pour le modèle cible sélectionné. Il s'agit d'une optimisation plus avancée qui vous permet de configurer les paramètres d'optimisation et de fournir quelques exemples étiquetés.

Ces méthodes sont disponibles pour les utilisateurs dans l'interface utilisateur (UI) ou le SDK Vertex AI.

Modèles cibles compatibles pour l'optimisation

L'optimiseur zero-shot est indépendant du modèle et peut améliorer les requêtes pour n'importe quel modèle Google.

L'optimiseur basé sur les données n'est compatible qu'avec les modèles Gemini disponibles dans le commerce.

Étapes suivantes