Présentation des modèles partenaires sur Vertex AI

Vertex AI est compatible avec une sélection de modèles développés par des partenaires Google. Les modèles partenaires peuvent être utilisés avec Vertex AI sous forme de modèle en tant que service (MaaS) et sont proposés en tant qu'API gérée. Lorsque vous utilisez un modèle partenaire, vous continuez à envoyer vos requêtes aux points de terminaison Vertex AI. Les modèles partenaires sont sans serveur. Vous n'avez donc pas besoin de provisionner ni de gérer l'infrastructure.

Vous pouvez découvrir des modèles partenaires sur la plate-forme Model Garden, et également y déployer des modèles. Pour en savoir plus, consultez la page Découvrir des modèles d'IA dans Model Garden. Bien que des informations sur chaque modèle partenaire disponible soient accessibles sur la fiche de modèle dédiée à chacun d'eux dans Model Garden, seuls les modèles tiers opérant comme un modèle MaaS avec Vertex AI sont documentés dans ce guide.

Les modèles Claude de la société Anthropic constituent un exemple de modèles gérés tiers disponibles sur Vertex AI. Pour apprendre à utiliser les modèles Claude, consultez la page Utiliser les modèles Claude d'Anthropic.

Performances prévisibles avec assurance de la capacité

Google propose un débit provisionné pour les modèles partenaires, qui réserve une capacité de débit pour vos modèles à un tarif fixe. Vous déterminez la capacité de débit et les régions dans lesquelles vous souhaitez réserver cette capacité. Étant donné que les requêtes de débit provisionné sont prioritaires par rapport aux requêtes standards avec paiement à l'utilisation, le débit provisionné offre une disponibilité accrue. Lorsque le système est surchargé, vos requêtes peuvent toujours être traitées tant que le débit reste inférieur à votre capacité de débit réservée. Pour en savoir plus ou pour vous abonner au service, contactez le service commercial.