Présentation des modèles partenaires sur Vertex AI

Vertex AI est compatible avec une sélection de modèles développés par des partenaires Google. Les modèles partenaires peuvent être utilisés avec Vertex AI sous forme de modèle en tant que service (MaaS) et sont proposés en tant qu'API gérée. Lorsque vous utilisez un modèle partenaire, vous continuez à envoyer vos requêtes aux points de terminaison Vertex AI. Les modèles partenaires sont sans serveur. Vous n'avez donc pas besoin de provisionner ni de gérer l'infrastructure.

Vous pouvez découvrir des modèles partenaires sur la plate-forme Model Garden, et également y déployer des modèles. Pour en savoir plus, consultez la page Découvrir des modèles d'IA dans Model Garden. Bien que des informations sur chaque modèle partenaire disponible soient accessibles sur la fiche de modèle dédiée à chacun d'eux dans Model Garden, seuls les modèles tiers opérant comme un modèle MaaS avec Vertex AI sont documentés dans ce guide.

Les modèles Anthropic Claude et Mistral sont des exemples de modèles gérés tiers disponibles sur Vertex AI.

Performances prévisibles avec assurance de la capacité

Google propose un débit provisionné pour les modèles partenaires, qui réserve une capacité de débit pour vos modèles à un tarif fixe. Vous déterminez la capacité de débit et les régions dans lesquelles vous souhaitez réserver cette capacité. Étant donné que les requêtes de débit provisionné sont prioritaires par rapport aux requêtes standards avec paiement à l'utilisation, le débit provisionné offre une disponibilité accrue. Lorsque le système est surchargé, vos requêtes peuvent toujours être traitées tant que le débit reste inférieur à votre capacité de débit réservée. Pour en savoir plus ou pour vous abonner au service, contactez le service commercial.

Activer les modèles partenaires pour les utilisateurs

Pour que vous puissiez activer des modèles partenaires et envoyer une requête, un administrateur Google Cloud doit définir les autorisations requises et vérifier que la règle d'administration autorise l'utilisation des API requises.

Définir les autorisations requises

Vous devez disposer des rôles et autorisations suivants pour utiliser des modèles partenaires :

  • Vous devez disposer du rôle IAM (Identity and Access Management) de gestionnaire des droits d'approvisionnement des consommateurs. Toute personne disposant de ce rôle peut activer des modèles partenaires dans Model Garden.

  • Vous devez disposer de l'autorisation aiplatform.endpoints.predict. Cette autorisation est incluse dans le rôle IAM "Utilisateur Vertex AI". Pour en savoir plus, consultez les sections Utilisateur Vertex AI et Contrôle des accès.

Console

  1. Pour attribuer les rôles IAM "Gestionnaire des droits d'approvisionnement des consommateurs" à un utilisateur, accédez à la page IAM.

    Accéder à IAM

  2. Dans la colonne Compte principal, recherchez le compte principal d'utilisateur pour lequel vous souhaitez activer l'accès aux modèles partenaires, puis cliquez sur Modifier le compte principal sur cette ligne.

  3. Dans le volet Modifier les accès, cliquez sur Ajouter un autre rôle.

  4. Dans Sélectionner un rôle, sélectionnez Gestionnaire des droits d'approvisionnement des consommateurs.

  5. Dans le volet Modifier les accès, cliquez sur Ajouter un autre rôle.

  6. Dans le champ Sélectionner un rôle, sélectionnez Utilisateur Vertex AI.

  7. Cliquez sur Enregistrer.

gcloud

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. Attribuez le rôle de gestionnaire des droits d'approvisionnement des consommateurs requis pour activer les modèles partenaires dans Model Garden

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/consumerprocurement.entitlementManager
    
  3. Attribuez le rôle d'utilisateur Vertex AI qui inclut l'autorisation aiplatform.endpoints.predict requise pour effectuer des requêtes :

    gcloud projects add-iam-policy-binding  PROJECT_ID \
    --member=PRINCIPAL --role=roles/aiplatform.user
    

    Remplacez PRINCIPAL par l'identifiant du compte principal. L'identifiant se présente sous la forme user|group|serviceAccount:email ou domain:domain (par exemple, user:cloudysanfrancisco@gmail.com, group:admins@example.com, serviceAccount:test123@example.domain.com ou domain:example.domain.com.

    Le résultat est une liste de liaisons de stratégie qui incluent les éléments suivants :

    - members:
      - user:PRINCIPAL
      role: roles/roles/consumerprocurement.entitlementManager
    

    Pour plus d'informations, consultez les sections Attribuer un seul rôle et gcloud projects add-iam-policy-binding.

Définir la règle d'administration

Pour activer les modèles partenaires, votre règle d'administration doit autoriser les API suivantes :

  • API Cloud Commerce Consumer Procurement – cloudcommerceconsumerprocurement.googleapis.com
  • API Commerce Agreement – commerceagreement.googleapis.com

Si votre organisation définit une règle d'administration pour restreindre l'utilisation des services, un administrateur de l'organisation doit vérifier que cloudcommerceconsumerprocurement.googleapis.com et commerceagreement.googleapis.com sont autorisés en définissant la règle d'administration.