Provisionner des GPU et activer les API pré-entraînées Vertex AI

Chaque service Vertex AI nécessite des ressources de calcul différentes, y compris des processeurs graphiques (GPU), comme décrit dans Planification de la capacité et exigences de calcul. Cette page explique comment provisionner des ressources GPU pour exécuter des charges de travail d'intelligence artificielle (IA) et de machine learning (ML) dans un environnement GPU. Cette page vous explique également comment activer les API pré-entraînées Vertex AI sur l'appliance isolée Google Distributed Cloud (GDC) afin de pouvoir commencer à implémenter les fonctionnalités Vertex AI.

La plupart des tâches de configuration des ressources GPU et d'activation ou de désactivation des API pré-entraînées Vertex AI nécessitent un accès administrateur. Si vous ne disposez pas des autorisations nécessaires, demandez à votre administrateur d'activer les GPU et les API Vertex AI pré-entraînés pour vous.

L'appliance Vertex AI sur GDC isolée physiquement inclut trois API, une pour chacun de ses modèles pré-entraînés. Pour en savoir plus sur ces modèles pré-entraînés, consultez la documentation suivante :

Utilisez la console GDC pour activer, désactiver et afficher les points de terminaison des API Vertex AI pré-entraînées.

Avant de commencer

Pour obtenir les autorisations nécessaires pour activer les API pré-entraînées, demandez à votre administrateur IAM au niveau de l'organisation ou du projet de vous attribuer le rôle Administrateur AI Platform (ai-platform-admin) dans l'espace de noms du projet.

Pour en savoir plus sur ce rôle, consultez Préparer les autorisations IAM. Pour savoir comment accorder des autorisations à un sujet, consultez Accorder et révoquer des accès.

Pour provisionner des GPU avant d'activer les API pré-entraînées, procédez comme suit :

  1. Configurez un projet pour utiliser Vertex AI.
  2. Assurez-vous que la communication d'entrée appropriée est configurée pour votre projet.
  3. Gérer les charges de travail GPU
  4. Connectez-vous à la console GDC. Si vous ne parvenez pas à vous connecter, consultez Récupérer un appareil si le fournisseur d'identité n'est pas disponible.

Activer les API pré-entraînées

Vous pouvez activer les API pré-entraînées OCR, Speech-to-Text et Vertex AI Translation à l'aide de la console GDC.

Après avoir rempli les conditions préalables, suivez ces étapes pour activer les API pré-entraînées :

  1. Connectez-vous à la console GDC.
  2. Dans le menu de navigation, cliquez sur Vertex AI > API pré-entraînées.
  3. Sur la page API pré-entraînées, cliquez sur Activer pour un service spécifique afin d'activer cette API.

  4. Dans la boîte de dialogue de confirmation, cliquez sur Enable (Activer). Un message de progression s'affiche.

La durée d'activation varie. Cette opération peut prendre entre 15 et 45 minutes.

Si vous souhaitez afficher l'état des API pré-entraînées, consultez l'état du service et les points de terminaison.

Désactiver les API pré-entraînées

Vous pouvez désactiver les API pré-entraînées OCR, Speech-to-Text et Vertex AI Translation à l'aide de la console GDC.

Après avoir rempli les conditions préalables, suivez ces étapes pour désactiver les API pré-entraînées :

  1. Connectez-vous à la console GDC.
  2. Dans le menu de navigation, cliquez sur Vertex AI > API pré-entraînées.
  3. Sur la page API pré-entraînées, cliquez sur Désactiver sur un service spécifique pour désactiver cette API.

  4. Dans la boîte de dialogue de confirmation, saisissez disable dans le champ de texte pour confirmer l'action. Cliquez ensuite sur Désactiver. Un message de progression s'affiche.

Si vous souhaitez afficher l'état des API pré-entraînées, consultez l'état du service et les points de terminaison.