Votre guide vers l’IA générative dans Vertex AI
Warren Barkley
Sr. Director of Product Management
Contactez-nous
Si vous êtes une entreprise et que vous souhaitez vous développer, découvrez comment gagner en productivité avec Google Cloud ou contactez notre équipe commerciale.
Commencer iciVertex AI a été lancé en 2021 pour accélérer le développement et le déploiement de modèles ML avec des outils entièrement managés allant de l'ingénierie des caractéristiques à l'entraînement des modèles et à l'inférence à faible latence, le tout agrémenté de fonctionnalités de gouvernance et de monitoring adaptées aux besoins des entreprises. Depuis son lancement, Vertex AI a été adopté par de nombreux clients qui cherchaient à accélérer leurs projets ML, tels Wayfair, Vodafone, Twitter ou encore CNA. Des centaines de nouvelles fonctionnalités sont venues enrichir la plateforme.
Vertex IA vient ainsi de bénéficier de sa plus importante mise à jour : la prise en charge de l’IA générative. Cette nouvelle fonctionnalité offre aux équipes le moyen le plus simple de tirer parti d'un ensemble de modèles génératifs. Dit autrement, Il est désormais possible d’exploiter toute la puissance de l'IA générative intégrée directement dans notre plateforme de machine learning « de bout en bout ».
Intégration de l’IA générative à Vertex AI
Au cours des derniers mois, l'IA générative grand public a attiré l'attention de millions de personnes, avec des chatbots intelligents et des avatars numériques réalistes. Pour exploiter pleinement le potentiel de cette technologie, il faut la mettre entre les mains de tous les développeurs, entreprises et gouvernements. Jusqu'à présent, il était difficile de travailler sur l’IA générative et de personnaliser les modèles de base (foundation models) pour un usage professionnel. De fait, passer ces grands modèles en production restait complexe car nécessitant un outillage avancé, beaucoup de données, des compétences spécialisées et beaucoup de temps.
L’intégration de l'IA générative à Vertex AI permet désormais aux développeurs et aux data scientists d'accéder plus facilement aux modèles de base, de les personnaliser et de les déployer à partir d'une interface utilisateur simple. Nous proposons un large éventail d'outils, de flux de travail automatisés et de « points de départ ». Une fois déployés, les modèles de base peuvent être mis à l'échelle, gérés et gouvernés en production en utilisant les fonctionnalités MLOps « de bout en bout » de Vertex AI et une infrastructure IA entièrement managée.
Vertex AI a récemment intégré deux nouveautés phares : Model Garden (ou Jardin de modèles) et Generative AI Studio. Dans cet article, nous allons entrer un peu plus en détail sur ces fonctionnalités et explorer les possibilités qu’elles offrent.
Model Garden : Découvrir et utiliser la plus grande variété de modèles disponibles
Model Garden propose un environnement unique pour rechercher, découvrir et interagir avec les modèles de base (foundation models) de Google et, à terme, avec des centaines de modèles open source et provenant de tiers. Les utilisateurs auront accès à bien plus que des modèles textuels : ils pourront créer des applications de nouvelle génération en accédant aux modèles multimodaux de Google dans les domaines de la vision, du dialogue mais aussi de la génération et de la complétion de code. Nous nous engageons à proposer un large choix à tous les niveaux de la pile IA, c'est pourquoi Model Garden inclura des modèles provenant à la fois de partenaires open source et de notre écosystème de partenaires IA. En regroupant ainsi en un seul endroit une grande variété de types et de tailles de modèles, nos clients sont certains de pouvoir trouver la meilleure ressource pour leurs besoins métiers et d’y accéder en toute simplicité.
Avec Model Garden, les utilisateurs peuvent lancer une variété de workflows à base d’IA, tels que l’appel direct d’un modèle sous forme d’API, l'ajustement et la personnalisation de modèles dans Generative AI Studio ou encore le déploiement de modèles directement dans un notebook data science au sein de Vertex AI.
Generative AI Studio : optimisez et déployez facilement des modèles de base
Generative AI Studio est un environnement managé dans Vertex AI au sein duquel les développeurs et les data scientists peuvent interagir avec des modèles de base (foundation models), les optimiser et les déployer.
Generative AI Studio offre un large éventail de fonctionnalités, notamment une interface de discussion (avec les IA), la création d’invites (prompt design), l’optimisation d’invites (prompt tuning) et même la possibilité d'affiner les poids des modèles.
À partir de Generative AI Studio, les utilisateurs peuvent implémenter des modèles nouvellement optimisés directement dans leurs applications ou déployer des modèles en production sur la plateforme ML de Vertex AI.
Grâce à ces deux outils qui aident les développeurs et les datascientists à construire une IA générative, les organisations peuvent mettre en production la prochaine génération d'applications plus rapidement et avec plus de confiance.
5 façons d'interagir avec les modèles de base dans Vertex AI
1. Utiliser les modèles de base sous forme d’API : nous rendons accessibles les modèles de base de Google sous forme d’APIs que ces modèles soient adaptés à la génération de texte, à la conversation, à la génération ou la complétion de code informatique, à la génération d’images ou aux embeddings (aussi appelées plongements neuronaux ou intégrations neuronales).
Ces APIs gérées dans Vertex AI simplifient l'intégration de fonctionnalités d’IA génératives dans les applications puisqu’il suffit simplement de quelques lignes de code pour les appeler, comme pour n'importe quelle autre API Google Cloud. Les développeurs n'ont ainsi pas à se préoccuper de la complexité du provisionnement des ressources de stockage ou de calcul, ni de l'optimisation du modèle pour l'inférence.
2. Créations d’invites (Prompt design) : Generative AI Studio fournit une interface facile à utiliser pour la conception d'invites, autrement dit pour la création de consignes manuelles écrites qui permettent de diriger une IA afin qu’elle génère du texte pertinent ou une image fidèle à vos besoins, par exemple. Son interface de type Chat permet aux utilisateurs n'ayant pas d'expertise en programmation d'interagir avec un modèle. Celle-ci est enrichie de réglages permettant de précisément configurer le système. Ils peuvent ainsi, par exemple, contrôler le ton et le style des réponses mais aussi préciser si les réponses doivent être plus ou moins créatives.
3. Optimisation des invites (prompt tuning) : l’optimisation des invites est un moyen efficace et peu coûteux de personnaliser un modèle de base sans le réentraîner. Les invites permettent de guider le modèle pour qu'il génère des résultats pertinents, en utilisant le langage naturel plutôt qu'un langage de programmation. Generative AI Studio permet de télécharger facilement des données d’un utilisateur qui sont ensuite utilisées pour inciter le modèle à se comporter d'une manière spécifique. Par exemple, si un utilisateur souhaite mettre à jour le modèle de langage PaLM pour qu'il parle avec « la voix » de sa marque, il peut simplement télécharger des documents, des tweets, des communiqués de presse et d'autres actifs propres à son entreprise dans Generative AI Studio.
4. Ajustements (Fine-tuning) : Les organisations qui veulent construire des IT génératives hautement différenciées peuvent s’appuyer sur la finesse des ajustements rendus possibles par Generative AI Studio. Ces ajustements permettent de poursuivre l’entraînement d’un modèle préentraîné à l’aide de nouvelles données qui vont venir modifier les équilibres du modèle. Cela permet notamment d’adapter un modèle LLM général au vocabulaire médical ou juridique afin de le spécialiser. Dans Vertex AI Generative AI Studio, les utilisateurs peuvent télécharger de grands ensembles de données et réentraîner des modèles à l'aide de la fonctionnalité Vertex AI Training. Google Cloud vous offre la possibilité d'affiner votre modèle sans pour autant rendre publics les changements de poids (et donc conserver le modèle ajusté au sein de votre périmètre protégé). Cela vous permet d'utiliser la puissance de nos modèles de bases sans que vos données ne quittent jamais votre contrôle.
5. Optimisation des coûts : Chez Google, nous exploitons ces modèles dans nos workloads de production depuis déjà plusieurs années. Ce qui nous a permis de développer plusieurs techniques pour optimiser leur inférence en fonction des coûts. Nous proposons ainsi une sélection optimisée des modèles (OMS), qui examine ce qui est demandé au modèle et achemine la requête vers le plus petit modèle capable d'y répondre efficacement. Lorsqu'elle est activée, cette sélection se fait en arrière-plan et est invoquée en fonction de différentes conditions.
L’enthousiasme des premiers clients sur le support de l’IA Générative dans Vertex AI
« Depuis son lancement, Vertex AI a contribué à transformer la façon dont CNA utilise et met l'IA à l’échelle, tout en gérant mieux les modèles d'apprentissage machine en production », s’enthousiasme Santosh Bardwaj, SVP, Global Chief Data & Analytics Officer chez CNA. « Grâce à la prise en charge de grands modèles sur Vertex AI, CNA peut désormais également affiner ses analyses pour répondre au mieux aux besoins métiers spécifiques de ses clients et de ses collaborateurs. »
« Google Cloud est un partenaire stratégique pour Deutsche Bank, travaillant avec nous pour améliorer l'efficacité opérationnelle et remodeler la façon dont nous concevons et fournissons des services à nos clients », explique de son côté Gil Perez, Chief Innovation Officer, Deutsche Bank. « Nous apprécions leur approche responsable de l'IA et sommes impatients de co-innover avec leurs avancées en matière d'IA générative, en nous appuyant sur nos succès pour améliorer la productivité des développeurs, stimuler l'innovation et augmenter la rétention des employés. »
De nouveaux services d'IA générative prêts à l'emploi sont disponibles dès aujourd'hui pour les développeurs sélectionnés dans le cadre du programme Google Cloud Trusted Tester.
Pour en savoir plus sur ces annonces, visitez notre page Web « L’IA sur Google Cloud ».