Google Cloud propose une gamme de produits et d'outils permettant de créer des applications d'IA générative avec un scaling, une sécurité et une observabilité professionnelles.

Utilisez cette page pour découvrir les étapes du développement d'une application d'IA générative, choisir les meilleurs produits et outils pour votre cas d'utilisation, et accéder à la documentation dont vous avez besoin pour vous lancer.

Découvrez les principes de base du développement de l'IA générative

Découvrez comment développer une application d'IA générative.
Découvrez des cas d'utilisation et des types de modèles courants d'IA générative.
Déterminez si l'IA générative, l'IA traditionnelle, ou une combinaison des deux, convient à votre cas d'utilisation professionnel.
Découvrez comment relever les défis à chaque étape du développement d'une application d'IA générative.

Choisir une infrastructure pour votre application d'IA générative

Découvrez les produits, frameworks et outils qui correspondent le mieux à la création de votre application d'IA générative. Les composants courants d'une application d'IA générative hébergée dans le cloud sont les suivants:

  1. Hébergement d'application: calculez pour héberger votre application. Votre application peut utiliser les bibliothèques clientes et les SDK de Google Cloud pour communiquer avec différents produits Cloud.
  2. Hébergement de modèles: hébergement évolutif et sécurisé pour un modèle génératif.
  3. Modèle: modèle génératif pour le texte, le chat, les images, le code, les représentations vectorielles continues et le multimodal.
  4. Solution d'ancrage: ancrez la sortie du modèle sur des sources d'informations vérifiables et mises à jour.
  5. Base de données: stockez les données de votre application. Vous pouvez réutiliser votre base de données existante comme solution d'ancrage, en augmentant les invites via une requête SQL et/ou en stockant vos données sous forme de représentations vectorielles continues à l'aide d'une extension telle que pgvector.
  6. Stockage: stockez des fichiers, tels que des images, des vidéos ou des interfaces Web statiques. Vous pouvez également utiliser Storage pour les données d'ancrage brutes (par exemple, PDF) que vous convertissez ensuite en représentations vectorielles continues et stockez dans une base de données vectorielle.

Schéma illustrant une vue d'ensemble d'une infrastructure d'hébergement d'applications d'IA générative, y compris un modèle et son infrastructure d'hébergement de modèle, sa solution d'ancrage, sa base de données, son espace de stockage et son hébergement d'applications.

Les sections ci-dessous présentent chacun de ces composants pour vous aider à choisir les produits Google Cloud à essayer.

Infrastructure d'hébergement d'applications

Choisissez un produit sur lequel héberger et diffuser la charge de travail de votre application, qui appellera le modèle génératif.
Arbre de décision orientant les utilisateurs dans la sélection d'un service approprié pour l'hébergement de l'application.

Premiers pas avec :

Infrastructure d'hébergement du modèle

Google Cloud propose plusieurs solutions pour héberger un modèle génératif, de la plate-forme Vertex AI phare à l'hébergement portable et personnalisable sur Google Kubernetes Engine.

Arbre de décision guidant les utilisateurs dans le choix du bon modèle hébergeant un service cloud en fonction de leurs priorités et de leurs exigences.

Premiers pas avec :

Livraison

Google Cloud fournit un ensemble de modèles de fondation de pointe via Vertex AI, y compris Gemini. Vous pouvez également déployer un modèle tiers vers Vertex AI Model Garden ou l'auto-hébergement sur GKE, Cloud Run ou Compute Engine.

Arbre de décision guidant les utilisateurs dans leur choix d'un service Vertex AI pour générer du texte ou du code, avec des options pour l'utilisation de représentations vectorielles continues de texte, d'images ou de vidéos.

Premiers pas avec :

Surface de référence

Pour garantir des réponses de modèle précises et éclairées, vous pouvez ancrer votre application d'IA générative sur des données en temps réel. C'est ce qu'on appelle la génération augmentée de récupération (RAG).

Vous pouvez mettre en œuvre l'ancrage avec vos propres données dans une base de données vectorielles, qui constitue un format optimal pour des opérations telles que la recherche de similarités. Google Cloud propose plusieurs solutions de base de données vectorielles pour différents cas d'utilisation.

Remarque: Vous pouvez également baser vos données sur des bases de données traditionnelles (non vectorielles) en interrogeant simplement une base de données existante telle que Cloud SQL ou Firestore, puis en utilisant le résultat dans l'invite de votre modèle.

Arbre de décision guidant l'utilisateur dans le choix de la solution de base de données vectorielle adaptée à ses besoins.

Premiers pas avec :

Ancrage avec des API

Au lieu (ou en plus) d'utiliser vos propres données pour l'ancrage, de nombreux services en ligne proposent des API que vous pouvez utiliser pour récupérer les données d'ancrage afin d'améliorer l'invite de votre modèle.
Créez, déployez et gérez des extensions qui connectent de grands modèles de langage aux API de systèmes externes.
Découvrez différents chargeurs de documents et intégrations d'API pour vos applications d'IA générative, de YouTube à Google Scholar.
Si vous utilisez des modèles hébergés dans Vertex AI, vous pouvez ancrer des réponses de modèle à l'aide de Vertex AI Search, de la recherche Google ou du texte intégré/infile.

Créer des applications

Configurer l'environnement de développement

Installez les outils dont vous avez besoin pour créer une application d'IA générative sur Google Cloud.
Outils de ligne de commande permettant de configurer un environnement de développement local et d'interagir avec les API Cloud.
Consultez la documentation et les exemples d'API dans votre IDE, et accélérez le développement local dans GKE et Cloud Run.
Découvrez comment vous authentifier auprès des API Google Cloud depuis votre environnement local et depuis des charges de travail hébergées.
LangChain est un framework Open Source pour les applications d'IA générative qui vous permet d'intégrer du contexte dans vos invites et d'agir en fonction de la réponse du modèle.

Concevoir des invites et évaluer des modèles

Découvrez des stratégies pour construire des requêtes et testez différents modèles.
Découvrez des stratégies de conception d'invites pour différents types de données, du texte au code en passant par les requêtes multimodales.
Découvrez comment concevoir, tester et gérer vos invites dans Vertex AI Studio.
Découvrez des dizaines d'exemples d'invites couvrant des cas d'utilisation, y compris la classification, l'idéation et la synthèse.
Découvrez des exemples d'invites pour générer, développer et communiquer de nouvelles idées.

Exemples de code

Dupliquer un exemple sur GitHub et commencer à créer

Apprenez à créer un chatbot Web de questions-réponses à l'aide de Vertex AI Search and Conversation et Firebase.

Débutant Node.js

Découvrez comment créer une application Python Flask simple qui appelle un modèle de fondation pré-entraîné dans Vertex AI.

Débutant Python

Créez une application Web pour générer des idées de campagne marketing à l'aide de Gemini sur Vertex AI, Cloud Run et Streamlit.

Débutant Python

Découvrez comment utiliser Vertex AI Search et LangChain pour ancrer des invites de modèle sur une source de connaissances vérifiable (livre blanc Google Cloud).

Python intermédiaire

Découvrez comment implémenter l'appel de fonction, le processus qui consiste à utiliser un LLM pour renseigner un corps de requête que vous pouvez ensuite envoyer à une API externe.

Python intermédiaire

Exemple d'application pour la génération augmentée de récupération avec AlloyDB pour PostgreSQL et Vertex AI. (Article du blog, atelier de programmation.)

Python intermédiaire

Conseils d'architecture et solutions de démarrage

Recommandations et exemples d'applications d'IA générative sécurisées, efficaces, résilientes, performantes et économiques.

Utilisez cette architecture de référence pour concevoir l'infrastructure permettant d'exécuter une application d'IA générative avec la génération augmentée de récupération (RAG) à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL.

Intermédiaire

Utilisez cette architecture de référence pour concevoir l'infrastructure permettant d'exécuter une application d'IA générative avec la génération augmentée de récupération (RAG) à l'aide de GKE, Cloud SQL et d'outils Open Source tels que Ray, Hugging Face et LangChain.

Intermédiaire

Ce document fournit des conseils de conception pour l'utilisation et l'intégration des diverses options de stockage proposées par Google Cloud pour les charges de travail clés d'IA et de ML.

Avancé

Déployez un exemple d'application en un clic pour résumer des documents longs avec Vertex AI.

Intermédiaire