Créer une application d'IA générative sur Google Cloud

Google Cloud propose une gamme de produits et d'outils permettant de créer des applications d'IA générative avec un scaling, une sécurité et une observabilité professionnels.

Utilisez cette page pour découvrir les étapes du développement d'une application d'IA générative, choisir les meilleurs produits et outils pour votre cas d'utilisation, et accéder à la documentation dont vous avez besoin pour vous lancer.

Découvrez les principes de base du développement de l'IA générative

Découvrez comment développer une application d'IA générative.

Découvrez des cas d'utilisation et des types de modèles courants d'IA générative.

Quand utiliser l'IA générative ou l'IA traditionnelle ?

Déterminez si l'IA générative, l'IA traditionnelle, ou une combinaison des deux, convient à votre cas d'utilisation professionnel.

Présentation du développement d'une application d'IA générative

Découvrez comment relever les défis à chaque étape du développement d'une application d'IA générative.

Choisir une infrastructure pour votre application d'IA générative

Découvrez les produits, frameworks et outils qui correspondent le mieux à la création de votre application d'IA générative. Les composants courants d'une application d'IA générative hébergée dans le cloud sont les suivants :

Hébergement d'application : calculez pour héberger votre application. Votre application peut utiliser les bibliothèques clientes et SDK de Google Cloud pour communiquer avec différents produits Cloud.
Hébergement de modèles : hébergement évolutif et sécurisé pour un modèle génératif.
Modèle : modèle génératif pour le texte, le chat, les images, le code, les représentations vectorielles continues et le multimodal.
Solution d'ancrage : ancrez la sortie du modèle sur des sources d'informations vérifiables et mises à jour.
Base de données: stockez les données de votre application. Vous pouvez réutiliser votre base de données existante comme solution d'ancrage, en augmentant les requêtes via une requête SQL et/ou en stockant vos données sous forme d'embeddings à l'aide d'une extension telle que pgvector.
Stockage: stockez des fichiers, tels que des images, des vidéos ou des interfaces Web statiques. Vous pouvez également utiliser le stockage pour les données brutes d'ancrage (par exemple, PDF) que vous convertissez ensuite en embeddings et stockez dans une base de données vectorielle.

Schéma illustrant une vue d'ensemble d'une infrastructure d'hébergement d'applications d'IA générative, y compris un modèle et son infrastructure d'hébergement de modèle, sa solution d'ancrage, sa base de données, son espace de stockage et son hébergement d'applications.

Les sections ci-dessous présentent chacun de ces composants pour vous aider à choisir les produits Google Cloud à essayer.

Infrastructure d'hébergement d'applications

Choisissez un produit sur lequel héberger et diffuser la charge de travail de votre application, qui appellera le modèle génératif.

Premiers pas avec :

Infrastructure d'hébergement du modèle

Google Cloud propose plusieurs solutions pour héberger un modèle génératif, de la plate-forme Vertex AI phare à l'hébergement portable et personnalisable sur Google Kubernetes Engine.

Arbre de décision guidant les utilisateurs dans le choix du bon modèle hébergeant un service cloud en fonction de leurs priorités et de leurs exigences.

Premiers pas avec :

Modèle

Google Cloud fournit un ensemble de modèles de fondation de pointe via Vertex AI, y compris Gemini. Vous pouvez également déployer un modèle tiers vers Vertex AI Model Garden ou l'auto-hébergement sur GKE, Cloud Run ou Compute Engine.

Arbre de décision guidant les utilisateurs dans leur choix d'un service Vertex AI pour générer du texte ou du code, avec des options pour l'utilisation d'embeddings textuels, d'images ou de vidéos.

Premiers pas avec :

Gemini
Codey
Imagen
Embedding de texte
Vertex AI Model Garden (modèles Open Source)
Hub de modèles HuggingFace (modèles Open Source)

Surface de référence

Pour garantir des réponses de modèle précises et éclairées, vous pouvez ancrer votre application d'IA générative sur des données en temps réel. C'est ce que l'on appelle la génération augmentée par récupération (RAG).

Vous pouvez mettre en œuvre l'ancrage avec vos propres données dans une base de données vectorielles, qui constitue un format optimal pour des opérations telles que la recherche de similarités. Google Cloud propose plusieurs solutions de base de données vectorielles pour différents cas d'utilisation.

Remarque: Vous pouvez également baser vos données sur des bases de données traditionnelles (non vectorielles) en interrogeant simplement une base de données existante telle que Cloud SQL ou Firestore, puis en utilisant le résultat dans la requête de votre modèle.

Arbre de décision guidant l'utilisateur dans le choix de la solution de base de données vectorielle adaptée à ses besoins.

Premiers pas avec :

Vertex AI Agent Builder (anciennement Enterprise Search, Gen AI App Builder, Discovery Engine)
Vector Search (anciennement Matching Engine)
AlloyDB pour PostgreSQL
Cloud SQL
BigQuery

Ancrage avec des API

Au lieu (ou en plus) d'utiliser vos propres données pour l'ancrage, de nombreux services en ligne proposent des API que vous pouvez utiliser pour récupérer les données d'ancrage afin d'améliorer l'invite de votre modèle.

Vertex AI Extensions (version bêta privée)

Créez, déployez et gérez des extensions qui connectent de grands modèles de langage aux API de systèmes externes.

Composants de Langchain

Découvrez différents chargeurs de documents et intégrations d'API pour vos applications d'IA générative, de YouTube à Google Scholar.

Ancrage dans Vertex AI

Si vous utilisez des modèles hébergés dans Vertex AI, vous pouvez ancrer des réponses de modèle à l'aide de Vertex AI Search, de la recherche Google ou de texte intégré/infile.

Créer des applications

Configurer l'environnement de développement

Installez les outils dont vous avez besoin pour créer une application d'IA générative sur Google Cloud.

Installer Google Cloud CLI

Outils de ligne de commande permettant de configurer un environnement de développement local et d'interagir avec les API Cloud.

Installer l'extension Cloud Code dans votre IDE

Consultez la documentation et les exemples d'API dans votre IDE, et accélérez le développement local dans GKE et Cloud Run.

Configurer l'authentification

Découvrez comment vous authentifier auprès des API Google Cloud depuis votre environnement local et depuis des charges de travail hébergées.

Configurer LangChain

LangChain est un framework Open Source pour les applications d'IA générative qui vous permet d'intégrer du contexte dans vos requêtes et d'agir en fonction de la réponse du modèle.

Concevoir des requêtes et évaluer des modèles

Découvrez des stratégies de requêtes et testez différents modèles.

Présentation de la conception de requêtes

Découvrez des stratégies de conception de requêtes pour différents types de données, du texte au code en passant par les requêtes multimodales.

Vertex AI Studio

Découvrez comment concevoir, tester et gérer vos requêtes dans Vertex AI Studio.

Exemples de requêtes d'IA générative

Découvrez des dizaines d'exemples de requêtes couvrant des cas d'utilisation, y compris la classification, l'idéation et la synthèse.

Conceptualisation avec les modèles génératifs sur Vertex AI

Découvrez des exemples de requêtes pour générer, développer et communiquer de nouvelles idées.

Évaluation de modèles dans Vertex AI

Utilisez Vertex AI pour effectuer des évaluations basées sur les métriques ou des évaluations côte à côte.

Exemples de code

Dupliquer un exemple sur GitHub et commencer à créer

Chatbot Web: répondre à des questions sur le Google Store

Apprenez à créer un chatbot Web de questions-réponses à l'aide de Vertex AI Agent Builder et de Firebase.

Application de chat avec Eventarc et Vertex AI

Découvrez comment créer une application Python Flask simple qui appelle un modèle de fondation pré-entraîné dans Vertex AI.

Générer une campagne marketing avec Gemini

Créez une application Web pour générer des idées de campagne marketing à l'aide de Gemini sur Vertex AI, Cloud Run et Streamlit.

Application de questions-réponses avec le guide "The Practitioner's Guide to MLOps"

Découvrez comment utiliser Vertex AI Search et LangChain pour ancrer des requêtes de modèle sur une source de connaissances vérifiable (livre blanc Google Cloud).

Outil d'aide de requête de l'API Weather: appel de fonction avec Gemini

Découvrez comment implémenter l'appel de fonction, le processus qui consiste à utiliser un LLM pour renseigner un corps de requête que vous pouvez ensuite envoyer à une API externe.

Assistant aux aéroports: application de récupération de bases de données d'IA générative

Exemple d'application pour la génération augmentée de récupération avec AlloyDB pour PostgreSQL et Vertex AI. (Article du blog, atelier de programmation.)

Conseils d'architecture et solutions de démarrage

Recommandations et exemples d'applications d'IA générative sécurisées, efficaces, résilientes, performantes et économiques.