Créer une application d'IA générative sur Google Cloud
Google Cloud propose une gamme de produits et d'outils permettant de créer des applications d'IA générative avec un scaling, une sécurité et une observabilité professionnels.
Utilisez cette page pour découvrir les étapes du développement d'une application d'IA générative, choisir les meilleurs produits et outils pour votre cas d'utilisation, et accéder à la documentation dont vous avez besoin pour vous lancer.
Découvrez les principes de base du développement de l'IA générative
Quand utiliser l'IA générative ou l'IA traditionnelle ?
Présentation du développement d'une application d'IA générative
Choisir une infrastructure pour votre application d'IA générative
Découvrez les produits, frameworks et outils qui correspondent le mieux à la création de votre application d'IA générative. Les composants courants d'une application d'IA générative hébergée dans le cloud sont les suivants:
- Hébergement d'application: calculez pour héberger votre application. Votre application peut utiliser les bibliothèques clientes et les SDK de Google Cloud pour communiquer avec différents produits Cloud.
- Hébergement de modèles: hébergement évolutif et sécurisé pour un modèle génératif.
- Modèle: modèle génératif pour le texte, le chat, les images, le code, les représentations vectorielles continues et le multimodal.
- Solution d'ancrage: ancrez la sortie du modèle sur des sources d'informations vérifiables et mises à jour.
- Base de données: stockez les données de votre application. Vous pouvez réutiliser votre base de données existante comme solution d'ancrage, en augmentant les requêtes via une requête SQL et/ou en stockant vos données sous forme de représentations vectorielles continues à l'aide d'une extension telle que pgvector.
- Stockage: stockez des fichiers, tels que des images, des vidéos ou des interfaces Web statiques. Vous pouvez également utiliser Storage pour les données d'ancrage brutes (par exemple, PDF) que vous convertissez ensuite en représentations vectorielles continues et stockez dans une base de données vectorielle.
Les sections ci-dessous présentent chacun de ces composants pour vous aider à choisir les produits Google Cloud à essayer.
Infrastructure d'hébergement d'applications
Premiers pas avec :
Infrastructure d'hébergement du modèle
Premiers pas avec :
Modèle
Premiers pas avec :
- Gemini
- Codey
- Imagen
- Embedding de texte
- Vertex AI Model Garden (modèles Open Source)
- Hub de modèles HuggingFace (modèles Open Source)
Surface de référence
Pour garantir des réponses de modèle précises et éclairées, vous pouvez ancrer votre application d'IA générative sur des données en temps réel. C'est ce qu'on appelle la génération augmentée de récupération (RAG).
Vous pouvez mettre en œuvre l'ancrage avec vos propres données dans une base de données vectorielles, qui constitue un format optimal pour des opérations telles que la recherche de similarités. Google Cloud propose plusieurs solutions de base de données vectorielles pour différents cas d'utilisation.
Remarque: Vous pouvez également baser vos données sur des bases de données traditionnelles (non vectorielles) en interrogeant simplement une base de données existante telle que Cloud SQL ou Firestore, puis en utilisant le résultat dans la requête de votre modèle.
Premiers pas avec :
- Vertex AI Agent Builder (anciennement Enterprise Search, Gen AI App Builder, Discovery Engine)
- Vector Search (anciennement Matching Engine)
- AlloyDB pour PostgreSQL
- Cloud SQL
- BigQuery
Ancrage avec des API
Vertex AI Extensions (version bêta privée)
Composants de Langchain
Ancrage dans Vertex AI
Créer des applications
Configurer l'environnement de développement
Installer Google Cloud CLI
Installer l'extension Cloud Code dans votre IDE
Configurer l'authentification
Configurer LangChain
Concevoir des requêtes et évaluer des modèles
Présentation de la conception de requêtes
Vertex AI Studio
Exemples de requêtes d'IA générative
Conceptualisation avec les modèles génératifs sur Vertex AI
Évaluation de modèles dans Vertex AI
Exemples de code
Chatbot Web: répondre à des questions sur le Google Store
Apprenez à créer un chatbot Web de questions-réponses à l'aide de Vertex AI Agent Builder et de Firebase.
Application de chat avec Eventarc et Vertex AI
Découvrez comment créer une application Python Flask simple qui appelle un modèle de fondation pré-entraîné dans Vertex AI.
Générer une campagne marketing avec Gemini
Créez une application Web pour générer des idées de campagne marketing à l'aide de Gemini sur Vertex AI, Cloud Run et Streamlit.
Application de questions-réponses avec le guide "The Practitioner's Guide to MLOps"
Découvrez comment utiliser Vertex AI Search et LangChain pour ancrer des requêtes de modèle sur une source de connaissances vérifiable (livre blanc Google Cloud).
Outil d'aide de requête de l'API Weather: appel de fonction avec Gemini
Découvrez comment implémenter l'appel de fonction, le processus qui consiste à utiliser un LLM pour renseigner un corps de requête que vous pouvez ensuite envoyer à une API externe.
Assistant aux aéroports: application de récupération de bases de données d'IA générative
Exemple d'application pour la génération augmentée de récupération avec AlloyDB pour PostgreSQL et Vertex AI. (Article du blog, atelier de programmation.)
Conseils d'architecture et solutions de démarrage
Infrastructure pour une application d'IA générative compatible avec RAG à l'aide de Vertex AI
Utilisez cette architecture de référence pour concevoir l'infrastructure permettant d'exécuter une application d'IA générative avec la génération augmentée de récupération (RAG) à l'aide de Vertex AI et d'AlloyDB pour PostgreSQL.
Infrastructure pour une application d'IA générative exploitant le RAG, à l'aide de GKE
Utilisez cette architecture de référence pour concevoir l'infrastructure permettant d'exécuter une application d'IA générative avec la génération augmentée de récupération (RAG) à l'aide de GKE, Cloud SQL et d'outils Open Source tels que Ray, Hugging Face et LangChain.
Choisir son stockage pour les charges de travail d'IA et de ML dans Google Cloud
Ce document fournit des conseils de conception pour l'utilisation et l'intégration des diverses options de stockage proposées par Google Cloud pour les charges de travail clés d'IA et de ML.
Solution de démarrage rapide : résumé de documents
Déployez un exemple d'application en un clic pour résumer des documents longs avec Vertex AI.
Solution de démarrage rapide : RAG d'IA générative avec Cloud SQL
Déployez un exemple d'application en un clic qui utilise des représentations vectorielles continues stockées dans Cloud SQL pour améliorer la précision des réponses d'une application de chat.
Solution de démarrage rapide : base de connaissances générée par l'IA générative
Déployez un exemple d'application en un clic qui extrait des paires question/réponse à partir d'un ensemble de documents, ainsi qu'un pipeline qui déclenche l'application lors de l'importation d'un document.