Choisir une infrastructure pour votre application d'IA générative

Découvrez les produits, frameworks et outils qui correspondent le mieux à la création de votre application d'IA générative. Les composants courants d'une application d'IA générative hébergée dans le cloud sont les suivants :

  1. Hébergement d'application : calculez pour héberger votre application. Votre application peut utiliser les bibliothèques clientes et SDK de Google Cloud pour communiquer avec différents produits Cloud.
  2. Hébergement de modèles : hébergement évolutif et sécurisé pour un modèle génératif.
  3. Modèle : modèle génératif pour le texte, le chat, les images, le code, les représentations vectorielles continues et le multimodal.
  4. Solution d'ancrage : ancrez la sortie du modèle sur des sources d'informations vérifiables et mises à jour.
  5. Base de données : stockez les données de votre application. Vous pouvez réutiliser votre base de données existante comme solution d'ancrage, en augmentant les requêtes à l'aide d'une requête SQL, ou en stockant vos données sous forme de représentations vectorielles continues à l'aide d'une extension telle que pgvector.
  6. Stockage : stockez des fichiers, tels que des images, des vidéos ou des interfaces Web statiques. Vous pouvez également utiliser le stockage pour les données brutes d'ancrage (par exemple, PDF) que vous convertissez ensuite en embeddings et stockez dans une base de données vectorielle.

Schéma illustrant une vue d'ensemble d'une infrastructure d'hébergement d'applications d'IA générative, y compris un modèle et son infrastructure d'hébergement de modèle, sa solution d'ancrage, sa base de données, son espace de stockage et son hébergement d'applications.

Les sections suivantes présentent chacun de ces composants et vous aident à choisir les produits Google Cloud à essayer.

Infrastructure d'hébergement d'applications

Choisissez un produit pour héberger et diffuser votre charge de travail d'application, qui appelle le modèle génératif.

Arbre de décision guidant les utilisateurs dans la sélection d'un service approprié pour l'hébergement d'applications.

Premiers pas avec :

Infrastructure d'hébergement de modèles

Google Cloud propose plusieurs solutions pour héberger un modèle génératif, de la plate-forme Vertex AI phare à l'hébergement portable et personnalisable sur Google Kubernetes Engine.

Arbre de décision guidant les utilisateurs dans leur choix du modèle d'hébergement de service cloud approprié en fonction de leurs priorités et de leurs exigences.

Premiers pas avec :

Modèle

Google Cloud fournit un ensemble de modèles de fondation de pointe via Vertex AI, y compris Gemini. Vous pouvez également déployer un modèle tiers vers Vertex AI Model Garden ou l'auto-hébergement sur GKE, Cloud Run ou Compute Engine.

Arbre de décision guidant les utilisateurs dans leur choix d'un service Vertex AI pour générer du texte ou du code, avec des options pour l'utilisation d'embeddings textuels, d'images ou de vidéos.

Premiers pas avec :

Surface de référence

Pour garantir des réponses de modèle précises et éclairées, vous pouvez ancrer votre application d'IA générative sur des données en temps réel. C'est ce que l'on appelle la génération augmentée par récupération (RAG).

Vous pouvez mettre en œuvre l'ancrage avec vos propres données dans une base de données vectorielles, qui est un format optimal pour des opérations telles que la recherche de similarités. Google Cloud propose plusieurs solutions de base de données vectorielle pour différents cas d'utilisation.

Remarque : Vous pouvez également baser vos données sur des bases de données traditionnelles (non vectorielles) en interrogeant simplement une base de données existante telle que Cloud SQL ou Firestore, puis en utilisant le résultat dans la requête de votre modèle.

Arbre de décision guidant l'utilisateur dans le choix de la solution de base de données vectorielle adaptée à ses besoins.

Premiers pas avec :

Ancrage avec les API

Au lieu d'utiliser vos propres données pour l'ancrage (ou en plus), de nombreux services en ligne proposent des API que vous pouvez utiliser pour récupérer des données d'ancrage afin d'enrichir votre requête de modèle.

Vertex AI Extensions (version bêta privée)

Créez, déployez et gérez des extensions qui connectent de grands modèles de langage aux API de systèmes externes.

Composants Langchain

Découvrez différents chargeurs de documents et intégrations d'API pour vos applications d'IA générative, de YouTube à Google Scholar.

Ancrage dans Vertex AI

Si vous utilisez des modèles hébergés dans Vertex AI, vous pouvez ancrer des réponses de modèle à l'aide de Vertex AI Search, de la recherche Google ou de texte intégré/infile.

Démarrer la création

Configurer votre environnement de développement pour Google Cloud

Configurer LangChain

LangChain est un framework Open Source pour les applications d'IA générative qui vous permet d'intégrer du contexte dans vos requêtes et d'agir en fonction de la réponse du modèle.

Afficher des exemples de code et déployer des applications exemples

Consultez des exemples de code pour des cas d'utilisation courants et des exemples d'applications d'IA générative sécurisées, efficaces, résilientes, performantes et économiques.