Tarifs de Vertex AI Agent Builder
Les tarifs sont indiqués en dollars américains (USD).
Les tarifs des fonctionnalités listées en disponibilité générale (DG) s'appliquent à partir du 1er septembre 2023.
Vertex AI Agent Builder permet aux développeurs, même s'ils ont peu de connaissances en machine learning, d'exploiter la puissance des grands modèles de langage de fondation de Google, de l'expertise en recherche et des technologies d'IA conversationnelle de Google pour créer des applications d'IA générative de niveau professionnel.
Avoirs d'essai et assistance
1 000$ de crédits d'essai GRATUITS sont attribués pour une utilisation avec Vertex AI Agent Builder. Ces crédits sont valables un an à compter de la création du compte avec Vertex AI Agent Builder, à partir du 18 juillet 2023.
Vous avez des questions sur les fonctionnalités de GA ou sur le packaging et le prix des fonctionnalités Preview ?
Pour en savoir plus, contactez votre équipe commerciale Google Cloud .
Tarification de Vertex AI Agents
Vertex AI Agent Builder permet de créer rapidement des agents virtuels (chatbots) qui génèrent des réponses en fonction du contenu (site Web, documents) que vous incluez dans les entrepôts de données. Avec Vertex AI Agents, vous pouvez créer un agent virtuel Dialogflow CX ou ajouter la fonctionnalité à un agent virtuel Dialogflow CX existant.
Pour ajouter d'autres fonctionnalités d'IA générative à vos agents virtuels Dialogflow CX, vous pouvez exploiter les recours génératifs, qui utilisent un grand modèle de langage (LLM) pour gérer avec élégance les scénarios où l'intention de l'utilisateur ne correspond à aucune requête. Les générateurs permettent aux créateurs de bots d'injecter des actions génératives n'importe où dans le flux de conversation. Par exemple, pour résumer une conversation, personnaliser une interaction ou enchaîner plusieurs appels de LLM afin de créer un workflow génératif complet.
Tarifs de la fonctionnalité Vertex AI Agents GA
Vertex AI Agents Chat* | 12 $ par 1 000 requêtes** |
---|---|
Vertex AI Agents Voice* | 0,002 $ / seconde† |
Chat Dialogflow CX***(fonctionnalités d'IA standard non génératives pour Chat) | 7 $ par 1 000 requêtes** |
Dialogflow CX Voice***(fonctionnalités d'IA standard non génératives pour Voice) | 0,001 $ par seconde† |
* Tous les services d'IA générative (agents de magasin de données, solutions de repli génératives, générateurs et applications d'agent) sont inclus dans les tarifs des SKU Vertex AI Agents Chat et Voice. Si vous utilisez plusieurs types de fonctionnalités d'IA générative dans une même requête, vous serez facturé séparément pour chaque fonctionnalité en fonction de son utilisation. * Les clients peuvent combiner les requêtes/secondes de Dialogflow CX (non génératives) et de Vertex AI Agents (génératives) dans le même agent ou flux, et seront facturés automatiquement en fonction de l'utilisation réelle de chaque ensemble de fonctionnalités. Vous pouvez ainsi exploiter l'IA générative de manière sélective, uniquement lorsque cela est pertinent, et ne payer que ce que vous utilisez réellement. ** Request (ou Query): facturation au prorata du nombre de requêtes ou de demandes individuelles. Une requête correspond à un appel d'API au service Dialogflow ou au service Vertex AI Agents, qu'il soit effectué directement via l'API ou indirectement par le biais de l'intégration ou de la console. Par exemple, un utilisateur posant une question à un agent virtuel (chatbot) et que le chatbot y répond correspond à une seule requête. Une interaction utilisateur avec le chatbot peut être composée de plusieurs requêtes pour accomplir une tâche. † Inclut la reconnaissance vocale, le STT (Speech-to-Text), la synthèse vocale, le TTS (Text-to-Speech) et la téléphonie. La durée totale du traitement audio facturé est indépendante de tout traitement non audio (latence de l'API, traitement du webhook, etc.) pouvant être effectué avant, pendant ou après le traitement audio. * Dialogflow CX Chat et Dialogflow CX Voice ne sont pas éligibles aux 1 000 $de crédits d'essai GRATUITS. Dialogflow CX propose un programme de crédits d'essai supplémentaires qui peut être combiné avec ce programme de crédits d'essai GRATUITS pour Vertex AI Agent Builder. Pour en savoir plus sur le comptage Dialogflow CX, consultez cette page. |
Exemple de tarification pour la fonctionnalité Vertex AI Agents en GA
Exemple de mélange de réponses basées sur l'intention et génératives: Service client sur le site Web
- Des flux déterministes basés sur l'intention sont utilisés pour certaines questions spécifiques au client (facturation, paiement).
- Réponses génératives utilisées pour traiter les questions pour lesquelles aucune intention n'est définie, mais dont la réponse se trouve sur le site Web
Hypothèses :
- 100 M de visites annuelles sur le site
- 5% des visiteurs utilisent le chatbot, 3 requêtes par utilisation, 50% génératives, 50% basées sur l'intention
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
Chat Dialogflow CX (basé sur les intentions) | ||
7,5 M par an 100 M*5% des utilisateurs*3 des requêtes*50% basées sur l'intention |
* 7 $ par millier de requêtes = | 52 500 $ |
Chat Dialogflow CX Enterprise (générateur) | ||
7,5 M par an 100 M*5% d'utilisation*3 requêtes*50% génératives |
* 12 $ / 1 000 requêtes = | 90 000 € |
Données indexées | ||
50 Go par an 10 Go gratuits, soit 40 Go utilisés dans le calcul du prix |
* 5 $ / Go * 12 mois = | 2 400 $ |
Tarification de Vertex AI Search
Vertex AI Agent Builder permet de créer rapidement des moteurs de recherche pour les sites Web, les données non structurées et les données structurées afin de récupérer des informations et de générer des réponses fondées. Vous pouvez en savoir plus sur les fonctionnalités disponibles dans Vertex AI Search.
Tarifs de la fonctionnalité Vertex AI Search GA
Édition Standard du Réseau de Recherche | 2 $ par millier de requêtes | |
---|---|---|
Search Enterprise Edition | 4 $ pour 1 000 requêtes | |
Module complémentaire LLM (peut être ajouté à l'édition Standard et à l'édition Enterprise) |
De base | +4$par 1 000 requêtes utilisateur |
Avancé | +10$par 1 000 requêtes utilisateur | |
Search Standard Edition : fonctionnalités de recherche non structurée Search Enterprise Edition : fonctionnalités de recherche non structurée et de recherche sur les sites Web Module complémentaire LLM de base : fournit des réponses et des résumés à des requêtes simples à un ou plusieurs tours, avec la possibilité de traiter des requêtes simples, des requêtes composées, des requêtes longues et des requêtes multitours, et compatible avec les modèles TextBison, Gemini 1.0 Series et Gemini 1.5 Flash (lien) Module complémentaire LLM avancé : fournit des réponses et des résumés à des requêtes multisauts (requête contenant deux questions imbriquées ou plus, dont la réponse à l'une d'elles clarifie la suivante), et compatible avec les modèles TextBison, Gemini 1.0 Series et Gemini 1.5 Flash (lien) . Nous facturons en fonction du nombre de requêtes d'entrée utilisateur, et non en fonction du nombre de sauts. Avant-première privée : Recherche structurée et nouvelles fonctionnalités d'IA nouvelle génération (contactez l'équipe commerciale pour connaître les dernières fonctionnalités) Requête : facturation au prorata du nombre de requêtes d'entrée utilisateur Une requête correspond à tout appel d'API à Enterprise Search, qu'il soit effectué directement via l'API ou indirectement par le biais d'une intégration ou de la console. Par exemple, lorsqu'un utilisateur pose une question en langage naturel et que le moteur de recherche y répond, cela correspond à une seule requête. Le module complémentaire LLM est ajouté à une requête pour augmenter le traitement afin d'utiliser une IA générative. Le module complémentaire LLM peut être utilisé de manière interchangeable avec Search Standard Edition ou Search Enterprise Edition. Exemple: Exécuter une requête Search Enterprise avec une requête de synthèse = 1 requête Search Enterprise + 1 requête du module complémentaire LLM |
Exemple de tarification pour la fonctionnalité Vertex AI Search GA
Exemple de données non structurées : recherche de documents
Hypothèse:
- 10 M de requêtes Standard Edition par an
- 10 millions de requêtes Enterprise Edition et 10 millions de requêtes de synthèse LLM par an
- 100 000 documents d'environ 1 Mo chacun
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
Réseau de Recherche | ||
10 M par an | * 2 $ par millier de requêtes = | 20 000 € |
Rechercher dans l'entreprise | ||
10 M par an | * 4 $ pour 1 000 requêtes = | 40 000 $ |
Module complémentaire LLM de recherche de base Chaque requête ajoutée à une requête Standard ou Enterprise |
||
10 M par an | * +4$par 1 000 requêtes utilisateur = | +40 000 $ |
Module complémentaire LLM pour la recherche avancée Chaque requête ajoutée à une requête Standard ou Enterprise |
||
10 M par an | * +10$pour 1 000 requêtes de saisie utilisateur = | + 100 000 $ |
Données indexées | ||
100 Go par an 10 Go offerts, soit 90 Go utilisés dans le calcul du prix | * 5 $ / Go * 12 mois = | 5 400 $ |
Tarifs de Data Index
Tarifs de Vertex AI Agent Builder pour le stockage des données d'index
Données indexées | 5 $ par Gio par mois |
---|---|
* Quota gratuit de 10 Gio par mois fourni ** Partagé entre Vertex AI Agent Builder *** Le stockage est calculé comme suit : 500 kibioctets (Kio) * "nombre de pages sur le site Web", où 1 Kio correspond à 1 024 octets. (500 Kio équivaut à ~0,000477 Gio.L'indexation des données le tarif pour un site Web de 1 000 pages est de 2,38 $par mois.) |
Tarifs de Vertex AI Search pour le secteur de la santé
Vertex AI Search for Healthcare permet de créer rapidement des moteurs de recherche axés sur la médecine à partir de données de santé.
Recherche Healthcare | 20 $ par millier de requêtes |
---|
Vertex AI Search for Healthcare inclut certaines fonctionnalités en version Preview, comme les réponses d'IA générative, les mises à jour en flux continu de l'index et d'autres encore. Le prix de ces fonctionnalités peut être différent du prix indiqué actuellement lorsqu'elles seront disponibles en général.
Exemple de tarification pour Healthcare Search
Hypothèse:
1 000 000 requêtes de recherche dans le secteur de la santé par mois
1 000 Go de données de santé indexées
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
1 000 000 recherches | 20 $/1 000 | 20 000 € |
1 000 Gio | 5 $/Gio | 5 000 $ |
Tarifs de Vertex AI Search pour le secteur des médias
Vertex AI Search for Media vous permet de fournir des résultats vidéo très pertinents en exploitant la compréhension contextuelle et des requêtes de Google pour améliorer la découverte sur votre site multimédia.
Vertex AI Agent Builder: index de données | 5 $/Go/mois |
---|---|
Vertex AI Search: nombre de requêtes à l'API Media Search | 2 $ par millier de requêtes |
Tarifs de Vertex AI Search pour les recommandations de contenus multimédias
Les seules opérations Media Recommendations occasionnant des frais sont l'entraînement, le réglage ou la requête de prédictions faisant appel à la méthode recommend. L'importation et la gestion des événements utilisateur ou des informations sur les documents sont gratuites.
Les coûts d'entraînement (par nœud et par heure) sont facturés chaque jour si votre modèle est entraîné de manière active ou si vous avez envoyé une demande de reprise d'entraînement. Une fois que vous avez mis en veille ou supprimé un modèle, il ne vous est plus facturé. Consultez la documentation liée à la gestion de l'entraînement.
Les coûts de réglage (par nœud et par heure) pour les modèles actifs vous sont facturés une fois le réglage effectué. Un réglage incomplet ne vous sera facturé que si vous mettez en pause ou supprimez un modèle en cours de réglage. Dans ce cas, les nœuds-heure consommés avant l'arrêt du réglage du modèle vous sont facturés. Consultez la documentation liée à la gestion du réglage.
Requêtes de prédiction par mois | Prix pour 1 000 prédictions |
---|---|
Jusqu'à 20 000 000 | 0,27 $ |
Les 280 000 000 suivantes | 0,18 $ |
Après 300 000 000 | 0,10 $ |
Fonctionnalité | Prix |
Entraînement et réglage | 2,50 $ par nœud et par heure |
Exemple de tarification pour les recommandations multimédias
Hypothèse:
1 000 000 000 requêtes de prédiction par mois
Entraîne un seul modèle par jour, qui se réentraîne automatiquement une fois par jour
Cela correspond à environ 500 nœuds-heure d'entraînement de modèle et 100 heures de réglage de modèle par mois.
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
20 M de prédictions initiales | * 0,27 $ par 1 000 prédictions = | 5 400 $ |
Les 280 M de prédictions suivantes | * 0,18 $ / 1 000 prédictions = | 50 400 $ |
700 M de prédictions suivantes | * 0,10 $ / 1 000 prédictions = | 70 000 € |
500 nœuds-heure (entraînement) | * 2,50 $ de l'heure = | 1 250 € |
100 nœuds-heure (réglage) | * 2,50 $ de l'heure = | 250 $ |
Total | 127 300 $ |
Frais liés à Google Cloud Observability
Media Recommendations consigne une erreur dans la suite Google Cloud Observability pour chaque requête API renvoyant une erreur, comme une requête d'événement utilisateur dont la syntaxe JSON est incorrecte, ou une requête d'importation de document comportant un prix négatif. Media Recommendations enregistre également une erreur pour chaque requête de prédiction comportant un document absent du datastore importé.
Google Cloud Observability facture chaque Gio de journaux stockés et la conservation au-delà de la période de conservation par défaut. Pour en savoir plus sur l'attribution gratuite et la conservation des données, consultez la page Tarifs de Google Cloud Observability.
La taille des données de journalisation dépend de la taille de votre charge utile JSON. Un Gio correspond à environ 200 000 erreurs Media Recommendations.
Tarification de l'API Grounded Generation
L'API Grounded Generation vous permet de créer des réponses génératives à vos requêtes en utilisant des informations issues de la recherche Google ou de vos propres données.
Requête d'entrée (incluant l'invite utilisateur, les instructions système et les informations de base intégrées) | facturé au prix du modèle Gemini sélectionné. |
Sortie | facturé au prix du modèle Gemini sélectionné. |
Génération ancrée pour ancrer vos propres données | 2,50 $ pour 1 000 requêtes |
Génération ancrée pour l'ancrage dans la recherche Google | Consultez Ancrage avec la recherche Google. |
Les frais supplémentaires pour la récupération des données sont déterminés par le système de récupération sélectionné (Vertex AI Search, par exemple). |
Exemple 1: Ancrage sur Vertex AI Search et ancrage intégré
L'utilisateur utilise Vertex AI Search et des faits ancrés supplémentaires pour générer des réponses ancrées. Chaque requête d'entrée comporte 2 500 caractères (y compris les faits de référence intégrés) et chaque requête de sortie est composée de 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.
Volume par requête | Prix par 1 000 requêtes | |
---|---|---|
Requête d'entrée | 2 500 caractères | 1 000 requêtes * 0,000125 $ par tranche de 1 000 caractères * 2 500 caractères par requête = 0,3125$par tranche de 1 000 requêtes |
Sortie | 200 caractères | 1 000 requêtes * 0,000375 $ par tranche de 1 000 caractères * 2 caractères par requête = 0,075$par tranche de 1 000 requêtes |
Génération ancrée pour ancrer vos propres données | 1 requête | 2,50$pour 1 000 requêtes |
Récupération de données: Vertex AI Search (édition Enterprise) | 1 requête | 4,00$pour 1 000 requêtes |
Total: 6,8875 $ pour 1 000 demandes |
Exemple 2: Ancrage avec la recherche Google
L'utilisateur utilise la recherche Google pour générer des réponses ancrées. Chaque requête d'entrée comporte 500 caractères et chaque requête de sortie, 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.
Volume par requête | Prix par 1 000 requêtes | |
---|---|---|
Requête d'entrée | 500 caractères | 1 000 requêtes * 0,000125 $ par tranche de 1 000 caractères * 500 caractères par requête = 0,0625$par tranche de 1 000 requêtes |
Sortie | 200 caractères | 1 000 requêtes * 0,000375 $ par tranche de 1 000 caractères * 200 caractères par requête = 0,075$par tranche de 1 000 requêtes |
Génération ancrée pour l'ancrage dans la recherche Google | 1 requête | 35$pour 1 000 requêtes |
Total: 35,1375 $ pour 1 000 demandes |
Vérifier les tarifs de l'API Grounding
Cette fonctionnalité permet de déterminer si un extrait de texte (la réponse candidate) est bien ancré dans un ensemble donné de textes de référence (les faits).
Vérifier la mise à la terre | 0,00075 $ pour 1 000 caractères de réponse |
Tarifs des fonctionnalités Document AI
Pour connaître les tarifs complets de toutes les fonctionnalités de Document AI, consultez la page "Tarifs de Document AI".
Pour connaître les fonctionnalités Document AI intégrées à Vertex AI Search et facturées via ce service, consultez les tableaux ci-dessous.
Numériser du texte
Processeur | 1 à 5 000 000 pages/mois * | À partir de 5 000 001 pages/mois |
---|---|---|
Processeur Enterprise Document OCR | 1,50 $ par tranche de 1 000 pages | 0,60 $ par ensemble de 1 000 pages |
Extraire des structures et des entités à partir de documents
Analyseur de mise en page (y compris le découpage initial) | 10 $ par ensemble de 1 000 pages |
*La taille d'une page dépend du format de fichier :
Images (JPEG/JPG, PNG, BMP, HEIF): chaque image = 1 page
PDF: chaque page du PDF = 1 page
TIFF: chaque image du fichier TIFF équivaut à une page
Word (DOCX): jusqu'à 3 000 caractères = 1 page
Excel (XLSX): chaque onglet correspond à une page.
PowerPoint (PPTX): chaque diapositive = une page
HTML: jusqu'à 3 000 caractères = 1 page
Documents analysés: jusqu'à 3 000 caractères = 1 page
Tarifs de l'API Ranking
L'API de classement prend une liste de documents et les classe à nouveau en fonction de leur pertinence par rapport à une requête.
Contrairement aux représentations vectorielles continues, qui ne prennent en compte que la similarité sémantique entre un document et une requête, l'API de classement peut vous fournir des scores précis sur la pertinence d'un document par rapport à une requête donnée.
L'API de classement peut être utilisée pour améliorer la qualité des résultats de recherche après avoir récupéré un ensemble initial de documents candidats.
Classer les documents
Classement | 1 $ par millier de requêtes |
---|
Une requête peut contenir jusqu'à 100 documents, mais un utilisateur peut spécifier plus de 100 documents par requête. Si vous spécifiez plus de 100 documents, le prix augmente de 1 pour chaque multiple de 100 documents.
Par exemple:
132 documents à classer = 2 requêtes
200 documents à classer = 2 requêtes
399 documents à classer = 4 requêtes
401 documents à classer = 5 requêtes
Étape suivante
- Lisez la documentation sur Vertex AI Agent Builder.
- Essayez le Simulateur de coût.