Tarifs de Vertex AI Agent Builder
Les tarifs sont indiqués en dollars américains (USD).
Les tarifs des fonctionnalités en disponibilité générale listées seront appliqués à partir du 1er septembre 2023.
Vertex AI Agent Builder permet aux développeurs, même si leurs compétences en machine learning sont limitées, d'exploiter les les grands modèles de langage de fondation, l'expertise de la recherche et les technologies d'IA conversationnelle de Google pour créer des applications d'IA générative professionnelles
Crédits d'essai et Assistance
1 000$ de crédits d'essai GRATUITS sont attribués pour une utilisation avec Vertex AI Agent Builder. Ces crédits sont valables un an à compter de la création d'un compte Vertex AI Agent Builder à compter du 18 juillet 2023.
Vous avez des questions sur les fonctionnalités en disponibilité générale ou sur le packaging et la tarification des fonctionnalités en preview ?
Pour en savoir plus, veuillez contacter votre équipe commerciale Google Cloud .
Tarifs des agents Vertex AI
Vertex AI Agent Builder permet de créer rapidement des agents virtuels (chatbots) qui génèrent des réponses en fonction du contenu (site Web, documents). que vous incluez dans les data stores. Les agents Vertex AI vous permettent de créer un nouvel objet Dialogflow CX. un agent virtuel OU ajouter la fonctionnalité à un agent virtuel Dialogflow CX existant.
Pour ajouter des fonctionnalités d'IA générative supplémentaires à vos agents virtuels Dialogflow CX, vous pouvez utiliser des recours génératifs, qui utilisent un grand modèle de langage (LLM) afin de gérer de façon optimale les cas où il n'y a pas de correspondance avec l'intent de l'utilisateur. Les générateurs permettent à vos développeurs de bots d'injecter des actions génératives à n'importe quel moment de votre flux de conversation, par exemple pour résumer une conversation, personnaliser une interaction ou enchaîner plusieurs appels LLM pour créer un workflow génératif complet.
Tarifs de la fonctionnalité en disponibilité générale des agents Vertex AI
Chat avec les agents Vertex AI* | 12 $ / 1 000 requête** |
---|---|
Voix pour les agents Vertex AI* | 0,002 $ / seconde† |
Chat Dialogflow CX***(fonctionnalités d'IA standards non génératives pour Chat) | 7 $ / 1 000 requête** |
Dialogflow CX Voice***(fonctionnalités d'IA standards non génératives pour Voice) | 0,001 $ par seconde† |
* Toutes les fonctionnalités d'IA générative, à savoir les agents de data store, les instances de secours génératifs, les générateurs et les applications d'agent, sont couvertes par les tarifs des SKU Chat et Voice pour les agents Vertex AI. Si vous utilisez plusieurs types de fonctionnalités d'IA générative dans une même requête, vous serez facturé séparément pour chaque fonctionnalité en fonction de son utilisation. * Les clients peuvent combiner des requêtes par seconde Dialogflow CX (non génératifs) et des agents Vertex AI (génératifs) dans le même agent ou flux. L'utilisation réelle de chaque ensemble de caractéristiques sera automatiquement facturée. Vous pouvez ainsi exploiter l'IA générative de manière sélective lorsque c'est possible et ne payer que ce que vous utilisez réellement. ** Requête (ou requête): facturation facturée à l'usage pour chaque requête ou requête individuelle. Une requête ou une requête est définie comme un appel d'API au service Dialogflow ou au service Agents Vertex AI, qu'il soit effectué directement via l'API, ou indirectement via l'intégration ou la console. Par exemple, un utilisateur posant une question à un agent virtuel (chatbot) et que le chatbot répond est une requête. Une interaction utilisateur avec le chatbot peut être constituée de plusieurs requêtes pour accomplir une tâche. † Inclut la reconnaissance vocale, la synthèse vocale, la synthèse vocale et la téléphonie. La durée totale du traitement audio facturé est indépendante de tout traitement sans frais non audio (latence de l'API, traitement du webhook, etc.) pouvant survenir avant, pendant ou après le traitement audio. * Les fonctionnalités Dialogflow CX Chat et Dialogflow CX Voice ne sont pas éligibles aux crédits d'essai GRATUITS de 1 000 $. Dialogflow CX propose un programme de crédits d'essai supplémentaires qui peut être associé à ce programme de crédits d'essai GRATUITS de Vertex AI Agent Builder. Pour consulter d'autres définitions de la mesure Dialogflow CX, cliquez ici. |
Exemple de tarification pour la fonctionnalité en disponibilité générale des agents Vertex AI
Exemple de combinaison de réponses basées sur l'intention et génératives: service client sur le site Web
- Des flux déterministes basés sur l'intention sont utilisés pour certaines questions spécifiques au client (facturation, paiement)
- Réponses génératives utilisées pour gérer les questions dont l'intention n'est pas définie, mais dont la réponse figure sur le site Web
Hypothèses :
- 100 millions de visites annuelles du site Web
- 5% des visiteurs utilisent le chatbot, 3 requêtes par utilisation, 50% d'IA générative, 50% basées sur l'intention
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
Chat Dialogflow CX (basé sur l'intent) | ||
7,5 M par an 100 M x 5% d'utilisation x 3 requêtes x 50% basées sur l'intention |
* 7 € / 1 000 requêtes = | 52 500 $ |
Chat d'entreprise Dialogflow CX (génératif) | ||
7,5 M par an 100 M x 5% d'utilisation x 3 requêtes x 50% d'IA générative |
* 12 € / 1 000 requêtes = | 90 000 $ |
Données indexées | ||
50 Go par an 10 Go gratuits, donc 40 Go utilisés pour calculer le prix |
* 5,00 $ / Go x 12 mois = | 2 400 $ |
Tarifs de Vertex AI Search
Vertex AI Agent Builder permet de créer rapidement des moteurs de recherche pour des sites Web, ainsi que des données non structurées et structurées afin de récupérer des informations et de générer des réponses fondées. Pour en savoir plus sur les fonctionnalités disponibles dans Vertex AI Search,
Tarifs des fonctionnalités de disponibilité générale de Vertex AI Search
Recherche en édition Standard* | 2 $ / 1 000 requête |
---|---|
Recherche Enterprise Edition* | 4 $ / 1 000 requête |
Module complémentaire LLM de recherche de base** | +4 $ / 1 000 requêtes saisies par l'utilisateur** |
Module complémentaire LLM de recherche avancée** | +10,00 € / 1 000 requêtes saisies par l'utilisateur** |
Recherche Édition Standard – Fonctionnalités de recherche non structurées Édition Enterprise – Recherche non structurée et fonctionnalités de recherche pour site Web Module complémentaire LLM pour la recherche de base** : fournit des réponses et des résumés à des requêtes simples/multitours, avec possibilité de traiter des requêtes simples, des requêtes composées, des requêtes longues, des requêtes multitours, compatible avec des modèles tels que TextBison, Gemini 1.0 Series et Gemini 1.5 Flash (lien) Module complémentaire LLM pour la recherche avancée** (version Preview publique actuelle, en disponibilité générale, le 1er juillet 2024) : fournit des réponses et des résumés aux requêtes à sauts multiples (une requête qui contient au moins deux questions imbriquées, la réponse à une clarifiant la question suivante), qui prend en charge des modèles tels que TextBison, Gemini 1.0 Series et Gemini 1.5 Flash (lien). Nous avons facturé en fonction du nombre de requêtes saisies par l'utilisateur, et non du nombre de sauts. Preview privée – Recherche structurée et nouvelles fonctionnalités d'IA générative (contactez le service commercial pour connaître les dernières fonctionnalités) *Requête: facturation facturée à l'usage pour chaque requête ou saisie de requête Une requête ou une requête est définie comme un appel d'API à Enterprise Search, qu'il soit effectué directement via l'API, ou indirectement lié à l'intégration ou à la console. Exemple: un utilisateur posant une question en langage naturel et que le moteur de recherche y répond ne correspond qu'à une seule requête. ** Le module complémentaire LLM à une requête pour augmenter le traitement afin d'utiliser une IA générative fonctionnalité, Le module complémentaire LLM peut être utilisé de manière interchangeable avec Search Standard Edition ou Search Enterprise Edition. Exemple: Exécuter une requête Search Enterprise avec une requête de synthèse = 1 requête Search Enterprise + 1 requête du module complémentaire LLM |
Exemple de tarification pour la fonctionnalité GA de Vertex AI Search
Exemple de données non structurées : Recherche de documents
Hypothèse:
- 10 millions de requêtes par an dans l'édition Standard
- 10 millions de requêtes Enterprise Edition avec 10 millions de requêtes de synthèse LLM par an
- 100 000 documents, à environ 1 Mo chacun
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
Recherche standard | ||
10 millions d'euros par an | * 2 $ / 1 000 requêtes = | 20 000 $ |
Rechercher dans Enterprise | ||
10 millions d'euros par an | * 4,00 $ / 1 000 requêtes = | 40 000 $ |
Module complémentaire LLM de recherche de base Chaque requête ajoutée à une requête standard ou Enterprise |
||
10 millions d'euros par an | * + 4 € / 1 000 requêtes saisies par l'utilisateur = | + de 40 000 $ |
Module complémentaire LLM de recherche avancée Chaque requête ajoutée à une requête standard ou Enterprise |
||
10 millions d'euros par an | * + 10,00 € / 1 000 requêtes saisies par l'utilisateur = | + de 100 000 $ |
Données indexées | ||
100 Go par an 10 Go gratuits, soit 90 Go utilisés dans le calcul du prix | * 5,00 $ / Go x 12 mois = | 5 400 $ |
Tarifs de Data Index
Tarifs du stockage de données d'index dans Vertex AI Agent Builder
Données indexées | 5 $ / Gio par mois |
---|---|
* Quota gratuit de 10 Gio par mois fourni ** Partagé entre Vertex AI Agent Builder *** Le stockage est calculé comme suit : 500 kibioctets (Kio) * "nombre de pages sur le site Web", où 1 Kio correspond à 1 024 octets. (500 Kio équivaut à ~0,000477 Gio.L'indexation des données le tarif pour un site Web de 1 000 pages est de 2,38 $par mois.) |
Tarifs de Vertex AI Search pour le secteur de la santé
Vertex AI Search pour le secteur de la santé permet de créer rapidement des moteurs de recherche réglés sur le plan médical plutôt que des données de santé.
Healthcare Search | 20 $ pour 1 000 requête |
---|
Vertex AI Search for Healthcare inclut certaines fonctionnalités en version preview, telles que les réponses d'IA générative, les mises à jour en continu de l'index, etc. Ces fonctionnalités peuvent être facturées différemment du prix catalogue actuel lors de leur sortie en disponibilité générale.
Exemple de tarification pour la recherche dans le domaine de la santé
Hypothèse:
1 000 000 de requêtes de recherche concernant la santé par mois
1 000 Gio de données de santé indexées
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
1 000 000 de recherches | 20 $/1 000 | 20 000 $ |
1 000 Gio | 5 $/Gio | 5 000 $ |
Tarifs de Vertex AI Search pour les médias
Vertex AI Search for Media vous permet de fournir des résultats vidéo très pertinents en exploitant la requête et la compréhension contextuelle de Google pour améliorer la visibilité sur votre site multimédia.
Vertex AI Agent Builder: index de données | 5 $ / Go par mois |
---|---|
Vertex AI Search: nombre de requêtes de l'API Media Search | 2 $ / 1 000 requête |
Tarifs de Vertex AI Search pour les recommandations de médias
Les seules opérations de recommandations de médias qui entraînent des frais sont l'entraînement, le réglage ou la demande de prédictions en appelant la méthode recommend. L'importation et la gestion des événements utilisateur ou des informations figurant dans les documents sont gratuites.
Les coûts d'entraînement (par nœud et par heure) sont facturés quotidiennement si votre modèle est en cours d'entraînement ou si vous avez envoyé une demande de reprise de l'entraînement. Lorsque vous mettez en veille ou supprimez un modèle, vous n'êtes plus facturé. Consultez la documentation sur la gestion de l'entraînement.
Les coûts du réglage (par nœud et par heure) des modèles actifs sont facturés une fois le réglage terminé. Vous ne payez un réglage incomplet que si vous mettez en pause ou supprimez un modèle pendant un réglage en cours. Dans ce cas, les nœuds-heure utilisés avant l'arrêt du réglage du modèle vous sont facturés. Consultez la documentation sur la gestion du réglage.
Requêtes de prédiction par mois | Prix pour 1 000 prédictions |
---|---|
Jusqu'à 20 000 000 | 0,27 $ |
Les 280 000 000 suivantes | 0,18 $ |
Après 300 000 000 | 0,10 $ |
Fonctionnalité | Prix |
Entraînement et réglage | 2,50 $ par nœud et par heure |
Exemple de tarification pour les recommandations de médias
Hypothèse:
1 000 000 000 de requêtes de prédiction par mois
Entraîne un seul modèle par jour, qui se réentraîne automatiquement une fois par jour
Cela représente environ 500 nœud-heures d'entraînement du modèle et 100 heures de réglage de modèle par mois
Volume de SKU | Tarif | Prix catalogue total |
---|---|---|
20 premiers millions de prédictions | * 0,27 $ / 1 000 prédictions = | 5 400 $ |
280 millions de prédictions suivants | * 0,18 $ / 1 000 prédictions = | 50 400 $ |
700 millions de prédictions suivants | * 0,10 $ / 1 000 prédictions = | 70 000 $ |
500 nœud-heures (entraînement) | * 2,50 $ / heure = | 1 250 $ |
100 nœud-heures (réglage) | * 2,50 $ / heure = | 250 $ |
Total | 127 300 $ |
Frais d'observabilité Google Cloud
Media Recommendations consigne une erreur dans Google Cloud Observability pour chaque requête API qui génère une erreur, telle qu'une requête d'événement utilisateur contenant un fichier JSON mal formé, ou une demande d'importation de document dont le prix est négatif. Les recommandations de médias consignent également une erreur pour chaque requête de prédiction associée à une valeur document qui ne se trouve pas dans le datastore importé.
Les frais d'observabilité Google Cloud sont facturés par Gio de journaux stockés, ainsi que la conservation au-delà du et la durée de conservation par défaut. Pour en savoir plus sur les attribution gratuite et conservation des données, consultez la page des tarifs de Google Cloud Observability.
La taille des données de journalisation dépend de la taille de votre charge utile JSON, alors qu'un Gio correspondrait à environ 200 000 erreurs de recommandations de médias.
Tarifs de l'API Grounded Generation
L'API Grounded Generation vous permet de créer des réponses génératives à vos requêtes à l'aide des informations de la recherche Google ou de vos propres données.
Invite d'entrée (inclut une invite utilisateur, des instructions système et des informations sur l'ancrage intégré) | Facturée au prix du modèle Gemini sélectionné. |
Sortie | Facturée au prix du modèle Gemini sélectionné. |
Ground Generation pour s'ancrer sur vos propres données récupérées | 2,50 $ / 1 000 requêtes |
Ground Generation pour s'ancrer dans la recherche Google | Pour en savoir plus, consultez Éléments au sol dans la recherche Google. |
Les frais supplémentaires liés à la récupération des données sont déterminés par le système de récupération sélectionné (par exemple, Vertex AI Search). |
Exemple n° 1: Ancrage sur Vertex AI Search et faits d'ancrage intégrés
L'utilisateur utilise Vertex AI Search et d'autres faits d'ancrage pour générer des réponses fondées. Chaque requête d'entrée compte 2 500 caractères (y compris les faits d'ancrage intégrés) et chaque requête de sortie comporte 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.
Volume par requête | Prix pour 1 000 requêtes | |
---|---|---|
Invite de saisie | 2 500 caractères | 1 000 requêtes x 0,000125 $ pour 1 000 caractères x 2 500 caractères par requête = 0,3125$pour 1 000 requêtes |
Sortie | 200 caractères | 1 000 requêtes x 0,000375 $ pour 1 000 caractères x 2 caractères par requête = 0,075$pour 1 000 requêtes |
Ground Generation pour s'ancrer sur vos propres données récupérées | 1 requête | 2,50$pour 1 000 requêtes |
Récupération des données: Vertex AI Search (édition Enterprise) | 1 requête | 4,00$pour 1 000 requêtes |
Total: 6,8875 $ pour 1 000 requêtes |
Exemple 2: Ancrage sur la recherche Google
L'utilisateur utilise la recherche Google pour générer des réponses fondées. Chaque requête d'entrée comporte 500 caractères et chaque requête de sortie de 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.
Volume par requête | Prix pour 1 000 requêtes | |
---|---|---|
Invite de saisie | 500 caractères | 1 000 requêtes x 0,000125 $ pour 1 000 caractères x 500 caractères par requête = 0,0625$pour 1 000 requêtes |
Sortie | 200 caractères | 1 000 requêtes x 0,000375 $ pour 1 000 caractères x 200 caractères par requête = 0,075$pour 1 000 requêtes |
Ground Generation pour s'ancrer dans la recherche Google | 1 requête | 35,00$pour 1 000 requêtes |
Total: 35,1375 $ pour 1 000 requêtes |
Consulter les tarifs de l'API Grounding
L'ancrage de la vérification permet de déterminer dans quelle mesure un texte (la réponse possible) est ancré dans un ensemble donné de textes de référence (les faits).
Vérifier la connexion à la terre | 0,00075 $ pour 1 000 caractères de réponse |
Tarifs des fonctionnalités Document AI
Pour obtenir des informations complètes sur la tarification de toutes les fonctionnalités de Document AI, consultez la page des tarifs de Document AI.
Pour en savoir plus sur les fonctionnalités Document AI intégrées et facturées via Vertex AI Search, reportez-vous aux tableaux ci-dessous.
Numériser du texte
Processeur | 1 à 5 000 000 pages/mois * | À partir de 5 000 001 pages/mois |
---|---|---|
Processeur OCR d'entreprise de documents | 1,50 $ par tranche de 1 000 pages | 0,60 $ par ensemble de 1 000 pages |
Extraire des structures et des entités à partir de documents
Analyseur de mise en page (inclut la fragmentation initiale) | 10 $ par tranche de 1 000 pages |
*La taille d'une page dépend du format de fichier :
Images (JPEG/JPG, PNG, BMP, HEIF): chaque image = 1 page
PDF: chaque page du PDF = 1 page
TIFF: chaque image du TIFF = une page
Mot (DOCX): jusqu'à 3 000 caractères = 1 page
Excel (XLSX): chaque onglet = une page
Powerpoint (PPTX): chaque diapositive correspond à une page.
HTML: jusqu'à 3 000 caractères = 1 page
Documents analysés: jusqu'à 3 000 caractères = 1 page
Tarifs de l'API de classement
L'API de classement prend une liste de documents et reclasse ces documents en fonction de leur pertinence par rapport à une requête.
Par rapport aux représentations vectorielles continues, qui examinent uniquement la similarité sémantique d'un document et d'une requête, l'API de classement peut vous fournir des scores précis sur la façon dont un document répond à une requête donnée.
L'API de classement peut être utilisée pour améliorer la qualité des résultats de recherche après la récupération d'un ensemble initial de documents candidats.
Classer les documents
Classement | 1 $ pour 1 000 requêtes |
---|
Une requête se définit comme contenant jusqu'à 100 documents, bien qu'un utilisateur puisse spécifier plus de 100 documents par requête. Si plus de 100 documents sont spécifiés, le tarif augmente de 1 pour chaque multiple de 100 documents.
Exemple:
132 documents à classer = 2 requêtes
200 documents à classer = 2 requêtes
399 documents à classer = 4 requêtes
401 documents à classer = 5 requêtes
Étape suivante
- Lisez la documentation de Vertex AI Agent Builder.
- Essayez le Simulateur de coût.