Tarifs de Vertex AI Search and Conversation

Les tarifs sont indiqués en dollars américains (USD).

La tarification des fonctionnalités en disponibilité générale est appelée le 1er septembre 2023.

Vertex AI Search and Conversation permet aux développeurs, même ceux ayant des compétences limitées en machine learning, d'exploiter la puissance des grands modèles de langage de base, de l'expertise en recherche et des technologies d'IA conversationnelle de Google pour créer des applications d'IA générative professionnelles.

Assistance et crédits d'essai

1 000$ de crédits d'essai GRATUIT sont accordés pour être utilisés avec Vertex AI Search and Conversation. Ces crédits sont valides pendant un an à compter du 18 juillet 2023 à compter de la création du compte avec Vertex AI Search and Conversation.

Vous avez des questions sur les fonctionnalités GA ou sur le packaging et la tarification des fonctionnalités en preview ?

Pour en savoir plus, veuillez contacter votre équipe commerciale Google Cloud .

Tarifs de Vertex AI Conversation

Vertex AI Search and Conversation vous permet de créer rapidement des agents virtuels (chatbots) qui génèrent des réponses en fonction du contenu (site Web, documents) que vous incluez dans les data stores. Vertex AI Conversation vous permet de créer un agent virtuel Dialogflow CX OU d'ajouter la fonctionnalité à un agent virtuel Dialogflow CX existant.

Pour ajouter des fonctionnalités d'IA générative supplémentaires à vos agents virtuels Dialogflow CX, vous pouvez utiliser les remplacement(s) génératifs qui utilisent un grand modèle de langage (LLM) pour gérer efficacement les scénarios sans correspondance avec l'intent de l'utilisateur. Les générateurs permettent aux compilateurs de bots d'injecter des actions génératives n'importe où dans le flux de conversation. Il peut s'agir de résumer une conversation, de personnaliser une interaction ou d'associer plusieurs appels LLM pour créer un workflow génératif complet.

Tarifs de la fonctionnalité Vertex AI Conversation en disponibilité générale

Chat de conversation Vertex AI* 12 $ / 1 000 requête**
Vertex AI Conversation Voice* 0,002 $ / seconde†
Chat Dialogflow CX***(fonctionnalités standards d'IA non générative pour Chat) 7,00 $ / 1 000 requêtes**
Voix Dialogflow CX***(fonctionnalités d'IA standards non génératives pour Voice) 0,001 $ / seconde†
* Toutes les fonctionnalités d'IA générative (agents Datastore, remplacements génératifs et générateurs) sont incluses dans les tarifs du chat de conversation de Vertex AI et des SKU Voice.

* Les clients peuvent combiner des requêtes Dialogflow CX (non générative) et Vertex AI Conversation (générative) par seconde dans le même agent ou le même flux. Ils seront automatiquement facturés selon l'utilisation réelle de chaque ensemble de fonctionnalités. Vous pouvez ainsi exploiter l'IA générative de façon sélective le cas échéant et ne payer que ce que vous utilisez réellement.

** Requête (ou requête): facturation facturée à l'usage pour chaque requête ou requête individuelle.
Une requête ou une requête est définie comme un appel d'API au service Dialogflow ou Vertex AI Conversation, qu'il soit effectué directement via l'API ou indirectement par le biais de l'intégration ou de l'utilisation de la console.
Par exemple, si un utilisateur pose une question à un agent virtuel (chatbot), et que le chatbot répond, c'est une requête. Une interaction utilisateur avec le chatbot peut être constituée de plusieurs requêtes visant à accomplir une tâche.

† Inclut la reconnaissance et la synthèse vocales (STT), la synthèse vocale et la téléphonie. La durée totale du traitement audio facturé est indépendante de tout traitement sans frais non audio (latence de l'API, traitement webhook, etc.) qui peut avoir lieu avant, pendant ou après le traitement audio.

* Le chat Dialogflow CX et Dialogflow CX Voice ne sont pas éligibles aux crédits d'essai GRATUIT de 1 000 $. Dialogflow CX propose un programme de crédits d'essai supplémentaires qui peut être associé à ce programme de crédits d'essai GRATUIT Vertex AI Search and Conversation. Pour consulter des définitions supplémentaires de la mesure Dialogflow CX, cliquez ici.

Exemple de tarification pour la fonctionnalité en disponibilité générale de Vertex AI Conversation

Exemple combinant des réponses basées sur l'intention et génératives: service client sur le site Web

  • Des flux déterministes basés sur l'intention sont utilisés pour certaines questions spécifiques au client (facturation, paiement).
  • Réponses génératives utilisées pour gérer les questions pour lesquelles aucun intent n'est défini, mais dont la réponse se trouve sur le site Web

Hypothèses :

  • 100 millions de visites annuelles du site Web
  • 5% des visiteurs utilisent le chatbot, 3 requêtes par utilisation, 50% génératives, 50% basées sur l'intention
Volume de SKU Fréquence Prix catalogue total
Chat Dialogflow CX (basé sur l'intent)
7,5 M par an
100 M x 5% utilisent 3 requêtes x 50% basées sur l'intention
* 7,00 $ / 1 000 requêtes = 52 500 $
Dialogflow CX Enterprise Chat (génératif)
7,5 M par an
100 M x 5% utilisent 3 requêtes x 50% génératives
* 12 $ / 1 000 requêtes = 90 000 $
Données indexées
50 Go par an
10 Go gratuits, donc 40 Go utilisés pour le calcul du prix
* 5,00 $ / Go x 12 mois = 2 400 $

Tarifs de Vertex AI Search

Vertex AI Search and Conversation permet de créer rapidement des moteurs de recherche pour des sites Web, des données non structurées et des données structurées afin de récupérer des informations et de générer des réponses terrain. Vous pouvez en apprendre davantage sur les fonctionnalités disponibles dans Vertex AI Search.

Tarifs des fonctionnalités de Vertex AI Search en disponibilité générale

Recherche Édition Standard* 2 $ / 1 000 requêtes
Search Enterprise Edition* 4 $ / 1 000 requêtes
Rechercher un module complémentaire LLM** +4 € / 1 000 requêtes**
Search Standard Edition – Fonctionnalités de recherche non structurée
Search Enterprise Edition – Recherche non structurée + Fonctionnalités de recherche dans un site Web
Module complémentaire LLM de recherche – Synthèse + Fonctionnalités de recherche multitours
Aperçu privé : Recherche structurée + Nouvelles fonctionnalités d'IA générative (contactez le service commercial pour connaître les dernières fonctionnalités)

*Requête : facturation mesurée par requête individuelle ou saisie de requête
Une requête ou une requête est définie comme un appel d'API ou une utilisation directe avec Enterprise Search, qu'il s'agisse d'un appel d'API ou d'une utilisation directe vers Enterprise Search.
Exemple: Un utilisateur pose une question en langage naturel et le moteur de recherche qui y répond est une seule requête.
Les suggestions de saisie semi-automatique ne sont pas comptabilisées comme des requêtes. Une requête n'est comptabilisée que lorsque l'utilisateur soumet une requête de recherche finale.

** Le module complémentaire LLM est ajouté à une requête pour améliorer le traitement afin d'utiliser une fonctionnalité d'IA générative.
Le module complémentaire LLM peut être utilisé de manière interchangeable avec Search Standard Edition ou Search Enterprise Edition.
Exemple: Exécuter une requête Search Enterprise avec une demande de synthèse = 1 requête Search Enterprise + 1 requête du module complémentaire LLM

Exemple de tarification pour la fonctionnalité de disponibilité générale de Vertex AI Search

Exemple de données non structurées : Document Search

Hypothèse:

  • 10 millions de requêtes effectuées chaque année sur l'édition Standard
  • 10 millions de requêtes pour l'édition Enterprise et 10 millions de requêtes de synthèse LLM par an
  • 100 000 documents d'environ 1 Mo chacun
Volume de SKU Fréquence Prix catalogue total
Réseau de Recherche standard
10 millions de dollars par an * 2 $ / 1 000 requêtes = 20 000 $
Search Enterprise
10 millions de dollars par an * 4,00 $ / 1 000 requêtes = 40 000 $
Module complémentaire de recherche LLM
Chaque requête ajoutée à une requête Standard ou Enterprise
10 millions de dollars par an * +4 € / 1 000 requêtes = + de 40 000 $
Données indexées
100 Go par an 10 Go gratuits, donc 90 Go utilisés pour le calcul du prix * 5,00 $ / Go x 12 mois = 5 400 $

Tarifs de l'index de données

Tarifs du stockage de données Vertex AI Search and Conversation Index

Données indexées 5 $ / Gio par mois
* Quota gratuit de 10 Gio par mois fourni
** Partagé sur Vertex AI Search and Conversation
*** Le stockage est calculé comme suit : 500 kibioctets (Kio) * "nombre de pages sur le site Web", 1024 octets. (500 Kio équivaut à environ 0,000477 Gio. Le tarif d'indexation des données pour un site Web de 1 000 pages est donc de 2,38 $par mois).

Tarifs de Vertex AI Search pour le secteur médical

Vertex AI Search for Healthcare permet de créer rapidement des moteurs de recherche adaptés aux données médicales.

Recherche dans le secteur de la santé 20 € / 1 000 requête

Vertex AI Search for Healthcare inclut certaines fonctionnalités en preview, telles que les réponses d'IA générative, les mises à jour en streaming de l'index, etc. Le prix de ces fonctionnalités peut être différent du prix catalogue actuel lors du lancement en disponibilité générale.

Hypothèse:

  • 1 000 000 demandes de recherche dans le domaine de la santé par mois

  • 1 000 Gio de données de santé indexées

Volume de SKU Fréquence Prix catalogue total
1 000 000 de recherches 20/1 000 $ 20 000 $
1 000 Gio 5 $/Gio 5 000 $

Tarifs de Vertex AI Search for Media

Vertex AI Search for Media vous permet de fournir des résultats vidéo très pertinents en exploitant les requêtes et la compréhension contextuelle de Google pour améliorer la visibilité sur votre site multimédia.

Vertex AI Search and Conversation: index de données 5 $/Go/mois
Vertex AI Search: nombre de requêtes de l'API Media Search 2 $ / 1 000 requêtes

Tarifs de Vertex AI Search pour les recommandations de médias

Les seules opérations Media Recommendations qui entraînent des frais sont l'entraînement, le réglage ou la requête de prédictions en appelant la méthode recommend. L'importation et la gestion des événements utilisateur ou des informations sur les documents sont gratuites.

Les coûts d'entraînement (par nœud et par heure) sont facturés quotidiennement si votre modèle est en cours d'entraînement ou si vous avez envoyé une demande de reprise de l'entraînement. Dès que vous suspendez ou supprimez un modèle, vous n'êtes plus facturé. Consultez la documentation sur la gestion de l'entraînement.

Les coûts de réglage (par nœud et par heure) pour les modèles actifs sont facturés une fois le réglage terminé. Un réglage incomplet ne vous est facturé que si vous mettez en pause ou supprimez un modèle pendant un réglage en cours. Dans ce cas, les nœuds-heure consommés avant l'arrêt du réglage du modèle vous sont facturés. Consultez la documentation sur la gestion des réglages.

Prédictions 0,27 $ / 1 000 prédiction
Entraînement et réglage 2,50 $ par nœud et par heure

Exemple de tarification pour les recommandations de médias

Hypothèse:

  • 10 000 000 de requêtes de prédiction par mois

  • Entraîne un seul modèle par jour, qui se réentraîne automatiquement une fois par jour

  • soit environ 150 nœuds-heure pour l'entraînement du modèle et 30 heures de réglage du modèle par mois.

Volume de SKU Fréquence Prix catalogue total
10 millions de prédictions * 0,27 $ / 1 000 prédictions = 2 700 $
150 nœuds-heure (entraînement) * 2,50 $ / heure = 375 $
30 nœuds-heure (réglage) * 2,50 $ / heure = 75 $
Total 3 150 $

Frais d'observabilité Google Cloud

Media Recommendations enregistre une erreur dans Google Cloud Observability pour chaque requête API entraînant une erreur, comme une requête d'événement utilisateur contenant un format JSON incorrect ou une requête d'importation de document avec un prix négatif. Media Recommendations consigne également une erreur pour chaque requête de prédiction avec un document qui ne se trouve pas dans le datastore importé.

Les journaux stockés et leur conservation au-delà de la période de conservation par défaut sont facturés en Gio par l'observabilité Google Cloud. Pour en savoir plus sur l'attribution gratuite et la conservation des données, consultez la page Tarifs de l'observabilité Google Cloud.

La taille des données de journalisation dépend de la taille de votre charge utile JSON, mais un Gio correspond à environ 200 000 erreurs Media Recommendations.

Étapes suivantes

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
Contacter le service commercial