Tarification de Vertex AI Search

Les tarifs sont indiqués en dollars américains (USD).

Les tarifs des fonctionnalités en disponibilité générale (DG) indiquées seront appliqués à partir du 1er septembre 2023.

Vertex AI Search permet aux développeurs, même ceux qui ont des compétences limitées en machine learning, d'exploiter la puissance des grands modèles de langage de fondation de Google, ainsi que son expertise en recherche et en recommandations, pour créer des applications d'IA générative de niveau entreprise.

Vertex AI Search permet de créer rapidement des moteurs de recherche pour les sites Web, les données non structurées et les données structurées afin de récupérer des informations et de générer des réponses ancrées. Pour en savoir plus sur les fonctionnalités disponibles dans Vertex AI Search,

Vertex AI Search propose deux modèles de tarification : général et configurable. Vous devez choisir un modèle pour votre application de recherche et ses datastores associés.

Tarification générale Tarification configurable
Application idéale Démarrage rapide

Charges de travail avec moins de 15 millions de requêtes

Trafic imprévisible
Charges de travail avec plus de 15 millions de requêtes par mois

Besoin de trafic / débit prévisible

Flexibilité pour ne pas toujours utiliser la recherche sémantique pour toutes les requêtes
Pricing Meter Facturation à la requête et par Go de données indexées Abonnement mensuel pour la capacité de requêtes (QPM) et le stockage, avec paiement à la requête pour les fonctionnalités complémentaires avancées

Important : Un data store créé avec le modèle de tarification configurable ne peut être utilisé que par une application de recherche qui utilise également ce modèle.

Tarification générale de Vertex AI Search

Ce modèle est basé sur une tarification à l'usage pour les requêtes de recherche et le stockage de données.

Essai gratuit : vous aurez accès à 10 000 requêtes par compte et par mois sans frais pour explorer Vertex AI Search sans investissement initial. Exclut les réponses génératives avancées.

Tarifs des requêtes de recherche

Search Standard Edition
inclut la récupération sémantique et l'optimisation des KPI
1,50 $ pour 1 000 requêtes
Search Enterprise Edition
inclut la récupération sémantique, l'optimisation des KPI et les réponses génératives de base (mode IA)
4 $ / 1 000 requêtes
Réponses génératives avancées (mode IA)
(peut être ajouté aux éditions Standard et Enterprise)
+ 4 $ / 1 000 requêtes d'entrée utilisateur
Search Standard Edition : fonctionnalités de recherche non structurée et de recherche structurée
Search Enterprise Edition : fonctionnalités de recherche non structurée, de recherche structurée et de recherche sur un site Web

Vertex AI Search Enterprise Edition inclut les réponses génératives de base (mode IA). Fournissez des réponses, des résumés et des suivis sans frais supplémentaires. Remarque : Les réponses génératives de base n'incluent pas les suggestions de questions complémentaires, le traitement des requêtes complexes, le traitement des requêtes longues ni la multimodalité.

Les réponses génératives avancées incluent des fonctionnalités avancées telles que les suggestions de suivi, le traitement des requêtes complexes et la multimodalité.

Requête : facturation à l'utilisation par requête ou entrée de requête individuelle
Une requête correspond à un appel d'API à Enterprise Search, qu'il soit effectué directement via l'API ou indirectement par le biais de l'intégration ou de la console.
Par exemple, lorsqu'un utilisateur pose une question en langage naturel et que le moteur de recherche y répond, cela correspond à une seule requête.

Les réponses génératives avancées (mode IA) sont ajoutées à une requête pour augmenter le traitement afin d'utiliser une fonctionnalité d'IA générative.
Les réponses génératives avancées (mode IA) peuvent être utilisées de manière interchangeable avec Search Standard Edition ou Search Enterprise Edition.
Exemple : Exécuter une requête Search Enterprise avec une requête multimodale = 1 requête Search Enterprise + 1 requête Réponses génératives avancées (mode IA)

Tarifs pour l'indexation / le stockage de données

Consultez la section "Tarifs de stockage des index".

Exemple de tarification pour la fonctionnalité DG de Vertex AI Search

Exemple de données non structurées : recherche de documents

Hypothèse :

  • 10 millions de requêtes Standard Edition par an
  • 10 millions de requêtes Enterprise Edition avec 2 millions de requêtes Réponses génératives avancées (mode IA) par an
  • 100 000 documents d'environ 1 Mo chacun
Volume de SKU Tarif Prix catalogue total
Recherche standard
10 millions par an (avec 10 000 en essai gratuit) * 1,50 $ pour 1 000 requêtes = 14 985 $
Search Enterprise avec les réponses génératives de base (Mode IA)
10 millions par an (avec 10 000 en essai gratuit) * 4 $ pour 1 000 requêtes = 39 960 $
Réponses génératives avancées (mode IA)
Chaque requête ajoutée à une requête Standard ou Enterprise
2 M de visiteurs * + 4$pour 1 000 requêtes d'entrée utilisateur = + 8 000 $
Données indexées
100 Go par an 10 Go gratuits, donc 90 Go utilisés dans le calcul du prix * 5 $ / Go * 12 mois = 5 400 $

Tarification configurable de Vertex AI Search

Ce modèle offre des coûts prévisibles grâce à des abonnements mensuels pour la capacité de recherche de base, avec des modules complémentaires à la demande pour des fonctionnalités supplémentaires. Il est conçu pour les clients dont les charges de travail sont régulières et qui souhaitent mieux maîtriser leurs coûts.

Engagement mensuel minimal : 1 000 requêtes par minute (QPM) et 50 Go d'espace de stockage.

Tarifs de l'abonnement Core (facturation mensuelle)

SKU Prix Description
Unité de requête 6 $ par QPM et par mois Un abonnement pour la capacité de débit des requêtes de votre application de recherche
Unité de stockage 1 $ / Go / mois Un abonnement pour les données brutes stockées pour l'indexation

Modules complémentaires avec paiement à l'usage (facturés par tranche de 1 000 requêtes)

Module complémentaire Prix Description
Sémantique 0,75 $ pour 1 000 requêtes + 1,50 $par Go et par mois pour les embeddings Permet la compréhension sémantique et la recherche hybride, et est nécessaire pour les Aperçus IA et le Mode IA.

Les frais de stockage supplémentaires couvrent le coût de la génération et de la maintenance des embeddings.
KPI et personnalisation 0,20 $ pour 1 000 requêtes Permet de réorganiser et de personnaliser les événements pour optimiser les KPI de l'entreprise (engagement, conversion)
Réponses génératives de base 2 $ pour 1 000 requêtes Génère des réponses, des citations et des questions complémentaires. Nécessite le module complémentaire Semantic.
Réponses génératives avancées (mode IA) 4 $ pour 1 000 requêtes Gère les requêtes conversationnelles complexes et multitours, ainsi que la multimodalité. Nécessite le module complémentaire Semantic.

Dépassements : l'utilisation qui dépasse le nombre de QPM auquel vous avez souscrit est considérée comme un dépassement. Par défaut, les requêtes excédentaires sont facturées au tarif de l'édition Standard du modèle de tarification générale (1,50 $ pour 1 000 requêtes).

Évolutivité : vous pouvez augmenter votre nombre de QPM ou votre forfait de stockage à tout moment, et les coûts sont calculés au prorata pour le reste du mois. La réduction prendra effet au début du prochain cycle de facturation.

Exemple de tarification configurable pour Vertex AI Search

Exemple de données structurées : recherche d'hôtels

Hypothèse :

  • 1 million de documents (éléments de catalogue) à environ 100 ko chacun
  • Abonnement mensuel de 1 500 requêtes par minute
  • 50 millions de requêtes mensuelles avec le module complémentaire d'optimisation des KPI
  • 30 millions de requêtes mensuelles avec le module complémentaire sémantique
  • 10 millions de requêtes mensuelles avec les réponses génératives de base (Aperçus IA)
Volume de SKU Tarif Prix catalogue total
Abonnement Core – Unité de requête
1 500 requêtes par minute * 6 $ / RPM x abonnement mensuel = 9 000 $
Abonnement Core – Unité de stockage
100 Go * 1 $/Go x abonnement mensuel = 100 $
Module complémentaire : indexation sémantique
100 Go * 1,50 $/Go/mois 150 $
Module complémentaire : requêtes sémantiques
30 millions * 0,75 $ pour 1 000 requêtes 22 500 $
Module complémentaire – KPI et personnalisation
50 millions * 0,20 $ pour 1 000 requêtes 10 000 $
Module complémentaire : Réponses génératives de base
10 millions * 2 $ pour 1 000 requêtes 20 000 $

Tarifs du stockage d'index

Tarifs du stockage des données d'index Vertex AI Search

Stockage d'index 5 $ par Gio de données brutes par mois
* Quota gratuit de 10 Gio par mois fourni
** Partagé entre Vertex AI Search
***Le coût de stockage de l'index est appliqué à la taille totale des données brutes, échantillonnées régulièrement et calculées comme une moyenne pour le mois. Les opérations d'actualisation des données n'entraînent pas de coûts supplémentaires.
**** Pour le data store de site Web, le stockage est calculé comme suit : 500 kibioctets (Kio) * "nombre de pages sur le site Web", où 1 Kio correspond à 1 024 octets. (500 Kio équivaut à ~0,000477 Gio.L'indexation des données le tarif pour un site Web de 1 000 pages est de 2,38 $par mois.)

Tarifs de Vertex AI Search pour le secteur de la santé

Vertex AI Search pour le secteur de la santé permet de créer rapidement des moteurs de recherche adaptés au domaine médical à partir de données de santé.

Healthcare Search 20 $ / 1 000 requêtes

Vertex AI Search for Healthcare inclut certaines fonctionnalités en preview, comme les réponses générées par l'IA générative, les mises à jour en flux continu de l'index et d'autres encore. Ces fonctionnalités peuvent être facturées à un prix différent de celui indiqué actuellement lorsqu'elles seront en disponibilité générale.

Hypothèse :

  • 1 million de requêtes de recherche liées à la santé par mois

  • 1 000 Gio de données de santé indexées

Volume de SKU Tarif Prix catalogue total
1 000 000 de recherches 20 $/1 000 20 000 $
1 000 Gio 5 $/Gio 5 000 $

Tarifs de Vertex AI Search pour les médias

Vertex AI Search pour les médias vous permet de fournir des résultats vidéo très pertinents, en exploitant la compréhension contextuelle et des requêtes de Google pour améliorer la découverte sur votre site de médias.

Vertex AI Search : index de données 5 $ par Go et par mois
Vertex AI Search: nombre de requêtes d'API de recherche de contenu multimédia 2 $ pour 1 000 requêtes

Tarifs de Vertex AI Search pour les recommandations de contenus multimédias

Les seules opérations Media Recommendations occasionnant des frais sont l'entraînement, le réglage, ou la requête de prédictions faisant appel à la méthode recommend. L'importation et la gestion des événements utilisateur ou des informations sur les documents sont gratuites.

Les coûts d'entraînement (par nœud et par heure) sont facturés chaque jour si votre modèle est entraîné de manière active ou si vous avez envoyé une demande de reprise d'entraînement. Lorsque vous mettez en pause ou supprimez un modèle, il ne vous est plus facturé. Consultez la documentation liée à la gestion de l'entraînement.

Les coûts de réglage (par nœud et par heure) pour les modèles actifs vous sont facturés une fois le réglage effectué. Un réglage incomplet ne vous sera facturé que si vous mettez en pause ou supprimez un modèle en cours de réglage. Dans ce cas, les nœuds-heure consommés avant l'arrêt du réglage du modèle vous seront facturés. Consultez la documentation liée à la gestion du réglage.

Requêtes de prédiction par mois 0,20 $ / 1 000 prédictions
Entraînement et réglage 2,50$par nœud et par heure

Exemple de tarification pour les recommandations de contenus multimédias

Hypothèse :

  • 1 milliard de requêtes de prédiction par mois

  • Entraîne un seul modèle par jour, lequel se réentraîne automatiquement une fois par jour

  • Cela correspond à environ 500 nœuds-heure d'entraînement de modèle et 100 heures de réglage de modèle par mois.

Volume de SKU Tarif Prix catalogue total
1 milliard de prédictions * 0,20 $ pour 1 000 prédictions = 200 000 $
500 heures-nœud (entraînement) * 2,50 $ par heure = 1 250 $
100 heures-nœud (réglage) * 2,50 $ par heure = 250 $
Total 201 500 $

Frais Google Cloud Observability

Media Recommendations enregistre une erreur dans Google Cloud Observability pour chaque requête API qui entraîne une erreur, comme une requête d'événement utilisateur dont la syntaxe JSON est incorrecte, ou une requête d'importation de documents dont le prix est négatif. Media Recommendations enregistre également une erreur pour chaque requête de prédiction comportant un document absent du datastore importé.

Google Cloud Observability facture chaque Gio de journaux stockés et la conservation au-delà de la période de conservation par défaut. Pour en savoir plus sur l'allocation sans frais et la conservation des données, consultez la page sur les tarifs de Google Cloud Observability.

La taille des données de journalisation dépend de la taille de votre charge utile JSON. Un Gio correspond à environ 200 000 erreurs Media Recommendations.

Tarifs de l'API Grounded Generation

L'API Grounded Generation vous permet de générer des réponses à vos requêtes à l'aide d'informations issues de la recherche Google ou de vos propres données.

Prompt d'entrée (inclut le prompt de l'utilisateur, les instructions système et les faits d'ancrage intégrés) Facturé au prix du modèle Gemini sélectionné.
Résultat Facturé au prix du modèle Gemini sélectionné.
Grounded Generation pour l'ancrage sur vos propres données récupérées 2,50 $ pour 1 000 requêtes
Grounded Generation pour l'ancrage sur la recherche Google Consultez Ancrage avec la recherche Google.
Les frais supplémentaires pour la récupération des données sont déterminés par le système de récupération sélectionné (par exemple, Vertex AI Search).

Exemple n° 1 : Ancrage sur Vertex AI Search et faits d'ancrage intégrés

L'utilisateur se sert de Vertex AI Search et d'autres faits d'ancrage pour générer des réponses ancrées. Chaque requête d'entrée comporte 2 500 caractères (y compris les faits d'ancrage intégrés) et chaque requête de sortie 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.

Volume par requête Prix par tranche de 1 000 requêtes
Requête d'entrée 2 500 caractères 1 000 requêtes x 0,000125 $ par tranche de 1 000 caractères x 2 500 caractères par requête = 0,3125$par tranche de 1 000 requêtes
Résultat 200 caractères 1 000 requêtes x 0,000375 $ par tranche de 1 000 caractères x 2 caractères par requête = 0,075$par tranche de 1 000 requêtes
Grounded Generation pour l'ancrage sur vos propres données récupérées 1 requête 2,50$par 1 000 requêtes
Récupération de données : Vertex AI Search (édition Enterprise) 1 requête 4$pour 1 000 requêtes
Total : 6,8875 $ pour 1 000 demandes

L'utilisateur se sert de la recherche Google pour générer des réponses ancrées. Chaque requête d'entrée comporte 500 caractères et chaque requête de sortie 200 caractères. L'utilisateur a sélectionné Gemini 1.5 Flash.

Volume par requête Prix par tranche de 1 000 requêtes
Requête d'entrée 500 caractères 1 000 requêtes x 0,000125 $ par tranche de 1 000 caractères x 500 caractères par requête = 0,0625$par tranche de 1 000 requêtes
Résultat 200 caractères 1 000 requêtes x 0,000375 $ par tranche de 1 000 caractères x 200 caractères par requête = 0,075$par tranche de 1 000 requêtes
Grounded Generation pour l'ancrage sur la recherche Google 1 requête 35$par 1 000 requêtes
Total : 35,1375 $ par tranche de 1 000 requêtes

Vérifier les tarifs de l'API Grounding

La vérification de l'ancrage permet de déterminer dans quelle mesure un texte (la réponse candidate) est ancré dans un ensemble donné de textes de référence (les faits).

Vérifier l'ancrage 0,00075 $ par tranche de 1 000 caractères de réponse

Tarifs des fonctionnalités de Document AI

Pour obtenir des informations complètes sur les tarifs de toutes les fonctionnalités de Document AI, consultez la page sur les tarifs de Document AI.

Pour les fonctionnalités Document AI intégrées à Vertex AI Search et facturées par son biais, consultez les tableaux ci-dessous.

Numériser du texte

Processeur 1 à 5 000 000 pages/mois * À partir de 5 000 001 pages/mois
Processeur Enterprise Document OCR 1,50 $ par tranche de 1 000 pages 0,60 $ par ensemble de 1 000 pages

Extraire des structures et des entités à partir de documents

Analyseur de mise en page (y compris le découpage initial) 10 $ par ensemble de 1 000 pages

*La taille d'une page dépend du format de fichier.

  • Images (JPEG/JPG, PNG, BMP, HEIF) : chaque image = 1 page

  • PDF : chaque page du PDF = 1 page

  • TIFF : chaque image du fichier TIFF = 1 page

  • Word (DOCX) : jusqu'à 3 000 caractères = 1 page

  • Excel (XLSX) : chaque onglet = 1 page

  • PowerPoint (PPTX) : chaque diapositive = 1 page

  • HTML : jusqu'à 3 000 caractères = 1 page

  • Documents analysés : jusqu'à 3 000 caractères = 1 page

Tarifs de l'API Ranking

L'API Ranking prend une liste de documents et les classe à nouveau en fonction de leur pertinence par rapport à une requête.

Contrairement aux représentations vectorielles continues, qui ne tiennent compte que de la similarité sémantique entre un document et une requête, l'API Ranking peut vous fournir des scores précis indiquant dans quelle mesure un document répond à une requête donnée.

L'API Ranking peut être utilisée pour améliorer la qualité des résultats de recherche après avoir récupéré un ensemble initial de documents candidats.

Classer les documents

Classement 1 $ par millier de requêtes

Une requête est définie comme comportant jusqu'à 100 documents, mais un utilisateur peut spécifier plus de 100 documents par requête. Si vous spécifiez plus de 100 documents, le prix augmente de 1 pour chaque multiple de 100 documents.
Par exemple :

  • 132 documents à classer = 2 requêtes

  • 200 documents à classer = 2 requêtes

  • 399 documents à classer = 4 requêtes

  • 401 documents à classer = 5 requêtes

Étape suivante

Demander un devis personnalisé

Avec le paiement à l'usage de Google Cloud, vous ne payez que pour les services que vous utilisez. Contactez notre équipe commerciale pour obtenir un devis personnalisé pour votre entreprise.
Contacter le service commercial