Preços da Vertex AI para Pesquisa

Os preços são indicados em dólares americanos (US$).

O preço da funcionalidade listada em disponibilidade geral (GA) será aplicado a partir de 1º de setembro de 2023.

A Vertex AI Search permite que desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, aproveitem o poder dos modelos de linguagem grandes de fundação, da experiência em pesquisa e das recomendações do Google para criar aplicativos de IA generativa de nível empresarial.

A Vertex AI para Pesquisa oferece a capacidade de criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados para recuperar informações e gerar respostas fundamentadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.

A Vertex AI para Pesquisa oferece dois modelos de preços: Geral e Configurável. Você precisa escolher um modelo para seu aplicativo de pesquisa e os repositórios de dados associados.

Sistema de preços geral Preços configuráveis
Ideal para Início rápido

Cargas de trabalho com menos de 15 milhões de consultas

Tráfego imprevisível
Cargas de trabalho com mais de 15 milhões de consultas por mês

Necessidade de tráfego / capacidade de processamento previsível

Flexibilidade para não usar sempre a semântica em todas as consultas
Medidor de preços Pagamento por consulta e por GB de dados indexados Assinatura mensal para capacidade de consulta (QPM) e armazenamento, com pagamento por consulta para recursos complementares avançados

Importante:um repositório de dados criado com o modelo de preços configurável só pode ser usado por um app de pesquisa que também usa esse modelo.

Preços gerais da Vertex AI para Pesquisa

Esse modelo é baseado em preços de pagamento por uso para consultas de pesquisa e armazenamento de dados.

Teste gratuito: você terá acesso a 10.000 consultas por conta, por mês, sem custo financeiro, para conhecer o Vertex AI Search sem um investimento inicial. Exclui respostas generativas avançadas.

Preços de consultas de pesquisa

O Search Standard Edition
inclui recuperação semântica e otimização de KPI
US$ 1,50 / 1.000 consultas
A Search Enterprise Edition
inclui recuperação semântica, otimização de KPI e as principais respostas generativas (Modo IA)
US$ 4,00 / 1.000 consultas
Respostas generativas avançadas (Modo IA)
(podem ser adicionadas ao Standard Edition e ao Enterprise Edition)
+$4,00 / 1.000 consultas de entrada do usuário
Search Standard Edition: recursos de pesquisa não estruturada + pesquisa estruturada
Search Enterprise Edition: recursos de pesquisa não estruturada + pesquisa estruturada + pesquisa de sites

A Vertex AI para Pesquisa Enterprise Edition inclui as principais respostas generativas (modo IA). Forneça respostas, resumos e acompanhamentos sem custo financeiro adicional. Observação: as principais respostas generativas não incluem acompanhamentos sugeridos, multimodalidade, tratamento de consultas complexas e longas nem tratamento de consultas complexas.

As respostas generativas avançadas incluem recursos avançados, como acompanhamentos sugeridos, tratamento de consultas complexas e multimodalidade.

Pesquisa: o faturamento é medido por solicitação ou entrada de consulta individual
Uma solicitação ou consulta é definida como qualquer chamada de API para a Pesquisa empresarial, seja direta com o uso da API ou indireta com o uso da integração ou do console.
Por exemplo, quando um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde, isso é uma consulta.

As respostas generativas avançadas (Modo IA) são adicionadas a uma consulta para aprimorar o processamento e usar um recurso de IA generativa.
As respostas generativas avançadas (Modo IA) podem ser usadas de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition.
Exemplo: executar uma consulta do Search Enterprise com uma solicitação multimodal = 1 consulta do Search Enterprise + 1 consulta de respostas generativas avançadas (Modo IA)

Preços de indexação / armazenamento de dados

Consulte a seção de preços de armazenamento de índice

Exemplo de preço da funcionalidade GA da Vertex AI para Pesquisa

Exemplo de dados não estruturados : pesquisa de documentos

Suposição:

  • 10 milhões de consultas da Standard Edition por ano
  • 10 milhões de consultas do Enterprise Edition com 2 milhões de consultas de respostas generativas avançadas (Modo IA) por ano
  • 100 mil documentos com cerca de 1 MB cada
Volume de SKU Taxa Preço de tabela total
Pesquisa padrão
10 milhões anuais (com teste gratuito de 10 mil) * US$ 1,50 / 1.000 consultas = US$ 14.985
Search Enterprise com as principais respostas generativas (Modo IA)
10 milhões anuais (com teste gratuito de 10 mil) * US$ 4,00 / 1 mil consultas = US$ 39.960
Respostas generativas avançadas (Modo IA)
Cada consulta adicionada a uma consulta Standard ou Enterprise
2 milhões anuais * +US$4,00 / 1.000 consultas de entrada do usuário = +US$8.000
Dados indexados
100 GB anuais 10 GB gratuitos, então 90 GB usados no cálculo do preço * US$ 5,00 / GB * 12 meses = US$ 5.400

Preços configuráveis da Vertex AI para Pesquisa

Esse modelo oferece custos previsíveis por meio de assinaturas mensais para a capacidade principal de pesquisa, com complementos opcionais de pagamento conforme o uso para recursos adicionais. Ele foi criado para clientes com cargas de trabalho consistentes que buscam maior controle de custos.

Compromisso mensal mínimo: 1.000 consultas por minuto (QPM) e 50 GB de armazenamento.

Preços da assinatura principal (cobrança mensal)

SKU Preço Descrição
Unidade de consulta US$ 6,00 / QPM / mês Uma assinatura para a capacidade de taxa de transferência de consultas do seu aplicativo de pesquisa
Unidade de armazenamento US$ 1,00 / GB / mês Uma assinatura dos dados brutos armazenados para indexação

Complementos de pagamento por utilização (cobrados por 1.000 consultas)

Complemento Preço Descrição
Semântica US$ 0,75 / 1 mil consultas + US $1,50 / GB / mês para embeddings Permite a compreensão semântica, a pesquisa híbrida e é necessário para a Visão geral criada por IA e o Modo IA.

A cobrança de armazenamento adicional cobre o custo de geração e manutenção de embeddings.
KPI e personalização US$ 0,20 / 1.000 consultas Permite a reclassificação e a personalização de eventos para otimizar os KPIs de negócios (engajamento, conversão)
Respostas generativas principais US$ 2,00 / 1.000 consultas Gera respostas, citações e acompanhamentos. Requer o complemento semântico.
Respostas generativas avançadas (modo IA) US$ 4,00 / 1 mil consultas Lida com consultas conversacionais complexas, com vários turnos e multimodalidade. Requer o complemento semântico.

Excedentes:o uso que exceder o QPM da sua assinatura será considerado excedente. Por padrão, as consultas excedentes são cobradas de acordo com a taxa da edição Standard do modelo de preços geral (US$ 1,50 / 1.000 consultas).

Escalonabilidade:você pode escalonar verticalmente o número de consultas por minuto ou a assinatura de armazenamento a qualquer momento, com custos proporcionais ao restante do mês. A redução de escala entra em vigor no início do próximo ciclo de faturamento.

Exemplo de preços configuráveis da Vertex AI para Pesquisa

Exemplo de dados estruturados : pesquisa de hotéis

Suposição:

  • 1 milhão de documentos (itens do catálogo) @ ~100 KB cada
  • Assinatura mensal de 1.500 consultas por minuto
  • 50 milhões de consultas mensais com o complemento de otimização de KPI
  • 30 milhões de consultas mensais com o complemento semântico
  • 10 milhões de consultas mensais com respostas generativas principais (resumos de IA)
Volume de SKU Taxa Preço de tabela total
Assinatura principal: unidade de consulta
1.500 consultas por minuto * US$ 6,00 / QPM x assinatura mensal = $9.000
Assinatura principal – Unidade de armazenamento
100 GB * US$ 1/GB x assinatura mensal = US$ 100
Complemento: indexação semântica
100 GB * US$ 1,50 / GB x mês US$ 150
Complemento: consultas semânticas
30 milhões * US$ 0,75 / 1 mil consultas $ 22.500
Complemento: KPI e personalização
50 milhões * US$ 0,20 / 1.000 consultas US$ 10.000
Complemento: respostas generativas principais
10 milhões * US$ 2,00 / 1.000 consultas US$ 20.000

Preços do armazenamento de índice

Preços do armazenamento de dados de índice da Vertex AI para Pesquisa

Armazenamento de índice US$ 5,00 / GiB de dados brutos por mês
* Cota gratuita de 10 GiB por mês fornecida
** Compartilhado entre a Vertex AI Search
***O custo de armazenamento do índice é aplicado ao tamanho total dos dados brutos, amostrados regularmente e calculados como uma média para o mês. As operações para atualizar os dados não geram custos adicionais.
**** Para o repositório de dados do site, o armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.)

Preços da Vertex AI para Pesquisa no setor de saúde

A Vertex AI para Pesquisa na área de saúde oferece a capacidade de criar rapidamente mecanismos de pesquisa ajustados para a área médica com base em dados de saúde.

Pesquisa de serviços de saúde US$ 20,00 / 1.000 consultas

A Vertex AI para Pesquisa para o setor de saúde inclui alguns recursos em pré-lançamento, como respostas de IA generativa, atualizações de streaming para o índice e outros. Esses recursos podem ter preços diferentes do preço atual listado quando forem lançados para disponibilidade geral.

Suposição:

  • 1 milhão de solicitações de pesquisa de serviços de saúde por mês

  • 1.000 GiB de dados de saúde indexados

Volume de SKU Taxa Preço de tabela total
1.000.000 de pesquisas US$ 20/1.000 US$ 20.000
1.000 GiB US$ 5/GiB US$ 5.000

Preços da Vertex AI para Pesquisa em mídia

A Vertex AI para Pesquisa no setor de mídia permite fornecer resultados de vídeo altamente relevantes, aproveitando a consulta e a compreensão contextual do Google para melhorar a descoberta em seu site de mídia.

Vertex AI para Pesquisa: índice de dados US$ 5,00 / GB por mês
Vertex AI para Pesquisa: contagem de solicitações da API Media Search US$ 2,00 / 1.000 consultas

Preços da Vertex AI para Pesquisa em recomendações de mídia

As únicas operações do Media Recommendations que geram cobranças são treinamento, ajuste ou solicitação de previsões chamando o método recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações do documento.

Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois que você pausa ou exclui um modelo, não há mais cobranças. Consulte a documentação sobre como gerenciar treinamentos.

Os custos de ajuste (nós por hora) para modelos ativos são cobrados depois que o ajuste é concluído. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você será cobrado pelas horas de uso do nó consumidas antes do ajuste do modelo ser interrompido. Consulte a documentação sobre como gerenciar ajustes.

Solicitações de previsão por mês US$0,20 / 1.000 previsões
Treinamento e ajuste US$2,50 por nó/hora

Exemplo de preço para recomendações de mídia

Suposição:

  • 1 bilhão de solicitações de previsão por mês

  • Treina um único modelo por dia, que é treinado novamente de forma automática uma vez por dia

  • Equivale a cerca de 500 horas de uso do nó com treinamento de modelo e 100 horas de ajuste de modelo por mês

Volume de SKU Taxa Preço de tabela total
1 bilhão de previsões * US$ 0,20 / 1 mil previsões = US$ 200.000
500 horas de uso do nó (treinamento) * US$ 2,50 / hora = US$ 1.250
100 horas de uso de nós (ajuste) * US$ 2,50 / hora = US$ 250,00
Total US$ 201.500

Cobranças do Google Cloud Observability

O Media Recommendations registra um erro no Google Cloud Observability para cada solicitação de API que resulta em erro, como uma solicitação de evento do usuário que contém JSON malformado ou uma solicitação de importação de documento com um preço negativo. O Media Recommendations também registra um erro para cada solicitação de previsão com um documento que não está no datastore importado.

O Google Cloud Observability cobra pelo GiB de registros armazenados e pela retenção além do período de armazenamento padrão. Para detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços do Google Cloud Observability.

O tamanho dos dados de criação de registros depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros do Media Recommendations.

Preços da API Grounded Generation

A API Grounded Generation permite criar respostas generativas para seus comandos usando informações da Pesquisa Google ou seus próprios dados.

Comando de entrada (inclui o comando do usuário, as instruções do sistema e os fatos de embasamento inline) Cobrado pelo preço do modelo do Gemini selecionado.
Saída Cobrado pelo preço do modelo do Gemini selecionado.
Grounded Generation para embasamento nos seus próprios dados recuperados US$ 2,50 / 1.000 solicitações
Grounded Generation para embasamento na Pesquisa Google Consulte Embasamento na Pesquisa Google.
As cobranças adicionais pela recuperação de dados são determinadas pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa).

Exemplo 1: embasamento na Vertex AI para Pesquisa e fatos de embasamento inline

O usuário usa a Vertex AI para Pesquisa e fatos adicionais para gerar respostas embasadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de embasamento em linha) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por 1.000 solicitações
Comando de entrada 2.500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações
Grounded Generation para embasamento nos seus próprios dados recuperados 1 solicitação US$2,50 por 1.000 solicitações
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) 1 solicitação US$4,00 por 1.000 solicitações
Total: US$ 6,8875 por 1.000 solicitações

O usuário usa a Pesquisa Google para gerar respostas embasadas. Cada comando de entrada tem 500 caracteres e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por 1.000 solicitações
Comando de entrada 500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US$0,075 por 1.000 solicitações
Grounded Generation para embasamento na Pesquisa Google 1 solicitação US$35,00 por 1.000 solicitações
Total: US$ 35,1375 por 1.000 solicitações

Confira os preços da API Grounding

A verificação de embasamento permite determinar o quanto um texto (a resposta candidata) está embasado em um determinado conjunto de textos de referência (os fatos).

Verifique o embasamento US$ 0,00075 por 1.000 caracteres de resposta

Preços dos recursos da Document AI

Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.

Para os recursos do Document AI integrados e cobrados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.

Digitalize o texto

Processador De 1 a 5.000.000 de páginas/mês * A partir de 5.000.001 páginas/mês
Processador Enterprise Document OCR US$ 1,50 a cada 1.000 páginas US$ 0,60 por 1.000 páginas

Extrair estruturas e entidades de documentos

Analisador de layout (inclui a divisão inicial) US$ 10 por 1.000 páginas

*O tamanho de uma página depende do formato do arquivo.

  • Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página

  • PDF: cada página do PDF = 1 página

  • TIFF: cada imagem no TIFF = 1 página

  • Word (DOCX): até 3.000 caracteres = 1 página

  • Excel (XLSX): cada guia = 1 página

  • PowerPoint (PPTX): cada slide = 1 página

  • HTML: até 3.000 caracteres = 1 página

  • Documentos analisados: até 3.000 caracteres = 1 página

Preços da API Ranking

A API de classificação recebe uma lista de documentos e os reclassifica com base na relevância deles para uma consulta.

Em comparação com os embeddings, que analisam apenas a semelhança semântica entre um documento e uma consulta, a API Ranking pode fornecer pontuações precisas sobre o quanto um documento responde bem a uma determinada consulta.

A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa após a recuperação de um conjunto inicial de documentos candidatos.

Classificar documentos

Classificação US$ 1 por 1.000 consultas

Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso em que mais de 100 documentos são especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
Por exemplo:

  • 132 documentos para classificar = 2 consultas

  • 200 documentos para classificar = 2 consultas

  • 399 documentos para classificar = 4 consultas

  • 401 documentos para classificar = 5 consultas

A seguir

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato