Preços da Vertex AI para Pesquisa

Os preços são indicados em dólares americanos (US$).

O preço da funcionalidade listada em disponibilidade geral (GA) será aplicado a partir de 1º de setembro de 2023.

A Vertex AI Search permite que desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, aproveitem o poder dos modelos de linguagem grandes de fundação, da experiência em pesquisa e das recomendações do Google para criar aplicativos de IA generativa de nível empresarial.

A Vertex AI para Pesquisa oferece a capacidade de criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados para recuperar informações e gerar respostas fundamentadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.

Preços da funcionalidade GA da Vertex AI para Pesquisa

Teste gratuito: você terá acesso a 10.000 consultas por conta, por mês, sem custo financeiro, para conhecer o Vertex AI Search sem um investimento inicial. Exclui respostas generativas avançadas.

Search Standard Edition US$ 1,50 / 1.000 consultas
O Search Enterprise Edition
inclui as principais respostas generativas (Modo IA)
US$ 4,00 / 1.000 consultas
Respostas generativas avançadas (Modo IA)
(podem ser adicionadas ao Standard Edition e ao Enterprise Edition)
+$4,00 / 1.000 consultas de entrada do usuário
Search Standard Edition: recursos de pesquisa não estruturada + pesquisa estruturada
Search Enterprise Edition: recursos de pesquisa não estruturada + pesquisa estruturada + pesquisa de sites

A Vertex AI para Pesquisa Enterprise Edition inclui as principais respostas generativas (modo IA). Forneça respostas, resumos e acompanhamentos sem custo financeiro adicional. Observação: as principais respostas generativas não incluem acompanhamentos sugeridos, multimodalidade, tratamento de consultas complexas e longas nem tratamento de consultas complexas.

As respostas generativas avançadas incluem recursos avançados, como acompanhamentos sugeridos, tratamento de consultas complexas e multimodalidade.

Pesquisa: o faturamento é medido por solicitação ou entrada de consulta individual
Uma solicitação ou consulta é definida como qualquer chamada de API para a Pesquisa empresarial, seja direta com o uso da API ou indireta com o uso da integração ou do console.
Por exemplo, quando um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde, isso é uma consulta.

As respostas generativas avançadas (Modo IA) são adicionadas a uma consulta para aprimorar o processamento e usar um recurso de IA generativa.
As respostas generativas avançadas (Modo IA) podem ser usadas de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition.
Exemplo: executar uma consulta do Search Enterprise com uma solicitação multimodal = 1 consulta do Search Enterprise + 1 consulta de respostas generativas avançadas (Modo IA)

Exemplo de preço da funcionalidade GA da Vertex AI para Pesquisa

Exemplo de dados não estruturados : pesquisa de documentos

Suposição:

  • 10 milhões de consultas da Standard Edition por ano
  • 10 milhões de consultas do Enterprise Edition com 2 milhões de consultas de respostas generativas avançadas (Modo IA) por ano
  • 100 mil documentos a ~1 MB cada
Volume de SKU Taxa Preço de tabela total
Pesquisa padrão
10 milhões anuais (com teste gratuito de 10 mil) * US$ 1,50 / 1.000 consultas = US$ 14.985
Search Enterprise com as principais respostas generativas (Modo IA)
10 milhões anuais (com teste gratuito de 10 mil) * US$ 4,00 / 1 mil consultas = US$ 39.960
Respostas generativas avançadas (Modo IA)
Cada consulta adicionada a uma consulta Standard ou Enterprise
2 milhões anuais * +US$4,00 / 1.000 consultas de entrada do usuário = +US$8.000
Dados indexados
100 GB anuais 10 GB gratuitos, então 90 GB usados no cálculo do preço * US$ 5,00 / GB * 12 meses = US$ 5.400

Preços do armazenamento de índice

Preços do armazenamento de dados de índice da Vertex AI para Pesquisa

Armazenamento de índice US$ 5,00 / GiB de dados brutos por mês
* Cota gratuita de 10 GiB por mês fornecida
** Compartilhado entre a Vertex AI Search
***O custo de armazenamento do índice é aplicado ao tamanho total dos dados brutos, amostrados regularmente e calculados como uma média para o mês. As operações para atualizar os dados não geram custos adicionais.
**** Para o repositório de dados do site, o armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.)

Preços da Vertex AI para Pesquisa no setor de saúde

A Vertex AI para Pesquisa na área da saúde oferece a capacidade de criar rapidamente mecanismos de pesquisa ajustados para a área médica com base em dados de saúde.

Pesquisa de serviços de saúde US$ 20,00 / 1.000 consultas

A Vertex AI para Pesquisa para o setor de saúde inclui alguns recursos em pré-lançamento, como respostas de IA generativa, atualizações de streaming para o índice e outros. Esses recursos podem ter preços diferentes do preço atual listado quando forem lançados para disponibilidade geral.

Suposição:

  • 1 milhão de solicitações de pesquisa de serviços de saúde por mês

  • 1.000 GiB de dados de saúde indexados

Volume de SKU Taxa Preço de tabela total
1.000.000 de pesquisas US$ 20/1.000 US$ 20.000
1.000 GiB US$ 5/GiB US$ 5.000

Preços da Vertex AI para Pesquisa em mídia

A Vertex AI para Pesquisa no setor de mídia permite fornecer resultados de vídeo altamente relevantes, aproveitando a consulta e a compreensão contextual do Google para melhorar a descoberta em seu site de mídia.

Vertex AI para Pesquisa: índice de dados US$ 5,00 / GB por mês
Vertex AI para Pesquisa: contagem de solicitações da API Media Search US$ 2,00 / 1.000 consultas

Preços da Vertex AI para Pesquisa em recomendações de mídia

As únicas operações do Media Recommendations que geram cobranças são treinamento, ajuste ou solicitação de previsões chamando o método recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações do documento.

Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois que você pausa ou exclui um modelo, não há mais cobranças. Consulte a documentação sobre como gerenciar treinamentos.

Os custos de ajuste (nós por hora) para modelos ativos são cobrados depois que o ajuste é concluído. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você será cobrado pelas horas de uso do nó consumidas antes do ajuste do modelo ser interrompido. Consulte a documentação sobre como gerenciar ajustes.

Solicitações de previsão por mês US$0,20 / 1.000 previsões
Treinamento e ajuste US$2,50 por nó/hora

Exemplo de preço para recomendações de mídia

Suposição:

  • 1 bilhão de solicitações de previsão por mês

  • Treina um único modelo por dia, que é treinado novamente de forma automática uma vez por dia

  • Equivale a cerca de 500 horas de uso do nó com treinamento de modelo e 100 horas de ajuste de modelo por mês

Volume de SKU Taxa Preço de tabela total
1 bilhão de previsões * US$ 0,20 / 1 mil previsões = US$ 200.000
500 horas de uso do nó (treinamento) * US$ 2,50 / hora = US$ 1.250
100 horas de uso de nós (ajuste) * US$ 2,50 / hora = US$ 250,00
Total US$ 201.500

Cobranças do Google Cloud Observability

O Media Recommendations registra um erro no Google Cloud Observability para cada solicitação de API que resulta em erro, como uma solicitação de evento do usuário que contém JSON malformado ou uma solicitação de importação de documento com um preço negativo. O Media Recommendations também registra um erro para cada solicitação de previsão com um documento que não está no datastore importado.

O Google Cloud Observability cobra pelo GiB de registros armazenados e pela retenção além do período de armazenamento padrão. Para detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços do Google Cloud Observability.

O tamanho dos dados de criação de registros depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros do Media Recommendations.

Preços da API Grounded Generation

A API Grounded Generation permite criar respostas generativas para seus comandos usando informações da Pesquisa Google ou seus próprios dados.

Comando de entrada (inclui o comando do usuário, as instruções do sistema e os fatos de embasamento inline) Cobrado pelo preço do modelo do Gemini selecionado.
Saída Cobrado pelo preço do modelo do Gemini selecionado.
Grounded Generation para embasamento nos seus próprios dados recuperados US$ 2,50 / 1.000 solicitações
Grounded Generation para embasamento na Pesquisa Google Consulte Embasamento na Pesquisa Google.
As cobranças adicionais pela recuperação de dados são determinadas pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa).

Exemplo 1: embasamento na Vertex AI para Pesquisa e fatos de embasamento inline

O usuário usa a Vertex AI para Pesquisa e outros fatos de embasamento para gerar respostas embasadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de embasamento em linha) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por 1.000 solicitações
Comando de entrada 2.500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações
Grounded Generation para embasamento nos seus próprios dados recuperados 1 solicitação US$2,50 por 1.000 solicitações
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) 1 solicitação US$4,00 por 1.000 solicitações
Total: US$ 6,8875 por 1.000 solicitações

O usuário usa a Pesquisa Google para gerar respostas embasadas. Cada comando de entrada tem 500 caracteres e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por 1.000 solicitações
Comando de entrada 500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US$0,075 por 1.000 solicitações
Grounded Generation para embasamento na Pesquisa Google 1 solicitação US$35,00 por 1.000 solicitações
Total: US$ 35,1375 por 1.000 solicitações

Confira os preços da API Grounding

A verificação de embasamento permite determinar o quanto um texto (o candidato a resposta) está embasado em um determinado conjunto de textos de referência (os fatos).

Verifique o embasamento US$ 0,00075 por 1.000 caracteres de resposta

Preços dos recursos da Document AI

Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.

Para os recursos do Document AI integrados e cobrados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.

Digitalize o texto

Processador De 1 a 5.000.000 de páginas/mês * A partir de 5.000.001 páginas/mês
Processador Enterprise Document OCR US$ 1,50 a cada 1.000 páginas US$ 0,60 por 1.000 páginas

Extrair estruturas e entidades de documentos

Analisador de layout (inclui a divisão inicial) US$ 10 por 1.000 páginas

*O tamanho de uma página depende do formato do arquivo.

  • Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página

  • PDF: cada página do PDF = 1 página

  • TIFF: cada imagem no TIFF = 1 página

  • Word (DOCX): até 3.000 caracteres = 1 página

  • Excel (XLSX): cada guia = 1 página

  • PowerPoint (PPTX): cada slide = 1 página

  • HTML: até 3.000 caracteres = 1 página

  • Documentos analisados: até 3.000 caracteres = 1 página

Preços da API Ranking

A API de classificação recebe uma lista de documentos e os reclassifica com base na relevância deles para uma consulta.

Em comparação com os embeddings, que analisam apenas a semelhança semântica entre um documento e uma consulta, a API de classificação pode fornecer pontuações precisas sobre o quanto um documento responde bem a uma determinada consulta.

A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa após a recuperação de um conjunto inicial de documentos candidatos.

Classificar documentos

Classificação US$ 1 por 1.000 consultas

Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso em que mais de 100 documentos são especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
Por exemplo:

  • 132 documentos para classificar = 2 consultas

  • 200 documentos para classificar = 2 consultas

  • 399 documentos para classificar = 4 consultas

  • 401 documentos para classificar = 5 consultas

A seguir

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato