Os preços são indicados em dólares americanos (USD).
Os preços da funcionalidade listada em disponibilidade geral (GA) serão aplicados a partir de 1º de setembro de 2023.
A Vertex AI para Pesquisa permite que desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, aproveitem o poder dos modelos de linguagem grandes de fundação, da experiência em pesquisa e das recomendações do Google para criar aplicativos de IA generativa de nível empresarial.
✩ Observação interna do Google: para mais informações sobre preços, consulte go/vertexsc-pricing.
A Vertex AI para Pesquisa oferece a capacidade de criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados para recuperar informações e gerar respostas fundamentadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.
A Vertex AI para Pesquisa oferece dois modelos de preços: Geral e Configurável. Você precisa escolher um modelo para seu aplicativo de pesquisa e os repositórios de dados associados.
Sistema de preços geral | Preços configuráveis | |
|---|---|---|
Ideal para | Comece a usar rapidamente Cargas de trabalho com menos de 15 milhões de consultas Tráfego imprevisível | Cargas de trabalho com mais de 15 milhões de consultas por mês Necessidade de tráfego / capacidade de processamento previsível Flexibilidade para não usar sempre a semântica em todas as consultas |
Medidor de preços | Pagamento por consulta e por GB de dados indexados | Assinatura mensal para capacidade de consulta (QPM) e armazenamento, com pagamento por consulta para recursos complementares avançados |
Importante: um repositório de dados criado com o modelo de preços configurável só pode ser usado por um app de pesquisa que também usa esse modelo.
Preços gerais da Vertex AI para Pesquisa
Esse modelo é baseado em preços de pagamento conforme o uso para consultas de pesquisa e armazenamento de dados.
Teste sem custo financeiro: você terá acesso a 10.000 consultas por conta, por mês, sem custo financeiro, para conhecer o Vertex AI Search sem um investimento inicial. Exclui respostas generativas avançadas.
Preços de consultas de pesquisa
Tipo | Preço (USD) |
|---|---|
Search Standard Edition Inclui recuperação semântica e otimização de KPI | US$ 1,50 / 1.000 consultas |
Enterprise Search inclui as principais respostas generativas (Modo IA) | US$ 4,00 / 1.000 consultas |
Respostas generativas avançadas (Modo IA) (pode ser adicionado às edições Standard e Enterprise) | +$4,00 / 1.000 consultas de entrada do usuário |
Search Standard Edition: recursos de pesquisa não estruturada + pesquisa estruturada
Search Enterprise Edition: recursos de pesquisa não estruturada + pesquisa estruturada + pesquisa de sites
A Vertex AI para Pesquisa Enterprise Edition inclui as principais respostas generativas (modo IA). Forneça respostas, resumos e acompanhamentos sem custo financeiro adicional. Observação: as principais respostas generativas não incluem acompanhamentos sugeridos, multimodalidade, tratamento de consultas complexas e longas nem tratamento de consultas complexas.
As respostas generativas avançadas incluem recursos avançados, como acompanhamentos sugeridos, tratamento de consultas complexas e multimodalidade.
Consulta: o faturamento é medido por solicitação individual ou entrada de consulta
Uma solicitação ou consulta é definida como qualquer chamada de API para a Pesquisa empresarial, seja direta com o uso da API ou indireta com o uso da integração ou do console.
Por exemplo, quando um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde, isso é uma consulta.
As respostas generativas avançadas (Modo IA) são adicionadas a uma consulta para aprimorar o processamento e usar um recurso de IA generativa.
As respostas generativas avançadas (Modo IA) podem ser usadas de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition.
Exemplo: executar uma consulta do Search Enterprise com uma solicitação multimodal = 1 consulta do Search Enterprise + 1 consulta de respostas generativas avançadas (Modo IA)
Preços de indexação / armazenamento de dados
Consulte a seção de preços de armazenamento de índice
Exemplo de preço da funcionalidade GA da Vertex AI Search
Exemplo de dados não estruturados : pesquisa de documentos
Suposição:
Item | Volume de SKU | Taxa | Preço de tabela total |
|---|---|---|---|
Pesquisa padrão | 10 milhões anuais (com 10 mil de teste sem custo financeiro) | * US$ 1,50 / 1.000 consultas = | US$ 14.985 |
Search Enterprise com as principais respostas generativas (Modo IA) | 10 milhões anuais (com 10 mil de teste sem custo financeiro) | * US$ 4,00 / 1 mil consultas = | US$ 39.960 |
Respostas generativas avançadas (Modo IA) Cada consulta adicionada à consulta Standard ou Enterprise | 2 milhões anuais | * +US$4,00 / 1.000 consultas de entrada do usuário = | +US$8.000 |
Dados indexados | 100 GB anuais 10 GB sem custo financeiro, então 90 GB usados no cálculo do preço | * US$ 5,00 / GB * 12 meses = | US$ 5.400 |
Preços configuráveis da Vertex AI para Pesquisa
Esse modelo oferece custos previsíveis com assinaturas mensais para a capacidade de pesquisa principal, com complementos opcionais de pagamento conforme o uso para recursos adicionais. Ele foi criado para clientes com cargas de trabalho consistentes que buscam maior controle de custos.
Compromisso mensal mínimo: 1.000 consultas por minuto (QPM) e 50 GB de armazenamento.
Preços da assinatura principal (cobrança mensal)
SKU | Preço (USD) | Descrição |
|---|---|---|
Unidade de consulta | US$ 0,008219178 / 1 hour | Uma assinatura para a capacidade de taxa de transferência de consultas do seu aplicativo de pesquisa |
Unidade de armazenamento | US$ 0,001369863 / 1 hour | Uma assinatura dos dados brutos armazenados para indexação |
Complementos de pagamento por utilização. (Cobrado por 1.000 contagens)
Complemento | Preço (USD) | Descrição |
|---|---|---|
Semântica | US$ 0,75 / 1 mil contagens + US $1,50 / GB / mês para embeddings | Permite a compreensão semântica, a pesquisa híbrida e é necessário para a Visão geral criada por IA e o Modo IA. A cobrança de armazenamento adicional cobre o custo de geração e manutenção de embeddings. |
KPI e personalização | US$ 0,20 / 1,000 count | Permite a reclassificação e a personalização de eventos para otimizar os KPIs de negócios (engajamento, conversão) |
Respostas generativas principais | US$ 2,00 / 1,000 count | Gera respostas, citações e acompanhamentos. Requer o complemento semântico. |
Respostas generativas avançadas (Modo IA) | US$ 4,00 / 1 mil contagens | Lida com contagens de conversas complexas e com vários turnos e multimodalidade. Requer o complemento semântico. |
Excedentes: o uso que exceder o QPM da sua assinatura será considerado excedente. Por padrão, a contagem de excedentes é cobrada de acordo com a taxa da edição Standard do modelo de preços geral (US$ 1,50 / 1.000 consultas).
Escalonabilidade: você pode aumentar o número de consultas por minuto ou a assinatura de armazenamento a qualquer momento, com custos proporcionais ao restante do mês. A redução de escala entra em vigor no início do próximo ciclo de faturamento.
Exemplo de preços configuráveis da Vertex AI para Pesquisa
Exemplo de dados estruturados : pesquisa de hotéis
Suposição:
Item | Volume de SKU | Taxa | Preço de tabela total |
|---|---|---|---|
Assinatura principal: unidade de consulta | 1.500 consultas por minuto | * US$ 6,00 / QPM x assinatura mensal = | $9.000 |
Assinatura principal – Unidade de armazenamento | 100 GB | * US$ 1/GB x assinatura mensal = | US$ 100 |
Complemento: indexação semântica | 100 GB | * US$ 1,50 / GB x mês | US$ 150 |
Complemento: consultas semânticas | 30 milhões | * US$ 0,75 / 1 mil consultas | $ 22.500 |
Complemento: KPI e personalização | 50 milhões | * US$ 0,20 / 1.000 consultas | US$ 10.000 |
Complemento: respostas generativas principais | 10 milhões | * US$ 2,00 / 1.000 consultas | US$ 20.000 |
Preços do armazenamento de dados de índice da Vertex AI para Pesquisa
Tipo | Preço (USD) |
|---|---|
Armazenamento de índice | US$ 0,006849315 / 1 gibibyte hour |
* Cota sem custo financeiro de 10 GiB por mês
** Compartilhado na Vertex AI para Pesquisa
***O custo de armazenamento do índice é aplicado ao tamanho total dos dados brutos, amostrados regularmente e calculados como uma média para o mês. As operações para atualizar os dados não resultam em custos adicionais.
**** Para o repositório de dados do site, o armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.)
A Vertex AI para Pesquisa na área de saúde oferece a capacidade de criar rapidamente mecanismos de pesquisa ajustados para a área médica com base em dados de saúde.
Tipo | Preço (USD) |
|---|---|
Pesquisa de serviços de saúde | US$ 20,00 / 1,000 count |
A Vertex AI para Pesquisa no setor de saúde inclui alguns recursos em pré-lançamento, como respostas de IA generativa, atualizações de streaming para o índice e outros. Esses recursos podem ter preços diferentes do preço atual listado quando forem lançados para disponibilidade geral.
Exemplo de preço para a Pesquisa em saúde
Suposição:
Volume de SKU | Taxa | Preço de tabela total |
|---|---|---|
1.000.000 de pesquisas | US$ 20/1.000 | US$ 20.000 |
1.000 GiB | US$ 5/GiB | US$ 5.000 |
A Vertex AI para Pesquisa no setor de mídia permite fornecer resultados de vídeo altamente relevantes, aproveitando a consulta e a compreensão contextual do Google para melhorar a descoberta em seu site de mídia.
Tipo | Preço (USD) |
|---|---|
Vertex AI para Pesquisa: índice de dados | 0 gibibyte month to 10 gibibyte month US$ 0,00 (Free) / 1 gibibyte hour, per 1 month / account 10 gibibyte month and above US$ 0,006849315 / 1 gibibyte hour, per 1 month / account |
Tipo | Preço (USD) |
|---|---|
Vertex AI para Pesquisa: contagem de solicitações da API Media Search | US$ 2,00 / 1,000 count |
As únicas operações do Media Recommendations que geram cobranças são treinar, ajustar ou solicitar previsões chamando o método de recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações do documento.
Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois que você pausar ou excluir um modelo, não haverá mais cobranças. Consulte a documentação sobre como gerenciar treinamentos.
Os custos de ajuste (nós por hora) para modelos ativos são cobrados depois que o ajuste é concluído. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você será cobrado pelas horas de uso do nó consumidas antes do ajuste do modelo ser interrompido. Consulte a documentação sobre como gerenciar ajustes.
Tipo | Preço (USD) |
|---|---|
Solicitações de previsão por mês | US$ 0,20 / 1,000 count |
Tipo | Preço (USD) |
|---|---|
Treinamento e ajuste | US$ 2,50 / 1 hour |
Exemplo de preço para recomendações de mídia
Suposição:
Volume de SKU | Taxa | Preço de tabela total |
|---|---|---|
1 bilhão de previsões | * US$ 0,20 / 1.000 previsões = | US$ 200.000 |
500 horas de uso do nó (treinamento) | * US$ 2,50 / hora = | US$ 1.250 |
100 horas de uso de nós (ajuste) | * US$ 2,50 / hora = | US$ 250,00 |
Total | US$ 201.500 |
Cobranças do Google Cloud Observability
O Media Recommendations registra um erro no Google Cloud Observability para cada solicitação de API que resulta em erro, como uma solicitação de evento do usuário que contém JSON malformado ou uma solicitação de importação de documento com um preço negativo. O Media Recommendations também registra um erro para cada solicitação de previsão com um documento que não está no datastore importado.
O Google Cloud Observability cobra pelo GiB de registros armazenados e pela retenção além do período de retenção padrão. Para detalhes sobre a cota sem custo financeiro e a retenção de dados, consulte a página de preços do Google Cloud Observability.
O tamanho dos dados de criação de registros depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros do Media Recommendations.
A API Grounded Generation permite criar respostas generativas para seus comandos usando informações da Pesquisa Google ou seus próprios dados.
Tipo | Preço (USD) |
|---|---|
Comando de entrada (inclui o comando do usuário, instruções do sistema e fatos de embasamento inline) | Cobrado pelo preço do modelo do Gemini selecionado. |
Saída | Cobrado pelo preço do modelo do Gemini selecionado. |
Grounded Generation para embasamento nos seus próprios dados recuperados | US$ 2,50 / 1,000 count |
Grounded Generation para embasamento na Pesquisa Google | Consulte Embasamento na Pesquisa Google. |
As cobranças adicionais pela recuperação de dados são determinadas pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa). |
Exemplo 1: embasamento na Vertex AI para Pesquisa e fatos de embasamento inline
O usuário usa a Vertex AI para Pesquisa e fatos adicionais para gerar respostas embasadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de embasamento em linha) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.
Volume por solicitação | Preço por 1.000 solicitações | |
|---|---|---|
Comando de entrada | 2.500 caracteres | 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações |
Saída | 200 caracteres | 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações |
Grounded Generation para embasamento nos seus próprios dados recuperados | 1 solicitação | US$ 2,50 / 1,000 count |
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) | 1 solicitação | US$ 4,00 / 1,000 count |
Total: US$ 6,8875 por 1.000 solicitações |
Exemplo 2: embasamento na Pesquisa Google
O usuário usa a Pesquisa Google para gerar respostas embasadas. Cada comando de entrada tem 500 caracteres e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.
Item | Volume por solicitação | Preço por 1.000 solicitações |
|---|---|---|
Comando de entrada | 500 caracteres | 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações |
Saída | 200 caracteres | 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US $0,075 por 1.000 solicitações |
Grounded Generation para embasamento na Pesquisa Google | 1 solicitação | 0 count to 10,000 count US$ 0,00 (Free) / 1,000 count, per 1 day / account 10,000 count and above US$ 35,00 / 1,000 count, per 1 day / account |
Total: US$ 35,1375 por 1.000 solicitações |
A verificação de embasamento permite determinar o quanto um texto (a resposta candidata) está embasado em um determinado conjunto de textos de referência (os fatos).
Tipo | Preço (USD) |
|---|---|
Verifique o embasamento | US$ 0,00075 / 1,000 count |
Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.
Para os recursos do Document AI integrados e cobrados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.
Digitalizar texto
Processador | Preço (USD) |
|---|---|
Número de páginas processadas para o processador de OCR. | 0 count to 1,000 count US$ 0,00 (Free) / 1,000 count, per 1 month / account 1,000 count to 5,000,000 count US$ 1,50 / 1,000 count, per 1 month / account 5,000,000 count and above US$ 0,60 / 1,000 count, per 1 month / account |
Extrair estruturas e entidades de documentos
Item | Preço (USD) |
|---|---|
Analisador de layout (inclui a divisão inicial) | US$ 10,00 / 1,000 count |
*O tamanho de uma página depende do formato do arquivo.
A API de classificação recebe uma lista de documentos e os reclassifica com base na relevância deles para uma consulta.
Em comparação com os embeddings, que analisam apenas a semelhança semântica entre um documento e uma consulta, a API Ranking pode fornecer pontuações precisas sobre o quanto um documento responde bem a uma determinada consulta.
A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa depois de recuperar um conjunto inicial de documentos candidatos.
Classificar documentos
Item | Preço (USD) |
|---|---|
Classificação | US$ 1,00 / 1,000 count |
Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso em que mais de 100 documentos são especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
A seguir