Preços da Vertex AI para Pesquisa e Conversação

Os preços são indicados em dólares americanos (USD).

Os preços da funcionalidade listada para disponibilidade geral (GA) começam em 1o de setembro de 2023.

A Vertex AI para Pesquisa e Conversação permite que desenvolvedores, mesmo aqueles com habilidades limitadas em machine learning, aproveitem o poder dos modelos de linguagem grandes da base do Google, experiência de pesquisa e tecnologias de IA de conversação para criar aplicativos de IA generativa de nível empresarial

Suporte e créditos de teste

US$ 1.000 em créditos de teste GRATUITO para usar com a Vertex AI para Pesquisa e Conversação. Esses créditos são válidos por um ano a partir da inscrição na conta com a Vertex AI para Pesquisa e Conversação, a partir de 18 de julho de 2023.

Dúvidas sobre o pacote e o preço dos recursos do GA ou da versão de pré-lançamento?

Entre em contato com a equipe de vendas do Google Cloud para mais informações.

Preços da Vertex AI para Conversação

Com a Vertex AI para Pesquisa e Conversação, é possível criar rapidamente agentes virtuais (chatbots) que geram respostas com base no conteúdo (site, documentos) incluído nos repositórios de dados. Com o Vertex AI para Conversação, é possível criar um novo agente virtual do Dialogflow CX OU adicionar o recurso a um agente virtual atual do Dialogflow CX.

Para adicionar outros recursos de IA generativa aos agentes virtuais do Dialogflow CX, use os substitutos generativos, que usam um modelo de linguagem grande (LLM) para lidar com cenários em que não há correspondência com a intenção do usuário. Os geradores permitem que os criadores de bots injetem ações generativas em qualquer lugar do fluxo de conversa. Por exemplo, resumir uma conversa, personalizar uma interação ou encadear várias chamadas de LLM para criar todo um fluxo de trabalho generativo.

Preços da funcionalidade de disponibilidade geral da Vertex AI para Conversação

Chat de conversação da Vertex AI* US$ 12,00 / 1.000 consulta**
Voz de conversação da Vertex AI* US$ 0,002 / segundo†
Chat do Dialogflow CX***(recursos padrão de IA não generativa para Chat) US$ 7,00 / 1.000 consulta**
Dialogflow CX Voice***(recursos padrão de IA não generativa para voz) US$ 0,001 / segundo†
*Todos os recursos de IA generativa: agentes do Datastore, substitutos generativos e geradores estão incluídos nos preços da Vertex AI para Conversação e SKU do Voice.

*Os clientes podem combinar consultas/segundos do Dialogflow CX (não generativa) e da Vertex AI para Conversação (generativa) no mesmo agente ou fluxo e serão cobrados automaticamente pelo uso real de cada conjunto de recursos. Dessa forma, é possível aproveitar a IA generativa de forma seletiva quando aplicável e pagar apenas pelo que realmente usar.

**Solicitação (ou consulta): faturamento medido por solicitação ou consulta individual.
Uma solicitação ou consulta é definida como qualquer chamada de API para o serviço do Dialogflow ou da Vertex AI para Conversação, seja direta com o uso da API ou indireta com a integração ou o uso do console.
Por exemplo, quando um usuário faz uma pergunta a um agente virtual (chatbot), e o bot de bate-papo responde é "1 Request". Uma interação do usuário com o bot de bate-papo pode ser composta de várias solicitações para realizar uma tarefa.

† Inclui reconhecimento de fala, conversão de voz em texto (STT, na sigla em inglês), síntese de fala, conversão de texto em voz (TTS) e telefonia. A duração total do processamento de áudio faturado é independente de qualquer processamento sem custo financeiro que não seja de áudio (latência da API, processamento de webhook etc.) que possa ocorrer antes, durante ou depois do processamento do áudio.

* O chat do Dialogflow CX e o Dialogflow CX Voice não estão qualificados para os créditos de teste GRATUITO de US $1.000. O Dialogflow CX tem um programa de créditos de teste extra que pode ser combinado com este programa de crédito de teste GRATUITO da Vertex AI para Pesquisa e Conversação. Veja mais definições de medição do Dialogflow CX aqui.

Exemplo de preço para a funcionalidade de disponibilidade geral da Vertex AI para Conversação

Exemplo de combinação de respostas baseadas em intenção e generativas: suporte ao cliente no site

  • Fluxos determinísticos baseados em intenção são usados para algumas perguntas específicas do cliente (faturamento, pagamento).
  • Respostas generativas usadas para lidar com perguntas sem intenção definida, mas a resposta está no site

Considerações:

  • 100 milhões de visitas anuais ao site
  • 5% dos visitantes utilizam o chatbot, 3 consultas por uso, 50% generativos e 50% baseados em intenção
Volume de SKUs Taxa Preço de tabela total
Chat do Dialogflow CX (baseado em intent)
7,5 milhões anuais
100 mi*5% de uso*3 consultas*50% com base em intenção
* US$ 7,00 / 1.000 consultas = US$ 52.500
Chat empresarial do Dialogflow CX (generativo)
7,5 mi anuais
100 mi*5% de uso*3 consultas*50% generativas
* US$ 12,00 / 1.000 consultas = USD 90.000
Dados indexados
50 GB anuais
10 GB gratuitos, portanto, 40 GB usados no cálculo de preço
* US$ 5,00 / GB * 12 meses = US$ 2.400

Preços da Vertex AI para Pesquisa

Com a Vertex AI para Pesquisa e Conversação, é possível criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados com o objetivo de recuperar informações e gerar respostas fundamentadas. Leia mais sobre os recursos disponíveis na Vertex AI para Pesquisa.

Preços da funcionalidade de disponibilidade geral da Vertex AI para Pesquisa

Google Search Standard Edition* US$ 2,00 / 1.000 consulta
Edição empresarial do Search* US$ 4,00 / 1.000 consulta
Pesquisar complemento LLM** +US$4,00 / 1.000 consulta**
Search Standard – Recursos de pesquisa não estruturados
Search Enterprise Edition – Recursos de pesquisa não estruturada + Pesquisa em sites
Complemento de pesquisa LLM – Resumo + recursos de pesquisa em vários turnos
Visualização particular: pesquisa estruturada + novos recursos de IA generativa (entre em contato com a equipe de vendas para saber os recursos mais recentes)

*Query: uso do faturamento limitado por solicitação ou entrada de consulta
Uma solicitação ou consulta é definida como qualquer chamada de API para o Enterprise Search ou integração direta com o uso da API ou integração direta com a API.
Exemplo: um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde com uma consulta.
Sugestões de preenchimento automático não contam como consultas. Uma consulta é contada apenas quando o usuário envia uma consulta de pesquisa final.

** O complemento LLM é adicionado a uma consulta para aumentar o processamento e usar um recurso de IA generativa.
Ele pode ser usado alternadamente com o Search Standard Edition ou o Search Enterprise Edition.
Exemplo: executar uma consulta do Search Enterprise com uma solicitação de resumo = 1 consulta do Search Enterprise + 1 consulta de complemento do LLM

Exemplo de preços para a funcionalidade de disponibilidade geral da Vertex AI para Pesquisa

Exemplo de dados não estruturados : pesquisa de documentos

Suposição:

  • 10 milhões de consultas do Google Apps Standard por ano
  • 10 milhões de consultas do Enterprise Edition com 10 milhões de consultas de resumo de LLM por ano
  • 100.000 documentos a ~1 MB cada
Volume de SKUs Taxa Preço de tabela total
Pesquisa padrão
10 mi anuais * US$ 2,00 / 1.000 consultas = US$ 20.000
Pesquisar no Enterprise
10 mi anuais * US$ 4,00 / 1.000 consultas = USD 40.000
Complemento de pesquisa LLM
Cada consulta adicionada a uma consulta Standard ou Enterprise
10 mi anuais * +US$4,00 / 1.000 consultas = Mais de US$40 mil
Dados indexados
100 GB anuais 10 GB grátis, 90 GB usados no cálculo de preço * US$ 5,00 / GB * 12 meses = US$ 5.400

Preços do índice de dados

Preços do armazenamento de dados do índice de conversação e da Vertex AI para Pesquisa

Dados indexados US$ 5,00 mensais por GiB
* Cota gratuita de 10 GiB por mês fornecida
** Compartilhada entre Vertex AI para Pesquisa e Conversação
*** O armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é 1.024 bytes. 500 KiB é aproximadamente 0,000477 GiB.Portanto, o preço de indexação de dados para um site de 1.000 páginas é de US $2,38 por mês.

Preços da Vertex AI para Pesquisa para o setor de saúde

A Vertex AI para Pesquisa para a área de saúde oferece a capacidade de criar rapidamente mecanismos de pesquisa medicamente ajustados sobre dados de saúde.

Pesquisa na área da saúde US$ 20 / 1.000 consulta

A Vertex AI para Pesquisa para o setor de saúde inclui alguns recursos em pré-lançamento, como respostas da IA generativa, atualizações de streaming do índice e outros. Esses recursos poderão ter preços diferentes do preço de tabela atual quando forem lançados para disponibilidade geral.

Suposição:

  • 1.000.000 solicitações de pesquisa de saúde por mês

  • 1.000 GiB de dados de saúde indexados

Volume de SKUs Taxa Preço de tabela total
1.000.000 pesquisas US$ 20/1.000 US$ 20.000
1.000 GiB US$ 5/GiB US$ 5.000

Preços da Vertex AI para Pesquisa para mídia

Com a Vertex AI para Pesquisa para mídia, é possível fornecer resultados de vídeo altamente relevantes, aproveitando a consulta e o entendimento contextual do Google para melhorar a descoberta no seu site de mídia.

Vertex AI para Pesquisa e Conversação: índice de dados US$ 5,00 / GB por mês
Vertex AI Search: contagem de solicitações da API Media Search US$ 2,00 / 1.000 consulta

Preços da Vertex AI para Pesquisa para recomendações de mídia

As únicas operações de recomendações de mídia que geram cobranças são treinamento, ajuste ou solicitação de previsões chamando o método recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações do documento.

Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois de pausar ou excluir um modelo, você não será mais cobrado. Consulte a documentação sobre como gerenciar treinamentos.

Os custos de ajuste (nós por hora) para modelos ativos são cobrados após a conclusão do ajuste. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você recebe uma cobrança pelas horas de uso do nó consumidas antes da interrupção do ajuste do modelo. Consulte a documentação para gerenciar os ajustes.

Previsões US$ 0,27 / 1.000 previsão
Treinamento e ajuste US$ 2,50 por nó/hora

Exemplo de preço para recomendações de mídia

Suposição:

  • 10.000.000 solicitações de previsão por mês

  • Treina um único modelo por dia, que é retreinado automaticamente uma vez por dia

  • Soma cerca de 150 horas de uso do nó de treinamento de modelo e 30 horas de ajuste de modelos por mês

Volume de SKUs Taxa Preço de tabela total
10 milhões de previsões * US$ 0,27 / 1.000 previsões = US$ 2.700
150 horas de uso de nós (treinamento) * US$ 2,50 / hora = US$ 375
30 horas de uso de nós (ajuste) * US$ 2,50 / hora = R$ 75,00
Total US$ 3.150

Cobranças de observabilidade do Google Cloud

As recomendações de mídia registram um erro na observabilidade do Google Cloud para cada solicitação de API que resulta em um erro, como uma solicitação de evento do usuário que contém JSON incorreto ou uma solicitação de importação de documentos com um preço negativo. As recomendações de mídia também registram um erro para cada solicitação de previsão com um documento que não esteja no repositório de dados importado.

A observabilidade do Google Cloud cobra por GiB de registros armazenados e para retenção além do período de armazenamento padrão. Para mais detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços de observabilidade do Google Cloud.

O tamanho dos dados de registro depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros de recomendações de mídia.

A seguir

Solicite uma cotação personalizada

Com os preços de pagamento por utilização do Google Cloud, você paga apenas pelos serviços que usa. Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato