Preços do Vertex AI Agent Builder

Os preços são indicados em dólares americanos (US$).

Os preços dos recursos em disponibilidade geral (GA) listados serão aplicados a partir de 1º de setembro de 2023.

O Vertex AI Agent Builder permite que os desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, aproveitem o poder dos grandes modelos de linguagem de fundação, da experiência em pesquisa e das tecnologias de IA de conversação do Google para criar aplicativos de IA generativa de nível empresarial

Créditos do teste e suporte

US$ 1.000 em créditos de teste GRÁTIS para uso com o Vertex AI Agent Builder. Esses créditos são válidos por um ano a partir do dia 18 de julho de 2023, quando a conta foi criada no Vertex AI Agent Builder.

Tem dúvidas sobre a funcionalidade do GA ou sobre a definição de pacotes e preços dos recursos de visualização?

Entre em contato com a equipe de vendas do Google Cloud para mais informações.

Preços dos Agentes da Vertex AI

O Vertex AI Agent Builder permite criar rapidamente agentes virtuais (chatbots) que geram respostas com base no conteúdo (site, documentos) que você inclui em repositórios de dados. Com os Vertex AI Agents, você pode criar um novo agente virtual do Dialogflow CX OU adicionar o recurso a um agente virtual do Dialogflow CX.

Para adicionar mais recursos de IA generativa aos seus agentes virtuais do Dialogflow CX, você pode usar os fallbacks generativos, que usam um modelo de linguagem grande (LLM) para lidar com cenários em que não há correspondência com a intenção do usuário. Os geradores permitem que os criadores de bots injetem ações generativas em qualquer lugar do fluxo de conversação, seja para resumir uma conversa, personalizar uma interação ou encadear várias chamadas de LLM para criar um fluxo de trabalho generativo completo.

Preços da funcionalidade GA do Vertex AI Agents

Chat dos agentes da Vertex AI* US$ 12,00 / 1.000 consultas**
Voz dos Agentes da Vertex AI* US$ 0,002 / segundo†
Chat do Dialogflow CX***(recursos de IA padrão e não generativa para o Chat) US$ 7,00 / 1.000 consultas**
Voz do Dialogflow CX***(recursos de IA padrão e não generativa para voz) US$ 0,001 / s†
*Todos os recursos de IA generativa: agentes do Data Store, soluções de fallback generativas, geradores e apps de agente estão incluídos nos preços das SKUs de chat e voz dos agentes da Vertex AI. Se você usar vários tipos de recursos de IA generativa em uma única solicitação, será cobrado separadamente por cada recurso de acordo com o uso.

*Os clientes podem combinar consultas/segundos do Dialogflow CX (não generativas) e da Vertex AI para Agentes (generativas) no mesmo agente ou fluxo e serão cobrados automaticamente pelo uso real de cada conjunto de recursos. Isso permite que você use a IA generativa de forma seletiva, quando aplicável, e pague apenas pelo que realmente usar.

**Request (ou Query): faturamento medido por Request ou Query individual.
Uma solicitação ou consulta é definida como qualquer chamada de API para o serviço do Dialogflow ou do Vertex AI Agents, seja direta com o uso da API ou indireta com a integração ou o uso do console.
Por exemplo, um usuário faz uma pergunta a um agente virtual (chatbot) e o chatbot responde. Isso é 1 solicitação. Uma interação do usuário com o chatbot pode ser composta por várias solicitações para realizar uma tarefa.

† Inclui reconhecimento de fala, conversão de voz em texto (STT), síntese de fala, conversão de texto em voz (TTS) e telefonia. A duração total do processamento de áudio faturado é independente de qualquer processamento não áudio sem cobrança (latência da API, processamento de webhook etc.) que possa ocorrer antes, durante ou após o processamento de áudio.

* O Dialogflow CX Chat e o Dialogflow CX Voice não são elegíveis para os créditos de teste GRÁTIS de US $1.000. O Dialogflow CX tem um programa adicional de créditos de teste que pode ser combinado com este programa de créditos de teste GRÁTIS do Vertex AI Agent Builder. Confira mais definições de medição do Dialogflow CX aqui.

Exemplo de preços para o recurso GA do Vertex AI Agents

Exemplo de mistura de respostas baseadas em intenção e generativas: suporte ao cliente no site

  • Fluxos deterministas baseados em intenção são usados para algumas perguntas específicas do cliente (faturamento, pagamento)
  • Respostas generativas usadas para tratar perguntas em que não há intenção definida, mas a resposta está no site

Considerações:

  • 100 milhões de visitas anuais ao site
  • 5% dos visitantes usam o chatbot, 3 consultas por uso, 50% generativo, 50% baseado em intenção
Volume de SKU Taxa Preço de tabela total
Chat do Dialogflow CX (com base em intenção)
7,5 milhões anuais
100 milhões*5% de uso*3 consultas*50% com base em intenção
* US$ 7,00 / 1.000 consultas = US$ 52.500
Chat do Dialogflow CX Enterprise (generativo)
7,5 milhões anuais
100M*5% de uso*3 consultas*50% generativo
* US$ 12,00 / 1.000 consultas = USD 90.000
Dados indexados
50 GB por ano
10 GB livres, então 40 GB usados na cálculo de preço
* US$ 5,00 / GB * 12 meses = US$ 2.400

Preços da Vertex AI para Pesquisa

O Vertex AI Agent Builder permite criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados para recuperar informações e gerar respostas fundamentadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.

Preços da funcionalidade de pesquisa GA da Vertex AI

Edição Padrão da Rede de pesquisa US$ 2,00 / 1.000 consultas
Enterprise Search US$ 4,00 / 1.000 consulta
Complemento LLM
(pode ser adicionado à Standard Edition e à Enterprise Edition)
Básico +US$4,00 / 1.000 consulta de entrada do usuário
Avançado +US$10,00 / 1.000 consulta de entrada de usuário
Search Standard Edition: recursos de pesquisa não estruturada
Search Enterprise Edition: recursos de pesquisa não estruturada + pesquisa de site

Complemento básico do LLM: fornece respostas e resumos para consultas simples de um ou vários turnos, com capacidade de processar consultas simples, compostas, longas e de vários turnos, com suporte a modelos como TextBison, Gemini 1.0 Series e Gemini 1.5 Flash (Link).
Cobramos por número de consultas de entrada do usuário, não por número de saltos.
Preview particular – Pesquisa estruturada + novos recursos de IA generativa (entre em contato com as vendas para saber mais sobre os recursos mais recentes)

Consulta: faturamento medido por solicitação ou entrada de consulta individual
Uma solicitação ou consulta é definida como qualquer chamada de API para a Pesquisa corporativa, seja direta com o uso da API ou indireta com a integração ou o uso do console.
Por exemplo, quando um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde, isso é uma consulta.

O complemento LLM é adicionado a uma consulta para aprimorar o processamento e usar um recurso de IA generativa.
O complemento LLM pode ser usado de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition.
Exemplo: executar uma consulta do Search Enterprise com uma solicitação de resumo = 1 consulta de pesquisa corporativa + 1 consulta de complemento do LLM

Exemplo de preço para a funcionalidade GA da Vertex AI para Pesquisa

Exemplo de dados não estruturados : pesquisa de documentos

Suposição:

  • 10 milhões de consultas na Standard Edition por ano
  • 10 milhões de consultas da edição Enterprise com 10 milhões de consultas de resumo do LLM anualmente
  • 100 mil documentos de ~1 MB cada
Volume de SKU Taxa Preço de tabela total
Pesquisa padrão
10 milhões/ano * US$ 2,00 / 1.000 consultas = US$ 20.000
Pesquisa corporativa
10 milhões/ano * US$ 4,00 / 1.000 consultas = USD 40.000
Complemento LLM básico do Search
Cada consulta adicionada a uma consulta Standard ou Enterprise
10 milhões/ano * +US$4,00 / 1.000 consultas de entrada do usuário = Mais de US$40.000
Complemento LLM de pesquisa avançada
Cada consulta adicionada a uma consulta Standard ou Enterprise
10 milhões/ano * +US$10,00 / 1.000 consultas de entrada do usuário = Mais de US$100.000
Dados indexados
100 GB por ano 10 GB gratuitos, portanto 90 GB usados na cálculo de preço * US$ 5,00 / GB * 12 meses = US$ 5.400

Preços do Data Index

Preços do armazenamento de dados de índice do Vertex AI Agent Builder

Dados indexados US$ 5,00 / GiB por mês
* Cota gratuita de 10 GiB por mês fornecida
** Compartilhado entre a Vertex AI Agent Builder
*** O armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.)

Preços da Vertex AI para Pesquisa no setor de saúde

A Vertex AI para Pesquisa de Saúde permite criar rapidamente mecanismos de pesquisa ajustados para dados de saúde.

Pesquisa da Healthcare US$ 20,00 / 1.000 consulta

A Vertex AI para Pesquisa na Saúde inclui alguns recursos em visualização prévia, como respostas de IA generativa, atualizações de streaming no índice e outros. Esses recursos podem ter preços diferentes do valor listado atualmente quando forem lançados para disponibilidade geral.

Suposição:

  • 1.000.000 solicitações de pesquisa de saúde por mês

  • 1.000 GiB de dados de saúde indexados

Volume de SKU Taxa Preço de tabela total
1.000.000 pesquisas US$ 20/1.000 US$ 20.000
1.000 GiB US$ 5/GiB US$ 5.000

Preços da Vertex AI para Pesquisa em mídia

Com a Vertex AI para mídia, você pode oferecer resultados de vídeo altamente relevantes, aproveitando a consulta e o entendimento contextual do Google para melhorar a descoberta no seu site de mídia.

Vertex AI Agent Builder: índice de dados US$ 5,00 / GB por mês
Vertex AI para Pesquisa: contagem de solicitações da API Media Search US$ 2,00 / 1.000 consultas

Preços da Vertex AI para Pesquisa em Recomendações de mídia

As únicas operações do Media Recommendations que geram cobranças são treinar, ajustar ou solicitar previsões chamando o método recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações de documentos.

Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois que você pausar ou excluir um modelo, não haverá mais cobranças. Consulte a documentação sobre como gerenciar treinamentos.

Os custos de ajuste (nós por hora) para modelos ativos são cobrados depois que o ajuste é concluído. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você será cobrado pelas horas de uso do nó consumidas antes do ajuste do modelo ser interrompido. Consulte a documentação sobre como gerenciar ajustes.

Solicitações de previsão por mês Preço por 1.000 previsões
Até 20.000.000 US$ 0,27
Próximos 280.000.000 US$ 0,18
Após 300.000.000 US$ 0,10
Recurso Preço
Treinamento e ajuste US$ 2,50 por nó/hora

Exemplo de preço para recomendações de mídia

Suposição:

  • 1.000.000.000 solicitações de previsão por mês

  • Treina um modelo por dia, que faz novo treino automaticamente uma vez por dia

  • equivale a aproximadamente 500 horas de uso do nó com treinamento de modelo e 100 horas de ajuste de modelo por mês

Volume de SKU Taxa Preço de tabela total
Primeiras 20 milhões de previsões * US$ 0,27 / 1.000 previsões = US$ 5.400
Próximos 280 milhões de previsões * US$ 0,18 / 1.000 previsões = US$ 50.400
Próximas 700 milhões de previsões * US$ 0,10 / 1.000 previsões = US$ 70.000
500 horas de uso de nós (Treinamento) * US$ 2,50 / hora = US$ 1.250
100 horas de uso de nós (ajuste) * US$ 2,50 / hora = US$ 250,00
Total US$ 127.300

Cobranças do Google Cloud Observability

O Media Recommendations registra um erro na Observabilidade do Google Cloud para cada solicitação de API que resulta em um erro, como uma solicitação de evento do usuário que contém JSON malformado ou uma solicitação de importação de documento com um preço negativo. O Media Recommendations também registra um erro para cada solicitação de previsão com um documento que não está no datastore importado.

O Google Cloud Observability cobra pelo GiB de registros armazenados e pela retenção além do período de armazenamento padrão. Para detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços do Google Cloud Observability.

O tamanho dos dados de criação de registros depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros do Media Recommendations.

Preços da API Grounded Generation

Com a API Grounded Generation, é possível criar respostas generativas para seus prompts usando informações da Pesquisa Google ou seus próprios dados.

Comando de entrada (inclui comando do usuário, instruções do sistema e informações de contexto) Cobrado pelo preço do modelo Gemini selecionado.
Saída Cobrado pelo preço do modelo Gemini selecionado.
Geração com base nos seus próprios dados recuperados US$ 2,50 / 1.000 solicitações
Geração com embasamento para embasamento na Pesquisa Google Consulte Embasamento na Pesquisa Google.
As taxas adicionais para recuperação de dados são determinadas pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa).

Exemplo 1: fundamentação na Vertex AI para Pesquisa e fatos de fundamentação inline

O usuário usa a Vertex AI para Pesquisa e outros fatos de embasamento para gerar respostas fundamentadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de fundamentação inline) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por mil solicitações
Comando de entrada 2.500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações
Geração com base nos seus próprios dados recuperados 1 solicitação US$2,50 por 1.000 solicitações
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) 1 solicitação US$4,00 por 1.000 solicitações
Total: US$ 6,8875 por 1.000 solicitações

O usuário usa a Pesquisa Google para gerar respostas fundamentadas. Cada comando de entrada tem 500 caracteres e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.

Volume por solicitação Preço por mil solicitações
Comando de entrada 500 caracteres 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações
Saída 200 caracteres 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US$0,075 por 1.000 solicitações
Geração com embasamento para embasamento na Pesquisa Google 1 solicitação US$35,00 por 1.000 solicitações
Total: US$ 35,1375 por 1.000 solicitações

Confira os preços da API Grounding

A verificação de embasamento permite determinar o quão embasado um texto (a resposta candidata) está em um determinado conjunto de textos de referência (os fatos).

Verificar aterramento US$ 0,00075 por 1.000 caracteres de resposta

Preços dos recursos da Document AI

Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.

Para os recursos da Document AI integrados e faturados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.

Digitalizar texto

Processador 1 a 5.000.000 páginas/mês * A partir de 5.000.001 páginas/mês
Processador Enterprise Document OCR US$ 1,50 a cada 1.000 páginas US$ 0,60 por 1.000 páginas

Extraia estruturas e entidades de documentos

Analisador de layout (inclui o agrupamento inicial) US$ 10 por 1.000 páginas

*O tamanho de uma página depende do formato do arquivo.

  • Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página

  • PDF: cada página no PDF = 1 página

  • TIFF: cada imagem no TIFF = 1 página

  • Word (DOCX): até 3.000 caracteres = 1 página

  • Excel (XLSX): cada guia = 1 página

  • PowerPoint (PPTX): cada slide = 1 página

  • HTML: até 3.000 caracteres = 1 página

  • Documentos analisados: até 3.000 caracteres = 1 página

Preços da API Ranking

A API de classificação recebe uma lista de documentos e os classifica novamente com base na relevância deles para uma consulta.

Em comparação com os embeddings, que consideram apenas a similaridade semântica de um documento e de uma consulta, a API de classificação pode fornecer pontuações precisas sobre o quanto um documento responde a uma consulta específica.

A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa depois de recuperar um conjunto inicial de documentos candidatos.

Classificar documentos

Classificação US$ 1 por 1.000 consultas

Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso de mais de 100 documentos especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
Por exemplo:

  • 132 documentos para classificar = 2 consultas

  • 200 documentos para classificar = 2 consultas

  • 399 documentos para classificar = 4 consultas

  • 401 documentos para classificar = 5 consultas

A seguir

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato