Preços do Vertex AI Agent Builder

Os preços são indicados em dólares americanos (US$).

Os preços da funcionalidade listada na disponibilidade geral (GA) serão aplicados em 1o de setembro de 2023.

Com a Vertex AI Agent Builder, os desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, podem aproveitar o poder dos modelos de linguagem grandes, da experiência em pesquisa e das tecnologias de IA de conversação da base do Google para criar aplicativos de IA generativa de nível empresarial

Créditos de teste e suporte

US$ 1.000 em créditos de teste GRATUITO são concedidos para uso com a Vertex AI Agent Builder. Esses créditos são válidos por 1 ano a partir da inscrição da conta no Vertex AI Agent Builder, que começa em 18 de julho de 2023.

Dúvidas sobre a funcionalidade do Google Analytics ou o pacote e preço dos recursos em fase de pré-lançamento?

Entre em contato com a equipe de vendas do Google Cloud para mais informações.

Preços dos Agentes da Vertex AI

A Vertex AI Agent Builder oferece a capacidade de criar rapidamente agentes virtuais (chatbots) que geram respostas com base no conteúdo (site, documentos) incluído nos repositórios de dados. Com os Agentes da Vertex AI, é possível criar um novo agente virtual do Dialogflow CX OU adicionar o recurso a um agente virtual atual do Dialogflow CX.

Para adicionar outros recursos de IA generativa aos agentes virtuais do Dialogflow CX, use os substitutos generativos, que usam um modelo de linguagem grande (LLM) para lidar com cenários em que não há correspondência com a intenção do usuário. Os geradores permitem que os criadores de bots injetem ações generativas em qualquer lugar do fluxo de conversa. Isso pode ser para resumir uma conversa, personalizar uma interação ou encadear várias chamadas LLM para criar um fluxo de trabalho generativo inteiro.

Preços da funcionalidade GA da Vertex AI Agents

Chat de agentes da Vertex AI* US$ 12,00 / 1.000 consulta**
Voz de agentes da Vertex AI* US$ 0,002 / segundo†
Dialogflow CX Chat***(recursos padrão de IA não generativa para chat) US$ 7,00 / 1.000 consulta**
Dialogflow CX Voice***(recursos padrão de IA não generativa para o Voice) US$ 0,001 / segundo†
*Todos os recursos de IA generativa: agentes de repositório de dados, substitutos generativos, geradores e apps de agente são cobertos pelos preços de SKU do Voice e Chat para agentes da Vertex AI. Se você usar vários tipos de recursos de IA generativa em uma única solicitação, cada recurso vai receber uma cobrança separada com base no uso.

*Os clientes podem combinar consultas/segundos do Dialogflow CX (não generativa) e agentes da Vertex AI (generativos) no mesmo agente ou fluxo e serão cobrados automaticamente pelo uso real de cada conjunto de atributos. Assim, é possível aproveitar seletivamente a IA generativa, quando aplicável, e pagar apenas pelo que realmente usar.

**Solicitação (ou consulta): faturamento limitado por solicitação ou consulta individual.
Uma solicitação ou consulta é definida como qualquer chamada de API para o serviço do Dialogflow ou dos Agentes da Vertex AI, seja direta com o uso da API ou indireta com a integração ou o uso do console.
Por exemplo, uma pergunta para um agente virtual (chatbot) e a resposta dele é de uma solicitação. Uma interação do usuário com o chatbot pode ser composta por várias solicitações para realizar uma tarefa.

† Inclui reconhecimento de fala, conversão de voz em texto (STT, na sigla em inglês), síntese de fala, conversão de texto em voz (TTS) e telefonia. A duração total do processamento de áudio faturado é independente de qualquer processamento sem custo financeiro e não relacionado a áudio (latência da API, processamento de webhook etc.) que possa ocorrer antes, durante ou depois do processamento do áudio.

* O Dialogflow CX Chat e o Dialogflow CX Voice não estão qualificados para receber US $1.000 em créditos de teste GRATUITO. O Dialogflow CX tem um programa adicional de créditos de teste que pode ser combinado com este programa de créditos de teste GRATUITO da Vertex AI Agent Builder. Consulte outras definições da medição do Dialogflow CX aqui.

Exemplo de preço da funcionalidade de disponibilidade geral dos agentes da Vertex AI

Exemplo de combinação de respostas com base em intenção e generativas: suporte ao cliente no site

  • Os fluxos determinísticos baseados em intenção são usados para algumas perguntas específicas do cliente (faturamento, pagamento)
  • Respostas generativas usadas para processar perguntas sem intenção definida, mas com uma resposta no site

Considerações:

  • 100 milhões de visitas anuais ao site
  • 5% dos visitantes usam o chatbot, 3 consultas por uso, 50% generativas, 50% baseadas em intenção
Volume de SKUs Taxa Preço de tabela total
Chat do Dialogflow CX (baseado em intent)
7,5 mi por ano
100 mi*5% de uso*3 consultas*50% com base em intenção
* US$ 7,00 / mil consultas = USD 52.500
Chat empresarial do Dialogflow CX (generativo)
7,5 mi por ano
100 mi*5% de uso*3 consultas*50% generativas
* US$ 12,00 / mil consultas = USD 90.000
Dados indexados
50 GB anuais
10 GB gratuitos, portanto, 40 GB usados no cálculo do preço
* US$ 5,00 / GB * 12 meses = US$ 2.400

Preços da Vertex AI para Pesquisa

Com a Vertex AI Agent Builder, é possível criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados. O objetivo é recuperar informações e gerar respostas embasadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.

Preços da funcionalidade da Vertex AI para Pesquisa em GA

Pesquisa Standard Edition* US$ 2,00 / 1.000 consulta
Pesquisa Enterprise Edition* US$ 4,00 / 1.000 consulta
Complemento LLM de pesquisa básica** +US$4,00 / 1.000 consultas de entrada do usuário**
Complemento LLM de pesquisa avançada** +US$10,00 / 1.000 consultas de entrada do usuário**
Pesquisa Standard Edition – Recursos de pesquisa não estruturada
Edição empresarial de pesquisa: recursos de pesquisa não estruturada + Pesquisa de sites
Complemento básico do LLM de pesquisa** – Oferece respostas e resumos para consultas simples de um ou vários turnos, podendo processar consultas simples, compostas, longas e com vários turnos, além de modelos como TextBison, Gemini 1.0 série, Gemini 1.0 e a próxima pergunta que contém as perguntas avançadas (Link 1.5 Flash, que contém as perguntas avançadas do Gemini 1.5 Flash (Link-B)
Cobramos pelo número de consultas de entrada do usuário, não por número de saltos
Prévia particular: pesquisa estruturada + novos recursos de IA generativa (entre em contato com a equipe de vendas para saber os recursos mais recentes)

*Consulta: faturamento medido por solicitação individual ou entrada de consulta
Uma solicitação ou consulta é definida como qualquer chamada de API ao Enterprise Search, seja direta com o uso da API ou indireta com a integração ou o uso do console.
Exemplo: um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde 1 consulta.

** O complemento LLM é adicionado a uma consulta para aumentar o processamento do uso de um recurso de IA generativa.
O complemento LLM pode ser usado de forma intercambiável com o Search Standard Edition ou Search Enterprise Edition.
Exemplo: como executar uma consulta do Search Enterprise com uma solicitação de resumo = 1 consulta de pesquisa corporativa + 1 consulta de complemento do LLM

Exemplo de preços da funcionalidade da Vertex AI para Pesquisa em GA

Exemplo de dados não estruturados : Pesquisa de documentos

Suposição:

  • 10 milhões de consultas do Google Apps Standard por ano
  • 10 milhões de consultas do Enterprise Edition com 10 milhões de consultas de resumo de LLM por ano
  • 100 mil documentos a ~1 MB cada
Volume de SKUs Taxa Preço de tabela total
Pesquisa padrão
10 mi anuais * US$ 2,00 / mil consultas = US$ 20.000
Pesquisar empresa
10 mi anuais * US$ 4,00 / mil consultas = USD 40.000
Complemento LLM de pesquisa básica
Cada consulta adicionada a uma consulta padrão ou corporativa
10 mi anuais * +US$4,00 / mil consultas de entrada do usuário = Mais de US$40.000
Complemento LLM de pesquisa avançada
Cada consulta adicionada a uma consulta padrão ou corporativa
10 mi anuais * +US$10,00 / mil consultas de entrada do usuário = Mais de US$100.000
Dados indexados
100 GB anuais 10 GB gratuitos, portanto, 90 GB usados no cálculo do preço * US$ 5,00 / GB * 12 meses = US$ 5.400

Preços do índice de dados

Preços do armazenamento de dados de índice do Agent Builder da Vertex AI

Dados indexados US$ 5,00 / GiB por mês
* Cota gratuita de 10 GiB por mês fornecida
** Compartilhada no Vertex AI Agent Builder
*** O armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB equivale a 1.024 bytes. (500 KiB é aproximadamente 0,000477 GiB; portanto, o preço de indexação de dados para um site de 1.000 páginas é de US $2,38 por mês.)

Preços da Vertex AI para Pesquisa para Saúde

Com a Vertex AI para Pesquisa para o setor de saúde, é possível criar rapidamente mecanismos de pesquisa ajustados com base em dados médicos.

Pesquisa da área da saúde US$ 20,00 / 1.000 consulta

A Vertex AI para Pesquisa para Saúde inclui alguns recursos em pré-lançamento, como respostas de IA generativa, atualizações de streaming para o índice, entre outros. Quando forem lançados para disponibilidade geral, esses recursos poderão ter preços diferentes do valor de tabela atual.

Suposição:

  • 1.000.000 de solicitações de pesquisas em saúde por mês

  • 1.000 GiB de dados de saúde indexados

Volume de SKUs Taxa Preço de tabela total
1.000.000 de pesquisas US$ 20/1000 US$ 20.000
1.000 GiB US$ 5/GiB US$ 5.000

Preços da Vertex AI para Pesquisa para Mídia

Com a Vertex AI para Pesquisa para Mídia, é possível fornecer resultados de vídeo altamente relevantes, aproveitando a consulta e a compreensão contextual do Google para melhorar a descoberta em todo o seu site de mídia.

Vertex AI Agent Builder: índice de dados US$ 5,00 / GB por mês
Vertex AI para Pesquisa: contagem de solicitações da API Media Search US$ 2,00 / 1.000 consulta

Preços da Vertex AI para Pesquisa para Recomendações de mídia

As únicas operações de recomendações de mídia que geram cobranças são treinar, ajustar ou solicitar previsões chamando o método recommend. Não há custos para importar ou gerenciar eventos do usuário ou informações de documentos.

Os custos de treinamento (por nó/hora) são cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois de pausar ou excluir um modelo, você não receberá mais cobranças. Consulte a documentação sobre como gerenciar treinamento.

Os custos de ajuste (por nó/hora) para modelos ativos são cobrados após o ajuste ser concluído. Você só vai receber cobranças por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você vai receber cobranças pelas horas de uso do nó consumidas antes da interrupção do ajuste do modelo. Consulte a documentação para gerenciar os ajustes.

Previsões US$ 0,27 / 1.000 previsão
Treinamento e ajuste US$ 2,50 por nó/hora

Exemplo de preço para recomendações de mídia

Suposição:

  • 10.000.000 solicitações de previsão por mês

  • Treina um único modelo por dia, com retreinamento automático uma vez por dia

  • Isso equivale a cerca de 150 horas de uso de nós de treinamento de modelo e 30 horas de ajuste de modelo por mês

Volume de SKUs Taxa Preço de tabela total
10 milhões de previsões * US$ 0,27 / 1.000 previsões = US$ 2.700
150 horas de uso do nó (treinamento) * US$ 2,50 / hora = US$ 375
30 horas de uso do nó (ajuste) * US$ 2,50 / hora = R$ 75,00
Total US$ 3.150

Cobranças de observabilidade do Google Cloud

As recomendações de mídia registram um erro no Google Cloud Observability para cada solicitação de API que resulta em um erro, como uma solicitação de evento de usuário que contém JSON incorreto ou uma solicitação de importação de documentos com um preço negativo. As recomendações de mídia também registram um erro para cada solicitação de previsão com um documento que não está no repositório de dados importado.

A observabilidade do Google Cloud cobra por GiB de registros armazenados e por retenção além do período de armazenamento padrão. Para detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços de observabilidade do Google Cloud.

O tamanho dos dados de registro depende do tamanho do payload JSON, mas um GiB seria de aproximadamente 200.000 erros de recomendações de mídia.

Conferir os preços da API Grounding

A verificação de embasamento fornece a capacidade de determinar o quão fundamentado um texto (o candidato a resposta) está em um determinado conjunto de textos de referência (os fatos).

Verificar embasamento US$ 0,00075 por 1.000 caracteres de resposta

Preços de recursos da Document AI

Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.

Para os recursos da Document AI integrados e faturados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.

Digitalizar texto

Processador 1 a 5.000.000 páginas/mês * A partir de 5.000.001 páginas/mês
Processador de OCR para documentos empresariais US$ 1,50 a cada 1.000 páginas US$ 0,60 por 1.000 páginas

Extrair estruturas e entidades de documentos

Analisador de layout (inclui a divisão inicial) US$ 10 por 1.000 páginas

*O tamanho de uma página depende do formato do arquivo:

  • Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página

  • PDF: cada página no PDF = 1 página

  • TIFF: cada imagem na página TIFF = 1

  • Palavra (DOCX): até 3.000 caracteres = 1 página

  • Excel (XLSX): cada guia = 1 página

  • Powerpoint (PPTX): cada slide = 1 página

  • HTML: até 3.000 caracteres = 1 página

  • Documentos analisados: até 3.000 caracteres = 1 página

A seguir

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato