Preços do Vertex AI Agent Builder
Os preços são indicados em dólares americanos (US$).
Os preços da funcionalidade listada na disponibilidade geral (GA) serão aplicados em 1o de setembro de 2023.
O Vertex AI Agent Builder permite que os desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, explorem dos modelos de linguagem grandes de base do Google, do conhecimento em pesquisa e das tecnologias de IA de conversação para criar aplicativos de IA generativa de nível empresarial
Créditos de teste e Suporte
US$ 1.000 em créditos de teste GRATUITO são concedidos para uso com a Vertex AI Agent Builder. Esses créditos são válidos por 1 ano a partir da inscrição da conta no Vertex AI Agent Builder, que começa em 18 de julho de 2023.
Dúvidas sobre a funcionalidade do Google Analytics ou o pacote e preço dos recursos em fase de pré-lançamento?
Entre em contato com a equipe de vendas do Google Cloud para mais informações.
Preços dos Agentes da Vertex AI
Com a Vertex AI Agent Builder, é possível criar rapidamente agentes virtuais (chatbots) que geram respostas com base no conteúdo (site, documentos). que você inclui nos repositórios de dados. Usando os Agentes da Vertex AI, é possível criar uma nova CX agente virtual OU adicione o recurso a um agente virtual atual do Dialogflow CX.
Para adicionar outros recursos de IA generativa aos agentes virtuais do Dialogflow CX, use os substitutos generativos, que usam um modelo de linguagem grande (LLM) para lidar com cenários em que não há correspondência com a intenção do usuário. Os geradores capacitam os criadores de bots a injetar ações generativas em qualquer lugar do fluxo de conversa. Por exemplo, para resumir uma conversa, personalize uma interação ou encadeie várias chamadas LLM para criar um fluxo de trabalho generativo completo.
Preços da funcionalidade GA da Vertex AI Agents
Chat de agentes da Vertex AI* | US$ 12,00 / 1.000 consulta** |
---|---|
Voz de agentes da Vertex AI* | US$ 0,002 / segundo† |
Dialogflow CX Chat***(recursos padrão de IA não generativa para chat) | US$ 7,00 / 1.000 consulta** |
Dialogflow CX Voice***(recursos padrão de IA não generativa para o Voice) | US$ 0,001 / segundo† |
*Todos os recursos de IA generativa: agentes de repositório de dados, substitutos generativos, geradores e apps de agente são cobertos pelos preços de SKU do Voice e Chat para agentes da Vertex AI. Se você usar vários tipos de recursos de IA generativa em uma única solicitação, cada recurso vai receber uma cobrança separada com base no uso. *Os clientes podem combinar consultas/segundos do Dialogflow CX (não generativa) e agentes da Vertex AI (generativos) no mesmo agente ou fluxo e serão cobrados automaticamente pelo uso real de cada conjunto de atributos. Assim, é possível aproveitar seletivamente a IA generativa, quando aplicável, e pagar apenas pelo que realmente usar. **Solicitação (ou consulta): faturamento limitado por solicitação ou consulta individual. Uma solicitação ou consulta é definida como qualquer chamada de API para o serviço do Dialogflow ou do Agentes da Vertex AI, seja direta com o uso da API ou indireta com a integração ou o uso do console. Por exemplo, uma pergunta para um agente virtual (chatbot) e a resposta dele é de 1 solicitação. Uma interação do usuário com o chatbot pode ser composta por várias solicitações para realizar uma tarefa. † Inclui reconhecimento de fala, conversão de voz em texto (STT, na sigla em inglês), síntese de fala, conversão de texto em voz (TTS) e telefonia. A duração total do processamento de áudio faturado é independente de qualquer processamento sem custo financeiro e não relacionado a áudio (latência da API, processamento de webhook etc.) que possa ocorrer antes, durante ou depois do processamento do áudio. * O Dialogflow CX Chat e o Dialogflow CX Voice não estão qualificados para receber US $1.000 em créditos de teste GRATUITO. O Dialogflow CX tem um programa adicional de créditos de teste que pode ser combinado com este programa de créditos de teste GRATUITO da Vertex AI Agent Builder. Consulte outras definições da medição do Dialogflow CX aqui. |
Exemplo de preço da funcionalidade de disponibilidade geral dos agentes da Vertex AI
Exemplo de combinação de respostas com base em intenção e generativas: suporte ao cliente no site
- Os fluxos determinísticos baseados em intenção são usados para algumas perguntas específicas do cliente (faturamento, pagamento)
- Respostas generativas usadas para processar perguntas sem intenção definida, mas com uma resposta no site
Considerações:
- 100 milhões de visitas anuais ao site
- 5% dos visitantes usam o chatbot, 3 consultas por uso, 50% generativas, 50% baseadas em intenção
Volume de SKUs | Taxa | Preço de tabela total |
---|---|---|
Chat do Dialogflow CX (baseado em intent) | ||
7,5 mi anuais 100 milhões*5% de uso*3 consultas*50% com base em intenção |
* US$ 7,00 / mil consultas = | USD 52.500 |
Chat empresarial do Dialogflow CX (generativo) | ||
7,5 mi anuais 100 mi*5% de uso*3 consultas*50% generativas |
* US$ 12,00 / mil consultas = | USD 90.000 |
Dados indexados | ||
50 GB anuais 10 GB gratuitos, portanto, 40 GB usados no cálculo de preço |
* US$ 5,00 / GB * 12 meses = | US$ 2.400 |
Preços da Vertex AI para Pesquisa
Com a Vertex AI Agent Builder, é possível criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados. O objetivo é recuperar informações e gerar respostas embasadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.
Preços da funcionalidade da Vertex AI para Pesquisa em GA
Pesquisa Standard Edition* | US$ 2,00 / 1.000 consulta |
---|---|
Pesquisa Enterprise Edition* | US$ 4,00 / 1.000 consulta |
Complemento LLM de pesquisa básica** | +US$4,00 / 1.000 consultas de entrada do usuário** |
Complemento LLM de pesquisa avançada** | +US$10,00 / 1.000 consultas de entrada do usuário** |
Pesquisa Standard Edition – Recursos de pesquisa não estruturada Search Enterprise Edition – Recursos de pesquisa não estruturada + pesquisa em sites Complemento básico do LLM de pesquisa** – Forneça respostas e resumos para consultas simples de um ou vários turnos, com a capacidade de processar consultas simples, compostas, longas e de vários turnos, além de modelos compatíveis, incluindo TextBison, Gemini 1.0 e Gemini 1.5 Flash (link) Complemento LLM de pesquisa avançada** (Acesso antecipado, no momento, GA em 1o de julho de 2024): forneça respostas e resumos para consultas de vários saltos (uma consulta que contém duas ou mais perguntas aninhadas, a resposta para esclarecer a próxima pergunta que precisa ser respondida), modelos compatíveis, incluindo TextBison, Gemini 1.0 e Gemini 1.5 Flash (link). Cobramos pelo número de consultas de entrada do usuário, não pelo número de saltos Prévia particular: pesquisa estruturada + novos recursos de IA generativa (entre em contato com a equipe de vendas para saber os recursos mais recentes) *Consulta: faturamento limitado por solicitação individual ou entrada de consulta Uma solicitação ou consulta é definida como qualquer chamada de API para o Enterprise Search, seja direta com o uso da API ou indireta com a integração ou o uso do console. Exemplo: um usuário fazendo uma pergunta em linguagem natural e o mecanismo de pesquisa respondendo é 1 consulta. ** O complemento LLM é a uma consulta para aprimorar o processamento e usar O complemento LLM pode ser usado de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition. Exemplo: executar uma consulta do Search Enterprise com uma solicitação de resumo = 1 consulta de pesquisa corporativa + 1 consulta de complemento do LLM |
Exemplo de preços da funcionalidade da Vertex AI para Pesquisa em GA
Exemplo de dados não estruturados : Pesquisa de documentos
Suposição:
- 10 milhões de consultas do Google Apps Standard por ano
- 10 milhões de consultas do Enterprise Edition com 10 milhões de consultas de resumo de LLM por ano
- 100 mil documentos a ~1 MB cada
Volume de SKUs | Taxa | Preço de tabela total |
---|---|---|
Pesquisa padrão | ||
10 mi anuais | * US$ 2,00 / mil consultas = | US$ 20.000 |
Pesquisar empresa | ||
10 mi anuais | * US$ 4,00 / mil consultas = | USD 40.000 |
Complemento LLM de pesquisa básica Cada consulta adicionada a uma consulta padrão ou corporativa |
||
10 mi anuais | * +US$4,00 / mil consultas de entrada do usuário = | Mais de US$40.000 |
Complemento LLM de pesquisa avançada Cada consulta adicionada a uma consulta padrão ou corporativa |
||
10 mi anuais | * +US$10,00 / mil consultas de entrada do usuário = | Mais de US$100.000 |
Dados indexados | ||
100 GB anuais 10 GB livres, portanto, 90 GB usados no cálculo do preço | * US$ 5,00 / GB * 12 meses = | US$ 5.400 |
Preços do índice de dados
Preços do armazenamento de dados de índice do Agent Builder da Vertex AI
Dados indexados | US$ 5,00 / GiB por mês |
---|---|
* Cota gratuita de 10 GiB por mês fornecida ** Compartilhado entre a Vertex AI Agent Builder *** O armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.) |
Preços da Vertex AI para Pesquisa para Saúde
Com a Vertex AI para Pesquisa para o setor de saúde, é possível criar rapidamente mecanismos de pesquisa ajustados com base em dados médicos.
Pesquisa da área da saúde | US$ 20,00 / 1.000 consulta |
---|
A Vertex AI para Pesquisa para Saúde inclui alguns recursos em pré-lançamento, como respostas de IA generativa, atualizações de streaming para o índice, entre outros. Quando forem lançados para disponibilidade geral, esses recursos poderão ter preços diferentes do valor de tabela atual.
Exemplo de preço para a pesquisa de saúde
Suposição:
1.000.000 de solicitações de pesquisas em saúde por mês
1.000 GiB de dados de saúde indexados
Volume de SKUs | Taxa | Preço de tabela total |
---|---|---|
1.000.000 de pesquisas | US$ 20/1000 | US$ 20.000 |
1.000 GiB | US$ 5/GiB | US$ 5.000 |
Preços da Vertex AI para Pesquisa para Mídia
Com a Vertex AI para Pesquisa para Mídia, é possível fornecer resultados de vídeo altamente relevantes, aproveitando a consulta e a compreensão contextual do Google para melhorar a descoberta em todo o seu site de mídia.
Vertex AI Agent Builder: índice de dados | US$ 5,00 / GB por mês |
---|---|
Vertex AI para Pesquisa: contagem de solicitações da API Media Search | US$ 2,00 / 1.000 consulta |
Preços da Vertex AI para Pesquisa para Recomendações de mídia
As únicas operações de recomendações de mídia que geram cobranças são treinar, ajustar ou solicitar previsões chamando o método recommend. Não há custos para importar ou gerenciar eventos do usuário ou informações de documentos.
Os custos de treinamento (por nó/hora) são cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois de pausar ou excluir um modelo, você não receberá mais cobranças. Consulte a documentação sobre como gerenciar treinamento.
Os custos de ajuste (por nó/hora) para modelos ativos são cobrados após o ajuste ser concluído. Você só vai receber cobranças por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você vai receber cobranças pelas horas de uso do nó consumidas antes da interrupção do ajuste do modelo. Consulte a documentação para gerenciar os ajustes.
Solicitações de previsões por mês | Preço por 1.000 previsões |
---|---|
Até 20.000.000 | US$ 0,27 |
Próximos 280.000.000 | US$ 0,18 |
Após 300.000.000 | US$ 0,10 |
Recurso | Preço |
Treinamento e ajuste | US$ 2,50 por nó/hora |
Exemplo de preço para recomendações de mídia
Suposição:
1.000.000.000 de solicitações de previsão por mês
Treina um único modelo por dia, com retreinamento automático uma vez por dia
Isso equivale a cerca de 500 horas de uso de nós de treinamento de modelo e 100 horas de ajuste de modelo por mês
Volume de SKUs | Taxa | Preço de tabela total |
---|---|---|
Primeiras 20 milhões de previsões | * US$ 0,27 / 1.000 previsões = | US$ 5.400 |
Próximas 280 milhões de previsões | * US$ 0,18 / 1.000 previsões = | US$ 50.400 |
Próximas 700 milhões de previsões | * US$ 0,10 / 1.000 previsões = | US$ 70.000 |
500 horas de uso do nó (treinamento) | * US$ 2,50 / hora = | US$ 1.250 |
100 horas de uso do nó (ajuste) | * US$ 2,50 / hora = | US$ 250,00 |
Total | US$ 127.300 |
Cobranças de observabilidade do Google Cloud
As recomendações de mídia registram um erro no Google Cloud Observability para cada solicitação de API que resulte em um erro, como uma solicitação de evento de usuário que contenha JSON incorreto, ou uma solicitação de importação de documentos com um preço negativo. As recomendações de mídia também registram um erro para cada solicitação de previsão com um documento que não esteja no repositório de dados importado.
A observabilidade do Google Cloud cobra por GiB de registros armazenados e por retenção além dos período de armazenamento padrão. Para mais detalhes sobre o cota gratuita e retenção de dados, consulte a página de preços de observabilidade do Google Cloud.
O tamanho dos dados de registro depende do payload JSON. mas um GiB seria de aproximadamente 200.000 erros de recomendações de mídia.
Preços da API Grounded Generation
A API Grounded Generation permite criar respostas generativas para seus comandos usando informações da Pesquisa Google ou dos seus próprios dados.
Comando de entrada (inclui comando do usuário, instruções do sistema e fatos de embasamento inline) | A cobrança é feita de acordo com o preço do modelo Gemini selecionado. |
Saída | A cobrança é feita de acordo com o preço do modelo Gemini selecionado. |
Geração empírica para se basear nos próprios dados recuperados | US$ 2,50 / 1.000 solicitações |
Grounded Generation para uso na Pesquisa Google | Consulte Fundamentos da Pesquisa Google. |
As cobranças adicionais para recuperação de dados são determinadas pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa). |
Exemplo 1: embasamento na Vertex AI para Pesquisa e fatos de embasamento inline
O usuário usa a Vertex AI para Pesquisa e outros fatos embasados para gerar respostas embasadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de embasamento inline) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.
Volume por solicitação | Preço por 1.000 solicitações | |
---|---|---|
Comando de entrada | 2.500 caracteres | 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações |
Saída | 200 caracteres | 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações |
Geração empírica para se basear nos próprios dados recuperados | 1 solicitação | US$2,50 por 1.000 solicitações |
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) | 1 solicitação | US$4,00 por 1.000 solicitações |
Total: US$ 6,8875 por 1.000 solicitações |
Exemplo 2: embasamento na Pesquisa Google
O usuário usa a Pesquisa Google para gerar respostas embasadas. Cada comando de entrada tem 500 caracteres e cada comando de saída, 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.
Volume por solicitação | Preço por 1.000 solicitações | |
---|---|---|
Comando de entrada | 500 caracteres | 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações |
Saída | 200 caracteres | 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US$0,075 por 1.000 solicitações |
Grounded Generation para uso na Pesquisa Google | 1 solicitação | US$35,00 por 1.000 solicitações |
Total: US$ 35,1375 por 1.000 solicitações |
Conferir os preços da API Grounding
A verificação de embasamento fornece a capacidade de determinar o quão fundamentado um texto (o candidato a resposta) está em um determinado conjunto de textos de referência (os fatos).
Verificar embasamento | US$ 0,00075 por 1.000 caracteres de resposta |
Preços de recursos da Document AI
Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.
Para os recursos da Document AI integrados e faturados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.
Digitalizar texto
Processador | 1 a 5.000.000 páginas/mês * | A partir de 5.000.001 páginas/mês |
---|---|---|
Processador de OCR para documentos empresariais | US$ 1,50 a cada 1.000 páginas | US$ 0,60 por 1.000 páginas |
Extrair estruturas e entidades de documentos
Analisador de layout (inclui a divisão inicial) | US$ 10 por 1.000 páginas |
*O tamanho de uma página depende do formato do arquivo:
Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página
PDF: cada página no PDF = 1 página
TIFF: cada imagem na página TIFF = 1
Palavra (DOCX): até 3.000 caracteres = 1 página
Excel (XLSX): cada guia = 1 página
Powerpoint (PPTX): cada slide = 1 página
HTML: até 3.000 caracteres = 1 página
Documentos analisados: até 3.000 caracteres = 1 página
Classificação de preços da API
A API de classificação pega uma lista de documentos e reclassifica esses documentos com base na relevância deles para uma consulta.
Em comparação com os embeddings, que analisam apenas a semelhança semântica de um documento e uma consulta, a API de classificação pode fornecer pontuações precisas sobre a resposta de um documento a uma determinada consulta.
A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa após a recuperação de um conjunto inicial de documentos candidatos.
Classificar documentos
Classificação | US$ 1,00 por 1.000 consultas |
---|
Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso em que mais de 100 documentos são especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
Por exemplo:
132 documentos para classificação = 2 consultas
200 documentos para classificação = 2 consultas
399 documentos para classificar = 4 consultas
401 documentos para classificação = 5 consultas
A seguir
- Leia a documentação do Vertex AI Agent Builder.
- Use a calculadora de preços.