Preços do Vertex AI Agent Builder
Os preços são indicados em dólares americanos (US$).
Os preços dos recursos em disponibilidade geral (GA) listados serão aplicados a partir de 1º de setembro de 2023.
O Vertex AI Agent Builder permite que os desenvolvedores, mesmo aqueles com habilidades limitadas de machine learning, aproveitem o poder dos grandes modelos de linguagem de fundação, da experiência em pesquisa e das tecnologias de IA de conversação do Google para criar aplicativos de IA generativa de nível empresarial
Créditos do teste e suporte
US$ 1.000 em créditos de teste GRÁTIS para uso com o Vertex AI Agent Builder. Esses créditos são válidos por um ano a partir do dia 18 de julho de 2023, quando a conta foi criada no Vertex AI Agent Builder.
Tem dúvidas sobre a funcionalidade do GA ou sobre a definição de pacotes e preços dos recursos de visualização?
Entre em contato com a equipe de vendas do Google Cloud para mais informações.
Preços dos Agentes da Vertex AI
O Vertex AI Agent Builder permite criar rapidamente agentes virtuais (chatbots) que geram respostas com base no conteúdo (site, documentos) que você inclui em repositórios de dados. Com os Vertex AI Agents, você pode criar um novo agente virtual do Dialogflow CX OU adicionar o recurso a um agente virtual do Dialogflow CX.
Para adicionar mais recursos de IA generativa aos seus agentes virtuais do Dialogflow CX, você pode usar os fallbacks generativos, que usam um modelo de linguagem grande (LLM) para lidar com cenários em que não há correspondência com a intenção do usuário. Os geradores permitem que os criadores de bots injetem ações generativas em qualquer lugar do fluxo de conversação, seja para resumir uma conversa, personalizar uma interação ou encadear várias chamadas de LLM para criar um fluxo de trabalho generativo completo.
Preços da funcionalidade GA do Vertex AI Agents
Chat dos agentes da Vertex AI* | US$ 12,00 / 1.000 consultas** |
---|---|
Voz dos Agentes da Vertex AI* | US$ 0,002 / segundo† |
Chat do Dialogflow CX***(recursos de IA padrão e não generativa para o Chat) | US$ 7,00 / 1.000 consultas** |
Voz do Dialogflow CX***(recursos de IA padrão e não generativa para voz) | US$ 0,001 / s† |
*Todos os recursos de IA generativa: agentes do Data Store, soluções de fallback generativas, geradores e apps de agente estão incluídos nos preços das SKUs de chat e voz dos agentes da Vertex AI. Se você usar vários tipos de recursos de IA generativa em uma única solicitação, será cobrado separadamente por cada recurso de acordo com o uso. *Os clientes podem combinar consultas/segundos do Dialogflow CX (não generativas) e da Vertex AI para Agentes (generativas) no mesmo agente ou fluxo e serão cobrados automaticamente pelo uso real de cada conjunto de recursos. Isso permite que você use a IA generativa de forma seletiva, quando aplicável, e pague apenas pelo que realmente usar. **Request (ou Query): faturamento medido por Request ou Query individual. Uma solicitação ou consulta é definida como qualquer chamada de API para o serviço do Dialogflow ou do Vertex AI Agents, seja direta com o uso da API ou indireta com a integração ou o uso do console. Por exemplo, um usuário faz uma pergunta a um agente virtual (chatbot) e o chatbot responde. Isso é 1 solicitação. Uma interação do usuário com o chatbot pode ser composta por várias solicitações para realizar uma tarefa. † Inclui reconhecimento de fala, conversão de voz em texto (STT), síntese de fala, conversão de texto em voz (TTS) e telefonia. A duração total do processamento de áudio faturado é independente de qualquer processamento não áudio sem cobrança (latência da API, processamento de webhook etc.) que possa ocorrer antes, durante ou após o processamento de áudio. * O Dialogflow CX Chat e o Dialogflow CX Voice não são elegíveis para os créditos de teste GRÁTIS de US $1.000. O Dialogflow CX tem um programa adicional de créditos de teste que pode ser combinado com este programa de créditos de teste GRÁTIS do Vertex AI Agent Builder. Confira mais definições de medição do Dialogflow CX aqui. |
Exemplo de preços para o recurso GA do Vertex AI Agents
Exemplo de mistura de respostas baseadas em intenção e generativas: suporte ao cliente no site
- Fluxos deterministas baseados em intenção são usados para algumas perguntas específicas do cliente (faturamento, pagamento)
- Respostas generativas usadas para tratar perguntas em que não há intenção definida, mas a resposta está no site
Considerações:
- 100 milhões de visitas anuais ao site
- 5% dos visitantes usam o chatbot, 3 consultas por uso, 50% generativo, 50% baseado em intenção
Volume de SKU | Taxa | Preço de tabela total |
---|---|---|
Chat do Dialogflow CX (com base em intenção) | ||
7,5 milhões anuais 100 milhões*5% de uso*3 consultas*50% com base em intenção |
* US$ 7,00 / 1.000 consultas = | US$ 52.500 |
Chat do Dialogflow CX Enterprise (generativo) | ||
7,5 milhões anuais 100M*5% de uso*3 consultas*50% generativo |
* US$ 12,00 / 1.000 consultas = | USD 90.000 |
Dados indexados | ||
50 GB por ano 10 GB livres, então 40 GB usados na cálculo de preço |
* US$ 5,00 / GB * 12 meses = | US$ 2.400 |
Preços da Vertex AI para Pesquisa
O Vertex AI Agent Builder permite criar rapidamente mecanismos de pesquisa para sites, dados não estruturados e dados estruturados para recuperar informações e gerar respostas fundamentadas. Saiba mais sobre os recursos disponíveis na Vertex AI para Pesquisa.
Preços da funcionalidade de pesquisa GA da Vertex AI
Edição Padrão da Rede de pesquisa | US$ 2,00 / 1.000 consultas | |
---|---|---|
Enterprise Search | US$ 4,00 / 1.000 consulta | |
Complemento LLM (pode ser adicionado à Standard Edition e à Enterprise Edition) |
Básico | +US$4,00 / 1.000 consulta de entrada do usuário |
Avançado | +US$10,00 / 1.000 consulta de entrada de usuário | |
Search Standard Edition: recursos de pesquisa não estruturada Search Enterprise Edition: recursos de pesquisa não estruturada + pesquisa de site Complemento básico do LLM: fornece respostas e resumos para consultas simples de um ou vários turnos, com capacidade de processar consultas simples, compostas, longas e de vários turnos, com suporte a modelos como TextBison, Gemini 1.0 Series e Gemini 1.5 Flash (Link). Cobramos por número de consultas de entrada do usuário, não por número de saltos. Preview particular – Pesquisa estruturada + novos recursos de IA generativa (entre em contato com as vendas para saber mais sobre os recursos mais recentes) Consulta: faturamento medido por solicitação ou entrada de consulta individual Uma solicitação ou consulta é definida como qualquer chamada de API para a Pesquisa corporativa, seja direta com o uso da API ou indireta com a integração ou o uso do console. Por exemplo, quando um usuário faz uma pergunta em linguagem natural e o mecanismo de pesquisa responde, isso é uma consulta. O complemento LLM é adicionado a uma consulta para aprimorar o processamento e usar um recurso de IA generativa. O complemento LLM pode ser usado de forma intercambiável com o Search Standard Edition ou o Search Enterprise Edition. Exemplo: executar uma consulta do Search Enterprise com uma solicitação de resumo = 1 consulta de pesquisa corporativa + 1 consulta de complemento do LLM |
Exemplo de preço para a funcionalidade GA da Vertex AI para Pesquisa
Exemplo de dados não estruturados : pesquisa de documentos
Suposição:
- 10 milhões de consultas na Standard Edition por ano
- 10 milhões de consultas da edição Enterprise com 10 milhões de consultas de resumo do LLM anualmente
- 100 mil documentos de ~1 MB cada
Volume de SKU | Taxa | Preço de tabela total |
---|---|---|
Pesquisa padrão | ||
10 milhões/ano | * US$ 2,00 / 1.000 consultas = | US$ 20.000 |
Pesquisa corporativa | ||
10 milhões/ano | * US$ 4,00 / 1.000 consultas = | USD 40.000 |
Complemento LLM básico do Search Cada consulta adicionada a uma consulta Standard ou Enterprise |
||
10 milhões/ano | * +US$4,00 / 1.000 consultas de entrada do usuário = | Mais de US$40.000 |
Complemento LLM de pesquisa avançada Cada consulta adicionada a uma consulta Standard ou Enterprise |
||
10 milhões/ano | * +US$10,00 / 1.000 consultas de entrada do usuário = | Mais de US$100.000 |
Dados indexados | ||
100 GB por ano 10 GB gratuitos, portanto 90 GB usados na cálculo de preço | * US$ 5,00 / GB * 12 meses = | US$ 5.400 |
Preços do Data Index
Preços do armazenamento de dados de índice do Vertex AI Agent Builder
Dados indexados | US$ 5,00 / GiB por mês |
---|---|
* Cota gratuita de 10 GiB por mês fornecida ** Compartilhado entre a Vertex AI Agent Builder *** O armazenamento é calculado como 500 kibibytes (KiB) * "número de páginas no site", em que 1 KiB é igual a 1.024 bytes. (500 KiB é ~0,000477 GiB; portanto, a indexação de dados preço para um site com 1.000 páginas é US $2,38 ao mês.) |
Preços da Vertex AI para Pesquisa no setor de saúde
A Vertex AI para Pesquisa de Saúde permite criar rapidamente mecanismos de pesquisa ajustados para dados de saúde.
Pesquisa da Healthcare | US$ 20,00 / 1.000 consulta |
---|
A Vertex AI para Pesquisa na Saúde inclui alguns recursos em visualização prévia, como respostas de IA generativa, atualizações de streaming no índice e outros. Esses recursos podem ter preços diferentes do valor listado atualmente quando forem lançados para disponibilidade geral.
Exemplo de preço para a Pesquisa em Saúde
Suposição:
1.000.000 solicitações de pesquisa de saúde por mês
1.000 GiB de dados de saúde indexados
Volume de SKU | Taxa | Preço de tabela total |
---|---|---|
1.000.000 pesquisas | US$ 20/1.000 | US$ 20.000 |
1.000 GiB | US$ 5/GiB | US$ 5.000 |
Preços da Vertex AI para Pesquisa em mídia
Com a Vertex AI para mídia, você pode oferecer resultados de vídeo altamente relevantes, aproveitando a consulta e o entendimento contextual do Google para melhorar a descoberta no seu site de mídia.
Vertex AI Agent Builder: índice de dados | US$ 5,00 / GB por mês |
---|---|
Vertex AI para Pesquisa: contagem de solicitações da API Media Search | US$ 2,00 / 1.000 consultas |
Preços da Vertex AI para Pesquisa em Recomendações de mídia
As únicas operações do Media Recommendations que geram cobranças são treinar, ajustar ou solicitar previsões chamando o método recommend. Não há custo para importar ou gerenciar eventos do usuário ou informações de documentos.
Os custos de treinamento (nós por hora) serão cobrados diariamente se o modelo estiver treinando ativamente ou se você tiver enviado uma solicitação para retomar o treinamento. Depois que você pausar ou excluir um modelo, não haverá mais cobranças. Consulte a documentação sobre como gerenciar treinamentos.
Os custos de ajuste (nós por hora) para modelos ativos são cobrados depois que o ajuste é concluído. Você só será cobrado por um ajuste incompleto se pausar ou excluir um modelo durante um ajuste em andamento. Nesse caso, você será cobrado pelas horas de uso do nó consumidas antes do ajuste do modelo ser interrompido. Consulte a documentação sobre como gerenciar ajustes.
Solicitações de previsão por mês | Preço por 1.000 previsões |
---|---|
Até 20.000.000 | US$ 0,27 |
Próximos 280.000.000 | US$ 0,18 |
Após 300.000.000 | US$ 0,10 |
Recurso | Preço |
Treinamento e ajuste | US$ 2,50 por nó/hora |
Exemplo de preço para recomendações de mídia
Suposição:
1.000.000.000 solicitações de previsão por mês
Treina um modelo por dia, que faz novo treino automaticamente uma vez por dia
equivale a aproximadamente 500 horas de uso do nó com treinamento de modelo e 100 horas de ajuste de modelo por mês
Volume de SKU | Taxa | Preço de tabela total |
---|---|---|
Primeiras 20 milhões de previsões | * US$ 0,27 / 1.000 previsões = | US$ 5.400 |
Próximos 280 milhões de previsões | * US$ 0,18 / 1.000 previsões = | US$ 50.400 |
Próximas 700 milhões de previsões | * US$ 0,10 / 1.000 previsões = | US$ 70.000 |
500 horas de uso de nós (Treinamento) | * US$ 2,50 / hora = | US$ 1.250 |
100 horas de uso de nós (ajuste) | * US$ 2,50 / hora = | US$ 250,00 |
Total | US$ 127.300 |
Cobranças do Google Cloud Observability
O Media Recommendations registra um erro na Observabilidade do Google Cloud para cada solicitação de API que resulta em um erro, como uma solicitação de evento do usuário que contém JSON malformado ou uma solicitação de importação de documento com um preço negativo. O Media Recommendations também registra um erro para cada solicitação de previsão com um documento que não está no datastore importado.
O Google Cloud Observability cobra pelo GiB de registros armazenados e pela retenção além do período de armazenamento padrão. Para detalhes sobre a cota gratuita e a retenção de dados, consulte a página de preços do Google Cloud Observability.
O tamanho dos dados de criação de registros depende do payload JSON, mas um GiB seria de aproximadamente 200.000 erros do Media Recommendations.
Preços da API Grounded Generation
Com a API Grounded Generation, é possível criar respostas generativas para seus prompts usando informações da Pesquisa Google ou seus próprios dados.
Comando de entrada (inclui comando do usuário, instruções do sistema e informações de contexto) | Cobrado pelo preço do modelo Gemini selecionado. |
Saída | Cobrado pelo preço do modelo Gemini selecionado. |
Geração com base nos seus próprios dados recuperados | US$ 2,50 / 1.000 solicitações |
Geração com embasamento para embasamento na Pesquisa Google | Consulte Embasamento na Pesquisa Google. |
As taxas adicionais para recuperação de dados são determinadas pelo sistema de recuperação selecionado (por exemplo, Vertex AI para Pesquisa). |
Exemplo 1: fundamentação na Vertex AI para Pesquisa e fatos de fundamentação inline
O usuário usa a Vertex AI para Pesquisa e outros fatos de embasamento para gerar respostas fundamentadas. Cada comando de entrada tem 2.500 caracteres (incluindo fatos de fundamentação inline) e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.
Volume por solicitação | Preço por mil solicitações | |
---|---|---|
Comando de entrada | 2.500 caracteres | 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 2.500 caracteres por solicitação = US$0,3125 por 1.000 solicitações |
Saída | 200 caracteres | 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 2 caracteres por solicitação = US$0,075 por 1.000 solicitações |
Geração com base nos seus próprios dados recuperados | 1 solicitação | US$2,50 por 1.000 solicitações |
Recuperação de dados: Vertex AI para Pesquisa (edição Enterprise) | 1 solicitação | US$4,00 por 1.000 solicitações |
Total: US$ 6,8875 por 1.000 solicitações |
Exemplo 2: uso da Pesquisa Google
O usuário usa a Pesquisa Google para gerar respostas fundamentadas. Cada comando de entrada tem 500 caracteres e cada comando de saída tem 200 caracteres. O usuário selecionou o Gemini 1.5 Flash.
Volume por solicitação | Preço por mil solicitações | |
---|---|---|
Comando de entrada | 500 caracteres | 1.000 solicitações * US$ 0,000125 por 1.000 caracteres * 500 caracteres por solicitação = US$0,0625 por 1.000 solicitações |
Saída | 200 caracteres | 1.000 solicitações * US$ 0,000375 por 1.000 caracteres * 200 caracteres por solicitação = US$0,075 por 1.000 solicitações |
Geração com embasamento para embasamento na Pesquisa Google | 1 solicitação | US$35,00 por 1.000 solicitações |
Total: US$ 35,1375 por 1.000 solicitações |
Confira os preços da API Grounding
A verificação de embasamento permite determinar o quão embasado um texto (a resposta candidata) está em um determinado conjunto de textos de referência (os fatos).
Verificar aterramento | US$ 0,00075 por 1.000 caracteres de resposta |
Preços dos recursos da Document AI
Para informações completas sobre os preços de todos os recursos da Document AI, consulte a página de preços da Document AI.
Para os recursos da Document AI integrados e faturados pela Vertex AI para Pesquisa, consulte as tabelas abaixo.
Digitalizar texto
Processador | 1 a 5.000.000 páginas/mês * | A partir de 5.000.001 páginas/mês |
---|---|---|
Processador Enterprise Document OCR | US$ 1,50 a cada 1.000 páginas | US$ 0,60 por 1.000 páginas |
Extraia estruturas e entidades de documentos
Analisador de layout (inclui o agrupamento inicial) | US$ 10 por 1.000 páginas |
*O tamanho de uma página depende do formato do arquivo.
Imagens (JPEG/JPG, PNG, BMP, HEIF): cada imagem = 1 página
PDF: cada página no PDF = 1 página
TIFF: cada imagem no TIFF = 1 página
Word (DOCX): até 3.000 caracteres = 1 página
Excel (XLSX): cada guia = 1 página
PowerPoint (PPTX): cada slide = 1 página
HTML: até 3.000 caracteres = 1 página
Documentos analisados: até 3.000 caracteres = 1 página
Preços da API Ranking
A API de classificação recebe uma lista de documentos e os classifica novamente com base na relevância deles para uma consulta.
Em comparação com os embeddings, que consideram apenas a similaridade semântica de um documento e de uma consulta, a API de classificação pode fornecer pontuações precisas sobre o quanto um documento responde a uma consulta específica.
A API de classificação pode ser usada para melhorar a qualidade dos resultados da pesquisa depois de recuperar um conjunto inicial de documentos candidatos.
Classificar documentos
Classificação | US$ 1 por 1.000 consultas |
---|
Uma consulta é definida como tendo até 100 documentos, embora um usuário possa especificar mais de 100 documentos por consulta. No caso de mais de 100 documentos especificados, o preço aumenta em 1 para cada múltiplo de 100 documentos.
Por exemplo:
132 documentos para classificar = 2 consultas
200 documentos para classificar = 2 consultas
399 documentos para classificar = 4 consultas
401 documentos para classificar = 5 consultas
A seguir
- Leia a documentação do Vertex AI Agent Builder.
- Use a calculadora de preços.