A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Nesta página, descrevemos os preços e o faturamento do mecanismo RAG da Vertex AI com base nos componentes usados, como modelos, reclassificação e armazenamento de vetores.
O mecanismo de RAG da Vertex AI pode ser usado sem custos financeiros. No entanto, se você configurar os componentes do mecanismo RAG da Vertex AI, o faturamento poderá ser afetado.
Esta tabela explica como funciona o faturamento ao usar os componentes de RAG.
Componente
Como funciona o faturamento com o mecanismo de RAG da Vertex AI
O mecanismo de RAG da Vertex AI permite ingerir dados de diferentes fontes. Por exemplo, fazer upload de arquivos locais, do Cloud Storage e do Google Drive. O acesso a arquivos nessas fontes de dados pelo mecanismo RAG da Vertex AI é gratuito, mas elas podem cobrar pela transferência de dados. Por exemplo, custos de saída de dados.
Analisador de LLM: o mecanismo RAG da Vertex AI usa o modelo de LLM especificado para analisar seu arquivo. Os custos do modelo de LLM aparecem e são pagos diretamente do seu projeto.
Analisador de layout da Document AI: o mecanismo de RAG da Vertex AI usa o analisador de layout da Document AI especificado para processar seu arquivo. O uso dele vai aparecer e ser cobrado diretamente no seu projeto.
O mecanismo RAG da Vertex AI organiza a geração de embeddings usando o modelo especificado, e seu projeto é cobrado pelos custos associados a esse modelo.
O mecanismo RAG oferece suporte a duas categorias de bancos de dados de vetores para pesquisa vetorial:
Banco de dados gerenciado por RAG
Use seu próprio banco de dados de vetores
Um banco de dados gerenciado por RAG tem duas finalidades:
Um banco de dados gerenciado pela RAG armazena recursos da RAG, como corpus e arquivos da RAG. O conteúdo do arquivo é excluído.
De acordo com sua escolha, indexação e
recuperação de embeddings para pesquisa vetorial.
Um banco de dados gerenciado por RAG usa uma instância do Spanner como back-end.
Para cada um dos seus projetos, o mecanismo de RAG da Vertex AI provisiona um projeto Google Cloud específico do cliente e gerencia recursos gerenciados pela RAG armazenados no mecanismo de RAG da Vertex AI, para que seus dados sejam isolados fisicamente.
Se você escolher o nível básico RagManagedDB ou o nível escalonado, o mecanismo RAG da Vertex AI vai provisionar uma instância da edição Enterprise do Spanner no projeto correspondente:
Nível básico: 100 unidades de processamento com backup
Nível escalonado: começa com 1 nó (1.000 unidades de processamento) e faz escalonamento automático para até 10 nós com backup.
Se algum corpus de RAG no seu projeto usar um banco de dados gerenciado por RAG para a pesquisa vetorial, você vai receber uma cobrança pela instância do Spanner gerenciada por RAG.
O mecanismo de RAG da Vertex AI mostra os custos do Spanner do projeto gerenciado por RAG correspondente no seu projeto Google Cloud para que você possa ver e pagar os custos da instância do Spanner.
Para mais detalhes sobre os preços do Spanner, consulte Preços do Spanner.
As seguintes ferramentas de classificação são compatíveis após a recuperação:
LLM Reranker: o mecanismo de RAG da Vertex AI usa o
modelo de LLM especificado para reclassificar os resultados da recuperação, e você
vai ver e pagar os custos do modelo de LLM diretamente do seu projeto.
API Vertex AI Search Ranking:
o mecanismo RAG da Vertex AI usa a
API Vertex AI Search Ranking para reclassificar os resultados
da recuperação. Você vai ver e pagar pela API Ranking diretamente do seu projeto.
A seguir
Para saber como usar o SDK da Vertex AI para executar tarefas do mecanismo de RAG da Vertex AI, consulte Início rápido da RAG para Python.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-04 UTC."],[],[],null,["# Vertex AI RAG Engine billing\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page describes the Vertex AI RAG Engine pricing and billing based on the Vertex AI RAG Engine components you use, such as models, reranking, and vector storage.\n\nFor more information, see the [Vertex AI RAG Engine overview](/vertex-ai/generative-ai/docs/rag-engine/rag-overview) page.\n\nPricing and billing\n-------------------\n\nVertex AI RAG Engine is free to use. However, if you configure\nVertex AI RAG Engine components, the billing might be affected.\n\nThis table explains how billing works when you use the RAG components.\n\nWhat's next\n-----------\n\n- To learn how to use the Vertex AI SDK to run Vertex AI RAG Engine tasks, see [RAG quickstart for\n Python](/vertex-ai/generative-ai/docs/rag-quickstart).\n- To learn about grounding, see [Grounding\n overview](/vertex-ai/generative-ai/docs/grounding/overview).\n- To learn more about the responses from RAG, see [Retrieval and Generation Output of Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/model-reference/rag-output-explained).\n- To learn about the RAG architecture:\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and Vector Search](/architecture/gen-ai-rag-vertex-ai-vector-search)\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and AlloyDB for PostgreSQL](/architecture/rag-capable-gen-ai-app-using-vertex-ai)."]]