O embasamento é uma técnica que pode ser usada para produzir respostas de modelos mais confiáveis, úteis e factuais. Ao embasar as respostas do modelo de IA generativa, você as conecta a fontes verificáveis de informações. Para implementar o embasamento, geralmente é necessário recuperar dados de origem relevantes. A prática recomendada é usar a técnica de geração aumentada de recuperação (RAG, na sigla em inglês). A recuperação geralmente é feita usando um mecanismo de pesquisa, que usa um índice que incorpora os significados semânticos do texto de origem.
Também há serviços e APIs de componentes que implementam o ciclo de vida da RAG, como a API Vertex AI Search Builder, que permite a criação de combinações e correspondências. Ao criar combinações e correspondências, é possível implementar uma solução de RAG usando qualquer um dos seguintes serviços ou APIs:
- API de geração de embasamento: pode ser usada para implementar o embasamento ou vincular a um provedor de recuperação para o ciclo de vida completo de RAG.
- Analisador de layout de documentos: esse analisador representa o melhor da Document AI e do Gemini para a compreensão de documentos.
- Vertex AI Vector Search: esse serviço de pesquisa é de alto desempenho e usa um banco de dados vetorial de alta qualidade.
- API de verificação de embasamento: essa API compara a saída da RAG com os fatos recuperados e ajuda a garantir que todas as informações sejam embasadas antes de retornar a resposta ao usuário.
A seguir
- Para saber mais sobre IA responsável e filtros de segurança, consulte práticas recomendadas de IA responsável e os filtros de segurança da Vertex AI.
- Para saber mais sobre como a RAG é implementada pelo RAG Engine, consulte RAG Engine.