Embasar respostas usando RAG

O embasamento é uma técnica que pode ser usada para produzir respostas de modelos mais confiáveis, úteis e factuais. Ao embasar as respostas do modelo de IA generativa, você as conecta a fontes verificáveis de informações. Para implementar o embasamento, geralmente é necessário recuperar dados de origem relevantes. A prática recomendada é usar a técnica de geração aumentada de recuperação (RAG, na sigla em inglês). A recuperação geralmente é feita usando um mecanismo de pesquisa, que usa um índice que incorpora os significados semânticos do texto de origem.

Também há serviços e APIs de componentes que implementam o ciclo de vida da RAG, como a API Vertex AI Search Builder, que permite a criação de combinações e correspondências. Ao criar combinações e correspondências, é possível implementar uma solução de RAG usando qualquer um dos seguintes serviços ou APIs:

  • API de geração de embasamento: pode ser usada para implementar o embasamento ou vincular a um provedor de recuperação para o ciclo de vida completo de RAG.
  • Analisador de layout de documentos: esse analisador representa o melhor da Document AI e do Gemini para a compreensão de documentos.
  • Vertex AI Vector Search: esse serviço de pesquisa é de alto desempenho e usa um banco de dados vetorial de alta qualidade.
  • API de verificação de embasamento: essa API compara a saída da RAG com os fatos recuperados e ajuda a garantir que todas as informações sejam embasadas antes de retornar a resposta ao usuário.

A seguir