Embasar respostas usando RAG

O embasamento é uma técnica que pode ser usada para produzir respostas de modelos mais confiáveis, úteis e factuais. Ao embasar as respostas do modelo de IA generativa, você as conecta a fontes verificáveis de informações. Para implementar o embasamento, geralmente é necessário recuperar dados de origem relevantes. A prática recomendada é usar a técnica de geração aumentada de recuperação (RAG, na sigla em inglês). A recuperação geralmente é feita usando um mecanismo de pesquisa, que usa um índice que incorpora os significados semânticos do texto de origem.

Também há serviços e APIs de componentes que implementam o ciclo de vida da RAG, como a API Vertex AI Search Builder, que permite a criação de combinações e correspondências. Ao criar combinações e correspondências, é possível implementar uma solução de RAG usando qualquer um dos seguintes serviços ou APIs:

  • API de geração de embasamento: pode ser usada para implementar o embasamento ou vincular a um provedor de recuperação para o ciclo de vida completo de RAG.
  • Analisador de layout de documentos: esse analisador representa o melhor da Document AI e do Gemini para a compreensão de documentos. Para mais informações sobre o analisador de layout, consulte Usar o analisador de layout.
  • Vertex AI Vector Search: esse serviço de pesquisa é de alto desempenho e usa um banco de dados vetorial de alta qualidade.
  • API de verificação de embasamento: essa API compara a saída da RAG com os fatos recuperados e ajuda a garantir que todas as informações sejam embasadas antes de retornar a resposta ao usuário.

Embasar respostas usando o mecanismo de RAG da Vertex AI

Para embasar respostas usando o mecanismo de RAG da Vertex AI, crie um comando. Faça o seguinte:

  1. No console Google Cloud , acesse a página Criar comando usando o Vertex AI Studio.

    Acessar "Criar comando"

  2. Selecione Embasamento: seus dados.

  3. Selecione a fonte de embasamento do mecanismo RAG.

  4. Na lista Corpus, selecione o nome do seu corpus.

  5. No campo Similaridade do Top-K, selecione 20, que é o padrão.

  6. Clique em Salvar.

A seguir