Aprimorar as transformações do RAG

Depois que um documento é ingerido, o Vertex AI RAG Engine executa um conjunto de transformações para preparar os dados para indexação. É possível controlar seus casos de uso usando os seguintes parâmetros:

Parâmetro Descrição
chunk_size Quando os documentos são ingeridos em um índice, eles são divididos em partes. O parâmetro chunk_size (em tokens) especifica o tamanho do bloco. O tamanho do bloco padrão é de 1.024 tokens.
chunk_overlap Por padrão, os documentos são divididos em blocos com uma certa quantidade de sobreposição para melhorar a relevância e a qualidade de recuperação. A sobreposição de blocos padrão é de 200 tokens.

Um tamanho de bloco menor significa que os embeddings são mais precisos. Um tamanho de bloco maior significa que os embeddings podem ser mais gerais, mas podem perder detalhes específicos.

Por exemplo, se você converter 1.000 palavras em uma matriz de incorporação destinada a 200 palavras, poderá perder detalhes. A capacidade de incorporação é fixa para cada bloco. Um bloco grande de texto pode não caber em um modelo de janela pequena.

A seguir