Esta página foi traduzida pela API Cloud Translation.

Aprimorar as transformações do RAG

Depois que um documento é ingerido, o Vertex AI RAG Engine executa um conjunto de transformações para preparar os dados para indexação. É possível controlar seus casos de uso usando os seguintes parâmetros:

Parâmetro	Descrição
`chunk_size`	Quando os documentos são ingeridos em um índice, eles são divididos em partes. O parâmetro `chunk_size` (em tokens) especifica o tamanho do bloco. O tamanho do bloco padrão é de 1.024 tokens.
`chunk_overlap`	Por padrão, os documentos são divididos em blocos com uma certa quantidade de sobreposição para melhorar a relevância e a qualidade de recuperação. A sobreposição de blocos padrão é de 200 tokens.

Um tamanho de bloco menor significa que os embeddings são mais precisos. Um tamanho de bloco maior significa que os embeddings podem ser mais gerais, mas podem perder detalhes específicos.

Por exemplo, se você converter 1.000 palavras em uma matriz de incorporação destinada a 200 palavras, poderá perder detalhes. A capacidade de incorporação é fixa para cada bloco. Um bloco grande de texto pode não caber em um modelo de janela pequena.

A seguir

Use o analisador de layout do Document AI com o mecanismo de RAG da Vertex AI.