Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Depois que um documento é ingerido, o Vertex AI RAG Engine executa um conjunto de transformações para
preparar os dados para indexação. É possível controlar seus casos de uso usando os
seguintes parâmetros:
Parâmetro
Descrição
chunk_size
Quando os documentos são ingeridos em um índice, eles são divididos em partes. O parâmetro chunk_size (em tokens) especifica o tamanho do bloco. O tamanho do bloco padrão é de 1.024 tokens.
chunk_overlap
Por padrão, os documentos são divididos em blocos com uma certa quantidade de sobreposição para melhorar a relevância e a qualidade de recuperação. A sobreposição de blocos padrão é de 200 tokens.
Um tamanho de bloco menor significa que os embeddings são mais precisos. Um tamanho de bloco maior
significa que os embeddings podem ser mais gerais, mas podem perder detalhes específicos.
Por exemplo, se você converter 1.000 palavras em uma matriz de incorporação destinada
a 200 palavras, poderá perder detalhes. A capacidade de incorporação é fixa para cada
bloco. Um bloco grande de texto pode não caber em um modelo de janela pequena.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-02-01 UTC."],[],[]]