Sobre a pesquisa vetorial

O Memorystore para Redis oferece suporte para armazenamento e consulta de dados vetoriais. Esta página oferece informações sobre a pesquisa de vetor no Memorystore para Redis.

A pesquisa de vetores no Memorystore para Redis é compatível com o framework LLM de código aberto LangChain. Usar a pesquisa de vetores com o LangChain permite criar soluções para os seguintes casos de uso:

  • Geração aumentada de recuperação (RAG)
  • Cache LLM
  • Mecanismo de recomendação
  • Pesquisa semântica
  • Pesquisa de similaridade de imagens

A vantagem de usar o Memorystore para armazenar seus dados de IA geral, em vez de outros bancos de dados do Google Cloud, é a velocidade do Memorystore. A pesquisa vetorial no Memorystore para Redis aproveita consultas com vários threads, resultando em alta taxa de transferência de consulta (QPS) com baixa latência.

O Memorystore também oferece duas abordagens de pesquisa distintas para ajudar você a encontrar o equilíbrio certo entre velocidade e precisão. A opção HNSW (Hierarchical Navigable Small World) oferece resultados rápidos e aproximados, o que é ideal para grandes conjuntos de dados em que uma correspondência próxima é suficiente. Se você precisar de precisão absoluta, a abordagem "FLAT" vai produzir respostas exatas, mas pode levar um pouco mais de tempo para processar.

Se você quiser otimizar seu aplicativo para as velocidades de leitura/gravação de dados vetoriais mais rápidas, o Memorystore para Redis provavelmente é a melhor opção.