Memorystore for Valkey supporta l'archiviazione e l'esecuzione di query sui dati vettoriali. Questa pagina fornisce informazioni sulla ricerca vettoriale su Memorystore for Valkey.
La ricerca vettoriale su Memorystore for Valkey è compatibile con l'LLM open source LangChain. L'utilizzo della ricerca vettoriale con LangChain ti consente di creare soluzioni per quanto segue: casi d'uso:
- Retrieval Augmented Generation (RAG)
- Cache LLM
- Motore per suggerimenti
- Ricerca semantica
- Ricerca di somiglianze di immagini
Il vantaggio di utilizzare Memorystore per archiviare i dati di IA generativa, anziché ad altri database Google Cloud è la velocità di Memorystore. Vettore su Memorystore for Valkey sfrutta le query multi-thread, ottenendo un'elevata velocità effettiva di query (QPS) a bassa latenza.
Memorystore offre anche due diversi approcci di ricerca per aiutarti a trovare il giusto equilibrio tra velocità e accuratezza. L'opzione HNSW (Hierarchical Navigable Small World) offre risultati rapidi e approssimativi, ideale per set di dati di grandi dimensioni in cui è sufficiente una corrispondenza molto ravvicinata. Se hai bisogno di una precisione assoluta, il parametro "FLAT" produce risposte esatte, anche se l'elaborazione potrebbe richiedere un po' più di tempo.
Se vuoi ottimizzare la tua applicazione per le velocità di lettura e scrittura dei dati vettoriali più elevate, Memorystore for Valkey è probabilmente la scelta migliore per te.