In der interaktiven Demo zur Vektorsuche können Sie die Leistungsfähigkeit der modernen Vektorsuchtechnologie erleben. Anhand von echten Datensätzen bietet die Demo ein realistisches Beispiel, anhand dessen Sie die Funktionsweise der Vektorsuche kennenlernen, die semantische und hybride Suche erkunden und das Reranking in Aktion sehen können. Reichen Sie eine kurze Beschreibung eines Tieres, einer Pflanze, eines E-Commerce-Artikels oder eines anderen Artikels ein und lassen Sie die Vektorsuche den Rest erledigen.
Testen!
Probieren Sie die verschiedenen Optionen in der Demo aus, um einen Vorsprung bei der Vektorsuche zu erhalten und die Grundlagen der Vektorsuchtechnologie zu verstehen.
So führen Sie den Befehl aus:
Beschreiben Sie im Textfeld Abfrage die Elemente, nach denen Sie suchen möchten (z. B.
vintage 1970s pinball machine
). Alternativ können Sie auf Abfrage generieren klicken, um eine Beschreibung automatisch generieren zu lassen.Klicken Sie auf Senden.
Weitere Informationen zu den Funktionen der Demo finden Sie unter Benutzeroberfläche.
Benutzeroberfläche
In diesem Abschnitt werden die Einstellungen in der Benutzeroberfläche beschrieben, mit denen Sie die Ergebnisse der Vector Search steuern und deren Reihenfolge festlegen können.
Dataset
Wählen Sie im Drop-down-Menü Dataset aus, für welches Dataset die Abfrage in Vector Search ausgeführt werden soll. Weitere Informationen zu den einzelnen Datasets finden Sie unter Datasets.
Abfrage
Fügen Sie dem Feld Suchanfrage eine Beschreibung oder ein oder mehrere Keywords hinzu, um anzugeben, welche Elemente Vector Search finden soll. Alternativ können Sie auf Abfrage generieren klicken, um eine Beschreibung automatisch generieren zu lassen.
Ändern
Es gibt mehrere Optionen, mit denen Sie die Ergebnisse der Vector Search ändern können:
Klicken Sie auf Zeilen und wählen Sie die maximale Anzahl der Suchergebnisse aus, die von Vector Search zurückgegeben werden sollen.
Wählen Sie Dicht einbetten aus, wenn die Vektorsuche semantisch ähnliche Ergebnisse zurückgeben soll.
Wählen Sie Sparse Einbettungen verwenden aus, wenn die Vektorsuche Ergebnisse basierend auf der Textsyntax Ihrer Suchanfrage zurückgeben soll. Nicht alle verfügbaren Datensätze unterstützen Modelle mit spärlichen Einbettungen.
Wählen Sie sowohl Dicht besetzende Einbettungen verwenden als auch Dünn besetzende Einbettungen verwenden aus, wenn die Vektorsuche die Hybridsuche verwenden soll. Dieses Modell wird nicht von allen Datensätzen unterstützt. Bei der Hybridsuche werden Elemente aus dichten und dünnbesetzten Einbettungen kombiniert, um die Qualität der Suchergebnisse zu verbessern. Weitere Informationen finden Sie unter Hybridsuche.
Geben Sie im Feld RRF Alpha einen Wert zwischen 0,0 und 1,0 ein, um den RRF-Rankingeffekt anzugeben.
Wenn Sie die Suchergebnisse neu sortieren möchten, wählen Sie im Drop-down-Menü Neu sortieren die Option ranking_api aus. Wenn Sie die Funktion deaktivieren möchten, wählen Sie Kein aus.
Messwerte
Nach dem Ausführen einer Abfrage werden Ihnen Latenzmesswerte angezeigt, die Aufschluss über die Zeit geben, die für die verschiedenen Suchphasen benötigt wurde.
Abfrageprozess
Bei der Verarbeitung einer Abfrage geschieht Folgendes:
Generierung von Suchanfrage-Embeddings:Für den angegebenen Suchanfragetext wird eine Einbettung generiert.
Vektorsuchabfrage:Die Abfrage wird mit dem Vektorsuchindex ausgeführt.
Abruf aus dem Vertex AI Feature Store:Features wie Artikelname, Beschreibung oder Bild-URL werden anhand der Liste der Artikel-IDs aus der Vektorsuche aus dem Vertex AI Feature Store gelesen.
Neuer Rang: Die abgerufenen Elemente werden über Ranking-APIs sortiert, die den Suchtext, den Artikelnamen und die Artikelbeschreibung verwenden, um den Relevanzwert zu berechnen.
Einbettungen
Multimodal: Multimodale semantische Suche anhand von Artikelbildern. Weitere Informationen finden Sie im Blogpost What is Multimodal Search: 'LLMs with vision' change businesses.
Text (semantische Ähnlichkeit): Semantische Textsuche anhand der semantischen Ähnlichkeit von Artikelnamen und ‑beschreibungen. Weitere Informationen finden Sie unter Vertex AI Embeddings for Text: LLMs fundieren leicht gemacht.
Text (Frage-Antwort-System): Semantische Textsuche in Artikelnamen und ‑beschreibungen mit verbesserter Suchqualität durch den Aufgabentyp QUESTION_ANSWERING. Dies eignet sich für Anwendungen vom Typ „Fragen und Antworten“. Informationen zu Einbettungen für Aufgabentypen finden Sie unter Generative AI-Anwendung mit Vertex AI-Ebenen und Aufgabentypen optimieren.
Spärlich (Hybridsuche): Stichwortbasierte (tokenbasierte) Suche nach Artikelnamen und ‑beschreibungen, generiert mit dem TF-IDF-Algorithmus. Weitere Informationen finden Sie unter Hybridsuche.
Datasets
Die interaktive Demo enthält mehrere Datensätze, für die Sie Abfragen ausführen können. Datensätze unterscheiden sich voneinander durch das Einbettungsmodell, die Unterstützung für spärliche Einbettungen, die Einbettungsdimensionen und die Anzahl der gespeicherten Elemente.
Dataset | Einbettungsmodell | Modell mit dünn besetzten Einbettungen | Einbettungsdimensionen | Anzahl der Elemente |
---|---|---|---|---|
Mercari Multimodal + Sparse embeddings | Multimodale Einbettung | TF-IDF (Artikelname und -beschreibung) |
1408 | ~ 3 Millionen |
Mercari Text (semantische Ähnlichkeit) + spärliche Einbettungen | text-embedding-005 ) (Aufgabentyp: SEMANTIC_SIMILARITY) |
TF-IDF (Artikelname und -beschreibung) |
768 | ~ 3 Millionen |
Mercari Text (Frageantworten) + dünne Einbettungen | text-embedding-005 ) (Aufgabentyp: QUESTION_ANSWERING) |
TF-IDF (Artikelname und -beschreibung) |
768 | ~ 3 Millionen |
GBIF Flowers Multimodal + Sparse embeddings | Multimodale Einbettung | TF-IDF (Artikelname und -beschreibung) |
1408 | ~ 3,3 Millionen |
Multimodale Einbettungen von GBIF-Tieren | Multimodale Einbettung | – | 1408 | ~ 7 Millionen |
Nächste Schritte
Nachdem Sie sich mit der Demo vertraut gemacht haben, können Sie sich eingehender mit der Verwendung der Vektorsuche befassen.
Kurzanleitung:Mit einem Beispieldatensatz können Sie einen Index in weniger als 30 Minuten erstellen und bereitstellen.
Vorbereitung:Informieren Sie sich, wie Sie Einbettungen vorbereiten und die Art des Endpunkts festlegen, auf dem Sie Ihren Index bereitstellen möchten.