Abruf und Ranking

Auf dieser Seite wird beschrieben, wie Abruf und Ranking zusammenarbeiten, um relevante Suchergebnisse in Vertex AI Search-Apps zu liefern.

Übersicht

Kurz gesagt: Beim Abrufen werden relevante Dokumente gefunden, beim Ranking werden diese abgerufenen Dokumente sortiert. Das Ranking aller verfügbaren Dokumente kann rechenintensiv sein. Abruf und Ranking erfolgen daher sequenziell.

Zuerst wird die Anfrage vom Suchmodell verstanden und umformuliert. Anschließend ruft das Modell je nach verfügbaren Datenquellen und Anzahl der indexierten Dokumente in Ihrem Datenspeicher Tausende von Dokumenten ab. Den abgerufenen Dokumenten wird eine Relevanzbewertung zugewiesen.

Das Ranking-Modell sortiert dann die abgerufenen Dokumente und gibt die 400 Ergebnisse mit dem höchsten Ranking aus. Die folgende Abbildung zeigt, wie diese beiden Prozesse in den Suchworkflow passen.

Abrufen und Ranking in der Suche
Abbildung 1. Abruf und Ranking im Suchworkflow

Abrufmethoden

Beim Abrufen wird eine Teilmenge von Dokumenten aus Ihrem Datenspeicher ausgewählt, die für die Anfrage eines Nutzers relevant sind. Das Vertex AI Search-Modell verwaltet den Abruf für Ihre Suchanwendungen basierend auf verschiedenen Signalen, z. B. den folgenden, und weist Relevanzbewertungen zu:

  • Relevanz: Hierzu gehören Keyword-Abgleich, Knowledge Graphs und Websignale.

  • Einbettungen: Enthält Einbettungen, um konzeptionell ähnliche Inhalte zu finden.

  • Cross-Attention: Ermöglicht es einem Modell, die Beziehung zwischen einer Anfrage und einem Dokument zu berücksichtigen, um dem Dokument einen Relevanzwert zuzuweisen.

  • Aktualität: Hierbei wird das Alter der Dokumente im Datenspeicher ermittelt.

  • Nutzerereignisse: Hierzu gehören Conversion-Signale, die für die Personalisierung verwendet werden.

Außerdem können Sie in einer Suchanfrage Relevanzfilter und Metadatenfilter für Websitedaten und strukturierte oder unstrukturierte Daten angeben, um die Liste der relevanten Dokumente einzugrenzen.

Ranking-Methoden

Beim Ranking werden die Dokumente, die in der Abrufphase ausgewählt wurden, anhand der folgenden Bedingungen neu geordnet und ihnen wird ein neuer Relevanzwert zugewiesen:

  • Boost: Bestimmte Ergebnisse werden anhand von benutzerdefinierten Attributen oder Aktualität priorisiert oder herabgestuft. Dies wirkt sich auf die ersten 1.000 abgerufenen Dokumente aus und sortiert die 400 besten. Weitere Informationen finden Sie unter Suchergebnisse optimieren.
  • Benutzerdefiniertes Ranking: Die Standard-Rankinglogik wird mit einem formelbasierten Rankingalgorithmus gesteuert, optimiert und überschrieben, um Ihren spezifischen Anforderungen gerecht zu werden. Der Relevanzwert, der durch das benutzerdefinierte Ranking zugewiesen wird, hat Vorrang beim Ausliefern der Ergebnisse. Weitere Informationen finden Sie unter Suchergebnisse sortieren.
  • Suchabstimmung: Wirkt sich darauf aus, wie das Modell die semantische Relevanz Ihrer Dokumente wahrnimmt, und ändert die Relevanzwerte für Einbettungen. Weitere Informationen finden Sie unter Suchergebnisse mit der Suchoptimierung verbessern.
  • Ereignisbasiertes Neusortieren: Die Ergebnisse werden zum Zeitpunkt der Bereitstellung anhand eines auf Nutzerereignissen basierenden Personalisierungsmodells aktualisiert.