Suchanfragen nach Relevanz auf Dokumentebene filtern

Wenn Sie in Ihrer Vertex AI Search-App suchen, können Sie einen Relevanzgrenzwert anwenden, damit nur die Dokumente als Ergebnisse zurückgegeben werden, die diesen Grenzwert erfüllen. Auf dieser Seite wird beschrieben, wie Sie einen Relevanzgrenzwert angeben, um die Anzahl der Dokumente zu reduzieren, die bei Suchanfragen zurückgegeben werden.

Nach Relevanz auf Dokumentebene filtern

Jedem Dokument, das von einer Suchanfrage zurückgegeben wird, wird ein Relevanzlevel zugewiesen, das die Relevanz des zurückgegebenen Dokuments für die Suchanfrage angibt. Wenn Sie eine Suchanfrage über einen API-Aufruf stellen, können Sie einen Relevanzgrenzwert festlegen. Wenn Sie einen hohen Relevanzgrenzwert festlegen, wird die Anzahl der von einer Abfrage zurückgegebenen Dokumente möglicherweise reduziert.

Wenn Sie beispielsweise feststellen, dass bei der Suche zu viele Dokumente zurückgegeben werden, die für Ihre Nutzer nicht relevant sind, können Sie den Relevanzgrenzwert auf „Hoch“ setzen, um die Ergebnisse auf die relevantesten zu beschränken. Wenn die Einstellung „Hoch“ zu restriktiv ist, versuchen Sie es mit der Einstellung „Mittel“.

Datentypen und Apps, die für den Relevanzfilter auf Dokumentebene unterstützt werden

Der Relevanzfilter auf Dokumentebene kann auf Datenspeicher mit den folgenden Datentypen angewendet werden:

  • Websitedaten mit erweiterter Websiteindexierung
  • Generische unstrukturierte Daten
  • Generische strukturierte Daten

Der Relevanzfilter auf Dokumentebene funktioniert nicht für Datenspeicher mit grundlegender Websiteindexierung, Mediendaten oder Gesundheitsdaten.

Außerdem kann der Relevanzfilter auf Dokumentebene nicht mit Apps für die kombinierte Suche verwendet werden. Apps mit kombinierter Suche sind Apps, die mit mehreren Datenspeichern verbunden sind.

Andere Arten von Filtern

Der Relevanzfilter auf Dokumentebene ist nicht die einzige Möglichkeit, Daten zu filtern, die von Abfragen zurückgegeben werden. Sie können auch Filterausdrücke verwenden, um Ergebnisse anhand von Metadaten (bei der erweiterten Websiteindexierung und unstrukturierten Daten mit Metadatenspeichern) und Feldwerten (in strukturierten Datenspeichern) zu filtern.

Weitere Informationen finden Sie unter:

Wenn Sie sowohl einen Filterausdruck als auch den Relevanzfilter auf Dokumentebene verwenden, wird der Filterausdruck zuerst auf die Ergebnisse und dann der Relevanzfilter auf Dokumentebene angewendet.

Hinweise

Sie müssen eine App und einen Datenspeicher erstellt und Daten in Ihren Datenspeicher aufgenommen haben. Weitere Informationen finden Sie unter Such-App erstellen und Datentypen und Apps, die für den Relevanzfilter auf Dokumentebene unterstützt werden.

So filtern Sie nach Relevanz:

  1. Suchen Sie Ihre App-ID. Wenn Sie bereits eine App-ID haben, fahren Sie mit dem nächsten Schritt fort.

    1. Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.

      Zu Apps wechseln

    2. Suchen Sie auf der Seite Apps nach dem Namen Ihrer App und sehen Sie sich die ID der App in der Spalte ID an.

  2. Wenn Sie die Suche nach Relevanz auf Dokumentebene filtern möchten, verwenden Sie das Feld relevanceThreshold mit der Methode engines.servingConfigs.search.

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    
    • PROJECT_ID ist die ID Ihres Google Cloud-Projekts.
    • APP_ID: Die ID der Vertex AI Search-App, die Sie abfragen möchten.
    • QUERY: Der Suchtext.
    • RELEVANCE_THRESHOLD: einer der folgenden Werte: HIGH, MEDIUM, LOW, LOWEST.
  3. Testen Sie mehrere Abfragen mit unterschiedlichen Grenzwerten, um die besten Grenzwerteinstellungen für Ihre Daten und Ihre Anwendung zu ermitteln.