Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Auf dieser Seite wird beschrieben, wie Abruf und Ranking zusammenarbeiten, um relevante Suchergebnisse in Vertex AI Search-Apps zu liefern.
Übersicht
Kurz gesagt: Beim Abrufen werden relevante Dokumente gefunden, beim Ranking werden diese abgerufenen Dokumente sortiert. Das Ranking aller verfügbaren Dokumente kann rechenintensiv sein. Abruf und Ranking erfolgen daher sequenziell.
Zuerst wird die Anfrage vom Suchmodell verstanden und umformuliert.
Anschließend ruft das Modell je nach verfügbaren Datenquellen und Anzahl der indexierten Dokumente in Ihrem Datenspeicher Tausende von Dokumenten ab. Den abgerufenen Dokumenten wird eine Relevanzbewertung zugewiesen.
Das Ranking-Modell sortiert dann die abgerufenen Dokumente und gibt die 400 Ergebnisse mit dem höchsten Ranking aus. Die folgende Abbildung zeigt, wie diese beiden Prozesse in den Suchworkflow passen.
Abbildung 1. Abruf und Ranking im Suchworkflow
Abrufmethoden
Beim Abrufen wird eine Teilmenge von Dokumenten aus Ihrem Datenspeicher ausgewählt, die für die Anfrage eines Nutzers relevant sind. Das Vertex AI Search-Modell verwaltet den Abruf für Ihre Suchanwendungen basierend auf verschiedenen Signalen, z. B. den folgenden, und weist Relevanzbewertungen zu:
Relevanz: Hierzu gehören Keyword-Abgleich, Knowledge Graphs und Websignale.
Einbettungen: Enthält Einbettungen, um konzeptionell ähnliche Inhalte zu finden.
Cross-Attention: Ermöglicht es einem Modell, die Beziehung zwischen einer Anfrage und einem Dokument zu berücksichtigen, um dem Dokument einen Relevanzwert zuzuweisen.
Aktualität: Hierbei wird das Alter der Dokumente im Datenspeicher ermittelt.
Nutzerereignisse: Hierzu gehören Conversion-Signale, die für die Personalisierung verwendet werden.
Beim Ranking werden die Dokumente, die in der Abrufphase ausgewählt wurden, anhand der folgenden Bedingungen neu geordnet und ihnen wird ein neuer Relevanzwert zugewiesen:
Boost: Bestimmte Ergebnisse werden anhand von benutzerdefinierten Attributen oder Aktualität priorisiert oder herabgestuft. Dies wirkt sich auf die ersten 1.000 abgerufenen Dokumente aus und sortiert die 400 besten.
Weitere Informationen finden Sie unter Suchergebnisse optimieren.
Benutzerdefiniertes Ranking: Die Standard-Rankinglogik wird mit einem formelbasierten Rankingalgorithmus gesteuert, optimiert und überschrieben, um Ihren spezifischen Anforderungen gerecht zu werden.
Der Relevanzwert, der durch das benutzerdefinierte Ranking zugewiesen wird, hat Vorrang beim Ausliefern der Ergebnisse.
Weitere Informationen finden Sie unter Suchergebnisse sortieren.
Suchabstimmung: Wirkt sich darauf aus, wie das Modell die semantische Relevanz Ihrer Dokumente wahrnimmt, und ändert die Relevanzwerte für Einbettungen. Weitere Informationen finden Sie unter Suchergebnisse mit der Suchoptimierung verbessern.
Ereignisbasiertes Neusortieren: Die Ergebnisse werden zum Zeitpunkt der Bereitstellung anhand eines auf Nutzerereignissen basierenden Personalisierungsmodells aktualisiert.
[[["Leicht verständlich","easyToUnderstand","thumb-up"],["Mein Problem wurde gelöst","solvedMyProblem","thumb-up"],["Sonstiges","otherUp","thumb-up"]],[["Schwer verständlich","hardToUnderstand","thumb-down"],["Informationen oder Beispielcode falsch","incorrectInformationOrSampleCode","thumb-down"],["Benötigte Informationen/Beispiele nicht gefunden","missingTheInformationSamplesINeed","thumb-down"],["Problem mit der Übersetzung","translationIssue","thumb-down"],["Sonstiges","otherDown","thumb-down"]],["Zuletzt aktualisiert: 2025-09-05 (UTC)."],[],[],null,["# About retrieval and ranking\n\nThis page describes how retrieval and ranking work together to deliver relevant\nsearch results in Vertex AI Search apps.\n\nOverview\n--------\n\nIn short, retrieval is finding relevant documents, while ranking is\nordering those retrieved documents. Ranking all the available documents\ncan be computationally expensive. Therefore, retrieval and ranking work\nsequentially.\n\nFirst, the search model understands the query and rewrites it.\nThen, depending on the data sources available and the number of indexed\ndocuments in your data store, the model\nretrieves documents in the order of thousands. A relevance score is assigned to\nthe retrieved documents.\n\nThe ranking model then orders the retrieved documents\nand serves the top 400 ranked results. The following image shows how\nthese two processes fit into the search workflow.\n**Figure 1.** Retrieval and ranking in search workflow\n\n### Retrieval methods\n\nRetrieval is the process of selecting a subset of documents from your data store\nthat are relevant to a user's query. Vertex AI Search model\nmanages retrieval for your search apps based on different signals, such as the\nfollowing, and assigns relevance scores:\n\n- **Topicality**: Includes keyword matching, knowledge graphs, and web signals.\n\n- **Embeddings**: Includes embeddings to find conceptually similar content.\n\n- **Cross-attention**: Allows a model to consider the relationship between a\n query and a document to assign a relevance score to the document.\n\n- **Freshness**: Involves ascertaining the age of the documents in the data\n store.\n\n- **User events**: Includes conversion signals used for personalization.\n\nAdditionally, in a search request, you can supply\n[relevance filters](/generative-ai-app-builder/docs/filter-by-relevance) and\nmetadata filters for [website data](/generative-ai-app-builder/docs/filter-website-search)\nand [structured or unstructured data](/generative-ai-app-builder/docs/filter-search-metadata) to\nnarrow down the list of relevant documents.\n\n### Ranking methods\n\nRanking takes the documents that are selected during the retrieval phase,\nassigns them a new relevance score according to the following conditions, and\nreorders them:\n\n- **Boost** : Promotes and demotes certain results according to custom attributes or freshness. This impacts the first 1,000 retrieved documents and ranks the top 400. For more information, see [Boost search results](/generative-ai-app-builder/docs/boost-search-results).\n- **Custom ranking** : Controls, tunes, and overrides the default ranking logic with a formula-based ranking algorithm to suit your specific requirements. The relevance score that custom ranking assigns takes a precedence when serving the results. For more information, see [Customize search results ranking](/generative-ai-app-builder/docs/custom-ranking).\n- **Search tuning** : Impacts how the model perceives the semantic relevance of your documents and changes the embedding relevance scores. For more information, see [Improve search results with search tuning](/generative-ai-app-builder/docs/search-tuning).\n- **Event-based reranking**: Updates the results at the time of serving using user-events-based personalization model."]]