Auf dieser Seite werden Vertex AI Search-Anwendungen und ‑Datenspeicher beschrieben. Informationen zu Vertex AI-Agenten-Datenspeichern finden Sie unter Vertex AI-Agenten-Datenspeicher.
Mit Vertex AI Search erstellen Sie eine Such- oder Empfehlungs-App und verknüpfen sie mit einem Datenspeicher. Ein Google Cloud-Projekt kann mehrere Apps enthalten.
Beziehung zwischen Apps und Datenspeichern
Die Beziehung zwischen Apps und Datenspeichern hängt vom App-Typ ab:
Allgemeine Suchanwendungen haben eine „Mehrfach-zu-Mehrfach“-Beziehung zu Datenspeichern. Wenn mehrere Datenspeicher mit einer einzigen generischen Suchanwendung verbunden sind, wird dies als zusammengeführte Suche bezeichnet. Informationen zu den Einschränkungen beim Verbinden einer Such-App mit mehreren Datenspeichern finden Sie unter Zusammengeführte Suche.
Eine App für generische Empfehlungen hat eine Eins-zu-Eins-Verbindung mit ihrem Datenspeicher.
Eine Medien-App hat eine n:1-Beziehung zu ihrem Datenspeicher. Eine App kann nur mit einem Datenspeicher verbunden werden, während ein bestimmter Datenspeicher mit mehreren Apps verbunden werden kann. Beispielsweise können eine App für die Mediensuche und eine App für Medienempfehlungen einen gemeinsamen Datenspeicher verwenden.
Eine App zur Suche nach Gesundheitsdaten hat eine Beziehung vom Typ „Viele zu Eins“ zu ihrem Datenspeicher. Eine App kann nur mit einem Datenspeicher verbunden werden, während ein bestimmter Datenspeicher mit mehreren Apps verbunden werden kann. Beispielsweise können eine patientenorientierte App und eine dienstleisterorientierte App eine Verbindung zum selben Datenspeicher herstellen.
Beim Batch-Datenimport von Gesundheitsdaten werden die Daten in einen Datenspeicher in einer App importiert. Beim Streaming-Datenimport (Vorabversion) von Gesundheitsdaten werden die Daten in eine Entität importiert, eine Art Datenspeicher in einem Daten-Connector. Ein Daten-Connector ist auch eine Art von Datenspeicher, der sich in einer App befindet.
Nachdem ein Datenspeicher mit einer App verbunden wurde, kann die Verbindung nicht mehr getrennt werden.
Methode zur App-Erstellung und Datenaufnahme
Wie Sie eine App erstellen und Daten aufnehmen, hängt vom Datentyp ab:
Für Websitedaten verwenden Sie die Google Cloud Console, nicht die API, um Ihre App zu erstellen und Daten zu importieren.
Für strukturierte oder unstrukturierte Daten können Sie entweder die Google Cloud Console oder die API verwenden.
Für Gesundheitsdaten können Sie entweder die Google Cloud Console oder die API verwenden.
Dokumente
Jeder Datenspeicher enthält einen oder mehrere Datensätze, sogenannte Dokumente. Was ein Dokument darstellt, hängt vom Datentyp im Datenspeicher ab:
Website. Ein Dokument ist eine Webseite.
Strukturierte Daten Ein Dokument ist eine Zeile in einer Tabelle oder ein JSON-Eintrag, der einem bestimmten Schema folgt. Sie können dieses Schema selbst angeben oder Vertex AI Agent Builder das Schema aus den aufgenommenen Daten ableiten lassen.
Strukturierte Daten für Medien Ein Dokument ist eine Zeile in einer Tabelle oder ein JSON-Eintrag, der einem medienspezifischen Schema folgt. Die Dokumente sind Einträge zu Medieninhalten wie Videos, Nachrichtenartikeln, Musikdateien und Podcasts. Ein Dokument enthält Informationen, die das Medienelement beschreiben. Mindestens sind folgende Angaben erforderlich: Titel, URI zum Speicherort der Inhalte, Kategorien, Dauer und Verfügbarkeitsdatum.
Strukturierte Daten für Drittanbieter-Datenquellen (Vorabversion mit Zulassungsliste) Ein Dokument ist eine Entität, die für die Drittanbieterdatenquelle spezifisch ist, z. B. ein Jira-Problem oder ein Confluence-Bereich.
Unstrukturierte Daten Ein Dokument ist eine Datei im HTML-, PDF- oder TXT-Format mit eingebettetem Text. Die PPTX- und DOCX-Formate sind in der Vorabversion verfügbar.
FHIR-Daten aus dem Gesundheitswesen Ein Dokument ist eine unterstützte FHIR R4-Ressource. Eine Liste der FHIR R4-Ressourcen, die von Vertex AI Search unterstützt werden, finden Sie unter Referenz für das Datenschema von Healthcare FHIR R4.
Datenspeicher und Apps
In Vertex AI Agent Builder gibt es verschiedene Arten von Datenspeichern. Ein Datenspeicher kann nur einen Datentyp enthalten.
- Websitedaten
- Strukturierte Daten
- Strukturierte Inhalte (Medien)
- Strukturierte Inhalte für Datenquellen von Drittanbietern
- Unstrukturierte Daten
- FHIR-Daten aus dem Gesundheitswesen
Websitedaten
Ein Datenspeicher mit Websitedaten verwendet Daten, die von öffentlichen Websites indexiert wurden. Sie können eine Reihe von URL-Mustern angeben, die in Ihren Datenspeicher aufgenommen werden sollen. Webseiten, die den URL-Mustern entsprechen, werden als eingeschlossene Webseiten bezeichnet. Anschließend können Sie Suchanfragen oder Empfehlungen auf Grundlage der Daten einrichten, die von den enthaltenen Webseiten gecrawlt wurden.
Sie können beispielsweise URL-Muster wie yourexamplewebsite.com/faq/*
und yourexamplewebsite.com/events/*
angeben und die Suche oder Empfehlungen für die Daten aktivieren, die von diesen Webseiten gecrawlt wurden und dem Muster entsprechen. Dazu gehören Text, mit Metadaten getaggte Bilder und andere strukturierte Daten wie meta
-Tags, PageMap-Attribute und schema.org-Daten.
Es gibt zwei Arten von Website-Datenspeichern:
Grundlegende Websitesuche:
- Bietet Suchfunktionen über den vorhandenen Index der Google Suche für die enthaltenen Websites.
- Es ist keine Domainbestätigung erforderlich.
Erweiterte Websiteindexierung:
- Bietet erweiterte Suchfunktionen über einen Index, der auf einem der folgenden Elemente basiert: dem vorhandenen Index der Google Suche für die enthaltenen Websites.
- Die Eigentümer der Vertex AI Search-Anwendung können steuern, welche Webseiten indexiert werden, indem sie Sitemaps einreichen und verwalten. Weitere Informationen finden Sie unter Websites mithilfe von Sitemaps indexieren und aktualisieren. So wird der Index ohne manuelles Eingreifen auf dem neuesten Stand gehalten.
- Die App-Inhaber von Vertex AI Search können eine anfängliche Indexierung durchführen, die dem Index der Google Suche entspricht, und dann die Abdeckung des Index erweitern, indem sie die Websites bei Bedarf noch einmal crawlen, um sie auf dem neuesten Stand zu halten. Weitere Informationen finden Sie unter Webseiten aktualisieren. Die erweiterten Funktionen der erweiterten Websiteindexierung sind unter Erweiterte Websiteindexierung aufgeführt.
- Die Inhaber von Vertex AI Search-Datenspeichern müssen die Domains bestätigen, zu denen die enthaltenen Websites gehören. Weitere Informationen finden Sie unter Websitedomains bestätigen.
- Bietet die Möglichkeit, dem Datenspeicherschema strukturierte Daten hinzuzufügen.
Eine Website enthält unstrukturierte Daten. Sie können Ihren Webseiten jedoch strukturierte Daten in Form von
meta
-Tags, PageMap-Attributen und Schema.org-Daten hinzufügen. Sie können diese strukturierten Daten dann verwenden, um das Datenspeicherschema zu bearbeiten, wie im Hilfeartikel Strukturierte Daten für die erweiterte Indexierung von Websites verwenden beschrieben.
- Bietet erweiterte Suchfunktionen über einen Index, der auf einem der folgenden Elemente basiert: dem vorhandenen Index der Google Suche für die enthaltenen Websites.
Nächste Schritte
Für die Websitesuche:
- Informationen zu den Voraussetzungen für die Indexierung finden Sie unter Daten für die Websitesuche vorbereiten.
- Datenspeicher mit Websitecontent erstellen
- Erstellen Sie eine Such-App.
Empfehlungen:
- Erstellen Sie einen generischen Datenspeicher für Empfehlungen.
- Eine allgemeine Empfehlungs-App erstellen
Strukturierte Daten
Ein Datenspeicher mit strukturierten Daten ermöglicht eine semantische Suche oder Empfehlungen für strukturierte Daten. Sie können Daten aus BigQuery oder Cloud Storage importieren. Sie können strukturierte JSON-Daten auch manuell über die API hochladen.
Sie können beispielsweise die Suche oder Empfehlungen über einen Produktkatalog für Ihren E-Commerce-Shop oder ein Ärzteverzeichnis für die Suche nach oder Empfehlungen von Anbietern aktivieren.
Vertex AI Agent Builder erkennt das Schema automatisch anhand der von Ihnen importierten Daten. Optional können Sie ein Schema für Ihre Daten angeben. Wenn Sie ein Schema für Ihre Daten angeben, wird die Qualität der Ergebnisse in der Regel verbessert.
Nächste Schritte
Für die allgemeine Suche:
- Strukturierte Daten für die Aufnahme vorbereiten
- Erstellen Sie einen Suchdatenspeicher mit einer der folgenden Methoden:
- Erstellen Sie eine Such-App.
Für allgemeine Empfehlungen:
- Erstellen Sie einen generischen Datenspeicher für Empfehlungen.
- Eine allgemeine Empfehlungs-App erstellen
Strukturierte Daten für Medien
Medien-Apps können nur mit Mediendatenspeichern verbunden werden. Mediendatenspeicher sind strukturierte Datenspeicher mit einem von Google definierten Schema oder einem benutzerdefinierten Schema, das fünf Medienfelder enthält. Weitere Informationen zum Schema finden Sie unter Mediendokumente und Datenspeicher.
Sie können beispielsweise Empfehlungen aktivieren, indem Sie eine App für Medienempfehlungen für einen Filmkatalog oder eine Nachrichtenwebsite erstellen, damit Ihre Nutzer passende und personalisierte Vorschläge erhalten.
Neben Mediendokumenten enthalten Mediendatenspeicher auch Informationen zu Nutzerereignissen, mit denen Vertex AI Search Empfehlungen anpassen und nach Nutzern suchen kann. Nutzerereignisse sind für Apps mit Medienempfehlungen erforderlich und werden für Apps mit Mediensuche empfohlen. Informationen zu Nutzerereignissen finden Sie unter Nutzerereignisse in Echtzeit aufzeichnen.
Nächste Schritte
Strukturierte Daten für Datenspeicher von Drittanbietern
Die folgenden Connectors für Datenquellen von Drittanbietern sind in der Vorabversion mit Zulassungsliste verfügbar:
- Confluence
- Jira
- Salesforce
- SharePoint Online
- Slack
Daten von diesen Drittanbietern gelten als strukturierte Daten.
Wenn Sie einen neuen Connector einrichten, wählen Sie eine Synchronisierungshäufigkeit aus. Außerdem können Sie auswählen, welche Entitäten synchronisiert werden sollen. Die Entitäten variieren je nach Quelle, z. B. Probleme für Jira und Inhalte und Gruppenbereiche für Confluence. Für jede Entität wird ein eindeutiger Datenspeicher erstellt. Entitätsdatenspeicher werden nach Connectorinstanz gruppiert.
Nächste Schritte
Für die Suche:
- Drittanbieterdaten für die Aufnahme vorbereiten
- Datenquelle eines Drittanbieters verbinden
- Erstellen Sie eine Such-App.
Empfehlungen:
- Erstellen Sie einen generischen Datenspeicher für Empfehlungen.
- Eine allgemeine Empfehlungs-App erstellen
Unstrukturierte Daten
Ein Speicher für unstrukturierte Daten ermöglicht die semantische Suche oder Empfehlungen für Daten wie Dokumente und Bilder.
Unstrukturierte Datenspeicher unterstützen Dokumente im HTML-, PDF- mit eingebettetem Text und TXT-Format. Die PPTX- und DOCX-Formate sind in der Vorabversion verfügbar.
Die Suche liefert Ergebnisse in Form von 10 URLs und zusammengefassten Antworten für Suchanfragen in natürlicher Sprache. Dokumente müssen mit den entsprechenden Zugriffsberechtigungen in einen Cloud Storage-Bucket hochgeladen werden. So kann beispielsweise eine Finanzinstitution Suchanfragen oder Empfehlungen für ihren privaten Korpus an Finanzforschungspublikationen oder ein Biotech-Unternehmen Suchanfragen oder Empfehlungen für sein privates Repository an medizinischen Forschungsdaten zulassen.
Nächste Schritte
Für die Suche:
- Unstrukturierte Daten für die Aufnahme vorbereiten
- Erstellen Sie einen Suchdatenspeicher mit einer der folgenden Methoden:
- Erstellen Sie einen Suchdatenspeicher für Ihre unstrukturierten Daten.
- Erstellen Sie eine Such-App.
Für allgemeine Empfehlungen:
- Erstellen Sie einen generischen Datenspeicher für Empfehlungen.
- Eine allgemeine Empfehlungs-App erstellen
Healthcare FHIR-Daten
Eine Such-App für das Gesundheitswesen verwendet FHIR R4-Daten, die aus einem FHIR-Speicher der Cloud Healthcare API importiert wurden. Eine Liste der FHIR R4-Ressourcen, die von Vertex AI Search unterstützt werden, finden Sie unter Referenz für das FHIR R4-Datenschema für die Gesundheitsbranche. Ein FHIR R4-Datenspeicher muss einige Anforderungen erfüllen, bevor er als Datenquelle für den Vertex AI Search-Datenspeicher verwendet werden kann. Weitere Informationen finden Sie unter FHIR-Daten aus dem Gesundheitswesen für die Datenaufnahme vorbereiten.
Nächste Schritte
- FHIR R4-Daten für die Aufnahme vorbereiten
- Erstellen Sie einen Datenspeicher für die Suche nach Gesundheitsdaten.
- Erstellen Sie eine Such-App für das Gesundheitswesen.
Zusammengeführte Suche
Sie können eine App für die Zusammenführung von Suchanfragen erstellen, bei der mehrere Datenspeicher mit einer einzigen generischen Suchanwendung verbunden werden können. Mit dieser Funktion können Sie mit einer App in mehreren Quellen und Datentypen suchen.
Wenn Sie eine App für die kombinierte Suche erstellen möchten, wählen Sie beim Erstellen einer neuen generischen Such-App mehrere Datenspeicher aus. Wenn Sie beim Erstellen nicht mehrere Datenspeicher auswählen, können Sie später keine zusätzlichen Datenspeicher hinzufügen.
Wenn Sie Suchergebnisse abrufen, können Sie entweder in allen Datenspeichern suchen oder nach Ergebnissen aus einem einzelnen Datenspeicher filtern.
Es gelten folgende Einschränkungen:
- Datenspeicher hinzufügen und entfernen:
- Wenn Sie die kombinierte Suche für eine App aktivieren möchten, müssen Sie beim Erstellen der App mindestens zwei Datenspeicher damit verknüpfen.
- Sie können Datenspeicher zu einer App mit kombinierter Suche hinzufügen oder daraus entfernen. Die App darf jedoch nie weniger als zwei Datenspeicher haben.
- Wenn Sie beim Erstellen einer App einen einzelnen Datenspeicher mit einer Such-App verknüpfen, können Sie diesen Datenspeicher nicht mehr hinzufügen oder entfernen.
- Für die Verwendung von Website-Datenspeichern für die kombinierte Suche muss die erweiterte Websiteindexierung aktiviert sein. Weitere Informationen finden Sie unter Erweiterte Websiteindexierung.
- Datenspeicher, die unstrukturierte Daten enthalten, die mit BigQuery importiert wurden, werden nicht unterstützt.
- Bei der kombinierten Suche sind die folgenden Felder in Suchanfragen zulässig:
query
pageSize
offset
dataStoreSpecs
pageToken
filter
spellCorrectionSpec
session
contentSearchSpec
summarySpec
extractiveContentSpec
searchResultMode
chunkSpec
- Zusätzlich zu den oben aufgeführten Feldern werden die folgenden Felder nur für Suchanwendungen mit kombinierten Datenspeichern unterstützt, wenn Suchanfragen so gefiltert werden, dass Ergebnisse aus einem einzelnen Datenspeicher zurückgegeben werden. Sie werden nicht unterstützt, wenn Ergebnisse aus mehreren Datenspeichern abgerufen werden:
facetSpec
- Bei der kombinierten Suche sind in
dataStoreSpecs
die folgenden Felder zulässig:boostSpec
filter
: Wenn sowohl fürSearchRequest
als auch fürdataStoreSpecs
Filter angegeben sind, werden beide Filter auf die Suchergebnisse angewendet.
- Für Hybrid-Apps werden CRUD-Vorgänge (Create, Read, Update, Delete = Erstellen, Lesen, Aktualisieren und Löschen) für Bereitstellungskonfigurationen unterstützt. In einer Bereitstellungskonfiguration können nur die folgenden Felder hinzugefügt oder aktualisiert werden:
name
displayName
solutionType
genericConfig
:contentSearchSpec
:summarySpec
extractiveContentSpec
searchResultMode
chunkSpec
boostControlIds
synonymsControlIds
onewaySynonymsControlIds
- Für Apps mit kombinierter Suche werden CRUD-Vorgänge für die folgenden Steuerelemente unterstützt:
boostAction
synonymACtion
- In Apps mit kombinierter Suche werden die folgenden Funktionen nicht unterstützt:
- Auslieferungssteuerungen filtern, umleiten, ignorieren, ersetzen und trennen
- Snippets, in denen
contentSearchSpec.snippetSpec
in Suchanfragen oder Bereitstellungskonfigurationen verwendet wird - Mit weiterführenden Fragen suchen