Datenspeicher werden verwendet von Datenspeicher-Agents um anhand Ihrer Daten Antworten auf die Fragen der Endnutzer zu finden. Datenspeicher sind eine Sammlung von Websites und Dokumenten, die jeweils auf Ihre Daten verweisen.
Stellt ein Endnutzer dem Kundenservicemitarbeiter eine Frage, Der Agent sucht im angegebenen Quellinhalt nach einer Antwort. und fasst die Ergebnisse in einer kohärenten Agent-Antwort zusammen. Sie enthält auch unterstützende Links zu den Quellen der der Antwort, um mehr zu erfahren. Der Agent kann bis zu fünf Antwort-Snippets für eine bestimmte Frage bereitstellen.
Datenspeicherquellen
Es gibt verschiedene Quellen, die Sie für Ihre Daten angeben können:
- Website-URLs: Websiteinhalte aus einer Liste von Domains automatisch crawlen oder Webseiten.
- BigQuery Daten aus Ihrer BigQuery-Tabelle importieren
- Cloud Storage: Importieren Sie Daten aus Ihrem Cloud Storage-Bucket.
Website content
Wenn Sie Website-Inhalte
als Quelle hinzufügen,
mehrere Websites hinzufügen und ausschließen.
Wenn Sie eine Website angeben,
Sie können einzelne Seiten oder *
als Platzhalter für ein Muster verwenden.
Alle HTML- und PDF-Inhalte werden verarbeitet.
Du musst Domain bestätigen wenn Website-Content als Quelle verwendet wird.
Einschränkungen:
- Dateien von öffentlichen URLs müssen vom Google-Suchindex gecrawlt worden sein. damit sie im Suchindex vorhanden sind. Sie können dies mit der Google Search Console prüfen.
- Es sind maximal 200.000 Seiten indexiert. Wenn der Datenspeicher mehr Seiten vorhanden sind, schlägt die Indexierung fehl und der letzte indexierte Inhalt bleibt erhalten.
Daten importieren
Sie können Ihre Daten entweder aus BigQuery oder Cloud Storage importieren. Diese Daten können strukturiert oder unstrukturiert sein. mit Metadaten oder ohne Metadaten.
Folgende Optionen für den Datenimport sind verfügbar:
- Daten hinzufügen/aktualisieren: Die bereitgestellten Dokumente werden dem Datenspeicher hinzugefügt. Wenn ein neues Dokument dieselbe ID wie ein altes Dokument hat, ersetzt das neue Dokument das alte.
- Vorhandene Daten überschreiben: Alle alten Daten werden gelöscht, werden neue Daten hochgeladen. Dieser Vorgang kann nicht rückgängig gemacht werden.
Strukturierter Datenspeicher
Strukturierte Datenspeicher können Antworten auf häufig gestellte Fragen (FAQs) enthalten. Wenn Fragen von Nutzern einer hochgeladenen Frage mit hoher Zuverlässigkeit zugeordnet werden, gibt der Agent die Antwort auf diese Frage ohne Änderungen zurück. Sie können für jedes Frage-Antwort-Paar einen Titel und eine URL angeben. der vom Agent angezeigt wird.
Beim Hochladen von Daten in den Datenspeicher muss das CSV-Format verwendet werden. Jede Datei muss eine Kopfzeile haben, in der die Spalten beschrieben werden.
Beispiel:
"question","answer","title","url"
"Why is the sky blue?","The sky is blue because of Rayleigh scattering.","Rayleigh scattering","https://en.wikipedia.org/wiki/Rayleigh_scattering"
"What is the meaning of life?","42","",""
Die Spalten title
und url
sind optional und können weggelassen werden:
"answer","question"
"42","What is the meaning of life?"
Während des Uploadprozesses kann ein Ordner ausgewählt werden, in dem jede Datei CSV-Datei unabhängig von der Endung.
Einschränkungen:
- Zusätzliches Leerzeichen nach
,
verursacht einen Fehler. - Leerzeilen (auch am Ende der Datei) verursachen einen Fehler.
Unstrukturierter Datenspeicher
Unstrukturierte Datenspeicher können Inhalte in den folgenden Formaten enthalten:
- HTML
- TXT
- CSV
Einschränkungen:
- Die maximale Dateigröße beträgt 2,5 MB für textbasierte Formate, 100 MB für andere Formate.
Datenspeicher mit Metadaten
Sie können einen Titel und eine URL als Metadaten angeben. Wenn sich der Agent in einer Unterhaltung mit einem Nutzer befindet, kann der Agent dem Nutzer diese Informationen zur Verfügung stellen. Dies kann Nutzenden helfen, um schnell auf interne Webseiten zu verlinken, auf die die Google-Suche nicht zugreifen kann Indexierung.
Um Inhalte mit Metadaten zu importieren, geben Sie eine oder mehrere JSON-Zeilen. Jede Zeile dieser Datei beschreibt ein Dokument. Sie laden die Dokumente nicht direkt hoch. URIs, die mit den Cloud Storage-Pfaden verknüpft sind, werden in der JSON-Lines-Datei bereitgestellt.
Achten Sie bei der Bereitstellung Ihrer JSON-Lines-Dateien darauf, stellen Sie einen Cloud Storage-Ordner bereit, der diese Dateien enthält. Legen Sie keine anderen Dateien in diesem Ordner ab.
Feldbeschreibungen:
Feld | Typ | Beschreibung |
---|---|---|
id | String | Eindeutige Kennung für das Dokument. |
content.mimeType | String | MIME-Typ des Dokuments. "application/pdf" und "text/html" unterstützt werden. |
content.uri | String | URI für das Dokument in Cloud Storage. |
content.structData | String | Einzeiliges JSON-Objekt mit den optionalen Feldern title und url . |
Beispiel:
{ "id": "d001", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/first_doc.pdf"}, "structData": {"title": "First Document", "url": "https://internal.example.com/documents/first_doc.pdf"} }
{ "id": "d002", "content": {"mimeType": "application/pdf", "uri": "gs://example-import/unstructured/second_doc.pdf"}, "structData": {"title": "Second Document", "url": "https://internal.example.com/documents/second_doc.pdf"} }
{ "id": "d003", "content": {"mimeType": "text/html", "uri": "gs://example-import/unstructured/mypage.html"}, "structData": {"title": "My Page", "url": "https://internal.example.com/mypage.html"} }
Datenspeicher ohne Metadaten
Für diese Art von Inhalten gibt es keine Metadaten. Geben Sie einfach die zu importierenden Dokumente an. Der Inhaltstyp wird durch die Dateiendung bestimmt.
Konfiguration parsen und aufteilen
Je nach Datenquelle können Sie möglicherweise Parsing- und Blockeinstellungen wie in Vertex AI Search definiert.
Datenspeicher erstellen
So erstellen Sie einen Datenspeicher:
Rufen Sie die Agent Builder-Konsole auf:
Wählen Sie Ihr Projekt aus dem Drop-down-Menü der Konsole aus.
Lesen und akzeptieren Sie die Nutzungsbedingungen und klicken Sie anschließend auf Fortfahren und API aktivieren.
Klicken Sie in der linken Navigationsleiste auf Datenspeicher.
Klicken Sie auf Neuer Datenspeicher.
Wählen Sie eine Datenquelle aus.
Aktivieren Erweiterte Websiteindexierung: Dies ist für Datenspeicher-Agents erforderlich.
Daten und Konfiguration angeben für die ausgewählte Datenspeicherquelle. Der Speicherort Ihres Datenspeichers sollte dem Standort des Kundenservicemitarbeiters
Klicken Sie auf Erstellen, um den Datenspeicher anzulegen.
Legen Sie optional die Datenspeichersprache fest:
- Klicken Sie in der Liste der Datenspeicher auf den soeben erstellten Datenspeicher.
- Klicken Sie auf die Schaltfläche „Bearbeiten“ . für die Spracheinstellung.
- Wählen Sie eine Sprache aus und klicken Sie auf das Kästchen, um sie anzuwenden.
Cloud Storage für ein Datenspeicherdokument verwenden
Wenn Ihr Inhalt nicht öffentlich ist, sollten Sie Ihre Inhalte in Cloud Storage speichern.
Beim Erstellen von Datenspeicherdokumenten
geben Sie die URLs für Ihre Cloud Storage-Objekte im folgenden Format an:
gs://bucket-name/folder-name
Jedes Dokument im Ordner wird dem Datenspeicher hinzugefügt.
Beim Erstellen des Cloud Storage-Buckets:
- Achten Sie darauf, dass Sie das Projekt ausgewählt haben, das Sie für an den Agent.
- Verwenden Sie die Standard Storage-Klasse.
- Bucket-Standort festlegen an denselben Standort wie der Agent.
Folgen Sie der Cloud Storage-Kurzanleitung, um einen Bucket zu erstellen und Dateien hochzuladen.
Sprachen
Für unterstützte Sprachen: sehen Sie sich die Datenspeicherspalte in der Dialogflow-Sprachreferenz
Für eine optimale Leistung wird empfohlen, Datenspeicher in einer einzigen Sprache zu erstellen.
Nach dem Erstellen eines Datenspeichers können Sie optional die Sprache des Datenspeichers angeben. Wenn Sie die Sprache des Datenspeichers festlegen, können Sie den Datenspeicher mit einem Datenspeicher-Agent der für eine andere Sprache konfiguriert ist. Beispiel: können Sie einen französischen Datenspeicher das mit einem englischen Agent verbunden ist.
Unterstützte Regionen
Für unterstützte Regionen sieh dir die Referenz zur Dialogflow-Region