Unterhaltungsdaten hochladen

"Intelligente Antwort" akzeptiert Unterhaltungsdaten als Eingabe und verwendet die Daten zum Trainieren eines benutzerdefinierten Modells für Antwortvorschläge. Optional können Sie die von Agent Assist bereitgestellten Unterhaltungsdaten zum Testen der Funktionalität oder Einbindung verwenden, ohne eigene Daten bereitstellen zu müssen. Zur Verwendung von "Intelligente Antwort" während der Laufzeit müssen Sie Ihre eigenen Unterhaltungsdaten bereitstellen.

Auf dieser Seite wird beschrieben, wie Sie mit dem vorhandenen Dataset arbeiten und Ihre eigenen Daten für den Upload in Cloud Storage formatieren. Sie müssen Ihre Unterhaltungsdaten als JSON-formatierte Textdateien bereitstellen.

Vom Agent Assist bereitgestellte Unterhaltungsdaten verwenden (optional)

Agent Assist bietet öffentlich verfügbare Unterhaltungsdaten sowie ein Modell und eine Zulassungsliste, die mit diesen Daten trainiert wurden. Sie können diese Ressourcen nutzen, um ein Unterhaltungsprofil zu erstellen und die Funktionalität zu testen, ohne eigene Daten bereitstellen zu müssen. Wenn Sie diese Option verwenden möchten, können Sie die Anleitung für Unterhaltungsprofile aufrufen und mithilfe der folgenden Ressourcen ein Unterhaltungsprofil erstellen.

Das bereitgestellte Unterhaltungs-Datenset wird von einer externen Quelle abgeleitet und in einem Google Cloud Storage-Bucket gespeichert: gs://smart_messaging_integration_test_data. Die Daten enthalten aufgabenorientierte Dialoge mit sechs Domains: "Buchung", "Restaurant", "Hotel", "Attraktion", "Taxi" und "Zug". Das Modell, das mit diesen Daten und der entsprechenden Zulassungsliste trainiert wurde, finden Sie an folgenden Speicherorten:

  • Modell: projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • Zulassungsliste: projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

Wenn Sie die Funktionalität des Features testen möchten, empfehlen wir Ihnen, zuerst die folgenden Endnutzernachrichten zu verwenden, um eine Antwort auszulösen:

  • "Können Sie mir eine teure Unterkunft im Osten der Stadt nennen?"
  • "Ich suche nach einem teuren Restaurant mit thailändischer Küche."
  • "Hallo, ich brauche ein Hotel mit kostenlosem WLAN im Norden von Cambridge."

Transkriptdaten der Unterhaltung

Textunterhaltungsdaten müssen in JSON-formatierten Dateien bereitgestellt werden, wobei jede Datei Daten für eine einzelne Unterhaltung enthält. Im Folgenden wird das erforderliche JSON-Format beschrieben.

Unterhaltung

Das Objekt auf oberster Ebene für Unterhaltungsdaten.

Feld Typ Beschreibung
conversation_info ConversationInfo { } Optional. Metadaten für die Unterhaltung.
entries Eintrag [ ] Erforderlich. Unterhaltungsnachrichten in chronologischer Reihenfolge.

ConversationInfo

Die Metadaten für eine Unterhaltung.

Feld Typ Beschreibung
Kategorien Kategorie [ ] Optional. Benutzerdefinierte Kategorien für die Unterhaltungsdaten.

Kategorie

Unterhaltungsdatenkategorie. Wenn Sie Ihren Unterhaltungsdaten Kategorien zuweisen, werden diese verwendet, um Themen in den Unterhaltungen zu identifizieren. Wenn Sie keine Kategorien angeben, kategorisiert das System die Unterhaltungen automatisch anhand der Inhalte.

Feld Typ Beschreibung
display_name String Erforderlich. Einen Anzeigenamen für die Kategorie.

Entry

Daten für eine einzelne Unterhaltungsnachricht.

Feld Typ Beschreibung
text String Erforderlich. Der Text dieser Unterhaltungsnachricht.
user_id Ganzzahl Optional. Eine Zahl, die den Unterhaltungsteilnehmer identifiziert. Jeder Teilnehmer sollte eine eigene user_id haben, die wiederholt verwendet wird, wenn der Teilnehmer an mehreren Unterhaltungen teilnimmt.
role String Erforderlich. Die Rolle des Unterhaltungsteilnehmers. Eine der folgenden Möglichkeiten: "KUNDENSERVICEMITARBEITER" oder "KUNDE".
start_timestamp_usec Ganzzahl Erforderlich. Der Zeitstempel für den Beginn dieses Unterhaltungsrunde in Mikrosekunden.

Beispiel

Das folgende Beispiel zeigt eine Datei mit Unterhaltungsdaten.

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Unterhaltungen in Cloud Storage hochladen

Sie müssen Ihre Unterhaltungsdaten in einem Cloud Storage-Bucket bereitstellen, der in Ihrem GCP-Projekt enthalten ist. Beim Erstellen des Buckets:

  • Sie müssen das GCP-Projekt ausgewählt haben, das Sie für Dialogflow verwenden.
  • Verwenden Sie die Standard Storage-Klasse.
  • Legen Sie den Bucket-Speicherort auf einen Standort fest, der Ihrem Standort am nächsten ist. Wenn Sie die Unterhaltungsdaten bereitstellen, benötigen Sie die Standort-ID, z. B. us-west1. Am besten notieren Sie sich diese.
  • Sie benötigen den Bucket-Namen auch, wenn Sie die Unterhaltungsdaten bereitstellen.

Folgen Sie der Cloud Storage-Kurzanleitung, um einen Bucket zu erstellen und Dateien hochzuladen.