Unterhaltungs-Dataset erstellen

Ein Unterhaltungs-Dataset enthält Transkriptdaten von Unterhaltungen. Diese Daten werden verwendet, um ein Modell für intelligente Antworten zu trainieren und Textantworten an menschliche Kundenservicemitarbeiter zu senden, die mit einem Endnutzer interagieren. Weitere Informationen zu den von Agent Assist unterstützten Datentypen finden Sie auf der Seite "Datenübersicht". Zum Testen der API-Einbindung oder der Funktionsweise des Features, ohne Ihre eigenen Daten hochzuladen, können Sie von Agent Assist bereitgestellte Unterhaltungsdaten verwenden.

Hinweis

  1. Folgen Sie der Anleitung unter Dialogflow einrichten, um Dialogflow in einem GCP-Projekt (Google Cloud Platform) zu aktivieren.
  2. Aktivieren Sie die Data Labeling API für Ihr Projekt.
  3. Wir empfehlen, die Seite Grundlagen zu Agent Assist zu lesen, bevor Sie mit dieser Anleitung beginnen.
  4. (Optional) In der Dokumentation zur Verwendung der öffentlich verfügbaren Unterhaltungsdaten und des Modells können Sie das das Feature "Intelligente Antwort" testen, ohne Ihre eigenen Daten bereitzustellen. Wenn Sie diese Option auswählen, können Sie mit dem Erstellen eines Unterhaltungsprofils fortfahren, in dem das öffentlich verfügbare Unterhaltungs-Dataset und das vortrainierte Modell verwendet werden.
  5. Wenn Sie "Intelligente Antwort" mit Ihren eigenen Unterhaltungsdaten implementieren, achten Sie darauf, dass die Transkripte in JSON im angegebenen Format und in einem Google Cloud Storage-Bucket gespeichert sind. Ein Unterhaltungs-Dataset muss mindestens 30.000 Unterhaltungen enthalten, andernfalls schlägt das Modelltraining fehl. Als allgemeine Regel gilt: Je mehr Unterhaltungen, desto besser ist die Modellqualität. Es wird empfohlen, Unterhaltungen mit weniger als 20 Nachrichten oder drei Unterhaltungsrunden zu entfernen (Änderungen, bei denen der Teilnehmer eine Äußerung macht). Sie sollten Unterhaltungen aus einem Zeitraum von mindestens drei Monaten hochladen, damit möglichst viele Anwendungsfälle abgedeckt sind. Die maximale Anzahl an Unterhaltungen in einem Unterhaltungs-Dataset beträgt 1.000.000.

  6. Öffnen Sie die Agent Assist Console. Wählen Sie Ihr GCP-Projekt aus und klicken Sie ganz links auf der Seite auf die Menüoption Daten:

    Im Menü Daten werden alle Ihre Daten angezeigt. Es gibt zwei Tabs, jeweils einen für Unterhaltungs-Datasets und Wissensdatenbanken:

  7. Klicken Sie auf den Tab Unterhaltungs-Datasets und dann rechts oben auf der Seite "Unterhaltungs-Datasets" auf die Schaltfläche + Neu erstellen:

Unterhaltungs-Dataset erstellen

  1. Wenn Sie ein neues Unterhaltungs-Dataset erstellen, wird die folgende Seite angezeigt:

  2. Geben Sie unter Name einen Namen und optional eine Beschreibung für das neue Dataset ein. Geben Sie im Feld Unterhaltungsdaten den URI des Storage-Buckets ein, der Ihre Unterhaltungstranskripte enthält. Agent Assist unterstützt die Verwendung des *-Symbols für den Platzhalterabgleich. Der URI muss das folgende Format haben:

    gs://<bucket name>/<object name>
    

    Beispiel:

    gs://mydata/conversationjsons/conv0*.json
    gs://mydatabucket/test/conv.json
    
  3. Am unteren Rand der Seite befindet sich das Drop-down-Menü Ziel:

    Wenn Sie sicher sind, dass Ihr Dataset zum Trainieren eines intelligenten Antwortmodells verwendet wird, können Sie diese Auswahl jetzt treffen. Andernfalls können Sie ein Dataset erstellen, ohne es einem Modelltyp zuzuweisen. Treffen Sie Ihre Auswahl und klicken Sie auf Erstellen. Das neue Dataset wird jetzt in der Dataset-Liste auf der Menüseite Daten des Tabs Unterhaltungs-Datasets angezeigt.

Nächste Schritte

Trainieren Sie ein Modell für intelligente Antworten zu einem oder mehreren Unterhaltungs-Datasets über die Agent Assist Console.