In diesem Dokument werden die Grundlagen der Verwendung von Dialogflow CX-Abläufen (Conversational Agents) zum Erstellen eines Agents beschrieben. Es bietet eine Übersicht über die wichtigsten Konzepte.
Agents
A Conversational Agents (Dialogflow CX)-Agent ist ein virtueller Kundenservicemitarbeiter der gleichzeitige Unterhaltungen mit Ihren Endnutzern abwickelt. Mithilfe von Natural Language Understanding (NLU) versteht der Agent die Nuancen der menschlichen Sprache. Conversational Agents (Dialogflow CX) übersetzen den Text oder Audio von Endnutzern während einer Unterhaltung bis hin zu strukturierten Daten, die Ihre Apps und Dienste verstehen können. Sie entwerfen und erstellen einen Agent für Conversational Agents (Dialogflow CX) um die für Ihr System erforderlichen Arten von Unterhaltungen zu verarbeiten.
Ein Konversations-Agent (Dialogflow CX) ähnelt einem menschlichen Callcenter-Agent. Beide werden für die Bearbeitung erwarteter Szenarien trainiert. Dabei sind keine übermäßig genauen Vorgaben nötig.
Abläufe
Komplexe Dialoge enthalten oft mehrere Unterhaltungsthemen. Beispielsweise kann es sein, dass ein Agent für die Pizzaauslieferung Essensbestellung, Kundeninformationen und Bestätigung als unterschiedliche Themen verarbeiten muss. Zu jedem Thema sind dann mehrere Unterhaltungsrunden erforderlich, damit der Agent die relevanten Informationen vom Endnutzer erhält.
Abläufe werden zum Definieren dieser Themen und der zugeordneten Unterhaltungspfade verwendet. Jeder Agent hat einen Ablauf, der als Standardstartablauf bezeichnet wird. Dieser eine Ablauf kann alles sein, was Sie für einen einfachen Agent benötigen. Komplexere Agents können zusätzliche Abläufe erfordern und verschiedene Mitglieder des Entwicklungsteams können für das Erstellen und Verwalten dieser Abläufe verantwortlich sein. Die Abläufe eines Pizza-Lieferdienst-Agents könnten zum Beispiel so aussehen:Seiten
Eine Unterhaltung (Sitzung) mit Conversational Agents (Dialogflow CX) kann als Zustandsmaschine beschrieben und dargestellt werden. Der Status einer Sitzung wird durch Seiten.
Für jeden Ablauf definieren Sie mehrere Seiten, wobei die Gesamtheit der Seiten eine vollständige Unterhaltung zu den Themen ermöglicht, für die der Ablauf bestimmt ist. Es ist immer genaue eine Seite die aktuelle Seite. Diese aktuelle Seite wird als aktiv bezeichnet. Weiter wird der mit dieser Seite verknüpfte Ablauf als aktiv angesehen. Jeder Ablauf hat eine besondere Startseite. Wird ein Ablauf zum ersten Mal aktiviert, wird die Startseite zur aktuellen Seite. Pro Unterhaltungsrunde bleibt die aktuelle Seite entweder gleich oder wechselt zu einer anderen Seite.
Sie konfigurieren jede Seite so, dass vom Endnutzer Informationen erfasst werden, die für den von der Seite dargestellten Unterhaltungsstatus relevant sind. Sie können beispielsweise die Seiten (in Blau) im folgenden Diagramm erstellen, um einen Essensbestellungsablauf eines Pizza-Lieferdienst-Agents zu sehen. Der Startknoten des Diagramms stellt die Startseite des Essensbestellungsablaufs dar. Wenn der Ablauf abgeschlossen ist, wird zur Bestätigung gewechselt.
Entitätstypen
Entitätstypen steuern, wie Daten aus Endnutzereingaben extrahiert werden.Konversations-Agenten (Dialogflow CX) bieten vordefinierte Systementitäten, die mit vielen gängigen Datentypen übereinstimmen. So gibt es beispielsweise Systementitäten für den Abgleich von Datumsangaben, Uhrzeiten, Farben und E-Mail-Adressen. Sie können auch eigene benutzerdefinierte Entitäten erstellen, um benutzerdefinierte Daten zuzuordnen. Es ist zum Beispiel möglich, mit der Entität "Gemüse" alle Gemüsearten zu erfassen, die bei einem Lebensmittelhändler erhältlich sind.
Parameter
Parameter werden zum Erfassen und Referenzieren von Werten verwendet, die der Endnutzer während einer Sitzung bereitgestellt hat. Jeder Parameter hat einen Namen und einen Entitätstyp. Im Unterschied zu unstrukturierten Endnutzereingaben sind Parameter strukturierte Daten, mit denen auf einfache Weise ein bestimmter Ablauf ausgeführt werden kann oder Antworten erzeugt werden können.Formulare
Für jede Seite können Sie ein Formular definieren. Dies ist eine Liste von Parametern, die vom Endnutzer für die Seite erfasst werden sollen. Der Agent interagiert mit dem Endnutzer mehrere Unterhaltungsrunden lang, bis er alle erforderlichen Formularparameter, auch Seitenparameter genannt, erfasst hat. Der Agent erfasst diese Parameter in der auf der Seite definierten Reihenfolge. Für jeden Formularparameter geben Sie auch Aufforderungen an, mit denen der Agent diese Informationen vom Endnutzer anfordert. Dieser Vorgang wird als Ausfüllen von Formularen bezeichnet.
Sie können beispielsweise ein Formular erstellen, in dem der Name und die Telefonnummer des Endnutzers für eine Collect Customer Info
-Seite erfasst werden.
Intents
Ein Intent kategorisiert die Absicht eines Endnutzers für eine Unterhaltungsrunde.
Ein Intent enthält folgende Daten:
Begriff | Definition |
---|---|
Anzeigename | Name, der in der Console für den Intent angezeigt wird. |
Labels | Labels, die bei der Kategorisierung von Intents helfen. Beispiel: head intent. |
Trainingsformulierungen | Trainingsformulierungen sind Beispielformulierungen für das, was Endnutzer eingeben oder sagen könnten, sogenannte Endnutzereingaben. Wenn die Endnutzereingabe einer dieser Formulierungen ähnelt, Konversations-Agents (Dialogflow CX) stimmen mit dem Intent überein. Sie müssen nicht jedes denkbare Beispiel definieren, da das integrierte maschinelle Lernen von Conversational Agents (Dialogflow CX) erweitert wird, mit ähnlichen Formulierungen auf Ihrer Liste. |
Parameter | Sie definieren Ihre Trainingsformulierungen, um mithilfe von Parametern Werte aus bestimmten Teilen der Endnutzereingabe zu extrahieren. |
DTMF-Muster | Informationen zu Telefonieintegrationen in DTMF |
Webhook
Webhooks sind Dienste, die Ihre Geschäftslogik hosten oder andere Dienste aufrufen. Während einer Sitzung können Sie mit Webhooks die Daten verwenden, die Conversational Agents (Dialogflow CX) per Natural Language Processing extrahiert hat, um dynamische Antworten zu generieren, erfasste Daten zu validieren oder Aktionen im Back-End auszulösen.Ein Webhook kann entweder ein Standard-Webhook oder ein flexibler Webhook sein. Bei einem Standard-Webhook werden die Anfrage- und Antwortfelder von Konversations-Agents (Dialogflow CX) definiert. Mit einem flexiblen Webhook die Anfrage- und Antwortfelder.
Auftragsausführung
Damit der Agent an der Unterhaltung teilnehmen kann, muss der Agent auf den Endnutzer mit einer Antwort auf eine Frage, einer Anfrage nach Informationen oder dem Beenden der Sitzung antworten. Ihr Agent muss sich möglicherweise auch mit Ihrem Dienst in Verbindung setzen, um dynamische Antworten zu generieren oder Aktionen für eine weitere Unterhaltungsrunde auszuführen. Auftragsausführung wird für all dies verwendet.
Eine Auftragsausführung kann folgende Elemente enthalten:
- Statische Antwortnachrichten
- Webhook-Aufrufe nach dynamischen Antworten und/oder Aktionen
- Parametervoreinstellungen zum Festlegen oder Überschreiben von Parameterwerten
Während der Unterhaltungsrunde eines Agents ist es möglich (und manchmal gewünscht), mehrere Auftragsausführungen aufzurufen, von denen jede eine Antwort erzeugen kann. Konversations-Agents (Dialogflow CX) speichern diese Antworten in einer Antwortwarteschlange. Sobald der Kundenservicemitarbeiter an der Reihe ist, Conversational Agents (Dialogflow CX) senden die geordneten Antworten an den Endnutzer.
Zustands-Handler
Zustands-Handler, auch einfach Handler genannt, werden zur Steuerung der Unterhaltung verwendet. Handler erstellen Antworten für Endnutzer und/oder wechseln die aktuelle Seite. Für jede Unterhaltungsrunde werden Handler ausgewertet. Dies kann sich auf die Sitzung auswirken. Handler haben drei allgemeine Datentypen:Begriff | Definition |
---|---|
Handler-Anforderungen | Dies sind die Anforderungen, die erfüllt sein müssen, damit sich der Handler auf die Sitzung auswirkt. Ein Handler gilt als aufgerufen, wenn er seine Anforderungen erfüllt und die Sitzung in irgendeiner Weise beeinflusst. |
Handler-Auftragsausführung | Wenn ein Handler aufgerufen wird, werden mit einer optionalen Auftragsausführung Antworten für Endnutzer erstellt. Diese Antworten sind entweder in statischen Agent-Daten definiert oder werden dynamisch aus Ihrem Webhook-Dienst abgerufen. |
Handler-Umstellungsziel | Nach dem Aufruf eines Handlers wird ein optionales Umstellungsziel verwendet, um die aktuelle Seite zu ändern. Die nächste Seite kann nur eine Ablauf-Startseite oder eine Seite im aktuell aktiven Ablauf sein. |
Es gibt zwei Arten von Zustands-Handlern mit unterschiedlichen Handler-Anforderungen:
Begriff | Definition |
---|---|
Routen | Routen werden aufgerufen, wenn eine Endnutzereingabe mit einem Intent übereinstimmt und/oder eine Bedingung für den Sitzungsstatus erfüllt ist. Eine Route mit einer Intent-Anforderung wird auch als Intent-Route bezeichnet. Eine Route mit lediglich einer Bedingungsanforderung wird auch als Bedingungsroute bezeichnet. |
Event-Handler | Ereignis-Handler werden aufgerufen, wenn ein Ereignis eintritt. Einige integrierte Ereignisse werden ausgelöst, wenn unerwartete Endnutzereingaben empfangen werden oder wenn ein Webhook-Fehler auftritt. Sie können auch benutzerdefinierte Ereignisse definieren, die aufgerufen werden, wenn etwas außerhalb der Unterhaltung stattfindet. |
Die Verarbeitung eines Zustands-Handlers umfasst drei Schritte:
Begriff | Definition |
---|---|
1. Umfang | Ein Handler muss sich im Bereich befinden, um Auswirkungen auf die Sitzung zu haben. Der Bereich wird dadurch bestimmt, ob ein Handler auf einen Ablauf, eine Seite oder einen Formularparameter angewendet wird und ob der verknüpfte Ablauf aktiv ist, die zugehörige Seite aktiv ist oder der Agent versucht, den zugehörigen Formularparameter auszufüllen. |
2. Bewertung | Jeder Handler im Bereich wird der Reihe nach ausgewertet. Wenn die Anforderungen eines Handlers erfüllt sind, gilt die Bewertung als bestanden. |
3. Aufruf | Wenn ein Handler im Bereich liegt und die Bewertung besteht, wird er aufgerufen. Zugehörige Auftragsausführungen werden aufgerufen und zugehörige Umstellungsziele werden auf die Sitzung angewendet. |
Regionalisierung und Standorteinstellungen
Wenn Sie einen Agent erstellen, müssen Sie eine Region als Speicherort des Agents angeben. An Ihren Agent gesendete Anfragen werden von Google-Diensten in dieser Region verarbeitet und Conversational Agents (Dialogflow CX) sorgen dafür, dass ruhende Daten bleiben. sich innerhalb der geografischen Region oder des geografischen Standorts befinden. Für eine optimale Leistung sollten Sie eine Region in der Nähe Ihrer Dienste und Endnutzer auswählen.
Nachdem ein Agent erstellt wurde, kann dessen Speicherort nicht mehr geändert werden. Wenn Sie den Standort eines Agents ändern möchten, müssen Sie einen neuen Agent mit einem anderen Standort erstellen und den Agent dorthin exportieren und wiederherstellen.
Jedem Standort sind Einstellungen zugeordnet, die für Ihr Projekt gelten. In den meisten Fällen müssen Sie diese Standorteinstellungen nicht bearbeiten und die Standardeinstellungen funktionieren gut. Wenn Ihr System vom Kunden verwaltete Verschlüsselungsschlüssel benötigt und diese häufig von Behörden oder regulierten Branchen benötigt werden, finden Sie weitere Informationen zu Standorteinstellungen.
Console
Konversations-Agents (Dialogflow CX) bieten eine Webbenutzeroberfläche namens Dialogflow CX-Konsole (Dokumentation ansehen, Konsole öffnen). Mit dieser Konsole können Sie Agents erstellen und testen. Sie stellt jeden Ablauf als Maschinendiagramm des Unterhaltungsstatus dar, wodurch komplexe Bots leichter zu entwerfen und zu verstehen sind.
Die Dialogflow CX-Konsole ist anders über die Google Cloud Console (Dokumentation ansehen, Konsole öffnen). Die Dialogflow CX Console dient zum Verwalten von Conversational Agents (Dialogflow CX), während mit der Google Cloud Console Google Cloud-spezifische Conversational Agents (Dialogflow CX)-Einstellungen (z. B. für die Abrechnung) und andere Google Cloud-Ressourcen verwaltet werden.
In den meisten Fällen sollten Sie zum Erstellen von Agents die Dialogflow CX Console verwenden. Agents für komplexere Szenarien können Sie aber auch mit der Dialogflow API erstellen.
Integrationen
Conversational Agents (Dialogflow CX) bieten mehrere integrierte Funktionen, Integrationen mit anderen Kommunikationsplattformen. Diese Integrationen stellen dem Endnutzer eine Benutzeroberfläche zur Verfügung und rufen die API für Sie auf. Sie müssen lediglich einen Agent erstellen und optional einen Webhook-Dienst implementieren. Jede Integration behandelt die Interaktionen plattformspezifisch. Weitere Informationen finden Sie in der jeweiligen Integrationsdokumentation.
Interactions
Für jede Unterhaltungsrunde findet eine Interaktion statt. Während einer Interaktion sendet ein Endnutzer eine Eingabe an Conversational Agents (Dialogflow CX) und Conversational Agents (Dialogflow CX) sendet eine Antwort. Sie haben zwei Möglichkeiten, Ihr System für die Verarbeitung von Interaktionen zu implementieren: mithilfe der API oder mithilfe einer Integration.
Wenn Sie die API verwenden, muss Ihr System Folgendes verarbeiten:
- Agent erstellen
- Benutzeroberfläche für Endnutzer bereitstellen
- Rufen Sie die Dialogflow API für jeden Sprecherwechsel auf, um Endnutzereingaben an die API zu senden.
- Wenn die Agent-Antworten nicht nur statisch sind (seltener), müssen Sie einen Webhook-Dienst für die Verarbeitung der Webhook-aktivierten Auftragsausführung hosten.
Wenn Sie eine Integration verwenden, muss Ihr System nur Folgendes verarbeiten:
- Agent erstellen
- Implementieren Sie optional einen Webhook-Dienst.
Das folgende Diagramm zeigt die Schritte, die für einen Sprecherwechsel einer Sitzung ausgeführt werden.
- Der Endnutzer gibt etwas ein oder sagt etwas. Dies wird als Endnutzereingabe bezeichnet.
- Ihr Benutzeroberflächen- oder Integrationssystem empfängt die Eingabe und leitet sie in einer Anfrage zur Intent-Erkennung an die Dialogflow API weiter.
- Die Dialogflow API empfängt die Anfrage zur Intent-Erkennung. Sie ordnet die Eingabe einem Intent- oder Formularparameter zu, legt bei Bedarf Parameter fest und aktualisiert den Sitzungsstatus. Falls eine Webhook-fähige Auftragsausführung aufgerufen werden muss, wird eine Webhook-Anfrage an Ihren Webhook-Dienst gesendet. Fahren Sie andernfalls mit Schritt 6 fort.
- Ihr Webhook-Dienst empfängt die Webhook-Anfrage. Der Dienst führt alle erforderlichen Aktionen aus, z. B. das Aufrufen externer APIs, das Abfragen oder Aktualisieren einer Datenbank usw.
- Ihr Webhook-Dienst erstellt eine Antwort und sendet eine Webhook-Antwort an die Conversational Agents (Dialogflow CX) zurückgegeben.
- Konversations-Agents (Dialogflow CX) erstellen eine Antwort zur Intent-Erkennung. Wenn ein Webhook aufgerufen wurde, verwendet es die Webhook-Antwort. Wenn kein Webhook aufgerufen wurde, verwendet es die im Agent definierte statische Antwort. Konversations-Agents (Dialogflow CX) senden eine Antwort zur Intent-Erkennung in Ihre Benutzeroberfläche oder ein Integrationssystem einbinden.
- Ihr Benutzeroberflächen- oder Integrationssystem empfängt die Antwort für die Intent-Erkennung und leitet die Text- oder Audioantwort an den Endnutzer weiter.
- Der Endnutzer sieht oder hört die Antwort.