Diese Seite wurde von der Cloud Translation API übersetzt.

Sprachanpassung

Wenn Sie eine Anfrage zur Intent-Erkennung ausführen, können Sie optional Sprachkontext angeben, um dem Erkennungsmodul Hinweise zu geben. Diese Hinweise können in einem bestimmten Unterhaltungsstatus bei der Erkennung helfen.

Automatische Sprachanpassung

Das Feature zur automatischen Sprachanpassung verbessert die Genauigkeit der Spracherkennung Ihres Agents, indem automatisch der Unterhaltungsstatus verwendet wird, um relevante Entitäten und Trainingsformulierungen als Sprachkontexthinweise für alle Anfragen zur Intent-Erkennung zu übergeben. Dieses Feature ist standardmäßig aktiviert.

Automatische Sprachanpassung aktivieren oder deaktivieren

So aktivieren oder deaktivieren Sie die automatische Sprachanpassung:

Rufen Sie die Dialogflow ES-Konsole auf.
Wählen Sie Ihren Agent im oberen Bereich der linken Seitenleiste aus.
Klicken Sie neben dem Namen des Agents auf die Schaltfläche für die Einstellungen.
Wählen Sie den Tab Sprache aus.
Scrollen Sie zum Abschnitt Improve Speech Recognition Quality.
Aktivieren oder deaktivieren Sie die Option Enable Auto Speech Adaptation.

Agent-Design für Verbesserungen der Spracherkennung

Wenn die automatische Sprachanpassung aktiviert ist, können Sie Ihren Agent so erstellen, dass Sie ihn zu Ihrem Nutzen verwenden können. In den folgenden Abschnitten wird erläutert, wie die Spracherkennung durch bestimmte Änderungen an den Trainingsformulierungen, Kontexte und Entitäten Ihres Agents verbessert werden kann.

Trainingsformulierungen und Kontexte

Wenn Sie Trainingsformulierungen mit einer Formulierung wie „stuffy nose“ definieren, wird eine ähnlich klingende Nutzeräußerung zuverlässig als „stuffy nose“ und nicht als „stuff he knows“ erkannt.

Wenn eine Sitzung aktive Kontexte hat, berücksichtigt die automatische Sprachanpassung vorwiegend Trainingsformulierungen von Intents, in denen alle Eingabekontexte aktiv sind. Beispiel: Bei den beiden aktiven Kontexten „pay-bill“ und „confirmation“ wirken sich die folgenden Intents alle auf die automatische Spracherkennung aus: Intents mit einem einzelnen Eingabekontext „pay-bill“, Intents mit einem einzelnen Eingabekontext „confirmation“ und Intents mit zwei Eingabekontexten „pay-bill“ und „confirmation“.

Hinweis :Bei der automatischen Sprachanpassung werden nur die Kontexte berücksichtigt, die am Ende des vorherigen Gesprächsabschnitts aktiv waren. Kontexte, die während der laufenden Anfrage aktiviert werden, wirken sich nicht auf die automatische Sprachanpassung für diese Anfrage aus. Kontexte, die über die API-Methode contexts aktiviert werden, wirken sich nicht auf die automatische Sprachanpassung für die Folgeanfrage aus. Kontexte, die über einen Ereigniseingang oder über die outputContexts beeinflussen die automatische Sprachanpassung für die Folgeanfrage.
Wenn eine Sitzung keine aktiven Kontexte hat, berücksichtigt die automatische Sprachanpassung vorwiegend die Trainingsformulierungen von Intents ohne Eingabekontexte.

Wenn Sie einen erforderlichen Parameter haben, der bei Dialogflow Eingabeaufforderungen zur Slot-Füllung erzwingt, wird die automatische Sprachanpassung vorwiegend die zu füllende Entität berücksichtigen.

In allen Fällen berücksichtigt die automatische Sprachanpassung lediglich die Spracherkennung, ohne sie zu beschränken. Beispiel: Auch wenn Dialogflow einen Nutzer zur Eingabe eines erforderlichen Parameters auffordert, können Nutzer weiterhin andere Intents auslösen, z. B. einen Intent der obersten Ebene „Mit Mitarbeiter sprechen“.

Systementitäten

Wenn Sie eine Trainingsformulierung definieren, in der die @sys.number Systementität verwendet wird und der Endnutzer „Ich möchte zwei“ auf Englisch ausspricht („I want two“), kann dies in der englischen Sprache als „to“, „too“, „2“ oder „two“ erkannt werden.

Wenn die automatische Sprachanpassung aktiviert ist, verwendet Dialogflow bei der Spracherkennung die Entität @sys.number als Hinweis. Der Parameter wird mit größerer Wahrscheinlichkeit als „2“ extrahiert.

Benutzerdefinierte Entitäten

Wenn Sie eine benutzerdefinierte Entität für Produkt- oder Dienstleistungsnamen, die von Ihrem Unternehmen angeboten werden, definieren und der Endnutzer diese Begriffe in einer Äußerung erwähnt, werden sie eher erkannt. Die Trainingsformulierung „I love Dialogflow“, wobei „Dialogflow“ als @product-Entität annotiert ist, gibt der automatischen Sprachanpassung vor, sich an „I love Dialogflow“, „I love Cloud Speech“ und anderen Einträgen in der @product-Entität zu orientieren.
Es ist besonders wichtig, dass Sie präzise Entitätssynonyme definieren, wenn Sie Dialogflow zur Spracherkennung verwenden. Angenommen, Sie haben zwei @product-Entitätseinträge, „Dialogflow“ und „Dataflow“. Ihre Synonyme für „Dialogflow“ sind beispielsweise „Dialogflow“, „dialogue flow“, „dialogue builder“, „Speaktoit“, „speak to it“, „API.ai“, „API dot AI“. Diese Synonyme sind gut, da sie die gängigsten Varianten abdecken. Sie müssen „the dialogue flow builder“ nicht hinzufügen, da dies von „dialogue flow“ bereits abgedeckt ist.

Hinweis: Warum ist das wichtig? Angenommen, Sie haben zwei Entitäten "Dialogflow“ und "Dataflow“ und zwei Synonyme sind "the dialogue flow builder“ und "Google Cloud Dataflow". Ein Endnutzer sagt möglicherweise "Google Cloud Dialogflow" in angemessener Weise. Da es jedoch kein "Google Cloud Dialogflow"-Synonym gibt, hört die Spracherkennung wahrscheinlich "Google Cloud Dataflow", da die Entitätsdefinitionen sind auf diese Wortgruppe ausgerichtet. Wenn jemand die Sprache "Dataflow-Builder" sagt, hören Sie höchstwahrscheinlich "Dialogflow-Builder", da dies die einzige mit "Builder" definierte Entität ist. Stattdessen erhalten Sie eine bessere Leistung, wenn Sie nur die im obigen Aufzählungspunkt aufgeführten Schlüsselformulierungen definieren. Zusammenfassung: Achten Sie darauf, keine allgemeinen Daten zu Entitätsdefinitionen hinzuzufügen, da dies die Intent-Trainingsformulierungen sind. Die Trainingsformulierung "Google Cloud Dataflow", wobei "Dataflow" als @product-Entität annotiert ist, ermöglicht die automatische Sprachanpassung, um "Google Cloud Dataflow" und "Google Cloud Dialogflow" mit gleicher Gewichtung zu überwachen. Weitere Best Practices finden Sie unter Agent-Design.

Nutzeräußerungen mit aufeinanderfolgenden, aber separaten Zahlenentitäten können mehrdeutig sein. Beispiel: „I want two sixteen packs“ könnten 2 Pakete mit 16 Sets oder 216 Mengen bedeuten. Durch die Sprachanpassung lassen sich solche Fälle eindeutig unterscheiden, wenn Sie Entitäten mit buchstabierten Werten einrichten:
- Definieren Sie eine quantity-Entität mit folgenden Einträgen:
  zero
  one
  ...
  twenty
- Definieren Sie eine product- oder size- Entität mit folgenden Einträgen:
  sixteen pack
  two ounce
  ...
  five liter
- In der Sprachanpassung werden nur Entitätssynonyme verwendet. Sie können also eine Entität mit dem Referenzwert 1 und dem einzelnen Synonym one definieren, um die Auftragsausführungslogik zu vereinfachen.

RegExp-Entitäten

RegExp-Entitäten können bei korrekter Konfiguration und ‑prüfung die automatische Sprachanpassung für alphanumerische und Ziffernsequenzen wie „ABC123“ oder „12345“ auslösen.

Wenn Sie diese Sequenzen über Sprache erkennen möchten, müssen Sie alle vier der folgenden Anforderungen implementieren:

1. Regexp-Eingabeanforderung

Jeder reguläre Ausdruck lässt sich zum Extrahieren von Entitäten aus Texteingaben verwenden, aber nur bestimmte Ausdrücke geben der automatischen Sprachanpassung vor, vorwiegend buchstabierte alphanumerische oder Ziffernsequenzen zu berücksichtigen.

In der RegExp-Entität muss mindestens ein Eintrag allen folgenden Regeln folgen:

Muss mit einigen alphanumerischen Zeichen übereinstimmen, z. B. \d, \w oder [a-zA-Z0-9].
Darf keine Leerzeichen, oder \s enthalten, wobei \s* und \s? zulässig sind
Sollte keine Erfassungs- oder Nichterfassungsgruppen enthalten ()
Es sollte nicht versucht werden, Sonderzeichen oder Satzzeichen wie ` ~ ! @ # $ % ^ & * ( ) - _ = + , . < > / ? ; ' : " [ ] { } \ | zu finden.

Dieser Eintrag kann Zeichensätze [] und Wiederholungsquantifizierer wie *, ?, + oder {3,5} enthalten.

Beispiele

2. Anforderung an die Parameterdefinition

Markieren Sie die RegExp-Entität als erforderlichen Intent-Parameter, damit sie während der Slot-Füllung erfasst werden kann. Dadurch kann die automatische Sprachanpassung stark auf die Sequenzerkennung ausgerichtet werden, anstatt zu versuchen, einen Intent und eine Sequenz gleichzeitig zu erkennen. Andernfalls könnte „Wo ist mein Paket für ABC123“ als „Wo ist mein Paket 4ABC123“ falsch erkannt werden.

3. Anforderung an die Anmerkung von Trainingsformulierungen

Verwenden Sie die reguläre Regexp-Entität nicht für eine Intent-Annotation für Trainingsformulierungen. Dadurch wird der Parameter im Rahmen der Slot-Füllung aufgelöst.

4. Testanforderungen

Weitere Informationen finden Sie unter Sprachanpassung testen.

Beispiele

Beispielsweise löst eine RegExp-Entität mit einem einzelnen Eintrag ([a-zA-Z0-9]\s?){5,9} nicht die Sprachsequenzerkennung aus, da sie eine Erfassungsgruppe enthält. Um das Problem zu beheben, fügen Sie einfach einen weiteren Eintrag für [a-zA-Z0-9]{5,9} hinzu. Nun profitieren Sie von der Sequenzerkennung, wenn Sie „ABC123“ abgleichen, aber die NLU ordnet noch Eingaben wie „ABC 123“ zu, dank der ursprünglichen Regel, die Leerzeichen zulässt.

Die folgenden Beispiele für reguläre Ausdrücke passen sich für alphanumerische Sequenzen an:

^[A-Za-z0-9]{1,10}$
WAC\d+
215[2-8]{3}[A-Z]+
[a-zA-Z]\s?[a-zA-Z]\s?[0-9]\s?[0-9]\s?[0-9]\s?[a-zA-Z]\s?[a-zA-Z]

Die folgenden Beispiele für reguläre Ausdrücke passen sich für Ziffernsequenzen an:

\d{2,8}
^[0-9]+$
2[0-9]{7}
[2-9]\d{2}[0-8]{3}\d{4}

Problemumgehung für reguläre Ausdrücke

Die integrierte Unterstützung einer automatischen Sprachanpassung für RegExp-Entitäten variiert je nach Sprache. Unter Sprachklassen-Tokens finden Sie die unterstützten Sprachen $OOV_CLASS_ALPHANUMERIC_SEQUENCE und $OOV_CLASS_DIGIT_SEQUENCE.

Ist Ihre Sprache nicht aufgeführt, können Sie diese Einschränkung umgehen. Wenn Sie beispielsweise möchten, dass eine Mitarbeiter-ID, bei der auf drei Buchstaben drei Ziffern folgen, richtig erkannt wird, können Sie den Agent mit den folgenden Entitäten und Parametern erstellen:

Definieren Sie eine digit-Entität, die (mit Synonymen) 10 Entitätseinträge enthält:
0, 0
1, 1
...
9, 9
Definieren Sie eine letter-Entität, die (mit Synonymen) 26 Entitätseinträge enthält:
A, A
B, B
...
Z, Z
Definieren Sie eine employee-id-Entität, die einen einzigen Entitätseintrag (ohne Synonyme) enthält:
@letter @letter @letter @digit @digit @digit
Verwenden Sie @employee-id als Parameter in einer Trainingsformulierung.

Sprachanpassung testen

Wenn Sie die Sprachadaptierungsfunktionen Ihres Agents für eine bestimmte Trainingsphrase oder Entitätsübereinstimmung testen, sollten Sie nicht direkt mit dem Testen der Übereinstimmung mit der ersten Sprachäußerung einer Unterhaltung beginnen. Verwenden Sie für die gesamte Unterhaltung vor dem Abgleich, den Sie testen möchten, nur Sprach- oder Ereigniseingaben. Das Verhalten Ihres Agents bei einem solchen Test ähnelt dem Verhalten in echten Produktionsunterhaltungen.

Beschränkungen

Es gelten folgende Einschränkungen:

Die Sprachanpassung ist nicht für alle Sprachmodelle und Sprachkombinationen verfügbar. Auf der Seite zur Sprachunterstützung von Cloud Speech können Sie nachsehen, ob die Modellanpassung für Ihr Sprachmodell und Ihre Sprachkombination verfügbar ist.

Die automatische Sprachanpassung kann für Actions on Google (Google Assistant) nicht verwendet werden, da die Spracherkennung von Actions on Google durchgeführt wird, bevor Daten an Dialogflow gesendet werden.

Das Erkennen langer Zeichensequenzen ist schwierig. Die Anzahl der Zeichen, die in einer einzelnen Runde erfasst werden, hängt direkt von der Qualität der Audioeingabe ab. Wenn Ihre Integration beispielsweise auf Anrufaudio basiert, müssen Sie erweiterte Sprachmodelle aktivieren, um alphanumerische Sequenzen mit mehr als vier oder fünf Zeichen oder Ziffernsequenzen mit mehr als 10 Zeichen zuverlässig zu erkennen. Wenn Sie alle Richtlinien für RegExp-Entitäten befolgt haben und es immer noch nicht gelingt, die gesamte Sequenz in einer einzigen Antwort zu erfassen, können Sie einige alternative Konversationsoptionen in Betracht ziehen:
- Wenn Sie die Sequenz anhand einer Datenbank validieren, sollten Sie Querverweise für andere erfasste Parameter wie Datumsangaben, Namen oder Telefonnummern erstellen, um unvollständige Übereinstimmungen zu ermöglichen. Fragen Sie einen Nutzer beispielsweise nicht nur nach seiner Bestellnummer, sondern auch nach seiner Telefonnummer. Wenn der Webhook nun die Datenbank nach dem Bestellstatus abfragt, kann er sich zuerst auf die Telefonnummer verlassen und dann die am besten übereinstimmende Bestellung für dieses Konto zurückgeben. Dies könnte dazu führen, dass Dialogflow „ABC“ falsch als „AVC“ erkennt, aber dennoch den korrekten Bestellstatus für den Nutzer zurückgibt.
- Bei extra langen Sequenzen sollten Sie vielleicht einen Ablauf entwerfen, der Endnutzer dazu veranlasst, eine Pause zu machen, sodass der Bot die Eingabe bestätigen kann. In dieser Anleitung finden Sie weitere Informationen.

Zurück

Sprachmodelle

Weiter

Erweiterte Sprachmodelle