Nozioni di base su Dialogflow CX

Questo documento descrive le nozioni di base sull'utilizzo di Dialogflow CX. Fornisce una panoramica dei concetti più importanti.

Agenti

R Agente Dialogflow CX è un agente virtuale che gestisce le conversazioni simultanee con i tuoi utenti finali. È un modulo di comprensione del linguaggio naturale che comprende le sfumature del linguaggio umano. Dialogflow CX traduce il testo o l'audio degli utenti finali durante una conversazione ai dati strutturati comprensibili per le tue app e i tuoi servizi. Progetti e crei un agente Dialogflow CX per gestire i tipi di conversazione richiesti per il tuo sistema.

Un agente Dialogflow CX è simile a un agente umano di call center. Devi addestrare entrambi a gestire gli scenari di conversazione previsti, e non è necessario che sia eccessivamente esplicita.

Flussi

Le finestre di dialogo complesse spesso coinvolgono più argomenti di conversazione. Ad esempio, un addetto alla consegna di pizza potrebbe avere ordine di cibo, dati del cliente e conferma come argomenti distinti. Ogni argomento richiede più turni di conversazione per un agente per acquisire le informazioni pertinenti dall'utente finale.

Flussi vengono utilizzati per definire questi argomenti e i percorsi conversazionali associati. Ogni agente ha un flusso chiamato Flusso di avvio predefinito. Questo flusso singolo potrebbe essere tutto ciò di cui hai bisogno per un agente semplice. Gli agenti più complicati possono richiedere flussi aggiuntivi, e diversi membri del team di sviluppo possono essere responsabili della creazione e la gestione di questi flussi. Ad esempio, i flussi di un addetto alla consegna di pizza possono avere il seguente aspetto:

Esempio di diagramma a più flussi.

Pagine

Una conversazione (sessione) Dialogflow CX può essere descritta e visualizzata come macchina a stato. Gli stati di una sessione sono rappresentati pagine.

Per ogni flow, devi definire molte pagine, in cui le pagine combinate possano gestire una conversazione completa agli argomenti per cui è stato progettato il flusso. In qualsiasi momento esattamente una pagina è la pagina corrente, la pagina corrente è considerata attiva e il flusso associato a quella pagina è considerato attivo. Ogni flusso ha uno speciale pagina iniziale. Quando un flusso diventa inizialmente attivo, la pagina iniziale diventa la pagina corrente. Per ogni svolta colloquiale, la pagina corrente rimarrà invariata o passerà a un'altra.

Configura ogni pagina in modo che raccolga informazioni dell'utente finale pertinenti per lo stato conversazionale rappresentato dalla pagina. Ad esempio, potresti creare le pagine (in blu) nello schema seguente per un flusso Ordinazione cibo di un addetto alla consegna di pizza. Il nodo Start del diagramma rappresenta la pagina iniziale del flusso Ordinazione di cibo. Una volta completato, passa al flusso Confirmation (Conferma).

Esempio di diagramma a più flussi.

Tipi di entità

Tipi di entità per controllare il modo in cui vengono estratti i dati dell'input dell'utente finale.

Dialogflow CX fornisce risorse entità di sistema che possono corrispondere a molti tipi di dati comuni. Ad esempio, esistono entità di sistema per le date corrispondenti, orari, colori, indirizzi email e così via. Puoi anche creare entità personalizzate per trovare corrispondenze con i dati personalizzati. Ad esempio: Puoi definire un'entità vegetale che possono corrispondere ai tipi di ortaggi disponibili per l'acquisto da parte di un agente di un negozio di alimentari.

Parametri

Parametri vengono utilizzati per acquisire e fare riferimento forniti dall'utente finale durante una sessione. Ogni parametro ha un nome e un tipo di entità. A differenza dell'input non elaborato dell'utente finale, sono dati strutturati, che possono essere facilmente utilizzati per eseguire alcune logiche o generare risposte.

Moduli

Per ogni pagina puoi definire modulo, un elenco di parametri che deve essere raccolto dall'utente finale per la pagina. L'agente interagisce con l'utente finale in più turni di conversazione, finché non ha raccolto tutti i parametri del modulo richiesti, chiamati anche parametri di pagina. L'agente raccoglie questi parametri nell'ordine definito nella pagina. Per ogni parametro obbligatorio del modulo, fornisci anche messaggi che l'agente utilizza richiedere queste informazioni all'utente finale. Questa procedura è chiamata compilazione di moduli.

Ad esempio, puoi creare un modulo che raccoglie il nome dell'utente finale e numero di telefono per una pagina Collect Customer Info.

Intent

Un intent classifica le intenzioni di un utente finale per un turno di conversazione.

Un intent contiene i seguenti dati:

Termine Definizione
Nome visualizzato Nome visualizzato sulla console per l'intent.
Etichette Etichette che consentono di classificare gli intent. Ad esempio: head intent.
Frasi di addestramento Frasi di addestramento sono frasi di esempio che descrivono gli utenti finali che potrebbero digitare o dire noto come input dell'utente finale. Quando input utente finale assomiglia a una di queste frasi, Dialogflow CX corrisponde all'intent. Non è necessario definire ogni possibile esempio, perché il machine learning integrato di Dialogflow CX espande nel tuo elenco con altre frasi simili.
Parametri Sei tu a definire le frasi di addestramento da usare parametri per estrarre valori da parti specifiche dell'input dell'utente finale.
Pattern DTMF Consulta DTMF per le integrazioni della telefonia.

Webhook

Webhook sono servizi che ospitano la tua logica di business o chiamare altri servizi. Durante una sessione, i webhook ti consentono di usare i dati estratti dall'elaborazione del linguaggio naturale di Dialogflow CX generare risposte dinamiche, convalidare i dati raccolti o attivare azioni sul backend.

Un webhook può essere un web webhook standard o un webhook flessibile. Con un webhook standard, i campi di richiesta e risposta sono definiti da Dialogflow. Con un webhook flessibile, devi definire i campi di richiesta e risposta.

Fulfillment

Per il turno colloquiale di un agente, l'agente deve rispondere con una risposta a una domanda una richiesta di informazioni o la chiusura di una sessione. L'agente potrebbe anche dover contattare il servizio per generare risposte dinamiche o eseguire azioni per una svolta. Completamento viene utilizzato per fare tutto questo.

Un fulfillment può contenere uno dei seguenti elementi:

  • Messaggi di risposta statici.
  • Chiamate webhook per risposte dinamiche e/o azioni.
  • Preimpostazioni dei parametri per impostare o sostituire i valori dei parametri.

Durante il turno di un agente, è possibile (e talvolta auspicabile) chiamare più completamenti ognuno dei quali può generare un messaggio di risposta. Dialogflow CX conserva queste risposte in una coda di risposte. Una volta terminato il turno dell'agente, Dialogflow CX invia le risposte ordinate all'utente finale.

Gestori di stato

Gestori di stato, chiamati anche semplicemente gestori, vengono utilizzati per controllare la conversazione creando risposte per gli utenti finali e/o eseguendo la transizione della pagina corrente. Per ogni svolta colloquiale, i gestori vengono valutati e possono influire sulla sessione. I gestori hanno tre tipi generali di dati:

Termine Definizione
Requisiti per i gestori Questi sono i requisiti che devono essere soddisfatti affinché il gestore abbia alcun effetto sulla sessione. Si dice che un gestore viene chiamato quando soddisfa i suoi requisiti. e influisce sulla sessione in qualche modo.
Fulfillment gestore Se viene chiamato un gestore, un'opzione facoltativa fulfillment viene utilizzato per creare risposte per gli utenti finali. Queste risposte sono definiti nei dati statici dell'agente o recuperato dinamicamente dal tuo servizio webhook.
Target della transizione del gestore Se viene chiamato un gestore, viene utilizzato un target di transizione facoltativo per modificare la pagina corrente. La pagina successiva può contenere solo pagina iniziale di Flow o una pagina nel flusso attualmente attivo.

Esistono due tipi di gestori dello stato con requisiti diversi per i gestori:

Termine Definizione
Route Percorsi vengono richiamati quando l'input di un utente finale corrisponde a intent e/o alcune condizione sullo stato della sessione. Una route con requisito di intent è anche chiamata un instradamento dell'intent. Una route con solo un requisito di condizione è chiamato anche percorso delle condizioni.
Gestori di eventi Gestori di eventi vengono richiamate quando viene richiamato un evento. Alcune eventi integrati vengono attivati quando riceve input imprevisto da parte dell'utente finale, o quando si verifica un errore relativo al webhook. Puoi inoltre definire eventi personalizzati che richiami quando succede qualcosa al di fuori della conversazione.

L'elaborazione di un gestore di stato prevede tre passaggi:

Termine Definizione
1. Ambito Per avere un effetto sulla sessione, un gestore deve rientrare nell'ambito. L'ambito è determinato dall'applicazione di un gestore al parametro di un flusso, di una pagina o di un modulo. e se il flusso associato è attivo, la pagina associata è attiva o l'agente sta attualmente tentando di compilare il parametro del modulo associato.
2. Valutazione Ogni gestore nell'ambito viene valutato in ordine. Se i requisiti di un gestore vengono soddisfatti, il gestore supera la valutazione.
3. Chiamata Se un gestore rientra nell'ambito e supera la valutazione, viene chiamato. Vengono chiamati tutti i completamenti associati e tutti i target di transizione associati vengono applicati alla sessione.

Impostazioni regionali e di geolocalizzazione

Quando crei un agente, devi specificare region [regione] come località dell'agente. Le richieste inviate al tuo agente vengono gestite dai servizi Google in questa regione e Dialogflow CX mantiene i dati at-rest fisicamente all'interno della regione o località geografica. Per un rendimento ottimale, devi scegliere una regione vicina ai tuoi servizi e ai tuoi utenti finali.

Una volta creato un agente, la sua località non può cambiare. Per cambiare la località di un agente, devi esportare e ripristinare a un nuovo agente con una località diversa.

A ogni località sono associate delle impostazioni che si applicano all'intero progetto. Nella maggior parte dei casi non è necessario modificare queste impostazioni di geolocalizzazione, e le impostazioni predefinite funzioneranno bene. Se il tuo impianto richiede chiavi di crittografia gestite dal cliente (spesso richieste da enti governativi o settori regolamentati), scopri di più su impostazioni di geolocalizzazione.

Console

Dialogflow CX offre un'interfaccia utente web chiamata Console Dialogflow CX (visita la documentazione e apri la console). Puoi utilizzare questa console per creare, creare e testare agenti. Traccia ogni flusso come un diagramma di macchina a stato conversazionale, che semplifica la progettazione e la comprensione degli agenti complessi.

La console Dialogflow CX è diversa dalla Google Cloud Console (consulta la documentazione, apri la console). La console Dialogflow CX viene utilizzata per gestire gli agenti Dialogflow CX, mentre la Google Cloud Console viene utilizzata per gestire le impostazioni di Dialogflow CX specifiche per Google Cloud (ad es. fatturazione) e altre risorse Google Cloud.

Nella maggior parte dei casi devi utilizzare la console Dialogflow CX per creare agenti, ma puoi anche usare l'API Dialogflow per creare agenti per scenari avanzati.

Integrazioni

Dialogflow CX offre diverse soluzioni integrate integrazioni con altre piattaforme di conversazione. Queste integrazioni forniscono un'interfaccia utente all'utente finale, e chiama l'API per te. Devi solo creare il tuo agente e, facoltativamente, implementare un webhook completamente gestito di Google Cloud. Ogni integrazione gestisce le interazioni in un modo specifico della piattaforma, consulta la documentazione sull'integrazione specifica per maggiori dettagli.

Interazioni

Per ogni turno di conversazione, ha luogo un'interazione. Durante un'interazione, un utente finale invia un input a Dialogflow CX, e Dialogflow CX invia una risposta. Hai due opzioni per implementare il sistema per gestire le interazioni, ad esempio tramite l'API o un'integrazione.

Quando utilizzando l'API, il sistema deve gestire quanto segue:

  • Crea un agente.
  • Fornisci un'interfaccia utente per gli utenti finali.
  • Chiama l'API Dialogflow per ogni svolta di conversazione per inviare input utente finale all'API.
  • A meno che le risposte dell'agente non siano puramente statiche (non comuni), devi ospitare un servizio webhook per gestire i webhook abilitati fulfillment.

Se utilizzi un integrazione, il sistema deve gestire solo quanto segue:

  • Crea un agente.
  • Facoltativamente, implementa un servizio webhook.

Il seguente diagramma mostra i passaggi che vengono eseguiti per un solo turno di conversazione durante una sessione.

Diagramma di flusso dell'API.

  1. L'utente finale digita o dice qualcosa, noto come input dell'utente finale.
  2. L'interfaccia utente o il sistema di integrazione riceve l'input. e la inoltra all'API Dialogflow in una richiesta di rilevamento dell'intento.
  3. L'API Dialogflow riceve la richiesta di rilevamento di intent. Corrisponde all'input di un intent o a un parametro del modulo imposta i parametri in base alle esigenze e aggiorna lo stato della sessione. Se deve chiamare un fulfillment abilitato per webhook, invia una richiesta webhook al tuo servizio webhook altrimenti vai al passaggio 6.
  4. Il tuo servizio webhook riceve la richiesta di webhook. Il servizio esegue le azioni necessarie, come le chiamate ad API esterne, eseguire query o aggiornare un database e così via.
  5. Il servizio webhook crea una risposta e invia un risposta webhook a Dialogflow CX.
  6. Dialogflow CX crea una risposta di rilevamento dell'intento. Se è stato chiamato un webhook, utilizza la risposta fornita. nella risposta webhook. Se non è stato chiamato alcun webhook, utilizza la risposta statica. definiti nell'agente. Dialogflow CX invia una risposta di rilevamento di intent all'interfaccia utente o al sistema di integrazione.
  7. L'interfaccia utente o il sistema di integrazione riceve la risposta di rilevamento dell'intento e inoltra il testo o la risposta audio all'utente finale.
  8. L'utente finale vede o sente la risposta.