Un set di dati di conversazione contiene i dati della trascrizione della conversazione e viene utilizzato per addestrare un modello personalizzato di Risposta rapida o Riepilogo. Risposta intelligente utilizza le trascrizioni delle conversazioni per consigliare risposte di testo agli agenti umani che conversano con un utente finale. I modelli di sintesi personalizzati vengono addestrati su set di dati di conversazione che contengono sia trascrizioni sia annotazioni. Utilizzano le annotazioni per generare riepiloghi della conversazione per gli agenti umani al termine di una conversazione.
Esistono due modi per creare un set di dati: utilizzando i flussi di lavoro del tutorial della console o creando manualmente un set di dati nella console utilizzando la scheda Dati -> Set di dati. Ti consigliamo di utilizzare i tutorial della Console come prima opzione. Per utilizzare i tutorial della console, vai alla console Agent Assist e fai clic sul pulsante Inizia sotto la funzionalità che vuoi testare.
Questa pagina mostra come creare un set di dati manualmente.
Prima di iniziare
Segui le istruzioni di configurazione di Dialogflow per attivare Dialogflow in un progetto Google Cloud Platform.
Ti consigliamo di leggere la pagina relativa alle nozioni di base di Agent Assist prima di iniziare questo tutorial.
Se stai implementando Risposta rapida utilizzando i tuoi dati della trascrizione, assicurati che le trascrizioni siano in
JSON
nel formato specificato e archiviate in un bucket Google Cloud Storage. Un set di dati di conversazione deve contenere almeno 30.000 conversazioni, altrimenti l'addestramento del modello non andrà a buon fine. Come regola generale, più conversazioni hai, migliore sarà la qualità del modello. Ti consigliamo di rimuovere le conversazioni con meno di 20 messaggi o 3 turni di conversazione (modifiche in cui il partecipante emette un'espressione). Ti consigliamo inoltre di rimuovere eventuali messaggi del bot o messaggi generati automaticamente dai sistemi (ad esempio, "L'agente entra nella chat room"). Ti consigliamo di caricare almeno 3 mesi di conversazioni per garantire la copertura del maggior numero possibile di casi d'uso. Il numero massimo di conversazioni in un set di dati di conversazione è 1.000.000.Se stai implementando il riepilogo utilizzando i tuoi dati di trascrizione e annotazione, assicurati che le trascrizioni siano nel formato specificato e archiviate in un bucket Google Cloud Storage. Il numero minimo consigliato di annotazioni di addestramento è 1000. Il numero minimo obbligatorio è 100.
Vai alla console Agent Assist. Seleziona il tuo progetto Google Cloud Platform, poi fai clic sull'opzione di menu Dati sul margine a sinistra della pagina. Il menu Dati mostra tutti i tuoi dati. Sono presenti due schede, una per i set di dati conversazionali e una per le knowledge base.
Fai clic sulla scheda Set di dati conversazionali, quindi sul pulsante + Crea nuovo nella parte in alto a destra della pagina dei set di dati conversazionali.
Creare un set di dati di conversazione
Inserisci un Nome e una Descrizione facoltativa per il nuovo set di dati. Nel campo Dati conversazione, inserisci l'URI del bucket di archiviazione che contiene le trascrizioni delle conversazioni. Agent Assist supporta l'utilizzo del simbolo
*
per la corrispondenza con caratteri jolly. L'URI deve avere il seguente formato:gs://<bucket name>/<object name>
Ad esempio:
gs://mydata/conversationjsons/conv0*.json gs://mydatabucket/test/conv.json
Fai clic su Crea. Il nuovo set di dati viene visualizzato nell'elenco dei set di dati nella pagina del menu Dati, nella scheda Set di dati conversazionali.
Passaggi successivi
Addestra un modello di risposta rapida o di riepilogo su uno o più set di dati di conversazione utilizzando la console Agent Assist.