Estamos cambiando el nombre de algunos productos y funciones. Las funciones de guía y flujo generativos también se están migrando a una única consola consolidada. Consulta los detalles.

Esta página se ha traducido con Cloud Translation API.

Prácticas recomendadas para el diseño de agentes de voz

En esta guía se ofrecen prácticas recomendadas específicas para diseñar agentes de voz. Cuando diseñas un agente de voz, el objetivo es ayudar a los usuarios finales a completar una tarea sin tener que derivarlos a un agente humano. Los usuarios deben sentir que están manteniendo una conversación natural, interactiva y cooperativa con el agente de voz.

También deberías consultar la guía de diseño general de agentes para todos los tipos de agentes y la guía de prácticas recomendadas para usar el servicio Dialogflow.

Medir la calidad de los agentes

Para medir la calidad de la experiencia de usuario de tu agente, te recomendamos que monitorices las siguientes métricas:

Ruta incorrecta: cuántas personas que han llamado han llegado al lugar equivocado.
Resolución en la primera llamada: número de llamadas que se resuelven en la primera llamada o contacto.
Tiempo medio de gestión: tiempo que se tarda en resolver el problema del usuario.
Satisfacción del cliente: la puntuación que obtiene tu agente de voz en una encuesta de usuarios.
Número de turnos: cuántas interacciones se necesitan para completar la tarea del usuario.
Abandono de usuarios: frecuencia con la que los usuarios dejan de participar en la conversación.

Reconocimiento de voz

Los siguientes consejos pueden ayudar a tu agente a reconocer el habla del usuario final:

Tu agente debe animar al usuario final a usar frases largas o completas. De esta forma, se mejora la calidad del reconocimiento.
Te recomendamos que uses un webhook para verificar la entrada del usuario final que puede que no se reconozca con precisión o que deba validarse.
Usa eventos de no coincidencia para pedirle al usuario final que pronuncie más despacio y con claridad.

Estructura de la conversación

Una conversación con un agente de voz suele organizarse en la siguiente secuencia:

Actividad	Ejemplo	Notas
Actividad de apertura	El usuario inicia sesión o llama a tu centro de contacto. Agente de voz: Hola, soy de Travel Inc. ¿En qué puedo ayudarte?	El agente de voz inicia la conversación con un mensaje de bienvenida.
Secuencia principal	Usuario: Quiero reservar un billete de avión. Agente de voz: vale, ¿adónde quieres ir? Usuario: Guatemala, 19 de mayo a las 21:00. Agente de voz: vale, te hemos reservado un billete para Guatemala el 19 de mayo a las 21:00.	El usuario define la tarea y el agente de voz la completa. Puede que el agente de voz tarde varias interacciones en recoger toda la información necesaria.
Cerrar actividad	Agente de voz: ¿Puedo ayudarte en algo más? Usuario: no Agente de voz: vale, gracias por chatear conmigo.	El usuario está listo para finalizar la conversación cuando se haya completado su solicitud.

Actividad

Ejemplo

Notas

Actividad de apertura

El usuario inicia sesión o llama a tu centro de contacto.

Agente de voz: Hola, soy de Travel Inc. ¿En qué puedo ayudarte?

El agente de voz inicia la conversación con un mensaje de bienvenida.

Secuencia principal

Usuario: Quiero reservar un billete de avión.

Agente de voz: vale, ¿adónde quieres ir?

Usuario: Guatemala, 19 de mayo a las 21:00.

Agente de voz: vale, te hemos reservado un billete para Guatemala el 19 de mayo a las 21:00.

El usuario define la tarea y el agente de voz la completa. Puede que el agente de voz tarde varias interacciones en recoger toda la información necesaria.

Cerrar actividad

Agente de voz: ¿Puedo ayudarte en algo más?

Usuario: no

Agente de voz: vale, gracias por chatear conmigo.

El usuario está listo para finalizar la conversación cuando se haya completado su solicitud.

Mensaje de bienvenida

Cuando diseñes el mensaje inicial para el usuario, piensa en cómo llegar al primer tema lo antes posible. El mensaje de bienvenida debe ser breve y directo. Estas son algunas sugerencias:

Responde a la llamada con frases como "Hola".
Identifica al agente de voz con frases como "Soy el agente o asistente de voz de la empresa XYZ".
Mostrar disponibilidad con frases como "¿En qué puedo ayudarte?"

Cualquier información adicional puede frustrar a los usuarios y hacer que se pongan en contacto con un agente humano. Sin embargo, es posible que tengas que ampliar el mensaje de bienvenida por motivos legales, como informar al usuario de que la conversación se puede grabar.

Evita la información que haga que la conversación suene poco natural o desequilibrada. Por ejemplo:

Qué debes hacer	Qué no debes hacer
Usa el lenguaje que quieras que utilicen tus usuarios. Por ejemplo, si quieres que el usuario explique las cosas en una o dos frases, limita tu agente de voz a una o dos frases por turno.	No indiques a los usuarios cómo deben hablar con frases como "en una o dos frases, dime…" o "puedes decir cosas como…".
Céntrate en la tarea que quiere completar el usuario y diseña estrategias de gestión de errores por si la conversación falla.	No digas a los usuarios lo que puede hacer el agente de voz con frases como "Puedo ayudarte a resolver problemas complejos".

Pares de turnos de conversación

Una conversación típica consta de pares de turnos, como los siguientes tipos de intercambios:

Pregunta-respuesta, que es la más habitual en los agentes de voz
invitation-acceptance/rejection
greetings-greetings

A veces, un par de turnos puede incluir texto adicional, como una explicación sobre por qué necesitamos hacer una pregunta, información general relacionada con la pregunta que queremos hacer o una reacción a la respuesta del usuario. Por ejemplo, echa un vistazo al siguiente par de turnos de pregunta y respuesta:

Agente de voz: te costará 10 USD al día. (información o explicación) ¿Quieres seguir añadiendo esta ventaja? (pregunta)

Usuario: Sí. (answer)

Agente de voz: ¡Genial! (reacción)

Consulta también la sección Entrega de la guía de prácticas recomendadas para el diseño de agentes generales, donde encontrarás directrices sobre la colocación de la entrega.

Reparación de conversaciones

La reparación de conversaciones es la práctica de corregir malentendidos, errores al escuchar y errores de articulación para reanudar una conversación. Reparar una conversación puede ayudar a generar confianza en el usuario, ya que demuestra que el agente de voz está escuchando su solicitud.

Te indicamos algunas prácticas recomendadas:

Sé específico y usa el contexto que el usuario ya ha ofrecido en turnos anteriores. Evita hacer preguntas obvias y redundantes, como "No te he entendido", "No lo entiendo" o "Tengo problemas".
Ofrece al usuario la oportunidad de corregir su respuesta, lo que significa permitirle corregir su turno de la forma que considere más adecuada para asegurarse de que tiene el control de la conversación. Evita frases como "prueba a reformularlo" o "puedes decir x, y o z".
Usa la estructura "¿Quieres decir x?" para comprobar si has entendido bien lo que te han dicho.

En la siguiente tabla se describen varios ejemplos de lo que se debe y no se debe hacer:

Qué debes hacer	Qué no debes hacer
Usuario: Voy a viajar a Italia. Agente de Voice: ¿En qué país?	Usuario: Voy a viajar a Italia. Agente de voz: lo siento, estoy teniendo problemas. ¿Puedes reformularlo? ¿A dónde vas?
Usuario: Quiero pagar 80 $. Agente de voz: ¿Quieres decir 80 €? (Repite solo la información que necesita confirmación)	Usuario: Quiero pagar 80 $. Agente de voz: ¿quieres pagar 80 €? (Repite la información redundante "quiero pagar")

Qué debes hacer

Qué no debes hacer

Usuario: Voy a viajar a Italia.

Agente de Voice: ¿En qué país?

Usuario: Voy a viajar a Italia.

Agente de voz: lo siento, estoy teniendo problemas. ¿Puedes reformularlo? ¿A dónde vas?

Usuario: Quiero pagar 80 $.

Agente de voz: ¿Quieres decir 80 €? (Repite solo la información que necesita confirmación)

Usuario: Quiero pagar 80 $.

Agente de voz: ¿quieres pagar 80 €? (Repite la información redundante "quiero pagar")

Gestión de errores

En la siguiente sección se describe cómo gestionar las situaciones en las que falla una conversación.

Sin coincidencias

Un evento No-Match se invoca cuando el agente de voz no encuentra ninguna intención que coincida con lo que ha dicho el usuario.

En la primera instancia del evento No-Match, prueba lo siguiente:

Repite la pregunta al usuario, pero reformúlala de forma más breve para indicar la información que falta. Al centrarse únicamente en la información que falta, el agente de voz transmite implícitamente que ha escuchado el resto de la declaración del usuario.
Puedes añadir "perdón" antes de la pregunta reformulada para indicar que algo ha ido mal por tu parte.

En la segunda instancia del evento No-Match, muestra más claramente que el agente de voz está haciendo un esfuerzo por escuchar. Por ejemplo, echa un vistazo a la siguiente conversación:

Usuario: Voy a viajar a Italia.

Agente de Voice: ¿En qué país?

Usuario: Italia

Agente de voz: Perdona, ¿a qué país vas a viajar?

Sin entrada

Si tu agente de voz no ha recibido ninguna respuesta verbal del usuario, repite la pregunta de la misma forma que la primera vez. En la segunda instancia del evento No-Input, puedes reformular la pregunta original, pero asegúrate de que estén presentes todos los componentes originales de la pregunta.

Limitar las repeticiones de no coincidencia y de no introducción

Para evitar que los usuarios se queden atrapados en un bucle de eventos de gestión de errores, implementa un máximo de 3 para cada página en los casos de No-Match/No-Input. Deriva a los usuarios a un agente humano después del tercer evento No-Match o No-Input.

Tiempo de espera sin voz

En las situaciones en las que los usuarios tengan que revisar información o tomar decisiones antes de continuar, aumenta el valor de no-speech-timeout para darles tiempo suficiente para responder.

En el siguiente ejemplo, el ajuste de tiempo de espera sin habla de 2 segundos es demasiado corto para que el usuario lea un mensaje SMS y tome una decisión:

Agente de voz: te he enviado un mensaje de texto a tu dispositivo. Haz clic en el enlace para obtener información sobre el pase de viaje. Pondré música para que tengas tiempo de leer el texto y volver a hablar conmigo. <pausa de 2 segundos> ¿Quieres continuar?

Usuario: Sigo leyendo.

Agente de voz: ¿quieres añadir el pase de viaje a tu plan?

Técnicas de conversación

En esta sección se describen técnicas para ayudar al agente de voz a generar confianza entre los usuarios y a que las conversaciones se desarrollen con mayor fluidez.

Diseñar preguntas prácticas

Diseña preguntas explícitas y prácticas para que tu agente de voz se las haga al usuario. Por ejemplo, ten en cuenta lo siguiente:

Qué debes hacer	Qué no debes hacer
Haz preguntas abiertas, como "¿Cuándo vas a viajar?", que animen al usuario a proporcionar fechas si las sabe o a decir "No lo sé" si no las sabe.	No preguntes "¿Sabes las fechas de tu viaje?", ya que solo se puede responder con un sí o un no y es menos útil.
Pregunta: "¿Quieres consultar el estado de otro paquete?"	No preguntes "¿Quieres consultar el estado de otro paquete?"

También debes preparar tu agente de voz para situaciones en las que el usuario pueda responder a una pregunta de forma implícita, como suele ocurrir en las conversaciones naturales. Por ejemplo, considera la siguiente interacción:

Agente de voz: ve a Cuenta, haz clic en Uso y, a continuación, en Uso por línea. Avísame cuando llegues.

Usuario: dice que no puedo ver datos de hace 3 meses o más.

La respuesta del usuario implica que ha llegado correctamente a la pantalla de destino, pero que aún necesita más ayuda. Tu agente de voz debe anticipar estas implicaciones en lugar de esperar que el usuario solo diga "He llegado" o "No he llegado".

Ganarse la confianza de los usuarios

Los agentes de voz pueden mostrar a los usuarios que les están escuchando mediante confirmaciones y detalles específicos. Si el agente de voz ofrece respuestas genéricas, los usuarios pueden pensar que no suena natural.

Usa confirmaciones. Por ejemplo, en la siguiente conversación, se usa "No hay problema" como confirmación:

Usuario: Quiero concertar un acuerdo de pago para el lunes.

Agente de voz: no hay problema. ¿Cuánto quieres pagar el lunes?
Añade detalles específicos para demostrar que el agente de voz está escuchando activamente al usuario. Por ejemplo, en la conversación anterior, la frase "el lunes" es un detalle específico que indica que el agente de voz ha oído lo que ha dicho el usuario.
Responde a la solicitud del usuario lo antes posible y excluye cualquier paso innecesario. En el siguiente ejemplo, la información superflua puede provocar frustración en el usuario:

Usuario: ¿Hay una interrupción del servicio en mi zona?

Agente de voz: sabemos lo importante que es para ti mantenerte conectado. Vamos a averiguar qué está causando este problema. Indícanos los cuatro últimos dígitos de la línea con la que tienes problemas. Si el problema se produce en varias líneas, indícanos una por ahora.

Usuario: 1234

Agente de voz: gracias. Voy a consultar los pasos que debes seguir para esta línea. Ahora, empecemos. Desactivar y volver a activar la voz en HD temporalmente puede ser la solución. ¿Te ha funcionado?"
Asegúrate de que la conversación entre el usuario y el agente de voz sea equilibrada. Los usuarios pueden sentir que no tienen control sobre la conversación si el agente de voz la domina. Prioriza las preguntas que empiezan por quién, dónde, qué, cuándo y cómo sobre las que empiezan por sí o no.
Asegúrate de que la conversación del usuario se transfiera sin problemas cuando quiera hablar con agentes humanos.

Información adicional

Consulta la guía de diseño de conversaciones del equipo de Actions on Google.
Consulta la guía de prácticas recomendadas de Voice para los próximos mil millones de usuarios.
Consulta la guía de SSML de Cloud Text-to-Speech.
Consulta más información sobre los actos de habla para diseñar preguntas que permitan realizar acciones.

Historial de conversación

Prácticas recomendadas para el diseño de agentes de voz Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

Medir la calidad de los agentes

Reconocimiento de voz

Estructura de la conversación

Mensaje de bienvenida

Pares de turnos de conversación

Reparación de conversaciones

Gestión de errores

Sin coincidencias

Sin entrada

Limitar las repeticiones de no coincidencia y de no introducción

Tiempo de espera sin voz

Técnicas de conversación

Diseñar preguntas prácticas

Ganarse la confianza de los usuarios

Información adicional

Prácticas recomendadas para el diseño de agentes de voz