Prácticas recomendadas para trabajar con la Atención al cliente

En esta guía, se proporcionan prácticas recomendadas para escribir un caso de asistencia eficaz. Sigue estas prácticas recomendadas para ayudarnos a resolver tu caso de asistencia técnica con mayor rapidez.

Cómo crear un caso de asistencia

Antes de crear un caso de asistencia, revisa los problemas conocidos para ver si ya se presentó uno.

Para evitar confusiones y que podamos hacer un seguimiento de tu solicitud en un solo punto, crea un caso de asistencia por problema. Se cierra cualquier caso duplicado que se crea.

Describe tu problema

Redactar casos de asistencia detallados facilita que el equipo de Atención al cliente responda con rapidez y eficiencia. Si se omiten detalles esenciales en tu caso de asistencia, tendremos que pedirte más información, lo que conllevará tiempo adicional.

Los mejores casos de asistencia son detallados y específicos. Nos cuentan lo que sucedió y lo que esperabas que sucediera. Cuando describas el problema en tu caso de asistencia, incluye los siguientes detalles:

Hora: la marca de tiempo específica del momento en que comenzó el problema.
Producto: los productos y las funciones asociados con el problema.
Ubicación: las zonas en las que se presenta el problema.
Identificadores: el ID del proyecto o de la aplicación, y otros identificadores concretos que nos ayuden a investigar el problema.
Artefactos útiles: cualquier información que puedas proporcionar para ayudarnos a diagnosticar el problema.
Tipo de problema: si el problema es intermitente, transitorio o constante.

Las siguientes secciones describen estos conceptos en mayor detalle.

Hora

Dinos cuándo fue la primera vez que notaste el problema y cuánto tiempo duró. Usa el formato ISO 8601 para las fechas y las marcas de tiempo.

Ejemplos:

Entre las 2017-08-09T15:13:06+00:00 y 5 minutos después, observamos que…
Observamos un problema intermitente, que se dio por primera vez el 2017-09-10 y sucedió entre 2 y 5 veces…
El problema está en curso desde las 2017-09-08T15:13:06+00:00…
Desde las 2017-09-08T15:13:06+00:00 hasta las 2017-09-08T15:18:16+00:00…

Es muy probable que el especialista de Atención al cliente que resuelva el problema no esté en tu zona horaria, por lo que las descripciones relativas, como las siguientes, hacen que el problema sea más difícil de diagnosticar:

"Esto comenzó en algún momento de ayer…" (nos obliga a inferir la fecha implícita).
"Notamos el problema el 8/9…" (Es ambiguo, ya que algunas personas pueden interpretar la fecha como el 8 de septiembre y otras, como el 9 de agosto).

Producto

Si bien el formulario de caso básico pide que se especifique un nombre de producto, necesitamos información específica sobre qué función de ese producto tiene el problema. Lo ideal es que tu informe mencione las APIs específicas o las URLs de la consola de Google Cloud (o incluya capturas de pantalla). En el caso de las APIs, puedes agregar un vínculo a la página de documentación que contenga el nombre del producto en la URL.

Indica también cuál es el mecanismo que estás utilizando para iniciar la solicitud (por ejemplo, la API de REST, Google Cloud CLI, la consola de Google Cloud o tal vez una herramienta como Cloud Deployment Manager. Si hay varios productos involucrados, danos cada nombre específicamente.

Ejemplos:

"La API de REST de Compute Engine devolvió los siguientes errores…".
"La interfaz de consulta de BigQuery en console.cloud.google.com no responde…".

Las siguientes afirmaciones no son lo suficientemente específicas para saber dónde buscar al momento de diagnosticar el problema:

"No puedo crear instancias…" (necesitamos saber el método que estás usando para crear instancias).
"El comando gcloud compute create instances muestra un error…" (la sintaxis del comando es incorrecta, por lo que no podemos ejecutarla para reproducir el error; además, no sabemos cuál es el error que se mostró).

Ubicación

Necesitamos conocer la región y la zona de tu centro de datos, ya que, a menudo, implementamos cambios en una región o zona a la vez. La región y la zona nos permiten identificar el número de versión del software subyacente. Esta información nos ayuda a saber si una versión particular de nuestro software incluye cambios rotundos que están afectando tus sistemas.

Ejemplos:

"En us-east1-b…"
"Probé en las regiones us-east1 y us-central1…"

Identificadores

Los identificadores específicos nos ayudan a saber cuál de tus proyectos de Cloud está experimentando el problema. Siempre necesitamos conocer el ID del proyecto en formato alfanumérico o el ID de la aplicación. Los nombres de proyecto no son útiles. Si el problema afecta a varios proyectos, debes incluir todos los ID afectados.

Además de los ID de proyecto o aplicación, hay varios otros identificadores que nos ayudan a diagnosticar tu caso:

ID de instancia
ID de trabajo de BigQuery o nombres de tablas
Direcciones IP

Cuando especifiques una dirección IP, también debes decirnos el contexto en el que se utiliza. Por ejemplo, debes especificar si la IP estaba conectada a una de procesamiento, un balanceador de cargas, una ruta personalizada o un extremo de API. Además, infórmanos si la dirección IP no está relacionada con los sistemas de Google (por ejemplo, si corresponde a tu conexión de Internet local, un extremo de VPN o un sistema de supervisión externo).

Ejemplos:

“En el proyecto robot-name-165473 o my-project-id…”
"En varios proyectos (incluido my-project-id)…"
"Cuando intento establecer una conexión con la IP externa de Google Cloud 218.239.8.9 desde nuestra puerta de enlace empresarial 56.56.56.56…"

Las descripciones generales, como las siguientes, son demasiado vagas, por lo que no son útiles para diagnosticar el problema:

“No podemos conectarnos con una de nuestras instancias…”.
“No podemos conectarnos por Internet…”.

Artefactos útiles

Si nos proporcionas artefactos relacionados con el problema, se acelerará el proceso de solución, ya que podremos ver exactamente lo mismo que tú.

Por ejemplo:

Usa una captura de pantalla para mostrar exactamente lo que ves.
En el caso de las interfaces basadas en la Web, proporciona cualquier información de seguimiento del navegador pertinente.
Adjunta los resultados de tcpdump, fragmentos de registros y ejemplos de seguimientos de pila.

Tipo de problema

Intermitente: Los problemas intermitentes ocurren de forma aleatoria sin patrones de falla habituales. La solución de estos problemas es difícil porque su irregularidad dificulta la recopilación de datos durante la falla. En este caso, debes intentar identificar los cuellos de botella en la arquitectura y verificar si tus recursos están alcanzando su umbral máximo de uso. También puedes ejecutar verificaciones frecuentes en un trabajo programado usando la automatización. Si la verificación no es exitosa, recopila información de depuración durante la falla. Algunos ejemplos de este tipo de errores son la resolución de DNS y la pérdida de paquetes.
Transitorio: Los problemas transitorios son momentáneos o existen solo durante un período breve. Si tienes problemas que ocurren solo durante un segundo o unos microsegundos, puedes comprobar si hay pequeños aumentos de actividad en el tráfico o picos de utilización de recursos. En la mayoría de los casos, los problemas transitorios se pueden ignorar si no se repiten con frecuencia y si el servicio está diseñado para tolerar fallas transitorias. Algunos ejemplos de este tipo de errores son los aumentos repentinos de latencia de red, que ocurren solo durante algunos microsegundos, y las pequeñas pérdidas de paquetes que causan tiempos de espera. Ten en cuenta que el Protocolo de control de transmisión (TCP) está diseñado para tolerar fallas, como pequeñas pérdidas de paquetes y aumentos repentinos de latencia, y puede manejar estos problemas de forma eficaz, a menos que tu aplicación sea sensible a la latencia.
Constante: Los problemas constantes son aquellos que producen fallas totales, como cuando tu sitio web está inactivo. Los problemas constantes son relativamente sencillos de solucionar porque se pueden reproducir. En este caso, indícanos los pasos para reproducir el problema, de modo que nuestros especialistas de Atención al cliente puedan replicar el entorno y solucionar el problema.

Ejemplos de descripciones

En los siguientes ejemplos, se proporcionan descripciones detalladas para los casos de asistencia.

Primer ejemplo

JobName:

A_ATL_BIG1toBQ_big_04)201704202

00045_491

Source:

S3_avl-transfer

Destination:

CloudStorage: avl-transfer

Start time (ISO 8601 format): 2017-04-20 20:14:43 PDT

End time (ISO 8601 format): 2017-04-21 at 10:03:44 PDT

I started a file transfer at 2017-04-20 at 20:14:43 PDT using the transfer API.
This job normally takes 10 minutes to complete, but in this case the job was
still running when I canceled it the next day (2017-04-21 at 10:03:44 PDT). This
is not an isolated event; several other jobs involving the transfer API had
intermittent, significant delays.

Please investigate the cause of the delays and advise of any best practices that
we can implement to prevent these issues in the future.

Segundo ejemplo

Start time (ISO 8601 format): 2017-05-12 at 11:03:43

End time (ISO 8601 format): The issue is still happening as of the time of this
report.

Issue summary:

`/cron/payments-service/sync-v2-batch` cron using the App Engine Task Queue API
has stopped running since 2017-05-12 at 11:03:43. We rely on this job to handle
payments correctly.

We saw datastore and queue errors and then the cron stopped running. We
attempted unsuccessfully to fix the issue by re-uploading cron.xml. Here is the
error trace:

`[error trace]`

Please advise if the issue is with the API or our implementation and let us
know next steps.

Establece la prioridad y deriva

La prioridad nos ayuda a comprender el impacto que este problema tiene en tu negocio y afecta la rapidez con la que respondemos para resolverlo. Las prioridades se definen en la siguiente tabla. Puedes obtener más información en Prioridad de los casos de asistencia.

Definición de prioridad	Ejemplo de situación
P1: Impacto crítico (servicio inutilizable en producción)	La aplicación o infraestructura es inutilizable en producción y presenta una tasa de errores significativa para el usuario El impacto en el negocio es crítico (pérdida de ingresos, posible problema de integridad de los datos, entre otros).
P2: Impacto alto (uso del servicio gravemente afectado)	La infraestructura presenta defectos en la producción, tiene una tasa notoria de errores para el usuario o hay dificultad para iniciar un nuevo sistema de producción. El impacto sobre el negocio es moderado (peligro de pérdida de ingresos, disminución de la productividad, etcétera).
P3: Impacto medio (uso del servicio parcialmente afectado)	El problema está limitado en alcance o severidad. El problema no tiene un impacto visible para el usuario. El impacto comercial es bajo (por ejemplo, inconvenientes o procesos comerciales menores afectados).
P4: Impacto bajo (servicio totalmente utilizable)	El impacto técnico o comercial del problema es escaso o nulo. Se recomienda para tickets de consulta en los que se prefiere el análisis, la solución de problemas o el asesoramiento en profundidad, en lugar de comunicaciones más frecuentes.

Cuándo establecer la prioridad más alta

Si tienes un problema que afecta los servicios esenciales de la empresa y necesita atención inmediata de Google, elige el nivel de prioridad "P1". Explícanos en detalle por qué seleccionaste P1. Incluye una breve descripción del impacto que este problema está teniendo en tu negocio. Por ejemplo, podrías determinar que un problema en una versión de desarrollador es de nivel P1, a pesar de que ningún usuario final se vea afectado directamente, si está bloqueando una corrección de seguridad crítica.

Cuando un caso se establece como P1, se alerta de inmediato a un experto para que trabaje exclusivamente en el problema. Recibirás una respuesta inicial rápida para unirte a una llamada de solución de problemas en vivo a través de Google Meet. Si tu organización no puede usar Google Meet, incluye un vínculo al software de videoconferencias que prefieras para que el experto se una. Después de eso, recibirás actualizaciones periódicas a través del caso.

Valoramos los comentarios detallados que respaldan el nivel de priorización elegido, ya que nos ayuda a responder adecuadamente.

Qué esperar del equipo de asistencia en los casos de P1

Caso nuevo de P1
- Un experto en asistencia se comunicará contigo a través de Google Meet o cualquier otro medio que proporciones. Esperamos que te unas a la llamada en un plazo de 15 a 30 minutos. Informa al experto de asistencia al cliente si no puedes unirte a la llamada por algún motivo.
- De forma predeterminada, el caso "sigue al sol". Esto significa que los expertos en asistencia se comprometen las 24 horas del día hasta que se mitiga el caso o se le quita prioridad. Si la mitigación de un caso se debe realizar en una región específica, ese caso se puede bloquear en una zona horaria determinada. Puedes indicarnos tu preferencia al respecto.
Aumento de prioridad a P1
- Si el problema comenzó a afectar tu entorno de producción o está a punto de hacerlo, puedes aumentar la prioridad de un caso existente de entre P2 y P4 a P1.
- Cuando aumentas la prioridad de un caso existente a P1, es posible que se reasigne el caso de asistencia para que un experto en asistencia disponible pueda brindar atención inmediata.
Impacto en la no producción

Para garantizar que se asignen los recursos adecuados donde sea necesario, es posible que el equipo de asistencia se comunique contigo para reevaluar los casos marcados como P1 que no afecten la producción ni causen un alto impacto en el negocio.

Tiempos de respuesta

Los niveles de prioridad de los problemas tienen tiempos de respuesta predefinidos que se indican en los Lineamientos de los Servicios de Asistencia Técnica de Google Cloud Platform. Si necesitas una respuesta antes de un plazo específico, avísanos en la descripción de tu informe. Si un problema de nivel P1 requiere atención continua las 24 horas del día, puedes solicitar que el servicio siga al sol. Estos casos se reasignan a un especialista de Atención al cliente activo varias veces al día. Mientras solucionamos tu caso de P1, te recomendamos que te mantengas alerta para responder preguntas hasta que se resuelva el problema y, así, facilitar la comunicación eficiente. Si no respondes durante más de 3 horas, es posible que reduzcamos la prioridad del caso a P2 hasta que reactives tu participación.

Derivación

Cuando las circunstancias cambien, es posible que debas derivar un problema. Estos son algunos buenos motivos para derivar un caso:

El impacto para la empresa aumentó.
Hubo un desglose del proceso de resolución. Por ejemplo, no recibiste una actualización en el plazo acordado o tu problema está "atascado" sin progreso después de intercambiar varios mensajes.

Cuando tienes un problema de alto impacto, la mejor solución es establecer el caso con la prioridad adecuada durante un tiempo suficiente, en lugar de derivarlo. La derivación no necesariamente resuelve el caso más rápido y, si se realiza poco después del cambio de prioridad, incluso podría hacer que la resolución del caso sea más lenta. Puedes encontrar una explicación más detallada en el video Cuándo derivar.

Para obtener más información, consulta Deriva un caso.

Cómo enrutar casos a la zona horaria requerida

Debido a los factores en los que se basa la disponibilidad de Atención al cliente, es posible que tu caso de asistencia se asigne a un especialista de Atención al cliente que trabaje fuera de tu horario laboral. También es posible que desees comunicarte con el equipo de Atención al cliente durante los días hábiles de una zona horaria específica. En esos casos, te recomendamos que le solicites al equipo que dirija tu caso de asistencia a una zona horaria que te resulte conveniente. Puedes agregar esta solicitud en la descripción o respuesta de tu caso. Por ejemplo, Please route this case to the Pacific time zone (GMT-8). Los casos de P1 se transfieren al equipo de Atención al cliente de la siguiente región porque sigue al sol, mientras que otros casos permanecerían con el propietario actual del caso para seguir trabajando en él al día siguiente.

Proporciona comentarios con la encuesta de CES

Cuando se resuelva un caso, se enviará por correo electrónico una encuesta de Customer Effort Score (CES) para conocer tu opinión sobre cómo se desarrolló el proceso. Agradeceríamos que te tomaras unos minutos para completarla, de modo que podamos saber qué hicimos bien y cuáles fueron los desafíos para mejorar estos aspectos.

El equipo de experiencia del cliente revisa manualmente todos los formularios de comentarios y toma las medidas correspondientes para mejorar tu experiencia en el futuro. La puntuación será de 1 a 5. Una puntuación de 3 o menos se considera difícil desde el punto de vista del cliente. Por otro lado, una puntuación de 4 o más significa que la interacción no fue difícil para el cliente y se considera una experiencia positiva.

Para obtener más información, mira el video Cómo enviar comentarios sobre los servicios de Google Cloud con CES.

Problemas difíciles o de larga duración

Los problemas que tardan mucho tiempo en resolverse pueden volverse confusos o dejar de avanzar. La mejor manera de evitar esto es recopilar información con nuestra plantilla de problemas de larga duración, en la que debe resumirse el estado más reciente en la parte superior.

Para usar la plantilla, abre el vínculo anterior y haz una copia. Incluye vínculos a todos los casos relevantes y errores de seguimiento interno. Comparte este documento con el grupo de tu equipo de cuentas y solicita que lo compartan con especialistas de Atención al cliente específicos.

Este documento incluye lo siguiente:

Un resumen del estado actual en la parte superior
Una lista de hipótesis potencialmente verdaderas
Las pruebas o herramientas que deseas usar para poner a prueba cada hipótesis

Trata de mantener cada caso centrado en un solo problema y evita volver a abrir un caso para mencionar un problema nuevo.

Informa una interrupción de la producción

Si el problema hizo que tu aplicación deje de entregar tráfico a los usuarios o tiene un impacto crítico similar sobre tu empresa, se considera una interrupción de la producción. Queremos tomar conocimiento lo antes posible. No consideramos como interrupciones de la producción a los problemas que bloquean a una pequeña cantidad de desarrolladores.

Cuando recibimos un informe de interrupción de la producción, usamos el siguiente procedimiento para clasificar la situación rápidamente:

Revisamos inmediatamente si corresponde a algún problema conocido que afecte a la infraestructura de Google Cloud .
Confirmamos la naturaleza del problema.
Establecemos canales de comunicación.

Puedes esperar una respuesta con un mensaje breve, que contendrá la siguiente información:

Cualquier problema conocido relacionado que afecte a varios clientes
Una confirmación de que podemos observar el problema que se informó o una solicitud de más detalles
Cómo pensamos comunicarnos

Por lo tanto, es importante crear rápidamente un caso que incluya la hora, el producto, los identificadores y la ubicación para, luego, comenzar una solución de problemas más profunda. Es posible que tu organización tenga un proceso de gestión de incidentes definido, y este paso debe ejecutarse apenas se presente el incidente.

El proceso de gestión de incidentes de Google define una función clave: el comandante del incidente. Esta persona involucra a las personas adecuadas, recopila continuamente el estado más reciente del problema y resume periódicamente su estado. Delega trabajo a otros, para solucionar problemas y aplicar cambios. Esta delegación nos permite investigar varias hipótesis en paralelo. Te recomendamos que se establezca un proceso similar dentro de tu organización. La persona que abrió el caso suele ser la mejor opción como comandante del incidente, ya que es quien posee más información del contexto.

Cómo informar un problema de herramientas de redes

El tamaño y la complejidad de la red de Google pueden dificultar la identificación del equipo propietario del problema. Para diagnosticar problemas de red, necesitamos identificar causas raíz muy específicas. Debido a que los mensajes de error de la red a menudo son generales (como “No se puede establecer una conexión al servidor”), necesitamos recopilar información de diagnóstico detallada para reducir las hipótesis posibles.

Los diagramas de flujo de paquetes proporcionan una estructura excelente para el informe de problemas. Estos diagramas describen los saltos importantes que da un paquete a lo largo de una ruta, desde el origen hasta el destino, junto con cualquier transformación significativa en el camino.

Comienza por identificar los extremos de la red afectados por la dirección IP de Internet o por la dirección privada RFC 1918, más un identificador de la red. Por ejemplo, 2.3.4.5 o 10.2.3.4 en la red predeterminada del proyecto en Compute Engine.

Agrega cualquier dato significativo relacionado con los extremos, como los siguientes ejemplos:

Quién los controla
Si están asociados con un nombre de host de DNS
Cualquier encapsulamiento o indirección intermedios, o ambos, como tunelización de VPN, proxies y puertas de enlace de NAT
Cualquier filtrado intermedio, como firewalls, CDN o WAF

Muchos problemas que se manifiestan como de alta latencia o pérdida intermitente de paquetes requerirán un análisis de la ruta o una captura de paquetes, o ambos, para el diagnóstico.

El análisis de la ruta es una lista de todos los saltos que recorren los paquetes y es conocido como "traceroute". A menudo usamos MTR o tcptraceroute, o ambos, porque tienen una mejor capacidad de diagnóstico. Te recomendamos que te familiarices con estas herramientas.
La captura de paquetes (también conocida como "pcap", por el nombre de la biblioteca "libpcap") es una observación del tráfico de red real. Es importante realizar una captura de paquetes de ambos extremos al mismo tiempo, lo cual puede ser confuso. Es recomendable que practiques con las herramientas adecuadas (por ejemplo, tcpdump o Wireshark) y te asegures de tenerlas instaladas antes de que las necesites.

Cómo informar un problema de la consola de Google Cloud

Cuando informes un problema de la consola de Google Cloud basada en la Web, además de la orientación anterior, proporciona la siguiente información para ayudarnos a reducir las posibles causas del problema:

URLs de las páginas de la consola afectadas
IDs de los proyectos afectados
Cantidad de usuarios afectados
Si el problema ocurre en diferentes máquinas
Navegadores afectados
Cualquier extensión del navegador o los sistemas de firewall que se usan

Además, incluir cualquier información de seguimiento del navegador pertinente nos ayuda a comprender y analizar tu problema.

Prácticas recomendadas para trabajar con la Atención al cliente Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Cómo crear un caso de asistencia

Describe tu problema

Hora

Producto

Ubicación

Identificadores

Artefactos útiles

Tipo de problema

Ejemplos de descripciones

Primer ejemplo

Segundo ejemplo

Establece la prioridad y deriva

Cuándo establecer la prioridad más alta

Qué esperar del equipo de asistencia en los casos de P1

Tiempos de respuesta

Derivación

Cómo enrutar casos a la zona horaria requerida

Proporciona comentarios con la encuesta de CES

Problemas difíciles o de larga duración

Informa una interrupción de la producción

Cómo informar un problema de herramientas de redes

Cómo informar un problema de la consola de Google Cloud

Prácticas recomendadas para trabajar con la Atención al cliente