Bonnes pratiques concernant l'utilisation de Customer Care

Ce guide vous explique comment rédiger une demande d'assistance efficace. Le respect de ces bonnes pratiques nous aide à résoudre votre demande d'assistance technique plus rapidement.

Créer une demande d'assistance

Avant de créer une demande d'assistance, examinez les problèmes connus pour vérifier que la demande n'a pas déjà été transmise.

Pour éviter toute confusion et nous permettre de suivre votre demande depuis un point unique, créez une demande d'assistance par problème. Toutes les demandes créées en double sont clôturées.

Décrire votre problème

Rédiger une demande d'assistance détaillée permet à l'équipe Customer Care de vous répondre de manière rapide et efficace. Si vous formulez une demande d'assistance en omettant des détails importants, nous devons alors vous demander des compléments d'informations, ce qui prend plus de temps.

Dans l'idéal, une demande d'assistance est à la fois détaillée et spécifique. Elle doit indiquer ce qu'il s'est passé et le résultat que vous attendiez. Lorsque vous décrivez votre problème dans votre demande d'assistance, incluez les informations suivantes :

Heure : le code temporel spécifique à l'apparition du problème
Produit : le ou les produits et fonctionnalités associés au problème
Emplacement : les zones où survient le problème
Identifiants : l'ID du projet ou de l'application, et d'autres identifiants concrets qui peuvent nous aider à étudier le problème
Artefacts utiles : tous les détails que vous pouvez fournir pour nous aider à diagnostiquer le problème
Type de problème : le problème est-il intermittent, passager ou persistant ?

Ces concepts sont décrits plus en détail dans les sections suivantes.

Heure

En utilisant le format ISO 8601 pour la date et l'heure, indiquez le moment où vous avez observé le problème pour la première fois, ainsi que sa durée.

Exemples :

À partir du 2017-09-08T15:13:06+00:00 et pendant cinq minutes, nous avons remarqué…
Problème survenu par intermittence, au plus tôt le 2017-09-10 et constaté deux à cinq fois…
Problème en cours depuis le 2017-09-08T15:13:06+00:00…
Du 2017-09-08T15:13:06+00:00 au 2017-09-08T15:18:16+00:00…

Il y a de fortes chances pour que le spécialiste Customer Care en charge de la résolution du problème se trouve dans un fuseau horaire différent du vôtre. Par conséquent, les déclarations semblables aux suivantes compliquent le diagnostic du problème :

"Le problème a commencé hier…" (Nous sommes obligés de déduire la date)
"Nous avons observé le problème le 9/8…" (Ambigu, car il pourrait s'agir du 8 septembre comme du 9 août)

Produit

Le formulaire de demande de base vous demande de préciser le nom du produit, mais ce n'est pas suffisant : nous avons également besoin d'informations spécifiques sur la fonctionnalité présentant le problème. Dans l'idéal, votre rapport doit faire référence à des API spécifiques ou à des URL de la console Google Cloud (ou inclure des captures d'écran). Pour les API, vous pouvez ajouter un lien vers la page de documentation, qui contient le nom du produit dans l'URL.

Indiquez également le moyen que vous utilisez pour lancer la demande (par exemple : l'API REST, Google Cloud CLI, la console Google Cloud ou encore un outil tel que Cloud Deployment Manager). Si plusieurs produits sont concernés, précisez le nom de chacun d'eux.

Exemples :

"L'API REST de Compute Engine a renvoyé les erreurs suivantes…"
"L'interface de requête BigQuery dans console.cloud.google.com est suspendue…"

Les déclarations suivantes ne sont pas assez spécifiques pour nous aider à diagnostiquer le problème :

"Impossible de créer des instances…" (Nous avons besoin de connaître la méthode que vous employez pour créer des instances.)
"La commande gcloud compute create instances renvoie une erreur…" (La syntaxe de la commande est incorrecte. Nous ne pouvons donc pas l'exécuter nous-mêmes afin de reproduire l'erreur. De plus, nous n'avons pas d'informations sur l'erreur que vous avez constatée.)

Emplacement

Nous devons connaître la région et la zone du centre de données, car nous apportons souvent des modifications à une région ou à une zone à la fois. La région et la zone correspondent à un proxy pour le numéro de version du logiciel sous-jacent. Ces informations nous aident à savoir si des modifications importantes apportées à une version particulière de notre logiciel affectent vos systèmes.

Exemples :

"Dans la région us-east1-b…"
"J'ai essayé les régions us-east1 et us-central1…"

Identifiants

Des identifiants spécifiques nous aident à identifier le projet Cloud auquel le problème est associé. Il nous est primordial de connaître l'ID alphanumérique du projet ou de l'application. Les noms de projet ne sont pas utiles. Si le problème concerne plusieurs projets, incluez tous les ID concernés.

En plus des ID application ou de projet, d'autres identifiants peuvent s'avérer utiles pour diagnostiquer le problème que vous rencontrez :

ID d'instances
ID de tâche BigQuery ou noms de table
Adresses IP

Lorsque vous spécifiez une adresse IP, indiquez également le contexte dans lequel elle est utilisée. Par exemple, précisez si l'adresse IP est connectée à une instance Compute, un équilibreur de charge, une route personnalisée ou un point de terminaison de l'API. Indiquez également si l'adresse IP n'est pas liée aux systèmes de Google (par exemple, si elle correspond à votre réseau Internet personnel, à un point de terminaison VPN ou à un système de surveillance externe).

Exemples :

"Dans le projet robot-name-165473 ou my-project-id…"
"Dans plusieurs projets (y compris my-project-id)…"
"Connexion à l'adresse IP externe 218.239.8.9 de Google Cloud depuis notre passerelle d'entreprise 56.56.56.56…"

Les déclarations de ce type sont trop vagues pour nous aider à diagnostiquer le problème :

"Une de nos instances est inaccessible…"
"Nous n'arrivons pas à nous connecter depuis Internet…"

Artefacts utiles

En nous fournissant des artefacts liés au problème, vous nous aidez à voir l'écran tel que vous le voyez et accélérez ainsi le dépannage.

Exemple :

Envoyez une capture d'écran pour montrer exactement ce que vous voyez.
Pour les interfaces Web, fournissez toute information de trace du navigateur pertinente.
Joignez le résultat tcpdump, des extraits de journaux et des exemples de traces de pile.

Type de problème

Intermittent : les problèmes intermittents surviennent de manière aléatoire, sans modèle de défaillance régulier apparent. Ces problèmes sont difficiles à résoudre, car leur irrégularité complique la collecte de données pendant la défaillance. Dans ce cas, essayez d'identifier les goulots d'étranglement dans l'architecture et vérifiez si vos ressources atteignent leur seuil maximal d'utilisation. Vous pouvez également lancer des vérifications fréquentes dans un job planifié via l'automatisation. Si la vérification échoue, recueillez les informations de débogage pendant la défaillance. Les échecs de résolution DNS et la perte de paquets sont des exemples de ce type de défaillance.
Passager : les problèmes passagers sont momentanés ou ne durent qu'une courte période. Si vous rencontrez des problèmes qui ne durent qu'une seconde ou quelques microsecondes, vous pouvez vérifier la présence de micro-pics de trafic ou d'utilisation des ressources. Dans la plupart des cas, les problèmes passagers peuvent être ignorés s'ils ne se produisent pas fréquemment et si votre service est conçu pour tolérer les pannes temporaires. Les pics de latence du réseau qui ne durent que quelques microsecondes, ainsi que les faibles pertes de paquets entraînant des dépassements de délai, constituent des exemples de ce type de défaillance. Le protocole TCP est conçu pour les défaillances telles que les petites pertes de paquets et les pics de latence. Il peut gérer ces problèmes efficacement, sauf si votre application est sensible à la latence.
Persistant : les problèmes persistants sont des problèmes qui entraînent une défaillance totale, telle que l'inaccessibilité de votre site Web. Ils sont relativement faciles à résoudre, car ils peuvent être reproduits. Dans ce cas, indiquez la procédure permettant de reproduire la défaillance afin que les spécialistes Customer Care puissent répliquer l'environnement et résoudre le problème.

Exemples de descriptions

Les exemples suivants fournissent des descriptions détaillées pour les demandes d'assistance.

Exemple 1

JobName:

A_ATL_BIG1toBQ_big_04)201704202

00045_491

Source:

S3_avl-transfer

Destination:

CloudStorage: avl-transfer

Start time (ISO 8601 format): 2017-04-20 20:14:43 PDT

End time (ISO 8601 format): 2017-04-21 at 10:03:44 PDT

I started a file transfer at 2017-04-20 at 20:14:43 PDT using the transfer API.
This job normally takes 10 minutes to complete, but in this case the job was
still running when I canceled it the next day (2017-04-21 at 10:03:44 PDT). This
is not an isolated event; several other jobs involving the transfer API had
intermittent, significant delays.

Please investigate the cause of the delays and advise of any best practices that
we can implement to prevent these issues in the future.

Exemple 2

Start time (ISO 8601 format): 2017-05-12 at 11:03:43

End time (ISO 8601 format): The issue is still happening as of the time of this
report.

Issue summary:

`/cron/payments-service/sync-v2-batch` cron using the App Engine Task Queue API
has stopped running since 2017-05-12 at 11:03:43. We rely on this job to handle
payments correctly.

We saw datastore and queue errors and then the cron stopped running. We
attempted unsuccessfully to fix the issue by re-uploading cron.xml. Here is the
error trace:

`[error trace]`

Please advise if the issue is with the API or our implementation and let us
know next steps.

Définir et augmenter la priorité d'un problème

Le niveau de priorité nous aide à comprendre l'impact du problème sur votre entreprise et influe sur la rapidité de sa résolution. Les priorités sont définies dans le tableau ci-dessous. Pour en savoir plus, consultez Priorité des demandes d'assistance.

Définition de la priorité	Exemple de situation
P1 : impact critique – Service inutilisable en production	L'application ou l'infrastructure ne peut pas être utilisée en production en raison d'un taux élevé d'erreurs visibles par les utilisateurs. Les répercussions sur les activités de l'entreprise sont très importantes (perte de revenu, risques au niveau de l'intégrité des données, etc.).
P2 : impact important – Utilisation du service très perturbée	L'infrastructure est dégradée en production, vous faites face à un nombre considérable d'erreurs visibles par les utilisateurs ou vous rencontrez des difficultés pour développer rapidement un nouveau système de production. Les répercussions sur les activités de l'entreprise sont modérées (risque de perte de revenu, baisse de la productivité, etc.).
P3 : impact moyen – Utilisation du service partiellement perturbée	Le problème a une portée et/ou une gravité limitée. Il n'a pas d'incidence visible pour les utilisateurs. Les répercussions sur les activités de l'entreprise sont faibles (désagrément ou processus mineurs concernés, par exemple).
P4 : impact faible – Service entièrement utilisable	Incidence technique ou répercussions sur les activités de l'entreprise minimes, voire nulles. Ce niveau de priorité est recommandé pour les demandes d'informations pour lesquelles une analyse approfondie, un dépannage plus poussé ou des conseils détaillés sont préférables à des communications plus fréquentes.

Quand définir la priorité la plus élevée

Si vous rencontrez un problème qui affecte les services critiques de votre entreprise et qui nécessite une attention immédiate de Google, sélectionnez "P1". Expliquez-nous en détail pourquoi vous avez choisi ce niveau de priorité. Rédigez une brève description de l'impact du problème sur votre entreprise. Par exemple, vous pouvez évaluer un problème lié à une version de développement comme étant de niveau P1, même si aucun utilisateur final n'est directement affecté, car ce problème bloque un correctif de sécurité critique.

Lorsqu'une demande est définie sur le niveau P1, un expert est immédiatement averti pour qu'il travaille exclusivement sur le problème. Vous recevez une réponse initiale rapide pour rejoindre un appel de dépannage en direct via Google Meet. Si votre organisation ne peut pas utiliser Google Meet, incluez un lien vers le logiciel de visioconférence de votre choix pour que l'expert puisse participer. Vous recevrez ensuite des informations régulières sur l'état de votre demande.

Nous vous invitons à fournir des commentaires détaillés expliquant le niveau de priorité choisi afin de nous aider à y répondre comme il se doit.

Comment l'assistance traite les demandes P1

Nouvelle demande P1
- Un expert de l'assistance vous contactera via Google Meet ou tout autre outil de visioconférence que vous aurez fourni. Nous nous attendons à ce que vous rejoigniez l'appel dans les 15 à 30 minutes. Informez l'expert de l'assistance si vous ne pouvez pas rejoindre l'appel pour quelque raison que ce soit.
- Par défaut, la demande suit les fuseaux horaires. Cela signifie que les experts de l'assistance sont disponibles 24h/24 jusqu'à ce que le problème soit résolu ou que la priorité de la demande soit revue à la baisse. Si la résolution d'une demande doit être effectuée dans une région spécifique, elle peut être verrouillée sur un fuseau horaire donné. Vous pouvez nous indiquer votre préférence à cet égard.
Augmentation de la priorité P1
- Si le problème a commencé à avoir un impact sur votre environnement de production ou est sur le point d'en avoir un, vous pouvez augmenter la priorité d'une demande existante (P2 à P4) à P1.
- Lorsque vous augmentez le niveau de priorité d'une demande existante à P1, il est possible qu'elle soit réattribuée afin qu'un expert de l'assistance disponible puisse s'en occuper immédiatement.
Impact hors production

Pour s'assurer que les ressources appropriées sont allouées là où elles sont nécessaires, l'assistance peut vous contacter pour réévaluer les demandes marquées comme P1 qui n'ont pas d'impact sur la production ni sur l'activité.

Temps de réponse

Les niveaux de priorité des problèmes ont des temps de réponse prédéfinis décrits dans les instructions relatives aux services d'assistance technique de Google Cloud Platform. Si vous avez besoin d'une réponse avant une échéance précise, veuillez nous l'indiquer dans la description de votre rapport. Si un problème de niveau P1 nécessite un traitement en continu 24h/24, vous pouvez demander le service de suivi des fuseaux horaires. Ces demandes sont réattribuées plusieurs fois par jour à un spécialiste Customer Care actif. Pendant que nous résolvons votre demande P1, nous vous recommandons de rester disponible pour répondre aux questions jusqu'à la résolution du problème afin de faciliter la communication. Si vous ne répondez pas pendant plus de trois heures, nous pouvons réduire la priorité de la demande à P2 jusqu'à ce que vous repreniez contact.

Escalader

Lorsque les circonstances évoluent, il peut être nécessaire d'escalader un problème. Vous pouvez escalader pour les raisons suivantes :

L'impact du problème sur votre entreprise est devenu plus important.
Le processus de résolution a échoué. Par exemple, vous n'avez pas reçu de réponse dans le délai convenu, ou votre problème est "bloqué" sans aucune progression après que vous avez échangé plusieurs messages.

Lorsque vous rencontrez un problème à impact majeur, la meilleure solution consiste à définir le niveau de priorité de la demande sur "approprié" pendant une durée suffisante, plutôt que d'augmenter la priorité. L'escalade ne résout pas nécessairement le problème plus rapidement. De plus, si vous faites une escalade peu de temps après le changement de priorité, la résolution du problème peut même être plus lente. Pour en savoir plus, regardez la vidéo Quand devez-vous escalader un problème ?

Pour savoir comment escalader une demande, consultez Escalader une demande.

Router les demandes vers le fuseau horaire requis

En raison des facteurs sur lesquels se base la disponibilité Customer Care, votre demande d'assistance peut être attribuée à un spécialiste Customer Care qui travaille en dehors de vos heures d'ouverture. Vous pouvez également vouloir contacter Customer Care pendant les jours ouvrés d'un fuseau horaire spécifique. Dans une telle situation, nous vous recommandons de demander à Customer Care de router votre demande vers un fuseau horaire adapté. Vous pouvez ajouter cette requête dans la description ou la réponse de votre demande. Par exemple, Please route this case to the Pacific time zone (GMT-8). Les demandes P1 sont transmises au service Customer Care de la région suivante, car elles suivent les fuseaux horaires, tandis que les autres demandes sont toujours transmises au propriétaire actuel afin qu'il puisse reprendre son travail le jour suivant.

Envoyer des commentaires avec l'enquête CES

Une fois un problème résolu, une enquête de satisfaction client (CES) est envoyée par e-mail pour recueillir votre avis sur le processus de traitement. Nous vous remercions de prendre quelques minutes pour répondre à ces questions. Nous serons ainsi en mesure de déterminer ce que nous avons réussi et quelles étaient les difficultés, afin de pouvoir améliorer ces aspects.

Chaque formulaire de commentaires est examiné manuellement par l'équipe en charge de l'expérience client, à la suite de quoi des actions sont mises en œuvre pour améliorer votre expérience future. Le score fourni est un score sur 5. Un score de 3 ou moins est considéré comme une expérience difficile pour le client. En revanche, un score de 4 ou plus signifie que l'interaction n'a pas été difficile pour le client, ce que l'on considère comme une expérience positive.

Pour en savoir plus, regardez la vidéo Envoyer des commentaires sur les services Google Cloud avec l'enquête CES.

Problèmes de longue durée ou complexes

Les problèmes longs à résoudre peuvent devenir flous et obsolètes. Le meilleur moyen d'éviter une telle situation consiste à collecter des informations à l'aide de notre modèle de problème de longue durée avec l'état le plus récent indiqué en haut de l'écran.

Pour utiliser ce modèle, cliquez sur le lien ci-dessus et faites-en une copie. Incluez des liens vers toutes les demandes pertinentes et les bugs ayant fait l'objet d'un suivi interne. Partagez ce document avec le groupe de votre équipe responsable du compte et demandez-leur de le transmettre aux spécialistes Customer Care concernés.

Ce document comprend les éléments suivants :

Un récapitulatif de l'état actuel indiqué en haut de l'écran
Une liste des hypothèses potentiellement vraies
Les tests ou outils que vous comptez utiliser pour tester chaque hypothèse

Essayez de centrer chaque demande sur un seul problème. Évitez de rouvrir une demande à chaque nouveau problème.

Signaler une interruption de production

Si le problème en question empêche votre application de diffuser du trafic auprès des utilisateurs ou a un impact tout aussi critique sur l'entreprise, il peut s'agir d'une interruption de production. Nous souhaitons en être informés dès que possible. En revanche, les problèmes qui bloquent un petit nombre de développeurs ne sont pas considérés comme des interruptions de production.

Lorsque nous recevons un rapport signalant une interruption de production, nous évaluons rapidement la situation en :

recherchant immédiatement des problèmes connus affectant l'infrastructure Google Cloud ;
confirmant la nature du problème ;
mettant en place des canaux de communication.

Vous recevrez une réponse avec un bref message, contenant les éléments suivants :

Tous les problèmes connus associés qui affectent d'autres clients
La confirmation que nous pouvons constater le problème que vous avez signalé ou une demande d'informations supplémentaires
Le mode de communication que nous envisageons

Par conséquent, il est important de créer rapidement une demande comprenant l'heure, le produit, les identifiants et l'emplacement, puis de lancer un dépannage plus approfondi. Votre organisation peut avoir un processus de gestion des incidents défini. Cette étape doit être exécutée très tôt.

Le processus de gestion des incidents de Google définit un rôle clé : le chargé d'incidents. Il met en lien les bonnes personnes impliquées, collecte continuellement le dernier état et synthétise périodiquement l'état du problème. Il délègue à d'autres personnes la résolution des problèmes et l'application des modifications. Cette délégation nous permet d'examiner plusieurs hypothèses en parallèle. Nous vous recommandons d'établir un processus similaire au sein de votre organisation. La personne qui a généré la demande est généralement la plus apte à endosser le rôle de chargé d'incidents, car elle dispose de plus de contexte.

Signaler un problème de réseau

L'équipe responsable du problème peut être difficile à identifier en raison de la taille et de la complexité du réseau de Google. Afin de diagnostiquer les problèmes liés au réseau, nous devons déterminer les causes très spécifiques à l'origine de ces problèmes. Comme les messages d'erreur de réseau sont souvent d'ordre général (exemple : "Impossible de se connecter au serveur"), nous devons collecter des informations de diagnostic détaillées afin d'affiner les hypothèses.

Les schémas des flux de paquets constituent une excellente structure pour le rapport de signalement du problème. Ces schémas décrivent les sauts importants qu'un paquet emprunte tout au long d'un chemin d'accès, allant de la source à la destination, ainsi que les éventuelles transformations importantes intervenues en cours de route.

Commencez par identifier les points de terminaison du réseau affectés par l'adresse IP Internet ou par l'adresse privée RFC 1918, ainsi qu'un identifiant pour le réseau. Par exemple, 2.3.4.5 ou 10.2.3.4 sur le réseau par défaut du projet Compute Engine.

Notez toutes les informations utiles liées aux points de terminaison. Exemple :

Les personnes qui les contrôlent
S'ils sont associés à un nom d'hôte DNS
Les encapsulations et/ou indirections intermédiaires, telles qu'un tunnel VPN, des proxys et des passerelles NAT
Les filtres intermédiaires, comme les pare-feu, CDN ou WAF

De nombreux problèmes qui se traduisent par une latence élevée ou une perte de paquet intermittente nécessitent une analyse du chemin et/ou une capture de paquets à des fins de diagnostic.

L'analyse de chemin constitue une liste de tous les sauts que les paquets traversent et est connue sous le nom de "traceroute". Nous utilisons souvent MTR et/ou tcptraceroute, car ils présentent de meilleures performances en termes de diagnostic. Nous vous recommandons de vous familiariser avec ces outils.
La capture de paquets (ou "pcap", en référence au nom de la bibliothèque "libpcap") est une observation du trafic réseau réel. Il est important de prendre une capture de paquets pour les deux points de terminaison en même temps, ce qui peut s'avérer délicat. Vous pouvez vous entraîner à l'aide des outils nécessaires (par exemple, tcpdump ou Wireshark) et vous assurer qu'ils sont installés pour pouvoir les utiliser quand vous en aurez besoin.

Signaler un problème lié à la console Google Cloud

Lorsque vous signalez un problème lié à la console Google Cloud basée sur le Web, en plus des conseils précédents, fournissez les informations suivantes pour nous aider à identifier les causes potentielles du problème :

URL des pages de la console concernées
ID des projets concernés
Nombre d'utilisateurs concernés
Si le problème se produit sur différentes machines
Navigateurs concernés
Toutes les extensions de navigateur ou tous les systèmes de pare-feu utilisés

De plus, l'inclusion de toute information de trace de navigateur pertinente nous aide à comprendre et à examiner votre problème.

Bonnes pratiques concernant l'utilisation de Customer Care Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Créer une demande d'assistance

Décrire votre problème

Heure

Produit

Emplacement

Identifiants

Artefacts utiles

Type de problème

Exemples de descriptions

Exemple 1

Exemple 2

Définir et augmenter la priorité d'un problème

Quand définir la priorité la plus élevée

Comment l'assistance traite les demandes P1

Temps de réponse

Escalader

Router les demandes vers le fuseau horaire requis

Envoyer des commentaires avec l'enquête CES

Problèmes de longue durée ou complexes

Signaler une interruption de production

Signaler un problème de réseau

Signaler un problème lié à la console Google Cloud

Bonnes pratiques concernant l'utilisation de Customer Care