Ce document présente Personalized Service Health, qui vous permet d'identifier les Google Cloud interruptions de service pertinentes pour vos projets afin de les gérer et de les traiter efficacement. Ces perturbations sont appelées "événements de santé du service". Elles sont disponibles dans la console Google Cloud et via divers points d'intégration.
Fonctionnement de Personalized Service Health
Le diagramme suivant montre comment Personalized Service Health met à disposition les événements de santé des services.
Vous pouvez accéder aux événements d'état du service avec les éléments suivants:
- Tableau de bord Service Health: suivez les Google Cloud incidents émergents et actifs qui affectent vos projets.
- API Service Health: extrait des informations sur les événements de santé du service par projet ou organisation.
- Alertes: recevez des notifications sur les événements pertinents pour vos projets. Les alertes sont basées sur les journaux de Cloud Logging.
- Journaux: exportez les journaux liés aux événements Google Cloud .
Afficher les incidents Google Cloud actifs et passés dans le tableau de bord Service Health
Le tableau de bord "État du service" de la console Google Cloud affiche les incidents pertinents pour votre projet, leur état, ainsi que les produits et les zones géographiques concernés.Google Cloud
Consultez le guide de démarrage rapide pour savoir comment accéder au tableau de bord "État du service".
Afficher les Google Cloud incidents et recevoir des alertes sur un appareil mobile
Le tableau de bord de l'état des services est également disponible sur un appareil mobile.
Pour recevoir des alertes sur votre appareil mobile, vous pouvez configurer une stratégie d'alerte pour envoyer des alertes à votre appareil mobile.
Demander des événements de santé du service à l'aide de l'API Service Health
L'API Service Health vous permet d'obtenir des événements de santé du service susceptibles d'avoir un impact sur votre projet ou d'en avoir déjà eu un, ou d'obtenir des informations sur les événements, telles que les mises à jour, les heures de début et de fin, les produits et les emplacements concernés, et l'état. Google Cloud
Pour en savoir plus, consultez la documentation de référence de l'API Service Health.
Configurer des alertes ou exporter des journaux via Cloud Logging
Personalized Service Health consigne les événements de santé des services dans Cloud Logging et vous permet de configurer des alertes en fonction de ces journaux. Vous pouvez configurer des alertes pour des conditions telles que la création ou la mise à jour d'incidents pour des produits ou des emplacements spécifiques. Google Cloud
Consultez le guide de démarrage rapide pour configurer une alerte dans le tableau de bord "État du service".
Concepts
Personalized Service Health utilise les concepts suivants pour désigner les événements qui affectent votre projet et la façon dont ils sont liés à votre projet.
Événement d'état du service
Un événement de santé du service (v1,v1beta) est un événement perturbateur qui affecte un Google Cloud produit pertinent pour vos projets ou ressources. Exemples : pannes réseau, erreurs de configuration et problèmes de performances.
Chaque événement contient des informations sur l'impact global de l'événement, des informations de Google et des informations spécifiques à votre Google Cloud projet.
Incident
Les incidents sont des pannes ou des dégradations de service émergentes et actives Google Cloud qui affectent vos projets. Il s'agit d'une catégorie d'événement d'état de service.
Un incident comprend les éléments suivants:
- Impact de l'incident: détails de la portée de l'événement, tels que les produits et les emplacementsGoogle Cloud concernés.
- Informations de Google Cloud: informations périodiques de l'assistanceGoogle Cloud .
- Pertinence personnalisée: pertinence de l'incident par rapport à votre Google Cloud projet.
- Symptômes, solutions de contournement et délais d'indisponibilité: informations pour évaluer l'impact, appliquer une solution de contournement ou en savoir plus sur la cause du problème.
Un incident peut faire l'objet d'un rapport d'incident, qui comprend les facteurs ayant contribué à l'incident et les mesures prévues pour éviter que des incidents similaires ne se reproduisent. Google Cloud Les rapports d'incident sont disponibles pour les incidents qui répondent aux conditions suivantes:
- L'incident a un impact mondial ou affecte un pourcentage important de projets client dans une ou plusieurs régions.
- Un ou plusieurs produits ne sont pas disponibles ou sont très dégradés.
États des événements et états détaillés
Un événement comporte deux champs indiquant son état. Les valeurs de ces champs changent à mesure que l'événement évolue.
État de l'événement: indique l'état global de l'événement. Il peut s'agir de l'un des éléments suivants:
- Actif: l'événement a un impact direct sur Google Cloud et continuera de recevoir des mises à jour.
- Clôturé: l'événement n'affecte plus aucun Google Cloud produit ou a été fusionné avec un autre événement.
État détaillé: fournit plus d'informations sur l'état de l'événement. Il ne s'applique qu'aux incidents et peut correspondre à l'une des valeurs suivantes, en fonction de l'état de l'événement:
En cours: les ingénieurs de Google étudient activement l'incident pour déterminer son impact. Un incident émergent devient un incident confirmé ou résolu une fois l'évaluation de l'impact terminée. Un incident actif peut être un incident émergent.
L'assistance pour les incidents émergents n'est disponible que pour les produits de mise en réseau Google Cloud.
Confirmé: l'incident est confirmé par les ingénieurs Google et affecte au moins un Google Cloud produit. Nous vous tiendrons informé de l'évolution de la situation jusqu'à ce que le problème soit résolu.
Un incident actif peut être un incident confirmé.
Fusionné: l'incident a été fusionné avec un incident parent. Toutes les mises à jour ultérieures seront publiées dans le parent uniquement.
Résolu: l'incident n'affecte plus aucun Google Cloudproduit après avoir pris des mesures. Aucune autre information ne sera communiquée à ce sujet.
Un incident fermé est généralement un incident résolu.
Faux positif: après examen, les ingénieurs Google ont conclu que l'incident n'affectait pas un Google Cloud produit. Cet état peut changer si l'incident est réexaminé.
Fermé automatiquement: l'incident a été fermé automatiquement pour les raisons suivantes:
- L'impact de l'incident n'a pas pu être confirmé.
- L'incident était intermittent ou s'est résolu de lui-même.
L'incident n'a pas été résolu, car aucune action ni aucune enquête n'ont été effectuées. Si le problème est intermittent, l'incident peut être rouvert.
Pertinence
Personalized Service Health évalue l'impact de tous les incidents sur votre projet. Si l'impact de l'incident sur votre projet est possible ou confirmé, il devient disponible dans le tableau de bord et l'API Service Health.
La pertinence décrit l'impact d'un incident sur votre projet. La pertinence peut changer au fur et à mesure de l'incident.
La pertinence peut prendre les valeurs suivantes:
- Impacté: l'impact de l'incident sur votre projet est confirmé. Disponible pour certains Google Cloud produits uniquement.
- Associé: l'incident a un lien direct avec votre projet et a un impact sur un Google Cloud produit situé dans un emplacement utilisé par votre projet.
- Partiellement associé: l'incident est associé à un Google Cloudproduit utilisé par votre projet, mais il ne devrait pas affecter ce projet. Par exemple, il se peut que l'incident ait un impact sur un produit Google Cloudutilisé par votre projet, mais dans un emplacement que celui-ci n'utilise pas.
- Non concerné: l'incident n'a pas d'impact sur votre projet.
- Inconnu: l'impact sur votre projet n'est pas connu à ce stade.