Présentation de la surveillance et de la journalisation

Google Distributed Cloud (GDC) air-gapped fournit des services de surveillance, de journalisation et d'alerte, ce qui vous permet de conserver la visibilité, l'observabilité des données et le contrôle de vos déploiements. Ces services vous permettent de configurer des ressources personnalisées pour l'observabilité de vos propres applications et services.

Cette présentation décrit les principaux composants et points à prendre en compte pour la pile d'observabilité dans GDC.

Fonctionnalités d'observabilité

GDC inclut les fonctionnalités suivantes dans ses ressources d'observabilité :

  • Pile intégrée : GDC offre une suite complète et intégrée d'outils d'observabilité, y compris la collecte de métriques, les tableaux de bord de surveillance, les mécanismes d'alerte et la gestion des journaux, le tout dans les limites sécurisées de votre environnement isolé.
  • Collecte de données automatisée : les agents et les services collectent automatiquement des métriques et des journaux provenant de diverses sources, telles que des composants d'infrastructure, des applications et des journaux d'audit, pour une capture complète des données. Toutefois, vous pouvez également configurer des ressources pour collecter des journaux et des métriques, et obtenir des insights à partir de vos propres charges de travail.
  • Sécurité et souveraineté des données : toutes les données collectées restent dans votre environnement isolé, ce qui garantit la conformité avec les réglementations sur la sécurité et la résidence des données.
  • Normes ouvertes et intégration : utilisez des normes et des API ouvertes pour l'intégration aux outils de surveillance, aux systèmes de gestion des incidents et aux solutions de gestion des informations et des événements de sécurité (SIEM) existants.

Composants clés

La pile d'observabilité GDC inclut les composants suivants pour les insights sur les applications et l'analyse des performances :

  • Surveillance :

    • Collecte de métriques : GDC inclut des agents et des services qui collectent les métriques clés des composants d'infrastructure tels que le calcul, le stockage, la mise en réseau et les applications. Ces métriques fournissent des insights sur les performances du système, l'utilisation des ressources et l'état de l'application.
    • Plate-forme de surveillance : un service dédié au sein de l'environnement isolé collecte, stocke et traite les métriques. Ce service propose des tableaux de bord, des visualisations et des outils permettant d'analyser les tendances, d'identifier les anomalies et de résoudre les problèmes.
    • Intégration aux outils existants : le service de surveillance s'intègre aux outils et frameworks existants, ce qui vous permet d'utiliser des interfaces et des workflows standards.
  • Journalisation :

    • Collecte des journaux : GDC collecte automatiquement les journaux provenant de diverses sources, y compris les composants système, les applications et les pistes d'audit. Cette collecte centralisée des journaux simplifie le dépannage et l'analyse de la sécurité.
    • Stockage et conservation des journaux : un service de journalisation dédié dans l'environnement isolé fournit un stockage sécurisé et évolutif des journaux. Configurez des règles de conservation pour répondre aux exigences de conformité et opérationnelles.
    • Analyse et recherche dans les journaux : les fonctionnalités de recherche et de filtrage permettent d'analyser efficacement les journaux pour identifier les causes premières, résoudre les problèmes et détecter les menaces de sécurité.
  • Alertes :

    • Règles d'alerte : définissez des règles d'alerte basées sur des seuils de métriques, des événements ou des anomalies. Ces règles déclenchent des notifications lorsque des conditions spécifiques sont remplies, ce qui permet de répondre de manière proactive aux problèmes potentiels.
    • Canaux de notification : configurez différents canaux de notification, tels que les e-mails, les SMS ou l'intégration aux systèmes de gestion des incidents, pour vous assurer que les alertes atteignent la destination appropriée.
    • Escalade des alertes : mettez en œuvre des procédures d'escalade des alertes pour garantir des réponses rapides et éviter la fatigue liée aux alertes.

Workflow de haut niveau

La pile d'observabilité GDC fonctionne selon le workflow suivant :

  1. Déploiement : déployez votre solution d'observabilité dans votre environnement isolé.
  2. Configuration : configurez les sources de données, les métriques et les paramètres de collecte des journaux en fonction de vos besoins en matière de surveillance et de journalisation.
  3. Collecte de données : les agents et les services collectent automatiquement des métriques et des journaux à partir de sources désignées.
  4. Surveillance et analyse : utilisez des tableaux de bord, des visualisations et des outils d'analyse pour surveiller les performances du système, l'état des applications et les événements de sécurité.
  5. Alertes : définissez des règles d'alerte basées sur des seuils, des événements ou des anomalies pour déclencher des notifications sur différents canaux.
  6. Dépannage et correction : utilisez les journaux et les métriques collectés pour examiner et diagnostiquer les problèmes, ce qui permet de les résoudre et de minimiser les temps d'arrêt.

Avantages

Lorsque vous utilisez des solutions d'observabilité dans GDC, vous bénéficiez des avantages suivants :

  • Visibilité améliorée : obtenez des informations détaillées sur l'état, les performances et la sécurité de votre environnement isolé.
  • Atténuation des problèmes : détectez et résolvez les problèmes potentiels avant qu'ils n'aient un impact sur les opérations grâce à la surveillance et aux alertes en temps réel.
  • Sécurité renforcée : renforcez la sécurité en surveillant les activités, en analysant les journaux d'audit et en identifiant les menaces potentielles.
  • Dépannage simplifié : diagnostiquez et résolvez les problèmes à l'aide de journaux centralisés et de métriques de performances détaillées.
  • Amélioration de l'efficacité opérationnelle : optimisez l'utilisation des ressources, réduisez les temps d'arrêt et améliorez l'efficacité opérationnelle globale.
  • Conformité et souveraineté des données : conservez toutes les données d'observabilité dans votre environnement isolé pour assurer la conformité avec les réglementations sur la résidence et la sécurité des données.

En tirant parti de ces fonctionnalités et avantages, vous pouvez gérer et sécuriser efficacement vos environnements isolés, ce qui vous permet d'assurer le bon fonctionnement de vos opérations et de minimiser les risques.