Guide de dépannage de l'agent Google Cloud pour SAP

Ce guide vous explique comment résoudre les problèmes liés à la version 3.5 (la plus récente) de l'agent Google Cloud pour SAP.

Pour obtenir des informations de dépannage et d'assistance SAP, consultez les notes SAP suivantes :

Journalisation

Vérifiez les journaux dans le répertoire qui correspond spécifiquement à votre système d'exploitation.

Pour afficher les journaux de l'agent Google Cloud pour SAP, accédez aux chemins d'accès suivants :

Linux

/var/log/google-cloud-sap-agent.log

Windows

C:\Program Files\Google\google-cloud-sap-agent\logs\google-cloud-sap-agent.log

Si vous avez activé la fonctionnalité Backint de l'agent SAP pour Google Cloud, consultez les journaux suivants :

  • Le fichier SAP HANA backup.log, qui contient des informations sur les opérations de sauvegarde et de récupération SAP HANA.
  • Le fichier SAP HANA backint.log, qui contient les appels à l'interface de sauvegarde utilisée par la fonctionnalité Backint de l'agent et d'autres outils de sauvegarde externe.
  • Fichier journal Backint de l'agent Google Cloud pour SAP : /var/log/google-cloud-sap-agent/backint.log. Ce fichier contient des informations sur la date d'activation de la fonctionnalité Backint et des événements opérationnels associés, ainsi que des indications d'erreurs de communication avec Cloud Storage et des problèmes de configuration ou d'autorisation associés.
  • Les journaux Google Cloud dans Cloud Logging, qui peuvent contenir des erreurs liées au compte de service utilisé par l'agent Google Cloud pour SAP. Pour afficher ces journaux, accédez à la page Explorateur de journaux dans la console Google Cloud.

Problèmes courants

Les sections suivantes fournissent des informations sur les problèmes courants liés à l'utilisation de l'agent Google Cloud pour SAP, leurs causes et leur résolution.

Problème : autorisations IAM insuffisantes

Problème : les journaux de l'agent Google Cloud pour SAP indiquent une erreur d'autorisation IAM insuffisante.

Cause : Le compte de service utilisé par l'agent ne dispose pas des autorisations IAM requises pour accéder à l'API Cloud Monitoring, ou, si vous utilisez la fonctionnalité Backint de l'agent, d'autorisations suffisantes pour accéder au bucket Cloud Storage.

Résolution : pour résoudre ce problème, procédez comme suit :

  1. Dans la console Google Cloud, sur la page Détails de l'instance de VM, notez le nom du compte de service de VM. Par exemple, sap-example@example-project-123456.iam.gserviceaccount.com.

  2. Accédez à la page IAM et administration et, pour le compte de service indiqué, assurez-vous qu'il inclut les rôles IAM suivants :

    Fonctionnalité Rôles IAM requis
    Collecte de métriques de l'agent hôte SAP
    Collecte des métriques de surveillance des processus
    Collecte des métriques d'évaluation du gestionnaire de charges de travail
    Collecte des métriques de surveillance SAP HANA
    Sauvegarde et récupération basées sur Backint pour SAP HANA
    • Administrateur des objets de l'espace de stockage (roles/storage.objectAdmin)
    • Chiffreur/Déchiffreur de clés cryptographiques Cloud KMS (roles/cloudkms.cryptoKeyEncrypterDecrypter) si vous avez utilisé une clé de chiffrement gérée par le client pour chiffrer vos sauvegardes SAP HANA dans Cloud Storage. Pour en savoir plus sur cette fonctionnalité, consultez la page Options de chiffrement pour les sauvegardes.

    Pour en savoir plus, consultez la section Autorisations Cloud Storage requises.

Pour en savoir plus sur l'authentification requise pour l'agent Google Cloud pour SAP, consultez la page Authentification et accès.

Pour connaître les autorisations requises par l'agent Cloud Monitoring, consultez la documentation de Monitoring suivante :

Problème : Niveaux d'accès incorrects pour le compte de service de VM

Problème : si vous limitez les niveaux d'accès sur votre instance de VM hôte, l'erreur de l'agent Google Cloud pour SAP peut afficher une erreur d'autorisation IAM insuffisante.

Cause : l'agent Google Cloud pour SAP nécessite un minimum de niveaux d'accès aux API Cloud sur l'instance de VM hôte. Cette erreur se produit lorsque le compte de service ne dispose pas des niveaux d'accès requis.

Solution : les champs d'application d'accès représentent l'ancienne méthode de spécification des autorisations associées à votre instance de VM. Compute Engine recommande de configurer vos instances de VM de façon à accorder un niveau d'accès complet à toutes les API Cloud et à n'utiliser que les autorisations IAM du compte de service de la VM pour contrôler les accès aux ressources Google Cloud.

Pour résoudre ce problème, il est recommandé de définir tous les niveaux d'accès cloud-platform sur l'instance de VM, puis de restreindre de manière sécurisée les accès du compte de service aux API à l'aide de rôles IAM. Exemple :

  • https://www.googleapis.com/auth/cloud-platform

Si vous limitez les niveaux d'accès de votre instance de VM, vous devez vous assurer que la VM hôte dispose des niveaux d'accès suivants :

  • https://www.googleapis.com/auth/source.read_write
  • https://www.googleapis.com/auth/compute
  • https://www.googleapis.com/auth/servicecontrol
  • https://www.googleapis.com/auth/service.management.readonly
  • https://www.googleapis.com/auth/logging.admin
  • https://www.googleapis.com/auth/monitoring
  • https://www.googleapis.com/auth/trace.append
  • https://www.googleapis.com/auth/devstorage.full_control

Si vous avez activé la collecte des métriques de surveillance des processus ou des métriques de surveillance SAP HANA, les champs d'application d'accès de l'instance de VM hôte doivent également disposer d'un accès en écriture pour publier des données de métrique sur votre projet Google Cloud :

  • https://www.googleapis.com/auth/monitoring.write

Pour modifier les niveaux d'accès, vous devez arrêter votre instance de VM, apporter les modifications nécessaires, puis la redémarrer. Pour savoir comment procéder, consultez la documentation Compute Engine. Ce problème ne nécessite pas que vous modifiez les autorisations relatives aux rôles IAM.

Problème : Agent hôte SAP manquant ou incorrect

Problème : les journaux de l'agent Google Cloud pour SAP sont manquants ou incorrects.

Cause : l'agent hôte SAP ou le niveau de correctif minimal requis pour l'agent hôte SAP n'est pas installé. Pour que l'agent Google Cloud pour SAP fonctionne, votre système SAP doit avoir installé l'agent hôte SAP et le niveau de correctif minimal requis pour l'agent hôte est conservé.

Solution : pour résoudre ce problème, installez la version requise de l'agent hôte SAP. Pour savoir comment installer l'agent hôte SAP, consultez la documentation SAP.

Pour connaître les exigences relatives à la version de l'agent hôte SAP, consultez les notes SAP suivantes :

Problème : Échec de l'installation de l'agent Google Cloud pour SAP

Problème : l'installation de l'agent échoue lorsque vous exécutez la commande d'installation du gestionnaire de paquets, telle que yum, zypper ou googet, ou bien le message d'erreur suivant s'affiche : Package matching google-cloud-sap-agent-VERSION_NUMBER already installed. Checking for update..

Cause : l'installation de l'agent échoue pour l'une des raisons suivantes :

  • Vous revenez à une version antérieure de l'agent qui n'est pas la dernière version en date, et votre instance de calcul s'exécute sur une version plus ancienne de RHEL pour SAP, telle que la version 7.9.
  • L'instance de calcul qui héberge l'agent a été créée sans adresse IP externe.

Résolution : pour résoudre ce problème, effectuez l'une des opérations suivantes, selon votre situation :

  • Si vous souhaitez revenir à une version antérieure de l'instance de votre agent, qui n'est pas la dernière version en date, et que votre instance de calcul s'exécute sur une version plus ancienne de RHEL pour SAP, telle que la version 7.9, exécutez la commande suivante :

    RHEL

    sudo tee /etc/yum.repos.d/google-cloud-sap-agent.repo << EOM
    [google-cloud-sap-agent]
    name=Google Cloud Agent for SAP
    baseurl=https://packages.cloud.google.com/yum/repos/google-cloud-sap-agent-el$(cat /etc/redhat-release | cut -d . -f 1 | tr -d -c 0-9)-x86_64
    enabled=1
    gpgcheck=1
    repo_gpgcheck=0
    gpgkey=https://packages.cloud.google.com/yum/doc/yum-key.gpg https://packages.cloud.google.com/yum/doc/rpm-package-key.gpg
    EOM
    sudo yum downgrade google-cloud-sap-agent-VERSION_NUMBER.x86_64

    SLES15

    sudo zypper addrepo --refresh https://packages.cloud.google.com/yum/repos/google-cloud-sap-agent-sles15-x86_64 google-cloud-sap-agent
    sudo zypper install google-cloud-sap-agent-VERSION_NUMBER.x86_64

    SLES 12

    sudo zypper addrepo --refresh https://packages.cloud.google.com/yum/repos/google-cloud-sap-agent-sles12-x86_64 google-cloud-sap-agent
    sudo zypper install google-cloud-sap-agent-VERSION_NUMBER.x86_64

    Remplacez VERSION_NUMBER par le numéro de version de l'agent que vous souhaitez installer, par exemple 3.1-606637668. Pour en savoir plus sur les versions d'agent que vous pouvez installer, consultez la section Lister toutes les versions disponibles de l'agent.

  • Si l'instance de calcul qui héberge l'agent ne dispose pas d'une adresse IP externe, configurez une passerelle NAT qui donne au serveur hôte un accès sortant à Internet. Pour en savoir plus sur la configuration d'une passerelle NAT, consultez le guide de déploiement de votre système SAP. Par exemple, pour SAP NetWeaver, consultez les pages suivantes :

Problème : Échec de la collecte des métriques de surveillance SAP HANA

Problème : lors de la mise à niveau à partir de l'agent de surveillance pour SAP HANA, un message d'erreur semblable à celui-ci s'affiche après l'installation de l'agent Google Cloud pour SAP :

tls: failed to verify certificate: x509: certificate relies on legacy Common Name field, use SANs instead

Cause : l'agent Google Cloud pour SAP ne peut pas démarrer la collecte des métriques de surveillance SAP HANA, car les instances SAP HANA cibles utilisent des certificats SSL spécifiés avec le nom commun (CN).

Résolution : pour résoudre ce problème, procédez comme suit :

  1. Pour les instances SAP HANA que vous souhaitez surveiller à l'aide de l'agent Google Cloud pour SAP, vous devez passer à un certificat SSL (SAN, Subject Alternative Name) au lieu des certificats SSL spécifiés avec le nom commun (CN).

  2. Établissez une connexion SSH avec votre instance de VM hôte ou votre serveur de solution Bare Metal.

  3. Ouvrez le fichier de configuration de l'agent Google Cloud pour SAP :

    /etc/google-cloud-sap-agent/configuration.json
  4. Dans la section hana_monitoring_configuration, définissez le paramètre enabled sur true.

  5. Dans la section hana_monitoring_configuration.hana_instances, procédez comme suit pour chaque instance SAP HANA qui utilise le protocole TLS/SSL pour une communication sécurisée :

    1. Spécifiez le paramètre enable_ssl et définissez sa valeur sur true.

    2. Spécifiez le paramètre host_name_in_certificate et définissez le nom d'hôte SAP HANA comme spécifié dans le certificat TLS/SSL en tant que valeur.

    3. Spécifiez la propriété tls_root_ca_file et définissez le chemin d'accès au certificat TLS/SSL en tant que valeur.

  6. Enregistrez le fichier de configuration.

  7. Redémarrez l'agent Google Cloud pour SAP pour que les nouveaux paramètres prennent effet :

    sudo systemctl restart google-cloud-sap-agent
  8. Vérifiez que l'agent collecte les métriques de surveillance SAP HANA. Pour obtenir des instructions, consultez la page Afficher les autres métriques.

  9. Désinstallez l'agent de surveillance pour SAP HANA.

Problème: erreur "Connexion refusée"

Problème : les journaux de l'agent hôte SAP affichent l'erreur "Connexion refusée".

Cause : l'agent de Google Cloud pour SAP ne peut pas démarrer, car le port 18181 n'est pas disponible. L'agent Google Cloud pour SAP écoute les requêtes sur le port 18181. Ce port doit être disponible pour que l'agent démarre.

Solution : pour résoudre ce problème, assurez-vous que le port 18181 est disponible pour l'agent Google Cloud pour SAP. Si un autre service utilise le port 18181, vous devrez peut-être redémarrer cet autre service ou le reconfigurer pour qu'il utilise un autre port.

Problème : pour les images d'OS SLES 15 SP4 pour SAP et versions ultérieures, l'agent pour Google Cloud pour SAP ne s'exécute pas

Problème : Lorsque vous utilisez les images d'OS SLES "pour SAP", l'agent Google Cloud pour SAP est préinstallé. Toutefois, pour les images d'OS SLES 15 SP4 pour SAP et versions ultérieures, l'agent préinstallé pour SAP ne démarre pas seul.

Pour vérifier que l'agent est en cours d'exécution ou non, procédez comme suit :

  1. Connectez-vous à l'instance de VM hôte ou au serveur de solution Bare Metal.
  2. Exécutez la commande suivante :

    systemctl status google-cloud-sap-agent

    Si l'agent n'est pas en cours d'exécution, le résultat contient inactive (dead). Exemple :

    google-cloud-sap-agent.service - Google Cloud Agent for SAP
     Loaded: loaded (/usr/lib/systemd/system/google-cloud-sap-agent.service; disabled; vendor preset: disabled)
     Active: inactive (dead)
    
    .

Cause : l'agent pour SAP ne démarre pas seul en raison d'un problème avec le packaging de système d'exploitation.

Résolution : pour résoudre le problème, procédez comme suit :

  1. Connectez-vous à l'instance de VM hôte ou au serveur de solution Bare Metal.
  2. Exécutez les commandes suivantes :

    sudo sed -i 's~ /usr/sap~ -/usr/sap~g' /usr/lib/systemd/system/google-cloud-sap-agent.service
    sudo systemctl restart google-cloud-sap-agent
  3. Vérifier que l'agent est en cours d'exécution :

    systemctl status google-cloud-sap-agent

    Un résultat semblable aux lignes suivantes doit s'afficher :

    google-cloud-sap-agent.service - Google Cloud Agent for SAP
      Loaded: loaded (/usr/lib/systemd/system/google-cloud-sap-agent.service; disabled; vendor preset: disabled)
      Active: active (running) since Wed 2023-07-12 03:07:23 UTC; 7s ago
    Main PID: 6117 (google_cloud_sa)
       Tasks: 6
      Memory: 8.8M (max: 1.0G limit: 1.0G available: 1015.1M)
      CGroup: /system.slice/google-cloud-sap-agent.service
               └─ 6117 /usr/bin/google_cloud_sap_agent startdaemon
    

Problème : la découverte du système échoue en raison d'une autorisation d'exécution manquante pour le répertoire /usr/sap

Problème : dans les journaux de l'agent Google Cloud pour SAP, un avertissement No execute permission for /usr/sap directory, some of the discovery operations will fail. Please ensure that the root user has execute permission for /usr/sap directory. s'affiche.

Cause : l'utilisateur racine ne dispose pas de l'autorisation d'exécution pour le répertoire /usr/sap/. Cela empêche l'utilisateur racine d'accéder au profil système SAP et aux outils SAP situés dans le répertoire /usr/sap. Cela peut empêcher l'agent de découvrir les systèmes SAP exécutés sur l'instance de calcul hôte, et, par conséquent, limiter le comportement attendu de ses fonctionnalités.

Résolution : pour résoudre ce problème, assurez-vous que l'utilisateur racine dispose de l'autorisation d'exécution sur le répertoire /usr/sap/. Pour ce faire, exécutez la commande suivante :

chmod +x /usr/sap

Problème : débit faible

Problème : le débit est inférieur à celui attendu.

Cause : pour la fonctionnalité Backint de l'agent Google Cloud pour SAP, vous avez peut-être activé la compression à l'aide du paramètre de configuration compress.

Résolution : pour résoudre ce problème, vérifiez que la compression n'est pas activée. Pour ce faire, procédez comme suit :

  1. Connectez-vous à votre hôte SAP HANA par SSH.

  2. Ouvrez le fichier de configuration Backint :

    /usr/sap/SID/SYS/global/hdb/opt/backint/backint-gcs/parameters.json

    Remplacez SID par le SID du système dans lequel vous avez installé les fichiers associés à Backint.

  3. Vérifiez que le paramètre compress est défini sur false.

  4. Si vous apportez des modifications, enregistrez le fichier de configuration.

Problème : erreurs de multistreaming

Problème : vous obtenez des erreurs lors du multistreaming des sauvegardes de données.

Cause : pour la fonctionnalité Backint de l'agent Google Cloud pour SAP, vous avez peut-être spécifié un nombre plus élevé de flux parallèles.

Résolution : pour résoudre ce problème, procédez comme suit :

  1. Connectez-vous à votre hôte SAP HANA par SSH.

  2. Ouvrez le fichier de configuration Backint :

    /usr/sap/SID/SYS/global/hdb/opt/backint/backint-gcs/parameters.json

    Remplacez SID par le SID du système dans lequel vous avez installé les fichiers associés à Backint.

  3. Si vous avez défini une valeur pour le paramètre parallel_streams, diminuez-la sur 1.

    Si le problème persiste, contactez le service client.

Problème de connexion à Cloud Storage

Problème : vous rencontrez un problème de connectivité avec votre bucket Cloud Storage.

Cause :

  • problème temporaire de connectivité temporaire.
  • Le compte de service utilisé par l'agent Google Cloud pour SAP ne dispose pas des autorisations requises pour accéder à Cloud Storage.
  • Votre configuration présente un problème

Résolution : pour résoudre un problème de connectivité avec le bucket Cloud Storage, vérifiez les points suivants :

  • Effectuez une nouvelle tentative de sauvegarde ou de récupération pour vous assurer que l'erreur n'est pas simplement un problème de connectivité passager.
  • Si l'agent Google Cloud pour SAP utilise le compte de service de votre VM, assurez-vous que celle-ci a accès à tous les champs d'application cloud ou, si vous limitez l'accès, vérifiez que la VM a accès à storage.googleapis.com. Pour plus d'informations, consultez Activer l'accès aux API et aux serveurs de métadonnées Cloud.
  • Si vous avez créé un compte de service à utiliser avec l'agent Google Cloud pour SAP, vérifiez les points suivants :
    • Le compte de service dispose du rôle Administrateur des objets de l'espace de stockage.
    • Le compte de service dispose du rôle Chiffreur/Déchiffreur de clés cryptographiques Cloud KMS si vous utilisez une clé de chiffrement gérée par le client pour chiffrer les sauvegardes dans Cloud Storage. Pour en savoir plus, consultez la page Chiffrement des sauvegardes.
  • Assurez-vous d'avoir correctement spécifié les paramètres dans le fichier de configuration Backint, PARAMETERS.json et dans le fichier SAP HANA global.ini.

Vous pouvez tester l'accès à votre bucket Cloud Storage à l'aide de la fonctionnalité d'autodiagnostic intégrée à l'agent de Google Cloud pour SAP. Pour en savoir plus, consultez la section Autodiagnostic.

Problème avec une opération de sauvegarde ou de récupération basée sur un instantané de disque

Problème : une opération de sauvegarde ou de récupération effectuée pour SAP HANA à l'aide de la commande hanadiskbackup ou hanadiskrestore de l'agent échoue.

Cause : ce problème peut survenir pour l'une des raisons suivantes :

  • L'agent rencontre une erreur et quitte l'opération de sauvegarde ou de récupération.
  • L'agent prend plus de temps que prévu pour créer l'instantané de disque ou l'importer dans Cloud Storage en raison d'un problème avec un service Google Cloud sous-jacent.
  • L'agent plante sans message d'erreur ou de réussite clair.
  • L'opération de sauvegarde ou de récupération échoue en raison d'un problème au niveau du système d'exploitation.
  • L'agent est obligé d'attendre plus longtemps que prévu par votre base de données SAP HANA, ce qui peut être dû à une charge de travail très importante.

Résolution : pour résoudre ce problème, utilisez les informations suivantes :

  • S'il s'agit d'une opération de sauvegarde qui échoue, procédez comme suit :

    1. Vérifiez que l'agent est en cours d'exécution. Si ce n'est pas le cas, redémarrez l'agent, puis réessayez l'opération de sauvegarde.

    2. Si l'agent s'exécute comme prévu, vérifiez l'état de la création de l'instantané :

      gcloud compute snapshots list
        --filter="sourceDisk:projects/PROJECT_ID/zones/ZONE_ID/disks/DISK_NAME"
      

      Remplacez les éléments suivants :

      • PROJECT_ID : projet Google Cloud dans lequel le disque source est déployé.
      • ZONE_ID : zone Compute Engine dans laquelle le disque source est déployé, par exemple us-central1-a.
      • DISK_NAME : nom du disque source.

      L'état de sortie peut être l'un des suivants : CREATING, UPLOADING ou READY.

    3. Si l'état de la création de l'instantané est CREATING ou UPLOADING, nous vous recommandons d'attendre la fin de cette opération, en particulier s'il s'agit du premier instantané que vous créez pour le disque hébergeant votre volume /hana/data.

      Si cette opération échoue, l'agent quitte automatiquement la procédure et met à jour les journaux. Vous pouvez réessayer de créer la sauvegarde en exécutant la commande hanadiskbackup. L'agent se charge de terminer l'opération de sauvegarde infructueuse dans la base de données SAP HANA et crée une sauvegarde basée sur des instantanés.

      Si vous avez utilisé l'argument -confirm-data-snapshot-after-create avec la commande hanadiskbackup et que l'opération d'importation de l'instantané échoue, vous devez supprimer manuellement l'entrée de l'instantané dans votre catalogue de sauvegarde SAP HANA et réessayer de créer l'instantané. Pour supprimer l'entrée du catalogue de sauvegarde SAP HANA, vous pouvez utiliser l'instruction BACKUP CATALOG DELETE. Pour en savoir plus sur l'argument -confirm-data-snapshot-after-create, consultez sa description dans la section Créer une sauvegarde basée sur un instantané de disque.

    4. Si l'état de création de l'instantané est READY, mais que la commande hanadiskbackup semble toujours être en cours d'exécution, cela signifie que l'agent attend que SAP HANA effectue sa partie de la sauvegarde.

    5. Si la commande hanadiskbackup semble s'exécuter plus longtemps que prévu, procédez comme suit pour reprendre le fonctionnement normal de votre base de données SAP HANA :

      1. Relancez le système de fichiers XFS contenant le volume /hana/data :

        xfs_freeze -u PATH_TO_HANA_DATA_VOLUME
      2. À partir de votre base de données SAP HANA, obtenez l'ID de sauvegarde de l'instantané de stockage ayant échoué :

        SELECT BACKUP_ID, STATE_NAME, COMMENT FROM M_BACKUP_CATALOG WHERE ENTRY_TYPE_NAME = 'data snapshot' and STATE_NAME = 'prepared'
      3. Dans SAP HANA, mettez à jour l'entrée de l'instantané ayant échoué :

        BACKUP DATA FOR FULL SYSTEM CLOSE SNAPSHOT BACKUP_ID UNSUCCESSFUL 'Do not use - manually terminated';
        

      Remplacez BACKUP_ID par le BACKUP_ID que vous avez récupéré à l'étape précédente.

    6. Pour résoudre le problème de l'échec de l'opération de sauvegarde, contactez le service client avec le pack d'assistance de l'agent.

  • S'il s'agit d'une opération de récupération qui échoue, procédez comme suit :

    1. Vérifiez que le disque d'origine hébergeant le volume /hana/data est associé à votre VM hôte. Si ce n'est pas le cas, joignez-le à l'aide de la commande gcloud compute instances attach-disk.

    2. Analysez à nouveau vos groupes de volumes et volumes logiques :

      sudo /sbin/dmsetup remove_all
      sudo /sbin/vgscan -v --mknodes
      sudo /sbin/vgchange -ay
      sudo /sbin/lvscan
      sudo mount -av
      
    3. Si la nouvelle analyse échoue, redémarrez votre VM hôte. Le système d'exploitation analyse alors à nouveau les groupes de volumes.

    4. Dans SAP HANA, vérifiez que le volume /hana/data est actif.

    5. Si le volume /hana/data n'est toujours pas actif, contactez le service client avec le pack d'assistance de l'agent pour résoudre le problème.

Obtenir de l'aide concernant l'agent Google Cloud pour SAP

Si vous avez besoin d'aide pour résoudre un problème lié à l'agent Google Cloud pour SAP, rassemblez les informations de diagnostic nécessaires et contactez Cloud Customer Care. Pour en savoir plus, consultez la section Informations de diagnostic sur l'agent Google Cloud pour SAP.