Surveiller l'utilisation de Data Boost

Cette page explique comment surveiller et analyser l'utilisation de Spanner Data Boost à l'aide de Cloud Monitoring et des journaux d'audit Spanner.

Cloud Monitoring offre la possibilité de suivre l'utilisation totale au fil du temps et de la répartir par utilisateur. Les journaux d'audit Spanner permettent une analyse plus flexible des utilisations, y compris la fourniture de métriques par utilisateur ou par ID de tâche BigQuery.

Utiliser Cloud Monitoring pour suivre l'utilisation de Data Boost

Pour suivre l'utilisation globale de Data Boost:

  1. Dans Google Cloud Console, accédez à Monitoring.
    Accéder à Monitoring
  2. Si l'Explorateur de métriques s'affiche dans le menu de navigation, sélectionnez-le. Sinon, cliquez sur Ressources, puis sélectionnez Explorateur de métriques.
  3. En haut de la page, sélectionnez un intervalle de temps.
  4. Dans la liste déroulante Métrique, dans le champ Filtrer par nom de ressource ou de métrique, saisissez spanner, puis appuyez sur Enter pour affiner la recherche.
  5. Dans la liste Métrique, sélectionnez Instance Cloud Spanner > Instance > Unité de traitement en secondes, puis cliquez sur Appliquer.

    Cela crée un graphique en courbes de l'utilisation agrégée de Data Boost sur toutes les instances Spanner.

  6. Pour afficher l'utilisation d'une instance particulière, procédez comme suit:

    1. Cliquez sur + AJOUTER UN FILTRE pour créer un filtre.
    2. Dans la liste déroulante Étiquette 1, sélectionnez instance_id.
    3. Dans le champ de texte Valeur 1, saisissez ou sélectionnez l'ID de l'instance pour laquelle afficher l'utilisation.
  7. Pour afficher la répartition de l'utilisation par instance, procédez comme suit:

    1. Effacez tous les filtres en cliquant sur l'icône de la corbeille à côté des champs Filtres.
    2. Sous Grouper par, dans la liste déroulante Libellés, sélectionnez instance_id, puis Somme dans la liste Fonction de regroupement.
  8. Pour répartir l'utilisation par compte principal, sous Grouper par, sélectionnez credential_id dans la liste Libellés et Somme dans la liste Fonction de regroupement.

L'exemple suivant montre l'unité de traitement en secondes par compte principal.

Secondes de PU par utilisateur

Utiliser les journaux d'audit pour analyser l'utilisation de Data Boost

Les journaux d'audit Spanner permettent une analyse plus flexible de l'utilisation de Data Boost. En plus de pouvoir répartir l'utilisation dans le temps par instance ou par compte principal comme avec Cloud Monitoring, les journaux d'audit Spanner, s'ils sont activés et disponibles, permettent de répartir l'utilisation dans le temps par base de données ou ID de tâche BigQuery.

L'activation des journaux d'audit peut entraîner des frais supplémentaires. Pour en savoir plus sur les tarifs de Logging, consultez la page Tarifs de Google Cloud Observability: Cloud Logging.

Activer les journaux d'audit de l'utilisation de Data Boost

Vous devez activer les journaux d'audit des accès aux données pour Spanner avant de pouvoir collecter des données d'utilisation pour Data Boost. Pour cela, procédez comme suit :

  1. Suivez les instructions de la section Configurer les journaux d'audit pour l'accès aux données à l'aide de la console Google Cloud.
  2. Activez le type de journal Lecture de données pour le service API Spanner.
  3. Pour obtenir l'utilisation de Data Boost par le biais du texte SQL d'un job BigQuery, assurez-vous que les journaux d'audit pour BigQuery sont également activés.

Afficher l'utilisation par compte principal

Pour interroger les journaux d'audit afin d'afficher l'utilisation de Data Boost par utilisateur, procédez comme suit:

  1. Accédez à l'explorateur de journaux dans la console Google Cloud.

    Accéder à l'explorateur de journaux

  2. Dans le menu de navigation, cliquez sur Analyse de journaux.

  3. Pour afficher l'utilisation par utilisateur et par base de données au cours des sept derniers jours, exécutez la requête suivante. Pour modifier la période d'utilisation, modifiez l'expression timestamp dans la clause WHERE.

    SELECT
      SUM(CAST(JSON_VALUE(labels.data_boost_usage) AS INT64)) AS usage,
      REGEXP_EXTRACT(
        proto_payload.audit_log.resource_name,
        'projects/[^/]+/instances/[^/]+/databases/[^/]+') AS database,
      proto_payload.audit_log.authentication_info.principal_email AS principal_email
    FROM `PROJECT_NAME.global._Default._AllLogs`
    WHERE
      timestamp > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
      AND resource.type = 'spanner_instance' AND operation.last IS NULL
      AND JSON_VALUE(labels.data_boost_usage) != ''
    GROUP BY database, principal_email;
    

    Remplacez PROJECT_NAME par le nom de votre projet.

L'exemple suivant illustre l'utilisation en unités de traitement pour quatre comptes principaux.

Utilisation de Data Boost par utilisateur à partir des journaux d'audit

Afficher l'utilisation par ID de job BigQuery

Pour interroger les journaux d'audit afin d'afficher l'utilisation de Data Boost ventilée par base de données, utilisateur et ID de tâche BigQuery, procédez comme suit:

  1. Accédez à l'explorateur de journaux dans la console Google Cloud.

    Accéder à l'explorateur de journaux

  2. Dans le menu de navigation, cliquez sur Analyse de journaux.

  3. Exécutez la requête suivante :

    SELECT
      SUM(CAST(JSON_VALUE(labels.data_boost_usage) AS INT64)) AS usage,
      REGEXP_EXTRACT(
        proto_payload.audit_log.resource_name,
        'projects/[^/]+/instances/[^/]+/databases/[^/]+') AS database,
      proto_payload.audit_log.authentication_info.principal_email AS principal_email,
      IFNULL(JSON_VALUE(labels.data_boost_workload_id), 'not from BQ') AS job_id
    FROM `PROJECT_NAME.global._Default._AllLogs`
    WHERE
      timestamp > TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
      AND resource.type = 'spanner_instance' AND operation.last IS NULL
      AND JSON_VALUE(labels.data_boost_usage) != ''
    GROUP BY database, principal_email, job_id;
    

    Remplacez PROJECT_NAME par le nom de votre projet.

L'exemple suivant illustre l'utilisation par ID de job BigQuery.

Utilisation de Data Boost par ID de job

Afficher l'utilisation par texte SQL BigQuery

Pour afficher l'utilisation de Data Boost pour plusieurs tâches BigQuery (agrégées par le texte SQL de ces tâches), procédez comme suit:

  1. Accédez à l'explorateur de journaux dans la console Google Cloud.

    Accéder à l'explorateur de journaux

  2. Dans le menu de navigation, cliquez sur Analyse de journaux.

  3. Exécutez la requête suivante :

    SELECT
      SUM(
        CAST(
          JSON_VALUE(db.labels.data_boost_usage)
          AS INT64)) AS usage,
      JSON_VALUE(
        bq.proto_payload.audit_log.metadata.jobInsertion.job.jobConfig.queryConfig.query)
        AS bq_query
    FROM
      `PROJECT_NAME.global._Default._AllLogs` db,
      `PROJECT_NAME.global._Default._AllLogs` bq
    WHERE
      db.timestamp > TIMESTAMP_SUB(
        CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
      AND db.resource.type = 'spanner_instance'
      AND JSON_VALUE(db.labels.data_boost_usage) != ''
      AND db.operation.last IS NULL
      AND bq.timestamp > TIMESTAMP_SUB(
        CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
      AND bq.proto_payload.audit_log.method_name
        = 'google.cloud.bigquery.v2.JobService.InsertJob'
      AND bq.resource.type = 'bigquery_project'
      AND JSON_VALUE(
        bq.proto_payload.audit_log.metadata.jobInsertion.job.jobConfig.queryConfig.query)
        IS NOT NULL
      AND JSON_VALUE(db.labels.data_boost_workload_id)
        = REGEXP_EXTRACT(bq.proto_payload.audit_log.resource_name, '[^/]*$')
    GROUP BY bq_query
    ORDER BY usage DESC
    

    Remplacez PROJECT_NAME par le nom de votre projet.

L'exemple suivant illustre l'utilisation de Data Boost par texte SQL.

Utilisation de Data Boost par texte SQL

Créer une alerte Data Boost

Pour créer une alerte envoyée lorsque l'utilisation de Data Boost dépasse un seuil prédéfini, consultez la section Définir une alerte pour l'utilisation de Data Boost.

Étapes suivantes