Surveiller les fiches

En tant que fournisseur de données, vous pouvez effectuer le suivi des métriques d'utilisation de vos fiches. Il existe deux méthodes pour obtenir les métriques d'utilisation de vos données partagées :

  • Utiliser Analytics Hub. Avec Analytics Hub, vous pouvez afficher le tableau de bord des métriques d'utilisation de vos fiches, qui inclut les abonnements quotidiens, les jobs exécutés quotidiennement, le nombre d'abonnés pour chaque organisation et la fréquence des jobs pour chaque table. Les métriques d'utilisation de vos données partagées sont récupérées en interrogeant la vue INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

  • Utiliser la vue INFORMATION_SCHEMA. Vous pouvez suivre la manière dont les abonnés utilisent vos ensembles de données en interrogeant directement la vue INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Utiliser Analytics Hub

Pour obtenir les métriques d'utilisation de vos données partagées à l'aide d'Analytics Hub, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page Analytics Hub.

    Accéder à Analytics Hub

  2. Cliquez sur le nom de l'échange de données contenant la fiche pour laquelle vous souhaitez afficher les métriques d'utilisation.

  3. Cliquez sur Métriques d'utilisation, puis procédez comme suit :

    1. Dans le menu Fiches, sélectionnez la fiche.

    2. Définissez la période.

La page affiche les métriques d'utilisation suivantes :

  • Total des abonnements : nombre d'abonnements actuels sur la fiche sélectionnée. Vous pouvez afficher le nombre total d'abonnements pour une période maximale de 60 jours.
  • Nombre total d'abonnés :nombre d'abonnés uniques pour tous les abonnements sur la fiche sélectionnée. Vous pouvez afficher le nombre total d'abonnés pour une période maximale de 60 jours.
  • Nombre total de jobs exécutés : nombre de jobs uniques exécutées sur chaque table de la fiche sélectionnée.
  • Nombre total d'octets analysés : nombre total d'octets analysés dans toutes les tables de la fiche sélectionnée.
  • Abonnements quotidiens : graphique permettant de suivre le nombre d'abonnements associés à la fiche sélectionnée sur une période donnée. Vous pouvez afficher les abonnements quotidiens pour une période maximale de 60 jours.
  • Abonnés par organisation : liste les organisations et leur nombre d'abonnés qui utilisent la fiche que vous avez sélectionnée.
  • Jobs exécutés par jour : ce graphique affiche la consommation de jobs de la fiche sélectionnée.
  • Fréquence des jobs des tables : fréquence d'accès aux tables sur la fiche sélectionnée.

Utiliser la vue INFORMATION_SCHEMA

Si vous êtes un fournisseur de données, vous pouvez suivre la manière dont les abonnés utilisent vos ensembles de données en interrogeant la vue INFORMATION_SCHEMA.SHARED_DATASET_USAGE. Assurez-vous de disposer du rôle requis pour interroger cette vue.

Pour exécuter la requête sur un projet autre que celui par défaut, ajoutez l'ID du projet en respectant le format suivant :

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Par exemple, myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Les exemples suivants décrivent comment afficher les métriques d'utilisation en interrogeant la vue INFORMATION_SCHEMA :

Obtenir le nombre total de jobs exécutés sur toutes les tables partagées

L'exemple suivant calcule le nombre total de jobs exécutés par des abonnés pour un projet donné :

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Le résultat ressemble à ce qui suit :

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Pour vérifier le nombre total de jobs exécutés par des abonnés, utilisez la clause WHERE :

  • Pour les ensembles de données, utilisez WHERE dataset_id = "...".
  • Pour les tables, utilisez WHERE dataset_id = "..." AND table_id = "...".

Obtenir la table la plus utilisée en fonction du nombre de lignes traitées

La requête suivante calcule la table la plus utilisée en fonction du nombre de lignes traitées par les abonnés.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

Le résultat ressemble à ce qui suit :

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Identifier les principales organisations qui utilisent vos tables

La requête suivante calcule les principaux abonnés en fonction du nombre d'octets traités à partir de vos tables. Vous pouvez également utiliser la colonne num_rows_processed en tant que métrique.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

Le résultat ressemble à ce qui suit :

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Pour les abonnés sans organisation, vous pouvez utiliser job_project_number au lieu de subscriber_org_number.

Obtenir les métriques d'utilisation de votre échange de données

Si votre échange de données et votre ensemble de données source se trouvent dans des projets différents, procédez comme suit pour afficher les métriques d'utilisation de votre échange de données :

  1. Recherchez toutes les fiches qui appartiennent à votre échange de données.
  2. Récupérez l'ensemble de données source associé à la fiche.
  3. Pour afficher les métriques d'utilisation de votre échange de données, utilisez la requête suivante :
SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

Étapes suivantes