Supervisa las fichas

Como proveedor de datos, puedes realizar un seguimiento de las métricas de uso de tus fichas. Existen dos métodos para obtener las métricas de uso de tus datos compartidos:

  • Usa Analytics Hub. Con Analytics Hub, puedes ver el panel de métricas de uso para tus fichas que incluye suscripciones diarias, trabajos ejecutados por día, cantidad de suscriptores de cada organización y frecuencia de trabajos para cada tabla. Las métricas de uso para tus datos compartidos se recuperan con una consulta a la vista INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

  • Usa la vista INFORMATION_SCHEMA. Puedes realizar un seguimiento de cómo los suscriptores usan tus conjuntos de datos con una consulta directa a la vista INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Usa Analytics Hub

Para obtener las métricas de uso de tus datos compartidos con Analytics Hub, sigue estos pasos:

  1. En la consola de Google Cloud, ve a la página Analytics Hub.

    Ir a Analytics Hub

  2. Haz clic en el nombre de intercambio de datos que contiene la ficha para la que deseas ver las métricas de uso.

  3. Haz clic en Métricas de uso y, luego, haz lo siguiente:

    1. En el menú Fichas, selecciona la ficha.

    2. Establece el intervalo de tiempo.

En la página, se muestran las siguientes métricas de uso:

  • Total de suscripciones: la cantidad de suscripciones actuales en la ficha seleccionada. Puedes ver el total de suscripciones durante un máximo de 60 días.
  • Total de suscriptores: es la cantidad de suscriptores únicos en todas las suscripciones de la ficha seleccionada. Puedes ver el total de suscriptores durante un máximo de 60 días.
  • Total de trabajos ejecutados: la cantidad de trabajos únicos que se ejecutan en cada tabla de la ficha seleccionada.
  • Total de bytes analizados: la cantidad total de bytes analizados de todas las tablas de la ficha seleccionada.
  • Suscripciones diarias: el gráfico que realiza un seguimiento de la cantidad de suscripciones de la ficha seleccionada durante un período. Puedes ver las suscripciones diarias durante un máximo de 60 días.
  • Suscriptores por organización: enumera las organizaciones y su cantidad de suscriptores que consumen la ficha seleccionada.
  • Trabajos ejecutados diariamente: este gráfico muestra el consumo de trabajos de la ficha seleccionada.
  • Frecuencia de trabajos de las tablas: es la frecuencia con la que se accede a las tablas en la ficha seleccionada.

Usa la vista INFORMATION_SCHEMA

Si eres un proveedor de datos, puedes realizar un seguimiento de cómo los suscriptores usan tus conjuntos de datos con una consulta a la vista INFORMATION_SCHEMA.SHARED_DATASET_USAGE. Asegúrate de tener el rol necesario para consultar esta vista.

Para ejecutar la consulta en un proyecto que no sea el predeterminado, agrega el ID del proyecto con el siguiente formato:

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Por ejemplo, myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

En los siguientes ejemplos, se describe cómo ver las métricas de uso con una consulta a la vista INFORMATION_SCHEMA:

Obtén la cantidad total de trabajos ejecutados en todas las tablas compartidas

En el siguiente ejemplo, se calcula el total de trabajos que ejecutan los suscriptores para un proyecto:

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

El resultado es similar al siguiente:

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Para verificar el total de trabajos que ejecutan los suscriptores, usa la cláusula WHERE:

  • Para los conjuntos de datos, usa WHERE dataset_id = "...".
  • Para las tablas, usa WHERE dataset_id = "..." AND table_id = "...".

Obtén la tabla más usada según la cantidad de filas procesadas

La siguiente consulta calcula la tabla más usada según la cantidad de filas procesadas por los suscriptores.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

El resultado es similar a este:

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Busca las organizaciones principales que consumen tus tablas

En la siguiente consulta, se calculan los suscriptores principales según la cantidad de bytes procesados de tus tablas. También puedes usar la columna num_rows_processed como una métrica.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

El resultado es similar a este:

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Para los suscriptores sin una organización, puedes usar job_project_number en lugar de subscriber_org_number.

Obtén métricas de uso para tu intercambio de datos

Si tu intercambio de datos y conjunto de datos de origen están en proyectos diferentes, sigue estos pasos para ver las métricas de uso de tu intercambio de datos:

  1. Busca todas las fichas que pertenecen a tu intercambio de datos.
  2. Recupera el conjunto de datos de origen adjunto a la ficha.
  3. Para ver las métricas de uso de tu intercambio de datos, usa la siguiente consulta:
SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

¿Qué sigue?