Monitorare le schede

In qualità di fornitore di dati, puoi monitorare le metriche di utilizzo per le tue schede. Esistono due metodi per ottenere le metriche di utilizzo per i dati condivisi:

  • Utilizza Analytics Hub. Con Analytics Hub puoi visualizzare la dashboard delle metriche di utilizzo per le tue schede, che include sottoscrizioni giornaliere, job eseguiti giornalieri, numero di sottoscrittori per ciascuno dell'organizzazione e la frequenza dei job per ogni tabella. Le metriche di utilizzo per i dati condivisi vengono recuperati eseguendo query INFORMATION_SCHEMA.SHARED_DATASET_USAGE visualizzazione.

  • Utilizza la visualizzazione INFORMATION_SCHEMA. Puoi monitorare il modo in cui i sottoscrittori utilizzano i tuoi set di dati eseguendo query direttamente INFORMATION_SCHEMA.SHARED_DATASET_USAGE visualizzazione.

Utilizzare Analytics Hub

Per ottenere le metriche di utilizzo per i dati condivisi usando Analytics Hub: segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina di Analytics Hub.

    Vai ad Analytics Hub

  2. Fai clic sul nome dello scambio dati contenente la scheda per la quale vuoi visualizzare le metriche sull'utilizzo.

  3. Fai clic su Metriche di utilizzo e segui questi passaggi:

    1. Dal menu Schede, seleziona la scheda.

    2. Imposta l'intervallo di tempo.

Nella pagina vengono visualizzate le seguenti metriche di utilizzo:

  • Abbonamenti totali: il numero di abbonamenti attuali nella scheda selezionata. Puoi visualizzare gli abbonamenti totali per un massimo di 60 giorni.
  • Iscritti totali:il numero di iscritti unici rispetto a tutti. abbonamenti nella scheda selezionata. Puoi visualizzare il numero totale di iscritti per un massimo di 60 giorni.
  • Totale job eseguiti: il numero di job unici eseguiti su ciascuna tabella del scheda selezionata.
  • Byte totali analizzati: il numero totale di byte analizzati da tutte le tabelle della scheda selezionata.
  • Giornalieri abbonamenti: il grafico che tiene traccia del numero di abbonamenti per la scheda selezionata in un determinato periodo di tempo. Puoi visualizzare gli abbonamenti giornalieri per per un massimo di 60 giorni.
  • Iscritti per organizzazione: vengono elencate le organizzazioni e il relativo numero di iscritti che utilizzano la scheda selezionata.
  • Job eseguiti ogni giorno: questo grafico mostra il consumo dei job da scheda selezionata.
  • Frequenza dei job delle tabelle: la frequenza con cui si accede alle tabelle nella scheda selezionata.

Utilizzare la visualizzazione INFORMATION_SCHEMA

Se sei un fornitore di dati, puoi monitorare il modo in cui gli abbonati utilizzano i tuoi set di dati eseguendo una query sulla vista INFORMATION_SCHEMA.SHARED_DATASET_USAGE. Assicurati di disporre del ruolo necessario per eseguire query su questa visualizzazione.

Per eseguire la query su un progetto diverso da quello predefinito, aggiungi l'ID progetto nel seguente formato:

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Ad esempio, myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Gli esempi riportati di seguito descrivono come visualizzare le metriche sull'utilizzo eseguendo una query sulla visualizzazione INFORMATION_SCHEMA:

Ottieni il numero totale di job eseguiti su tutte le tabelle condivise

L'esempio seguente calcola il numero totale di job eseguiti dagli abbonati per un progetto:

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Il risultato è simile al seguente:

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Per controllare i job totali eseguiti dai sottoscrittori, utilizza la clausola WHERE:

  • Per i set di dati, utilizza WHERE dataset_id = "...".
  • Per le tabelle, utilizza WHERE dataset_id = "..." AND table_id = "...".

Ottieni la tabella più utilizzata in base al numero di righe elaborate

La seguente query calcola la tabella più utilizzata in base al numero di righe elaborati dagli abbonati.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

L'output è simile al seguente:

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Trova le principali organizzazioni che utilizzano le tue tabelle

La seguente query calcola i principali iscritti in base al numero di byte elaborati dalle tabelle. Puoi anche utilizzare la colonna num_rows_processed come di una metrica.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

L'output è simile al seguente:

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Per gli abbonati che non hanno un'organizzazione, puoi usare job_project_number anziché subscriber_org_number.

Ottenere le metriche di utilizzo per lo scambio di dati

Se l'scambio di dati e il set di dati di origine si trovano in progetti diversi, segui questi passaggi per visualizzare le metriche di utilizzo per lo scambio di dati:

  1. Trova tutte le schede che appartengono al tuo scambio di dati.
  2. Recupera il set di dati di origine collegato alla scheda.
  3. Per visualizzare le metriche di utilizzo per lo scambio di dati, utilizza la seguente query:
SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

Passaggi successivi