Einträge überwachen

Als Datenanbieter können Sie die Nutzungsmesswerte für Ihre Einträge erfassen. Es gibt zwei Methoden, um die Nutzungsmesswerte für Ihre freigegebenen Daten abzurufen:

  • Verwenden Sie Analytics Hub. Mit Analytics Hub können Sie das Dashboard mit den Nutzungsmesswerten für Ihre Einträge aufrufen, das tägliche Abos, täglich ausgeführte Jobs, die Anzahl der Abonnenten für jede Organisation und die Häufigkeit der Jobs für jede Tabelle enthält. Die Nutzungsmesswerte für Ihre freigegebenen Daten werden durch Abfrage der Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE abgerufen.

  • Wählen Sie das Dropdown-Menü INFORMATION_SCHEMA Ansicht aus: Sie können verfolgen, wie Abonnenten Ihre Datasets verwenden, indem Sie die Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE direkt abfragen.

Analytics Hub verwenden

So rufen Sie die Nutzungsmesswerte für Ihre freigegebenen Daten mithilfe von Analytics Hub ab:

  1. Rufen Sie in der Google Cloud Console die Seite Analytics-Hub auf.

    Zum Analytics Hub

  2. Klicken Sie auf den Namen des Datenpools, der den Eintrag enthält, für den Sie die Nutzungsmesswerte aufrufen möchten.

  3. Klicken Sie auf Nutzungsmesswerte und gehen Sie dann so vor:

    1. Wählen Sie im Menü Einträge den Eintrag aus.

    2. Legen Sie den Zeitraum fest.

Auf der Seite werden die folgenden Nutzungsmesswerte angezeigt:

  • Gesamtzahl der Abos: Die Anzahl der aktuellen Abos in dem ausgewählten Eintrag. Sie können sich die Gesamtzahl der Abos bis zu 60 Tage anzeigen lassen.
  • Abonnenten insgesamt:Die Anzahl der eindeutigen Abonnenten für alle Abos im ausgewählten Eintrag. Sie können die Gesamtzahl der Abonnenten bis zu 60 Tage aufrufen.
  • Gesamtzahl der ausgeführten Jobs: Die Anzahl der eindeutigen Jobs, die in jeder Tabelle des ausgewählten Eintrags ausgeführt werden.
  • Gesamt gescannte Byte: Die Gesamtzahl der Byte, die aus allen Tabellen der ausgewählten Liste gescannt wurden.
  • Tägliche Abos: Das Diagramm, das die Anzahl der Abos für den ausgewählten Eintrag über einen bestimmten Zeitraum verfolgt. Sie können tägliche Abos bis zu 60 Tage lang aufrufen.
  • Abonnenten pro Organisation: Listet die Organisationen und deren Anzahl von Abonnenten auf, die den ausgewählten Eintrag verwenden.
  • Täglich ausgeführte Jobs: Dieses Diagramm zeigt den Jobverbrauch aus dem ausgewählten Eintrag an.
  • Jobhäufigkeit von Tabellen: Die Häufigkeit, mit der auf die Tabellen in der ausgewählten Liste zugegriffen wird.

Ansicht INFORMATION_SCHEMA verwenden

Wenn Sie Datenanbieter sind, können Sie erfassen, wie Abonnenten Ihre Datasets verwenden, indem Sie die Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE abfragen. Prüfen Sie, ob Sie die erforderliche Rolle zum Abfragen dieser Ansicht haben.

Wenn Sie die Abfrage für ein anderes Projekt als Ihr Standardprojekt ausführen möchten, fügen Sie die Projekt-ID im folgenden Format hinzu:

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Beispiel: myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

In den folgenden Beispielen wird beschrieben, wie Sie die Nutzungsmesswerte durch Abfragen der Ansicht INFORMATION_SCHEMA aufrufen:

Gesamtzahl der Jobs abrufen, die in allen freigegebenen Tabellen ausgeführt werden

Im folgenden Beispiel werden die Jobs insgesamt berechnet, die von Abonnenten für ein Projekt ausgeführt werden:

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Das Ergebnis sieht etwa so aus:

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Verwenden Sie die Klausel WHERE, um die von Abonnenten ausgeführten Jobs zu prüfen:

  • Verwenden Sie für Datasets WHERE dataset_id = "...".
  • Verwenden Sie WHERE dataset_id = "..." AND table_id = "..." für Tabellen.

Anhand der Anzahl der verarbeiteten Zeilen die am häufigsten verwendete Tabelle abrufen

Die folgende Abfrage berechnet die am häufigsten verwendete Tabelle basierend auf der Anzahl der von Abonnenten verarbeiteten Zeilen.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

Die Ausgabe sieht in etwa so aus:

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Top-Organisationen suchen, die Ihre Tabellen verwenden

Bei der folgenden Abfrage werden die Top-Abonnenten basierend auf der Anzahl der Byte berechnet, die aus Ihren Tabellen verarbeitet werden. Sie können auch die Spalte num_rows_processed als Messwert verwenden.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

Die Ausgabe sieht in etwa so aus:

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Für Abonnenten ohne Organisation können Sie job_project_number anstelle von subscriber_org_number verwenden.

Nutzungsmesswerte für Ihren Datenaustausch abrufen

Wenn sich Ihr Datenpool und Ihr Quell-Dataset in verschiedenen Projekten befinden, führen Sie die folgenden Schritte aus, um die Nutzungsmesswerte für Ihren Datenaustausch aufzurufen:

  1. Finden Sie alle Einträge, die zu Ihrem Datenaustausch gehören.
  2. Rufen Sie das Quell-Dataset ab, das dem Eintrag zugeordnet ist.
  3. Verwenden Sie die folgende Abfrage, um die Nutzungsmesswerte für Ihren Datenaustausch aufzurufen:
SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

Nächste Schritte