Diese Seite wurde von der Cloud Translation API übersetzt.

Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Die Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE enthält Metadaten in nahezu Echtzeit zum Verbrauch Ihrer freigegebenen Dataset-Tabellen. Informationen zum organisationsübergreifenden Freigeben von Daten finden Sie unter Sharing in BigQuery (früher Analytics Hub).

Erforderliche Rollen

Bitten Sie Ihren Administrator, Ihnen die IAM-Rolle BigQuery-Dateninhaber (roles/bigquery.dataOwner) für Ihr Quellprojekt zuzuweisen. Diese Rolle enthält die Berechtigung, die Sie zum Abfragen der Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE benötigen. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Diese vordefinierte Rolle enthält die Berechtigung bigquery.datasets.listSharedDatasetUsage, die zum Abfragen der INFORMATION_SCHEMA.SHARED_DATASET_USAGE-Ansicht erforderlich ist.

Sie können diese Berechtigung auch mit benutzerdefinierten Rollen oder anderen vordefinierten Rollen erhalten.

Schema

Die zugrunde liegenden Daten werden nach der Spalte job_start_time partitioniert und nach project_id und dataset_id geclustert.

Die Tabelle INFORMATION_SCHEMA.SHARED_DATASET_USAGE hat das folgende Schema:

Spaltenname	Datentyp	Wert
`project_id`	`STRING`	*(Clustering-Spalte)* Die ID des Projekts, das das freigegebene Dataset enthält.
`dataset_id`	`STRING`	*(Clustering-Spalte)* Die ID des freigegebenen Datasets.
`table_id`	`STRING`	Die ID der aufgerufenen Tabelle.
`data_exchange_id`	`STRING`	Der Ressourcenpfad des Datenaustauschs.
`listing_id`	`STRING`	Der Ressourcenpfad des Eintrags.
`job_start_time`	`TIMESTAMP`	*(Partitionierungsspalte)* Die Startzeit dieses Jobs.
`job_end_time`	`TIMESTAMP`	Die Endzeit dieses Jobs.
`job_id`	`STRING`	Die Job-ID. Beispiel: bquxjob_1234.
`job_project_number`	`INTEGER`	Die Nummer des Projekts, zu dem dieser Job gehört.
`job_location`	`STRING`	Der Ort des Jobs.
`linked_project_number`	`INTEGER`	Die Projektnummer des Projekts des Abonnenten.
`linked_dataset_id`	`STRING`	Die ID des verknüpften Datasets des Abonnenten.
`subscriber_org_number`	`INTEGER`	Die Organisationsnummer, in der der Job ausgeführt wurde. Das ist die Organisationsnummer des Abonnenten. Dieses Feld ist für Projekte ohne Organisation leer.
`subscriber_org_display_name`	`STRING`	Ein visuell lesbarer String, der sich auf die Organisation bezieht, in der der Job ausgeführt wurde. Das ist die Organisationsnummer des Abonnenten. Dieses Feld ist für Projekte ohne Organisation leer.
`job_principal_subject`	`STRING`	Die Hauptkonto-ID (E-Mail-ID des Nutzers, Dienstkonto, E-Mail-ID der Gruppe, Domain) von Nutzern, die Jobs und Abfragen für verknüpfte Datasets ausführen.
`num_rows_processed`	`INTEGER`	Die Gesamtzahl der Zeilen, die von den Basistabellen verarbeitet werden, auf die in der abgefragten Ressource verwiesen wird.
`total_bytes_processed`	`INTEGER`	Die Gesamtzahl der Byte, die von den Basistabellen verarbeitet wurden, auf die von der abgefragten Ressource verwiesen wird.
`shared_resource_id`	`STRING`	Die ID der abgefragten Ressource (Tabelle, Ansicht oder Routine).
`shared_resource_type`	`STRING`	Der Typ der abgefragten Ressource. Beispiel: `TABLE`, `EXTERNAL_TABLE`, `VIEW`, `MATERIALIZED_VIEW`, `TABLE_VALUED_FUNCTION` oder `SCALAR_FUNCTION`.
`referenced_tables`	`RECORD REPEATED`	Enthält die Felder `project_id`, `dataset_id`, `table_id` und `processed_bytes` der Basistabelle.

Datenaufbewahrung

Die Ansicht INFORMATION_SCHEMA.SHARED_DATASET_USAGE enthält laufende Jobs und den Jobverlauf der letzten 180 Tage.

Bereich und Syntax

Für Abfragen dieser Ansicht muss ein Regions-Qualifier verwendet werden. Wenn Sie keinen Regions-Qualifier angeben, werden Metadaten aus der US-Region abgerufen. In der folgenden Tabelle wird der Regionsbereich für diese Ansicht erläutert:

Ansichtsname	Ressourcenbereich	Regionsbereich
`[PROJECT_ID.]INFORMATION_SCHEMA.SHARED_DATASET_USAGE`	Projektebene	US-Region
[PROJECT_ID.]`region-REGION`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE	Projektebene	`REGION`

Dabei gilt:

Optional: PROJECT_ID: die ID Ihres Google Cloud -Projekts. Wenn keine Angabe erfolgt, wird das Standardprojekt verwendet.
REGION: ist ein beliebiger Dataset-Regionsname. Beispiel: `region-us`

Hinweis: Zum Abfragen von INFORMATION_SCHEMA-Ansichten müssen Sie einen Regions-Qualifier verwenden. Der Ort der Abfrageausführung muss mit der Region der Ansicht INFORMATION_SCHEMA übereinstimmen.

Beispiele

Wenn Sie die Abfrage für ein anderes Projekt als Ihr Standardprojekt ausführen möchten, fügen Sie die Projekt-ID im folgenden Format hinzu:

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Beispiel: myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Gesamtzahl der Jobs abrufen, die in allen freigegebenen Tabellen ausgeführt werden

Im folgenden Beispiel werden die Jobs insgesamt berechnet, die von Abonnenten für ein Projekt ausgeführt werden:

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Das Ergebnis sieht etwa so aus:

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Verwenden Sie die Klausel WHERE, um die von Abonnenten ausgeführten Jobs zu prüfen:

Verwenden Sie für Datasets WHERE dataset_id = "...".
Verwenden Sie WHERE dataset_id = "..." AND table_id = "..." für Tabellen.

Anhand der Anzahl der verarbeiteten Zeilen die am häufigsten verwendete Tabelle abrufen

Die folgende Abfrage berechnet die am häufigsten verwendete Tabelle basierend auf der Anzahl der von Abonnenten verarbeiteten Zeilen.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

Die Ausgabe sieht in etwa so aus:

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Top-Organisationen suchen, die Ihre Tabellen verwenden

Bei der folgenden Abfrage werden die Top-Abonnenten basierend auf der Anzahl der Byte berechnet, die aus Ihren Tabellen verarbeitet werden. Sie können auch die Spalte num_rows_processed als Messwert verwenden.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

Die Ausgabe sieht in etwa so aus:

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Für Abonnenten ohne Organisation können Sie job_project_number anstelle von subscriber_org_number verwenden.

Nutzungsmesswerte für Ihren Datenaustausch abrufen

Wenn sich Ihr Datenpool und Ihr Quell-Dataset in verschiedenen Projekten befinden, führen Sie die folgenden Schritte aus, um die Nutzungsmesswerte für Ihren Datenaustausch aufzurufen:

Finden Sie alle Einträge, die zu Ihrem Datenaustausch gehören.
Rufen Sie das Quell-Dataset ab, das dem Eintrag zugeordnet ist.
Verwenden Sie die folgende Abfrage, um die Nutzungsmesswerte für Ihren Datenaustausch aufzurufen:

SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

Nutzungsmesswerte für freigegebene Ansichten abrufen

Die folgende Abfrage zeigt die Nutzungsmesswerte für alle freigegebenen Ansichten in einem Projekt an:

SELECT
  project_id,
  dataset_id,
  table_id,
  num_rows_processed,
  total_bytes_processed,
  shared_resource_id,
  shared_resource_type,
  referenced_tables
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE shared_resource_type = 'VIEW'

Die Ausgabe sieht etwa so aus:

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|     project_id      |   dataset_id   | table_id | num_rows_processed | total_bytes_processed | shared_resource_id | shared_resource_type |                                                                                                              referenced_tables                                                                                                              |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|     myproject       | source_dataset | view1    |                  6 |                    38 | view1              | VIEW                 | [{"project_id":"myproject","dataset_id":"source_dataset","table_id":"test_table","processed_bytes":"21"},
{"project_id":"bq-dataexchange-exp","dataset_id":"other_dataset","table_id":"other_table","processed_bytes":"17"}]                 |

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

Nutzungsmesswerte für freigegebene Tabellenwertfunktionen abrufen

Die folgende Abfrage zeigt die Nutzungsmesswerte für alle wertbezogenen Funktionen für freigegebene Tabellen in einem Projekt an:

SELECT
  project_id,
  dataset_id,
  table_id,
  num_rows_processed,
  total_bytes_processed,
  shared_resource_id,
  shared_resource_type,
  referenced_tables
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE shared_resource_type = 'TABLE_VALUED_FUNCTION'

Die Ausgabe sieht etwa so aus:

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+
|     project_id      |   dataset_id   | table_id | num_rows_processed | total_bytes_processed | shared_resource_id | shared_resource_type  |                                                  referenced_tables                                                  |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+
|     myproject       | source_dataset |          |                  3 |                    45 | provider_exp       | TABLE_VALUED_FUNCTION | [{"project_id":"myproject","dataset_id":"source_dataset","table_id":"test_table","processed_bytes":"45"}]           |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+