Halaman ini diterjemahkan oleh Cloud Translation API.

Tampilan INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Tampilan INFORMATION_SCHEMA.SHARED_DATASET_USAGE berisi metadata yang mendekati real-time tentang pemakaian tabel set data bersama. Untuk mulai membagikan data Anda ke seluruh organisasi, lihat Berbagi di BigQuery (sebelumnya Analytics Hub).

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan untuk membuat kueri tampilan INFORMATION_SCHEMA.SHARED_DATASET_USAGE, minta administrator untuk memberi Anda peran IAM BigQuery Data Owner (roles/bigquery.dataOwner) di project sumber Anda. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran bawaan ini berisi izin bigquery.datasets.listSharedDatasetUsage yang diperlukan untuk membuat kueri tampilan INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Skema

Data pokok dipartisi oleh kolom job_start_time dan dikelompokkan menurut project_id dan dataset_id.

INFORMATION_SCHEMA.SHARED_DATASET_USAGE memiliki skema berikut:

Nama kolom	Data type	Nilai
`project_id`	`STRING`	*(Kolom pengelompokan)* ID project yang berisi set data bersama.
`dataset_id`	`STRING`	*(Kolom pengelompokan)* ID dari set data bersama.
`table_id`	`STRING`	ID tabel yang diakses.
`data_exchange_id`	`STRING`	Jalur resource pertukaran data.
`listing_id`	`STRING`	Jalur resource listingan.
`job_start_time`	`TIMESTAMP`	*(Kolom partisi)* Waktu mulai tugas ini.
`job_end_time`	`TIMESTAMP`	Waktu berakhir tugas ini.
`job_id`	`STRING`	ID tugas. Misalnya, bquxjob_1234.
`job_project_number`	`INTEGER`	Jumlah project yang mencakup tugas ini.
`job_location`	`STRING`	Lokasi tugas.
`linked_project_number`	`INTEGER`	Nomor project pada project pelanggan.
`linked_dataset_id`	`STRING`	ID set data tertaut dari set data pelanggan.
`subscriber_org_number`	`INTEGER`	Nomor organisasi tempat tugas dijalankan. Nomor ini adalah nomor organisasi pelanggan. Kolom ini kosong untuk project yang tidak memiliki organisasi.
`subscriber_org_display_name`	`STRING`	String yang dapat dibaca manusia yang mengacu pada organisasi tempat tugas dijalankan. Nomor ini adalah nomor organisasi pelanggan. Kolom ini kosong untuk project yang tidak memiliki organisasi.
`job_principal_subject`	`STRING`	ID utama (ID email pengguna, akun layanan, ID email grup, domain) pengguna yang menjalankan tugas dan kueri terhadap set data tertaut.
`num_rows_processed`	`INTEGER`	Jumlah total baris yang diproses oleh tabel dasar yang dirujuk oleh resource yang dikueri.
`total_bytes_processed`	`INTEGER`	Jumlah total byte yang diproses oleh tabel dasar yang dirujuk oleh resource yang dikueri.
`shared_resource_id`	`STRING`	ID resource yang dikueri (tabel, tampilan, atau rutinitas).
`shared_resource_type`	`STRING`	Jenis resource yang dikueri. Misalnya, `TABLE`, `EXTERNAL_TABLE`, `VIEW`, `MATERIALIZED_VIEW`, `TABLE_VALUED_FUNCTION`, atau `SCALAR_FUNCTION`.
`referenced_tables`	`RECORD REPEATED`	Berisi kolom `project_id`, `dataset_id`, `table_id`, dan `processed_bytes` dari tabel dasar.

Retensi data

Tampilan INFORMATION_SCHEMA.SHARED_DATASET_USAGE berisi tugas yang sedang berjalan dan histori tugas selama 180 hari terakhir.

Cakupan dan sintaksis

Kueri terhadap tampilan ini harus menyertakan penentu region. Jika Anda tidak menetapkan penentu regional, metadata akan diambil dari region AS. Tabel berikut menjelaskan cakupan region untuk tampilan ini:

Nama Tampilan	Cakupan resource	Cakupan region
`[PROJECT_ID.]INFORMATION_SCHEMA.SHARED_DATASET_USAGE`	Level project	Region AS
[PROJECT_ID.]`region-REGION`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE	Level project	`REGION`

Ganti kode berikut:

Opsional: PROJECT_ID: ID project Google Cloud Anda. Jika tidak ditentukan, project default akan digunakan.
REGION: nama region set data apa pun. Misalnya, `region-us`.

Catatan: Anda harus menggunakan penentu region untuk membuat kueri tampilan INFORMATION_SCHEMA. Lokasi eksekusi kueri harus cocok dengan region tampilan INFORMATION_SCHEMA.

Contoh

Untuk menjalankan kueri terhadap project selain project default Anda, tambahkan project ID dalam format berikut:

PROJECT_ID.region-REGION_NAME.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Misalnya, myproject.region-us.INFORMATION_SCHEMA.SHARED_DATASET_USAGE.

Mendapatkan jumlah total tugas yang dijalankan di semua tabel bersama

Contoh berikut menghitung total tugas yang dijalankan oleh pelanggan untuk sebuah project:

SELECT
  COUNT(DISTINCT job_id) AS num_jobs
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE

Hasilnya mirip dengan berikut ini:

+------------+
| num_jobs   |
+------------+
| 1000       |
+------------+

Untuk memeriksa total tugas yang dijalankan oleh pelanggan, gunakan klausa WHERE:

Untuk set data, gunakan WHERE dataset_id = "...".
Untuk tabel, gunakan WHERE dataset_id = "..." AND table_id = "...".

Mendapatkan tabel yang paling sering digunakan berdasarkan jumlah baris yang diproses

Kueri berikut menghitung tabel yang paling sering digunakan berdasarkan jumlah baris yang diproses oleh pelanggan.

SELECT
  dataset_id,
  table_id,
  SUM(num_rows_processed) AS usage_rows
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1,
  2
ORDER BY
  3 DESC
LIMIT
  1

Outputnya mirip dengan yang berikut ini:

+---------------+-------------+----------------+
| dataset_id    | table_id      | usage_rows     |
+---------------+-------------+----------------+
| mydataset     | mytable     | 15             |
+---------------+-------------+----------------+

Menemukan organisasi teratas yang menggunakan tabel Anda

Kueri berikut menghitung pelanggan teratas berdasarkan jumlah byte yang diproses dari tabel Anda. Anda juga dapat menggunakan kolom num_rows_processed sebagai metrik.

SELECT
  subscriber_org_number,
  ANY_VALUE(subscriber_org_display_name) AS subscriber_org_display_name,
  SUM(total_bytes_processed) AS usage_bytes
FROM
  `region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
GROUP BY
  1

Outputnya mirip dengan yang berikut ini:

+--------------------------+--------------------------------+----------------+
|subscriber_org_number     | subscriber_org_display_name    | usage_bytes    |
+-----------------------------------------------------------+----------------+
| 12345                    | myorganization                 | 15             |
+--------------------------+--------------------------------+----------------+

Untuk pelanggan tanpa organisasi, Anda dapat menggunakan job_project_number, bukan subscriber_org_number.

Mendapatkan metrik penggunaan untuk pertukaran data Anda

Jika pertukaran data dan set data sumber Anda berada di project yang berbeda, ikuti langkah berikut guna melihat metrik penggunaan untuk pertukaran data Anda:

Temukan semua listingan yang termasuk dalam pertukaran data Anda.
Ambil set data sumber yang dilampirkan ke listingan.
Untuk melihat metrik penggunaan bagi pertukaran data Anda, gunakan kueri berikut:

SELECT
  *
FROM
  source_project_1.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"
UNION ALL
SELECT
  *
FROM
  source_project_2.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE
  dataset_id='source_dataset_id'
AND data_exchange_id="projects/4/locations/us/dataExchanges/x1"

Mendapatkan metrik penggunaan untuk tampilan bersama

Kueri berikut menampilkan metrik penggunaan untuk semua tampilan bersama yang ada dalam project:

SELECT
  project_id,
  dataset_id,
  table_id,
  num_rows_processed,
  total_bytes_processed,
  shared_resource_id,
  shared_resource_type,
  referenced_tables
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE shared_resource_type = 'VIEW'

Outputnya mirip dengan hal berikut ini:

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|     project_id      |   dataset_id   | table_id | num_rows_processed | total_bytes_processed | shared_resource_id | shared_resource_type |                                                                                                              referenced_tables                                                                                                              |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|     myproject       | source_dataset | view1    |                  6 |                    38 | view1              | VIEW                 | [{"project_id":"myproject","dataset_id":"source_dataset","table_id":"test_table","processed_bytes":"21"},
{"project_id":"bq-dataexchange-exp","dataset_id":"other_dataset","table_id":"other_table","processed_bytes":"17"}]                 |

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+----------------------+---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

Mendapatkan metrik penggunaan untuk fungsi bernilai tabel bersama

Kueri berikut menampilkan metrik penggunaan untuk semua fungsi bernilai tabel bersama yang ada dalam project:

SELECT
  project_id,
  dataset_id,
  table_id,
  num_rows_processed,
  total_bytes_processed,
  shared_resource_id,
  shared_resource_type,
  referenced_tables
FROM `myproject`.`region-us`.INFORMATION_SCHEMA.SHARED_DATASET_USAGE
WHERE shared_resource_type = 'TABLE_VALUED_FUNCTION'

Outputnya mirip dengan hal berikut ini:

+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+
|     project_id      |   dataset_id   | table_id | num_rows_processed | total_bytes_processed | shared_resource_id | shared_resource_type  |                                                  referenced_tables                                                  |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+
|     myproject       | source_dataset |          |                  3 |                    45 | provider_exp       | TABLE_VALUED_FUNCTION | [{"project_id":"myproject","dataset_id":"source_dataset","table_id":"test_table","processed_bytes":"45"}]           |
+---------------------+----------------+----------+--------------------+-----------------------+--------------------+-----------------------+---------------------------------------------------------------------------------------------------------------------+