Mengakses insight data di Dataplex

Insight data menawarkan cara otomatis untuk menjelajahi dan memahami data Anda. Dengan insight data, Gemini menggunakan metadata untuk membuat pertanyaan natural language tentang tabel Anda dan kueri untuk menjawabnya. Hal ini membantu Anda menemukan pola, menilai kualitas data, dan melakukan analisis statistik.

Dokumen ini menjelaskan fitur utama insight data dan cara melihatnya untuk eksplorasi data yang bermanfaat.

Sebelum memulai

Insight data dihasilkan menggunakan Gemini di BigQuery dan hanya dapat dihasilkan di BigQuery Studio. Pertama, siapkan Gemini di BigQuery, lalu dapatkan insight di BigQuery. Gemini memproses metadata Anda untuk insight secara eksklusif di wilayah us-central1. Untuk mengetahui informasi selengkapnya, lihat Lokasi penayangan Gemini. Setelah membuat insight, Anda dapat melihatnya di Dataplex.

Peran yang diperlukan

Untuk mendapatkan akses hanya baca ke insight yang dihasilkan, minta administrator Anda untuk memberi Anda peran IAM berikut:

Untuk mengetahui informasi selengkapnya tentang pemberian peran, lihat Mengelola akses ke project, folder, dan organisasi.

Anda mungkin juga bisa mendapatkan izin yang diperlukan melalui peran khusus atau peran bawaan lainnya. Untuk melihat izin yang benar-benar diperlukan untuk menghasilkan insight, luaskan bagian Izin yang diperlukan:

Izin yang diperlukan

  • dataplex.datascans.get
  • dataplex.datascans.getData

Mengaktifkan API

Untuk menggunakan insight data, aktifkan API berikut di project Anda:

Untuk informasi selengkapnya tentang cara mengaktifkan Gemini for Google Cloud API, lihat Mengaktifkan Gemini for Google Cloud API di project Google Cloud.

Tentang insight data

Saat menjelajahi tabel baru yang tidak dikenal, analis data sering kali menghadapi masalah cold start. Masalah ini sering kali melibatkan ketidakpastian tentang struktur data, pola utama, dan insight yang relevan dalam data, sehingga sulit untuk mulai menulis kueri.

Insight data menangani masalah cold start dengan otomatis membuat kueri bahasa alami dan padanan SQL-nya berdasarkan metadata tabel. Daripada memulai dengan editor kueri kosong, Anda dapat dengan cepat memulai eksplorasi data dengan kueri yang bermakna dan menawarkan insight yang berharga. Untuk menyelidiki lebih lanjut, Anda dapat mengajukan pertanyaan lanjutan di kanvas data.

Contoh insight yang dijalankan

Pertimbangkan tabel bernama telco_churn dengan metadata berikut:

Nama kolom Jenis
CustomerID STRING
Gender STRING
Masa bakti INT64
InternetService STRING
StreamingTV STRING
OnlineBackup STRING
Kontrak STRING
DukunganTeknis STRING
PaymentMethod STRING
MonthlyCharges FLOAT
Churn BOOLEAN

Berikut adalah beberapa contoh kueri yang dihasilkan insight data untuk tabel ini:

  • Identifikasi pelanggan yang telah berlangganan semua layanan premium dan telah menjadi pelanggan selama lebih dari 50 bulan.

    SELECT
      CustomerID,
      Contract,
      Tenure
    FROM
      agentville_datasets.telco_churn
    WHERE
      OnlineBackup = 'Yes'
      AND TechSupport = 'Yes'
      AND StreamingTV = 'Yes'
      AND Tenure > 50;
    
  • Identifikasi layanan internet mana yang memiliki pelanggan yang paling banyak beralih.

    SELECT
      InternetService,
      COUNT(DISTINCT CustomerID) AS total_customers
    FROM
      agentville_datasets.telco_churn
    WHERE
      Churn = TRUE
    GROUP BY
      InternetService
    ORDER BY
      total_customers DESC
    LIMIT 1;
    
  • Identifikasi rasio churn menurut segmen di antara pelanggan bernilai tinggi.

    SELECT
      Contract,
      InternetService,
      Gender,
      PaymentMethod,
      COUNT(DISTINCT CustomerID) AS total_customers,
      SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers,
      (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID))
      * 100 AS churn_rate
    FROM
      agentville_datasets.telco_churn
    WHERE
      MonthlyCharges > 100
    GROUP BY
      Contract,
      InternetService,
      Gender,
      PaymentMethod;
    

Lihat analisis

Untuk melihat insight untuk tabel BigQuery, akses entri tabel di Dataplex menggunakan Penelusuran Dataplex.

  1. Di konsol Google Cloud, buka halaman Penelusuran Dataplex.

    Buka Penelusuran Dataplex

  2. Telusuri entri tabel di Dataplex.

  3. Klik tab Insight. Jika tab kosong, berarti insight untuk tabel ini belum dibuat. Anda dapat membuat insight data di BigQuery Studio.

Harga

Untuk mengetahui detail harga fitur ini, lihat ringkasan harga Gemini di BigQuery.

Kuota dan batas

Untuk mengetahui informasi tentang kuota dan batas untuk fitur ini, lihat Kuota untuk Gemini di BigQuery.

Batasan

  • Insight data tersedia untuk tabel BigQuery, tabel BigLake, tabel eksternal, dan tampilan.
  • Untuk pelanggan multi-cloud, data dari cloud lain tidak tersedia.
  • Insight data tidak mendukung jenis kolom Geo atau JSON.
  • Pengoperasian insight tidak menjamin presentasi kueri setiap saat. Untuk meningkatkan kemungkinan menghasilkan kueri yang lebih menarik, buat ulang insight di BigQuery Studio.

Langkah berikutnya