Apa yang dimaksud dengan produk data?

Produk data hanyalah cara mengemas data agar dapat mengatasi masalah bisnis tertentu. Daripada menawarkan data mentah yang mungkin berantakan atau membingungkan, kami memperlakukannya seperti produk di rak toko—lengkap dengan deskripsi tentang definisi data, cara menggunakannya, dan janji bahwa data tersebut akurat. Hal ini mengubah informasi mentah menjadi aset berkualitas tinggi dan mudah ditemukan yang dapat diandalkan oleh seluruh organisasi.

Bayangkan perbedaan antara membeli bahan-bahan terpisah dan membeli kit makanan. Produk data adalah kit tersebut: produk ini mengemas data mentah dengan petunjuk dan konteks yang diperlukan untuk memecahkan masalah bisnis tertentu. Produk ini mengubah data yang tersebar menjadi sesuatu yang tepercaya, mudah ditemukan, dan langsung berguna bagi organisasi.

Poin-poin penting

Produk data dapat digunakan dalam berbagai bentuk, termasuk:

  • API yang menampilkan skor prediktif (seperti skor risiko kredit)
  • Dasbor yang disematkan dalam aplikasi untuk menampilkan analisis pengguna
  • Mesin pemberi saran yang menyarankan film atau produk
  • Model machine learning yang mendeteksi penipuan secara real-time
  • Agen AI yang dapat dilatih dan dioperasikan pada data yang telah dibersihkan, diatur, dan diselaraskan dengan tujuan bisnis

Data sebagai produk versus produk data

Istilah "produk data" dan "data sebagai produk" sering kali membingungkan, tetapi keduanya memiliki arti yang berbeda. Memahami perbedaan ini penting untuk membangun solusi cloud.

  • Data sebagai produk (DaaP) adalah pola pikir atau strategi, dan biasanya berkaitan dengan konsep arsitektur "Mesh Data". Artinya, Anda memperlakukan set data internal dengan perhatian yang sama seperti saat memperlakukan produk software publik.
  • Produk data, di sisi lain, adalah hasil teknis yang sebenarnya. Data ini adalah data yang telah dikemas sebelumnya yang mendukung software atau alat yang Anda buat menggunakan data berkualitas tinggi tersebut.

Perbedaan utama:

Fitur

Data sebagai produk

Produk data

Apa ini?

Strategi atau filosofi.

Aset data yang telah dikemas sebelumnya.

Sasaran utama

Untuk meningkatkan kualitas dan kepercayaan data.

Untuk mengatasi masalah pengguna tertentu.

Contoh

Tabel "Pelanggan" yang bersih dan terdokumentasi di BigQuery dengan pemilik yang ditetapkan.

Produk data "Customer 360" yang mengambil data dari tabel tersebut digunakan untuk menampilkan histori pengguna.

Fitur

Data sebagai produk

Produk data

Apa ini?

Strategi atau filosofi.

Aset data yang telah dikemas sebelumnya.

Sasaran utama

Untuk meningkatkan kualitas dan kepercayaan data.

Untuk mengatasi masalah pengguna tertentu.

Contoh

Tabel "Pelanggan" yang bersih dan terdokumentasi di BigQuery dengan pemilik yang ditetapkan.

Produk data "Customer 360" yang mengambil data dari tabel tersebut digunakan untuk menampilkan histori pengguna.

Kasus penggunaan produk data

Produk data bertindak sebagai kemampuan tata kelola dengan mengemas data dan model ke dalam unit logis, aman, dan mudah ditemukan. Hal ini memungkinkan organisasi menetapkan kepemilikan yang jelas dan mengelola akses melalui alur kerja persetujuan.


Retailer dapat mengemas data perilaku pelanggan dan model rekomendasi produk ke dalam satu "Produk Data Personalisasi". Dengan menggunakan Knowledge Catalog, organisasi dapat memastikan bahwa hanya developer yang berwenang yang dapat mengakses set data yang mendasarinya dan endpoint model. Lapisan tata kelola ini memberikan konteks melalui metadata (aspek) sekaligus melindungi interaksi pengguna yang sensitif.

Lembaga keuangan dapat membuat produk data "Risiko Penipuan" yang menggabungkan aliran transaksi real-time dengan model machine learning. Paket terpadu ini memungkinkan alur kerja persetujuan yang aman. Saat seorang penyelidik memerlukan akses ke skor risiko, mereka akan memintanya melalui portal pusat. Hal ini memastikan bahwa akses dibatasi waktu dan diaudit sepenuhnya, sehingga mencegah eksposur data yang tidak sah.

Dalam manufaktur, produk data "kondisi mesin" menggabungkan data sensor dengan model deteksi anomali. Kemampuan tata kelola seperti pemeriksaan kualitas data otomatis dan pembuatan profil memastikan bahwa model hanya menggunakan data tepercaya. Hal ini mencegah prediksi kegagalan yang salah akibat sensor yang rusak atau input mentah yang "berantakan".

Tim logistik dapat mengemas algoritma perutean dan set data batasan kendaraan sebagai produk data "pengoptimalan pengiriman". Dengan menetapkan kepemilikan tingkat domain dalam data fabric, perusahaan dapat melacak silsilah data—yang menunjukkan secara tepat bagaimana data lokasi mentah diubah menjadi jadwal pengemudi akhir.

Manfaat produk data

Membangun produk data dapat memberikan keuntungan signifikan bagi bisnis. Mereka dapat membantu mengalihkan fokus dari sekadar mengumpulkan data menjadi benar-benar menggunakannya untuk menghasilkan nilai.

Pengambilan keputusan yang lebih baik

Organisasi dapat menggunakan produk data untuk menempatkan insight penting langsung di hadapan karyawan yang membutuhkannya. Hal ini membantu memberdayakan tim untuk membuat pilihan strategis yang lebih cerdas berdasarkan bukti, bukan intuisi.

Inovasi lebih cepat

Produk data yang dapat digunakan kembali mengurangi waktu yang diperlukan untuk mengimplementasikan kasus penggunaan baru. Developer dapat mengintegrasikan produk data yang ada ke dalam aplikasi mereka, yang membantu mereka mengirimkan fitur dan menyelesaikan masalah lebih cepat tanpa mengelola pipeline data mentah yang kompleks.

Peningkatan pendapatan

Produk data membantu perusahaan memonetisasi aset mereka secara langsung. Misalnya, sebuah bisnis dapat mengemas data eksklusif mereka agar dapat digunakan oleh developer lain.

Keunggulan kompetitif

Organisasi berbasis data sering kali lebih efektif dalam mendapatkan dan mempertahankan pelanggan. Dengan menawarkan pengalaman yang lebih cerdas dan dipersonalisasi, perusahaan dapat unggul dari pesaing yang tidak memanfaatkan data mereka secara efektif.

Membangun agen dengan aman

Dengan membangun agen AI di atas produk data "yang dikemas sebelumnya" ini, Anda memastikan AI belajar dari informasi terverifikasi dan berkualitas tinggi, bukan dari data mentah yang berantakan. Hal ini menciptakan lingkungan yang aman sehingga AI dapat memberikan jawaban akurat yang benar-benar dapat Anda percayai, tanpa membocorkan informasi sensitif atau salah secara tidak sengaja.

Contoh: developer e-commerce perusahaan menggunakan Knowledge Catalog dan BigQuery

Mari kita lihat cara membangun produk data, seperti "Prediktor Inventaris Retail," menggunakan alat seperti BigQuery dan Knowledge Catalog.

Tujuannya: Membangun alat internal yang memberi tahu manajer toko item mana yang stoknya menipis dan memprediksi apa yang perlu mereka pesan untuk minggu depan.

Langkah 1: Menyerap dan menyimpan data dengan BigQuery

Pertama, Anda memerlukan tempat untuk menyimpan data penjualan. Anda dapat menggunakan BigQuery, data warehouse serverless, untuk menyiapkan pipeline yang memberikan angka penjualan harian dari setiap toko ke tabel BigQuery.

Langkah 2: Mengelola dan mengatur data dengan Knowledge Catalog

Sebelum membangun model, Anda harus memastikan data sudah bersih. Gunakan Knowledge Catalog untuk mengelola siklus proses data, karena ini dapat membantu Anda:

  • Membuat katalog data agar developer lain dapat menemukannya
  • Menetapkan aturan kualitas data (misalnya, "Harga tidak boleh negatif")
  • Mengamankan data sehingga hanya pengguna yang diotorisasi yang dapat mengaksesnya

Langkah 3: Membangun model dengan BigQuery ML

Sekarang, Anda membuat kecerdasan. Alih-alih mengekspor data ke alat terpisah, Anda menggunakan BigQuery ML untuk menulis kueri SQL sederhana yang melatih model machine learning. Model ini melihat tren penjualan sebelumnya untuk memperkirakan permintaan di masa mendatang.

  • SQL
Memuat...

Langkah 4: Mengekspos produk data

Terakhir, Anda dapat membangun API sederhana atau dasbor menggunakan Looker. Saat login, manajer toko tidak akan melihat kueri SQL, melainkan antarmuka yang jelas bertuliskan, "Pesan 50 kemeja merah lagi paling lambat hari Selasa." Selamat! Anda telah berhasil mengubah data mentah menjadi produk data yang bermanfaat.

Mengatasi tantangan bisnis Anda dengan Google Cloud

Pelanggan baru mendapatkan kredit gratis senilai $300 untuk dibelanjakan di Google Cloud.

Referensi lainnya

Langkah selanjutnya

Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.