Dataprep by Trifacta
Layanan data cloud cerdas guna menjelajahi, membersihkan, dan menyiapkan data secara visual untuk analisis dan machine learning.
Lihat dokumentasi untuk produk ini.
Persiapan data cerdas
Yang baru
Kemudahan serverless
Dataprep adalah layanan partner terintegrasi yang dioperasikan oleh Trifacta dan didasarkan pada solusi persiapan data terdepan di industri. Google bekerja sama dengan Trifacta untuk menyediakan pengalaman pengguna yang lancar tanpa perlu penginstalan software di awal, biaya lisensi terpisah, atau overhead operasional terus-menerus. Dataprep terkelola sepenuhnya dan diskalakan sesuai permintaan untuk memenuhi kebutuhan persiapan data Anda yang terus berkembang, sehingga Anda dapat tetap berfokus pada analisis.
Deteksi anomali dan eksplorasi yang cepat
Pahami dan jelajahi data secara instan dengan distribusi data visual. Dataprep secara otomatis mendeteksi skema, jenis data, kemungkinan penggabungan, dan anomali seperti nilai yang hilang, pencilan, dan duplikat agar Anda tidak perlu membuang waktu melakukan penilaian kualitas data serta langsung melakukan eksplorasi dan analisis.
Persiapan data yang mudah dan canggih
Dengan setiap gestur di UI, Dataprep secara otomatis menyarankan dan memprediksi transformasi data ideal Anda berikutnya. Setelah Anda menentukan urutan transformasi, Dataprep menggunakan komponen dasar Dataflow atau BigQuery, yang memungkinkan Anda memproses set data terstruktur atau tidak terstruktur dari berbagai ukuran cukup dengan klik, tanpa perlu kode.
Fitur Dataprep
Edisi Starter, Professional, dan Enterprise.
Transformasi prediktif
Dataprep menggunakan algoritma inferensi eksklusif untuk menafsirkan intent transformasi data dari pilihan data pengguna. Serangkaian saran dan pola yang diurutkan serta dicocokkan dengan pilihan tersebut akan dibuat secara otomatis.
Transformasi serbaguna
Manfaatkan ratusan fungsi transformasi untuk mengubah data Anda menjadi aset yang Anda inginkan. Cukup dengan mengklik mouse, terapkan agregasi, pivot, unpivot, gabung, union, ekstraksi, penghitungan, perbandingan, kondisi, penggabungan, ekspresi reguler, dan lainnya.
Throughput pemrosesan yang dioptimalkan
Dataprep akan otomatis memilih mesin pemrosesan Google Cloud dasar terbaik untuk mentransformasikan data secepat mungkin. Berdasarkan volume dan lokalitas data, Dataprep akan memanfaatkan BigQuery (transformasi ELT di tempat) untuk menyiapkan data, Dataflow, atau mesin dalam memori di Dataprep untuk volume kecil.
Pembuatan profil aktif
Lihat dan pelajari data Anda melalui distribusi data visual yang interaktif untuk membantu dalam penemuan, pembersihan, dan transformasi. Representasi visual membantu menafsirkan data dalam volume yang besar, dan teknik pembuatan profil yang inovatif dari Dataprep memvisualisasikan informasi statistik utama dalam format yang dinamis dan mudah digunakan.
Aturan kualitas data
Aturan kualitas data menyarankan sejumlah indikator kualitas data untuk memantau serta memperbaiki akurasi, kelengkapan, konsistensi, validitas, dan keunikan data, yang memastikan Anda memiliki gambaran komprehensif tentang kebersihan data Anda.
Kolaborasi
Dalam lingkungan tim, sangat bermanfaat bila beberapa pengguna dapat menggunakan aset yang sama atau membuat salinan tugas yang berkualitas baik agar dapat dijadikan template bagi pengguna lainnya. Dengan Dataprep, pengguna dapat berkolaborasi pada objek alur yang sama secara real time atau membuat salinan bagi pengguna lain yang akan digunakan untuk tugas independen.
Konektivitas komprehensif
Selain konektivitas standar BigQuery, Cloud Storage, Microsoft Excel, dan Google Spreadsheet, perkaya analisis mandiri dengan ratusan sumber data seperti Salesforce, Oracle, Microsoft SQL Server, MySQL, PostgreSQL, dan banyak lainnya.
Orkestrasi pipeline data
Jadwalkan dan otomatiskan tugas persiapan data dengan menggabungkan mereka dalam urutan yang runtut dan bersyarat. Beri tahu pengguna hasilnya, baik sukses maupun gagal, dan picu tugas eksternal (seperti Cloud Functions). Manfaatkan API komprehensif untuk mengintegrasikan Dataprep sebagai bagian dari solusi end-to-end perusahaan.
Operasionalisasi skala perusahaan
Gunakan praktik deployment berkelanjutan dengan impor/ekspor urutan langkah antara berbagai edisi dan versi, parameter alur, konfigurasi kustom untuk Dataflow atau BigQuery, penyesuaian performa, dan API lanjutan untuk mengotomatiskan pemantauan dan siklus proses pengembangan software.
Jenis data umum
Transformasikan set data terstruktur atau tidak terstruktur, yang disimpan dalam format CSV, JSON, format tabel relasional, atau data aplikasi SaaS dari berbagai ukuran—megabyte hingga petabyte—dengan mudah dan simpel.
Pencocokan pola
Manfaatkan pencocokan pola kolom untuk mengidentifikasi pola data yang menarik bagi Anda dan menampilkannya di antarmuka untuk digunakan dalam menyusun urutan langkah Anda. Selain itu, dalam urutan langkah, Anda dapat menerapkan ekspresi reguler atau pola Dataprep untuk menemukan pola dan mengubah data yang cocok dalam set data Anda.
Standardisasi
Kelompokkan nilai menurut kemiripan yang didasarkan pada pengucapan yang tidak terikat pada bahasa tertentu atau ejaan, serta buat cluster nilai konsisten yang dibakukan.
Pengambilan sampel
Untuk pengoptimalan performa, Dataprep akan otomatis menghasilkan satu atau beberapa sampel data untuk ditampilkan dan dimanipulasi di aplikasi klien. Namun, Anda dapat mengubah ukuran sampel, cakupan sampel, dan metode pembuatan sampel dengan mudah.
Keamanan lanjutan
Perluas standar keamanan saat ini dengan menyediakan kontrol akses data tertentu menggunakan kombinasi peran IAM dan BigQuery Google, Cloud Storage, serta hak akses Google Spreadsheet untuk menentukan akses.
Arsitektur pipeline ELT Dataprep
"Dataprep memungkinkan kami mempelajari set data baru secara cepat, dan fleksibilitasnya mendukung semua yang diperlukan transformasi data kami. Tugas persiapan data di Merkle kini dapat diselesaikan dalam hitungan menit, bukan jam atau hari, sehingga mempercepat persiapan data kami sebesar 90%.
Henry Culver, IT Architect, Merkle
Baca kisahPelanggan kami
Referensi
-
Mulai menggunakan panduan memulai Dataprep
-
Pengumuman dan info terbaru produk Dataprep
-
Berinteraksilah dengan pengguna lain Dataprep di Stack Overflow
-
FAQ terkait Dataprep by TrifactaPelajari bagaimana Trifacta mematuhi keamanan, privasi, dan perlindungan data.
-
Otomatiskan pipeline Dataprep ketika file sampai tujuan dengan Cloud Functions
-
Menggunakan lab mandiri Dataprep
-
Otomatisasi ML dengan BigQuery ML, Dataprep, dan Cloud Composer
-
Membangun data warehouse pemasaran
-
Cara men-streaming data IoT Core ke Cloud Dataprep
Harga
Lihat halaman harga kami di Google Cloud Marketplace.
Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan 20+ produk yang selalu gratis.
Mulai project baru Anda, pelajari tutorial interaktif, dan kelola akun Anda.