Pratinjau data

Halaman ini menjelaskan cara melihat pratinjau data di Cloud Data Fusion Studio, sehingga Anda dapat men-debug error sebelum men-deploy dan menjalankan pipeline.

Jika mengalami error, Anda dapat memperbaikinya saat pipeline masih dalam mode Draf.

Cloud Data Fusion menggunakan 100 baris pertama set data sumber untuk menghasilkan pratinjau.

Dalam mode Pratinjau, halaman Studio menampilkan status dan durasi tugas pratinjau. Anda dapat menghentikan tugas pratinjau kapan saja. Anda juga dapat memantau peristiwa log saat tugas pratinjau berjalan.

Konsol

  1. Pastikan setiap sumber, transformasi, dan sink tidak memiliki error. Untuk memvalidasinya, di halaman Studio Cloud Data Fusion, buka node untuk setiap plugin, lalu klik Properties > Validate.
  2. Lihat pipeline Anda di halaman Studio dan klik tombol Pratinjau ke posisi aktif. Opsi Run, Duration, dan Logs muncul di bagian atas kanvas halaman Studio.
  3. Opsional: sebelum menjalankan tugas pratinjau, perbarui setelan berikut dengan mengklik Configure.

    1. Argumen runtime: untuk mengetahui informasi selengkapnya, lihat Menyiapkan argumen runtime.
    2. Konfigurasi pratinjau: perbarui jumlah baris yang akan dipratinjau.
    3. Opsi lanjutan: memperbarui konfigurasi pipeline dan engine. Untuk informasi selengkapnya, lihat Mengelola konfigurasi pipeline.
  4. Untuk memulai tugas pratinjau, klik Run. Saat tugas pratinjau berjalan, tidak ada data yang ditulis ke sink, tetapi Anda dapat memeriksa apakah data dibaca dan ditulis seperti yang diharapkan saat Anda men-deploy pipeline.

  5. Opsional: setelah Anda menjalankan tugas pratinjau, untuk melihat tampilan data pada setiap tahap dalam pipeline, klik Pratinjau data pada node di pipeline yang menangani data, seperti sumber, sink, dan transformasi.

  6. Setelah selesai melihat pratinjau data, keluar dari mode Pratinjau dengan mengklik tombol Pratinjau ke posisi nonaktif.

Langkah selanjutnya