Memecahkan masalah error jenis program yang tidak didukung

Halaman ini menjelaskan cara menyelesaikan masalah umum di Cloud Data Fusion 6.8.0 dan 6.8.1 saat pipeline data gagal dengan error jenis program yang tidak didukung di Cloud Data Fusion. Masalah ini telah diatasi di versi 6.8.2.

Untuk mengurangi waktu mulai pipeline, instance Cloud Data Fusion versi 6.8.0 dan 6.8.1 meng-cache artefak yang diperlukan untuk memulai pipeline di cluster Dataproc di dalam bucket Cloud Storage. Salah satu artefak yang di-cache ini adalah application.jar. Bergantung pada urutan Anda menjalankan pipeline, beberapa pipeline mungkin gagal dengan error berikut:

Unsupported program type: Spark

Misalnya, setelah Anda membuat instance 6.8.1 baru (atau mengupgrade ke 6.8.1), saat pertama kali menjalankan pipeline yang hanya berisi tindakan, pipeline tersebut akan berhasil. Namun, pipeline berikutnya yang berjalan, yang mencakup sumber atau sink, mungkin gagal dengan error ini.

Rekomendasi

Untuk mengatasi masalah ini, lakukan salah satu tindakan berikut:

Anda dapat menonaktifkan penyimpanan dalam cache untuk salah satu hal berikut:

  • Untuk semua pipeline dalam instance.
  • Untuk namespace tertentu.
  • Untuk profil Dataproc tertentu yang berisi pipeline yang gagal.
  • Hanya untuk pipeline yang gagal.

Menonaktifkan cache Cloud Storage untuk semua pipeline dalam instance

Untuk menonaktifkan cache Cloud Storage untuk semua pipeline dalam instance, ikuti langkah-langkah berikut:

Konsol

  1. Buka instance Anda:
    1. Di konsol Google Cloud, buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Klik System Admin > System Preferences dan tetapkan nilai untuk system.profile.properties.gcsCacheEnabled ke false.

    Dialog preferensi

REST API

Untuk menetapkan system.profile.properties.gcsCacheEnabled ke false, lihat Menetapkan preferensi.

Menonaktifkan cache Cloud Storage untuk namespace tertentu

Untuk menonaktifkan cache Cloud Storage untuk namespace tertentu, ikuti langkah-langkah berikut:

Konsol

  1. Buka instance Anda:
    1. Di konsol Google Cloud, buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Klik System Admin > Namespaces, lalu pilih namespace Anda.
  3. Klik Preferensi > Edit dan tetapkan nilai untuk system.profile.properties.gcsCacheEnabled ke false.

    Dialog preferensi namespace

REST API

Untuk menetapkannya melalui REST API, lihat Menetapkan preferensi.

Menonaktifkan cache Cloud Storage untuk profil Dataproc

Untuk menonaktifkan penyimpanan dalam cache Cloud Storage untuk profil Dataproc tertentu yang berisi pipeline yang gagal, ikuti langkah-langkah berikut:

Konsol

  • Tetapkan gcsCacheEnabled ke false di profil Dataproc.

Menonaktifkan cache Cloud Storage hanya untuk pipeline yang gagal

Untuk menonaktifkan cache Cloud Storage hanya untuk pipeline yang gagal, ikuti langkah-langkah berikut:

Konsol

  1. Buka instance Anda:
    1. Di konsol Google Cloud, buka halaman Cloud Data Fusion.

    2. Untuk membuka instance di Cloud Data Fusion Studio, klik Instance, lalu klik View instance.

      Buka Instance

  2. Klik Daftar, lalu pilih pipeline yang gagal.
  3. Klik Luaskan di samping Jalankan dan tetapkan argumen runtime system.profile.properties.gcsCacheEnabled ke false.
  4. Ulangi untuk pipeline lain yang gagal.

Dialog runtime

REST API

Penyimpanan dalam cache Cloud Storage dapat dinonaktifkan saat memulai pipeline melalui REST API dan juga dengan menentukan argumen runtime sebagai peta JSON dalam isi permintaan secara opsional. Untuk mengetahui informasi selengkapnya, lihat Memulai program.