Template Dataproc

Untuk menyiapkan dan menjalankan workload dan tugas Dataproc, gunakan template Dataproc di GitHub

Template disediakan dalam bahasa dan lingkungan eksekusi berikut:

  • Template orkestrasi Airflow: Menjalankan tugas Spark dari DAG di Airflow.
  • Template Java: Jalankan workload atau tugas batch Spark di Google Cloud Serverless untuk Apache Spark atau cluster Dataproc yang ada.
  • Template Python: Jalankan workload batch PySpark di Google Cloud Serverless untuk Apache Spark.
  • Template notebook: Jalankan tugas Spark menggunakan notebook Vertex AI.