Ringkasan Dataproc Hub

Dataproc Hub memungkinkan Anda memanfaatkan Vertex AI Workbench dan Dataproc untuk menjalankan tugas pemrosesan data dan ML interaktif dalam skala besar menggunakan notebook Jupyter dan ekosistem Hadoop dan Spark.

Notebook Dataproc Hub adalah notebook satu pengguna yang dikurasi administrator dan berjalan di cluster JupyterLab Dataproc yang dibuat dan berjalan di project pengguna.

  • Dataproc Hub memanfaatkan JupyterHub untuk:

    • Tingkatkan konsistensi di seluruh organisasi dengan memungkinkan administrator membuat daftar template notebook yang dikurasi untuk berbagai grup pengguna data dan ML.
    • Percepat pembuatan notebook dengan menyediakan lingkungan yang telah dikonfigurasi sebelumnya kepada pengguna data dan ML yang sesuai dengan persyaratan software dan hardware mereka.
  • Dataproc Hub menyediakan antarmuka terpisah untuk administrator dan pengguna:

    • Administrator menggunakan halaman Dataproc→Workbench→User-Managed Notebooks di konsol Google Cloud untuk membuat instance Dataproc Hub. Setiap instance hub berisi serangkaian lingkungan notebook yang telah ditentukan sebelumnya yang ditentukan oleh file konfigurasi cluster YAML.
    • Pengguna data dan ML menggunakan UI Notebooks→Instances di konsolGoogle Cloud untuk memilih lingkungan notebook yang telah ditentukan sebelumnya untuk memunculkan server notebook di cluster Dataproc mereka.
      • Pengguna tanpa akses konsol dapat mengakses instance Dataproc Hub untuk memunculkan cluster Dataproc dari browser web mereka menggunakan URL instance Dataproc Hub yang diberikan oleh administrator.
  • Kasus penggunaan Dataproc Hub:

    • Pengguna data dan ML diatur dalam grup dengan persyaratan software dan hardware yang sama (pengguna dapat ditempatkan dalam beberapa grup)
    • Akses konsol Dataproc yang dibatasi: Pengguna tidak memiliki akses ke Dataproc di konsol Google Cloud
  • Fitur Dataproc Hub:

    • Lingkungan pengguna standar
    • Isolasi cluster dan notebook: anggota grup tidak diberikan akses mudah ke cluster dan notebook anggota di grup lain

Untuk informasi selengkapnya