Dengan Dataproc Hub, Anda dapat memanfaatkan Vertex AI Workbench dan Dataproc untuk menjalankan tugas pemrosesan data dan ML interaktif dalam skala besar menggunakan notebook Jupyter serta ekosistem Hadoop dan Spark.
Notebook Dataproc Hub adalah notebook satu pengguna yang diseleksi administrator yang berjalan di cluster Dataproc JupyterLab yang dibuat dan dijalankan di project pengguna.
Dataproc Hub memanfaatkan JupyterHub untuk:
- Wujudkan konsistensi di seluruh organisasi dengan memungkinkan administrator membuat daftar template notebook pilihan untuk berbagai kelompok data dan pengguna ML.
- Percepat pembuatan notebook dengan menyediakan lingkungan yang telah dikonfigurasi sebelumnya kepada pengguna data dan ML yang sesuai dengan persyaratan software dan hardware mereka.
Dataproc Hub menyediakan antarmuka terpisah untuk administrator dan pengguna:
- Administrator menggunakan halaman Dataproc→Workbench→User-Managed Notebooks di Konsol Google Cloud untuk membuat instance Dataproc Hub. Setiap instance hub berisi serangkaian lingkungan notebook yang telah ditentukan sebelumnya dan ditentukan oleh file konfigurasi cluster YAML.
- Pengguna Data dan ML menggunakan UI Notebooks→Instances di Konsol Google Cloud untuk memilih lingkungan notebook standar guna memunculkan server notebook di cluster Dataproc mereka.
- Pengguna tanpa akses konsol dapat mengakses instance Dataproc Hub untuk memunculkan cluster Dataproc dari browser web mereka menggunakan URL instance Dataproc Hub yang disediakan oleh administrator.
Kasus penggunaan Dataproc Hub:
- Pengguna data dan ML diatur dalam beberapa grup sesuai dengan persyaratan software dan hardware umum (pengguna dapat ditempatkan di beberapa grup)
- Akses konsol Dataproc terbatas: Pengguna tidak memiliki akses ke Dataproc di konsol Google Cloud
Fitur Dataproc Hub:
- Lingkungan pengguna yang telah ditetapkan
- Isolasi cluster dan notebook: anggota grup tidak diberi akses yang mudah ke cluster dan notebook anggota dalam grup lain
Untuk informasi selengkapnya
- Admin: Mengonfigurasi Dataproc Hub
- Pengguna: Gunakan Dataproc Hub