Pengantar notebook terkelola

Instance notebook terkelola Vertex AI Workbench adalah lingkungan yang dikelola Google dengan integrasi dan kemampuan yang membantu Anda menyiapkan dan bekerja di lingkungan produksi berbasis notebook Jupyter yang menyeluruh.

Instance notebook terkelola dikemas dengan JupyterLab dan memiliki rangkaian paket deep learning yang telah diinstal sebelumnya, termasuk dukungan untuk framework TensorFlow dan PyTorch. Instance notebook terkelola mendukung akselerator GPU dan kemampuan untuk melakukan sinkronisasi dengan repositori GitHub. Instance notebook terkelola Anda dilindungi oleh autentikasi dan otorisasi Google Cloud.

Infrastruktur komputasi yang dikelola Google

Instance notebook terkelola Vertex AI Workbench adalah infrastruktur komputasi berbasis notebook Jupyter yang dikelola Google.

Saat Anda membuat instance notebook terkelola, instance tersebut akan di-deploy sebagai instance virtual machine (VM) yang dikelola Google dalam project tenant.

Instance notebook terkelola Anda mencakup banyak lingkungan framework data science umum, seperti TensorFlow dan PyTorch. Anda juga dapat menambahkan image container kustom Anda sendiri ke instance notebook terkelola Anda. Lingkungan ini tersedia sebagai kernel tempat Anda dapat menjalankan file notebook.

Saat Anda menjalankan notebook di salah satu kernel, Vertex AI Workbench akan memulai container yang sesuai, membuat sesi Jupyter di container tersebut, dan menggunakan sesi Jupyter tersebut untuk menjalankan notebook Anda di container.

Infrastruktur komputasi yang dikelola Google ini mencakup integrasi dan kemampuan yang membantu Anda menerapkan alur kerja machine learning dan data science dari awal hingga akhir. Lihat bagian berikut untuk mengetahui detailnya.

Menggunakan container kustom

Anda juga dapat menambahkan image container Docker kustom ke instance notebook terkelola untuk menjalankan kode notebook di lingkungan yang disesuaikan dengan kebutuhan Anda.

Container kustom ini tersedia untuk digunakan langsung dari antarmuka pengguna JupyterLab, bersama dengan framework yang sudah diinstal sebelumnya. Untuk mengetahui informasi selengkapnya, lihat Menambahkan container kustom ke instance notebook terkelola.

Alur kerja berbasis notebook

Instance notebook terkelola memungkinkan Anda melakukan tugas-tugas berorientasi alur kerja tanpa keluar dari antarmuka pengguna JupyterLab.

Mengontrol hardware dan framework dari JupyterLab

Dalam instance notebook terkelola, antarmuka pengguna JupyterLab adalah tempat Anda menentukan resource komputasi tempat kode akan dijalankan. Misalnya, Anda dapat mengonfigurasi jumlah vCPU atau GPU yang Anda inginkan, berapa banyak RAM yang Anda inginkan, dan framework apa yang ingin Anda gunakan untuk menjalankan kode. Anda dapat menulis kode terlebih dahulu, lalu memilih cara menjalankannya tanpa keluar dari JupyterLab atau memulai ulang instance. Untuk menguji kode secara sekilas, Anda dapat memperkecil skala hardware, lalu meningkatkannya kembali untuk menjalankan kode pada lebih banyak data.

Akses ke data

Anda dapat mengakses data Anda tanpa meninggalkan antarmuka pengguna JupyterLab.

Dari dalam menu navigasi JupyterLab pada instance notebook terkelola, Anda dapat menggunakan integrasi Cloud Storage untuk menjelajahi data dan file lain yang dapat Anda akses. Lihat Mengakses bucket dan file Cloud Storage dari dalam JupyterLab.

Anda juga dapat menggunakan integrasi BigQuery untuk menjelajahi tabel yang dapat Anda akses, menulis kueri, melihat pratinjau hasil, dan memuat data ke notebook Anda. Lihat Data kueri di tabel BigQuery dari dalam JupyterLab.

Menjalankan operasi notebook

Gunakan eksekutor untuk menjalankan file notebook sebagai eksekusi satu kali atau sesuai jadwal. Pilih lingkungan dan hardware tertentu yang Anda inginkan untuk menjalankan eksekusi Anda. Kode notebook Anda akan berjalan pada pelatihan kustom Vertex AI, yang dapat mempermudah melakukan pelatihan terdistribusi, mengoptimalkan hyperparameter, atau menjadwalkan tugas pelatihan berkelanjutan. Lihat Menjalankan file notebook dengan eksekutor.

Anda dapat menggunakan parameter dalam eksekusi untuk membuat perubahan spesifik pada setiap eksekusi. Misalnya, Anda dapat menentukan set data lain yang akan digunakan, mengubah kecepatan pembelajaran pada model, atau mengubah versi modelnya.

Anda juga dapat mengatur notebook untuk dijalankan secara rutin. Meskipun instance Anda dinonaktifkan, Vertex AI Workbench akan menjalankan file notebook Anda dan menyimpan hasilnya untuk dilihat dan dibagikan kepada orang lain.

Membagikan insight

Operasi notebook yang dijalankan disimpan di bucket Cloud Storage, sehingga Anda dapat berbagi insight dengan orang lain dengan memberikan akses ke hasilnya. Lihat bagian sebelumnya tentang cara untuk menjalankan operasi notebook.

Mengamankan instance Anda

Anda dapat men-deploy instance notebook terkelola dengan jaringan default yang dikelola Google, yang menggunakan jaringan VPC dan subnet default. Sebagai ganti jaringan default, Anda dapat menentukan jaringan VPC yang akan digunakan dengan instance Anda. Untuk mengetahui informasi selengkapnya, lihat Menyiapkan jaringan. Anda dapat menggunakan Kontrol Layanan VPC untuk memberikan keamanan tambahan bagi instance notebook terkelola Anda.

Untuk menggunakan notebook terkelola dalam perimeter layanan, lihat Menggunakan instance notebook terkelola dalam perimeter layanan.

Secara default, Google Cloud otomatis mengenkripsi data saat dalam penyimpanan menggunakan kunci enkripsi yang dikelola oleh Google. Jika memiliki persyaratan kepatuhan atau peraturan khusus terkait dengan kunci yang melindungi data, Anda dapat menggunakan kunci enkripsi yang dikelola pelanggan (CMEK) dengan instance notebook terkelola Anda. Untuk informasi selengkapnya, lihat Menggunakan kunci enkripsi yang dikelola pelanggan.

Penonaktifan otomatis untuk instance yang tidak ada aktivitas

Untuk membantu mengelola biaya, instance notebook terkelola dinonaktifkan setelah tidak ada aktivitas selama jangka waktu tertentu secara default. Anda dapat mengubah durasi waktu atau menonaktifkan fitur ini. Untuk mengetahui informasi selengkapnya, lihat Penonaktifan saat tidak ada aktivitas.

Integrasi Dataproc

Anda dapat memproses data secara cepat dengan menjalankan notebook pada cluster Dataproc. Setelah cluster siap, Anda dapat menjalankan file notebook di dalamnya tanpa meninggalkan antarmuka pengguna JupyterLab. Untuk informasi selengkapnya, lihat Menjalankan instance notebook terkelola pada cluster Dataproc.

Batasan

Pertimbangkan batasan notebook terkelola berikut saat sedang merencanakan project Anda:

  • Instance notebook terkelola dikelola Google sehingga kurang dapat disesuaikan dibandingkan instance notebook yang dikelola pengguna Vertex AI Workbench. Instance notebook yang dikelola pengguna dapat lebih ideal bagi pengguna yang membutuhkan banyak kendali atas lingkungan mereka. Untuk informasi selengkapnya, lihat Pengantar notebook yang dikelola pengguna.

  • Ekstensi JupyterLab pihak ketiga tidak didukung.

  • Instance notebook terkelola tidak mengizinkan pengguna untuk memiliki akses sudo.

  • Saat Anda menggunakan Access Context Manager dan BeyondCorp Enterprise untuk melindungi instance notebook terkelola dengan kontrol akses kontekstual, akses akan dievaluasi setiap kali pengguna mengautentikasi ke instance. Misalnya, akses dievaluasi pada saat pertama kali pengguna mengakses JupyterLab, dan setiap kali mereka mengaksesnya jika masa berlaku cookie browser web mereka telah habis.

  • Untuk menggunakan akselerator dengan instance notebook terkelola, jenis akselerator yang Anda inginkan harus tersedia di zona instance Anda. Untuk mempelajari ketersediaan akselerator berdasarkan zona, lihat Ketersediaan region dan zona GPU.

Langkah selanjutnya