Bagian ini menunjukkan cara membuat notebook Jupyter dalam instance Vertex AI Workbench. Instance Vertex AI Workbench adalah lingkungan pengembangan berbasis Jupyter Notebook untuk seluruh alur kerja data science. Instance Vertex AI Workbench sudah dikemas dengan JupyterLab dan memiliki rangkaian paket deep learning bawaan, termasuk dukungan untuk framework TensorFlow dan PyTorch. Untuk mengetahui informasi selengkapnya, lihat Pengantar instance Vertex AI Workbench.
Setelah membuat notebook di Vertex AI Workbench, jalankan bagian-bagian kode Python yang berurutan untuk melakukan sebagian besar pekerjaan guna membuat prediksi.
Membuat instance Vertex AI Workbench
Untuk membuat instance Vertex AI Workbench, lakukan hal berikut:
Di konsol Google Cloud, buka project Google Cloud Anda jika belum terbuka.
Di konsol Google Cloud, buka halaman Instances Vertex AI Workbench.
Jika opsi untuk mengaktifkan Notebooks API muncul, klik Aktifkan. Mungkin perlu waktu beberapa saat untuk menyelesaikan proses pengaktifan.
Klik
Buat baru.Pada dialog New instance, untuk Name, masukkan nama instance Anda.
Untuk Region, pilih us-central1 (Iowa).
Untuk Zone, pilih us-central1-a.
Klik Create. Jika ingin mempelajari lebih lanjut instance, setelah instance muncul dalam daftar instance, klik namanya untuk melihat propertinya.
Menyiapkan notebook
Instance Vertex AI Workbench Anda sudah diautentikasi untuk menggunakan project Google Cloud. Namun, Anda harus menginstal dan melakukan inisialisasi Vertex AI SDK untuk Python. Bagian ini akan memandu Anda melakukan langkah-langkah ini.
Setelah membuat notebook, Anda akan menggunakannya untuk memasukkan dan menjalankan cuplikan kode berurutan dalam tutorial ini. Setiap cuplikan kode harus dijalankan satu per satu dan secara berurutan.
Buat dan buka notebook Anda
Notebook Anda merupakan tempat bagi Anda untuk menjalankan kode dalam tutorial ini. Notebook adalah file dengan
ekstensi .ipynb
. Saat Anda membuatnya, file tersebut tidak diberi judul. Anda dapat
mengganti namanya setelah dibuka. Untuk membuat dan membuka {i>notebook<i} Anda, lakukan hal berikut:
Di konsol Google Cloud, buka halaman Instance.
Di samping nama instance, klik Open JupyterLab.
Instance Vertex AI Workbench Anda membuka lingkungan JupyterLab.
Di JupyterLab, pilih File > New > Notebook.
File notebook baru akan terbuka.
Di panel navigasi kiri JupyterLab, temukan notebook baru Anda, bernama Untitled.ipynb. Untuk mengganti namanya, klik kanan nama notebook Anda, klik Rename, lalu masukkan nama baru.
Menginstal Vertex AI SDK untuk Python
Setelah membuka notebook, Anda harus menginstal Vertex AI SDK untuk Python. Anda dapat menggunakan Vertex AI SDK untuk Python guna melakukan panggilan Vertex AI API yang membuat set data, membuat model, melatih dan men-deploy model, serta membuat prediksi dengan model Anda. Untuk mengetahui informasi selengkapnya, lihat Menggunakan Vertex AI SDK untuk Python.
Saat Anda menginstal Vertex AI SDK untuk Python, Google Cloud SDK lain yang bergantung padanya juga akan diinstal. Dua dari Google Cloud SDK tersebut digunakan dalam tutorial ini:
Cloud Storage - Saat Anda menggunakan Vertex AI SDK untuk Python guna melakukan panggilan Vertex AI API, Vertex AI akan menyimpan artefak di bucket Cloud Storage. Bucket ini disebut sebagai bucket staging. Anda menentukan bucket staging saat Anda melakukan inisialisasi Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat klien Python untuk Google Cloud Storage API.
BigQuery - Vertex AI melatih model Anda menggunakan set data publik BigQuery. BigQuery SDK harus diinstal guna mengakses dan mendownload set data yang digunakan dalam tutorial ini. Untuk mengetahui informasi selengkapnya, lihat library klien BigQuery API.
Guna menginstal Vertex AI SDK untuk Python dan SDK yang berkaitan dengannya, jalankan kode berikut.
# Install the Vertex AI SDK
! pip3 install --upgrade --quiet google-cloud-aiplatform
Flag --quiet
menyembunyikan output sehingga hanya error yang ditampilkan,
jika ada. Tanda seru (!
) menunjukkan bahwa kode tersebut adalah perintah shell.
Karena ini adalah kode pertama yang Anda jalankan di notebook baru, Anda
harus memasukkannya ke dalam sel kode kosong di bagian atas notebook. Setelah memasukkan
kode dalam sel kode, klik Shift + Enter
untuk menjalankan kode.
Dalam langkah selanjutnya dari tutorial ini, Anda dapat menjalankan kode dalam sel kode kosong yang otomatis muncul di bawah kode yang terakhir dijalankan. Jika Anda ingin menambahkan sel kode baru secara manual, klik tombol
Sisipkan sel di bawah pada file notebook.
Menetapkan ID project dan region
Pada langkah ini, Anda akan menetapkan ID project dan region Anda. Tetapkan ID project dan region ke
variabel terlebih dahulu, sehingga keduanya dapat dirujuk dengan mudah pada bagian selanjutnya dalam tutorial ini. Kemudian, gunakan
perintah gcloud config
untuk menetapkan ID project dan region untuk sesi Google Cloud Anda.
Kemudian, Anda akan menggunakannya dan URI bucket Cloud Storage untuk menginisialisasi Vertex AI SDK untuk Python.
Menetapkan ID project
Untuk menetapkan ID project, lakukan hal berikut:
Temukan ID project Google Cloud Anda. Untuk mengetahui informasi selengkapnya, lihat Menemukan ID project.
Jalankan kode berikut dalam sel kode di notebook Anda. Dalam kode, ganti MY_PROJECT_ID dengan ID project yang baru saja Anda temukan. Output yang dihasilkan perintah ini adalah
Updated property [core/project].
project_id = "MY_PROJECT_ID" # @param {type:"string"} # Set the project id ! gcloud config set project {project_id}
Menetapkan region
Tutorial ini menggunakan region us-central1
. Untuk menetapkan region Anda, lakukan hal
berikut:
Jalankan kode berikut untuk menetapkan variabel
region
yang digunakan oleh Vertex AI keus-central1
. Perintah ini tidak menghasilkan output. Untuk mengetahui informasi selengkapnya, lihat Memilih lokasi.region = "us-central1" # @param {type: "string"}
Membuat bucket Cloud Storage
Tutorial ini memerlukan bucket Cloud Storage yang digunakan oleh Vertex AI untuk menyiapkan artefak. Vertex AI menyimpan data yang berkaitan dengan set data yang Anda buat dan membuat model sumber daya dalam bucket staging. Data ini akan dipertahankan dan tersedia di seluruh sesi. Dalam tutorial ini, Vertex AI juga menyimpan set data Anda di bucket staging. Anda akan menentukan bucket staging saat Anda melakukan inisialisasi Vertex AI SDK untuk Python.
Setiap nama bucket Cloud Storage harus unik secara global. Jika Anda memilih nama
yang telah digunakan, perintah gsutil mb
untuk membuat bucket akan gagal. Kode
berikut menggunakan stempel datetime dan nama project Anda untuk membuat nama bucket
yang unik. Tambahkan nama bucket ke gs://
guna membuat URI untuk
bucket Cloud Storage Anda. Perintah shell echo
menampilkan URI sehingga Anda dapat
memverifikasi bahwa URI dibuat dengan benar.
Untuk menetapkan nama bucket dan URI, jalankan kode berikut. Baris terakhir menampilkan URI bucket Cloud Storage Anda.
bucket_name = "bucket-name-placeholder" # @param {type:"string"} bucket_uri = f"gs://{bucket_name}" from datetime import datetime timestamp = datetime.now().strftime("%Y%m%d%H%M%S") if bucket_name == "" or bucket_name is None or bucket_name == "bucket-name-placeholder": bucket_name = project_id + "aip-" + timestamp bucket_uri = "gs://" + bucket_name ! echo $bucket_uri
Untuk membuat bucket menggunakan library klien Cloud Storage dan URI bucket, jalankan kode berikut. Kode ini tidak menghasilkan output.
from google.cloud import storage client = storage.Client(project=project_id) # Create a bucket bucket = client.create_bucket(bucket_name, location=region)
Untuk memverifikasi bahwa bucket Anda berhasil dibuat, jalankan perintah berikut:
print("Bucket {} created.".format(bucket.name))
Melakukan inisialisasi Vertex AI SDK untuk Python
Guna melakukan inisialisasi Vertex AI SDK untuk Python, Anda harus terlebih dahulu mengimpor library-nya,
aiplatform
. Selanjutnya, panggil aiplatform.init
dan teruskan nilai untuk
parameter berikut:
project
-project
menentukan project Google Cloud yang akan digunakan saat Anda menggunakan Vertex AI SDK untuk Python guna melakukan panggilan ke Vertex AI API. Dalam tutorial ini, Anda akan menentukan project Google Cloud dengan namanya. Anda juga dapat menentukan project dengan nomor project-nya.location
-location
menentukan region Google Cloud yang akan digunakan saat Anda melakukan panggilan API. Jika Anda tidak menentukan lokasi, Vertex AI SDK untuk Python akan menggunakanus-central1
.staging_bucket
-staging_bucket
menentukan bucket Cloud Storage yang akan digunakan untuk menyiapkan artefak saat Anda menggunakan Vertex AI SDK untuk Python. Tentukan bucket dengan URI yang diawali dengangs://
. Dalam tutorial ini, Anda akan menggunakan URI yang dibuat sebelumnya di bagian Membuat bucket Cloud Storage.
Untuk menetapkan project Google Cloud, region, dan bucket staging, jalankan perintah berikut. Perintah ini tidak menghasilkan output.
from google.cloud import aiplatform
# Initialize the Vertex AI SDK
aiplatform.init(project=project_id, location=region, staging_bucket=bucket_uri)
Melakukan inisialisasi BigQuery
Tutorial ini menggunakan set data publik BigQuery yang berisi penguin untuk melatih sebuah model. Setelah Vertex AI melatih model, tentukan parameter yang merepresentasikan karakteristik penguin. Model akan menggunakan karakteristik tersebut untuk memprediksi spesies penguin yang direpresentasikan. Untuk mengetahui informasi selengkapnya tentang set data publik, lihat set data publik BigQuery.
Sebelum menggunakan set data BigQuery, Anda harus melakukan inisialisasi BigQuery dengan ID project Anda. Untuk melakukannya, jalankan perintah berikut. Perintah ini tidak menghasilkan output.
from google.cloud import bigquery
# Set up BigQuery client
bq_client = bigquery.Client(project=project_id)