Pengantar data teks: Menyiapkan project dan lingkungan Anda

Jika Anda berencana menggunakan Vertex AI SDK untuk Python, pastikan akun layanan yang menginisialisasi klien memiliki peran IAM Vertex AI Service Agent (roles/aiplatform.serviceAgent).

Untuk bagian tutorial ini, Anda akan menyiapkan project Google Cloud untuk menggunakan Vertex AI dan bucket Cloud Storage yang berisi dokumen untuk melatih model AutoML Anda.

Tutorial ini memiliki beberapa halaman:

  1. Menyiapkan project dan lingkungan Anda.

  2. Membuat set data klasifikasi teks .

  3. Melatih model klasifikasi teks AutoML.

  4. Men-deploy model ke endpoint dan mengirim prediksi.

  5. Membersihkan project.

Setiap halaman mengasumsikan bahwa Anda telah menjalankan petunjuk dari halaman sebelumnya dalam tutorial ini.

Menyiapkan project dan lingkungan

Selesaikan langkah-langkah berikut sebelum menggunakan fungsi Vertex AI.

  1. Di konsol Google Cloud, buka halaman Pemilih project.

    Buka pemilih project

  2. Pilih atau buat project Google Cloud.

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Buka Cloud Shell. Cloud Shell adalah lingkungan shell interaktif untuk Google Cloud yang dapat Anda gunakan untuk mengelola project dan resource dari browser web.
  5. Buka Cloud Shell
  6. Di Cloud Shell, tetapkan project saat ini ke project ID Google Cloud Anda dan simpan dalam variabel shell projectid:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Ganti PROJECT_ID dengan project ID Anda. Anda dapat menemukan project ID di Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, baca Menemukan project ID.
  7. Aktifkan API IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
    • Replace PROJECT_ID with your project ID.
    • Replace USER_IDENTIFIER with the identifier for your user account. For example, user:myemail@example.com.

    • Replace ROLE with each individual role.
  9. Peran IAM Pengguna Vertex AI (roles/aiplatform.user ) menyediakan akses untuk menggunakan semua resource di Vertex AI. Storage Admin (roles/storage.admin) memungkinkan Anda menyimpan set data pelatihan dokumen di Cloud Storage.

Membuat bucket Cloud Storage dan menyalin set data sampel

Membuat bucket Cloud Storage untuk menyimpan dokumen yang Anda gunakan untuk melatih model AutoML.

  1. Buka Cloud Shell.

  2. Tetapkan variabel PROJECT_ID ke ID project Anda.

    export PROJECT_ID=PROJECT_ID
  3. Tetapkan variabel BUCKET, yang Anda gunakan untuk membuat bucket Cloud Storage.

    export BUCKET=${PROJECT_ID}-lcm
  4. Buat bucket Cloud Storage di region us-central1 dengan variabel BUCKET.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Salin contoh set data pelatihan happiness.csv ke dalam bucket Anda.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Langkah selanjutnya

Ikuti halaman berikutnya di tutorial ini untuk menggunakan konsol Vertex AI guna membuat set data klasifikasi teks dan mengimpor dokumen yang Anda salin ke bucket Cloud Storage.