Terhubung ke model AI generatif Vertex AI

Vertex AI adalah platform machine learning (ML) yang memungkinkan Anda melatih, menyesuaikan, dan men-deploy model ML dan aplikasi AI. Untuk menambahkan kemampuan AI generatif ke layanan Cloud Run yang ada, Anda dapat menggunakan Vertex AI untuk mengakses model AI generatif seperti Gemini, PaLM, Imagen, Codey, dan banyak lagi.

Panduan ini membahas cara menggunakan integrasi Cloud Run untuk menyiapkan akses ke Vertex AI untuk layanan Cloud Run Anda dengan cepat.

Sebelum memulai

  • Pastikan layanan Cloud Run yang ingin Anda integrasikan sudah di-deploy.
  • Tinjau halaman harga Vertex AI. Anda akan dikenai biaya untuk setiap resource yang digunakan dalam integrasi.

Peran yang diperlukan

Untuk menggunakan integrasi Cloud Run, Anda atau administrator Anda harus memberikan peran IAM pada dua akun utama yang berbeda.

Klik untuk melihat peran yang diperlukan untuk Akun Google Anda

Untuk mendapatkan izin yang diperlukan untuk menggunakan integrasi Cloud Run, minta administrator Anda untuk memberikan peran IAM berikut pada Akun Google Anda pada project Anda:

Klik untuk melihat peran yang diperlukan untuk akun layanan

Untuk men-deploy layanan Cloud Run, Anda dapat menggunakan akun layanan default Compute Engine yang dibuat otomatis, atau menentukan akun layanan yang dikelola pengguna. Akun layanan harus memiliki peran berikut:

Menghubungkan layanan ke Vertex AI

Saat Anda menggunakan integrasi Cloud Run untuk terhubung ke Vertex AI, integrasi akan melakukan hal berikut:

  • Mengaktifkan Vertex AI API untuk layanan Cloud Run guna mengakses model AI generatif Vertex AI.
  • Memberikan identitas layanan peran yang diperlukan.

Anda dapat membuat integrasi menggunakan konsol atau command line.

Konsol

  1. Pada konsol Google Cloud, buka halaman Cloud Run.

    Buka Cloud Run

  2. Klik layanan dalam daftar layanan yang ingin Anda gunakan dalam integrasi ini.

  3. Klik tab Integrations.

  4. Klik Tambahkan integrasi.

  5. Klik Vertex AI.

  6. Gunakan nama default atau ubah nama ke nilai yang ingin Anda gunakan.

  7. Jika diminta untuk mengaktifkan daftar API, klik Enable dan tunggu hingga API diaktifkan.

  8. Klik Submit dan tunggu hingga integrasi selesai. Proses ini dapat memerlukan waktu hingga satu menit.

Command line

  1. Update ke Google Cloud CLI terbaru:

    gcloud components update
  2. Buat integrasi:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \

    Ganti:

    • SERVICE dengan nama layanan Cloud Run Anda.

    Secara opsional, sertakan flag --service-account=SERVICE_ACCOUNT_EMAIL.

    • Ganti SERVICE_ACCOUNT_EMAIL dengan alamat email akun layanan yang dikelola pengguna (PROJECT_NUMBER-compute@developer.gserviceaccount.com) yang digunakan untuk men-deploy layanan. Hapus flag ini jika Anda ingin menggunakan akun layanan komputasi default (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Untuk terus menggunakan akun layanan yang ditentukan saat men-deploy integrasi Cloud Run, jalankan:

      gcloud config set runapps/deployment-service-account
  3. Tunggu hingga satu menit. Selama waktu tersebut, layanan Cloud Run Anda diberi izin untuk memanggil Vertex AI API.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.

    Anda dapat memeriksa statusnya menggunakan gcloud beta run integrations describe.

Lihat integrasi Vertex AI

Untuk melihat status integrasi Vertex AI saat ini untuk layanan Cloud Run Anda:

Konsol

  1. Pada konsol Google Cloud, buka halaman Cloud Run.

    Buka Cloud Run

  2. Klik layanan dalam daftar layanan yang ingin Anda gunakan dalam integrasi ini.

  3. Klik tab Integrations.

  4. Temukan integrasi Vertex AI yang Anda minati, lalu klik Lihat detail.

Command line

  1. Gunakan perintah berikut untuk mendapatkan daftar integrasi yang tersedia:

    gcloud beta run integrations list
  2. Menggunakan nama dari daftar yang ditampilkan, tampilkan detailnya:

    gcloud beta run integrations describe INTEGRATION_NAME

    Ganti INTEGRATION_NAME dengan nama integrasi Vertex AI Anda.

Menghapus integrasi Vertex AI

Menghapus integrasi juga akan menghapus semua resource Google Cloud yang terkait dengan integrasi tersebut, tetapi tidak akan menghapus layanan Cloud Run Anda.

Untuk menghapus integrasi Vertex AI dari layanan Cloud Run Anda:

Konsol

  1. Pada konsol Google Cloud, buka halaman Cloud Run.

    Buka Cloud Run

  2. Klik layanan yang integrasinya ingin Anda hapus.

  3. Klik tab Integrations.

  4. Temukan integrasi Vertex AI yang Anda minati, lalu klik ikon elipsis di sebelah kanan integrasi, lalu klik Delete.

Command line

  1. Gunakan perintah berikut untuk mendapatkan daftar integrasi yang tersedia:

    gcloud beta run integrations list
  2. Dengan menggunakan nama dari daftar yang ditampilkan, hapus integrasi:

    gcloud beta run integrations delete INTEGRATION_NAME

    Ganti:

    • INTEGRATION_NAME dengan nama integrasi Vertex AI Anda.

    Secara opsional, Anda dapat menggunakan opsi tanda berikut:

    Opsi Deskripsi
    --service-account Alamat email akun layanan yang dikelola pengguna untuk melakukan operasi penghapusan.

Akses model AI generatif Vertex AI dalam kode Anda

Setelah menyelesaikan integrasi, Anda dapat mengirim permintaan ke Vertex AI model API, dan menggunakan Vertex AI Studio untuk menguji dan menyesuaikan model AI generatif dalam aplikasi Anda dengan cepat.

Batasan

Integrasi Cloud Run hanya didukung di region tertentu. Jika Anda perlu menggunakan region yang tidak didukung oleh integrasi Cloud Run, lihat lokasi Vertex AI.