Men-deploy aplikasi AI agentic di GKE dengan Agent Development Kit (ADK) dan Vertex AI


Panduan ini menunjukkan cara men-deploy dan mengelola aplikasi AI/ML agentik dalam container menggunakan Google Kubernetes Engine (GKE). Dengan menggabungkan Google Agent Development Kit (ADK) dengan Vertex AI sebagai penyedia model bahasa besar (LLM), Anda dapat mengoperasikan agen AI secara efisien dan dalam skala besar. Panduan ini akan memandu Anda melalui proses end-to-end untuk membawa agen berbasis FastAPI yang didukung oleh Gemini 2.0 Flash dari pengembangan hingga deployment produksi di GKE.

Panduan ini ditujukan untuk Engineer machine learning (ML), Developer, dan Arsitek cloud yang tertarik untuk menggunakan kemampuan orkestrasi container Kubernetes untuk menyajikan aplikasi AI/ML agentik. Untuk mempelajari lebih lanjut peran umum dan contoh tugas dalam konten Google Cloud , lihat Peran dan tugas pengguna GKE Enterprise umum.

Sebelum memulai, pastikan Anda memahami hal-hal berikut:

Latar belakang

Panduan ini menggabungkan beberapa teknologi Google untuk membuat platform yang skalabel bagi AI agentik. GKE menyediakan orkestrasi container untuk agen, yang dibangun menggunakan ADK. Dengan menggunakan Vertex AI API untuk inferensi LLM, cluster GKE tidak memerlukan hardware GPU khusus, karena inferensi ditangani oleh infrastruktur terkelola Google.

Google Agent Development Kit (ADK)

Agent Development Kit (ADK) adalah framework fleksibel dan modular untuk mengembangkan dan men-deploy agen AI. Meskipun dioptimalkan untuk Gemini dan ekosistem Google, ADK tidak bergantung pada model, tidak bergantung pada deployment, dan dibuat agar kompatibel dengan framework lain.

Untuk mengetahui informasi selengkapnya, lihat dokumentasi ADK.

Layanan Kubernetes terkelola GKE

GKE adalah layanan Kubernetes terkelola untuk men-deploy, menskalakan, dan mengelola aplikasi dalam container. GKE menyediakan infrastruktur yang diperlukan, termasuk resource yang skalabel, komputasi terdistribusi, dan jaringan yang efisien, untuk menangani permintaan komputasi LLM.

Untuk mengetahui informasi selengkapnya tentang konsep utama Kubernetes, lihat Mulai mempelajari Kubernetes. Untuk mengetahui informasi selengkapnya tentang GKE dan cara GKE membantu Anda melakukan penskalaan, mengotomatiskan, dan mengelola Kubernetes, lihat Ringkasan GKE.

Vertex AI

Vertex AI adalah platform ML terpadu Google Cloud', yang memungkinkan developer membangun, men-deploy, dan menskalakan model AI/ML. Untuk aplikasi AI agentic di GKE, Vertex AI menyediakan alat dan layanan penting, termasuk akses ke LLM seperti Gemini 2.0 Flash, infrastruktur terkelola untuk pelatihan dan inferensi, serta kemampuan MLOps untuk pengelolaan siklus proses yang efisien.

Saat menggunakan LLM melalui Vertex AI API, inferensi model terjadi di infrastruktur terkelola Google, sehingga mengurangi kebutuhan akan kuota GPU atau TPU tertentu di cluster GKE Anda.

Untuk mengetahui informasi selengkapnya tentang Vertex AI untuk aplikasi AI agentik, lihat dokumentasi Vertex AI.

Gemini 2.0 Flash

Gemini 2.0 Flash menghadirkan fitur generasi berikutnya dan kemampuan yang ditingkatkan yang dirancang untuk beban kerja agentik, termasuk kecepatan yang lebih tinggi, penggunaan alat bawaan, pembuatan multimodal, dan jendela konteks 1 juta token. Gemini 2.0 Flash lebih baik daripada model Flash sebelumnya dan menawarkan kualitas yang lebih baik dengan kecepatan yang serupa.

Untuk informasi teknis tentang Gemini 2.0 Flash (seperti tolok ukur performa, informasi tentang set data pelatihan kami, upaya keberlanjutan, penggunaan dan batasan yang dimaksudkan, serta pendekatan kami terhadap etika dan keamanan), lihat kartu model untuk Gemini 2.0 Flash.

Tujuan

Panduan ini menunjukkan cara melakukan hal berikut:

  • Siapkan Google Cloud lingkungan Anda.
  • Buat image container untuk agen Anda.
  • Deploy agen ke cluster GKE.
  • Uji agen yang di-deploy.

Biaya

Panduan ini menggunakan komponen Google Cloudyang dapat ditagih berikut:

Tinjau harga untuk setiap layanan guna memahami potensi biaya.

Sebelum memulai

  • Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  • In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  • Verify that billing is enabled for your Google Cloud project.

  • Enable the required APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  • In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  • Verify that billing is enabled for your Google Cloud project.

  • Enable the required APIs.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the APIs

  • Make sure that you have the following role or roles on the project: roles/container.admin, roles/iam.serviceAccountAdmin, roles/artifactregistry.admin, roles/cloudbuild.builds.editor, roles/resourcemanager.projectIamAdmin

    Check for the roles

    1. In the Google Cloud console, go to the IAM page.

      Go to IAM
    2. Select the project.
    3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

    4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

    Grant the roles

    1. In the Google Cloud console, go to the IAM page.

      Buka IAM
    2. Pilih project.
    3. Klik Grant access.
    4. Di kolom New principals, masukkan ID pengguna Anda. Biasanya berupa alamat email untuk Akun Google.

    5. Di daftar Select a role, pilih peran.
    6. Untuk memberikan peran tambahan, klik Tambahkan peran lain, lalu tambahkan setiap peran tambahan.
    7. Klik Simpan.
    8. Menyiapkan lingkungan

      Tutorial ini menggunakan Cloud Shell untuk mengelola resource yang dihosting di Google Cloud. Cloud Shell telah diinstal dengan software yang Anda perlukan untuk tutorial ini, termasuk kubectl, terraform, dan Google Cloud CLI.

      Untuk menyiapkan lingkungan Anda dengan Cloud Shell, ikuti langkah-langkah berikut:

      1. Di Google Cloud konsol, luncurkan sesi Cloud Shell dan klik Ikon aktivasi Cloud Shell Aktifkan Cloud Shell. Tindakan ini akan meluncurkan sesi di panel bawah konsol Google Cloud .
      2. Tetapkan variabel lingkungan default:

        gcloud config set project PROJECT_ID
        export GOOGLE_CLOUD_LOCATION=REGION
        export PROJECT_ID=PROJECT_ID
        export GOOGLE_CLOUD_PROJECT=$PROJECT_ID
        export WORKLOAD_POOL=$PROJECT_ID.svc.id.goog
        export PROJECT_NUMBER=$(gcloud projects describe --format json $PROJECT_ID | jq -r ".projectNumber")
        

        Ganti nilai berikut:

        • PROJECT_ID: Google Cloud project ID Anda.
        • REGION: Google Cloud region (misalnya, us-central1) untuk menyediakan cluster GKE, Artifact Registry, dan resource regional lainnya.

      Meng-clone project contoh

      1. Dari terminal Cloud Shell, clone repositori kode contoh tutorial:

        git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git
        
      2. Buka direktori tutorial:

        cd kubernetes-engine-samples/ai-ml/adk-vertex
        

      Membuat dan mengonfigurasi resource Google Cloud

      Untuk men-deploy agen ke GKE, sediakan resourceGoogle Cloud yang diperlukan. Anda dapat men-deploy agen menggunakan gcloud CLI untuk eksekusi command line langsung atau Terraform untuk infrastruktur sebagai kode.

      gcloud

      Bagian ini menyediakan perintah gcloud CLI untuk menyiapkan cluster GKE, Artifact Registry, dan Workload Identity Federation untuk GKE agar terintegrasi secara lancar dengan Vertex AI. Pastikan Anda telah menetapkan variabel lingkungan seperti yang dijelaskan dalam Mempersiapkan lingkungan.

      1. Buat cluster GKE: Anda dapat men-deploy aplikasi agentik dalam container di cluster GKE Autopilot atau Standard. Gunakan cluster Autopilot untuk pengalaman Kubernetes yang terkelola sepenuhnya. Untuk memilih mode operasi GKE yang paling sesuai dengan workload Anda, lihat Memilih mode operasi GKE.

        Autopilot

        Jalankan perintah berikut di Cloud Shell:

        gcloud container clusters create-auto CLUSTER_NAME \
                --location=$GOOGLE_CLOUD_LOCATION \
                --project=$PROJECT_ID
        

        Ganti CLUSTER_NAME dengan nama cluster GKE Autopilot Anda.

        Standar

        Jalankan perintah berikut di Cloud Shell:

        gcloud container clusters create CLUSTER_NAME \
            --location=$GOOGLE_CLOUD_LOCATION \
            --project=$PROJECT_ID \
            --release-channel=stable \
            --num-nodes=1 \
            --machine-type=e2-medium \
            --workload-pool=$PROJECT_ID.svc.id.goog
        

        Ganti CLUSTER_NAME dengan nama cluster Standard Anda.

      2. Buat repositori Artifact Registry untuk container Docker Anda: Buat repositori Artifact Registry untuk menyimpan dan mengelola image container Docker agen Anda secara aman. Registry pribadi ini membantu memastikan aplikasi Anda siap di-deploy ke GKE dan terintegrasi dengan Cloud Build.

        gcloud artifacts repositories create adk-repo \
            --repository-format=docker \
            --location=$GOOGLE_CLOUD_LOCATION \
            --project=$PROJECT_ID
        
      3. Dapatkan URL repositori: Jalankan perintah ini untuk memverifikasi jalur lengkap ke repositori Anda. Anda akan menggunakan format jalur ini untuk memberi tag pada image Docker di langkah berikutnya.

        gcloud artifacts repositories describe adk-repo \
            --location $GOOGLE_CLOUD_LOCATION \
            --project=$PROJECT_ID
        
      4. Memberi akun layanan default Compute Engine peran IAM yang diperlukan: Secara default, akun layanan default Compute Engine tidak memiliki izin untuk mengirim image ke Artifact Registry, atau untuk melihat objek di Cloud Storage atau log. Berikan peran yang diperlukan untuk operasi ini.

        ROLES_TO_ASSIGN=(
            "roles/artifactregistry.writer"
            "roles/storage.objectViewer"
            "roles/logging.viewer"
        )
        
        for ROLE in "${ROLES_TO_ASSIGN[@]}"; do
            gcloud projects add-iam-policy-binding "${PROJECT_ID}" \
                --member="serviceAccount:${PROJECT_NUMBER}-compute@developer.gserviceaccount.com" \
                --role="${ROLE}"
        done
        
      5. Bangun dan kirim image container agen: Jalankan perintah ini untuk membangun image Docker dan mengirimkannya ke Artifact Registry Anda. Pastikan Dockerfile dan kode aplikasi Anda berada di direktori /app.

        export IMAGE_URL="${GOOGLE_CLOUD_LOCATION}-docker.pkg.dev/${PROJECT_ID}/adk-repo/adk-agent:latest"
        
        gcloud builds submit \
            --tag "$IMAGE_URL" \
            --project="$PROJECT_ID" \
            app
        
      6. Pastikan image telah di-push:

        gcloud artifacts docker images list \
            $GOOGLE_CLOUD_LOCATION-docker.pkg.dev/$PROJECT_ID/adk-repo/adk-agent \
            --project=$PROJECT_ID
        

      Terraform

      Bagian ini menjelaskan cara menggunakan Terraform untuk menyediakan resource Google Cloud Anda. Repositori contoh yang Anda clone mencakup file konfigurasi Terraform yang diperlukan.

      1. Lakukan inisialisasi Terraform: Buka direktori terraform dan lakukan inisialisasi Terraform.

        terraform init
        
      2. Tinjau rencana eksekusi: Perintah ini menunjukkan perubahan infrastruktur yang akan dilakukan Terraform.

        terraform plan -var-file=default_env.tfvars
        
      3. Terapkan konfigurasi: Jalankan rencana Terraform untuk membuat resource di project Google Cloud Anda. Konfirmasi dengan yes saat diminta.

        terraform apply -var-file=default_env.tfvars
        

        Setelah Anda menjalankan perintah ini, Terraform akan menyediakan cluster GKE dan repositori Artifact Registry, serta mengonfigurasi akun layanan dan peran IAM yang diperlukan, termasuk Workload Identity Federation untuk GKE.

      Untuk mempelajari lebih lanjut cara menggunakan Terraform, lihat Dukungan Terraform untuk GKE.

      Konfigurasi kubectl untuk berkomunikasi dengan cluster Anda

      Jika Anda belum mengonfigurasi kubectl untuk berkomunikasi dengan cluster, jalankan perintah berikut:

      gcloud container clusters get-credentials CLUSTER_NAME \
          --location=${GOOGLE_CLOUD_LOCATION}
      

      Ganti CLUSTER_NAME dengan nama cluster GKE Anda.

      Mengonfigurasi Workload Identity Federation untuk akses GKE

      Anda dapat melewati langkah ini jika menggunakan Terraform. Proses ini menautkan Akun Layanan Kubernetes (KSA) ke akun layanan IAM untuk memberikan akses yang aman bagi agen Anda ke layanan Google Cloud .

      1. Buat akun layanan untuk akses Vertex AI:

        gcloud iam service-accounts create vertex-sa \
            --project=$PROJECT_ID
        
      2. Berikan peran aiplatform.user kepada akun layanan. Hal ini memungkinkan akun layanan berinteraksi dengan Vertex AI.

        gcloud projects add-iam-policy-binding $PROJECT_ID \
            --member "serviceAccount:vertex-sa@$PROJECT_ID.iam.gserviceaccount.com" \
            --role "roles/aiplatform.user"
        
      3. Buat KSA di cluster Anda. Pastikan untuk mengikuti petunjuk di bagian Mengonfigurasi kubectl untuk berkomunikasi dengan cluster Anda sebelum menjalankan perintah ini.

        kubectl create serviceaccount vertex-sa
        
      4. Anotasikan KSA untuk menautkannya ke akun layanan Anda:

        kubectl annotate serviceaccount vertex-sa \
            iam.gke.io/gcp-service-account=vertex-sa@$PROJECT_ID.iam.gserviceaccount.com
        
      5. Beri akun layanan Anda izin untuk bertindak sebagai pengguna Workload Identity Federation for GKE untuk KSA:

        gcloud iam service-accounts add-iam-policy-binding vertex-sa@$PROJECT_ID.iam.gserviceaccount.com \
            --role roles/iam.workloadIdentityUser \
            --member "serviceAccount:$PROJECT_ID.svc.id.goog[default/vertex-sa]"
        

      Men-deploy dan mengonfigurasi aplikasi agen

      Setelah menyiapkan resource Google Cloud , siapkan aplikasi agen untuk deployment dan konfigurasi runtime-nya di GKE. Hal ini melibatkan pendefinisian kode agen, pembuatan Dockerfile untuk menyimpannya dalam container, dan penulisan manifes Kubernetes untuk men-deploy-nya ke cluster Anda.

      1. Memahami struktur aplikasi agen: Direktori /app berisi file inti untuk aplikasi agen Anda:
        • main.py: Titik entri aplikasi FastAPI, yang bertanggung jawab untuk mengekspos API agen.
        • agent.py: Berisi logika agen ADK, yang menentukan cara agen tersebut menggunakan Vertex AI dan menangani permintaan.
        • __init__.py: Menginisialisasi paket Python.
        • requirements.txt: Mencantumkan semua dependensi Python untuk agen Anda.
        • Dockerfile: Menentukan cara aplikasi Anda dipaketkan ke dalam image Docker.
      2. Buat manifes deployment agen: Di direktori tutorials-and-examples/adk/vertex, buat manifes berikut sebagai file bernama agent-deployment.yaml:

        apiVersion: apps/v1
        kind: Deployment
        metadata:
          name: adk-agent-deployment
          labels:
            app: adk-agent
        spec:
          replicas: 1
          selector:
            matchLabels:
              app: adk-agent
          template:
            metadata:
              labels:
                app: adk-agent
            spec:
              serviceAccountName: vertex-sa
              containers:
              - name: adk-agent
                image: IMAGE_URL
                ports:
                - containerPort: 8000
                env:
                - name: GOOGLE_CLOUD_PROJECT_ID
                  value: PROJECT_ID
                - name: GOOGLE_CLOUD_LOCATION
                  value: REGION
                - name: GOOGLE_GENAI_USE_VERTEXAI
                  value: "1"
                - name: PORT
                  value: "8000"
                resources:
                  requests:
                    memory: "512Mi"
                    cpu: "500m"
                  limits:
                    memory: "1Gi"
                    cpu: "1"
        

        Ganti nilai berikut:

        • IMAGE_URL: URL lengkap image Docker yang Anda kirim ke Artifact Registry (misalnya, us-central1-docker.pkg.dev/${PROJECT_ID}/adk-repo/adk-agent:latest). Anda bisa mendapatkan nilai ini dari output perintah gcloud artifacts docker images list di bagian sebelumnya. Atau, jalankan perintah seperti berikut: sed -i "s|image: IMAGE_URL|image: $IMAGE_URL|" agent-deployment.yaml.
        • PROJECT_ID: Google Cloud Project ID Anda.
        • REGION: Google Cloud region tempat cluster GKE Anda disediakan.
      3. Terapkan manifes deployment:

        kubectl apply -f agent-deployment.yaml
        

        Perintah ini akan membuat Deployment dan Pod terkait untuk aplikasi agen Anda di cluster GKE.

      4. Mengekspos agen: Anda dapat menggunakan metode ini untuk mengekspos agen Anda agar dapat diakses.

        • Untuk mengakses agen dari luar cluster, buat Layanan Kubernetes. Untuk API web, layanan jenis LoadBalancer umum digunakan.
        • Untuk pengembangan dan pengujian lokal, gunakan perintah kubectl port-forward untuk mengakses agen Anda secara langsung.

        LoadBalancer

        1. Buat manifes berikut sebagai file bernama agent-service.yaml:

          apiVersion: v1
          kind: Service
          metadata:
            name: adk-agent-service
          spec:
            selector:
              app: adk-agent
            type: LoadBalancer # Creates an external IP address for access
            ports:
            -   protocol: TCP
              port: 80
              targetPort: 8000 # Matches the containerPort exposed in the Deployment
          
        2. Terapkan manifes:

          kubectl apply -f agent-service.yaml
          

          Mungkin perlu waktu beberapa menit agar alamat IP eksternal disediakan.

        3. Pastikan alamat IP telah disediakan:

          kubectl get service adk-agent-service
          

          Cari nilai EXTERNAL-IP di output. Setelah nilai tersedia, gunakan alamat IP ini untuk berinteraksi dengan agen yang di-deploy.

        port-forward

        Jika Anda terutama menggunakan port-forward, sebaiknya gunakan jenis Layanan ClusterIP, bukan LoadBalancer, karena Layanan ClusterIP bersifat internal dan menggunakan lebih sedikit resource.

        POD_NAME=$(kubectl get pods -l app=adk-agent -o jsonpath='{.items[0].metadata.name}')
        kubectl port-forward $POD_NAME 8000:8000
        

        Perintah ini memblokir terminal Anda, tetapi meneruskan traffic dari localhost:8000 di komputer Anda ke agen yang berjalan di dalam cluster GKE.

      Menguji agen yang di-deploy

      Setelah aplikasi agen Anda di-deploy dan diekspos, uji fungsinya.

      Bagian ini menjelaskan cara mengidentifikasi endpoint agen dan menguji API agen.

      1. Identifikasi endpoint agen: Bergantung pada cara Anda memilih untuk mengekspos agen di bagian sebelumnya, identifikasi endpoint yang dapat diakses:

        LoadBalancer

        1. Ambil alamat IP eksternal:

          kubectl get service adk-agent-service -o jsonpath='{.status.loadBalancer.ingress[0].ip}'
          
        2. Simpan alamat IP eksternal dalam variabel lingkungan agar lebih mudah digunakan:

          export AGENT_IP=$(kubectl get service adk-agent-service -o jsonpath='{.status.loadBalancer.ingress[0].ip}')
          

          URL dasar agen Anda adalah http://${AGENT_IP}.

        port-forward

        Pastikan perintah kubectl port-forward Anda berjalan di terminal terpisah. URL dasar agen Anda adalah http://localhost:8000.

      2. Uji API agen: Uji API agen dengan membuat permintaan curl ke endpoint /run-nya. Agen mengharapkan payload JSON dengan kolom pesan. Ganti AGENT_BASE_URL dengan http://${AGENT_IP} (untuk LoadBalancer) atau http://localhost:8000 (untuk penerusan port).

        1. Membuat sesi baru. Tindakan ini akan menyiapkan agen untuk percakapan baru.

          # The user ID and session ID are arbitrary.
          # The appName must match the agent's Python package directory name (in this case, "capital-agent").
          curl -X POST AGENT_BASE_URL/apps/capital-agent/users/user-123/sessions/session-123
          

          Anda dapat mencantumkan aplikasi yang tersedia dengan perintah berikut:

          curl -X GET AGENT_BASE_URL/list-apps
          
        2. Kirim kueri ke agen menggunakan detail sesi dari langkah sebelumnya.

          curl -X POST AGENT_BASE_URL/run \
          -H "Content-Type: application/json" \
          -d '{
            "appName": "capital-agent",
            "userId": "user-123",
            "sessionId": "session-123",
            "newMessage": {
              "role": "user",
              "parts": [{
                "text": "Hello, agent! What can you do for me?"
              }]
            }
          }'
          

          Anda akan menerima respons JSON dari agen, yang menunjukkan bahwa agen berhasil memproses permintaan dan berinteraksi dengan model Gemini melalui Vertex AI. Respons berisi balasan yang dibuat agen berdasarkan pesan Anda.

      3. Akses UI web agen (jika berlaku): Jika agen Anda menyertakan antarmuka pengguna berbasis web, akses dengan membuka AGENT_BASE_URL di browser web. ADK biasanya menyertakan UI web dasar untuk interaksi dan proses debug. Misalnya, jika Anda mengekspos agen melalui LoadBalancer dan EXTERNAL-IP-nya adalah 34.123.45.67, buka http://34.123.45.67 di browser Anda.

      Pembersihan

      Agar tidak perlu membayar biaya pada akun Google Cloud Anda untuk resource yang digunakan dalam tutorial ini, hapus project yang berisi resource tersebut, atau simpan project dan hapus setiap resource.

      Menghapus resource yang di-deploy

      Agar tidak menimbulkan biaya pada akun Google Cloud Anda untuk resource yang Anda buat dalam panduan ini, jalankan perintah berikut:

      gcloud

      gcloud container clusters delete CLUSTER_NAME \
          --location=${GOOGLE_CLOUD_LOCATION} \
          --project=$PROJECT_ID
      
      gcloud projects remove-iam-policy-binding $PROJECT_ID \
          --member "serviceAccount:vertex-sa@$PROJECT_ID.iam.gserviceaccount.com" \
          --role "roles/aiplatform.user"
      
      gcloud iam service-accounts delete vertex-sa@$PROJECT_ID.iam.gserviceaccount.com
      
      gcloud artifacts repositories delete adk-repo \
          --location=$GOOGLE_CLOUD_LOCATION \
          --project=$PROJECT_ID
      

      Ganti CLUSTER_NAME dengan nama cluster GKE Anda.

      Terraform

      1. Di terminal Cloud Shell, buka direktori tutorials-and-examples/adk/vertex/:

        cd tutorials-and-examples/adk/vertex/
        
      2. Jalankan perintah ini untuk menghapus semua resource yang ditentukan dalam file konfigurasi Terraform Anda.

        cd terraform
        terraform destroy
        

      Langkah berikutnya

      • Pelajari cara mengonfigurasi Horizontal Pod Autoscaler (HPA) untuk menyesuaikan resource agen Anda secara otomatis sesuai permintaan.
      • Pelajari cara mengonfigurasi Identity-Aware Proxy (IAP) untuk aplikasi web yang berjalan diGoogle Cloud, yang menyediakan otorisasi terpusat untuk akses ke UI agen Anda.
      • Pelajari cara menggunakan Cloud Logging dan Cloud Monitoring untuk mendapatkan insight tentang performa dan kondisi agen Anda dalam cluster GKE.
      • Jelajahi contoh eksperimental di GKE AI Labs yang dapat membantu Anda menggunakan GKE untuk mempercepat inisiatif AI agentic Anda.