Halaman ini diterjemahkan oleh Cloud Translation API.

Men-deploy aplikasi AI agentic di GKE dengan Agent Development Kit (ADK) dan Vertex AI

Panduan ini menunjukkan cara men-deploy dan mengelola aplikasi AI/ML agentik dalam container menggunakan Google Kubernetes Engine (GKE). Dengan menggabungkan Google Agent Development Kit (ADK) dengan Vertex AI sebagai penyedia model bahasa besar (LLM), Anda dapat mengoperasikan agen AI secara efisien dan dalam skala besar. Panduan ini akan memandu Anda melalui proses end-to-end untuk membawa agen berbasis FastAPI yang didukung oleh Gemini 2.0 Flash dari pengembangan hingga deployment produksi di GKE.

Panduan ini ditujukan untuk Engineer machine learning (ML), Developer, dan Arsitek cloud yang tertarik untuk menggunakan kemampuan orkestrasi container Kubernetes untuk menyajikan aplikasi AI/ML agentik. Untuk mempelajari lebih lanjut peran umum dan contoh tugas dalam konten Google Cloud , lihat Peran dan tugas pengguna GKE umum.

Sebelum memulai, pastikan Anda memahami hal-hal berikut:

Latar belakang

Panduan ini menggabungkan beberapa teknologi Google untuk membuat platform yang skalabel bagi AI agentik. GKE menyediakan orkestrasi container untuk agen, yang dibangun menggunakan ADK. Dengan menggunakan Vertex AI API untuk inferensi LLM, cluster GKE tidak memerlukan hardware GPU khusus, karena inferensi ditangani oleh infrastruktur terkelola Google.

Google Agent Development Kit (ADK)

Agent Development Kit (ADK) adalah framework fleksibel dan modular untuk mengembangkan dan men-deploy agen AI. Meskipun dioptimalkan untuk Gemini dan ekosistem Google, ADK tidak bergantung pada model, tidak bergantung pada deployment, dan dibuat agar kompatibel dengan framework lain.

Untuk mengetahui informasi selengkapnya, lihat dokumentasi ADK.

Layanan Kubernetes terkelola GKE

GKE adalah layanan Kubernetes terkelola untuk men-deploy, menskalakan, dan mengelola aplikasi dalam container. GKE menyediakan infrastruktur yang diperlukan, termasuk resource yang skalabel, komputasi terdistribusi, dan jaringan yang efisien, untuk menangani permintaan komputasi LLM.

Untuk mengetahui informasi selengkapnya tentang konsep utama Kubernetes, lihat Mulai mempelajari Kubernetes. Untuk mengetahui informasi selengkapnya tentang GKE dan cara GKE membantu Anda melakukan penskalaan, mengotomatiskan, dan mengelola Kubernetes, lihat Ringkasan GKE.

Vertex AI

Vertex AI adalah platform ML terpadu Google Cloud', yang memungkinkan developer membangun, men-deploy, dan menskalakan model AI/ML. Untuk aplikasi AI agentic di GKE, Vertex AI menyediakan alat dan layanan penting, termasuk akses ke LLM seperti Gemini 2.0 Flash, infrastruktur terkelola untuk pelatihan dan inferensi, serta kemampuan MLOps untuk pengelolaan siklus proses yang efisien.

Saat menggunakan LLM melalui Vertex AI API, inferensi model terjadi di infrastruktur terkelola Google, sehingga mengurangi kebutuhan akan kuota GPU atau TPU tertentu di cluster GKE Anda.

Untuk mengetahui informasi selengkapnya tentang Vertex AI untuk aplikasi AI agentik, lihat dokumentasi Vertex AI.

Gemini 2.0 Flash

Gemini 2.0 Flash menghadirkan fitur generasi berikutnya dan kemampuan yang ditingkatkan yang dirancang untuk beban kerja agentik, termasuk kecepatan yang lebih tinggi, penggunaan alat bawaan, pembuatan multimodal, dan jendela konteks 1 juta token. Gemini 2.0 Flash lebih baik daripada model Flash sebelumnya dan menawarkan kualitas yang lebih baik dengan kecepatan yang serupa.

Untuk informasi teknis tentang Gemini 2.0 Flash (seperti tolok ukur performa, informasi tentang set data pelatihan kami, upaya keberlanjutan, penggunaan dan batasan yang dimaksudkan, serta pendekatan kami terhadap etika dan keamanan), lihat kartu model untuk Gemini 2.0 Flash.

Menyiapkan lingkungan

Tutorial ini menggunakan Cloud Shell untuk mengelola resource yang dihosting di Google Cloud. Cloud Shell telah diinstal dengan software yang Anda perlukan untuk tutorial ini, termasuk kubectl, terraform, dan Google Cloud CLI.

Untuk menyiapkan lingkungan Anda dengan Cloud Shell, ikuti langkah-langkah berikut:

Di Google Cloud konsol, luncurkan sesi Cloud Shell dan klik Activate Cloud Shell. Tindakan ini akan meluncurkan sesi di panel bawah konsol Google Cloud .

Tetapkan variabel lingkungan default:

gcloud config set project PROJECT_ID
export GOOGLE_CLOUD_LOCATION=REGION
export PROJECT_ID=PROJECT_ID
export GOOGLE_CLOUD_PROJECT=$PROJECT_ID
export WORKLOAD_POOL=$PROJECT_ID.svc.id.goog
export PROJECT_NUMBER=$(gcloud projects describe --format json $PROJECT_ID | jq -r ".projectNumber")

Ganti nilai berikut:

PROJECT_ID: Google Cloud project ID Anda.
REGION: Google Cloud region (misalnya, us-central1) untuk menyediakan cluster GKE, Artifact Registry, dan resource regional lainnya.

Meng-clone project contoh

Dari terminal Cloud Shell, clone repositori kode contoh tutorial:

git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git

Buka direktori tutorial:

cd kubernetes-engine-samples/ai-ml/adk-vertex

Membuat dan mengonfigurasi resource Google Cloud

Untuk men-deploy agen ke GKE, sediakan resourceGoogle Cloud yang diperlukan. Anda dapat men-deploy agen menggunakan gcloud CLI untuk eksekusi command line langsung atau Terraform untuk infrastruktur sebagai kode.

gcloud

Bagian ini menyediakan perintah gcloud CLI untuk menyiapkan cluster GKE, Artifact Registry, dan Workload Identity Federation untuk GKE agar terintegrasi secara lancar dengan Vertex AI. Pastikan Anda telah menetapkan variabel lingkungan seperti yang dijelaskan dalam Mempersiapkan lingkungan.

Buat cluster GKE: Anda dapat men-deploy aplikasi agentik dalam container di cluster GKE Autopilot atau Standard. Gunakan cluster Autopilot untuk pengalaman Kubernetes yang terkelola sepenuhnya. Untuk memilih mode operasi GKE yang paling sesuai dengan workload Anda, lihat Memilih mode operasi GKE.
Autopilot
Jalankan perintah berikut di Cloud Shell:
```
gcloud container clusters create-auto CLUSTER_NAME \
        --location=$GOOGLE_CLOUD_LOCATION \
        --project=$PROJECT_ID
```
Ganti CLUSTER_NAME dengan nama cluster GKE Autopilot Anda.
Standar
Jalankan perintah berikut di Cloud Shell:
```
gcloud container clusters create CLUSTER_NAME \
    --location=$GOOGLE_CLOUD_LOCATION \
    --project=$PROJECT_ID \
    --release-channel=stable \
    --num-nodes=1 \
    --machine-type=e2-medium \
    --workload-pool=$PROJECT_ID.svc.id.goog
```
Ganti CLUSTER_NAME dengan nama cluster Standard Anda.
Buat repositori Artifact Registry untuk container Docker Anda: Buat repositori Artifact Registry untuk menyimpan dan mengelola image container Docker agen Anda secara aman. Registry pribadi ini membantu memastikan aplikasi Anda siap di-deploy ke GKE dan terintegrasi dengan Cloud Build.
```
gcloud artifacts repositories create adk-repo \
    --repository-format=docker \
    --location=$GOOGLE_CLOUD_LOCATION \
    --project=$PROJECT_ID
```
Dapatkan URL repositori: Jalankan perintah ini untuk memverifikasi jalur lengkap ke repositori Anda. Anda akan menggunakan format jalur ini untuk memberi tag pada image Docker di langkah berikutnya.
```
gcloud artifacts repositories describe adk-repo \
    --location $GOOGLE_CLOUD_LOCATION \
    --project=$PROJECT_ID
```

Memberi akun layanan default Compute Engine peran IAM yang diperlukan: Secara default, akun layanan default Compute Engine tidak memiliki izin untuk mengirim image ke Artifact Registry, atau untuk melihat objek di Cloud Storage atau log. Berikan peran yang diperlukan untuk operasi ini.

ROLES_TO_ASSIGN=(
    "roles/artifactregistry.writer"
    "roles/storage.objectViewer"
    "roles/logging.viewer"
)

for ROLE in "${ROLES_TO_ASSIGN[@]}"; do
    gcloud projects add-iam-policy-binding "${PROJECT_ID}" \
        --member="serviceAccount:${PROJECT_NUMBER}-compute@developer.gserviceaccount.com" \
        --role="${ROLE}"
done

Bangun dan kirim image container agen: Jalankan perintah ini untuk membangun image Docker dan mengirimkannya ke Artifact Registry Anda. Pastikan Dockerfile dan kode aplikasi Anda berada di direktori /app.

export IMAGE_URL="${GOOGLE_CLOUD_LOCATION}-docker.pkg.dev/${PROJECT_ID}/adk-repo/adk-agent:latest"

gcloud builds submit \
    --tag "$IMAGE_URL" \
    --project="$PROJECT_ID" \
    app

Pastikan image telah di-push:

gcloud artifacts docker images list \
    $GOOGLE_CLOUD_LOCATION-docker.pkg.dev/$PROJECT_ID/adk-repo/adk-agent \
    --project=$PROJECT_ID

Terraform

Bagian ini menjelaskan cara menggunakan Terraform untuk menyediakan resource Google Cloud Anda. Repositori contoh yang Anda clone mencakup file konfigurasi Terraform yang diperlukan.

Lakukan inisialisasi Terraform: Buka direktori terraform dan lakukan inisialisasi Terraform.
```
terraform init
```
Tinjau rencana eksekusi: Perintah ini menunjukkan perubahan infrastruktur yang akan dilakukan Terraform.
```
terraform plan -var-file=default_env.tfvars
```
Terapkan konfigurasi: Jalankan rencana Terraform untuk membuat resource di project Google Cloud Anda. Konfirmasi dengan yes saat diminta.
```
terraform apply -var-file=default_env.tfvars
```
Setelah Anda menjalankan perintah ini, Terraform akan menyediakan cluster GKE dan repositori Artifact Registry, serta mengonfigurasi akun layanan dan peran IAM yang diperlukan, termasuk Workload Identity Federation untuk GKE.

Untuk mempelajari lebih lanjut cara menggunakan Terraform, lihat Dukungan Terraform untuk GKE.

Konfigurasi `kubectl` untuk berkomunikasi dengan cluster Anda

Jika Anda belum mengonfigurasi kubectl untuk berkomunikasi dengan cluster, jalankan perintah berikut:

gcloud container clusters get-credentials CLUSTER_NAME \
    --location=${GOOGLE_CLOUD_LOCATION}

Ganti CLUSTER_NAME dengan nama cluster GKE Anda.

Mengonfigurasi Workload Identity Federation untuk akses GKE

Anda dapat melewati langkah ini jika menggunakan Terraform. Proses ini menautkan Akun Layanan Kubernetes (KSA) ke akun layanan IAM untuk memberikan akses yang aman bagi agen Anda ke layanan Google Cloud .

Buat akun layanan untuk akses Vertex AI:

gcloud iam service-accounts create vertex-sa \
    --project=$PROJECT_ID

Berikan peran aiplatform.user kepada akun layanan. Hal ini memungkinkan akun layanan berinteraksi dengan Vertex AI.

gcloud projects add-iam-policy-binding $PROJECT_ID \
    --member "serviceAccount:vertex-sa@$PROJECT_ID.iam.gserviceaccount.com" \
    --role "roles/aiplatform.user"

Buat KSA di cluster Anda. Pastikan untuk mengikuti petunjuk di bagian Mengonfigurasi kubectl untuk berkomunikasi dengan cluster Anda sebelum menjalankan perintah ini.
```
kubectl create serviceaccount vertex-sa
```

Anotasikan KSA untuk menautkannya ke akun layanan Anda:

kubectl annotate serviceaccount vertex-sa \
    iam.gke.io/gcp-service-account=vertex-sa@$PROJECT_ID.iam.gserviceaccount.com

Beri akun layanan Anda izin untuk bertindak sebagai pengguna Workload Identity Federation for GKE untuk KSA:

gcloud iam service-accounts add-iam-policy-binding vertex-sa@$PROJECT_ID.iam.gserviceaccount.com \
    --role roles/iam.workloadIdentityUser \
    --member "serviceAccount:$PROJECT_ID.svc.id.goog[default/vertex-sa]"

Men-deploy dan mengonfigurasi aplikasi agen

Setelah menyiapkan resource Google Cloud , siapkan aplikasi agen untuk deployment dan konfigurasi runtime-nya di GKE. Hal ini melibatkan pendefinisian kode agen, pembuatan Dockerfile untuk menyimpannya dalam container, dan penulisan manifes Kubernetes untuk men-deploy-nya ke cluster Anda.

Memahami struktur aplikasi agen: Direktori /app berisi file inti untuk aplikasi agen Anda:
- main.py: Titik entri aplikasi FastAPI, yang bertanggung jawab untuk mengekspos API agen.
- agent.py: Berisi logika agen ADK, yang menentukan cara agen tersebut menggunakan Vertex AI dan menangani permintaan.
- __init__.py: Menginisialisasi paket Python.
- requirements.txt: Mencantumkan semua dependensi Python untuk agen Anda.
- Dockerfile: Menentukan cara aplikasi Anda dipaketkan ke dalam image Docker.

Buat manifes deployment agen: Di direktori tutorials-and-examples/adk/vertex, buat manifes berikut sebagai file bernama agent-deployment.yaml:

apiVersion: apps/v1
kind: Deployment
metadata:
  name: adk-agent-deployment
  labels:
    app: adk-agent
spec:
  replicas: 1
  selector:
    matchLabels:
      app: adk-agent
  template:
    metadata:
      labels:
        app: adk-agent
    spec:
      serviceAccountName: vertex-sa
      containers:
      - name: adk-agent
        image: IMAGE_URL
        ports:
        - containerPort: 8000
        env:
        - name: GOOGLE_CLOUD_PROJECT_ID
          value: PROJECT_ID
        - name: GOOGLE_CLOUD_LOCATION
          value: REGION
        - name: GOOGLE_GENAI_USE_VERTEXAI
          value: "1"
        - name: PORT
          value: "8000"
        resources:
          requests:
            memory: "512Mi"
            cpu: "500m"
          limits:
            memory: "1Gi"
            cpu: "1"