本頁面由 Cloud Translation API 翻譯而成。

使用 Agent Development Kit (ADK) 和 Vertex AI，在 GKE 部署代理式 AI 應用程式

本指南說明如何使用 Google Kubernetes Engine (GKE) 部署及管理容器化代理程式 AI/ML 應用程式。結合 Google 代理程式開發套件 (ADK) 和 Vertex AI (大型語言模型 (LLM) 提供者)，即可有效率地大規模運作 AI 代理程式。本指南會逐步說明如何使用 Gemini 2.0 Flash，將以 FastAPI 為基礎的代理程式從開發階段部署到 GKE 正式環境。

本指南適用於對使用 Kubernetes 容器自動化調度管理功能，提供代理型 AI/機器學習應用程式服務感興趣的機器學習工程師、開發人員和雲端架構師。如要進一步瞭解內容中的常見角色和範例工作，請參閱「常見的 GKE 使用者角色和工作」。 Google Cloud

開始之前，請務必詳閱下列事項：

背景

本指南結合多項 Google 技術，建立可擴充的代理程式 AI 平台。GKE 會為使用 ADK 建構的代理程式提供容器自動化調度管理功能。使用 Vertex AI API 進行 LLM 推論時，GKE 叢集不需要專用 GPU 硬體，因為推論作業是由 Google 的代管基礎架構處理。

Google Agent Development Kit (ADK)

Agent Development Kit (ADK) 是一個彈性十足的模組化框架，可用於開發及部署 AI 代理。雖然 ADK 專為 Gemini 和 Google 生態系統最佳化，但與模型無關，可獨立部署，且與其他架構相容。

詳情請參閱 ADK 說明文件。

GKE 代管 Kubernetes 服務

GKE 是代管 Kubernetes 服務，可部署、擴充及管理容器化應用程式。GKE 提供必要的基礎架構，包括可擴充的資源、分散式運算和高效能網路，可處理 LLM 的運算需求。

如要進一步瞭解 Kubernetes 的重要概念，請參閱「開始學習 Kubernetes」。如要進一步瞭解 GKE，以及如何透過 GKE 自動處理、管理 Kubernetes 及調度資源，請參閱 GKE 總覽。

Vertex AI

Vertex AI 是 Google Cloud的統合式機器學習平台，可讓開發人員建構、部署及擴充 AI/機器學習模型。對於 GKE 上的代理式 AI 應用程式，Vertex AI 提供必要的工具和服務，包括存取 Gemini 2.0 Flash 等 LLM、用於訓練和推論的代管基礎架構，以及用於有效管理生命週期的 MLOps 功能。

透過 Vertex AI API 使用 LLM 時，模型推論會在 Google 的代管基礎架構上進行，因此您在 GKE 叢集中不需要特定 GPU 或 TPU 配額。

如要進一步瞭解 Vertex AI 在代理程式 AI 應用程式中的用途，請參閱 Vertex AI 說明文件。

Gemini 2.0 Flash

Gemini 2.0 Flash 提供新一代功能，並提升專為代理工作負載設計的能力，包括速度更快、內建工具使用功能、多模態生成，以及 100 萬個詞元的脈絡窗口。Gemini 2.0 Flash 比先前的 Flash 模型更出色，品質提升，速度則與先前相近。

如要瞭解 Gemini 2.0 Flash 的技術資訊 (例如效能基準、訓練資料集資訊、永續發展工作、預期用途和限制，以及我們的倫理和安全方法)，請參閱 Gemini 2.0 Flash 的模型資訊卡。

準備環境

本教學課程會使用 Cloud Shell 管理託管於 Google Cloud的資源。Cloud Shell 已預先安裝本教學課程所需的軟體，包括 kubectl、terraform 和 Google Cloud CLI。

如要使用 Cloud Shell 設定環境，請按照下列步驟操作：

在 Google Cloud 控制台中啟動 Cloud Shell 工作階段，然後按一下「啟用 Cloud Shell」。系統會在 Google Cloud 控制台的底部窗格啟動工作階段。

設定預設環境變數：

gcloud config set project PROJECT_ID
export GOOGLE_CLOUD_LOCATION=REGION
export PROJECT_ID=PROJECT_ID
export GOOGLE_CLOUD_PROJECT=$PROJECT_ID
export WORKLOAD_POOL=$PROJECT_ID.svc.id.goog
export PROJECT_NUMBER=$(gcloud projects describe --format json $PROJECT_ID | jq -r ".projectNumber")

替換下列值：

PROJECT_ID：您的 Google Cloud 專案 ID。
REGION：用於佈建 GKE 叢集、Artifact Registry 和其他區域資源的 Google Cloud 區域 (例如 us-central1)。

複製範例專案

在 Cloud Shell 終端機中，複製本教學課程的範例程式碼存放區：

git clone https://github.com/GoogleCloudPlatform/kubernetes-engine-samples.git

前往教學課程目錄：

cd kubernetes-engine-samples/ai-ml/adk-vertex

建立及設定 Google Cloud 資源

如要將代理程式部署至 GKE，請佈建必要的Google Cloud 資源。您可以透過 gcloud CLI 直接執行指令列，或使用 Terraform 進行基礎架構即程式碼作業，部署代理程式。

gcloud

本節提供 gcloud CLI 指令，可設定 GKE 叢集、Artifact Registry 和 Workload Identity Federation for GKE，與 Vertex AI 順暢整合。請確認您已按照「準備環境」一文所述設定環境變數。

建立 GKE 叢集：您可以在 GKE Autopilot 或 Standard 叢集中部署容器化代理程式應用程式。使用 Autopilot 叢集，享有全代管 Kubernetes 服務。如要選擇最適合工作負載的 GKE 作業模式，請參閱「選擇 GKE 作業模式」。
Autopilot
在 Cloud Shell 中執行下列指令：
```
gcloud container clusters create-auto CLUSTER_NAME \
        --location=$GOOGLE_CLOUD_LOCATION \
        --project=$PROJECT_ID
```
將 CLUSTER_NAME 替換為 GKE Autopilot 叢集的名稱。
標準
在 Cloud Shell 中執行下列指令：
```
gcloud container clusters create CLUSTER_NAME \
    --location=$GOOGLE_CLOUD_LOCATION \
    --project=$PROJECT_ID \
    --release-channel=stable \
    --num-nodes=1 \
    --machine-type=e2-medium \
    --workload-pool=$PROJECT_ID.svc.id.goog
```
將 CLUSTER_NAME 替換為您的 Standard 叢集名稱。
為 Docker 容器建立 Artifact Registry 存放區：建立 Artifact Registry 存放區，安全地儲存及管理代理程式的 Docker 容器映像檔。這個私人登錄檔可確保應用程式隨時可部署至 GKE，並與 Cloud Build 整合。
```
gcloud artifacts repositories create adk-repo \
    --repository-format=docker \
    --location=$GOOGLE_CLOUD_LOCATION \
    --project=$PROJECT_ID
```
取得存放區網址：執行這項指令，確認存放區的完整路徑。您會在下一個步驟中使用這個路徑格式，為 Docker 映像檔加上標記。
```
gcloud artifacts repositories describe adk-repo \
    --location $GOOGLE_CLOUD_LOCATION \
    --project=$PROJECT_ID
```

授予 Compute Engine 預設服務帳戶必要的 IAM 角色：根據預設，Compute Engine 預設服務帳戶沒有權限將映像檔推送至 Artifact Registry，也無法查看 Cloud Storage 中的物件或記錄。授予這些作業的必要角色。

ROLES_TO_ASSIGN=(
    "roles/artifactregistry.writer"
    "roles/storage.objectViewer"
    "roles/logging.viewer"
)

for ROLE in "${ROLES_TO_ASSIGN[@]}"; do
    gcloud projects add-iam-policy-binding "${PROJECT_ID}" \
        --member="serviceAccount:${PROJECT_NUMBER}-compute@developer.gserviceaccount.com" \
        --role="${ROLE}"
done

建構及推送代理程式容器映像檔：執行這項指令，建構 Docker 映像檔並推送至 Artifact Registry。確認 Dockerfile 和應用程式程式碼位於 /app 目錄中。

export IMAGE_URL="${GOOGLE_CLOUD_LOCATION}-docker.pkg.dev/${PROJECT_ID}/adk-repo/adk-agent:latest"

gcloud builds submit \
    --tag "$IMAGE_URL" \
    --project="$PROJECT_ID" \
    app

確認映像檔已推送：

gcloud artifacts docker images list \
    $GOOGLE_CLOUD_LOCATION-docker.pkg.dev/$PROJECT_ID/adk-repo/adk-agent \
    --project=$PROJECT_ID

Terraform

本節說明如何使用 Terraform 佈建資源。 Google Cloud您複製的範例存放區包含必要的 Terraform 設定檔。

初始化 Terraform：前往 terraform 目錄並初始化 Terraform。
```
terraform init
```
查看執行計畫：這個指令會顯示 Terraform 將進行的基礎架構變更。
```
terraform plan -var-file=default_env.tfvars
```
套用設定：執行 Terraform 方案，在 Google Cloud 專案中建立資源。當系統提示時，請使用 yes 確認。
```
terraform apply -var-file=default_env.tfvars
```
執行這些指令後，Terraform 會佈建 GKE 叢集和 Artifact Registry 存放區，並設定必要的 IAM 角色和服務帳戶，包括 GKE 的 Workload Identity Federation。

如要進一步瞭解如何使用 Terraform，請參閱「GKE 的 Terraform 支援」。

設定 `kubectl` 與叢集通訊

如果尚未設定 kubectl 與叢集通訊，請執行下列指令：

gcloud container clusters get-credentials CLUSTER_NAME \
    --location=${GOOGLE_CLOUD_LOCATION}

將 CLUSTER_NAME 替換為您的 GKE 叢集名稱。

設定 Workload Identity Federation，以便存取 GKE

如果您使用 Terraform，可以略過這個步驟。這個程序會將 Kubernetes 服務帳戶 (KSA) 連結至 IAM 服務帳戶，安全地授予代理程式 Google Cloud 服務的存取權。

建立服務帳戶，以存取 Vertex AI：

gcloud iam service-accounts create vertex-sa \
    --project=$PROJECT_ID

將 aiplatform.user 角色授予服務帳戶。服務帳戶即可與 Vertex AI 互動。

gcloud projects add-iam-policy-binding $PROJECT_ID \
    --member "serviceAccount:vertex-sa@$PROJECT_ID.iam.gserviceaccount.com" \
    --role "roles/aiplatform.user"

在叢集中建立 KSA。執行這項指令前，請務必按照「設定 kubectl 與叢集通訊」一文中的操作說明進行設定。
```
kubectl create serviceaccount vertex-sa
```

為 KSA 加入註解，將其連結至服務帳戶：

kubectl annotate serviceaccount vertex-sa \
    iam.gke.io/gcp-service-account=vertex-sa@$PROJECT_ID.iam.gserviceaccount.com

授予服務帳戶權限，使其以 KSA 的 Workload Identity Federation for GKE 使用者身分執行作業：

gcloud iam service-accounts add-iam-policy-binding vertex-sa@$PROJECT_ID.iam.gserviceaccount.com \
    --role roles/iam.workloadIdentityUser \
    --member "serviceAccount:$PROJECT_ID.svc.id.goog[default/vertex-sa]"

部署及設定代理程式應用程式

設定 Google Cloud 資源後，請準備部署代理程式應用程式，並在 GKE 上設定其執行階段。這包括定義代理程式的程式碼、建立 Dockerfile 以將其容器化，以及編寫 Kubernetes 資訊清單，將其部署至叢集。

瞭解代理程式應用程式結構：/app 目錄包含代理程式應用程式的核心檔案：
- main.py：FastAPI 應用程式的進入點，負責公開代理程式的 API。
- agent.py：包含 ADK 代理程式的邏輯，定義代理程式如何使用 Vertex AI 和處理要求。
- __init__.py：初始化 Python 套件。
- requirements.txt：列出代理程式的所有 Python 依附元件。
- Dockerfile：定義如何將應用程式封裝至 Docker 映像檔。

建立代理程式部署資訊清單：在 tutorials-and-examples/adk/vertex 目錄中，建立下列資訊清單，並將其命名為 agent-deployment.yaml：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: adk-agent-deployment
  labels:
    app: adk-agent
spec:
  replicas: 1
  selector:
    matchLabels:
      app: adk-agent
  template:
    metadata:
      labels:
        app: adk-agent
    spec:
      serviceAccountName: vertex-sa
      containers:
      - name: adk-agent
        image: IMAGE_URL
        ports:
        - containerPort: 8000
        env:
        - name: GOOGLE_CLOUD_PROJECT_ID
          value: PROJECT_ID
        - name: GOOGLE_CLOUD_LOCATION
          value: REGION
        - name: GOOGLE_GENAI_USE_VERTEXAI
          value: "1"
        - name: PORT
          value: "8000"
        resources:
          requests:
            memory: "512Mi"
            cpu: "500m"
          limits:
            memory: "1Gi"
            cpu: "1"