에이전트 개발 키트(ADK) 및 Vertex AI를 사용하여 GKE에 에이전트 AI 애플리케이션 배포

표준

이 가이드에서는 Google Kubernetes Engine(GKE)을 사용하여 컨테이너화된 에이전트 AI/ML 애플리케이션을 배포하고 관리하는 방법을 보여줍니다. Google 에이전트 개발 키트(ADK)를 대규모 언어 모델(LLM) 제공업체인 Vertex AI와 결합하면 AI 에이전트를 효율적이고 대규모로 운영할 수 있습니다. 이 가이드에서는 Gemini 2.0 Flash로 구동되는 FastAPI 기반 에이전트를 개발에서 GKE의 프로덕션 배포로 가져오는 엔드 투 엔드 프로세스를 안내합니다.

이 가이드는 에이전트 AI/ML 애플리케이션을 서빙하기 위해 Kubernetes 컨테이너 조정 기능을 사용하는 데 관심이 있는 머신러닝(ML) 엔지니어, 개발자, 클라우드 설계자를 대상으로 합니다. Google Cloud 콘텐츠에서 참조하는 일반적인 역할 및 예시 태스크에 대해 자세히 알아보려면 일반 GKE 사용자 역할 및 태스크를 참조하세요.

시작하기 전에 다음 사항을 숙지하세요.

배경

이 가이드에서는 여러 Google 기술을 결합하여 에이전트 AI를 위한 확장 가능한 플랫폼을 만듭니다. GKE는 ADK를 사용하여 빌드된 에이전트의 컨테이너 조정을 제공합니다. LLM 추론에 Vertex AI API를 사용하면 추론이 Google의 관리형 인프라에서 처리되므로 GKE 클러스터에 특수 GPU 하드웨어가 필요하지 않습니다.

Google 에이전트 개발 키트(ADK)

에이전트 개발 키트(ADK)는 AI 에이전트를 개발하고 배포하기 위한 유연한 모듈식 프레임워크입니다. Gemini 및 Google 생태계에 최적화되어 있지만 ADK는 모델에 구애받지 않고 배포에 독립적이며 다른 프레임워크와의 호환성을 위해 빌드됩니다.

자세한 내용은 ADK 문서를 참고하세요.

GKE 관리형 Kubernetes 서비스

GKE는 컨테이너화된 애플리케이션을 배포, 확장, 관리하기 위한 관리형 Kubernetes 서비스입니다. GKE는 확장 가능한 리소스, 분산 컴퓨팅, 효율적인 네트워킹을 포함하여 LLM의 계산 요구를 처리하는 데 필요한 인프라를 제공합니다.

주요 Kubernetes 개념에 대한 자세한 내용은 Kubernetes 학습 시작을 참고하세요. GKE에 대한 정보 그리고 GKE가 Kubernetes를 확장, 자동화, 관리하는 데 어떻게 도움이 되는지 알아보려면 GKE 개요를 참고하세요.

Vertex AI

Vertex AI는 Google Cloud의 통합 ML 플랫폼으로, 개발자가 AI/ML 모델을 빌드, 배포, 확장할 수 있습니다. GKE의 에이전트 AI 애플리케이션의 경우 Vertex AI는 Gemini 2.0 Flash와 같은 LLM에 대한 액세스, 학습 및 추론을 위한 관리형 인프라, 효율적인 수명 주기 관리를 위한 MLOps 기능을 비롯한 필수 도구와 서비스를 제공합니다.

Vertex AI API를 통해 LLM을 사용할 때 모델 추론은 Google의 관리형 인프라에서 발생하므로 GKE 클러스터에 특정 GPU 또는 TPU 할당량이 필요하지 않습니다.

에이전트 AI 애플리케이션을 위한 Vertex AI에 대한 자세한 내용은 Vertex AI 문서를 참고하세요.

Gemini 2.0 Flash

Gemini 2.0 Flash는 빠른 속도, 기본 제공 도구 사용, 멀티모달 생성, 토큰 컨텍스트 윈도우 100만 개 등 에이전트형 워크로드용으로 설계된 차세대 기능과 향상된 기능을 제공합니다. Gemini 2.0 Flash는 이전 Flash 모델을 개선하여 유사한 속도로 향상된 품질을 제공합니다.

Gemini 2.0 Flash에 관한 기술 정보(예: 성능 벤치마크, 학습 데이터 세트 정보, 지속 가능성 노력, 의도한 사용 및 제한사항, 윤리 및 안전에 대한 Google의 접근 방식)는 Gemini 2.0 Flash 모델 카드를 참고하세요.

목표

이 가이드에서는 다음을 수행하는 방법을 보여줍니다.

Google Cloud 환경을 설정합니다.
에이전트의 컨테이너 이미지를 빌드합니다.
GKE 클러스터에 에이전트를 배포합니다.
배포된 에이전트를 테스트합니다.

비용

이 가이드에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud구성요소를 사용합니다.

각 서비스의 가격을 검토하여 잠재적 비용을 파악합니다.

시작하기 전에

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the required APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the required APIs.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Make sure that you have the following role or roles on the project: roles/container.admin, roles/iam.serviceAccountAdmin, roles/artifactregistry.admin, roles/cloudbuild.builds.editor, roles/resourcemanager.projectIamAdmin
Check for the roles
1. In the Google Cloud console, go to the IAM page.
  Go to IAM
2. Select the project.
3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.
Grant the roles
1. In the Google Cloud console, go to the IAM page.
  IAM으로 이동
2. 프로젝트를 선택합니다.
3. 액세스 권한 부여를 클릭합니다.
4. 새 주 구성원 필드에 사용자 식별자를 입력합니다. 일반적으로 Google 계정의 이메일 주소입니다.
5. 역할 선택 목록에서 역할을 선택합니다.
6. 역할을 추가로 부여하려면 다른 역할 추가를 클릭하고 각 역할을 추가합니다.
7. 저장을 클릭합니다.

에이전트 개발 키트(ADK) 및 Vertex AI를 사용하여 GKE에 에이전트 AI 애플리케이션 배포

배경

Google 에이전트 개발 키트(ADK)

GKE 관리형 Kubernetes 서비스

Vertex AI

Gemini 2.0 Flash

목표

비용

시작하기 전에

Check for the roles

Grant the roles

환경 준비

샘플 프로젝트 클론

Google Cloud 리소스 만들기 및 구성

gcloud

Autopilot

Standard

Terraform

클러스터와 통신하도록 `kubectl`을 구성합니다.

GKE용 워크로드 아이덴티티 제휴 액세스 구성

에이전트 애플리케이션 배포 및 구성

LoadBalancer

port-forward

배포된 에이전트 테스트

LoadBalancer

port-forward

삭제

배포된 리소스 삭제

gcloud

Terraform

다음 단계

에이전트 개발 키트(ADK) 및 Vertex AI를 사용하여 GKE에 에이전트 AI 애플리케이션 배포

배경

Google 에이전트 개발 키트(ADK)

GKE 관리형 Kubernetes 서비스

Vertex AI

Gemini 2.0 Flash

목표

비용

시작하기 전에

Check for the roles

Grant the roles

환경 준비

샘플 프로젝트 클론

Google Cloud 리소스 만들기 및 구성

gcloud

Autopilot

Standard

Terraform

클러스터와 통신하도록 kubectl을 구성합니다.

GKE용 워크로드 아이덴티티 제휴 액세스 구성

에이전트 애플리케이션 배포 및 구성

LoadBalancer

port-forward

배포된 에이전트 테스트

LoadBalancer

port-forward

삭제

배포된 리소스 삭제

gcloud

Terraform

다음 단계

클러스터와 통신하도록 `kubectl`을 구성합니다.