콘텐츠로 이동하기
컨테이너 및 Kubernetes

Agent Sandbox 소개: Kubernetes 및 GKE 기반 에이전트 AI를 위한 강력한 보호장치

2025년 11월 11일
Brandon Royal

Senior Product Manager

Try Gemini 3

Our most intelligent model is now available on Vertex AI and Gemini Enterprise

Try now

* 본 아티클의 원문은 2025년 11월 12일 Google Cloud 블로그(영문)에 게재되었습니다.

Google과 클라우드 네이티브 커뮤니티는 최신 애플리케이션을 지원하기 위해 지속적으로 Kubernetes를 강화해 왔습니다. 올해 초 KubeCon EU 2025에서 Google Cloud는 AI 추론을 더 잘 지원하기 위한 일련의 Kubernetes 개선 사항을 발표한 바 있습니다. 그리고 오늘 KubeCon NA 2025에서는 Agent Sandbox를 새롭게 선보이며 Kubernetes를 AI 에이전트를 위한 가장 개방적이고 확장 가능한 플랫폼으로 만드는 데 집중하고자 합니다.

AI 에이전트가 제시하는 과제를 생각해 보세요. AI 에이전트는 애플리케이션이 단순한 쿼리에 답하는 것을 수준을 넘어 사용자의 목표를 달성하기 위해 복잡한 다단계 작업을 수행하도록 돕습니다. 예를 들어 '지난 분기 매출 데이터를 시각화해 줘'와 같은 요청을 받으면 에이전트는 데이터를 쿼리하고 해당 데이터를 그래프로 처리한 다음 사용자에게 반환해야 합니다.  기존 소프트웨어는 예측 가능한 반면, AI 에이전트는 코드 생성, 컴퓨터 터미널 사용, 심지어 브라우저 활용까지 포함하여 사용자의 목표를 달성하기 위해 언제 어떻게 도구를 사용할지 자체적으로 결정을 내릴 수 있습니다.

강력한 보안 및 운영 가드레일 없이는 이처럼 강력하고 예측 불가능한(Non-deterministic) 강력한 에이전트를 조정하는 데 심각한 리스크를 초래할 수 있습니다. 코드와 명령어를 실행하는 에이전트에 커널 수준 격리(Kernel-level isolation)를 제공하는 것은 필수입니다. AI 및 에이전트 기반 워크로드는 기존 애플리케이션과 다른 추가적인 인프라 요구사항을 가집니다. 가장 눈에 띄는 점은 수천 개의 샌드박스를 임시 환경으로 조정해야 한다는 것입니다. 필요에 따라 빠르게 생성하고 삭제해야 하며 동시에 네트워크 액세스를 제한되어야 한다는 것입니다.

성숙도, 보안성, 확장성을 고려할 때 Kubernetes는 AI 에이전트를 실행하기에 가장 적합한 기반입니다. 하지만 에이전트 코드 실행 및 컴퓨터 사용 시나리오를 완벽히 충족하기 위해서는 진화가 필요합니다. Agent Sandbox는 이 방향으로 나아가는 강력한 첫걸음입니다.

대규모 환경에서의 강력한 격리

에이전트 기반 코드 실행 및 컴퓨터 사용을 위해서는 각 작업마다 격리된 샌드박스를 프로비저닝해야 합니다. 또한 사용자는 수천 개의 샌드박스가 병렬로 스케줄링되더라도 인프라가 그 속도를 따라잡기를 기대합니다.

Agent Sandbox는 Kubernetes 커뮤니티와 함께 빌드한 새로운 Kubernetes 기본 요소(primitive)로, 에이전트 코드 실행 및 컴퓨터 사용을 위해 특별히 설계되어 차세대 에이전트 AI 워크로드에 필요한 성능과 규모를 제공합니다. Agent Sandbox는 런타임 격리를 위해 Kata 컨테이너를 추가로 지원하는 gVisor를 기반으로 빌드되었으며, 데이터 손실, 유출 또는 프로덕션 시스템 손상으로 이어질 수 있는 취약점의 위험을 줄이는 안전한 경계를 제공합니다. Google Cloud는 Agent Sandbox를 Kubernetes 커뮤니티 내의 CNCF(Cloud Native Computing Foundation) 프로젝트로 빌드하며 오픈소스에 대한 약속을 이어가고 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_K1VZDUQ.max-1400x1400.jpg

GKE를 통한 성능 향상

에이전트를 확장할 때 최저 비용으로 최고의 사용자 경험을 제공하려면 성능을 최적화해야 합니다. GKE(Google Kubernetes Engine)에서 Agent Sandbox를 사용하면 GKE Sandbox의 관리형 gVisor와 컨테이너 최적화 컴퓨팅 플랫폼을 활용하여 샌드박스를 더 빠르게 수평 확장할 수 있습니다. 또한 관리자가 미리 준비된 샌드박스 풀(Pre-warmed pools)을 구성할 수 있게 하여 지연 시간이 짧은(Low-latency) 샌드박스 실행을 지원합니다. 이 기능을 통해 Agent Sandbox는 완전히 격리된 에이전트 워크로드에 대해 서브 세컨드 수준의 지연 시간을 제공하며 콜드 스타트 대비 최대 90%의 성능 향상을 이끌어냅니다.

샌드박스를 안전하게 만드는 격리 속성은 역설적으로 컴퓨팅 리소스의 활용도 저하를 야기하기 쉽습니다. 각 샌드박스 환경을 스크립트로 매번 초기화하는 것은 불안정하고 느릴 수 있으며, 유휴 상태의 샌드박스는 종종 귀중한 컴퓨팅 사이클을 낭비하곤 합니다. 이상적인 환경이라면 실행 중인 샌드박스 환경의 스냅샷을 찍어 특정 상태에서 바로 시작할 수 있어야 합니다.

Pod Snapshots은 실행 중인 포드(Pod)의 전체 체크포인트 및 복원을 지원하는 새로운 GKE 전용 기능입니다. Pod snapshots은 에이전트 및 AI 워크로드의 시작 지연 시간을 획기적으로 줄여줍니다. Pod snapshots을 Agent Sandbox와 결합하면 팀은 스냅샷에서 샌드박스 환경을 프로비저닝하여 몇 초 만에 시작할 수 있습니다. GKE Pod Snapshots은 CPU 기반 워크로드와 GPU 기반 워크로드의 스냅샷과 복원을 모두 지원하여 포드 시작 시간을 몇 분에서 몇 초로 단축합니다. 이를 통해 유휴 샌드박스를 스냅샷으로 저장하고 일시 중단할 수 있어 최종 사용자에게 중단 없이 컴퓨팅 사이크를 크게 절약할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_NJWlanH.max-1800x1800.jpg

AI 엔지니어를 위한 빌드

오늘날의 에이전트 AI나 강화 학습(RL) 시스템을 빌드하는 팀이 인프라 전문가일 필요는 없습니다. Google Cloud는 AI 엔지니어를 염두에 두고 Agent Sandbox를 빌드했으며 이들이 기본 인프라에 대한 걱정 없이 샌드박스의 수명 주기를 관리할 수 있도록 API와 Python SDK를 설계했습니다.

로드 중...

이러한 관심사의 분리(Separation of concern)는 AI 개발자에게 친화적인 경험을 제공하는 동시에 Kubernetes 관리자와 운영자가 기대하는 운영 제어 및 확장성을 보장합니다.

지금 시작하기

에이전트 AI는 소프트웨어 개발팀과 인프라팀에 중대한 변화를 가져다줍니다. Agent Sandbox와 GKE는 에이전트가 필요로 하는 격리와 성능을 제공할 수 있습니다. Agent Sandbox는 오픈소스로 제공되며 지금 바로 GKE에 배포할 수 있습니다. GKE Pod Snapshots은 제한된 프리뷰로 제공되며 올해 말 모든 GKE 고객에게 제공될 예정입니다. 시작하려면 Agent Sandbox 문서빠른 시작 가이드를 확인하세요. 여러분이 빌드할 멋진 결과물을 기대하겠습니다.

게시 위치