콘텐츠로 이동하기
Hybrid & Multicloud

Google Distributed Cloud의 새로운 혁신

2026년 4월 28일
https://storage.googleapis.com/gweb-cloudblog-publish/images/GCN26_102_BlogHeader_2436x1200_Opt_9_Light.max-2500x2500.jpg
Muninder Sambi

VP, Google Distributed Cloud

Try Gemini Enterprise Business Edition today

The front door to AI in the workplace

Try now

* 본 아티클의 원문은 2026년 4월 23일 Google Cloud 블로그(영문)에 게재되었습니다.


오늘 Google Cloud Next에서 우리는 Google Distributed Cloud (GDC)의 새로운 기능들을 발표합니다. 이를 통해 여러분의 데이터가 있는 곳 어디에서나 Gemini와 고급 AI 스택을 활용할 수 있게 되어, AI 혁신과 데이터 주권(sovereignty) 사이에서 더 이상 타협할 필요가 없습니다. 이는 소버린 네오클라우드(sovereign neocloud) 아키텍처의 촉매제 역할을 할 것입니다.

GDC는 고객의 데이터 센터나 에지(edge) 등 필요한 곳 어디로든 Google Cloud를 확장해 줍니다. GDC는 고객의 특정한 보안 및 하드웨어 요구 사항을 충족하기 위해 두 가지 모델로 제공됩니다: GDC 에어갭(air-gapped) 최고 수준의 보안과 컴플라이언스를 위해 설계된 Google 공급 전용 하드웨어에서 실행되는 완전 격리형 배포 모델입니다; GDC 커넥티드(connected)는 고객의 자체 하드웨어에서 Google이 관리하는 통합 소프트웨어 라이프사이클의 이점을 누릴 수 있는 모델입니다.

전통적으로 엄격한 데이터 규제와 주권 요구 사항이 있는 기업 및 정부 기관은 최신 AI 기능을 활용하는 데 제약이 있었습니다. 이들의 유일한 선택지는 자체 시스템을 구축하는 것이었으나, 이는 느리고 복잡하며 막대한 비용이 들었습니다. GDC는 이러한 어려움을 해결해 줍니다. 이제 번거로운 과정 없이 온프레미스 환경에서 세계 최고 수준의 AI 혁신을 경험할 수 있습니다.

GDC는 완벽한 온프레미스 AI 솔루션을 제공합니다. AI 워크로드에 최적화된 관리형 인프라, 유연성을 위한 Gemini 또는 오픈 모델 선택권, 그리고 비용 효율적인 인퍼런스(Inference) 서비스가 포함됩니다. 이러한 토대를 바탕으로 데이터에 대한 완전한 통제권을 유지하면서 보안이 강화된 AI 에이전트와 애플리케이션을 구축하고 실행할 수 있습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/1_Google_Distributed_Cloud.max-900x900.png

GDC의 새로운 혁신 기술들이 여러분의 소버린 AI 워크로드를 어떻게 지원하는지 자세히 살펴보겠습니다.

관리형 AI 인프라

온프레미스에서 소버린 AI 요구 사항을 충족하려면 컴퓨팅, 스토리지, 네트워킹 전반에서 막대한 성능 요구치를 감당할 수 있는 관리형 인프라가 필요합니다. 온프레미스 AI 워크로드는 동적이며 예측하기 어렵기 때문에, 다양한 요구 사항 전반에서 최고의 성능을 제공하는 새로운 인프라 혁신을 도입합니다.

  • NVIDIA Blackwell GPU: NVIDIA Blackwell (NVIDIA HGX B200) 및 NVIDIA Blackwell Ultra platforms (NVIDIA HGX B300) GPU를 통해 AI 성능을 가속화합니다. 5세대 NVIDIA NVLink를 활용하여 데이터 센터급 대역폭을 여러분의 환경에 직접 제공합니다.

  • Google Cloud 머신 패밀리: GDC는 이미 범용 워크로드를 위한 N2N3 머신 패밀리를 지원하고 있으며, 이제 까다로운 인퍼런스(Inference) 작업을 처리하기 위해 최대 컴퓨팅 성능이 2.25배 향상된 새로운 A4 머신 패밀리를 지원합니다. 또한 메모리 대 vCPU 비율이 높아야 하는 ERP 및 데이터 분석과 같은 워크로드를 위해 메모리 최적화형인 M2M3 머신 패밀리를 GDC에 도입합니다.

  • 강화된 스토리지 규모 및 성능: GDC는 이제 존(zone)당 6PB의 오브젝트 스토리지를 지원하며(기존 1PB 대비), 이는 이전보다 6배 늘어난 용량입니다. 또한 존당 30 IOPS/GB(기존 3 IOPS/GB 대비)를 제공하여 성능을 10배 향상시켰으며 스토리지 병목 현상을 최소화했습니다.

데이터 센터 내 Foundational Model

GDC를 사용하면 Google의 플래그십 모델인 Gemini의 성능을 여러분의 환경에 직접 가져올 수 있습니다. 최신 세대 NVIDIA Blackwell GPU를 기반으로 자체 경계 내에서 네이티브 배포를 지원함으로써, 세계 수준의 생성형 AI와 엄격한 데이터 주권 사이의 간극을 메워줍니다.

오늘 저희는 최신 Gemini Flash 모델이 GDC connected 고객을 위해 NVIDIA Blackwell 및 Blackwell Ultra 플랫폼에서 프리뷰로 제공된다는 기쁜 소식을 전해드립니다. 이로써 기존에 지원되던 GDC air-gapped 고객에 이어, 더 많은 고객이 최신 AI 성능을 직접 경험하실 수 있게 되었습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/2_Google_Distributed_Cloud.max-1900x1900.png

“Samsung SDS는 Google Distributed Cloud에 Gemini를 도입하여 글로벌 제조 현장을 획기적으로 개선했습니다. 최첨단 AI를 로컬에서 직접 구동함으로써 클라우드 지연 시간 없이 IoT 데이터를 분석하고, 실시간 예방 정비와 품질 관리를 수행할 수 있게 되었습니다. 이를 통해 핵심 지식재산권(IP)에 대한 엄격한 데이터 주권을 유지하면서도 클라우드와 같은 민첩성을 확보했습니다.” – 삼성SDS 대표이사 이준희

AI 인퍼런스 서비스: Google Distributed Cloud AI gateway 발표

성능을 최적화하고 인프라의 복잡성을 추상화하기 위해, 소버린 환경을 위한 AI gateway를 소개합니다. 이 지능형 미들웨어는 모델을 위한 컨트롤 플레인 역할을 하며 다음과 같은 기능을 제공합니다.

  • 동적 요청 라우팅(Dynamic request routing): 하드 코딩된 로직이 아닌 비용, 지연 시간, 정확도를 바탕으로 인퍼런스 요청을 적절한 AI 모델로 자동 라우팅합니다.

  • 지능형 로드 밸런싱(Intelligent load balancing): GPU 사용률을 기반으로 최적의 장치를 선택하여 인퍼런스 효율성을 극대화하도록 요청을 배분합니다.

  • 할당량 관리(Quota management): 요청의 우선순위를 정해 핵심 애플리케이션이 필요한 처리량을 확보하고, 할당량 관리 목표를 달성할 수 있도록 보장합니다.

  • 관측성(Observability): 모든 인퍼런스 호출에 대해 트레이싱 및 로깅 기능을 내장하여, 규제가 엄격한 환경에서도 감사 가능성(auditability)을 확보할 수 있도록 돕습니다.

https://storage.googleapis.com/gweb-cloudblog-publish/images/3_Google_Distributed_Cloud.max-1300x1300.png

에이전틱 AI 애플리케이션 및 에이전트

조직이 edge 환경에서 AI를 진정으로 실무에 적용하려면 단순히 파운다셔널 모델을 갖추는 것 이상의 대안이 필요합니다. 스스로 행동할 수 있는 에이전틱 AI 아키텍처를 기반으로 구축된, 자율적이고 안전한 에이전트가 필요합니다. 저희는 오늘 Google Distributed Cloud를 위한 새로운 소버린 에이전틱 AI 아키텍처(sovereign agentic AI architecture)를 발표하게 되어 매우 기쁩니다. Kubernetes 상에서 서드파티 제공업체들과 함께 구축된 이 아키텍처는 여러분의 에이전틱 워크플로가 보안이 철저한 고객 조직 경계(Customer Organization boundary) 내에서 완전히 실행되도록 보장합니다

https://storage.googleapis.com/gweb-cloudblog-publish/images/4_Google_Distributed_Cloud.max-1100x1100.png

이 에이전틱 아키텍처를 활용하면 개발, 코딩 또는 데이터 분석과 같은 에이전틱 태스크(agentic tasks)를 수행하는 강력한 AI 에이전트를 보안 경계 내에서 안전하게 구축하고 배포할 수 있습니다.

Google Distributed Cloud로 어디서나 구현하는 AI

우리는 GDC가 온프레미스, 커넥티드(connected), 에어갭(air-gapped) 환경 전반에서 Google 모델과 타사 모델을 제공할 수 있는 최고의 플랫폼이라고 믿습니다. 이를 통해 모든 고객은 데이터 주권을 타협하지 않고도 AI와 에이전틱 솔루션을 활용할 수 있습니다. 제품에 대해 더 자세히 알아보시려면 웹사이트를 방문해 주세요. 오늘 소개해 드린 혁신 기술들은 소버린 AI 시대에 꼭 필요한 유연성과 보안을 제공합니다. 실제 작동 모습을 확인하시려면 Next ’26의 GDC 브레이크아웃 세션이나 쇼케이스에 참여해 보시기 바랍니다.

게시 위치