고성능 컴퓨팅(HPC)을 위한 H3 컴퓨팅 최적화 VM 소개

Garv Sawhney
Senior Product Manager, Google Compute Engine
Bill Magro
Chief Technologist, HPC
고성능 컴퓨팅(HPC)은 과학 컴퓨팅, 엔지니어링 시뮬레이션, 기후 모델링, 재무 위험 분석, 신약 개발을 포함한 광범위한 응용 분야에서 개발을 촉진하고 제품을 시장에 더 빠르게 출시하는데 도움이 됩니다. 필요한 컴퓨팅 리소스에 적시에 액세스하여 더 많은 시나리오를 살펴보고 유용한 정보를 얻기까지의 시간을 단축하기 위해 Google Cloud를 채택하는 HPC 사용자가 증가하고 있습니다. Google은 고객 지원을 향상하고 워크로드에 최적화된 인프라 제공을 위한 노력을 강화하기 위해 HPC에 초점을 둔 새로운 H3 가상 머신 시리즈를 출시합니다. H3 시리즈는 특별히 HPC 워크로드에 맞게 설계된 Google 최초의 머신 시리즈입니다.
Intel의 4세대 Xeon 플랫폼(Sapphire Rapids)을 기반으로 하는 H3 VM 인스턴스는 HPC 사용자에게 더 저렴한 비용으로 더 나은 성능을 제공합니다. H3는 이전 세대 C2 인스턴스(Intel Cascade Lake 기반)에 비해 최대 3배 향상된 노드별 성능, 다중 노드 워크로드를 위한 개선된 확장성, 최대 2배 더 나은 가성비를 제공합니다. 이러한 개선을 통해 HPC 사용자는 연구 개발 속도를 높이면서도 비용을 절감할 수 있습니다. 현재 H3는 Compute Engine 및 Google Kubernetes Engine(GKE) 사용자에게 공개 미리보기(Public Preview)로 제공되며, 광범위한 HPC 워크로드를 지원하기 위해 88개의 코어(SMT 비활성)와 352GB 메모리를 제공합니다.
특화된 HPC VM 머신 시리즈
H3는 HPC 고객을 위한 Google 포트폴리오 제품군을 강화하며 Intel 4세대 Xeon 플랫폼의 성능을 HPC 사용 사례에 맞게 확장합니다. H3 머신 시리즈는 C2 및 C2D VM이 포함된 Google의 컴퓨팅 최적화 머신 제품군에 속합니다. H3는 HPC에 최적화된 Google의 인프라 제품을 확장하며 컴퓨팅, 네트워킹, 스토리지 분야의 최신 혁신 기술을 단일 플랫폼에서 제공합니다. 그 결과 고객은 분자 동역학, 전산 지구과학, 기후 예측, 프런트엔드 및 백엔드 EDA, 전산 유체역학과 같은 다양한 HPC 워크로드에서 성능 개선을 경험할 수 있습니다.
H3 VM 머신 시리즈를 위한 네트워킹은 Google의 3세대 VM을 가동하는 Google 커스텀 Intel Infrastructure Processing Unit(IPU)을 기반으로 구축됩니다. Google의 IPU에는 오프로드된 네트워킹 스택 및 프로그래밍 가능한 패킷 처리 엔진이 포함되므로 높은 수준의 네트워킹 성능, 격리(isolation), 보안이 가능합니다. H3 VM은 200Gbps의 지연 시간이 짧은 기본 네트워킹(Google의 이전 세대 VM에 비해 2배 향상)을 제공하므로 긴밀하게 결합된 분산 컴퓨팅 및 네트워크 집약적인 워크로드에 이상적입니다. 또한 H3 머신은 압축 배치(compact placement)를 지원하며 대용량의 고밀도 풀에 배포되어 지연 시간과 네트워크 잡음을 줄이고 HPC 애플리케이션 확장성을 향상시킵니다.
“금융 서비스와 생명과학을 포함한 여러 주요 업종에서는 가장 까다로운 컴퓨팅 문제를 해결하기 위해 점점 더 HPC 기술을 활용하고 있습니다. Intel과 Google Cloud는 이와 같이 증가하는 수요를 충족하기 위해 파트너 관계를 맺고 Intel 컴퓨팅과 IPU의 최신 혁신 기술을 단일 플랫폼으로 결합한 특화된 HPC VM 인스턴스를 생산하고 있습니다. 확장 가능한 4세대 Xeon 프로세서가 제공하는 워크로드 가속 기능을 갖춘 H3는 업계 최고의 가성비를 자랑하는 HPC 워크로드용 플랫폼입니다.” - 리사 스펠만, Intel Xeon 제품 및 솔루션 그룹 부문 법인 부사장 겸 총괄 책임자
가격과 성능
Google은 업계 표준 벤치마크를 기준으로 H3의 성능 개선을 테스트했습니다. 아래 결과는 H3 VM이 이전 세대 VM에 비해 더 빠르고 효율적으로 결과를 생성할 수 있음을 보여줍니다. Google은 기상 예측(WRF), 분자 동역학(LAMMPS, Quantum Espresso), 자동차 충돌 시뮬레이션(Ansys LS-DYNA 및 Altair Radioss), 전산 유체역학(OpenFOAM)을 포함한 잘 알려진 여러 HPC 벤치마크를 기준으로 H3의 전체 서버 노드를 C2와 비교 테스트했습니다.
그 결과 H3 VM은 다양한 HPC 워크로드에서 이전 세대 C2 머신에 비해 최대 3배 더 우수한 성능을 제공하는 것으로 나타났습니다.


H3는 긴밀하게 결합된 다중 노드 워크로드에 최적화되었습니다. WRFv3 기상 예측 테스트에서 H3는 높은 병렬 효율성을 유지하면서도 C2 대비 최대 2배 더 많은 코어 수로 확장 가능한 것으로 확인되었습니다. 예를 들어 WRFv3 2.5km 기상 예측에서는 90%의 효율성으로 4,000개 이상의 코어까지 확장할 수 있었습니다. 이는 동일한 워크로드에서 C2보다 2배 더 많은 수입니다.
Google은 성능 향상 외에도 H3의 비용 효율성을 높여 Compute Engine 포트폴리오에서 HPC 워크로드를 위한 최상의 가성비를 제공합니다. H3 VM은 C2 VM에 비해 최대 2배 개선된 가성비를 제공합니다. 기상 예측(WRFv3) 테스트에서 H3는 C2에 비해 50% 더 낮은 비용으로 최대 3배 더 빠르게 결과를 도출했습니다.


고객과 파트너의 평가


"Altair는 H3의 Radioss 워크로드 시뮬레이션 런타임이 C2에 비해 최대 3배 줄어든 것으로 확인된 초기 테스트 결과에 고무되었습니다. Google Cloud Platform에서 런타임이 크게 단축된 것은 양사의 공동 고객을 위한 엔지니어링 생산성 증대에 도움이 될 것입니다.” - 에릭 르퀴니우, Radioss Development 및 Altair Solver 수석 부사장


“Rescale의 고객은 Google Cloud가 제공하는 최신 고성능 컴퓨팅(HPC) 기술의 혜택을 누릴 수 있는 다양한 종류의 까다로운 애플리케이션을 활용합니다. Google Cloud가 HPC 고객의 고유한 니즈를 충족하는 H3 VM 제품군을 출시한 것은 정말 반가운 소식입니다. 최신 Intel 4세대 프로세서, 고용량 메모리, 짧은 네트워킹 지연 시간이라는 특성이 결합된 새로운 H3 VM은 전산 유체역학, 유한 요소 분석, 분자 동역학과 같은 다양한 핵심 HPC 워크플로에서 C2 머신에 비해 최대 3배 우수한 성능을 제공합니다.” - 물리안토 푸르트, Rescale HPC 엔지니어링 부문 VP


“GCP H3 인스턴스를 사용한 결과 C2에 비해 50% 저렴한 작업 비용으로 CAE 워크로드에서 코어당 최대 25%의 성능이 향상되었습니다. 덕분에 TotalCAE는 고객에게 GCP의 CAE 워크로드에 대해 최대 2.5배 더 높은 가성비와 확장성을 제공할 수 있습니다.” - 로드니 마크, TotalCAE CEO


"여러 노드에서 실행할 때 새로운 H3 머신 시리즈가 2.5배 이상의 성능 향상과 약 50~70%에 달하는 상당한 작업 비용 절감 효과를 제공하는 것을 확인했습니다. H3의 가성비 수준은 수치 기상 예측 업계의 리더들이 필수적으로 고려해야 할 요소가 되었습니다." - 매튜 샥스티드, Parallel Works 사장


"제품의 복잡성이 증가하고 설계 주기가 단축됨에 따라 엔지니어들은 혁신을 강화하고 그 속도를 높이기 위해 고성능 컴퓨팅(HPC)으로 구동되는 클라우드 기반 시뮬레이션을 수행해야 합니다. Google Cloud는 4세대 Intel Xeon 확장 가능 프로세서에 기반한 새로운 H3 인스턴스를 출시하여 HPC 수요에 대응하고 있습니다. H3의 높은 메모리 대역폭과 짧은 네트워크 지연 시간 덕분에 C2 인스턴스에 비해 Ansys LS-DYNA 워크로드의 성능이 2.4배 향상되었습니다.” - 윔 슬랙터, Ansys 파트너 프로그램 책임자


“AirShaper는 고정 비용으로 CFD 시뮬레이션을 제공합니다. 코어가 증가하고 빠를수록 확장 문제 등으로 인해 전체 비용이 상승하기 마련입니다. 하지만 H3를 사용하면 전체 비용을 낮추면서도 시뮬레이션 시간을 절반으로 단축할 수 있습니다." - 우터 레메리, Airshaper CEO


“일반적인 HPC 벤치마크를 사용해서 Google Cloud의 새로운 H3 HPC 인스턴스를 테스트한 결과 기존의 유사한 물리적 HPC 시스템보다 성능이 우수하다는 것을 확인했습니다. 사용 경험이 원활하고 간편했으며, HPC 고객이 H3를 도입하도록 돕게 되어 기쁩니다." - 칼레드 엘 암라위, Brightskies CEO
지금 H3 VM 시작하기
H3 VM은 현재 US-central1(아이오와) 및 Europe-west4(네덜란드) 리전에서 사용할 수 있습니다. H3 인스턴스 사용을 시작하려면 해당 리전에 대해 Google Cloud 콘솔에서 새로운 VM 또는 GKE 노드 풀을 생성할 때 컴퓨팅 최적화 머신 제품군에서 H3를 선택하세요. H3 VM 머신 시리즈에 대해 자세히 알아보고 Google Cloud 영업 담당자에게 추가 정보를 문의하세요.문의하기 | Google Cloud