Google Cloud는 비즈니스와 정부에서 차세대 클라우드 인프라를 빠르고 안전하게 경제적으로 빌드할 수 있도록 지원합니다.
소규모 모델과 대규모 LLM 모두에 필요한 성능과 경제성을 위해 특별히 설계된 TPU, GPU, CPU를 포함한 인프라를 사용하여 AI 워크로드를 빌드, 실행, 배포할 수 있습니다.
리더
Google, 2023년 Gartner® Magic Quadrant™의 컨테이너 관리 부문에서 리더로 선정
Google은 Kubernetes를 개발했으며 Google은 고객이 업계를 선도하는 기능(예: 클러스터당 노드 15,000개)이 탑재된 GKE를 통해 깊이 있는 전문지식을 활용하여 뛰어난 확장성을 얻을 수 있도록 지원하고 있습니다.
Google Cloud는 인프라 성능을 향상시키기 위해 혁신적인 방법에 지속적으로 투자하고 있습니다. Google은 워크로드에 최적화된 하드웨어/소프트웨어 오프로드 아키텍처인 Titanium과 같은 기본 제공 아키텍처 개선사항을 계속 발전시키고 있습니다. Google은 고객이 종량제 모델, 동적 워크로드 예약, 약정 사용 할인, 에너지 효율이 높은 인프라 등을 통해 비용을 최소화할 수 있도록 지원하고 있습니다. 또한 Google은 고객이 Cloud Assist와 같은 AI 어시스턴트를 사용하여 배포를 최대한 활용할 수 있도록 지원하고 있습니다.
변화하는 주권 요구사항을 충족하기 위해 지원이 필요한 규제가 엄격한 산업의 조직의 경우 Google Cloud 주권 솔루션과 Google Distributed Cloud를 통해 인프라와 데이터에 대한 제어를 유지하면서 엄격한 데이터 주권, 보안, 개인 정보 보호 규칙을 준수할 수 있습니다.
출처: Google Cloud 내부 데이터, 2023년 7월
이 eBook은 기술 부문 리더가 강력하고 확장 가능하며 비용 효율적인 생성형 AI 시스템을 설계하는 데 도움이 되는 가이드를 제공합니다. 이 가이드에서 다루는 내용은 다음과 같습니다.
+ AI 플랫폼을 평가하기 위한 실행 가능한 전략
+ 비용 효율적인 AI 기술로 리소스를 최적화하기 위한 권장사항
+ 비용, 확장성, 보안, 성능 측정기준에 대한 검토
+ Vertex AI 및 Google Kubernetes Engine(GKE)과 같은 최첨단 기술을 사용한 개발 및 배포 경로
권장사항을 알아보고 Google Cloud가 다른 클라우드 제공업체와 어떻게 비교되는지 확인해 보세요.