모든 기업에 혁신을 불러올 Gemini를 소개합니다
Thomas Kurian
CEO, Google Cloud
2023년 한 해 동안 Google Cloud는 고객과 광범위한 개발자 및 유저 커뮤니티에 놀랍고 새로운 AI 혁신을 선보여 왔습니다. 생성형 AI 모델의 학습과 운영을 위한 AI 하이퍼컴퓨터(AI Hypercomputer), 엔터프라이즈용 AI 플랫폼인 Vertex의 생성형 AI 기능, Google Workspace의 Duet AI(Duet AI in Google Workspace)와 Google Cloud의 Duet AI 등이 여기에 해당됩니다. 또한 GPU, TPU, 머신러닝(ML) 소프트웨어 및 컴파일러, 워크로드 관리 등에서 괄목할 만한 발전을 이루며 AI에 최적화된 인프라에 여러 가지 새로운 기능을 추가했고, Vertex AI의 다양한 혁신과 더불어, Google Workspace 및 Google Cloud Platform에서 Duet AI 에이전트를 포함한 완전히 새로운 기능들을 출시했습니다.
또한, 굉장한 유저 성장을 기록하기도 했습니다. 올해 2분기와 3분기 사이에 Vertex AI에서 운영되는 생성형 AI 프로젝트의 수는 7배 이상 증가했습니다. Forbes(포브스), Formula E(포뮬러 E), Spotify(스포티파이)와 같은 선도적인 브랜드가 Vertex AI를 활용해 자체 생성형 AI 애플리케이션을 구축하고 있으며, Anthropic(앤트로픽), AI21 Labs(AI21 랩스), Cohere(코히어)는 Vertex AI에서 모델을 학습하고 있습니다. Google Cloud 고객들이 개발하는 애플리케이션은 놀랍도록 창의적이며 그 종류도 다양합니다. Fox Sports(폭스 스포츠)는 더욱 매력적인 콘텐츠를 제작하고 있습니다. Priceline(프라이스라인)은 디지털 여행 컨시어지를 구축하고 있습니다. Six Flags(식스 플래그)는 디지털 컨시어지를, Estée Lauder(에스티 로더)는 디지털 브랜드 매니저를 구축하고 있습니다.
오늘 Google Cloud는 Google의 가장 강력하고 범용적인 모델인 Gemini(제미나이)를 활용할 수 있도록, AI 스택 전반에 걸쳐 여러 가지 새로운 기능을 소개합니다. 개발 초기부터 멀티모달로 구축된 Gemini는 텍스트, 코드, 오디오, 이미지, 영상을 포함한 다양한 유형의 정보를 일반화하고 원활하게 이해하며, 함께 활용하고 결합할 수 있습니다. 이는 인간이 다양한 유형의 정보를 동시에 보고, 듣고, 읽고, 말하는 것과 같은 방식입니다.
Google Cloud의 통합형 AI 스택
오늘부터 Gemini는 최적화된 AI 기술 스택의 일부로 포함되어, 다른 여러 요소들과 함께 작동하도록 설계됐습니다:
- 확장성이 뛰어난 AI 인프라: Google Cloud는 기업이 모델을 학습하고 운영(serve)할 수 있도록, Google에서 사용하는 것과 동일한 선도적인 AI 맞춤형 인프라를 제공합니다. 해당 인프라는 Google Cloud 리전에서 서비스 형태로 제공되며, 구글 분산형 클라우드(Google Distributed Cloud)를 통해 기업의 데이터센터와 에지(edge)에서도 실행할 수 있습니다. Google Cloud의 AI 인프라 스택은 전체가 공동 설계된 시스템으로 구축돼 AI 학습, 튜닝, 운영 전반의 효율성과 생산성을 높여줍니다.
- 세계적 수준의 모델: Google Cloud는 다양한 기술을 갖춘 폭넓은 AI 모델을 지속적으로 제공하고 있습니다. 2022년 말에 PaLM(Pathways Language Model)을 출시했고, 곧이어 PaLM 2를 공개했으며, 이제 Gemini Pro를 제공합니다. Med-PaLM, Sec-PaLM과 같은 특정 도메인을 위한 모델도 선보였습니다.
- Vertex AI - 개발자를 위한 선도적인 엔터프라이즈용 AI 플랫폼: 개발자가 생성형 AI 모델을 구축하고 애플리케이션에 통합할 수 있도록, Google Cloud는 AI 개발 플랫폼인 Vertex AI를 빠르게 고도화하고 있습니다. Vertex AI는 고객이 Gemini의 API를 사용해 구축한 애플리케이션을 활용, 커스터마이즈(customize), 증강(augment), 배포, 관리할 수 있는 기능을 제공합니다. 또한 Google의 엄격한 엔터프라이즈 안전 및 품질 표준을 충족하는 130개 이상의 엄선된 오픈 소스 및 타사 AI 모델 리스트를 제공합니다. Vertex AI에는 Google Cloud가 제공하는 데이터 거버넌스 및 데이터 프라이버시(data privacy) 제어 기능이 내장돼 있으며, 개발자가 모델을 책임감 있고 안전하게 사용할 수 있도록 지원하는 도구 모음을 같이 제공합니다. 또한 Vertex AI Search와 Vertex AI Conversation을 활용해, 로우 코드(low code) 방식으로 여러 분야에서 활용 가능한 정교한 검색 및 대화형 애플리케이션을 구축할 수 있습니다.
- Duet AI - Workspace 및 Google Cloud의 보조 AI 에이전트: Duet AI는 Google Cloud의 AI 기반 공동 작업자로, 이용자의 Google Workspace 및 Google Cloud 활용을 도와줍니다. 예를 들어 Google Workspace의 Duet AI는 글쓰기, 이미지 생성, 스프레드시트 분석, 이메일 초안 작성 및 요약, 채팅 메시지 작성, 회의 요약 등의 작업을 지원합니다. Google Cloud의 Duet AI는 이용자가 애플리케이션을 코딩, 배포, 확장, 모니터링하는 과정에 도움을 주며 사이버 보안 위협을 식별하고 빠르게 대처할 수 있도록 해줍니다.
오늘 각 분야별 새로운 소식을 여러분께 기쁜 마음으로 소개합니다:
세계 최고 수준의 인프라 강화
생성형 AI 모델의 규모와 복잡성이 증가함에 따라 학습, 튜닝, 추론을 위한 요구 사항도 함께 늘어났습니다. 그 결과, 모델 학습과 운영에 필요한 성능, 확장성, 비용 효율성이 뛰어난 AI 인프라에 대한 수요 역시 기하급수적으로 증가하고 있습니다.
이는 고객뿐만 아니라 Google에게도 마찬가지입니다. TPU는 오랫동안 YouTube, Gmail, Google Maps, Google Play, Android와 같은 Google의 AI 기반 제품을 학습하고 서비스하기 위한 기반이 되어 왔습니다. Gemini 역시 실제로 TPU를 사용해 학습됐고, 지금도 TPU를 기반으로 운영되고 있습니다.
지난 주 Google Cloud는 지금까지 출시된 제품 중 가장 강력하고 확장성이 뛰어나며 유연한 AI 가속기인 Cloud TPU v5p를 발표했습니다. TPU v5p는 포드(pod) 당 전체 가용 플롭스(FLOPs) 측면에서 TPU v4 보다 4배 더 뛰어난 확장성을 가지고 있습니다. Google Cloud는 올해 초, 클라우드 TPU(Cloud TPU) v5e의 정식 출시를 발표했습니다. 이전 세대인 TPU v4에 비해 업계 벤치마크 기준 달러 당 추론 성능이 2.7배 향상되었으며, 현존하는 가장 비용 효율적인 TPU입니다.
Google Cloud는 획기적인 슈퍼컴퓨터 아키텍처인 AI 하이퍼컴퓨터도 발표했습니다. AI 하이퍼컴퓨터는 성능 최적화된 하드웨어와 오픈 소프트웨어, 선도적인 머신러닝 프레임워크, 유연한 소비 모델로 구성된 통합 시스템을 사용합니다. AI 하이퍼컴퓨터는 여러 등급의 5세대 TPU와 엔비디아(NVIDIA) GPU를 포함한 다양한 가속기 옵션을 제공합니다.
최신 혁신 모델 제공
Gemini는 데이터 센터부터 모바일 기기에 이르기까지, 모든 곳에서 효율적으로 실행될 수 있는 가장 유연한 모델이기도 합니다. Gemini Ultra는 매우 복잡한 작업을 위한 가장 크고 성능이 뛰어난 모델이며, Gemini Pro는 광범위한 작업에 걸쳐 확장이 가능한 최고의 모델이고, Gemini Nano는 온디바이스(on-device) 작업에 가장 효율적인 모델입니다. Gemini의 최첨단 기술력은 개발자와 기업 고객이 AI를 구축하고 확장하는 방식을 크게 향상시킬 것입니다.
또한 오늘 Google 이미지 생성 모델의 업그레이드 버전인 Imagen 2를 공개하며, 가장 진보된 텍스트-이미지 전환(text-to-image) 기술을 선보입니다. 이매진 2는 향상된 이미지 사실감(photorealism), 텍스트 렌더링, 로고 생성 기능을 제공해, 텍스트가 포함된 이미지나 로고를 손쉽게 생성할 수 있습니다.
이외에도 Google Cloud는 의료 분야 모델 및 API 제품군인 Med-PaLM을 중심으로 도메인 특화 모델 개발을 위한 노력을 지속해 왔습니다. 이를 기반으로 의학 분야 전문 모델 제품군인 MedLM의 정식 출시를 발표하게 돼 기쁘게 생각합니다. MedLM은 선정된 고객들에게 Vertex AI에서 제공되며, 의료 전문 지식 데이터셋에서 튜닝된 Google의 파운데이션 모델(foundation model)을 바탕으로 강력한 기능을 고객에게 제공합니다.
Gemini를 통한 Vertex AI 플랫폼 대폭 강화
오늘부터 Vertex AI에서 Gemini Pro를 프리뷰 버전으로 이용하실 수 있습니다. Gemini Pro를 활용해 개발자는 텍스트, 언어, 코드, 이미지, 영상 전반에 걸쳐 정보를 처리할 수 있는 새롭고 차별화된 생성형 AI 애플리케이션을 구축할 수 있습니다. Vertex AI는 생성형 AI 애플리케이션을 프로덕션 환경에 배포, 관리하고, 응답의 품질과 신뢰성을 자동으로 평가, 모니터링할 수 있는 기능을 제공합니다.
Vertex AI는 Gemini API를 기반으로 구축된 애플리케이션을 활용, 커스터마이즈, 증강, 관리, 배포하기 위한 기능을 제공하여 Gemini를 전방위적으로 활용할 수 있습니다.
- 프롬프트 엔지니어링, LoRA(Low-Rank Adaptation)와 같은 어댑터 튜닝, RLHF(인간 피드백 강화 학습, Reinforcement Learning from Human Feedback), 증류(Distillation) 등 자체 데이터를 사용해 Gemini 모델을 커스터마이즈할 수 있는 다양한 방법을 제공합니다.
- Gemini 모델이 임베딩을 활용해 현실 세계의 정보를 검색하고 이해하여 RAG(검색 증강 생성, Retrieval Augmented Generation)의 빌딩 블록으로 활용될 수 있도록 다양한 증강 도구를 제공합니다. Vertex AI Extension을 통해 Gemini 및 기타 생성형 AI 모델을 서드 파티 애플리케이션과 연동하여 작업을 수행할 수도 있습니다.
- 고품질 웹 및 엔터프라이즈 데이터 소스를 활용해 Gemini 및 기타 AI 모델의 응답 품질을 향상시킬 수 있는 그라운딩(grounding) 기능을 제공합니다.
- Gemini를 포함한 생성형 AI 모델을 안전하고 책임감 있게 사용할 수 있도록 폭넓은 제어 기능을 제공합니다.
Vertex AI의 Gemini 지원 외에도 다음의 소식을 전합니다.
- 모델 성능 비교를 위한 자동화 도구인 오토매틱 사이드 바이 사이드(Automatic Side by Side, AutoSxS)를 소개합니다. 오토매틱 사이드 바이 사이드는 수동 모델 평가 방식보다 빠르고 비용 효율적이며, 다양한 태스크를 위한 커스터마이즈를 지원하여 여러 생성형 AI 활용 사례에 대응할 수 있습니다.
- Vertex AI의 Model Garden(모델 가든)에 Mistral(미스트랄), ImageBind(이미지바인드)와 DITO(디토)를 추가하여 다양한 오픈 소스 모델 지원을 제공하기 위한 Google Cloud의 노력은 지속되고 있습니다.
- 12월 말, Vertex AI Search 및 Vertex AI Conversation에서도 Gemini가 제공될 예정으로, 이를 활용해 프로덕션 레벨의 애플리케이션을 빠르게 구축하실 수 있습니다.
Duet AI의 기능 확장
Google Cloud는 고객이 Duet AI를 통해 생산성을 향상하고, 경쟁우위를 확보하며, 궁극적으로 비즈니스를 개선할 수 있도록 노력하고 있습니다. 오늘 개발자를 위한 Duet AI(Duet AI for Developers)와 시큐리티 운영의 Duet AI(Duet AI in Security Operations)가 정식 출시되었으며, 향후 몇 주에 걸쳐 Duet AI 포트폴리오 전반에 Gemini를 통합할 예정입니다.
개발자를 위한 Duet AI는 유저가 다양한 통합 개발 환경(IDE)에서 AI 기반의 코드 자동 완성, 코드 생성 및 코드 채팅을 통해 빠르게 코딩할 수 있도록 도와줍니다. 유닛 테스트 코드 생성, 코드 설명, 트러블 슈팅(troubleshooting) 및 이슈 해결과 같은 반복적인 개발자들의 작업 과정을 수월하게 해주며, 결과적으로 개발자들의 컨텍스트 스위칭(context-switching) 횟수를 줄여줍니다. 또한 Duet AI는 자연어로 코드 관련 질문을 할 수 있는 채팅 기능을 제공하여 개발자들의 역량 향상에도 도움을 줍니다.
Google Cloud는 25개 이상의 코드 보조 및 지식 기반 파트너가 플랫폼별 데이터셋을 제공할 예정임을 발표합니다. 이를 통해 개발자를 위한 Duet AI 유저는 파트너의 코딩 모델과 데이터 모델, 제품 설명서, 모범 사례 및 기타 유용한 엔터프라이즈 리소스를 기반으로 만들어진 AI의 코드 보조 기능을 활용할 수 있습니다.
Google Cloud의 통합 보안 운영 플랫폼을 위한 시큐리티 운영의 Duet AI는 보안 담당자가 사이버 공격으로부터 조직을 더욱 효과적으로 보호할 수 있도록 지원합니다. 생성형 AI의 기술을 활용해 보안 팀은 역량을 증진하고 위협 탐지, 조사, 대응을 가속화할 수 있습니다. Google Cloud는 시큐리티 운영 Duet AI를 통해 업계 최초로 크로니클(Chronicle)을 위한 AI 보조 기능을 제공하여, 유저들은 자연어 기반의 커스텀 쿼리로 대량의 데이터를 수초만에 검색하거나 수동 리뷰 과정을 단축하고, 경보 요약을 통해 보안 위협의 핵심 사항을 빠르게 식별할 수 있습니다. 나아가 보안 조치를 위한 단계별 추천 사항을 기반으로 응답 시간을 단축시킬 수 있습니다.
Google은 인프라 및 기반 모델부터 최상위 수준의 통합 및 이용자 경험에 이르기까지, 모든 Duet AI 기술 스택을 보유하고 있습니다. Google Cloud는 엔지니어와 연구원이 고유한 방식으로 협업하며, 고객에게 일관된 통합 제품 경험을 바탕으로 최신 AI 기술 혁신을 제공하고 있음에 자부심을 느낍니다. 내년 초에는 BigQuery, Looker, Google Cloud의 데이터베이스 제품군, Apigee 등 포트폴리오 전반에 걸쳐 Duet AI를 더욱 확장할 계획입니다.
차세대 AI 솔루션 도입 추진
Google Cloud의 통합형 AI 기술 스택 전반에서 제공되는 새로운 기능과 더불어, Google Cloud는 더 많은 기업이 Gemini를 활용할 수 있도록 경쟁력 있는 가격을 책정하고 있으며, 저작권 문제로부터 고객 보호를 돕기 위해 면책 조항을 확대하고 있습니다.
Gemini는 확장성이 뛰어난 AI 인프라, Vertex AI 및 Duet AI 포트폴리오와 결합해 개발자와 고객을 위한 포괄적이고 강력한 클라우드를 제공합니다. 이러한 혁신을 통해 Google Cloud는 모든 산업 분야에서 차세대 AI 기반 애플리케이션 도입을 가속화하며, 기업이 생성형 AI를 성공적으로 도입해디지털 혁신을 이룰 수 있도록 계속해서 지원해 나갈 예정입니다.