2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델 부문 리더로 선정된 Google
Warren Barkley
Sr. Director, Product Management, Cloud AI
* 본 아티클의 원문은 2024년 06월 06일 Google Cloud 블로그(영문)에 게재되었습니다.
Google이 2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델 부문 리더로 선정되었다는 기쁜 소식을 오늘 전해 드립니다. Google은 최신 서비스와 전략 카테고리에서 평가 대상 공급업체 중 가장 높은 점수를 받았습니다.
"Gemini는 특히 멀티모달리티와 컨텍스트 길이 측면에서 시장에서 차별화되며 광범위한 보완 클라우드 서비스 생태계와의 상호 연결성을 보장합니다." - 2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델
2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델 사본을 무료로 다운로드하세요.
생성형 AI는 기술에 대한 상호작용 방식을 새롭게 바꾸고 있습니다. 최종 사용자를 위한 혁신적인 새로운 앱, 경험 및 에이전트를 빌드하는 개발자에게 강력한 관리형 모델이 제공되고 있습니다. 튜닝 모델의 접근성이 그 어느 때보다 커져 이제는 과거에 필요했던 데이터의 1%만 있어도 됩니다. 영역 전반에 걸쳐 생성형 AI가 계속해서 빠르게 발전하고 있습니다.
Google은 오랜 AI 연구 및 혁신의 역사를 자랑하며, 오늘날 생성형 AI 애플리케이션의 핵심인 Transformer 아키텍처, 확산 모델은 물론 기타 선구적인 노력의 결과를 제공하고 있습니다.
Gemini는 Google의 멀티모달 모델 제품군으로서 Google DeepMind와 Google 연구팀을 포함한 Google의 여러 팀이 대규모로 협업한 결과입니다. 처음부터 텍스트, 코드, 이미지, 오디오, 동영상을 원활하게 결합하고 이해하도록 설계된 Gemini 모델은 개발자들이 거의 모든 산업 분야의 최첨단 AI 에이전트를 만드는 데 활용되고 있습니다.
Gemini는 머신러닝 모델의 대규모 개발, 배포, 모니터링이 가능한 Google Cloud의 완전 관리형 통합 플랫폼 Vertex AI를 통해 고객에게 제공됩니다. 생성형 AI와 예측 AI 모델 모두를 지원하는 Vertex AI에서 고객은 엔터프라이즈용 튜닝, 그라운딩, 모니터링, 추론 기능을 비롯해 최고의 AI 인프라와 사용하기 쉬운 AI 에이전트 빌드 도구로 Gemini 및 다른 AI 모델을 맞춤설정하고 배포할 수 있습니다.
최고의 성능
엔터프라이즈 고객은 Vertex AI를 통해 다음 Gemini 모델을 사용할 수 있습니다.
-
Gemini 1.5 Pro: 올해 발표되어 현재 정식 버전으로 제공되고 있는 Gemini 1.5 Pro는 업계 최고의 혁신적인 백만 개의 토큰 컨텍스트 윈도우를 통해 단일 프롬프트로 대용량 문서, 코드베이스 또는 전체 동영상을 정확하게 처리할 수 있습니다. 대규모 코드베이스나 광범위한 문서 라이브러리를 분석하는 등 더 큰 컨텍스트 윈도우가 필요한 사용 사례를 위해, 최대 2백만 개의 토큰 컨텍스트 윈도우를 지원하는 Gemini 1.5 Pro가 곧 고객에게 제공됩니다. 2백만 개의 토큰 컨텍스트 윈도우 대기자 명단에 등록하려면 여기에서 신청하세요.
-
Gemini 1.5 Flash: 역시 현재 정식 버전인 Gemini 1.5 Flash는 획기적인 백만 개의 토큰 컨텍스트 윈도우를 제공하지만 1.5 Pro보다 가벼운 제품으로 채팅 애플리케이션과 같은 작업을 속도와 규모 면에서 효율적으로 처리하도록 설계되었습니다.
-
Gemini 1.0 Pro: 자연어 작업, 멀티턴 텍스트 및 코드 채팅, 코드 생성을 처리하도록 설계되었습니다. 새 버전은 지연 시간이 단축되고 품질이 개선되었으며, 지도 튜닝 (Supervised tuning) 기능이 추가된 정식 버전으로 제공됩니다.
-
Gemini 1.0 Pro Vision: 멀티모달 프롬프트를 지원합니다. 프롬프트 요청에 텍스트, 이미지, 동영상을 포함하고 텍스트 또는 코드 형태의 대답을 얻을 수 있습니다.
Vertex AI
Vertex AI에서는 Gemini의 맞춤설정 및 배포가 가능하므로 현재 개발자가 텍스트, 코드, 이미지, 동영상 전반의 정보를 처리하는 차별화된 새 애플리케이션을 빌드할 수 있습니다. 개발자는 Vertex AI를 사용해 다음과 같은 작업을 수행할 수 있습니다.
-
Gemini를 살펴보고 사용하거나 Google의 130개가 넘는 선별 목록 중에서 모델을 선택합니다. 이 목록에는 Google은 물론 Google의 엄격한 엔터프라이즈 보안 및 품질 표준을 충족하는 오픈소스와 서드 파티의 모델이 포함됩니다. 개발자가 사용하기 쉬운 API로 모델에 액세스하여 애플리케이션에 모델을 빠르게 빌드할 수 있습니다.
-
모델 동작을 맞춤설정합니다. 튜닝 도구를 사용하여 학습 지식을 보강하고 필요에 따라 모델 가중치를 조정하여 특정 전문 분야 또는 회사의 전문성에 맞게 모델 동작을 맞춤설정할 수 있습니다. Vertex AI는 프롬프트 설계, LoRA(Low Rank Adaptation)와 같은 어댑터 기반 튜닝, 증류 등 다양한 튜닝 기술을 제공합니다. 또한 RLHF(인간 피드백 기반 강화 학습) 지원을 통해 사용자 의견을 수집하여 모델을 개선하는 기능도 제공합니다.
-
도구로 모델을 보강합니다. 이를 통해 특정 컨텍스트 또는 사용 사례에 맞게 Gemini Pro를 조정할 수 있습니다. Vertex AI 확장 프로그램과 커넥터를 사용하면 개발자가 트랜잭션 및 기타 작업을 위해 Gemini Pro를 외부 API에 연결하고 외부 소스에서 데이터를 가져오거나 코드베이스에서 함수를 호출할 수 있습니다. Vertex AI는 조직의 자체 데이터 소스에서 파운데이션 모델 출력을 그라운딩하여 모델 대답의 정확성과 관련성을 개선하는 기능도 조직에 제공합니다. 또한 기업에서는 정형 데이터 및 비정형 데이터에 대한 그라운딩과 Google 검색 기술을 통한 그라운딩을 사용할 수 있습니다.
-
프로덕션에서 모델을 확장 및 관리합니다. 이를 위한목적으로 제작된 도구를 사용하여 빌드한 애플리케이션을 쉽게 배포 및 유지 관리할 수 있습니다. 고객은 모델을 비교하는 자동화된 주문형 도구인 자동 정렬(AutoSxS)을 사용해 모델을 평가할 수 있습니다. 자동 정렬(Auto SxS)은 수동 모델 평가보다 빠르고 비용 효율적일 뿐만 아니라 새로운 생성형 AI 사용 사례를 처리하도록 다양한 작업 사양에 맞게 맞춤설정할 수 있습니다.
-
로우 코드/노 코드 환경에서 AI 에이전트를 빌드합니다. Vertex AI Agent Builder를 사용하면 머신러닝 능숙도에 상관없이 모든 개발자가 Gemini 모델로 몇 주나 몇 달이 아닌 몇 시간 또는 며칠 만에 흥미로운 프로덕션 급 AI 에이전트를 만들 수 있습니다.
-
혁신을 책임감 있게 전달합니다. Vertex AI의 안전 필터, 콘텐츠 조정 API, 기타 책임감 있는 AI 도구를 사용하면 모델이 부적절한 콘텐츠를 출력하지 않도록 하는 데 도움이 됩니다.
-
데이터 보호를 지원합니다. Google Cloud에서 기본 제공하는 데이터 거버넌스 및 개인 정보 보호 설정을 통해 데이터를 보호할 수 있습니다. 데이터는 고객이 제어하며, Google은 모델 학습에 고객 데이터를 사용하지 않습니다. Vertex AI는 고객 관리 암호화 키 및 VPC 서비스 제어를 비롯해 고객이 자신의 데이터를 전적으로 제어할 수 있는 다양한 메커니즘을 제공합니다.
최근 혁신 기능
Vertex AI의 지속적인 혁신은 Google과 업계에서 제공하는 최고의 모델, 엔드 투 엔드 모델 빌드 플랫폼, 더욱 빠른 에이전트 개발 및 배포를 실현하도록 설계되며, 이 모든 것은 규모 조정과 엔터프라이즈 준비를 기반으로 합니다. 최근의 제품 혁신은 다음과 같습니다.
-
Batch API는 지연 시간에 민감하지 않은 대량의 텍스트 프롬프트 요청을 전송할 수 있는 매우 효율적인 방법으로서 분류 및 감정 분석, 데이터 추출, 설명 생성과 같은 사용 사례를 지원합니다. 단일 요청으로 여러 프롬프트를 모델에 전송할 수 있어 개발자 워크플로 속도를 높이고 비용을 절감하는 데 도움이 됩니다.
-
컨텍스트 캐싱은 이번 달에 미리보기 출시로 제공된 기능으로 고객이 캐시된 컨텍스트 데이터를 적극적으로 관리하고 재사용할 수 있게 합니다. 컨텍스트 길이만큼 처리 비용이 증가하므로 긴 컨텍스트의 애플리케이션을 프로덕션으로 이동하면 비용이 많이 들 수 있습니다. Vertex AI 컨텍스트 캐싱은 고객이 캐시된 데이터를 활용하여 비용을 크게 절감하는 데 도움이 됩니다.
-
제어 생성은 이번 달에 공개 미리보기 출시가 예정된 기능으로 고객이 특정 형식 또는 스키마에 따라 Gemini 모델 출력을 정의할 수 있게 합니다. 대부분의 모델에서는 지정된 지침이 있어도 출력의 형식과 구문이 보장되지 않습니다. Vertex AI 제어 생성을 사용하면 고객이 YAML 및 XML과 같은 사전 빌드된 옵션을 사용하거나 사용자 지정 형식을 정의하여 원하는 출력 형식을 선택할 수 있습니다. 사전 빌드된 옵션으로 JSON 또한 사용할 수 있습니다.
-
Vertex AI 기반 LlamaIndex는 데이터 수집 및 변환부터 임베딩, 색인 생성, 검색, 생성에 이르는 검색 증강 생성(RAG) 프로세스를 간소화합니다. 이제 Vertex AI 고객은 Google의 모델과 AI에 최적화된 인프라를 LlamaIndex의 간단하고 유연한 오픈소스 데이터 프레임워크와 함께 활용하여 커스텀 데이터 소스를 생성 모델에 연결할 수 있습니다.
-
Genkit는 Firebase에서 발표한 오픈소스 Typescript/JavaScript 프레임워크로 프로덕션에 즉시 사용 가능한 AI 에이전트의 개발, 배포, 모니터링을 간소화하도록 설계되었습니다. Vertex AI 플러그인을 통해 지원되어 Firebase 개발자는 이제 Gemini, Imagen 2와 같은 Google 모델은 물론 텍스트 임베딩도 활용할 수 있습니다.
-
Google 검색을 통한 그라운딩은 현재 정식 버전으로 사용 가능하며, 모델을 세상의 지식, 광범위한 주제, 인터넷상의 최신 정보와 연결할 수 있습니다. Google 검색으로 Gemini 모델을 그라운딩하면 고객이 Google에서 제공하는 최신 파운데이션 모델의 이점을 활용하면서 고품질의 최신 정보에 액세스할 수 있어 대답의 완전성과 정확성이 대폭 개선됩니다.
-
Gemma 2는 Gemini를 만드는 데 사용된 것과 동일한 기술을 사용하여 광범위한 AI 개발자 사용 사례를 위해 구축된 차세대 개방형 모델 제품군입니다. Gemma 2 모델은 Vertex AI Model Garden에서 곧 제공됩니다.
-
Imagen 3은 Vertex AI에 곧 출시될 예정이며 Google의 모델 중 품질이 가장 우수한 텍스트-이미지 생성 모델입니다. 놀라운 수준의 디테일과 살아 있는 듯한 실사형 이미지를 생성할 수 있습니다.
Gemini 모델로 혁신을 추구하는 고객 사례
Vertex AI는 지난해 상반기에서 하반기 사이에 API 요청이 약 6배 증가하면서 도입이 크게 증가한 것으로 나타났습니다. 특히 Gemini 모델이 멀티모달이며 복잡한 추론을 처리하는 데 탁월하다는 점을 활용한 고객의 사용 사례들은 더없이 인상적이었습니다.
삼성: 최근 Galaxy S24 시리즈가 스마트폰 최초로 Gemini 모델을 탑재했다고 발표했습니다. 이에 따라 고객은 Notes 앱 및 음성 녹음 앱 등 삼성 기본 앱에서 요약 기능을 활용할 수 있게 되었습니다. 삼성은 Vertex AI의 보안, 안전, 개인 정보 보호 기능이 최종 사용자를 보호한다는 점을 확신하고 있습니다.
Jasper: 엔터프라이즈 마케팅팀이 브랜드 이미지에 맞는 콘텐츠와 캠페인을 대규모로 제작할 수 있는 AI 마케팅 플랫폼인 Jasper는 Gemini 모델을 사용해 고객을 위한 마케팅 캠페인 콘텐츠를 빠르게 생성하고 있습니다. 덕분에 이제 마케팅팀은 콘텐츠에 대한 고품질 기준을 유지하여 브랜드의 색깔을 유지하고, 마케팅 지침을 준수하는 동시에 더욱 발 빠르게 움직일 수 있습니다.
Quora: 인기 있는 질의응답 플랫폼인 Quora는 Gemini를 사용해 자사의 AI 채팅 플랫폼인 Poe에서 크리에이터의 수익 창출에 힘을 실어주고 있습니다. Poe에서는 사용자가 다양한 AI 기반 봇을 탐색할 수 있으며, Gemini는 Poe에서 활동하는 크리에이터들이 글쓰기 도우미, 코드 생성, 맞춤형 학습 등 다양한 사용 사례를 위한 맞춤형 봇을 빌드할 수 있도록 지원합니다.
2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델 부문 및 2024년 1분기 The Forrester Wave: AI 인프라 솔루션 보고서에서 Google이 리더로 선정되었습니다. Google은 고객의 이익을 위해 수십 년간 쌓아온 AI R&D 전문 지식을 모델 빌드, 대규모 인프라, Vertex AI 기능에 쏟아부으며 AI 분야의 지속적인 연구와 혁신에 전념하고 있습니다.
"엄청난 AI 인프라 용량, 유능한 수많은 AI 연구원, 계속해서 늘고 있는 Google 엔터프라이즈 고객 등 Google Cloud는 AI 시장을 선도하는 데 필요한 모든 조건을 갖추고 있습니다." - 2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델
전체 보고서는 2024년 2분기 The Forrester Wave™: Language AI 파운데이션 모델에서 확인할 수 있습니다.