Vertex AI 고객을 위해 Gemini 모델에 대한 액세스를 확대합니다
Burak Gokturk
VP & GM, Cloud AI & Industry Solutions, Google Cloud
*본 아티클의 원문은 2024년 2월 16일 Google Cloud 블로그(영문)에 게재되었습니다.
지난 12월에 Google이 발표한 Gemini는 이제까지 Google이 선보인 모델 중 가장 강력하고 범용적인 모델입니다. 삼성전자, Palo Alto Networks를 비롯한 일부 고객은 지난 12월부터 Vertex AI의 Gemini 모델로 정교한 AI 에이전트를 빌드하여 한 차원 높은 생산성과 맞춤형 학습 등을 고객에게 제공하고 있습니다. 이제 Google Cloud는 다음과 같이 신규 업데이트를 발표하고 서비스 범위를 확대하여 고객에게 더 많은 Gemini 모델을 제공합니다.
- Gemini 1.0 Pro: AI 태스크 전반에 적용 가능한 최고의 확장용 모델로, 이제 모든 Vertex AI 고객에게 정식 버전으로 제공됩니다. 오늘부터 개발자라면 누구나 프로덕션 환경에서 Gemini Pro를 사용하여 빌드를 시작할 수 있습니다. 1.0 Pro는 대부분의 AI 태스크(콘텐츠 생성, 편집, 요약, 분류 등)에서 품질과 성능, 비용 간에 최적화된 균형을 제공합니다.
- Gemini 1.0 Ultra: 복잡한 태스크를 위한 가장 정교하고 성능이 뛰어난 모델로, 이제 허용 목록을 통해 Vertex AI에서 고객에게 정식 버전으로 제공됩니다. 복잡한 태스크용으로 설계된 만큼 1.0 Ultra는 복잡한 명령, 코드, 추론, 다국어와 같은 영역에서 특히 뛰어난 성능을 보이며 고품질 출력에 최적화되어 있습니다.
Google은 이 두 가지에 더하여 기쁜 마음으로 Gemini 차세대 모델을 소개합니다. Gemini 1.5는 보다 효율적인 아키텍처에서 향상된 성능을 제공하는 모델입니다.
초기 테스트를 위해 출시된 첫 번째 Gemini 1.5 모델인 Gemini 1.5 Pro는 현재 Vertex AI에서 비공개 프리뷰로 제공되고 있습니다. Gemini 1.5 Pro는 다양한 태스크에 걸친 확장에 최적화된 중간 규모 멀티모달 모델로서, 지금까지 Google의 최대 규모 모델인 1.0 Ultra와 비슷한 수준의 성능을 발휘합니다. 1.5 Pro는 긴 컨텍스트 이해의 측면에서 혁신적인 실험용 기능을 새로 도입했습니다. 즉 이 모델은 현재까지의 그 어떤 대규모 기반 모델보다 더 폭넓은 컨텍스트 범위를 자랑합니다. 이제 프로덕션 환경에서 앱은 최대 100만 개의 토큰을 실행할 수 있습니다. 다시 말해 1.5 Pro는 1시간 분량의 동영상, 11시간 분량의 오디오, 3만 줄이 넘는 코드베이스, 70만 개가 넘는 단어 등 방대한 양의 정보를 한 번에 처리할 수 있다는 뜻입니다.
더 넓은 컨텍스트 범위를 사용하면 모델이 더 많은 정보를 참조하고, 내러티브를 파악하며, 긴 구절에서 일관성을 유지하고, 문맥에 따라 더욱 풍성한 응답을 생성할 수 있습니다. 1.5 Pro를 사용하여 기업이 수행할 수 있는 작업의 예는 다음과 같습니다.
- 모델을 세부 조정하지 않아도 단일 프롬프트에서 전체 코드 라이브러리를 정확하게 분석합니다. 가령 오류, 코드 불일치, 비효율성과 같이 개발자가 놓치기 쉬운 자잘한 세부정보를 이해하고 추론합니다.
- 아주 긴 문서에 대해 추론합니다. 이를 테면 계약 전반의 세부정보 비교부터 애널리스트 보고서나 연구 조사, 심지어 시리즈로 구성된 책의 전반적인 주제와 의견을 종합 및 분석합니다.
- 여러 시간 분량의 동영상 콘텐츠를 분석하고 비교합니다. 예를 들어 스포츠 영상에서 특정 세부 정보를 찾거나 화상 회의 요약에서 세부정보를 파악해 질문에 정확한 답을 줄 수 있습니다.
- 챗봇이 복잡한 작업이나 많은 후속 상호작용에도 세부정보를 놓치지 않고 긴 대화를 이어갈 수 있도록 지원합니다.
- 복잡하게 모델을 세부 조정하지 않아도 관련 사용자 정보를 프롬프트로 가져와 고도로 개인화된 경험을 제공합니다.
Gemini 모델로 혁신을 추구하는 고객 사례
Vertex AI는 지난해 상반기에서 하반기 사이에 API 요청이 약 6배 증가하는 등 도입이 크게 증가한 것으로 나타났습니다. 특히 Gemini 모델이 멀티모달이며 복잡한 추론을 처리하는 데 탁월하다는 점을 활용한 고객의 사용 사례들은 더없이 인상적이었습니다.
삼성전자: 최근 Galaxy S24 시리즈가 스마트폰 최초로 Gemini 모델을 탑재했다고 발표했습니다. 이에 따라 고객은 Notes 앱 및 음성 녹음 앱 등 삼성 기본 앱에서 요약 기능을 활용할 수 있게 되었습니다. 삼성은 Vertex AI의 보안, 안전, 개인 정보 보호 기능이 최종 사용자를 보호한다는 점을 확신하고 있습니다.
Palo Alto Networks: 다양한 사용 사례에서 Gemini 모델을 테스트하고 있습니다. 고객 지원에 소요되는 시간을 단축시키고 고객이 제품 포트폴리오와 보다 직관적인 방식으로 상호작용할 수 있도록 하는 지능형 제품 에이전트도 여기에 포함됩니다.
Jasper: 엔터프라이즈 마케팅팀이 콘텐츠를 만들고 리패키징하는 것을 지원하는 AI 서비스인 Jasper는 Gemini 모델을 사용해 고객을 위한 블로그 콘텐츠 및 제품 설명을 자동 생성하고 있습니다. 덕분에 마케팅팀은 콘텐츠에 대한 고품질 기준을 유지하여 브랜드의 색깔을 지키고 마케팅 지침을 준수하는 동시에 더욱 발 빠르게 움직일 수 있습니다.
Quora: 인기 있는 질의응답 플랫폼인 Quora는 Gemini를 사용해 자사의 AI 채팅 플랫폼인 Poe에서 크리에이터의 수익 창출에 힘을 실어주고 있습니다. Poe에서는 사용자가 다양한 AI 기반 봇을 탐색할 수 있으며, Gemini는 Poe에서 활동하는 크리에이터들이 글쓰기 도우미, 코드 생성, 맞춤형 학습 등 다양한 사용 사례를 위한 맞춤형 봇을 빌드할 수 있도록 지원합니다.
Vertex AI의 Gemini API를 사용하여 프로덕션에 바로 사용 가능한 애플리케이션 빌드하기
Vertex AI의 Gemini API는 개발자가 텍스트, 코드, 이미지, 동영상 등 모달 전반에서 정보를 동시에 처리할 수 있는 차세대 AI 에이전트 및 앱을 빌드할 수 있도록 지원합니다. Gemini 모델의 강력한 기능을 활용하려면 조직과 개발자가 엔터프라이즈급 애플리케이션을 빌드하고 이를 프로덕션에 적용할 수 있어야 합니다. Vertex AI는 모델, 도구, 인프라를 위한 단일 통합 플랫폼을 제공하는 유일한 클라우드 AI 플랫폼입니다. 따라서 Gemini 모델로 빌드한 애플리케이션을 쉽게 배포 및 유지보수할 수 있습니다. Vertex AI를 사용하면 고객은 다음을 수행할 수 있습니다.
구체적인 비즈니스 니즈에 맞춰 Gemini 모델을 맞춤설정합니다. 이제 Vertex AI의 Gemini API는 LoRA(Low-Rank Adaptation)와 같은 어댑터 기반 튜닝을 지원하므로 개발자가 비용을 절감하면서 효율적으로 모델을 맞춤설정할 수 있습니다. 인간 피드백 기반 강화 학습(RLHF), 정제 등 추가적인 맞춤설정 기술도 몇 달 내로 Gemini API에 추가될 예정입니다.
가장 최신 정보로 Gemini 모델의 반응을 강화하여 실제 상황에서 모델이 조치를 취할 수 있도록 합니다. 완전 관리형 그라운딩을 지원하므로 개발자가 기업의 자체 데이터를 사용해 Gemini 모델 답변의 관련성과 정확도를 높일 수 있습니다. 또한 이제 함수 호출이 정식 버전으로 제공되어 개발자가 Gemini 모델을 외부 API에 연결하고 트랜잭션 등의 작업을 수행할 수 있습니다.
특수 목적으로 제작된 도구를 사용하여 프로덕션에서 Gemini를 확장 및 관리하고 빌드한 애플리케이션을 쉽게 배포 및 유지 관리합니다. Vertex AI는 생성형 AI 모델용 자동 평가 도구인 자동 정렬 평가 수행을 제공합니다. 이 기능은 일련의 기준을 표준으로 삼아 모델 간 응답을 비교함으로써 개발자가 Gemini의 성능을 이해하고 해당 피드백을 기반으로 프롬프트와 튜닝을 조정할 수 있도록 지원합니다.
Gemini 모델을 사용하여 검색 및 대화형 에이전트를 빌드합니다. 최소한의 코딩 전문 지식만 있어도 빌드에 몇 달이나 몇 주가 아닌, 단 며칠, 몇 시간밖에 걸리지 않습니다.
- Vertex AI Search는 개발자에게 즉시 사용 가능한, Google 검색 품질 수준의 정보 검색 및 답변 생성 시스템을 제공합니다. Gemini 모델의 지원을 받으면 개발자가 더욱 강력한 근거, 정확한 인용, 만족스러운 답변을 제공하는 검색 애플리케이션을 빌드할 수 있습니다.
- Vertex AI Conversation을 사용하면 이제 개발자가 Gemini 모델로 정교한 생성형 AI 기반 대화형 챗봇을 빌드할 수 있습니다. Gemini의 고급 추론 및 멀티모달 기능은 개발자가 애플리케이션에 더욱 맞춤설정되고 유익하며 매력적인 대화형 AI 환경을 구현할 수 있습니다.
이제 막 시작한 Gemini 시대의 트렌드를 이끌어보세요.
엔터프라이즈급 모델 증강, 테스트, 배포, 관리 도구를 제공하는 Vertex AI에서 개발자는 프로덕션급 애플리케이션을 빌드할 수 있습니다. 또한 개발자들은 API 키를 사용해 신속하게 프로토타입을 만들고 앱을 출시할 수 있는 무료 웹 기반 개발자 도구인 Google AI Studio에서 API를 통해 여러 Gemini 모델을 경험할 수 있습니다. 새 Gemini 모델 전부를 사용하실 수 있게 된 고객 여러분이 앞으로 어떤 차세대 지능형 앱과 에이전트를 만들지 무척 기대됩니다. 하지만 Gemini 시대는 이제 시작 단계에 불과합니다. 조직을 최첨단 상태로 유지하려면 어카운트팀과 소통하여 머잖아 출시될 Gemini 모델의 신뢰할 수 있는 테스터로 등록되어 있는지 확인하세요. 오는 4월 라스베이거스에서 열리는 Google Cloud Next ‘24에 꼭 참석하여 Google Cloud의 최신 생성형 AI 소식과 예정된 이벤트를 알아보고 제품과 전략을 자세히 살펴보세요.