콘텐츠로 이동하기
AI 및 머신러닝

엔터프라이즈 사용 사례에 향상된 추론을 제공하는 Gemini 2.5

2025년 5월 1일
https://storage.googleapis.com/gweb-cloudblog-publish/images/Gemini_2.5.max-2500x2500.jpg
Jason Gelman

Director, Product Management, Vertex AI

Tulsee Doshi

Director, Product Management, Google DeepMind

Try Gemini 2.5

Our most intelligent model is now available on Vertex AI

Try now

* 본 아티클의 원문은 2025년 4월 10일 Google Cloud 블로그(영문)에 게재되었습니다. 

Google은 최근 자사 최고의 지능형 AI 모델인 Gemini 2.5를 발표했습니다. 현재 Gemini 2.5 모델은 대답 전 추론이 가능한 사고형 모델로, 획기적으로 향상된 성능을 자랑합니다. 이러한 투명하고 단계적인 추론은 기업의 신뢰와 규정 준수에 필수입니다.

이 제품군의 첫 번째 모델인 Gemini 2.5 Pro는 현재 Vertex AI 기반의 공개 프리뷰 버전으로 제공되며, 고급 추론이 필요한 작업과 코딩에 사용할 수 있는 세계 최고의 모델로 손꼽힙니다. 여러 업계 기준치에서 최고 성능을 달성했으며, 많은 사용자로부터 최고의 엔터프라이즈용 추론 모델로 평가받고 있습니다. 또한 LM Arena 리더보드에서 큰 격차로 1위를 차지했습니다. 

이러한 성과에 힘입어 Google은 짧은 지연 시간과 비용 효율성을 제공하는 주력 모델인 Gemini 2.5 Flash도 출시합니다. 이 모델은 AI 애플리케이션과 에이전트를 빌드하고 관리하는 포괄적인 플랫폼인 Vertex AIGoogle AI Studio를 기반으로 합니다.

이제 이러한 모델의 기능으로 Google Cloud에서 AI 개발을 어떻게 혁신하고 있는지 자세히 살펴보겠습니다.

심층 추론을 통한 기업 문제 해결력 향상

기업은 복잡한 정보 환경, 다단계 분석, 세밀한 의사 결정이 요구되는 상황 속에서 문제를 해결하려면 단순한 처리를 넘어 추론 능력을 갖춘 AI가 필요합니다. Vertex AI 기반의 Gemini 2.5 Pro는 이 점을 감안하여 심층적인 추론과 코딩 전문성을 요구하는 가장 복잡한 작업을 최고의 품질로 처리할 수 있도록 설계되었습니다. Gemini 2.5 Pro는 100만 개에 달하는 토큰 컨텍스트 윈도우와 결합해 심도 있는 데이터 분석을 수행하고, 법률 계약서나 의료 기록 같은 복잡한 문서에서 핵심 인사이트를 추출하고, 전체 코드베이스를 이해하여 복잡한 코딩 작업을 처리합니다.

"Box에서는 기업이 콘텐츠에 인텔리전스를 적용하는 방식을 재정의하고 있습니다. Gemini 기반의 Box AI 추출 에이전트는 사용자가 비정형 데이터를 실행 가능한 형태로 변환하여 작업을 즉시 간소화할 수 있도록 지원하며, 조달과 보고 같은 다양한 사용 사례에서 수백만 건의 추출 작업에 활용되고 있습니다. 고급 추론의 수준을 한 단계 높인 Gemini 2.5 덕분에 더 강력한 에이전트 시스템 빌드가 가능해져, 자동으로 추출된 인사이트를 통해 후속 작업을 실행하고 여러 단계를 조율할 수 있게 되었습니다. 이러한 발전은 자동화의 지평을 넓혀 비즈니스가 가장 가치 있는 정보를 더욱 효과적이고 효율적으로 활용할 수 있는 토대를 마련합니다."  - Yashodha Bhavnani, Box AI 제품 관리 부문 부사장

"Moody's는 모델에 구애받지 않는 프레임워크 내에서 Vertex AI 기반의 Gemini 고급 추론 기능을 활용하고 있습니다. 현재 프로덕션 시스템에서 지능형 필터링에 Gemini 2.0 Flash를, 고정밀 추출에 Gemini 1.5 Pro를 사용한 결과, 복잡한 PDF 처리 시간 80% 단축 및 정확도 95% 이상이라는 성과를 거두었습니다. 이 성공을 바탕으로 현재 Gemini 2.5 Pro의 초기 테스트를 진행 중입니다. 대규모 컨텍스트 윈도우 같은 기능 덕분에 방대한 문서 모음에서 더 심층적이고 체계적인 추론이 가능해져 훨씬 더 복잡한 데이터 과제를 해결하고 데이터 범위를 확대할 좋은 조짐이 보입니다. 아직 프로덕션 단계는 아니지만 초기 결과는 매우 고무적입니다." - Wade Moss, Moody’s AI 데이터 솔루션 부문 전무이사

고유한 데이터 전문화를 위한 지도 튜닝과 긴 컨텍스트의 효율적인 처리를 위한 컨텍스트 캐싱 같이 특정 니즈에 맞춰 Gemini를 조정할 때 활용 가능한 Vertex AI 기능이 곧 비즈니스에 제공되므로 성능 향상과 비용 절감 효과를 얻을 수 있습니다. 이 두 기능은 몇 주 내에 Gemini 2.5 모델에서 출시될 예정입니다.

효율적인 반응형 AI 애플리케이션의 대규모 빌드

Gemini 2.5 Pro는 복잡한 과제 해결에 최고 품질을 제공하는 것을 목표로 하지만, 기업 애플리케이션의 우선순위는 속도, 짧은 지연 시간, 비용 효율성인 경우가 많습니다. 이 니즈를 충족하기 위해 Vertex AI 기반 Gemini 2.5 Flash도 곧 출시될 예정입니다. 이 주력 모델은 짧은 지연 시간과 비용 절감에 특히 최적화된 모델로, 고객 서비스나 실시간 정보 처리 같은 대규모 시나리오에서 균형 잡힌 우수한 품질을 제공합니다. 반응형 가상 어시스턴트와 실시간 요약 도구처럼 규모에 따른 효율성이 필요한 작업에 이상적인 엔진입니다.

Gemini 2.5 Flash는 동적이고 제어 가능한 추론 기능도 지원합니다. 이 모델은 쿼리 복잡도에 따라 처리 시간('사고 예산')을 자동으로 조정하여 간단한 요청에 더 빠른 답변을 도출합니다. 또한 예산을 세부적으로 제어할 수 있으므로 구체적인 니즈에 맞게 속도, 정확성, 비용 균형의 명시적인 튜닝이 가능합니다. 이러한 유연성은 비용에 민감한 대규모 애플리케이션에서 Flash 성능을 최적화하는 데 핵심적인 역할을 합니다.

"Gemini 2.5 Flash의 향상된 추론 기능과 인사이트가 담긴 대답은 향후 AI 기반 위협을 탐지하고 자사 AI 포트폴리오 전반에서 고객 지원을 더욱 효과적으로 제공할 수 있다는 점에서 Palo Alto Networks에 막대한 잠재력을 선사합니다. Palo Alto Networks는 최신 모델이 요약 및 대답을 포함한 AI 어시스턴트 성능에 미치는 영향을 집중적으로 평가하고 있으며, 고급 기능을 활용하기 위해 이 모델로 마이그레이션할 계획이 있습니다." - Rajesh Bhagwat, Palo Alto Networks 엔지니어링 부문 부사장

Vertex AI 기반 환경 최적화

Gemini 2.5 Pro와 2.5 Flash 같은 강력한 모델 중 무엇을 선택할지는 사용자의 니즈에 따라 다릅니다. 쉽게 선택할 수 있도록 Google은 원하는 품질과 비용 간 균형에 맞춰 각 프롬프트에 최고 품질의 대답을 자동 생성하는 실험용 Vertex AI Model Optimizer를 도입할 예정입니다. 고객이 워크로드를 반드시 특정 위치에서 처리할 필요가 없는 경우 Vertex AI Global Endpoint를 사용하면 여러 리전에서 Gemini 모델을 용량에 따라 라우팅할 수 있습니다. 덕분에 트래픽 급증이나 리전 서비스 변동이 발생해도 애플리케이션의 응답성을 유지할 수 있습니다.

정교한 에이전트 및 멀티 에이전트 생태계를 통한 미래 지원

Gemini 2.5 Pro의 고급 멀티모달 추론 기능은 정교하고 실질적인 에이전트 워크플로를 지원합니다. 이 모델은 시각적 컨텍스트(지도, 플로우 차트)를 해석하고, 텍스트 이해를 통합하고, 웹 검색 같은 그라운딩 작업을 수행하고, 다양한 정보를 종합하여 에이전트와 복잡한 입력 데이터 간의 상호작용이 의미 있게 이루어지게 합니다.

이러한 가능성을 바탕으로 오늘 Google은 멀티 에이전트 생태계를 지원하는 Vertex AI의 여러 혁신적인 기능도 발표합니다. Gemini 모델의 Live API는 실시간 상호작용을 동적으로 지원하는 핵심적인 혁신 기술입니다. 에이전트는 이 API를 통해 짧은 지연 시간으로 스트리밍 오디오, 동영상, 텍스트를 처리하여 사람처럼 대화를 나누거나, 실시간 회의에 참여하거나, 작업 중 음성 안내를 이해하는 등 실시간 상황을 모니터링할 수 있습니다.

이러한 상호작용을 더욱 강화하는 주요 Live API 기능은 30분 이상의 길고 재개 가능한 세션, 다국어 오디오 출력, 분석을 위한 타임스탬프 포함 스크립트, 세션 중 동적으로 업데이트되는 안내, 강력한 도구 통합(검색, 코드 실행, 함수 호출)을 지원합니다. 이러한 발전 덕분에 고도의 상호작용형 애플리케이션에 Gemini 2.5 Pro 같은 모델이 유용하게 활용될 것으로 예상됩니다.

시작하기 

복잡한 문제를 해결하고, 효율적인 애플리케이션을 빌드하고, 정교한 AI 에이전트를 만들고 싶다면 지금 Vertex AI에서 Gemini 2.5를 사용해 보세요.

게시 위치