Gemini 2.5 Flash로 전체 서비스 속도 및 추론 성능 향상
구글 클라우드의 리소스 확보 계약으로 서비스 안정성 확보
Gemini 2.5 Pro의 유연한 언어 처리로 이용자 대화 만족도 높아져
뛰어난 언어 이해도와 유연성을 갖춘 Gemini는 뤼튼의 AI 오케스트레이션과 맞물려 더 최적화된 글 쓰기 경험을 만들고, 자연스러운 언어로 캐릭터 채팅에 생동감을 불어 넣어 주었습니다.
뤼튼은 생성형 AI 기술을 기반으로 이용자들의 생각과 창의성을 글로 표현해 주는 서비스로 시작해 전 세계의 다양한 생성형 AI를 통해 이용자들이 더 중요한 일에 몰두할 수 있도록 돕는 AI 에이전트 역할로 영역을 넓혀 나가는 AI 스타트업입니다. 인공지능을 다루는 방법을 익히고, 특성을 공부하지 않아도 대화를 나누면서 원하는 의도를 전달하면 원하는 일을 가장 효과적으로 처리해주는 통합 인공지능 도우미인 셈입니다.
지난 4월 뤼튼은 인공지능의 창의성을 활용해 이용자들이 직접 만든 개성 넘치는 AI 캐릭터와 대화하며 상상력에 기반한 이야기를 이어갈 수 있는 캐릭터 챗 서비스 '크랙(Crack)'도 출시했습니다. 뤼튼은 인공지능과 언어 모델의 가능성에 누구보다 일찍 주목했고, 다양한 활용에 대한 고민을 이어가고 있습니다.
최근 뤼튼은 서비스에서 중요한 역할을 맡고 있는 외부 언어 모델 엔진으로 Gemini를 적극적으로 활용하고 있습니다. 특히 크랙의 핵심인 캐릭터 대화 능력에서 Gemini 2.5 Pro는 이용자들의 높은 만족도를 얻으며 가장 인기 있는 언어 모델로 자리 잡았습니다.
그동안 뤼튼은 글을 쉽게 만들어 주는 개별 도구들을 기반으로 서비스를 확장해왔습니다. 다음 단계로 더 많은 사람이 인공지능에 대해 공부하거나 활용법을 익히지 않아도 쉽게 접할 수 있는 서비스로 진화하고 있습니다. 뤼튼의 목표는 이용자가 그저 대화창에 말하기만 하면 복잡한 처리 과정을 거쳐 원하는 바를 가장 잘 이루어주는 인공지능 서비스를 제공하는 것입니다.
하지만 그 과정은 결코 단순하지 않습니다. 대규모 언어 모델을 비롯해 이미지, 영상 등 생성형 AI의 발전 속도는 매우 빠릅니다. 게다가 인공지능 서비스의 특성상 각 모델마다 잘 수행하는 역할이 다르고, 더 만족스러운 결과물을 얻기 위해서는 각 생성형 AI의 특성에 맞는 프롬프트 엔지니어링 뿐 아니라 검색증강생성(RAG), 메모리 시스템 등 다양한 기술을 통해 의도를 정확히 전달하는 기술이 필요합니다. 뤼튼은 바로 이 과정의 전문가 역할을 하는 서비스입니다.
뤼튼은 이용자들이 모델 특성에 대해 고민하지 않아도 쉴 새 없이 진화하는 모델들을 잘 다루어 이용자의 의도에 맞는 답변을 만들어냅니다. 일종의 AI 오케스트레이션입니다. 이를 위해 이용자들을 더 깊이 이해하고 각자의 리터러시 수준에 맞춰 고도로 개인화된 생성형 AI 서비스를 만들어 나가고 있습니다.
현재 뤼튼은 세계적으로 가장 인기 있는 세 회사가 서비스하는 다양한 언어 모델을 용도에 따라 나누어 사용합니다. 먼저 입력된 프롬프트를 해석하여 이용자가 무엇을 원하는지 판단하고, 가장 적절한 언어 모델을 결정합니다. 그런 다음 해당 모델에 맞는 프롬프트를 생성해서 핵심 정보를 얻어냅니다. 이렇게 만들어낸 정보들을 다시 언어 모델을 통해 자연스러운 언어로 구성합니다.
구글 클라우드의 Gemini는 뤼튼의 가장 중요한 접점입니다. 현재 뤼튼은 Gemini 2.5 Pro와 Gemini 2.5 Flash를 함께 사용하고 있습니다. Gemini 2.5 Pro는 거대한 세계관을 바탕으로 대화를 이끌어 나가는 크랙의 캐릭터 챗 서비스에 주로 쓰이며, Gemini 2.5 Flash는 뤼튼이 이용자의 의도를 이해하고 맥락에 맞는 다양한 글을 쓰는 데에 활용됩니다.
Gemini는 입력에 대한 반응 속도가 빠르고, 토큰 쓰루풋이 높아서 기다리지 않고 원하는 결과물을 만들어 주었습니다. 같은 시간에 더 많은 입력을 받을 수 있고, 결과물이 만들어지는 시간도 줄어들어서 이용자들도 전체 서비스가 빨라졌다는 반응을 내비치고 있습니다.
박민우
뤼튼 AI 리드
특히 Gemini는 주로 이용자가 입력하는 내용의 의도를 읽고, 결과물을 생성해서 이용자에게 최종 결과물을 언어 형태로 제공하는 일련의 과정을 맡고 있습니다. 이와 비슷한 역할을 하는 또 다른 모델이 동시에 운영되며, 전체 답변을 얻어내는 과정에서 이용자의 의도를 정확히 파악해 적절한 모델에게 요구사항을 전달하고 전체 과정을 검증, 관리하는 라우팅 언어 모델도 함께 쓰입니다.
뤼튼은 이렇게 복합적인 모델을 활용해 최적의 답변을 만들어내는데, Gemini 2.5 출시 이후 라우팅된 모델에서 Gemini의 비율이 크게 늘었다고 합니다. 이용자들의 만족도뿐만 아니라 전체 흐름을 오케스트레이션하는 언어 모델도 Gemini 2.5로 만들어낸 결과가 가장 적절한 사례가 많아졌다고 판단하는 셈입니다.
Gemini 2.5를 적용하면서 전체 서비스에 미묘한 변화가 일어났습니다. 언어의 특성에 대한 고민이 크게 줄어들었기 때문입니다. 박민우 리드는 Gemini가 더 사람처럼 언어를 이해하고, 그 속에 숨겨진 의도까지 정확히 파악하는 것뿐만 아니라 세대에 맞는 새로운 소통 방법과 문학적 이해도까지 변화가 느껴진다고 설명합니다.
“Gemini는 이용자들과 직접 맞닿아 이야기를 귀담아듣고 원하는 답변을 내어주는 모델입니다. 이를 잘 다루는 것은 뤼튼의 역할이지만, 기본적으로 이용자와 가장 먼저 마주하는 Gemini의 언어적 역할이 중요합니다. Gemini는 특히 유행어나 밈(Meme) 등 인터넷 리터러시에 아주 밝아서 대화의 몰입도를 크게 높여주었습니다.”
박민우 리드는 Gemini가 인터넷에 있는 방대한 자료를 가장 잘 활용하는 모델이라고 말합니다. 인터넷을 통해 현재의 정보부터 최신 지식, 다양한 형태의 데이터들을 예민하게 활용해서 결과물을 만들어내는 것이지요. 점잖은 글뿐만 아니라 커뮤니티나 소셜 미디어에서 쓰이는 여러 밈 요소나 유행어, 트렌드, 심지어 은어에도 능숙하다는 설명입니다.
프롬프트에 대한 전반적인 이해 수준이 높았습니다. 기존의 언어 모델들은 프롬프트를 통해 답변에 대한 가이드를 만들어주면 그에 너무 강하게 반응해서 때로는 원치 않는 답변을 내놓는 일이 적지 않았습니다. 반면 Gemini 2.5 모델은 더 유연하다는 인상을 줍니다. 여러 정보와 요구사항들을 전체적으로 살펴서 최종적으로 답변을 내놓기 전에 이용자들의 입맛에 맞는 형태의 답변을 눈치 있게 잘 만들어낸다고 볼 수 있습니다.
박민우
뤼튼 AI 리드
Gemini의 폭넓은 리터러시와 유연성은 특히 캐릭터 챗과 잘 맞아떨어졌습니다. 이용자가 캐릭터와 이전에 나누었던 대화를 바탕으로 의도를 읽고 그에 적절한 정보를 더해서 이야기를 끌어가는 것이 중요한데, Gemini는 이 과정을 잘 처리해냈습니다. 특히 캐릭터가 가지고 있는 각각의 세계관과 페르소나를 정확히 이해하는 능력이 대화의 몰입도를 결정하는데, 이는 직접적으로 언어 모델의 성능과 연결됩니다.
“캐릭터 챗은 원작자가 그려낸 세상을 완벽히 이해하고 그 안에서 움직이기 때문에, 지금까지 대규모 언어 모델이 쓰이는 사례들 중 가장 높은 수준의 인공지능 능력을 요구합니다. Gemini 2.5 Pro는 다양한 논리적 추론 과정을 통해 상황을 잘 이해하고, 애초에 설정한 환경에서 벗어나지 않고 일관된 언어 톤으로 대화를 만들어내는 데 적합했습니다.”
뤼튼의 서비스가 백그라운드에서 언어 모델이 하는 일들을 드러내지 않는 것과 달리, 크랙은 이용자가 언어 모델을 직접 고를 수 있도록 선택지를 제공합니다. 모델마다 언어적 표현력이 조금씩 다르기 때문입니다. 이용자들 사이에서 Gemini 2.5 Pro는 이야기를 밀도 있게 꽉 채워 주도적으로 이끌어준다는 입소문이 퍼지면서 Gemini의 언어적 성향을 좋아하는 이용자들이 빠르게 늘어나고 있습니다. Gemini 2.5 Pro는 출시된 지 얼마 되지 않았지만 이용자들이 직접 선택해서 사용하는 비중이 절반을 넘어섰고, 사용량도 지속적으로 늘어나고 있습니다.
또한 Gemini는 다국어에 대한 이해도가 높아 캐릭터 챗 서비스를 여러 국가에 제공하는 데에도 좋은 기술적 기반이 됐습니다. 크랙은 캐릭터에 대한 선호도가 높은 일본에서도 서비스를 함께 시작했는데, Gemini 2.5 Pro에 대한 언어적 만족도가 국내와 마찬가지로 두드러졌다고 합니다.
생성형 AI 기반 서비스의 어려움 중 하나는 안정적인 운영입니다. 각 서비스의 이용자가 크게 늘어나고, 사용 범위나 관련 기업들의 참여도 늘어나면서 자원 부족이 고질적으로 이어지고 있습니다. 뤼튼은 최근 구글 클라우드와 Gemini의 자원 확보에 대해 추가적인 기술 계약을 맺었습니다. 이를 통해 구글과 함께 전 세계적으로 Gemini 트래픽이 늘어나도 장애나 속도 저하가 일어나지 않도록 다양한 노력을 이어가고 있습니다.
서비스 규모가 급격하게 성장하는 뤼튼으로서는 충분한 자원을 확보해두어야 속도와 안정성이라는 서비스의 신뢰를 얻을 수 있습니다. 어떤 상황에서도 처리량에 대해 확실한 보장이 이루어졌고, 전반적인 체감 속도와 성능에도 적지 않은 이점이 있었습니다.
뤼튼은 크랙의 캐릭터 챗을 시작으로 AI를 통한 다양한 경험을 만들어갈 계획입니다. 롤플레잉 게임에 가까운 캐릭터 챗 경험뿐만 아니라 여러 명이 하나의 대화 환경에 접속해 거대한 이야기를 즐기는 멀티 플레이어 채팅 등 인공지능에 특화된 엔터테인먼트 플랫폼을 만들어 내고자 합니다.
AI는 생산성을 높이는 역할뿐만 아니라 창의성을 표현하고, 상상력을 자극하는 다양한 역할을 하는 도구입니다. 구글 클라우드의 Gemini는 그 접근성을 높이려는 뤼튼의 가장 중요한 엔진입니다. 구글 클라우드와 Gemini는 단순한 클라우드, 인프라 서비스가 아니라 전략적 차원에서 함께 고민하고 언어 모델의 방향을 만들어가면서 추론을 돕는 ‘씽킹 파트너’라고 할 수 있습니다.
박민우
뤼튼 AI 리드
뤼튼의 궁극적인 목표는 이용자를 이해하고 일상 모든 영역에서 자연스럽게 접할 수 있는 AI 서비스를 만드는 것입니다. Gemini 2.5는 이용자의 언어 속에 담긴 의미를 알아채고, 그 대화 속 데이터를 통해 이용자를 이해하는 과정이 이어집니다. 물론 언어 모델도 이용자와 나눈 대화를 이해하는 메모리 기능이 있지만, 뤼튼은 다양한 모델을 오케스트레이션하면서 얻어지는 방대한 데이터를 BigQuery로 분석하며 이용자들의 마음을 읽어냅니다. 또한 Vertex AI를 통해 인공지능 관련 서비스의 데이터를 안전하고 투명하게 처리하고 있습니다.
뤼튼은 구글 클라우드의 AI 서비스들을 더 적극적으로 활용하고 있습니다. 뤼튼과 구글 클라우드는 최근 파트너십을 맺고 AI를 중심으로 인프라, 보안 등을 더욱 강화하며 생성형 AI의 다음 단계를 함께 하기로 약속했습니다. 뤼튼과 구글 클라우드는 단순한 서비스 공급자-이용자의 관계가 아니라 빠르게 성장하는 생성형 AI 서비스를 함께 그려가는 ‘씽킹 파트너’로 자리 잡아가고 있습니다.
뤼튼테크놀로지스는 '모두를 위한 AI' 비전 아래, 아시아를 대표하는 **'AI 슈퍼 앱'**으로 성장하는 것을 목표로 하는 선도적인 기업입니다. 대표 서비스인 '뤼튼'은 단순히 글의 초안을 작성하는 것을 넘어, 사용자의 질문에 가장 최적화된 거대언어모델(LLM)을 자동으로 선정하고 해당 모델에 맞는 최적의 프롬프트로 질문하여 최고 품질의 답변을 제공합니다. 나아가 AI 캐릭터 채팅 서비스 '크랙(Cracked)'을 출시하여 텍스트를 넘어 사용자와 감성적으로 교류하는 종합적인 콘텐츠 경험으로 사업을 확장하며 AI 기술의 대중화를 이끌고 있습니다.
산업 분야: 미디어 및 엔터테인먼트
위치: 대한민국