꿈많은청년들 : Gemini, PaLM 2 기반 38개 언어 다루는 글로벌 블로그 서비스 완성

Dream Youngs에 대하여

꿈많은청년들은 인공지능 기술을 통해 사람들이 자유롭게 소통할 수 있다는 비전을 바탕으로 서비스를 개발해 왔습니다. 2016년 시작한 챗봇 서비스에 이어 최근 38개 언어로 내용을 자동 번역해주는 블로그 ‘두루미스’를 개발해 콘텐트 크리에이터들을 53억 명 규모의 언어 시장으로 연결합니다.

산업 분야: 과학 기술

위치: 대한민국

제품: Kubernetes Engine, Anthos, Cloud Run, Cloud Functions, Cloud CDN, Cloud SQL

어떤 어려움을 겪고 계신지 알려주세요. Google Cloud가 도와드리겠습니다.

문의하기

꿈많은청년들은 글을 쓰면 38개 언어로 자동 번역해주는 블로그 플랫폼인 ‘두루미스’를 시작했습니다. 구글 클라우드로 제공되는 Gemini와 PaLM 2 모델은 어떤 글이든 매끄럽게 38가지 언어로 번역해 주었고 문맥을 읽어 카테고리 분류와 추천 글을 자동으로 이어주면서 전통적인 플랫폼으로 꼽히던 블로그에 새로운 흐름을 만들었습니다.

구글 클라우드 사용 효과

38개 언어로 53억 명 규모 언어 시장 블로그 서비스
높은 성능 대비 획기적인 비용 절감
8개 지역 멀티 리전으로 전 세계 대상 매끄러운 환경

1/10 비용으로 38개 언어 번역하는 생성 AI

꿈많은청년들은 최근 ‘두루미스(durumis)’라는 블로그 서비스를 시작했습니다. 두루미스는 여느 블로그처럼 자유롭게 글을 쓸 수 있지만 이용자들이 만든 콘텐츠가 38개 언어로 자동 번역되어서 53억 명 규모의 언어 시장으로 배포되는 것이 강점입니다.

꿈많은청년들은 2016년 챗봇 서비스를 시작하면서 커뮤니케이션에 대한 경험을 쌓기 시작했고, 인공지능 기술을 통해서 사람들의 생각을 전 세계로 공유하고 소통할 수 있다는 가능성에 주목해 글로벌 블로그 서비스를 시작하게 됐습니다. 그 중심에는 구글 클라우드와 구글의 인공지능 서비스인 Gemini가 있었습니다.

"구글 클라우드는 챗봇 서비스를 이용하면서부터 접하게 됐습니다. 기존 클라우드 서비스가 네트워크 문제로 골치를 썩이면서 구글 클라우드로 인프라 이전을 고민했습니다. 구글 클라우드는 네트워크를 비롯한 인프라 안정성에 대한 문제가 없었을 뿐 아니라 꾸준히 제안되는 새로운 기술을 통해 개발과 운영에 대한 경험치를 높일 수 있었습니다."

정민석 꿈많은청년들 CTO는 구글 클라우드의 안정적인 통합 서비스를 높이 샀습니다. 클라우드에 대한 가장 큰 기대는 안정적으로 서비스가 운영되는 것인데 구글 클라우드는 기본적인 요건에서 만족스러웠다는 설명입니다. 자연스럽게 이전 이후 많은 서비스들이 구글 클라우드 위에서 실험되고, 고도화되면서 더 나은 서비스와 새로운 비즈니스의 가능성을 열 수 있었습니다.

두루미스, 인공지능으로 블로그 언어의 장벽 깨

글로벌 블로그 플랫폼인 두루미스는 블로그 그 자체로서의 역할도 중요하지만 무엇보다 매끄럽게 전 세계 언어로 번역하는 과정이 필요합니다. 대규모 언어 모델은 번역에 최적화되어 있었고, 이를 잘 이용하면 원하는 결과물을 얻어낼 수 있을 것이라는 기대를 했습니다.

하지만 문제는 비용이었습니다. 블로그의 특성상 번역해야 하는 텍스트의 양이 많았습니다. 초기에 고민했던 대규모 언어 모델은 기대하는 이용자 규모가 되었을 때 부담이 될 가능성이 높았습니다. 비슷한 성능과 더 낮은 가격으로 운영할 수 있는 방법을 고민할 수밖에 없었습니다.

"2023년 여름 구글 클라우드에 PaLM 2가 공개되면서 가능성이 열렸습니다. 세세한 프롬프트 엔지니링을 통해서 얻어낼 수 있는 결과물에는 차이가 없었고, 성능도 좋았지만 요금이 비교할 수 없을 만큼 저렴했습니다. 글로벌 언어로 번역해야 하는 서비스의 특성상 사용량이 늘어나는 것에 대한 대비는 매우 중요한 문제였습니다."

구글은 지난해 Google I/O 개발자 컨퍼런스를 통해서 모델의 크기가 큰 것이 전부가 아니라 적절한 모델을 선택하는 것이 더 낫다는 발표와 함께 겍코(Gecko), 오터(otter), 바이슨(Bison), 유니콘(Unicorn) 등 네 가지로 PaLM 2의 모델 크기를 구분했습니다. 꿈많은청년들은 이 모델들을 자연스럽게 선택해서 활용하면서 경험을 쌓았습니다.

"초기 두루미스는 바이슨 모델을 활용해서 번역을 시작했습니다. 세세한 프롬프트 엔지니어링을 적용할 수 있었고, 이를 바탕으로 적절한 톤 앤 매너를 바탕으로 매끄러운 번역 결과물을 얻어낼 수 있었습니다. 이후 더 큰 유니콘 모델이 등장하면서 모델을 간단히 바꾸어서 번역을 이어갈 수 있었습니다. 필요에 따른 모델 변화에 유연하다는 것도 만족스러웠습니다."

모델의 크기를 바꾸는 것은 아주 간단한 일이었고, API를 연결하는 부분만 바꾸면 아예 다른 모델로 전환하는 것도 가능했습니다. 꿈많은청년들이 초기에 고민했던 타사의 모델에서 PaLM 2로 이전하는 과정도 API의 연결을 바꾸는 간단한 작업으로 처리됐습니다.

이후 구글이 또 다른 생성 AI 모델인 Gemini를 내놓으면서 두루미스의 최종 언어 모델은 다시 업데이트가 이뤄졌습니다. PaLM 2에서 Gemini로 전환하는 과정은 역시 API 연결 고리만 바꾸는 것으로 매끄럽게 이뤄졌습니다. 이전은 간단했지만 효과는 대단했습니다. 당장 더 높은 수준의 대규모 언어 모델을 타 서비스에 비해 10분의 1 수준의 비용으로 활용할 수 있었습니다.

Gemini 모델은 TPU v4 인프라를 통해서 운영됩니다. 머신러닝 전용 프로세서인 TPU는 안정된 모델에 대해서 GPU에 비해 훨씬 저렴한 가격과 더 빠른 처리 속도를 자랑합니다. 서비스가 확대될수록 Gemini는 여느 대규모 언어모델과 비교할 수 없는 반응 속도와 안정성을 보여주면서도 비용을 낮추는 효과가 크게 와 닿았습니다.

"PaLM 2와 Gemini는 세세한 프롬프트 구조를 바탕으로 매끄러운 번역을 해 주었습니다. 각 언어의 현지인들도 편하게 읽을 수 있는 품질의 번역이 이뤄졌고 언어의 장벽 없는 블로그 서비스를 구상할 수 있었습니다. TPU 기반으로 운영되는 구글의 생성 AI는 기존 서비스들보다 10분의 1 비용으로 더 빠르고 안정적인 서비스를 마련해주었습니다."

PaLM 2부터 Gemini까지, 다양한 인공지능 모델 활용의 유연성

구글 클라우드가 제공하는 생성 AI는 여러 모델이 세세한 특성을 갖고 있습니다. PaLM 2는 언어에 특화된 모델이다 보니 텍스트를 섬세하게 다룰 수 있었습니다. 그 안에서도 유니콘 모델은 덩치만큼 성능이 뛰어나지만 바이슨 모델은 한 번에 받아들일 수 있는 텍스트의 양이 더 컸습니다. 정민석 CTO는 특히 Gemini가 등장과 함께 이전보다 폭넓은 생성 AI의 면모를 보여주었다는 점에 주목했습니다.

"Gemini가 PaLM 2와 비슷한 비용으로 더 다양한 활용이 가능했습니다. 한번에 넣을 수 있는 텍스트 양에 제한이 상당히 길고, 파이프라인을 체계적으로 짤 수 있습니다. 비용과 속도등 모든 측면에서 만족스러웠습니다."

Gemini와 PaLM 2는 번역에만 활용되는 것은 아닙니다. 이 인공지능 서비스들은 이용자가 블로그에 글을 쓰면 어떤 내용인지 파악해서 가장 적절한 카테고리로 분류해 줍니다. 또한 각 포스트는 머신러닝을 통해 해석되고, 글의 내용과 성격에 따라 벡터 검색을 통해 비슷한 글이 함께 추천됩니다. 이제까지의 블로그 서비스들은 글을 쓴 뒤에 적절한 카테고리를 설정하고, 관련 포스트들을 연결하는 등의 부가적인 일이 필요했지만 두루미스는 구글의 인공지능 기술을 이용해서 번거로운 작업들을 덜어냈습니다. 이용자는 글을 쓰는 데에만 집중하면 됩니다.

"서비스를 고도화하는 여러 아이디어 중에는 생성형 AI의 특성을 활용하는 것이 많이 있습니다. 블로그 글에서 가장 고민되는 것 중 하나는 독자들의 시선을 끄는 썸네일 이미지입니다. 이를 인공지능으로 적절히 꾸미는 것도 고민중입니다. Vertex AI 의 이미지 생성 AI인 Imagen을 이용해 글 내용에 적합한 이미지를 그려주는 것 역시 충분히 가능한 일입니다."

정민석 CTO는 구글의 대규모 언어 모델과 생성형 AI 서비스의 빠른 발전과 현실적인 요금 서비스를 통해서 제약 없이 더 나은 서비스를 고민할 수 있다고 말했습니다. 상상하던 것들이 더 빠르게 현실로 다가왔고, 이를 적용하는 데에 기술적, 성능적, 비용적 제약이 낮았기 때문입니다.

전 세계 대상으로 하는 매끄러운 글로벌 블로그 인프라

두루미스는 서비스를 시작한지 얼마 되지 않았지만 세계적으로 의미있는 성과를 내고 있습니다. 콘텐츠 크리에이터들에게 블로그는 하나의 고정된 무대이기 때문에 선택과 이전이 쉽지는 않습니다. 새로운 글을 올릴 수 있도록 하는 가장 큰 동력은 많은 독자들에게 읽히도록 하는 플랫폼의 힘입니다.

두루미스는 언어의 장벽을 깨고 전 세계의 동일 관심사의 사람들이 소통하도록 하는 것을 목표로 하는 만큼 이미 매끄러운 번역을 통해 주요 언어 시장에서 이용자들이 늘어나고 있습니다. 구글의 언어 모델이 제공하는 번역의 품질은 계속해서 발전하고, 꿈많은청년들 역시 점점 각 모델을 다루는 프롬프트의 노하우가 늘어나면서 글로벌 이용자들에게도 자연스럽게 읽히는 글을 만들어내고 있습니다.

두루미스는 인프라도 고도화되어 있습니다. 두루미스는 포스트를 올리면 Gemini와 PaLM 2 모델을 통해 미리 번역된 뒤에 이용자 각각의 웹브라우저에서 선택한 언어로 텍스트가 전달되는 구조입니다. 여느 블로그 서비스처럼 독자들이 콘텐츠를 클릭하면 빠르게 내용이 뿌려져야 합니다. 두루미스는 언어 번역 모델이 매끄럽게 운영되는 38개 언어로 사실상 전 세계로 서비스되고 있기 때문에 빠른 네트워크가 필요합니다.

꿈많은청년들은 이를 위해 적극적인 멀티 리전 구조로 운영하고 있습니다. 서울과 미국을 비롯해 싱가포르, 인도, 유럽 등 8개 리전을 통해 전 세계로 촘촘하게 콘텐츠를 실어나릅니다. 더 빠른 웹 페이지 로딩 속도가 우선적인 목표지만 이중화와 재해복구의 효과도 있었습니다.

"Google Kubernetes Engine을 비롯해 Cloud CDN and Media CDN과 Cloud SQL 등 속도에 예민한 서비스들의 성능을 위해 멀티 리전을 운영하고 있지만 북미 리전만으로 테스트했을 때도 대부분의 지역에서 지연 없이 게시물들을 띄워주었습니다. 기본적으로 구글 클라우드의 네트워크와 로드밸런스 기술이 뛰어나다는 것을 실감하고 있습니다."

서비스의 기본적인 구조는 Cloud Run과 Kubernetes를 바탕으로 운영됩니다. 데이터베이스에 연결되고 상시 운영되면서 복잡한 처리를 하는 작업은 Kubernetes Engine을 통해서 운영되고, 이미지 최적화나 CDN의 연동 등 데이터와 직접적으로 연결되지 않는 서비스는 Cloud Run을 이용합니다.

8개 리전의 데이터는 모두 실시간으로 동기화됩니다. 이를 모두 같은 환경으로 관리하는 것 역시 번거로운 일인데, 꿈많은청년들은 이를 Anthos로 통합했습니다. Anthos는 컨테이너의 배포와 정책 변경, 업데이트 등 모든 설정을 8번 반복하는 노력을 없애주는 것은 물론이고 운영 효율성이 높아지면서 인프라 비용을 줄이는 효과도 냈습니다.

정민석 CTO는 구글 클라우드와 인공지능의 만족도와 함께 지속적인 서비스의 진화를 생각할 수 있게 됐다고 말합니다. 비즈니스 그 자체에 집중하고 더 나은 서비스를 고민하면 구글 클라우드를 통해서 손쉽게 현실화할 수 있는 가능성을 경험했기 때문입니다.

"두루미스를 전 세계에 서비스할 수 있는 힘은 구글 클라우드와 함께 하면서 생겨났습니다. 인공지능과 매끄러운 글로벌 서비스를 통해 인터넷에서 가장 오래된 전통적 형태의 블로그 서비스에 새로운 가능성과 활기를 불어넣을 수 있었습니다. 구글 클라우드의 모든 환경은 세계 어디에서나 똑같은 서비스를 제공할 수 있게 해 주었고, 콘텐츠 크리에이터들에게 다양한 가능성을 열어주고 있습니다."

어떤 어려움을 겪고 계신지 알려주세요. Google Cloud가 도와드리겠습니다.

문의하기

Dream Youngs에 대하여

산업 분야: 과학 기술

위치: 대한민국

Kubernetes Engine Anthos Cloud Run Cloud Functions Cloud CDN Cloud SQL