JoongAng Ilbo logo

중앙일보: Vertex AI와 함께 AI 검색, 기사 요약 서비스, 미디어의 새로운 가치 만들어

Google Cloud 도입 효과
  • 지난 60년 기사 RAG로 AI 검색 서비스 구축

  • 기사 제목, 뉴스레터 등 생성형 AI 기반 업무 프로세스

  • 확장성 바탕으로 AI와 미디어 산업의 연결 고리 확인

중앙일보는 구글 클라우드의 Vertex AI를 활용하여 뉴스 검색, 기사 요약 등 다양한 AI 서비스를 도입하며 미디어 산업의 디지털 전환을 이뤘습니다. 중앙일보는 창간 이후 60년간의 방대한 뉴스 데이터와 Gemini를 결합해 AI 검색 서비스를 구축하고, 기사 작성 과정에서 AI와 함께 제목을 짓는 등 뉴스의 생산과 소비의 새로운 방법을 만들어 내고 있습니다.

중앙일보는 2024년 인공지능을 통해 뉴스를 폭넓게 검색하고 쉽게 더 많은 정보를 읽을 수 있는 AI 검색 서비스를 시작했습니다. AI 검색은 중앙일보가 대규모 언어 모델을 중심으로 한 인공지능 기술로 콘텐츠를 더 돋보이게 하려는 오랜 고민의 출발점이기도 합니다. 중앙일보는 AI 검색 서비스와 함께 'AI+중앙일보'라는 메시지를 내놓고 뉴스를 만들고 읽는 새로운 방법을 제시하고 있습니다.

'인공지능이 신문에서 해야 할 일은 무엇인가?'에 대한 고민

미디어 산업은 오랫동안 인공지능을 어떻게 활용할지에 대해 고민해 왔습니다. 지금도 기사를 쓰는 '인공지능 기자'를 먼저 떠올리곤 하지만 당장 기계가 기자를 대신하기는 어렵습니다. 오히려 그 외의 부분에서 가치를 찾으려는 노력들이 더 현실성을 보인다는 것이 중앙일보의 고민이었습니다.

인공지능은 새로운 기술이고, 지금도 빠르게 발전하고 있습니다. 단번에 답을 찾기에 인공지능의 발전 속도와 활용 영역은 너무 넓었습니다. 확실한 것을 기다리며 미루기 보다 인공지능 기술에 익숙해지면서 서서히 과정을 만들어가는 것이 옳다는 답을 내고 구글 클라우드와 함께 인공지능에 대한 고민을 본격적으로 시작했습니다.

처음 인공지능과 만난 접점은 수많은 정보를 읽기 쉽게 가다듬는 것이었습니다. 미디어 구성원들은 내부적으로 콘텐츠 생산을 위해 매일 수많은 콘텐츠를 찾아서 읽습니다. 하지만 정보량이 방대하기 때문에 늘 쫓기듯 읽어내려가는 경우가 많습니다. 언어를 이해하는 대규모 언어 모델이 성장하기 시작했고 인공지능이 수많은 정보를 빠르게 찾고 언어의 장벽을 넘어 맥락을 읽는 데에 도움을 줄 수 있다고 기대했습니다.

정진환

IT서비스본부장

중앙일보 IT서비스본부 정진환 본부장은 인공지능이 익숙하지 않은 단계에서 Vertex AI를 도입하고 프로젝트를 시작했지만 기대보다 더 좋은 결과물을 내어 주었다고 말합니다. Gemini를 비롯한 대규모 언어 모델의 언어 이해도는 생각보다 훨씬 높은 수준이어서 학습이나 튜닝에 대한 부담을 덜어내고 기대하는 결과물을 빠르게 얻어낼 수 있었습니다.

막연함에서 시작했지만 '할 수 있다'는 가능성을 확인한 것입니다. 정진환 본부장은 프로젝트가 완성 단계로 접어들면서 Vertex AI로 할 수 있는 일들을 명확히 알게 됐고, 현실적이면서도 새로운 아이디어가 떠오르기 시작했다고 강조했습니다.

본격적으로 인공지능을 중앙일보 내에 반영할 수 있는 방법들을 모으기 시작했습니다. 어떻게 활용할지에 대한 접근은 두 가지 측면으로 분류할 수 있었습니다. 한 가지는 독자들을 대상으로 하는 서비스, 그리고 다른 한 가지는 기사와 콘텐트를 만드는 과정에 활용하는 것입니다.

지식, 정보 담긴 기사 속에서 통찰력 얻어내는 AI 검색

"지난 구글I/O 2024에서 공개된 구글 AI Overview는 매우 인상적이었습니다. AI Overview는 주제어에 대해서 다양한 정보를 실시간으로 검색하고 이를 바탕으로 완성된 정보를 보여주는 다음 세대의 검색 서비스입니다. 언론사의 웹사이트에서 이용자들이 원하는 것 역시 정보를 검색하고, 이를 통해 적절한 견해와 통찰력을 갖게 되는 것입니다. AI Overview는 중요한 영감을 제공했습니다."

한용수 백엔드개발팀 팀장은 AI Overview의 검색 결과가 상당히 인상적이었다고 말합니다. 흩어져 있는 정보들을 하나로 모으는 통찰력은 기사를 검색하는 독자들이 궁극적으로 원하는 목표라고 봤기 때문입니다.

"AI Overview는 범용 검색 서비스이다 보니 특정 주제에 대해서는 다소 조심스러운 반응을 보이기도 했습니다. 언론사 입장에서는 직접적이고 명확한 답이 필요했는데 검색 범위를 중앙일보가 기존에 만들어 낸 기사로 좁히면 정확하면서도 적극적인 답을 꺼낼 수 있을 것이라는 생각으로 이어졌습니다. 중앙일보의 'AI 검색' 서비스는 이렇게 '뉴스에 대해서는 우리가 더 좋은 통찰력을 제공할 수 있지 않을까?'라는 생각에서 출발했습니다."

인공지능은 뛰어나지만 그 자체로 완전한 결과물을 만들어주지는 않습니다. 새로운 정보 습득의 한계나 엉뚱한 답을 만들어내는 환각까지 불완전한 모습들을 일반 이용자들을 대상으로 하는 서비스에 꺼내 놓을 수는 없었습니다. 먼저 내부적으로 활용하면서 능숙하게 다루는 방법을 익히기로 했습니다.

그 과정에서 인공지능의 환각에 대응하는 방법도 답을 찾을 수 있었습니다. 중앙일보의 뉴스를 학습시키고, 해당 도메인의 데이터에 대해서만 검색과 생성이 이뤄지도록 한정하는 방법으로 정확도를 크게 높일 수 있었습니다. 일종의 검색 증강 생성(RAG, Retrieval-Augmented Generation)의 출발점인 셈입니다.

60년 동안의 기사를 학습해 RAG를 구축했습니다. 자연어 검색이 입력되면 Gemini는 의도를 파악해서 Vertex AI Search를 통해 적절한 기사를 찾아내고 Gemini는 다시 그 내용을 담아내는 글을 매끄럽게 만들어 냅니다.
60년 동안의 기사를 학습해 RAG를 구축했습니다. 자연어 검색이 입력되면 Gemini는 의도를 파악해서 Vertex AI Search를 통해 적절한 기사를 찾아내고 Gemini는 다시 그 내용을 담아내는 글을 매끄럽게 만들어 냅니다.

AI 검색은 Vertex AI의 Vertex Search를 중심으로 설계했습니다. 먼저 자연어로 입력된 질문에 대해서 Function Calling을 통해 Gemini를 불러 의도를 파악하는 과정이 이뤄집니다. Gemini는 정확한 내용을 바탕으로 Vertex Search에서 관련성이 높은 기사들을 검색합니다.

검색 결과를 문장으로 생성하는 과정에서 가장 어려웠던 것은 '시점'이었다고 합니다. 중앙일보는 지난 60년 분량의 기사를 모두 구글 클라우드에 학습시켰습니다. 사실상 우리나라의 모든 순간이 압축되어 있기 때문에 그 사이에 비슷한 키워드로 해석되는 일들이 함께 검색될 수 있습니다. 또한 모든 기사는 그 순간, 현재 상태를 기록하기 때문에 대규모 언어 모델이라고 해도 문장만 보면 모든 글이 '오늘'처럼 같은 시점으로 읽을 수밖에 없습니다.

중앙일보는 이를 해결하기 위해서 시점을 해석하는 에이전트를 만들어서 각 기사가 작성된 날짜, 그리고 그 내부 문장들이 가리키는 시점에 대해서 적절하게 파악할 수 있도록 했습니다. 이를 통해서 정확한 시점의 기사들을 추려낼 수 있기 때문에 의도에 맞는 정보 추출의 정확도가 크게 높아집니다. 이렇게 모인 기사들을 다시 Gemini를 통해 요약, 정리하도록 해서 결과적으로 자연어 대화 형태의 매끄러운 정보를 제공할 수 있게 됐습니다.

AI 검색은 '뉴스에 대해서는 우리가 더 좋은 통찰력을 제공할 수 있지 않을까?'라는 생각에서 출발했습니다. 이제까지 만들어 온 기사들을 바탕으로 Vertex AI에 정보를 모으고 Gemini로 내용을 정리하면서 환각을 비롯한 정보의 오류 없이 정확하고 적극적인 정보를 만들어낼 수 있었습니다.

한용수

백엔드개발팀 팀장

인공지능으로 더 나은 기사를 만드는 과정

기사 생산에 대한 부분도 다시 가다듬었습니다. 으레 미디어와 생성형 AI의 결합을 '인공지능 기자'로 떠올릴 수 있지만 여전히 기사는 기자들의 현장 취재를 통해 만들어지고, 그 과정에서 가치가 생깁니다. 중앙일보는 직접 기사를 만드는 것보다 인공지능을 통해 기사를 더 돋보이게 하는 방법을 고민했습니다. 그 중 한 가지는 제목입니다.

"Vertex AI와 Gemini를 통해 기사의 내용을 효과적으로 담아내는 제목을 지을 수 있도록 구성했습니다. Gemini는 여느 대규모 언어 모델들과 비교했을 때 한글에 대한 이해도가 높아서 왜곡 없이 매끄러운 결과를 만들어 주었습니다. 적절한 길이와 톤을 잡도록 설계해서 단숨에 기사를 설명하는 제목을 제안하도록 설계했고, 이를 기사 편집 시스템에 붙이는 과정까지 매끄럽게 이뤄졌습니다."

기사 편집 시스템에서 버튼을 누르면 Vertex AI는 기사 내용을 읽어들이고 Gemini를 통해 적절한 제목 몇 가지를 제안합니다. 물론 Gemini가 만든 제목이 그대로 기사와 함께 나가는 것은 아니고 편집국에서 검토와 수정을 거쳐서 출고되는 시스템입니다.

정수민 서비스기획팀 차장은 제목이 기사를 한 줄로 표현해서 독자의 눈길을 끌고, 긴 글을 편하게 읽을 수 있도록 이끌어주는 역할을 한다는 원칙에 충실해야 한다는 관점에서 Gemini를 활용하기 시작했습니다. 쉽게 읽어 넘기는 것이 제목이지만 사실 이를 만드는 과정은 생각보다 많은 고민이 필요합니다. 정수민 차장은 Vertex AI와 Gemini에 적절한 프롬프트를 통해 큰 틀을 잡아주면서 제목을 결정할 수 있도록 설계했습니다.

"실제 편집국에서 Vertex AI를 이용한 기사의 최종 제목은 Vertex AI가 만든 제목과 70% 이상의 유사도를 보였습니다. 중요한 단어와 문구들이 제안되고 있고 그 안에서 적절한 문장 길이와 톤을 손 보는 정도로도 적절한 제목이 만들어지고 있다고 볼 수 있습니다."

중앙일보는 현재 Vertex AI의 언어 모델로 Gemini 1.5 Pro를 주로 이용하고 있습니다. 있습니다. 아무래도 단어를 기반으로 데이터베이스를 찾는 키워드 검색과 달리 AI 검색은 여러 머신러닝 모델을 복합적으로 활용하기 때문에 어느 정도의 처리 시간이 필요합니다. 조금 더 빠른 Gemini 1.5 Flash 모델을 쓸 수도 있었지만 최신 모델인 Gemini 1.5 Pro를 통해 원하는 수준의 결과물을 좀 더 쉽게 만들어낼 수 있었고, 세세한 프롬프트를 통해서 더 나은 결과물들이 얻어졌습니다.

AI 검색의 검색 결과가 나오는 과정은 키워드 검색보다 오래 걸리기 때문에 처음에는 빠른 모델을 고민하기도 했습니다. 하지만 AI 검색을 이용하면 원하는 정보를 얻기 위해 여러 번 검색하는 과정이 사라지고 전체적인 내용을 한 눈에 볼 수 있게 요약해주기 때문에 결과적으로 검색을 통해 얻으려는 정보를 더 빠르게 얻을 수 있었습니다. 그래서 약간의 로딩 차이라면 더 좋은 결과를 만들어주는 Gemini 1.5 Pro 모델을 선택했고, 실제 독자들의 만족도도 높았습니다.

정수민

서비스기획팀 차장

생성형 AI의 로딩에 대한 부분은 늘 서비스 개발 부서의 고민입니다. 로딩이 길어지면 이용자들이 기다리다가 서비스를 벗어날 수 있기 때문입니다. 반면 속도를 높이면 비용이나 정확도에서 아쉬움이 남을 수 있습니다. 한용수 팀장은 AI 검색이 주는 가치를 ‘최종적인 통찰력 전달’로 꼽았고 약간의 시간적인 손해가 있어도 전체적인 경험을 높이는 방법인 셈입니다.

구축과 운영이 이뤄지는 동안 모델을 다루는 방법에 대한 경험도 늘었습니다. 완벽한 모델에 기대기보다 각 모델을 적절하게 설계하고 프롬프트를 최적화하는 것이 최종 결과물에 대해 더 큰 영향을 끼칠 수 있다는 것을 알게 됐습니다. Vertex AI는 모델의 선택이 자유롭고, 다양한 방법으로 실험하면서 최적화할 수 있는 환경을 제공해 주어서 앞으로 나올 모델과 지속적인 프롬프트의 확장에 대한 기대가 큽니다.

Vertex AI는 Gemini의 여러 버전이 모두 담겨 있고, 그 외에도 갖가지 인공지능 모델들이 준비되어 있기 때문에 같은 조건 안에서 다양한 모델만 바꾸어가며 적합성을 판단할 수 있습니다. Gemini 2.0를 비롯한 모델 업데이트로 중앙일보의 인공지능 서비스가 한 발짝 더 나아가고 더 나은 모델을 통해 새로운 서비스를 개발할 수 있다는 기대도 갖고 있습니다.

인공지능을 다루는 경험이 만들어낸 혁신, AI 미디어의 새로운 가능성

전체적으로 Gemini의 언어적 능력은 탁월했습니다. 특히 요약 결과물은 다른 언어 모델과 비교가 의미 없을 정도였습니다. 요약이 매끄럽게 이뤄지면서 뉴스레터도 인공지능을 통해 제작하고 있습니다. 뉴스레터는 Gemini 1.5 Pro를 이용해 신문의 1면부터 5면까지의 주요 기사를 한 눈에 들어오게 요약하는 것으로 시작합니다. 미리 설계한 프롬프트에 따라서 적절한 톤과 분량의 결과물을 만들어 줍니다.

물론 그 결과물이 그대로 외부에 나가지는 않습니다. 반드시 검수를 통해 내용에 왜곡이 없는지, 부적절한 단어가 쓰이지 않았는지 확인하는 과정을 거쳐 뉴스레터가 완성됩니다. 하지만 대부분의 경우 기사의 의도를 잘 파악한 요약글이 지어지기 때문에 뉴스레터를 만드는 과정이 간소화되었습니다. 

60년 동안 쌓여 온 수많은 기사를 모두 스토리지에 적재해야 했습니다. 클라우드 스토리지와 BigQuery는 모든 데이터를 안정적으로 저장하면서도 인공지능을 위한 워크로드가 매끄럽게 연결되어 있습니다. 특히 데이터 분석과 학습을 잘 하려면 전처리가 매우 중요하다는 것이 한용수 팀장의 설명입니다.

"AI 검색을 준비하는 과정에서 데이터의 전처리가 중요하다는 것을 알게 됐습니다. 머신러닝 모델이 효과적으로 받아들이고, 정확한 검색 결과를 얻을 수 있도록 하는 필수 과정입니다. 데이터 전처리가 잘 이뤄진 이후로는 Vertex AI의 모든 과정이 순조로웠습니다."

언론사가 만들어내는 뉴스는 시의성과 속도가 중요합니다. 그러다 보니 공들여 만든 기사들이 관심을 받는 시간은 몇 시간에 그칠 정도로 짧습니다. 하지만 기사들은 언론사의 가장 큰 자산이고, 이 기사들이 모여서 만들어내는 지식은 큰 가치를 갖고 있습니다. 그 가치를 만들어내는 것이 미디어의 온라인 서비스입니다. Vertex AI를 통해 인공지능을 접목하면서 과거의 기사들이 다시 읽히게 되고, Gemini를 통해 새로운 지식 정보로 재가공되고 있습니다.

다른 한편으로는 인공지능의 뛰어난 언어 능력 때문에 콘텐츠 제작 역할을 대체하는 것에 대한 걱정과 고민이 많습니다. 언어 모델을 갖고 있는 기업들이 더 좋은 기사를 만들어낼 수 있다는 이야기까지 나오고 있으니 말입니다. 하지만 정진환 본부장은 실제로 Vertex AI를 통해 언어 모델과 인공지능 기술을 접하면서 인공지능의 역할과 역량에 대해서 이해도가 높아졌다고 말합니다.

"언론사의 근본적인 역할은 올바른 정보를 수집하고, 가치 판단을 통해 적절한 정보를 전달하는 것이라고 봅니다. 인공지능은 업무의 간소화가 아니라 제작을 더 잘 할 수 있도록 부가적인 가치를 만드는 데에 있습니다. 사람에게 관심을 기울이고, 이야기를 귀담아 듣는 것에서 기사는 시작됩니다. 여기에 현재의 사건들과 과거의 기록을 더하는 것으로 더 큰 가치를 만들어내는 것에 주목하고 있습니다."

결국 인공지능이 특정 업무나 직군을 대체한다는 우려보다는 인공지능 기술을 잘 다루는 기업과 사람들이 가치를 더 높여가는 것이라는 확신을 갖게 됐습니다. 정진환 본부장은 인공지능 기술을 직접 다뤄보지 않았다면 지금도 사내에서는 인공지능에 대한 불안감부터 대규모 언어 모델을 직접 만들어야 할 지에 대한 고민까지 생각만 맴돌고 있었을 것이라고 말합니다.

중요한 것은 인공지능을 활용할 아이디어와 실제 다루는 경험에 있다는 이야기입니다. 구글의 AI에 대한 목표 역시 인공지능 기술 그 자체가 아니라 누구나 인공지능 기술로 새로운 영감을 떠올리고 역량을 강화해 각자의 분야에서 문제를 해결하고 새로운 기회를 만드는 데에 있습니다. 'AI+중앙일보'와 Vertex AI의 만남은 인공지능이 가야 할 방향성을 잘 보여주고 있습니다.

Vertex AI를 통해서 얻은 가장 큰 가치는 기술의 역량을 정확히 읽고, 더 나은 콘텐츠 제작과 비즈니스의 방향을 인공지능과 함께 고민하게 됐다는 점입니다. 긍정적인 부분과 부정적인 부분을 판단할 수 있는 시야가 생기면서 더 큰 그림이 그려지고 있습니다. 구글 클라우드와 Vertex AI는 빠르고 안전하게 인공지능을 서비스에 접목할 수 있는 기회였습니다. 그 여정을 함께 하고 있는 구글 클라우드는 앞으로의 미디어 산업 변화를 함께 고민하는 훌륭한 파트너입니다.

정진환

IT서비스본부장

중앙일보

중앙일보는 1965년 창간된 대한민국 대표 종합일간지입니다. 정치, 경제, 사회 등 다양한 분야의 뉴스를 심층적으로 다루며, 신뢰도 높은 보도로 독자들의 신뢰를 얻고 있습니다. 중앙그룹의 핵심 계열사로, 신문뿐만 아니라 방송, 출판 등 다양한 미디어 사업을 통해 양질의 정보를 제공하고 있습니다.

산업 분야: 미디어 및 엔터테인먼트

위치: 대한민국

사용된 제품: Vertex AI, Gemini, BigQuery


Google Cloud 파트너 정보: GS네오텍

GS네오텍은 Google Cloud의 최상위 티어 파트너사로서 AI 도입부터 운영, 보안까지 안정적인 운영을 돕고 있습니다. GS네오텍만의 경험과 노하우로 고객 비즈니스 결과 극대화를 위한 전략과 로드맵을 제공하겠습니다.

Google Cloud 파트너
  • GS네오텍 logo
Google Cloud
콘솔
Google Cloud