넥슨 : Vertex AI 기반 유해 이미지 탐지로 게임 최적화된 콘텐츠 관리 환경 구축
NEXON에 대하여
넥슨은 1994년부터 메이플스토리, 카트라이더, 던전앤파이터 등 수많은 게임을 개발, 운영하고 있습니다. 국내를 넘어 190여개 국가에서 19억 게이머가 PC 뿐 아니라 모바일과 콘솔 게임기를 통해 넥슨의 게임 세상을 만나고 있고 있습니다. 넥슨은 언제나 즐겁고 혁신적인 콘텐츠로 게이머들에게 최고의 경험을 제공한다는 목표를 바탕으로 끊임없이 새로운 시도를 이어갑니다.
어떤 어려움을 겪고 계신지 알려주세요. Google Cloud가 도와드리겠습니다.
문의하기넥슨은 전 세계 19억 이용자들에게 게임 서비스를 제공합니다. 소통이 중요한 요소인 온라인 게임은 이용자가 늘어남에 따라 각 연령대의 게이머들에게 적절하지 않은 콘텐츠가 공유되기도 합니다. 넥슨은 이 유해 콘텐츠를 빠르고 정확하게 골라내기 위해 Vertex AI 기반의 탐지 시스템을 개발했습니다. Vertex AI는 게임에 적절한 모델을 선정하고 학습할 수 있도록 다양한 지표를 주었고, 손쉬운 최적화 환경을 제공해 효과적으로 유해 이미지들을 골라 낼 수 있는 환경을 만들었습니다.
구글 클라우드 사용 효과
- 게임 콘텐츠에 최적화된 AI 모델로 높아진 탐지 정확도
- 멀티모달 탐지를 통해 콘텐츠 안전성 확보
- 직접 구성한 데이터 기반의 AI 모델 학습 환경
게임 환경에 최적화된 유해 이미지 탐지 시스템으로 안전한 커뮤니티 환경 구축
넥슨은 1994년부터 게임을 개발하고 퍼블리싱해 온 게임 전문 기업입니다. 메이플 스토리부터 던전앤파이터, 카트라이더 등 오랜 히트작부터 최근의 데이브 더 다이버까지 다양한 시도를 통해 게임의 영역을 넓히며 50여 가지 게임으로 전 세계 19억 명의 게이머들과 만나고 있습니다.
게임은 기술의 변화와 발전을 가장 예민하게 반영하는 분야입니다. 최근의 인공지능 흐름도 빠질 수 없습니다. 넥슨은 구글 클라우드와 함께 인공지능 기술을 게임에 접목하는 방법을 고민해 왔습니다. 인공지능을 이용해 더 나은 게임 경험을 만들 수 있는 다양한 사례들을 연구하면서 가장 쉽게 접근할 수 있는 방법으로 이미지 해석을 선택했습니다.
온라인 게임은 수많은 사람이 동시에 접속하고, 서로 커뮤니케이션을 통해서 게임을 이끌어가기 때문에 다양한 소통 수단이 뒤따릅니다. 이 커뮤니케이션을 통해 게임은 하나의 독자적인 세상으로 자리를 잡게 됩니다. 대부분의 이용자들은 게임을 더 즐겁게 하는 내용들을 올리지만 때로는 게이머들의 나이에 적합하지 않거나 보편적으로 다른 이용자들에게 불쾌감을 줄 수 있는 게시물이 올라오기도 합니다.
특히 외설적이거나 폭력적, 부적절한 게시물들이 노출되면 순식간에 피해가 퍼질 수 있습니다. 넥슨이 구글 클라우드의 인공지능 기술과 함께 하기로 결정한 첫 번째 프로젝트는 바로 게임과 커뮤니티 내에서 공유되는 유해 이미지 탐지였습니다.
넥슨이 개발과 퍼블리싱, 운영을 하는 게임은 매우 많고, 또 지속적으로 업데이트와 신작 추가가 이어지기 때문에 이용자들이 올리는 게시물과 이미지도 매달 1백만 건에 달할 만큼 많습니다. 이 내용을 모두 운영자가 직접 열어보고 유해 내용을 판단하는 일은 쉽지 않습니다.
또한 다른 이용자들에게 피해를 주는 콘텐츠는 운영자에게도 스트레스를 주기 때문에 되도록이면 직접적인 노출을 줄일 필요도 있습니다. 스스로 게시물의 부적절한 내용을 골라내주는 인공지능은 게시물들을 가장 효과적으로 운영하는 방법이었습니다.
게임에 꼭 맞는 맞춤형 유해 콘텐츠 탐지 기술 필요
이미 넥슨은 자체적으로 콘텐츠의 유해 이미지를 탐지하는 인공지능 기반 솔루션을 개발해서 운영하고 있었습니다. 하지만 늘 정확도에 대한 고민이 있었습니다. 잘못된 내용이 유해 콘텐츠로 선별되기도 하고, 골라내야 할 콘텐츠가 탐지되지 않는 경우도 있기 때문입니다. 인공지능도 100% 골라낼 수는 없지만 그 정확도가 학습을 통해서 꾸준히 높아지는 과정이 중요합니다.
게임이라는 특수성도 인공지능 모델 운영을 어렵게 하는 요인입니다. 무엇보다 게임마다 이용자들의 나이 제한이 다르고, 그에 따른 유해 콘텐츠의 선별 기준도 다릅니다. 나이별로 명확한 법적 기준이 세워져 있는 것은 아니어서 내부의 정책을 잘 이해하는 운영자들의 능력이 콘텐츠 관리의 중요한 부분이자 어려운 점이기도 했습니다. 동시에 지속적으로 진화하는 유해 게시물의 표현도 이해해야 했습니다.
또한 게임의 특성상 캐릭터의 디자인이 인공지능 모델의 오해를 사기도 합니다. 결국 게임은 여느 콘텐츠들의 유해성 선별과 다른 방법으로 접근이 필요했습니다. 하지만 세이프 서치를 비롯한 일반적인 유해 콘텐츠 검출 방식은 최적화와 별도 학습이 어려웠습니다. 결국 직접 데이터셋과 모델의 튜닝을 결정할 수 있는 인공지능 솔루션이 필요했습니다. 구글 클라우드와 Vertex AI 는 가장 효율적으로 답을 찾아낼 수 있는 방법이었습니다.
"구글 클라우드와 함께 직접 학습과 파라미터 최적화를 쉽게 할 수 있는 인공지능 모델을 찾았습니다. 다양한 시나리오에 적용할 수 있는 모델을 리서치하고 구글 클라우드 내에서 직접 학습과 테스트가 이뤄졌습니다. 구글 클라우드는 각 모델의 실험 데이터를 정교하게 제공했고, 이를 바탕으로 최적의 환경을 판단할 수 있었습니다."
넥슨코리아 선행개발실 장창완 실장은 최적화된 모델을 직접 판단하고 결정할 수 있다는 점이 Vertex AI가 눈에 띄는 강점이라고 설명합니다. 넥슨은 명확한 기준과 운영 경험을 바탕으로 인공지능 모델의 방향성을 결정했고, 이를 받아들일 수 있는 Vertex AI는 최적의 환경이었습니다.
"Vertex AI의 Model Garden에서 선택할 수 있는 클립(CLIP)을 선택했습니다. 도입 전에 여러 모델을 지속적으로 테스트했는데, 클립은 무엇보다 멀티모달 해석에 최적화가 되어 있었습니다. 이미지를 그 자체로 인식하기도 하지만 동시에 이미지의 맥락을 읽어서 내용을 텍스트와 태그 형태로 뽑아내 줍니다."
Vertex AI의 Model Garden은 기업들이 쉽게 활용할 수 있는 모델을 선별하고 맞춤 설정해주는 서비스입니다. 넥슨코리아가 Model Garden에서 선택한 클립 모델은 결과적으로 이미지와 텍스트를 함께 해석하기 때문에 이미지의 맥락을 더 정확하게 이해할 수 있게 됐습니다. 이미지만 보고 판단하던 것과는 확연히 탐지의 품질이 좋아졌고, 미탐지와 오탐지 자체도 크게 줄일 수 있는 기반이 갖춰져 있었습니다.
"구글 클라우드와 함께 직접 학습과 파라미터 최적화를 쉽게 할 수 있는 인공지능 모델을 찾았습니다. 다양한 시나리오에 적용할 수 있는 모델을 리서치하고 구글 클라우드 내에서 직접 학습과 테스트가 이뤄졌습니다. 구글 클라우드는 각 모델의 실험 데이터를 정교하게 제공했고, 이를 바탕으로 최적의 환경을 판단할 수 있었습니다."
모델 선택부터 학습 데이터까지 유연성 확보
기존의 AutoML 이나 세이프 서치와 달리 필요한 데이터셋을 직접 활용한 학습도 이뤄졌습니다. 자체적으로 수집한 이미지 뿐 아니라 애니메이션과 게임에 특화되어 있는 데이터셋을 이용해 모델을 학습시켰습니다. 수 십 테라바이트 수준의 데이터를 학습시키는 것에 대한 부담이 있었는데 구글 클라우드의 컴퓨팅 파워와 구글의 노하우를 통해서 적절한 데이터셋을 효과적으로 학습시킬 수 있었다고 설명합니다.
"이미지는 담고 있는 정보량이 텍스트에 비해 많습니다. 전체적인 맥락부터 화면을 구성하는 픽셀을 모두 읽어내고, 색을 표현하는 RGB 채널도 해석해야 합니다. 대용량 처리 기술이 필요했는데, 단순히 컴퓨팅 성능에만 의존하는 것이 아니라 학습에 알맞는 최적의 데이터셋을 꾸릴 수 있도록 했습니다."
최종적으로는 모델이 TensorFlow 환경에서 운영되도록 했습니다. 모델의 데이터 학습과 실험은 모두 구글 클라우드 내에서 운영되어서 빠르게 필요한 내용들을 확인하고 반영할 수 있었습니다. 이렇게 만들어진 모델은 TensorFlow로 추출해서 각 게임에 직접 반영됩니다. 모델이 직접 배포, 적용되기 때문에 넥슨이 직접 개발하는 게임 외에도 외부 스튜디오가 제작하고 넥슨이 퍼블리싱하는 게임에도 쉽게 적용할 수 있습니다.
"AI 모델은 학습하면서 결과를 예민하게 살펴서 어떤 결과가 나오는지 검증과 수정을 반복하면서 고도화해야 합니다. 구글 클라우드는 이 실험 보고서를 정교하게 제공해 주었습니다. 학습 데이터가 모델에 얼마나 적합하게 반영되었는지를 알려주기 때문에 필요한 요소들을 빠르게 수정해서 모델에 다시 반영할 수 있었습니다."
장창완 실장은 적용과 운영이 이뤄지는 과정에서도 세세한 최적화로 정확도를 꾸준히 높일 수 있다는 부분을 강조했습니다. 모델의 정확도를 높이기 위한 파라미터 튜닝은 정교한 작업이 필요합니다. 하나하나의 과정은 단순하지만 반복적으로 값을 바꿔가며 답을 찾아야 하기 때문에 시간과 노력이 많이 들어가는 과정입니다. Vertex AI는 모델의 파라미터가 끼치는 영향을 스스로 해석해서 어떤 파라미터가 영향을 끼치고, 최적화에 어떤 영향을 끼치는지도 알려줍니다. 전체적으로 모델의 운영 전체가 자동화와 시각화되어서 원하는 답을 빠르게 찾아내는 과정을 통해 완성도가 높아지는 고도화가 이뤄지는 것입니다.
학습의 속도도 빨랐습니다. Vertex AI는 충분히 빠른 학습 속도를 제공해 주었고, 필요하면 더 많은 인스턴스를 활용해 속도를 끌어올려도 비용에 대한 부담이 늘어나지 않았습니다. 결과적으로 학습이 프로젝트의 진행에 발목을 잡지 않았습니다.
구글 클라우드, 인공지능 기술 적용에 확신 주는 경험
현재 넥슨의 유해 이미지 탐지는 Vertex AI로 중심을 옮겨가고 있지만 여전히 AutoML에 대한 가능성도 열어놓고 있습니다. Vertex AI의 모델은 최적화가 쉽고 정확도를 높일 수 있는 여지가 많이 있지만 AutoML의 범용성과 빠른 적응성도 큰 강점입니다. 이를 융합해서 단기적으로 빠르게 대응해야 하는 프로젝트부터 높은 정확성이 필요한 일까지 유연하게 대응할 수 있도록 할 계획입니다.
"정확도를 높이기 위해서 모델의 규모를 키우는 것을 먼저 떠올릴 수 있는데, 모델이 커지는 것에 비해서 속도와 정확성, 적용 편의성에 대한 이점이 크지 않기 때문에 현업에서는 막연히 정확성만을 위해서 큰 모델을 운영하는 것에 부담을 갖게 됩니다. 하지만 Vertex AI는 모델의 규모가 커져도 속도나 운영 편의성이 전혀 떨어지지 않았기 때문에 더욱 적극적으로 활용할 수 있었습니다."
정확도가 높아지면서 업무에 대한 부담도 크게 줄었습니다. 잘못 분류되는 내용에 대해서는 빠르게 판단하고 다시 학습을 통해 실수가 반복되지 않을 수 있고, 콘텐츠 제공과 관리에 대한 걱정을 덜어낼 수 있었습니다. 운영자들에게 노출되는 유해 이미지도 줄어들며 건강에 대한 우려를 크게 덜어냈습니다.
넥슨은 더 큰 가능성을 기대하고 있습니다. 현재 활용하고 있는 클립 모델은 지금 상황에서 가장 적합하다고 판단하고 있지만 지금 이 순간에도 구글 클라우드에는 수많은 새 인공지능 모델이 공유되고 있습니다. 인공지능 기술의 흐름은 몇 달을 내다볼 수 없을 만큼 빠른데 Vertex AI는 가장 큰 장벽인 리서치와 튜닝에 대한 장벽이 없어서 언제든 더 나은 최신의 모델을 검토하고 서비스에 적용하는 모든 과정의 가능성이 열려 있습니다.
장창완 실장은 구글 클라우드와 Vertex AI를 이용한 프로젝트를 진행하며 전체적인 인공지능 관련 선행 기술에 자신을 갖게 됐다고 말합니다. 기술의 도입과 운영에 대한 부담은 적고 막연한 과정에 대한 다양한 지원이 있었기에 원하는 답을 얻어낼 수 있었고, 더 적극적으로 활용할 수 있다는 확신을 갖게 됐기 때문입니다.
"구글 클라우드는 인공지능 전문 부서가 적극적으로 문제를 함께 고민하고 전문 컨설턴트와 엔지니어가 함께 문제를 해결해 가는 일련의 과정이 인상깊었습니다. 클라우드는 완성된 제품을 중심으로 쓴다는 생각이 있었는데 전혀 반대의 경험이었습니다. 이를 바탕으로 더 많은 영역에 인공지능 기술들을 적극적으로 활용할 수 있다는 가능성을 확인할 수 있었습니다."
어떤 어려움을 겪고 계신지 알려주세요. Google Cloud가 도와드리겠습니다.
문의하기NEXON에 대하여
넥슨은 1994년부터 메이플스토리, 카트라이더, 던전앤파이터 등 수많은 게임을 개발, 운영하고 있습니다. 국내를 넘어 190여개 국가에서 19억 게이머가 PC 뿐 아니라 모바일과 콘솔 게임기를 통해 넥슨의 게임 세상을 만나고 있고 있습니다. 넥슨은 언제나 즐겁고 혁신적인 콘텐츠로 게이머들에게 최고의 경험을 제공한다는 목표를 바탕으로 끊임없이 새로운 시도를 이어갑니다.