‘딥러닝 기술’, 금칙어로 못 막는 게임 욕설 분류

욕설은 유저들이 게임 내에서 겪는 가장 불쾌한 경험 중 하나다.

대부분의 게임들이 금칙어 기반의 제재 시스템을 구축하고 폭언과 욕설을 일삼는 유저들에 처벌을 가하고 있지만, 시스템의 구조적 한계와 문제점으로 인해 관리자들의 피로도가 상당한 편이다.

‘딥 러닝으로 욕설 탐지하기’라는 주제로 강연을 진행한 넥슨코리아 인텔리전스랩스 어뷰징탐지팀 조용래 연구원은 금칙어 기반 시스템의 문제점으로 3가지를 지적했다.

첫 번째는 우회가 쉽다는 점이다. 중간에 다른 문자를 섞어 욕설을 할 수 있기 때문이다. 두 번째 문제는 잦은 오탐이다. 금칙어로 욕설을 판별하다다 보니 일반적으로 사용하는 단어와 비속어를 구분하는데 한계가 존재한다.

마지막은 비속어와 공격적인 표현을 구분하기 어렵다는 점이다. 공격적이지 않은 자연스러운 비속어가 제재되는가 하면, 반대로 비속어를 사용하지 않고 공격적인 표현을 사용할 경우 제재하지 못하는 상황이 발생한다.

결과적으로 욕설 신고를 받은 운영자가 직접 텍스트를 읽고 판단하는 프로세스로 시간이 많이 소요되며, 텍스트를 읽고 판단하는 관리자의 스트레스가 상당하다.

조 연구원은 “운영자의 수고를 더는 것이 목표다. 신고된 텍스트를 추출 및 정렬해서 사람이 읽기 좋은 형태로 만들어 좀 더 나은 환경을 만드는 것을 지향한다.”라며 딥 러닝 기술로 욕설을 탐지하게 된 이유를 설명했다.

딥 러닝 기반 욕설 탐지 기술은 ‘데이터’, ‘모델링’, ‘해석’의 3가지 과정을 거쳐 개발됐다. 이 작업은 고도화를 거쳐 반복적으로 작용한다.

데이터는 ‘안녕하세요’, ‘즐겜하세요’는 ‘정상’, ‘게임 ㅈ같이 하네’는 ‘욕설’ 같이 태그를 다는 방식이며, 모델링은 CNN(Convolutional Neural Network)을 활용했다. 특히, 욕설을 자음과 모음으로 분류하고 이를 쉽게 분류하기 위해 숫자로 변환했다. 해석은 LIME이라는 알고리즘을 사용했다. LIME은 텍스트에서 글자를 번갈아 빼면서 욕설을 판단하는 방식을 빠르고 효율적으로 진행할 수 있게 도움을 준다.

딥 러닝 기반의 욕설 탐지 기술은 넥슨의 슈팅게임 ‘서든어택’에 시범적으로 적용됐다. 조 연구원은 “1분 당 모니터링 건수를 비교한 결과 기존 프로세스가 1분당 23건의 신고를 확인했는데, 딥 러닝 기반의 욕설 탐지기를 사용했을 때 35건을 확인했다. 또한 기존 프로세스는 23건 중 41%가 제재 대상이었던 반면, 딥 러닝 기반 프로세스의 경우 36건 중 96%가 제재 대상에 포함됐다.”라며 딥 러닝 기반의 욕설 탐지 기술의 효용성을 설명했다.

마지막으로 “인공지능이 사람을 완벽히 대체하기는 어렵다. 한 건이라도 무고한 유저가 처벌을 받는 일이 없어야 하기 때문이다. 대신 인공지능은 아이언맨의 ‘자비스’ 같은 역할을 할 수 있다. 인간을 도와 업무를 편리하고 효율적으로 할 수 있게 만드는 가치를 발휘한다.”며 딥 러닝 기반 욕설 탐지 기술의 필요성을 강조했다.

김동준 기자 kimdj@gameinsight.co.kr

다른기사 보기