네이버 검색어 서비스, 어떻게 운영돼왔나?


네이버 검색어 노출 제외 절차 및 운영 정책

[김영리기자] 그간 조작 논란이 끊이지 않던 네이버 검색서비스 운영 방식이 외부 검증에 의해 공개됐다.

실시간 급상승 검색어·자동완성·연관 검색어 서비스는 우리 사회의 굵직한 이슈가 생길 때마다 이를 보여주는 지표 역할을 한다. 사회에 미치는 영향이 막중하기 때문에 이번 네이버 검색서비스 운영 방식 공개는 객관성, 공정성에 대한 의혹을 어느 정도 해소했다는 데 의의가 있다.

그러나 여전히 네이버 측의 자의적 판단이 개입할 여지가 남아 있어 지속적인 서비스 보완과 정보 공개의 확대가 필요한 것으로 나타났다.

한국인터넷자율정책기구(KISO)는 지난 18일 네이버 검색서비스 운영 방식과 기준 등을 검토하고 문제점·개선점을 제시한 '네이버 실시간급상승검색어 등에 대한 검증보고서'를 발표했다.

네이버는 '촛불시위' '정우택 성상납' '안철수 룸살롱' '박근혜 콘돔' 등 지속적인 검색어 조작 논란에 휘말려왔다. 이에 사회적 신뢰와 공정성을 확보하기 위해 외부 기관인 KISO를 통해 검증받고 운영 방식을 공개한 것.

4개월간의 검증 기간을 거쳐 이번에 KISO가 발표한 보고서에는 그동안 외부에는 알려지지 않았던 네이버 검색어의 노출 제외 절차, 운영정책, 노출 제외어에 대한 검증 결과가 담겨있다.

보고서에 따르면 지난해 9월 한달 간 제외된 검색어 리스트 1천66건 중 성인·음란 영역이 전체 61.4%를 차지했다. 또 자동완성 검색어의 경우 이용자 권리 침해 요청을 기준으로 197건의 제외 요청이 들어와 관련 검색어 436개 가운데 76개가 제외처리됐다. 처리 사유로는 명예훼손이 58%, 개인정보 침해가 14.2%로 가장 많은 비중을 차지한 것으로 나타났다.

◆ 실시간급상승검색어, 10분동안 15초마다 순위 산출

보고서는 "실시간급상승검색어는 강한 의제 설정 기능이 있어 특정 검색어를 배제하거나 부각시키는 등 불공정하게 운영될 경우 사회여론에 부정적 영향을 미칠 수 있다"며 "언론사의 편집 원칙과 같이 투명한 노출제어 기준의 공표가 필요한 미디어 서비스 영역이라고 할 수 있다"고 설명했다.

실시간급상승검색어의 경우 '특정 시점 대비 측정 시간'은 통상 10분이며 15초마다 새로 순위를 산출한다. 일정한 알고리즘에 의해 50위~100위의 검색어를 추출, 상위 순위 10여개 검색어를 노출한다.

노출된 검색어는 시간이 경과하면서 상승폭이 줄고 순위에서 밀려나 자연스레 사라지며, 노출 지속시간은 통상 하루를 넘지 않는다.

이 서비스는 두 자리수의 담당자들이 24시간 3교대로 관리하고 있다. 업무의 주요 내용은 50~100위 검색어 중 세부 운영정책에 따라 노출에서 제외할 필요가 있는 검색어가 있는지 검토하고 제외 여부를 결정한다. 검색어 검수에서 노출까지 통상 5분 정도 내외에서 이루어진다.

검색어를 자동추출할 때 400여개의 사행성 게임 지칭 검색어는 기계적으로 자동 제외되지만 욕설이나 성인어에 대해선 기계적 필터링을 하고 있지 않다.

서비스 담당자가 수동적으로 제외 처리를 하는 경우는 7개의 노출 제어 기준에 따른다. 개인정보 노출, 명예훼손, 성인·음란성, 불법·범죄·혐오성, 서비스 품질저해, 법령 및 행정·사법 기관의 요청, 상업적·의도적 악용 등이다. 단 '안철수 불륜'이나 '협박 근혜' 등처럼 명예훼손 등 법률적 판단이 필요한 사안에는 법무담당책임자에게 의뢰해 처리하고 있다.

KISO 검증위원회는 "서비스 제공자의 편집기능 활동에서 자의적 판단을 배제하기 위한 객관적 기준과 공정한 판단절차를 수립하는 것이 무엇보다 중요하다"며 "그러나 7개의 노출 제어기준은 모두 추상적 기준이며 세부 운영정책에는 각각 추상적 기준에 해당하는 구체적 사례가 제시돼있기는 하지만 담당자의 자의적 판단에 따른 노출 제외가 없다고 단정할 수 없는 구조"라고 지적했다.

또한 "네이버 검색서비스에 대한 사회적 의혹 제기는 서비스 담당자의 자의적 판단이 개입될 수 있는 이러한 여지와 구조에 뿌리를 두고 있는 것으로 판단된다"며 "자의적 개입 여지를 최소화할 수 있는 공정하고 객관적인 절차를 마련하는 것이 바람직하다"고 덧붙였다.

이에 검증위원회는 ▲검수부터 노출까지 시간 최소 10분 연장 ▲정치·사회적 문제와 관련된 검색어 노출 제외 결정 시, 3인 이상의 책임자급 판단 절차 마련 ▲노출 제외어 타당성 사후검증 내부 절차 마련 등의 개선점을 제안했다.

◆ 자체 판단 노출 제외 비율 자동완성 8%, 연관검색어 4.5% 수준

보고서는 "자동완성·연관검색어는 사람에 의한 필터링이나 편집이 아니라는 점에서 자동화된 서비스로 이해할 수 있다"며 "명백하게 불법적인 내용의 검색어가 아닌 이상 검색 사업자가 검색어의 조합으로 인한 권리침해 현상을 예측하기 어렵다는 특징이 있다"고 설명했다.

지난해 11월1일 기준, 자동완성 검색어에서 사용자가 찾은 검색어는 약 666만개, 네이버 콘텐츠 키워드는 약 1천400만개가 축적됐고 매일 추가된다. 검색횟수가 많은 순으로 노출된다.

이 서비스는 담당팀에서 매일 신규 사용자 검색어를 검색횟수 순으로 검토하는 방식으로 관리되고 있다. 담당자는 새로 생성된 사용자 검색어 목록을 보고 세부 운영 정책에 따라 노출 제한이 필요한 검색어를 선택해 제외한다.

사용자 검색어에서 자동으로 필터링 되는 검색어는 2만3천여개의 키워드, 2천700여개의 단어가 포함된 청소년유해검색어와 7천600여개의 오타 키워드다. 콘텐츠 키워드에선 오타 키워드만 자동필터링하고 청소년유해검색어는 자동필터링 하지 않는다. 신규 사용자 검색어는 검색횟수가 매우 적은 키워드를 제외하면 매일 약 1만5천여개 수준이다.

자동완성검색어에 대해선 매일 약 15개 정도에 대해 권리침해 신고가 이루어지며 수용비율은 대략 40% 수준이다.

신고 없이 네이버가 직접 제외처리하는 경우는 성인·음란성, 유명인 개인정보 노출 등 9개 노출 제어 기준에 따라 결정한다. 매일 1만5천여개의 신규 사용자 검색어 중 약 1천200여개의 검색어가 운영정책에 따라 수동으로 노출제외 된다. 제한 기간은 1개월에서 영구까지 담당자가 선택해 설정한다.

연관검색어에 대해선 매일 50~90개 정도 검색어에 대한 권리침해 신고가 이뤄지며 수용비율은 대략 35~40% 수준으로 나타났다. 신고 없이 네이버가 직접 제외 처리하는 경우는 자동완성검색어 서비스와 같은 방식으로 9개 노출 제어 기준에 따라 운영된다.

검증위원회는 "권리침해 신고 없이 서비스 담당자가 운영정책에 따라 판단해 제외하는 검색어가 자동완성의 경우 8%, 연관검색어는 4.5%에 달한다는 점에서 조심스럽게 접근할 필요가 있다"며 "명예훼손·개인정보 등 권리침해를 이유로 하는 자동완성검색어 제외 결정은 권리침해신고에 따라 이루어지도록 하고 자체적인 제외 결정을 최소화해야 한다"고 지적했다.

이에 네이버 측은 "KISO의 권고를 존중해 세부 내용을 면밀히 검토한 뒤 필요한 조치를 취할 것"이라며 "검색어 서비스 투명성 제고를 위해 정례적 검증의 필요성을 강조한만큼 이를 구체화하기 위한 절차도 KISO와 협의를 시작하고 결과를 빠른 시일 내에 공개하겠다"고 밝혔다.

김영리기자 miracle@inews24.com






포토뉴스