ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 구글 뉴스: 낚시성 글에 대처하는 법
    News 2015. 6. 30. 11:53

    지난 주 금요일 실시간 검색어로 '설리'가 1위에 올랐다. 내용은 없고 비슷한 내용에 실제 내용과는 상관없는 자극적인 사진이 담겨진 기사들이 넘쳐났다. 이런 검색 어뷰징 기사들로 뉴스들의 질이 떨어지고 있다. 구글뉴스는 100%알고리즘으로 운영되는데, 일주일에 한번씩 뉴스 알고리즘을 바꾼다. 가장 먼저 속보를 낸 매체에 가점을 주고(크레디트) 이 크레디트가 누적된 언론사들의 기사를 더 노출시킨다.(너도 나도 속보를 내는 단점발생) 두번째는 퍼블리셔센터를 활용해 비교분석을 통해 진자 속보를 찾는 방안이다. 국내에서는 실시간 검색어를 없애는 방안을 제시하고 있지만, 이것도 근본적인 해결방안은 아니다.










    “구글 뉴스는 ‘낚시’에 어떻게 대처하고 있나요?”

    실시간 급상승 검색어에 ‘설리’가 1위로 오른다. 몇 분도 채 지나지 않아 ‘설리’를 제목으로 내건 수십건의 기사가 포털로 전송된다. 내용은 엇비슷하다 못해 거의 동일하다. 새로움을 담은 진짜 뉴스는 찾아보기 힘들다. 조악한 정보들을 조합해 자극적인 사진을 담는 경우가 넘쳐난다. 오로지 트래픽을 뽑기 위해 제작된 기사기에 그렇다. 이를 통상 ‘검색 어뷰징’ 기사라고 부른다. 한국 저널리즘 생태계를 망치는 주범으로 지목돼 왔다.

    아난드 파카 구글 뉴스 PM

    아난드 파카 구글 뉴스 PM

    검색어 어뷰징은 비단 한국만의 문제는 아니다. 전세계 7만여 언론사들의 기사를 수집해 제공하는 구글 뉴스에도 골칫거리다. 언뜻 ‘실시간 검색어 서비스도 없는데 어뷰징 기사가?’라고 생각하기 쉽지만, 현실은 그렇지 않았다. 교묘한 방식으로 구글의 인기 검색어를 추출해 어뷰징 기사를 생산하는 언론사가 적지 않다고 구글은 털어놓는다.

    지난 6월16일 미국 샌프란시스코 마운틴뷰 본사에서 아난드 파카 구글 뉴스 PM을 만나 한국의 검색어 어뷰징 사례를 설명했다. 그리고 “당신이라면 어떻게 해결할 수 있겠느냐”고 물었다. 돌아온 대답은 의외였다. “우리도 항상 고민을 하고 있고, 많은 시간을 할애하고 있다”는 것이다.

    구글 뉴스는 100% 알고리즘으로 뉴스를 배치한다. 구글 뉴스 알고리즘이 13개 팩터로 구성됐다는 보도가 나온 적이 있지만, 아난드 파카는 “13개보다 훨씬 많고 다양하다”고 반박했다. 게다가 “일주일에 한 번씩 알고리즘을 바꾸고 있다”고 했다. 그럼에도 검색어를 찾아내 어뷰징하는 언론사들이 적지 않다고 했다.

    “일주일에 한 번씩 뉴스 알고리즘 바꾼다”

    아난드 파카는 이미 많은 언론사들로부터 검색어 어뷰징에 대한 불만들을 듣고 있다고 했다. 좋은 뉴스나 속보가 구글 뉴스에 걸리면 이를 베낀 듯 모방한 뉴스들이 줄줄이 생산된다는 것이다. 때론 전혀 관련 없는 내용의 기사에 특정 키워드를 삽입, 구글 뉴스의 상단자리 노출을 노리기도 한다고 했다. 그는 “굉장히 해결하기 어려운 문제”라고 털어놓았다.

    그는 2가지 방식으로 이 문제를 풀어가고 있다고 했다. 우선 특종성 속보를 가장 먼저 내보낸 언론사에 가점을 부여하는 방식이다. 그는 이를 “크레디트를 준다”라고 표현했다. 예를 들어 <뉴욕타임스>가 가장 먼저 특종을 내보내면 구글 뉴스는 신뢰도 가점을 얹어주는 방식이다. 크레디트가 누적된 언론사일수록 구글 뉴스에서 노출될 확률은 높아진다.

    하지만 이 방식은 곧 무력화됐다. 그는 “좋은 접근 방식이었다고 생각했지만, 제대로 작동은 되지 않았다”고 말했다. 언론사들이 너도나도 ‘속보’, ‘단독'(exclusive)이라고 표현하면서 가점 부과 방식은 곧 무력화됐다고 했다.

    그가 고안한 다른 해법은 ‘퍼블리셔센터’를 활용하는 방안이었다. 구글 뉴스는 언론사들에 퍼블리셔센터라는 대시보드 형태의 웹서비스를 제공하고 있다. 이곳에 섹션별 RSS 주소 등을 등록해두면 확인을 거쳐 뉴스를 자동 수집해간다. 조만간 방문자 데이터를 알려주는 애널리틱스 기능도 제공할 예정이다.

    퍼블리셔 센터를 활용하면 ‘진짜’ 속보를 쉽게 찾아낼 수 있다. 어떤 언론사가 가장 먼저 속보를 내보냈는지 원본 기사가 어떤 언론사에서 작성된 것인지 비교적 빨리 확인할 수 있다는 것이다. 아난드 파카는 “갑작스럽게 키워드 어뷰징 기사가 쏟아져나왔을 때 시간적으로 추적한다”고 말했다. 뉴스 랭킹 알고리즘의 빈틈을 퍼블리셔 센터라는 도구를 통해 보완하는 형태다.

    ‘실급검’ 폐지가 어뷰징 대안이 될 수 있을까

    SONY DSC

    지난 6월16일 구글 마운틴뷰 본사 회의실에서 <블로터> 취재진과 인터뷰하고 있는 구글 뉴스 PM 아난드 파카.

    그는 사용자 피드백을 반영하는 방안도 제시했다. 사용자들이 스팸성 기사를 신고하면 이를 알고리즘에 반영하는 것이다. 아난드 파카는 “특정 웹사이트가 키워드만 보고 기사를 쓰고 있다는 걸 사용자들이 보고해주면 이를 토대로 필터링할 수 있다”고 설명했다. 이어 그는 “한국과 다를 수도 있겠지만 가장 강력한 신호는 특정 언론사를 선호하는 사용자들의 클릭 데이터”라며 “시간을 갖고 지켜보면 사용자들이 오리지널 사이트를 찾아낸다”고 말했다.

    최근 국내에선 검색어 어뷰징 기사에 대한 해결책으로 실시간 급상승 검색어(실급검) 서비스 폐지가 거론되고 있다. 하지만 구글 뉴스의 사례를 보면 이 또한 근본적인 대안이 될 수 없다는 점이 분명해진다. 이미 알려진 다양한 기술로 인기 검색어를 추정해내는 것은 그리 어렵지 않기 때문이다.

    결국 구글은 퍼블리셔센터라는 관리 도구와 사용자의 클릭 데이터로 어뷰징에 대처하고 있다. 그 기저에는 “좋은 기자만이 훌륭한 기사를 쓸 수 있다는 사실은 변하지 않는다”는 믿음이 깔려 있다. 이 믿음을 알고리즘과 서비스에 투명함으로써 사용자들이 ‘양질의 뉴스’를 만날 수 있도록 돕고 있다. 아난드 파카 구글 뉴스 PM이 동병상련을 겪고 있는 국내 포털뉴스 담당자에게 보내는 조언의 핵심이었다.



    반응형

    댓글

Designed by Tistory.