본문 바로가기

과학오디세이

디지털 시대의 사실 검증

녹음이 불가능한 시절, 뱉고 나면 공중에서 사라지는 말을 기록하는 과정에는 과장과 기록자의 소망이 들어가기 쉬웠을 것이다. 그래서 백만대군이라든지, 일당백의 무술고수 이야기는 적절히 가려서 믿어야 한다. 지식의 생산과 배분을 소수의 기득권이 독점한 옛날과 달리 현재는 거의 모든 내용이 인터넷에 기록되고 있으며 누구든지 습득·배포할 수 있어 사실의 진위 확인은 더욱 혼란스러워지고 있다. 지식의 생산, 전달 속도 증가에 비해 인간의 인지능력은 만 년 전과 비교해 전혀 나아진 것이 없다. 그런데 사람은 자주 보고 접한 것을 사실로 인식하게 유전적으로 프로그램되어 있기 때문에 엉터리 사실이라도 더 많이, 더 자주 보여주면 사실로 오인하게 된다. 그런데 디지털 시대에 전달과 배분은 사람이 아닌 기계가 담당하기 때문에 이전과 달리 정보의 왜곡과 날조가 더 쉬워지고 있다. 특히 최신의 사회관계망서비스(SNS) 문화는 정보의 진위 전쟁에 기름을 붓고 있다. 국정원 댓글개입, 역사교과서 국정화, 다음카카오 사건이 보여주듯이 모든 지배 집단은 정보의 배포 과정을 독점하고 싶어 한다.

특히 정치가들이 엉터리 정보를 이용해 대중을 선동하는 일은 흔한 일이라 이런 문제를 해결하기 위해 정치적 주장을 검증하는 사이트가 오래전부터 운영되고 있다. 20여개 사실(fact) 검증 사이트 중에서 Politifact, Snopes, factcheck.org가 신뢰도가 높은 곳이다. 요즘 이들 사이트에서 거짓 선동가로 선두를 달리고 있는 분은 미 공화당 대선주자인 도널드 트럼프이다. 트럼프는 흑인에 의해 살해되는 백인의 비율이 81%라며 인종주의적 주장을 했다. 뉴스로만 살인사건을 접한 사람에게 트럼프의 주장은 그럴듯하게 들릴지 모르겠지만 실제 백인을 살해한 흑인, 백인의 비율은 18%, 82%로 흑인이 월등히 낮다. 이렇게 유명인이 주장하는 구체화된 거짓에 대중은 쉽게 설득된다. 게다가 그런 주장에 자신의 소망을 더해 그 믿음을 강화하고 진실인 양 전파한다. 더구나 트럼프가 말한 자료 출처인 범죄통계청은 존재하지도 않는다. 우리 상황도 별로 다르지 않다. 90%의 역사학자가 좌편향이라는 식의 종북타령은 잘못된 사실의 확산과 강화의 좋은 예이다.

도널드 트럼프가 미국 공화당 대선토론회에서 발언하고 있다._AP연합뉴스



그런데 일반적인 사실 검증 사이트는 전문가 집단의 수작업으로 개별 주장을 확인하기 때문에 속도와 범위가 한정될 수밖에 없다. 수작업 확인에는 이틀 정도 걸리기 때문에 특정 주장이 발화된 시점과 완료된 검증이 공개되는 시간 차이로 인한 문제가 발생한다. 예를 들어 대선 토론과 같은 극한의 상황에서 허위 사실로 공격한다면 반박할 여유가 없는 상대방은 무척 억울할 수 있다. 사후 법적인 조치를 취한다고 해도 그 손실은 치명적이 될 수밖에 없다. 모략은 한마디의 말로 충분하지만 그에 대한 해명은 백 가지 자료로도 부족하다. 이런 상황에서 인공지능과 최신의 빅데이터 기술을 결합해 어떤 주장의 진위 중요도를 실시간으로 판정해주는 시스템이 개발됐다.

ClaimBuster라고 명명된 이 시스템은 정치가들 주장의 가치를 자동으로 계산해준다. 즉 정치가들의 주장을 자연어 시스템으로 분해한 뒤, 기존의 사실 검증용 데이터베이스를 통해 그 진위 검증의 필요성을 계산한다. 이 시스템은 지난 8월 미국 공화당 대선주자 TV 토론에 활용되어 주목을 받았다. 실제 CNN 전문가들의 결과와 비교해볼 때 그 정확도는 74% 정도로 보고되었다. 만일 이 시스템이 기존의 사실 검증 데이터베이스와 결합하면 TV 토론에서 누가 얼마나 진실한 주장을 하는지 실시간 평가도 가능할 것이다. 미래의 공개 토론은 실시간 점수가 나오는 테니스 시합과 같이 될 것이다. 정치가들 주장의 검증도 중요하지만 그 일관성은 더욱 중요한 요소이다. 우리나라 정치가, 고위 공직자들의 이전 발언이나 글을 참조해 지금의 주장이 이전의 주장과 일관되는지, 서로 모순인지를 밝혀주는 일은 무척 흥미로울 것이다.

사실 검증 시스템의 공통된 특징은 하나가 아니라 복수의 독립된 데이터베이스를 활용하는 것이다. 기초 데이터베이스의 독립성과 다양성은 진위 검증에 매우 중요한 핵심이다. 단 하나의 데이터베이스만이 검증에 사용되면, 그것은 바로 종교다. 단 하나만 허용되는 국정 역사교과서가 위험한 것은 지금의 사실 검증 시스템 구조가 잘 보여주고 있다.



조환규 | 부산대 교수·컴퓨터공학