"정치자금 내역, 더 투명해져야…폭증하는 데이터 감시할 언론인 필요"
"정치자금 내역, 더 투명해져야…폭증하는 데이터 감시할 언론인 필요"
  • 정지나 기자, 최락선 기자
  • 승인 2018.12.31 13:41
  • 댓글 0
이 기사를 공유합니다

[제7회 온라인저널리즘어워드 수상자 인터뷰] 데이터저널리즘상 받은 이종호 오마이뉴스 기자

오마이뉴스는 중앙선거관리위원회의 정보공개를 통해 받은 정치자금수입지출보고서 2200여건, 10만3617매를 전수분석해 19-20대 국회의원 총 482명이 6년간 지출한 정치자금 2587억원의 지출내역을 전부 공개했다. 

아직 아무도 걷지 않은 길을 맨발로 뛰는 일은 예상처럼 쉽지 않았다. 정보공개청구를 통해 자료를 받는데만 1개월정도가 걸렸다. 정보공개청구비용만 250만원이 들었다. 정치자금이 들어오는 경로는 있는데 나가는 분류기준은 없다보니 교통비, 식비, 정책 관련 비용으로 얼마를 썼는지 분류기준부터 새로 만들고 작업을 했다. 1년치를 분석하는데 꼬박 3개월 정도가 걸리는 지난한 작업이었다. 

프로젝트를 담당한 이종호 기자는 "앞으로 여건이 허락하는한 계속 할 예정"이라며 "정치자금 사용내역 공개로 국회의원들의 정치자금 씀씀이가 더 투명해지기를 바란다"고 밝혔다. 이 기자는 2002년 오마이뉴스 창간 멤버로 입사해 사진부, 방송팀장을 거쳐 2015년부터 데이터저널리즘을 담당하고 있다. 다음은 일문일답.

이종호 오마이뉴스 데이터저널리즘 담당 기자.
이종호 오마이뉴스 데이터저널리즘 담당 기자./협회보

-2015년 데이터저널리즘 시작하게 된 계기는? 
"오마이뉴스 창간 15년을 맞아 대표가 적극적으로 새로운 시도를 독려했다. 한달이든 몇년이든 해보고 싶은게 있으면 해보라는 것을 강조했다. 기자 중 한 명은 공단에 위장취업해 한달동안 일하고 기사쓴 친구도 있고. 그런 문화 속에서 이전부터 관심이 있던 데이터저널리즘을 해보겠다고 제안했다." 

-독립적인 팀 대신 TF 운영으로 데이터저널리즘이 가능한가.
"팀에서 진행하는 것과 TF로 진행하는 것은 각각 장단점이 있다. 팀의 장점은 안정적인 기사 생산이 가능하다는 점이다. 기존 언론사에는 없던 리서처, 분석가, 인포그래픽 제작이 가능한 디자이너, 개발자들이 같이 팀을 꾸리려면 규모가 최소 5인 이상이다.

그럴만한 여력이 충분하다면 장점이 되겠지만 중소규모 회사에서는 부담이 된다. 언론사 개발자들은 사이트 관리 업무를 주로 담당하는 경우가 많은데 오마이뉴스는 내부에서 사이트개발을 직접 한다. 개발자들이 데이터베이스도 잘 다루고 협업하는 문화가 잘 돼있다. 이때문에 따로 팀을 꾸리기보다는 프로젝트별로 TF를 조직해 협업하는 형태가 적합하다. 아무리 장기적인 비전을 보고 팀을 만든다 해도 데이터저널리즘은 단기간에 성과가 나는 분야가 아니라 소규모 회사에서는 TF로 가는게 장점이 더 많다." 

-국내 데이터저널리즘 분야가 초창기와 달라지 점은.
"팀이 있고 인원 많은 곳이 많지 않다. 꾸리면 5명 안팎. KBS, SBS에 팀이 있고 뉴스타파, YTN도 팀을 꾸렸다. 방송사는 협업문화가 신문사보다는 발달돼있어 가능한 것 같다. 신문사는 중앙일보 외에는 팀이라 불릴만한 곳이 없다. 예산체계도 다른 것 같다. 신문은 프리랜서와 일하면 부정적으로 보는 문화도 있고.

변화는 한때 데이터저널리즘 붐이 불었다가 거품이 꺼졌다는 얘기가 나왔는데, 데이터저널리즘이 마치 저널리즘의 미래인것처럼 보던 과대포장이 없어졌다. 데이터를 이용해 어떤 보도를 해야하는지에 대한 스킬은 훨씬 많이 발전했다. 사람들 생각도 단단해지고. 차별적인 보도를 준비하는 곳도 있다. 더 좋은 미래가 있을 것으로 본다." 

이 기자는 취재본부 부본부장도 겸직하고 있어 데이터저너리즘 업무 외에도 행정 업무도 많다. 올해는 박근혜 전 대통령 판결문 공개 사이트 프로젝트를 법조팀과 진행했다.


-국회의원 정치자금 전수조사 프로젝트를 기획한 이유는. 왜 정치자금인가. 
"2012년부터 2014년까지 3년치 자료를 2015년부터 작업해 2016년 3월에 공개한 바 있다. 2001년부터 2008년까지 국회출입한 경험이 있는데, 국회의원들이 돈을 어디다 쓰는지 궁금했다. 막연히 알뜰하게 쓰는 것 같지는 않다고 생각했고 일반 사람들도 정치자금 하면 부정적인 인식이 많다.

그때도 간간히 정치자금 조사를 했는데 그때는 정보공개청구제도가 안착되기 전이라 지역구 국회의원의 정치자금을 보려면 지역구 선관위에 가야 했다. 지금은 중앙선관위로 신청하면 전국 것을 모아준다. 물리적으로 전국을 일일이 돌아다니며 자료를 수집하는 것이 어려워 서울, 비례대표 이런식으로 하다가 데이터저널리즘을 맡으며 본격적으로 전수조사를 해야겠다고 생각했다. 문제가 있는 부분이나, 문제가 없는데도 사람들이 오해하는 부분을 전수데이터를 통해 바로잡아보고 싶었다.

2016년 첫 공개 후 2017년에도 자료를 업데이트해 공개할 계획이었지만 대선이 있어 상대적으로 관심이 덜할 것 같아 이번에 3년치를 수집해 진행했다."

데이터저널리즘상을 수상한 오마이뉴스 정치자금특별팀 기자들.
데이터저널리즘상을 수상한 오마이뉴스 정치자금특별팀 기자들./협회보


-2016년에 비해 작업과정은 개선이 됐나.
"작업방식은 크게 달라지지 않았다. OCR(이미지를 텍스트로 변환해주는 프로그램)을 이용한다. 문서를 스캔하면 프로그램이 그림에 가장 가까운 글자로 변환해주는 방식이다. 영어나 프린트 상태가 좋으면 100% 가까이 인식이 되는데 한국어나 프린트 상태가 안좋을 경우 인식률이 떨어진다. 그래도 바로 수작업하는 것보다는 낫다. 초기 작업할 때와 차이점은 언론재단의 지원을 받은 것이다."

-언론재단의 지원이 도움이 됐나.
"혼자 작업하면 일년치 자료를 작업하는데 3개월 정도 걸린다. 언론재단 지원이 없었다면 작업기간이 굉장히 오래 걸렸을 것이다. 작업기간이 길어지면 단순히 출고가 늦어지는 것이 아니라 새로운 이슈로 인해 출고 타이밍을 잡기가 힘들어지는 등 여러모로 애로사항이 있다." 

이번 프로젝트는 언론재단의 기획취재 지원을 받아 진행됐다. 해외 취재와 사이트 개발(데이터 수집비용 포함) 비용이 함께 지원됐기 때문에 데이터 수집과 분류에 비용을 쓰는 데 제약이 있었다. 이 기자는 "2015년, 2017년 자료수집 2개월, 사이트개발 2개월, 취재는 1개월 정도 걸렸다"고 말했다.  

-언론재단 지원이 좀더 효과를 보려면 어떤 점이 개선돼야 할까.  
"아쉬운 점은 데이터베이스 개발자금을 받으면 규정상 언론사에서 자체인건비로 책정할 수 없다. 외주를 줘야하는데 외주를 주기에는 충분하지 않은 금액이다. 외주를 주게 되면 장점도 있지만 단점도 뚜렸하다.

새로운 기술로 사이트 만들었는데 계약이 만료되면 그 기술은 언론사에 남지 않고 개발한 회사가 가져가게 된다. 지원금액 증액도 필요하고, 언론사에서 자체인건비를 편성해 직접 개발할 수 있도록 해주면 기술과 노하우가 언론사의 자산으로 계속 남을 것이다."

-프로젝트 과정에서 아쉬운 점은.
"두가지 측면에서 고민이 있다. 첫번째는 일반 독자들이 더 쉽게 이해하고 가깝게 접근할 수 있는 방법에 대한 고민이다. 일반 독자들은 숫자에 익숙하지 않고, 정치자금 프로젝트의 경우 정치자금이 본인들의 씀씀이와 다른 부분에 대한 이해가 쉽지 않다. 어디에 얼마를 썼다고 제시된 숫자가 큰건지 작은건지 감을 잡는 것도 어렵다.

두번째 고민은 데이터저널리즘을 하는 비기자들과의 협업을 통해 시너지를 내는 부분이다. 데이터저널리즘은 언론사 기자들과 함께 외부의 데이터 사이언티스트라 불리는 다른 전문가들도 참여한다. 기자의 접근법과 데이터 사이언티스트의 접근법은 확실히 다르다. 기자들이 뉴스적으로 접근한다면 그분들은 데이터적인 부분에 좀더 집중한다.

예를 들면 기자들은 정치자금으로 왜 노래방에 갔는지, 식비를 왜 많이 썼는지 본다면 데이터 사이언티스트들은 패턴을 많이 본다. 정치자금 사용이 몇월에 집중되는지, 지역구별로 사용패턴은 어떤지. 다른 패턴을 찾으려 노력한다. 기자가 갖지 못하는 다른 인사이트를 찾거나 정치자금에 대한 다른 분석이 나올 수 있다는 기대가 가능하다."
 

-정치자금 같은 데이터는 기사로 끝내는 것이 아니라 DB화 해야하는거 아닌가. 
"의원들에 대한 정보를 좀더 상세히 제시하고 바뀐 정보가 실시간 반영될 수 있어야 한다. 2016년 처음 정치자금 공개를 했을때 들었던 얘기가 정치자금 1억을 썼으면 그게 많이 쓴건지 적게 쓴건지 모르겠다는 얘기였다. 일반인들은 체감이 안되는 숫자니까. 그 숫자를 좀더 체감할 수 있게 하려면 많은 정보가 필요하다.

처음에는 이름 소속정당, 지역 정도 정보를 넣었는데 이번에는 의원들에 대한 개별정보를 추가했다. 어떤 직업 출신인지, 지역구에서 득표율은 어땠고 소속 상임위는 어디고 고액후원자는 몇명인지. 많은 정보가 제시되면 3선이면 이정도 돈을 쓰는구나 라던가, 지역이 철원, 양구, 화천이라 지역구가 넓다보니 주유비가 많이 들어가는구나. 이런 부분을 쉽게 이해할 수 있다.

상임위 출석률이나 대표발의건수 등은 국회에서 제공하는 API 정보를 이용하면 고정된 값이 아니고 자료가 실시간으로 반영된다. 이런 정보가 더해지면 지역구에 어떤 의원을 후원하고픈데 그 사람이 괜찮은 사람인지 살펴보는데 유용한 정보가 될 것이다. 올해 쓴 정치자금을 내년에 공개할때는 이러한 부분을 업그레이드할 생각이다."  

-정치권 반응은.
"국회의원 보좌관들도 후원회 회계책임자를 모르는 경우가 많았다. 그래서 '이렇게 쓰셨던데 반론 하라' 하면 보좌관들도 몰라서 답변을 못하고, 의원에게 물어봐도 끝까지 답변을 안하고는 보도가 나간 이후에 해명하는 경우가 대부분이다.

이때문에 다른 기사에 비해 기사수정 많이 되는 편이다. 잘못 쓴 돈은 선관위에 반환하기도 했다. 의원 중 한 명은 부인 외제차 수리비를 정치자금으로 쓴 것을 반론해달라니 끝까지 반론 안하고는 보도가 나간 이후 바로 반납했다.

의원들은 아직까지는 소극적이고 부정적인 생각이 많다. 데이터는 선거때가 되면 독자들이 많이 이용한다. 싫어하는 후보에 대해 '정책개발비를 이렇게 많이쓴다', '밥값이 많이 든다' 하는 것으로 여론전을 펼친다. 내후년에 총선이 있다. 올해와 내년의 자료가 정리되면 공천이나 경선, 본선때 많이들 이용할 것으로 보인다. 

-정치자금은 절약하는 것이 미덕인가?
"열심히 일하는 의원들은 돈을 많이 쓸 수밖에 없다. 선거관리위원회 후원금 모금 한도가 선거가 없는 해는 1억5000만원, 선거가 있는 해는 3억원이다. 그러나 정치를 잘 하는 사람은 더 많은 돈을 쓸 수 있어야 한다. 모금액에 한도를 주는 것은 맞지 않다고 본다. 한도 대신 의원들이 좀 더 자주, 보기 쉬운 방식으로 자금사용 내역에 대한 전자문서를 공개하는 편이 바람직하다. 장부를 보면 다 보인다. 현장방문 하고 비서들과 분식으로 끼니떼우고. 그런 의원들은 후원금이 더 늘었으면 한다." 

어워드 당일 제작 과정을 설명하는 이종호 기자
이종호 기자가 프로젝트 제작 과정을 설명한 뒤 질의응답을 받고 있다./협회보

-정부기관에서 데이터 공개를 하더라도 감추고 싶은 것은 비공개하는데, 어떻게 감시해야 할까. 
"2017년 대선때 시군구별 투표율과 인구사회학적 통계를 결합시킨 정보 분석을 시도한 적이 있다. 선거가 끝나면 판세분석을 많이 한다. 어디는 노인인구가 많아서, 어디는 고학력인구가 많아서, 소득이 많아서 이런 결과가 나왔다라는 분석을 내놓는데 그게 정말 맞는지 확인해보려는 시도였다.

시군구별 후보 득표율과 평균연령, 평균학력, 평균주택가격, 평균소득 이렇게 4가지를 연결시켜보려 했는데 평균소득 보기가 굉장히 힘들었다. 국세청 가도 자료가 없고 연금관리공단에도 없었고, 자료를 못 찾아 우회한 것이 건강보험 데이터였다. 건강보험은 소득과 주택을 반영해 산정하니까. 시군구별 평균 보험료를 보면 평균소득에 가까운 데이터가 되지 않을까 생각했다.

정확하지는 않겠지만 대략적인 시군구별 순위가 나왔다. 알아보니 여러 기관에서 데이터는 가지고 있지만 시군구에서 발표를 결사 반대하는 입장이더라. 특정 지역이 타 지역보다 소득이 낮게 나올 경우 파급효과를 우려해서다. 그러나 평균소득이 읍면동 단위까지 공개돼야 정확한 진단이나 분석이 가능해질 것이다."  

-해외사례 정치자금 내역 공개는 어떤가.
"미국의 경우 선거비용이 종료시점 없이 다 공개된다. 우리나라는 3개월까지만 공개된다. 미국은 후원자도 전부 공개되지만 우리는 300만원 이상 후원자만 공개된다. 미국은 자료 공개시 어떤 파일로든 호환이 가능한 CVS(Comma-Separated Values : 데이터베이스나 스프레드시트의 데이터를 응용프로그램 간에 교환하는 데 사용할 수 있는 텍스트 파일 형식) 파일로 공개한다.

그런데 한국은 아직도 종이로만 정보를 공개하는 낮은 단계에 머물러 있다. 이번에 우리에게 공개한 자료가 PDF 파일이지만 말이 전자문서지 기계가 읽기 어려운 수준이다. 정치자금 사용내역을 데이터 처리하는데 몇 개월의 시간을 써야 한다. 자료정리를 언론사가 대신할 수밖에 없는 현실이 안타깝다." 

-데이터저널리즘의 미래는?
"국내 언론이 투자대비 효율을 따지는 편이라 앞으로도 꽃길이 펼쳐지지는 않겠지만 데이터저널리즘의 역할은 분명하다고 본다. 데이터는 기하급수적으로 증가하고 있고 그것을 감시할 언론인은 반드시 있어야 한다. 특히 남북관계 변화에 따라 데이터저널리즘의 중요성이 더 커질 것이다.

북한과 협력이 본격화되면 가장먼저 해야할 부분이 통계데이터 부분이다. 우리가 북한에 대해 파편적으로 알고있는 정보들이 많다. 북한도 많이 바뀌었고 평양과 지역의 격차도 굉장히 심하다. 우리가 북한과 협력을 하든 북한에 투자를 하든 제대로 하기 위해서는 데이터 활용이 가장 먼저 이뤄져야 한다. 데이터 분석 없이 이렇겠지 라는 추측으로 하면 실수를 반복할 것이다. 북한쪽 데이터에 언론이 관심을 많이 가져야 한다." 

-데이터저널리즘 발전의 전제 조건은 뭐가 있을까.
"기존 언론사에 없던 차별성을 주기 위해서는 데이터 리서처, 분석가, 인포그래픽 디자이너들이 필요하다. 그런데 그분들 뽑기가 굉장히 힘들다. 그분들에겐 언론사가 매력적인 직장이 아니다. 연봉도 높지 않고 가면 기자들이 갑질한다더라 하는 안좋은 이미지도 있고. 좋은 인력을 확보하기 위한 노력이 필요하다."  

-데이터저널리즘으로 접근하면 유용한 영역은 무엇일까.
"정치적 성향과 관계없이 편견, 고정관념을 너무 강하게 주장하는 분들이 많다. 젠더이슈가 사회적 문제가 되는 것도 그런 영향과 무관치 않다. 편견에 불과한 이야기, 옛날 얘기나 통설 같은 것을 막연히 믿는다거나 사람들이 잘못 생각하고 있는 부분을 데이터로 증명해 바로잡는 보도가 많아졌으면 한다."  



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.