빅데이터 시대와 데이터 공개
상태바
빅데이터 시대와 데이터 공개
  • 윤현위
  • 승인 2015.10.14 09:53
  • 댓글 0
이 기사를 공유합니다

[정치칼럼] 윤현위 / 자유기고가, 박사 인문지리학전공

요즘을 데이터의 시대라고 한다면 너무 진부한 표현이 아닐까 싶다. 남의 일인 줄만 알았던 빅데이터가 이제 아주 흔한 일상의 용어가 되어버린지도 이제 오래다. 부분적으로 학위논문에서만 하던 여러사람의 인터뷰를 따서 공동으로 사용된 용어를 분석하던 시대는 정말 그런 분석이 있었나 싶을 정도로 우리가 사용하는 인터넷상의 말들이 수집되어 정보로 가공되는 건 이제 놀랍지도 않다.

유투브를 사용하시는 분들을 알겠지만 로그인을 해서 사용하면 이제 유투브는 우리가 어떤 영상을 좋아하는지 이미 알고 있다는 것에 놀란다. 굳이 찾아 다니지 않아도 되는 경우도 많다. 3년전만해도 개인이 얻을 수 없었던 건축물대장을 이제는 엑셀로 받을 수 있는 시대가 되었다. 기존에 엑셀을 사용하시던 분들은 좀 여러 번 일을 하면되고 최신의 통계프로그램을 사용할 수 있는 사람들이라면 전국의 건축물에 대한 전수자료를 활용할 수 있게 되었다.

아직은 본격적으로 사용하고 있지 못하지만 지번단위의 자료를 마음껏 사용할 수 있다는건 나같은 공간과 지역을 연구하는 사람들에게는 큰 기회라고 할 수 있다. 연구분야에서만 그렇게 생각하는 것은 아닐게다. 여러분은 통계자료를 떠올리면 어떤 기관이 생각나는가? 그렇다 바로 통계청이다. 연도의 끝자리가 ‘0’ 혹은 ‘5’로 끝나는 해에 우리나라는 1960년대부터 인구주택총조사를 해왔다. 인구자료는 1925년부터 받을 수 있지만 생활전반에 관련 자료수집은 1960년대 와서 본격적으로 진행되었다. 나라 사정이 어려워 1965년이 아닌 1966년 통계가 나온 적도 있지만 그래도 그 이후에 통계자료는 계속적으로 수집되었다.

조사원이 가가호호 방문하여 만든(요즘은 인터넷으로도 할 수 있다) 자료를 바탕으로한 인구주택총조사 이외에도 정말이지 무궁무진한 자료를 만들어내고 자신들의 홈페이지에 올리고 있다. 실로 방대하다. 그러나 사회의 변화는 어쩜 이들의 업그레이드보다 더 빠른 것 같다. 사회가 빨리 변하고 공간자료에 대한 수요가 더 커지면서 과거 시도 단위나 시군구 단위로 제공되던 자료 이외에도 더 작은 단위의 자료가 필요한 경우가 많아졌다.

허나 통계자료의 본산인 통계청은 아직은 데이터공개에 대해서 다소 발걸음이 느린 듯하다. 공공데이터포털이 만들어지고 예전보다 데이터를 구할 수 있는 방법이 다양해지고 기관들의 문턱이 낮아진 것도 사실이다. 그래도 통계청은 여전히 가장 많은 자료를 갖고 있다. 과거에도 홈페이지에 게시하지 않은 자료들을 구할 수 있는 방법이 있긴 했다. 바로 돈을 주고 사면된다.

홈페이지에 게시되지 않은 자료들 중에서 전수자료를 판매하지 않고 일부의 자료 즉 2% 혹은 5%정도의 샘플데이터만 구할 수 있다. 이것도 개인 차원에서는 작은 돈이 아니다. 행정구역의 단위수가 많아지면 금액도 같이 올라간다. 만약에 특정지역에서 시행된 인구주택총조사의 자료를 모두 이용하고 싶다면 방법이 있을까? 있다. 혹 글을 읽으시는 분들 중에서는 무슨 통계청 홍보대사인 줄 아시겠다. 그런건 아니다. 오히려 고객에 가깝다. 통계청에서 운영하는 시스템 중에서 마이크로데이터 시스템이라는 것이 있다.

여기에 들어가면 인구주택총조사를 비롯해서 원시자료를 이용할 수 있다. 그런데 문제는 자료를 받는 것이 아니라 말 그대로 통계청의 데이터베이스에 접근해서 자료를 가공한 다음에 통계청의 승인을 받은 후에 그 자료를 이용할 수 있다. 표본자료를 구매하는 것보다 훨씬 더 많은 금액이 들어가는데 절차 또한 매우 까다롭다.

통계청에 있는 데이터베이스에 들어가면 웹으로 구동되는 우리가 사용하는 엑셀과 동일한 엑셀프로그램이 나오는데 여기에서는 단 한 개의 셀도 복사되지 않는다. 손으로 칠 수 있는 자료는 힘껏 쳐서 자료를 만들면 되지만 자료의 양이 많으면 그럴 수 없다. 지인을 통해서 통계청에 문의한 바에 따르면 통계청은 디비를 업그레이드할 계획은 있지만 자료를 제공하는 방식은 변경할 계획이 없다고 한다.

5년에 한 번씩 하는 인구주택총조사는 조사 자체만으로도 엄청난 비용이 들어간다. 그리고 이를 가공하고 유지하는 일에도 엄청난 비용이 들어간다. 사회의 변화속도가 과거보다 빠르고  지식기반산업이 증가하고 있는 요즘이다. 고도화된 사회에 공공의 역할은 여기서 무얼까? 권한과 예산 범위 내에서 자신들의 조직을 유지하는 것도 중요하지만 사람들에게 더 편리하게 자료를 제공하는 방식으로 변하는 것이 통계청 본연의 모습이 아닐까 싶다. 위에서 언급한 모든 과정들은 모두 세금으로 이루어진다. 결국 다 세금이다. 그런데 이걸 이용하는데 너무 많은 금액이 든다면 이건 분명 문제라고 생각한다.

좋은 자료가 있어야 좋은 글과 지도, 결과적으로 좋은 연구가 나올 수 있다. 연구결과물이 나오면 마지막에 저작권이양 동의서라는 것을 쓴다. 연구가 종료되자마자 쓴다. 연구자의 이름은 나가지만 결국 공공재가 된다는 것을 의미한다. 아직 본격 데이터 개방의 시대는 열리지 않았다. 통계청이 시작하면 완성할 수 있다.
 
 
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.

시민과 함께하는 인터넷 뉴스 월 5,000원으로 소통하는 자발적 후원독자 모집