유경준 통계청창
그러나 여기에는 간단치 않은 문제가 있다. 빅데이터는 개인 정보를 바탕으로 여러 데이터를 연결해 쓰는 경우가 많기 때문에 당연히 개인 정보 보호와 충돌이 생길 수 있다. 또한 빅데이터 통계 산업은 공공재적 성격이 있어 일정 부분 정부의 도움이 필요하다.
먼저 개인 정보 보호에 대한 입장 차이는 미국과 유럽의 충돌에서 극명히 드러난다. 유럽은 미국 중심의 다국적 디지털 기업들의 프라이버시 침해에 대응하기 위해 온라인상의 개인 정보를 기업에 요청해 삭제할 수 있는 ‘잊혀질 권리’를 인정한 바 있다. 또한 2013년 미국 정부의 디지털 기업 서버 감청을 폭로한 ‘스노든 사태’가 발생해 미국 정부 및 디지털 기업의 데이터 남용과 사생활 침해가 우려됐다. 이러한 미국과 유럽 간의 데이터 전쟁은 빅데이터 개방과 개인 정보 보호 간 조화가 쉽지 않다는 것을 보여 준다.
우리나라도 빅데이터 활용을 위해 지난해 초 행정자치부 등 관계 부처 합동으로 ‘개인 정보 비식별 조치 가이드라인’이 발간된 바 있다. 그러나 이는 실질적·법적 효력이 부족한 행정 조치로 재식별될 경우 자료 제공자가 처벌될 우려가 있다. 또한 과도한 비식별화로 인한 중요 정보의 상실로 유의미한 활용에도 한계가 있다. 따라서 실질적인 빅데이터 활용을 위해 가이드라인을 법제화할 필요가 있다. 이는 비식별 자료 처리기법 개발과 더불어 연계된 데이터의 목적 외 사용이나 정보 유출에 대한 처벌 등 사후 조치의 강화로 해결을 모색할 수 있을 것이다.
한편 통계 산업이 공공재적 성격이 있듯이 빅데이터 산업도 공공재적 성격이 있다. 국방이나 경찰과 같이 누군가 타인의 사용을 배제하고 독점적으로 사용할 수 없어 민간에서 자생적으로 생산하기 어렵기 때문이다. 따라서 빅데이터 통계 산업을 그냥 내버려 두면 필요한 만큼 공급되지 않을 뿐 아니라 미국과 같은 선진국에 잠식당할 우려가 크다. 따라서 빅데이터 통계 산업은 일정 수준까지는 정부가 주도적으로 육성할 필요도 있다.
통계청은 일찍이 공공 빅데이터를 취합해 통계 작성의 원천으로 활용하고 있다. 지난번의 인구센서스를 전수 설문조사가 아닌 주민등록부, 건축물 대장 등 13개 정부 기관의 24개 행정데이터를 기반으로 작성한 바 있다. 이는 공공 빅데이터 시대를 알리는 서막으로 여길 수 있다.
앞으로도 통계청은 지속적으로 여러 부처의 다양한 공공 행정데이터를 융·복합해 빅데이터 시대를 선도할 것이다. 또한 이를 민간 빅데이터와 결합하는 매개체 역할을 통해 국내 빅데이터 산업의 활성화에 기여할 것이다.
2017-03-07 30면
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지