본문 바로가기
IT 동향

빅데이터 개인정보 남용 걱정끝내도 될까?

by SenseChef 2015. 1. 8.

빅데이터는 대한민국 IT의 미래를 책임질 핵심 국가 산업 !

 

IT 산업의 미래 발전을 규정 짓는 핵심 키워드 중의 하나는 빅 데이터(Big Data)이다.


TV나 신문 기사, 정부 정책, 블로그 등에도 자주 언급되며, 그 중요성에 대한 사회적 공감대도 이미 형성되어 있다.


빅데이터는 불특정 다수의 사람들이 만들어 내는 대규모 데이터를 분석하여 대중이 좋아하는 것이 무엇인지, 무엇에 관심이 있는지를 알아내는 행동 분석 산업이다.

사람들이 퇴근 시간에 가장 많이 찾는 곳은 어디일까 ?

빅데이터 분석을 하기 전까지는 누구도 이에 대해 명확히 얘기할 수 없다. 그러나 이동통신사가 갖고 있는 다수 이용자들의 기지국 기반 위치 정보, 스마트폰을 통한 대량의 네비게이션 길찾기 요청 데이터를 분석하면 답을 얻을 수 있다. 

이처럼 빅데이터 분석은 우리가 궁금해 하는 분야에 대한 명쾌한 답을 얻을 수 있다. 그러나 한편으로는 걱정이 앞선다. 빅데이터가 바로 우리들 자신에 대한 정보가 모여진 것이기 때문이다.

그렇다면 빅데이터 분석에서의 개인정보 보호, 프라이버시 침해 우려에 대해 걱정하지 않아도 될까 ? 어떤 대비책이 있는 것일까 ?

빅 데이터 분석에 대한 기대와 우려, Source: Office Clip art


 

 

빅데이터 분석에서의 개인정보 침해, 유출 가능성에 대한 우려 !

 

요즘 범죄 수사에서는 피의자, 범죄자들의 성격과 행동을 분석하는 프로파일링(Profiling) 분석 기법이 많이 활용된다. 이를 통해 범인들의 예상 도주로나 출몰 지점을 예측할 수 있다. 또한 이미 잡힌 범인이나 피의자라면 프로파일링 분석을 통해  그들의 범죄 동기나 행동을 이해하여 향후 예방책을 마련할 수도 있다,


이러한 프로파일링 분석 역시 큰 틀에서는 빅데이터 분석에 포함될 수 있다. 기존에 있었던 다수의 범죄 사례를 종합 분석해 유형을 만들어 이를 적용하기 때문이다. 또한 빅데이터 분석 결과는 개인에 대한 분석에 사용될 수도 있음을 의미한다.


빅데이터의 수집 단계에서는 다수의 개인 정보들이 수집될 수 밖에 없다. 근본적인 자료 자체가 각 개인에게서 나오는 것이기에 이를 피할 수는 없다.


따라서 빅데이터 분석이 중요하나 수집되는 자료에 특정 개인임을 알 수 있는 식별 정보가 포함되는 것을 방지해야 한다. 또한 단독으로는 특정인 임을 추정할 수 없으나 다른 정보와 결합되어 누군가를 특정할 수 있다면 그런 정보 역시 배제 되거나 정보의 일부만 저장 되어야 한다.


이러한 상황들이 의미하는 바는 명확하다. 빅데이터 수집, 분석 과정에서 특정 개인에 대한 정보가 수집되어 분석 및 특정 될 수 있다. 빅데이터 분석에서의 개인정보 보호 및 프라이버시(Privacy)에 대한 고려가 반드시 필요한 이유이다.

 

 

정부가 발표한 빅데이터 개인정보보호 가이드라인의 실효적 운영에 대한 기대 !

 

빅 데이터 분석에 따른 개인정보 침해 가능성을 우려하여 정부 소관부처인 방송통신위원회에서 "빅데이터 개인정보 보호 가이드라인"을 발표했다.


빅데이터 분석 시 개인정보에 대한 비 식별화 조치 시행, 빅데이터 처리 사실에 대한 공개, 파기 등의 내용을 담고 있다.


빅데이터 분석이 점차 활성화 되고 있는 시점에서 규제 불확실성을 해소시켜 줄 수 있는 정책 가이드라인이기에 이에 대한 기대가 높다. 가이드라인의 주요한 내용은 다음과 같다.


[개인정보의 비 식별화 조치 의무화]

공개된 정보 및 이용 내역 정보에 개인을 식별할 수 있는 "개인 정보"가 포함될 수 있다. 이 경우 정보 수집 단계에서부터 해당 개인정보에 대한 비식별화 조치를 해야 한다.


비식별화 방법에는 해당 정보의 일부분을 "*"로 처리하는 등의 가리기(마스킹, Masking), 일부 내용 삭제, 가명 처리, 개인이 아닌 집단으로의 총합 처리, 범주 분류 등이 있다. 이러한 방법이 이용되면 해당 정보 단독으로 또는 다른 정보와 결합하여 특정인임을 알 수 없게 된다. 특정 개인에 대한 비 식별화 조치이다.


[비 식별화 조치 후에는 이용자 동의없이 정보를 수집, 이용 및 내부 목적으로 사용 가능]

개인정보의 경우 이용자 동의(Opt-in)를 받아야만 이를 이용할 수 있다. 그러나 위에서 언급된 비 식별화 조치가 시행된 경우 이용자 동의가 없더라도 이를 이용하거나 제3자에게 제공 할 수 있다.


또한 이용자가 거부 의사를 밝히지 않는  한 자신의 업무 수행을 위해 내부 목적으로 해당 정보를 이용할 수 있다.


[빅데이터 처리 사실, 목적 등 공개를 통한 투명성 확보]

여러가지 경로를 통해 수집된 개인정보가 얼마나 되는지, 누가 수집했는지 파악조차 힘든 세상이다. 이에 개인정보가 들어있는 공개된 정보와  이용 내역 정보를 수집하거나 이용하는 경우 해당 정보의 이용 사실과 새로운 정보가 만들어질 수 있다는 것 등을 공개해야 한다.


이와 같은 정보 공개를 통해 투명성을 확보할 수 있다.


이외에도 가이드라인에는 개인정보 재 식별 시 파기/비 식별화 조치, 만김한 정보나 비밀의 수집/이용/분석 금지, 수집된 정보의 저장 등에 따른 기술적, 관리적 보호 조치 등이 포함되어 있다.


세부적인 내용은 아래의 방송통신위원회 가이드라인을 참조하기 바란다.



 

규제와 진흥 사이의 갈림길 ! 사후적 관리가 잘 되길 !

 

위에 소개한 방송통신위원회의 가이드라인을 보면서 여러 생각이 교차된다.


정부는 빅데이터라는 새로운 산업에 대한 진흥과 규제 모두를 추진해야 한다. 만약 규제에 치우친 정책이 나온다면 지나친 옥죄기로 태동기의 빅데이터 산업 발전을 저해한다는 따가운 비판이 나올 것이다.


반면 빅데이터 자료의 광범위한 활용을 허용하는 정책을 펴낸다면 기업들의 개인정보를 이용한 장사를 방치하고, 또 다른 개인정보 오남용을 조장한다는 비난에서 자유로울 수 없다.


따라서 방송통신위원회가 발표한 가이드라인을 유심히 살펴본다. 정책 수립 시 고민한 흔적이 많이 보이며, 규제와 진흥의 중간지점에 위치한 듯 보인다.


그러나 미래의 상황 전개가 어떻게 될 지, 어떤 변수가 튀어 나올지는 아무도 알 수 없다. 사전과 사후라는 시간 개념을 적용 시 정책에 대한 사후 관리가 무척 중요하다는 의미이다.  


앞으로 빅데이터 산업은 활성화 될 수 밖에 없다. 부디 정부가 가이드라인 발표로 역할을 끝내지 말고 향후 진행 상황을 면밀히 살펴, 필요 시 가이드라인의 개정도 추진하길 바란다.


알고 싶은 미래의 모습 ! 빅 데이터 분석이 해법일 수 있다. 개인정보의 유출이나 오남용이 없는 빅데이터 분석 산업이 하루빨리 활성화 되길 기대해 본다.