본문 바로가기
IT 동향

페북의 빅데이터 분석이 전해주는 연인 발전사

by SenseChef 2014. 2. 17.

페이스북은 사람들에 대해 얼마나 자세히 알고 있을까 ?

 

2014년 2월 현재 페이스북의 가입자 수는 12억 3천만 명이나 된다고 한다. 오늘도 전 세계의 수많은 사람들이 페이스북에 자신들의 얘기를 가감없이 쏟아낸다. 자신이 간 곳, 누구를 만났는지, 어떤 음식이 맛있었는지, 싱글인지 연인이 있는지 결혼 했는지까지도 올린다.


따라서 페이스북에 쌓이는 수많은 개인들의 데이터가 어떻게 활용되는지, 이걸 분석하면 무엇을 알 수 있게 되는지 궁금해진다. 빅 데이터(Big data) 분석 시대에 페이스북이 갖고 있을 개인들의 방대한 자료가 세상의 흐름을 보여 주는 좋은 나침판이 될 수 있기 때문이다.


그런데 최근 페이스북이 자신들의 데이터 분석 결과를 발표 했다. 이른바 사람들의 관계(Relationship) 형성에 대한 보고서이다. 이걸 보면 페이스북이 자신들의 자료를 어떻게 활용하는지, 어떤 결과를 도출하는지 알수 있게 된다.


페이스북은 우리들에 대해 무엇을 분석하고 있을까 ? 프라이버시 침해를 우려 해야만 되는 걸까 ?


데이터 분석을 통한 흐름 파악, Source: Clip art


 

페이스북을 통해 연인과의 만남,이별의 방정식을 알 수 있다 !

 

페이스북의 연구자들은 빅 데이터 분석을 통해 연인 관계의 변천사를 분석했다. 이를 보면 연인 관계가 어떻게 시작되는지, 이별의 시작은 어떻게 찾아오는지 알 수 있다.


[연인 관계가 시작 되기 12일 전에 페이스북 포스팅이 최고치를 기록한다] (출처: Facebook The Formation of Love)


페이스북에는 자신이 독신(Single)인지 연인(In a relationship)인지 여부를 입력하게 되어 있다. 따라서 이걸 분석해 보면 사람들의 연인 관계 변화 추이를 알 수 있게 된다.


독신인 사람이 서로 연인 관계로 발전하는 최초의 시작점은 상호 간의 메시지 교환과 상대방의 프로필(Profile)을 읽어 보는 것이다. 이후 이들의 페이스북 포스팅 수가 증가 되며, 연인이 되기 12일 전에 하루 1.67 건으로 최고의 포스팅 수준을 유지한다.


그러나 이후 포스팅 수치가 점차 감소 된다. 이는 연인들이 온라인보다 오프라인에서의 만남이 증가되기 때문일 것으로 추정된다. 또한 서로에 대한 구애(Courtship)가 일단락 되었기 때문일 수도 있다. 아래는 이에 대한 그래프이다.

연인 관계 전후의 메시지 교환량 추이, Source: Facebook data


그러나 독신일 때에 비해 연인이 되면 페이스북에 올리는 글에서 긍정적인 단어가 증가된다. 긍정적인 단어는 Love, Nice, Happy 등이며, 부정적인 단어는 Hate, Hurt, Bad 등이다. 이러한 추세를 보면 연인 관계로 발전 시 세상을 좀 더 긍정적으로 보게 됨을 알 수 있다. 세부 사항은 아래 그래프를 참조 하자.

연인 관계 전후의 긍정적 어휘 구사 비율 변화 추이, Source: Facebook data



[연인과 이별 하게 되면 갑자기 메시지량이 급증한다] (출처: Facebook, When Love Goes Awry)


어떤 사람이 연인과 이별을 하게 되면 갑자기 그의 메시지량이 급속히 증가된다. 평균치 대비 무려 225%나 늘어난다. 그러나 이후에는 포스팅 량이 점차 감소된다. 연인과 헤어진 뒤 아쉬움과 슬픔을 해소하기 위해 이제는 독신이 된 사람이 지인들과의 소통량을 늘리기 때문일 것이다.



페이스북의 데이터 분석을 통해 세상의 흐름 변화를 쉽게 파악할 수 있게 된다 !

 

페이스북의 연구진이 발표한 분석 결과에 많은 공감을 하게 된다. 그만큼 페이스북의 조사 결과에 신뢰성이 있다는 얘기이다. 달리 말하면 페이스북에 쌓이는 데이터를 분석해 보면 우리의 일상 생활에 대해 일정한 패턴을 찾을 수 있다는 의미이기도 하다.


페이스북의 데이터를 분석하면 연인 관계의 발전 외에 질병의 전파나 창궐을 미리 예측할 수 있을지도 모른다. 특정 지역 사람들이 병원이나 병명을 언급하는 빈도수가 일정 수준으로 증가되면 해당 지역에 전염병이 나타날 수 있을 것이다.


또한 국회의원이나 대통령 선거에서 특정 후보에 대한 긍정적, 부정적 단어 사용 사례를 분석해 보면 그들의 당선 여부나 지지율 수준을 파악할 수도 있을 것이다. 선거 참여 관련 단어의 출현 횟수를 보면 투표율까지 예측할 수 있을 것이다.



데이터 분석 시 유형만을 분석하니 프라이버시 침헤에 대한 우려는 낮댜 !

 

페이스북에 의하면 자신들은 빅 데이터 연구 시 특정인이 누구인지 알 수 있는 '이름'은 분석 대상에서 제외 시킨다고 한다. 나이, 성별, 위치, 현재 상태 등 만으로 분석을 진행 하는 것이다. 그렇게 되면 연령대나 지역, 성별에 따른 사람들의 변화 추이를 분석할 수 있게 된다.


이러한 빅데이터 분석이 의미하는 바는 명확하다. 페이스북이 특정인이 아닌, 사람들의 유형 분석에 집중한다는 것이다. 예컨대 도시 지역과 농촌 지역에 사는 사람들 간의 분석이다.


따라서 빅 데이터 분석 시 프라이버시 침해에 대해 당분간은 그리 염려하지 않아도 될 듯 하다. 그러나 빅 데이터 분석의 범위를 특정인에 맞추는 것 또한 그리 어렵지 않다는 것을 명심 할 필요가 있다.

 

 

빅 데이터 분석이 흥미롭게 전해 주는 일상 이야기에 주목하자 ! 숫자로 풀어보는 세상만사 !

 

페이스북 등의 빅 데이터 분석 결과를 보면 세상의 흐름이 읽혀진다. 물론 이를 완전히 신뢰할 수는 없다. 모든 사람들이 페이스북에 가입된 것도 아니고, 자신의 이야기를 진실하게 올리지 않을 것이기 때문이다. 그러나 표본(Sample)의 수가 매우 크다면 이러한 특이한 데이터들은 분석에서 제외되고 현실을 제대로 알려 줄 수 있게 된다. 이는 통계학 이론을 통해 증명된다.


따라서 앞으로 빅데이터 분석이 전해주는 세상 이야기에 주목하자. 시대의 흐름 변화를 빨리 파악 해 새로운 비즈니스 모델 발굴이나 수익원 확대에 도움을 받을 수 있을 것이기 때문이다.


"높이 나는 새가 멀리 본다"는 말이 있는 것처럼 세상을 제대로 이해 하려면 이제 빅 데이터 분석은 반드시 해야만 하는 필수 사항이다. 산 속에 들어가 나무만을 보다가 산 전체를 조망하지 못해 산 사태를 맞는 그런 우를 범하지는 말아야 할 것이다.