콘텐츠로 건너뛰기

빅데이터 인간을 해석하다

빅데이터 인간을 해석하다

1947년 중동에 위치한 사해Dead Sea 북서쪽의 쿰란Qumran 지역에서 있었던 일이다. 한 양치기 소년이 잃어버린 양을 찾아 해매고 있었다. 그러다가 막다른 길에서 동굴을 만난다. 양치기 소년은 아마도 그 동굴로 양이 들어갔을 것이라고 생각하여 다시 나오게 하려고 동굴 안으로 돌맹이를 던진다.

그러자 그 순간 동굴 안에서는 “쨍그랑”하는 항아리 깨지는 소리가 들렸다. 양치기 소년은 호기심이 생겨서 동굴로 들어간다. 그리고 그곳에서 깨진 항아리와 양피지에 적힌 아주 오래된 문서를 발견한다. 이것은 훗날 ‘사해 문서Dead Sea Scrolls‘로 불리며 그 이전까지 알려지지 않은 성경의 새로운 판본으로 인정받는다.

사람들은 흔히 성경을 절대불변의 완전한 문서로 생각한다. 하지만 실제로는 성경에 다양한 버전이 존재한다. 이는 성경이 작성되는 동안 오랜 시간을 거치며 여러 사람들을 통해 말로 전해지거나 손글씨로 베껴졌기 때문이다. 이 과정에서 중요한 내용이 빠지거나 없던 내용이 새로 들어가기도 했다. 그렇기 때문에 아직 발견되지 않은 성경 판본이 발견되어 언제든 새로운 내용이 세상에 드러날 수 있다. 이를테면 우리에게 잘 알려진 ‘착한 사마리아인 이야기’의 새로운 버전도 발견될 수 있는 것이다.

원래 착한 사마리아인 이야기는 이렇다. 한 행인이 강도를 만나서 길에 쓰러져 있다. 그리고 그 모습을 제사장이 발견한다. 하지만 이 제사장은 못 본 채 지나간다. 잠시 후 사마리아인도 그 길을 지나다가 그 행인을 발견하게 된다. 그런데 그 사마리아인은 제사장과는 달랐다. 쓰러진 행인에게 응급 처치를 해준다. 뿐만 아니라 근처 여관으로 데려가서 완쾌될 때까지 돌봐달라고 하며 필요한 돈을 맡긴다. 게다가 도움이 필요하면 자신을 찾아달라며 연락처를 남긴다.

성경 안에서도 워낙 유명한 이야기이다. 그리고 여기에 담긴 함의는 이렇다. 당시 제사장은 대표적인 사회지도층이었다. 반면에 사마리아인이란 사회적으로 그다지 인정받지 못하던 계층이었다. 따라서 현재 우리나라에 비추어보면 제사장과 사마리아인의 비유는 국회의원과 동남아 노동자 정도로 볼 수 있다. 국회의원이 자기 지역구의 행인이 다쳐서 쓰러진 것을 못 본 척하며 지나갈 때 동남아 노동자가 이를 구해줬다는 이야기다.

그런데 ‘착한 사마리아인’에 관하여 우리에게 알려지지 않은 새로운 이야기가 있다. 이 이야기는 훨씬 구체적이고 그 이전까지 알려져 있지 않은 놀라운 이야기를 담고 있다. 이 이야기가 충격적으로 다가오는 이유는 사마리아인이 사실 착하지 않을 수도 있음을 말하기 때문이다.

착한 사마리아인으로 알려진 인물은 사실은 당시 그 일대에서 활동하던 가수였다. 유명 가수는 아니고 하루하루 지역 행사를 뛰며 살아가는 그런 무명 가수였다. 그 날도 행사를 마치고 집에 돌아가는 길이었다. 그런데 저 앞에 누군가 쓰려져 있는 것이 아닌가. 사마리아인은 강도에게 당한 것으로 보이는 이 행인을 발견한다. 처음에는 쓰러진 행인을 보고 흠칫 놀라며 못 본 척하고 멀리 돌아가려고 했다.

하지만 그 순간 사마리아인의 머릿속을 스치는 일이 생각난다. 얼마 전에 길거리에서 주운 거액의 돈을 꿀꺽하지 않고 주인에게 찾아준 개그맨 친구의 이야기다. 그 일로 인해서 그 개그맨은 일약 전국적 스타가 되었고 광고도 찍고 MC로도 진출해 몸값도 높아졌다. 최근 라디오 고정 프로그램도 준비중이라는 이야기도 들린다. 사마리아인은 같은 연에계 종사자로 내심 부러운 마음을 갖고 있었다.

다시 행인의 상태를 살펴보니 처음 생각했던 것보다 심각하지는 않았다. 돈은 강도에게 다 뺏긴 것 같았지만 가벼운 찰과상이 있는 것 외에는 큰 상처는 없어 보였다. 그 순간 사마리아인 머리속에서는 치밀한 계획이 떠오른다. 그러자 앞에서 쓰러져있던 행인이 다르게 보이기 시작한다. 행인의 뒤에서 후광이 비치며 자신의 인생을 바꿔줄 다시 없을 기회로 보이기 시작한다.

우선 사마리아인은 근처 약국에 가서 소독약과 붕대를 사다가 행인의 상처를 치료해주었다. 그리고 사마리아인이 쓰러진 행인을 치료하던 그 때, 한 무리의 고등학생들이 지나가다가 사마리아인이 행인을 치료해주는 모습을 스마트폰 카메라에 담았다. 이 고등학생들은 각자의 인스타그램Instagram으로 이 사진을 공유한다.

일이 예상대로 흘러간다고 느낀 사마리아인은 내친김에 행인을 자기가 아는 여관으로 데려간다. 사실 행인에게 집 주소를 물어서 택시를 태워서 집으로 돌려보내도 되는 상황이지만 말이다. 여관에 도착한 후 친분이 있던 여관 주인에게 행인이 푹 쉬고 회복할 수 있도록 부탁한다. 그러면서 행인을 가볍게 포옹하고 떠날 채비를 한다. 행인은 사마리아인이 누구인지 알려달라고 했으나 사마리아인은 손사래를 친다. 그냥 나중에 곤란한 사람을 만나면 똑같이 해주면 된다는 멋진 멘트를 남긴다. 하지만 속으로는 ‘여관 주인에게 물어보세요.’라고 되뇌인다.

그 순간에도 사마리아인 뒤에서는 지켜보는 눈들이 있었다. “어 저 사람 아까 행사에서 본 가수 아니야?”, “오! 아직 이 사회도 아직 살만한 곳이구나…”라며 사람들이 수군대고 있었다. 하지만 사마리아인은 이 모든 것에 신경쓰지 않는 듯한 초연한 태도로 여관 주인에게 행인을 돌봐달라고 거듭 당부하고 자리를 떠난다.

몇 시간 후 사마리아인을 찍은 사진과 동영상이 페이스북과 트위터 등 각종 SNS를 강타한다. ‘사마리아인’이 실시간 검색어 1위로 오른다. 며칠 후에는 포털 사이트에 경쟁적으로 팬클럽 카페가 개설되기에 이른다.

기사 거리가 될 것이라는 냄새를 맡은 언론들도 움직이기 시작한다. 중동의 유력 언론 알자지라Al Jazeera 방송이 사마리아인과의 독점 인터뷰를 보도한다. 이어서 CNN 등의 외신도 사마리아인 이야기를 서구 사회에 소개한다. 전쟁과 폭력으로 신음하는 중동에서 한줄기 빛과 같은 희망을 주는 이야기로 주목받는다.

급기야 사마리아인은 테드TED에 연자로 초청되어 ‘누가 당신의 이웃인가?Who is your neighbor?‘라는 주제로 강연을 한다. 이는 유튜브을 타고 사람들의 심금을 울리며 폭발적인 조회수를 기록한다. 그때 마침 다음 강의를 준비중이던 예수는 유튜브에서 사마리아인의 테드 강연을 접하고 자신들의 제자들에게 이 이야기를 소개해야겠다고 생각한다. 그리고 그 내용은 예수의 제자 가운데 한 명이 수업 중에 양피지 형태의 성경에 기록한다.

이 양피지를 보관하던 제자가 박해를 피해 다니던 어느 날이었다. 그는 사막 한가운데의 동굴 속 항아리에 이 양피지를 봉인한다. 그리고 그날 저녁 그는 로마 병사에게 체포되어 형장의 이슬로 사라진다. 그날 이후 인류 역사가 끝날 때까지 결국 아무도 이 양피지 성경을 찾아내지 못한다. 끝.

물론 이것은 내가 지어낸 이야기이다. 하지만 착한 사마리아인의 이야기에 우리가 모르는 내용이 없으리라고 누가 장담할 수 있겠는가. 우리는 역사적 사실에 대해서 실제로 일어난 일 그 자체가 아니라 특정인이 그 사실을 해석한 내용 만을 접한다. 그 특정인이 누군지 모르지만 말이다. 내가 말하고 싶은 바는 하나의 사실도 다양한 관점에서 달리 해석될 수 있다는 것이다.

bigdata

이러한 해석의 다양성은 오늘날처럼 자료와 정보가 폭발적으로 증가한 시대에 더욱 중요한 의미를 가지게 되었다. 자료가 많아질 수록 그에 대한 해석은 훨씬 더 많아지기 때문이다. 이른바 빅데이터big data 시대가 시작되면서 자료 그 자체보다 이를 어떻게 가공하고 활용하는지가 중요하게 된 것이다.

빅데이터란 개인 신상 정보나 설문 결과 등의 자료의 방대한 모음을 이야기한다. 하지만 그냥 자료를 엄청나게 많이 모았다고 다 빅데이터라고 하지는 않는다. 경제적 가치를 창출할 수 있는 즉 돈이 될만한 자료일 경우에만 그 모음을 빅데이터라고 한다.

이 빅데이터를 실제로 활용가치가 높도록 가공하는 기술이 2012년부터 IT 업계를 중심으로 주목받기 시작했다. 대표적인 곳이 구글Google Inc.이나 페이스북Facebook Inc. 같은 인터넷 기업들이다. 이들은 사람들의 일거수 일투족을 빅데이터로 축적해가며 사업의 기회를 엿보고 있다.

실감이 가지 않는가. 최근 당신이 스마트폰으로 사고 싶은 물건을 검색하고, 얼마 뒤 스마트폰으로 뉴스를 읽고 있는데 페이지 한 켠에 우연히 같은 상품의 광고를 보게 된 경험이 있을 것이다. 그것은 우연이 아니다. 아마도 구글이 당신의 물건 검색 결과를 토대로 광고를 보여준 것일 가능성이 높다. 이런 것이 빅데이터의 힘이다.

『빅데이터 인간을 해석하다 원제 : Dataclysm | 크리스티안 러더 지음 | 이가영 옮김 | 다른 | 2015년 07월 24일 출간』에서 다루고 있는 것도 빅데이터의 일면이다. 이 책의 저자 크리스천 러더Christian Rudder는 미국 유명 데이트 사이트 OK큐피드OKCupid의 설립자이자 정보 분석가로 자신의 경험을 토대로 빅데이터에 대한 우리의 시야를 넓혀준다. 예컨대 페이스북의 ‘좋아요’를 통하여 한 사람의 성적 취향이나 지능을 놀라운 정도로 예측할 수 있다는 연구 결과, 아름다운 여성이 기하급수적으로 더 많은 면접을 받게 되는 현상, 트위터Twitter Inc.에서 나타나는 인터넷 상의 공개적 망신이나 신상털기가 일어나는 이유를 설명한다.

이어서 저자는 빅데이터가 가져올 수 있는 위험으로 ‘감시’와 ‘판매 수단’의 악용 가능성에 대해 이야기한다. 우리나라에서도 국가정보원이 인터넷 포털 업체에 개인 정보를 내줄 것을 요청했다는 뉴스들이 심심치 않게 들려온다. ‘감시’는 그런 것을 말한다. 그리고 앞서 말한 스마트폰으로 검색한 물건이 뉴스 광고로 나타나는 것이 ‘판매 수단’의 사례이다. 저자는 이처럼 ‘감시’와 ‘판매 수단’ 영역에서 빅데이터가 활용되는 현실에서 자아와 사생활을 지킬 수 있는 방법을 고민한다. 나는 책장을 덮으며 자료의 양이 많아질수록 이를 해석하는 관점이 얼마나 중요한지 깊이 느끼게 되었다.

내가 글을 시작하며 성경 이야기를 꺼내고 시덥지 않은 가상의 이야기를 풀어놓은 것은 다 이유가 있다. 성경이 우리가 다루고 있는 수많은 자료들 중에서 가장 많은 사람들에게 영향력을 끼치고 있는 것이기 때문이다. 전세계적으로 부동의 베스트셀러인 성경은 그 자체로 이미 빅데이터이다. 앞서 말한 경제적 가치 창출이라는 빅데이터의 핵심 요건도 갖추고 있다. 의심된다면 서울 야경을 수놓고 있는 교회의 십자가들을 보라.

나는 성경이라는 확고부동한 빅데이터 조차도 얼마든지 달리 해석될 여지가 있음을 말하고 싶다. 우리가 진실이라고 믿고 쓰는 그 모든 빅데이터들은 우리가 접할 때 이미 누군가가 손을 댄 가공물일 수밖에 없다. 그렇기 때문에 우리는 빅데이터에 대한 맹목적인 믿음을 항상 경계해야 한다. 그것이 성경이 아니라 숫자와 도표로 보기 좋게 꾸며진 세련되고 현대적인 것일지라도 말이다.

잊지 말아야 할 것이 하나 더 있다. 우리가 매 순간 기업과 정부에 내어주는 우리의 각종 개인 정보도 얼마든지 우리 뜻과는 달리 해석되고 활용될 수 있다는 점을 기억하자. 이익과 권력을 추구하는 주체인 기업과 정부는 그들의 필요에 따라서 얼마든지 빅데이터를 입맛에 맞게 해석할 수 있다. 빅데이터 전략이라고 댓글 부대를 운영하는 것 외에는 생각해내지 못하는 작금의 정치인들의 수준을 생각하면 아직 크게 걱정할 정도는 아닌 것도 같다. 하지만 그들도 언제까지나 지금과 같은 낮은 수준에 머무르지는 않을 것이다. 우리가 경계해야 할 것은 그 시도의 불순함이다.

그렇다면 우리는 어떻게 해야 하는가. 기업과 정부가 당신의 개인 정보를 모아서 빅데이터를 구축하고 그들의 필요에 맞게 활용하는 시대는 반드시 온다. 아니 이미 우리는 그런 시대에 살고 있다. 그렇다면 남은 대안은 그들을 철저하게 감독하는 것 밖에 없다. 빅데이터의 위력이 점차 커지고 현실화하는 이때, 빅데이터를 도덕적으로 책임있게 관리할 수 있도록 하는 감독자가 있어야 할 것이다. 그리고 그 감독자는 다름 아닌 바로 당신이라는 점을 기억하자.

요컨대 빅데이터 시대에 접어든 오늘날 우리가 두 가지의 소양을 반드시 갖추어야 한다고 나는 믿는다. 그 첫 번째는 눈에 보이는 것에 대한 ‘맹목적인 믿음의 경계’이고, 그 두 번째는 눈에 보이는 것을 제공하는 이들에 대한 ‘엄격한 감시의 시선’이다.

“빅데이터 인간을 해석하다”의 4개의 댓글

  1. 먼저 선한 사마리아인의 비유를 재미있게 해석하신 것이 유쾌합니다. 저도 같은 비유를 나름대로 묵상하며 쓴 적이 있는데 말이지요. 국가적 차원의 data mining은 이미 잘 알려져 있는데 미국의 경우 911 이후로 이념에 따라 판이한 논쟁의 대상이 되고 있지요. 거기다 불편한 진실(Inconvenient Truth)을 말하지 못하는 Political Correctness라는 괴물까지 등장해서, 지난번 LA 근교에서 있었던 테러사건의 주범이 미국에 들어올 때 당연히 거쳐야 할 심사과정이 약식으로 되어서 문제가 대두되고 있습니다. Big Data는 분야에 따라 해당 기업이나 개인들도 많이 갖고 있지만 누가 어떻게 사용하느냐가 역시 문제이지요.

    1. 국가안보는 개인의 자유와 직결됨으로 복잡하다는 생각이 듭니다. 국가안보가 깨어지면, 정도의 차이는 있겠지만, 개인의 자유도 깨어지는 것이지요. 안보를 유지하기 위해서 개인정보를 어느 정도까지 분석하느냐가 주요 쟁점입니다. 미국 정부에서는 상상을 초월한 방대한 개인정보를 수집하였지만 실제로 분석활용하는데 많은 걸림돌이 있습니다. 다민족으로 구성된 나라이다 보니 profiling이 차별을 유발한다고 금지되어 있습니다. 그래서 테러는 99% 특정 종교 및 국가 출신들에 의해서 자행되고 있지만, 그런 사람들이 미국에 들어올 때 앞에서 언급한 이유로 제대로 심사를 하지 않은 것이 이번에 노출된 것입니다. SNS에 공공연히 테러를 찬양한 글을 올린 데이터가 있었지만 말입니다,

      1. 세밀한 통계자료는 일반에게 공개되지 않습니다. Internet으로 접할 수 있는 것 하나를 소개하지요. http://www.statista.com/statistics/236983/terrorist-attacks-by-country/ 이것 만으로는 물으신 데에 대한 답이 되지 못하는 점 이해하시기 바랍니다. 문제는 big data를 갖고 있지만 이런 저런 이유로 제대로 이용을 못하여 사전에 방지할 수 있었던 일이 터져 14명이 죽고 21명이 중상을 당하는 불행한 일이 발생했다는 것입니다.

댓글 남기기