뉴머러티

   
스티븐 베이커(역자: 이창희)
ǻ
세종서적
   
13500
2010�� 06��



■ 책 소개
신용카드 구매, 휴대전화통화, 이메일 발송, 인터넷의 마우스 클릭, 프로그램 다운로드, 톨게이트 통과 등등. 사람들은 일상생활을 영위하는 것만으로도 수많은 개인 정보를남기고 다닌다. 우리를 둘러싼 기계가 스마트해지면 스마트해질수록 우리가 뿌리는 정보의 수도 늘어난다.  


“누가 이러한 정보를 모으고 있을까? 이 엄청난 데이터를 분석하는 사람들은 누구일까?이러한 데이터를 가지고 그들은 과연 무엇을 할 수 있을까?” 숫자를 뜻하는 ‘number’와 지식 계급을 뜻하는 ‘literati’가 합쳐진신조어 "뉴머러티(Numerati)는 이러한 데이터를 모으고 분석하는 사람들을 가리키는 말이다. 이들이 하는 일은 사람들이 여기저기 흘린정보들을 수학과 통계학을 바탕으로 데이터화하여 사람들의 행동 양식을 분석하고 예측하는 것이다. 셜록 홈스를 떠올려보자. 이 명탐정은 범인이 남긴담뱃재나 발자국 등 여러 단서를 이용하여 추리를 통해 범인의 모습을 그려낸다. 뉴머러티가 하는 일도 이와 크게 다르지 않다.

뉴머러티는 인간 생활의 모든 영역을 파고들어 근로자,쇼핑객, 환자, 유권자, 잠재적 테러리스트, 심지어 연인으로서의 모습까지 우리를 분석한다. 그리고 우리의 행동을 수학적 모델로 만들어 이를실험하고 예측하고자 한다. 책은 뉴머러티들이 다루는 것이 단순한 숫자가 아니라 우리 ‘인간’이라는 점은, 그들이 다른 분야의 많은 전문가들과연대해야만 하며, 이는 공동체를 통해 가능하다는 점을 시사해준다. 

■ 저자 스티븐 베이커(Stephen Baker)

「비즈니스위크」의 테크놀로지 부문수석 편집자로, 20년 이상 「비즈니스위크」에서 일했다. 그의 기사는 「월스트리트저널」「LA 타임스」「보스턴글로브」「필라델피아 인콰이어러」등유수의 매체에 실렸으며, 부상하는 멕시코 자동차 산업에 대한 취재로 ‘오버시즈 프레스 클럽 상’을 수상한 바 있다. 또한 베이커는블로그스팟팅(Blogspotting.net)의 공동 창립자로, 「뉴욕 타임스」는 이를 ‘눈여겨볼 만한 50대 블로그’에 포함시켰다. 저자는 현재아내와 세 아들과 함께 뉴저지의 몬트클레어에서 살고 있다. 

■ 역자 이창희

서울대학교 불문학과를 졸업한 후 파리 소르본 대학교 통역대학원에서한-영-불 통역학으로 석사학위를 받았다. 한국외국어대학교 통역번역대학원에서 강의했으며, 현재는 이화여자대학교 통역번역대학원 교수로 재직 중이다.역서로 『엔트로피』『피자의 열역학』『다음 50년』『21세기의 신과 과학 그리고 인간』『진화-시간의 강을 건너온 생명들』『지구의 삶과죽음』『태양의 아이들』등이 있다.

■차례
머리말 : 뉴머러티의 세계가 열렸다
제1장 근로자 : 어떻게 생산성을 높일 것인가 
제2장 쇼핑객 :무엇을 사게 만들 것인가 
제3장 유권자 : 부동표는 어디에 있는가 
제4장 블로거 : 피드백은 어떻게 이루어지는가 
제5장테러리스트 : 테러리스트는 어디에 숨어 있는가 
제6장 환자 : 발병 시기는 예측 가능한가 
제7장 연인 : 내게 가장 잘 어울리는사람은 누구인가 
맺음말 : 우리가 데이터의 주인이다 


참고문헌
감사의 말
옮긴이의말
 

 





뉴머러티

머리말 : 뉴머러티의 세계가 열렸다
사람들은 매순간 엄청난 양의 데이터를 만들어낸다. 일상을 보내는 것만으로도 사람들은 휴대전화, 노트북, 신용카드를 사용하면서 자신의 디지털 데이터를 늘려간다. 나만 해도 그렇다. 뉴저지의 카페에서 이 글을 쓰고 있는 봄날 아침, 이동통신업체인 버라이존은 몇 미터 이내의 오차로 지금의 내 위치를 파악할 수 있다. 비자카드사는 내가 카페인을 충분히 섭취하여 어제 저녁 8시 19분에 산 포르투갈산 와인의 취기를 이겨내고 있다고 증언할 수 있을 것이다. 8시 19분이면 대학 농구 경기를 보기에 딱 알맞은 시간인데, 티보(Tivo, 하드디스크에 텔레비전 프로그램을 자동으로 녹화할 수 있는 디지털 비디오리코더의 상표명-옮긴이)가 알고 있겠지만 나는 이 경기를 전반전만 보고 껐다. 은행과 편의점의 CCTV는 내 모습을 시간이 표시된 영상을 통해 포착해낸다. 내가 인터넷에서 어떤 사이트를 방문하는가는 말할 필요조차 없다. 세계 각국의 수많은 인터넷 출판업체와 광고업체들에 있어 이러한 정보는 기록의 대상이 된 지 오래다.


이 모든 것이 컴퓨터칩으로부터 시작되었다. 1980년대까지만 해도 수백만 개의 미세한 트랜지스터의 모임인 이 조그만 실리콘 조각들은 그저 신기한 물건에 불과했다. 그런데 해가 가면서 가격은 싸지고 성능은 향상되었다. 제조업체들은 조금이라도 스마트한 기능이 필요한 기기라면 모두 칩을 끼워 넣기 시작했다. 이 칩들은 휴대전화, 자동차의 마이크로프로세서, 디지털 카메라, 그리고 두말할 것도 없이 컴퓨터에 들어간다. 칩은 자신이 받은 모든 명령과 수행한 모든 작업을 기록할 수 있다. 정보 하나하나만을 보면 거의 의미가 없다. 그러나 이들을 모아놓고 보면 패턴이 생기고, 이 패턴이 우리의 취향과 행동 양식, 직장에서의 일과, 상가와 슈퍼마켓에서의 동선을 보여준다. 그리고 이 데이터의 흐름은 지구 반대편까지 전송될 수 있다.


누군가가 이 정보들을 한데 모아 체계를 세운다면 갑자기 초점이 맞아 또렷해진 영상이 보일 것이다. 이렇게 되면 끊임없이 변하면서 업데이트되는 인간 행동의 모자이크가 생겨난다. 마케팅 담당자들은 생각만으로도 흥분되어 몸이 떨릴 것이다. 이 정보의 구슬을 꿸 수만 있다면 이들은 우리의 욕망, 공포, 필요를 모두 읽어낼 수 있다. 그러면 우리가 원하는 바로 그것을 우리에게 팔 수 있을 것이다.


사람들이 만들어내는 이 무수한 데이터에서 의미를 찾아낼 수 있는 사람들은 뛰어난 수학자들과 컴퓨터 과학자, 엔지니어들뿐이다. 이들은 우리의 삶을 보여주는 비트(bit)를 기호로 바꾸는 방법을 안다. 인간이 만들어내는 데이터의 양이 폭발적으로 늘어나고 컴퓨터의 처리 능력이 눈부시게 강화됨에 따라 이 마에스트로들의 힘 또한 더욱 커지고 있다. 이들 중 두 사람이 90년대에 구글을 창립하면서 큰 성공을 거두었다. 21세기로 들어서면서 구글은 이 시대의 상징적인 기업이 되었다. 구글은 전적으로 수학에 바탕을 둔 업체로, 창립 목적이 사람들의 ‘데이터 사냥’을 도와주는 데 있다. 사람들은 원하는 웹 페이지를 찾기 위해 단어들을 입력한다. 단순한 검색엔진을 거대 미디어 기업으로 탈바꿈시킨 돌파구는 이 단어들이 광고업체들에게는 엄청난 가치를 갖는다는 사실을 발견한 것이다. 구글은 데이터를 어떻게 돈으로 변화시키는가를 알아냈다. 그리고 많은 업체들이 같은 목표를 향해 달려가고 있다. 데이터 고수들은 생물학, 의학, 광고, 스포츠, 정치 분야로 영역을 확장하고 있다. 인간은 모두 수량화되고 있는 것이다.


사실 인간에게는 선택의 여지가 없었다. 옛날 방식들은 어처구니없을 정도로 느렸다. 그러나 새로운 방식을 이용하려면 한 가지 조건이 있었다. 우리의 삶을 이루는 모든 것들을 0과 1로 바꾸는 것이다. 이로 인해 인간의 의사소통의 열쇠를 기호언어의 마에스트로에게 넘겨주게 된 것이다. 이제 이들 수학자들과 컴퓨터 과학자들은 우리의 삶을 이루는 정보를 지배할 수 있게 되었다. 이 사람들을 나는 ‘뉴머러티(Numerati)라고 부른다(저자가 만든 이 단어는 ’literati를 변형한 것으로 보이는데, ‘number가 숫자 ’literati‘가 ’지식 계급‘이라는 뜻이므로 ’Numerati는 ‘숫자 지식 계급’이라는 뜻으로 생각된다-옮긴이).


이런저런 난관이 있기는 하지만 오늘날의 뉴머러티들은 대중에게로 시선을 고정한 채 계속 전진하고 있다. 이들은 이미 사람들로부터 나온 데이터 파편을 결합하여 예측 가능한 모델을 만들어내고 있다. 이는 시작에 불과하다. 앞으로 10년 후면 사람들은 자기도 모르는 사이에 삶의 거의 모든 측면에서 자신의 모델을 만들어내기 시작할 것이다.


앞으로 살펴볼 이 엄청난 데이터의 세계는 곧 인간 행동의 거대한 실험실이다. 그러니까 사회과학 및 경제학적 행동, 심리학을 망라하는 실험장인 것이다. 마이크로소프트와 야후 같은 회사들은 의학에서부터 언어학에 이르는 다양한 분야의 학자들을 채용하여 쏟아져 들어오는 인간의 삶에 관한 막대한 양의 정보를 처리하고 있다. 심리학자, 경제학자, 생물학자, 컴퓨터 과학자 같은 사람들이 과거와는 전혀 다른 차원의 협력을 통해 사람들의 일생을 담은 무수한 데이터를 분석하여 함께 답을 찾아낸다는 뜻이다. 인폼테크놀로지스(Inform Technologies)라는 뉴욕에 위치한 신생 기업의 수석 연구원 잭 아인혼은 21세기의 위대한 발견은 방대한 양의 데이터에서 패턴을 찾아내는 데서 이루어지리라고 내다본다.


근로자 : 어떻게 생산성을 높일 것인가
지난 10년 동안 사무직 근로자의 업무는 책상 위에 쌓인 서류 파일, 공책, 신문, 출입문에 붙은 포스트잇 같은 것으로부터 점차 멀어져왔다. 그러면서 이들의 업무는 네트워크에 연결된 컴퓨터로 옮겨갔다. 그러니까 사무직 근로자들은 무지막지한 기억력과 초인적인 시간 감각을 갖춘 데다 동료애라고는 전혀 없는 동료와 한데 묶여 있다. 이 동료는 사장에게만 충성을 다하며, 공책이나 스톱워치가 없어도 우리가 하는 일을 모두 측정할 수 있다. 컴퓨터는 감시자의 역할을 하며 10억 분의 1초도 망설이거나 안타까워하는 일 없이 우리의 온라인 비밀을 모두 까발린다. 다른 어느 곳보다도 직장에서 우리는 데이터의 노예, 그러니까 우리 자신이 만들어내는 정보의 종이 되어가고 있다.


2006년에 마이크로소프트는 심지어 직원들의 심장박동 수, 혈압, 피부 전기전도성, 표정 등을 모니터하는 기술에 대해 특허 출원을 하기도 했다. 특허 신청서에 따르면 이 기술은 직원들의 스트레스나 짜증의 정도가 올라갈 경우 관리자에게 이를 알릴 수 있다. 이러한 기술의 연구는 지금 시작 단계이다. 하지만 오늘날의 기술로도 모니터링은 얼마든지 가능하다. 여러분이 다니는 회사가 키보드를 통해 여러분의 행동 패턴을 철저히 분석하지 않는다면 이는 회사가 그렇게 하지 않기로 결정했거나 아직 그 정도까지 갈 능력이 없기 때문일 뿐이다. 그러면 왜 회사는 이렇게 직원들을 감시할까? 간단히 말하면 생산성을 끌어올리기 위해서이다.


어떤 사람이 눈부신 성과를 올리면 업체들은 결국 그의 수학 모델을 ??일터의 DNA??로 활용할 것이다. 그리고 이를 이용하여 어떤 의미에서 그를 복제해낼 것이다. 타크리티의 팀원 중 하나인 알렉산드라 모이실로비치는 이렇게 말한다. 어떤 회사에 조 스미스라는 특출한 직원이 있다고 하자. 경영진은 스미스와 비슷한 사람 두세 명, 아니 열댓 명이 있으면 좋겠다고 생각할 것이다. 회사가 전체 직원들에 대한 수학적 프로필을 충분히 확보한다면, 조 스미스만의 독특한 경험이나 업무 방식을 찾아내 그 조건에 맞는 직원들을 걸러내는 일은 어렵지 않을 것이다. “직원의 업무 경력을 모두 알고 있으면 수학 계산을 통해 제2의 조 스미스를 만드는 단계를 알아낼 수 있을 겁니다.” 모이실로비치의 말이다. 물론 이렇게 하려면, 유전자 조작이 필요한 것이 아니라 교육 훈련이 필요할 것이다. 하지만 어쩌면 진짜 조 스미스는 복제해낼 수 없는 타고난 지적 능력이나 설계 역량 등을 가지고 있을지도 모른다. 모이실로비치는 말한다. “과학자나 화가, 음악가를 똑같이 만들어내자는 말이 아니에요. 하지만 그저 복제 가능한 단순한 역량을 요구하는 직책들도 많거든요.” 그리고 어떤 사람이 이러한 직책에 적성이 없다고 판단되면 이 사람은 일단 수학적으로, 그런 뒤엔 실생활에서 그 자리에 맞게 조정될 것이다.


오늘날 야구계의 뉴머러티들은 월스트리트의 수량 분석가만큼이나 재빨리 야구 관련 데이터를 분석해낸다. 이들은 선수들을 수학적으로 분석하는 새로운 모델을 만들어내고 있다. WARP(Wins Above Replacement Player, 다른 선수로 대체했을 경우와 비교하여 더 많이 올릴 수 있는 승리 수-옮긴이)는 이러한 모델 중 하나이다. 베이스볼 프로스펙티브(Baseball Prospective, 야구 전망‘이라는 뜻-옮긴이)라는 수량 분석가 사이트를 방문하면 ’카를로스 벨트란‘이라는 선수의 프로필을 볼 수 있다.


뉴욕 메츠의 중견수인 벨트란은 좌우 타석을 오가며 타격을 하는 선수이다. 2004년 말에 벨트란은 7년간 1억 2천만 달러를 받는 것으로 구단과 계약을 했는데, 이 정도면 연봉 1천 8백만 달러 수준이다. 눈부신 성적을 올린 2006년 시즌이 마감되었을 때 그의 WARP 값은 10.6이었다. 무슨 뜻이냐 하면, 메츠가 벨트란을 연봉 50만 달러를 받는 그저 그런 선수와 대체했을 경우 162경기를 치러야 하는 한 시즌 동안 승리하는 경기 수가 11경기 줄어든다는 뜻이다. 이 통계에 따르면 1승을 거둘 때마다 메츠는 162만 달러를 지불하는 꼴이 된다. 돈 많은 뉴욕 구단이라면 이 정도는 감당할 수 있다. 그러나 벨트란이 삐걱거리는 33세가 되는 2010년에도 이 정도의 WARP 값을 유지할 수 있을까? 베이스볼 프로스펙티브는 아니라고 진단한다. 이들의 예측에 따르면 그때쯤 벨트란의 WARP 값은 3.6으로 떨어지고 실제 가치는 580만 달러로 내려간다. 그가 받는 연봉에 비해 훨씬 낮은 가치이다.


이 계산은 옳은가? 아무도 모른다. 이 WARP 수치에는 눈에 보이지 않는, 그러니까 측정 불가능한 벨트란의 가치가 포함되어 있는가? 예를 들어 신인 선수에게 타격에 대한 조언을 해준다든가, 1루에 나갔을 때 춤추듯 리드를 잡으며 상대 투수를 교란하는 것 등으로 팀에 기여하는 일 말이다. 달리 말해 이 모든 복잡한 요소로 되어 있는 현실을 숫자가 반영해 내는가? 그렇지 못하다. 심지어 야구처럼 통계자료가 풍부한 분야마저도 그렇다. 잘못된 숫자를 뽑으면 엉뚱한 결과가 나온다. 이상한 일도 아니다. 하지만 수치로 나타난 내 역량이 형편없는데 상사에게 이런 논리를 들이댈 수 있을까?


숫자 세상의 근로자는 누구의 도움도 받지 못하며, 그저 자신에게 매겨진 숫자에게 따라 성패가 결정될 뿐이다. 이들 중 극소수만이 카를로스 벨트란처럼 7년 계약을 체결할 수 있다. 이렇게 숫자로 평가되는 세상에서는 무리에 속해서 얻는 보호막이 존재하지 않는다. 결국 숫자에 의존하는 시장에서 게으르거나 무능한 근로자가 살아남는다면 이는 시장의 비효율성을 의미할 뿐이다. 그리고 시간이 지나 엄밀한 측정 방법이 확립되면 이들은 아마 가치가 폭락할 것이고 마치 실적이 나쁜 주식처럼 포트폴리오에서 제거될 것이다.


이렇게 점점 수량적으로 정의되는 일터에서는, 인간은 측정할 수 있는 대상이 아니라고 주장하는 사람들도 결국 숫자를 이용하여 자신의 주장을 뒷받침해야 하는 압력에 직면하게 될 것이다.


쇼핑객 : 무엇을 사게 만들 것인가
집단으로서의 쇼핑객의 행동에 대해서는 많은 것을 알아냈지만 소비자 개개인에 대해서는 아는 것이 별로 없었다. 설령 같은 가게에 100번을 들어갔다고 해도 이 가게의 시스템은 개인으로서의 우리를 인식하지 못한다. 개인을 알아볼 방법이 없는 것이다. 이제 이런 시대는 저물어가고 있다. 인터넷을 보라. 아마존이든 여행 상품을 파는 사이트든 인터넷 상인들은 고객 개개인을 파악하기 위해 끊임없이 노력하고 있다. 이들은 사람들의 소비 패턴을 파악해서 그들의 욕구를 예측하고 소비를 유도한다.


3년 전에 라이드 가니가 이끄는 액센추어의 연구팀은 한 식료품 체인과 공동 작업을 시작했다. 이 프로젝트는 횡재나 마찬가지였다. 왜냐하면 2년치의 상세한 고객 정보를 얻을 수 있었기 때문이다. 물론 마트 측은 고객의 이름, 나이, 기타 개인 정보를 삭제했지만 아무 상관이 없었다. 가니 팀이 연구 대상으로 삼은 2만여 명의 쇼핑객들은 그저 숫자일 뿐이었다. 그러나 마트 안에서의 행동을 분석하면 숫자는 어떤 쇼핑객의 상세한 초상화로 탈바꿈했다.


여러분이 이름 없는 쇼핑객이라고 가정하자. 연구자들은 여러분에 대해 무엇을 알아낼 수 있을까? 사실 아주 많은 것을 알아낼 수 있다. 연구자들은 구매 패턴과 매주의 구매액을 바탕으로 여러분이 쪼들리는 생활을 하는지 아닌지를 알아낸다. 이들은 여러분이 최대한 얼마나 쓸 수 있는가를 계산해낼 수 있다. 이 데이터에 ‘의미를 가진 이름표’를 조금 추가하면 다른 결론을 이끌어낼 수도 있다. 여러분이 스킴 밀크를 사기 시작하거나 아니면 미러클 밀크셰이크를 산다면 다이어트 중이라는 결론을 끌어낼 수도 있다. 연구자들은 중학교 2학년 정도의 수학 실력만 있으면 누구나 이해할 수 있는 통계적인 기법으로 이 작업들을 수행한다.


이렇게 해서 연구팀은 21세기 최초 2년 동안 일군의 도시 거주 미국인들의 식품 구매 습관을 알 수 있는 거대한 카탈로그를 작성했다. 그런데 예를 들어 여러분이 일주일에 95달러의 예산을 가지고 살고 있다던가, 치토스라면 사족을 못 쓴다거나, 과거 한때 황제 다이어트를 시도해보았다는 사실이 마트 경영진에게 어떤 도움을 주는가? 여러분이 고객 카드를 손에 들고 카트를 밀며 카운터 앞에 서기  전까지는 구매가 이루어지지 않는 것인데, 그 상황에서 이러한 정보가 무슨 도움이 되느냐는 것이다. 카운터 앞에 서는 순간 여러분의 쇼핑은 이미 끝났다. 따라서 고객 개개인에 대한 분석 자료를 바탕으로 샘플을 건넬 기회는 이미 지나간 것이다.


하지만 고객이 카트 하나를 밀며 마트로 들어서는 순간 그가 누군지를 알아볼 수 있다면 해결의 실마리가 생긴다. 새로워진 스마트 카드가 이제 막 굴려지기 시작했다. 매사추세츠 주에 있는 체인점에서 스톱앤드숍(Stop&Shop)은 이러한 카트를 시험하고 있다. 마이크로소프트 프로그램을 장착한 카트들도 미국 동부 지역의 숍라이트(ShopRite)에서 선을 보이고 있다. 독일계 체인점인 메트로(Metro)는 뒤셀도르프에서 첫선을 보였다. 한-영 합작사인 삼성-테스코는 서울에서 이러한 카트를 운영하고 있다.


똑똑한 카트를 밀고 가는 쇼핑객이 겪을 만한 일은 대략 다음과 같다. 카트를 하나 끄집어내 고객 카드를 통과시킨다. 어서 오시라는 초기 화면에 이어 쇼핑 리스트가 뜬다. 이 리스트는 이제까지의 내 쇼핑 실적을 바탕으로 만들어진 것이다. 우유, 달걀, 야채 등등. 컴퓨터는 내가 사고 싶은 각 품목으로 가는 최단 거리를 알려줄 것이다. 아니면 리스트를 편집하라고 고객이 명령할 수도 있다. 예를 들어 콜리플라워나 소금 뿌린 땅콩은 다시 리스트에 올리지 말라고 말이다. 이 정도는 간단하다. 그러나 액센추어의 연구에 따르면, 쇼핑객들은 자기가 사려는 목록을 평균 11퍼센트 정도 잊어버린다. 고객이 필요로 하는 것을 알려줄 수만 있다면 사람들은 한밤중에 동네 편의점으로 달려가는 일이 적어질 것이고 따라서 마트의 수입은 올라갈 것이다.


마트 책임자들이 쇼핑객의 행동을 조작할 수 있다면 상황은 더욱 흥미로워진다. 라이드 가니는 자기 팀이 설계한 마트의 컨트롤 패널을 보여준다. “어떤 마트에서 쇼핑객들 중 400명이 특정 냉동 생선 브랜드로 옮겨가기를 원한다고 해보죠.” 가니가 말한다. 마우스만 몇 번 클릭하면 마트 관리자는 자기네 마트를 드나드는 손님 중 몇 명이 이 냉동 생선을 사는지 알 수 있다. 이렇게 특정 브랜드를 구매하는 쇼핑객의 집단을 마케팅에서는 ‘버킷(bucket)이라고 한다. 이 경우에는 냉동 생선 버킷이다. 이 버킷에 들어 있는 쇼핑객의 수가 5,000명이라고 하자. 이 중에는 물론 경쟁사 브랜드를 사는 사람들도 들어 있다. 이들이 타깃으로, 이들은 다시 경쟁사 브랜드를 구매하는 1,000명의 버킷 3개로 세분할 수 있다. 이들 중 3분의 1 정도(1,000명)는 경쟁사 브랜드에 충성도가 있는 사람들이다. 그러니까 이 사람들을 경쟁사로부터 빼앗으려면 상당한 폭의 할인을 해주어야 한다는 뜻이다. 그러나 나머지, 그러니까 약 2,000명 정도는 브랜드에 관해 좀 더 유동적이다. 이들은 브랜드를 좀 더 자주, 그리고 쉽게 바꾼다.


이러한 버킷은 점점 더 세분화된다. 이런저런 식으로 수치를 조정해서 수익과 매출을 올리고, 브랜드를 홍보하고, 재고를 줄일 수 있다. 다시 말해 확률에 기반을 둔 인형극이 펼쳐지는 것이다. 여기서 인형은 말할 것도 없이 수치로 변형된 우리들 자신이다.


1990년대부터 세계적으로 뛰어난 수학자와 컴퓨터 과학자들은 방대한 DNA 데이터베이스 및 그 밖의 인체 관련 자료를 분석할 알고리듬 분석에 매달려왔다. 이들은 수십억의 염기쌍 중 백혈병의 발병 위험, 천재적 창의력, 알코올 중독, 죽음에 이를 수 있는 땅콩 알레르기 등으로 사람을 몰고 갈 수 있는 유전자 패턴을 찾고 있다. 이 연구는 아직 초기 단계지만 과학자들은 이런 저런 질병과 염기쌍을 연관 짓는 거대한 데이터베이스를 구축 중이다.


가니가 쇼핑 패턴과 유전자 연구자들에 관해 하는 말을 들으면서 나는 이제까지 등장한 사람들, 그러니까 식품업체, 마이크로타깃팅을 하는(세분화된 소수집단을 대상으로 하는) 광고업체, 수리(數理) 유전학자 같은 사람들을 한자리에 모아놓는 모습을 떠올려본다. 겉으로 보기에 이들 사이트에는 공통점이 별로 없다. 그러나 공통점은 분명히 존재한다. 오늘날 거의 모든 업종에서 소비자들이 만들어낸 데이터는 0과 1로 표시된다. 오랫동안 서로 다른 분야, 대학의 서로 다른 학과, 서로 다른 업종에서 고립되어 일하던 연구자들은 이제 같은 문제에 달려들고 있다. 분석의 네트워크는 예를 들어 물리학으로부터 사회학에까지 뻗쳐 있다. 어떤 의미에서 이 모든 과학자들은 세계 차원에서 네트워크를 통해 하나로 연결된 실험실에서 일하고 있는 것과도 같다.


이 모든 것이 의미하는 바는 무엇인가? 쇼핑 패턴의 비밀, 그러니까 소비자 자신도 미처 모르고 있던 무의식 차원에서 숨어 있는 비밀을 찾아낼 도구를 개발하는 연구자들은 지금 월마트나 구글 아니면 가니가 이끄는 팀에서 일하는 사람들이 아닐 수도 있다는 뜻이다. 예를 들어 마이크로소프트에서 일하는 데이비드 헤커먼이라는 사람은 쏟아져 들어오는 이메일 중에서 스팸을 걸러내는 프로그램 작성에 몰두해 있었다. 스팸을 보내는 사람들은 갈수록 정교해지는 방어 시스템을 돌파하기 위해 체계적으로 수법을 바꾼다는 사실을 헤커먼은 알고 있었다. 그러니까 그가 씨름하고 있던 문제는 자연에서 일어나는 돌연변이와 비슷한 현상이었다. 그는 해커들이 일으키는 변화를 예측하는 시스템을 만들어야 했던 것이다. 의사인 동시에 컴퓨터 과학자였던 헤커먼은 스팸에서 일어나는 돌연변이를 자신의 시스템이 찾을 수 있다면, 이를 의학에도 이용할 수 있다고 생각했다. 2003년에 그는 에이즈를 일으키는 병원체인 HIV에 눈을 돌렸다. 스팸에서 성과를 올린 그의 시스템은 결국 에이즈 백신을 향하는 길을 열어줄 수도 있다. “둘 다 같은 코드인 셈”이라고 헤커먼은 말한다. 뉴머러티의 세계에서 해결책은 어느 방향에서도 나올 수 있다.


연인 : 내게 가장 잘 어울리는 사람은 누구인가
배우자를 찾든 직업을 찾든 네트워크로 연결된 오늘날의 세상에서 성공하려면 대상을 잘 찾는 능력이 있어야 할 뿐만 아니라 다른 사람들의 검색 결과에서 내가 제일 위에 놓이도록 하는 것이 중요하다.


뉴머러티의 역할이 점점 커짐에 따라 사람들은 자신의 모습이나 목소리, 혹은 인간관계에 의해 눈에 띄기보다는 사람들의 데이터를 기를 쓰고 분석해대는 수학 프로그램에 의해 분석될 가능성이 점점 더 커져만 간다. 여기서 점점 더 중요해지는 능력은 기계가 우리를 잘 찾게 하는가, 그리고 우리가 기계를 이용하여 다른 사람을 잘 찾는가 하는 것이다.


기업의 경우 눈에 띄어야 한다는 절대적인 명제가 있다. 이로 인해 대규모의 컨설팅 사업이 탄생했다. 이러한 서비스를 ‘검색엔진 최적화(SEO, Search Engine Optimization)라고 부른다. 어떤 사람이 애리조나 주 투손에서 여관을 운영하고 있다고 하자. 여관주인은 컨설팅 업체에 연락을 하여 돈을 내고 자신의 웹사이트가 명단 맨 위 근처로 올라가도록 한다(인터넷은 이런 서비스를 제공하는 사람들로 넘쳐난다).


이 여관 주인의 웹페이지를 최적화하려면 컨설팅 업체는 우선 검색 알고리듬을 이해해야 한다. 위로 올라가려면 어떻게 해야 하는가? 능력 있는 컨설팅 업체라면 수천 가지의 조합을 시험해본 뒤 어떤 알고리듬이 적합한가를 찾아낸다. 그러고 나서 고객의 웹페이지를 이런저런 식으로 가공하여 최적의 조건을 만들어낸다. 한편 검색엔진에서 일하는 전문가들은 자기 회사의 알고리듬을 적절히 수정하여 이런 컨설팅 업체의 고객보다는 가장 관련성이 높은 사이트가 맨 위로 오도록 조정한다. 전문가들은 한 번 클릭이 이루어질 때마다 정보를 입수한다. 이것은 영원한 전쟁이다. 검색엔진과 컨설팅 업체만이 아니라 컨설팅 업체끼리의 전쟁인 것이다.


사실 이런 싸움은 인간이 두 발로 서기 시작했을 때부터 존재해왔다. 시스템과 겨루는 것이야말로 인간의 특기 중 하나다. 일단 시스템이 어떻게 돌아가는가를 파악하고 나서, 어떻게 하면 시스템이 자신에게 유리하게 돌아갈까를 계산해낸다. 각 참여자는 자신이 원하는 결과를 끌어낼 수 있는 최적의 레시피 또는 알고리듬을 개발해낸다. 이런 측면에서 기본적으로 달라진 점은 없다. 오늘날이 과거와 다른 점이 있다면 자동화된 시스템이 활용된다는 사실이다. 여기서 중요한 점은 돈이건 사랑이건 상대방에게 발견되려면 기계가 우리를 쉽게 알아볼 수 있게 해야 한다는 사실이다. 웹페이지의 맨 위로 올라가야 한다. 그러려면 알고리듬에 스스로를 맞춰야 한다는 뜻이다.


주머니나 핸드백에 손을 넣어 휴대전화를 꺼내보라. 휴대전화는 통신 신호, 센서, 컴퓨터 연산 능력, 저장 능력을 가진 막강한 장치이다. 위 속에 테니스공만한 모니터링 장치를 집어넣고 사는 소, 노먼을 기억하는가? 노먼의 뱃속에 들어 있는 컴퓨터처럼 휴대전화가 우리의 동작과 상호작용 등을 모두 기억해서 뉴머러티에게 보내 우리의 수학적 모델을 만들게 한다면 어떨까? 그러면 우리와 여러 가지 패턴이 비슷한 다른 사람을 찾아낼 수 있을까? 이런 사람들이 우리의 친구나 동료 혹은 연인이 될 수 있을까?


네이선 이글은 이런 분야를 연구하는 사람이다. 몇 년 전 MIT의 미디어랩에서 박사과정을 밟고 있던 이글은 실험을 했다. 이글은 100명의 대학원생에게 휴대전화를 나눠주었다. 이들 중 4분의 1은 MIT의 슬로안 경영대학원의 학생들이었고 나머지는 미디어랩(Media Lab) 학생들이었다. 참여자들에게 이글은 이 전화를 가지고 다니면 동작과 상호작용이 기록된다는 사실을 알려주었다. 1년 내내 이 전화는 연구팀에게 학생들이 어디에 갔는지, 누구와 만났는지 뿐만 아니라 누구와 몰려다니는지, 아니면 누구와 밤을 함께 보내는지에 관한 데이터를 모두 입수할 수 있도록 했다.


이글에 따르면 실험을 수행한 1년 동안 두 그룹의 학생들, 그러니까 경영대학원생들과 과학 전공생들의 움직임 패턴이 다르다는 사실을 쉽게 알 수 있었다고 한다. 그래서 나중에는 데이터만 봐도 이 사람이 어디에 속하는 학생인가를 90퍼센트의 확률로 알아낼 수 있었다고 한다. 게다가 다양한 타입의 관계를 들여다보면 어떤 사람이 누구와 친구인지, 누구와는 단순한 지인인지 금방 알 수 있었다.


이글은 각 개인에 대한 모델을 정립하기 시작했다. 우선 휴대전화 사용의 기본 패턴이 연구 대상이었다. 즉 집이나 학교에서 휴대전화를 켜놓는가, 꺼놓는가 하는 것이다. 이글은 이러한 각각의 변수에 ‘고유 행동’이라는 이름을 붙였다. 각 고유 행동의 평균을 구하기는 쉬웠다. 도표를 보면 학생들은 집단의 형태로 나타났다. 이를 근거로 이글은 경영대학원생과 과학 전공생을 구분했다. 같은 집단 안에서도 각 구성원은 독특한 행동의 조합을 보였다. 어떤 사람들은 토요일에 12시가 넘을 때까지 잤다. 어떤 사람들은 일요일 아침에 전화를 꺼놓았다. 여러 가지 색을 이용해서 도표를 만들어보니 각 개인의 삶은 질서정연한 기하학적 형태를 보였다. 워낙 규칙적이어서 이 사람이 다음에 무엇을 할지, 집에 오면 휴대전화를 끌지 그대로 둘지 등을 예측할 수 있었다는 얘기다.


모든 조직은 이런 데이터에 목말라한다. 대중교통 관리자는 통근자들의 움직임을 예측하고 싶어한다. 지역의 광고업체라면 말할 필요도 없이 어떤 사람이 술을 마시고 싶은 때에 맞추어 바나 식당의 광고를 띄우고 싶을 것이다.

?

이글은 이를 사람 사귀기에 쓰려고 한다. 예를 들어 휴대전화를 ??무차별?? 모드에 놓았다고 상상해보자고 이글은 말한다. 이는 상대가 누구든 가리지 않고 아무나 만날 자세가 되어 있다는 뜻이다. 이 사람의 전화는 마치 등대처럼 그의 프로필을 전파를 통해 주변에 있는 모든 사람들에게 쏘아 보낸다. 초기에 여기 수록된 프로필은 마치 초기의 컴퓨터 소개팅 수준일 것이다. 관심 분야 몇 가지가 일단 수록된다. 예를 들어 스웨덴 영화, 자전거 여행, 프랑스 음식 등. 전파 도달 범위 내에 있는 사람들 중 같은 취미를 가진 사람이 있으면 이 사람의 프로필이 그들의 전화기에 뜨고 아마 이들 중 하나가 다가와서는 팔꿈치를 툭 치며 “저쪽 레스토랑에서 끝내주는 코코뱅(와인으로 요리한 닭고기-옮긴이) 요리를 하는데요”라고 말을 걸어도 전혀 이상하지 않을 것이다. 휴대전화만 들고 다니면 그 사람의 프로필은 더욱 상세해질 수 있다.

(본 정보는 도서의 일부 내용으로만 구성되어 있으며, 보다 많은 정보와 지식은 반드시 책을 참조하셔야 합니다.)