데이터 분석의 힘 | ||||
지은이 : 이토 고이치로(역:전선영) | ||||
출판사 : 인플루엔셜 | ||||
출판일 : 2018년 04월 |
■ 책 소개
폭발하는 빅데이터 시대, 데이터는 어떻게 전략이 되는가
2017년 출간 직후 일본 아마존 경제 1위, 제39회 산토리 학예상 및 제60회 닛케이경제도서문화상을 동시 수상하며 학계와 대중으로부터 뜨거운 관심을 받은, 빅데이터 시대를 위한 데이터 분석 입문서. 듣기만 해도 어려운 데이터 분석 이론들을 흥미로운 사례와 함께 설명해 전문가가 아니어도 쉽게 이해할 수 있도록 썼다. 정말 그 광고가 제품의 매출을 높였다고 판단할 수 있는지, 오바마 대선 캠프는 어떤 데이터 분석을 활용해서 6천만 달러의 후원금을 ‘더’ 모았는지, 정부가 전기요금을 얼마나 인상해야 절전 효과가 발생하는지, 구글과 우버는 빅데이터를 활용해 어떤 비즈니스 전략을 이끌어냈는지 등 실제 사례를 통해 데이터 분석의 세계를 경험케 한다. 이 책을 통해 의미 없는 숫자의 나열에 불과해 보이는 데이터가 어떻게 똑똑한 전략, 세상을 바꾸는 정책으로 진화하게 되는지를 이해하게 될 것이다.
■ 저자 이토 고이치로
중국의 미세먼지, 동일본 지진 후 일본 내 전력 공급 부족 문제 등 뜨거운 관심이 쏟아지는 환경 에너지 정책 분야의 실증 연구와 데이터 분석으로 주목받는 젊은 경제학자. 중국인들은 미세먼지 1마이크로그램을 줄이는데 얼마를 지불할 용의가 있는지, 부족한 전력 공급 문제를 해결하기 위해 일본 정부가 전력 가격을 얼마나 올려야 절전 효과를 얻을 수 있을지 등의 실험 분석 결과를 논문으로 발표해 숫자에 불과한 데이터가 어떻게 똑똑한 전략과 정책이 되는지, 어떻게 세상을 바꿀 수 있는지를 몸소 증명하고 있는 현장형 분석가다.
일본에서 태어나 교토대학교 경제학부를 졸업하고 미국 캘리포니아대학교 버클리캠퍼스에서 박사과정을 수료했다. 스탠퍼드대학교 경제정책연구소 연구원, 보스턴대학교 비즈니스스쿨 조교수를 거쳐 2015년부터 시카고대학교 해리스스쿨(공공정책대학원)에서 강의하고 있다. 전미경제연구소(NBER) 연구원과 경제산업연구소(RIETI) 연구원을 겸임하고 있으며 전문 분야는 환경에너지 경제학, 산업조직론, 응용계량경제학이다. 시카고대학교에서는 환경 정책, 에너지 정책의 실증 연구를 수행하는 한편 데이터 분석 이론과 응용에 관한 강의를 하고 있다.
2017년 일반인을 대상으로 처음 집필한 이 책 《데이터 분석의 힘》으로 단번에 제39회 산토리 학예상과 제60회 닛케이경제도서문화상을 동시 수상하며 학계와 대중의 뜨거운 스포트라이트를 받았다. 기존의 데이터 분석서와 다르게 수식을 사용하지 않고도 데이터 분석이 무엇인지 파악할 수 있도록 집필해 일본 내에서 8만 부 이상 판매되며 아마존 재팬 경제 분야 1위, 2017년 신서대상 6위에 선정됐다.
■ 역자 전선영
한국외국어대학교 일본어과를 졸업하고 현재 출판 전문 번역가로 활동 중이다. 옮긴 책으로 《감정적으로 받아들이지 않는 연습》, 《도쿄대 교수가 제자들에게 주는 쓴소리》, 《쓸데없는 걱정 따위》, 《카리스마 CEO의 함정》, 《일상생활 속에 숨어 있는 수학》, 《개념부터 다시 시작하는 Reset! 수학》(전 4권) 등이 있다.
■ 감수 이학배
연세대학교 응용통계학과(통계학 전공)를 졸업하고 동 대학원에서 석사, 미국 미네소타대학교에서 통계학으로 박사학위를 받았다. 한국통계학회 이사, 연세대학교 경제대학원 원장 등을 지냈다. 현재 연세대 응용통계학과 교수로 재직 중이며 한국자료분석학회 부회장을 역임하고 있다. 국민안전처 등의 여러 정부기관에서 데이터 분석과 통계에 관한 자문을 해왔다. 빅데이터 분석에 대한 국내 최고의 권위자로 손꼽힌다.
■ 차례
이 책을 추천하며 _ 빅데이터 시대를 준비하는 가장 유용한 책을 만나다 _ 이학배
한국어판 서문
프롤로그 여기 데이터가 있습니다. 분석할 줄 아십니까?
1장 정말 광고가 아이스크림 매출을 올렸을까 : 데이터의 상관관계는 인과관계가 아니다
어느 회사에서 광고를 집행했고, 매출이 올랐다. 매출이 상승한 원인은 광고 때문일까? 그럴 수도 있고 아닐 수도 있다. 광고와 매출 사이에 ‘상관관계’는 있다 해도 ‘인과관계’가 반드시 있는 것은 아니라는 말이다. 그동안 당신이 속아왔던 무수한 ‘잘못된 데이터 분석’은 모두 이 지점에서 시작된다.
2장 오바마 캠프는 어떻게 후원금을 ‘더’ 모았을까 : 최선의 데이터 분석법, RCT
2008년 미국 오바마 대선 캠프는 구글 출신의 데이터 분석 전문가를 영입했다. 그는 후원금 모금 웹페이지를 무려 24개의 조합으로 설계했다. 그 결과 약 6000만 달러의 후원금을 ‘추가로’ 획득했다. 가장 투명하고 가장 확실한 데이터 분석법, RCT(무작위비교시행). 최적의 전략을 이끌어내는 방법이다. 단, 비용이 많이 든다!
3장 70세가 되자 병원을 많이 가기 시작했다 : 급격한 변화의 ‘경계선’을 찾는 RD디자인
장수하는 노인이 많은 일본에서는 70세를 전후로 의료서비스 이용이 급격히 점프한다. 69세와 70세 사이에 무슨 ‘경계’가 있는 것일까. 본인이 부담하는 의료비 비율이 70세부터 10%로 줄어드는 게 이유일까? 그게 이유라는 걸 어떻게 입증할 수 있을까? 급격한 변화의 ‘경계선’이 있는 데이터 분석법이 RD디자인(회귀불연속설계법)이다.
4장 규제 때문에 자동차가 무거워졌다고? : 계단식 변화가 있는 곳엔 집군분석
각종 규제나 세금을 적용할 때는 일정 구간을 묶는 ‘계단식’ 정책이나 제도들이 많다. 이렇게 구간별로 나뉘는 데이터들은 어떻게 분석해야 할까. 특히 ‘인센티브 제도’가 이렇게 설계되어 있을 때는 어떤 현상이 벌어질까. 자동차 무게와 연비 규제의 사례를 통해, 집군분석을 알아보자.
5장 소득세를 내리면 이민자가 늘어날까 : 시간의 흐름에 따른 패널 데이터 분석
1991년 덴마크는 우수한 외국인 노동자를 유입시키기 위해 세제 개혁을 실시했다. 이로 인해 연소득 1억 이상의 외국인 노동자의 소득세가 대폭 줄어들게 되었다. 이민자수는 늘어났을까? 과연 세제 개혁 때문일까? 패널 데이터 분석은 바로 복수의 집단, 복수의 기간에 대한 데이터를 분석하기에 적합하다.
6장 구글은 41가지의 파란색을 고민했다 : 데이터는 어떻게 전략이 되는가
실리콘밸리는 그 어떤 곳보다 데이터 분석이 활발한 지역이다. 구글, 우버, 페이스북 등 많은 IT기업들이 엄청난 빅데이터를 확보하고 이를 비즈니스 모델에 활용하면서 무한한 시장과 만났다. 비단 기업만의 일이 아니다. 전 세계적으로 정부도 민간처럼 데이터를 활용해 효과적인 정책 입안을 하기 시작했다. 데이터가 막강한 전략으로 탈바꿈하고 있다.
7장 그럼에도 데이터 분석은 불완전하다 : 불량 분석을 피하기 위한 방법
데이터를 분석하는 과정은 초밥 장인이 초밥을 만드는 과정과 닮았다. 솜씨 좋은 장인이 초밥을 만들더라도 재료가 형편없으면 먹을 수 없는 초밥이듯이, 데이터 자체에 문제가 있다면 분석 기법이 탁월해도 신뢰할 만한 결론을 도출해낼 수 없다. 이밖에 외적 타당성 확보 문제나 출판 편향 등의 한계 등 ‘잘못된 재료’를 선택하지 않을 수 있는 방법은 무엇일까.
에필로그
더 알고 싶은 이들을 위한 참고도서
부록
참고문헌