넷플릭스 인사이트
저   자 : 이호수
출판사 : 21세기북스
출판일 : 2020년 07월

도서정보

■ 책 소개


국내 최고 AI 전문가의 넷플릭스 성공 요인 심층 분석!
DVD 대여업체에서 미디어 거인으로 우뚝 선 초고속 성장의 비밀

빅데이터나 인공지능 등을 이용하는 기업이라고 하면 흔히 아마존이나 구글을 떠올린다. 하지만 저자는 넷플릭스야말로 인공지능이라는 말을 필요 이상으로 언급하지 않으면서도 인공지능이나 기계학습과 같은 첨단 기술을 가장 모범적으로 사용하는 기업이라고 말한다. 

이 책에서는 지금까지 콘텐츠와 성장 스토리를 중심으로 넷플릭스를 분석해왔던 기존의 시각에서 벗어나 지금까지 잘 알려져 있지 않던 넷플릭스의 독보적인 기술력에 대해서 상세하게 설명하고 있다. 전 세계에 걸쳐 고화질의 동영상을 제공하고 있는 넷플릭스는 끊김 없는 스트리밍을 위해 어떤 기술을 사용하고 있으며, 다양한 기기에서 콘텐츠를 볼 수 있도록 하기 위해 어떤 방식으로 인코딩을 하고 있을까? 또한 세계 각국의 언어를 빠른 시간 안에 현지어에 가장 가깝게 번역하기 위해 어떤 방법을 사용하고 있을까? 이처럼 이 책에서는 초고속 성장이라는 넷플릭스의 화려한 이름 뒤에 감춰져 드러나지 않았던 탁월한 기술력의 비밀을 일목요연하게 분석해 흥미롭게 풀어내고 있다.

4차 산업혁명과 디지털 혁신 시대에 넷플릭스가 인공지능을 포함한 새로운 ICT 기술과 파괴적 혁신의 비즈니스 모델이 협력적으로 이루어내는 가치 창출 과정을 살펴보면 국내 기업에 많은 시사점을 던져준다. 짧은 기간 안에 글로벌 미디어 거인으로 발돋움한 넷플릭스의 혁신과 성장 과정에 대한 이해는 기업의 리더십이나 글로벌 비즈니스를 꿈꾸는 분들에게 새로운 통찰을 제공해줄 것이다.

■ 저자 이호수
저자 이호수는 IBM, 삼성전자, SK텔레콤 등에서 기술과 비즈니스의 시너지를 통한 변화와 혁신을 주도했다. 특히 인공지능을 포함한 새로운 ICT 기술과 파괴적 혁신의 비즈니스 모델이 협력적으로 이루어내는 가치 창출에 많은 관심을 가지고 있다. 서울 공대와 KAIST에서 전자공학을, 그리고 미국 노스웨스턴 대학에서 인공지능 연구로 박사학위를 받았다. 그 후 뉴욕 소재 IBM Watson 연구소에서 20년 동안 지식기반 시스템을 포함한 인공지능, 최적화, 비즈니스 프로세스 모델링, 스케줄링, 모바일 컴퓨팅 분야의 연구 수행과 동시에 다수의 글로벌 기업 고객들의 문제를 해결해주는 이노베이션 컨설팅 서비스 활동을 했다. 2006년부터 삼성전자에서 소프트웨어 센터와 미디어솔루션 센터장으로서 스마트 디바이스 시대 개막과 함께 삼성 갤럭시폰 및 태블릿을 비롯한 다수의 디바이스에 탑재되는 소프트웨어, 콘텐츠&서비스 사업을 총괄했고 SK그룹의 SK C&C와 SK텔레콤에서 IT서비스 및 ICT 분야 사업을 총괄했다. 현재 공학한림원 회원이다. 취미는 사진 찍기, 음악과 영화 감상 그리고 신기술 서핑이다.
  
■ 차례
Part 1 넷플릭스, 새로운 미디어의 탄생
넷플릭스, 새로운 도전의 역사가 시작되다
진화하는 인터넷, 미디어 시장의 판도를 바꾸다
피할 수 없는 거대 기업과의 정면승부
스트리밍 서비스, 미디어 업계의 지각 변동이 시작되다

PART 2 글로벌 기업으로 성장하기 위한 파괴적 혁신 전략
OTT 서비스의 무서운 경쟁자들
오리지널 콘텐츠로 성장의 기반을 마련하다
영화계의 공공의 적이 되다
마침내 글로벌 기업으로 도약하다

PART 3 넷플릭스 최고의 경쟁력, 추천 시스템과 웹사이트
AI와 인간의 협업으로 최고의 추천 시스템을 만들다
넷플릭스 최고의 경쟁력, 추천 시스템의 비밀
추천 시스템의 개혁을 위해 콘테스트를 열다
사용자 중심의 웹사이트를 위한 끝없는 개혁

PART 4 고품질 스트리밍을 가능하게 한 독보적 기술력의 핵심
콘텐츠를 전송하는 넷플릭스만의 노하우
고품질 스트리밍을 위한 인코딩과 재생

PART 5 넷플릭스, 인공지능과 파괴적 혁신으로 날개를 달다
넷플릭스 최고의 전략, AI
넷플릭스, AI 활용의 교과서가 되다
멈추지 않는 넷플릭스의 파괴적 혁신

PART 6 넷플릭스, 한국에 상륙하다
넷플릭스, 한국의 소비자를 사로잡다
넷플릭스가 바꾼 국내 엔터테인먼트 산업의 변화
급변하는 한국의 OTT 서비스 환경

에필로그
부록
후주
참고문헌

 

도서요약
넷플릭스 인사이트


글로벌 기업으로 성장하기 위한 파괴적 혁신 전략

오리지널 콘텐츠로 성장의 기반을 마련하다

치열해진 비디오 스트리밍 사업 경쟁

넷플릭스는 2007년 스트리밍 서비스를 통해 급성장하면서부터 영화 스튜디오, 콘텐츠 소유자, 그리고 업계 경쟁업자들로부터 다양한 견제를 받으며 어려움을 겪고 있었다. 그중 하나는 이전에는 협력에 우호적이었던 콘텐츠 소유자들이 라이선스 계약 갱신을 거부하고 종료하는 것이었다. 그중 한 사례가 2011년 미국의 프리미엄 케이블 및 위성 TV 네트워크인 스타즈가 넷플릭스와의 계약 갱신을 거부한 것이다.


2007년 넷플릭스가 스트리밍 서비스를 시작할 때 스트리밍이 가능한 비디오 타이틀은 불과 1,000편에 불과했다. 사실 이즈음 넷플릭스는 7만 5,000편의 DVD를 보유하고 있었지만 이들의 스트리밍 라이선스를 받기에는 매우 오랜 시간이 걸릴 뿐 아니라 비용도 많이 들어갈 것으로 예측되었다. 이렇게 어려운 상황에서 2008년 10월, 넷플릭스는 스타즈로부터 향후 4년 동안 2,500편의 영화 및 TV 프로그램을 스트리밍할 수 있는 권한을 얻었다. 스트리밍 가능 비디오 타이틀이 매우 적은 넷플릭스로서는 천군만마를 얻은 듯한 대단히 중요한 제휴였다. 넷플릭스의 기존 가입자는 추가 비용 없이 추가된 2,500편의 콘텐츠를 감상할 수 있었고, 이로 인해 신규 가입자도 크게 증가했다.


그러나 스타즈는 2011년 9월에 자신들의 독점적이고 가치 있는 콘텐츠에 대한 적절한 가격 보장과 브랜드의 프리미엄 특성을 보호하기 위해 넷플릭스와의 4년 계약 만료 후 갱신은 없을 것이라고 발표했다. 이로 인해서 넷플릭스 고객은 스타즈가 제공해오던 히트작들뿐 아니라 넷플릭스 사이트의 ‘스타즈 플레이(Starz Play)’ 섹션에 있었던 약 1,000편의 다른 영화도 더 이상 볼 수 없게 되었다.


이러한 상황을 인지하고 있는 넷플릭스는 앞으로 콘텐츠 소유자들로부터 영화 라이선스 제공이 줄어들 것이라는 판단과 함께 TV 프로그램 확보 노력을 배가했다. 넷플릭스는 유튜브, 아마존 및 디시 네트워크(Dish Network)와 같은 영화 콘텐츠를 스트리밍하는 사이트뿐만 아니라 TV 프로그램을 스트리밍하는 사이트와도 경쟁해야 하는 상황에 직면하고 있었다.


이러한 상황으로 인해서 넷플릭스는 다른 스튜디오에서 제작한 영화 및 TV 드라마의 라이선스 도입은 줄이고 오리지널 콘텐츠 비율을 점점 늘려야 한다는 판단을 했다. 이것은 최근 스트리밍 서비스 경쟁 기업들의 발 빠른 움직임을 고려하면 바람직한 결정이다. 디즈니, 워너미디어 및 NBC 유니버설이 모두 자체 스트리밍 서비스를 시작하기 위해 노력함에 따라 시장에서 라이선스를 얻을 수 있는 타이틀은 크게 감소할 것으로 예측하고 있다. 그뿐만 아니라 설령 콘텐츠 라이선스가 가능할 경우에도, 모든 미디어 회사가 자체 스트리밍 서비스에서만 타이틀을 독점적으로 제공하기를 원하기 때문에 인기 콘텐츠의 라이선스 가격은 인상될 것으로 보고 있다.


콘텐츠 시청의 패러다임을 바꾼 일괄 출시

‘빈지(Binge)’는 우리말로 ‘폭식하다’라는 의미다. 빈지 워칭(Binge Watching)은 TV 드라마 시리즈의 전체 에피소드를 한꺼번에 ‘몰아보기’ 하는 것으로 보통 앉은 자리에서 두세 편의 에피소드를 이어서 시청하는 것을 말한다. 몰아보기는 온디맨드 시청과 온라인 스트리밍이 등장하면서 시작되었지만 2013년 넷플릭스가 <하우스 오브 카드> 시즌 전체 에피소드를 동시에 일괄 출시하면서 몰아보기가 대중화되었다. 넷플릭스 설문 조사에 의하면 참여자의 61퍼센트가 정기적으로 몰아보기를 즐기고 있다고 한다. 넷플릭스와 아마존 프라임뿐 아니라 많은 회사들이 이런 일괄 출시 모델을 채택하며 몰아보기 경쟁에 뛰어들고 있다.


넷플릭스는 사용자 중심의 비디오 서비스를 위해서는 고객이 콘텐츠를 소비하는 방법을 혁신할 수 있는 길을 열어주어 기존 미디어 엔터테인먼트 시장의 오래되고 철옹성같이 단단한 틀을 깨뜨릴 필요가 있다고 생각했다. 이를 위한 첫 번째 혁신이 2007년의 미디어 스트리밍 서비스였고, 두 번째가 고객에게 시청 재량권을 주기 위해 모든 에피소드를 한 번에 공개한 <릴리해머>의 일괄 출시였다. 넷플릭스가 TV 시리즈 에피소드를 한꺼번에 공개하는 전략은 모든 과정이 파격이어서 그 당시에는 가히 혁명적인 아이디어로 여겨졌다. 우리가 수십 년간 가지고 있었던 선형 TV의 고정관념을 과감하게 버리고, 시청 패러다임에 일대 혁신을 이루었기 때문이다. 넷플릭스가 <릴리해머>에 이어 2013년 <하우스 오브 카드>의 모든 에피소드를 일괄 출시한 후, 경쟁 기업들은 넷플릭스가 새로운 오리지널 시리즈 제작과 공개를 어떻게 진행해왔는지에 대해서 호기심 어린 눈초리로 지켜보면서 대응책 마련에 많은 노력을 기울였다.


TV 시리즈의 모든 에피소드를 일괄 공개하면서 가능해진 몰아보기의 대중화는 OTT 업체와 TV 네트워크 업체에 다음과 같은 변화와 도전을 가져왔다.


• 여러 달에 걸쳐 한 주에 한두 편의 에피소드를 공개하는 전통적인 TV 시리즈의 경우에 콘텐츠 마케팅은 중간에 하거나 오랜 기간에 걸쳐 할 수 있으며 도중에 마케팅 전략 일부를 수정할 수도 있다. 그러나 한꺼번에 에피소드를 모두 공개하는 일괄 출시 시리즈의 경우, 개봉 영화의 마케팅과 유사하다. 새로 공개하는 영화의 성공 여부는 개봉 후 며칠 만에 결정된다. 그러므로 영화 개봉 전부터 사인회, 광고 등을 포함한 치열한 마케팅 활동을 전개해 영화의 인지도를 높여야 한다. 일괄 출시 시리즈의 에피소드도 공개 날짜에 맞추어 치열한 마케팅 활동이 전개된다. 그래서 일괄 출시 시리즈의 성공 여부도 영화와 같이 공개 후 며칠 사이에 결정된다.


• 전통적인 TV 시리즈의 경우에는 한 주에 한두 편의 에피소드가 공개되면서 시청자들의 반응을 모니터해 시나리오 일부를 수정할 수도 있고 심지어 인기가 없는 부분은 제외할 수 있는 융통성이 있다. 하지만 일괄 출시 시리즈의 경우 한꺼번에 시리즈의 모든 에피소드가 공개되므로 시나리오 수정이 불가능하다. 그러므로 아주 단단한 시나리오가 요구되어 기획과 작가의 능력이 매우 중요하다.


• 일괄 출시는 콘텐츠 제작 일정에도 영향을 미친다. 오랜 기간 매주 공개하는 TV 시리즈의 경우에는 시나리오 작성, 영화 제작, 편집을 주 단위로 하고 또 작가와 배우들이 협력하며 일정을 맞추려고 노력한다. 이에 반해 일괄 출시 시리즈 경우에는 한 번에 모든 콘텐츠를 촬영해야 한다.


• 네트워크사가 일괄 출시 시리즈를 채택할 경우 수익 채산성을 맞추는 것이 매우 도전적일 수 있다. 특히 광고가 주요 수입원인 경우에는 더욱 그렇다. 전통적인 TV 방영인 경우에는 시청자의 시청 시간이 보통 한 시간 정도이므로 중간에 광고를 삽입해도 큰 부작용은 없다. 하지만 몰아보기의 경우, 시청자가 몇 시간 동안 연속적으로 시청하므로 현실적으로 동일한 광고를 여러 번 삽입하기가 어렵다. 그래서 몰아보기가 증가하는 경우 시청자들에게 광고 삽입이 하나의 문제가 될 수 있다. 가입자의 월정 구독료로 운영되는 넷플릭스는 이러한 광고 문제에서 자유로울 수 있다.



넷플릭스 최고의 경쟁력, 추천 시스템과 웹사이트

AI와 인간의 협업으로 최고의 추천 시스템을 만들다

기업의 운명을 좌우하는 추천 시스템

넷플릭스는 고객별로 개인화된 추천 서비스를 제공해 고객이 좋아하는 영화 및 TV 드라마를 쉽게 찾도록 도와준다. 고객이 넷플릭스 서비스에 접속할 때마다 넷플릭스 추천 시스템이 작동해 최소한의 노력으로 고객의 취향에 맞는 콘텐츠를 신속하게 찾도록 도움을 주는 것이다.


고객이 방대한 비디오 라이브러리 중에서 원하는 콘텐츠를 직접 찾아 선택하기는 어렵다. 넷플릭스가 실시한 소비자 조사에 따르면 일반적인 넷플릭스 회원은 10~20개의 타이틀을 검토한 후 자신이 시청하고 싶은 영화를 결정하지 못하면 60~90초 후에 흥미를 잃는다고 한다. 그렇기 때문에 넷플릭스는 오랜 기간에 걸쳐, 전 세계 전문가들과의 오픈 이노베이션 방법으로 추천 시스템의 정확성을 높이기 위해 노력해왔다.


넷플릭스가 스트리밍 서비스 사업을 하면서부터 수집하는 데이터는 일반인의 상상을 초월한다. 고객 정보, 콘텐츠 관련 정보, 시청자 평가는 기본이고, 시청자가 비디오를 시청할 때 어느 부분에서 일시정지를 하고 어느 부분에서 되감기를 하는지, 또 주중에 언제 어디서 영화를 보았는지 등의 정보도 가지고 있다. 이러한 방대한 데이터를 활용해 넷플릭스는 AI/ML 기술로 고객이 선호할 가능성이 높은 콘텐츠를 추천할 뿐 아니라 고객의 홈페이지 화면 및 아트워크 구성의 최적화를 꾀하도록 한다.


넷플릭스 추천 시스템은 통계, 빅데이터 분석, 기계학습을 포함한 AI 기술을 활용해 사용자의 성향을 분석해 영화를 추천해주는 것은 기본이고, 사용자가 넷플릭스에 가입하면 섬네일과 아트워크를 포함한 전체 페이지가 사용자의 취향에 맞춤형으로 구성되는 수준으로까지 발전했다.


넷플릭스 양자이론

넷플릭스에는 신작 영화, TV 시리즈, 애니메이션 등의 새로운 콘텐츠가 들어오면 약 30명의 콘텐츠 분석 전문가들이 해당 콘텐츠를 일일이 감상하고 분석해 카테고리 태그와 메타데이터를 생성한다. 그들은 이 작업을 위해서 일주일에 20시간 정도 TV와 영화를 몰아보기 한다. 넷플릭스 분석 전문가들은 도서관의 사서처럼 콘텐츠를 정확하게 분류할 수 있는 능력이 있고, 이에 더해 TV 드라마나 영화들이 서로 어떤 연관이 있는지를 알아내야 하므로 콘텐츠에 대한 높은 수준의 지식을 가지고 있어야 한다. 이에 대해서 IT 매거진 <패스트 컴퍼니(Fast Company)> 는 넷플릭스 분석 전문가의 자격으로 다음의 세 가지를 언급했다. 첫째, 다양한 영화와 TV 장르에서 콘텐츠의 뉘앙스를 구별할 수 있는 능력, 둘째, 영화/드라마의 본질을 추출해 이를 간결하게 전달할 수 있는 능력, 셋째, 영화 및 방송 업계에서 5년 이상의 경험이다. 이러한 작업은 AI가 하지 못하는 인간만이 할 수 있는 영역이다.


메타데이터는 기본적으로 출시 연도, 언어, 감독, 출연자 목록, 그리고 선정성 같은 콘텐츠에 대한 객관적인 정보를 포함한다. 여기에 더해 분석 전문가가 모든 넷플릭스 콘텐츠를 감상한 후 생성한 주관적인 태그를 메타데이터에 포함시켜 콘텐츠를 더욱 생생하게 표현하고 있다. 이 메타데이터는 콘텐츠 분류, 탐색 혹은 추천에 직접 활용된다. 넷플릭스의 분석 전문가로 일하고 있는 셰리 굴마하마드(Sherrie Gulmahamad)는 “콘텐츠에 내재되어 있는 의도와 분위기를 포착하기 위해 톤과 스토리라인 팔레트를 사용해 작업하며, 태그들이 도출되면 콘텐츠의 분위기를 더욱 잘 전달하기 위해 편집을 한다.”라고 분석 전문가로서의 작업을 말했다.

경쟁사 제품을 면밀히 분석해 설계 개념, 적용 기술, 특징 및 성분 등을 파악해 이 제품의 재현을 시도하는 것을 ‘리버스 엔지니어링(reverse engineering)’이라고 한다. 콘텐츠의 태깅 작업은 마치 콘텐츠를 리버스 엔지니어링하는 것과 유사한 과정을 거친다. 즉, 콘텐츠를 감상하고 분석한 뒤에 장르, 주제, 분위기, 스토리라인 등 콘텐츠를 제작할 때 의도했던 주요 특성을 추출해내는 매우 복잡하고 정교한 작업이다. 그래서 넷플릭스의 분석 전문가들은 이 프로세스를 가이드하는 36쪽에 달하는 교육 자료에 따라 해당 콘텐츠와 관련 있다고 생각되는 모든 태그를 꼼꼼하게 채워넣는다.


이 작업을 내부적으로 ‘넷플릭스 양자이론(Netflix Quantum Theory)’이라 부르는데, 콘텐츠 정보를 더 이상 쪼갤 수 없는 수준까지 쪼갠다는 의미라고 한다. 이 콘텐츠 태깅 작업은 노력과 시간이 많이 들어가는 노동집약적 작업으로서, 아이러니하게도 비디오 콘텐츠 추천에서 넷플릭스가 다른 경쟁사보다 훨씬 우월한 이유 중 하나다.


넷플릭스 최고의 경쟁력, 추천 시스템의 비밀

어떻게 영화를 추천할 것인가?

넷플릭스가 2000년 공개한 시네매치 추천 시스템은 간단히 말해서 오라클 데이터베이스다. 시네매치 시스템은 개념적으로 말하자면, 타깃 사용자가 과거에 시청한 영화들이 속한 클러스터(마이크로장르) 내에서 그 고객이 아직 시청하지 않은 작품 중 동일 취향 그룹에 속한 시청자들로부터 높은 평가를 받은 영화들을 추천한다(도표 3-3 참조).


추천 시스템은 도표 3-5에서와 같이 크게 협업 필터링, 콘텐츠 기반 필터링, 그리고 하이브리드 기반 필터링으로 구분된다. 협업 필터링 알고리즘은 다시 메모리 기반 협업 필터링과 모델 기반 협업 필터링이라는 두 개의 범주로 구별된다. 메모리 기반 협업 필터링은 잠재된 모델 없이 인터랙션 매트릭스에 있는 모든 평점 데이터가 메모리에 기억되며 이 평점만을 참고해 예측 및 추천을 계산한다. 이에 반해 모델 기반 협업 필터링은 기계학습을 이용해 사용자-아이템 간의 평점을 예측할 수 있는 모델을 만드는 방식이다. 도출된 모델을 이용하면 아직 평점이 없는 셀의 평점을 계산할 수 있게 된다.


메모리 기반 협업 필터링은 유사성의 대상에 따라 ‘사용자 기반 협업 필터링(User-based Collaborative Filtering)’과 ‘아이템 기반 협업 필터링(Item-based Collaborative Filtering)’으로 나눌 수 있다.


유유상종을 바탕으로 한 메모리 기반 협업 필터링

사용자 기반 협업 필터링

대부분의 추천 알고리즘은 타깃 고객이 시청해 평가한 콘텐츠들을 이미 시청했고 평가한 ‘유사 취향 그룹’을 추출함으로 시작한다. 이 알고리즘은 유사 취향 그룹에 속하는 사용자들이 선호하는 모든 비디오 중에서 타깃 고객이 이미 시청했거나 평가한 비디오를 제외한 콘텐츠를 추천한다.


사용자 기반 협업 필터링 알고리즘의 기본 단계

① 타깃 사용자와 가장 유사한 사용자들(유사 취향 그룹)을 파악한다.

② 유사 취향 그룹의 사용자들이 좋아했던 영화들을 추출한다.

③ 이 영화들 각각에 대해 타깃 사용자가 부여할 것 같은 등급을 예측한다.

④ 이 예측 등급에 근거해 상위 몇 개의 영화들을 추천한다.


아이템 기반 협업 필터링

아이템 기반 협업 필터링 알고리즘은 유사한 고객이 아니라 유사한 아이템을 발견하는 데 초점을 맞춘 것이다. 아이템 기반 협업 필터링을 활용한 추천의 흔한 사례는 그림 3-3과 같이 아마존과 같은 온라인 쇼핑 사이트에서 볼 수 있는 “이 상품을 본 고객이 함께 살펴본 상품들 리스트”다.


아이템 기반 협업 필터링 알고리즘의 기본 단계

① 타깃 사용자가 평가한 아이템(영화)을 추출한다.

② 추출된 아이템과 타깃 아이템이 얼마나 유사한지 평가벡터를 이용해 계산한다. 유사도 계산에는 다른 사용자들이 과거에 매겼던 평가만 사용한다.

③ 가장 유사한 몇 개의 아이템을 선택한다.

④ 타깃 사용자가 가장 유사한 아이템에 부여한 평점들의 가중 평균치를 예측치로 한다.


고객 평가를 기반으로 한 모델 기반 협업 필터링

‘넷플릭스 프라이즈’에서 우승한 알고리즘은 메모리 기반 협업 필터링에 해당하는 사용자 및 아이템 기반 협업 필터링과 더불어 ‘행렬 분해(Matrix Factorization)’를 활용한 ‘모델 기반 협업 필터링’을 사용하고 있다.


모델 기반 협업 필터링은 기존 항목 간의 유사성을 단순하게 비교하는 것에서 벗어나 사용자와 아이템에 내재된 혹은 숨어 있는 ‘잠재 모델(latent model)’ 의 패턴을 이용하는 기법이다. 모델 기반 알고리즘은 기계학습에 의해 겉으로 드러나지 않은 사용자 선호도를 추측하기 위한 모델을 생성하며, 이를 이용해 사용자가 이전에 보지 못한 특정 영화에 대한 사용자의 평점을 예측하는 데 사용된다.


예를 들어 어느 사용자가 한국영화 <클래식>을 좋아한다면 이 정보를 단순히 그대로 사용하는 것이 아니라, 주위의 정보를 이용해 선호 이유를 도출해 사용하는 것이다. 그 사용자가 <클래식>의 주연 배우인 ‘손예진’ 때문에 좋아할 수도 있고, 그 영화 OST인 ‘너무 아픈 사랑은 사랑이 아니었음을’이 좋아서 선호할 수도 있으며, 로맨스 장르를 선호해서 선택할 수도 있다. 많은 양의 정보를 분석함으로써 이러한 평가에 영향을 미친 잠재 모델을 이끌어내고, 이를 추천에 이용하는 것이다.


구체적인 예를 들어보자, 4명의 시청자가 다섯 편의 영화에 대해서 도표 3-8의 사용자-아이템 평가 매트릭스와 같이 1~5의 평점을 매겼다고 가정하자 이 매트릭스에서는 어느 사용자가 어떤 영화에 대해서 왜 그 평점을 주었는지 이유를 밝히지 않는다.


이러한 문제를 해결하기 위해서 잠재 모델이란 개념을 도입했다. 잠재 모델이란 사용자와 아이템이 주어진 속성(attribute)에 어떤 관련이 있는가를 작은 매트릭스에 표현하는 기법이다. 이 중 한 방법으로, 사용자와 아이템 관련된 속성의 연관 값을 동적으로 변화시키면서 기계학습에 의해 작은 새로운 사용자-아이템 매트릭스를 생성한다.


모델 기반 방법에서는 과거의 사용자 평점 데이터를 이용해 모델을 만들었기 때문에 부분적으로 사용자가 매긴 평점 정보가 부족하다 하더라도 특정 아이템에 대한 사용자의 평점을 예측할 수 있다.



넷플릭스, 인공지능과 파괴적 혁신으로 날개를 달다

넷플릭스 최고의 전략, AI

AI는 고사양 하드웨어, 클라우드, 알고리즘 등을 갖춘다고 되는 게 아니다. 고스펙의 인력이 있다고 되는 것도 아니다. 고가의 AI 솔루션을 섣불리 적용한다고 되는 것도 아니다. 오히려 실망스러운 결과와 함께 책임만 커질 따름이다. AI 프로젝트들이 실패하는 가장 큰 이유는 회사가 갖고 있는 기존 시스템에 새로이 개발한 AI 솔루션을 결합하여 하나의 시스템으로 만드는 것에 성공률이 낮기 때문이다. 이의 근본적인 원인은 이루어야 할 목적이 불분명해 이해 당사자들끼리 AI 프로젝트에 대한 합의가 미흡했기 때문이다.


넷플릭스는 AI를 어떻게 활용하는가?

넷플릭스는 AI/ML이 잘하는 부분이 있고 취약한 부분이 있다는 것을 잘 인지하고 있다. 그래서 AI/ML과 사람과의 협업을 조화시킨다. 주로 감정, 심미성, 사회성 등 AI가 취약한 부분은 사람 전문가가 담당하게 하는데 이런 부분은 넷플릭스가 다루는 영화, TV, 드라마, 애니메이션 콘텐츠와 깊은 관계가 있다. 콘텐츠의 깊은 특성을 표현하는 태깅 작업과 세부 장르 설정 같은 것은 AI에게 시키지 않고 많은 콘텐츠 전문가가 노동집약적 형태로 직접 수행한다.


넷플릭스만큼 AI/ML 기술을 잘 이용해 현업의 핵심 문제를 해결한 기업은 거의 없다. 흥미로운 점은 내가 아는 한 넷플릭스가 발행한 문서나 인터뷰 내용 어디에도 AI/ML이라는 말을 필요 이상으로 언급하고 있지 않다는 점이다. 단지 넷플릭스 직원들이 그들이 하고 있는 업무를 논문 혹은 컨퍼런스 등에서 발표하면서 AI/ML을 언급하는 정도다. 넷플릭스는 AI를 마케팅 목적으로 사용하지 않는다. 정작 AI를 잘 이해하고 수행하는 기업은 소리가 없다. 다만 결과로만 이야기할 뿐이다.


AI 및 데이터 기반 실험 활동이 넘치는 넷플릭스

매년 20억 달러를 마케팅에 사용하는 넷플릭스는 “마케팅 자금을 어디에 사용하는 것이 가장 효과적일까?” 등의 마케팅 최적화를 위해 기계학습 모델을 사용하고 있다. 마케팅 결과가 미흡하면 데이터 전문가와 협의해 데이터와 모델이 정확한지를 점검하는 데이터 및 모델 확인 과정을 거친 후 다시 실험을 수행한다.


또한 넷플릭스는 구성원들이 제품에 대한 어떤 문제를 인지했을 경우, 이를 적극적으로 제기하고, 개선할 새로운 아이디어를 제안하고 실험하는 것을 장려한다. 이 실험을 통해 그들이 제안한 혁신적인 아이디어의 채택 여부를 결정하는 데 사람의 의견이 아닌 데이터가 사용되도록 하는 프레임워크를 제공한다. 제품 개선을 위한 새로운 아이디어를 구현하고 테스트해 수집된 데이터가 보여주는 사용자의 선호도에 따라 이 아이디어를 제품 개발에 반영하거나 혹은 폐기한다.


넷플릭스에는 제품과 관련해 의사 결정이 필요한 항목들이 많다. 예를 들면 새로운 영화 추천 알고리즘, 유저 인터페이스 기능, 콘텐츠 프로모션 전략, 오리지널 시리즈 출시 전략, 스트리밍 알고리즘, 새로운 회원 가입 절차 및 지불 방법 등이다. 이 항목들에 새롭고 혁신적인 아이디어가 제기되면 이를 반영한 제품 변경 여부를 테스트하기 위해 실험 환경에 따라 A/B 테스팅 등의 방법을 사용한다.


기계학습을 통한 넷플릭스만의 마케팅 전략

회원 확보를 위한 콘텐츠 선택에 활용

기업에서 마케팅 대상을 결정하는 것은 신규 회원을 확보하고 기존 회원의 이탈을 방지하는 데 필수적이다. 넷플릭스는 자체 서비스가 제공하는 매력적인 가치를 알지 못하는 새로운 회원을 확보하려고 노력하고 있다. 이를 위해 넷플릭스는 페이스북, 구글 및 유튜브와 같은 주요 온라인 광고주와 협력해 잠재적 신규 회원에게 접근해 광고 메시지를 전한다. 이 과정에서 어려운 과제 중의 하나는 광고 메시지에 어떤 영화 타이틀을 사용하는 것이 가장 적합한지 알아내는 것이다. 잘 선택한 영화 타이틀의 사용은 잠재 회원의 호기심을 자극해 넷플릭스에 긍정적인 시각을 부여한다. 넷플릭스는 기계학습을 사용해 여러 다른 맥락에서 잠재 회원들에게 좋은 인상을 줄 수 있는 콘텐츠를 선택한다.


적정 마케팅 비용 책정에 활용

아마 글로벌 온라인 기업이 자주 당면하고 있는 질문은 ‘신규 회원 확보를 위해 홍보 마케팅에 얼마를 지출하는 것이 적합할까?’ 혹은 ‘글로벌 지역에서, 어떤 시간대 및 어느 채널에서 광고 마케팅을 하는 것이 적절한가?’ 등일 것이다.


이를 위해서는 회원이 ‘어떻게 가입했고 무엇을 시청했는지’를 추적함으로써 가장 효과적인 곳에 마케팅을 집중하는 것이 바람직할 것이다. 예산을 미세하게 조정해 신규 회원 확보에 가장 효과적인 마케팅 비용을 책정할 수도 있다.


그러나 이것은 넷플릭스와 같이 전 세계에 걸쳐 많은 마케팅 활동을 하고 있는 기업에 쉬운 문제가 아니다. 전통적으로 마케팅 방법과 비용의 결정은 사람이 해왔다. 하지만 세계 많은 지역에서 이와 같은 결정을 자주 내려야 하므로 이를 자동화할 필요가 있는데, 넷플릭스는 이 과정을 기계학습을 활용해 해결했다. 기계학습 알고리즘은 인과 모델링 기법을 활용해 특정 노출에 의한 광고 가치를 결정해 그에 대한 마케팅 금액을 결정한다.


* * *


본 도서 정보는 우수 도서 홍보를 위해 저작권자로부터 정식인가를 얻어 도서의 내용 일부를 발췌 요약한 것으로, 저작권법에 의하여 저작권자의 정식인가 없이 무단전재, 무단복제 및 전송을 할 수 없으며, 원본 도서의 모든 출판권과 전송권은 저작권자에게 있음을 알려드립니다.