북집 지식DB

습관의 알고리즘

지은이 : 러셀 폴드랙(역:신솔잎)

출판사 : 비즈니스북스

출판일 : 2022년 02월

뇌과학자 정재승 교수는 우리가 이 책을 집어 든 것만으로 일단 ‘절반은 성공했다고 말합니다. 스탠퍼드 심리학과 교수가 밝혀낸 습관의 알고리즘! 최신 뇌과학과 심리학 연구로 습관의 작동원리를 밝혀내고, 그 원리를 통해 행동을 변화시키는 방법을 제시합니다.

습관의 알고리즘

습관이란 무엇인가
습관의 작동 원리, 자동성

윌리엄 제임스(William James)는 미국 최초의 실험 심리학자이다. 1890년에 출간된 ‘심리학의 원리’에서 제임스는 습관이 우리의 일상에 얼마나 필수적인 요소인지를 생생하게 묘사하며 습관의 중요성을 가장 설득력 있게 설명했다고 평가받는 글을 남겼다. 제임스는 ‘습관’이라는 개념의 핵심을 ‘자동성(automaticity)’, 즉 적절한 상황이 조성될 때 의식적으로 의도하지 않고도 어떤 행동을 자동적으로 행하는 정도로 봤다.

신경계를 ‘적이 아니라 협력자로’ 만들어야 한다는 제임스의 말은 특히나 새로운 기술을 배울 때, 다시 말해 노력을 들이지 않고도 행하는 고도의 기민한 능력(습관의 개념과 상당히 유사하다)을 익힐 때 적용된다. 운전을 하거나 자전거를 타는 일부터 컴퓨터 키보드를 조작하거나 스마트폰 터치패드를 사용하는 일까지 이 세상에 존재하는 사물과의 상호작용은 거의 모두 오랜 시간 동안 쌓아온 숙련된 행동과 연관이 있다.

습관과 목적이 있는 행동의 차이점

가령, 한 연구자가 쥐에게 레버를 누르면 먹이가 나온다는 것을 며칠 동안 훈련시켜 쥐들이 상자 안에 들어가자마자 곧장 레버를 누르기 시작한다고 생각해보자. 그럼 이때 우리는 이 행동이 ‘습관’인 지 어떻게 알 수 있을까? 케임브리지 대학의 심리학자 앤서니 디킨슨(Anthony Dickinson)이 이 질문에 가장 영향력 있는 답변을 제시했다. 디킨슨은 쥐가 이 행동을 한 번 익히고 난 뒤 레버를 계속 누르는 데는 두 가지 이유가 있다고 설명했다.

하나는 먹이를 얻고자 하는 쥐가 보상이 주어진다는 걸 알고 그 행동을 한다는 것이다. 행동이 목표를 달성하는 데 직접적으로 연관되어 있기 때문에 디킨슨은 이름 ‘목표 지향적(goal-directed)’ 행동이라고 불렀다. 다른 이유는 딱히 목표가 없더라도 스키너 박스에서 이렇게 행동해야 한다고 학습했기 때문에 레버를 눌렀다는 것이다. 디킨슨이 ‘자극반응’ 또는 ‘습관적 행동’이라고 부르는 유형이다. 이 두 가지 차이를 바탕으로 디킨슨은 쥐가 목표를 갖고 레버를 누르는지 알아낼 한 가지 영리한 방법을 따 올렸다. 목표의 가치를 없앤 뒤 쥐가 해당 행동을 계속하는지 지켜보는 것이다. 예컨대, 쥐가 사료 알갱이를 보상으로 받는다고 생각해보자, 스키너 박스에 넣기 전 쥐에게 충분한 사료를 제공해 먹이에 싫증을 느끼게 만드는 방식으로 보상의 가치를 낮출 수 있다.

디킨슨의 연구진은 훈련 초기 단계의 쥐들이 목표 지향적으로 행동하는 현상을 발견했다. 보상의 가치가 떨어지자 더 이상 레버를 더 누르지 않았던 것이다. 그러나 훈련이 계속되자 쥐들의 행동은 습관적으로 변해 보상을 원치 않을 때에도 계속 레버를 눌렀다. 초기 목표 지향적 통제에 의존하던 성향이 습관적 통제에 의존하는 성향으로 변화하는 패턴은 앞으로 습관에 대해 우리가 행한 연구에서 반복적으로 확인하게 될 사실이다.

정리하자면 습관은 우선 두 가지 면에서 의도적인 목표 지향적 행동과 차이가 있다. 첫째, 적절한 자극이 등장할 때마다 자동적으로 촉발된다는 점이다. 둘째, 한번 촉발되고 나면 특정한 목표와 관계없이 행동으로 이어진다는 점이다. 당신이 없애고자 하는 나쁜 습관이 있거나 혹은 만들고 싶은 좋은 습관이 있다면 바로 이러한 습관의 형성 원리와 작동 방식에 대해 먼저 이해해야 한다. 그렇다면 다음으로 던져야 하는 질문은 우리의 두뇌가 이렇듯 습관의 기계로 진화한 이유가 무엇인가 하는 것이다.

습관은 왜 우리 몸에 각인되는가?

심리학자인 데이비드 셰리(David Sherry)와 대니얼 색터(Daniel Schacter)는 ‘기능적으로 양립할 수 없는’, 다시 말해 하나의 시스템으로는 해결할 수 없는 문제를 해결하기 위해 우리의 뇌가 분리된 시스템으로 진화했다고 설명했다. 두뇌의 습관 시스템(habit system)은 이 세상의 안정적인(즉, 변치 않는) 일들을 학습하기 위해 진화한 반면, 서술 기억 시스템(declarative memory system)으로 알려진 또 다른 기억 시스템은 매 순간 변화하는 일들을 학습하도록 진화했다. 습관 시스템을 통해 우리는 자동차 페달 기능을 익히고(변치 않는 일), 서술 기억 시스템을 통해 오늘은 차를 어디에 주차했는지 위치를 떠올릴 수 있다(매일 달라지는 일).

우리가 하는 모든 행동은 환경의 영향을 받고, 환경은 우리가 할 수 있는 일과 해서는 안 되는 일의 선택지를 모두 제공하는 동시에 우리의 욕구와 습관을 촉발하는 자극제를 선사한다. 행동을 변화시키는 가장 효과적인 방법은 환경을 바꾸는 것이다. 우리가 무언가를 선택하고자 할 때 몇 가지 요인이 우리의 결정에 영향을 미친다. 첫째는 ‘미래에 무엇을 하고 싶은가?’ 같은 장기적인 목표다. 둘째는 즉각적인 욕구다. 장기적 목표와 부합하느냐와 상관없이 지금 당장 하고 싶은 무언가가 있다. 마지막으로 습관이 있다. 경험을 통해 학습한 행동이자 ‘아무런 생각 없이 자동적으로 행하는’ 행동이다.

습관과 행동 변화를 위한 로드맵

과학자들마다 습관을 정의하는 방식이 다르지만 대다수가 동의하는 몇 가지 기본적인 특성이 있다. 첫째로 습관은 특정 자극제나 상황에 의해 자동적으로 촉발되는 행동 또는 생각이라는 점이다. 여기에는 그 어떤 의식적인 의도가 관여하지 않는다. 둘째로 습관은 특정한 목표와도 관련되어 있지 않다. 단순히 촉발제 때문에 시작되는 것이 습관이다. 이 사실이 중요한 이유는 습관을 불러오는 보상이 더는 주어지지 않는다 해도 그 행동(혹은 생각)이 계속 지속된다는 의미이기 때문이다. 셋째로, 습관은 끈질기다. 아무리 참아보려 노력해도 습관은 다시 되살아나고 우리가 가장 나약한 순간에 이런 일이 벌어질 때가 많다.

두뇌의 습관 시스템 이해하기
습관과 의식적인 기억의 차이

습관의 놀라운 특징 중 하나는 과거에 대한 우리의 의식적인 기억과 완벽하게 분리된다는 점이다. 습관을 실행하는 순간도 그리고 그 습관에 대한 회상도 의식적인 기억과 동떨어져 있다.

이러한 습관과 의식적 기억의 차이는 특히나 뇌 손상으로 기억을 잃은 사람들에게서 두드러지게 나타난다. 프랑스의 신경과 전문의인 에두아르 클라파레드(Éduard Claparéde)가 보여준 유명한 사례가 있다. 그는 기억 장애를 앓고 있는 환자 한 명과 악수를 나누며 손에 감춰둔 작은 핀으로 환자의 손을 찔렀다. 몇 분 후 환자는 핀에 찔렸다는 사실을 기억하지 못했음에도 의사가 손을 내밀자 손을 뻗기를 주저했다. 의사가 왜 손을 뒤로 물렸는지 묻자 그녀는 이렇게 답했다. “사람들이 손에 핀을 숨길 때가 종종 있거든요.” 클라파레드의 환자는 특정 사건을 의식적으로 기억하지는 못해도 핀에 찔렸던 경험에 대한 기록은 분명 유지하고 있었다. 이런 식의 일화들을 기반으로 1960년대부터 시작된 신경과학 연구를 통해 오늘날 두뇌 속에 ‘다중 기억 시스템’이 있다는 개념이 정립되었다. 다중 기억 시스템 간의 핵심적인 차이는 오늘 아침 어디에 주차를 했는지 떠올리듯이 ‘과거의 사건을 의식적으로 기억하게 해주는 시스템’과 습관이나 운전 기술처럼 ‘과거의 일을 의식적으로 떠올리는 것과 무관한 다른 유형의 기억’에 있다.

욕망은 어떻게 습관으로 변화하는가

두뇌의 신경화학 시스템은 매우 복잡하고 긴밀하게 연결되어 있고, 지난 20년이 넘는 세월 동안 얻은 중대한 발견에 따르면 도파민은 약물 사용으로 나타나는 즐거운 감각에 ‘직접적으로’ 관련하지 않는다. 대신 도파민의 역할은 동기(motivation)에 초점이 맞춰진 것으로 보인다. 신경 과학자인 켄트 베리지(Kent Berridge)의 표현에 따르면 ‘행복’(liking)보다는 ‘욕망’(wanting)에 말이다.

선택권이 주어지면 평범한 쥐의 경우, 거의 항상 철조망을 올라가 더 많은 먹이를 얻으려고 한다. 그러나 여러 연구에서 살라몬과 그의 동료들은 도파민 개입이 벌어지면 쥐들이 노력을 하지 않아도 되는 소량의 먹이를 선택할 확률이 훨씬 높아진다는 것을 보여주었다.

도파민 개입이 먹이를 구하기 위해 노력하는 ‘의욕’을 저하시킨 것이라 볼 수 있다. 이러한 연구 결과는 도파민의 역할이 ‘유인적 현저성’(incentive salience)에 있다고 주장한 신경 과학자 켄트 베리지와 테리 로빈슨(Terry Robinson)의 아이디어와 일치한다. 즉, 도파민은 유기체가 보상을 얼마나 ‘좋아하는지’ 보다 유기체가 이 세계에서 어떠한 보상을 얼마나 ‘원하는지’, 또 그것을 얻기 위해 얼마나 노력할지에 대한 신호를 보낸다는 것이다.

습관 형성의 두 가지 메커니즘

기저핵과 도파민 시스템은 우리가 어떤 특정한 순간에 무엇을 할 것인지, 그것을 어떻게 할 것인지 결정하는 계산에서 중요한 역할을 하는 것으로 보인다.

1999년 신경학자인 피터 레드그레이브(Peter Redgrave)는 기저핵이 행위를 선택하는 데 있어 ‘중앙 배전판’과 비슷한 역할을 한다고 주장했다. 이 이론에서는 대뇌피질이 잠재적인 행동을 의미하는 신호를 기저핵에 보낸다. 이 이론은 앞에서 언급했던 담창구 내 강력한 긴장성 억제를 바탕으로 한다. 두 가지 가능한 행동 중(가령 케이크에 손을 뻗을 것인가, 당근에 손을 뻗을 것인가) 선택을 내려야 하는 상황에 놓여 있다고 생각해보자. 이 두 가지 가능한 행위가 각각 대뇌피질에서 기저핵에 신호로 전달된다. 신호가 도착하기 전에 기저핵의 긴장성 억제가 모든 행위를 억제한 상태다. 선조체에 두 개의 신호가 도착하면 직접 경로와 간접 경로 내에서 여러 활동을 거쳐 서로 경쟁을 하다가 결국 한 가지 행위가 선택을 받고 직접 경로를 통해 수행된다.

한 가지 간단한 예시를 들어보겠다. 쥐가 어떤 것을 누를지 선택할 수 있는 두 개의 레버가 제시되어 있고, 이 중 하나에서만 보상인 사료 알갱이가 나온다. 처음에는 이 두 행위가 거의 동등한 가치를 지닌다. 쥐는 어떤 행위가 보상을 가져올지 모르기 때문이다(그림에도 실험 동물은 이런 실험을 그간 충분히 해봤기 때문에 레버를 눌러야 한다는 사실만은 잘 알고 있다). 대뇌피질이 각각의 레버에 상응하는 명령을 선조체로 보내면 선조체에서 두 신호 중 하나가 경쟁에서 이긴다. 가령, 쥐는 과거의 경험에서 상자의 오른쪽에 있는 레버가 보상을 줄 확률이 높다는 것을 배웠기에 오른쪽 레버를 선택한다. 먹이를 받는다면 예상치 못한 보상이 도파민의 분비를 유발하고, 이로써 세 가지 요소 법칙에 따라 오른쪽 레버 누르기를 초래한 대뇌피질과 선조체의 연결성이 강해진다. 이 연결성의 강도가 증가하며 다음번에도 대뇌피질 뉴런이 선조체 뉴런을 발화시킬 확률이 커진다. 만약 쥐가 보상을 받지 못했다면 이러한 반응을 야기한 연결성의 강도가 저하될 것이다. 연결성의 강도에서 일어난 변화로 인해 다음번 선택에서는 보상을 얻는 행동이 경쟁에서 이길 확률이 높아지고 시간이 지나면서 이 행위가 습관으로 굳어지는 것이다.

한번 습관은 영원한 습관이다
오래된 습관은 죽지 않는다

앞서 우리는 두뇌가 언제 안정적인 상태를 유지하고 언제 변화해야 하는지를 결정해야 한다는 즉, 안정성과 유연성 간의 딜레마를 배웠다. 이 딜레마를 해결하려는 두뇌의 전략 중 한 가지가 밝혀지는 데는 버몬트 대학의 마크 부턴(Mark Bouton) 이라는 과학자의 연구가 크게 기여했다. 부턴이 연구한 현상은 자발적 회복(spontaneous recovery), 재개(renewal), 복귀(reinstatement), 부활(resurgence) 등 여러 이름으로 불리지만, 하나같이 일찍이 배웠던 습관이 사라진 줄 알았지만 더욱 강력하게 돌아온다는 보편적인 현상을 반영한다. 이러한 ‘재출현 현상’은 특히나 우리가 변화시키고 싶은 대다수의 나쁜 습관과 관련되어 있으므로 이 현상을 좀 더 자세하게 살펴볼 필요가 있다.

재출현 및 이에 관련한 현상을 파헤친 부턴의 연구는 오래된 습관을 새 습관으로 대체할 때 우리가 실제로 오래된 습관을 ‘잊어버리는 것’이 아니라 능동적으로 과거의 행동을 ‘억제’함으로써 새로운 행동이 나타나도록 하는 것이라는 개념을 공고히 하는 데 일조했다. 그는 더 나아가 이러한 억제성 학습이 기존의 습관보다 ‘학습된 환경’과 더욱 밀접한 연관이 있다는 것을 보여주었고 이 개념은 공포증부터 외상 후 스트레스 장애, 강박장애까지 습관적인 생각과 행동을 보이는 여러 질병의 치료법에 영향을 미쳤다

한번 시작되면 멈출 수 없다

MIT의 신경 과학자인 앤 그레이비엘(Ann Graybiel)의 연구는 새로운 습관을 습득할 때 우리의 두뇌가 행동을 덩어리(chunks)로 나누는 방식에 대해 상세한 통찰을 제공한다. 지금껏 나온 강력한 신경과학적 도구를 모두 활용한 그녀의 연구는 쥐가 새로운 습관을 형성할 때 기저핵의 활동이 습관을 구성하는 일련의 행위를 ‘시작과 끝을 구분 짓거나 나누기’ 때문에 한 번 시퀀스가 시작되면 추가적인 행위 없이 단번에 완수한다는 것을 보여주었다.

그레이비엘은 연구에서 T 모양의 미로를 활용해 쥐에게 아주 단순한 과제를 수행하도록 했다. 쥐가 T의 아랫 부분에서 시작해 좁은 통로를 통과한 뒤 왼쪽 또는 오른쪽으로 방향을 틀면 되는 것이다. 그녀는 쥐들이 가능한 빨리 먹이를 얻기 위해 정확한 방향으로 전환하는 법을 신속하게 익히도록 지속적으로 같은 장소에 먹이를 두었다. 쥐들이 해당 과제를 처음 학습하는 단계에서는 미로를 달리는 동안 선조체의 활동이 있었다. 하지만 보상을 향해 방향을 전환하는 과정이 하나의 습관으로 자리 잡은 후에는 선조체 활동이 주로 행위의 시작과 끝에서만 발생했다. 뛰어난 아이디어가 돋보인 일련의 후속 연구에서 그레이비엘과 카일 스미스(Kyle Smith)는 쥐들이 해당 과제를 수행할 때 가끔씩 관찰되던 한 가지 현상을 검사했다. 쥐는 한 번씩 선택의 기로(T의 출발선과 가로선이 만나는 연결 지점)에서 멈추었다가 앞뒤를 살폈는데, 두 사람은 이를 ‘심사숙고’라고 지칭했다.

스미스와 그레이비엘의 연구에서는 선조체와 더불어 쥐가 습관을 형성하는데 필수적으로 알려진 변연계아래(infralimbic)피질이라고 하는 전전두피질 부분의 활동성을 측정했다. 쥐가 습관을 익힐수록 선조체에서 ‘행위 구간을 나누는’ 패턴(움직임의 시작과 끝에서만 활동성이 나타나는 현상)이 생겨나기 시작했고, 이 현상이 나타나자 쥐는 숙고를 덜 하기 시작했다.

스미스와 그레이비엘이 선조체의 활동 패턴과 쥐의 심사숙고 간의 관계성을 살피자 아주 흥미로운 사실이 드러났다. 어떠한 일을 수행할 때 심사숙고의 여부는 행위 구간을 나누는 패턴이 심사숙고가 벌어지기 훨씬 전인 (다시 말해 선택의 기로에 서기 훨씬 전인) 수행의 시작 단계에서 생성되는지에 달려 있다. 이들은 이와 유사한 패턴이 변연계아래피질에서도 나타나는 것을 발견했지만, 여기서는 행동이 실제로 습관화됐을 즈음인 훨씬 뒤에야 패턴이 나타났다. 이 결과는 습관이 형성되는 과정에서 선조체와 전전두피질이 협력해 행위 연속체를 ‘개별적인 행위의 집합’이 아니라 ‘하나의 행동’으로 바꿔놓고, 이로 인해 습관적 행동이 한 번 시작되면 해당 시퀀스를 중간에 멈추기가 훨씬 어려워진다는 것을 보여주었다.

성공을 계획하는 법
트리거 경고: 습관에 개입할 때

앞서 습관의 지속성에 관한 중요한 메커니즘 중 하나는 주변 환경 속 신호에 쉽게 촉발되는 것이라고 봤었다. 그렇다면 습관에 개입할 때 가능한 한 가지 전략은 바로 ‘습관의 촉발제’가 등장하지 못하도록. 즉 애초에 습관이 촉발될 일이 없도록 하는 것이다. 더크워스와 그녀의 동료들이 진행한 일련의 연구는 우리가 행동을 멈추는 데 의지력에 기대는 것보다 유혹을 없애는 것이 유용하다는 직접적인 증거를 제시했다. 연구진은 고등학생과 대학생을 대상으로 학업 목표를 달성하는 능력을 검사했다. 그러기 위해서 학생들은 집중을 어지럽히는 대상을 피해야 했다. 공부 시간마다 한 학생 집단은 집중력을 떨어뜨리는 유혹을 없애는 전략(공부할 동안은 페이스북 사용을 차단하는 앱을 설치하는 등)을 실행하라는 이야기를 들었고, 다른 집단은 유혹이 일 때마다 그것을 이겨내는 의지력을 발휘하는 훈련을 하라는 이야기를 들었다. 일주일 후 학생들은 목표를 얼마나 달성했는지 평가받았다. 환경에 변화를 준 학생들은 유혹을 이기기 위해 의지력을 활용해야 했던 이들보다 학업 목표를 달성하는 데 더욱 나은 성과를 거두었다고 한결같이 보고했다.

급진적이지만 습관의 트리거를 피하는 데 효과가 있는 한 가지 방법은 새로운 장소로 옮기는 것이다. 토드 헤더튼(Todd Heatherton)과 파트리시아 니콜스(Patricia Nichols)의 질적 연구에서는 참가자들에게 살면서 변화를 시도했던 일 중 성공했던 때와 실패했던 때를 이야기로 적어달라고 요청했다. 성공적으로 변화를 이뤄낸 사람과 실패한 사람의 가장 큰 차이 중 하나는 새로운 장소로 이동했느냐의 여부였다. 성공적으로 변화를 이룬 사람들은 그렇지 않은 사람들에 비해 새로운 곳으로 옮긴 비율이 세 배 가까이 되었다. 웬디 우드(Wendy Wood)와 그녀의 동료들은 학생들이 새로운 대학으로 편입하기 전과 후 운동 습관이 어떻게 달라졌는지를 실험하며 장소 이동을 좀 더 직접적으로 연구했다. 연구 결과 장소를 바꾸는 것은 처음부터 습관이 강하게 형성되었던 학생들에게 특히나 큰 영향을 미쳤다. 그들은 운동 습관이 약했던 학생들과 비교해 운동 횟수가 크게 줄었다. 반면, 처음부터 습관이 약했던 학생들은 새로운 변화가 행동을 의도와 일치시키는 데 도움을 주었고, 이를 통해 운동 의지가 강해진 이들은 실제로 운동을 더욱 많이 했다. 이처럼 장소 이동을 통해 개인의 환경을 바꾸는 것은 행동 변화에 잠재적으로 강력한 효과를 발휘한다.

‘습관의 뇌’를 해킹하다
습관을 없애지 않고 조절할 수 있다?

MIT의 앤 그레이비엘과 동료들이 진행한 특별한 연구를 통해 습관을 고치는 데 광유전학의 활용 가능성을 살짝 엿볼 수 있다. 연구진은 쥐들이 마크 패커드의 미로를 달리도록 훈련시켰고, 이후 가치가 낮아진 보상을 위해 계속 쥐들이 달리는 모습을 보며 쥐들에게 습관이 생겼다는 사실을 파악했다. 그런 다음 광유전 자극의 한 방식을 이용해 일시적으로 변연계아래피질의 뉴런을 억제하자 거의 즉각적으로 쥐들의 행동을 저하된 가치에 다시 민감해지도록 만들 수 있다는 것을 발견했다. 즉, 연구진은 습관적 행동을 다시 목표 지향적 행동으로 돌려놓았다. 여기서 끝이 아니다. 놀랍게도, 새로운 습관을 형성한 쥐들의 변연계아래피질을 비활성화시키자 쥐들은 원래의 습관으로 되돌아갔다. 이는 광유전 자극이 기존의 습관을 ‘없앤’ 것이 아니라 변연계아래피질이 행동을 통제하는 정도를 ‘조절’했다는 의미였다.

이런 접근법을 인간에게 적용하는 데는 한 가지 어려움이 있으니, 인간에 있어 설치류의 변연계아래피질에 해당하는 영역이 어느 곳인지 정확히 모르고(아마도 복측 전전두피질일 듯 싶지만), 이 영역은 종마다 매우 다르게 기능할 것이 분명하기 때문이다. 인간 시험을 시행하려면 수십 년까지는 아니더라도 수 년은 더 걸려야 하겠지만 그럼에도 이 연구는 심각한 중독 행동을 통제하는 데 있어 가장 훌륭한 단서 중 하나를 제공해주었다.