‘인공지능 리뷰(Artificial Intelligence Review)’ 저널에 발표된 한 연구에서, 소매업체를 위한 새로운 인공지능 기반 매장 상품 진열, 즉 ‘레이아웃’ 디자인 프레임워크가 제안되었다.
이 연구는 최근 컴퓨터 비전 및 딥 러닝의 인공지능 하위 분야에서 발전한 기술을 활용하여 고객의 물리적 쇼핑 행동을 모니터링 한 것이다.
매장에서 가장 먼 구석에서 우유를 꺼낸 고객을 생각해보자. 매우 효율적인 매장 레이아웃은 ‘구매 의도가 없었던’ 상품에 대해서도 고객의 관심을 끌고, 구매 검토 시간을 늘리고, 연계 혹은 독립적인 다른 대체 상품들까지 한 데 묶어 고객들이 상품을 더 쉽게 찾을 수 있도록 상품군을 구성할 것이다.
즉, 잘 계획된 레이아웃은 판매 및 고객 만족도 증가와 긍정적 상관관계가 있다. 이는 가장 효과적인 매장 내 마케팅 전술 중 하나이고, 수익성을 높이기 위해 고객 결정에 직접적인 영향을 미치는 데 활용되는 전략이다.
이번 연구는 기존 폐쇄 회로 TV 카메라 데이터 위에 새로운 인공지능 기술을 적용하여 매장 내에서 고객과 고객의 행동을 해석하고, 이를 더 잘 이해할 수 있는 포괄적이고 새로운 프레임워크를 제안하고 있다.
비디오 데이터가 고객이 매장에서 어떻게 이동하는지, 경로는 어떤지, 더 많은 시간을 보내는 섹션이 어디인지에 대한 통찰력을 제공한다는 것은 이미 잘 알려져 있는 사실이다. 그러나 이 연구는 그보다 더 나아가 고객들이 눈썹을 올리거나 눈을 뜨거나 웃는 것과 같은 눈에 띄는 표정을 통해 감정을 표현한다는 점에 주목하면서 고객 행동을 더 자세히 조사한 것이다.
이러한 고객 행동과 감정에 대한 이해는 마케팅 담당자와 관리자가 판매 제품에 대한 고객 반응을 더 잘 이해할 수 있는 유용한 도구를 제공할 수 있다.
감정 인식 알고리즘은 컴퓨터 비전 기술을 사용하여 얼굴을 인식하고, 눈썹 끝, 코끝, 입꼬리와 같은 얼굴의 주요 랜드마크를 식별한다. 이러한 고객 행동을 이해하는 것이 비즈니스 인텔리전스(Business Intelligence)의 궁극적 목표이다. 비즈니스 인텔리전스란 기업이 의사결정을 내리기 위해 데이터를 분석하여, 의미있고 효율적인 정보를 도출하는 기술 및 분야를 말한다.
즉, 소매업체에서의 비즈니스 인텔리전스란 이동하고, 제품을 집고 카트에 넣거나 선반에 다시 올려놓는 것과 같은, 구매에 대한 고객의 모든 명백한 행동에 대해 데이터를 분석하여, 의미있고 효율적인 정보를 도출하는 것이다. 제품을 응시하거나 제품 포장을 읽는 것과 같은 행동도 제품에 대한 고객의 관심을 이해하려는 마케터에게는 금광과도 같은 데이터일 것이다.
안면 신호 및 고객 특성화를 통해 감정을 이해하는 것과 함께 레이아웃 관리자는 고객의 의사결정에 대해 파악하기 위해, 히트맵 분석, 인적 궤적 추적 및 고객 행동 인식 기술을 사용할 수 있다. 이러한 유형의 지식들은 비디오 데이터로 고객들을 직접 평가할 수 있고, 고객에 대한 개별 신원에 대해서는 알 필요 없이 매장 내에서 불특정 다수의 고객 행동을 이해하는 데 도움이 될 수 있다.
이 분석을 기반으로 연구팀은 센스(Sense), 씽크(Think), 액트(Act), 런(Learn), 즉 STAL(Sense-Think-Act-Learn)이라 불리는 소매점용 프레임워크를 제안했다. 이 프레임워크는 어떻게 적용될까?
첫째, '센스'는 처리 및 분석을 위해 매장의 폐쇄 회로 TV 카메라의 비디오 영상과 같은 원시 데이터를 수집하는 것을 의미한다. 일반적인 소매점 관리자는 이러한 작업을 눈으로 하나하나 수행한다. 하지만 새로운 접근 방식을 통해 마케터는 이러한 감지를 모두 자동화하고 고객 또는 고객 모집단을 따라 매장 전체에서 이를 수행할 수도 있다.
둘째, ‘씽크’는 인간이 인풋 데이터, 즉 수집된 데이터를 뇌를 사용하여 처리하는 것과 거의 같은 방식으로 상위 인공지능, 데이터 분석, 딥 머신 러닝 기술을 통해 수집된 데이터를 처리하는 것을 의미한다. 특히, 씽크 단계에서 지능형 비디오 분석 레이어는 이미지와 비디오의 내용을 해석하는 데 중요한 역할을 수행한다.
셋째, '액트'는 소매점 레이아웃을 개선하고 최적화하기 위해 '씽크' 단계의 지식과 통찰력을 활용하는 것을 의미한다.
이 프로세스가 완전하게 구현되면, 그 다음부터 프로세스는 STAL의 마지막 단계인 런 사이클, 즉 지속적인 학습 사이클을 구성하게 된다. 이를 통해 시간이 지날수록 STAL은 수익성을 최적화하는 매장 경영 방법을 알려 준다.
이 프레임워크의 장점은 소매업체들이 고객이 매장에 들어올 때의 트래픽 흐름과 행동 또는 매장의 다른 영역에 배치된 매장 디스플레이의 효율성과 같은 매장 디자인 예측 평가를 할 수 있다는 것이다.
연구에서 관찰된 바와 같이, 일부 소매업체들은 이미 일상적으로 인공지능 기반 알고리즘을 사용하여 고객의 관심과 요구 사항을 더 잘 충족시키고, 고객 맞춤화 판매를 제안하고 있다. POS 시스템(point-of-sales system)과 고객 충성도 프로그램의 경우 특히 그렇다.
STAL은 더 효과적인 데이터 기반의 매장 레이아웃 및 디자인을 제공하고 물리적 공간에서 고객 행동을 더 잘 이해하기 위해 인공지능을 사용하는 또 다른 사례이다.
연구팀은 데이터를 필터링하고 정리하여 품질과 개인 정보를 개선하고 이를 구조적 형태로 변환할 수 있다고 밝혔다. 개인 정보 보호는 모든 고객의 주요 관심사이기 때문에, 예를 들어 데이터를 전체 수준에서 조사하여 개인 고객의 정보들은 익명화될 수 있다.
매장의 폐쇄 회로 TV 카메라를 통해 유입되는 막대한 데이터 흐름이기 때문에, 슈퍼마켓 레이아웃 분석을 위한 비디오 데이터를 처리, 저장하는 데 클라우드 기반 시스템이 적절한 방식일 것이다.
연구팀은 STAL 프레임워크를 사용하여 구현된 인공지능이 매장 관리자가 최소한 세 가지 중요한 요소를 기반으로 주요 운영 변수를 조정하는 데 도움이 될 수 있음을 관찰했다.
첫째는, 체크아웃 배치이고, 둘째는 직원 수와 교육, 배치와 같은 직원 변수이다. 셋째는 혼잡, 방문 시간, 충동 구매, 대기열 형성, 제품 진열에 대한 수용성 등과 같은 고객 변수이다.
In a study just published in Artificial Intelligence Review, a research team proposes a new AI-powered store layout design framework for retailers. This research takes advantage of recent advances in the AI subfields of computer vision and deep learning to monitor the physical shopping behaviors of customers.
Any shopper who has retrieved milk from the farthest corner of a store knows that an efficient store layout presents its merchandise to attract customer attention to items they had not intended to buy, increase browsing time, and make it easier to find related or viable alternative products grouped together.
A well thought out layout has been shown to positively correlate with increased sales and customer satisfaction. It is one of the most effective in-store marketing tactics and it is used to directly influence customer decisions to boost profitability.
The research proposes a comprehensive and novel framework to apply new AI techniques on top of the existing closed-circuit TV camera data to interpret and better understand customers and their behavior, in-store.
It’s well known that video offers insights into how shoppers travel through the store, the route they take, and the sections where they spend more time. But this research drills down further, noting that people express emotion through observable facial expressions such as raising an eyebrow, eyes opening or smiling.
Understanding this customer emotion as they browse could provide marketers and managers with a valuable tool to understand customer reactions to the products they sell.
Emotion recognition algorithms work by employing computer vision techniques to locate the face, and identify key landmarks on the face, such as corners of the eyebrows, tip of the nose, and corners of the mouth.
Understanding customer behaviors is the ultimate goal for business intelligence. Obvious actions like picking up products, putting products into the cart, and returning products back to the shelf have attracted great interest for the smart retailers.
Other behaviors, like staring at a product or reading the packaging of a product are a gold mine for marketers seeking to understand the interest of customers in a product.
Along with understanding emotions through facial cues and customer characterization, layout managers could employ heatmap analytics, human trajectory tracking and customer action recognition techniques to inform their decisions.
This type of knowledge can be assessed directly from the video and can be helpful to understand customer behavior at a store-level while avoiding the need to know about individual identities.
Based on this analysis, the team proposed a framework for retailers called Sense-Think-Act-Learn (or STAL). How is the framework applied?
Firstly, ‘Sense’ means to collect raw data, such as from video footage from a store’s closed-circuit TV cameras for processing and analysis. Store managers routinely do this with their own eyes; however, new approaches allow marketers to automate this aspect of sensing, and to perform it across the entire store, following a customer or customer population.
Secondly, ‘Think’ means to process the data collected through advanced AI, data analytics, and deep machine learning techniques, in much the same way humans use their brains to process incoming data.
Thirdly, ‘Act’ means to use the knowledge and insights from the “Think” phase to improve and optimize the supermarket layout. Notably, the intelligent video analytic layer in the THINK phase plays a key role in interpreting the content of images and videos.
Implemented fully, this process constitutes a continuous “Learning” cycle, which is where the fourth phase of the STAL framework applies. Overtime, STAL helps store management learn how to optimize profitability.
An advantage of this framework is that it allows retailers to evaluate store design predictions such as traffic flow and behavior when customers enter a store, or the effectiveness of store displays placed in different areas of the store.
As the researchers observe, some retailers already routinely use AI empowered algorithms to better serve customer interests and wants, and to provide personalized recommendations.
This is particularly true for the point-of-sale system and customer loyalty programs. STAL is simply another example of using AI to provide better data-driven store layouts and designs, and to better understand customer behavior in physical spaces.
The researchers say data could be filtered and cleaned to improve quality and privacy and transformed into a structural form. As privacy was a key concern for customers, data could be de-identified or made anonymous, for example, by examining customers at an aggregate level.
Since there is an intense data flow from the closed-circuit TV camera in store, a cloud-based system could be considered as a suitable approach in processing and storing video data for supermarket layout analysis.
The researchers observe that AI implemented using the STAL framework could help managers adjust critical operating variables of “the retail mix” based on at least three critical factors:
First, design variables such as space design, point-of-purchase displays, product placement, and placement of check-outs.
Second, employee variables such as the number, training and placement of personnel.
And third, customer variables such as, crowding, visit duration, impulse purchases, use of furniture, queue formation and receptivity to product displays.