타겟 광고에 대한 반감 vs. 공감

타겟 광고에 대한 엄청난 과장이 담긴 글을 하나 봤다. 사용자들이 어떤 페이지를 거쳐갔는지에 대한 정보를 바탕으로 어떤 상품에 관심이 있을 것이라고 추정하고, 맞춤형 타겟 광고를 하는 서비스에 이용자들이 굉장한 불쾌감을 느끼는 경우가 많단다. 저자의 의도인지는 모르겠지만 그런 광고에 대한 강한 거부감이 느껴지는 글이었다.

딱 저 알고리즘을 만들어서 Re-target 해주는 광고회사의 Senior Data Scientist 였고, 또 비슷한 모델을 더 업그레이드 시켜서 사업하겠다고 나선 “Data guy”인 필자의 관점을 한 마디로 요약하자면, 타겟 광고가 불편한게 아니라, 윗 블로그 글처럼 피상적인 이해만 가진 사람들의 불편한 시선들이 오히려 불편하다.

 

타겟 광고란?

미국에 Target이라는 대형 슈퍼마켓 체인점이 있다. 여기서 일하던 어느 통계학자가 구매 품목을 기준으로 구매자들을 구분하고, 그에 맞춰서 상품 광고를 보내는 알고리즘을 만들었다. 덕분에 임신한 10대 소녀의 구매 패턴이 바뀌는 걸 시스템이 자동으로 인식하고, 임신한 여성이 좋아할만한 상품을 담은 이메일을 여러차례 보냈다. 아마 K-Means로 유저들의 그룹을 구분하고, 이메일에 대한 반응률을 바탕으로 그룹이 바뀐 것을 확인했을 것이다. 이 스토리가 Fox News에까지 보도될만큼 해프닝이 된 이유는, 부모들도 몰랐던 소녀의 임신을 Target이 먼저 알아차렸다는 사실이 데이터 사이언스를 모르는 사람에게는 적잖은 충격이었기 때문일 것이다.

(그나저나 저런 패턴 인식 알고리즘을 통계학 출신이 만든다는 글들이 한국어 블로그로도 돌아다니는데 정작 “머신러닝은 개발자가 하는거 아닌가요?”라고 질문하는 사람들이 왜 이렇게 많은지… “머신러닝 개발자 과정”이라니.. 머신러닝은 개발자/기획자를 나눌게 아니라 통계학 관련 전공자와 비 전공자를 나눠서 교육해야하는 과목이다. 에효…)

경제학 + 통계학 + 시뮬레이션으로 교육과정을 거친 필자의 눈에 Target의 통계학자가 했을법한 생각은 지극히 상식적인 패턴이다. 현시선호 (Revealed preference)라는 미시경제학 용어는 입으로 말하는 것보다 직접 행동으로 옮긴 내용이 더 명확하게 개개인의 선호를 보여준다는 개념인데, 괜한 설문조사로 어떤 상품을 좋아하냐고 묻지말고, 어떤 상품을 구매하고 있는지와 어떤 상품 광고에 더 민감하게 반응하는지를 기준으로 그 유저의 선호를 파악하는 방식이 딱 여기에 해당된다.

여러 상품에 대한 구매 패턴을 놓고, K-Means를 이용해서 특정 상품군을 구매하는 유저들을 같은 그룹으로 묶고, 그런 그룹핑이 제대로 된 건지 이메일 광고에 대한 반응률로 재 확인하는 작업은 통계학 모델링 + Feedback을 이용한 재확인 작업에 다름없다. 저런 방식의 타겟 서비스를 출시하기 전에 회사 내부에 축적된 구매 데이터를 이용해서 시기별, 지역별 적용 가능성도 확인했을 것이고, 더미 데이터를 생성해서 시뮬레이션으로 확인해보는 작업도 거쳤을 것이다.

그 10대 소녀는 임산부가 되고나서 10대 소녀들이 자주 구매하는 품목들 대신 임산부가 구매하는 품목으로 바스켓의 구성 상품이 바뀌었을 것이고, Target의 시스템에서 유저 “가”가 그룹 A에서 그룹 B로 이동한 것 같다는 Alert이 떴을 것이다. 확인차 보낸 이메일 광고에 대한 반응을 보고 유저를 잘못 인식하거나 Identity fake가 아니라 정말 한 명의 유저가 다른 그룹으로 이동했다는 것을 확인했고, 몇 차례 추가적인 이메일 광고 반응을 바탕으로 Target에서는 그 소녀가 임신했다는 확신을 갖게 되었을 것이라고 생각한다.

 

타겟 광고에 대한 반감

저 위에 언급한 블로그 글을 보면, 내가 알려주지 않은 개인 정보를 남들이 알아냈다는 사실이 두렵단다. 필자의 눈에 타겟팅 작업은 일종의 탐정 놀이 같은건데, 범죄자 입장에서 탐정이 증거를 모아 “니가 범인이야!”라고 외치면 좀 섬뜩해질만하다는 생각이 들긴 한다.

여기서 하나 짚고 넘어가고 싶은 사실은, Target이 그 소녀에게 임신 테스트기를 주고, 그 결과를 전송받아서 임신 사실을 아는 것이 아니라, 단순하게 그 소녀의 구매 패턴 (or 행동 패턴)을 보고 상태 변화를 알아냈다는 사실이다.

그 소녀가 Target 매장에서 구매한 상품에 대한 데이터는 그녀만의 개인 정보일까? 아니면 상품 진열을 최적화해서 하나라도 더 팔고 싶은 Target 과 공유해야하는 정보일까? 만약에 공유 정보라면, Target은 그녀의 행동 패턴을 바탕으로 상태 변화를 알아낼 수 있는 알고리즘을 만들어내면 사생활 침해가 되는걸까? 아니면 회사 영업 이익 극대화를 위한 자본의 논리로 봐야할까?

지난 몇 년간 타겟 광고의 진화 양상을 보면, 처음에는 이미 봤던 상품들을 다시 보여주는 수준에 그쳤다가, 안 봤지만 찾고 있을 것 같은 상품을 추천하고, 글을 읽고 있는 페이지에 나오는 핵심 단어와 매칭되는 광고 상품을 보여주고, 더 나아가서는 SNS의 친구들이 샀던 상품을 추천하는 서비스까지 출시되어 있다.

한국처럼 모든 유저 행동 데이터는 개인정보랍시고 철저하게 틀어막는 나라에서는 이상한 나라의 엘리스처럼 들릴지 모르겠지만, 사실 요즘 나오는 타겟 광고 상품들의 대부분은 “탐정 놀이”로 패턴을 찾아내는 서비스지, 그 유저의 주민등록번호 같은 개인 정보를 이용하질 않는다. Target 매장에서 구매자의 상품 목록도 못 갖고 있고, 그 목록에 맞춰서 광고도 못하게 하면, 개인정보 보호를 명목으로 Target의 영업 자유를 침해하는 꼴이 된다. 정작 보호해야하는 개인정보인 주민등록번호나 주소 같은건 쓰지도 않는데.

 

타겟 광고에 대한 공감

온라인 쇼핑몰을 이용할 때, 내가 찾는 상품의 정확한 이름을 모르면 검색이 질질 늘어진다. 비슷한 용어, 비슷한 기능에 대한 검색어를 몇 번이나 넣으면서 Trial-and-error를 거듭하다가 때로는 못 찾고 포기할 때도 있고, 다음에 찾아야지라고 생각하고 잊어버릴 때도 있고, 또 운 좋게 비슷한 용어가 여럿 들어간 상품 제목을 보고 찾던 단어를 발견하는 경우도 있다.

좀 더 스케일을 낮추면, 비슷한 디자인의 옷들을 보다가 딱 마음에 드는 옷이 안 나타날 때, 화면 하단이나 양쪽 여백에 추천 상품 목록을 보고, “이게 더 좋은거 같은데…?”라는 생각에 클릭을 하는 경우도 종종 있다. 옷 매장에 가서 색상과 디자인을 정확하게 골라주는 도우미들 서비스와 이런 추천 알고리즘이 뭐가 다를까?

구매 혹은 금전 지불이라는 행동 이전에 필수적으로 거치는 작업이 “탐색” or “정보 수집”이다. 경제학에서는 “검색 비용 (Searching Cost)”라고 한다. 타겟 광고에 대한 반응률을 보면, 검색 비용을 줄여주는 광고에는 민감도가 높지만, 단순하게 노출 패턴을 다양화하는 광고에는 유저들의 거부감이 숫자로 나타난다. 옷 매장에서 아무 옷이나 다 잘 어울린다고 하는 도우미의 말 보다, 체형을 보고 적절한 옷을 추천해주는 도우미의 말에 구매자들이 더 신뢰를 보이는 경우와 크게 다르지 않을 것이다.

 

나가며

필드에 있는 사람이 정부 정책에 불평을 늘어놓는 건 너무 일상적인 일이라 항상 자제하려고 하지만, 타겟 광고에 대한 부분 만큼은 한 마디 지적질을 해보고 싶다. 개인정보 보호법의 원래 목표는 남북 분단과 간첩 색출이라는 민족사적인 아픔 때문에 만들어낸 주민등록번호라는 Super Mega Ultra 핵심적인 개인 정보를 보호하는 것이다. 그 사람의 구매 패턴 정보가 왜 그렇게까지 보호해야하는 개인 정보인가? 그렇게 빅데이터 생산은 꽁꽁 묶어놓은 상태에서 머신러닝 산업을 지원하고 4차 산업혁명을 주도하는 선진국이 되겠다니? 총칼을 주기는 커녕 몸을 꽁꽁 묶어놓고 레이저 건을 들고 있는 적군과 전투에 나가라고 내모는 꼴이다.

주변에 있는 스타트업 분들 중에는 저런 이유 때문에 법인 자체를 미국에 설립해버리는 경우가 은근 있다. 한국이 말도 안 되는 억지 규제가 너무 심하니, 외국 회사가 외국에 서버를 두고 외국에서 합법적으로 활용할 수 있는 기술을 한국 시장에 “적용”만 하도록 하면 많은 억지 규제들에서 회피할 수 있단다. 빅데이터가 뭔지도 모르고 입에만 “빅”을 올리거나, 그냥 용량만 많은 데이터인 줄 아는 사람들이 정책을 결정하고 있고, 그 사람들이 복지부동하겠다고 조금만 모르는 내용 나오면 다짜고짜 “안 된다”고 딱 자르는데, 저런 통계 모델링 할 수 있는 인재가 뭐하러 한국에 법인 세우고 복지부동 공무원들과 고생하면서 싸울까?

 

X