4차 산업혁명이란? – “인공지능 시대, 인간을 다시 묻다” 서평

강의 4회차에 빅데이터 활용을 위한 차원 축소 (Dimensionality Reduction)을 설명하면서 Principal Component Analysis (PCA)를 수학 빼고 최대한 직관적으로 가르치려고 노력하는데, 학부 기초 수학 수업인 선형대수학에서 나오는 Eigen vector라는 개념을 이용해 데이터들을 새로운 축에서 재해석하고, 새로운 축들 중 값이 큰 축만 골라내면 거의 손실없이 빅데이터의 특성을 모두 담을 수 있는 작은 데이터 셋을 만들 수 있다는 방식으로 설명한다. (이래서 선형대수학을 아예 모르면 데이터 사이언스 강의 듣기 어려운 것 같기는 하다.)

이번 달 강의에 오셨던 학생 분 중 정말 철학자가 아닐까 싶은 분이 한 분 계셨다. 그 연배 있으신 학생 분은 항상 복습하고 인터넷 뒤져서 찾아낸 자료 중 일부를 공유주시곤 했는데, 그 4주차 강의 복습을 하신 자료 중 생물학과에서 인간을 구성하는 46개의 염색체 안에 있는 개별 게놈(Genome)의 기능을 파악한 데이터를 염색체별로 정리하는 것이 아니라, 같은 기능을 하는 게놈을 묶은 Eigen Gene이라는 설명을 하는 슬라이드는 정말 충격적이었다. 현미경으로 보는 염색체 1번부터 46번이라는 인간이 정리하는 방식의 데이터 인식이 아니라, 게놈 각각의 기능에 맞춰 염색체 단위가 아니라 기능 단위로 데이터를 재정리하는 것이 마치 자연이 만들어 놓은 방식을 역추적해서 새로운 축으로 재해석하는게 PCA인 것 같다는 식으로 메일을 주셨는데, 이 정도의 철학적인 이해를 마주하고 나니, 그동안 필자가 선형대수학을 헛공부했구나는 생각에 고개를 못들겠더라.

사실 머신러닝이건 생물학이건 모델링의 영역으로 들어가면 모든 구성 요소는 수학과 통계학이고, 더 아래에는 철학이 깔려있다. 학부시절, 지식을 잡학다식하길 좋아했던 필자가 미학과의 미학원론*을 들으며 알게된 철학과 친구를 수학과 2학년 수업인 해석개론에서 다시 만났는데, 해석개론이 철학과 전공 인정 수업중 하나라고 하더라. 보통 해석개론은 수학에서 증명을 하는 내공을 길러주고, 앞으로 계속 수학 증명으로 깊게 들어갈 능력이 있는지를 판단하는 가늠자 같은 수업인데, 그래서 보통 경제학 전공자들 중 박사 유학을 고민하는 친구들 사이에 필수적인 수업인데, 이런 수학 수업이 철학과 전공 인정 수업이라니… (필자도 문돌이긴 하지만, 그 이후로 인문대 친구들이 수학 못할 것이라고 함부로 가정하면 안 된다는 걸 뼈저리게 느낀 사건이다.) 

(* 미학, 철학, 종교학은 사실상 하나의 원류에서 시작하는 학문이다. 잘 모르는 사람들이나 미학은 미술이고, 종교학은 목사나 스님되는거라고 생각하지, 실상 세 학문의 출발점은 플라톤과 아리스토텔레스, 피타고라스를 위시한 고대 그리스 소피스트들이다.)

나이가 더 들고, 공부를 더 하면서 수학이 사실은 철학이고, 증명도 논리학이라는 걸 깨닫게 되면서, 틈나는대로 철학 서적들을 찾아서 읽는다. 그러던 차에 위에 살짝 언급한 철학자 풍의 수강생께서 7회차 수업 후에 아래의 책 한권을 선물해주시더라.

 

철학하시는 분이 머신러닝을 철학적인 관점에서 바라본 내용인데, 일부 신문기사처럼 “인공지능이 철학적으로 재해석되어야된다”는 둥, “인공지능에 철학적 관점이 필요하다”는 둥의 뚱딴지 같은 내용과는 거리가 멀고, 책 저자가 수학 공부를 참 많이 한 것 같아서 책 페이지를 넘기면서 참 반가운 부분이 많았다. 그 중 가장 눈에 띄는 부분은, Supervised learning이 아닌 영역, Un-supervised learning으로 접근하고 있는 영역에서 별로 성과가 없는 이유를 설명하면서 Stochastic process와 생물학적인 진화를 연결짓는 부분이었는데, 부족하나마 필자의 첨언을 좀 달아보고 싶다.

 

1. Supervised vs. Un-Supervised

필자의 머신러닝 수업 첫 시간은 아래의 그래프로 시작한다. 기존 통계학이 데이터를 가장 잘 설명하는 선형 함수를 찾는데 집중했던 것, 왜 선형 함수가 가장 유리했었는지, 왜 빅데이터 시대에는 선형 함수가 최선의 선택이 아닐 수도 있는지, 머신러닝이란 결국 (데이터 속에 숨겨진) 비선형 함수 패턴을 찾는 것이다는 아이디어를 짧게나마 정리하고 수업에 들어간다.

굳이 저런 그래프로 수업을 시작하는 이유는, 다들 머신러닝이 뭔가 새로운 학문이라고 오해하고 있고, 그리고 머신러닝이 통계학과는 별개의 학문이라고 생각하고 수업에 들어오기 때문이다. IT 업계 짬밥도 있고, 데이터 관리 플랫폼 만들어내는데는 한국에서 몇 손가락 안에 꼽히실만한 어느 스타트업 개발이사(CTO) 분을 만난적이 있었는데, 필자더러 어떤 변수를 넣을지도 알아서 찾아내는 시스템이 있는데, 굳이 필자가 주장하는 방식으로 수학, 통계학을 배우고 머신러닝 알고리즘을 익혀야하냐고 되물으시더라. 말을 바꾸면, 저 위의 그래프 (혹은 다른 어떤 규칙)를 찾아가는 길(path)를 인간이 지정해주지 않고도 기계가 알아서 찾아내는데, 굳이 모델을 만들어야할 필요가 있냐는 것이다. 그분이 들었던 예가 알파고가 “스스로” 학습해서 인간 최고수를 이겼으니, 인간이 가르쳐주지 않은 길(path)를 만들어낸 것이 아니냐는 거였다.

모델링을 직접하는 사람들은 알겠지만, 사실 알파고의 시스템은 바둑의 규칙을 단지 Linear regression 대신 Neural net으로 구현하고, 과거 바둑 데이터의 승/패 여부를 활용해 인간이 몰랐던 승리 “패턴”을 찾아낸 것에 불과하다. 새로운 “승리 패턴”을 만들어 낸 것이고, 우리가 알고 있는 바둑의 “포석”들 보다 더 나은 선택지가 있다는 것을 알려준 것이지, 바둑의 규칙을 새로 “창조”해 낸 것은 아니다. Neural net이 복잡한 비선형 패턴을 찾아내기에 좋은 도구이기 때문에 Linear regression보다 더 나은 성과를 가져다 준 것은 맞지만, 그렇다고 Neural net이 Linear regression과 완전히 다른 기술이냐고 물으면 또 그것도 아니다. 필자의 수업에서 꼭 짚고 넘어가는 부분인데, Neural net은 Logistic regression의 결합이고, Logistic regression은 Linear regression에 다른 Kernel을 하나 추가한 것에 불과하다.

좀 쉽게 말하면, 우리가 학부 수업 때 들었던 통계학 방법을 좀 응용해서 쓴 테크닉으로 알파고가 만들어졌다는 뜻이다. (인공지능이 무슨 4차원의 기술이 아니라는 뜻이기도 하다.)

추천받은 책에서 가장 맘에 들었던 부분은, 철학자이신 저자가 위의 내용을 정확하게 알고 있고, 더 나아가서 왜 Supervised learning에서만 Neural net이 작동하고, Unsupervised learning에서는 좋은 성과가 나오기가 힘든지에 대한 설명을 해 놓은 단락이었다. 비선형 함수 or 비선형 패턴을 찾아내는 작업은 무한대의 조합 중 가장 그럴듯한 함수를 하나 찾아내는 작업인데, 데이터가 0 또는 1로 가이드를 해줄 때는 (승/패 값을 알려줄 때는), 데이터가 보정을 해 주니 그럭저럭 가장 그럴듯한 함수를 찾아낼 수 있는데, 데이터의 보정이 전혀 없으면 어떻게 무한대 중에 어떤 조합이 가장 좋은지 알아낼 수 있겠냐고 설명하더라.

저 위의 생물학 Eigen Gene의 예제와 접목시켜보면, 특정 DNA가 무슨 기능을 하는지에 대한 유전자 지도도 없는 상태에서 어떻게 PCA 함수로 Eigen Gene을 “알아서” 찾아내도록 만들 수 있을까라는 반박과 같다. 우리가 PCA로 유사한 기능을 하는 DNA들을 하나의 Eigen Gene으로 묶을 수 있는 건, 그 DNA들이 유사한 기능을 하고 있다는 정보를 이미 알고 있기 때문이다.

 

2. Stochastic process

인공지능이 Supervised의 영역에서 Unsupervised의 영역으로 확장되기 위해서 가장 필요한 부분이 뭘까는 질문에 대한 챕터에 “진화”라는 제목이 달려 있었다. 그리고 단락 소제목으로 Stochastic Process가 있더라.

필자가 박사 재학시절 배우고 Best Teaching Award까지 받으며 가르친 Stochastic process는 시간을 분,초 단위의 “인간이 인지할 수 있는” 기준으로 쪼개는 것이 아니라, 무한대분의 1과 같이 “인간이 인자할 수 없는” 기준으로 쪼갤 때, 그 때 각각의 쪼개진 부분들에 미분, 적분같은 기존의 수학이 어떻게 적용되는지 설명하는 수학이었다. 그렇게 잘게 쪼개는 이유는, 인간이 인지할 수 없는 무수히 많은 Particle들이 뭉쳐져서 하나의 물질이 된다는 아이디어를 활용해, 불확실성(Uncertainty)을 모델화할 수 있는 최소 단위를 만들기 위함이다. 우주 물리학에서는 같은 수학을 이용해서 천체의 움직임을 예측하고, 파이낸스에서는 파생상품의 가격 계산에 Stochastic Calculus를 쓴다. (필자의 논문에 쓰인 수학도 Stochastic Calculus다.) 그런 Stochastic Process가 왜 갑자기 인공지능의 진화 부분에 나오고, 인공지능의 진화와 Unsupervised learning은 도대체 무슨 관계가 있는걸까?

저자의 정의에 따르면, 인공지능이라고 불리고 있는 (Deep) Neural Net 모델이 Unsupervised learning을 하게 된다는 것은 인간이 알려준 규칙말고 다른 규칙을 만들어 낼 수 있다는 뜻이란다. 바둑의 규칙내에서 새로운 “포석”을 찾는게 아니라 바둑 이외에 새로운 “게임”을 만들어내는 수준에 이르러야 진짜 Unsupervised learning이고, 그걸 위해서는 자연계에서 진화가 일어나는 방식대로 “돌연변이”가 랜덤하게 일어나는 모델링이 필요하다는 뜻이다. (인간이 추위에 적응하기 위해서 털 옷을 만드는게 아니라, 털이 많은 인간으로 진화하는 거랑 비슷하다고 이해했다.)

머신러닝 모델에 Stochastic process까지 도입한 모델은 아직 필자도 본 적이 없지만, 최소한 “랜덤”을 추가해서 기존 모델의 성능을 업그레이드 하는 경우는 꽤나 보아왔다. 상품 추천 알고리즘에서 “Serendipity”라고 불리는 모델 응용은 기존 데이터 기반으로 추천하지 않아야할 상품을 랜덤하게 끼워넣는 것이고 (위의 Netflix 모델 설명 슬라이드 참조), 알파고의 성능 업그레이드를 위해서 데미스 하사비스도 일부러 오류를 발생시키는 알파고와 기존 알파고 간 대국을 통해 기존 알파고에게 새로운 데이터 셋을 추가했다는 인터뷰를 보기도 했다. (아래 YouTube 영상의 31분 이후부터 이세돌의 “신의 한수” (4국 78수)를 언급하고, 대응책으로 오류 알파고를 활용했다고 언급한다.)

필자가 모델링을 하면서 Serendipity를 만들 때도 나름대로의 랜덤 함수 규칙이 있고, 오류 생성 알파고도 아마 오류에 해당하는 알고리즘이 따로 있었을텐데, 인류가 인공지능의 등급을 진짜 Unsupervised까지 끌어올리기 위해서 어떤 방식으로 “돌연변이”를 모델에 집어넣어야할까?

최소한 인간이 처음보는 단어가 나왔다고  페이스북 챗봇 서비스를 중단했다는 기사를 보고, 문자 데이터 전처리를 잘못했나보다고 생각하는게 아니라, 페이스북이 진정한 Unsupervised learning 모델을 만들어냈다고 설레발치는 기사들이 돌아다니는 수준으로는 어렵겠지.

 

3. Integrated Intelligence

인공지능이 성장하면서 인류의 삶에 어떤 영향을 미칠 것인지에 대한 이야기들이 참 많이들 돌아다닌다. 위에 소개한 책처럼 철학자이면서 동시에 수학과 기술을 다 이해하고 있는 분의 의견도 있는 반면, 많은 경우에는 잘 모르는 기자들이 쓴 단발성 기사라서 필자가 관심을 기울이는 경우가 드물다. 그러다 며칠전에 우연히 모 방송국의 다큐 프로그램에서 아래 대담을 스쳐봤는데, 그냥 넘어가기가 좀 많이 불편해, 한 마디해야 겠다는 생각에 굳이 스샷을 떴다. (다른 부분을 안 봐서 앞, 뒤 내용이 달랐을 수도 있다는 점을 미리 공지하고, 방송국에서 저작권 위반이라고 연락받으면 삭제할 수도 있다는 점 알려드립니다.)

우선, 위 스샷의 대담 내용 중에 도로 사진을 찍는 자동차를 운전하는 사람이 구글 정규직 직원이 아니라는 점은 동의한다. (미국 사회에 한국식 정규직 – or 철밥통 – 이라는 개념이 있는지 잘 모르겠다는 점은 일단 배제해놓자.)

그러나, 도로 사진을 찍는 자동차, 그 자동차를 운전하는 운전자, 그 운전자를 고용하는 구글 (or 다른 자율주행 프로그램 제작회사)의 관계 부분에 대해서만큼은 꼭 한 마디하고 싶다. 일반 운전자가 자율주행 프로그램을 무료로 쓴다는 조건으로 현재 달리는 도로의 사진을 모두 자율주행 프로그램사에 제공한다면 어떻게 될까? 이미지 전송 속도를 지금보다 더 빠르게해 줄 5G 세대가 오면 (현재는 4G, LTE 속도) 충분히 가능한 이야기가 아닐까? 아니 지금도 좀 화질을 낮추면 얼마든지 실시간으로 이미지 전송을 할 수 있다. 전세계의 모든 운전자가 자기 차에 달린 카메라 (or 블랙박스)로 현재 달리는 도로, 주차장의 상태를 찍어서 보낸다면, 굳이 도로 사진을 찍어줄 직원을 (비정규직으로라도) 고용할 필요가 있을까?

필자의 회사가 만들고 있는 시스템도, 유저들이 보내준 데이터를 기반으로 돌아간다. 이런 방식의 수익자 제공 데이터 기반 시스템을 조금 유식한 용어로 Integrated Intelligence*라고 부르는데, 인공지능 모델의 최대 한계인 데이터 수집 부분을 설문조사하듯이 고비용을 들여 직접 찾아가는 방식이 아니라, 특정 서비스를 제공해주는 조건으로 그 서비스에 필요한 데이터의 일부가 되는 것을 반대급부로 제공하는 방식이다.

(*Collective Intelligence는 여러 사람의 생각이 모이면 오류가 줄어들 수 있다는, 이른바 “평균의 위대함”을 말하는 것이었다면, Integrated Intelligence는 유사함을 기준으로 유저를 묶어 서치 비용을 감소시키는, “다양성의 존중과 지원”이라고 할 수 있다.)

어마어마한 계산 비용을 써야하는 알파고에 맞서 겨우 설탕 한 스푼치 열량으로 비슷한 효율을 내는 (지능적인 생물인) 인간을 겨우 도로 위 사진 찍는 “저급한” 노동에 쓰기는 좀 아깝지 않나? 그런건 기계에게 맡겨도 될만큼 인공지능자동화 시스템이 많이 성장했다. (물론 잉여 시간과 설탕 투입량을 증가시켰더니 살만 찌는 부작용이 있기는 하지만 ㅋㅋ)

 

나가며

지난달 중순쯤에 4차 산업을 선도하는 어느 IT전문 매체라는 곳에서 필자더러 데이터 사이언스 강의를 해달라고 요청이 왔다. (아래 내용이 비판적이기 때문에 어느 곳인지 밝히지 않는 점, 미리 독자의 양해를 구합니다.)

필자가 3시간짜리 8회 강의를 해도 사실 시간이 빠듯하고, 내용 이해를 다 못하실까봐 강의 동영상도 제공하고, 심지어는 어느정도 수학, 통계학 공부를 하신분만 오라고 “엄포”를 놓고 있는데, 자기네 매체 쪽에서 같은 강의를 열면서 대신 이론 6시간, 응용 6시간 정도로 줄여달라고 하시더라. 데이터 사이언스를 가르치는게 아니라, 교양 수업 수준으로 간단한 안내 정도만해야 아마 12시간 안에 빠듯하게 내용 전달을 할 수 있을 것 같은데, 도대체 지금까지 무슨 강의만 했길래 저런 이야기를 할까 싶어서 그 IT전문 매체 홈페이지 이곳저곳을 뒤져봤다. “챗봇 만들기 6시간 과정”, “앙상블 모델 따라하기 6시간 과정” 같은 수업들이 여럿 있었고, 인터넷 검색해보니 그런 식으로 짧고 간단하고 만만해 보이는 종류의 수업들이 참 많더라. 좀 양식 있으신 분은 필자에게 질문하는 메일을 쓰면서 가격 할인해달라는 이야기가 아니라, 이 많은 내용을 어떻게 그 짧은 시간에 가르칠 수 있냐고 묻는데, 우리나라의 IT전문 매체라는 타이틀을 달고 있는 회사는 앞 뒤 다 짤라먹고 6시간짜리 단축강의만 해라니…

구글이 직원을 고용해서 도로 위 사진 찍는 이야기하는게 메이저 방송사의 다큐 프로에 버젓이 나오는 마당에 뭘 바라야할까?

인공지능이라는게 예전보다 자동화 시스템이 좀 더 잘 갖춰질 수 있도록 패턴 인식하는 성능이 더 나아진 상황에 불과한데, 온갖 설레발을 다 치면서 직장 잃을거라고 겁이나 주는 언론의 “썰”들을 보면 답답하다. 무슨 러다이트 (Luddite) 운동하는 것 같은 프로그램을 만들게 아니라, 인공지능이라는게 뭔지 좀 정확하게 알려주는 내용들이 등장하고, 자동화하기 어려운 직업을 가질려면 자라나는 학생들이 어떻게 준비해야하는지 같은 좀 발전적인 프로그램은 방송 안 하나?

짧게 한 마디로 필자의 소견을 던지면, 위에 언급한 저 책에서 철학자가 이 정도의 수학, 머신러닝 소양을 갖고 있는 것에 놀라는 것이 아니라, 일반인이 그런 지식을 기본 소양으로 갖출 수 있는 시대가 진짜 4차 산업혁명 시대라고 생각한다.

 

X