스카이넷과 알파고의 차이점
2016.03.10 00:19
저는 경영과 통계 학부전공의 지식을 갖고 있고 금융쪽 분석 경력을 갖고 있습니다. 실제 수학이나 알고리즘 분야는 겉핥기 지식만 갖고 있으며 특정 모델링이나 수학 시뮬레이션 구현도 특정 패키지에서만 가능합니다. 넷플릭스, 아마존, 구글 알고리즘을 설계하고 구현할 수 있는 사람들과 현격한 능력차를 갖고 있습니다.
사람들이 이번 알파고와 이세돌의 바둑승부에 대해서 많이 이야기 합니다. 결론적으로 사람은 기계나 모델링에 대해서 대체가 불가능합니다. 일단 이번의 알고리즘은 그동안 모든 대국을 기억하고 그것을 기계에 학습시켜서 최대한 많은 것을 기억하고 계산한 것입니다. 체스는 바둑에 비해서 훨씬 간단한 룰과 행마로 인해서 1997년 이미 딥블루에게 패했습니다.
그러나 바둑은 여러분들이 아시기에 훨씬 더 많은 경우의 수와 기보를 조회해야 합니다. 구글은 이미 구글 검색에 사용된 기술과 빅데이터의 사실상 표준이 된 하둡 기술의 원천 기술을 가진 회사입니다. 일반인이 생각할 수 있는 거의 모든 수싸움을 기록하고 그것을 측정할 수 있습니다.
경영학에 이런 이야기가 있습니다. 정량적으로 측정할 수 없는 것은 가짜이거나 신의 영역이다. 인터넷이나 애플 아이폰과 같은 혁신은 패러다임과 시장을 바꿀 수 있는 것이며 그게 가능한 것은 파괴적 창조자로 인해서 그런 것이다라구요. 아마존의 AWS나 구글의 검색이 그런 것이겠죠.
그런 면에서 구글 알파고(알파 바둑)은 스카이넷이라기보다는 매트릭스에 가깝습니다. 스카이넷은 폭주하고 인간들을 멸종시키려 하는 프로그래밍적인 성격을 보여줍니다. 인간들이 학습시켰지만 프로그래밍의 범위에서 벗어나지 않고 그 이후는 생각지 못하는 것 말이죠.
매트릭스는 다릅니다. 거기서 새로운 인간과 공존을 위해 노력하고 화해의 몸짓을 보내기도 합니다. 인간의 외교와 협상을 학습한 덕분이죠. 그러나 인간은 공존보다는 인공지능의 절멸을 원했고 전쟁이 시작되지만 인간들을 멸종시키지 않습니다.
왜냐하면 그들은 학습할 데이터가 필요했고 매번 토벌이 끝날 때마다 최초의 자이언 멤버 남녀를 선정해서 새로운 학습데이터셑을 만듭니다. 왜냐하면 기본적으로 데이터가 들어가지 않으면 정체되고 발달을 위해서 인간이 만드는 자료가 필요하기 때문입니다. 기본적으로 기계는 거짓말이나 기세를 할줄 모릅니다, 하는 것 처럼 행동할 뿐이죠. 매트릭스3편 끝부분에서 아키텍트와 오러클이 대화할때, 오러클이 이의를 제기하자 아키텍트가 답변하죠. '내가 인간인줄 아는가? 난 거짓말을 하지 않는다."라고 말이죠.
따라서 기계가 진보하기 위해서는 수학이 아니라 끊임없는 데이터와 측정 불가능한 이상치(천재)들이 필요합니다. 그래야 매트릭스가 운영되는 것이고 니오를 돕는 프로그램인 어라클이 학습 프로그램인 것입니다. 이렇게 보면 선형적인 세게가 아니라 지극히 불안정하고 불확실한 통계의 세계로 들어오게 됩니다.
저는 오늘 많이 충격을 받기는 했는데 이것보다는 제 분야에 대해서 고민했습니다. 저는 기본적으로 딥러닝이나 인공지능에 대해서 회의적이었는데 이제 바둑 수준의 세계에서도 통하게 되었습니다. 현대 통계학의 응용이 지극히 컴퓨팅 파워로 인해서 가능했던 것인데, 사실상 그에 대한 제한이 풀렸다는 것이죠.
제가 시뮬레이션의 세계는 5 레이어만 얹어도 사람도 기계도 죽어버리는데 구글은 그게 잘 정리할 알고리즘만 있다면 얼마든지 가능하다는 것이죠. 물론 바둑과 현실의 차이는 크지만 100만개의 시나리오와 데이터를 시현하는게 이제 가능한 거죠. 이제 돈만 있다면 연산의 한계나 가정은 무의할 수 있다는 거죠.
이런 세계는 10년후에나 올줄 알았는데 몬테카를로 시뮬레이션울 초당 몇 백만개나 돌리는 시스템이 나올줄은 몰랐습니다. 저같이 어설픈 스크립터가 생각하는 것은 가뿐히 넘어서는게 현실 세계인것 같아서 씁쓸하네요.
뉴턴이 말했던 "우리들은 모두 거인(선대의 지식)의 어깨위에서 본다"라는 말씀이 떠오릅니다.
코멘트 12
-
왕초보
03.10 02:32
-
제이크스태덤
03.10 10:06
개발사가 영국이라네요.
-
영진
03.10 15:50
세금문제때문에 영국령 섬같은데 법인세웠겠죠 뭐
-
쿠후^^
03.11 11:26
제가 주어 듣기론, 알파고 맹근 딥마인드란 회사가 영국인이 창업한것이고,(이 영국인이 아주 옛날 테마파크 겜 제작자 더군요. 단 둘이서 맹근건데 그 중 한명이랍니다.) 당연히 이 회사는 영국회사겠고, 나중에 구글이 인수하여 구글 딥마인드로 사명을 변경했나봅니다. 딥마인드는 여전히 본사가 영국에 있으니 알파고도 영국 국적을 달고 나온거 같습니다.
-
종다리
03.10 09:25
앞으로의 알파고의 핵심은 적은 컴퓨팅 파워로 얼마나 빠른 판단이 가능하냐로 초점을 바꿔야겠죠... 이번 첫대국으로 충분한 가능성을 입증했으니 소형화를 해서 해당 알고리즘을 얼마나 적은 컴퓨팅 파워로 운용이 되도록 하는거로 전략을 바꿔야 한다고 봅니다...
-
왕초보
03.10 10:06
빅데이타의 특성상 작은 컴퓨터에서 운용하는 것의 의미는 그리 없다고 봅니다. (어차피 데이타를 다뤄야 하기때문에요) 작은 컴퓨터는 데이타를 서버에 공급하고 계산을 서버에서 해서 작은 컴퓨터에 결과를 보내주는 역할을 하고, 모든 데이타는 한곳에 모여있는 형태가 적당하겠죠. 그래야 데이타도 빨리 모을테니까요. 그러면 컴퓨팅을 줄이는 것보다는 통신을 빠르게 하는 쪽으로 촛점을 맞추는 것이 당분간은 맞을 듯 합니다.
-
종다리
03.10 11:01
아직은 Her같은 개인단말 인공지능은 무리일지도 모르겠네요... 아니면 데이터 부분은 중앙 서버로 두고 가치 판단의 개성을 지닌 가치망의 알고리즘을 최적화 해서 고속 네트워크랑 연결하여 개인 단말에 탑제 하는 방식도 괜찮을지도 모르겠네요
제가 생각한 궁극적 AI는 네트워크 단절형 단독 실행 AI를 생각한거라서 말이죠... 보시기엔 그런게 가능하다고 생각하시나요?
-
왕초보
03.10 16:00
그 단독실행 AI도 엄청난 빅데이타를 갖고있지 않으면, 그냥 조건반사를 학습시킨 기계에 지나지 않겠죠. 가능은 하겠지만 얼마나 쓸모가 있을지 (밥솥 같은 간단한 용도로는 좋겠지만요) 의문입니다. 그렇지만 지금 쓸모가 없을 거라고 생각하는 것은 지금의 기술의 제한때문이고요 엑사바이트를 손에 들고다니는 시절이 온다면 충분히 쓸만 할 겁니다. 빅데이타를 핸드헬드 기기에 캐슁하고 (캐쉬가 엑사바이트면 뭐) 적당히 서버와 통신만 된다면야 충분히 쓸만 할 겁니다.
-
종다리
03.10 16:16
데이터를 스트리밍 하고 추론만 스탠드 얼론이면 근시일내에라도 가능할지도 모르겠네요...
-
왕초보
03.11 01:44
그러려면 빅데이타에서 필요한 데이타만 추려서 스트리밍하는 기술이 시급합니다. ㅠㅜ
-
맑은하늘
03.11 00:53
몬테카를로 많이 들어보고...옆에서 하는데 할줄은 모르네요.
인공지능이 인간을 대치할거라고 생각하지는 않는데..
영화적 상상력은 늘 대비해야된다 생각이 드네요 -
해색주
03.11 15:25
몬테카를로 시뮬레이션을 파이썬이나 R로 코딩을 하는 방법과 그게 아니면 솔루션을 쓰는 방법이 있는데요. 알파고 수준으로 할려고 하면 단순히 프로그래밍을 잘짜서 되는게 아니라, 속도나 의존성 등등을 모두 고려해서 만드는 거죠. 그러한 모든 것을 계산해서 대응하기 위해서 대규모 시스템이 필요하고 구글 정도나 되는 돈+기술+지식을 갖춘 회사에서나 가능한거죠.
뭐 아마존 회사 지하실에서 외계인들을 조져서 알고리즘을 짜내고 있다는 소문이 있기도 합니다. ^^
힘내세요. 빅데이타의 약점은 이게 어떻게 될지는 예측가능하지만 왜 그렇게 되는지는 전혀 모른다는 점입니다. 그래서 가정이 바뀌면 모든 데이타가 오히려 부담이 된다는 것이죠. 예를 들어 전국의 신호등을 최적으로 제어하는 일을 빅데이타로 한다고 합시다. 만약 길 하나의 최고속도가 100km/h에서 무슨 이유에선가 110km/h로 바뀌면.. 전국의 빅데이타가 무용지물이 될 수도 있습니다. 다시 모아야죠.
인간이 하는 일은 좀 많이 다릅니다. 몬테카를로 시뮬레이션이 의미가 있는 것은, 그 결과를 예상할 수 있는 이론이 있기때문입니다. 그게 없으면 아무 의미가 없죠. 뉴톤의 말에서 본다면 빅데이타는 선대의 지식에 불과합니다. 뉴톤이 없으면 빅데이타는 그냥 사과떨어지는 현상일 뿐입니다.
그런데 궁금한게 왜 알파고는 국적이 영국이죠 ?