알파고의 등장 이후 고민하는 직종
2016.03.12 01:51
구글은 여러 모로 IBM이 했던 길을 창조적으로 답습하는 회사라고 생각합니다. 상당히 많은 실험들이 이미 IBM들이 해왔지만 오랜기간동안 정체되어 왔거나 한동안 불가능하다고 생각했던 구글이 해결해왔습니다. IBM 처음 번역하는 프로그램을 만들었을 때 참조했던 것은 캐나다의 법전이었다고 하더군요. 캐나다는 공용어가 영어/프랑스어 이므로 이미 법전 자체가 일종의 참조 언어가 되는 것이지요.
IBM의 이러한 도전은 실패했는데 많은 사람들이 준거자료로 쓸 자료 자체의 부족을 이야기했다고 합니다. 이에 반해서 구글은 이미 인덱싱이나 분산처리를 통해서 상당히 하드코어한 기술 자체를 이미 획득한 상태에서 사람들이 구글을 통해서 검색하고 찾는 자료들을 통해서 이미 엄청난 분량의 데이터를 획득할 수 있었습니다. IBM과 달리 구글은 인터넷이라는 거대한 데이터 소스에서 끊임없이 자료가 갱신되고 바뀌고 업데이트가 된다는 이야기입니다.
그로 인해서 다른 것들과는 달리 구글 번역기의 경우 사람들의 검색과 조회가 많아지면 많아질 수록 점점 더 진화하게 됩니다. 제가 들었던 빅데이터 교육의 하나가 텍스트 마이닝이었는데, 데이터 핸들링을 10년 넘게 해왔던 저도 피하고 싶은 것은 텍스트핸들링인데도 전문화된 툴이 이미 많이 있더군요. 알파고처럼 거기서는 많은 준거 자료를 집어넣고 기계에게 학습을 시켜서 자료를 분류하게 하는데, 더많은 인덱스와 자료가 있을 수록 점점 더 정교해집니다.(얼마전 텍스트 핸들링 하면서 다시 이전 자료를 찾아보고 있습니다.)
처음 구글 번역기를 쓰기 시작한게 제 기억으로 5년 정도 전이었습니다. 그때 같이 일하던 대리님이 구글 번역기 돌린 글로 보고서나 이메일을 써서 놀랐던 적이 있었거든요. 처음 보는 말투가 있길래 했더니, 번역기를 쓴것이더라구요. 그런데 시간이 지날 수록 점점 더 진화하고 한글/영문 공용어 이메일을 주로 쓰는 저에게는 저도 몰랐던 깔끔한 번역과 매끄러운 영어식 표현이 눈에 띄더군요. 언젠가부터 초벌번역은 이미 번역기로 돌리고 번역을 교정해서 쓰는게 더 깔끔하게 변하더군요.
오늘 동시통역사 분들과 잠깐 이야기를 했는데, 이번 알파고 사건으로 그동안 불가능하다고 생각했던 영역이 완전히 박살났고 다음번은 아마도 번역 부분이 아닐까 한다고 하더군요. 번역이라는 것이 각 영역이 있고 은행 내에서도 카드/은행/리스크/전산/마케팅/재무가 다른 용어를 사용해서 적응하는데 일정 벽이 존재하는데 그런 것조차 데이터만 충분히 있다면 깨질 수 있다는게 그분들의 의견입니다. 뭐 데이터만 충분히 있고 알고리즘과 돈만 있다면, 불가능한 것이 점점 줄어드는 것이죠.
저는 사업에서 가장 두려운 것이 '불확실성'이라고 배웠고 Risk라는 말조차 "위험"이 아니라 "불확실성"이라고 번역해야 한다고 들었습니다. 점점 더 이러한 불확실성을 확실하게 줄이는 기술이 나오는 것 같습니다. 물론 인간이 방대한 데이터를 만들어줘야만 가능한 것이기는 하겠지만 말이죠.
만약에 기계학습이나 딥러닝말고 인공지능에 대해서 관심이 있다면 "Person of Interest"라는 미드를 꼭 보세요. 왜 모든 데이터를 모아 놓은 데이터가 무서운지 그리고 선악개념을 가르치고 도덕을 가르치고 통제하는 것이 얼마 어려운 일인지가 거기 나옵니다. 제가 이 분야에서 일하면서 가장 현실적이고 냉정하게 만들었다고 생각하는 드라마입니다. 거기서는 주인공이 처음 인공지능을 만들고 나서 겪은 것이 기계가 통제를 벗어나서 만든 사람 자체를 죽이려고 시도하는 것이었습니다.
나중에 주인공은 기계(Machine)의 기억을 일일 단위로 소거하고 상당히 많은 기능제한을 두고 나서 겨우 사람 비스무리한 인격으로 만듭니다. 물론 비슷한 생각을 한 천재는 이러한 일을 하지 않았는데, 아주 악독한 인격이 나오는데 "사마리탄"이라고 부릅니다. 회사 발표 시간에 이 드라마 시작 부분을 보여줬을 때 사람들의 반응은 좀 냉소적이었는데, 지금은 심각하게 생각할 수도 있겠네요.
행복한 주말 되세요. 회사에서 5가 정도 되는 신규 방법론을 도입한다고 해서, 찾아보고 있는데 이 분야에서 일하려면 수학/통계를 좀더 배우지 않으면 사기꾼이 되겠습니다. 기술은 정말 빠르게 발전하는데 저도 빠르게 지치고 늙어간다는 생각이 들고 있습니다. 그리고 SAS뿐만 아니라 R/파이썬을 쓰지 않으면 안되는 시점이 되었네요. R은 그나마 하겠는데 파이썬은 뭐 정신이 하나도 없더라구요. ^^ 기술강좌를 들었는데, 뭔가 정신도 없고 R처럼 팩키지 인스톨해서 얹어서 쓰는게 많아서 다른 일반적인 것들과는 달랐네요.
아, 강의 들어야 하는데 이만 자야겠어요.
코멘트 5
-
왕초보
03.12 02:02
-
해색주
03.12 02:19
지인이 파이썬은 버젼 관리만 제대로 된다면 아주 막강하다는 자랑을 하더군요. R은 통계분야에 특화된 툴이기는 한데, 의외로 다른 언어들과 협력해서 움직이는 경우도 많아요. 예전에 펄/파이썬/루비가 스크립트 언어 3총사라고 했는데 다른 언어들은 좀 잠잠하고 파이썬이 빅데이터나 이런 것들에서는 킹왕짱을 먹더군요.
예전에 비쥬얼라이즈 디스 책에서 보면 스크립트 언어 하나, 통계언어/팩키지 하나, 일반적인 컴파일러 언어 배워두라는 이야기가 있더군요. 배워두면 언젠가 쓸데가 있어진다고 말이죠. R은 대학원에서도 많이 쓰이고 회사에서도 쓸려고 노력하는 것이기는 합니다.
-
영진
03.12 07:06
직종 문제를 넘어서 이제 불을 사용하는 계급과 지배당하는 계급으로 이미 전선은 그어졌고 존코너도 이미 나왔는데
우리가 모르는거죠. 아니 정확히는 알고싶어하지 않는거죠^^
-
퍼슨 오브 인터레스트 저도 재미있게 보는 미드 입니다.
알파고 이야기 나오면서 생각나는 미드가 퍼슨 오브 인터레스트와 배틀스타 갤럭티카 인데 흥미 있는 드라마죠.
인공지능 요즘 너무 호들갑인것 같네요. 컴퓨터의 연산속도가 빨라지면 당연히 결론이 빨리 도출되는 것인데
이미 컴퓨터의 한계는 인간의 능력을 벗어난지 오래 입니다. 아직까지는 인간이 그 기술을 통제하고 있지만..
인공지능이 스스로 생각하고 판단하게 된다면? 절대 그럴 일이 있어서는 안 된다고 봅니다. 기술이 인간의 통제를 벗어나는
순간 어떤 결과가 올지는 아무도 장담 할 수 없으니깐요.
-
제이크스태덤
03.12 11:24
알파고개발자가 구글회장한테 윤리 위원회를 만들어 달라고 했다죠.
이 말 듣고 이 놈 진짜 제대로 사고 쳤구나....싶던데요.
대단하세요. 저도 암것도 모르지만 R은 통계분야에 특화된 툴이라면 파이썬은 아무데나 쓸 수 있는 스위스아미나이프라, R이 체스라면 파이썬은 바둑 정도이거나 더 큰 차이가 있다고 보시면 될 겁니다. 그렇지만 전체를 다 알아야 쓸 수 있는 것은 아니죠. 파이썬도 사실 거의 종교급인데, 그 종교에 귀의한 분들 얘기는, 창시자가 타임머신이 있거나 신일 거라는 얘기를 합니다. ^^
나보다 나은 넘이 있을지 모른다 라는 생각을 못하는 AI는 아직 시작도 못한 AI라고 생각합니다.