자유게시판


 구글은 여러 모로 IBM이 했던 길을 창조적으로 답습하는 회사라고 생각합니다. 상당히 많은 실험들이 이미 IBM들이 해왔지만 오랜기간동안 정체되어 왔거나 한동안 불가능하다고 생각했던 구글이 해결해왔습니다. IBM 처음 번역하는 프로그램을 만들었을 때 참조했던 것은 캐나다의 법전이었다고 하더군요. 캐나다는 공용어가 영어/프랑스어 이므로 이미 법전 자체가 일종의 참조 언어가 되는 것이지요.


 IBM의 이러한 도전은 실패했는데 많은 사람들이 준거자료로 쓸 자료 자체의 부족을 이야기했다고 합니다. 이에 반해서 구글은 이미 인덱싱이나 분산처리를 통해서 상당히 하드코어한 기술 자체를 이미 획득한 상태에서 사람들이 구글을 통해서 검색하고 찾는 자료들을 통해서 이미 엄청난 분량의 데이터를 획득할 수 있었습니다. IBM과 달리 구글은 인터넷이라는 거대한 데이터 소스에서 끊임없이 자료가 갱신되고 바뀌고 업데이트가 된다는 이야기입니다.


 그로 인해서 다른 것들과는 달리 구글 번역기의 경우 사람들의 검색과 조회가 많아지면 많아질 수록 점점 더 진화하게 됩니다. 제가 들었던 빅데이터 교육의 하나가 텍스트 마이닝이었는데, 데이터 핸들링을 10년 넘게 해왔던 저도 피하고 싶은 것은 텍스트핸들링인데도 전문화된 툴이 이미 많이 있더군요. 알파고처럼 거기서는 많은 준거 자료를 집어넣고 기계에게 학습을 시켜서 자료를 분류하게 하는데, 더많은 인덱스와 자료가 있을 수록 점점 더 정교해집니다.(얼마전 텍스트 핸들링 하면서 다시 이전 자료를 찾아보고 있습니다.)


 처음 구글 번역기를 쓰기 시작한게 제 기억으로 5년 정도 전이었습니다. 그때 같이 일하던 대리님이 구글 번역기 돌린 글로 보고서나 이메일을 써서 놀랐던 적이 있었거든요. 처음 보는 말투가 있길래 했더니, 번역기를 쓴것이더라구요. 그런데 시간이 지날 수록 점점 더 진화하고 한글/영문 공용어 이메일을 주로 쓰는 저에게는 저도 몰랐던 깔끔한 번역과 매끄러운 영어식 표현이 눈에 띄더군요. 언젠가부터 초벌번역은 이미 번역기로 돌리고 번역을 교정해서 쓰는게 더 깔끔하게 변하더군요.


 오늘 동시통역사 분들과 잠깐 이야기를 했는데, 이번 알파고 사건으로 그동안 불가능하다고 생각했던 영역이 완전히 박살났고 다음번은 아마도 번역 부분이 아닐까 한다고 하더군요. 번역이라는 것이 각 영역이 있고 은행 내에서도 카드/은행/리스크/전산/마케팅/재무가 다른 용어를 사용해서 적응하는데 일정 벽이 존재하는데 그런 것조차 데이터만 충분히 있다면 깨질 수 있다는게 그분들의 의견입니다. 뭐 데이터만 충분히 있고 알고리즘과 돈만 있다면, 불가능한 것이 점점 줄어드는 것이죠.


 저는 사업에서 가장 두려운 것이 '불확실성'이라고 배웠고 Risk라는 말조차 "위험"이 아니라 "불확실성"이라고 번역해야 한다고 들었습니다. 점점 더 이러한 불확실성을 확실하게 줄이는 기술이 나오는 것 같습니다. 물론 인간이 방대한 데이터를 만들어줘야만 가능한 것이기는 하겠지만 말이죠.


 만약에 기계학습이나 딥러닝말고 인공지능에 대해서 관심이 있다면 "Person of Interest"라는 미드를 꼭 보세요. 왜 모든 데이터를 모아 놓은 데이터가 무서운지 그리고 선악개념을 가르치고 도덕을 가르치고 통제하는 것이 얼마 어려운 일인지가 거기 나옵니다. 제가 이 분야에서 일하면서 가장 현실적이고 냉정하게 만들었다고 생각하는 드라마입니다. 거기서는 주인공이 처음 인공지능을 만들고 나서 겪은 것이 기계가 통제를 벗어나서 만든 사람 자체를 죽이려고 시도하는 것이었습니다.


  나중에 주인공은 기계(Machine)의 기억을 일일 단위로 소거하고 상당히 많은 기능제한을 두고 나서 겨우 사람 비스무리한 인격으로 만듭니다. 물론 비슷한 생각을 한 천재는 이러한 일을 하지 않았는데, 아주 악독한 인격이 나오는데 "사마리탄"이라고 부릅니다. 회사 발표 시간에 이 드라마 시작 부분을 보여줬을 때 사람들의 반응은 좀 냉소적이었는데, 지금은 심각하게 생각할 수도 있겠네요.




 행복한 주말 되세요. 회사에서 5가 정도 되는 신규 방법론을 도입한다고 해서, 찾아보고 있는데 이 분야에서 일하려면 수학/통계를 좀더 배우지 않으면 사기꾼이 되겠습니다. 기술은 정말 빠르게 발전하는데 저도 빠르게 지치고 늙어간다는 생각이 들고 있습니다. 그리고 SAS뿐만 아니라 R/파이썬을 쓰지 않으면 안되는 시점이 되었네요. R은 그나마 하겠는데 파이썬은 뭐 정신이 하나도 없더라구요. ^^  기술강좌를 들었는데, 뭔가 정신도 없고 R처럼 팩키지 인스톨해서 얹어서 쓰는게 많아서 다른 일반적인 것들과는 달랐네요.


 아, 강의 들어야 하는데 이만 자야겠어요.

번호 제목 작성자 작성일 조회
공지 [공지] 2025년 KPUG 호스팅 연장 완료 [9] KPUG 2025.08.06 18320
공지 [공지] 중간 업데이트/ 다시한번 참여에 감사 드립니다 [10] KPUG 2025.06.19 39893
공지 [안내의 글] 새로운 운영진 출범 안내드립니다. [15] 맑은하늘 2018.03.30 46883
공지 KPUG에 처음 오신 분들께 고(告)합니다 [100] iris 2011.12.14 473482
29813 토요일 아침 5시에 눈이 떠지다니... [2] update Electra 11.08 18
29812 대만이 온다.. 라는 유튜브를 기다리고 있습니다 [2] 왕초보 11.05 60
29811 서울 본가 TV에 별이 일곱개 생겼다고 합니다 [19] 왕초보 10.28 190
29810 34인치 모니터 질렀습니다. [13] 해색주 10.20 204
29809 이번 추석은 버라이어티 했습니다 [8] file 바보준용군 10.11 365
29808 벌써 추석이네요 [5] file 해색주 10.07 191
29807 강아지 추석빔...2 [11] file 아람이아빠 10.02 213
29806 나랏말싸미 듕국에.... [6] 인간 09.28 243
29805 강아지 추석빔.. [12] file 아람이아빠 09.21 269
29804 집을 질러야 할 것 같습니다. [5] 해색주 09.18 342
29803 테레비를 샀습니다 [17] file 바보준용군 09.11 794
29802 체력이 마이너스이구만요. [8] 해색주 09.08 359
29801 영포티는 모르겠고 [9] file 바보준용군 09.06 804
29800 영포티라고 아시나요? [11] 해색주 08.31 507
29799 그 동안 만든 것들 [8] file 아람이아빠 08.31 331
29798 kpop demon hunters [11] 왕초보 08.28 803
29797 가족의 중요성 [13] 인간 08.19 605
29796 휴가는 잘 다녀오셨나요? [20] 해색주 08.18 452
29795 오아시스 욱일기 논란 [5] 왕초보 08.15 484
29794 몇년만에 자게에 글을 쓰는 중인지 모르겠습니다. [12] Electra 08.14 404

오늘:
7,011
어제:
18,322
전체:
17,986,429