자유게시판


 구글은 여러 모로 IBM이 했던 길을 창조적으로 답습하는 회사라고 생각합니다. 상당히 많은 실험들이 이미 IBM들이 해왔지만 오랜기간동안 정체되어 왔거나 한동안 불가능하다고 생각했던 구글이 해결해왔습니다. IBM 처음 번역하는 프로그램을 만들었을 때 참조했던 것은 캐나다의 법전이었다고 하더군요. 캐나다는 공용어가 영어/프랑스어 이므로 이미 법전 자체가 일종의 참조 언어가 되는 것이지요.


 IBM의 이러한 도전은 실패했는데 많은 사람들이 준거자료로 쓸 자료 자체의 부족을 이야기했다고 합니다. 이에 반해서 구글은 이미 인덱싱이나 분산처리를 통해서 상당히 하드코어한 기술 자체를 이미 획득한 상태에서 사람들이 구글을 통해서 검색하고 찾는 자료들을 통해서 이미 엄청난 분량의 데이터를 획득할 수 있었습니다. IBM과 달리 구글은 인터넷이라는 거대한 데이터 소스에서 끊임없이 자료가 갱신되고 바뀌고 업데이트가 된다는 이야기입니다.


 그로 인해서 다른 것들과는 달리 구글 번역기의 경우 사람들의 검색과 조회가 많아지면 많아질 수록 점점 더 진화하게 됩니다. 제가 들었던 빅데이터 교육의 하나가 텍스트 마이닝이었는데, 데이터 핸들링을 10년 넘게 해왔던 저도 피하고 싶은 것은 텍스트핸들링인데도 전문화된 툴이 이미 많이 있더군요. 알파고처럼 거기서는 많은 준거 자료를 집어넣고 기계에게 학습을 시켜서 자료를 분류하게 하는데, 더많은 인덱스와 자료가 있을 수록 점점 더 정교해집니다.(얼마전 텍스트 핸들링 하면서 다시 이전 자료를 찾아보고 있습니다.)


 처음 구글 번역기를 쓰기 시작한게 제 기억으로 5년 정도 전이었습니다. 그때 같이 일하던 대리님이 구글 번역기 돌린 글로 보고서나 이메일을 써서 놀랐던 적이 있었거든요. 처음 보는 말투가 있길래 했더니, 번역기를 쓴것이더라구요. 그런데 시간이 지날 수록 점점 더 진화하고 한글/영문 공용어 이메일을 주로 쓰는 저에게는 저도 몰랐던 깔끔한 번역과 매끄러운 영어식 표현이 눈에 띄더군요. 언젠가부터 초벌번역은 이미 번역기로 돌리고 번역을 교정해서 쓰는게 더 깔끔하게 변하더군요.


 오늘 동시통역사 분들과 잠깐 이야기를 했는데, 이번 알파고 사건으로 그동안 불가능하다고 생각했던 영역이 완전히 박살났고 다음번은 아마도 번역 부분이 아닐까 한다고 하더군요. 번역이라는 것이 각 영역이 있고 은행 내에서도 카드/은행/리스크/전산/마케팅/재무가 다른 용어를 사용해서 적응하는데 일정 벽이 존재하는데 그런 것조차 데이터만 충분히 있다면 깨질 수 있다는게 그분들의 의견입니다. 뭐 데이터만 충분히 있고 알고리즘과 돈만 있다면, 불가능한 것이 점점 줄어드는 것이죠.


 저는 사업에서 가장 두려운 것이 '불확실성'이라고 배웠고 Risk라는 말조차 "위험"이 아니라 "불확실성"이라고 번역해야 한다고 들었습니다. 점점 더 이러한 불확실성을 확실하게 줄이는 기술이 나오는 것 같습니다. 물론 인간이 방대한 데이터를 만들어줘야만 가능한 것이기는 하겠지만 말이죠.


 만약에 기계학습이나 딥러닝말고 인공지능에 대해서 관심이 있다면 "Person of Interest"라는 미드를 꼭 보세요. 왜 모든 데이터를 모아 놓은 데이터가 무서운지 그리고 선악개념을 가르치고 도덕을 가르치고 통제하는 것이 얼마 어려운 일인지가 거기 나옵니다. 제가 이 분야에서 일하면서 가장 현실적이고 냉정하게 만들었다고 생각하는 드라마입니다. 거기서는 주인공이 처음 인공지능을 만들고 나서 겪은 것이 기계가 통제를 벗어나서 만든 사람 자체를 죽이려고 시도하는 것이었습니다.


  나중에 주인공은 기계(Machine)의 기억을 일일 단위로 소거하고 상당히 많은 기능제한을 두고 나서 겨우 사람 비스무리한 인격으로 만듭니다. 물론 비슷한 생각을 한 천재는 이러한 일을 하지 않았는데, 아주 악독한 인격이 나오는데 "사마리탄"이라고 부릅니다. 회사 발표 시간에 이 드라마 시작 부분을 보여줬을 때 사람들의 반응은 좀 냉소적이었는데, 지금은 심각하게 생각할 수도 있겠네요.




 행복한 주말 되세요. 회사에서 5가 정도 되는 신규 방법론을 도입한다고 해서, 찾아보고 있는데 이 분야에서 일하려면 수학/통계를 좀더 배우지 않으면 사기꾼이 되겠습니다. 기술은 정말 빠르게 발전하는데 저도 빠르게 지치고 늙어간다는 생각이 들고 있습니다. 그리고 SAS뿐만 아니라 R/파이썬을 쓰지 않으면 안되는 시점이 되었네요. R은 그나마 하겠는데 파이썬은 뭐 정신이 하나도 없더라구요. ^^  기술강좌를 들었는데, 뭔가 정신도 없고 R처럼 팩키지 인스톨해서 얹어서 쓰는게 많아서 다른 일반적인 것들과는 달랐네요.


 아, 강의 들어야 하는데 이만 자야겠어요.

번호 제목 작성자 작성일 조회
공지 [공지] KPUG 운영비 모금. 안내 드립니다. - updated 230805Sa [26] KPUG 2023.08.05 8160
공지 [안내의 글] 새로운 운영진 출범 안내드립니다. [15] 맑은하늘 2018.03.30 30781
공지 KPUG에 처음 오신 분들께 고(告)합니다 [100] iris 2011.12.14 441012
29767 [공지] 댓글 알림기능의 위치를 우측하단으로 변경하였습니다. [7] KPUG 07.16 61464
29766 [공지] 금칙어 적용에 대한 투표 결과입니다. [4] KPUG 07.15 60781
29765 Yuandao N10 그리고 N12의 공식케이스 공구들어갑니다. (마감되었습니다..) [39] file 星夜舞人 11.07 56079
29764 제7차 공동구매 시작합니다 (마감되었습니다~) [67] 星夜舞人 11.17 55213
29763 [기기 사용방안?]괜스레 고민만 쌓여 갑니다. [6] 유부총각 10.21 53089
29762 [공지] 댓글알림 기능 투표결과입니다. [5] midday 07.24 52125
29761 소모임의 자료실을 공개로 해놓을까요?? 아니면 회원공개로만 해놓을까요?? [21] 星夜舞人 02.03 51010
29760 다나와 중고장터 [4] matsal 01.25 49319
29759 공동구매 AS는 이렇게 이루어 집니다... [2] 星夜舞人 10.28 45336
29758 KPUG 운영비 계좌 + 모금현황 (최종) [16] 하얀강아지 06.13 41244
29757 [공지] 태파님에 대한 징계를 알려드립니다. [2] KPUG 웹마스터 1호기 07.31 40697
29756 제5차 공동구매 시작합니다... (마감되었습니다.) [51] file 星夜舞人 09.29 40472
29755 100만번째 이벤트 가위바위보 토너먼트 최종결과 그리고 나머지 이야기.. [44] file 星夜舞人 03.22 39871
29754 Gpad를 터치패널 구입합니다. (신청자 리플에 남겨 주세요..) [17] 성야무인 04.22 39036
29753 [알림]4기 운영진 인사드립니다 [20] KPUG 03.12 38654
29752 이북모임 이름 후보작들입니다. [13] 星夜舞人 01.21 37816
29751 서울, 경기, 인천지역에서 키보드 찾아가지 않으신 분들은 이번주 일요일에 노예처럼 부려먹겠습니다. ^^; (일요일 오후 5시부터 6시까지 회기역으로 오세요~~) <---시간 수정 .. 아 그리고 이번에 안찾아 오시는 분들의 경우 무조건 착불로 보냅니다.. 섭섭해 하지 마시기 바랍니다. [20] file 星夜舞人 11.17 36600
29750 KPUG 운영비 모금을 종료합니다. [13] 로켓단® 07.12 34867
29749 댓글 테스트 한번 더... [24] file 인포넷 05.15 34135

오늘:
842
어제:
2,243
전체:
16,258,598