자유게시판


 구글은 여러 모로 IBM이 했던 길을 창조적으로 답습하는 회사라고 생각합니다. 상당히 많은 실험들이 이미 IBM들이 해왔지만 오랜기간동안 정체되어 왔거나 한동안 불가능하다고 생각했던 구글이 해결해왔습니다. IBM 처음 번역하는 프로그램을 만들었을 때 참조했던 것은 캐나다의 법전이었다고 하더군요. 캐나다는 공용어가 영어/프랑스어 이므로 이미 법전 자체가 일종의 참조 언어가 되는 것이지요.


 IBM의 이러한 도전은 실패했는데 많은 사람들이 준거자료로 쓸 자료 자체의 부족을 이야기했다고 합니다. 이에 반해서 구글은 이미 인덱싱이나 분산처리를 통해서 상당히 하드코어한 기술 자체를 이미 획득한 상태에서 사람들이 구글을 통해서 검색하고 찾는 자료들을 통해서 이미 엄청난 분량의 데이터를 획득할 수 있었습니다. IBM과 달리 구글은 인터넷이라는 거대한 데이터 소스에서 끊임없이 자료가 갱신되고 바뀌고 업데이트가 된다는 이야기입니다.


 그로 인해서 다른 것들과는 달리 구글 번역기의 경우 사람들의 검색과 조회가 많아지면 많아질 수록 점점 더 진화하게 됩니다. 제가 들었던 빅데이터 교육의 하나가 텍스트 마이닝이었는데, 데이터 핸들링을 10년 넘게 해왔던 저도 피하고 싶은 것은 텍스트핸들링인데도 전문화된 툴이 이미 많이 있더군요. 알파고처럼 거기서는 많은 준거 자료를 집어넣고 기계에게 학습을 시켜서 자료를 분류하게 하는데, 더많은 인덱스와 자료가 있을 수록 점점 더 정교해집니다.(얼마전 텍스트 핸들링 하면서 다시 이전 자료를 찾아보고 있습니다.)


 처음 구글 번역기를 쓰기 시작한게 제 기억으로 5년 정도 전이었습니다. 그때 같이 일하던 대리님이 구글 번역기 돌린 글로 보고서나 이메일을 써서 놀랐던 적이 있었거든요. 처음 보는 말투가 있길래 했더니, 번역기를 쓴것이더라구요. 그런데 시간이 지날 수록 점점 더 진화하고 한글/영문 공용어 이메일을 주로 쓰는 저에게는 저도 몰랐던 깔끔한 번역과 매끄러운 영어식 표현이 눈에 띄더군요. 언젠가부터 초벌번역은 이미 번역기로 돌리고 번역을 교정해서 쓰는게 더 깔끔하게 변하더군요.


 오늘 동시통역사 분들과 잠깐 이야기를 했는데, 이번 알파고 사건으로 그동안 불가능하다고 생각했던 영역이 완전히 박살났고 다음번은 아마도 번역 부분이 아닐까 한다고 하더군요. 번역이라는 것이 각 영역이 있고 은행 내에서도 카드/은행/리스크/전산/마케팅/재무가 다른 용어를 사용해서 적응하는데 일정 벽이 존재하는데 그런 것조차 데이터만 충분히 있다면 깨질 수 있다는게 그분들의 의견입니다. 뭐 데이터만 충분히 있고 알고리즘과 돈만 있다면, 불가능한 것이 점점 줄어드는 것이죠.


 저는 사업에서 가장 두려운 것이 '불확실성'이라고 배웠고 Risk라는 말조차 "위험"이 아니라 "불확실성"이라고 번역해야 한다고 들었습니다. 점점 더 이러한 불확실성을 확실하게 줄이는 기술이 나오는 것 같습니다. 물론 인간이 방대한 데이터를 만들어줘야만 가능한 것이기는 하겠지만 말이죠.


 만약에 기계학습이나 딥러닝말고 인공지능에 대해서 관심이 있다면 "Person of Interest"라는 미드를 꼭 보세요. 왜 모든 데이터를 모아 놓은 데이터가 무서운지 그리고 선악개념을 가르치고 도덕을 가르치고 통제하는 것이 얼마 어려운 일인지가 거기 나옵니다. 제가 이 분야에서 일하면서 가장 현실적이고 냉정하게 만들었다고 생각하는 드라마입니다. 거기서는 주인공이 처음 인공지능을 만들고 나서 겪은 것이 기계가 통제를 벗어나서 만든 사람 자체를 죽이려고 시도하는 것이었습니다.


  나중에 주인공은 기계(Machine)의 기억을 일일 단위로 소거하고 상당히 많은 기능제한을 두고 나서 겨우 사람 비스무리한 인격으로 만듭니다. 물론 비슷한 생각을 한 천재는 이러한 일을 하지 않았는데, 아주 악독한 인격이 나오는데 "사마리탄"이라고 부릅니다. 회사 발표 시간에 이 드라마 시작 부분을 보여줬을 때 사람들의 반응은 좀 냉소적이었는데, 지금은 심각하게 생각할 수도 있겠네요.




 행복한 주말 되세요. 회사에서 5가 정도 되는 신규 방법론을 도입한다고 해서, 찾아보고 있는데 이 분야에서 일하려면 수학/통계를 좀더 배우지 않으면 사기꾼이 되겠습니다. 기술은 정말 빠르게 발전하는데 저도 빠르게 지치고 늙어간다는 생각이 들고 있습니다. 그리고 SAS뿐만 아니라 R/파이썬을 쓰지 않으면 안되는 시점이 되었네요. R은 그나마 하겠는데 파이썬은 뭐 정신이 하나도 없더라구요. ^^  기술강좌를 들었는데, 뭔가 정신도 없고 R처럼 팩키지 인스톨해서 얹어서 쓰는게 많아서 다른 일반적인 것들과는 달랐네요.


 아, 강의 들어야 하는데 이만 자야겠어요.

번호 제목 작성자 작성일 조회
공지 [공지] KPUG 운영비 모금. 안내 드립니다. - updated 230805Sa [26] KPUG 2023.08.05 8161
공지 [안내의 글] 새로운 운영진 출범 안내드립니다. [15] 맑은하늘 2018.03.30 30782
공지 KPUG에 처음 오신 분들께 고(告)합니다 [100] iris 2011.12.14 441012
29768 소소한 지름들 [7] 해색주 05.04 154
29767 펌/ 무거운 침묵 by 추미애 [4] file 맑은하늘 05.04 106
29766 시민들이 모여있네요. 조국 장관 이후.오랜만에 서초역 왔네요 [8] 맑은하늘 05.03 116
29765 비가 오네요. [2] 해색주 05.01 111
29764 손수건 만들기.. [10] file 아람이아빠 04.28 142
29763 추천 가전제품 (비데랑 정수기) [4] file minkim 04.19 303
29762 오랜만에 등산화 신고 천마산역 가는길이네요 [9] 맑은하늘 04.13 613
29761 10년 넘어서 노트북 바꿨습니다. [15] file matsal 04.12 631
29760 전 이 시국에 미싱.. 갤럭시탭 케이스 리폼.. [2] file 아람이아빠 04.11 576
29759 이 시국에 팜 =) [7] 왕초보 04.11 581
29758 윤석렬 대통령 파면 [11] 해색주 04.04 585
29757 Palm M505/M515 [7] 라이카 04.04 282
29756 현재 00시 27분 시민들과 안국역에 있네요 [10] file 맑은하늘 04.04 258
29755 희망은 있는걸까요 ? Hope... [18] 맑은하늘 04.03 295
29754 항상 집이 쵝오 라고 느끼는 이유가 [13] file 바보준용군 03.31 339
29753 털찐 강아지..새 옷 입고.. [9] file 아람이아빠 03.28 294
29752 경북 산불이 엄청나네요. [6] 왕초보 03.26 337
29751 연금 개혁에 말이 많군요. [6] 해색주 03.22 326
29750 살다보니 이런 날도 오는군요. [17] 해색주 03.20 335
29749 하하하 제감자탕 뼉다구가 말입니다 [16] 바보준용군 03.20 303

오늘:
1,009
어제:
2,243
전체:
16,258,765