한글과 regex
2011.05.17 10:22
안녕하세요. 냠냠입니다.
노트북을 안 들고 다녀도 될 입장에서...
그럼에도 불구하고 꼭 백팩에 노트북을 들고 다니는 건 사실 작업환경 때문입니다.
저는 주로 cmd 창에서 regex를 쓰는데....
가끔은 shell 을 달리 해서 regex를 쓸 때도 있고.. 심지어는 JRE javaw 를 그대로 이용해서 regex할 때도 있었습니다.
php 를 사용해서도 할 줄은 아는데.. 솔직히 이점이 없어서 쓰지는 않구요. Posix 콘솔에서는 많이 썼었는데..
사실 자바는 할 일이 없었는데.. 가끔 복잡한 한글 매치를 할 때에는 레퍼런스도 많고...
아무래도 뭐 장점이 있어서 어쩔 수 없이 즐겨 썼습니다.
어제 새벽에 잠시 시간이 되어서 powershell 공부를 했었는데.. (이제는 직업상으로 shell을 공부할 필요는 없거든요.)
유니코드는 당연한 거고... 일반 언어페이지에서도 모든 언어를 완벽하게 regex 할 수 있더군요. 별로 신경 안 쓰고도요.
chcp 라던가.. cmd -u 까지도... 그리고 표준출력에 대해서 유니코드 여부 확인 등... 확인할 게 많았었는데.. (문제가 있을 시에..)
이젠 매우 쉽게 다 할 수 있겠더군요.
혹시 새로 Shell을 배울 생각이 있으시다면 용도에 따라 다르겠지만 powershell 강력 추천합니다.
물리학이나 생물학, 유전공학 하시는 분이 극 대량의 Regex 하시는 데는 어울리지 않습니다. (언어 특성상 느리긴 해요.)
대신 엄청 쉽고 빠르죠. 원래 개발을 좀 아시는 분이라면 자기가 알던 지식과 융합해서 꽤 근사하게 고급 regex및 출력 가능합니다.
이게 참...매번 어렵더라구요.
자주 쓰는 것도 아니고...잘 알아두고는 싶은데, 매번 만들수도 없고, 누가 샘플로 만든게 있으면 샘플을 올려두면 좋겠다는 생각을 매번 하게 된다는~ 그래서 탁 고르기만 하면 좋겠던데~