사이트 내부 검색엔진이나 프로그램이 있을까요?
2015.04.09 15:35
질문하시기 전에 게시판 검색을 먼저 해주세요.
타블릿PC, 스마트폰에 관한 질문 또는 요청은 <포터블기기 질문답변> 게시판을 이용해주세요.
=============================================================================================
안녕하세요.
사이트 내에 html 파일을 쌓아서 간단하게 검색을 해보려고 합니다.
구글 맞춤 검색을 찾아보니 일단 구글서버가 크롤링을 해야 맞춤 검색도 가능한 것 같습니다.
사이트 하나 간단하게 만들고 바로 맞춤검색을 적용하니 안되더군요.
사이트 내의 html 텍스트를 검색할 수 있는 엔진이나 프로그램이 있을까요?
코멘트 6
-
나리
04.10 03:47
나모에서 개발한 두레박이라는 프로그램이 있었죠~ -
바보준용군
04.10 10:02
전부 쓸어와서 울트라 에디트... -
유태신
04.10 14:33
말씀하시는 것이 바로, 검색엔진의 기능 중 가장 중요한 text mining 기술이죠.. ㅎㅎ
기본은 그리 어려운 기술이 아니라서 조금한 알아보시면 금방 익히실 수 있는 건데요...
문제는 쌓여가는 html 문서에서 딱 맞는 자료를 찾는 것이 어렵다는 겁니다..
가장 쉬는 것이 하나의 html 문서 안에 찾는 낱말(keyword)이 얼마나 많이 들어있는 가하는 확률로 점수를 매기는 방법인데요.
이 방법도 글의 성격에 따라 꼭 맞는 것은 아니라서 관계어, 유사어 등에 대한 것도 비교하고, 관련 참조 문서와의 연관성 등도 비교하는 등 많은 보강이 필요합니다.
전 97년말에 asp와 vb, javascript 등으로 구현한 기억이 있네요... 워낙 오래 전이지만요.. ㅋㅋ
-
제이크스태덤
04.10 17:53
말씀하시는게 Lucene 아닌가 싶기도 하공...-_-;;;
-
Penguin
04.11 14:08
말씀하시는게 크롤러 같은데요.. -
솔모리
04.16 00:14
htDig ?