한글로 된 문장들이 유사한지 비교할 수 있는 개념이나 솔루션...Whatever.
2011.03.18 14:06
예를 들어, 어떤 문항의 정답이 있는데, 학생이 입력한 답안이 정답과 유사한지 문장을 비교하려고 합니다.
어떤 방법이 있을까요.
코멘트 4
-
505초보
03.18 14:36
-
지금 원하시는 정도는 현재 불가능합니다.
단순 keyword 매칭이라면 가능하겠지만, 문장 단위로 비교라.. 힘듭니다.
아무리 최신 NLP기술을 쓰더라도 정확도가 실제로 쓰이기에는 거리가 먼 상황입니다.
-
파인애플통조림
03.21 15:29
저 학교다닐때 레포트 제출하면 다른사람이랑 어느정도 유사한지 알려줘서
레포트 배끼기를 찾아주던 싸이트가 있었는데요
얼마나 신뢰할수 있었는지는 모르겠네요...
-
그건 매치되는 단어 정도로 체크했던 기억이 나네요. 유사한걸 찾아주는게 아니라 대놓고 배낀 레포트들을 찾아줬죠.
정확하게는 말씀 못드리겠고 (제가 지식이 부족해서.....)
아마도,
해당 문장에서 조사를 떼어내서 명사화 시킨 다음 단어들을 추출해 두 문장 사이의 일치도를 추출해 내면 될 것 같습니다.
또한 단어끼리의 동질성도 음절이 4개중 3개가 같으면 동일한 단어로 인정해 준다던가 하는 루틴을 넣어주면 어떨까 싶구요.....
예를들면 위의 첫 설명에서 찾아지는 명사들은
해당, 문장, 조사, 명사화, 다음, 단어들, 추출, 문장, 사이, 일치도, 추출
이고 정답문장에서도 같은 작업을 실시해서 얼마나 많은 단어들이 일치하는 가를 찾아내면 되지 않을런지,
정답의 경우는 미리 핵심 단어들을 찾아서 데이터베이스를 만들어 놔도 되겠네요.....
하지만 원하시는 만큼의 정확도를 달성하기는 쉽지 않을 듯 합니다.