Legacy/Shineware

형태소 분석기 오픈소스

shine_ing 2012. 10. 31. 03:28

국내에는 공개적으로 사용가능한 형태소 분석기가 몇개 없습니다.


자연어처리를 전공한 사람으로써 매우 안타깝다고 생각하고 있었습니다.


비록 성능은 좋지 못하지만 기본에 충실한 어절 단위 형태소 분석기를 오픈 소스로 공개하려합니다.


유능한 개발자 분들이 만들어두신 형태소 분석기도 있지만


사전이 잘못 됐는지는 모르겠으나 대부분 명사로 추출되는 경향이 강했습니다.


물론 루씬과 같은 검색기에서 주로 사용되는 품사는 명사류입니다만,


엄연히 말하자면 형태소 분석기와 색인기(명사 추출기)는 다르다고 말씀드리고 싶습니다.


비록 개발능력은 떨어지지만 고전 방식의 형태소 분석기를 제공하도록 하겠습니다.


다양한 분야에서 널리 사용되었으면 하는 작은 바람입니다.

'Legacy > Shineware' 카테고리의 다른 글

자바 HMM 라이브러리 소스 공개  (1) 2014.11.13
[FileUtil] 자바 파일 읽기  (2) 2012.11.06
자바 HMM 라이브러리  (20) 2012.10.31