Legacy/Shineware 4

자바 HMM 라이브러리 소스 공개

약 2년전 HMM 라이브러리를 공개한 적이 있습니다. 2년이 지난 지금도 많은 분들이 관련 내용에 대해서 문의를 주십니다. 또한 소스 요청도 종종 받고 있습니다. 이름, 소속 및 사용 용도를 메일로 보내주신 분에 한하여 소스를 드렸습니다. 2년이라는 시간이 흘렀지만 보잘것 없는 라이브러리를 지금도 찾아주셔서 감사하기도 하고 한편으로는 저 자신에게 부끄럽기도 합니다. 용기를 내어서 소스를 공개하고자 합니다. 사용법은 소스 내에 있는 toy example을 참고하시면 될 것 같습니다. 또한 아래 페이지에서도 다운로드 가능합니다. git : https://github.com/shin285/HMM 나름대로 안정화를 많이 시켰지만 부족한 부분이 많이 있습니다. 이와 관련하여 피드백을 주시면 반영하도록 하겠습니다...

Legacy/Shineware 2014.11.13 (1)

[FileUtil] 자바 파일 읽기

위치 kr.peopleware.util.common.file 소스 /** * 입력된 파일의 내용을 라인별 List 형태로 반환 * @param filename 읽어들일 파일 이름 * @param encoding 읽어들일 파일의 인코딩 * @return 파일의 한라인씩 순차적으로 저장된 리스트 */ public static List load2List(String filename,String encoding){ BufferedReader br; List resultList = new ArrayList(); try { br = new BufferedReader(new InputStreamReader(new FileInputStream(filename), encoding)); String line; while ..

Legacy/Shineware 2012.11.06 (2)

자바 HMM 라이브러리

직접 구현한 HMM 라이브러리를 오픈소스로 공개하려 합니다. 사용방법은 첨부된 pdf 파일을 참조해주시기 바랍니다. 개발실력이 거의 없다고 보시면됩니다. 그러나 연구 및 개발을 하는데 있어서 HMM을 잘 모르는데 만들어야하는 고충에 빠지신 분들과 아직 학교에서 연구에 매진중인 미래의 연구자 분들께서 사용하셨으면 좋겠습니다. 문의사항은 이메일이나 댓글로 남겨주시면 확인하는대로 답변드리겠습니다. peopleware-common 라이브러리는 hmm 구동에 필요한 내부 라이브러리로 사용되고 있습니다. 반드시 함께 import하여 사용해주시기 바랍니다. .jar 파일 설명서 https://github.com/shin285/HMM 에 가시면 다운로드 하실 수 있습니다.

Legacy/Shineware 2012.10.31 (20)

형태소 분석기 오픈소스

국내에는 공개적으로 사용가능한 형태소 분석기가 몇개 없습니다. 자연어처리를 전공한 사람으로써 매우 안타깝다고 생각하고 있었습니다. 비록 성능은 좋지 못하지만 기본에 충실한 어절 단위 형태소 분석기를 오픈 소스로 공개하려합니다. 유능한 개발자 분들이 만들어두신 형태소 분석기도 있지만 사전이 잘못 됐는지는 모르겠으나 대부분 명사로 추출되는 경향이 강했습니다. 물론 루씬과 같은 검색기에서 주로 사용되는 품사는 명사류입니다만, 엄연히 말하자면 형태소 분석기와 색인기(명사 추출기)는 다르다고 말씀드리고 싶습니다. 비록 개발능력은 떨어지지만 고전 방식의 형태소 분석기를 제공하도록 하겠습니다. 다양한 분야에서 널리 사용되었으면 하는 작은 바람입니다.

Legacy/Shineware 2012.10.31 (2)