2014/11 3

KOMORAN ver 2.4 (자바 한국어 형태소 분석기)

KOMORAN 2.4manual library shineware-common-2.0.jar shineware-ds-1.0.jar data file 주요 업데이트 내용불규칙 사전 정제형태소 분석 시 n-best 분석 결과 제공 기능 추가sample codeString in = "바람과 함께 사라지다를 봤어.";int nbest = 2; List analyzeNbestResult = komoran.analyze(in,nbest);분석 결과best 1바람과 함께 사라지다/NNP+를/JKO보/VV+았/EP+어/EF+./SFbest 2바람과 함께 사라지다/NNP+를/JKO보/VX+았/EP+어/EF+./SF기타어절 단위 n-best 형태소 분석은 분석 대상 문장을 공백 단위로 tokenize하여 어절 단위로 입력불..

Legacy/Library 2014.11.24 (15)

자바 HMM 라이브러리 소스 공개

약 2년전 HMM 라이브러리를 공개한 적이 있습니다. 2년이 지난 지금도 많은 분들이 관련 내용에 대해서 문의를 주십니다. 또한 소스 요청도 종종 받고 있습니다. 이름, 소속 및 사용 용도를 메일로 보내주신 분에 한하여 소스를 드렸습니다. 2년이라는 시간이 흘렀지만 보잘것 없는 라이브러리를 지금도 찾아주셔서 감사하기도 하고 한편으로는 저 자신에게 부끄럽기도 합니다. 용기를 내어서 소스를 공개하고자 합니다. 사용법은 소스 내에 있는 toy example을 참고하시면 될 것 같습니다. 또한 아래 페이지에서도 다운로드 가능합니다. git : https://github.com/shin285/HMM 나름대로 안정화를 많이 시켰지만 부족한 부분이 많이 있습니다. 이와 관련하여 피드백을 주시면 반영하도록 하겠습니다...

Legacy/Shineware 2014.11.13 (1)

EN-POSTA ver 0.5 (자바 영어 형태소 분석기)

자바로 만든 영어 형태소 분석기를 공개합니다. 이름은 EN-POSTA (ENglish POS TAgger) 입니다. 자체 동작 테스트는 완료하였습니다. 아직 안정화 단계에 접어들기 위해선 많은 피드백들이 반영되어야 할 것으로 보입니다. 사용하시다가 불편하신 점이나 이상하다고 느껴지시는 부분에 대해서 알려주시면 바로 반영할 수 있도록 하겠습니다. librarydata file 기본적인 사용법은 아래와 같습니다. public static void main(String[] args) throws Exception { EnPosta posta = new EnPosta(); posta.load("model"); //사용자 사전 추가 posta.appendUserDic("dic.user"); posta.buildF..

Legacy/Library 2014.11.06 (9)