KOMORAN ver 1.12 (자바 한글 형태소 분석기)

Legacy/Library

KOMORAN ver 1.12 (자바 한글 형태소 분석기)

shine_ing 2013. 6. 19. 02:40

komoran 1.2(예정)

검색 엔진을 위한 색인기 추가

기존 어절 단위 형태소 분석기 외에 문장 단위 형태소 분석기 추가

komoran1.12

-core library

komoran-1.12.jar

-required library

shineware-common-lib-1.0.jar

-required datas

datas.zip

[version 1.12 history]

score 계산시 발생하던 버그 수정.

- 정확률 향상

n 기호 및 숫자 등을 제외한 순수 한글 어절 ( 약 17만 어절, 33만 형태소 )

u 어절 정확률 : 92.55% -> 93.04%

u 형태소 별 품사 정확률 : 94.97% -> 95.39%

n 기호 및 숫자 등을 포함한 전체 어절 ( 약 20만 어절, 46만 형태소 )

u 어절 정확률 : 84.36% -> 84.80%

u 형태소 별 품사 정확률 90.81% -> 91.20%

[versiong 1.11 history]

왜 1.11을 건너 뛰었지?!?! ㅠㅠ

[version 1.1 history]

고유 명사 약 50만 단어 추가.

- 웹으로 수집 가능한 고유명사 추가

- 한글 위키피디아에 수록된 단어 목록 추가

기타 불규칙 변환 관련된 버그 수정.

사전 추가에 따라 최소 1G 이상의 메모리를 필요로 합니다. (-Xmx1G)

사용법은 1.0 버전 참조.

komoran 1.0

http://shineware.tistory.com/entry/KOMORAN-10

[상업적인 용도로 사용하실 수 없습니다.]

저작자표시 비영리 변경금지

'Legacy > Library' 카테고리의 다른 글

KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기) (51)	2014.08.05
KOMORAN 2.0 beta (7)	2014.07.21
KOMORAN ver 1.1 (자바 한글 형태소 분석기) (10)	2013.06.08
KOMORAN ver 1.0 (자바 한글 형태소 분석기) (17)	2013.05.18
KOMORAN ver 0.6 (자바 한글 형태소 분석기) (6)	2013.04.02

현재글KOMORAN ver 1.12 (자바 한글 형태소 분석기)

To. Me

코모란, KOMORAN 2.0, Hidden Markov Model, 품사태거, 한국어 형태소 분석기, 리눅스, 샤인웨어, shineware, KOMORAN2, 기계학습, 한글 형태소 분석기, 자연어처리, KOMORAN, 형태소분석, 형태소 분석기, Korean POS Tagger, 자바 한국어 형태소 분석기, 자바 형태소 분석기, Hmm, NLP,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

To. Me