KOMORAN ver 2.4 (자바 한국어 형태소 분석기)

Legacy/Library

KOMORAN ver 2.4 (자바 한국어 형태소 분석기)

shine_ing 2014. 11. 24. 02:49

KOMORAN 2.4

manual

komoran_2.0_manual(ver_2.4).pdf

library

data file

주요 업데이트 내용

불규칙 사전 정제
형태소 분석 시 n-best 분석 결과 제공 기능 추가

sample code

String in = "바람과 함께 사라지다를 봤어.";
int nbest = 2;

List<List<List<Pair<String,String>>>> analyzeNbestResult = komoran.analyze(in,nbest);

분석 결과

best 1

바람과 함께 사라지다/NNP+를/JKO
보/VV+았/EP+어/EF+./SF

best 2

바람과 함께 사라지다/NNP+를/JKO
보/VX+았/EP+어/EF+./SF

기타

어절 단위 n-best 형태소 분석은 분석 대상 문장을 공백 단위로 tokenize하여 어절 단위로 입력

불규칙 사전 빌드 및 처리 방식 변경에 따른 성능 개선

기호 및 숫자 등을 제외한 순수 한글 어절

어절 정확률 : 93.37% -> 93.60%
형태소 별 품사 정확률 : 95.62% -> 95.88%

기호 및 숫자 등을 포함한 전체 어절

어절 정확률 : 91.59% -> 92.12%
형태소 별 품사 정확률 : 95.06% -> 95.36%

버전 히스토리

[2.3]

학습 데이터 정제

[2.2]

불용 로그 제거
공백 미포함 형태소 분석 기능 추가

[2.1.2]

사용자 환경에 따른 용량별 데이터 제공
조사 결합 규칙 적용
연결 어미 품사 확장
기타 버그 수정

[2.1.1]

연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
버그 수정 및 안정화

[2.1]

형태소 분석기 안정화 및 속도 개선

[2.0.4]

띄어쓰기 관련 버그 및 기타 안정화

[2.0.3]

사용자 사전 포맷 오류 수정

[2.0.1]

분석 중 에러가 발생하는 치명적 오류 수정

[2.0.0]

komoran 2.0 beta 최초 공개

[2.0.0] 미만

링크 참조 - history

자세한 사용법은 하기 링크 또는 첨부된 메뉴얼을 참조하시기 바랍니다.

- 사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))

- 데모 사이트

KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.

저작자표시 비영리 변경금지

'Legacy > Library' 카테고리의 다른 글

KOMORAN ver 2.4 for python3 (8)	2014.12.26
KOMORAN 2.x 라이센스 변경 공지 (42)	2014.12.08
EN-POSTA ver 0.5 (자바 영어 형태소 분석기) (10)	2014.11.06
KOMORAN ver 2.3 (자바 한국어 형태소 분석기) (16)	2014.09.29
KOMORAN ver 2.2 (자바 한국어 형태소 분석기) (12)	2014.09.12

현재글KOMORAN ver 2.4 (자바 한국어 형태소 분석기)

To. Me

형태소분석, NLP, 자바 한국어 형태소 분석기, Hmm, KOMORAN, Hidden Markov Model, 한국어 형태소 분석기, 기계학습, 품사태거, 한글 형태소 분석기, Korean POS Tagger, 자연어처리, 리눅스, 형태소 분석기, 코모란, KOMORAN2, 샤인웨어, KOMORAN 2.0, 자바 형태소 분석기, shineware,

Today :
Yesterday :

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

To. Me

KOMORAN ver 2.4 (자바 한국어 형태소 분석기)

'Legacy > Library' 카테고리의 다른 글

'Legacy/Library'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

2025. 04
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

KOMORAN ver 2.4 (자바 한국어 형태소 분석기)

'Legacy > Library' 카테고리의 다른 글

'Legacy/Library'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역