KOMORAN 15

KOMORAN ver 1.12 (자바 한글 형태소 분석기)

komoran 1.2(예정)검색 엔진을 위한 색인기 추가기존 어절 단위 형태소 분석기 외에 문장 단위 형태소 분석기 추가 komoran1.12-core library -required library shineware-common-lib-1.0.jar -required datas [version 1.12 history]score 계산시 발생하던 버그 수정.- 정확률 향상n 기호 및 숫자 등을 제외한 순수 한글 어절 ( 약 17만 어절, 33만 형태소 )u 어절 정확률 : 92.55% -> 93.04%u 형태소 별 품사 정확률 : 94.97% -> 95.39%n 기호 및 숫자 등을 포함한 전체 어절 ( 약 20만 어절, 46만 형태소 )u 어절 정확률 : 84.36% -> 84.80%u 형태소 별 품사 정확..

Legacy/Library 2013.06.19 (29)

KOMORAN ver 1.1 (자바 한글 형태소 분석기)

komoran 1.2(예정)검색 엔진을 위한 색인기 추가기존 어절 단위 형태소 분석기 외에 문장 단위 형태소 분석기 추가 komoran 1.1-core library-required library-required data files 고유 명사 약 50만 단어 추가.- 웹으로 수집 가능한 고유명사 추가- 한글 위키피디아에 수록된 단어 목록 추가기타 불규칙 변환 관련된 버그 수정.사전 추가에 따라 최소 1G 이상의 메모리를 필요로 합니다. (-Xmx1G)사용법은 1.0 버전 참조. komoran 1.0http://shineware.tistory.com/entry/KOMORAN-10

Legacy/Library 2013.06.08 (10)

KOMORAN ver 1.0 (자바 한글 형태소 분석기)

1. KOMORAN? KOMORAN은 SHINEWARE SOFT에서 제작한 한국어 형태소 분석기로서 자바 라이브러리 형태(.jar)로 제공됩니다. KOMORAN은 기존 형태소 분석기의 연구 결과들을 바탕으로 하여 ‘속도’, ‘성능’, ‘사전 관리 비용’에서 가장 우수한 성능을 낼 수 있도록 설계되었습니다. 2. KOMORAM 특징 KOMORAN은 자소 단위, 확률 기반의 형태소 분석기 입니다. 속도, 성능, 사전 관리 측면에서 기존 형태소 분석기와 차별되는 특징은 아래와 같습니다. - 속도 n Hash 기반의 파싱 방법을 적용하여 한글 분석 속도 향상 n TRIE 기반의 사전 구성으로 사전 재탐색 횟수를 최소화하여 사전 탐색 속도 향상 n KOMORAN 내부의 자료형(Data Type)을 대부분 정수(I..

Legacy/Library 2013.05.18 (17)

KOMORAN ver 0.6 (자바 한글 형태소 분석기)

한글 형태소 분석기 KOMORAN 0.6 버전을 공개합니다. 네이밍과 관련하여 몇몇 분의 문의를 주셨는데, KOMORAN은 KOrean MORphological ANalyzer의 약자입니다. 버전업 주요 히스토리 ver 0.6 - 기존 0.5 버전 ( 링크 )에 기분석 사전을 추가하였습니다.- 기분석 사전 추가로 인해 분석 속도가 2배 가량 빨라졌습니다. (sec 당 200kb 분석)- VM는 최소 512mb를 필요로 합니다. ( -Xms512m -Xmx512m ) 형태소 분석 Core 라이브러리 파일 형태소 분석 라이브러리 내 사용되는 유틸성 라이브러리필요 라이브러리 파일 사용법은 ver 0.5와 같습니다. ( 링크 ) 본 형태소 분석기는 상업적 용도의 사용을 금지합니다. (안정성 검증 필요, 별도 연..

Legacy/Library 2013.04.02 (6)

KOMORAN ver 0.5 (자바 한글 형태소 분석기)

자바로 만든 한글 형태소 분석기를 공개합니다. 이름은 KOMORAN입니다. 현재 자체 테스트는 완료하였습니다. 기본적인 어절 단위 형태소 분석기를 따르고 있습니다. (sec 당 약 100kb 분석) 사용 중 발생하는 에러는 댓글로 부탁드립니다. 필요한 라이브러리 파일은 아래와 같습니다.형태소 분석 core 라이브러리 형태소 분석 라이브러리 내 사용된 유틸성 라이브러리 분석에 필요한 모델 파일들은 아래와 같습니다. 사용법은 아래와 같습니다. public static void main(String[] args) { MorphologyAnalyzer analyzer = new MorphologyAnalyzer("형태소 분석용 파일들이 저장된 루트 폴더"); Listreslut = analyzer.analyze..

Legacy/Library 2013.03.19 (13)