BLOG main image
분류 전체보기 (46)
Life (4)
Computer Science (3)
Programming (6)
Opensource (6)
Project (17)
Tip (10)
artikel terbaru. berita tekno..
artikel terbaru. berita tekno..
Best way to develop a mobile a..
Best way to develop a mobile a..
117,636 Visitors up to today!
Today 15 hit, Yesterday 39 hit
daisy rss
tistory 티스토리 가입하기!
2014.08.18 18:06

KOMORAN 2.1.1


    • 주요 업데이트 내용
      • 연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
        • input : DATE
        • ver 2.1의 분석 결과 : D/SL+A/SL+T/SL+E/SL
        • ver 2.1.1의 분석 결과 : DATE/SL
      • 일부 어절에 대해서 NA로 태깅되던 버그 수정
        • 품사 태거 동작 시 사용되는 score 변경
      • 데이터 정제로 인한 확률 모델 변경
        • 일부 부적절한 사전/품사 정보 제거 ( ㅂ/NNG, ㅑ/NNG 등)
      • 기타 조잡한 버그 수정 및 코드 정리


    • 버전 히스토리
      • [2.1]
        • 형태소 분석기 안정화 및 속도 개선
      • [2.0.4]
        • 띄어쓰기 관련 버그 및 기타 안정화
      • [2.0.3]
        • 사용자 사전 포맷 오류 수정
      • [2.0.1]
        • 분석 중 에러가 발생하는 치명적 오류 수정
      • [2.0.0]
        • komoran 2.0 beta 최초 공개
      • [2.0.0] 미만

자세한 사용법은 하기 링크를 참조하시기 바랍니다.

사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))


KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.


저작자 표시 비영리 변경 금지
신고
moai | 2014.08.18 19:40 신고 | PERMALINK | EDIT/DEL | REPLY
안녕하세요. 혹시 komoran 형태소 분석기 결과 tag-set을 알 수 있을까요??

사용자 정의 사전은 정말 유용하게 사용하고 있습니다!!
좋은 프로그램 제작/공유 정말 감사 드려요!!
shine_ing | 2014.08.19 00:17 신고 | PERMALINK | EDIT/DEL
세종태그셋을 사용하고 있습니다.
링크에서 좌측 열에 세종 품사 태그 부분을 참고하시면 될 것 같습니다. 감사합니다! http://kkma.snu.ac.kr/documents/?doc=postag
Geinna | 2014.08.20 00:58 신고 | PERMALINK | EDIT/DEL | REPLY
클리앙에서 우연히 발견하여 들어왔습니다. 굉장히 흥미로운 프로그램입니다. 재밌어 보이네요.

println 방식으로 테스트하기가 약간 어려워보여 간단하게 스윙으로 테스트 도구를 허접하나마 만들어 보았습니다. 조금이나마 테스트에 도움이 되셨으면 좋겠습니다 ^^; 메일 확인해주시면 감사하겠습니다.
shine_ing | 2014.08.20 01:09 신고 | PERMALINK | EDIT/DEL
감사합니다! 메일 확인 후에 회신드렸습니다. 큰 관심 가져주시고 이렇게 도와주셔서 진심으로 감사드립니다! 큰 도움이 됐습니다^^
lancif | 2014.08.21 13:11 신고 | PERMALINK | EDIT/DEL | REPLY
NA 관련해서 버그리포팅(?) 하나 드립니다.

"철수님 11시에 만나요♥"

라는 문장을 분석했을 때, 이전 버전에서는 "만나요♥" 부분이,

만나/VV 요/EC ♥/NNP

라고 분석됐는데, 이번 버전(2.1.1)에서는

만나요♥/NA

라고 나오네요.
확인 부탁드립니다. ^^

감사합니다!
shine_ing | 2014.08.21 13:46 신고 | PERMALINK | EDIT/DEL
항상 피드백 주셔서 감사드립니다! ㅎㅎ..혹시 1.x 버전 대비 말씀하시는건가요?
shine_ing | 2014.08.22 01:19 신고 | PERMALINK | EDIT/DEL
아마 금주나 차주 중에 있을 업데이트에 포함시키겠습니다~ 감사합니다!
lancif | 2014.08.22 14:38 신고 | PERMALINK | EDIT/DEL
예. "이전 버전"은 1.x 버전입니다.
jsjw | 2014.08.22 14:29 신고 | PERMALINK | EDIT/DEL | REPLY
안녕하세요~
2.1.1 버전에서 종종 아래와 같은 에러로그가
여러 문장을 루프돌리며 분석메서드를 호출할때 발생합니다.
에러 발생시 입력되었던 문장만 따로 돌려봤더니 그땐 안뜨구요
(=.,=) 헐헐헐;

도움이 되실까 해서 올립니다.
당시 입력문장에 /NA 태그 걸린건 감사히/NA 였습니다.

kr.co.shineware.nlp.komoran.a.a: Lattice Parse Answer Format Error. /NA
at kr.co.shineware.nlp.komoran.core.lattice.Lattice.parseAnswer(Unknown Source)
at kr.co.shineware.nlp.komoran.core.lattice.Lattice.backTracking(Unknown Source)
at kr.co.shineware.nlp.komoran.core.lattice.Lattice.getMax(Unknown Source)
at kr.co.shineware.nlp.komoran.core.analyzer.Komoran.analyze(Unknown Source)
shine_ing | 2014.08.22 15:33 신고 | PERMALINK | EDIT/DEL
엇! 감사합니다! 음..결과 파싱할 때 나는 에러 같은데..일단 나름대로 한번 잘 찾아보겠습니다만, 실례가 안된다면 오류가 나는 그 분석 데이터를 받아볼 수 있을까요?
Name
Password
Homepage
Secret

티스토리 툴바