티스토리 뷰

KOMORAN 2.1.1


    • 주요 업데이트 내용
      • 연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
        • input : DATE
        • ver 2.1의 분석 결과 : D/SL+A/SL+T/SL+E/SL
        • ver 2.1.1의 분석 결과 : DATE/SL
      • 일부 어절에 대해서 NA로 태깅되던 버그 수정
        • 품사 태거 동작 시 사용되는 score 변경
      • 데이터 정제로 인한 확률 모델 변경
        • 일부 부적절한 사전/품사 정보 제거 ( ㅂ/NNG, ㅑ/NNG 등)
      • 기타 조잡한 버그 수정 및 코드 정리


    • 버전 히스토리
      • [2.1]
        • 형태소 분석기 안정화 및 속도 개선
      • [2.0.4]
        • 띄어쓰기 관련 버그 및 기타 안정화
      • [2.0.3]
        • 사용자 사전 포맷 오류 수정
      • [2.0.1]
        • 분석 중 에러가 발생하는 치명적 오류 수정
      • [2.0.0]
        • komoran 2.0 beta 최초 공개
      • [2.0.0] 미만

자세한 사용법은 하기 링크를 참조하시기 바랍니다.

사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))


KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.


댓글
  • 프로필사진 moai 안녕하세요. 혹시 komoran 형태소 분석기 결과 tag-set을 알 수 있을까요??

    사용자 정의 사전은 정말 유용하게 사용하고 있습니다!!
    좋은 프로그램 제작/공유 정말 감사 드려요!!
    2014.08.18 19:40 신고
  • 프로필사진 shine_ing 세종태그셋을 사용하고 있습니다.
    링크에서 좌측 열에 세종 품사 태그 부분을 참고하시면 될 것 같습니다. 감사합니다! http://kkma.snu.ac.kr/documents/?doc=postag
    2014.08.19 00:17 신고
  • 프로필사진 Geinna 클리앙에서 우연히 발견하여 들어왔습니다. 굉장히 흥미로운 프로그램입니다. 재밌어 보이네요.

    println 방식으로 테스트하기가 약간 어려워보여 간단하게 스윙으로 테스트 도구를 허접하나마 만들어 보았습니다. 조금이나마 테스트에 도움이 되셨으면 좋겠습니다 ^^; 메일 확인해주시면 감사하겠습니다.
    2014.08.20 00:58 신고
  • 프로필사진 shine_ing 감사합니다! 메일 확인 후에 회신드렸습니다. 큰 관심 가져주시고 이렇게 도와주셔서 진심으로 감사드립니다! 큰 도움이 됐습니다^^ 2014.08.20 01:09 신고
  • 프로필사진 lancif NA 관련해서 버그리포팅(?) 하나 드립니다.

    "철수님 11시에 만나요♥"

    라는 문장을 분석했을 때, 이전 버전에서는 "만나요♥" 부분이,

    만나/VV 요/EC ♥/NNP

    라고 분석됐는데, 이번 버전(2.1.1)에서는

    만나요♥/NA

    라고 나오네요.
    확인 부탁드립니다. ^^

    감사합니다!
    2014.08.21 13:11 신고
  • 프로필사진 shine_ing 항상 피드백 주셔서 감사드립니다! ㅎㅎ..혹시 1.x 버전 대비 말씀하시는건가요? 2014.08.21 13:46 신고
  • 프로필사진 shine_ing 아마 금주나 차주 중에 있을 업데이트에 포함시키겠습니다~ 감사합니다! 2014.08.22 01:19 신고
  • 프로필사진 lancif 예. "이전 버전"은 1.x 버전입니다. 2014.08.22 14:38 신고
  • 프로필사진 jsjw 안녕하세요~
    2.1.1 버전에서 종종 아래와 같은 에러로그가
    여러 문장을 루프돌리며 분석메서드를 호출할때 발생합니다.
    에러 발생시 입력되었던 문장만 따로 돌려봤더니 그땐 안뜨구요
    (=.,=) 헐헐헐;

    도움이 되실까 해서 올립니다.
    당시 입력문장에 /NA 태그 걸린건 감사히/NA 였습니다.

    kr.co.shineware.nlp.komoran.a.a: Lattice Parse Answer Format Error. /NA
    at kr.co.shineware.nlp.komoran.core.lattice.Lattice.parseAnswer(Unknown Source)
    at kr.co.shineware.nlp.komoran.core.lattice.Lattice.backTracking(Unknown Source)
    at kr.co.shineware.nlp.komoran.core.lattice.Lattice.getMax(Unknown Source)
    at kr.co.shineware.nlp.komoran.core.analyzer.Komoran.analyze(Unknown Source)
    2014.08.22 14:29 신고
  • 프로필사진 shine_ing 엇! 감사합니다! 음..결과 파싱할 때 나는 에러 같은데..일단 나름대로 한번 잘 찾아보겠습니다만, 실례가 안된다면 오류가 나는 그 분석 데이터를 받아볼 수 있을까요? 2014.08.22 15:33 신고
댓글쓰기 폼