티스토리 뷰

KOMORAN 2.2


    • 주요 업데이트 내용
      • 일부 문장 분석 시 특정 로그가 출력되는 현상 제거
      • 형태소 분석 시 공백 포함/미포함 분석 기능 추가
        • 공백 포함 분석(2.2 이전 버전과 동일한 메소드 사용)
          • sample code
            • String in="바람과 함께 사라지다를 봤어.";            

              List<List<Pair<String,String>>> analyzeResultList = komoran.analyze(in);

          • 분석 결과

            • 바람과 함께 사라지다/NNP+를/JKO

              보/VV+았/EP+어/EF+./SF

        • 공백 미포함 분석(2.2 버전 신규 메소드)

          • sample code

            • String in="바람과 함께 사라지다를 봤어.";            

              List<List<Pair<String,String>>> analyzeResultList = komoran.analyzeWithoutSpace(in);

          • 분석 결과

            • 바람/NNG+과/JC

              함께/MAG

              사라지/VV+다/EC+를/JKO

              보/VV+았/EP+어/EF+./SF

    • 버전 히스토리
      • [2.1.2]
        • 사용자 환경에 따른 용량별 데이터 제공
        • 조사 결합 규칙 적용
        • 연결 어미 품사 확장
        • 기타 버그 수정
      • [2.1.1]
        • 연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
        • 버그 수정 및 안정화
      • [2.1]
        • 형태소 분석기 안정화 및 속도 개선
      • [2.0.4]
        • 띄어쓰기 관련 버그 및 기타 안정화
      • [2.0.3]
        • 사용자 사전 포맷 오류 수정
      • [2.0.1]
        • 분석 중 에러가 발생하는 치명적 오류 수정
      • [2.0.0]
        • komoran 2.0 beta 최초 공개
      • [2.0.0] 미만

자세한 사용법은 하기 링크를 참조하시기 바랍니다.

사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))


KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.


댓글
  • 프로필사진 얍얍 위에있는 프로그램 다섯개 다운받은다음에 어떻게 해야 되나요...?
    도저히 사용법을봐도..잘 이해가 안가네요
    2014.09.18 19:48 신고
  • 프로필사진 shine_ing 완전한 프로그램이 아닌 자바 라이브러리 형태입니다. 자바 프로그래밍에 대한 이해가 있으셔야 사용이 가능하십니다. 프로그래밍과 관련 없이 사용할 수 있도록 완전한 프로그램을 조만간 추가하도록 하겠습니다. 불편을 드려서 죄송합니다.. 2014.09.24 00:57 신고
  • 프로필사진 권순재 버그 리포트 할게요
    큰따옴표와 작은따옴표의 대표적인 용례를 소개해 주세요.
    [큰따옴표 NNP, 작은따옴표 NNP, 대표 NNG, 적 XSN, 이 VCP, ㄴ ETM, 용례 NNG, 소개 NNG, 하 XSV, 아 EC, 주 VX, 시 EP]
    큰따옴표 같은 경우 큰따옴표 NNP <- 요런식으로 잡히네용
    2014.09.19 14:17 신고
  • 프로필사진 shine_ing models-full과 같은 경우에는 위키피디아에 있는 제목들이 고유명사로 추가되었습니다. 그 과정에서 말씀하신 큰따옴표가 위키페이지에 존재하여 고유명사로 인식되는 것을 확인하였습니다. 이 부분은 위키피디아 데이터를 검수하여 수정하도록 하겠습니다. models-light 버전을 사용하시면 큰따옴표가 NNP로 분석되지 않을 것입니다^^ 감사합니다. 2014.09.24 01:00 신고
  • 프로필사진 lancif 코모란 매번 잘 쓰고 있습니다. ^^
    저도 버그리포트 하나 할게요.

    입력: 않을게요
    출력: 않/VX 으시/EP ㄹ게요/EC

    여기서 '으시'가 잘못나온것 같아요. '시'가 빠져야할것 같아요
    2014.09.24 14:28 신고
  • 프로필사진 shine_ing 불규칙 사전에 잘못된 정보가 있는 것 같네요~ 업데이트 시 반드시 반영하도록 하겠습니디ㅏ. 감사합니다! 2014.09.24 15:20 신고
  • 프로필사진 lancif 질문하나 더 드릴게요. ^^

    입력: 가능
    출력: 가능/XR

    이렇게 나오는데요, 이것도 버그인가요?
    아니면, XR('어근' 맞나요?)로 나오는게 맞는건가요?
    2014.09.25 16:40 신고
  • 프로필사진 shine_ing 글쎄요..어근이라는 품사 자체가 매우 애매한 부분이죠..학습한 데이터를 살펴보니 어근이라고 태깅되어 있네요^^ 개인적으로 어근이라는 태그를 명사로 변경할까 생각중입니다..애매하죠 참..ㅎㅎ 2014.09.25 16:45 신고
  • 프로필사진 lancif 그렇군요. 감사합니다 ^^ 2014.09.25 17:33 신고
  • 프로필사진 lancif 버그 리포트 하나 더 드립니다. ^^

    입력: 주셔요
    출력: 어/EC 주/VX 시/EP 어요/EC
    2014.09.29 11:07 신고
  • 프로필사진 shine_ing 정말 감사드립니다! 사실 이런 부분은 학습데이터 자체에 의한 버그라서 정말 찾기 힘든 부분인데.. 진심으로 감사드립니다! 2014.09.29 13:13 신고
  • 프로필사진 lancif 저야 말로, 좋은 형태소분석기 만들어주셔서 감사합니다 ^^ 2014.09.29 14:02 신고
댓글쓰기 폼