BLOG main image
분류 전체보기 (46)
Life (4)
Computer Science (3)
Programming (6)
Opensource (6)
Project (17)
Tip (10)
artikel terbaru. berita tekno..
artikel terbaru. berita tekno..
Best way to develop a mobile a..
Best way to develop a mobile a..
123,594 Visitors up to today!
Today 8 hit, Yesterday 36 hit
daisy rss
tistory 티스토리 가입하기!
2014.09.12 10:21

KOMORAN 2.2


    • 주요 업데이트 내용
      • 일부 문장 분석 시 특정 로그가 출력되는 현상 제거
      • 형태소 분석 시 공백 포함/미포함 분석 기능 추가
        • 공백 포함 분석(2.2 이전 버전과 동일한 메소드 사용)
          • sample code
            • String in="바람과 함께 사라지다를 봤어.";            

              List<List<Pair<String,String>>> analyzeResultList = komoran.analyze(in);

          • 분석 결과

            • 바람과 함께 사라지다/NNP+를/JKO

              보/VV+았/EP+어/EF+./SF

        • 공백 미포함 분석(2.2 버전 신규 메소드)

          • sample code

            • String in="바람과 함께 사라지다를 봤어.";            

              List<List<Pair<String,String>>> analyzeResultList = komoran.analyzeWithoutSpace(in);

          • 분석 결과

            • 바람/NNG+과/JC

              함께/MAG

              사라지/VV+다/EC+를/JKO

              보/VV+았/EP+어/EF+./SF

    • 버전 히스토리
      • [2.1.2]
        • 사용자 환경에 따른 용량별 데이터 제공
        • 조사 결합 규칙 적용
        • 연결 어미 품사 확장
        • 기타 버그 수정
      • [2.1.1]
        • 연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
        • 버그 수정 및 안정화
      • [2.1]
        • 형태소 분석기 안정화 및 속도 개선
      • [2.0.4]
        • 띄어쓰기 관련 버그 및 기타 안정화
      • [2.0.3]
        • 사용자 사전 포맷 오류 수정
      • [2.0.1]
        • 분석 중 에러가 발생하는 치명적 오류 수정
      • [2.0.0]
        • komoran 2.0 beta 최초 공개
      • [2.0.0] 미만

자세한 사용법은 하기 링크를 참조하시기 바랍니다.

사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))


KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.


저작자 표시 비영리 변경 금지
신고
얍얍 | 2014.09.18 19:48 신고 | PERMALINK | EDIT/DEL | REPLY
위에있는 프로그램 다섯개 다운받은다음에 어떻게 해야 되나요...?
도저히 사용법을봐도..잘 이해가 안가네요
shine_ing | 2014.09.24 00:57 신고 | PERMALINK | EDIT/DEL
완전한 프로그램이 아닌 자바 라이브러리 형태입니다. 자바 프로그래밍에 대한 이해가 있으셔야 사용이 가능하십니다. 프로그래밍과 관련 없이 사용할 수 있도록 완전한 프로그램을 조만간 추가하도록 하겠습니다. 불편을 드려서 죄송합니다..
권순재 | 2014.09.19 14:17 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포트 할게요
큰따옴표와 작은따옴표의 대표적인 용례를 소개해 주세요.
[큰따옴표 NNP, 작은따옴표 NNP, 대표 NNG, 적 XSN, 이 VCP, ㄴ ETM, 용례 NNG, 소개 NNG, 하 XSV, 아 EC, 주 VX, 시 EP]
큰따옴표 같은 경우 큰따옴표 NNP <- 요런식으로 잡히네용
shine_ing | 2014.09.24 01:00 신고 | PERMALINK | EDIT/DEL
models-full과 같은 경우에는 위키피디아에 있는 제목들이 고유명사로 추가되었습니다. 그 과정에서 말씀하신 큰따옴표가 위키페이지에 존재하여 고유명사로 인식되는 것을 확인하였습니다. 이 부분은 위키피디아 데이터를 검수하여 수정하도록 하겠습니다. models-light 버전을 사용하시면 큰따옴표가 NNP로 분석되지 않을 것입니다^^ 감사합니다.
lancif | 2014.09.24 14:28 신고 | PERMALINK | EDIT/DEL | REPLY
코모란 매번 잘 쓰고 있습니다. ^^
저도 버그리포트 하나 할게요.

입력: 않을게요
출력: 않/VX 으시/EP ㄹ게요/EC

여기서 '으시'가 잘못나온것 같아요. '시'가 빠져야할것 같아요
shine_ing | 2014.09.24 15:20 신고 | PERMALINK | EDIT/DEL
불규칙 사전에 잘못된 정보가 있는 것 같네요~ 업데이트 시 반드시 반영하도록 하겠습니디ㅏ. 감사합니다!
lancif | 2014.09.25 16:40 신고 | PERMALINK | EDIT/DEL | REPLY
질문하나 더 드릴게요. ^^

입력: 가능
출력: 가능/XR

이렇게 나오는데요, 이것도 버그인가요?
아니면, XR('어근' 맞나요?)로 나오는게 맞는건가요?
shine_ing | 2014.09.25 16:45 신고 | PERMALINK | EDIT/DEL
글쎄요..어근이라는 품사 자체가 매우 애매한 부분이죠..학습한 데이터를 살펴보니 어근이라고 태깅되어 있네요^^ 개인적으로 어근이라는 태그를 명사로 변경할까 생각중입니다..애매하죠 참..ㅎㅎ
lancif | 2014.09.25 17:33 신고 | PERMALINK | EDIT/DEL
그렇군요. 감사합니다 ^^
lancif | 2014.09.29 11:07 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포트 하나 더 드립니다. ^^

입력: 주셔요
출력: 어/EC 주/VX 시/EP 어요/EC
shine_ing | 2014.09.29 13:13 신고 | PERMALINK | EDIT/DEL
정말 감사드립니다! 사실 이런 부분은 학습데이터 자체에 의한 버그라서 정말 찾기 힘든 부분인데.. 진심으로 감사드립니다!
lancif | 2014.09.29 14:02 신고 | PERMALINK | EDIT/DEL
저야 말로, 좋은 형태소분석기 만들어주셔서 감사합니다 ^^
Name
Password
Homepage
Secret