BLOG main image
분류 전체보기 (46)
Life (4)
Computer Science (3)
Programming (6)
Opensource (6)
Project (17)
Tip (10)
artikel terbaru. berita tekno..
artikel terbaru. berita tekno..
Best way to develop a mobile a..
Best way to develop a mobile a..
123,594 Visitors up to today!
Today 8 hit, Yesterday 36 hit
daisy rss
tistory 티스토리 가입하기!
'2014/09'에 해당되는 글 2건
2014.09.29 20:46

KOMORAN 2.3




  • 주요 업데이트 내용
    • 불규칙 사전 정제
    • models-full에 포함된 단어 중 오분석을 유발할 수 있는 단어 정제

  • 버전 히스토리
    • [2.2]
      • 불용 로그 제거
      • 공백 미포함 형태소 분석 기능 추가
    • [2.1.2]
      • 사용자 환경에 따른 용량별 데이터 제공
      • 조사 결합 규칙 적용
      • 연결 어미 품사 확장
      • 기타 버그 수정
    • [2.1.1]
      • 연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
      • 버그 수정 및 안정화
    • [2.1]
      • 형태소 분석기 안정화 및 속도 개선
    • [2.0.4]
      • 띄어쓰기 관련 버그 및 기타 안정화
    • [2.0.3]
      • 사용자 사전 포맷 오류 수정
    • [2.0.1]
      • 분석 중 에러가 발생하는 치명적 오류 수정
    • [2.0.0]
      • komoran 2.0 beta 최초 공개
    • [2.0.0] 미만

    자세한 사용법은 하기 링크를 참조하시기 바랍니다.

    사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))

    - 데모 사이트


    KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.


저작자 표시 비영리 변경 금지
신고
lancif | 2014.10.02 15:37 신고 | PERMALINK | EDIT/DEL | REPLY
감사합니다! 요번 버전도 잘 쓸게요. ^^

버그 리포트 하나 더 합니다.

입력 : 어떠신지
출력 : 어떠/XR 신/NNG 이/VCP 지/EC
shine_ing | 2014.10.02 15:43 신고 | PERMALINK | EDIT/DEL
감사합니다.
매번 이렇게 피드백 주셔서 감사합니다!!
lancif | 2014.10.09 16:36 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포트할게요 ^^

"회신주시기 바랍니다"에서 따온건데요,

입력 : 회신주시기
출력 : 회/NNB 신주/NNG 시기/NNG

이렇게 나옵니다. 여기서, '주'가 동사로 뽑혔으면 하거든요.
입력했던 문장에 제대로 띄어쓰기를 해서 "회신 주시기"로 쓰면 제대로 됩니다.

감사합니다.
shine_ing | 2014.10.13 11:53 신고 | PERMALINK | EDIT/DEL
개인적인 일 때문에 답변이 늦었네요. 죄송합니다 ^^;;
리포팅하신 내용은 띄어쓰기가 올바르지 않아서 나타나는 문제인데, 사실 komoran에는 띄어쓰기 모듈이 들어있지 않습니다..ㅠㅠ 그래서 말씀하신 내용은 프로그램 측면에서 버그라기보다는 데이터 오류로 보여집니다만..말씀하신 내용들도 잘 처리를 해야겠죠! 조만간 띄어쓰기 모듈 추가해서 업데이트 하도록 하겠습니다! 항상 감사합니다!
lancif | 2014.10.15 10:54 신고 | PERMALINK | EDIT/DEL
감사합니다 ^^
Curycu | 2014.10.19 00:21 신고 | PERMALINK | EDIT/DEL | REPLY
안녕하세요/ komoran 유저입니다 :) 요번에 코모란 및 여러 형태소 분석기들을 이용해서 텍스트마이닝 프로그램을 작성 중인데요, 코모란이 제공하는 메소드 중에서는 "추출된 형태소의 원문 내에서의 위치" 를 알려주는 메소드가 없는 것 같더라구요/ 내부적으로는 형태소 분석 시에 분명 사용되고 있는 정보일 듯 한데, 차후 업데이트에서 해당 정보를 제공하는 메소드를 추가해주실 수 있을까요?
shine_ing | 2014.10.19 01:17 신고 | PERMALINK | EDIT/DEL
분석된 형태소가 입력된 텍스트에서 몇번째위치인지 알려달라는 말씀이신가요? 만약에 맞다면 이 부분은 형태소분석기의 기능이 아니라서 조금 힘들것 같습니다^^;;
Curycu | 2014.10.19 02:01 신고 | PERMALINK | EDIT/DEL | REPLY
엇... 그렇군요 ㅠ.ㅠ 알겠습니다~
shine_ing | 2014.10.19 02:04 신고 | PERMALINK | EDIT/DEL
형태소 분석기를 쉽게 응용 및 적용 가능하게끔 라이브러리들을 개발 예정 중에 있습니다. 말씀해주신 피드백 성실히 반영하도록 하겠습니다! 감사합니다^^;
lancif | 2014.10.27 17:03 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포트 하나 할게요. ^^

입력: "가. 일정: 10/20"
출력: "가/VV 아/EF ./SF 일정/NNG :/SP 10/SN //SP 20/SN"

문제는 '가.'입니다. 목차를 표현하려고 쓰인 것인데, 동사가 뽑혀버렸습니다.
'나.', '라.' 에서도 같은 현상이 나타납니다.

Ambiguity 문제라 해결하기 어려울 수도 있겠지만, 일단은 리포팅해봅니다. ^^

매번 감사합니다!
shine_ing | 2014.10.27 18:11 신고 | PERMALINK | EDIT/DEL
매번 감사드립니다. 현재 영어 품사 태거를 만들고 있어서 코모란 업데이트가 지연되고 있네요..ㅠㅠ 조만간 빨리 반영하도록 하겠습니다!
lancif | 2014.10.28 09:45 신고 | PERMALINK | EDIT/DEL
감사합니다 ^^
lancif | 2014.10.30 10:21 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포팅 하나 더 할게요.

입력: "보내주셔요"
출력: "보/NNG 내주/NNG 시/VA 어요/EC"

입력: "주셔요"
출력: "주/NNG 시/VA 어요/EC"

피드백 매번 잘 반영해주셔서 감사합니다. ^^
shine_ing | 2014.11.04 18:14 신고 | PERMALINK | EDIT/DEL
감사합니다! 아마 금주 내로 업데이트 될 것 같습니다! 감사합니다!
정담 | 2014.11.04 18:13 신고 | PERMALINK | EDIT/DEL | REPLY
이쪽 분야는 전혀 몰라서 어떻게 할지 난감했는데
덕분에 수고를 많이 줄였습니다.
정말 큰 도움 되었습니다. 감사합니다.
^_^b
shine_ing | 2014.11.04 18:15 신고 | PERMALINK | EDIT/DEL
도움이 되었다니 다행이네요. 사용하시다가 불편하신 점이나 이상한 점은 망설이지 마시고 바로 알려주시면 적극 반영하겠습니다. 감사합니다!
Name
Password
Homepage
Secret
2014.09.12 10:21

KOMORAN 2.2


    • 주요 업데이트 내용
      • 일부 문장 분석 시 특정 로그가 출력되는 현상 제거
      • 형태소 분석 시 공백 포함/미포함 분석 기능 추가
        • 공백 포함 분석(2.2 이전 버전과 동일한 메소드 사용)
          • sample code
            • String in="바람과 함께 사라지다를 봤어.";            

              List<List<Pair<String,String>>> analyzeResultList = komoran.analyze(in);

          • 분석 결과

            • 바람과 함께 사라지다/NNP+를/JKO

              보/VV+았/EP+어/EF+./SF

        • 공백 미포함 분석(2.2 버전 신규 메소드)

          • sample code

            • String in="바람과 함께 사라지다를 봤어.";            

              List<List<Pair<String,String>>> analyzeResultList = komoran.analyzeWithoutSpace(in);

          • 분석 결과

            • 바람/NNG+과/JC

              함께/MAG

              사라지/VV+다/EC+를/JKO

              보/VV+았/EP+어/EF+./SF

    • 버전 히스토리
      • [2.1.2]
        • 사용자 환경에 따른 용량별 데이터 제공
        • 조사 결합 규칙 적용
        • 연결 어미 품사 확장
        • 기타 버그 수정
      • [2.1.1]
        • 연속된 영어(SL), 숫자(SN), 한자(SH)에 대한 분석 결과 변경
        • 버그 수정 및 안정화
      • [2.1]
        • 형태소 분석기 안정화 및 속도 개선
      • [2.0.4]
        • 띄어쓰기 관련 버그 및 기타 안정화
      • [2.0.3]
        • 사용자 사전 포맷 오류 수정
      • [2.0.1]
        • 분석 중 에러가 발생하는 치명적 오류 수정
      • [2.0.0]
        • komoran 2.0 beta 최초 공개
      • [2.0.0] 미만

자세한 사용법은 하기 링크를 참조하시기 바랍니다.

사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))


KOMORAN과 관련된 문의 사항은 ceo@shineware.co.kr로 연락주시기 바랍니다.


저작자 표시 비영리 변경 금지
신고
얍얍 | 2014.09.18 19:48 신고 | PERMALINK | EDIT/DEL | REPLY
위에있는 프로그램 다섯개 다운받은다음에 어떻게 해야 되나요...?
도저히 사용법을봐도..잘 이해가 안가네요
shine_ing | 2014.09.24 00:57 신고 | PERMALINK | EDIT/DEL
완전한 프로그램이 아닌 자바 라이브러리 형태입니다. 자바 프로그래밍에 대한 이해가 있으셔야 사용이 가능하십니다. 프로그래밍과 관련 없이 사용할 수 있도록 완전한 프로그램을 조만간 추가하도록 하겠습니다. 불편을 드려서 죄송합니다..
권순재 | 2014.09.19 14:17 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포트 할게요
큰따옴표와 작은따옴표의 대표적인 용례를 소개해 주세요.
[큰따옴표 NNP, 작은따옴표 NNP, 대표 NNG, 적 XSN, 이 VCP, ㄴ ETM, 용례 NNG, 소개 NNG, 하 XSV, 아 EC, 주 VX, 시 EP]
큰따옴표 같은 경우 큰따옴표 NNP <- 요런식으로 잡히네용
shine_ing | 2014.09.24 01:00 신고 | PERMALINK | EDIT/DEL
models-full과 같은 경우에는 위키피디아에 있는 제목들이 고유명사로 추가되었습니다. 그 과정에서 말씀하신 큰따옴표가 위키페이지에 존재하여 고유명사로 인식되는 것을 확인하였습니다. 이 부분은 위키피디아 데이터를 검수하여 수정하도록 하겠습니다. models-light 버전을 사용하시면 큰따옴표가 NNP로 분석되지 않을 것입니다^^ 감사합니다.
lancif | 2014.09.24 14:28 신고 | PERMALINK | EDIT/DEL | REPLY
코모란 매번 잘 쓰고 있습니다. ^^
저도 버그리포트 하나 할게요.

입력: 않을게요
출력: 않/VX 으시/EP ㄹ게요/EC

여기서 '으시'가 잘못나온것 같아요. '시'가 빠져야할것 같아요
shine_ing | 2014.09.24 15:20 신고 | PERMALINK | EDIT/DEL
불규칙 사전에 잘못된 정보가 있는 것 같네요~ 업데이트 시 반드시 반영하도록 하겠습니디ㅏ. 감사합니다!
lancif | 2014.09.25 16:40 신고 | PERMALINK | EDIT/DEL | REPLY
질문하나 더 드릴게요. ^^

입력: 가능
출력: 가능/XR

이렇게 나오는데요, 이것도 버그인가요?
아니면, XR('어근' 맞나요?)로 나오는게 맞는건가요?
shine_ing | 2014.09.25 16:45 신고 | PERMALINK | EDIT/DEL
글쎄요..어근이라는 품사 자체가 매우 애매한 부분이죠..학습한 데이터를 살펴보니 어근이라고 태깅되어 있네요^^ 개인적으로 어근이라는 태그를 명사로 변경할까 생각중입니다..애매하죠 참..ㅎㅎ
lancif | 2014.09.25 17:33 신고 | PERMALINK | EDIT/DEL
그렇군요. 감사합니다 ^^
lancif | 2014.09.29 11:07 신고 | PERMALINK | EDIT/DEL | REPLY
버그 리포트 하나 더 드립니다. ^^

입력: 주셔요
출력: 어/EC 주/VX 시/EP 어요/EC
shine_ing | 2014.09.29 13:13 신고 | PERMALINK | EDIT/DEL
정말 감사드립니다! 사실 이런 부분은 학습데이터 자체에 의한 버그라서 정말 찾기 힘든 부분인데.. 진심으로 감사드립니다!
lancif | 2014.09.29 14:02 신고 | PERMALINK | EDIT/DEL
저야 말로, 좋은 형태소분석기 만들어주셔서 감사합니다 ^^
Name
Password
Homepage
Secret
prev"" #1 next