KOMORAN 2.1


    • 주요 업데이트 내용
      • 형태소 분석기 안정화 및 속도 개선
    • 버전 히스토리
      • [2.0.4]
        • 띄어쓰기 관련 버그 및 기타 안정화
      • [2.0.3]
        • 사용자 사전 포맷 오류 수정
      • [2.0.2]
        • 띄어쓰기 관련 오류 수정
      • [2.0.1]
        • 분석 중 에러가 발생하는 치명적 오류 수정
      • [2.0.0]
        • komoran 2.0 beta 최초 공개
      • [2.0.0 미만]


자세한 사용법은 하기 링크를 참조하시기 바랍니다.

- 사용법 (글 제목 : KOMORAN ver 2.0.4 beta (자바 한국어 형태소 분석기))


  1. obama 2014.08.11 17:56

    릴리즈 감사합니다. 잘 사용하겠습니다. ;-)

  2. origoni 2014.08.11 22:14

    감사합니다!!
    요즘 갑자기 바빠지긴 했는데요 ㅠㅠ 시간 나는대로 사용해보고 피드백 드리겠습니다!!!

    • shine_ing 2014.08.11 23:04 신고

      제가 오히려 감사드리죠 :)
      본의아니게 얼마전에 제주도로 옮기신걸 알게됐습니다~ 제주도 어떤가요?!

    • shine_ing 2014.08.11 23:04 신고

      본의아니게 옮겼다는 뜻이 아니라 제주도로 옮기신걸 본의아니게 알게 되었다는 의미입니다..-ㅁ-..자연어처리..하...ㅠㅠ

  3. hare 2014.08.12 18:01

    버전이 점점 올라가는군요! 언제나 감사드립니다!

    • shine_ing 2014.08.12 18:21 신고

      제가 감사드리죠! 사용해보시고 피드백 부탁드립니다 ^^

  4. lancif 2014.08.12 21:07

    매번 감사합니다. 잘 쓸게요!

  5. lancif 2014.08.14 22:57

    한 문장을 통채로 분석하는 것과 각 단어별로 따로 분석해서 합친 결과에 차이가 있나요?

    예를 들어, "안녕하세요. 제 이름은 김철수입니다. 잘 부탁 드립니다." 라는 문장을 통채로 입력해서 분석했을 때와,
    "안녕하세요.","제","이름은","김철수입니다","잘","부탁","드립니다."를 각각 따로 입력해서 분석한 후 결과를 합쳤을 때,

    결과가 달라질 수도 있나요? (위의 경우는 똑같은 결과가 나옵니다만, 혹시 다른 문장을 넣었을 때 달라질 수도 있는지 궁금합니다)

    • shine_ing 2014.08.14 23:30 신고

      현재 알고리즘 상으로는 같은 결과가 나올 것 같네요~ 문장 단위로 분석하는 알고리즘을 추가할 예정인데 그때는 아마 달라질것 같습니다~

    • lancif 2014.08.15 07:24

      그렇군요. 감사합니다! ^^

    • shine_ing 2014.08.15 11:03 신고

      참고로 사용자 사전에 "이름은 김철수"라고 있다고 한다면 결과가 다르겠네요~ 또 문의사항있으시면 알려주세요~^^

  6. lancif 2014.08.15 15:32

    하나 더 물어볼게요. ^^
    태그 중에 'NA'가 새로 생긴것 같은데요, Not Available, No Answer, 뭐 그런 뜻인가요?

    예를 들어, '<DATE>까지 놀다 온다.' 라는 문장을 돌리면 이전 버전에서는 '<DATE>'가 특수기호, 영어 각각으로 분리됐었는데,
    이번 버전에서는 '<DATE>까지/NA' 라고 나오네요.

    • shine_ing 2014.08.16 00:21 신고

      현재 영어나 숫자등이 특별한 의미가 없다면 기존과는 다르게 개별적(single character)으로 태깅이 됩니다만, 이 때 조합할 수 없는 경우가 나타나면 단어 전체가(word)NA로 태깅이 됩니다. 이 부분은 현재 어떤식으로 출력을 하는 것이 맞을지에 대해서 고민중에 있습니다만...이전 버전과 동일한 형태로 가야할 것 같습니다^^ 피드백 감사드리며 이는 재빨리 수정하여 다시 업데이트하도록 하겠습니다. 감사합니다!

    • shine_ing 2014.08.17 01:13 신고

      위에 있는 댓글과는 별개로 말씀하신대로 "<DATE>까지 놀다 온다."로 테스트 해 본 결과 NA 태그가 발생하지 않네요..죄송하지만 다시한번만 확인해보시고 알려주시면 감사드리겠습니다!

    • lancif 2014.08.19 19:29

      죄송합니다. 제가 이것저것 테스트하다가 예제를 잘못올렸네요. ^^;;

      <DATE_A>까지 놀다 온다.

      이 문장을 입력으로 넣으면 '<DATE_A>까지/NA'라고 결과가 나옵니다.
      (제가 이걸 옮겨 쓴다는게 실수를 했습니다.)
      (참고로 이 문제는, 태깅된 코퍼스로 개체명 인식기 트레이닝 시키다가 생겼던 문제입니다. 지금은 모든 개체명 태그셋을 사용자 사전에 넣어서 처리했습니다.)

      신경써주셔서 감사합니다. 2.1.1 버전도 감사히 쓰겠습니다!

    • shine_ing 2014.08.20 01:11 신고

      죄송하실 필요까지야..^^;;;
      방금 알려주신 내용으로 테스트를 해보니 NA 태그가 나오네요. 확인 결과 언더바(_)를 처리하지 못해서 해당 어절이 NA로 태깅되버리는 결과가 나오는 것으로 확인했습니다. 조만간 업데이트할 예정인데 그때 반드시 반영하도록 하겠습니다! 피드백 감사합니다!

+ Recent posts