본문 바로가기

잡다한 기술

[Python] 윈도우에서 형태소 분석기(KoNLPy)설치하기


메인 사진



# 여는 글


텍스트 관련 딥러닝을 하다보면 기본적으로 형태소 분석기를 사용하여 태깅작업을 진행하여 글자를 분류합니다. 게다가 한글 텍스트라면 한국어 형태소 분석기를 사용해야합니다. 하지만 한국어 형태소 분석기는 자료가 극히 적고(영문에 비하면...), 뭘 어떻게 해야할지 모릅니다. 그래서 파이썬으로 사용하기 쉽게 나온 한국어 형태소 분석기 파이썬 패키지가 존재합니다. 그 이름하여 KoNLPy입니다!!!



# KoNLPy(코엔엘파이) 란?




자 그럼 KoNLPy(코엔엘파이)란 무엇일까요? KoNLPy, 한국어 정보처리를 위한 파이썬 패키지입니다. 주로 태깅 패키지로 Hannanum(한나눔), Kkma(꼬꼬마), Komoran(코모란), Mecab, okt를 지원합니다. (그외 부수적으로 여러 가지를 제공하는데 사용을 해보지 않아서 잘 모르겠습니다.) 기본적으로 한국어 형태소 분석기를 사용하려고 하면 KoNLPy를 많이 씁니다.



# KoNLPy 설치법


필자는 윈도우 기반이니 윈도우 기반으로 설치하는 방법을 알아도록 하겠습니다.


1. 먼저 윈도우의 비트수를 확인합니다.

(필자는 x64 이므로 x64로 설치를 했습니다.)

 





2. 파이썬(https://www.python.org/downloads/)을 설치합니다.



파이썬의 버전은 기억해둡시다. KoNLPy 설치할 때 필요합니다.

만약 설치법을 모를 경우 아래의 경로에서 확인 바랍니다.

(파이썬 설치법: 작성중)


만약 이미 설치했을 경우 커맨드라인에서 python version을 치면 자신의 버전을 알수 있습니다.






3. open JDK를 설치합니다.




open JDK가 아니라 JDK여도 상관은 없지만 이제 JDK가 유료로 바뀌니 애초에 open JDK로 설치하도록 합니다.

(open JDK 설치법 : 작성중)






4. OS비트수에 일치하는 JPype1을 설치해줍니다.


JPype1 다운로드 사이트(https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype)에 들어가서 자신에게 맞는 것을 다운로드 합니다.




 

또한 여기서 중요하게 볼 것이 cp36 또는 cp37이라고 적혀있는 부분입니다. 만약 사용자가 파이썬 3.6.4을 설치했자면 cp36을 설치하여야 하고 사용자가 3.7.1을 설치했다면 cp37을 설치하여야 합니다. 그 이후엔 자신의 컴퓨터에 맞는 윈도우의 비트수에 맞춰 설치하도록 합니다.

 

필자는 파이썬 3.6.4를 설치하였으므로 JPype10.6.3cp36cp36mwin_amd64.whl을 설치하겠습니다.

 

자 다운로드가 완료가 되면 커맨드 라인을 키시고 pip를 업그레이드 시킵니다.

만약 pip가 설치가 안되었으면 pip를 설치하도록 합니다.

(pip 설치법: 작성중)

 

> pip install --upgrade pip





참고 : 필자는 이미 최신 버전이라서 이미 설치되었다고 떴으니 저렇게 안나오더라도 괜찮습니다.

 

그 후 다운로드 받은 JPype가 존재하는 폴더로 이동한 다음 아래의 커맨드를 입력하여 JPype를 인스톨 하도록 합니다.

 

> pip install JPype1-0.5.7-cp27-none-win_amd64.whl




참고 : JPype1또한 설치를 완료해서 이미 설치되었다고 떴으니 저렇게 안나오더라도 괜찮습니다.


5. KoNLPy 설치


마지막으로 아래 커멘드를 입력해주면 KoNLPy 설치가 완료됩니다.

 

> pip install konlpy




# 마무리


위 포스트는 제가 직접 제작한 것 입니다.

그렇기 때문에 틀린점이나 설명이 엉성한 점이 존재할 수 있습니다.

만약 틀린점이나 설명이 엉성한 부분이 존재하면 댓글로 알려주세요.

빠른 처리 하도록 하겠습니다.


티스토리 앱으로는 댓글 이용이 불가능 하므로 웹 브라우저로 봐 주세요

(URL : http://junprogramer.tistory.com/)


읽어주셔서 감사합니다.