메인 사진
# 여는 글
텍스트 관련 딥러닝을 하다보면 기본적으로 형태소 분석기를 사용하여 태깅작업을 진행하여 글자를 분류합니다. 게다가 한글 텍스트라면 한국어 형태소 분석기를 사용해야합니다. 하지만 한국어 형태소 분석기는 자료가 극히 적고(영문에 비하면...), 뭘 어떻게 해야할지 모릅니다. 그래서 파이썬으로 사용하기 쉽게 나온 한국어 형태소 분석기 파이썬 패키지가 존재합니다. 그 이름하여 KoNLPy입니다!!!
# KoNLPy(코엔엘파이) 란?
자 그럼 KoNLPy(코엔엘파이)란 무엇일까요? KoNLPy란, 한국어 정보처리를 위한 파이썬 패키지입니다. 주로 태깅 패키지로 Hannanum(한나눔), Kkma(꼬꼬마), Komoran(코모란), Mecab, okt를 지원합니다. (그외 부수적으로 여러 가지를 제공하는데 사용을 해보지 않아서 잘 모르겠습니다.) 기본적으로 한국어 형태소 분석기를 사용하려고 하면 KoNLPy를 많이 씁니다.
# KoNLPy 설치법
필자는 윈도우 기반이니 윈도우 기반으로 설치하는 방법을 알아도록 하겠습니다.
1. 먼저 윈도우의 비트수를 확인합니다.
(필자는 x64 이므로 x64로 설치를 했습니다.)
2. 파이썬(https://www.python.org/downloads/)을 설치합니다.
파이썬의 버전은 기억해둡시다. KoNLPy 설치할 때 필요합니다.
만약 설치법을 모를 경우 아래의 경로에서 확인 바랍니다.
(파이썬 설치법: 작성중)
만약 이미 설치했을 경우 커맨드라인에서 python —version을 치면 자신의 버전을 알수 있습니다.
3. open JDK를 설치합니다.
꼭 open JDK가 아니라 JDK여도 상관은 없지만 이제 JDK가 유료로 바뀌니 애초에 open JDK로 설치하도록 합니다.
(open JDK 설치법 : 작성중)
4. OS비트수에 일치하는 JPype1을 설치해줍니다.
JPype1 다운로드 사이트(https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype)에 들어가서 자신에게 맞는 것을 다운로드 합니다.
또한 여기서 중요하게 볼 것이 cp36 또는 cp37이라고 적혀있는 부분입니다. 만약 사용자가 파이썬 3.6.4을 설치했자면 cp36을 설치하여야 하고 사용자가 3.7.1을 설치했다면 cp37을 설치하여야 합니다. 그 이후엔 자신의 컴퓨터에 맞는 윈도우의 비트수에 맞춰 설치하도록 합니다.
필자는 파이썬 3.6.4를 설치하였으므로 JPype1‑0.6.3‑cp36‑cp36m‑win_amd64.whl을 설치하겠습니다.
자 다운로드가 완료가 되면 커맨드 라인을 키시고 pip를 업그레이드 시킵니다.
만약 pip가 설치가 안되었으면 pip를 설치하도록 합니다.
(pip 설치법: 작성중)
> pip install --upgrade pip
참고 : 필자는 이미 최신 버전이라서 이미 설치되었다고 떴으니 저렇게 안나오더라도 괜찮습니다.
그 후 다운로드 받은 JPype가 존재하는 폴더로 이동한 다음 아래의 커맨드를 입력하여 JPype를 인스톨 하도록 합니다.
> pip install JPype1-0.5.7-cp27-none-win_amd64.whl
참고 : JPype1또한 설치를 완료해서 이미 설치되었다고 떴으니 저렇게 안나오더라도 괜찮습니다.
5. KoNLPy 설치
마지막으로 아래 커멘드를 입력해주면 KoNLPy 설치가 완료됩니다.
> pip install konlpy
# 마무리
위 포스트는 제가 직접 제작한 것 입니다.
그렇기 때문에 틀린점이나 설명이 엉성한 점이 존재할 수 있습니다.
만약 틀린점이나 설명이 엉성한 부분이 존재하면 댓글로 알려주세요.
빠른 처리 하도록 하겠습니다.
티스토리 앱으로는 댓글 이용이 불가능 하므로 웹 브라우저로 봐 주세요
(URL : http://junprogramer.tistory.com/)
읽어주셔서 감사합니다.
'잡다한 기술' 카테고리의 다른 글
[딥러닝/머신러닝] 딥러닝. 머신러닝 이란? (0) | 2018.12.13 |
---|---|
[node.js] es8 async/await 사용하기 (0) | 2018.11.07 |
[안드로이드/코틀린] 코틀린 프레그먼트 (0) | 2018.11.01 |
[안드로이드] 프래그먼트 작업 (0) | 2018.10.29 |
[Python] 파이썬으로 만든 API에서 파일을 가져오는 방법 (0) | 2018.10.17 |