카카오 인공지능 형태소 분석기 ‘카이(khaiii)’ 오픈소스 공개

카카오 인공지능 형태소 분석기 ‘카이(khaiii)’ 오픈소스 공개

카카오가 인공지능(AI) 기반의 한국어 형태소 분석기를 khaiii를 깃허브(GitHub)에 오픈소스로 공개했습니다.

khaiii는 “Kakao Hangul Analyzer III”의 첫 글자들만 모아 만든 이름으로 카카오에서 개발한 세 번째 형태소분석기입니다.

요즘 큰 이슈가 되고 있는 머신러닝, 딥러닝 기술이 형태소 분석기에도 적용되었는데요.

형태소 분석기는 빠른 속도가 중요하기 때문에 자연어 처리에 많이 사용되는 LSTM, RNN 알고리즘 대신 주로 이미지 처리에서 사용되는 CNN 알고리즘을 사용한 것이 특징입니다.

또한 약 85만 문장, 천만 어절의 코퍼스를 사용하여 학습해 정확도를 높였다고 기술되어 있습니다.

아래 링크의 깃허브에 방문하시면 누구나 기술을 내려받아 사용할 수 있습니다.

https://github.com/kakao/khaiii

파이썬(Python) 에서 사용하기 위한 빌드 및 설치 방법은 아래 링크를 눌러 확인해주세요.

https://github.com/kakao/khaiii/blob/master/doc/setup.md