Knowledge for Data Analysis/딥 러닝을 이용한 자연어 처리 입문

텍스트 정규화-어간 추출과 표제어 추출

ddoddo201 2020. 8. 2. 18:41

 

 

텍스트 전처리를 위한 정규화

표기가 다른 단어들의 통합 / 대, 소문자 통합 / 불필요한 단어 제거 / 정규 표현식

 

이번 시간에는 표기가 다른 단어들을 통합하는 방법인 어간 추출(stemming)과 표제어 추출(lemmatization) 에 대해서 배울 것이다.

 

https://wikidocs.net/21707

 

위키독스

온라인 책을 제작 공유하는 플랫폼 서비스

wikidocs.net