-
텍스트 정규화-어간 추출과 표제어 추출Knowledge for Data Analysis/딥 러닝을 이용한 자연어 처리 입문 2020. 8. 2. 18:41
텍스트 전처리를 위한 정규화
표기가 다른 단어들의 통합 / 대, 소문자 통합 / 불필요한 단어 제거 / 정규 표현식
이번 시간에는 표기가 다른 단어들을 통합하는 방법인 어간 추출(stemming)과 표제어 추출(lemmatization) 에 대해서 배울 것이다.
위키독스
온라인 책을 제작 공유하는 플랫폼 서비스
wikidocs.net