1) 다양한 단어의 표현 방법
4) TF-IDF (Term Frequency-Inverse Document Frequency)
2) 여러가지 유사도 기법
토픽(Topic)은 한국어로 주제라고 합니다. 토픽 모델링이란 기계 학습 및 자연어 처리 분야에서 토픽이라는 문서 집합의 추상적인 주제를 발견하기 위한 통계적 모델 중 하나로, 텍스트 본문의 숨겨진 의미 구조를 발견하기 위해 사용되는 텍스트 마이닝 기법입니다.
1) 잠재 의미 분석(Latent Semantic Analysis, LSA)
과적합 Overfitting을 막는 방법