원-핫 이코딩

원-핫 인코딩의 한계

단어의 잠재 의미를 반영하여 다차원 공간에 벡터화 하는 기법으로 크게 두 가지가 있습니다.

첫째는 카운트 기반의 벡터화 방법인 LSA, HAL 등이 있으며,
둘째는 예측기반으로 벡터화하는 NNLM, RNNLM, Word2Vec, FastText 등이 있습니다.
그리고 카운트 기반과 예측 기반 두 가지 방법을 모두 사용하는 방법으로 GloVe라는 방법이 존재합니다.