텍스트 특징

from sklearn.feature_extraction.text import CountVectorizer
vec = CountVectorizer()
X = vec.fit_transform(sample)
X

TF-IDF Term Frequency-Inverse Document Frequency 용어 빈도-역문서 빈도