Kmeans 학습용, 형태소분석은 ETRI의 API를 이용함. 공공 인공지능오픈 API·DATA 서비스 포털
article_list의 모든 단어가 있는 리스트를 만들어 반환함. (중복x)
text의 모든 단어를 리스트 형태로 반환함.(중복o)
WordSet의 단어들을 [단어, 횟수]의 꼴로 리스트를 만들어 반환함.
WordSet에는 없지만 article_morp에 있다면 [단어, 0]꼴
정규화 : 문서에서 차지하는 비율로 변환 (0~1)
Vec1, Vec2간 유클리디안 거리 계산 후 반환