Skip to content

dev-wantap/Kmeans_01

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Kmeans_01

Kmeans 학습용, 형태소분석은 ETRI의 API를 이용함. 공공 인공지능오픈 API·DATA 서비스 포털

wordlist.py

MakeWordList_articles(article_list)

article_list의 모든 단어가 있는 리스트를 만들어 반환함. (중복x)

MakeWordList_text(text)

text의 모든 단어를 리스트 형태로 반환함.(중복o)

wordtovec.py

WordToVec(WordSet, article_morp)

WordSet의 단어들을 [단어, 횟수]의 꼴로 리스트를 만들어 반환함.
WordSet에는 없지만 article_morp에 있다면 [단어, 0]꼴

Standardization(Vec)

정규화 : 문서에서 차지하는 비율로 변환 (0~1)

dist.py

euclidean_distance(Vec1, Vec2)

Vec1, Vec2간 유클리디안 거리 계산 후 반환

About

Kmeans 학습용

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages