Skip to content

snutiise/Twitter-Crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

트위터 이미지 크롤러입니다.

사용하기 위해서는 selenium, scrapy, pymongo, configparser를 설치해야합니다.

$ git clone https://github.com/snutiise/Twitter-Crawler.git

$ sudo pip install configparser pymongo selenium scrapy

$ cd Twitter-Crawler

$ scrapy crawl twitter


메타데이터 저장시 몽고디비를 이용하므로 몽고디비도 설치해야합니다.

mongodb config -> settings.py 파일참조



config 파일에서 수집하고 싶은 이미지에 대한 키워드와 페이지 수, 그리고 크롤러가 위치한 절대경로를 설정해주면 됩니다.

ex)

keyword=러블리즈

page=10

rootPath=/home/jsh/git/Twitter-Crawler/

About

Twitter Crawler

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages