Skip to content

Een tool voor abonnees van de Groene Amsterdammer om de recentste PDF van de website te scrapen

License

Notifications You must be signed in to change notification settings

Pi2048/GroeneScrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Doel

Dit is een scraper voor de website van de Groene Amsterdammer. Met behulp van deze scraper kan een abonnee automatisch de PDF downloaden van de Groene Amsterdammer van deze week.

Gebruik in het kort

Installatie

$ git clone 
$ cd GroeneScrapy
$ sudo pip install -r requirements.txt

Als je problemen hebt met het installeren van Scrapy, zie http://doc.scrapy.org/en/0.24/intro/install.html.

Configuratie

Stel de volgende dingen in in GroeneScrapy/settings.py:

  • GROENE_USERNAME is je gebruikersnaam (e-mailadres);
  • GROENE_PASSWORD is je wachtwoord;
  • GROENE_PDF_PATH is de directory waar de PDF's worden opgeslagen (standaard: GroenePDF).

Gebruik

Gebruik dit in de root van de repository.

$ scrapy crawl pdfspider

About

Een tool voor abonnees van de Groene Amsterdammer om de recentste PDF van de website te scrapen

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages