Skip to content

Latest commit

 

History

History
17 lines (10 loc) · 668 Bytes

README.md

File metadata and controls

17 lines (10 loc) · 668 Bytes

##修改部分

  1. 原始链家爬虫lanbing510 2016/03/15版不支持最新的链家页面格式,修改更新到2017/01/17链家网站版本
  2. 优化原爬虫写数据库方面的函数

##链家爬虫

爬取北京地区链家历年二手房成交记录。链家爬虫一文的全部代码,包括链家模拟登录代码。

###爬取数据的部分截图

Aaron Swartz

Useful Website

  1. online database read: https://sqliteonline.com/
  2. unicode转化汉字 汉字转化unicode编码: http://www.guabu.com/zhuanma/