- http://www.mxwz.com/pingyi/wlhyr/py_list.aspx?type=ly
- http://www.mxwz.com/pingyi/py_view.aspx?ID=491892
- http://weixin.sogou.com/weixin?type=2&ie=utf8&query=%E5%85%A8%E5%9B%BD%E9%93%81%E8%B7%AF%E8%BF%8E%E5%A4%A7%E8%B0%83%E5%9B%BE&tsn=1&ft=&et=&interation=&wxid=&usip=
js跳转 changde.py
cookie加密验证天眼查 test_down_tianyancha.py
- http://tianyancha.com/company/3976673
- http://tianyancha.com/tongji/3976673.json?random=1470990214043
- http://tianyancha.com/company/3976673.json
http://xygs.gsaic.gov.cn/gsxygs/pub!list.do
豆瓣FM及其他豆瓣网站 https 不严密的cookie参数 test_down_douban.py
- https://douban.fm/
- https://douban.fm/j/explore/genre?gid=%s&start=0&limit=1000
- http://douban.fm/j/explore/channel_detail?channel_id=9
js执行后url增加_dsign参数 get_dsign.py
- http://bbs.auto.ifeng.com/thread-2758815-1-1.html
- http://wj.scdaily.scol.com.cn/thread-1754575-1-1.html -js代码
- https://m.guazi.com/bj/dazhong/
- 访问频率要小于 0.5次/s
- 如果使用代理的话 http协议要用http协议的代理 https要用https的代理,混用的话相当于没加代理
- \r在linux下会被解释为回车,如果使用\r当做换行符,在网页和windows上显示都没有问题,但在linux下输出的时候测绘覆盖\r之前的字符,导致输出结果和网页上看到的少很多。。,如果不太明白\r含义的话,想必要调试很久很久很久很久吧。。。