成片的Crawled (200) #343

Macedonialapadian · 2024-09-22T07:02:07Z

如图所示，comment正常爬取时，返回的都是DEBUG: Scraped from <200 URL>{content}。但是图中出现了成片DEBUG: Crawled (200) (referer: None)的形式。出现此种问题后，comment.py往往会飞快地结束。（可能是直接跳过了无法爬取的微博）。

我对comment.py做了改动，改动是将tweet_id加入了对应评论的数据集中。（见附件）
同时，我将setting.py中的并行数从16改为8，将随机请求时间上限从1改为5

[comment.py.zip](https://github.com/user-attachments/files/17088611/comment.py.zip)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

成片的Crawled (200) #343

成片的Crawled (200) #343

Macedonialapadian commented Sep 22, 2024 •

edited

Loading

成片的Crawled (200) #343

成片的Crawled (200) #343

Comments

Macedonialapadian commented Sep 22, 2024 • edited Loading

Macedonialapadian commented Sep 22, 2024 •

edited

Loading