Skip to content

Euclid-Jie/Euclidguba-search

Repository files navigation

东方财富股吧数据采集

wakatime

长期维护,欢迎issue,帮助完善代码

现有新旧两个版本,新版本要求高但是免费,旧版本要求不高,但是要使用付费代理(约1 rmb/小时)

  1. 如果你仅会使用简答的python,对数据库并不了解,请使用老版本,程序下载地址,详见介绍
  2. 如果你有数据库基础(需要用到redis,MongoDB),请使用新版本,直接往下读

程序特性

启动步骤

1. 获取代码

  1. 第一种方式,如果你会使用git, 请直接clone

  2. 第二种方式,下载源码,详见下图,点击 Download ZIP 既可下载,随即解压既可

    image-20240315122017995

2. 配置环境

前置条件是安转并启动了redis,mongo,并将redis密码设置为123456,后续会添加这部分的操作说明

  1. 安转代理池模块,再次感谢作者

    git submodule update --init
  2. 建议使用虚拟环境,并安装依赖

    pip install -r requirements.txt

3. 启动程序

  1. 启动代理池

    新开两个终端,第一个运行

    cd .\proxy_pool\
    python proxyPool.py schedule 

    第二个运行

    cd .\proxy_pool\
    python proxyPool.py server 
  2. 启动FullTextCrawler

    新开终端,运行

    python -m full_text_Crawler
  3. 启动主程序

    main_class.py中设置好参数,新开终端,运行

    python -m main_class
    

爬取成功的数据会在,MongoDB.guba 中,如有问题,请 issue

附录

  1. 爬取成功的数据截图

    image-20240315123641440

  2. 股吧页面截图

About

爬取东方财富股吧的发帖信息

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages