Scraper de informações de celulares do site tudocelular.com, escrito em Python e que extrai dados marca, modelo, preço e salva em arquivos JSON.
-
Clone o repositório para a sua máquina local:
git clone https://github.com/Ruy-Araujo/
-
Instale as dependências:
cd tudo_celular pip install -r requirements.txt
-
Execute o scraper:
scrapy crawl tudo_celular -o tudo_celular.json
O scraper irá extrair dados dos celulares disponiveis no site tudocelular.com e salvar em um arquivo JSON no diretório do projeto.
O scraper usa o framework Scrapy para fazer o parsing do HTML da página de fichas tecnicas dos celulares e descrições, extrair informações como marca, modelo, ano de lançamento, etc.
Os dados brutos estão disponiveis aqui
Se você quiser contribuir para este projeto, sinta-se à vontade para abrir uma issue ou enviar um pull request.