Skip to content

Projeto de scraper de informações de smartphones do site Tudo Celular, extrai e armazena em arquivo JSON dados como nome, marca e preço dos aparelhos

License

Notifications You must be signed in to change notification settings

Ruy-Araujo/tudo-celular-scraper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

pt-br

Tudo Celular Scraper

Scraper de informações de celulares do site tudocelular.com, escrito em Python e que extrai dados marca, modelo, preço e salva em arquivos JSON.

Como usar

  1. Clone o repositório para a sua máquina local:

    git clone https://github.com/Ruy-Araujo/
  2. Instale as dependências:

    cd tudo_celular
    pip install -r requirements.txt
  3. Execute o scraper:

    scrapy crawl tudo_celular -o tudo_celular.json

O scraper irá extrair dados dos celulares disponiveis no site tudocelular.com e salvar em um arquivo JSON no diretório do projeto.

Detalhes técnicos

O scraper usa o framework Scrapy para fazer o parsing do HTML da página de fichas tecnicas dos celulares e descrições, extrair informações como marca, modelo, ano de lançamento, etc.

Os dados brutos estão disponiveis aqui

Contribuindo

Se você quiser contribuir para este projeto, sinta-se à vontade para abrir uma issue ou enviar um pull request.

About

Projeto de scraper de informações de smartphones do site Tudo Celular, extrai e armazena em arquivo JSON dados como nome, marca e preço dos aparelhos

Topics

Resources

License

Stars

Watchers

Forks

Languages