Conteúdo do estudo > Clique para construir um projeto de dados do zero com Luciano Galvão.
Este projeto é um web spider desenvolvido utilizando a biblioteca Scrapy em Python, destinado a extrair informações de produtos da plataforma MercadoLivre.
- O spider é capaz de acessar a página inicial de uma categoria específica de produtos no MercadoLivre e extrair informações detalhadas de cada produto listado, incluindo marca, nome, preços antigo e novo, avaliação e quantidade de avaliações.
- O spider é projetado para iterar sobre múltiplas páginas de resultados de pesquisa, permitindo a coleta de um grande volume de dados.
- O número máximo de páginas que o spider pode percorrer é configurável para controlar o escopo da extração de dados.
- Os dados extraídos podem ser exportados para diferentes formatos, como JSON, CSV, ou diretamente para um banco de dados, para posterior análise e processamento.
$ git clone https://github.com/IasmimHorrana/web-scraping.git
$ cd web-scraping
$ python -m venv venv
$ venv\Scripts\activate
$ pip install scrapy
- Cria o ambiente virtual / Ativar o ambiente no windows / Instalar o Scrapy dentro do ambiente virtual.
$ pip install -r requirements.txt
$ scrapy crawl mercadolivre
$ streamlit run app.py