pescarte-ceasa

Este repositório contém uma ferramenta automática de extração de dados da web e de leitura de arquivos PDF. A extração de dados é feita a partir dos boletins de cotações de pescado do site do CEASA/RJ, vinculado à Secretaria de Estado de Agricultura, Pecuária, Pesca e Abastecimento Rio de Janeiro (http://www.ceasa.rj.gov.br/ceasa_portal/).

Para a coleta das cotações diárias dos diferentes tipos de peixes, implementamos um web crawler e a leitura de arquivos PDF. Para esta implementação, selecionamos a linguagem de programação Python e utilizamos as bibliotecas requests, para a coleta de dados do site do Ceasa e pdfplumber, para a leitura e extração dos preços de interesse dos arquivos PDF. Os dados estão armazenados em um banco de dados no PostgreSQL.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
bd_req.py		bd_req.py
read_htmlsource.py		read_htmlsource.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pescarte-ceasa

About

Releases

Packages

Languages

sahudy/pescarte-ceasa

Folders and files

Latest commit

History

Repository files navigation

pescarte-ceasa

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages