Skip to content

Commit

Permalink
atualizacao do relatorio a partir de feedback do CNJ
Browse files Browse the repository at this point in the history
  • Loading branch information
jtrecenti committed Mar 4, 2023
1 parent 777cb59 commit b9ce8fe
Show file tree
Hide file tree
Showing 19 changed files with 643 additions and 28 deletions.
149 changes: 137 additions & 12 deletions data-raw/0-load.R
Original file line number Diff line number Diff line change
Expand Up @@ -2,13 +2,13 @@

# da <- readr::read_csv("Datajud.csv", lazy = TRUE)
#
# ler_coluna_json <- function(x) {
# if (is.na(x)) return(tibble::tibble())
# res <- jsonlite::fromJSON(x)
# if (length(res) == 0) return(tibble::tibble())
# if (is.data.frame(res)) res <- tibble::as_tibble(res)
# res
# }
ler_coluna_json <- function(x) {
if (is.na(x)) return(tibble::tibble())
res <- jsonlite::fromJSON(x)
if (length(res) == 0) return(tibble::tibble())
if (is.data.frame(res)) res <- tibble::as_tibble(res)
res
}
#
#
# da |>
Expand Down Expand Up @@ -118,9 +118,20 @@ da_partes_sirenejud <- da_raw |>
tidyr::unnest(partes) |>
janitor::clean_names()

readr::write_rds(da_partes_sirenejud, "data-raw/sirenejud/da_partes_sirenejud.rds")
da_partes_sirenejud_ativo <- da_raw |>
dplyr::semi_join(da_basicas_amazon, c("numprocess" = "id_processo")) |>
dplyr::transmute(
id_processo = numprocess,
partes = purrr::map(partes_at_list, ler_coluna_json, .progress = TRUE)
) |>
tidyr::unnest(partes) |>
janitor::clean_names()

readr::write_rds(da_partes_sirenejud, "data-raw/sirenejud/da_partes_sirenejud.rds")
readr::write_rds(da_partes_sirenejud, "inst/relatorios/da_partes_sirenejud.rds")
readr::write_rds(da_partes_sirenejud_ativo, "data-raw/sirenejud/da_partes_sirenejud_ativo.rds")
readr::write_rds(da_partes_sirenejud_ativo, "inst/relatorios/da_partes_sirenejud_ativo.rds")


## Baixo processamento (rodar)

Expand All @@ -135,6 +146,17 @@ am_legal <- readxl::read_excel("data-raw/misc/lista_de_municipios_Amazonia_Legal
area = area_int
)

desmatamento <- readr::read_csv("data-raw/misc/DesmatamentoMunicipios2021.txt") |>
janitor::clean_names() |>
dplyr::mutate(desmatado_pct = desmatado2021/area_km2) |>
dplyr::transmute(
id_municipio = as.character(cod_ibge),
area_prodes = area_km2,
desmatado = desmatado2021,
desmatado_pct
) |>
dplyr::distinct(id_municipio, .keep_all = TRUE)

da_basicas_amazon <- da_basicas |>
dplyr::filter(
!sgt_nm_classe %in% c("Termo Circunstanciado", "Inquérito Policial"),
Expand All @@ -152,11 +174,42 @@ da_basicas_amazon <- da_basicas |>
dplyr::filter(ano == 2010),
c("id_municipio" = "muni_id")
) |>
dplyr::left_join(am_legal, "id_municipio")
dplyr::left_join(am_legal, "id_municipio") |>
dplyr::left_join(desmatamento, "id_municipio")


readr::write_rds(da_basicas_amazon, "inst/relatorios/da_sirenejud.rds")

## Segundo grau SireneJud

da_basicas <- readr::read_rds("data-raw/sirenejud/da_basicas.rds")

da_basicas_amazon <- da_basicas |>
dplyr::filter(
!sgt_nm_classe %in% c("Termo Circunstanciado", "Inquérito Policial"),
st_grau == "G2"
) |>
dplyr::filter(loc_uf %in% c(amazon)) |>
munifacil::limpar_colunas(loc_muni, loc_uf) |>
munifacil::incluir_codigo_ibge(diagnostico = FALSE) |>
dplyr::left_join(
dplyr::select(abjData::muni, muni_id),
c("id_municipio" = "muni_id")
) |>
dplyr::left_join(
dplyr::select(abjData::pnud_min, muni_id, ano, pop) |>
dplyr::filter(ano == 2010),
c("id_municipio" = "muni_id")
) |>
dplyr::left_join(am_legal, "id_municipio") |>
dplyr::left_join(desmatamento, "id_municipio")


readr::write_rds(da_basicas_amazon, "inst/relatorios/da_sirenejud_2grau.rds")




# corrupcao ---------------------------------------------------------------

## Alto processamento (não rodar)
Expand Down Expand Up @@ -206,20 +259,23 @@ da_corrup_select <- da_corrup |>

readr::write_rds(da_corrup_select, "data-raw/corrupcao/da_corrup_select.rds")


## Baixo processamento (rodar)

da_corrup_select <- readr::read_rds("data-raw/corrupcao/da_corrup_select.rds")

rx_assuntos_drogas <- "3372|11355|11346|5566|9864|3553|3417|11315|3614|3548|5897|3608|3607|9859|5899|5898|5894|9858|9866|10987|5885|9861|5895|9865|5896|9860|5901|9862|9971|5900"
rx_assuntos_drogas <- "3372|11355|5566|3553|3417|3614|5885|5895|5896|9860|5901|9862|5900"

da_corrup_orgaos <- da_corrup_select |>
dplyr::mutate(orgao_julgador = as.numeric(orgao_julgador)) |>
dplyr::semi_join(
da_basicas_amazon,
da_sirenejud,
c("orgao_julgador" = "trib_co_orgao")
) |>
dplyr::distinct(numero, .keep_all = TRUE) |>
dplyr::filter(!classes %in% c("[278]", "[279]")) |>
dplyr::filter(!stringr::str_detect(assuntos, rx_assuntos_drogas)) |>
dplyr::filter(grau == "G1") |>
dplyr::mutate(
assuntos = stringr::str_extract(assuntos, "[0-9, ]+")
) |>
Expand Down Expand Up @@ -264,10 +320,79 @@ da_corrup_orgaos <- da_corrup_select |>
dt_baixa_complete = dplyr::if_else(st_encerrado, dt_baixa, as.Date("2022-12-07")),
st_tempo = as.numeric(dt_baixa_complete - dt_dist) / 30.25,
st_tempo = dplyr::if_else(st_tempo < 0, NA_real_, st_tempo)
)
) |>
dplyr::left_join(desmatamento, "id_municipio")

readr::write_rds(da_corrup_orgaos, "inst/relatorios/da_datajud.rds")

## Segundo grau DataJud

da_corrup_select <- readr::read_rds("data-raw/corrupcao/da_corrup_select.rds")

rx_assuntos_drogas <- "3372|11355|5566|3553|3417|3614|5885|5895|5896|9860|5901|9862|5900"

da_corrup_orgaos <- da_corrup_select |>
dplyr::mutate(orgao_julgador = as.numeric(orgao_julgador)) |>
dplyr::filter(
grau == "G2",
sigla %in% paste0("TJ", amazon)
) |>
# dplyr::semi_join(
# da_sirenejud,
# c("orgao_julgador" = "trib_co_orgao")
# ) |>
dplyr::distinct(numero, .keep_all = TRUE) |>
dplyr::filter(!classes %in% c("[278]", "[279]")) |>
dplyr::filter(!stringr::str_detect(assuntos, rx_assuntos_drogas)) |>
dplyr::mutate(
assuntos = stringr::str_extract(assuntos, "[0-9, ]+")
) |>
tidyr::separate_wider_delim(
cols = assuntos,
names = c("codigo", "assunto2"),
delim = ", ",
too_few = "align_start",
too_many = "merge",
) |>
dplyr::left_join(
dplyr::distinct(abjData::assuntos, codigo, .keep_all = TRUE),
c("codigo")
) |>
dplyr::mutate(
dplyr::across(
dplyr::starts_with("assunto_nome"),
\(x) dplyr::na_if(x, y = "-")
),
assunto = dplyr::coalesce(
assunto_nome6, assunto_nome5,
assunto_nome4, assunto_nome3,
assunto_nome2, assunto_nome1
)
) |>
dplyr::mutate(
pd_seq_orgao = as.character(orgao_julgador)
) |>
dplyr::left_join(obsCIEE::varas, "pd_seq_orgao") |>
dplyr::left_join(abjData::muni, c("id_municipio" = "muni_id")) |>
dplyr::left_join(
abjData::pnud_min |>
dplyr::filter(ano == 2010) |>
dplyr::select(muni_id, pop),
c("id_municipio" = "muni_id")
) |>
dplyr::left_join(am_legal, "id_municipio") |>
dplyr::mutate(
dt_baixa = as.Date(lubridate::ymd_hms(dt_baixa)),
dt_dist = as.Date(lubridate::ymd_hms(dt_dist)),
st_encerrado = !is.na(dt_baixa),
dt_baixa_complete = dplyr::if_else(st_encerrado, dt_baixa, as.Date("2022-12-07")),
st_tempo = as.numeric(dt_baixa_complete - dt_dist) / 30.25,
st_tempo = dplyr::if_else(st_tempo < 0, NA_real_, st_tempo)
) |>
dplyr::left_join(desmatamento, "id_municipio")

readr::write_rds(da_corrup_orgaos, "inst/relatorios/da_datajud_2grau.rds")

# amostra de processos ----------------------------------------------------

## Amostra antiga
Expand Down
52 changes: 52 additions & 0 deletions data-raw/1-rfb.R
Original file line number Diff line number Diff line change
Expand Up @@ -55,3 +55,55 @@ da_rfb <- todos_estab |>

readr::write_rds(da_rfb, "data-raw/rfb/da_rfb.rds")
readr::write_rds(da_rfb, "inst/relatorios/da_rfb.rds")


# CNPJ LIST (ativo) ---------------------------------------------------------------
da_partes_pj_ativo <- da_partes_sirenejud_ativo |>
dplyr::filter(tipo_pessoa == "JURIDICA") |>
dplyr::select(id_processo, nome, cnpj = numero_documento_principal) |>
dplyr::mutate(
nome = stringr::str_squish(nome),
nome = abjutils::rm_accent(nome)
)

da_partes_pj_cnpj_ativo <- da_partes_pj_ativo |>
dplyr::distinct(cnpj) |>
dplyr::filter(stringr::str_length(stringr::str_squish(cnpj)) == 14)

raiz_ativo <- da_partes_pj_cnpj_ativo |>
with(stringr::str_sub(cnpj, 1, 8)) |>
unique()

# download BQ (ativo) -------------------------------------------------------------

todos_estab_ativo <- tb |>
dplyr::filter(cnpj_raiz %in% local(raiz_ativo))

todos_estab_ativo <- todos_estab_ativo |>
dplyr::collect()

readr::write_rds(todos_estab_ativo, "data-raw/rfb/todos_estab_ativo.rds")

## Baixo processamento (rodar)

todos_estab_ativo <- readr::read_rds("data-raw/rfb/todos_estab_ativo.rds")
da_partes_sirenejud_ativo <- readr::read_rds("data-raw/sirenejud/da_partes_sirenejud_ativo.rds")

da_partes_pj_ativo <- da_partes_sirenejud_ativo |>
dplyr::filter(tipo_pessoa == "JURIDICA") |>
dplyr::select(id_processo, nome, cnpj = numero_documento_principal) |>
dplyr::mutate(
nome = stringr::str_squish(nome),
nome = abjutils::rm_accent(nome)
)

da_partes_pj_cnpj_ativo <- da_partes_pj_ativo |>
dplyr::distinct(cnpj) |>
dplyr::filter(stringr::str_length(stringr::str_squish(cnpj)) == 14)

da_rfb_ativo <- todos_estab_ativo |>
dplyr::mutate(cnpj = paste0(cnpj_raiz, cnpj_comp, cnpj_dv)) |>
dplyr::semi_join(da_partes_pj_cnpj_ativo, "cnpj")

readr::write_rds(da_rfb_ativo, "data-raw/rfb/da_rfb_ativo.rds")
readr::write_rds(da_rfb_ativo, "inst/relatorios/da_rfb_ativo.rds")
1 change: 1 addition & 0 deletions data-raw/9-desmatamento.R
Original file line number Diff line number Diff line change
@@ -0,0 +1 @@

Binary file modified inst/relatorios/2-descritiva.docx
Binary file not shown.
Loading

0 comments on commit b9ce8fe

Please sign in to comment.