No presente projeto vou apresentar o trabalho final do curso de “Web scraping” da Curso-R. A ideia foi desenvolver ferramentas para raspar dados do Supremo Tribunal Federal (STF) e fazer algumas análises exploratórias preliminares e incipientes em cima destes dados. Espera-se, num futuro, desenvolver pacotes para análises mais profundas, inclusive em outros Tribunais.
Os feedbacks são muito bem vindos!
Vou aqui me ater ao Supremo Tribunal Federal, a Corte cuja atuação (e omissão…) causa o maior impacto social, político e econômico em nossa sociedade.
Mais especificamente, analisar as causas que envolvem diretamente o controle concentrado de constitucionalidade. Isso é, examinaremos as classes processuais relativas a:
- Ação Direta de Inconstitucionalidade (ADI),
- Ação Declaratória de Constitucionalidade (ADC),
- Ação Declaratória de Inconstitucionalidade por Omissão (ADO) e
- Arguição de Descumprimento de Preceito Fundamental (ADPF).
Essas classes processuais representam a atividade mais tradicional e típica de um Tribunal Constitucional em sua concepção clássica. Faz sentido, então, prestigiar e analisar a atuação do STF sob esse aspecto. (Não se ignore que o Supremo Tribunal Federal brasileiro tem competências que vão muito além disso, mas isso é papo para outro projeto…).
Ainda, é possível verificar nessas ações como se dão conflitos relevantes não apenas entre sociedade civil e poder público mas também entre os Poderes Legislativo e Executivo bem como evidencia a atuação da Procuradoria-Geral da República.
Durante a pandemia, também, essas ações têm sido especialmente importantes para definição de esferas de responsabilidade (vide ADPF 722), a discussão sobre o plano de vacinação, etc, etc.
A ideia é mapear aspectos como quantidade de ações por tipo/ano, quais os principais litigantes dessas ações (considerando-se os poucos legitimados para tanto), quais os principais temas dessas ações, as palavras-chave mais utilizadas nas petições iniciais, etc.
Com os dados ora obtidos espera-se poder realizar todas essas análises (e várias outras), ainda que a limitação de tempo até a entrega final provavelmente não permita esgotá-las.
Justifica-se a utilidade tendo-se em vista a importância (crescente?) do STF no cotidiano, não só das pessoas em carreiras jurídicas mas também da academia e das cidadãs e cidadãos comuns.
Trata-se de serviço público (cujo acesso à justiça é, inclusive, previsto na Constituição Federal) que, a despeito de sua importância, ainda é um ilustre desconhecido…
(E, sabemos, o juridiquês em nada ajuda: torço para que por meio da ciência de dados seja possível melhor compreender e melhor explicar o que faz o STF.)
De outro lado, não existe ainda disponibilizados dados abertos desse Tribunal e tampouco existe API pública e documentada que viabilize extração ordenada de dados. Portanto, até o momento, raspar os dados utilizando as técnicas aprendidas no curso é uma opção necessária e viável no presente caso.
Por fim, reitere-se que os processos judiciais são públicos por força do artigo 93, IX da Constituição Federal, que determina que “todos os julgamentos do Poder Judiciário serão públicos”. Também, tomei o cuidado de fazer as requisições mais volumosas durante a madrugada a fim de não onerar o servidor: seria uma triste ironia ser processado por sobrecarregar o Tribunal…
O portal do STF pode ser acessado pelo seguinte endereço: http://portal.stf.jus.br/ que dá acesso direto à home. Lá, no topo da página, é possível realizar a consulta por processos:
A ferramenta de consulta é um formulário que permite que se preencha a classe processual escolhida e o número. Na sequência, de forma invisível, o site irá identificar o número de “incidente” e nos redirecionar para a ferramente de busca interna (uma espécie de “API escondida”) que nos dará dados como os andamentos e as partes:
Outra das abas possiveis de ser analisada é a de “Peças processuais” que dá efetivo acesso a uma espécie de “pasta virtual” dos procesos, permitindo visualizar documentos, petições e decisões judiciais.
(Quem teve o desprazer de manusear os autos de processos físicos ao ver hoje o processo virtual ser uma realidade chega a dar um suspiro de alívio)
É através dessas páginas, portanto, que poderemos navegar e extrair dados para as análises futuras.
Vou explicar brevemente os passos que adotei para poder realizar a raspagem das ações de controle concentrado. Basicamente, foram:
- Lista de ações existentes
- Obtenção do número localizador de cada ação (número de incidente)
- Raspagem dos dados de parte
- Raspagem dos andamentos
- Acessar “pasta virtual” do caso
- Localizar a petição inicial
- Baixar o arquivo .pdf
a seguir mais detalhadamente cada uma delas.
O primeiro passo foi localizar uma lista de processos das classes escolhidas (ADPF, ADC, ADO e ADI) que sejam efetivamente existentes. Uma informação importante é que os números das ações no STF são sequenciais, por força de seu regimento.
Isso quer dizer que as ações propostas receberão um número de acordo com a ordem de sua propositura: a primeira ação de uma classe (uma ADI, por exemplo) será número 1, a segunda número 2 e assim sucessivamente.
Seria possível, então, iniciar a busca pela primeira ação de cada uma das classes e iterar indefinidamente até localizar as mais recentes.
Contudo, aproveitou-se o fato de que o Tribunal possui um painel de
estatística que contem um link para uma tabela em formado .xlsx
contendo todos os casos distribuídos ou autuados desde 2000.
Optou-se por utilizar a tabela de casos autuados pois a distribuição é uma fase posterior, que pode levar alguns dias para ocorrer ou, mesmo, sequer acontecer.
Verificou-se que esse link era estático e, portanto, não seria necessário atualizá-lo com frequência. Assim, foi criada uma função que baixa diretamente esse arquivo.
A tabela de casos disponibilizada pelo Tribunal, embora útil, não contém todas as informações que são desejáveis para uma análise mais aprofundada.
Por isso, não basta saber “quais” são os números das ações: é preciso também localizar o código de incidente, que nos leva até a página que efetivamente contém os dados.
Como esse é um número interno do sistema e, portanto, absolutamente arbitrário, é preciso descobri-lo caso a caso.
A melhor forma de fazer isso foi simular uma requisição da seguinte forma, criando uma função que recebe como parâmetros a classe e o número do processo:
# url da página
u_stf_listar <- "http://portal.stf.jus.br/processos/listarProcessos.asp"
# query que busca classe e numero
q_stf_listar <- list("classe" = classe,
"numeroProcesso" = numero)
# requisição
r_stf_listar <- httr::GET(u_stf_listar,
query = q_stf_listar)
Realizando essa requisição, sou redirecionado para a página com os dados do processo, cujo url conterá o número de incidente. Assim, extraio esse número da resposta:
Iterando isso para cada um dos processos que desejo, salvo o resultado numa tabela auxiliar, salva em .rds para uso futuro:
#> # A tibble: 6 x 3
#> classe numero incidente
#> <chr> <dbl> <chr>
#> 1 ADC 9 1948617
#> 2 ADC 10 2221383
#> 3 ADC 11 2338671
#> 4 ADC 12 2358461
#> 5 ADC 13 2383568
#> 6 ADC 14 2415705
Obtido o número de incidente, posso simular uma requisição para obter informações.
Observando mais atentamente as requisições, porém, observo que o site abre uma série de páginas menores que fazem também referência ao número do incidente.
Essas páginas, do tipo XHR, se mostraram muito mais simples de serem
salvas localmente e raspadas. Por isso, foram elas as utilizadas para
criar uma função denominada baixar_dados_processo
que recebe o
incidente, busca as abas de meu interesse (nesse caso, as relativas a
partes e andamentos) e as salva em disco caso já não existam.
Após salvar em disco o resultado da requisição para a aba relativa às
partes, foi criada a função ler_aba_partes
que, recebendo o número do
incidente, localiza o arquivo adequado e realiza a leitura.
Como os dados são bem estruturados no arquivo html
, conseguimos montar
uma tabela contendo a natureza de cada uma das partes (requerente,
requerida/o, interessada/o, amicus curiae) e seus respectivos
representantes.
#> # A tibble: 22 x 3
#> incidente tipo nome
#> <chr> <chr> <chr>
#> 1 5833114 REQTE PARTIDO SOCIALISMO E LIBERDADE (P-SOL)
#> 2 5833114 ADV ANDRE BRANDAO HENRIQUES MAIMONI (29498/DF, 7040/O/MT) E OUTR~
#> 3 5833114 INTDO GOVERNADOR DO ESTADO DO RIO DE JANEIRO
#> 4 5833114 PROC PROCURADOR-GERAL DO ESTADO DO RIO DE JANEIRO
#> 5 5833114 INTDO ASSEMBLEIA LEGISLATIVA DO ESTADO DO RIO DE JANEIRO
#> 6 5833114 ADV SEM REPRESENTAÇÃO NOS AUTOS
#> 7 5833114 INTDO SINDICATO DOS SERVIDORES DA CARREIRA SOCIOEDUCATIVA DO ESTAD~
#> 8 5833114 ADV RENATA MAIA SERRA (137788/RJ)
#> 9 5833114 ADV NATALIE AFONSO TOLEDO (196254/RJ)
#> 10 5833114 AM DEFENSORIA PÚBLICA DO ESTADO DO RIO DE JANEIRO
#> # ... with 12 more rows
Procedimento semelhante é feito para os andamentos. Foi criada a função
ler_aba_andamento
que, recebendo o número do incidente, irá buscar o
arquivo já salvo em disco.
Será lida a data e o nome de cada andamento e montada uma tabela estruturada com essas informações, sempre indexidadas com o número do incidente:
#> # A tibble: 36 x 3
#> incidente data andamento
#> <chr> <date> <chr>
#> 1 5833114 2020-09-10 Publicação, DJE
#> 2 5833114 2020-09-09 Conclusos ao(à) Relator(a)
#> 3 5833114 2020-09-09 Certidão
#> 4 5833114 2020-09-09 Deferido
#> 5 5833114 2020-08-26 Petição
#> 6 5833114 2020-07-28 Publicação, DJE
#> 7 5833114 2020-07-24 Conclusos ao(à) Relator(a)
#> 8 5833114 2020-07-24 Certidão
#> 9 5833114 2020-07-24 Deferido
#> 10 5833114 2020-07-17 Conclusos ao(à) Relator(a)
#> # ... with 26 more rows
Há uma aba específica com as peças processuais disponíveis ao público. Ela leva a uma outra página, como vimos, acima, onde os documentos listados se encontram.
O formato dessa página é bem mais complexo que as demais, porém felizmente ela também é acessível por meio do incidente.
Ela possui um painel de navegação contendo links para todos os documentos que, ao clicar, fazem com que seja aberto na página ao lado.
Uma vez aberta a pasta virtual podemos extrair todos os documentos disponíveis por lá. Contudo, para esse projeto vamos extrair somente a petição inicial que é a peça processual que define o objeto da causa.
Como o nome já diz, ela que inicia o processo e, portanto, é esperado
que seja um dos primeiros documentos linkados. Verificamos no código
fonte que todos os links de documentos continham texto explicativo do
que se tratava e todos fazem referência a uma função javascript
(que
deve ter relação com a visualização do documento).
Assim, foi necessário localizar os hyperlinks e, dentre esses, os que fazem menção expressa a “petição inicial”. Por segurança, caso nenhum documento seja localizado, iremos buscar o primeiro documento listado (afinal, é razoável supor que a inicial é a primeira das peças).
Localizado o link, capturamos a que página ele se redireciona e, assim, obtemos o link para a petição em si.
Foi criada a função baixar_pet_inicial
que, recebendo o número do
incidente, faz as etapas descritas acima e salva em disco o arquivo
.pdf.
Da mesma maneira, a função ler_pdf_inicial
busca a petição já baixada
relativa ao incidente indicado e faz a leitura da mesma, retornando uma
string com seu conteúdo.
#> # A tibble: 1 x 2
#> incidente texto_inicial
#> <chr> <chr>
#> 1 5833114 Assinado de forma digital ANDRE BRANDAO por ANDRE BRANDAO HENRIQUES~
Para os fins desse traballho, foram selecionadas todas as ações autuadas a partir de 2000 (primeiro ano disponibilizado na listagem do STF) até 04/12/2020. Foram salvos dados sobre as ações em si (direto do STF), os respectivos números de incidente, as partes, os andamentos, e a petição inicial.
Na pasta /data
foram salvos arquivos .rds contendo esses dados. São os
seguintes:
É a tabela que salva a correspondência entre classe e número (informações conhecidas) com a do incidente (informação desconhecida).
#> # A tibble: 6 x 3
#> classe numero incidente
#> <chr> <dbl> <chr>
#> 1 ADC 9 1948617
#> 2 ADC 10 2221383
#> 3 ADC 11 2338671
#> 4 ADC 12 2358461
#> 5 ADC 13 2383568
#> 6 ADC 14 2415705
Coluna | Descrição |
---|---|
classe | Classe processual (ADI, ADC, ADO ou ADPF) |
numero | Número sequencial daquele processo |
incidente | Localizador numérico do processo no sistema interno do STF |
Relaciona as partes para todos os processos da base.
Ela está em um formato em que o número do incidente é repetido para cada linha. A ideia é que seja possível filtrar, agrupar, pivotar e realizar join de acordo com a necessidade de cada análise.
#> # A tibble: 6 x 3
#> incidente tipo nome
#> <chr> <chr> <chr>
#> 1 1948617 REQTE PRESIDENTE DA REPÚBLICA
#> 2 1948617 ADV ADVOGADO-GERAL DA UNIÃO
#> 3 2221383 REQTE DINETE LESSA
#> 4 2221383 ADV ADRIANO FERNANDES
#> 5 2338671 REQTE GOVERNADOR DO DISTRITO FEDERAL
#> 6 2338671 ADV PROCURADOR-GERAL DO DISTRITO FEDERAL
Coluna | Descrição |
---|---|
incidente | Localizador numérico do processo no sistema interno do STF |
tipo | Que qualidade a parte ocupa no processo (ex. requerente, requerida, advogada, amicus curiar, etc) |
nome | Nome da parte |
Relaciona os andamentos para todos os processos da base.
Assim como a anterior, está em um formato em que o número do incidente é repetido para cada linha. A ideia é que seja possível filtrar, agrupar, pivotar e realizar join de acordo com a necessidade de cada análise.
#> # A tibble: 6 x 3
#> incidente data andamento
#> <chr> <date> <chr>
#> 1 1948617 2004-09-03 BAIXA AO ARQUIVO DO STF
#> 2 1948617 2004-09-03 PUBLICADA DECISÃO NO DJ
#> 3 1948617 2004-09-03 PUBLICADA DECISÃO NO D.O.U.
#> 4 1948617 2004-08-31 TRANSITADO EM JULGADO
#> 5 1948617 2004-04-26 JUNTADA DE CÓPIA AUTENTICADA DE MANDADO DE INTIMAÇÃO DEV~
#> 6 1948617 2004-04-26 JUNTADA DE CÓPIA AUTENTICADA DE MANDADO DE INTIMAÇÃO DEV~
Coluna | Descrição |
---|---|
incidente | Localizador numérico do processo no sistema interno do STF |
data | Data em que ocorreu o andamento |
nome | Andamento em si |
Relaciona o inteiro teor das petições para todos os processos da base de acordo com a leitura que foi possível realizar.
Assim como a anterior, está em um formato em que o número do incidente é repetido para cada linha. A ideia é qie seja possível filtrar, agrupar, pivotar e realizar join de acordo com a necessidade de cada análise.
Por ser um texto extenso, é a única que está compactada. Ela também foi
pré-processada com o pacote {pdftools}
para que fosse colapsada em
apenas uma única grande string. Caso a petição seja uma imagem (mais
comum com os processos mais antigos) a leitura não será feita.
#> # A tibble: 6 x 2
#> incidente texto_inicial
#> <chr> <chr>
#> 1 5902221 "AlessandraJirardi - Advogada EXCELENTÍSSIMO SENHOR DOUTOR MINISTRO~
#> 2 5902367 "EXCELENTÍSSIMO SENHOR MINISTRO PRESIDENTE DO SUPREMO TRIBUNAL FEDE~
#> 3 5989626 "SÉRGIO VICTOR ADVOCACIA EXCELENTÍSSIMO SENHOR MINISTRO PRESIDENTE ~
#> 4 6012085 "SÉRGIO VICTOR ADVOCACIA EXCELENTÍSSIMO SENHOR MINISTRO LUIZ FUX PR~
#> 5 6025884 "EXCELENTÍSSIMO(A) SENHOR(A) MINISTRO PRESIDENTE DO SUPREMO TRIBUNA~
#> 6 6062188 "EXCELENTÍSSIMO SR. MINISTRO PRESIDENTE DO SUPREMO TRIBUNAL FEDERAL~
Coluna | Descrição |
---|---|
incidente | Localizador numérico do processo no sistema interno do STF |
texto_inicial | String colapsada contendo todo o teor da petição inicial |
Não extraída diretamente do STF, mas decorrente de um pré-processamento do texto da petição inicial, ela relaciona as palavras mais frequentes em cada petição inicial.
É uma primeira experiência para futura aplicação de técnicas de modelagem de texto. Ainda está sujeita a muitas melhorias e serve, por enquanto, apenas enquanto protótipo.
Pode ajudar a identificar o assunto levado à Corte.
#> # A tibble: 6 x 2
#> incidente palavra
#> <chr> <chr>
#> 1 5902221 republica, federal, paulo, presidente, policia, constituicao, artig~
#> 2 5902367 º, honorarios, valor, federal, conselho, causa, constitucional, faz~
#> 3 5989626 nº, contribuicoes, constituicao, º, contribuicao, federal, constitu~
#> 4 6012085 trabalho, periculosidade, adicional, nº, superior, litros, º, decis~
#> 5 6025884 nº, cidadao, constitucional, constituicao, artigo, constitucionalid~
#> 6 6062188 º, trabalho, tempo, horas, jornada, nº, transporte, motorista, desc~
Coluna | Descrição |
---|---|
incidente | Localizador numérico do processo no sistema interno do STF |
palavra | Lista das 10 palavras mais frequentes no documento |
Semelhante à anterior, porém em formato de list column. Ou seja, está
aninhado à cada incidente um data frame
com a lista das palavras mais
frequentes e sua respectiva quantidade.
#> # A tibble: 6 x 2
#> incidente palavra
#> <chr> <list>
#> 1 5902221 <tibble [1 x 1]>
#> 2 5902367 <tibble [1 x 1]>
#> 3 5989626 <tibble [1 x 1]>
#> 4 6012085 <tibble [1 x 1]>
#> 5 6025884 <tibble [1 x 1]>
#> 6 6062188 <tibble [1 x 1]>
Coluna | Descrição |
---|---|
incidente | Localizador numérico do processo no sistema interno do STF |
palavra | Data frame contendo duas colunas: token (com a palavra) e n (com sua quantidade) |
Sem qualquer pretensão de esgotar o tema, faremos aqui algumas poucas análises exploratórias apenas para ilustrar o potencial do tema e mostrar a beleza que é o mundo jurídico (especialmente quando a ele se olha pela lente dos dados).
O primeiro aspecto que podemos observar é a quantidade de ações de controle concentrado de constitucionalidade ao longo dos anos. Abaixo, sem fazer distinção de qual categoria, vamos ver como se deu essa distribuição:
Aqui não estamos preocupados com o “saldo” de ações, ou seja, o gráfico acima não é afetado pela produtividade do Tribunal mas indica como variou a “procura” pela sua tutela constitucional ao longo do período.
E chama muito a atenção a tendência acentuada no aumento ao longo dos últimos anos, em especial a partir de 2019. Uma hipótese para esse aumento é o cenário de crise institucional presente no país desde a eleição do atual Presidente da República.
Como já noticiado, é uma característica de seu governo o excesso de Decretos editados, muitas vezes indo além dos limites legais. Já noticiou o UOL que, antes de terminado o primeiro semestre de 2019, já havia mais de 30 medidas questionadas no STF. Alguns veículos, como o Estadão, apontam uma espécie de estratégia da oposição de ir mais frequentemente ao Supremo contra atos da Presidência, sobretudo face um estado de tensão entre os Poderes.
Outra explicação, agravada pelo contexto acima descrito, é a pandemia de COVID-19 que enfrentamos nesse momento. Veja-se que, mesmo antes de encerrado o ano de 2020, esse ano já é recordista em ações constitucionais propostas,
Um outro aspecto interessante é observar quais os instrumentos vêm sendo mais utilizados dentre os 4 normalmente disponíveis no âmbito do controle de constitucionalidade.
Veremos abaixo a evolução de cada uma das classes ao longo dos últimos anos:
Percebe-se, naturalmente, uma prevalência da ADI, que se mantem constante, bem como uma baixa utilização da ADC e da ADO, que foram melhor regulamentadas ao longo do início dos anos 2000. Chama a atenção, contudo, como evoluiu - sobretudo nos últimos anos - a utilização da ADPF.
Isso é curioso justamente por ser uma característica dessa ação a subsidiariedade. Ou seja, ela deveria ser residual em seu cabimento. Algumas hipóteses que podem explicar esse crescimento são uma maior criatividade dos proponentes, que vêm se ancorando em teses como a do “estado de coisas inconstitucional” a exemplo do utilizado nas ADPFs 347, 635, 709 e 760.
Sabemos que as ações de controle concentrado possuem um rol estreito de legitimados à sua propositura e que é previsto no artigo 103 da Constituição Federal. Basicamente, são esses:
- Presidente da República e Governadores,
- Poder Legislativo (Câmara dos Deputados, Senado, Assembléias Legislativas e Distrital),
- Procuradoria-Geral da República,
- Conselho Federal da OAB,
- Partidos políticos com representantes no Congresso Nacional,
- Confederações sindicais ou entidades de classe de âmbito nacional.
Como se vê, basicamente são membros do Executivo (Presidente/Governadores), do Legislativo e o chefe do Ministério Público. Ao lado deles, os partidos políticos, a representação da Advocacia e alguns poucos representantes da sociedade civil organizada (como os sindicatos e as entidades de classe nacionais). Há, portanto, uma grande primazia de órgãos/autoridades públicas e grandes “conglomerados” da sociedade civil que detém essa legitimidade.
Podemos observar, então, como ao longo dos últimos 5 anos tem sido o comportamento desses proponentes:
Pensando no momento peculiar em que vivemos, uma aspecto interessante a observar é como se deu a atuação dos proponentes ao longo desse ano. Vejamos:
Podemos ver que a atuação dos Estados e DF (via Governadores) se deu de forma mais intensa no início do ano, enquanto a OAB atuou de forma mais contundente nos primeiros meses da pandemia.
As organizações da sociedade civil e os partidos tiveram atuação intensa durante todo o ano, com picos nas fases iniciais da pandemia.
A Presidência da República, quando agiu, foi apenas no meio do ano. A PGR, por sua vez, teve atuação mais destacada no inicio da pandemia e mais recentemente, em novembro.
Embora quase residual em termos de competência para atuação, as organizações da sociedade civil (OSC), compreendendo sindicatos, confederações, etc têm tido atuação expressiva e de grande importância nos últimos anos. Da mesma forma, os partidos políticos têm se mostrado bastante combativos no âmbito do STF.
Uma nota importante é que, ao contrário dessas associações, os Partidos políticos possuem a chamada “legitimidade universal” e, por isso, em tese podem apresentar ações em qualquer tema enquanto as OSCs apenas nos temas que dizem respeito direto aos seus associados.
Veremos algumas dessas entidades que têm litigado pertante o Supremo Tribunal Federal.
Abaixo lista de quais partidos mais apresentaram ações. Um grande destaque para os Partidos tradicionalmente tidos como de esquerda.
nome | n |
---|---|
PARTIDO SOCIALISTA BRASILEIRO PSB | 85 |
PARTIDO DEMOCRATICO TRABALHISTA PDT | 84 |
PARTIDO SOCIALISMO E LIBERDADE PSOL | 84 |
PARTIDO SOCIAL LIBERAL PSL | 80 |
PARTIDO DA SOCIAL DEMOCRACIA BRASILEIRA PSDB | 76 |
PARTIDO DOS TRABALHADORES | 68 |
REDE SUSTENTABILIDADE | 64 |
PARTIDO DEMOCRATICO TRABALHISTA | 54 |
SOLIDARIEDADE | 48 |
PARTIDO TRABALHISTA BRASILEIRO PTB | 40 |
Aqui as associações que mais apresentaram ações de controle concentrado no STF. Destaque para associações ligadas à carreiras jurídicas.
nome | n |
---|---|
ASSOCIACAO DOS MAGISTRADOS BRASILEIROS AMB | 104 |
CONFEDERACAO NACIONAL DA INDUSTRIA | 78 |
ASSOCIACAO NACIONAL DOS MEMBROS DO MINISTERIO PUBLICO CONAMP | 63 |
CONFEDERACAO NACIONAL DO COMERCIO DE BENS SERVICOS E TURISMO CNC | 51 |
CONFEDERACAO BRASILEIRA DE TRABALHADORES POLICIAIS CIVIS COBRAPOL | 46 |
ASSOCIACAO NACIONAL DAS OPERADORAS CELULARES ACEL | 45 |
CONFEDERACAO NACIONAL DO COMERCIO CNC | 43 |
ASSOCIACAO DOS NOTARIOS E REGISTRADORES DO BRASIL ANOREGBR | 42 |
CONFEDERACAO DOS SERVIDORES PUBLICOS DO BRASIL CSPB | 41 |
ASSOCIACAO NACIONAL DOS MAGISTRADOS ESTADUAIS ANAMAGES | 37 |
Sabemos que uma das razões que mostram um pico de casos em 2020 são as implicações em todos os níveis que a pandemia de COVID-19 nos trouxe.
Dúvidas sobre os limites federativos, questionamento de atos legislatios ou executivos, omissão do Governo Federal, etc foram algumas das muitas questões levadas à Corte.
Veremos a seguir a proporção de ações relativas à pandemia em relação aos demais temas ao longo dos meses de janeiro até o fim de novembro de 2020:
Vemos que, efetivamente, a partir de março esse foi um dos grandes temas que chegaram até a Corte, evidenciando sua importância inclusive no âmbito jurídico e político.
Nos meses de maio e julho, inclusive, essas ações relacionadas à pandemia foram mais frequentes do que os otros temas reunidos.
Vamos observar, brevemente, quais foram os legitimados que mais trouxeram o tema para a Corte:
Se relacionando de alguma maneira com a tendência de serem os protagonistas em número de ações, também quanto à COVID os partidos e as OSC foram recordistas de ações.
Por fim, encerrando o projeto, foi feita uma incipiente e exploratória análise das palavras mais comuns nas ações relacionadas a COVID e as que se dão em outros temas.
Trata-se, muito mais, de um mínimo produto viável para verificar os termos mais frequentes com cada tema e, naturalmente, não é possível concluir quase nada. Divide-se esse intento com a comunidade na esperança de feedbacks e sugestões de como aprimorar essa análise no futuro.
Vemos que nas ações relativas ao COVID-19 aparce, - além de “saúde” - termos como indígenas, quilombolas, povos, dados, proteçao, efeitos, etc, que podem sugerir que a tutela requerida ao Supremo é no sentido de buscar proteção para as consequências do contexto, tendo em mente também grupos vulnerabilizados.
De outro lado, nos casos relativos a outros temas, vemos expressões como trabalho, Amazônia, decreto, ambiente, e recursos. Provavelmente temas da agenda ambiental, sobre aspectos trabalhistas e financeiros foram levados ao Tribunal ao longo desse ano.
É também possível observar como variam as palavras mais usadas conforme a categoria do proponente. Foram separadas as palavras mais usadas por cada uma delas e plotadas as nuvens abaixo.
Podemos formular algumas hipóteses sobre a atuação de cada um desses grupos?
Provavelmente nada muito contundente por enquanto, mas pode ser interessante aplicar a esses dados técnicas mais aguçadas de mineração de texto.
A título especulativo, destacaria que parece interessante o fato de partidos políticos terem destacados termos como saúde, segurança, infraestrutura e eleitoral. Lembrando do falado acima, a legitimidade universal sugere que esse grupo leva à Corte temas diversos.
De outro lado, as organizações da sociedade civil - nas quais, como vimos, se destacam as entidades de classe de servidores públicos - têm entre os destaques os termos competência, servidores, regime, cargo, concessão, e outros sugestivos de matéria precipuamente de direito administrativo. Estariam essas entidades levando ao STF primordialmente temas relativos a direitos e deveres de suas categorias?
A Ordem dos Advogados do Brasil em destaque para termos como advogados, princípio, pagamento, recursos, custas, valores e competência, possivelmente relacionados a questões tributárias, de processo e exercício da atividade da advocacia.
A PGR traz com frequência termos como código, normas, competência, administração, cargos e outras expressões também bastante relacionadas ao direito público (embora o termo civil também seja bastante destacado).
As palavras referentes à Presidência da República são bem pouco conclusivas, pois traz expressões como ADPF, princípio, relator, preceitos, expressão que são muito inerentes à retórica jurídica: ou seja, são expressões esperadas em qualquer tipo de ação constitucional, sendo difícil dizer a que argumentos de mérito podem estar relacionados. Contudo, há destaque grande para as expressões exercício e liberdade. O que poderá significar?
Por fim, as expressões destacadas para Governadores indicam grande vínculo a matérias administrativas: assembleia e legislativa pode sugerir que a maior parte das ações digam respeito a normas Estaduais (aprovadas pela “Assembleia Legislativa”). Curiosamente, se nota dois nomes próprios: Jose e Silva, que provavelmente dizem respeito ao jurista José Afonso da Silva - uma referência no âmbito do direito constitucional brasileiro.
O presente projeto, mais do que concluir e aplicar as ótimas lições recebidas, pretende ser o pontapé de mais análises no campo da jurimetria e no web scrap.
Espera-se os feedbacks para ajudar na evolução do projeto, que serão incorporados nas medidas da possibilidade do aprendiz-autor.
- Correção de bugs e incorporação dos feedbacks
- Transformar em pacote
- Construir painéis de monitoramento das ações mais recentes
- Automatizar análises com GitHub Actions
- Aplicar modelos de tópicos e outras técnicas de mineração de texto
- Explorar e validar algumas das hipóteses sugeridas aqui
- etc, etc, etc….