3.7 Usando o dje
para listar processos
O pacote dje
baixa e lê diários de justiça eletrônicos. Com ele é possível baixar os PDFs e arrumá-los para obter uma base semi-estruturada.
A função dje::download_dje()
baixa os diários referentes a um dia. No TJSP, temos seis cadernos do diário, que são salvos em arquivos separados:
11
: Judicial - 2a instância12
: Judicial - 1a instância - capital18
: Judicial - 1a instância - interior parte 113
: Judicial - 1a instância - interior parte 215
: Judicial - 1a instância - interior parte 314
: Editais e Leilões
dje::download_dje("TJSP", dates = "2018-01-12", path = "data-raw/dje")
3.7.1 Exercício
- O que acontece quando você tenta baixar um DJE de um dia num final de semana ou feriado?
3.7.2 Parse DJE
Para parsear o DJE, primeiro você precisa transformar os PDF em textos:
dje::dje_to_text("data-raw/dje/tjsp_dje_2018-01-12")
E depois você aplica a função dje::parse_dje_tjsp()
para ler os textos
# para pegar somente 1a instancia
patterns <- glue::glue("_{c(12, 13, 15, 18)}_") %>%
glue::collapse("|")
#arquivos
dje_files <- dir("data-raw/dje/tjsp_dje_2018-01-12_txt",
full.names = TRUE, pattern = patterns)
# veremos purrr nas próximas aulas!
d_dje <- purrr::map_dfr(dje_files, dje::parse_dje_tjsp)
glimpse(d_dje)
#> Observations: 11,799
#> Variables: 3
#> $ classe <chr> "\nFórum João Mendes Júnior\n", "\nFórum João Mendes...
#> $ valor <chr> "\nDistribuidor Cível\n", "\nDistribuidor Cível\n", ...
#> $ processos <chr> "\nDistribuidor Cível\nRELAÇÃO DOS FEITOS CÍVEIS DIS...