3.7 Usando o dje para listar processos

O pacote dje baixa e lê diários de justiça eletrônicos. Com ele é possível baixar os PDFs e arrumá-los para obter uma base semi-estruturada.

A função dje::download_dje() baixa os diários referentes a um dia. No TJSP, temos seis cadernos do diário, que são salvos em arquivos separados:

  • 11: Judicial - 2a instância
  • 12: Judicial - 1a instância - capital
  • 18: Judicial - 1a instância - interior parte 1
  • 13: Judicial - 1a instância - interior parte 2
  • 15: Judicial - 1a instância - interior parte 3
  • 14: Editais e Leilões
dje::download_dje("TJSP", dates = "2018-01-12", path = "data-raw/dje")

3.7.1 Exercício

  1. O que acontece quando você tenta baixar um DJE de um dia num final de semana ou feriado?

3.7.2 Parse DJE

Para parsear o DJE, primeiro você precisa transformar os PDF em textos:

dje::dje_to_text("data-raw/dje/tjsp_dje_2018-01-12")

E depois você aplica a função dje::parse_dje_tjsp() para ler os textos

# para pegar somente 1a instancia
patterns <- glue::glue("_{c(12, 13, 15, 18)}_") %>% 
  glue::collapse("|")

#arquivos
dje_files <- dir("data-raw/dje/tjsp_dje_2018-01-12_txt", 
                 full.names = TRUE, pattern = patterns)

# veremos purrr nas próximas aulas!
d_dje <- purrr::map_dfr(dje_files, dje::parse_dje_tjsp)

glimpse(d_dje)
#> Observations: 11,799
#> Variables: 3
#> $ classe    <chr> "\nFórum João Mendes Júnior\n", "\nFórum João Mendes...
#> $ valor     <chr> "\nDistribuidor Cível\n", "\nDistribuidor Cível\n", ...
#> $ processos <chr> "\nDistribuidor Cível\nRELAÇÃO DOS FEITOS CÍVEIS DIS...