Capítulo 2 Metodologia
Toda pesquisa jurimétrica passa necessariamente por três etapas: (a) listagem de processos, (b) coleta de dados e (c) análise estatística. A etapa da listagem envolve encontrar os números identificadores dos processos que fazem parte da pesquisa, considerando o escopo definido. Já a etapa de coleta exige acessar os processos através de seus números identificadores, obtendo as informações que são relevantes para o estudo. A terceira etapa envolve a análise estatística dos dados coletados, realizando os cruzamentos necessários para atingir os objetivos da pesquisa.
Antes de listar os processos, entretanto, devemos ter um escopo bem definido. No nosso caso, o escopo inicial considerou todas as recuperações judiciais no Rio Grande do Sul distribuídas a partir de 2010. Após a listagem de processos, o escopo foi adaptado para o período de janeiro de 2010 até agosto de 2020, excluindo processos distribuídos depois desse período, de forma que fosse possível a comparação das conclusões do Rio Grande do Sul, Rio de Janeiro, e São Paulo.
Uma vez definido o escopo, podemos passar à listagem de processos.
2.1 Listagem de processos
Ao final da aplicação de filtros automatizados e manuais, foram identificados 521 processos principais de recuperação judicial. Esses casos podem ser entendidos como uma amostra representativa do total de PRJs do Tribunal, suficiente para obtenção de resultados confiáveis na análise. Os casos não contemplados por essa metodologia usualmente apresentam dificuldades de acesso por DJEs ou outros problemas de documentação na classe, assunto e tipo de ação disponibilizadas na consulta processual.
Por causa da migração dos processos físicos para o sistema eletrônico (E-proc) que está acontecendo no TJRS, muitos processos tinham dois números, um para o E-proc e outro para o Themis. Assim, antes de chegarmos no número de 521 processos, tivemos um trabalho de conectar esses processos duplicados.
2.2 Coleta
A coleta de dados envolve a leitura dos documentos de todos os processos resultantes da aplicação dos filtros de escopo e o preenchimento de fichas de classificação. Para isso, adotou-se uma metodologia em três passos: (a) pré-teste, (b) classificação e (c) diagnóstico.
No pré-teste, foram analisados 47 casos no total, sendo cada processo analisado por cinco pesquisadores distintos. O objetivo do pré-teste é compreender questões com problemas de interpretabilidade ou alto grau de subjetividade e antecipar possíveis problemas do questionário. A partir do pré-teste, alguns aprimoramentos foram realizados no formulário de classificação final, como a remoção de questões que não poderiam ser respondidas a partir da análise dos autos. O pré-teste foi finalizado em maio de 2021.
Durante a etapa de classificação, cada pesquisador recebeu um conjunto de processos para analisar. Dessa vez, cada processo foi classificado por apenas uma pesquisadora ou pesquisador. O formulário de classificação aplicado utilizou tecnologia Google Forms, pela sua facilidade de integração com as ferramentas computacionais da ABJ. O formulário possui mais de 50 campos, sendo uma parte preenchida automaticamente com metadados do processo (como número do processo e classe processual) e parte se desdobrava em vários campos. O formulário também envolve planilhas Excel auxiliares para inclusão de todas as informações das partes, AGCs e características dos planos de recuperação. As planilhas possuem controle de entrada de informações, com categorias bem definidas para cada campo sempre que possível, com o objetivo de evitar inconsistências na análise dos dados. Os casos foram acessados através dos sistemas de consulta processual do TJRS: Themis e E-proc. Esta etapa foi realizada entre junho e outubro de 2021.
Algumas dificuldades foram enfrentadas nessa etapa de classificação. A primeira decorre de uma transição de sistemas no TJRS. Antigamente, utilizava-se o sistema Themis, no qual ficavam registradas as movimentações processuais dos processos físicos. Agora, os processos estão sendo cadastrados no sistema E-proc. Na transição de um sistema para o outro, houve algumas perdas de documentos em alguns processos, dificultando a análise, pois deixava lacunas. Além disso, havia o fato de que o sistema Themis não fornece acesso aos autos do processo, mas apenas às movimentações. Dessa forma, os processos que só existiam nesse sistema (ou seja, os processos que eram inteiramente físicos e que não foram digitalizados) tinham muitas lacunas. Não eram lacunas de documentos perdidos, mas eram lacunas de documentos que não eram possíveis de serem encontrados neste sistema. Os documentos faltantes nos processos físicos eram:
- Petição inicial das requerentes
- Balanços patrimoniais das empresas
- Termo de compromisso do AJ
- Relações de credores
- Plano de recuperação judicial
- Atas de assembleia de credores
- Quadro Geral de Credores
- Editais de leilão e seus respectivos autos de arrematação
Além dessas informações, tivemos problemas em alguns casos com informações que deveriam estar disponíveis, mas não estavam. Isso prejudicou principalmente a coleta de datas e, por consequência, a análise dos tempos dos processos. As informações que estavam ausentes eram:
- Data da emenda
- Data da decisão de deferimento da recuperação judicial
- Data das Assembleias Gerais de Credores (AGCs)
- Data de aprovação do plano
- Data de homologação e concessão da recuperação judicial
- Data da decisão de decretação de falência
- Data de encerramento da recuperação judicial
Durante a etapa de diagnóstico, a equipe montou a base de dados construída pelos pesquisadores e buscou inconsistências na classificação. Os procedimentos de detecção de inconsistências identificaram datas incoerentes, informações conflitantes e lacunas na base. Os processos com problemas retornaram aos pesquisadores e foram corrigidos. O resultado foi uma base de dados final, preparada para análise.
2.3 Análise
O fluxo de obtenção, arrumação e análise de dados segue o ciclo da ciência de dados, observado na Figura 2.1. O ciclo divide o processo de aprendizado analítico em seis etapas, descritas a seguir.
Primeiro, o formulário de classificação e as planilhas auxiliares são extraídas. Em seguida, os dados são arrumados, para mitigar problemas de padronização, obter as variáveis de interesse e excluir casos que estão fora do escopo de análise (no caso, a exclusão de recuperações judiciais que não estejam entre 2010 e 2020), produzindo o que se define como base de dados analítica. A base completa possui 521 casos, sendo que somente 505 foram considerados, de acordo com o recorte de processos distribuídos entre 2010 e 2020.
A base analítica foi então transformada para produzir as tabelas e gráficos e utilizada como insumo para o ajuste de modelos estatísticos. Finalmente, os resultados obtidos foram comunicados através do presente relatório e de um dashboard interativo, disponível no site do Observatório da Insolvência - Rio Grande do Sul.
O estudo envolveu majoritariamente análises descritivas, como tabelas e gráficos. O propósito das visualizações é explorar as principais perguntas da pesquisa e trazer sumários úteis para a discussão sobre os processos.
Para responder a algumas perguntas específicas, foi necessário utilizar modelos estatísticos. Modelos de análise de sobrevivência (Colosimo and Giolo 2006) foram utilizados para tratar adequadamente os tempos dos processos, que podem ser censurados por não apresentarem determinado evento de interesse no momento de coleta.
Todas as análises foram realizadas utilizando o software estatístico R, na versão 4.2.1. Os códigos que obtêm os resultados da pesquisa a partir da base de dados analítica são reprodutíveis, podendo ser utilizados em projetos futuros de atualização da base.