Boxplot
Começamos a fazer o boxplot pela caixa central. Ela consiste nos três quartis: o quartil inferior (ou quantil de 25%), a mediana (ou quantil de 50%) e o quartil superior (ou quantil de 75%).
Depois da caixa central, adicionamos os bigodes. Os bigodes se iniciam nos quartis inferior e superior e se estende até, no máximo 3/2*IQR depois.
Apesar dos bigodes poderem se estender até 3/2*IQR unidades depois dos quartis, eles param no maior valor encontrado nos dados que esteja dentro da região do bigode.
Uma vez delimitado o fim dos bigodes, vamos para o último elemento dos boxplots: os pontos. Os pontos são todas as observações que estão além do fim dos bigodes.
São 5 informações de que precisamos (máximo, mínimo, mediana, quartil superior e inferior), e outras 7 medidas decorrentes dessas 5 (IQR, o limite superior do bigode, o limite inferior do bigode, o ponto superior, o ponto inferior e os potenciais outliers nos limites inferior e superior)
MEDIDAS | PARTE BOXPLOT | VALORES |
---|---|---|
valor máximo | bigodes | R$ 82.279,86 |
quartil superior | centro | R$ 22.370,00 |
mediana | centro | R$ 14.066,00 |
quartil inferior | centro | R$ 10.003,23 |
valor mínimo | bigodes | R$ 395,26 |
IQR | bigodes | R$ 12.366,77 |
quartil superior + 3/2 IQR | bigodes | R$ 40.920,16 |
quartil inferior - 3/2 IQR | bigodes | R$ -8.546,94 |
último ponto superior | bigodes | R$ 40.400,74 |
último ponto inferior | bigodes | R$ 395,26 |
quantidade de pontos superiores | pontos | 3 pontos |
quantidade de pontos inferiores | pontos | 0 pontos |
Os boxplots, assim como os histogramas, indicam distribuições
Outliers são pontos que se diferem drasticamente do resto dos dados. O problema é como identificar esses outliers.
Introdução à Pesquisa Jurimétrica.