Visualizações

Histograma

Ementa do curso

Parte 1 - Metodologia

  1. Processo de Geração de Dados
  2. Teorema de Priest & Klein
  3. Uma técnica de pesquisa

Parte 2 - Visualizações

  1. Gráfico de barras
  2. Histograma
  3. Boxplot
  4. Séries temporais
  5. Gráfico de dispersão

Histograma

Como construir?

Como construir? Visão geral

  • Variáveis numéricas contínuas
  • Eixos: x = variável de interesse; y = contagem / proporção
  • Bins
  • Podem ser bivariados

Como construir? Variável contínua

O eixo x contém uma linha contínua numérica. Dizemos que a linha é contínua porque ela é inteira preenchida: entre dois números, sempre existe um número intermediário.

Por exemplo, entre 1 e 2, tem 0 1.5; entre o 1.5 e o 1, tem o 1.25. Entre o 1 e o 1.25, tem o 1.125. Entre o 1 e o 1.125, tem o 1.01. Entre o 1 e o 1.01, tem o 1.05 e assim por diante.

Como construir? Bins / Barras

A linha do eixo x contém infinitos números, mas está delimitada entre o menor e o maior número encontrados na base. No nosso caso, os dados residem no intervalo entre 9 e 2049 dias.

No histograma, construímos barras que possuem largura fixa, através de uma separação da linha em intervalos.

Vamos ver, a seguir, como construir os intervalos que dão origem às barras.

Como construir? Bins / Barras

No gráfico, os limites são de 9 a 2049. Se construirmos 5 barras de largura 500 neste intervalo, teremos, os seguintes intervalos:

  • 0 a 500 dias, representados com [0, 500]
  • 500 a 1000 dias, representados com (500, 1000]
  • 1000 a 1500 dias, representados com (1000, 1500]
  • 1500 a 2000 dias, representados com (1500, 2000]
  • 2000 a 2500 dias, representados com (2000, 2500]

Como construir? Bins / Barras

Intervalo N
[0,500] 914
(500,1000] 66
(1000,1500] 14
(1500,2000] 5
(2000,2500] 1

Como construir? Bins / Barras

Podemos alterar a quantidade de bins, de forma que formemos diferentes intervalos. Neste caso, estamos com 30 barras.

intervalo n
[0,70.3] 514
(70.3,141] 198
(141,211] 68
(211,281] 42
(281,352] 38
(2040,2110.3] 1

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Bins / Barras

Como construir? Histograma x Barras

Tabela de frequência de variável categórica
Decisão de segunda instância N
Não reformou 511
Parcial 243
Reformou 198
Intervalo N
[0,500] 914
(500,1000] 66
(1000,1500] 14
(1500,2000] 5
(2000,2500] 1

Como construir? Histograma x Barras

Como construir? Histograma x Barras

Como construir? Bivariados

Como construir? Bivariados

Como construir? Bivariados

Interpretações

Interpretamos os histogramas indicando qual é a distribuição do dado. Existem alguns tipos de distribuições.

Interpretações

As distribuições resguardam uma relação importante em relação às medidas de centro.

Interpretações

A partir desses três histogramas, podemos tirar as seguintes propriedades:

  • Distribuição assimétrica para esquerda: Média < Mediana
  • Distribuição simétrica: Média = Mediana
  • Distribuição assimétrica para direita: Média > Mediana