Como manchar Estatística Variabilidade em um histograma

Você pode ter uma noção de variabilidade em uma dados estatísticos definidos por olhar para o seu histograma. Por exemplo, se os dados são todos iguais, todos eles são colocados em uma única barra, e não há variabilidade. Se uma quantidade igual de dados está em cada um dos vários grupos, o histograma parece plana com as barras próximas ao mesmo em altura isso sinaliza uma boa quantidade de variabilidade.

A ideia de um histograma plana indicando alguma variabilidade pode ir contra a sua intuição, e se isso acontecer você não está sozinho. Se você está pensando um histograma plana significa que não há variabilidade, provavelmente você está pensando em um gráfico de tempo, onde os números individuais são plotados ao longo do tempo. Lembre-se, porém, que um histograma não mostra os dados ao longo do tempo - ele mostra todos os dados em um ponto no tempo. Desde o histograma é plana, o que significa que os dados estão espalhados em todo o espectro, portanto, uma alta variabilidade.

Igualmente interessante é a idéia de que um histograma com um grande pedaço no meio e caudas inclinada acentuadamente para baixo em cada lado realmente tem menor variabilidade do que um histograma que é em linha reta. As curvas parecendo montes em um histograma representam aglomerados de dados que estão juntos, portanto, uma baixa variabilidade.

Variabilidade em um histograma é maior quando as barras mais altas estão mais espalhados longe da média e inferior quando as barras mais altas estão perto da média.

image0.jpg

Para idades de melhor atriz do Oscar vencedores mostrados na figura acima, você vê muitas atrizes estão na faixa etária de 30-35, e na maioria das atrizes são entre 20-50 anos de idade, o que é bastante diverse- então você ter esses valores extremos, essas poucas atrizes mais velhas (7 deles) que se espalham os dados mais longe, aumentando a variabilidade global dos dados.

A estatística mais comum usado para medir a variabilidade de um conjunto de dados é a desvio padrão, que em certo sentido áspera mede a distância "média" ou "típico" que a mentira de dados a partir da média. O desvio padrão para os dados de Melhor Atriz idade é 11,35 anos. Um desvio padrão de 11,35 anos, é bastante grande no contexto deste problema, mas o desvio padrão é baseado na distância média a partir da média, e a média é influenciada por valores extremos, de modo que o desvio-padrão irá ser influenciada bem.

menu