Como identificar Skew e simetria em um histograma de Estatística

Às vezes a média versus debate mediano pode ficar muito interessante. Especialmente quando você olha para a assimetria e simetria de seus dados estatísticos em um histograma.

Por exemplo, suponha que você faz parte de uma equipe da NBA tentando negociar salários. Se você representa os proprietários, que pretende mostrar o quanto todo mundo está fazendo e quanto dinheiro você está gastando, assim que você quer ter em conta os jogadores superstar e informar a média. Mas se você está no lado dos jogadores, que você gostaria de relatar a mediana, uma vez que é mais representativo do que os jogadores no meio estão fazendo. Cinquenta por cento dos jogadores fazem um salário acima da média, e 50 por cento fazem um salário abaixo da mediana.

Para resolver tudo isso, o melhor é encontrar e comparar tanto a média ea mediana. Um gráfico que mostra a forma dos dados é um ótimo lugar para começar.

Um dos gráficos que você pode fazer para ilustrar a forma de dados numéricos (quantos valores estão perto / longe da média, onde o centro é, como muitos valores extremos pode haver) é um histograma. UMA histograma é um gráfico que organiza e exibe dados numéricos em forma de imagem, mostrando grupos de dados e o número ou a porcentagem dos dados que se enquadram em cada grupo. Dá-lhe um bom instantâneo do conjunto de dados.

A) Os dados enviesados ​​direita; B) dados inclinados esquerdo; e C) de dados simétricas.
A) Os dados enviesados ​​direita; B) dados inclinados esquerdo; e C) de dados simétricas.

conjuntos de dados pode ter muitos diferentes shapes- possível aqui está uma amostra de três formas que são comumente discutidos em cursos introdutórios de estatística:

  • Se a maioria dos dados está no lado esquerdo do histograma, mas algumas são valores maiores do lado direito, os dados são referidos como sendo inclinado para a direita.

    Um histograma da figura mostra um exemplo de dados que são enviesados ​​para a direita. Os poucos valores maiores trazer os para cima médias, mas realmente não afeta a mediana. Então, quando os dados estão certos enviesada, a média é maior do que a mediana. Um exemplo de tais dados seriam NBA salários da equipe, onde os jogadores estrela fazem muito mais do que seus companheiros de equipe.

  • Se a maior parte dos dados são no lado direito, com alguns valores menores mostrando-se no lado esquerdo do histograma, os dados são inclinado para a esquerda.

    Histograma B na figura mostra um exemplo de dados que são enviesados ​​para a esquerda. Os poucos valores menores trazer a média para baixo, e, novamente, a mediana é minimamente afectada (se em tudo). Um exemplo de dados enviesada-esquerda é a quantidade de tempo que os alunos usam para tomar um exem- alguns alunos sair mais cedo, mais deles ficar até mais tarde, e muitos estadia até o amargo fim (alguns ficaria para sempre se eles poderiam!). Quando os dados são distorcidos esquerda, a média é menor do que a mediana.

  • Se os dados forem simétrico, eles têm aproximadamente a mesma forma em ambos os lados do meio. Em outras palavras, se você dobrar o histograma ao meio, parece quase a mesma em ambos os lados.

    Histograma C na figura mostra um exemplo de dados simétrico. Com os dados simétricas, a média ea mediana estão juntos.

Ao olhar para Histograma A na figura (cuja forma é distorcida direita), você pode ver que o # 147-tail # 148- do gráfico (onde as barras estão ficando mais curtos) é para a direita, enquanto o # 147-cauda # 148- é para a esquerda no histograma B (cuja forma é enviesada esquerda). Ao olhar para a direção da cauda de uma distribuição assimétrica, você determinar a direção da assimetria. Sempre adicionar a direção ao descrever uma distribuição assimétrica.

Histograma C é simétrica (que tem aproximadamente a mesma forma de cada lado). No entanto, nem todos os dados simétricas tem uma forma de sino como Histograma C faz. Enquanto a forma é aproximadamente a mesma em ambos os lados, em seguida, que diz que a forma é simétrica.

menu