Aplicando a regra empírica (68-95-99.7) a um conjunto de dados estatísticos

o Regra empírica (68-95-99.7) diz que, se a população de um conjunto de dados estatísticos tem uma distribuição normal (onde os dados estão na forma de uma curva de sino), com média populacional # 181- e desvio padrão

image0.png

em seguida, condições que se seguem:

  • Cerca de 68% dos valores encontram-se dentro de 1 desvio padrão da média (ou entre a média menos 1 vezes o desvio padrão, e a média mais 1 vezes o desvio padrão). Em notação estatística, este é representado como

    image1.png
  • Cerca de 95% dos valores encontram-se dentro de 2 desvios padrão da média (ou entre a média menos 2 vezes o desvio padrão, e a média mais 2 vezes o desvio padrão). A notação estatística para isso é

    image2.png
  • Sobre 99,7% dos valores encontram-se dentro de 3 desvios padrão da média (ou entre a média menos 3 vezes o desvio padrão e a média mais 3 vezes o desvio padrão). Os estatísticos usar a seguinte notação para representar este:

    image3.png

A regra empírica é também conhecido como o 68-95-99.7 Rule, em correspondência com essas três propriedades. Ele é usado para descrever uma população, em vez de uma amostra, mas você também pode usá-lo para ajudar a decidir se uma amostra de dados veio de uma distribuição normal. Se uma amostra é grande o suficiente e você pode ver que seu histograma parece perto de um sino-forma, você pode verificar para ver se os dados seguem as especificações 68-95-99.7 por cento. Se sim, é razoável concluir os dados vieram de uma distribuição normal.

A regra empírica (68%, 95% e 99,7%).
A regra empírica (68%, 95% e 99,7%).

Esta figura ilustra todos os três componentes da regra empírica. A razão que tantos (cerca de 68%) dos valores encontram-se dentro de 1 desvio padrão da média na regra empírica é porque, quando os dados são em forma de sino, a maioria dos valores são amontoada no meio, perto da significa (como a figura mostra).

A adição de outro desvio padrão em cada lado da média aumenta a percentagem de 68-95, que é um grande salto e dá uma boa ideia de onde # 147-most # 148- dos dados estão localizados. A maioria dos pesquisadores ficar com a gama de 95% (em vez de 99,7%) para reportam os seus resultados, porque o aumento da gama de 3 desvios padrão em cada lado da média (em vez de apenas dois) não parece vantajoso, apenas para escolher outra 4,7% dos valores.

A regra empírica diz-lhe sobre qual a percentagem de valores estão dentro de um determinado intervalo da média. Estes resultados são apenas aproximações, e eles só se aplicam se os dados seguem uma distribuição normal. No entanto, a regra empírica é um resultado importante nas estatísticas porque o conceito de # 147 out-going cerca de dois desvios-padrão para obter cerca de 95% dos valores # 148- é aquele que você vê mencionado muitas vezes com intervalos de confiança e testes de hipóteses.

menu