Tendência Central: Para além do básico

A média e mediana são as duas medidas mais fiáveis ​​e frequentes com o centro, e eles são usados ​​numa ampla variedade de situações. No entanto, se você está estudando seriamente as estatísticas, você deve estar familiarizado com duas outras medidas de tendência central.

Modo

o modo é outra medida de centro que calcula que o valor (ou intervalo de valores) ocorre com maior frequência. A média e mediana pode ser muito eficaz no que descreve distribuições simétricas e unimodais. O modo é útil para explicar situações que a média ea mediana consegue os dados não, particularmente enviesada ou multimodais.

Para calcular o modo, você simplesmente criar uma tabela de todos os valores possíveis de frequência e contar o número de vezes que cada aparece. Por exemplo, se o conjunto de dados contém 10, 20, 20, 20, 30, 30, 40, 50, 50-, em seguida, o modo é 20.

Se você tem um conjunto de dados que não têm valores que são repetidas exatamente, você pode dividi-los em faixas semelhante à maneira como você se prepara para fazer um histograma. Por exemplo, na tabela a seguir, dois jogadores no Lakers está fazendo o mínimo de liga NBA, de modo que o modo pode ser considerado como sendo $ 959.111. Alternativamente, você pode dividir os dados em grupos de $ 1 milhão, caso em que a modalidade seria a faixa de US $ 5-6 milhões de euros devido quatro jogadores se enquadram nesse grupo.

Os salários para L.A. Lakers da NBA Jogadores (2009-2010)
JogadorSalário ($)
Kobe Bryant23034375
Pau Gasol16452000
Andrew Bynum12526998
Lamar Odom7.500.000
Ron Artest5.854.000
Adam Morrison5.257.229
Derek Fisher5.048.000
Sasha Vujacic5.000.000
Luke Walton4.840.000
Shannon Brown2.000.000
Jordan Farmar1.947.240
Didier Ilunga-Mbenga959111
Josh Powell959111
Total91378064

O modo pode ser visualizado pelo pico no histograma. Com conjuntos de dados que têm vários picos, não é incomum para relatar vários modos porque a média ea mediana podem não refletir com precisão onde a maioria dos valores mentir.

médias aparadas

Você viu que a média é suscetível a outliers e será # 147 puxou # 148- para os valores mais extremos. o média aparada (ou média truncada) Tenta eliminar a influência de outliers aparando fora de um pequeno número de valores extremos de modo que o significativo incide mais sobre os valores mais centrais.

Para calcular uma média aparada, você escolhe uma pequena percentagem do seu conjunto de dados (por exemplo, 10 por cento), dividir esse número pela metade, remova a percentagem correspondente de valores de ambas as extremidades baixas e altas, e, em seguida, calcular a média dos restantes valores.

Por exemplo, suponha que um conjunto de dados contém o seguinte n = 20 valores: 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 9, 500. O valor outlier de 500 unidades da amostra (tradicional) significa ser 29,6, que é maior do que todos, mas um dos valores de dados, e não é indicativo de onde toda a ação está.

Em vez disso, você pode cortar os 10 por cento mais extremo, o que significa a remoção de dois valores (10% x 20 = 20), e apenas calcular uma média baseada na média 90 por cento dos valores. Desde que você tem que dividir que dois entre as duas extremidades, você remover um da extremidade inferior (3) e um da parte alta (500). O 90 por cento média aparada com base nos 18 valores de dados restantes é 4,9 e reflete melhor a tendência central dos dados.

menu