Como Descrever o Centro de dados contínuos em P

Você tem o conjunto de dados e você formatado-lo para atender às suas necessidades em R, então agora você está pronto para o trabalho real. Analisando seus dados sempre começa com descrevê-lo. Desta forma, você pode detectar erros nos dados, e você pode decidir quais os modelos são apropriados para obter as informações necessárias a partir dos dados que você tem.

Quais as estatísticas descritivas você usa depende da natureza dos dados, é claro.

Às vezes você está mais interessado no quadro geral de seus dados do que você está nos valores individuais. Você pode ser não está interessado na quilometragem de cada carro, mas na quilometragem média de todos os carros a partir desse conjunto de dados. Para isso, você calcular a média usando o significar() função, como este:

> média (carros $ mpg) [1] 20.09062

Você também pode calcular o número médio de cilindros esses carros têm, mas isso não faz muito sentido. A média seria 6.1875 cilindros, e há carros dirigir com um cilindro incompleto. Neste caso, o mediana - o valor mais central em seus dados - faz mais sentido. Você começa a mediana de usar a função mediana(), como isso:

> Medianos (carros $ cil) [1] 6

Existem numerosas outras razões para o cálculo da média, em vez da média, ou até mesmo os dois em conjunto. Ambas as estatísticas descrevem uma propriedade diferente de seus dados, e até mesmo a combinação pode dizer uma coisa.

menu