Como descrever a variação de dados em I

Um único número não dizer muito sobre seus dados. Muitas vezes é tão importante saber a disseminação de seus dados. Você pode usar R para olhar para esta propagação através de um número de diferentes abordagens.

Conteúdo

Primeiro, você pode calcular tanto o variação ou o desvio padrão para resumir a propagação em um único número. Para isso, você tem as funções convenientes var () e para a variância SD() para o desvio padrão. Por exemplo, se calcula o desvio padrão da variável mpg no quadro de dados carros como isso:

> Sd (carros $ mpg) [1] 6,026948

Próximo à média e variação, você também pode dar uma olhada nos quantis. UMA quantil, ou percentil, diz-lhe quanto de seus dados encontra-se abaixo de um determinado valor. O 50 por cento quantil, por exemplo, nada mais é que a mediana. Novamente, R tem algumas funções convenientes para ajudá-lo a olhar para os quantis.

Como calcular o intervalo de dados no R


Os quantis mais usados ​​são realmente os 0 por cento e 100 por cento quantiles. Você poderia facilmente chamar-lhes o mínimo eo máximo, porque é isso que eles são. Você pode obter tanto min () e max () as funções em conjunto, utilizando o alcance() função. Esta função convenientemente dá-lhe a gama dos dados. Assim, para saber, entre os quais dois valores todas as milhagens estão situados, basta fazer o seguinte:

> Gama (carros $ mpg) [1] 10.4 33.9

Como calcular os dados quartis em R

A gama ainda lhe dá apenas informações limitadas. Muitas vezes, os estatísticos relatam o primeiro eo terceiro quartil ao lado do alcance e da mediana. Estes quartis são, respectivamente, os 25 por cento e 75 por cento quantiles, que são os números para os quais um quarto e três quartos dos dados é menor. Você obtém estes números usando o quantile () função, como este:

> Quantil (MPG carros $) 0% 25% 50% 75% 100% 10,400 15,425 19,200 22,800 33,900

Os quartis não são os mesmos que a dobradiça inferior e superior calculado no resumo de cinco números. Os dois últimos são, respectivamente, a mediana da metade inferior e superior de seus dados, e eles diferem ligeiramente dos primeiro e terceiro quartis. Para obter os cinco estatísticas numéricas, você usa o fivenum () função.

Como chegar na velocidade com a função quantil em R

o quantile () função pode dar-lhe qualquer quantil quiser. Para isso, você usar o probs argumento. Você dá o probs (Ou probabilidades) como um número fraccionário. Para os 20 por cento quantil, por exemplo, você usar 0.20 como um argumento para o valor. Este argumento também leva um vetor como um valor, para que possa, por exemplo, obter os 5 por cento e 95 por cento quantiles como este:

> Quantílicas (carros $ MPG, Probs = c (0,05, 0,95)) 5% a 95% 11,995 31,300

O valor padrão para o probs argumento é um vector que representa o mínimo (0), o primeiro quartil (0,25), a mediana (0,5), o terceiro quartil (0,75), e o valor máximo (1).

Todas estas funções têm um argumento na.rm que lhe permite remover todos N / D valores antes de calcular a respectiva estatística. Se você não fizer isso, qualquer vector contendo N / D terá N / D como um resultado. Esta funciona de forma idêntica à na.rm argumento do soma() função.

» » » » Como descrever a variação de dados em I