Como Traçar Quantis para um subgrupo em R

Muitas vezes, você quer dividir-se análise de dados para diferentes subgrupos em R, a fim de compará-los. Você precisa fazer isso se você quer saber como o tamanho médio lábio compara entre gouramis beijando masculino e feminino (grande peixe pelo caminho!) Ou, no caso do nosso exemplo, você quer saber se o número de cilindros em um carro influencia a quilometragem.

Claro que você pode usar tapply () para calcular qualquer um dos descritivos de subgrupos definidos por uma variável fator. Mas, em R encontrar mais algumas ferramentas para resumir descriptives para diferentes subgrupos.

Uma forma de comparar rapidamente os grupos é construir um gráfico de caixa-and-whisker a partir dos dados. Você poderia construir essa trama por meio do cálculo do intervalo, os quartis, e a mediana para cada grupo, mas felizmente você pode apenas dizer-R para fazer tudo isso para você. Por exemplo, se você quiser saber como a quilometragem compara entre os carros com um número diferente de cilindros, você simplesmente usar o boxplot () função:

image0.png
> Boxplot (mpg ~ cil, data = carros)

Você fornece uma fórmula simples como o primeiro argumento para boxplot (). Esta fórmula lê como # caixas de 147 enredo para a variável mpg para os grupos definidos pela variável cil.# 148;

Este lote usa quantiles para lhe dar uma ideia de como os dados são espalhados dentro de cada subgrupo. A linha no meio de cada caixa representa a mediana, e as arestas da caixa representa o primeiro e o terceiro quartis. Os bigodes estender-se quer o mínimo e o máximo dos dados ou 1,5 vezes a distância entre o primeiro e o terceiro quartis, consoante o que for menor.

Para ser completamente correcto, as bordas da caixa representam as dobradiças superior e inferior a partir do sumário de cinco números, calculadas utilizando o fivenum () função. Eles são iguais aos quartis somente se você tiver um número ímpar de observações em seus dados. Contrário, os resultados de fivenum () e quantile () podem diferir um pouco, devido a diferenças nos detalhes do cálculo.

Você pode deixar os bigodes sempre alargar ao mínimo eo máximo, definindo o alcance argumento do boxplot () a função 0.

menu