Como de utilização de frequências ou densidades com seus dados em R

Ao quebrar seus dados em intervalos em R, você ainda perder algumas informações. Ainda assim, a forma mais completa de descrever seus dados é através da estimativa do função densidade de probabilidade

(PDF) ou densidade de sua variável.

Se este conceito não é familiar para você, não se preocupe. Basta lembrar que a densidade é proporcional à probabilidade de que qualquer valor na sua dados é aproximadamente igual a esse valor. De facto, para um histograma, a densidade é calculada a partir das contagens, de modo que a única diferença entre um histograma com uma frequência e com densidades, é a escala do y-eixo. Para o resto, são exatamente o mesmo.

Como criar um gráfico de densidade

É possível estimar a função de densidade de uma variável usando o densidade() função. A saída desta função em si não lhe diz muito, mas você pode facilmente usá-lo em uma trama. Por exemplo, você pode obter a densidade da variável de quilometragem mpg como isso:

> mpgdens lt; - densidade (carros $ mpg)

O objeto que você começa desta forma é uma lista que contém uma grande quantidade de informação que você realmente não precisa de se olhar. Mas essa lista faz traçando a densidade tão fácil como dizer # 147-enredo da densidade # 148-:

> plot (mpgdens)

O enredo parece um pouco áspera nas bordas, mas o importante é ver como vem o seu dados para fora. O objeto densidade é representada como uma linha, com os valores reais de seus dados no x-eixo e a densidade na y-eixo.

image0.png

o mpgdens lista de objetos contém - entre outras coisas - um elemento chamado x e uma chamada y. Estes representam o x- e y-coordenadas para traçar a densidade. Quando R calcula a densidade, o densidade() função divide-se os dados num número de pequenos intervalos e calcula a densidade para o ponto médio de cada intervalo. Esses pontos médios são os valores x, e as densidades calculados são os valores y.

Como traçar densidades em um histograma

Lembre-se que o hist () função retorna as contagens para cada intervalo. Agora, a possibilidade de que um valor situa-se dentro de um determinado intervalo de tempo é directamente proporcional à contagem. Quanto mais os valores que você tem dentro de um determinado intervalo, maior a chance de que qualquer valor que você escolheu está encontrando-se nesse intervalo.

Assim, em vez de planejar as contagens no histograma, você poderia muito bem representar graficamente as densidades. R faz todos os cálculos para você - a única coisa que você precisa fazer é definir o freq argumento de hist () para FALSO, como isso:

> Hist (carros $ mpg, col = "cinzenta", freq = FALSE)

Agora, o lote será exatamente o mesmo que antes- apenas os valores no y-eixo são diferentes. A escala na y-eixo é definida de tal forma que você pode adicionar a trama densidade sobre o histograma. Para isso, você usar o linhas () funcionar com o objeto densidade como o argumento.

Assim, você pode, por exemplo, gosta-se o histograma anterior um pouco mais longe, acrescentando a densidade estimada usando o código a seguir imediatamente após o comando anterior:

> linhas (mpgdens)

Você ver o resultado destes dois comandos no lado direito. Lembre-se disso linhas () utiliza o x e y elementos do objecto densidade mpgdens para traçar a linha.

menu