Como definir o Modo de Exibição de Dados em R

UMA ggplot2

Conteúdo

geom em R diz o enredo como você deseja exibir seus dados. Por exemplo, você usar geom_bar () para fazer um gráfico de barras. Dentro ggplot2, você pode usar uma variedade de Geoms predefinidos para fazer tipos padrão de trama.

A geom define o layout de um ggplot2 camada. Por exemplo, existem Geoms para criar gráficos de barras, gráficos de dispersão, e diagramas de linha (bem como uma variedade de outras parcelas).

Cada geom tem uma estatística padrão, e cada um tem um status geom padrão. Na prática, você tem que especificar apenas um destes.

GeomDescriçãoStat padrão
geom_bar ()Gráfico de barrasstat_bin ()
geom_point ()Scatterplotstat_identity ()
geom_line ()diagrama de linha, ligando observações em ordenados porx-valorstat_identity ()
geom_boxplotgráfico de caixa-and-whiskerstat_boxplot ()
geom_pathdiagrama de linha, observações de ligação na ordem originalstat_identity ()
geom_smoothAdicionar uma média condicionado alisoustat_smooth ()
geom_histogramUm alias para geom_bar () e stat_bin ()stat_bin ()

Como criar um gráfico de barras usando ggplot2 em R

Para fazer um gráfico de barras que você use o geom_bar () função. No entanto, note que a estatística padrão é stat_bin (), que é usado para cortar os seus dados em caixas. Assim, o comportamento padrão do geom_bar () é criar um histograma.

Por exemplo, para criar um histograma da profundidade de sismos no terremotos conjunto de dados, faça o seguinte:

> Ggplot (terremotos, aes (x = profundidade)) + geom_bar ()> ggplot (terremotos, aes (x = profundidade)) + geom_bar (binwidth = 50)

Observe que o mapeamento define apenas o x-variável do eixo (neste caso, abalos de profundidade $). Um argumento útil geom_bar () é binwidth, que controla o tamanho das caixas de que os seus dados são cortados em.


Então se geom_bar () faz um histograma por padrão, como você faz um gráfico de barras? A resposta é que você primeiro tem que agregar seus dados e, em seguida, especificar o argumento status = "identidade" em sua chamada para geom_bar ().

No próximo exemplo, você usar agregar() para calcular o número de terremotos em diferentes estratos de profundidade:

> quakes.agg lt; - agregado (mag ~ rodada (profundidade, -1), data = tremores, + FUN = comprimento)> nomes (quakes.agg) lt; - c ( "profundidade", "mag")


Agora você pode traçar o objeto quakes.agg com geom_bar (status = "identidade"):

> Ggplot (quakes.agg, aes (x = profundidade, y = mag)) ++ geom_bar (status = "identidade")

Em resumo, você pode usar geom_bar () para criar um histograma e deixar ggplot2 resumir seus dados, ou você pode pré-resumir seus dados e então usar status = "identidade" para traçar um gráfico de barras.

image0.jpg

Como fazer um gráfico de dispersão em ggplot2

Para criar um gráfico de dispersão, você usa o geom_point () função. A dispersão cria pontos (ou, por vezes, bolhas ou outros símbolos) em seu gráfico. Cada ponto corresponde a uma observação em seus dados.

Você provavelmente já viu ou criado este tipo de gráficos um milhão de vezes, então você já sabe que scatterplots usar o sistema cartesiano, onde uma variável é mapeada para a coordenada x-eixo e uma segunda variável é mapeado para o y-eixo.

Exactamente da mesma maneira, em ggplot2 você cria um mapeamento entre x-e eixo y-variáveis ​​de eixos. Então, para criar um gráfico do terremotos de dados, mapear treme $ longa ao x-e eixo tremores $ lat ao y-eixo:

image1.jpg
> Ggplot (terremotos, aes (x = comprimento, y = lat)) + geom_point ()

Como criar gráficos de linha ggplot2

Para criar um gráfico de linhas, você pode usar o geom_line () função. Esta função é utilizada de uma forma muito semelhante à geom_point (), com a diferença de que geom_line () desenha uma linha entre pontos consecutivos em seus dados.

Este tipo de gráfico é útil para dados de séries temporais em quadros de dados, como os dados de população no conjunto de dados built-in longley. Para criar um gráfico de linha de figuras de desemprego, você usa o seguinte:

image2.jpg
> Ggplot (Longley, aes (x = Ano, y = Desempregados)) + geom_line ()
» » » » Como definir o Modo de Exibição de Dados em R