Como contar valores exclusivos de dados em R

Para descobrir o que os dados podem ser tidos quando se trabalha em R, vamos dar uma olhada no conjunto de dados mtcars. Este conjunto de dados built-in descreve o consumo de combustível e dez pontos diferentes do projeto de 32 carros da década de 1970. Ele contém, no total, 11 variáveis, mas todas elas são numéricos.

Embora você possa trabalhar com o quadro de dados como está, algumas variáveis ​​podem ser convertidos em um fator, porque eles têm uma quantidade limitada de valores.

Se você não sabe quantos valores diferentes de uma variável tem, você pode obter essas informações em duas etapas simples:

  1. Obter os valores exclusivos da variável usando única ().

  2. Obter o comprimento do vector resultante usando comprimento().

usando o sapply () função, você pode fazer isso por toda a estrutura de dados de uma só vez. Você aplica uma função anônima combinação de ambas as etapas mencionadas em toda a estrutura de dados, como este:

> Sapply (mtcars, função (x) comprimento (exclusivo (x))) mpg cil disp hp drat peso qsec vs carb25 engrenagem am 3 27 22 22 29 30 2 2 3 6

Assim, parece que as variáveis cil, vs, sou, engrenagem, e carb podem beneficiar de uma conversão de fator.

Você tem 32 diferentes observações nesse conjunto de dados, de modo que nenhuma das variáveis ​​tem apenas valores exclusivos.

Quando a tratar uma variável como um factor depende um pouco sobre a situação, mas, como regra geral, evitar mais de dez diferentes níveis de um factor e tentar ter, pelo menos, cinco valores por nível.

menu