Como carregar os dados em um modelo de R Classification Predictive Analytics

O conjunto de dados analisamos para fazer uma previsão sobre o conjunto de dados de sementes, que podem ser encontrados no repositório UCI aprendizado de máquina. Este conjunto de dados tem 210 observações e 7 atributos mais o rótulo. O rótulo é o resultado esperado e é usado para treinar e avaliar a precisão do modelo preditivo.

O resultado que você está tentando prever é o tipo de semente é (atributo 8), tendo em conta os valores dos sete atributos. Os três valores possíveis para o tipo de semente são rotulados 1, 2 e 3, e representam o Kama, Rosa, e variedades canadenses de trigo.

Os atributos na ordem da coluna são fornecidas:

  1. área

  2. perímetro

  3. compacidade

  4. comprimento de núcleo

  5. largura do núcleo

  6. coeficiente de assimetria

  7. comprimento de ranhura de kernel

  8. classe de trigo

Para obter o conjunto de dados a partir do repositório UCI e carregá-lo na memória, digite o seguinte comando no console:

> sementes lt; - 
read.csv ( "https://archive.ics.uci.edu/ml/machine~~number=plural -Learning-bases de dados / 00236 / seeds_dataset.txt", header = false, Set = "", as.is = true)

Você vê que o conjunto de dados foi carregado na memória como a variável de estrutura de dados sementes, olhando para o seu painel de espaço de trabalho (canto superior direito). Clique no sementes variável para ver os valores de dados em painel de origem (canto superior esquerdo). Esta é a aparência dos dados no painel de origem.

image0.jpg

Você pode encontrar mais informações sobre os dados que você acabou de carregado usando o resumo() função.

> Resumo (sementes) V1 V2 V3Min. : 10,59 min. : 12,41 min. : 0.80811st Qu.:12.27 primeiro Qu.:13.45 primeiro Qu.:0.8569Median: 14,36 Median: 14,32 Median: 0.8734Mean: 14.85 Média: 14,56 Média: 0.87103rd Qu.:17.30 3ª Qu.:15.71 3ª Qu.:0.8878 Max. : 21.18 Max. : 17.25 Max. : 0,9183 ...

menu