Como avaliar os dados Linear com R

Naturalmente, R fornece um conjunto de diferentes testes e medidas para avaliar quão bem o seu modelo se encaixa seus dados, bem como olhar para os pressupostos do modelo. Mais uma vez, a visão geral aqui apresentado está longe de ser completa, mas dá-lhe uma ideia do que é possível e um ponto de partida para olhar mais profundo sobre o assunto.

Como resumir o modelo

o resumo() função imediatamente retorna o teste F para os modelos construídos com AOV (). Para lm () modelos, este é ligeiramente diferente. Dê uma olhada na saída:

> Model.summary lt; - resumo (Modelo)> Model.summaryCall: lm (fórmula = mpg ~ em peso, de dados = mtcars) Resíduos: Min 1T Median 3T Max-4,5432 -2,3647 -0,1252 1,4096 6.8727Coefficients: Estimativa Std. Pr Erro valor t (> | t |) (Intercept) 37,2851 1,8776 19,858 lt; 2e-16 *** em peso -5,3445 0,5591 -9,559 1.29e-10 *** --- Signif. códigos: 0 '***' 0.001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1Residual erro padrão: 3.046 em 30 graus de freedomMultiple R-quadrado: 0,7528, ajustado-R ao quadrado: 0.7446F-estatística: 91,38 nos dias 1 e 30 de DF, p-value: 1.294e-10

Isso é um monte de informações úteis. Aqui você vê o seguinte:

  • A distribuição dos resíduos, o que lhe dá uma primeira ideia sobre o quão bem os pressupostos de um modelo linear espera

  • Os coeficientes acompanhada por um teste t, dizendo-lhe em que medida cada coeficiente é significativamente diferente de zero

  • A medidas de bondade-de-ajuste R2 e o R ajustado2

  • O F-teste que lhe dá uma idéia sobre se o seu modelo explica uma parte significativa da variância nos dados

Você pode usar o coef () função para extrair uma matriz com as estimativas, erros padrão, e t-valor e p-valor para os coeficientes do objeto resumo assim:

> Coef (Model.summary) Estimativa Std. valor de erro t Pr (> | t |) (Intercept) 37,285126 1,877627 19,857575 8.241799e-19wt -5,344472 0,559101 -9,559044 1.293959e-10

Se esses termos não lhe dizer nada, procurá-los em uma boa fonte sobre modelagem. Para uma extensa introdução à aplicação e interpretação de modelos lineares corretamente, confira Modelos Applied Linear estatísticos, 5th Edition, por Michael Kutner et al (McGraw-Hill / Irwin).

Como para testar o impacto em termos de modelo

Para se ter uma tabela de análise de variância - como o resumo() função faz para um modelo ANOVA - você simplesmente usar o anova () funcionar e passá-lo a lm () objeto de modelo como um argumento, como este:

> Model.anova lt; - ANOVA (Modelo)> Model.anovaAnalysis de variância TableResponse: mpgDf Sum Sq média Sq valor F Pr (> F) em peso 1 847,73 847,73 91,375 1.294e-10 *** Residuais 30 278,32 9,28 --- Signif. códigos: 0 '***' 0.001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

Aqui, o objeto resultante é uma estrutura de dados que lhe permite extrair qualquer valor de que a tabela usando as ferramentas de subconjuntos e indexação. Por exemplo, para obter o valor-p, você pode fazer o seguinte:

> Model.anova [ 'p', 'Pr (> F)'] [1] 1.293959e-10

Você pode interpretar este valor como a probabilidade de que a adição de a variável wt o modelo não faz a diferença. O p-valor baixo indica aqui que o peso de um carro (wt) Explica uma parte significativa da diferença de quilometragem (mpg) Entre os carros. Isto não deve vir como uma surpresa com um carro mais pesado faz, de fato, precisam de mais energia para arrastar o seu próprio peso ao redor.

Você pode usar o anova () função para comparar modelos diferentes também, e muitos pacotes de modelagem fornecer essa funcionalidade. Você encontrar exemplos desta sobre a maioria das páginas da Ajuda relacionados, como ?anova.lm e ?anova.glm.

menu