Como modelo de relacionamento de dados linear com R

Uma análise de variância para os seus dados também pode ser escrito como um modelo linear

em R, onde você usa um fator como uma variável de previsão para modelar uma variável de resposta.

É claro, também variáveis ​​preditoras podem ser variáveis ​​contínuas. Por exemplo, o peso de um carro, obviamente, tem uma influência sobre a quilometragem. Mas seria bom ter uma ideia sobre a magnitude dessa influência. Essencialmente, você quer encontrar a equação que representa a linha de tendência. Poderá encontrar os dados que você precisa para verificar isso no conjunto de dados mtcars.

image0.png

Como construir um modelo linear

o lm () função permite que você especifique qualquer coisa a partir do modelo linear mais simples de modelos de interação complexos.

Para modelar a quilometragem em função do peso de um carro, você usa o lm () função, como este:

> Modelo lt; - lm (mpg ~ wt, dados = mtcars)

Você fornece dois argumentos:

  • Uma fórmula que descreve o modelo: Aqui, você modelar a variável mpg como uma função da variável wt.

  • Um quadro de dados que contém as variáveis ​​da fórmula: Aqui, você usa a estrutura de dados mtcars.

Você pode especificar muitos modelos complexos com a interface de fórmula quando você sabe o caminho de volta.

O objeto resultante é uma lista com uma estrutura muito complexa, mas na maioria dos casos, você não precisa se preocupar com isso. O modelo de objeto contém uma grande quantidade de informação que é necessário para os cálculos de diagnóstico e novas previsões.

Como extrair informações do modelo

Em vez de mergulhar no próprio objeto modelo e encontrar a informação em algum lugar do objeto de lista, você pode usar algumas funções que o ajudam a obter as informações necessárias a partir do modelo. Por exemplo, você pode extrair um vetor chamado com os coeficientes do modelo usando o coef () função, como este:

> coef.Model lt; - coef (Modelo)> coef.Model (Intercept) wt37.285126 -5,344472

Estes coeficientes representam a intercepção ea inclinação da linha de tendência. Você pode usar isso para traçar a linha de tendência em um gráfico de dispersão dos dados. Você pode fazer isso em duas etapas:

  1. Você traçar o gráfico de dispersão com os dados.

    Você usa o enredo() função para que.

  2. Você usa o abline () função para desenhar a linha de tendência com base nos coeficientes.

O código a seguir dá-lhe o enredo:

> Plot (mpg ~ em peso, de dados = mtcars)> abline (a = coef.Model [1], b = coef.Model [2])

o abline () argumento uma representa a intercepção e b representa a inclinação da linha de tendência que pretende desenhar. Você traçar uma linha vertical, definindo o argumento v para a intercepção com a x-eixo em vez disso. As linhas horizontais são plotados, definindo o argumento v para a intercepção com a y-eixo.

Abaixo está uma visão geral das funções para extrair informações do próprio modelo de objeto. Estas funções trabalhar com diferentes objetos do modelo, incluindo aqueles construídos por AOV () e lm ().

Muitos autores de pacotes também oferecem as mesmas funções para os modelos construídos pelas funções em seu pacote. Assim, você pode sempre tentar usar estas funções de extração em combinação com outras funções modelo também.

FunçãoO que faz
coef ()Retorna um vetor com os coeficientes do modelo
CONFINT ()Devolve uma matriz com o limite superior e inferior do intervalo de theconfidence para cada coeficiente do modelo
equipada ()Retorna um vetor com os valores ajustados para everyobservation
(resíduos)Retorna um vetor com os residuais para cada observação
vcov ()Retorna a matriz de variância-covariância para o coeficiente

menu