Como calcular uma linha de regressão

Nas estatísticas, é possível calcular uma linha de regressão para duas variáveis ​​se a sua dispersão mostra um padrão linear ea correlação entre as variáveis ​​é muito forte (por exemplo, r

= 0,98). A linha de regressão é simplesmente uma única linha que melhor se ajusta aos dados (em termos de ter a distância menor geral a partir da linha dos pontos). Os estatísticos chamam esta técnica para encontrar a linha de melhor ajuste a linear simples A análise de regressão utilizando o método dos mínimos quadrados.

Dispersão de grilos em relação à temperatura exterior.
Dispersão de grilos em relação à temperatura exterior.

A fórmula para o linha de melhor ajuste (ou linha de regressão) é y = mx + b, Onde m é o declive da linha e b é o y-interceptar. Esta equação em si é o mesmo usado para encontrar uma linha no algebra- mas lembre-se, nas estatísticas os pontos não mentem perfeitamente em uma linha - a linha é um modelo em torno do qual os dados se encontram, se existe um padrão linear forte.

  • o declive de uma linha é a mudança de Y através da alteração da x. Por exemplo, uma inclinação de

    image1.png

    significa que o x-acréscimos de valor (Move para a direita) por 3 unidades, o y-valor move-se por 10 unidades, em média.

  • o intercepção y é o valor no eixo dos Y, em que a linha atravessa. Por exemplo, na equação y = 2x - 6, a linha atravessa o y-eixo com o valor b = -6. As coordenadas deste ponto são (0, -6) - quando uma linha cruza a y-eixo, o x-valor é sempre 0.

Você pode estar pensando que você tem que tentar muitas e muitas linhas diferentes para ver qual deles se encaixa melhor. Felizmente, você tem uma opção mais simples (embora eyeballing uma linha no gráfico de dispersão faz ajudá-lo a pensar sobre o que seria de esperar a resposta a ser). A linha de melhor encaixe tem uma inclinação distinta e y-intercepção que pode ser calculada usando as fórmulas (e essas fórmulas não são muito difíceis de calcular).

Para salvar uma grande quantidade de tempo calculando a melhor linha de montagem, primeiro encontrar o # 147-cinco grandes, # 148- cinco estatísticas de resumo que você precisa em seus cálculos:

  1. A média do x valores

    image2.png
  2. A média do y valores

    image3.png
  3. O desvio padrão do x valores (denotado sx)

  4. O desvio padrão do y valores (denotado sy)

  5. A correlação entre x e Y (denotado r)

Encontrar a inclinação de uma linha de regressão

A fórmula para a inclinação, m, da linha de melhor ajuste é

image4.png

Onde r é a correlação entre x e Y, e sx e sy são os desvios-padrão da x-valores e o y-valores, respectivamente. Você simplesmente dividir syde sx e multiplicar o resultado por r.

Note-se que a inclinação da linha de melhor ajuste pode ser um número negativo, porque a correlação pode ser um número negativo. A inclinação negativa indica que a linha está indo ladeira abaixo. Por exemplo, se um aumento na policiais está relacionada com uma diminuição no número de crimes em um moda- linear, em seguida, a correlação e, portanto, a inclinação da linha de melhor encaixe é negativo no caso presente.

A correlação ea inclinação da linha de melhor ajuste não são os mesmos. A fórmula para o declive leva a correlação (uma medição sem unidade) e atribui unidades a ele. Imagine sy dividido por sx como a variação (semelhante a mudança) em Y através da variação X, em unidades de x e Y. Por exemplo, variação de temperatura (graus Celsius) através da variação no número de grilos (em 15 segundos).

Encontrar a intercepção y de uma linha de regressão

A fórmula para o y-interceptar, b, da linha de melhor ajuste é

image5.png

são os meios da x-valores e o y-valores, respectivamente, e m é o declive.

Assim, para calcular o y-interceptar, b, da linha de melhor ajuste, você começar por encontrar o declive, m, da linha de melhor ajuste usando as etapas acima. Em seguida, para encontrar o y-interceptar, você multiplicar m de

image6.png

Sempre calcular a inclinação antes do y-interceptar. A fórmula para o y-interceptação contém a inclinação!

menu