3 Principal Linear Probabilidade Model (LPM) Problemas

Usando a técnica de mínimos quadrados ordinários (OLS) para estimar um modelo com uma variável dependente manequim é conhecido como a criação de um modelo linear de probabilidade,

ou LPM. LPMs não são perfeitos. Três problemas específicos podem surgir:

  • Não normalidade do termo de erro

  • erros heterocedásticos

  • previsões potencialmente sem sentido

Não normalidade do termo de erro

A suposição de que o erro é normalmente distribuída é fundamental para a realização de testes de hipóteses depois de estimar o modelo econométrico.

O termo de erro de um LPM tem uma distribuição binomial em vez de uma distribuição normal. Isso implica que o tradicional t-testes de significância individual e F-testes de importância global são inválidos.

Como você pode ver, o termo de erro em um LPM tem um de dois valores possíveis para um determinado x valor. Um valor possível para o erro (Se Y = 1) é dada por A, e o outro valor possível para o erro (Se Y = 0) é dado por B. Consequentemente, é impossível para o termo de erro de ter uma distribuição normal.

image0.jpg

Heteroskedasticity

O modelo de regressão linear clássico (CLRM) assume que o termo de erro é homocedásticos. A suposição de homocedasticidade é obrigado a provar que os estimadores de MQO são eficientes (ou melhor). A prova de que MQO estimadores são eficientes é um componente importante do teorema de Gauss-Markov. A presença de heterocedasticidade pode causar o teorema de Gauss-Markov a ser violados e levar a outras características indesejáveis ​​para os estimadores de MQO.

O termo de erro em um LPM é heterocedásticos por causa da variância não é constante. Em vez disso, a variação de um termo de erro LPM depende do valor da variável independente (s).

Utilizando a estrutura do LPM, pode caracterizar a variância da sua termo de erro como segue

image1.jpg

Uma vez que a variância do erro depende do valor de X, exibe heteroskedasticity em vez de homocedasticidade.

probabilidades previstas Unbounded

A lei de probabilidade mais básico afirma que a probabilidade de um evento ocorrer deve ser contido dentro do intervalo [0,1]. Mas a natureza do LPM é tal que não assegura esta lei fundamental da probabilidade é satisfeito. Embora a maioria das probabilidades previstas a partir de um LPM têm valores sensíveis (entre 0 e 1), alguns probabilidades previstas podem ter valores sem sentido que são menos do que 0 ou maior do que 1.

Dê uma olhada na figura a seguir e focar sua atenção sobre os segmentos da linha de regressão, onde a probabilidade condicional é maior do que 1 ou inferior a 0. Quando a variável dependente é contínua, você não precisa se preocupar com valores ilimitados para o meios de condicional. No entanto, variáveis ​​dicotômicas são problemáticas porque os meios condicionais representam probabilidades condicionais. Interpretação probabilidades que não são delimitadas por 0 e 1 é difícil.

image2.jpg

Você pode ver um exemplo desse problema com dados reais:

image3.jpg

A maioria das probabilidades estimadas a partir da estimativa LPM estão contidos no intervalo [0,1], mas a probabilidade prevista para a sétima observação é negativo. Infelizmente, nada na estimativa de um LPM assegura que todas as probabilidades previstas ficar dentro de valores razoáveis.

menu