Como encontrar diferenças médias usando uma variável dummy

Você deve se lembrar de seu curso de estatística como conduzir o t

-teste para examinar as diferenças de médias entre dois grupos. Mas o que você pode não saber é que você pode usar variáveis ​​binárias e análise de regressão para obter os mesmos resultados que a t-teste.

Especificação

Mesmo que o seu modelo econométrico é provável que incluem características quantitativas e qualitativas, você pode começar com um modelo que utiliza apenas uma variável dummy para capturar características qualitativas e ignora outras variáveis ​​independentes potenciais. Este processo corresponde a identificação de diferenças de médias para os grupos identificados pela variável dummy (s), mas é um bloco de construção útil para a compreensão de modelos mais realistas que combinam características qualitativas com variáveis ​​quantitativas.

Se a característica qualitativa que você gostaria de usar como uma variável independente contém apenas dois grupos, em seguida, um modelo econométrico com uma única variável dummy como a única variável explicativa podem ser expressos como

image0.jpg

Onde Y é a variável dependente,

image1.jpg

é a intercepção (ou constante) prazo e

image2.jpg

é o impacto da característica representada pela variável dummy (D). DEu = 1 se a característica qualitativa específico está presente e DEu = 0 se não.

Se a característica qualitativa que você gostaria de usar como uma variável independente tem mais do que dois grupos, em seguida, o modelo econométrico deve incluir J - 1 variáveis ​​para captar plenamente as possibilidades. Suponha que você gostaria de usar uma variável com uma característica qualitativa contendo quatro possíveis resultados {A, B, C e D}. O modelo de base econométrica para capturar uma característica qualitativa é expressa como

image3.jpg

Onde DiB = 1 se a observação pertence ao grupo B, DiC = 1 se a observação pertence ao grupo C, Didentidade = 1 se a observação pertence ao grupo D, e DiB = DiC = Didentidade = 0 se a observação está no grupo A. Ao usar esta equação, você atribui implicitamente grupo A como referência ou grupo de base em qualquer comparação de dois grupos.

Interpretação

Uma forma útil de ver o papel de uma variável dummy em um modelo econométrico é interpretar os resultados de uma regressão usando uma variável fictícia como a única variável independente.

Uma regressão estimada com uma variável dummy é geralmente escrito como

image4.jpg

onde o

image5.jpg

termos representam os parâmetros estimados. Porque D só pode ser 0 ou 1, para uma dada observação,

image6.jpg

o previsto Y valor a partir de uma regressão representa a estimativa da média condicional (E(Y | DEu)). A variável dummy tem apenas dois valores, de modo a obter dois previu Y valores. Portanto, o predito Y os valores são iguais aos meios de amostra para cada grupo.

menu