3 Econometria Heterocedasticidade

Share Embed


Descrição do Produto

Econometria

Heterocedasticidade

Prof. José Francisco [email protected]

Hipóteses do modelo de regressão linear múltipla H0: Relação linear entre a variável dependente (Y) e as variáveis independentes (X) – Notação do Gujarati, Econometria Básica, 4ª ed.

Yi = β1 + β 2 X 2,i + β 3 X 3,i + K + β k X k ,i + ui

i = 1, K , n

em notação vetorial

onde Vetor da variável dependente

 y1  y  2  y= M    yn 

y = Xβ + u Matriz das variáveis explicativas

1 X 2,1 1 X 2, 2  X= M M  1 X 2,n

K X k ,1  K X k , 2  O M   K X k ,n 

Vetor de coeficientes de regressão

 β1  β  2  β= M   β k 

Vetor de erros (Vetor aleatório)

 u1  u  2  u= M   un 

Hipóteses do modelo de regressão linear múltipla H1: E(u)=0

 E (u1 ) 0  E (u ) 0 2  E (u ) =  =   M  M     ( ) E u n  0  

H2: Var(ui)=σ2 para i=1,...,n (erros com variância constante igual a σ2 ou homocedasticidade)

( )

( )

Var (ui ) = E u − [E (ui )] = E ui2 = σ 2 2 i

2

= 0 (hipótese H1)

H3: Cov(ui, uj)=0 para todo i≠j (erros não autocorrelacionados)

Cov (ui , u j ) = E (ui ⋅ u j ) − E (ui ) ⋅ E (u j ) = E (ui ⋅ u j ) = 0 = 0 (hipótese H1)

Hipóteses do modelo de regressão linear múltipla Hipóteses H2 e H3 são resumidas na matriz de covariâncias do vetor de erros u

(

Σ u = E uu T

)

Pela hipótese H2 Pela hipótese H3

  u1    u12 u1u2      u2    u2u1 u22 = E [u1 u2 K un ] = E  M M     M u u u u  u  n 2  n 1  n 

K u1un   K u2un  O M  K un2 

( ) Cov (u , u ) = E (u ⋅ u ) = 0 Var (ui ) = E ui2 = σ 2 i

j

i

j

Variâncias na diagonal principal Covariâncias fora da diagonal principal

 u12 u1u2   u2u1 u22 Σu = E  M  M u u u u n 2  n 1

K u1un   σ 2 0   K u 2u n   0 σ 2 =  O M   M M K un2   0 0

0   K 0  2 = σ I  O M  K σ 2  K

I é a matriz identidade de ordem n

Hipóteses do modelo de regressão linear múltipla H4: A matriz X é não aleatória H5: A matriz X tem posto k < n (k é o nº de variáveis explicativas e n o número de observações). Isto significa que não pode haver combinações lineares entre as variáveis explicativas, H6: Cada erro ui ~N(0,σ2) para i=1,...,n, logo o vetor de erros u tem distribuição normal multivariada (n-variada) com vetor média nulo e matriz de covariâncias Σu

 0 σ 2 0  u1     u  2 0  σ 0 u =  2  ~ N n   ,   M M   M M        0 u n   0  0

0   K 0    O M  2 K σ   K

Estimador de mínimos quadrados ordinários (MQO) Estimador MQO Vetor aleatório

 βˆ1  ˆ  ˆβ =  β 2  = X T X −1 X T y M    βˆk 

(

)

Matriz de covariâncias do estimador MQO Matriz de covariâncias do vetor aleatório

( )

 Var βˆ1  T Cov βˆ2 , βˆ1    ˆ ˆ Σ βˆ = E β − β β − β =    M  Cov βˆk , βˆ1

(

)(

)

(

(

(

)

Cov βˆ1 , βˆ2 Var βˆ

)

M Cov βˆk , βˆ2

( )

)

2

(

)

( (

) )

K Cov βˆ1 , βˆk   ˆ ˆ K Cov β 2 , β k  = σ 2 XT X  O M  ˆ K Var β k 

( )

(

)

−1

Estimador de mínimos quadrados ordinários (MQO)

Estimador MQO tem distribuição normal multivariada

 βˆ 1  ˆ  ˆβ =  β 2  ~ N β, Σ k βˆ M ˆ   β k 

(

)

Teorema de Gauss-Markov Sob as hipóteses H0 até H5 (inclusive a hipótese H2 de homocedasticidade do erro) o estimador MQO é o melhor estimador linear não tendencioso, ou seja, o estimador MQO é BLUE (Best Linear Unbiased Estimator)

()

E βˆ = β

Não tendencioso

As variâncias na diagonal da matriz

(

Σβ = σ X X 2

T

)

−1

são mínimas e por isso o MQO é o melhor estimador linear não tendencioso

Homocedasticidade A homocedasticidade significa que o erro e a variável explicada (Yi) têm variância constantes, ou seja, Var(Yi|Xi)= Var(ui)=σ2 Note que a variância é a mesma independentemente dos valores da variável explicativa X.

FRP:

Heterocedasticidade A heterocedasticidade indica que a variância de Y|X não é constante, Var(Yi|Xi)= Var(ui)=σi2 (observe o subscrito i), ou seja, a hipótese H2: Var(ui) constante é violada. Note que as variâncias não são as mesmas e dependem dos valores assumidos pela variável explicativa X

Homocedasticidade x Heterocedasticidade

Heterocedasticidade

Homocedasticidade

Var(ui)=σi2 = σ2ωi para i=1,...,n erros com variâncias diferentes (note que a variância está indexada por i )

Var(ui)=σ2

para i=1,...,n erros com variância constante igual a σ2

Matriz de covariâncias do vetor de erros u

(

Σ u = E uu T

)

1 0 K 0   1 K 0 20 2 =σ  = σ I M M O M   0 0 K 1  

Matriz de covariâncias do vetor de erros u

(

Σ u = E uu T Ω≠I

)

 ω1 0  0 ω2 2 =σ  M M  0 0 

0  K 0 2 = σ Ω O M   K ω n  K

Exemplo ilustrativo (MADDALA, 2003) A tabela abaixo apresenta os gastos com consumo e a renda de 20 famílias. Família Consumo (y) Renda (x) Família Consumo (y) Renda (x) 1 19,9 22,3 11 8,0 8,1 2 31,2 32,3 12 33,1 34,5 3 31,8 36,6 13 33,5 38,0 4 12,1 12,1 14 13,1 14,1 5 40,7 42,3 15 14,8 16,4 6 6,1 6,2 16 21,6 24,1 7 38,6 44,7 17 29,3 30,1 8 25,5 26,1 18 25,0 28,3 9 10,3 10,3 19 17,9 18,2 10 38,8 40,2 20 19,8 20,1

A relação entre o consumo (y) e renda (x) pode ser especificada pela seguinte equação econométrica:

Yi = β1 + β 2 X i + u Neste exemplo, os coeficientes β1 e β2 são estimados por MQO a partir da amostra de 20 famílias.

Exemplo ilustrativo (MADDALA, 2003) Estimação da equação de regressão por MQO

y=

19,9 31,2 31,8 12,1 40,7 6,1 38,6 25,5 10,3 38,8 8 33,1 33,5 13,1 14,8 21,6 29,3 25 17,9 19,8

X=

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

22,3 32,3 36,6 12,1 42,3 6,2 44,7 26,1 10,3 40,2 8,1 34,5 38 14,1 16,4 24,1 30,1 28,3 18,2 20,1

ˆ   β ˆβ =  1  = X T X −1 X T y  βˆ   2

(

)

ˆβ =  0,8471  0,8993   

Yˆi = 0,8471 + 0,8993 X i

Exemplo ilustrativo (MADDALA, 2003) Cálculo dos resíduos e da estimativa da variância do erro Resíduos =

uˆ =

-1,00199 1,30476 -1,96234 0,37112 1,81151 -0,32286 -2,44687 1,18057 0,18990 1,80010 -0,13158 1,22625 -1,52139 -0,42753 -0,79598 -0,92078 1,38328 -1,29794 0,68524 0,87652

uˆi = Yi − Yˆi = Yi − (0,8471 + 0,8993 X i ) Estimativa da variância do erro u n = 20

σˆ 2 σˆ 2 σˆ 2

2 ˆ u ∑ i

T ˆ u uˆ SQResíduos i =1 = = = n−k n−k n−k 2 ( − 1,00199) + 1,30476 2 + K + 0,87652 2 = 20 − 2 = 1,72632

Exemplo ilustrativo (MADDALA, 2003) Gráfico dos resíduos

2,5 2 1,5 1

Resíduos

0,5 0 -0,5

0

5

10

15

20

25

30

35

40

45

50

-1 -1,5 -2 -2,5 -3 Renda

Dispersão dos resíduos cresce com a renda familiar (X), indicando que a variância do erro não é constante, ou seja, a hipótese de homocedasticidade do erro não é verificada. Var(ui) cresce com a variável explicativa Xi ⇒ Var(ui)=f(Xi) ⇒ heterocedasticidade

Exemplo ilustrativo (MADDALA, 2003) Gráfico dos resíduos

A elevada dispersão reflete a maior variabilidade entre os consumos das famílias de maior renda, em função da maior incerteza na parcela da renda que é destinada ao consumo.

A pequena dispersão reflete a menor variabilidade entre os consumos das famílias de menor renda, onde a maior parte da renda é consumida (não é poupada) e as composições das despesas são parecidas.

2,5 2 1,5 1

Resíduos

0,5 0 -0,5

0

5

10

15

20

25

-1 -1,5 -2 -2,5 -3 Renda

30

35

40

45

50

Exemplo ilustrativo (MADDALA, 2003) Erro–padrão dos estimadores MQO

X=

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

22,3 32,3 36,6 12,1 42,3 6,2 44,7 26,1 10,3 40,2 8,1 34,5 38 14,1 16,4 24,1 30,1 28,3 18,2 20,1

Resultados obtidos sob a hipótese de homocedasticidade H2. Como veremos mais adiante, estas estimativas são tendenciosas, pois neste caso o erro é heterocedástico.

(

ˆ ˆ = σˆ 2 X T X Σ β

)

−1

ˆΣ ˆ =  0,49471 − 0,01617 − 0,01617 0,00064  β  

Erro-padrão de

βˆ

1

s 2βˆ = 0,49471 = 0,70336

Erro-padrão de

βˆ

2

s 2βˆ = 0,00064 = 0,02531

1

2

Natureza da heterocedasticidade A heterocedasticidade ocorre com freqüência quando trabalhamos com dados em corte transversal ou cross-section (HILL et al, 2003). O termo dados em corte transversal se refere aos dados sobre diversas unidades econômicas, tais como firmas, famílias, municípios, estados ou países em um dado ponto no tempo, por exemplo, um ano. Os dados em corte transversal invariavelmente envolvem observações sobre unidades econômicas de vários tamanhos:  Dados sobre famílias envolvem famílias com diferentes números de membros e diferentes níveis de renda, tais como famílias de baixa, média ou alta renda  Dados sobre firmas envolvem firmas de tamanhos diferentes, com distintos volumes de produção, tais como pequenos, médios e grandes firmas.

Em geral, a medida que aumenta o tamanho da unidade econômica, há maior incerteza associada aos resultados da variável dependente, conforme apresentado no exemplo ilustrativo da relação entre renda e consumo. Para que o modelo econométrico descreva o processo de geração de dados com essa propriedade, a variância do erro deve ser tanto maior quanto maior for o tamanho da unidade econômica, ou seja o erro deve ser heterocedástico.

Natureza da heterocedasticidade

A heterocedasticidade não se restringe aos dados em corte transversal, mas também pode ser observada em dados de séries temporais (HILL et al, 2003). Uma série temporal é formada por observações de uma unidade econômica ao longo do tempo, sendo possível que a variância do se modifique. Isso acontece quando um choque ou variação externa cria maior ou menor incerteza sobre a variável dependente. Uma classe de modelos para o tratamento da heterocedasticidade em séries temporais, em particular na análise de risco de ativos financeiros, são os modelos ARCH-GARCH (Generalized Autoregressive Conditional Heterocedasticity) para previsão da volatilidade (MORETTIN, 2008), tais modelos estão fora do escopo do curso.

Natureza da heterocedasticidade A heterocedasticidade também surge quando estamos trabalhando com médias de dados ou dados per capita de algum grupo ou região geográfica, em vez dos dados individuais (WOOLDRIDGE, 2006). Por exemplo, considere a equação de regressão linear múltipla, onde i denota a empresa e e o empregado desta empresa:

contribi ,e = β 1 + β 2 ganhosi ,e + β 3idadei ,e + β 4 taxconi ,e + uie

contribie = contribuição anual do empregado e que trabalha na empresa i ganhosie = ganho anual do empregado e idadeie = idade do empregado e taxcontie = montante que a empresa i deposita na conta do empregado e para cada real pago em contribuição pelo empregado uie = termo aleatório

Se as hipoteses H0-H5 são satisfeitas podemos estimar a equação a partir dos dados individuais por empregado entre vários empregadores. Porém, se dispomos apenas dos valores médios por empresa (os dados individuais não são disponíveis) temos o seguinte modelo de regressão linear múltipla estimado a partir dos valores médios das variáveis por empresa:

contrib i = β1 + β 2 ganhos i + β 3 idadei + β 4 taxconi + u i Se o erro na equação com dados individuais for homocedástico, o erro na equação com dados médios por empresa u i será heterocedastico e a variância diminuirá com o tamanho da empresa.

Conseqüências da heterocedasticidade para o estimador MQO

Na presença da heterocedasticidade, o estimador MQO permanece não tendencioso, consistente e assintoticamente normal, porém o estimador MQO torna-se ineficiente, ou seja, não tem variância mínima. Estimador MQO

(

ˆβ = X T X

)

−1

T

X y

Na presença da heterocedasticidade o estimador MQO não é mais BLUE.

(

T 2 ˆ ˆ Σ = σ X X Além disso, o estimador βˆ

)

−1

da matriz de covariância fornece estimativas incorretas (tendenciosas) dos erros-padrão dos estimadores MQO (raiz quadrada da variância na diagonal da matriz), pois este estimador assume o pressuposto de homocedasticidade do erro.

Conseqüências da heterocedasticidade para o estimador MQO −1 Não tendenciosidade do Estimador MQO βˆ = (X T X ) X T y quando erro heterocedástico:

( ) [( ) X y ]= E [(X X) E (βˆ ) = β + (X X ) X E (u ) = β

E βˆ = E X T X T

−1

−1

T

T

−1

y = Xβ + u

] [

X é não aleatório H4

(

X (Xβ + u ) = E β + X X T

T

)

−1

X Tu

]

T

=0 H1

()

E βˆ = β Note que para provar a não tendenciosidade não foi necessário assumir a hipótese H2 sobre a variância do erro, logo a heterocedasticidade não afeta esta propriedade do estimador MQO.

Conseqüências da heterocedasticidade para o estimador MQO

(

βˆ = X T X

(

)

−1

(

X y= X X

βˆ = β + X T X

T

)

−1

T

)

−1

X T (Xβ + u )

(

X Tu ⇒ βˆ − β = X T X

)

−1

Desvio do estimador em relação a sua média

X Tu

Matriz de covariância dos estimadores MQO

( )( )

(k

x

k)

T  ˆ ˆ Σβˆ = E β − β β − β   

Valor esperado dos quadrados dos desvios em notação matricial

(1 x k) (k x 1)

(

Substituindo o resultado βˆ − β = X T X

[(

Σ βˆ = E X X

(

T

Σ βˆ = X X T

)

−1

)

−1

X

)

−1

X Tu na matriz tem-se:

( ) ] E [uu ]X(X X ) T

T

T

X uu X X X

T

T

T

Matriz de covariâncias dos erros u

−1

−1

X é não aleatório H4

Conseqüências da heterocedasticidade para o estimador MQO

Matriz de covariância dos estimadores MQO

(

Σ βˆ = X X

[ ](

T

T

T

X E uu X X X

)

−1

Caso heterocedástico

Σ u = E uu

Σ u = E uu T = σ 2 Ω , Ω ≠ I

( ) = σ (X X ) = σ (X X )

T

)= σ

2

T

−1

2

T

−1

Σ βˆ = σ X X

Σ βˆ

)

−1

Caso homocedástico

(

Σ βˆ

T

2

T

T

2

(

I

( ) X(X X ) T

X IX X X X

T

T

−1

(

Σ βˆ = σ X X 2

T

)

)

−1

T

(

T

X ΩX X X

)

−1

−1

As variâncias na diagonal da matriz não são mínimas, por isso o estimador MQO não é eficiente na presença da heterocedasticidade

−1

σˆ (X X ) ≠ σˆ (X X ) X ΩX(X X ) 2

O uso do estimador

T

σˆ 2 (X T X )

−1

−1

2

T

−1

T

T

−1

implica em perda de validade da inferência quando o erro é heterocedástico

Conseqüências da heterocedasticidade para o estimador MQO O MQO ajusta a equação de regressão de maneira a minimizar a soma dos quadrados dos resíduos, ou seja, define os β’s como sendo a solução ótima do seguinte problema de otimização:

∑ [Y − (β n

Min

β1 , β 2 , β 3 ,K, β k

i

i =1

1 + β 2 X 2 ,i + β 3 X 3,i + K + β k X k ,i )]

2

Na presença da heterocedasticidade, os quadrados dos resíduos na região com erros mais voláteis (maior variância) são maiores que os quadrados dos resíduos na região com erros menos voláteis (menor variância). 2,5 2 1,5 1

Resíduos

0,5 0 -0,5

0

5

10

15

20

25

30

35

40

45

50

-1 -1,5 -2 -2,5 -3

Menor volatilidade

Renda

Maior volatilidade

Conseqüências da heterocedasticidade para o estimador MQO Na presença da heterocedasticidade, os quadrados dos resíduos na região de maior variabilidade do erro dominam a soma dos quadrados dos resíduos. Para minimizar a soma dos quadrados dos resíduos, o MQO faz um bom ajustamento da equação de regressão às observações na região de maior variabilidade do erro, pois é nesta região que se encontram os maiores resíduos. Ou seja, a definição dos β’s é orientada no sentido de minimizar a soma dos quadrados dos resíduos na região de maior variabilidade do erro. Portanto, a heterocedasticidade impõe uma ponderação implícita (PYNDICK & RUBINFELD, 2004), em que os quadrados dos resíduos da região mais volátil recebem “pesos” maiores que àqueles na região menos volátil. Esta ponderação implícita torna o estimador MQO ineficiente, ou seja, o estimador MQO perde a propriedade de variância mínima e, portanto não é mais BLUE, embora continue sendo não tendencioso e consistente.

Conseqüências da heterocedasticidade para o estimador MQO Soma dos quadrados dos resíduos a ser minimizada pelo estimador MQO:

uˆ A2 + uˆ B2 + uˆC2

C

Y

uˆC

Note que o resíduo da observação C domina a soma dos quadrados dos resíduos e por esta razão o MQO vai orientar a definição dos β’s no sentido de Yˆ = βˆ1 + βˆ2 X minimizar uˆC2 . Este é o efeito da ponderação implícita.

A

uˆ A

uˆ B B

X

Esta estratégia não é correta, pois atribui maior importância ás observações distantes da média, representada pela reta de regressão, e menor importância às observações junto a média.

Estimador de mínimos quadrados generalizados Admitindo que as variâncias dos erros Var(ui)=σi2 , i=1,...,n sejam conhecidas, a ponderação implícita no MQO, provocada pela heterocedasticidade, é compensada pela consideração de um sistema de pesos, em que o quadrado de cada resíduo é ponderado pelo inverso da respectiva variância do erro: n

Min

β1 , β 2 , β 3 ,K, β k

1

∑σ i =1

2 i

[Y − (β i

]

1 + β 2 X 2 , i + β 3 X 3, i + K + β k X k , i )

2

Note a diferença entre a nova função objetivo a ser minimizada e a função considerada pelo estimador MQO. Note que as observações amplamente distantes da média (reta de regressão), na região de maior variância do erro, recebem pesos menores, enquanto as observações junto a média, nas regiões com menor variabilidade do erro, recebem pesos maiores. O novo estimador obtido é conhecido como estimador de mínimos quadrados ponderados (MQP) um caso particular do mínimos quadrados generalizados (MQG). (MQG)

Estimador de mínimos quadrados generalizados Inserindo a variância σi2 dentro do termo quadrático obtém-se:  Yi  X 2,i X 3, i X k ,i 1 + β3 ⋅ +K+ βk ⋅  −  β1 ⋅ + β 2 ⋅ ∑ σi σi σi σi i =1  σ i  n

Min

β1 , β 2 , β 3 ,K, β k

   

2

Denotando Yi = *

Yi

σi

;X

* 1, i

=

1

σi

;X

* 2,i

=

X 2,i

;X

σi

* 3, i

=

X 3, i

σi

; L; X

* k ,i

=

X k ,i

σi

Variáveis transformadas

Obtém-se uma função objetivo semelhante a considerada pelo MQO, porém escrita com as variáveis transformadas.

∑ [Y − (β X n

Min

β1 , β 2 , β 3 ,K, β k

*

i

i =1

1

* 1, i

+ β2 X

* 2 ,i

+ β3 X

* 3, i

+K + βk X

* k ,i

)]

2

Estimador de mínimos quadrados generalizados Isto significa que para aplicar o MQP basta dividir a equação de regressão por σi , o desvio-padrão de ui, e aplicar o estimador MQO para obter as estimativas dos coeficientes β’s. Note que dividindo a equação de regressão por σi

1

σi

Yi = β1 + β 2 X 2,i + β 3 X 3,i + K + β k X k ,i + ui Yi

σi

= β1

1

σi

+ β2

X 2,i

σi

+ β3

X 3, i

σi

+K + βk

X k ,i

σi

i = 1,K , n +

1

σi

Erro da equação transformada

ui i = 1, K , n

Obtém-se uma equação de regressão com erro homocedástico:

 1  1 1 2   Var  ui  = 2 Var (ui ) = 2 σ i = 1 , i = 1,K , n σi σi  σi Dado que os erros do modelo com variáveis transformadas são homocedásticos, os coeficientes de regressão do modelo transformado podem ser estimados por MQO.

Estimador de mínimos quadrados generalizados Lembrando que

σ i2 = σ 2ωi , i = 1,K, n A constante σ2 pode ser suprimida e a ponderação pode ser expressa em termos de ωi

∑ ω [Y − (β n

Min

1

i

β1 , β 2 , β 3 ,K, β k

i =1

]

1 + β 2 X 2 , i + β 3 X 3, i + K + β k X k , i )

2

i

A solução deste problema de minimização produz o estimador de MQP, um caso particular do estimador de MQG, apresentado a seguir em notação matricial: Heterocedasticidade

βˆ MQG

 βˆ1  ˆ  β2   = = X T Ω −1 X M    βˆ k 

(

)

−1

X T Ω −1 y

 ω1 0   0 ω2 Ω= M M  0 0 

K 0  K 0 O M   K ωn 

Estimador de mínimos quadrados generalizados  ω1 0   0 ω2 Ω= M M  0 0 

   Ω −1 =     

1

ω1 0

0

0  K 0 O M   K ωn  K

K

1

M

K ω2 M O

0

0

K

0   0  M   1  ωn 

   −1 Ω =    





1 2

1

ω1 0

1

M

K ω2 M O

0

0

 1  ω1   0 =  M   0 

1 2

Ω = Ω ⋅Ω −1



K

0

K

0   0  M   1  ωn 

K

0 1

K ω2 M 0



1 2

O K

   0   M   1 ωn  0

Estimador de mínimos quadrados generalizados

(

βˆ MQG = X T Ω −1 X βˆ MQG

)

−1

X T Ω −1 y −1

1 1  T  − − =  X Ω Ω X  X T Ω 2 Ω 2 y   1 − 2

Fazendo

1 − 2



1 2

X* = Ω X 1 − 2

y* = Ω y

(

*T * ˆβ MQG = X X

)

−1

X *T y *

Yi* =

Variáveis transformadas

Yi

ωi

X 3*,i =

; X 1*,i = X 3,i

ωi

1

ωi

; X 2*,i =

; L ; X k*,i =

(

Semelhante ao MQO βˆ = X T X

)

−1

X 2 ,i

ωi

;

X k ,i

ωi

XTy

Em suma o MQG é o MQO aplicado nas variáveis transformadas e a inferência pode ser feita da maneira usual pelos testes t e F.

Estimador de mínimos quadrados generalizados Propriedades do estimador MQG

( ) XΩ y = (X Ω X ) X Ω (Xβ + u ) = β + (X Ω X ) X Ω u

βˆ MQG = X T Ω −1 X βˆ MQG βˆ MQG

T

−1 T

−1

T

−1

−1

T

−1

−1

T

−1

−1

( ) [( ) X Ω u] ) = β + (X Ω X) X Ω E[u] E (βˆ )= β E (βˆ E βˆ MQG = β + E X T Ω −1 X T

−1

−1

−1

T

T

−1

−1

X é não aleatório H4

MQG

MQG é não tendencioso

MQG

(

βˆ MQG − β = X T Ω −1 X

)

−1

X T Ω − 1u

=0 H1

Desvio do estimador em relação a sua média

Estimador de mínimos quadrados generalizados Σ βˆ

MQG

Propriedades do estimador MQG

(

)(

)

T  ˆ ˆ = E β MQG − β β MQG − β   

(

)

−1 T −1 T −1 ˆβ X Ω u MQG − β = X Ω X

Σ βˆ

MQG

Σ βˆ

MQG

[(

−1

=E X Ω X

(

T

−1

= X Ω X T

)

)

−1

−1

−1

T

(

−1

T

X Ω uu Ω X X Ω X

[ ]

−1

T

(

−1

T

Σ βˆ

MQG

Σ βˆ Σ βˆ

(

−1

=σ X Ω X T

MQG

( (X

MQG

)

= σ2

T

T

Ω −1

−1

) X)

−1

=σ X Ω X 2

T

)

−1

−1

X Ω E uu Ω X X Ω X Matriz de covariâncias dos erros u

2

−1

T

−1

T

−1

−1

(

T

(

−1

(

T

−1

X Ω XX Ω X

)

−1

)

Σ u = E uu T = σ 2 Ω , Ω ≠ I −1

X Ω ΩΩ X X Ω X T

]

)

−1

)

−1

−1

Matriz de covariância dos estimadores MQG

MQO , MQG , homocedasticidade , heterocedasticidade Estimador MQG Matriz de covariância do estimador MQG

(

T −1 ˆβ MQG = X Ω X

Σ βˆ

(

T

T

−1

X Ω y

−1

=σ X Ω X 2

MQG

)

−1

)

−1

homocedasticidade

1  20 Σu = σ  M  0 

0 1 M 0

heterocedasticidade

K K O K

0  0 2 = σ I M  1 

Ω =I

 ω1 0   0 ω2 Σu = σ 2  M M  0 0  Ω≠I

MQO é um caso particular do MQG

(

βˆ MQO = X T X

Σ βˆ

MQO

(

)

−1

XTy

= σ 2 XT X

)

−1

   2 = σ Ω   K ω n  K K O

0 0 M

O estimador MQG é eficiente e o MQO é ineficiente. Matriz de covariâncias do MQO com erros heterocedásticos As variâncias em

Σβˆ

Σ βˆ

MQO

MQO

(

= σ 2 XT X

)

−1

(

X T ΩX X T X

são maiores que as variâncias em

Σ βˆ

MQG

)

−1

Estimador de mínimos quadrados generalizados exeqüível Na realidade as n variâncias dos erros (ou os n elementos da matriz Ω) não são conhecidas e, portanto, devem ser estimadas. No entanto, dado que a amostra tem n observações, é impossível estimar as n variâncias e os k parâmetros da equação de regressão. A saída é obter alguma informação adicional que permita expressar a variância do erro como uma função dos valores de alguma variável explicativa Xi, está função define a forma de heterocedasticidade, por exemplo: 2 2 A identificação da forma de heterocedasticidade = h X i i h(Xi) não é uma tarefa simples A forma de heterocedasticidade reduz o nº de parâmetros a serem estimados tornando a estimação possível. Note que ao invés de estimar as n variâncias basta estimar apenas a constante de proporcionalidade σ2.

σ

σ

( )

0  h( X 1 )  h( X 2 ) Assim, tem-se o seguinte estimador para a matriz Ω: Ωˆ =  0 M M   0 0 

K 0   K 0  O M   K h( X n )

Estimador de mínimos quadrados generalizados exeqüível

Substituindo a matriz Ω por sua estimativa no estimador MQG tem-se o estimador MQG exequível (MQGE):

βˆ MQGE

 βˆ1  ˆ  −1 β2  T ˆ −1  ˆ −1y = = X Ω X XTΩ M    βˆk 

(

)

ˆˆ Σ β

MQGE

(

)

−1 −1 ˆ = σˆ X Ω X 2

T

O MQGE é tendencioso, mas assintoticamente terá as propriedades desejáveis ˆ for um estimador consistente de Ω. se Ω

Estimador de mínimos quadrados generalizados exeqüível Implementação do MQGE Considere a equação de regressão a ser estimada:

Yi = β1 + β 2 X 2,i + β 3 X 3,i + K + β k X k ,i + ui

i = 1,K, n

Uma vez identificado o padrão de heterocedasticidade, por exemplo, Var(ui) proporcional a X2,i2, (Var(ui)=σ2X2,i2, onde σ2 é uma constante de proporcionalidade) a estimação da equação de regressão por MQGE iniciase com a transformação das variáveis, dividindo toda a equação pelo desvio padrão de ui ignorando-se a constante de proporcionalidade σ2. Neste caso, basta dividir a equação por X2,i resultando na seguinte equação transformada:

X 3, i X k ,i Yi u 1 = β1 + β2 + β3 +K+ βk + i X 2 ,i X 2,i X 2,i X 2 , i X 2 ,i

u* i = 1, K , n

Admitindo que o padrão de heterocedasticidade tenha sido identificado corretamente, o erro u* na equação transformada é homocedástico e, portanto, o MQO poder ser utilizado para estimar a equação transformada:

 ui Var  X  2,i

  = 1 Var (ui ) = 1 ⋅ σ 2 X 22,i = σ 2 variância constante 2  X2 X 2 , i 2 ,i 

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Neste exemplo vamos considerar novamente uma amostra com dados sobre rendimento e despesa familiar anual de um conjunto com 20 famílias. Grupo 1 2 3 4

1,8 3,0 4,2 4,8

Despesas (em US$ 1000) 2,0 2,0 2,0 2,1 3,2 3,5 3,5 3,6 4,2 4,5 4,8 5,0 5,0 5,7 6,0 6,2

despesa anual (US$ 1000)

7

Rendimento (US$ 1000) 5,0 10,0 15,0 20,0

y = 0,2372x + 0,8900 R2 = 0,9335

6 5

Note que neste caso o gráfico das observações de rendimento e despesas já sugere heterocedasticidade

4 3 2 1 0 5,0

7,0

9,0

11,0

13,0

15,0

rendimento anual (US$ 1000)

17,0

19,0

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Mesmo com a suspeita de heterocedasticidade vale utilizar o MQO para estimar a equação de regressão que explica as despesas (Y) em função do rendimento familiar (X):

Yi = β1 + β 2 X i + ui

X=

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

5,0 5,0 5,0 5,0 5,0 10,0 10,0 10,0 10,0 10,0 15,0 15,0 15,0 15,0 15,0 20,0 20,0 20,0 20,0 20,0

Y=

1,8 2,0 2,0 2,0 2,1 3,0 3,2 3,5 3,5 3,6 4,2 4,2 4,5 4,8 5,0 4,8 5,0 5,7 6,0 6,2

(

MQO

βˆ = X T X

)

−1

βˆ1 = 0,89

XTy

βˆ2 = 0,2372

Mais resultados da estimação Coefficients Standard Error Intercept 0,8900 0,2043 X Variable 1 0,2372 0,0149

R2 = 0,9335

F= 252,7223

t Stat 4,3561 15,8972

P-value 0,0004 0,0000

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Análise dos resíduos MQO

(

uˆi = yi − βˆ1 + βˆ 2 X i

0,8 0,6 0,4 0,2 resíduos

uˆ =

-0,276 -0,076 -0,076 -0,076 0,024 -0,262 -0,062 0,238 0,238 0,338 -0,248 -0,248 0,052 0,352 0,552 -0,834 -0,634 0,066 0,366 0,566

)

O gráfico do resíduos contra a variável explicativa sugere que o erro é heterocedástico e sua variância cresce com o rendimento anual

0 -0,2

5

7

9

11

13

15

-0,4 -0,6 -0,8 -1 rendimento anual (US$ 1000)

17

19

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Análise dos resíduos MQO Outra forma de identificar a presença de heterocedasticidade é por meio do gráfico dos resíduos MQO contra os valores ajustados Yˆi = βˆ1 + βˆ2 X i (FOX, 1991) 0,8

O gráfico sugere heterocedasticidade do erro

0,6 0,4

Resíduos

0,2 0 2

2,5

3

3,5

4

4,5

-0,2 -0,4 -0,6 -0,8 -1

Valores ajustados

5

5,5

6

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Estimação por MQGE 1) Padrão de heterocedasticidade: com base no gráfico anterior observa-se que a dispersão dos resíduos cresce com o rendimento, então uma forma plausível para a heterocedasticidade é a seguinte:

Var (ui ) = σ X 2

2 i

DP(ui ) = σX i

2) Transformação das variáveis: neste caso basta dividir a equação de regressão por X, obtendo-se a seguinte equação transformada:

Yi ui 1 = β1 + β2 + Xi Xi Xi

Na equação transformada β2 é o intercepto e β1 a inclinação

3) Estimação por MQO: por hipótese o erro da equação transformada é homocedástico e, portanto, o MQO pode ser utilizado para estimar a equação transformada.

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Estimação por MQGE Cálculo das variáveis transformadas Variáveis originais

Xi=

5,0 5,0 5,0 5,0 5,0 10,0 10,0 10,0 10,0 10,0 15,0 15,0 15,0 15,0 15,0 20,0 20,0 20,0 20,0 20,0

Yi=

1,8 2,0 2,0 2,0 2,1 3,0 3,2 3,5 3,5 3,6 4,2 4,2 4,5 4,8 5,0 4,8 5,0 5,7 6,0 6,2

Variáveis transformadas

Yi = Xi

0,360 0,400 0,400 0,400 0,420 0,300 0,320 0,350 0,350 0,360 0,280 0,280 0,300 0,320 0,333 0,240 0,250 0,285 0,300 0,310

1 = Xi

0,2000 0,2000 0,2000 0,2000 0,2000 0,1000 0,1000 0,1000 0,1000 0,1000 0,0667 0,0667 0,0667 0,0667 0,0667 0,0500 0,0500 0,0500 0,0500 0,0500

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Estimação por MQGE Aplicação do MQO aos dados transformados

Yi * =

0,360 0,400 0,400 0,400 0,420 0,300 0,320 0,350 0,350 0,360 0,280 0,280 0,300 0,320 0,333 0,240 0,250 0,285 0,300 0,310

Xi* =

0,2000 0,2000 0,2000 0,2000 0,2000 0,1000 0,1000 0,1000 0,1000 0,1000 0,0667 0,0667 0,0667 0,0667 0,0667 0,0500 0,0500 0,0500 0,0500 0,0500

O R2 menor não indica que a correção da heterocedasticidade foi incorreta, pois as variáveis foram transformadas. Na verdade o R2 do modelo transformado é pouco informativo.

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

MQO

(

)

−1 βˆ = X * T X * X * T y *

βˆ1 = 0,8875 βˆ2 = 0,2360

Mais resultados da estimação Intercept 1/X

Coefficients Standard Error 0,2495 0,0117 0,7529 0,0983

R2 = 0,7654

Equação estimada

t Stat 21,2812 7,6629

P-value 0,0000 0,0000

F= 58,7206

Yi u 1 = 0,7529 + 0,2495 + i Xi Xi Xi

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) ˆ Y Resíduos da estimação por MQGE x valores ajustados i = βˆ 1 + βˆ 1 2 Xi Xi 0,04 0,03 0,02

Resíduos

0,01 0 0,25 -0,01

0,27

0,29

0,31

0,33

0,35

0,37

-0,02 -0,03 -0,04 -0,05

O gráfico dos resíduos da estimação por MQGE sugere homocedasticidade do erro da equação transformada

-0,06

Valores ajustados

0,39

0,41

Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004) Comparação dos resultados MQO

Yˆi =

+ 0,2372 X i 0,89 (0,2043) (0,0149)

MQG

Yˆi =

0,7529 + 0,2495 X i (0,0983) (0,0117 ) Erro padrão entre parênteses

A proximidade das estimativas pontuais reflete a não tendenciosidade do MQO quando o erro é heterocedastico, note a pequena diferença entre 0,2372 e 0,2495. Porém o erro padrão MQO está calculado de forma errada dada, não é robusto em relação à heterocedasticidade. As estimativas do MQG são mais precisas, note o menor erro-padrão.

Estimador de White (procedimento robusto em relação à heterocedasticidade) Na ausência de conhecimento razoavelmente seguro sobre a forma da heterocedasticidade, poderá considerar-se a a estimação dos coeficientes β por MQO, pois este é não tendencioso mesmo na presença de heterocedasticidade.

(

βˆ MQO = X T X

)

−1

XT y

Porém na estimação da matriz de covariâncias, no lugar −1 2 T da usual Σ βˆ = σ (X X ) deve-se utilizar a matriz −1 −1 Σ βˆ = σ 2 (X T X ) X T ΩX(X T X ) ,a especificação correta da MQO matriz de covariância quando o MQO é aplicado na estimação com erros heterocedásticos. MQO

Assim, o estimador de White para a matriz de covariâncias é dado por: uˆ12 0 L 0 

ˆˆ Σ β

MQO

(

= X X T

)

−1

T

(

T

X SX X X

)

−1

onde

 0 S= M   0

 0 O M  L uˆn2 

uˆ22 L M 0

Halbert L. White Jr. http://weber.ucsd.edu/~mbacci/white/

H. White: "A HeteroskedasticityConsistent Covariance Matrix Estimator and a Direct Test for Heteroskedasticity," Econometrica, 48, 817-838 (1980).

uˆi2 , i = 1, K , n são os resíduos obtidos na estimação por MQO

Estimador estritamente apropriado somente para grandes amostras (WOOLDRIDGE, 2006). Os testes t e F são somente válidos assintoticamente. Note que este procedimento consiste na aplicação do estimador MQO em uma situação com erro heterocedástico, assim os estimadores são ineficientes, pois as variâncias são maiores que as obtidas pelo MQG (PYNDICK & RUBINFELD, 2004), .

Comparação dos estimadores MQO, MQG e White na presença de heterocedasticidade (GUJARATI, 2000) Uma comparação do desempenho dos três estimadores sob erro heterocedástico foi realizada por Davidson e MacKinnon. A comparação baseia-se em simulações de Monte Carlo conduzidas com o seguinte modelo de regressão linear simples:

Yi = β1 + β 2 X i + ui

i = 1, K ,100

em que

β1 = 1 β2 = 1

X i ~ U (0,1)

(

ui ~ N 0, X iα

)

James MacKinnon http://qed.econ.queensu.c a/faculty/mackinnon/

Russell Davidson http://people.mcgill. ca/russell.davidson/

Russell Davidson and James G. MacKinnon, Estimation and Inference in Econometrics, Oxford University Press, New York

α é um parâmetro pré-fixado, cuja finalidade é controlar a variabilidade do erro

Note que o erro é heterocedástico para qualquer α≠0. Se α=1 a variância é proporcional a X, se α=2 a variância é proporcional ao quadrado de X, e assim por diante. Para cada valor de α eles simularam 20.000 amostras, cada uma com 100 observações e calcularam os estimadores MQO, MQG e o estimador de White.

Comparação dos estimadores MQO, MQG e White na presença de heterocedasticidade (GUJARATI, 2000) Erro-padrão da estimativa de β1 (MQO) α

0,5 1,0 2,0 3,0 4,0

Especificação incorreta da matriz de covariâncias 0,164 0,142 0,116 0,100 0,089

Especificação correta da matriz de covariâncias 0,134 0,101 0,074 0,064 0,059

Erropadrão da estimativa de β1 (MQG) 0,110 0,048 0,0073 0,0013 0,0003

Erro-padrão da estimativa de β2 (MQO) Especificação incorreta da matriz de covariâncias 0,285 0,246 0,200 0,173 0,154

Especificação incorreta da matriz de covariâncias (MQO) Especificação robusta em relação à heterocedasticidade (MQO) Especificação da matriz de covariâncias (MQG)

Σ βˆ Σ βˆ

MQO

MQO

Σ βˆ

Erropadrão da Especificação estimativa correta da de β2 matriz de (MQG) covariâncias 0,277 0,243 0,247 0,171 0,220 0,109 0,206 0,056 0,195 0,017

(

= σ 2 XT X

(

= σ 2 XT X

−1

)

−1

T

(

X T ΩX X T X

−1

=σ X Ω X 2

MQG

(

)

)

)

−1

−1

Os resultados mostram a ineficiência do estimador MQO (maiores errospadrão).O MQO superestima o verdadeiro erro-padrão estimado pelo MQG, em especial para grandes valores de α. Conclusão: na presença de heterocedasticidade utilize MQG (GUJARATI, 2000)

Detectando a heterocedasticidade Há vários procedimentos para testar se a hipótese de homocedasticidade é plausível:  Análise dos resíduos do modelo original estimado por MQO  Teste de Goldfeld-Quandt  Teste Park  Teste de Glejser  Teste Breusch-Pagan  Teste de White

H0: homocedasticidade H1: heterocedasticidade

Teste de Goldfeld-Quandt Assume que a variância do erro é uma função monótona de alguma variável explicativa X (em geral uma variável de tamanho), mas não assume especificação para esta função f.

Var (u ) = f ( X )

R.E.Quandt http://www.quandt.com/req.html

O teste baseia-se em uma idéia muito simples:  Primeiro divide-se a amostra em duas subamostras,  Em cada subamostra estima-se o modelo sob análise y=Xβ β+u e obtém-se a série de resíduos de cada um.  A partir das séries de resíduos obtém-se as estimativas para a variância do erro em cada subamostra.  Por fim, aplica-se o teste F para testar a hipótese de igualdade das variâncias. Subamostra II

2,5

σˆ 2II

2 1,5

H 1 : σ 2I ≠ σ 2II (heterocedasticidade )

Subamostra I

1

Resíduos

0,5 0 -0,5

0

5

10

15

20

H 0 : σ 2I = σ 2II (homocedasticidade )

25

30

35

40

45

50

-1

Sob H0

-1,5 -2 -2,5 -3

σˆ 2I

σˆ 2II ~F 2 σˆ I

Renda

S.M. Goldfeld & R.E.Quandt "Some Tests for Homoscedasticity," Journal of the American Statistical Association, 60 (1965), 539-547.

Teste de Goldfeld-Quandt 1)

Ordene as observações por ordem crescente da variável X, se f(X) for uma função crescente, ou por ordem decrescente da variável X, se f(X) for decrescente.

2)

Elimine as c observações centrais (c é um número arbitrário, por exemplo, Pindyck & Rubilfeld sugerem 1/5 da amostra). As n-c observações restantes são divididas em duas subamostras, uma incluindo os valores menores de X (subamostra I) de tamanho n1 e outra seus valores mais elevados (subamostra II) de tamanho n2.

3)

Estime o modelo de regressão sob análise y=Xβ β+u em cada subamostra e obtenha os respectivos resíduos, u(I,i) para i=1, ..., nI e u(2,i) para i=1, ..., n2.

4)

Calcule as somas dos quadrados dos resíduos para obter as estimativas das variâncias do erro em cada sub-amostra: nI

σˆ I2 = 5)

∑ u(1, i )

n II

2

i =1

nI − k

σˆ II2 =

∑ u (2, i )

2

K = nº de parâmetros no modelo de regressão linear

i =1

nII − k

Faça o teste F para igualdade de variâncias:

H 0 : σ 2I = σ 2II (homocedasticidade )

H 1 : σ 2I ≠ σ 2II (heterocedasticidade )

Sob H0

2 ˆ σ II ~ FnII − k ,nI − k 2 σˆ I

Teste de Goldfeld-Quandt Mais apropriado para grandes amostras, de modo que seja possível estimar as duas regressões adequadamente. Requer a normalidade dos resíduos. Requer a ausência de autocorrelação serial para que tenha validade.

Teste de Park Assume a seguinte relação entre a variância do erro e a variável explicativa X>0:

Var (ui ) = σ i2 = δX iC

δ>0 é uma constante de proporcionalidade C é uma constante a ser estimada (C ≠0 sugere heterocedasticidade) Aplicando uma transformação logarítmica tem-se:

ln σ i2 = ln δ + C ln X i Como Var(ui) não é conhecida, substitui-se a variância pelo quadrado do resíduo MQO do modelo y=Xβ β+u sob análise. Também admite-se uma relação estocástica:

ln uˆ = ln δ + C ln X i + vi 2 i

Ruído branco

O modelo acima é uma equação de regressão linear simples que pode ser estimada por MQO. Ao final, por meio de um teste t avalia-se a significância de C:

H 0 : C = 0(homocedasticidade )

H 1 : C ≠ 0(heterocedasticidade )

Sob H0:

Cˆ SC2ˆ

~ t n −2

Teste de Breusch-Pagan Assume que a variância do erro é uma função da combinação linear de p variáveis Z1,...,Zp que podem ser ou não as variáveis explicativas do modelo de regressão linear sob análise:

Var (ui ) = σ i2 = f (α1 + α 2 Z1,i + K + α p Z p ,i )

1) Estime o modelo de interesse y=Xβ β + u por mínimos quadrados ordinários. n 2 Obtenha a série dos quadrados dos resíduos ûi2 e calcule a estimativa de máxima ∑ uˆi verossimilhança da variância do erro u sob a hipótese de homocedasticidade σˆ 2 = i =1 n (n é o número de observações) 2) Estime por MQO o modelo de regressão auxiliar

uˆi2 = α1 + α 2 Z 2,i + K + α p Z p ,i + vi 2 σˆ

3) Calcule a SQExplicada da regressão auxiliar no passo 2. 4) Teste a hipótese nula H0: α2 = α3= ... = αp= 0 (homocedasticidade) contra a hipótese alternativa H1: α2 ≠ 0 ou α3 ≠ 0 ... ou αp ≠ 0 (heterocedasticidade). Sob a hipótese nula, a estatística teste SQExplicada tem distribuição χ2p-1

2

Se a estatística teste calculada for maior que o qui-quadrado tabelado ao nível de significância deve-se rejeitar a hipótese nula.

Teste de White 1) Estime o modelo de interesse y=Xβ β + u por mínimos quadrados ordinários. Obtenha a série dos quadrados dos resíduos ûi2. 2) Estime por mínimos quadrados ordinários o modelo de regressão auxiliar em que ûi2 é explicado pelas variáveis explicativas do modelo de regressão original, seus quadrados e interações entre elas: k

k

uˆ = α1 + ∑ α j X j ,i + ∑ δ j X 2 i

j =2

j =2

2 j ,i

k −1 k

+ ∑∑ θ j ,l X j ,i X l ,i + vi j = 2 l =3

3) Obtenha o R2 da regressão auxiliar. 4) Teste a hipótese nula H0: α2 = α3= ... = αk= δ2 =...= δk = θ23 =...= θk-1,k = 0 (homocedasticidade) contra a hipótese alternativa H1: pelo menos um dos coeficientes é diferente de zero (heterocedasticidade). Sob a hipótese nula, a estatística teste nR2 tem distribuição χ2 com graus de liberdade igual ao número de variáveis explicativas no modelo de regressão auxiliar, Se a estatística teste calculada for maior que o qui-quadrado tabelado ao nível de significância deve-se rejeitar a hipótese nula.

Exemplo Considere o seguinte modelo de regressão linear múltipla aplicado ao corte transversal (referente ao ano de 1970) formado pelos 51 estados norte americanos:

EXPi = β1 + β 2 AIDi + β 3 POPi + β 4 INCi + ui

i =1 , 50 observações

Onde: EXPi = gastos do governo no estado i AIDi = ajuda do governo federal ao estado i POPi = população do estado i INCi = renda agregada do estado i Para este modelo a expectativa é que o termo aleatório seja heterocedástico, pois trata-se de uma cross-section formada por unidades (estados) de tamanhos diferentes. Neste caso, a população é a variável associada ao tamanho das unidades e, portanto, é a variável que explica a possível heterocedasticidade.

Exemplo EXP

y=

704,00 526,00 411,00 5.165,98 699,00 2.545,99 22.749,37 5.911,02 8.840,06 6.867,01 3.456,99 8.935,04 7.799,04 3.756,99 3.527,99 2.108,00 3.156,00 475,00 521,00 1.052,00 1.550,99 571,00 3.391,98 3.037,02 1.250,00 2.938,01 1.512,00 3.197,00 4.771,00 2.063,01 2.446,01 2.104,01 1.427,01 1.014,00 2.690,99 1.767,01 7.246,00 587,00 512,00 368,01 1.919,99 823,00 1.522,99 821,00 543,02 3.070,01 1.766,00 20.051,97 698,00 940,03

AID

X=

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

190,84 95,20 108,10 1.101,24 178,30 446,60 4.408,08 1.036,21 1.619,08 1.200,86 544,46 1.754,06 1.324,91 525,02 631,95 325,89 716,80 127,43 132,60 204,75 299,38 97,07 546,48 624,22 452,34 736,16 411,26 842,47 837,56 598,39 712,60 679,55 575,28 399,59 732,65 500,27 1.636,16 180,43 135,90 127,67 432,61 298,05 294,45 220,89 95,94 628,91 439,18 4.082,20 185,25 164,83

POP 1.026 774 460 5.796 969 3.080 18.367 7.349 11.905 10.722 5.286 11.244 9.013 4.526 3.877 2.884 4.747 634 680 1.528 2.268 571 4.048 4.765 1.795 5.221 2.688 4.733 7.347 3.306 4.072 3.521 2.256 2.008 3.738 2.633 11.604 716 755 346 2.364 1.076 1.963 1.127 533 3.418 2.185 20.411 325 816

INC 3.759.264 3.311.946 1.703.380 27.965.700 4.373.097 16.675.120 96.885.928 39.530.272 54.108.220 49.020.980 23.068.100 58.041.528 44.902.768 19.366.750 16.837.810 12.447.340 20.445.330 2.617.152 2.560.880 6.801.128 10.285.380 2.981.762 20.308.820 20.946.940 6.505.080 20.194.830 9.408.000 18.723.750 32.694.150 12.014.000 15.098.980 12.239.000 7.192.128 6.716.760 13.325.970 10.102.820 47.402.340 2.923.428 2.801.805 1.477.074 10.874.400 3.778.912 8.387.899 4.216.107 2.776.397 15.726.220 9.480.715 103.830.800 1.697.150 4.204.848

Estimação por MQO

(

βˆ = X T X

)

−1

XT y

βˆ1 = −46,80526 βˆ2 = 3,23823 βˆ3 = −0,59662 βˆ4 = 0,00019 Raiz quadrada dos elementos da matriz Interseção AID POP INC

(

Σ βˆ = σˆ X X 2

T

)

−1

Coeficientes Erro padrão Stat t valor-P -46,80526 84,21 -0,56 0,58 3,23823 0,24 13,64 0,00 -0,59662 0,10 -5,71 0,00 0,00019 0,00 8,12 0,00

Exemplo Equação estimada por MQO (erros padrão entre parêntesis)

EXPi = −46,80526 + 3,23823 ⋅ AIDi − 0,59662 POPi + 0,00019 INCi + ui (84,21) (0,24) (0,10) (0,000023) Resíduos:

uˆi = EXPi − (− 46 ,80526 + 3 ,23823 ⋅ AIDi − 0 ,59662 POPi + 0 ,00019 INCi ) 1500

O gráfico sugere que a variância do erro cresce com a população

1000

Resíduos

500

População 0 0

-500

-1000

-1500

5000

10000

15000

20000

25000

EXP 698,00 368,01 411,00 543,02 571,00 475,00 521,00 587,00 512,00 526,00 940,03 699,00 704,00 823,00 821,00 1.052,00 1.250,00 1.522,99 1.014,00 1.766,00 1.427,01 1.550,99 1.919,99 1.767,01 1.512,00 2.108,00 2.545,99 2.063,01 3.070,01 2.104,01 2.690,99 3.527,99 3.391,98 2.446,01 3.756,99 3.197,00 3.156,00 3.037,02 2.938,01 3.456,99 5.165,98 4.771,00 5.911,02 7.799,04 6.867,01 8.935,04 7.246,00 8.840,06 22.749,37 20.051,97

intercepto 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

AID 185,25 127,67 108,10 95,94 97,07 127,43 132,60 180,43 135,90 95,20 164,83 178,30 190,84 298,05 220,89 204,75 452,34 294,45 399,59 439,18 575,28 299,38 432,61 500,27 411,26 325,89 446,60 598,39 628,91 679,55 732,65 631,95 546,48 712,60 525,02 842,47 716,80 624,22 736,16 544,46 1.101,24 837,56 1.036,21 1.324,91 1.200,86 1.754,06 1.636,16 1.619,08 4.408,08 4.082,20

POP 325 346 460 533 571 634 680 716 755 774 816 969 1.026 1.076 1.127 1.528 1.795 1.963 2.008 2.185 2.256 2.268 2.364 2.633 2.688 2.884 3.080 3.306 3.418 3.521 3.738 3.877 4.048 4.072 4.526 4.733 4.747 4.765 5.221 5.286 5.796 7.347 7.349 9.013 10.722 11.244 11.604 11.905 18.367 20.411

INC 1.697.150 1.477.074 1.703.380 2.776.397 2.981.762 2.617.152 2.560.880 2.923.428 2.801.805 3.311.946 4.204.848 4.373.097 3.759.264 3.778.912 4.216.107 6.801.128 6.505.080 8.387.899 6.716.760 9.480.715 7.192.128 10.285.380 10.874.400 10.102.820 9.408.000 12.447.340 16.675.120 12.014.000 15.726.220 12.239.000 13.325.970 16.837.810 20.308.820 15.098.980 19.366.750 18.723.750 20.445.330 20.946.940 20.194.830 23.068.100 27.965.700 32.694.150 39.530.272 44.902.768 49.020.980 58.041.528 47.402.340 54.108.220 96.885.928 103.830.800

Exemplo teste de Goldfeld-Quandt

Subamostra I nI = 21

8 observações centrais (c=8)

Subamostra II nII = 21

1) Ordene a amostra na ordem crescente da população dos estados 2) Retire algumas observações centrais e forme duas subamostras

EXP 698,00 368,01 411,00 543,02 571,00 475,00 521,00 587,00 512,00 526,00 940,03 699,00 704,00 823,00 821,00 1.052,00 1.250,00 1.522,99 1.014,00 1.766,00 1.427,01 1.550,99 1.919,99 1.767,01 1.512,00 2.108,00 2.545,99 2.063,01 3.070,01 2.104,01 2.690,99 3.527,99 3.391,98 2.446,01 3.756,99 3.197,00 3.156,00 3.037,02 2.938,01 3.456,99 5.165,98 4.771,00 5.911,02 7.799,04 6.867,01 8.935,04 7.246,00 8.840,06 22.749,37 20.051,97

intercepto 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

AID 185,25 127,67 108,10 95,94 97,07 127,43 132,60 180,43 135,90 95,20 164,83 178,30 190,84 298,05 220,89 204,75 452,34 294,45 399,59 439,18 575,28 299,38 432,61 500,27 411,26 325,89 446,60 598,39 628,91 679,55 732,65 631,95 546,48 712,60 525,02 842,47 716,80 624,22 736,16 544,46 1.101,24 837,56 1.036,21 1.324,91 1.200,86 1.754,06 1.636,16 1.619,08 4.408,08 4.082,20

POP 325 346 460 533 571 634 680 716 755 774 816 969 1.026 1.076 1.127 1.528 1.795 1.963 2.008 2.185 2.256 2.268 2.364 2.633 2.688 2.884 3.080 3.306 3.418 3.521 3.738 3.877 4.048 4.072 4.526 4.733 4.747 4.765 5.221 5.286 5.796 7.347 7.349 9.013 10.722 11.244 11.604 11.905 18.367 20.411

INC 1.697.150 1.477.074 1.703.380 2.776.397 2.981.762 2.617.152 2.560.880 2.923.428 2.801.805 3.311.946 4.204.848 4.373.097 3.759.264 3.778.912 4.216.107 6.801.128 6.505.080 8.387.899 6.716.760 9.480.715 7.192.128 10.285.380 10.874.400 10.102.820 9.408.000 12.447.340 16.675.120 12.014.000 15.726.220 12.239.000 13.325.970 16.837.810 20.308.820 15.098.980 19.366.750 18.723.750 20.445.330 20.946.940 20.194.830 23.068.100 27.965.700 32.694.150 39.530.272 44.902.768 49.020.980 58.041.528 47.402.340 54.108.220 96.885.928 103.830.800

Exemplo teste de Goldfeld-Quandt

Subamostra I nI = 21

3) Estime o modelo de regressão EXPi = β1 + β 2 AIDi + β 3 POPi + β 4 INCi + ui

em cada subamostra e obtenha a respectiva SQResíduos

Subamostra II nII = 21

EXP 698,00 368,01 411,00 543,02 571,00 475,00 521,00 587,00 512,00 526,00 940,03 699,00 704,00 823,00 821,00 1.052,00 1.250,00 1.522,99 1.014,00 1.766,00 1.427,01 1.550,99 1.919,99 1.767,01 1.512,00 2.108,00 2.545,99 2.063,01 3.070,01 2.104,01 2.690,99 3.527,99 3.391,98 2.446,01 3.756,99 3.197,00 3.156,00 3.037,02 2.938,01 3.456,99 5.165,98 4.771,00 5.911,02 7.799,04 6.867,01 8.935,04 7.246,00 8.840,06 22.749,37 20.051,97

intercepto 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

AID 185,25 127,67 108,10 95,94 97,07 127,43 132,60 180,43 135,90 95,20 164,83 178,30 190,84 298,05 220,89 204,75 452,34 294,45 399,59 439,18 575,28 299,38 432,61 500,27 411,26 325,89 446,60 598,39 628,91 679,55 732,65 631,95 546,48 712,60 525,02 842,47 716,80 624,22 736,16 544,46 1.101,24 837,56 1.036,21 1.324,91 1.200,86 1.754,06 1.636,16 1.619,08 4.408,08 4.082,20

POP 325 346 460 533 571 634 680 716 755 774 816 969 1.026 1.076 1.127 1.528 1.795 1.963 2.008 2.185 2.256 2.268 2.364 2.633 2.688 2.884 3.080 3.306 3.418 3.521 3.738 3.877 4.048 4.072 4.526 4.733 4.747 4.765 5.221 5.286 5.796 7.347 7.349 9.013 10.722 11.244 11.604 11.905 18.367 20.411

INC 1.697.150 1.477.074 1.703.380 2.776.397 2.981.762 2.617.152 2.560.880 2.923.428 2.801.805 3.311.946 4.204.848 4.373.097 3.759.264 3.778.912 4.216.107 6.801.128 6.505.080 8.387.899 6.716.760 9.480.715 7.192.128 10.285.380 10.874.400 10.102.820 9.408.000 12.447.340 16.675.120 12.014.000 15.726.220 12.239.000 13.325.970 16.837.810 20.308.820 15.098.980 19.366.750 18.723.750 20.445.330 20.946.940 20.194.830 23.068.100 27.965.700 32.694.150 39.530.272 44.902.768 49.020.980 58.041.528 47.402.340 54.108.220 96.885.928 103.830.800

Exemplo teste de Goldfeld-Quandt

Subamostra I nI = 21 ANOVA df Regression Residual Total

SS MS 2.957.338,81 985.779,60 88.308,84 5.194,64 3.045.647,65

3 17 20

F 189,77

Significance F 2,88174E-13

SQResíduos

Subamostra II nII = 21

SQResíduos

ANOVA df Regression Residual Total

3 17 20

SS MS 592.513.592,29 197.504.530,76 5.453.827,09 320.813,36 597.967.419,39

F Significance F 615,64 1,56325E-17

Exemplo teste de Goldfeld-Quandt

4) Calcule a estatística teste

SQ Re síduos II 5.453.827,09 5.453.827,09 nII − k 17 21 − 4 = = = 61,76 SQ Re síduos I 88.308,84 88.308,84 nI − k 21 − 4 17 k = número de parâmetros lineares, neste caso quatro Ao nível de significância de 5%, o F17,17 é 2,27 Como 61,76 > 2,27 rejeita-se a hipótese nula de homocedasticidade do erro

Exemplo teste de Park 1) Estime o modelo EXPi = β1 + β 2 AIDi + β 3 POPi + β 4 INCi + ui i=1,50 por MQO e obtenha a série de resíduos:

uˆi = EXPi − (− 46 ,80526 + 3 ,23823 ⋅ AIDi − 0 ,59662 POPi + 0 ,00019 INCi ) 2) Identifique a variável relacionada com a heterocedasticidade do erro, neste caso é a população. Em seguida estime o modelo de regressão linear simples, onde o logaritmo dos quadrados dos resíduos é explicado pelo logaritmo da população: 16

ln uˆ = α1 + α 2 ln POPi 2 i

Intercept LnPOP

αˆ 2

Coefficients Standard Error -1,1636 1,7815 1,4133 0,2255

Ln û2 14

t Stat -0,6532 6,2675

P-value 0,5168 0,0000

P-valor < 5% , logo α1 é significativamente diferente de zero e o erro é heterocedástico

12

10

8

6

LnPOP 4 4

5

6

7

8

9

10

11

Exemplo teste de Park 3) Com base nestes resultados obtemos a seguinte especificação para o padrão de heterocedasticidade:

Var (ui ) é proporcional a POPi

1, 4133

Exemplo Teste de Breusch-Pagan 1) Estime o modelo original por mínimos quadrados ordinários:

EXPi = β1 + β 2 AIDi + β 3 POPi + β 4 INCi + ui

i =1 , 50 observações

obtenha a série dos quadrados dos resíduos û2. 2 uˆi2 = [EXPi − (− 46,80526 + 3,23823 ⋅ AIDi − 0,59662 POPi + 0,00019 INCi )] 50

∑ uˆ

2 i

e o estimador de máxima verossimilhança do 2 ˆ σ = i =1 = 129.497,3 erro na hipótese de homocedasticidade 50 2) Estime a regressão auxiliar por mínimos quadrados ordinários:

uˆi2 = α1 + α 2 AIDi + α 3 POPi + α 4 INCi + vi 2 σˆ 3) Calcule a SQExplicada da regressão auxiliar, neste caso, 88,6148 4) O valor da estatística teste (SQExplicada/2) é 88,6148/2 = 44,30738. Sob H0 a estatística teste tem distribuição qui-quadrado com 3 graus de P (χ 32 > 44,30738) ≅ 0 < 5% liberdade. O p-valor logo rejeita-se a hipótese de homocedasticidade

Exemplo Teste de White 1) Estime o modelo original por mínimos quadrados ordinários:

EXPi = β1 + β 2 AIDi + β 3 POPi + β 4 INCi + ui

i =1 , 50 observações

e obtenha a série dos quadrados dos resíduos û2. 2 uˆi2 = [EXPi − (− 46,80526 + 3,23823 ⋅ AIDi − 0,59662 POPi + 0,00019 INCi )]

2) Estime a regressão auxiliar por mínimos quadrados ordinários:

uˆi2 = α1 + α 2 AIDi + α 3 POPi + α 4 INCi + δ 2 AIDi2 + δ 3 POPi 2 + δ 4 INCi2 +

θ 2,3 AIDi POPi + θ 24 AIDi INCi + θ 3, 4 POPi INCi + vi 3) Calcule o R2 da regressão auxiliar, neste caso seu valor é 0,5644. 4) O valor da estatística teste (nR2) é 50 x 0,5644 = 28,2202. Sob H0 a estatística teste tem distribuição qui-quadrado com 9 graus de liberdade. O p-valor P (χ 92 > 28,2202) ≅ 0,00088 < 5% logo rejeita-se a hipótese de homocedasticidade

Exemplo estimação por mínimos quadrados ponderados 1) Pelo resultado do teste de Park, estimamos o padrão de heterocedasticidade como sendo

Var (ui ) é proporcional a POPi

1, 4133

Assim, podemos transformar a equação de regressão original:

EXPi POPi1, 4133

= β1

1 POPi1, 4133

+ β2

AIDi POPi1, 4133

+ β3

POPi POPi1, 4133

+ β4

INCi POPi1, 4133

+ ui*

2) Estime a equação transformada por MQO, pois por hipótese u* é homocedástico (erro-padrão entre parêntesis) EXˆPi POPi1, 4133

= 15,89

(27,96)

1 POPi1, 4133

+ 2,39

(0,25)

AIDi POPi1, 4133

− 0,62

(0,09)

POPi POPi1, 4133

+ 0,00022

INCi POPi1, 4133

(0,000019)

Exemplo estimação por mínimos quadrados ponderados Resíduos da equação transformada x população

EXPi POPi1, 4133

= β1

1 POPi1, 4133

+ β2

AIDi POPi1, 4133

+ β3

POPi POPi1, 4133

+ β4

INCi POPi1, 4133

+ ui*

2) Estime a equação transformada por MQO, pois por hipótese u* é homocedástico (erro-padrão entre parêntesis) EXˆPi POPi1, 4133

= 15,89

(27,96)

1 POPi1, 4133

+ 2,39

(0,25)

AIDi POPi1, 4133

− 0,62

(0,09)

POPi POPi1, 4133

+ 0,00022

INCi POPi1, 4133

(0,000019)

3) Estimativa da equação original por mínimos quadrados ponderados:

EXˆPi = 15,89 + 2,39 AIDi − 0,62 POPi + 0,00022 INCi

Referências bibliográficas FOX, J. Regression Diagnostics, Sage University Paper Series on Quantitative Applications on the Social Science, series, nº 07-079, 1991. GUJARATI, D.N. Econometria Básica, 3ª edição, Pearson Makron Books, São Paulo, 2000. HILL, R.C.; GRIFFITHS, W.E. & JUDGE, G.G. Econometria, 2ª edição, Editora Saraiva, São Paulo, 2003. MADDALA, G.S. Introdução à econometria, LTC, Rio de Janeiro, 2003. MORETTIN, P.A. Econometria Financeira: um curso em séries temporais financeiras, Editora Blucher, São Paulo, 2008. PYNDICK, R.S. & RUBINFELD, D.L. Econometria: Modelos & Previsões, Elsevier, Rio de Janeiro, 2004. WOOLDRIDGE, J.M. Introdução à econometria: uma abordagem moderna, Thomson, São Paulo, 2006.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.