Econometria – Econometria – Semestre 2010.01
148
148
3) O teste de Durbin‐Watson A estatística d de Durbin e Watson é uma estatística de teste para autocorrelação de lag 1. Ela é baseada apenas nos resíduos de uma regressão, e a facilidade no seu cálculo faz com que ela seja incluída com freqüência dentre os diagnósticos padrão de um modelo de regressão. A estatística é definida como:
Note que o numerador da Durbin‐Watson é apenas a diferença (ao quadrado) entre resíduos em instantes sucessivos, e o denominador é a soma do quadrado dos resíduos (RSS).
O valor da estatística d é sempre um número entre 0 e 4.
A estatística d é aproximadamente igual a 2(1‐ρ^), onde ρ^ é o coeficiente de correlação amostral entre os resíduos. De d = 2, NÃO HÁ EVIDÊNCIA DE AUTOCORRELAÇÃO ENTRE OS RESÍDUOS. Portanto, a autocorrelação entre os resíduos é indicada por valores de d significantemente diferentes de 2.
Como uma regra empírica, valores de d < 1 são um indicador de problemas evidentes de autocorrelação positiva nos resíduos. Valores pequenos de d significam que, na média, resíduos sucessivos estão próximos, ou seja, têm correlação positiva. Se d > 2, resíduos sucessivos são, em média, muito diferentes uns dos outros, indicando correlação negativa. Note que se ρ^ = ‐ 1, então d = 4, e assim valores de d próximos de 4 indicam autocorrelação negativa dos resíduos.
Entretanto, é preciso conhecer as hipóteses subjacentes para usar a estatística de Durbin‐Watson de uma maneira adequada. Elas são:
O modelo de regressão inclui o termo constante;
As variáveis explicativas X no modelo não são estocásticas, i.e, são fixas;
Os distúrbios ut no modelo são supostos gerados por um processo AR(1), ou seja, ut = ρ. ut‐1 + et e assim a estatística não pode ser usada para detectar autocorrelações de ordem mais alta que um nos resíduos.
O termo de erro ut é suposto Normal.
P r o f e s s o r a M ô n i c a B a r r o s ENCE
Econometria – Semestre 2010.01
O modelo não inclui Y defasado como variável explicativa.
Não existem observações faltantes na amostra.
149
149
Uma questão importante é: não deixe de avaliar se as premissas do teste Durbin‐Watson são válidas antes da sua aplicação. O fato da estatística d estar disponível na maioria dos softwares estatísticos leva muitas pessoas a usá‐la de maneira indiscriminada (e errônea). Por exemplo, se a distribuição dos erros não é Normal, se existe autocorrelação de ordem maior que um, ou se a variável dependente aparece defasada como uma das variáveis explicativas, o teste de Durbin e Watson não é aplicável. Nestas situações pode‐se usar uma alternativa, o teste Breusch‐Godfrey (ou Teste LM de Correlação Serial), que será descrito a seguir.
A hipótese nula no teste de Durbin‐Watson é a de que os erros do modelo não apresentam autocorrelação serial de ordem 1. A distribuição exata da estatística d é complicada e não existe um único valor crítico que leva à rejeição da hipótese nula. O uso da estatística d depende então de valores críticos dL e dU obtidos por Durbin e Watson e da aplicação das regras de decisão descritas a seguir. dL e dU dependem do número de observações n e do número de variáveis explicativas, mas não dependem dos valores das variáveis explicativas. A tabela D.5 do Gujarati contém estes limites, e será reproduzida a seguir.
Para testar a existência de autocorrelação POSITIVA com nível de significância , a estatística de teste d é comparada aos valores críticos dL e dU da seguinte forma:
Se d < dL existe evidência de autocorrelação positiva nos erros, REJEITA‐SE A HIPÓTESE NULA DE CORRELAÇÃO ZERO DOS ERROS.
Se d > dU existe evidência de que os erros NÃO SÃO positivamente correlacionados;
Se dL < d < dU , o teste é inconclusivo.
Para testar a existência de autocorrelação NEGATIVA com nível de significância , a estatística de teste (4‐d) é comparada aos valores críticos dL e dU da seguinte forma:
Se (4‐d) < dL existe evidência de autocorrelação negativa nos erros, REJEITA‐SE A HIPÓTESE NULA DE CORRELAÇÃO ZERO DOS ERROS. Note que esta região crítica é equivalente à região: 4 – dL < d < 4.
Se (4‐d) > dU existe evidência de que os erros NÃO SÃO negativamente correlacionados;
P r o f e s s o r a M ô n i c a B a r r o s ENCE
Econometria – Semestre 2010.01
150
150
Se dL < (4‐d) < dU , o teste é inconclusivo.
As tabelas de valores críticos da estatística d com nível de significância 5% são dadas a seguir. As mesmas tabelas para nível 1% estão no apêndice D.5. de Gujarati.
Um ponto importante a observar na tabela é: a região de indecisão (em que não se pode concluir nada) se estreita à medida que o tamanho da amostra cresce.
P r o f e s s o r a M ô n i c a B a r r o s ENCE
Econometria – Semestre 2010.01
151
151
Exemplo Considere um modelo de regressão com n = 40 observações e apenas uma variável explicativa. Então k´ = 1 (número de variáveis explicativas) e dL = 1, 442 e dU = 1,544 com nível de significância 5%. Se o valor calculado da estatística d é menor que 1,442, existe evidência de correlação positiva de 1a. ordem nos erros. Se a estatística d é maior que 1, 544, NÃO EXISTE evidência de correlação serial positiva nos erros. Se d está entre 1,442 e 1,544, o teste é inconclusivo. Suponha agora que o tamanho da amostra é 150 e existe ainda apenas uma variável explicativa. Então: dL = 1, 720 e dU = 1,746 e a região de indefinição passou a ser apenas o intervalo entre estes dois números, bem mais estreito que o intervalo mostrado no parágrafo anterior.
P r o f e s s o r a M ô n i c a B a r r o s ENCE
Econometria – Semestre 2010.01
152
152
4) O teste de Breusch‐Godfrey (BG) – teste LM para correlação serial Breusch e Godfrey desenvolveram um teste para autocorrelação que não sofre das mesmas limitações do teste Durbin‐Watson. Considere o modelo de regressão com duas variáveis:
Suponha que o termo de erro ut segue um processo AR(p), isto é:
Onde et é um ruído branco (sequência de observações independentes e identicamente distribuídas) com média zero e variância constante. Considere a hipótese nula de inexistência de correlação serial (de qualquer ordem), isto é:
O teste BG é implementado através dos seguintes passos: 1) Estime (12.6.14) por MQO e obtenha os resíduos 2) Faça a regressão de
ˆt u
;
contra as variáveis explicativas originais do modelo (12.6.14) e os
ˆt u
próprios resíduos defasados até o lag p, ou seja, faça a regressão:
3) Encontre o R2 da regressão auxiliar (12.6.17). 4) Sob a hipótese de um tamanho de amostra grande, Breusch e Godfrey provaram que:
5) Se (n‐p)R2 for grande (maior que o valor crítico da distribuição Qui‐Quadrado com p graus de liberdade), a regressão auxiliar (12.6.17) é “importante”, e o resíduo depende dos seus p valores defasados e de X. Assim, se (n‐p)R2 for grande rejeitamos a hipótese nula de inexistência de autocorrelação dos erros, ou seja, há evidência de que ao menos um dos ´s em (12.6.17) é diferente de zero.
Algumas considerações sobre o teste de Breusch‐Godfrey
O modelo de regressão pode conter o regressando Y defasado, isto é, Yt‐1, Yt‐2, ..., ao contrário das premissas para a utilização do teste de Durbin‐Watson.
P r o f e s s o r a M ô n i c a B a r r o s ENCE
Econometria – Semestre 2010.01
153
153
O teste BG pode ser aplicado quando os erros seguem processos MA (médias móveis), que têm a forma:
Onde εt é um ruído branco.
Se, na equação (12.6.15), p =1, ou seja, o erro segue um processo AR(1), o teste BG é chamado de teste M de Durbin.
Um problema com o teste BG é que o número de defasagens p em (12.6.15) não pode ser especificado a priori, e temos que experimentar diversos valores de p.
O que fazer se encontramos autocorrelação? De acordo com Gujarati, existem 4 opções: 1) Verificar se a autocorrelação não é resultado de um erro de especificação do modelo, por terem sido omitidas variáveis importantes ou por ter sido especificada uma forma funcional incorreta; 2) Se a autocorrelação for “pura” (ou seja, se não for resultado de um erro de especificação), pode‐se tentar tratar o problema através de mínimos quadrados generalizados; 3) Se a amostra for grande pode‐se empregar o método de Newey‐West para obter erros‐ padrão dos estimadores MQO que foram corrigidos para a autocorrelação. Este método estende o método de White do capítulo anterior. (Veja, por exemplo, o guia do usuário do Eviews para maiores explicações sobre este método). 4) Em algumas situações, os estimadores MQO continuam a ser adotados.
12.7. ESPECIFICAÇÃO ERRÔNEA VERSUS AUTOCORRELAÇÃO PURA – EXEMPLO Considere novamente o exemplo da seção 12.5, a regressão dos salários versus a produtividade. Dois modelos tinham sido ajustados: 1) Modelo linear
P r o f e s s o r a M ô n i c a B a r r o s ENCE
Econometria – Semestre 2010.01
154
154
2) Modelo log‐linear
Considere o modelo linear (12.5.1). A estatística de Durbin‐Watson d é muito baixa e indica uma significante correlação positiva de 1a. ordem. Ambas as variáveis X e Y são séries temporais e é possível que apresentem tendências. Para tentar eliminar (ou pelo menos reduzir) a autocorrelação podemos ajustar uma tendência linear ao modelo:
Qual a interpretação de (12.8.1)? Ao longo do tempo, o índice real de salários diminui aproximadamente 0,90 unidades por ano. Levando‐se isso em conta, se o índice de produtividade (X) aumenta 1 unidade, o índice de salários aumenta aproximadamente 1,30 unidades (mas este número não é estatisticamente diferente de 1, veja o seu erro padrão).
No entanto, apesar da incorporação da tendência, o valor da estatística de Durbin‐Watson é ainda muito baixo,sugerindo que exista autocorrelação “pura”, e não um erro de especificação.
Podemos testar outras especificações, por exemplo a inclusão do quadrado de X no modelo. O resultado é:
Os coeficientes são todos significantes, mas a estatística de Durbin‐Watson é ainda pequena, e sugere autocorrelação positiva dos erros. Assim, a relação entre salários e produtividade é provavelmente afetada por uma autocorrelação “pura”, e não por uma causada por especificação incorreta do modelo.
P r o f e s s o r a M ô n i c a B a r r o s ENCE