Dispensa di introduzione a Gretl preparata per gli studenti di Econometria - CLED - A.A. 2009/2010 Chiara Monfardini Alessia Russo
November 11, 2009
1
Intr Introdu oduzi zion one e a Gret Gretll
1.1 1.1
Fonti onti
Gretl è un programma statistico opensource (dunque liberamente scaricabile da internet) creato per la rielaborazione econometrica di dati di varia natura (cross-section, time-series, panel-data). Può essere direttamente scaricato dal sito http://gretl.sourcefor http://gretl.sourceforge.net/gretl_ ge.net/gretl_italiano.html, italiano.html, men mentre la guida in italiano è scaricabile dal sito http://ricardo.ecn.wfu.e http://ricardo.ecn.wfu.edu/pub//gretl/manu du/pub//gretl/manual/it/gretlal/it/gretlguide-it.pdf. Seguite guide-it.pdf. Seguite le procedure per il download della versione del software gretl-1.7.9.
1.2
Import Importazio azione, ne, apertu apertura ra e salvata salvataggio ggio di dati dati
Si possono importare importare diversi diversi tipi di …le di dati: File gretl (*.gdt), (*.gdt), di testo (*.txt), di tipo ASCII (*.dat), di tipo STATA (*.dta), e altri. 1.2.1 1.2.1
Importa Importazio zione ne dati dati con con Gret Gretll
File ! Apri dati ! Importa ! ASCII (*.txt)! (*.txt) !c:n c:n.....n .....ncaschool.txt Questo Questo …le contiene contiene i dati sui distretti distretti scolastici scolastici della California California descritti nell’appendice nell’appendice 4.1 del testo di Stock & Watson, il dataset ha le seguenti caratteristiche: - Numero di osservazioni: 420 - Numero di variabili: 16
1
Una volta caricato il dataset viene visualizzato l’elenco delle variabili e la loro breve descrizione entrando nella …nestra Dati. Dati. Nel caso in cui non sia presen presenta ta una descri descrizio zione ne dei dati è possibile aggiungerla selezionando la variabile, cliccando sopra con il tasto destro e selezionando l’opzione Modi…ca attributi . E’ inoltre possibile possibile vedere vedere la matrice matrice di dati (dataset) (dataset) entrando nella …nestra Visualizza ! Finestre icone ! Dataset. 1.2.2 1.2.2
Salvata Salvataggi ggio o dati dati format formato o Gretl Gretl
Il salvataggio dei dati in formato Gretl avviene invece seguendo la seguente procedura: File ! File ! Salva dati come ! Gretl ! (seleziona variabili da salvare) ! OK. 1.2.3 1.2.3
Apertur Apertura a di …le format formato o Gret Gretll
Nel caso in cui vogliate aprire un …le salvato in formato Gretl seguite la seguente procedura: File ! Apri dati ! File utente ! c:n c:n.....n .....ncaschool.gdt. 1.2.4 1.2.4
Salvata Salvataggi ggio o dati dati forma formato to CSV CSV
Il salvataggio dei dati in formato CSV avviene seguendo la seguente procedura: File ! File ! Esporta Esporta dati ! CSV ! (seleziona "tab" come separatore per le colonne dei dati) ! OK.
1.3
Trasfor rasformaz mazion ione e dati dati
Entrare nella …nestra Aggiungi ! De…nisci nuova variabile . Nello Nello spazio spazio bianco bianco si possono possono digitare digitare espressio espressioni ni per e¤ettuare e¤ettuare trasforma trasformazioni zioni delle variabili ariabili esistent esistentii e aggi aggiunger ungeree nuove nuove variabili ariabili al dataset dataset (la stessa stessa operazione operazione può essere essere fatta entrando entrando nella …nestra Variabile). Variabile). * Esempio 1: creazione della costante (nel costante (nel dataset-caschool è già presente) const=1 * Esempio 2: trasformazione logaritmica ltest=log(testscr) * Esempio 3: di¤erenza prima d1_testscr=testscr-testscr(-1) * Esempio 4: cambiamento unità di misura expnstu_d=expnstu/1000
2
1.4
Analisi Analisi prelim prelimina inare re dei dati dati
Nella …nestra Variabile …nestra Variabile si si possono selezionare i comandi per visualizzare vari tipi di statistiche descrittive relative ad una sola variabile. a1. Istogramma di una variabile: Gra…co frequenze !numero di intervalli (n=20) ! OK b1. Statistiche descrittive di sintesi: Statistiche descrittive ! OK Nella …nestra Visualizza …nestra Visualizza si si possono selezionare i comandi per visualizzare vari tipi di gra…ci ed alcune statistiche descrittive relative a più variabili contemporaneamente. a2 Gra…co scatterplot : Gra…co! Gra…co ! X-Y a dispersione: testscr (variabile asse-Y) str (variabili asse-X)! asse-X) !OK b2 Correlazione fra due o più variabili : Matrice di correlazione !(testscr, str) ! OK c2 Statistiche descrittive di sintesi relative a più variabili: Selezionare testscr str ! Visualizza ! Statistiche descrittive ! OK Selezionare testscr str ! Visualizza ! Matrice di correlazione ! OK OK (procedura alternativa alla precedente, b2) b2 ) Esempio: str; str; pctel; exp nstu
3
Prendiamo l’output dei gra…ci dei gra…ci scatterplot per scatterplot per mostrare la procedura di salvataggio di oggetti sulla …nestra delle icone. icone. Riprendiam Riprendiamo o la procedura procedura per p er gra…ci scatterplot: Visualizza ! Visualizza ! Gra…co ! Gra…co ! X-Y a dispersione: testscr (variabile asse-Y) str (variabili asse-X) !OK Cliccare sul gra…co ottenuto col tasto destro del mouse e selezionare la voce " Salva alla sessione come icona". A questo punto l’oggetto Gra…co sarà stato salvato sulla …nestra delle icone. icone. Per recuperare recuperare il vostro vostro oggetto salvato salvato seguite la seguente seguente procedura procedura partendo dalla …nestra principale di lavoro: Visualizza ! Finestra icone Il gra…co scatterplot risulterà salvato sotto il nome di Gra…co 1, in 1, in quanto questo è il primo oggetto Gra…co oggetto Gra…co che salvate nella sessione corrente.
1.5
Salv Salvataggi ataggio o dei dati dati modi…cati modi…cati in forma formato to GRETL GRETL
Duran Durante te la sessio sessione ne di lavo lavoro ro possono possono essere essere salv salvati ati com comee icone icone vari ari ogg oggett ettii (un esempi esempio o è l’oggetto l’oggetto Gra…co salvato salvato sopra), che comparirann compariranno o sulla …nestra "Sessione "Sessione corrent corrente". e". Questi Questi oggetti ogge tti posso p ossono no essere: essere: informazio informazioni ni sui dati, dataset, dataset, modelli, modelli, note, correlazion correlazioni, i, statistic statistiche, he, gra…ci. Alla …ne della sessione di lavoro procediamo al salvataggio delle rielaborazioni seguendo la procedura: File ! Sessioni ! Salva sessione come ! Gretl data …le ! a:n a: ncaschool2.gdt Riaprendo il …le recupereremo l’ultima sessione di lavoro con tutti gli oggetti salvati sulla …nestra delle icone.
2
Regr Regressi ession one e lineare lineare con con Gretl Gretl:: stima stima OLS OLS con stand standar ard d error error robusti (caso di eteroschedasticità)
Partiamo dalla stima di regressione lineare sotto l’ipotesi di eteroschedasticità eteroschedasticità nella distribuzione degli errori. errori. Per ottenere ottenere gli errori standard robusti robusti all’etero all’eterosch schedast edasticità icità,, allo scopo di e¤ettuare inferenza valida anche se il termine di errore non è omoschedastico, è necessario e¤ettuare la procedu procedura ra per la stima stima OLS robusta robusta.. Nel …le di lavo lavoro ro pricipal pricipalee selezi seleziona onare re Modello !
4
OLS-minimi quadrati ordinari ! testscr (aggiungi in variabile dipendente), str, pctel, expnstu_d (aggiungi in variabili indipendenti). Notate che la costante compare di default nella lista delle variali indipendenti. Nella …nestra Speci…ca modello selezionare la voce “ Errori standard robusti ” e cliccare Con…gura . Selezionare nella …nestra HCCME la voce “Usa la matrice di covarianza robusta in modo prede…nito ”.
Nella tabella di output della stima OLS del modello di regressione troviamo varie informazioni. Nella prima parte in alto sono riportate: le stime dei parametri del modello (Coe¢ciente), gli errori standard (Standard Error), la statistica t (Rapporto-T), ed in…ne il p-value. Gli asterischi associati al valore del p-value devono essere interpretati nel modo seguente: no asterischi ! parametro statisticamente non diverso da zero; un asterisco (*) ! parametro diverso da zero a livello di signi…catività del 10%; due asterischi (**) ! parametro diverso da zero a livello di signi…catività del 5%; tre asterischi (***) ! parametro diverso da zero a livello di signi…catività dell’ 1%. Nella seconda parte in basso sono invece riportate insieme ad altre quantità: il coe¢ciente di determinazione R2 , anche nella sua versione corretta per i gradi di libertà (R2 corretto), la statistica F per la veri…ca della signi…catività dell’intera regressione (la q consideriamo come la F 1 del testo per n su¢ciente grande), la media e la deviazione standard della variabile dipendente, e la somma dei quadrati dei residui Residual Sum of Squares (SS R).
Si tralascino le restanti quantità, (che sono utili nel contesto dell’analisi delle serie storiche). Procediamo al salvataggio della …nestra di output del modello. Per il salvataggio dell’oggetto
5
Modello sulla …nestra delle icone selezionare, partendo dalla …nestra di output del modello, File ! Salva alla sessione come icona. Potete sempre veri…care, dopo questo tipo di salvataggio, come nella …nestra icone compaiano nuovi oggetti. Ripetiamo la procedura descritta sopra per la visualizzazione della …nestra delle icone partendo dalla …nestra principale di lavoro: Visualizza ! Finestra icone. Il modello OLS robusto risulterà salvato sotto il nome di Modello 1, in quanto questo è il primo oggetto Modello che salvate nella sessione corrente. Potete salvare l’output del modello anche in formato ASCII seguendo la procedura: File ! Salva come ! Oggetto semplice. Possono inoltre essere costruiti gli intervalli di con…denza per i parametri stimati seguendo la seguente procedura. Partendo dall’output del modello, selezionate: Analisi ! Intervalli di con…denza per i coe¢cienti.
Notate che vengono utilizzati i valori critici della statistica t e non N s tan dard validi in piccoli campioni sotto l’ipotesi di normalità. La matrice di varianza-covarianza robusta all’eteroschedasticità, di dimensioni (K + 1) (K + 1), è visualizzata selezionando nella …nestra di output del modello Analisi ! Matrice di covarianza dei coe¢cienti . L’output è riportato qui sotto:
6
2.1 2.1.1
Veri…ca di ipotesi congiunte con F-robusta Veri…ca signi…catività dell’intera regressione
Per veri…care la signi…catività congiunta di tutti i parametri della regressione del modello veri…chiamo che il p value associato alla statistica F robusta sia inferiore del livello di signi…catività considerato. La statistica F robusta di riferimento è quella riportata nella scheda di output della stima OLS robusta . Nel nostro caso particolare F 3act ;1 = 147; 204 ed il relativo p value ' 0. Ne deduciamo che possiamo ri…utare l’ipotesi nulla di uguaglianza a zero congiunta di tutti i parametri della regressione ad ogni livello di signi…catività. 2.1.2
Veri…ca signi…catività di un sottinsieme di coe¢cienti
Per veri…care la signi…catività congiunta di un sottinsieme di coe¢cienti quando le stime sono robuste per l’eteroschedasticità, è su¢ciente, partendo dalla …nestra di output della stima OLS robusta, selezionare Test ! OMIT (ometti variabili) ! str pctel (variabili da omettere nel modello ristretto). Otteniamo il seguente output.
La statistica F 2act ;1 robusta = 220; 778, con pvalue ' 0: Ri…utiamo l’ipotesi nulla di assenza
7
di signi…catività per il sottinsieme di parametri selezionato. 2.1.3
Veri…ca di vincoli lineari su più coe¢cienti
Quando invece dobbiamo testare vincoli lineare su più coe¢cienti congiuntamente, può essere utilizzata la seguente procedura. Dalla …nestra di output della regressione OLS robusta selezionare Test ! Vincoli lineari ! b[const]=0 . Otteniamo il seguente output: b[str]=1
La statistica F 2act ;1 robusta = 3928; 56, con p value ' 0: Ri…utiamo l’ipotesi nulla congiunta di: 1) uguaglianza a zero per il coe¢ciente di intercetta e 2) di coe¢ciente associato alla variabile str uguale a uno.
2.2
Veri…ca di una restrizione signola che coinvolge più coe¢cienti
Per veri…care restrizioni singole che coinvolgono più regressori possiamo utilizzare due metodi. Il primo (metodo diretto) utilizza la statistica F robusta, mentre il secondo (metodo di trasformazione della regressione) utilizza la statistica t: 2.2.1
Uso del metodo diretto
Utilizzando la stessa procedura del paragrafo 2.1.3. è possibile in Gretl testare anche restrizioni singole che coinvolgono più regressori. Veri…chiamo ad esempio la restrizione 2 = 2 1 :Dalla …nestra di output della regressione OLS robusta selezionare Test ! Vincoli lineari ! b[pctel]2*b[str]=0 . Otteniamo il seguente output:
8
1 La statistica F 1 robusta = 0; 007365, con p value = 0; 9316: Non ri…utiamo l’ipotesi nulla
di esistenza di vincolo lineare 2 = 2 1 fra 2 e 1 . 2.2.2
Uso del metodo di trasformazione della regressione
In presenza di un solo vincolo lineare una possibilità più immediata per veri…carne la validità è trasformare la regressione in maniera tale che nella regressione trasformata veri…care la signi…catività di un singolo coe¢ciente (tramite un test t) corrisponda alla veri…ca del vincolo di interesse. Questa procedura consiste in una riparametrizzazione del modello, ovvero una trasformazione in un nuovo modello tale che i parametri di quest’ultimo siano in corrispondenza biunivoca con quelli del modello di partenza. Consideriamo sempre l’ipotesi nulla: H 0 : 2 = 2 1 Aggiungendo e sottraendo al lato destro del modello non vincolato la quantità 2 1 P C T E Li si ottiene:
testscri = 0 + 1 stri + 2 1 pcteli 2 1 pcteli + 2 pcteli + 3 exp nstui + ui testscri = 0 + 1 (stri + 2 pcteli ) + ( 2 2 1 ) pcteli + 3 exp nstui + ui testscri = 0 + 1 Z 1i + 2 pcteli + 3 exp nstui + ui con Z 1i = stri + 2 pcteli ; 2 = 2 2 1 Per stimare il modello riparametrizzato (ovvero la regressione trasformata) dovremo allora prima costruire la nuova variabile Z 1i seguendo la procedura sopra descritta che riportiamo qui di seguito. Dalla …nestra principale di lavoro selezionare Aggiungi ! De…nisci nuova variabile 9
e digitare Z 1 = str + 2 pctel . Dopo aver creato la nuova variabile speci…care in Modello ! OLS il nuovo modello di regressione. Otteniamo il seguente output:
La statistica t associata alla variabile pcteli è pari a 0; 08582 ed il suo p value = 0; 9316. Come nel caso diretto anche in questo caso non possiamo ri…utare l’ipotesi nulla di 2 = 2 2 1 = 0 ossia di esistenza di vincolo lineare fra 2 e 1 .
3
Regressione lineare con Gretl: stima OLS con standard error classici (ipotesi di omoschedasticità)
Stimiamo ora il nostro modello sotto l’ipotesi restrittiva di esistenza di omoschedasticità e ripetiamo la procedura per la veri…ca di ipotesi congiunte utilizzando la F classica. Per ottenere la stima OLS non robusta ripetiamo la procedura del paragrafo 2, senza selezionare l’opzione "Errori standar robusti". Otteniamo la seguente stima:
10
3.1
Veri…ca di ipotesi congiunte con F classica
La statistica F , riportata nella …nestra di output della stima, veri…ca la signi…catività congiunta di tutti i parametri utilizzati nel modello. Dato il p-value prossimo allo zero possiamo ri…utare l’ipotesi nulla. La statistica F in questo caso può essere replicata utilizzando le formule per la F classica, che riportiamo qui di seguito: F nqK 1 =
(SS Rrestr SSRunrestr )=q SSRunrestr =(n K unrestr 1)
Nell’output di stima del modello abbiamo, fra le varie informazioni, anche la "Somma dei quadrati dei residui", ossia SS R =
2
Pu^ . Utilizzando gli SS R sia per la regressione ristretta i
i
sia per quella non ristretta applichiamo la formula per la F classica: 3.1.1
Veri…ca signi…catività dell’intera regressione con SSR del modello ristretto e non ristretto
Veri…chiamo la signi…catività dell’intera regressione usando la formula della F classica e 3 trovando "manualmente" il valore F 1 = 107; 455: Stimiamo, sempre con OLS classico, il modello ristretto in cui tutti i parametri, esclusi l’intercetta, sono posti uguali a zero. Otteniamo il seguente output:
11
Il modello stimato al paragrafo precedente è il nostro modello non ristretto. Dalla tabello di output di stima del modello non ristretto abbiamo l’informazione su S SR unrestr : SS Runrestr = 85699; 7 In questo paragrafo abbiamo invece stimato il modello ristretto con numero di restrizioni pari a 3 (q = 3), ossia il numero di regressori diversi dall’intercetta. Il valore di S SR restr _ intera è pari a: SS Rrestr _ intera = 152110 Abbiamo ora tutti gli elementi per applicare la formula della F classica: 3 F 1 =
(152110 85699; 7)=3 = 107; 45 85699; 7=(420 3 1)
Il p-value associato è prossimo allo zero (si veda il valore del p value associato alla statistica F riportato nella tabella di output del paragrafo 3.), dunque ri…utiamo l’ipotesi nulla di uguaglianza a zero dell’intera regressione. 3.1.2
Veri…ca signi…catività di un sottinsieme di coe¢cienti
La stessa procedura può essere utilizzata per veri…care la signi…catività di un sottinsieme di coe¢cienti. Ipotizziamo di voler veri…care la signi…catività congiunta dei parametri associati ai regressori (str;pctel). Stimiamo il modello ristretto. Qui di seguito l’output della stima OLS classica del modello ristretto con q = 2 (numero di restrizioni).
12
Il valore S SR restr _sott del nuovo modello ristretto è pari a: SS Rrestr _ sott = 146545 Abbiamo ora tutti gli elementi per applicare la formula della F classica: 2 F 1 =
(146545 85699; 7)=2 = 147; 67 85699; 7=(420 3 1)
Per determinare il p-value associato alla statistica F sopra determinata (ma in generale tutte le volte che desiderate determinare il p-value associato a qualche statistica), andate nella …nestra principale di lavoro e seguite la seguente procedura. Selezionare Strumenti ! Calcola p-value ! F, dfn : 2, dfd : 416, valore : 147,67. Il p-value associato è prossimo allo zero, dunque ri…utiamo l’ipotesi nulla di uguaglianza a zero del sottinsieme di regressori scelto. Possiamo ottenere il medesimo risultato procedendo come nel paragrafo 2.1.2. Partendo dalla stima OLS classica del modello non ristretto otteniamo il seguente output:
13
2 La statistica F 1 = 147; 675, come determinato manualmente sopra. Anche in questo caso
dunque ri…utiamo l’ipotesi nulla di assenza di signi…catività congiunta del sottinsieme di parametri scelto. 3.1.3
Veri…ca di vincoli lineari su più coe¢cienti
Per la veri…ca di vincoli lineari su più coe¢cienti possiamo procedere come nel paragrafo 2.1.3. Ipotizziamo, come nel caso precedente di voler testare il seguente vincolo lineare 0 = 0 e 1 = 1: Dalla …nestra di output della regressione OLS classica selezionare Test ! Vincoli lineari ! b[const]=0 . b[str]=1
Otteniamo il seguente output:
14
2 La statistica F 1 classica = 5198; 26, con p value ' 0: Ri…utiamo l’ipotesi nulla congiunta
di: 1) uguaglianza a zero per il coe¢ciente di intercetta e 2) coe¢ciente associato alla variabile str uguale a uno.
3.2
Veri…ca di una restrizione signola che coinvolge più coe¢cienti
Come nel caso della F robusta anche nel caso della F classica possiamo utilizzare due metodi per veri…care restrizioni singole che coinvolgono più regressori. Il primo (metodo diretto) utilizza la statistica F classica, mentre il secondo (metodo di trasformazione della regressione) utilizza la statistica t: 3.2.1
Uso del metodo diretto
Veri…chiamo ad esempio la restrizione 2 = 2 1 :Dalla …nestra di output della regressione OLS robusta selezionare Test ! Vincoli lineari ! b[pctel]-2*b[str]=0 . Otteniamo il seguente output:
15
1 La statistica F 1 classica = 0; 00737692;con p value = 0; 931596: Non ri…utiamo l’ipotesi
nulla di esistenza di vincolo lineare 2 = 2 1 fra 2 e 1 . 3.2.2
Uso del metodo di trasformazione della regressione
Ripetendo la procedura del paragrafo 2.2.2. per la riparametrizzazione del modello possiamo stimare l’ipotesi nulla H 0 : 2 = 2 1 utilizzando la statistica t: Per stimare il modello riparametrizzato (ovvero la regressione trasformata) costruiamo come prima la nuova variabile Z 1i = stri + 2 pcteli e speci…chiamo in Modello ! OLS-classico il modello di regressione. Otteniamo il seguente output:
La statistica t associata alla variabile pcteli è pari a 0; 08589 ed il suo p value = 0; 9316. Come nel caso diretto anche in questo caso non possiamo ri…utare l’ipotesi nulla di 2 = 2 2 1 = 0 ossia di esistenza di vincolo lineare fra 2 e 1 .
4 4.1
Test diagnostici Test di eteroschedasticità
Il test di eteroschedasticità sottopone a veri…ca l’ipotesi che la varianza del termine di errore sia costante (omoschedasticità). 16
L’ipotesi nulla che stiamo testando è quindi H 0 : presenza di omoschedasticità. In Gretl è possibile veri…ca l’ipotesi di omoschedasticità dei residui della regressione stimata selezionando nella …nestra di output del modello OLS classico Test ! LMTEST ! BREUSCHPAGAN TEST. Otteniamo il seguente output:
La statistica si distribuisce come una C hi quadro(3). Dato il valore del p value prossimo allo zero possiamo ri…utare l’ipotesi nulla di presenza di omoschedasticità.
4.2
Test di normalità
Il test, proposto da Jarque e Bera, veri…ca congiuntamente che la skewness e la kurtosis della distribuzione dei residui assumano valori statisticamente uguali a quelli che caratterizzano la distribuzione normale. L’ipotesi nulla che stiamo testando in questo caso è quindi uguale a: H 0 :gli errori sono distribuiti normalmente. In Gretl è possibile veri…care l’ipotesi di normalità dei residui della regressione stimata selezionando nella …nestra di output del modello OLS Test ! TESTUHAT (prendiamo il modello OLS-robusto). Otteniamo il seguente output:
17
La statistica si distribuisce come un Chi quadro2 : Nel nostro caso dato il p value = 18
0; 97222 non possiamo ri…utare l’ipotesi nulla di distribuzione normale degli errori. Nella regressione dei punteggi del test presentata in queste dispense i test diagnostici evidenziano che gli errori hanno distribuzione normale ma sono eteroschedastici. La conseguenza è che solo i risultati basati sulle formule robuste all’eteroschedasticità (paragrafo 2) sono da considerare validi, mentre l’utilizzo delle formule classiche per gli errori standard e la statistica F risulta inappropriato (paragrafo 3).
4.3
Analisi dei residui
Dalla …nestra di output del modello OLS è possibile e¤ettuare una serie di opzioni relative alla visualizzazione dei valori stimati della regressione e dei relativi residui. In particolare possiamo e¤ettuare le seguenti procedure: 1. per visualizzare l’elenco dei valori stimati, dei valori e¤ettivi e dei residui per ogni osservazione, ad esempio per individuare con precisione a quali osservazioni corrispondono valori anomali (individuati con un asterisco): Analisi ! Mostra valori stimati, e¤ettivi e residui 2. per salvare nel dataset i valori stimati, i residui, la somma dei quadrati dei residui, l’ R2 : Salva ! Valori stimati Salva ! Residui Salva ! Somma dei quadrati degli errori (SSR) (Questo valore viene salvato come oggetto scalare e può essere visualizzato partendo dalla …nestra principale di lavoro selezionando Dati ! Scalari ..) Salva ! R-quadro 3. per visualizzare gra…ci dei residui e dei valori e¤ettivi e stimati (ha senso solo nel caso di regressione semplice, ad esempio: testscr const str ): Gra…ci ! Residui ! rispetto a str Gra…ci ! Valori e¤ettivi e stimati ! rispetto a str
5
Introduzione con Gretl a regressioni temporali e previsioni
Analizziamo le principali procedure previste da Gretl per l’analisi econometrica di dati in serie storica. In questa seconda parte indicizziamo le variabili con t per denotare il tempo anzichè i; utilizzato invece per variabili di tipo sezionale. La dimensione campionaria è pari a T : L’analisi econometrica che usa serie storiche appartiene tipicamente alla parte di econometria che studia fenomeni macroeconomici, ossia che considera dati a livello aggregato e non individuale. 19
Le serie storiche si di¤erenziano dai dati di tipo sezionale fondamentalmente per la non possibilità di imporre l’ipotesi di incorrelazione fra osservazioni. Ad esempio la variazione di in‡azione al tempo t (D_IN F t ) plausibilmente dipenderà, fra gli altri, anche dalla variazione dell’in‡azione al periodo precedente ( D_INF t1 ). Conseguentemente la correlazione fra le due variabili ( D_IN F t ; D_IN F t1 ) risulterà essere diversa da zero, come vedremo in maggior dettaglio nei paragra… successivi.
5.1
Importazione di dati temporali
Dopo aver eseguito la procedura di importazione dati, in Gretl appare una …nestra nella quale viene proposto la rielaborazione dei dati importati in formato serie storiche. Dopo aver accettato la reimpostazione del dataset in formato serie storiche dovete scegliere la frequenza temporale di rilevazione delle osservazioni (anno, trimestre, mese,...) e la data dell’osservazione iniziale (ad esempio 1957:01 per indicare gennaio 1957). Procediamo all’importazione dei dati macro.gdt con frequenza trimestrale a partire dal primo trimestre 1960 (1960:1).
5.2
Trasformazioni e descrizione di dati temporali
Prima di e¤ettuare stime econometriche su modelli di regressione temporale, è necessario analizzare qualitativamente i dati a nostra disposizione. In generale il dataset originario presenta solo dati nei livelli, ossia variabili non trasformate. Spesso siamo però interessati ad analizzare variabili economiche trasformate. Ad esempio nel nostro dataset è presente la variabile CP I t (Consumer Price Index , ossia l’indice dei prezzi al consumo), ma l’analisi econometrica viene e¤ettuata sulla variabile tasso di in‡azione (IN F t ) che ne è una sua trasformazione (come vedremo nel paragrafo successivo). Nel paragrafo seguente mostriamo le principali trasformazioni che possono essere e¤ettuate su variabili economiche temporali di interesse. 5.2.1
Principali trasformazioni
Seguendo la procedura di trasformazione dei dati con creazione di nuove variabili, prevista in Gretl (vedi paragrafo 1.3), e¤ettuiamo le seguenti fondamentali trasformazioni (consideriamo le seguenti trasformazioni in sequenza ed utilizziamo ad ogni trasformazione il risultato della trasformazione precedente se necessario): * Primo ritardo CPI_1=CPI(-1) * j-esimo ritardo (ad esempio terzo ritardo) CPI_3=CPI(-3) * Di¤erenza prima 20
D_CPI=CPI-CPI_1 * Trasformazione logaritmica L_CPI=log(CPI) * Di¤erenza prima del logaritmo (Variazione) DL_CPI=L_CPI-L_CPI(-1) * Variazione percentuale VP_CPI=DL_CPI*100 Tutte le trasformazioni sopra e¤ettuate manualmente (eccetto la Variazione percentuale ) possono essere più velocemente e¤ettuate tramite una procedura automatica prevista in Gretl selezionando la/le variabile/i da trasformare e aprendo dalla …nestra di menù principale la tendina Aggiungi e l’opzione di trasformazione scelta. La nostra principale variabile economica di interesse è il tasso di in‡azione su base annuale (INF t ): Costruiamo la nostra variabile di interesse seguendo la procedura di creazione di una nuova variabile e e¤ettuiamo le seguente trasformazioni (il tasso di in‡azione su base annuale è ottenuto moltiplicando prima per 100, per ottenere la variazione percentuale trimestrale, e poi per 4, per ottenere l’in‡azione annualizzata, quindi 4 100 = 400): * Tasso di in‡azione annualizzata INF=400*(DL_CPI) * Primo ritardo del tasso di in‡azione INF_1=INF(-1) * Di¤erenza prima del tasso di in‡azione (Variazione) D_INF=INF-INF_1 5.2.2
Descrizione
Dopo aver trasformato adeguatamente le variabili economiche possiamo analizzare qualitativamente le variabili di interesse trasformate tramite analisi gra…ca e calcolando l’autocovarianza e l’autocorrelazione campionaria (fondamentali in caso di serie storiche). Gra…ci Riportiamo qui di seguito i gra…ci delle due variabili economiche che prenderemo in considerazione nell’analisi econometrica che seguirà, ossia il tasso di in‡azione annualizzato (INF t ) e il tasso di disoccupazione (UNEMP t ) negli USA nel periodo 1960-1999.
21
Osserviamo come il tasso di in‡azione negli USA mostri un andamento crescente dal 1960 al 1980, diminuendo poi rapidamente durante i primi anni ottanta. Il tasso di disoccupazione segue un andamento medio simile ma appare molto meno volatili. I picchi di disoccupazione coincidono con le fasi di recessione dell’economia statunitense. Autocovarianza e autocorrelazione Come abbiamo già intuito il valore di I NF t è tipicamente correlato con il suo valore al periodo precedente. Determiniamo il grado di autocovarianza e autocorrelazione campionario della variabile di interesse per avere un’idea del livello di "memoria" del processo stocastico in esame (in altri termini, per vedere …no a quale ritardo esiste una autocorrelazione statisticamente diversa da zero della variabile di interesse). Riportiamo qui di seguito le formule per la determinazione rispettivamente della autocovarianza (cov) e della autocorrelazione ( corr) campionaria di ordine j della variabile I NF t : a
a
_
a
Date IN F la media campionaria di I NF t sull’intervallo considerato e var(IN F t ) la varianza campionaria di I NF t , otteniamo le seguenti formule:
1 cov(IN F t ; I N Ft j ) = T j 1 t a
T
_
X (INF -INF t
j +1;T
_
)(INFtj -IN F 1;T j )
=j +1
a
a
corr(INFt ,INFtj )=
cov(IN F t ; I N Ft j ) a
var(IN F t )
Gretl dispone di una procedura automatica per la determinazione del valore di autocorrelazione, chiamato anche AutoCorrelation Function (ACF ): Selezionare dalla …nestra di lavoro principale la variabile di interesse, nel nostro caso IN F i , selezionare Variabile!Corre logramma !Ritardo massimo (ad esempio j=10). Otteniamo il seguente output:
22
Osserviamo sia dal primo output (in cui non prendiamo in considerazione la statistica Qstat), sia dal secondo output gra…co o autocorrelogramma, (qui le barre rosse indicano il valore di autocorrelazione ad ogni ritardo, mentre le linee orizzontali blue rappresentano gli intervalli di con…denza campionari) come esista una autocorrelazione signi…cativamente diversa da zero …no al decimo ritardo (vedi i tre asterischi associati al valore dell’autocorrelazione ad ogni livello di ritardo). In altri termini il processo generatore dati della variabile IN F t è caratterizzato da una lunga "memoria": Ripetiamo l’operazione per analizzare il grado di autocorrelazione della variabile D_IN F t = INF t IN F t1 , ovvero la di¤erenza prima del tasso di in‡azione annualizzato. Otteniamo il seguente output:
23
Osserviamo come l’autocorrelazione della variabile trasformata, ottenuta come di¤erenza prima della variabile INF t ; sia statisticamente diversa da zero …no al terzo ritardo a livello di signi…catività 1%, mentre ai ritardi successivi l’autocorrelazione campionaria appare solo parzialmente signi…cativa (potete notare osservando anche l’autocorrelogramma come le linee rosse escano fuori dall’intervallo di con…denza solo nei primi tre ritardi ed in pochi ritardi sucessivi). Altra sostanziale di¤erenza fra il grado di autocorrelazione della variabile INF t e quello della variabile D_IN F t è l’evidente andamento ciclico nel caso dell’autocorrelazione della seconda variabile e quello più persistente e solo decrescente della prima variabile.
6
Autoregressioni
Un’autoregressione è un modello di regressione, come quelli visti nella prima parte di queste dispense, ma i cui regressori sono i valori passati della variabile dipendente ed eventualmente i valori passati di altre variabili (come nel modello autoregressivo misto). Nei paragra… che seguono descriviamo i principali modelli autoregressivi prendendo come variabile dipendente del nostro modello la variazione percentuale dell’in‡azione su base annua D_IN F t :
24
6.1
Modello autoregressivo del primo ordine
Nei modelli autoregressivi del primo ordine la variabile esplicativa del modello è il primo ritardo della variabile che vogliamo spiegare. Tali modelli sono anche detti AR(1), ossia AutoRegressivi del primo ordine. Nel nostro caso il modello AR(1) è uguale a: D_INF t = 0 + 1 D_IN F t1 + ut
(1)
Il suo modello stimato (o il suo valore predetto) è uguale a: a
D_INF t = ^ 0 + ^ 1 D_INF t1
(2)
La stima OLS robusta del modello (1) risulta pari a:
Osserviamo come il coe¢ciente associato alla variabile ritardata risulti essere signi…cativo al 5% e pari a ^ 1 = 0:22, indicando una presenza di autocorrelazione di primo ordine negativa che poteva già essere individuata dall’analisi dell’autocorrelogramma (vedi il primo valore associato alla ACF della variabile D_IN F t ). 6.1.1
Previsione, valori predetti, errore di previsione e incertezza di previsione
Previsione Con dati in serie storica siamo principalmente interessati a determinare il valore futuro previsto della variabile di interesse data l’informazione passata. Indichiamo con a
a
D_INF tjt1 = E (D_IN F t jD_INF t1 ) il valore previsto di D_IN F t condizionato all’informazione
25
di D_IN F …no al tempo t 1: Nel caso del modello AR(1), partendo dall’equazione (2), otteniamo la seguente previsione stimata:
a
a
D_IN F tjt1 = E (D_IN F t jD_INF t1 )
(3)
^ + ^ = E ( 1 D_IN F t1 jD_IN F t1 ) = ^ 0 + ^ 1 D_INF t1 0 Attenzione! L’equazione (3) appare simile all’equazione (2), tuttavia i due valori di¤eriscono a
sostanzialmente. Mentre il valore predetto D_INF t è calcolato per le osservazioni interne a
al campione utilizzato per stimare la regressione, la previsione D_IN F tjt1 è fatta per istanti temporali esterni al campione dei dati utilizzati per la stima. Errore di previsione
L’errore di previsione è pari all’errore commesso dalla previsione, ossia
è pari alla di¤erenza fra il valore osservato di D_IN F t ed il suo valore previsto: a
EP t = D_IN F t D_INF tjt1 Incertezza di previsione Una misura del grado di incertezza della previsione è data dalla radice quadrata dell’errore di previsione quadratico medio (RMSFE, acronomico inglese per Root Mean Squared Forecast Error ), che misura l’entità dell’errore di previsione. Il RMSFE è pari a: RMSFE =
r
a
E [(D_INF t D_IN F tjt1 )2 ]
Il RMSFE combina due fonti di errore. La prima deriva dal fatto che la distribuzione di u t ^ e ^ : Se la seconda fonte di non è nota. La seconda dalla stima dei parametri del modello 0
1
incertezza è su¢cientemente piccola da poter essere trascurata il RMSFE può essere stimato dall’errore standard della regressione (SER). 6.1.2
Esempio
Vediamo come possiamo fare previsione utilizzando Gretl. Il nostro campione di dati arriva …no al primo trimestre del 2000. Restringiamo il campione …no al quarto trimestre 1999 ed e¤ettuiamo nuovamente la stima sul sottocampione. Otteniamo il seguente output:
26
Dalla …nestra di output selezionare Analisi!Previsione !Intervallo di previsione 2000:12000:1, previsione statica. Otteniamo il seguente output:
27
a
Il valore di D_INF 2000:I j1999:IV = 0:023%: Possiamo ottenere il medesimo risultato manualmente utilizzando l’equazione (3):
a
D_IN F 2000:I j1999:IV = 0:0181084 0:227798 (D_INF 1999:IV ) = 0:0181084 + 0:227798 (0:021765) = 0:023 a
Il valore previsto di IN F 2000:I j1999:IV è quindi pari a:
a
a
INF 2000:I j1999:IV = IN F 1999:IV + D_INF 2000:I j1999:IV = 2:93973 + 0:023 = 2:96273 (ovvero si prevede un’in‡azione pari al 2.96%). Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo. Il valore osservato di D_INF 2000:I = 0; 998861: L’errore di previsione è quindi pari a:
a
EP 2000:I = D_INF 2000 D_IN F 2000j1999 = 0; 998861 0:023 = 0:975861 (0.97 punti percentuali). lgnorando l’incertezza dovuta alla stima dei parametri del modello, e conseguentemente approssimando lo RMSFE con SER, l’incertezza di previsione risulta pari a 1; 65875: In…ne notiamo che dall’output di Gretl sul valore previsto di D_IN F t per 2000 : I otteni-
28
amo anche una informazione sull’intervallo di previsione puntuale con con valore critico 1:975. L’intervallo di previsione al 95% è un intervallo che contiene il valore futuro di una serie con il 95% di probabilità. Notiamo che l’intervallo di previsione è diverso dall’intervallo di con…denza. In questo caso infatti non possiamo utilizzare l’usuale valore critico 1:96 giusti…cato dal teorema del limite centrale per la costruzione degli intervalli di con…denza. La formula utilizzata per determinare l’intervallo di previsione da Gretl è: a
a
D_IN F tjt1 1:975 SE (D_INF t D_IN F tjt1 )
6.2
Modello di regressione di ordine p
Nei modelli autoregressivi di ordine p le variabili esplicative del modello sono i primi p ritardi della variabile che vogliamo spiegare. Tali modelli sono anche detti AR( p), ossia AutoRegressivi di ordine p. Nel nostro caso il modello AR(p) è uguale a: D_INF t = 0 + 1 D_INF t1 + ::: + p D_INF t p + "t
(4)
con E ("t jD_INF t1 ; D_INF t2 ; D_INF t3 ; D_IN F t4 ) = 0: Il suo modello stimato (o il suo valore predetto) è uguale a: a
D_IN F t = ^ 0 + ^ 1 D_INF t1 + ::: + ^ p D_INF t p
(5)
E¤ettuiamo la stima di un modello autoregressivo di ordine 4 (AR(4)) dopo aver creato le quattro variabili di ritardo. La stima OLS robusta del modello (4) con p=4 risulta pari a:
29
Testiamo l’ipotesi nulla utilizzando la procedura OMIT H 0 : 2 = 3 = 4 = 0;
H 1 : j 6 = 0 per qualche j 2 f2; 3; 4g
Otteniamo il seguente output:
30
3 La statistica F 1 = 7:88 con p-value prossimo allo zero. Ri…utiamo quindi l’ipotesi nulla di
uguaglianza a zero congiunta dei parametri associati alle tre variabili esplicative aggiunte nel 2 del modello AR(4) risulta pari a nostro modello autoregressivo. Inoltre osserviamo che l’ R 0:208, dunque AR(4) ha una capacità esplicativa maggiore rispetto a AR(1). 6.2.1
Previsione, valori predetti, errore di previsione e incertezza di previsione a
a
Previsione Indichiamo con D_INF tjt1 = E (D_IN F t jD_IN F t1 ) il valore previsto di D_INF t condizionato all’informazione di D_INF …no al tempo t 1: Nel caso del modello
31
AR(p), partendo dall’equazione (5), otteniamo la seguente previsione stimata: a
a
D_INF tjt1 = E (D_INF t jD_IN F t1 )
(6)
= E ( ^ 0 + ^ 1 D_IN F t1 + :: + ^ p D_INF t p jD_IN F t1 ) = ^ 0 + ^ 1 D_IN F t1 + :: + ^ p D_INF t p Attenzione! Come nel modello AR(1) valgono anche per il modello AR( p) le medesime a
considerazioni sulla di¤erenza fra (6) e (5), ossia fra valore predetto D_INF t e previsione a
D_INF tjt1 : Errore di previsione e incertezza di previsione
Vedi quanto detto per modelli AR(1),
paragrafo 6.1.1. 6.2.2
Esempio
Vediamo come possiamo fare previsione con modelli AR( p) utilizzando Gretl. Consideriamo p=4. Restringendo il campione …no al quarto trimestre 1999 otteniamo il seguente output:
32
Dalla …nestra di output selezionare Analisi!Previsione !Intervallo di previsione 2000:12000:1, previsione statica. Otteniamo il seguente output:
a
Il valore di D_INF 2000:I j1999:IV = 0:3727%: Possiamo ottenere il medesimo risultato manualmente utilizzando l’equazione (6):
a
D_INF 2000:I j1999:IV = 0:0218729 0:203692 (D_IN F 1999:IV ) 0:326004 (D_IN F 1999:II I ) +0:211239 (D_IN F 1999:II ) 0:0418501 (D_IN F 1999:I ) = 0:0218729 0:203692 (0:021765) 0:326004 (0:022090) +0:211239 (1:524024) 0; 0418501 (0:413217) = 0:3727 a
Il valore previsto di IN F 2000:I j1999:IV è quindi pari, in termini percentuali, a:
a
a
INF 2000:I j1999:IV = IN F 1999:IV + D_INF 2000:I j1999:IV = 2:93973 + 0:3727 = 3:31243 Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo ma più forte
33
rispetto a quanto previsto dal modello AR(1). Il valore osservato di D_IN F 2000:I = 0; 998861%: L’errore di previsione è quindi pari, in termini percentuali, a:
a
EP 2000:I = D_INF 2000 D_IN F 2000j1999 = 0; 998861 0:3727 = 0:626161 Quindi inferiore rispetto al modello con una sola variabile di ritardo. lgnorando l’incertezza dovuta alla stima dei parametri del modello, e conseguentemente approssimando lo RMSFE con SER, l’incertezza di previsione risulta pari a 1; 51; dunque inferiore rispetto a quella del modello AR(1).
6.3
Modello autoregressivo misto e modello con predittori multipli
Spesso la teoria economica suggerisce altre variabili i cui ritardi potrebbero migliorare la capacità esplicativa del modello autoregressivo. Un modello autoregressivo misto è caratterizzato dalla presenza dei ritardi della variabile dipendente e dei ritardi di altre variabili esplicative diverse dalla variabile dipendente. Tali modelli sono anche chiamati ADL( p,q), dove ADL è acronimo di Autoregressive Distributed Lag, p è pari al numero dei ritardi della variabile dipendente mentre q è pari al numero di ritardi della variabile esplicativa inclusa nel modello autoregressivo diversa dalla variabile dipendente. Nel nostro modello autoregressivo (4) possiamo ad esempio aggiungere il ritardo primo della variabile tasso di disoccupazione (UNEMP t1 ) creando un modello ADL(4,1): Tale relazione ci viene suggerita dalla teoria economica. La curva di Phillips di breve periodo prevede una relazione negativa fra tasso di disoccupazione e variazione annuale del tasso di in‡azione. Per testare tale ipotesi costruiamo il modello autoregressivo misto ADL(4,1) aggiungendo a (4) la variabile UNEMP t1 :
D_INF t = 0 +1 D_INF t1 +2 D_IN F t2 +3 D_INF t3 +4 D_INF t4 + 1 UNEMP t1 + t (7) E ( t jD_INF t1 ; D_INF t2 ; D_INF t3 ; D_INF t4 ; U N E M Pt 1 ) = 0: Il suo modello stimato (o il suo valore predetto) è uguale a:
a
^ UNEMP t1 D_INF t = ^ 0 +^ 1 D_IN F t1 +^ 2 D_INF t2 +^3 D_IN F t3 +^ 4 D_INF t4 + 1 (8) E¤ettuiamo la stima robusta del modello autoregressivo misto. Otteniamo il seguente output:
34
Il parametro associato alla variabile UNEMP t1 è signi…cativamente diverso da zero al 5%, 2 = 0:23726 quindi la capicità esplicativa del modello ADL(4,1) è maggiore del modello inoltre R AR(4). Prima di passare ad analizzare le capacità di previsione del modello ADL (4,1) stimiamo anche un modello ADL(4,4) aggiungendo i quattro ritardi anche della variabile UNEMP t :
D_INF t = 0 + 1 D_IN F t1 + 2 D_INF t2 + 3 D_IN F t3 + 4 D_IN F t4
(9)
+ 1 UNEMP t1 + 2 UNEMP t2 + 3 UNEMP t3 + 4 UNEMP t4 + vt con E(vt jD_INFt1 ,D_INFt2 ,D_INFt3 ,D_INFt4 ,UNEMPt1 ,UNEMPt2 ,UNEMPt3 ,UNEMPt4 )=0. Il suo modello stimato (o il suo valore predetto) è uguale a:
a
D_IN F t = ^ 0 + ^ 1 D_IN F t1 + ^ 2 D_INF t2 + ^ 3 D_INF t3 + ^ 4 D_IN F t4 (10) ^ UNEMP t1 + ^ + 2 UNEMP t2 + ^ 3 UNEMP t3 + ^ 4 UNEMP 1 Otteniamo il seguente output: 35
Testiamo l’ipotesi nulla utilizzando la procedura OMIT H 0 : 2 = 3 = 4 = 0;
H 1 : j 6 = 0 per qualche j 2 f2; 3; 4g
Otteniamo il seguente output:
36
3 Il valore della F 1 = 9:85 ed il suo p-value è prossimo allo zero. Rigettiamo quindi l’ipotesi
nulla di non signi…catività congiunta dei tre parametri associati ai ritardi maggiori o uguali 2 = 0:36 quindi la capacità esplicativa del modello a 2 associati alla variabile UNEMP t : L’R ADL(4,4) è maggiore di quella del modello ADL(4,1). Osserviamo tuttavia che alcuni parametri sono non signi…cativi se considerati individualmente. Il modello quindi può essere ancora migliorato togliendo uno alla volta i ritardi non signi…cativi delle variabili esplicative, partendo dai ritardi di grado maggiore. Vedremo nei paragra… successivi quali sono i criteri informativi usati per determinare il numero di ritardi ottimale delle variabili esplicative del modello.
37
6.3.1
Previsione, valori predetti, errore di previsione e incertezza di previsione
Previsione ed errore di previsione
Il valore previsto dal modello ADL(4,1) è pari a:
a
a
D_INF tjt1 = E (D_INF t jD_IN F t1 ; U N E M Pt 1 )
(11)
= E ( ^ 0 + ^ 1 D_INF t1 + ^ 2 D_IN F t2 + ^ 3 D_INF t3 + ^ 4 D_INF t4 ^ UNEMP t1 jD_INF t1 ; U N E M Pt 1 ) + 1 = ^ 0 + ^ 1 D_INF t1 + ^ 2 D_IN F t2 + ^ 3 D_INF t3 + ^ 4 D_INF t4 + ^ 1 UNEMP t1 a
Procediamo come nei paragra… precedenti per ottenere il valore previsto di D_IN F 2000:I j1999:IV e otteniamo il seguente output, che può essere replicato con la solita procedura manuale utilizzando l’equazione (11):
a
a
Il valore di D_INF 2000:I j1999:IV = 0:726503%, mentre il valore previsto di INF 2000:I j1999:IV è pari, in termini percentuali, a:
a
a
INF 2000:I j1999:IV = IN F 1999:IV + D_INF 2000:I j1999:IV = 2:93973 + 0:726503 = 3:666233 Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo ma più forte rispetto a quanto previsto sia dal modello AR(1) sia dal modello AR(4). Il valore osservato di D_INF 2000:I = 0; 998861%: L’errore di previsione è pari, in termini percentuali, a:
a
EP 2000:I = D_INF 2000 D_IN F 2000j1999 = 0; 998861 0:726503 = 0:272358 Quindi molto più basso rispetto ai modelli autoregressivi non misti. Ripetiamo la procedura di previsione per il modello ADL(4,4), che abbiamo visto avere una capacità esplicativa maggiore rispetto al modello ADL(4,1). Il valore previsto è in questo caso
38
pari a: a
a
D_INF tjt1 =E (D_INF t jD_INFt1 ,UNEMPt1 )
(12)
=E(^ 0 +^ 1 D_INFt1 +^ 2 D_INFt2 +^ 3 D_INFt3 +^ 4 D_INFt4 ^ UNEMPt1 + ^ + 2 UNEMPt2 + ^ 3 UNEMPt3 + ^ 4 UNEMPt4 jD_INFt1 ,UNEMPt1 ) 1 =^ 0 +^ 1 D_INFt1 +^ 2 D_INFt2 +^ 3 D_INFt3 +^ 4 D_INFt4 ^ 1 UNEMPt1 + ^ 2 UNEMPt2 + ^ 3 UNEMPt3 + ^ 4 UNEMPt4 + a
Procediamo come nei paragra… precedenti per ottenere il valore previsto di D_IN F 2000:I j1999:IV e otteniamo il seguente output, che può essere replicato con la solita procedura manuale utilizzando l’equazione (12):
a
a
Il valore di D_INF 2000:I j1999:IV = 0:97047%, mentre il valore previsto di INF 2000:I j1999:IV è pari, in termini percentuali, a:
a
a
INF 2000:I j1999:IV = IN F 1999:IV + D_INF 2000:I j1999:IV = 2:93973 + 0:97047 = 3:9102 Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo ma più forte rispetto a tutti i modelli stimati nei paragra… precedenti. Il valore osservato di D_IN F 2000:I = 0; 998861%: L’errore di previsione è quindi pari, in termini percentuali, a:
a
EP 2000:I = D_INF 2000 D_IN F 2000j1999 = 0; 998861 0:97047 = 0:028391 Quindi molto più basso rispetto ai modelli autoregressivi precedenti, prossimo al valore e¤ettivo. 6.3.2
Modello con predittori multipli, stazionarietà, test di Granger
Il modello (9) può essere ulteriormente generalizzato in modo tale da introdurre come regressori altre variabili esplicative ed i loro ritardi (le ipotesi utilizzate per la stima OLS di un modello 39
con predittori multipli sono riportate a pag.441 del libro di testo Stock e Watson (SW)). Fra le principali ipotesi alla base della stima OLS di questi modelli autoregressivi abbiamo l’ipotesi di stazionarietà della distribuzione delle variabili aleatorie utilizzate nel modello (la de…nizione di stazionarietà è riporata a pag.440 di SW). Un test di ipotesi rilevante nel caso dei modelli autoregressivi con predittori multipli è il test di Granger. Prendiamo il modello (9) che può essere considerato un caso particolare di modello con predittori multipli con una sola variabile diversa da quella dipendente compresa fra i regressori del modello. L’ipotesi nulla alla base del test di Granger è uguale a: H 0 : 1 = 2 = 3 = 4 = 0;
H 1 : j 6 = 0 per qualche j 2 f1; 2; 3; 4g
Procediamo utilizzando la procedura OMIT partendo dall’output di stima del modello (9). Otteniamo il seguente output:
40
4 La statistica F 1 = 8:222 ed il suo p-value. Ri…utiamo dunque l’ipotesi nulla e diciamo
che la variabile UNEMP t causa-nel senso di Granger-la variazione del tasso di in‡azione, ossia contiene informazioni utili per spiegare la variazione annuale del tasso di in‡azione.
7
Criteri di informazione
Come abbiamo visto passando in rassegna le principali varianti di modelli autoregressivi, un problema cruciale è la determinazione del numero ottimale di ritardi delle variabili esplicative da introdurre nel modello. Il principio alla base della scelta è il giusto bilanciamento fra 1)
41
bene…cio derivante da aggiungere più ritardi, 2) costo della maggiore incertezza della stima. Come abbiamo già accennato nei paragra… precedenti un primo metodo è quello che utilizza la statistica F implementando una serie di test di ipotesi congiunte sui ritardi maggiori delle variabile esplicative usate nel modello. Ad esempio partendo dal modello (9) e ripetendo la stima su modelli via via più parsimoniosi arriviamo …no alla stima del seguente modello:
In versioni ancora più parsimoniose del modello (con minor numero di ritardi) l’ipotesi nulla di non signi…catività congiunta o non congiunta di parametri è rigettata. Utilizzando la statistica F dunque il modello ADL(2,2) risulta essere la migliore speci…cazione del nostro modello. Esiste tuttavia un altro metodo, spesso più utile, che consiste nella minimizzazione di "criteri di informazione". Fra i principali criteri di informazione prendiamo in considerazione il BIC (Bayes Informazion Criterion ) e l’AIC (Akaike Information Criterion ), le cui formule generali (che valgono per qualunque versione di modello autoregressivo) riportiamo qui di seguito. K è 42