´ ´aire appliquee ´e Econometrie etrie lineaire e e Bruno Cr´ep on
Nicolas Jacquemet Septembre 2006
2
2
Sommaire Sommaire
3
1 Introduction 1.1 1.1 Anal Analy yse ´econ e conom om´´etri e triq que : pr´ pr´ese e sentati tation on . . . . . 1.2 1.2 Prin Princi cipa pale less ´etape e tapess de l’an l’anal alys ysee ´econ e conom om´´etri e triqu quee 1.3 Plan de l’ouvrage . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . 2 L’estimateur des moindres carr´ es ordinaires 2.1 2.1 D´efini e finiti tion on et prop propri ri´´et´ e t´es e s alg alg´ebri e briqu ques es . . . . . . 2.2 2.2 Mo Mod d`ele e le et prop propri ri´´et´ e t´es e s stat statis isti tiqu ques es . . . . . . . 2.3 2.3 Varia ariabl blee om omis isee et r´egre e gress sseu eurr addi additi tion onne nell . . . 2.4 R´esum´e . . . . . . . . . . . . . . . . . . . . . 3 Le L es 3 .1 3.2 3.2 3 .3 3.4 3 .5
. . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
MCO sous l’hypot poth` ese de normalit´ e des per perturbations Normalit´e de l’estimateur des mco . . . . . . . . . . . . . . . . Ecar Ecartt-ttypes ypes esti estim m´es, e s, test testss et inte interv rval alle less de confi confian ance ce . . . . . . Un exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Comp Compara arais ison on avec avec l’es l’esti tima mate teur ur du Max Maxim imum um de Vrais raisem embl blan ance ce R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 Estimation sous contraintes lin´ eaires 4.1 Formulation . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 4.2 L’Es L’Esti tima mate teur ur des des Mo Moin indr dres es Carr Carr´´es e s Con Contrai train nts (MCC (MCC)) . 4.3 Esp´erance erance et variance variance de ˆbmcc . . . . . . . . . . . . . . . 4.4 Estimateur de la variance variance des r´ esidus esidus σ 2 . . . . . . . . . 4.5 4.5 Loi Loi de l’es l’esti tima mate teur ur des des moi moind ndre ress carr carr´´es e s con contrai train nts . . . . 4.6 4.6 Esti Estim matio ation n par par int int´egra e grati tion on des des contr ontrai ain ntes tes . . . . . . . . 4.7 4.7 Tester les contrai raintes : le tes test de Fisher . . . . . . . . . 4.8 Applications du test de Fisher . . . . . . . . . . . . . . . 4.9 R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
1 . . . 1 . . . 3 . . . 8 . . . 10
. . . .
11 11 14 20 20
. . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . .
. . . .
21 . . 21 . . 23 . . 27 . . 29 . . 30
31 . . . . . . . . 33 . . . . . . . . 34 . . . . . . . . 35 . . . . . . . . 36 . . . . . . . . 37 . . . . . . . . 39 . . . . . . . . 40 . . . . . . . . 41 . . . . . . . . 45
5 Propri´ et´ es asymptotiques de l’estimateur des MCO 47 5.1 Propr Propri´ i´ et´ e t´es e s asym asympt ptoti otiqu ques es de l’es l’esti tima mate teur ur des des MCO MCO . . . . . . . . . . . . . . . . . 49 5.2 Tests asymptotiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 5.3 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3
4
Sommaire
R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
6 Evaluation : Les estimateurs de diff´ erence 6.1 Le Mo d`ele causal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 6.2 L’es L’esti tima mate teur ur des des Diff Diff´eren e rence cess de Diff Diff´eren e rence cess . . . . . . . . . . . . . . . . . . . . . .
61 62 66
7 Le mod` od` ele e le lin lin´ eair aire sans l’h l’hypoth poth` ` ese e se d’ho ’homosc osc´ edast dastiicit cit´ e 7.1 7.1 Le mo mod d`ele e le h´et´ e t´erosc rosc´´edas dastiqu tiquee . . . . . . . . . . . . . . . . . . . 7.2 Estimat Estimation ion en pr´ pr´esence esence d’h´ d’h´et´ et´erosc´ erosc´ edasti edasticit cit´´e . . . . . . . . . . 7.3 L’esti L’estimat mateur eur des Moindre Moindress Carr Carr´´es es QuasiQuasi-G´ G´ en´ en´eralis eralis´´es es . . . . . R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . .
8 Le mod´ ele h´ et´ erosc´ edastique en coup e 8.1 Inf´erence erence robuste a` l’h l’h´´et´ e t´eros e roscc´edas e dasti tici citt´e . . . . . . . . . . . . . . . . 8.2 Test est d’h d’h´´et´ e t´eros e rosc´ c´ edas e dasti tici cit´ t´ e de de Bre Breus ushh-Pa Pagan gan . . . . . . . . . . . . . . 8.3 L’estimateur des MCQG . . . . . . . . . . . . . . . . . . . . . . . . 8.4 8.4 Illu Illust stra rati tion on : Esti Estima mati tion on d’un d’unee ´equa e quati tion on de sala salair iree . . . . . . . . . R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . .
. . . .
71 . . . . 71 . . . . 77 . . . . 82 . . . . 83
85 . . . . . . . . 86 . . . . . . . . 89 . . . . . . . . 92 . . . . . . . . 95 . . . . . . . . 98 . . . . . . . . 98
9 Corr´ elation des observations 9.1 Estim Estimati ation on en pr´ pr´esen e sence ce de corr corr´´elati e lation onss ent entre re observ observat atio ions ns . . . . . . . . . . . . . 9.2 Illustration Illustration : estimat estimation ion d’une d’une fonction fonction de production production sur sur donn´ donn´ees ees individu individuelles elles . 9.3 9.3 Proce Process ssus us d’au d’autoc tocor orrr´elat e latio ion n des des pert pertur urba bati tion onss . . . . . . . . . . . . . . . . . . . . 9.4 Autocorr Autocorr´´elation elation des r´ esidus esidus dans dans les les s´ eries eries temporel temporelles les . . . . . . . . . . . . . . . R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99 99 104 106 106 111 120 12 1
10 Evaluation : Regressions ` a variables de contrˆ ole 123 10.1 Ind´ependance ependance conditionnelles `a des observables . . . . . . . . . . . . . . . . . . . 123 10.22 Le mod` 10. mod`ele e le de de s´ s´elec e lecti tivi vit´ t´ e sur sur inob inobse serv rvab able less . . . . . . . . . . . . . . . . . . . . . . 134 11 Variables instrumentales 11.1 Trois exempl exemples es types types d’endog d’endog´´en´ en´ eit´ eit´e des r´ egresseurs egresseurs . . . . . 11.2 11.2 La m´etho e thode de des des var varia iabl bles es inst instru rume men ntale taless . . . . . . . . . . . 11.3 11.3 L’est L’estim imat ateu eurr de des dou doubl blees moi moind ndre ress carr carr´´es es . . . . . . . . . . 11.4 Interpr´ etation etation de la condition conditio n : lim rangE ( rangE (zi′ xi ) = K + K + 1 . . 11.5 Test de suridentification . . . . . . . . . . . . . . . . . . . . 11.66 Test 11. est d’e d’exo xog´ g´ en´ e n´eit´ e it´ e des des variab ariable less exp expli lica cativ tives es . . . . . . . . . 11.7 I ll llustrations . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.8 R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
1 43 144 146 146 152 152 155 1 56 161 16 3 16 7
12 La M´ ethode des moments g´ en´ eralis´ ee 1 69 12.1 Mod`ele ele structure structurell et contrain contrainte te identifian identifiante te : restriction restriction sur les moments moments . . . . . 169 12.2 D´ efinir efinir un mod` mod`ele ele par par le biais biais de de conditi conditions ons d’ort d’orthogo hogonal nalit it´´e . . . . . . . . . . . . 171 12.3 Principe de la m´ethode ode : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
5
Sommaire
12.4 12.4 12.5 12.6 12.6 12.7 12.8 12.9
Con Converge ergenc ncee et et pro propr prii´et´ e t´es e s asym asympt ptot otiq ique uess . Estimateur optimal . . . . . . . . . . . . . Appl Applic icat atio ion n aux aux Varia ariabl bles es Inst Instru rume men ntale taless Test de sp´ecification . . . . . . . . . . . . I ll llustrations . . . . . . . . . . . . . . . . . R´esum´e . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
13 Variables d´ ependantes limit´ ees 13.1 Mod` od`ele dichotomique . . . . . . . . . . . . . . . . . . . . . . . . 13.2 Variables latentes . . . . . . . . . . . . . . . . . . . . . . . . . . 13.3 13.3 Estim Estimat atio ion n de des mod mod``eles e les dic dichoto hotomi miq ques ues . . . . . . . . . . . . . . 13.4 Illust Illustrati ration on : partici participat pation ion des femmes femmes sur le marc march´ h´ e du trav travail 13.5 13.5 S´elec e lecti tiv vit´ it´e : le mo mod d`ele e le Tob Tobit it . . . . . . . . . . . . . . . . . . . . 13 13..6 Esti Estim mati ation du mod` od`ele Tobit . . . . . . . . . . . . . . . . . . . . 13.77 Mod` 13. Mod`eles e les de de cho choix ix dis discr cret etss : le Mod Mod``ele e le Logi Logitt Multi Multino nomi mial al . . . . 13.8 R´esum´e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . .
. . . . . .
. . . . . .
. . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
178 178 179 181 181 186 19 0 19 4
. . . . . . . .
197 1 98 200 202 202 206 207 207 214 214 224 22 6
A Rappels de statistiques 229 A.1 Calcul matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 A.2 Rappel pel sur les convergences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 Liste des Graphiques
235
Liste des Tableaux
237
Liste des Applications
239
Table des Mati` eres
241
6
Sommaire
Chapitre 1
Introduction A la diff´erence de la statistique, qui est une branche des math´ematiques, l’´econom´etrie est une branche de l’´economie, destin´ee `a d´evelopper des outils d’analyse des donn´ees permettant de nourrir la r´eflexion th´eorique. Au del`a de la terminologie, cette diff´erence distingue de fa¸con fondamentale les ´el´ements qui seront trait´es ici de l’analyse statistique des donn´ees. Cette diff´erence se traduit, notamment, par le fait que l’analyse ´econom´etrique repose sur une mod´elisation du probl`eme auquel on s’int´eresse et qui servira au traitement des donn´ees dont on dispose.
1.1
Analyse ´ econom´ etrique : pr´ esentation
L’analyse ´econom´etrique d’un ensemble de donn´ees a, dans la grande majorit´e des cas, pour objectif de tester la validit´e et d’´evaluer l’ampleur des explications fournies par l’analyse ´economique. A ce titre, elle s’int´ eresse donc `a l’effet d’un ensemble de variables – dites variables explicatives et not´ees x – sur une ou plusieurs autres – appel´ees variables expliqu´ ees, y. Le choix de ces variables et leur rˆole dans le mod`ele ´econom´etrique est d´eduit de l’analyse ´economique du probl`eme auquel on s’int´eresse. Une mˆeme variable peut ainsi jouer le rˆole de variable expliqu´ee dans un mod`ele ´econom´etrique donn´e – par exemple, l’´education dans un mod`ele d’investissement en capital humain – et le rˆole de variable explicative dans un mod`ele diff´erent – l’´education dans un mod`ele de formation des salaires. La th´eorie sugg`ere ainsi une relation de causalit´e sp´ecifique au probl`eme consid´er´e entre les variables auxquelles on s’int´eresse. Pour cette raison, la variable expliqu´ee est ´egalement souvent qualifi´ee de d´ ependante ou endog` ene , au sens o` u une relation causale la lie aux variables explicatives consid´ er´ees ; et les variables explicatives qualifi´ees de variables ind´ ependantes ou exog`enes, au sens o`u leur niveau peut ˆetre consid´er´e comme une donn´ee dans le cadre du probl`eme auquel on s’int´eresse.
1.1.1
Mod` ele ´ econom´ etrique
Un mod`ele ´ econom´etrique est constitu´e de plusieurs ingr´edients. L’analyse empirique de la relation qui lie les variables explicatives `a la (aux) variable(s) expliqu´ee(s) passe d’abord par la sp´ecification d’une fonction telle que : y = f (x). Cette fonction refl`ete la relation causale qu’entretiennent les variables. Il est cependant impossible pour un observateur ext´erieur de connaˆıtre et d’observer parfaitement l’ensemble des d´eterminants d’un ph´enom`ene social. Le “moral des m´enages” est ainsi souvent pr´esent´e comme un d´eterminant important du comportement de consommation. Dans le cadre d’une analyse empirique du comportement individuel 1
2
Chapitre 1. Introduction
de consommation, il est cependant inimaginable de pouvoir observer de fa¸con certaine cette variable (chaque lecteur de ce manuel constitue ou appartient `a un m´enage : pouvez-vous mesurer votre moral ?). Il convient donc de distinguer dans l’analyse l’ensemble des ´el´ements observables, contenus dans la liste des variables explicatives, des d´eterminants qui ´echappent `a l’observation ; soit par m´econnaissance du probl`eme, soit, le plus souvent, en raison des difficult´es `a les mesurer. Ces ´el´ements inobservables ´ecartent la variable y du niveau que laissent attendre les variables observ´ees x. L’ampleur de cette erreur ne peut pas, par d´efinition, ˆetre caract´eris´ee. Elle est donc consid´er´ee comme une variable al´ eatoire , not´ee u, qui s’ajoute au mod`ele : y = f (x, u). Les variations de u ainsi que la fonction f elle mˆ eme se combinent pour expliquer les variations de la (les) variable(s) expliqu´ ee(s). Un certain nombre de param` etres inconnus interviennent dans cette combinaison. Le multiplicateur d’investissement keyn´ esien relie par exemple l’investissement I et le PIB, Y , selon une relation lin´eaire telle que : Y = γI . L’intensit´e de cette relation, mesur´ee par γ , est inconnue et n’est pas observable directement dans la vie ´economique. Les param`etres qui d´efinissent la fonction f , not´es b, doivent donc ˆetre estim´es, c’est `a dire ˆetre d´eduits des observations disponibles dans les donn´ees en s’appuyant sur le mod`ele. Pour ce faire, il est n´ecessaire d’imposer un certain nombre d’ hypoth` eses sur la fonction f et sur le terme d’erreur u. Comme nous le verrons plus bas (Section ??), les hypoth`eses retenues d´etermient de fa¸con importante les outils qui pourront ˆetre mobilis´es ainsi que les propri´et´es de l’analyse. Au total, un mod`ele ´econom´etrique se d´efinit ainsi comme (i) une relation causale entre des variables, (ii) perturb´ ee par un ensemble d’´ elements inobservables, (iii) d´ etermin´ ee par des param` etres inobservables (iv) et (v) sur laquelle sont impos´ ees un certain nombre d’hypoth` eses n´ ecessaires ` a l’estimation.
1.1.2
Le mod` ele lin´ eaire
Une hypoth`ese particuli`erement concerne la forme impos´ee `a la fonction f . Bien qu’il soit possible de d´efinir un mod`ele ´econom´etrique en conservant une forme g´en´erale `a la fonction – on parle alors de mod` ele non param` etrique – le proc´ed´e le plus courant consiste `a imposer une forme fonctionnelle pour f . On d´efini alors un mod`ele param`etrique. L’ensemble des choix possibles est extrˆemement vaste. On pourrait ainsi utiliser une forme exponentielle, logarithmique, un ratio de polynˆomes ou toute combinaison imaginable de ces fonctions. Le mod`ele `a la fois le plus simple et le plus ´etudi´e est le mod`ele qui impose une forme lin´eaire `a cette relation. Le mod`ele ´econom´etrique consid´er´e s’´ecrit alors : y = α + β 1 x1 +
··· + β K xK + u = xb + u
On retrouve ici les ´elements qui d´efinissent un mod`ele ´econom´etrique : une variable expliqu´ee, K variables explicatives (qui sont toutes observ´ees), K + 1 param`etres (`a estimer) et un terme d’erreur (inobservable). Il convient d’ˆetre tr`es vigilant quant au crit`ere qui caract´erise la lin´earit´e du mod`ele. La forme fonctionnelle utilis´ee est en effet qualifi´ee en fonction de la position qu’occupent les param` etres et non les variables dans le mod`ele.
D´ efinition 1.1 Un mod`ele ´econom´etrique est dit lin´eaire si la relation entre les variables explicatives et la (les) variable(s) expliqu´ee(s) est lin´eaire dans les param`etres. Le mod`ele ´econom´etrique qui consiste `a expliquer le salaire par une fonction lin´eaire de l’ˆage pris au carr´e (ou toute autre transformation non lin´eiare de cette variable) sera ainsi consid´er´e
1.2. Principales ´ etap es de l’analyse ´econom´etrique
3
comme un mod`ele lin´eaire. A l’exception du dernier chapitre, les r´esultats pr´esent´es dans cet ouvrage se concentrent sur ce mod`ele. Plusieurs facteurs expliquent son succ`es et la quantit´e des travaux qui lui sont consacr´es. En raison de sa simplicit´ e, d’abord, le mod`ele lin´eaire est historiquement `a l’origine de l’analyse ´econom´etrique. Les d´eveloppements ult´erieurs de l’analyse et notamment l’analyse non lin´eaire – qui sera introduite `a la fin de cet ouvrage – s’appuient donc naturellement sur les r´esultats obtenus dans le cadre du mod`ele lin´ eaire. Leur connaissance est ainsi indispensable `a une bonne compr´ehension de th`emes plus avanc´es, et toute formation `a l’´econom´etrie commence d’ailleurs, pour cette raison, par une pr´esentation de l’´econom´etrie lin´eaire. Cette simplicit´e explique ´egalement le succ` es de ce mod`ele parmi les praticiens (professionnels, chercheurs, . . . ) de l’´economie appliqu´ee. Comme nous le verrons au cours de l’ouvrage, une part tr`es importante des travaux r´ealis´es dans ce domaine repose en effet sur l’analyse lin´eaire, et peut par cons´equence ˆetre comprise en se limitant au ´elements pr´esent´es dans cet ouvrage. Une derni`ere raison, plus fondamentale, tient `a ce que de tr`es nombreux mod`eles peuvent ˆetre exprim´es sous forme lin´eaire. Il s’agit de la premi`ere ´etape de l’analyse ´econom´etrique, dont un certain nombre d’exemples sont pr´esent´es ci-dessous.
1.2
Principales ´ etapes de l’analyse ´econom´ etrique
Le passage de la th´eorie ´economique `a un mod`ele ´econom´etrique consistue en effet la premi`ere ´etape de l’analyse. Le mod`ele peut ensuite ˆetre mis en œuvre `a condition de disposer d’obsevation sur le ph´enom`ene consid´er´e et ses d´eterminants. Il s’agit alors de proc´eder `a l’estimation du mod`ele, et ce `a des fins de validation, d’´evaluation ou de pr´evision.
1.2.1
D’o` u vient le mod` ele ? - 1 de la th´ eorie ´ economique
Comme nous l’avons vu, c’est la th´eorie ´economique qui sugg`ere une relation de causalit´e entre la (les) variable(s) expliqu´ee(s) et les variables explicatives. Il faut cependant entendre le terme “th´eorie ´economique” au sens large. Bien que pr´ef´erable, il n’est pas indispensable, en effet, de disposer d’un mod`ele ´economique au sens propre du terme pour mettre en œuvre un mod`ele ´econom´etrique. Les quelques exemples propos´es ci-dessous illustrent les divers degr´es d’intimit´e qui peuvent exister entre la th´eorie et la sp´ecification d’un mod`ele ´econom´etrique. 1
(i)
Fonction de production
Dans sa variation la plus simple, l’analyse ´economique du processus de production consid` ere le niveau du produit, Y , qomme le r´ esultat de la combinaison de deux facteurs : le capital, K , et le travail, L : Y = F (K, L) Un mod`ele non param`etrique de production consisterait `a conserver la forme g´en´erale de F (). Seuls sont consid´er´es dans cet ouvrage les mod`eles param`etriques qui imposent une forme particuli`ere `a la fonction d’int´erˆet. On se restreint alors `a un ensemble de fonctions de productions ne d´ependant que d’un nombre fini de param`etres. Une sp´ecification fr´equemment retenue est la fonction de production Cobb-Douglas. Imposer une forme fonctionnelle n’est jamais neutre sur le 1
Certains de ces exemples seront developp´ es au cours de l’ouvrage.
4
Chapitre 1. Introduction
ph´enom`ene ´etudi´e. La fonction de production Cobb-Douglas impose par exemple une restriction forte sur les possibilit´es de substitution entre facteurs : Y = AK α Lβ α et β sont des param`etres `a estimer. On remarque imm´ediatement que le mod`ele ainsi sp´ecifi´e n’est pas lin´eaire au sens de la D´efinition 1.1. Une simple op´eration alg´ebrique permet cependant de se ramener `a ce cadre : log(Y ) = log(AK α Lβ ) y = a + αk + βl La seconde ´equation d´efinit ainsi un mod`ele lin´eaire dans les param`etres. L’op´eration a n´ecessitr´ e un changement de variables : on s’int´ eresse d´esormais au logarithme du produit y = log(Y ) comme des facteurs (k = log(K ) et l = log(L)). La quantit´e a correspond `a une quantit´e inobserv´ee, qui s’interprˆete comme le logarithem du param`etre d’´echelle de la fonction de production. Suivant les cas, on pourrra donc la consid´ erer comme un param`etre `a estimer (constant) ou comme le terme d’erreur du mod`ele. Lorsque l’on s’int´eresse `a la fonction d eproduction de diff´erentes entrprises, le niveau de la technologie est ainsi susceptible de varier d’une entrprise `a l’autre et il paraˆıtra alors naturelle de consid´ erer cette quantit´ e comme l’erreur du mod`ele. Pour les autres coefficients, en revacnhe, le mod`ele sp´ecifi´e impose une homog´en´eit´e du processus de production dans la population d’entreprises.
(ii)
Demande de facteurs
La th´eorie ´economique a montr´ e que la demande de facteurs qui ´emane des entreprises se d´ eduit directement de la fonction de coˆut associ´ee au processus de production. En toute g´en´eralit´e, cette fonction s’´ecrit : C (Q, pX , u), o` u Q est le niveau de production, pX le vecteur des prix des facteurs X et u le niveau de la technologie. La demande pour un facteur donn´ e X od est donn´ee par le Lemme de Shephard : X 0d =
∂C (Q, pX , u) ∂p X0
Comme dans le cas pr´ec´edent on se restreint en g´en´eral `a une forme param´etrique de la fonction de coˆ ut. Une sp´ecification standard est la fonction de coˆut translog avec deux facteurs : le capital de coˆ ut exp(c) et travail de coˆ ut exp(w) : log(C ) = a + αc + βw + 0.5δc c2 + δw,c cw + 0.5δw w 2 + log(Q)
− log(u)
Par application du lemme de Shephard, ce type de sp´ecification conduit `a des fonctions de demande sp´ecifiant la part optimal de chaque facteur dans le coˆut global. Pour la demande de travail, on a par exemple : wL = β + δw,c c + δw w Q Dans cette sp´ ecification, la perturbation n’a pas d’interpr´ etation aussi naturelle que dans le cas pr´ec´edent. Il faut consid´erer que soit le param`etre β est h´et´erog`ene, soit la part observ´ee s’´ecarte de la part th´eorique pour des raisons non expliqu´ees.
1.2. Principales ´ etap es de l’analyse ´econom´etrique
5
Le mod`ele peut aussi provenir d’une relation moins structurelle entre les variables. Par exemple un type d’´equations tr`es souvent estim´e est l’´equation de Mincer qui fait d´ependre le salaire du nombre d’ann´ees d’´etude et de l’exp´erience. Par exemple : log(wi ) = a0 + as si + ae ei + ui o`u as repr´esente le gain li´e `a une ann´ee d’´etude suppl´ementaire et ae le gain li´e `a une ann´ee d’exp´erience suppl´ementaire. Les param`etres ´economiques auxquels on s’int´eresse alors sont le rendement de l’´education ou le rendement de l’exp´erience. La mod´elisation sous-jacente est celle du capital humain : le capital humain s’accumule d’abord durant la p´ eriode des ´etudes puis durant la vie active par l’exp´erience, en apprenant sur le tas. Si on fait l’hypoth`ese d’un march´e du travail concurrentiel, les diff´erences de r´emun´erations entre les agents traduiront des diff´erences dans le capital humain. On peut remarquer concernant cette ´equation que l’on ne s’int´eresse pas seulement `a expliquer les diff´erences moyennes de revenus entre les agents mais que l’on souhaite aussi parvenir `a une estimation plus ambitieuse qui puisse conduire `a une interpr´etation causale : si on augmente la dur´ee des ´etudes de un an d’un individu quel sera son gain en terme de r´emun´eration ? Un autre exemple dans lequel le mod`ele entretient des rapports encore plus t´enus avec des param`etres structurels mais poss`ede une interpr´ etation causale est celui de l’incidence de la taille d’une classe sur le taux de r´eussite des ´el`eves de la classe. On peut l´egitimement se poser la question de savoir si la r´eduction de la taille des classes conduit `a une am´elioration du taux de r´eussite scolaire. On peut ainsi consid´erer un mod`ele du type : τ i = a0 + at taille i + xi ax + ui o`u τ i repr´esente le taux de r´eussite d’une classe. Dans cette sp´ecification que l’on pourrait appeler fonction de production scolaire, on introduit un ensemble d’autres variables. En effet on se doute bien que de nombreux facteurs affectent la r´eussite d’une classe. Par exemple l’environnement scolaire est certainement un facteur important. On pourrait se dire que comme on ne s’int´eresse pas `a la variable d’environnement on ne la met pas dans la r´egression. D’un cˆot´e on y gagne car on n’a pas `a faire l’effort de mesurer cette variable, mais d’un autre cˆot´e cette variable contribue aussi `a d´eterminer la taille de la classe. Il est possible que dans certains milieux d´efavoris´es la taille des classes soit plus petites. Si on ignore le rˆole de l’environnement scolaire et qu’on ne l’int` egre pas dans la r´egression, on risque de mesurer un effet de la taille de la classe qui soit un mixte de l’effet propre de la taille et de l’effet de l’environnement. Il donc important dans ce type de mod`ele, entretenant des rapports larges avec la th´eorie, d’introduire des facteurs annexes qui permettront d’isoler l’effet propre de la taille de la classe. On cherche `a contrˆ oler pour un certain nombre de facteurs ext´erieurs. Enfin, on peut avoir une approche descriptive des donn´ees. Il est important de remarquer que dans ce cas les param`etres n’ont pas d’interpr´etation structurelle.
1.2.2
Les donn´ ees
Les donn´ees constituent le cœur de l’´econom´etrie. Leur recueil et leur examen descriptif constituent aussi en g´en´eral une part importante de tout travail ´econom´etrique. Il y a principalement trois grands types de donn´ees :
6
Chapitre 1. Introduction
1. Donn´ees temporelles ou longitudinales. Elles sont indic´ees par le temps t. On dispose ainsi de s´eries dites temporelles : yt , xt , par exemple les s´eries trimestrielles de la consommation et du revenu, de l’inflation... En g´en´eral le nombre d’observation T est assez r´eduit, de l’ordre de la cinquantaine. On note en g´en´eral y le vecteur T 1 (y1 , . . . , yT )′ et x la matrice T (K + 1) : (x′1 , . . . , x′T )′ o` u xt est le vecteur ligne form´e des valeurs des diff´erentes variables explicatives (dont la constante) `a la date t.
×
×
2. Donn´ees en coupe. yi , xi . Leur indice correspond `a l’identifiant d’un individu ou d’une entreprise. Ces donn´ees peuvent repr´esenter par exemple le salaire d’un individu pour y et son diplˆome, son exp´ erience... pour les variables explicatives. Les ´echantillons dont on dispose sont en g´en´eral de beaucoup plus grande taille : le nombre d’observation N d´epasse le plus souvent la centaine et peut aller jusqu’`a plusieurs dizaines de milliers. On note l`a encore en g´en´eral y le vecteur N 1 (y1 , . . . , yN )′ et x la matrice N (K + 1) : (x′1 , . . . , x′N )′ o` u xi est le vecteur ligne form´e des valeurs des diff´erentes variables explicatives (dont la constante) pour l’individu i.
×
×
3. Donn´ees `a double indice, dites de panel : yit , xit . On dispose d’informations sur des individus i = 1, . . . , N que l’on suit sur plusieurs p´eriodes, t = 1, . . . , T . Les N T observations zit correspondent `a N observations vectorielles ”individuelles” zi1 , . . . ziT . On note en g´en´eral yi le vecteur T 1 (yi1 , . . . , yiT )′ et xi la matrice T (K + 1) : (x′i1 , . . . , x′iT )′ et y le vecteur
×
×
×
′
NT 1 y1 , . . . , yN et x la matrice N T (K + 1) : (x′1 , . . . , x′N )′ o`u xi est la matrice form´ee des valeurs des diff´erentes variables explicatives (dont la constante) pour l’individu i aux diff´erentes dates.
1.2.3
×
L’estimation
Estimer le mod`ele c’est trouver une fonction des observations y et x
b = b y, x
dont on souhaite qu’elle v´ erifie certaines conditions. Par exemple l’estimateur peut ˆetre choisi tel – qu’il soit “sans biais” E b = b y, x f y, x dydx = b
– qu’il satisfasse un crit`ere : minimisation de la somme des carr´es des r´esidus b = arg min (y maximisation de la log-vraisemblance b = arg max log l (y, x) – qu’il soit de variance minimale – qu’il soit convergent, c’est `a dire qu’il se rapproche de la vraie valeur du param`etre lorsque le nombre d’observations devient grand.
1.2.4
Pourquoi estimer le mod` ele ?
– tester l’existence d’un effet, i.e. v´erifier qu’une variable x a un effet sp´ecifique sur une variable y. Par exemple on peut s’interroger sur l’effet des taux d’int´erˆet sur l’investissement, c’est `a dire sur l’existence d’un canal mon´etaire de la politique mon´etaire. Dans le cadre d’un mod`ele acc´el´erateur profit standard, I = α∆Qt + βπ + γr + v, on peut s’interroger sur le fait que le coefficient du taux d’int´ erˆet γ soit nul ou non. On s’int´ eresse donc `a l’hypoth`ese H 0 : γ = 0, et on souhaite que les donn´ees permettent de r´epondre `a cette
− xb)2 ;
7
1.2. Principales ´ etap es de l’analyse ´econom´etrique
question. De fa¸con similaire, dans le cas de la fonction de production scolaire on peut s’interroger sur l’existence d’un effet de la taille de la classe sur le taux de r´ eussite. On va alors s’int´eresser `a l’hypoth`ese H 0 : at = 0, et l`a aussi on souhaite que les donn´ees nous permettent de choisir entre oui ou non. L’estimation du mod` ele et la confrontation du param`etre a` z´ ero est la voie la plus naturelle pour prendre cette d´ecision. La question est ici de savoir si le param` etre est significatif au sens statistique du terme. – quantifier cet effet, ce qui est utile `a des fins de simulations. Par exemple dans les deux cas pr´ec´edents on est aussi int´eress´e par donner un ordre de grandeur de l’effet `a attendre d’une variation de la variable. Si on voulait par exemple prendre une d´ecision de politique ´economique consistant `a baisser la taille des classes, ce qui est tr`es coˆuteux, on est int´eress´e certes `a savoir si cela aura un effet non nul mais aussi `a savoir l’ordre de grandeur de cet effet. S’il est tr`es faible on ne prendra pas alors aussi facilement la d´ecision de r´eduire la taille des classes. L’ordre de grandeur du param`etre est aussi important. La question est ici de savoir si le param`etre est significatif au sens ´economique du terme. – pr´evoir. Dans le mod`ele yt = xt β + ut , le param`etre β peut ˆetre estim´e sur les observations t = 1, . . . , T : β. Connaissant xT +1 on calcule la pr´evision de y `a la date T + 1 : yT +1 = xT +1 β
1.2.5
D’o` u vient le mod` ele ? - 2 de relations stochastiques
Le mod`ele provient aussi de relations stochastiques entre les variables. L’´ecriture de la relation y = xb + u ne constitue pas en fait un mod`ele ´econom´etrique. Comme on l’a vu il s’agit d’une relation plus ou moins fond´ee. Si on l’admet fond´ee, le param`etre b a un sens en lui-mˆeme. Il a une d´efinition ´economique, par exemple l’´elasticit´e de la production au capital. Pour que ce mod`ele soit un mod`ele ´econom´etrique il faut lui adjoindre une restriction stochastique. Une fa¸con naturelle de proc´eder est de sp´ecifier la loi jointe des observations l (y, x; b) . Ceci revient `a sp´ecifier la loi du r´esidu sachant les variables explicatives : l (u x ) . La situation de base est celle dans laquelle cette loi est choisie comme une loi normale ne d´ependant pas des variables x. On impose donc dans ce cas une restriction stochastique essentielle p our l’analyse ´econom´etrique
|
|
l (u x ) = l (u) = ϕ (u/σ) /σ o`u ϕ est la densit´e de la loi normale. Imposer cette restriction permet de d´efinir la densit´ e des observations l (y, x; b) = l (y x; b ) l (x) = ϕ ((y xb) /σ) l (x) /σ
|
−
et donc d’estimer les param`etres en appliquant par exemple la m´ethode du maximum de vraisemblance. L’estimateur auquel on parvient est alors celui des moindres carr´es ordinaires. On peut aussi faire des hypoth`eses sur la loi de u sachant x qui soient moins fortes que la sp´ ecification de la loi compl`ete. Par exemple on peut se contenter de sp´ ecifier :
|
E (u x ) = E (u) = 0 Cette propri´et´e est satisfaite si on sp´ecifie la loi conditionnelle de u sachant x comme une loi normale ind´ependante de x. L’inverse est faux et cette sp´ecification est donc moins exigeante que
8
Chapitre 1. Introduction
la pr´ec´edente. Elle permet, elle aussi, d’estimer le mod`ele. Elle implique en effet des restrictions du type E (x′ (y xb)) = 0 appel´ees intuitivement conditions d’orthogonalit´e dont on verra qu’elles sont suffisantes pour estimer les param`etres du mod`ele. On remarque `a ce stade que dans cette sp´ecification il y a d’ores et d´ej`a un param`etre de moins : la variance des r´esidus n’intervient plus. Ces restrictions stochastiques d´efinissent un param`etre statistique. On pourrait ainsi d´efinir autant de param`etres b qu’il y a de restrictions stochastiques envisageables, c’est `a dire une infinit´e. On pourrait par exemple consid´erer le param`etre bZ associ´e `a des restrictions stochastiques E (z ′ (y xbZ )) = 0 dont on verra qu’elles aussi peuvent ˆetre utilis´ees souvent pour conduire `a une estimation du param`etre. Il n’est pas certain que le param`etre statistique associ´e `a une restriction stochastique co¨ıncide avec le param`etre ´economique. L’estimation peut ainsi ˆetre non convergente, c’est `a dire que la valeur du param`etre estim´ ee ne se rapprochera pas de la vraie valeur (´economique) du param`etre lorsque le nombre d’observation augmente, ou ˆetre biais´ee, c’est `a dire que l’esp´erance du param`etre n’est pas la vraie valeur (´economique) du param`etre. Une partie importante de l’´econom´etrie, qui passe par une r´eflexion sur le mod`ele, les donn´ees et les m´ethodes consiste `a rechercher des conditions dans lesquelles le param`etre statistique co¨ıncide avec le param`etre ´economique. La question est-ce que p lim b = b0 , la vraie valeur ´economique du param`etre, est en dernier ressort la question la plus centrale et la plus importante de l’´econom´etrie, et assez naturelle : est-ce que j’ai bien mesur´e ce que je voulais ? C’est beaucoup moins facile qu’il n’y paraˆıt, car de nombreux facteurs affectent les d´ecisions individuelles et il est difficile d’isoler l’effet d’une unique cause.
−
−
1.3
Plan de l’ouvrage
Le cours d´ebute dans le chapitre 2 par l’estimateur des moindres carr´es, c’est `a dire le vecteur des coefficients de la projection orthogonale de y sur l’espace vectoriel engendr´e par les variables explicatives. On pr´esente d’abord les propri´et´es alg´ebriques de cet estimateur et ses propri´et´es statistiques sous des hypoth`eses minimales telles que l’ind´ependance et l’´equidistribution des observations (Th´eor`eme de Frish-Waugh, Th´eor`eme de Gauss-Markov, estimation des param`etres du second ordre, le R 2 et l’analyse de la variance). On montre ensuite dans le chapitre 3 comment la sp´ecification de la loi des r´esidus comme une loi normale permet de compl´eter l’analyse en particulier en permettant d’obtenir la loi des estimateurs, ´etape incontournable pour proc´eder `a des tests d’hypoth`eses simples (test de Student) ou d´efinir des intervalles de confiance pour les param`etres. On examine ensuite dans le chapitre 4 et dans le mˆeme cadre o`u la loi des r´esidus est suppos´ee normale, le cas important des estimations sous contraintes lin´eaires (dans les param`etres). On pr´esente alors les tests d’hypoth`eses lin´eaires sur les param`etres par le biais des tests de Fisher. Ces r´esultats sont obtenus sous des hypoth`eses fortes : – Ind´ependance des r´esidus et des variables explicatives : l (u x ) = l (u) – Homosc´edasticit´e V (u x ) = σ 2 I – Sp´ecification de la loi des r´esidus : l (u) normale. Les chapitres suivants vont progressivement revenir sur chacune de ces hypoth`eses. On va d’abord examiner dans un cadre tr`es proche la loi asymptotique des estimateurs, c’est `a dire lorsque le nombre d’observations devient grand. On va chercher `a d´evelopper le mˆeme genre de propri´et´es permettant de faire de l’inf´erence mais sans sp´ecifier la loi des r´esidus. Les r´esultats
|
|
9
1.3. Plan de l’ouvrage
seront obtenus sous les hypoth`eses : – Absence de corr´elation entre les r´esidus et les variables explicatives E (ux′ ) = 0 – Homosc´edasticit´e V (u x ) = σ 2 I Le comportement asymptotique des estimateurs est examin´e dans le chapitre 5. Dans le chapitre 6 on revient sur les hypoth`eses d’ind´ependance et d’´equidistribution des param`etres. On pr´esente l’estimateur des moindres carr´es g´en´eralis´ee ainsi que diff´erentes fa¸cons de traiter la situation dite d’h´et´erosc´edasticit´e, i.e. situation dans laquelle la variance des r´esidus d´epend des variables explicatives. On aborde aussi succinctement la question des donn´ees de panel et de l’estimation de mod`eles faisant intervenir des syst`emes d’´equations. Le cadre dans lequel on se situe est juste bas´e sur – Absence de corr´elation entre les r´esidus et les variables explicatives E (ux′ ) = 0 Les chapitres 7, 8 et 9 utilisent la m´ethode des moindres carr´es g´en´eralis´es en s’appuyant sur une connaissance a priori de la structure de corr´elation des r´esidus. Le chapitre 7 s’int´eresse plus particuli`erement au cas des r´egressions empil´ees. Dans le chapitre 8, on consid`ere le cas d’une r´egression en coupe dans laquelle on a h´et´erosc´edascticit´e du r´esidu, ce qui peut ˆetre le cas par exemple pour une ´equation de salaire, la variance du r´esidu ´etant g´en´eralement croissante avec le revenu. Dans le chapitre 9, on consid`ere le cas d’estimations o`u le r´esidu peut ˆetre mod´elis´e comme une s´ erie temporelle de comportement connu. On construit l’estimateur les moindres carr´es quasi-g´en´eralis´es en s’appuyant sur la connaissance de la forme de l’autocorr´elation du r´esidu. Dans le chapitre 10, on consid` ere la situation dans laquelle E (ux′ ) = 0. On aborde la question de l’identification, fondamentale en ´econom´etrie. On montre comment `a l’aide de variables ext´erieures z, dites instrumentales, il est possible d’estimer le param`etre d’int´erˆet. On revient donc en partie sur certains aspects des g´en´eralisations pr´ec´edentes pour mieux se concentrer sur l’hypoth`ese d’identification. Les r´esultats sont obtenus sous les hypoth`eses – Absence de corr´elation entre les r´esidus et des variables z : E (uz ′ ) = 0, – Rg (z ′ x) = dim x – Homosc´edasticit´e V (u x, z ) = σ 2 I On pr´esente aussi deux tests importants : le test d’exog´en´eit´e et le test de suridentification qui sont des guides importants dans le choix des variables instrumentales. Dans le chapitre 11 on pr´esente une g´en´eralisation importante de la m´ethode `a variable instrumentale et qui englobe la plupart des m´ethodes ´econom´etriques standards. Il s’agit de la m´ethode des moments g´en´eralis´ee et on montre en particulier comment elle permet d’´etendre la m´ethode a` variables instrumentales au cas dans lequel les perturbations sont h´et´erosc´edastiques et `a d’autres cas tels que celui de l’´econom´etrie des donn´ees de panel ou l’estimation de syst`emes d’´equations. Les hypoth`eses s’´ecrivent un peu diff´eremment ce qui souligne le caract`ere g´en´eral de cette m´ethode – E (g (z, θ)) = 0 o` u z repr´esente l’ensemble des variables du mod`ele, c’est `a dire inclus les y et les x. Dans le chapitre 12, on pr´esente succinctement certains mod`eles non lin´eaires proches des mod`ele lin´eaires. On s’int´eresse ainsi au mod`eles dits probit pour lesquels la variable `a expliquer n’a plus un support continu sur R mais prend ses valeurs dans 0, 1 . La mod´elisation sous jacente consiste `a introduire une variable latente, i.e. non observ´ee compl`etement
|
|
{ }
I ∗ = zc + u
10
Chapitre 1.
et dont les r´ealisations gouvernent l’observation de la variable I : I = 1
⇐⇒ I ∗ > 0
On aborde ´egalement d’autres situations importantes permettant d’aborder la questions de la s´electivit´e des ´echantillons, c’est `a dire la situation dans laquelle on n’observe la variable d´ependante que sous une condition li´ee par ailleurs `a la variable d´ependante elle-mˆeme : y ∗ = xb + u I ∗ = zc + u les r´ealisations de I ∗ gouvernent l’observation de la variable I et de la variable y : I ∗ > 0 I ∗
⇒
I = 1 y = y∗
≤ 0 ⇒ I = 0
Ce type de mod`ele appel´e mod`ele Tobit est souvent utilis´ e, en particulier pour aborder l’endog´en´eit´ e de variables explicatives prenant la valeur 0 ou 1 dans des mod`eles `a coefficients variables yi = λi I i + vi Ce type de mod`ele est souvent utilis´e pour aborder l’´evaluation des effets micro´economiques des politiques de l’emploi comme les stages de formations. Dans le chapitre 13, on s’int´ eresse `a l’´evaluation des politiques publiques. On introduit notamment l’estimateur par diff´erence de diff´erences qui s’applique `a une exp´erience naturelle. On parle d’exp´erience naturelle lorsqu’une partie de la population a fait l’objet d’une nouvelle politique, tandis qu’une autre partie de la population n’a pas fait l’objet de cette politique et donc peut servir de population t´emoin. On ne peut observer le comportement des individus touch´ es par une mesure s’ils n’avaient pas ´et´e touch´es, on verra comment on peut n´eanmoins construire des estimateurs ´evaluant l’impact d’une nouvelle p olitique.
Exercices 1. Lin´ earit´ e. Pour chacune des relations suivantes, proposer une transformation qui rende le mod`ele lin´eaire.
Y i = Y i = Y i =
1 β 1 + β 2 .X i X i β 1 + β 2 .X i 1 1 + eβ 1 +β 2 .Xi
(1.1) (1.2) (1.3)