Academia Academia de Studii Studii Economic Economicee Bucure Bucureș ti
Proiect econometrie
Problema A
Înre Înregi gist stra rați pent pentru ru 42 de unit unităăț i (jud (judeeț e), e), valo valori rile le spec specif ific icee ale ale unei unei pere perech chii de caracteristici ( și !) "ntre care e#istă o legătură logică$ %atele pre&entate su' forma ta'elară fac parte din lucrare$ 1.
Prez Prezen enta tare rea a prob proble lemei mei (inc (inclu lusi siv v descr descrie iere rea a natu naturi riii legăt legături uriii dint dintre re cele cele două două variabile, conform teoriei economice)
Se presu presupu pune ne că "n cadr cadrul ul prosu prosulu luii inte intern rn 'rut 'rut (B (B), ), "ntr "ntree venit venituri urile le tota totale le ale ale gospodăriilo gospodăriilorr și cheltuielil cheltuielilee totale ale ale acestora e#istă e#istă o dependen dependenț ă$ entru a se verifica verifica această această ipote&ă se "nregistrea&ă "nregistrea&ă următoarele date privind veniturile totale totale ale gospodăriilor gospodăriilor ș i cheltuielile totale totale ale acestora acestora "n "n anul 2**+ 2**+ pentru pentru cele 42 de unită unităț i teritorial teritorialee (județ e) ale ț ării
Nr.cr t. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Cheltuieli totale gospodarii
Judet
-icroregiunea . /ord 0est 0est
-icroregiunea . 1entru
-icroregiunea 2 /ord Est
-icroregiunea 2 Sud Est
-icroregiunea Sud -untenia
BH BN CJ MM SM SJ AB BV CV HR MS SB BC BT IS NT SV VS BR BZ CT GL TL VN AG CL DB GR IL PH TR
586.50 247.20 660.40 39 392.30 28 2 84.90 203.30 324.40 558.70 181.60 295.80 463.70 412.90 576.90 344.80 630.70 414.40 545.70 327.30 271.90 414.70 758.40 493.30 212.30 353.50 534.40 204.30 371.70 180.70 194.20 646.10 298.70
Venituri totale gospodarii 567.90 239.60 615.40 385.40 278.70 197.30 319.10 549.40 174.50 276.20 456.60 400.80 560.60 340.00 610.30 402.60 541.20 323.50 262.90 412.20 693.90 489.90 198.80 350.70 527.10 197.90 368.50 177.10 186.60 633.10 295.80
Numarul mediu al salariatilor de sex masculin 76 28 89 49 35 21 44 84 24 28 65 54 63 26 81 46 52 28 34 44 99 70 23 26 74 23 45 18 23 96 31
.
Înre Înregi gist stra rați pent pentru ru 42 de unit unităăț i (jud (judeeț e), e), valo valori rile le spec specif ific icee ale ale unei unei pere perech chii de caracteristici ( și !) "ntre care e#istă o legătură logică$ %atele pre&entate su' forma ta'elară fac parte din lucrare$ 1.
Prez Prezen enta tare rea a prob proble lemei mei (inc (inclu lusi siv v descr descrie iere rea a natu naturi riii legăt legături uriii dint dintre re cele cele două două variabile, conform teoriei economice)
Se presu presupu pune ne că "n cadr cadrul ul prosu prosulu luii inte intern rn 'rut 'rut (B (B), ), "ntr "ntree venit venituri urile le tota totale le ale ale gospodăriilo gospodăriilorr și cheltuielil cheltuielilee totale ale ale acestora e#istă e#istă o dependen dependenț ă$ entru a se verifica verifica această această ipote&ă se "nregistrea&ă "nregistrea&ă următoarele date privind veniturile totale totale ale gospodăriilor gospodăriilor ș i cheltuielile totale totale ale acestora acestora "n "n anul 2**+ 2**+ pentru pentru cele 42 de unită unităț i teritorial teritorialee (județ e) ale ț ării
Nr.cr t. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
Cheltuieli totale gospodarii
Judet
-icroregiunea . /ord 0est 0est
-icroregiunea . 1entru
-icroregiunea 2 /ord Est
-icroregiunea 2 Sud Est
-icroregiunea Sud -untenia
BH BN CJ MM SM SJ AB BV CV HR MS SB BC BT IS NT SV VS BR BZ CT GL TL VN AG CL DB GR IL PH TR
586.50 247.20 660.40 39 392.30 28 2 84.90 203.30 324.40 558.70 181.60 295.80 463.70 412.90 576.90 344.80 630.70 414.40 545.70 327.30 271.90 414.70 758.40 493.30 212.30 353.50 534.40 204.30 371.70 180.70 194.20 646.10 298.70
Venituri totale gospodarii 567.90 239.60 615.40 385.40 278.70 197.30 319.10 549.40 174.50 276.20 456.60 400.80 560.60 340.00 610.30 402.60 541.20 323.50 262.90 412.20 693.90 489.90 198.80 350.70 527.10 197.90 368.50 177.10 186.60 633.10 295.80
Numarul mediu al salariatilor de sex masculin 76 28 89 49 35 21 44 84 24 28 65 54 63 26 81 46 52 28 34 44 99 70 23 26 74 23 45 18 23 96 31
.
32 33 34 35 36 37 38 39 40 41 42
-icroregiunea Bucuresti lfov -icroregiunea 4 Sud0est 3ltenia -icroregiunea 4 0est
B
3155.10
2937.70
408
IF
333.40
295.10
39
DJ GJ MH OT VL AR CS HD TM
526.10 307.20 226.70 327.40 328.20 429.50 301.30 432.10 728.20
509.00 302.00 224.70 323.40 320.30 391.30 300.60 422.40 716.90
63 49 26 37 43 58 32 63 96
e 'a&a datelor pro'lemei se poate construi un model econometric de forma 5 f (#) 6 u unde repre&intă valorile reale ale varia'ilelor dependente, # 7 valorile reale ale varia'i varia'ilel lelor or independe independente nte ș i u 7 varia'il varia'ilaa re&idual re&idualăă (influen (influenț a celorla celorlallț i factori ai varia'il varia'ilei ei , nespecifica nespecificați "n model, care care au influenț e nesemnificati nesemnificative ve asupra varia'ilei varia'ilei )$ )$ În acest ca&, anali&8nd datele din ta'el, se pot specifica varia'ilele astfel # repre&intă veniturile totale ale gospodăriilor și este varia'ila endogenă (factorială), fiind considerată ipote&a de lucru cu influe influennța cea mai puterni puternică că asupra asupra varia'il varia'ilei ei 9 "n timp ce repre&i repre&intă ntă numărul numărul mediu mediu al salari salariaaților ilor de se# masculin masculin și este varia'ila varia'ila e#ogenă e#ogenă (re&ulta (re&ultativ tivă), ă), ale căror valori valori depind de mai mul mulți factori (veniturile totale ale gospodăriilor etc$) etc$) 2.
Defini Definirea rea modelu modelului lui de regr regresi esiee simpl simplă ă liniar liniară ă
-ode -odelu lull de regres regresie ie lini liniar arăă repre repre&i &int ntăă o ecua ecuaț ie sau o seri seriee de ecua ecuaț ii care e#pri e#primă mă depende dependennța varia'il varia'ilelo elorr comple#e comple#e de un ansam'lu ansam'lu de factori factori care acț ionea& ionea&ăă "n acelaș i sens sau "n sensur sensurii diferi diferite$ te$ Astfe Astfel,l, modelu modelull de regres regresie ie simplă simplă liniară liniară (unifact (unifactori orială ală)) are "n vedere vedere depende dependennța dintre dintre varia'il varia'ilaa (varia (varia'il 'ilăă endogen endogenăă sau factoria factorială) lă) ș i varia'i varia'ila la ! (varia' (varia'ilă ilă e#ogenă sau re&iduală)$
2.1. Forma, variabilele ș i parametrii modelului de regresie
2
:n model de regresie simplă liniară poate fi e#primat prin următoarea ecuaț ie !5 ;o 6 ;. 6 < unde ! repre&i repre&intă ntă varia'i varia'ila la endogen endogenăă sau re&ult re&ultati ativă, vă, ;o și ;. repre&intă parametrii ecuației de regresie regresie ș i < repre&intă componenta re&iduală (eroare aleatoare)$ %intre acestea ;o este punctul de intersecție al dreptei de regresie cu a#a 3, iar ;. este panta dreptei, care se mai numește coeficient coeficient de regresie, regresie, care arată arată cu c8te unităț i se modifică modifică ! dacă se modifică modifică cu o unitate$ Așa cu cu am am me menționat ș i ma mai su sus, varia'ilele "n acest ca& sunt veniturile totale ale gospod gospodări ăriilo ilorr () = varia'i varia'ilă lă endogenă endogenă (factorial (factorială), ă), ș i numărul numărul mediu al salari salariaaț ilor ilor de se masculin (!) = varia'ilă e#ogenă (re&ultativă)$
2.2 eprezentarea grafică a modelului legăturii dintre variabile
Legatura dintre cheltuielile totale ale gospodariilor si veniturile acestora in anul 2005, in cele 42 de judete 3500.00 3000.00 2500.00
f!" $ 1.08! % 16.91 R& $ 1
2000.00
Cheltuielile gospodariilor 1500.00 1000.00 500.00 0.00 0.00 00
1000 1000.0 .000 2000 2000.0 .000 3000 3000.0 .000 4000 4000.0 .000
Veniturile gospodariilor
!.
"stimarea parametrilor modelului ș i interpretarea acestora
!.1. "stimarea punctuală a parametrilor
-odelul de regresie simplă liniară "n eșantion este i 5 ;* 6 ; .#i 6
cu i 5 ; * 6 ; .#i unde ; * și ; . sunt parametrii funcției de regresie, iar i =
repre&intă valorile teoretice ale varia'ilei y o'?inute numai "n func?ie de valorile factorului esen?ial x @i valorile estimatorilor parametrilor ;* @i ;. 4
În mod concret, -$1$-$-$$ constă "n a minimi&a func?ia 2 2 2 F ( β 0 , β 1 ) =min ∑ ε i = min ∑ ( y i− ŷ i ) =min ∑ ( y i− β 0− β 1 x i )
Sistem pentru modelul de regresie unifactorială n;* 6 ;. t 5 ! t ;* t 6 ;. 2t 5 t ! n 5 42 42 ;* 6 ;. .CDDD 5 .4C*$ ;* .CDDD 6 ;. .+F+F++C$C 5 .F+.C.D.$.
;* 5 (.4C*$ 7 .CDDD ;.) G 42 .CDDD .4C*$ 7 .CDDD .CDDD ;* 6 .+F+F++C$C ;* 42 5 42 .F+.C.D.$. F+D2C+$ 7 +2+D+D2 ;* 6 F+D+D+4DD$.F ;* 5 FDF.CD$4F 7 +2+D+D2 ;* 5 2DD*2C$.F ;* 5 2DD*2C$.F G 7 +2+D+D2 ;* 5 = .F$.. 42 ;. 6 .CDDD ;* 5 .4C*$ 42 ;. 6 .CDDD (= .F$..) 5 .4C*$ 42 ;. = .D+D$C4D 5 .4C*$ ;. 5 .$*D+ ;* 5 = .F$.. ;. 5 .$*D+ ŷ i=−16.911 + 1.075∗ xi
I'()*+),( V)'-(*- (/() /,/*-1"
Coefcients %16.91096306 1.075313439
+
!.2 "stimarea parametrilor prin interval de #ncredere
a) parametrul ;o '* 7 &G2,n=2 S0 ;o '* 6 &G2,n=2 S0 %16.911 : 2.021 2.954 ;* %16.911 ; 2.021 2.954 %10.94 ;o %22.88 Lower 95% % 22.882708 07
1.065532 563
Upper 10.939218
1.085094
') parametrul ;. F
'. 7 &G2,n=2 S1 ;. '. 6 &G2,n=2 S1 .$*D+ 7 2$*2. *$**4C ;. .$*D+ 6 2$*2. *$**4C .$*F+ ;. 1.084 Lower 95%
Upper 95%
% 22.88270 807 1.065532 563
% 10.93921 805 1.085094 315
$.
%estarea semnificaț iei corelaț iei ș i a parametrilor modelului de regresie
$.1. %estarea semnificaț iei corelaț iei
Hestarea semnificației corelației cuprinde mai multe etape a) calcularea coeficientului de corelaț ie r =
∑ x y − ∑ x ⋅ ∑ y = [n∑ x − ( ∑ x ) ][n∑ y − ( ∑ y ) ] n 2 i
=
i
i
i
2
i
i
2 i
2
i
42 ⋅ .F+.C.D.,. − .CDDD ⋅ .E4C*,E
[ 42 ⋅ .+F+F++C,EC − +2+D+D2E ][ 42 ⋅ .D4E+D,F − DE+*+4F4 ,C.]
= *,EEE+
%eoarece r 5 *,+ (po&itiv ș i apropiat de .) putem afirma că "ntre cele două varia'ile e#istă o legătură puternică$
M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
Regression Statistics
0.999595157 0.999190478 0.99917024 13.0412831 42
') testarea semnificației coeficientului de corelaț ie D
et$. se sta'ilește ipote&a nulă I* r 5 * (coeficientul este semnificativ statistic) et$2 se sta'ilește ipote&a alternativă I. r
≠
* (coeficientul nu este semnificativ statistic)
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 se calculea&ă valoarea testului, folosindu=se testul t t r =
r s r
=
r n − 2 . − r 2
=
*,EEE ⋅ 4* . − *,EEE 2
= .4.,.+
et$+ se determină valoarea critică tcritic 5 t,n=25 2,*2. tcalculatJtcritic @ se neagă ipote&a nulă et$F se desprind conclu&ii entru o pro'a'ilitate de +K, e#istă suficiente dove&i statistice pentru a aprecia că r, coeficientul de corelaț ie, este semnificativ statistic$ c) determinarea raportului de corelaț ie
C
y
¿
y ¿ i−´¿
¿ ¿2 ¿ y
y i− ´¿
¿ ¿2 ¿ ¿ ¿ ∑¿
∑ ( y − ŷ ) ∗¿ R =1− ∑ ( y − y´ ) 2
i
2
2
i
%eoarece L 5 *,. (po&itiv ș i apropiat de .) putem afirma că "ntre cele două varia'ile e#istă o legătură liniară, puternică ș i directă$ Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999595157 0.999190478 0.99917024 13.0412831 42
d) testarea raportului de corelaț ie Hestarea raportului de corelaț ie se reali&ea&ă cu testul M (Misher) F calc =
R)*)-/' R)- T/(
R 2 . − R 2
⋅
n − k − . k
=
*,EEE.
⋅
4*
. − *,EEE. .
= 4EDC,*2
d
SS
1
8396926.227
40
6803.002594
41
8403729.23
MS 8396926.22 7 170.075064 9
F 49371.88 314
unde N repre&intă numărul de varia'ile e#ogene$ Mcalculat 5 4DC,*2 J Mcritic 5 4,*C entru o pro'a'ilitate de +K putem afirma că L, raportul de corelaț ie, este semnificativ diferit de *$
$.2. %estarea parametrilor unui model de regresie simplu
a) parametrul ;o et$. se sta'ilește ipote&a nulă I* ;o 5 * et$2 se sta'ilește ipote&a alternativă I* ;o
≠
*
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 deoarece n J *, se aplică testul O et$+ se calculea&ă indicatorii 2 . . x 44D,*D 2 = .,*4. ⋅ + sb * = se + = 2 n 42 D2F.CEC , DD ( xi − x) ∑ i
2,++ I'()*+),( V)'-(*- (/() /,/*-1"
Coefcients %16.91096306
Standard Error 2.954736394
1.075313439
0.004839441
.*
Se
¿
√
❑ n −2 5
√
6803,01
5 .,*4.
40
Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999595157 0.999190478 0.99917024 13.0412831 42
et$F se calculea&ă valoarea testului z calc =
b* − µ sb *
=
b* − * s b *
=
b* s b *
=
− .F,E.. 2,E++
I'()*+),( V)'-(*- (/() /,/*-1"
= −+$D22
Coefcients %16.91096306
Standard Error 2.954736394
t Stat %5.7233407
1.075313439
0.004839441
222.1978468
et$D se determină valoarea critică &critic 5 &G2,n=2 5 2,*2. @ &critic J &calc @ se acceptă ipote&a nulă (I*) et$C se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a afirma că estimatorul '* provine dintr=o populaț ie cu ;o 5 *, deci este nesemnificativ statistic$ et$ intervalul de "ncredere '* 7 &G2,n=2 S0 ;o '* 6 &G2,n=2 S0 =.F,.. 7 2,*2. P 2,++ Q ;o Q =.F,.. 6 2,*2. P 2,++ %2288 ;o =.*, ') parametrul ;. ..
et$. se sta'ilește ipote&a nulă I* ;. 5 * et$2 se sta'ilește ipote&a alternativă ≠
I* ;.
*
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 deoarece n J *, se aplică testul O et$+ se calculea&ă indicatorii Sc
=
n
( x −´ x ) ∑ =
S '. 5
2
13,041
√ 7261898,77
i
5 *,**4C4
i 1
I'()*+),( V)'-(*- (/() /,/*-1"
Se
¿
√
❑ n −2 5
√
6803,01 40
Coefcients %16.91096306
Standard Error 2.954736394
1.075313439
0.004839441
5 .,*4.
Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999595157 0.999190478 0.99917024 13.0412831 42
.2
et$F se calculea&ă valoarea testului z calc =
b. − µ s b.
=
b. − * s b.
=
b. s b.
=
.,*D+ *,**4C4
I'()*+),( V)'-(*- (/() /,/*-1"
= 222,.D
Coefcients %16.91096306
Standard Error 2.954736394
t Stat %5.7233407
1.075313439
0.004839441
222.1978468
et$D se determină valoarea critică &critic 5 &G2,n=2 5 2,*2. @ &critic J &calc @ se respinge ipote&a nulă (I*) și se acceptă ipote&a alternativă (I.) et$C se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a afirma că ≠
estimatorul '. provine dintr=o populaț ie cu ;o *, deci este semnificativ statistic$ et$ intervalul de "ncredere '. 7 &G2,n=2 S1 ;o '. 6 &G2,n=2 S1 .,*D+ 7 2,*2. *,**4C4 ;o .,*D+ 6 2,*2. *,**4C4 .,*F+ Q ;o Q .,*C+
&.Aplicarea analizei de tip A'A pentru validitatea modelului de regresie simplu ș i interpretarea rezultatelor
.
0erificarea verosimilită?ii modelului se face cu ajutorul anali&ei dispersionale (anali&a varia?iei)$
Sursa de varia?ie
-ăsura varia?iei
0arian?a dintre grupe
V = 2 x
n
∑ ( y> i − y )
/r$ grade de li'ertate 2
i =.
k = .
= CEFD.F,4
0arian?a re&iduală
n
∑ ( y
i
− Y i )
2
∑ ( y
− y)
2
V = 2 u
n − k − . = 4*
i =.
= FC*,*.
0arian?a totală
V *2 =
n
i
n − . = 4.
i =.
%ispersii corectate s
2 Y G X
=
V x2
k = CEFD.F,4
0aloarea testului RM F c
F α 9 v. 9 v2
2
F c =
sY G X 2
su>
F *, *+9.9 4* = +,2
= 4ED*,FFD
F *, *.9.9 4* = ..,
n − k − . = .D*,*D+
=
=
=
=
=
V u2
s = 2 u>
= C4*D2E,2
I* ipote&a nulă I. ipote&a alternativă Se aplică testul MSIEL F calc =
sY 2 G X s e2
CEFD.F,4
5
G .D*,*D+ 5 4D*,FFD .4
McalcJMcritic @ 4D*,FFD J 4 re&ultă că se respinge ipote&a I* si se acceptă I.$ entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a aprecia că modelul de regresie este valid, iar "ntre cele două varia'ile e#istă o legătură$
*. %estarea ipotezelor clasice asupra modelului de regresie simplă *.1. +poteze statistice clasice asuprta modelului de regresie simplă
pote&a . Morma func?ională yi = β * + β . xi + ε i = y> i + ε i
@ forma se respectă, "n acest ca& fiind y> = −.F,.. +1,075 ⋅ x
pote&a 2 -edia erorilor este * ε = *
pote&a Iomoscedasticitatea @ dispersia re&iduurilor "n populație este constantă pentru toate valorile #i σ ε 2 = cst ∀i = ., n
pote&a 4 /on=autocorelarea erorilor @ deviațiile o'servațiilor de la valorile lor aș teptate sunt necorelate Cov(ε i , ε j ) = * ∀ i ≠ j
pote&a + /ecorelare "ntre regresor ș i erori @ varia'ila # nu este influențată de eroarea oricărei o'servaț ii ε i T N (*, σ 2 )
pote&a F 0aria'ila aleatoare este normal distri'uită .+
*.2. %estarea liniaritaț ii modelului propus
a) calcularea coeficientului de corelație et$. se sta'ilește ipote&a nulă I* legătura dintre varia'ile este liniară et$2 se sta'ilește ipote&a alternativă I. legătura dintre varia'ile nu este liniară et$ se determină pragul de semnificație 5 *,*+ 5 +K
et$4 se calculea&ă indicatorii (calculați și la punctul 4$.)
r =
∑ x y − ∑ x ⋅ ∑ y = [n∑ x − ( ∑ x ) ][n∑ y − ( ∑ y ) ] n 2 i
=
i
i
i
2
i
i
2 i
2
i
42 ⋅ .F+.C.D.,. − .CDDD ⋅ .E4C*,E
[ 42 ⋅ .+F+F++C,EC − +2+D+D2E ][ 42 ⋅ .D4E+D,F − DE+*+4F4 ,C.]
= *,EEE+
%eoarece r 5 *,+ (po&itiv ș i apropiat de .) putem afirma că "ntre cele două varia'ile e#istă o legătură puternică$ Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999595157 0.999190478 0.99917024 13.0412831 42
') testarea semnificației coeficientului de corelație (reali&ată și la punctul 4$.) et$. se sta'ilește ipote&a nulă .F
I* r 5 * (coeficientul nu este semnificativ statistic) et$2 se sta'ilește ipote&a alternativă I. r ≠ * (coeficientul nu este semnificativ statistic) et$ se determină pragul de semnificație 5 *,*+ 5 +K )(.4 ) ++)Eă ?/*) ()(- f//-'%) ()( Z -()* z r=
r r √ n−2 0,9995 ∙ √ 40 = = =200,170 S r √ 1 −r 2 √ 1−0,99952
et$+ se determină valoarea critică &critic 5 &,n=25 .,F* &calculatJ&critic @ se neagă ipote&a nulă et$F se desprind conclu&ii entru o pro'a'ilitate de +K, e#istă suficiente dove&i statistice pentru a aprecia că r, coeficientul de corelație, este semnificativ statistic$
.!. "estarea normalit#$ii erorilor
et$. se sta'ilește ipote&a nulă I* distri'uția erorilor este normală et$2 se sta'ilește ipote&a alternativă I. distri'uția erorilor nu este normală et$ se determină pragul de semnificație 5 *,*+ 5 +K
et$4 se determină valoarea calculată cu ajutorul testului UaVue=Bera
.D
UB 5 n
[
S
2
6
+
(k − 3)2 24
]
5 42
[
2
177119,48 ( 2− 3) + 6 24
]
5 .2CC$..
et$+ se determină valoarea critică JB J W 2 α k
1ondiția de normalitate a erorilor este ca valorile re&iduale (Lesiduals) să se "ncadre&e "n intervalul %(()* X S) (()* X S)" %26355 26355"
Se o'servă că nu e#istă a'ateri de la trend=ul liniar, astfel e#istă suficiente dove&i statistice pentru a afirma că erorile sunt normal distri'uite "n pre&enta situație, accept8ndu=se astfel ipote&a nulă$ *.$. %estarea ipotezei de omoscedasticitate
et$. se sta'ilește ipote&a nulă I* ;* 5 ;. 5 $$$ 5 ;N 5 *, (homoscedasticitate) et$2 se sta'ilește ipote&a alternativă I. ;* 5 ;. 5 $$$ 5 ;N *, (heteroscedasticitate) et$ se determină pragul de semnificație .C
5 *,*+ 5 +K
et$4 se folosește testul Yhite (Z-) 2 Z- 5 n R 5 42 *,. 5 4.$F22
Z- J W 2 α k
entru o pro'a'ilitate de +K esistă suficiente dove&i statistice pentru a afirma că modelul de regresie este heteroscedastic, adică ;N [ *, resping8ndu=se ipote&a nulă$ *.&. %estarea ipotezei de autocorelare a erorilor
et$. se sta'ilește ipote&a nulă I* autocorelarea erorilor nu e#istă et$2 se sta'ilește ipote&a alternativă I. autocorelarea erorilor e#istă et$ se determină pragul de semnificație 5 *,*+ 5 +K
et$4 se folosește testul %ur'in=Yatson (%Y) n
∑ ( e −e − ) = i
DW =
2
i 1
i 1
n
e ∑ =
2
=
18606668,94 =0,1067 174322770,63
i
i 1
@ re&ultă %Yta'elar ta'elului %ur'in=Yatson, astfel dl5.,.D și d:5.,C$
.
Astfel 47 dl 5 2,C* 47 d: 5 2,F*2 \*9dl] 5 \*9.,.D] @ &onă de respingere = autocorelare po&itivă, \dl9du] 5 \.,.D9.,C] @ &onă de indeci&ie, \du94=du] 5 \.,C92,F*2] @ &onă de acceptare a ipote&ei nule (I*), \4=du94=dl] 5 \2,F*292,C*] @ &onă de indeci&ie, \4=dl9∞] 5 \2,C*9∞] @ &onă de respingere = autocorelare negativă$ @ %Ycalc se află in &ona de respingere, astfel pentru o pro'a'ilitate de +K e#istă suficiente
dove&i statistice pentru a afirma că autocorelarea erorilor e#istă, accept8ndu=se ipote&a alternativă$ -. Previziunea valorii variabilei dacă variabila / creș te cu 10 faț ă de ultima valoare #nregistrată (inclusive interval de #ncredere) pentru toate variantele cunoscute
%acă varia'ila # crește cu .*K fata de ultima valoare inregistrată, se va studia modul "n care se va modifica 42, dacă #42 crește cu .*K, și va re&ulta #4 5 #42 (.6*,.) 5 D.F$* .,. 5 DCC,+ Astfel, pentru un județ cu veniturile totale ale gospodăriilor de DCC,+ ecuația modelului de regresie va fi ^ 4 5 .,*D+ DCC,+ 7 .F,.. 5 C.$*F*C2D 2*
ntervalul de "ncredere pentru valoarea previ&ionată x
xn −1 −´¿
¿ ¿2 ¿
n
¿ ∑ ( x i−´ x )2 i =1
¿ x
xn −1 −´¿
¿ ¿2 ¿ ¿ ¿ 1 +¿ n
ŷ 43 − z α 2
∗S e∗√ ¿
, n−2
C.,*F 7 2,*2. .,*4
√
√
1 43
+
358,69 7375821,26
≤
y 43 ≤
C.,*F 6 2,*2. .,*4
1 358,69 + 43 7375821,26
C2D$*4 ≤ y 43 ≤ C+$*C entru un județ cu veniturile totale ale gospodăriilor de DCC,+, veniturile totale ale gospodariilor aferente vor fi cuprinse "ntre C2D,*4 si C+,*C$
2.
Problema 1. Definirea modelului de regresie multiplă liniară
-odelul de regresie liniară repre&intă o ecuaț ie sau o serie de ecuaț ii care e#primă dependența varia'ilelor comple#e de un ansam'lu de factori care acț ionea&ă "n acelasi sens sau "n sensuri diferite$ Astfel, modelul de regresie multiplă liniară are "n vedere relaț ia dintra varia'ila dependentă (varia'ilă endogenă, e#plicată, re&ultativă) ș i o mulț ime de varia'ile independente (varia'ile e#ogene, e#plicative)$ -odelul de regresie multiplă liniară se 'a&ea&ă pe modelul general de regresie, dar permite mai multe varia'ile dependente simultan$ 1.1.
Forma, variabilele, parametrii modelului de regresie multiplă
:n model de regresie multiplă liniară poate fi e#primat prin următoarea ecuaț ie 5 f (# j) 6 < unde repre&inta varia'ila endogenă, f (# j) este funcția de regresie$ %e asemenea # j repre&intă varia'ilele e#ogene (factoriale sau cau&ale)$ -odelul liniar multifactorial, la nivelul colectivită?ii generale, are forma
yi = b* + b. xi. + b2 xi 2 + ε i
cu i = ., n
Za nivelul eșantionului modelului de regresie multiplă "n acest ca&
1.2.
eprezentarea grafică a modelului legăturii dintre variabile
22
Legatura dintre cheltuielile totale ale gospodariilor si veniturile acestora in anul 2005, in cele 42 de judete 3500.00 3000.00
f!" $ 1.08! % 16.91 R& $ 1
2500.00 2000.00
Cheltuielile gospodariilor 1500.00 1000.00 500.00 0.00 0.0 0
1000.00 2000.00 3000.00 4000.00
Veniturile gospodariilor
Legatura dintre cheltuielile totale ale gospodariilor si numarul mediu al salariatilor de sex masculin in anul 2005, in cele 42 de judete 3500.00 3000.00 2500.00
f!" $ 7.48! ; 34.3 R& $ 0.99
2000.00
Cheltuielile gospodariilor 1500.00 1000.00 500.00 0.00 0 50 100 150 200 250 300 350 400 450
Numarul mediu al salariatilor de sex masculin
2
2. "stimarea parametrilor modelului ș i interpretarea acestora 2.1. "stimarea punctuală a parametrilor
-odelul de regresie multiplă liniară are in vedere sta'ilirea funcț iei de regresie _#.,#2,i 5 '* 6 '.#i 6 '2#2i unde '* și '. sunt parametrii funcției de regresie, iar < este valoarea re&iduală$ Sistemul de ecua?ii pentru determinarea estimatorilor b0 , b1 @i b2 este
24
n n n nb* + b. ∑ xi. + b2 ∑ xi 2 = ∑ yi n i =. n i =. n i =. n 2 b* ∑ xi. + b. ∑ xi. + b2 ∑ xi. xi 2 = ∑ xi. yi i =. i =. i =. in=. n n b x + b x x + b x 2 = n x y ∑ i2 . ∑ i. i 2 2 ∑ i2 i2 i * ∑ i =. i =. i =. i =.
Av8nd la 'a&ă sistemul de ecuații anterior se o'ț ine cu ajutorul programului E#cel următoarele valori I'()*+),( V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
Coefcients %15.00563133 1.029526202 0.323134285
'* 5 =.+$**+F. '. 5 .$*2+2F2*2 '2 5 *$2.42C+
2+
În acest ca& ecuaț ia de regresie are forma 5 =.+$**+F. 6 .$*2+2F2*2 # . 6 *$2.42C+ #2 2.2. "stimarea parametrilor prin interval de #ncredere
Coefcients
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202
0.323134285
Lower 95%
Upper 95%
% 21.772044 31 0.9512742 8 % 0.2248207 41
% 8.239218 357 1.107778 123 0.871089 312
entru estimarea parametrilor prin intervalul de "ncredere este nevoie de erorile standard ale varia'ilelor
Coefcients
Standard Error
2F
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202 0.323134285
3.3452530 53 0.0386870 38 0.2709039 83
S '* 5 $4+2+*+ S '. 5 *$*CFCD*C S '2 5 *$2D**C a) parametrul ;*
'* 7 &G2,n=2 S0 ;o '* 6 &G2,n=2 S0 =.+$**+F. 7 2,*2. $4+2+*+ ;o =.+$**+F. 6 2,*2. $4+2+*+ =2.$DF. ;o %8.24079 ') parametrul ;. '. 7 &G2,n=2 S1 ;. '. 6 &G2,n=2 S1 .$*2+2F2*2 7 2,*2. *$*CFCD*C ;. .$*2+2F2*2 6 2,*2. *$*CFCD*C *$+.4+*C ;. .$.*D+42 c) parametrul ;2 '2 7 &G2,n=2 S2 ;2 '2 6 &G2,n=2 S2 *$2.42C+ 7 2,*2. *$2D**C ;2 *$2.42C+ 6 2,*2. *$2D**C =*$224F+C ;2 0.8708898 !. %estarea semnificaț iei corelaț iei ș i a parametrilor regresiei modelului de regresie multiplă !.1 %estarea semnificaț iei corelaț iei multiplă
a) 1alcularea coeficientului de corelaț ie y i −´ y
∑ ( ŷ − y´ ) ∑ (¿) =0,9996 2
ij
2
r x 1, x 2=√ ¿
%eoarece L 5 *,F (po&itiv ș i apropiat de .) putem afirma că "ntre varia'ile e#istă o legătură puternică$
2D
Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999609409 0.999218971 0.999178918 12.97290604 42
') Hestarea semnificației coeficientului de corelaț ie et$. se sta'ilește ipote&a nulă I* r 5 * (coeficientul este semnificativ statistic) et$2 se sta'ilește ipote&a alternativă I. r
≠
* (coeficientul nu este semnificativ statistic)
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 se calculea&ă valoarea testului, folosindu=se testul O 'ilateral z r=
r r √ n−2 0,9996 ∙ √ 40 = = =225.785 S r √ 1 −r 2 √ 1−0,99962
et$+ se determină valoarea critică tcritic 5 t,n=25 2,*2. tcalculatJtcritic @ se neagă ipote&a nulă et$F se desprind conclu&ii entru o pro'a'ilitate de +K, e#istă suficiente dove&i statistice pentru a aprecia că r, coeficientul de corelaț ie, este semnificativ statistic$ c) %eterminarea raportului de corelaț ie 2C
y
¿
y ¿ i−´¿
¿ ¿2 ¿ y
y i− ´¿
¿ ¿2 ¿ ¿ ¿ ∑¿
∑ ( y − ŷ ) ∗¿ R =1− ∑ ( y − y´ ) 2
i
2
2
i
Regression Statistics M(-,) R R S<*) A=() R S<*)
0.999609409 0.999218971 0.999178918
2
%eoarece R 5 *,2 (po&itiv și apropiat de .) putem spune că "ntre cele două varia'ile e#istă o legătură liniară, puternică ș i directă$ d) Hestarea raportului de corelaț ie Hestarea raportului de corelaț ie se reali&ea&ă cu testul M (Misher) F calc =
R 2 . − R
2
⋅
n − k − . k
=
*,EEE2 . − *,EEE2
⋅
4* .
= 24E4D,++
unde N repre&intă numărul de varia'ile e#ogene$ Mcalculat 5 244D,++ J Mcritic 5 ,22 entru o pro'a'ilitate de +K putem afirma că L, raportul de corelaț ie, este semnificativ diferit de *$ 2
!.2 %estarea parametrilor modelului de regresie multiplă
a) parametrul ;o et$. se sta'ilește ipote&a nulă I* ;o 5 * et$2 se sta'ilește ipote&a alternativă I* ;o
≠
*
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 deoarece n J *, se aplică testul O 'ilateral et$+ se calculea&ă indicatorii Se5 .2,D Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/*
0.999609409 0.999218971 0.999178918 12.97290604
S '* 5 ,4+ I'()*+),(
Coefcients %15.00563133
Standard Error 3.3452530 53
*
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202 0.323134285
0.0386870 38 0.2709039 83
et$F se calculea&ă valoarea testului z calc =
b* − µ s b *
=
b* − * s b *
=
b* s b *
=
− .+,**+ ,4+
= −4,4C+
Coefcient
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202 0.323134285
Standard Error
t Stat
3.34525305 3 0.03868703 8 0.27090398 3
et$D se determină valoarea critică &critic 5 &G2,n=2 5 2,*2. @ &critic J &calc @ se acceptă ipote&a nulă (I*) et$C se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a afirma că estimatorul '* provine dintr=o populaț ie cu ;o 5 *, deci este nesemnificativ statistic$
') parametrul ;.
et$. se sta'ilește ipote&a nulă I* ;. 5 * et$2 se sta'ilește ipote&a alternativă I* ;.
≠
* .
% 4.4856490 96
26.611657 08 1.1928000 53
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 deoarece n J *, se aplică testul O 'ilateral et$+ se calculea&ă indicatorii Se5 .2,D2 Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999609409 0.999218971 0.999178918 12.97290604 42
S '. 5 *,*C
Coefcients
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202 0.323134285
Standard Error 3.3452530 53 0.0386870 38 0.2709039 83
et$F se calculea&ă valoarea testului z calc =
b. − µ s b.
=
b. − * s b.
=
b. s b.
=
.2,ED2 *,*C
= 2F,F..
Coefcients
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1"
1.029526202
Standard Error 3.3452530 53 0.0386870 38
t Stat % 4.485649 096 26.61165 708
2
N* )- *-(-/* ) )! +-' 2"
0.2709039 83
0.323134285
1.192800 053
et$D se determină valoarea critică &critic 5 &G2,n=2 5 2,*2. @ & critic X &calc @ se respinge ipote&a nulă (I*) și se acceptă ipote&a alternativă (I.) et$C se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a afirma că ≠
estimatorul '. provine dintr=o populaț ie cu ;o *, deci este semnificativ statistic$ c) parametrul ;2
et$. se sta'ilește ipote&a nulă I* ;2 5 * et$2 se sta'ilește ipote&a alternativă I. ;2
≠
*
et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 deoarece n J *, se aplică testul O 'ilateral et$+ se calculea&ă indicatorii Se 5 .2,D Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/*
0.999609409 0.999218971 0.999178918 12.97290604
S '2 5 *,2D.
0.323134285
Standard Error 3.3452530 53 0.0386870 38 0.2709039 83
Standard Error
t Stat
Coefcients
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202
et$F se calculea&ă valoarea testului z calc =
b − µ s b 2
=
b. − * s b 2
=
b2 s b 2
=
.2,ED *,2D.
= .,.E
Coefcients
I'()*+),(
%15.00563133
V)'-(*- (/() /,/*-- 1" N* )- *-(-/* ) )! +-' 2"
1.029526202 0.323134285
3.3452530 53 0.0386870 38 0.2709039 83
% 4.485649 096 26.61165 708 1.192800 053
et$D se determină valoarea critică &critic 5 &G2,n=2 5 2,*2. @ &critic J &calc @ se acceptă ipote&a nulă (I*) et$C se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a afirma că estimatorul '2 provine dintr=o populaț ie cu ;o5 *, deci este nesemnificativ statistic$ $. Aplicarea analizei de tip A'A pentru validitatea modelului de regresie multiplă și interpretarea rezultatelor
et$. se sta'ilește ipote&a nulă
4
I* modelul de regresie este valid et$2 se sta'ilește ipote&a alternativă I. modelul de regresie nu este valid et$ se determină pragul de semnificaț ie ∝
=0,05 =5
N 5 2, n=N=. 5 42=2=. 5 et$4 se aplică testul Misher et$+ se calculea&ă indicatorii n
sY 2 G X =
2 x
V
k
∑ ( y>
i
− y ) 2
i =.
=
=
k n
s e2 =
2 e
V
n − k − .
=
∑ ( y
i
− Y i )
i =.
n − k − .
CED.F+$FD 4 2
= 4.EC+C2,CD
2
=
F+F,+++ E
= .FC,2EF
d
R)*)-/'
SS 8397165.6 74 6563.5553 49 8403729.2 3
2
R)-
39
T/(
41
MS 4198582. 837 168.2962 91
et$F se calculea&ă valoarea testului 2
F calc =
sY G X 2
su>
=
4.EC+C2,CD .FC,2EF
= 24E4D,+FF
d
SS
MS
F
+
R)*)-/'
2
R)-
39
T/(
41
8397165. 674 6563.555 349 8403729. 23
4198582. 837 168.2962 91
24947.56 606
et$D se determină valoare critică F *,*+9.9 4* = 4,*C
Mcritic 5 Mcalc 5 4,*C @ Mcritic ˂ Mcalc @ se neagă ipote&a nulă (I*) @ varia'ila # are o influență semnificativă asupra varia'ilei et$C se desprin conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a aprecia că modelul de regresie este valid, iar "ntre cele două varia'ile e#istă o legătură$ &. %estarea ipotezelor clasice asupra modelului de regresie multiplă &.1 +poteze statistice clasice asupra modelului de regresie multiplă
a) ') c) d)
-odel liniar /ormalitatea erorilor Iomoscedasticitatea @ variația erorilor este constantă /on autocorelarea erorilor 1ov(
&.2 %estarea liniarităț ii modelului propus
a) 1alcularea coeficientului de corelație (reali&ată și la punctual $.) y i −´ y
∑ ( ŷ − y´ ) ∑ (¿) =0,9996 2
ij
2
r x 1, x 2=√ ¿
%eoarece L 5 *,F (po&itiv ș i apropiat de .) putem afirma că "ntre varia'ile e#istă o legătură puternică$
F
Regression Statistics M(-,) R R S<*) A=() R S<*) S('* >**/* O)*?(-/'
0.999609409 0.999218971 0.999178918 12.97290604 42
') Hestarea semnificației coeficientului de corelaț ie (reali&ată și la punctual $.) et$. se sta'ilește ipote&a nulă I* r 5 * (coeficientul este semnificativ statistic) et$2 se sta'ilește ipote&a alternativă I. r
≠
* (coeficientul nu este semnificativ statistic)
et$ se determină pragul de semnificație ∝
=0,05 =5
et$4 se calculea&ă valoarea testului, folosindu=se testul O 'ilateral z r=
r r √ n−2 0,9996 ∙ √ 40 = = =225.785 S r √ 1 −r 2 √ 1−0,99962
et$+ se determină valoarea critică tcritic 5 t,n=25 2,*2. tcalculatJtcritic @ se neagă ipote&a nulă et$F se desprind conclu&ii entru o pro'a'ilitate de +K, e#istă suficiente dove&i statistice pentru a aprecia că r, coeficientul de corelaț ie, este semnificativ statistic$ &.! %estarea normalităț ii erorilor
D
et$. se sta'ilește ipote&a nulă I* distri'uția erorilor este normală et$2 se sta'ilește ipote&a alternativă I. distri'uția erorilor nu este normală et$ se determină pragul de semnificație 5 *,*+ 5 +K
et$4 se determină valoarea calculată cu ajutorul testului UaVue=Bera UB 5 n
[
S
2
6
+
( k − 3)2 24
]
5 42
[
177119,48 6
+
( 2− 3)2 24
]
5 .2CC$..
et$+ se determină valoarea critică JB J W 2 α k
1ondiția de normalitate a erorilor este ca valorile re&iduale (Lesiduals) să se "ncadre&e "n intervalul %(()* S) (()* S)" %26355 26355" ・
・
Venituri totale gospodarii %&'( )esidual *lot 40 20
)esiduals
0 0.00 %20
500.00 1000.00 1500.00 2000.00 2500.00 3000.00 3500.00
%40
Venituri totale gospodarii %&'(
C
Numarul mediu al salariatilor de sex masculin %&2( )esidual *lot 40 30 20 10
)esiduals
0 %10
0
50
100
150
200
250
300
350
400
450
%20 %30
Numarul mediu al salariatilor de sex masculin %&2(
Se o'servă că e#istă a'ateri de la trend=ul linear, astfel e#istă suficiente dove&i statistice pentru a afirma că erorile nu sunt normal distri'uite in pre&enta situaț ie, resping8ndu=se astfel ipote&a nulă$ &.$. %estarea ipotezei de omoscedasticitate
et$. se sta'ilește ipote&a nulă I* ;* 5 ;. 5 $$$ 5 ;N 5 *, (homoscedasticitate) et$2 se sta'ilește ipote&a alternativă I. ;* 5 ;. 5 $$$ 5 ;N *, (heteroscedasticitate) et$ se determină pragul de semnificație 5 *,*+ 5 +K
et$4 se folosește testul Yhite (Z-) 2 Z- 5 n R 5 42 *,2 5 4.$FF4 Z- J W 2 α k
entru o pro'a'ilitate de +K esistă suficiente dove&i statistice pentru a afirma că modelul de regresie este heteroscedastic, adică ;N [ *, resping8ndu=se ipote&a nulă$
&.&. %estarea ipotezei de autocorelare a erorilor
et$. se sta'ilește ipote&a nulă I* autocorelarea erorilor nu e#istă et$2 se sta'ilește ipote&a alternativă I. autocorelarea erorilor e#istă et$ se determină pragul de semnificație 5 *,*+ 5 +K
et$4 se folosește testul %ur'in=Yatson (%Y) n
( e −e − ) ∑ = i
DW =
2
i 1
i 1
n
e ∑ =
2
=
14811 =2.2565 6563,56
i
i 1
@ re&ultă %Yta'elar ta'elului %ur'in=Yatson, astfel dl5.,.D și d:5.,C$
Astfel 47 dl 5 2,C* 47 d: 5 2,F*2 \*9dl] 5 \*9.,.D] @ &onă de respingere = autocorelare po&itivă, \dl9du] 5 \.,.D9.,C] @ &onă de indeci&ie, \du94=du] 5 \.,C92,F*2] @ &onă de acceptare a ipote&ei nule (I*), \4=du94=dl] 5 \2,F*292,C*] @ &onă de indeci&ie, \4=dl9∞] 5 \2,C*9∞] @ &onă de respingere = autocorelare negativă$ @ %Ycalc se află in &ona de acceptare, astfel pentru o pro'a'ilitate de +K e#istă suficiente
dove&i statistice pentru a afirma că autocorelarea erorilor nu e#istă, accept8ndu=se ipote&a nulă$ *. Previziunea valorii variabilei dacă variabila / creș te cu 10 faț ă de ultima valoare #nregistrată
%acă varia'ilele #. și #2 cresc cu .*K față de ultima valoare inregistrată, se va studia modul "n care se va modifica 42, dacă #.42 și #242 vor creș te cu .*K, și va re&ulta #.4 5 #.42 (.6*,.) 5 D.F, .,. 5 DCC$+ 4*
#24 5 #242 (.6*,.) 5 F .,. 5 .*+$F Astfel, pentru un județ cu veniturile totale ale gospodăriilor de DCC,+ si un număr de salariați de se# masculin de .*+,F, ecuaț ia modelului de regresie va fi ^ 45 =.+,**+F 6 .,*2+2 DCC,+ 6 *,2. .*+,F 5 C*$CF*D4C ntervalul de "ncredere pentru valoarea previ&ionată x
xn −1 −´¿
¿ ¿2 ¿
n
¿ ∑ ( x i−´ x )2 i =1
¿ x
xn −1 −´¿
¿ ¿2 ¿ ¿ ¿ 1 +¿ n
ŷ 43 − z α 2
∗S e∗√ ¿
, n−2
C*,CF 7 2,*2. .2,D
√
1 43
+
358,62 0
≤
y 43 ≤
C*,CF 6 2,*2. .2,D
1 358,62 + 43 0
C2F$C ≤
y 43 ≤
C4$C
entru un județ cu veniturile totale ale gospodăriilor de DCC,+ si un număr de salariaț i de se# masculine de .*+,F, valoarea cheltuielilor totale ale gospodăriilor aferente va fi cuprinsă "ntre C2F,C și C4,C$
4.
Problema 3
Molosind datele ro'lemei A, să se teste&e dacă dispersiile (varia?iile) celor două popula?ii (varia'ila e#ogenă ș i varia'ila endogenă) sunt egale9 testați dacă mediile celor două popula?ii sunt egale$ Le&olvarea pro'lemei 1 de e#emplificat "n E#cel, cu interpretarea re&ultatelor ș i parcurgerea etapelor testării ipote&elor statistice$ Hestarea ipote&ei privind raportul dintre cele două dispersii et$. se sta'ilește ipote&a nulă 2
σ 1
I* σ 2 =1 2 et$2 se sta'ilește ipote&a alternativă
42
2
σ 1
I. σ 2 ≠ 1 2 et$ se determină pragul de semnificaț ie ∝
=0,05 =5
et$4 se aplică testul Misher et$+ se calculea&ă valoarea testului 1
F calc =
S2 S
2 2
=
177119.482195122 =0.8641281235092818 204969.0056097561
x i−´ x
¿ ¿ ¿2 ¿ n
¿ ∑ = i 1 1 2
S =¿ y i− y´
¿ ¿ ¿2 ¿ n
¿ ∑ = i 1 2
S 2=¿
4
F%T)( T/%S,) f/* V*-'+) M)' V*-'+) O)*?(-/' f F PF$f" /')%(- F C*-(-+ /')%(-
xi 447.0714 286 177119.4 821 42 41 0.864128 123 0.321148 062 0.594656 101
yi 463.8309 524 204969.0 056 42 41
et$F se determină valoarea critică F
∝
∕ 2, n 1−1, n 2−1
=0.594656101
Mcalc J Mcritic
et$D se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a aprecia că dispersiile (variațiile) celor două populaț ii (varia'ila e#ogenă ș i cea endogenă) nu sunt egale$ 2. %estarea ipotezei privind diferenț a dintre cele două medii
et$. se sta'ilește ipote&a nulă I* μ1= μ2 et$2 se sta'ilește ipote&a alternativă I. μ1 ≠ μ2 et$ se determină pragul de semnificaț ie 44
∝
=0,05 =5
et$4 deoarece nJ* se folosește testul O 'ilateral et$+ se calculea&ă valoarea testului Z calc =
x´1− x´2
√
1
2
=
S2 S2 n1
+
n2
√
447,071− 463,831
177119,4882 204969,0056 42
+
=
−16.76 √ 9097.345
=0.17571
42
et$F se determină valoarea critică Z
∝
/2
=1,9599
Z calc < Z critic
et$D se desprind conclu&ii entru o pro'a'ilitate de +K e#istă suficiente dove&i statistice pentru a aprecia că mediile celor două popolații nu sunt egale, astfel se neagă ipote&a nulă$
E%T)( T/ S,) f/* M)' M)' K'/' V*-'+) O)*?(-/' H,/()-E) M)' D-)*)'+)
E PZ$E" /')%(- E C*-(-+ /')%(-
xi 447.0714 286 177119.4 882 42
yi 463.8309 524 204969.0 056 42
0 % 0.175713 181 0.430259 64 1.644853 627
4+