1. În tabelul următor avem date referitoare la 15 agenţi de asigurări angajaţi ai unei companii de asigurări de viaţă şi anume: timpul mediu, în minute, petrecut de un agent cu un potenţial client şi numărul de poliţe încheiate întro săptăm!nă. "acă # repre$intă timpul mediu, iar % repre$intă numărul de poliţe, avem datele sistemati$ate astfel: X
Y
&5 &' '( &5 &( '' 1) &1 && '( &* &* &+ & &(
1( 11 11& ) 1) 1( 1( 15 11 15 1& 111
e cere: a/ să se estime$e estime$e paramet parametrii rii modelul modelului ui liniar liniar de regresie0 regresie0 b/ să se teste$e semnificaţia parametrilor modelului pentru pe ntru un prag de semnificaţie 520 c/ să se determ determine ine eror erorile ile re$i re$idual duale0 e0 d/ să se teste$e teste$e validitat validitatea ea modelului modelului de regresie regresie pentru pentru un nivel de semnificaţ semnificaţie ie 520 e/ măsura măsuraţi ţi intens intensit itate ateaa legătu legăturii rii dintre dintre cele cele două variabi variabile le folosi folosind nd un indica indicator tor adecvat şi testaţi semnificaţia acestuia pentru un nivel de încredere de (,520 f/ efectu efectuaţi aţi o previ$io previ$ionar naree punctual punctualăă şi pe interva intervall de încred încredere ere a numărulu număruluii de poliţe încheiate de un agent care petrece în medie &- de minute cu un potenţial client. 3e$olvare: 4entru a determina forma modelului de regresie se va construi corelograma:
OY
numar polite polite
16 14 12 10 8 OX
6 16
18
20
22
24
26
28
30 32 34 timpul mediu
1 cm % 5 poliţe 1 cm # & minute 8 i a ( a1 6 i 7 a/ 4arametrii a şi b se determină cu ajutorul metodei celor mai mici pătrate: 7 i 78 i & min 7 i a ( a 1 6 i & min i
i
n n na ( a 1 6 i 7 i i1 i 1 n 15 n n n a 6 a 6 & 6 7 ( i 1 i 1 i 1 i i 1 i i 4entru a re$olva sistemul vom folosi următorul tabel în care sunt pre$entate valorile intermediare:
6i
&5 &' '( &5 &( '' 1) &1 && '( &* &* &+ & &(
6i
6 i&
7i
1( 11 11& ) 1) 1( 1( 15 11 15 1& 111
'+5
7i
6 i 7i
*&5 5& (( *&5 -(( 1() '&--1 -)(( *+* *+* +& )-1 -((
1)(
&5( &5' -&( '(( 1*( 51*& &1( &&( -5( &)* '( '&-(* &&(
6i7i
*'
-*-5
6 i&
7 i&
7 i 7 & 6 i 6 &
1(( 1&1 1* 1-*'&)1 1(( 1(( &&5 1&1 &&5 1-1* 1&1 7& i
&&*&
1 ( 1* '* 1 ( 1 1(&
( &5 ( &5 *- 1* &5 1 1 1* &5 &*-
15a ( a 1 '+5 1)( a ( '+5 a 1 *' -*-5
a ( 1,+' a1 (,5-&
"eci: 8 i 1,+' (,5-& 6 i 7
b/ 9estarea semnificaţiei parametrilor modelului: cuaţia de regresie la nivelul colectivităţii generale este: 7 i ( 1 6 i u i
iar la nivelul eşantionului este: 7 i a ( a1 6 i u i
9estarea semnificaţiei parametrului 1: 1/ se stabileşte ipote$a nulă: ;( : 1 ( &/ se stabileşte ipote$a alternativă: ;1 : 1 (, adică 1 este semnificativ diferit de $ero, adică 1 este semnificativ statistic. '/ se calculea$ă testul statistic: deoarece n 15 '( avem eşantion de volum redus şi pentru testare vom utili$a testul t: a 1 a 1 ( a 1 (,5-& t 1 *,) s a1 s a1 s a1 (,()
s a& i
s& u
6 i
6
&
1,+1 (,((* &*-
i
7i s &u i
78 i &
n < 1
&&,'5 15 &
1,+1
< = repre$intă numărul variabilelor factoriale >în ca$ul modelului unifactorial < 1/. 15
6i
6 i 1 15
'+5 15
&5
4entru un prag de semnificaţie de 52 valoarea tabelată a testului este: t(,(5?&0 1' t(,(&50 1' 1,'5 9estarea semnificaţiei parametrului (: 1/ se stabileşte ipote$a nulă: ;(: ( (0 &/ se stabileşte ipote$a alternativă: ;1: ( (0 '/ se calculea$ă testul statistic:
a 1 a ( ( a ( 1,+' t ( (,)sa( s a( s a ( &,(*
& sa (
s& u
1 n
6
&
6 i
6
i
&
1 &5 1,+1 -,1)* 15 &*
t calc (,)- t ? &0n & 1,'5
se acceptă ipote$a nulă, adică
parametrul a( nu este semnificativ statistic. u i 7 i 78 i şi sunt pre$entate în tabelul de
c/ rorile re$iduale sunt 1-, ,(
ui
&(,*&
&+,5+ &+,&&
(,1 1,5
1),') 1+,-)
1*,5) 5,(
+,'+ 5,-&
mai jos: 5,(' 1*,+(
d/ 9estarea validităţii modelului de regresie: 1/ se stabileşte ipote$a nulă: ;(: împrăştierea valorilor 78 t datorate factorului nu diferă semnificativ de împrăştierea aceloraşi valori datorate înt!mplării, deci modelul nu este valid. &/ se stabileşte ipote$a alternativă: ;1: modelul este valid0 '/ se calculea$ă testul @: @
s& 6 s& u
+,*1,+1
78 i s &6 i
&
<
7i s &u i
7
-*,'
+,*-
78 i &
n < 1
1
+,*-
&&,'5 15 &
1,+1
15
7i
1)( 1& 7 i 1 15 15 @calc @ 0n < 1 @(,(501,1' -,*+
"eoarece @calc @tab
modelul este valid.
e/ Antensitatea legăturii dintre cele două variabile se face cu coeficientul de corelaţie liniară: r
n 6 i 7i 6 i 7i
n
& 6i
6i
&
n
& 7i
7i
&
15 -*-5 '+5 1)(
15 *' '+5 15 &&*& 1)( &
&
(,)) 1 (
3e$ultă că între cele două variabile e6istă o legătură directă foarte puternică. 9estarea semnificaţiei coeficientului de corelaţie:
se stabileşte ipote$a nulă: ;(: nu este semnificativ statistic0 se stabileşte ipote$a alternativă: ;1: este semnificativ statistic0 se calculea$ă testul t: t
r r n & (,)) 1' *,+5 & & s r 1 r 1 (,))
t calc t 0n < 1 t (,(50 1' &,1*
Boeficientul de corelaţie este semnificativ statistic. Căsurarea intensităţii legăturii cu raportul de corelaţie 3:
3
n
78 i 7
&
i 1 n
7i 7
&
(,))
i 1
"eoarece 3 r (,)), apreciem că e6istă o legătură liniară, puternică şi directă între cele două variabile. 9estarea raportului de corelaţie se face cu testul @: @
3 & 1 3 &
n < 1 <
(,+) 1 (,+)
1' 1
-*,(
Bum: @calc @(,(50 10 1' -,*+
3 este semnificativ statistic. f/ 8 n 1 1,+' (,5-& &- 11,-5 D 1& 7
poliţe
>aceasta
este
punctuală/. 4entru estimarea pe interval de încredere vom avea: 78 n 1 t ? &0n < 1 s 78
n 1
7 n 1 78 n 1 t ? &0n < 1 s 78n 1
1& t (,(&501' 1,'5 7 n 1 1& t (,(&501' 1,'5
s& 8 7
n 1
s7 8
n 1
6 n 1 6 & 1 1 s& u & n 6 i 6 i
1 >&- &5/ & 1,+11 15 &*
1,)&
1,'5
1(,1++5 7 n 1 1',)&&5
Antervalul de încredere pentru numărul de poliţe încheiate este:
estimarea
1( 7 n 1 1-
3e$olvarea problemei cu ajutorul programului informatic #BE: e selectea$ă din meniul principal opţiunea 9ools, apoi "ata Fnal7sis, apoi 3egression şi se deschide următoarea fereastră:
şi se obţin următoarele re$ultate: GCCF3% G94G9 Regression Statistics
Cultiple 3 3 Huare Fdjusted 3 Huare tandard rror bservations
(.))'*&1 (.+)(+)* (.+*'&' 1.'11-)' 15.((((((
FIJF df
3egression 3esidual 9otal
SS
MS
F
Significance F
1.(((((( +.*-(15& +.*-(15 -*.'(&+& (.((((1' & + 1'.(((((( &&.'5)-) 1.+1)) 1-.(((((( 1(&.((((( (
Coefficient Standard s Error
Antercept # Jariable 1
t Stat
P-value
Lower 95%
Upper 95%
1.+'1(*1 &.(-*1&((.)-*(&1 (.-1&)-'*.151-'- &.*)'1 ' (.5-&-& (.()(+1* *.)(-*11 (.((((1' (.'+-)** (.+&'*1
3A"GFE G94G9 !servation
1.(((((( &.(((((( '.(((((( -.(((((( 5.(((((( *.(((((( +.(((((( ).(((((( .(((((( 1(.(((((( 11.(((((( 1&.(((((( 1'.(((((( 1-.(((((( 15.((((((
Predicted Residuals "
1&.(((((( 1(.(1515 1-.+-*&1& 1&.(((((( .&5'+)) 1*.''' ).155'(' .)('('( 1(.'5&&+' 1-.+-*&1& 1&.5-&-& 1&.5-&-& 1'.()-)5 1-.1*+( .&5'+))
&.(((((( (.()-)5 (.+-*&1& (.(((((( 1.&5'+)) 1.*(*(*1 (.)--*+ (.1*+( (.'5&&+' (.&5'+)) 1.5-&-& &.-5(+5) 1.()-)5 (.1*+( 1.+-*&1&
6plicitarea datelor din tabelele de mai sus: SUMMARY OUTPUT
Regression Statistics n
Multiple R
3aportul de corelatie >3/
78 i 7 &
(.))'*&1
37, 6
n
7 i 78 i &
i 1 n
1 i 1
i 1
i 1
n
7i 7 &
7 i 7 &
n
R Square
Boeficientul >gradul / de determinaţie
(.+)(+)*
&
3
&7 ? 6 &7
1
&e &7
78 i 7
&
n
&
i 1
7i 7
i 1
Adjusted R Square
Jaloarea ajustată a coeficientului de
(.+*'&'
&
3 1
&u ? n < 1 &7 ? n 1
determinaţie n
Standard Error
1.'11-)'
Fbaterea medie pătratică a erorilor în eşantion Observations
su
&u n&
7 i 78 i &
i1
n&
15
Iumărul observaţiilor >n/
9abel &. ANOVA df
Sursa variaţiei
MS (SS)df #&edia p'tratelor
SS #varian$a #su&a p'tratelor
>grade de libertate/
F
>dispersia corectată/
Significance F
3 Regression varia!ia datorat" regresiei#
n
&
&6 78 i 7
1 >
i 1
79.640152
s &6
9estul @46.302727 & & @ s * ? su
<
79.640152
n
Residual varia!ia re$idual"#
&6
& 8i& 1' >n<1/ u 7 i 7 i1
& su
0.000013 K
(.(5 >resping ;( = model valid/
&u n < 1
22.359848
1.719988
9
Total varia!ia total"#
1- >n1/
&7
n
7 i 7
&
i 1
s &7
102.000000
&7 n 1
SST=SSR + SSE
9abel ' Coefficients (Coeficienţi)
Standard Error (Abaterea medie patratică)
t Stat
P-value
Loer !"#
$pper !"#
Limita inf% a Limita sup% a intervalului intervalului de &ncredere de &ncredere %nter&ept ter'enul liber#
a+( 1.+'1(*1
Ti'pul 'ediu
a, ( (.5-&-&
s a( &.(-*1&( s
a
1
(.()(+1*
t a(
(.-1&)-' L (,(5
*.151-'-
&.*)'1'
t a1
(.((((1' K (,(5
(.'+-)**
(.+&'*1
(.)-*(&1 *.)(-*11
9abel -. RES%)UA* OUTPUT
!servation
1
8i Predicted .u&'rul de poli$e
'').5+*
Residuals 8i -i -
1-.)*
& ' 5 * + ) 1( 11 1& 1' 115
'+1.&5-& '+*.1+-) ''&.)5&5 '11.)&)1 '1(.**& '&5.&'5 &)+.)*5 '1(.+*' ')&.'(+' ''*.&1)) '*.&') '').+5('*+.&5&) '-*.(1+
&+.5+&& (.1() 1).')5 1*.5)) +.'+&) 5.('55 &(.*& .(*+ &+.&&++ 1.5*) 1+.-)+) 5.(55.-&*& 1*.+(-'
Anterpretare re$ultate din tabelul SUMMARY OUTPUT: R( +,--./01 arată că între numărul de poliţe încheiate şi timpul mediu petrecut cu un potenţial client e6istă o legătură puternică. R 0 (+,2-+2-/ arată că +)2 din variaţia numărului de poliţe încheiate este e6plicată de timpul mediu petrecut de un agent cu un potenţial client. Abaterea 'edie patrati&a a erorilor ( 1.'11-)'. În ca$ul în care acest indicator este $ero înseamnă că toate punctele sunt pe dreapta de regresie. s
u
Anterpretare re$ultate din tabelul ANOVA3 În acest tabel este calculat testul @ pentru validarea modelului de regresie. Întruc!t @-*.'(&+&+, iar Significance F #pragul de se&nificatie este (.((((1' >valoare mai mica de (.(5/ atunci modelul de regresie construit este valid şi poate fi utili$at pentru anali$a dependenţei dintre cele două variabile.
Anterpretarea re$ultatelor din tabelul -: %nter&ept este termenul liber, deci coeficientul a+ este 1.+'1(*1. 9ermenul liber este punctul în care variabila e6plicativă >factorială/ este (. "eci numărul de t
poliţe încheiate, dacă timpul petrecut este (. "eoarece a (.)-*(&1iar pragul de semnificaţie P-value este (.-1&)-'L(,(5 înseamnă că acest coeficient este nesemnificativ. "e altfel faptul că limita inferioară a intervalului de încredere (
>*.151-'- ( &.*)'1'/ pentru acest parametru este negativă, iar limita
superioară este po$itivă arată că parametrul din colectivitatea generală este apro6imativ $ero. Boeficientul a' este (.5-&-&, ceea ce însemnă că la creşterea timpului petrecut cu un minut, numărul de poliţe încheiate va creşte cu (,5-&-&. "eoarece t a1 *.)(-*11 iar pragul de semnificaţie P-value este (.((((1'K(,(5 înseamnă că acest coeficient este semnificativ. Antervalul de încredere pentru acest parametru este (.'+-)** 1 (.+&'*1.
&. În tabelul următor avem informaţii privind veniturile obţinute de &( de gospodării selectate aleator şi ta6ele plătite de către aceste gospodării: Venitul 'ii euro# 4
Ta4ele euro# 5
1+,5 '+,5 -+,5 &5,( 55,5 '5,( 15,5 1&,( '&,( -&,'
Venitul 'ii euro# 4
'5,( *(,5 )),5 +(,5 1&5,( *',( '(,( '(,( *5,( )(,(
Ta4ele euro# 5
&),( &&,5 &5,( &,5 *5,( 51,( ',' '',( -5,( +5,(
+5,( +(,( *(,( *5,( 15(,( 1((,( +5,( -(,( +5,( &((,(
e cere: a/ să se specifice modelul econometric ce descrie legătura dintre cele două variabile0 b/ să se estime$e parametrii modelului0 c/ să se verifice ipote$ele metodei celor mai mici pătrate0 d/ să se verifice semnificaţia parametrilor modelului de regresie pentru (,10 e/ să se teste$e validitatea modelului de regresie0 f/ să se teste$e intensitatea legăturii dintre cele două variabile şi să se teste$e semnificaţia indicatorilor utili$aţi0 g/ să se estime$e punctual şi pe interval de încredere nivelul ta6elor care trebuie plătite dacă venitul este de -( mii euro pentru o probabilitate de 52. 3e$olvare: a/ e va repre$enta grafic legătura dintre nivelul ta6elor şi venit pentru cele &( de gospodării prin corelogramă sau diagrama norului de puncte: OY 220 200 180 160 140 120 100 80 60 40 20 0
yi
OX 0
10
20
30
40
50
60
70
xi
80
1 cm # 1( mii euro 0 1 cm % &( euro
"in grafic se poate observa că distribuţia punctelor >6 i, 7 i/ poate fi apro6imată cu o dreaptă, deci modelul econometric care descrie legătura dintre cele două variabile este un model liniar:
7 ( 1 6 u
= parametrii modelului0 1 ( >panta dreptei/ deoarece legătura dintre cele două variabile este directă. b/ 4entru estimarea parametrilor modelului de regresie utili$ăm metoda celor mai mici pătrate: (, 1
7 i a ( a1 6 i u
i 1,&(
8 i a ( a1 6 i 7
7 i 78 i &
min
i
7i
a ( a 16 i & min
i
&(a ( +'',1a1 155+,5 a ( +'',1 a1 '11,5' *))*-
a ( *,-&(1 a 1 &,&+
"eci, modelul este: 8 i *,-&(1 &,&+ 6 i 7
n a1
6i n
6i
7i 6 i 7i 6i 6 i&
&(
155+,5
+'',1 *))*&(
+'',1
&,&+
+'',1 '11,5'
a ( 7 a 1 6 *,-&(1
c/ Apote$ele metodei celor mai mici pătrate: c1/ Jariabilele observate nu sunt afectate de erori de măsură. Fceastă ipote$ă se poate verifica cu ajutorul următoarelor relaţii: 6 's 6 6 i 6 's 6 7 's 7 7 i 7 's 7
unde: n
6 i 6
i1
s6
511,+-
n
&(
n
7 i 7
n n
n
'&11*,-&(
-(,(+
&(
6i
i 1
15,
&
i1
s7
6
&
6i
i 1
&(
+'',1 &(
'*,*55
&(
7i
7
i 1
155+,5
++,)+5 &( &( '*,*55 ' 15, 6 i '*,*55 ' 15, 11,'15 6 i )-,*&5 >adevărat/ ++,)+5 ' -(,(+ 7 i ++,)+5 ' -(,(+ -&,''5 7 i &(1,()5 >adevărat/
Apote$a poate fi acceptată fără nici un dubiu. c&/ Jariabila aleatoare >re$iduală/ u este medie nulă şi dispersia variabilei re$iduale este constantă şi independentă de variabila factorială >ipote$a de homoscedasticitate/. Apote$a de homoscedasticitate poate fi verificată cu metoda grafică >corelograma/. e repre$intă grafic pe a6a # valorile variabilei factoriale 6, iar pe a6a % se repre$intă valorile variabilei re$iduale u. Ja trebui să calculăm valorile variabilei re$iduale: u i 7 i 78 i 3e$ultatele sunt pre$entate în tabelul de mai jos: 8i 7
ui
'',)& +,)& 1(&,)& 51,(+ 1&1,&1 +-,(+ &,&' &1,1) *+,1+ (,)* 5+,+ -5,'& 51,(+ *1,-& 1-',(* 11(,)* )',* *,-+ +,(+ 1**,(* OY
1,1) 1,'& 1-,'& 1,-' ',+ 11,(+ (,++ ),)& &,1+ 1(,)* 1+,(' &-,*) ),' ',5) *,1(,)* ),* &,-+ &&,(+ '',-
ui
35 30 25 20
15 10 5 0 -5 0 -10
OX 20
40
60
80 xi
-15 -20 -25 -30
"eoarece graficul punctelor pre$intă o evoluţie oscilantă putem accepta ipote$a că variabila factorială şi cea re$iduală sunt independente.
c'/ Jalorile variabilei re$iduale nu sunt autocorelate, adică sunt independente între ele: Jerificarea acestei ipote$e se poate face prin: - metoda grafică >corelograma/0 - testul "urbinMarson. 4rin metoda grafică se construieşte corelograma trec!nduse pe a6a # valorile variabilei re$ultative 7i, iar pe a6a % valorile variabilei re$iduale: ui
OY
35 30 25 20
15 10 5 0 -5 0 -10
OX 20
40
60
80
100
120
140
160
180 yi
-15 -20 -25 -30
"istribuţia erorilor este oscilantă, adică nu avem alternativă sistematică sub formă de dinţi de fierăstrău, deci putem accepta ipote$a că erorile sunt independente, adică nu sunt autocorelate. 9estarea ipote$ei cu ajutorul testului "urbinMatson: se stabileşte ipote$a nulă: ;(: variabila re$iduală nu este autocorelată. se stabileşte ipote$a alternativă: ;1: variabila re$iduală este autocorelată. se calculea$ă testul "urbinMatson: n
u i u i1 &
d calc i 1
n
u i&
+5(),)+ 5(-(,&*
1,-)
i 1
4entru a efectua calculul lui d vom pre$enta re$ultatele intermediare în următorul tabel: ui
1,1) 1,'& 1-,'& 1,-'
u i 1
1,1) 1,'& 1-,'&
u i u i 1 & -&(,1 &5,(11'),(
u i&
1,') '+',&1 &(-,'++,-'
',+ 11,(+ (,++ ),)& &,1+ 1(,)* 1+,(' &-,*) ),' ',5) *,1(,)* ),* &,-+ &&,(+ '',-
1,-' ',+ 11,(+ (,++ ),)& &,1+ 1(,)* 1+,(' &-,*) ),' ',5) *,1(,)* ),* &,-+ &&,(+
&--,+1 &&(,)( 1-(,'( *-,)* 1&(,+ +5,-+ +++,++ 5),-+ &-),1&),*' 11,& '1+,(( ',*& -&(,** 5-,)1 '1'+,-1 +5(),)+
1-,'1&&,5' (,*( ++,)* -,+1 11+,)) &),+ *(),5 +,+( 1&,)1 -),1* 11),()(,&5 )*),-) -)*,' 115&,1( 5(-(,&*
se compară dcalc cu cele două valori d1 şi d& din tabelul testului "urbinMatson pentru pragul de semnificaţie (,(5 pentru numărul variabilelor e6ogene < 1 şi pentru n &(: d1 1,&( d& 1,-1 d & d calc - d & 1, -1 1, -) &,5
erorile
sunt independente. 9ot pentru testarea ipote$ei privind autocorelarea erorilor poate fi utili$at şi coeficientul de autocorelaţie de ordinul A: n
u i u i1
r 1
i 1
n
u i&
+(,-1 5(-(,&*
(,1-
i 1
"eoarece r 1 este apropiat de ( putem aprecia că valorile variabilei re$iduale nu sunt autocorelate, adică sunt independente. c-/ Jalorile variabilei re$iduale sunt normal distribuite: 4entru a testa această ipote$ă se foloseşte metoda grafică >corelograma/. 4e a6a # se repre$intă valorile ajustate 78 i , iar pe a6a % se repre$intă valorile variabilei re$iduale:
Nuit(,(50 1) su
OY
35 30 25 20
15 10 5 0 -5 0 -10 -15 -20 -25 -30
OX 20
40
60
80
100
120
140
160
8i 7
180
t(,(50 1) su
e observă că valorile re$iduale ui se înscriu în banda construită, deci putem accepta ipote$a de normalitate a erorilor pentru un prag de semnificaţie de (,(5. d/ 9estarea semnificaţiei parametrilor modelului 9estarea semnificaţiei parametrului (: se stabileşte ipote$a nulă: ;(: ( ( se stabileşte ipote$a alternativă: ;1: ( ( se calculea$ă testul t: t
a( sa
*,-&(1 -1,)&
(
s a& s & u (
(,15
6 i& i
6 i
6
&
&)( ,(1
'11,5' 1--,*) 511 ,+5
i
7i s &u i
78 i &
n&
5(-(,&* 1)
&)(,(1
se compară tcalc cu t ?&0 n& t(,(50 15 &,1(1 "eoarece t calc t (,(501) este foarte probabil ca estimatorul a ( să provină dintro colectivitate cu ( ( deci ( nu este diferit semnificativ de $ero. 9estarea semnificaţiei parametrului 1: se stabileşte ipote$a nulă: ;(: 1 ( se stabileşte ipote$a alternativă: ;1: 1 ( se calculea$ă testul t:
t
a1 sa
1
&,&+ (,&'
,
s a& 1
s &u
&(
6 i
i 1
6
&
&)(,(1 511,+5
(,(5
se compară tcalc cu t ?&0 n& t(,(50 1) &,1(1 "eoarece t calc t (,(501) apreciem că parametrul 1 este semnificativ statistic. Antervalul de încredere pentru parametrul 1 este:
a 1 t ? &0n & s a 1 a1 t ? &0n & s a 1 1 &,&+ &,1(1 (,&' 1 &,&+ &,1(1 (,&'
1,)1*-+ 1 &,+)&'
e/ 9estarea validităţii modelului de regresie: se stabileşte ipote$a nulă: ;(: modelul nu este valid. se stabileşte ipote$a alternativă: ;1: modelul este valid0 se calculea$ă testul @: s& &+(+*,1) @ 6 *,* & &)( , (1 su &(
78 i
s &6 i 1
7
&
<
se compară @calc cu @
&+(+*,1) 1
&+(+*,1)
@(,10 10 1) ),&) @calc *,* @(,10101) se respinge ipote$a nulă şi se acceptă alternativa, deci modelul este valid. 0
<0 n<1
f/ Antensitatea legăturii dintre cele două variabile se aprecia$ă cu ajutorul: coeficientului de corelaţie0 raportului de corelaţie. Boeficientul de corelaţie: n 6 i 7i 6 i 7i
r 7 ? 6
i
i
i
& & # # n 6 & ! 6 i n 7 & ! 7 i i ! i i !" i i " i
(,1)
"eoarece r 7?6 (,1) 1, apreciem că între cele două variabile e6istă o legătură liniară, directă, foarte puternică. 9estarea semnificaţiei coeficientului de corelaţie pentru colectivitatea generală: se stabileşte ipote$a nulă: ;(: ( > nu este semnificativ statistic/0 se stabileşte ipote$a alternativă: ;1: ( > este semnificativ statistic/0 coeficientul de corelaţie la nivelul colectivităţii generale se calculea$ă testul t: t calc
r n & 1 r &
(,1) 1) 1 (,1) &
,)&
se compară t calc cu t 0n & t (,10 1) &,)+) "eoarece t calc t (,10 1) respingem ipote$a nulă şi acceptăm alternativa, deci coeficientul de corelaţie este semnificativ statistic.
3aportul de corelaţie 3:
7 i 78 i &
3 1 i1
7i
i 1
1 7
&
5(-(,&* '&11*,--
(,1)
"eoarece 3 r 7?6, apreciem că între cele două variabile e6istă, o legătură liniară. 9estarea semnificaţiei raportului de corelaţie: se stabileşte ipote$a nulă: ;(: 3 nu este semnificativ statistic0 se stabileşte ipote$a alternativă: ;1: 3 este semnificativ statistic0 se calculea$ă testul @: @calc
n < 1 <
3 &
1)
întradevăr,
(,1) &
-,5 1 1 (,1) & 1 3 & @0< 0n < 1 @(,10101) ), &)
se compară @calc cu "eoarece @calc @(,10 10 1) se respinge ipote$a nulă şi se acceptă alternativa, deci raportul de corelaţie este semnificativ statistic. g/ 8 n 1 *,-&(1 &,&+ -( )5,5*+ euro >estimarea punctuală/ 7
4entru estimarea pe interval de încredere vom avea: 78 n 1 t ? &0n < 1 s 78
n 1
7 n 1 78 n 1 t ? &0n < 1 s 78 n 1
)5,5*+ t (,(&501) &,55& 1+,1* 7 n 1 )5,5*+ t (,(&501) &,55& 1+,1*
s &78
n 1
& 6 n 1 6 1 & su 1 n n & 6 i 6 i 1
& &) (,(11 1 > -( '* ,*5 5/ & -,5 &( 511,+5
"eci, intervalul de încredere pentru ta6ele plătite pentru un venit de -( mii euro la nivelul populaţiei este: -1,++ >euro/ 7 n 1 1&,'* >euro/
3e$olvarea problemei cu ajutorul programului informatic #BE: e selectea$ă din meniul principal opţiunea 9ools, apoi "ata Fnal7sis, apoi 3egression şi se va deschide următoarea fereastră:
şi se obţin următoarele re$ultate GCCF3% G94G9 Regression Statistics
(.1)1)-5 Cultiple 3 )) (.)-'(*& 3 Huare '+ Fdjusted 3 (.)'-'--& Huare 1& tandard 1*.+''*'1 rror () bservations &( FIJF df
3egression 3esidual 9otal
SS
F
Significanc e F
&+(+*.1 1.155)) 1&+(+*.1+)1) *.*5** () &)(.(11)5(-(.&5'*' 1 '&11*.-'+5 Coefficient Standard s Error
Antercept
MS
t Stat
P-value
.'5''+-))) (.*)*- (.5(1&(
Lower 95%
Upper 95%
1'.&'(5)
*.-&(1-&&*.(+()* ) 1# Jariable 1 &.&*(1 .)''' 1.)()'5* >Jenitul/ 51(.&'')*5'&5 5 1.1*() 55 &.+1(&' 3A"GFE G94G9 Predicted !servation " Residuals
1 & ' 5 * + ) 1( 11 1& 1' 115 1* 1+ 1)
''.)&--'5 1* 1.1+55*-)+.)1)&') 1) 1.'1)&')1) 1(&.)151' + 1-.'151'* 51.(+&111& 1.-&+)))+1 1&1.&1&** ('.+)+''1(+ +-.(*(1& ) 11.(*(1&) &.&&5(5)*(.++--51-1 &1.1+*1' '').)&')*(** *+.1*-& '5 &.1*-&'-) (.)5*+5( 1(.)5*+5( 5+.+11)1+ -1+.(&))1)&* -5.'&&))5 1&-.*++11-( 51.(+&111& ).&+)))+() *1.-&(+1* +'.5+&)'(& 1-'.(5+1 +'*.-(&)&*+11(.)*-(55 & 1(.)*-(55&1 )'.5+*)( -5 ).5+*)(-- *.-**'& 5 &.-**'&5
+.(*51 '1 &&.(*51-'1 1**.(5**1 ))''.-'')11+
1 &(
6plicitarea datelor din tabelele de mai sus: SUMMARY OUTPUT Regression Statistics n
Multiple R
0.91818458
3aportul de corelaţie >3/
n
78 i 7 &
i 1 n
37, 6
8
7i 7
7 i 78 i
1 i 1 n
7i 7 &
&
i 1
i 1 n
R Square
Boeficientul >gradul / de determinaţie
0.84306293
3 &
7
&7 ? 6 &7
1
&e
78 i 7
&
n
&
i 1
&7
7i 7
i 1
Adjusted R Square
Jaloarea ajustată a coeficientului de determinaţie
0.83434421 &
3 1
2
&u ? n < 1 &7 ? n 1
Standard Error
Fbaterea medie pătratică a erorilor în eşantion
n
16.7336310 8
&u
su
n&
7 i 78 i &
i 1
n&
Observations
Iumărul observaţiilor >n/
&(
9abel &. ANOVA Sursa variaţiei Regression varia!ia datorat" regresiei# Residual varia!ia re$idual"#
df
>grade de libertate/
1 >
MS (SS)df #&edia p'tratelor
SS #varian$a #su&a p'tratelor
3
& *
n
-8 i -
>dispersia corectată/ &
i 1
s *&
1) >n<1/
n
u - i -8 i i 1
5040.259363
/
27076.18
27076.17814
&
&*
&
&u s n / 1 & u
280.0144
Significance F
F
9estul
1.15588E-
08K (.(5 @96.69566 >resping ;( & & @ s * ? s u = model valid/
Total varia!ia total"#
n
7i 7
9 7 &
1 >n1/
&
&
i 1
s -
32116.4375
&
-
n
1
SST=SSR + SSE
9abel '. Standard Error Coefficients (Abaterea medie (Coeficienţi) patratică)
t Stat
P-value
Loer !"#
$pper !"#
Limita sup% Limita inf% a a intervalului de intervalului &ncredere de &ncredere %nter&ept ter'enul liber# Venitul
s a(
a+( -6.42014248
9.353374888 s
a, ( 2.299690151
a
1
t a(
t a1
0.233865325
0.501209 L(,(5 -26.07086914
13.23058
1.16E-08 K(,(5 1.808356955
2.791023
-0.6864
9.833395
9abel -. RES!"#$ O"%&"%
Observation
8i Predicted taxe plătite
Residuals 8i -i -
1
338.5796
-14.9986
2
371.2542
-27.5722
3
376.1748
-0.9108
4
332.8525
18.3895
5
311.8281
16.5889
6
310.6962
7.3728
7
325.9235
5.0355
8
287.8659
-20.6299
9
310.9763
9.9067
10
382.3073
27.2277
11
336.2188
-19.9568
12
369.2938
-17.4878
13
338.7504
-5.0954
14
367.2528
5.4262
15
346.0917
16.7043
Anterpretare re$ultate din tabelul SUMMARY OUTPUT: R( +,61-1-78-- arată că între impo$itele plătite şi venitul anual, e6istă o legătură puternică. R 0(.)-'(*&'+ arată că )-2 din variaţia impo$itelor este e6plicată de venit Abaterea 'edie patrati&a a erorilor ( 1/,2../.1+- . În ca$ul în care acest indicator este $ero înseamnă că toate punctele sunt pe dreapta de regresie. s
u
Anterpretare re$ultate din tabelul ANOVA3 În acest tabel este calculat testul @ pentru validarea modelului de regresie. Întruc!t @*.*5**, iar Significance F #pragul de se&nifica$ie este 1.155))() >valoare mai
mica de (.(5/ atunci modelul de regresie construit este valid şi poate fi utili$at pentru anali$a dependenţei dintre cele două variabile.
Anterpretarea re$ultatelor din tabelul -: %nter&ept este termenul liber, deci coeficientul a+ este *.-&(1-&-). 9ermenul liber este punctul în care variabila e6plicativă >factorială/ este (. "eci impo$itele t
care ar trebui plătite, dacă nu sar obţine nici un venit. "eoarece a (.*)*- iar pragul de semnificaţie P-value este (.5(1&(L(,(5 înseamnă că acest coeficient este nesemnificativ. "e altfel faptul că limita inferioară a intervalului de încredere (
>&*.(+()*1- ( 1'.&'(5)/ pentru acest parametru este negativă, iar limita superioară este po$itivă arată că parametrul din colectivitatea generală este apro6imativ $ero. Boeficientul a' este &.&*(151, ceea ce însemnă că la creşterea venitului cu o mie euro, ta6ele vor creşte cu &,&*(151 euro. "eoarece t a1 .)'''5 iar pragul de semnificaţie P-value este 1.1*()K(,(5 înseamnă că acest coeficient este semnificativ. Antervalul de încredere pentru acest parametru este 1.)()'5*55 1 &.+1(&'