ANALIZA VARIANŢEI ŞI PLANURI EXPERIMENTALE ÎN AGRICULTURĂ
ANALIZA VARIANŢEI BIFACTORIALĂ COMPLETĂ NEBALANSATĂ ÎN POPULAŢII OMOGENE
În populaţia statistică luăm ca obiect de studiu un caracter măsurabil Z faţă de care exemplarele populaţiei au media µ. Fie alte două caractere X,Y asociate cu exemplarele populaţiei, populaţiei, caracterul X având m variante (doze, nivele, tratamente) notate X(1),...,X(m), iar caracterul Y având n variante (doze, nivele, tratamente) notate Y(1),...,Y(n). Caracterele X, Y se numesc factori şi constituie criterii de clasificare dublă a populaţiei în mn subpopulaţii subpopulaţii (straturi) ce corespund perechilor de variante (X(i), Y(j)), mediile pe subpopulaţii subpopulaţii relativ la caracterul Z fiind µ(i,j) (i=1,........, m; j=1,........,n). Diferenţele α(X,Y)(i,j) = µ(i,j)-µ se numesc efecte principale ale perechii de factori m
(X,Y) în subpopulaţii.
Avem
n
∑∑ i =1 j =1
α(X,Y)(i,j)=0
Subpopulaţiile Subpopulaţiile se presupun presupun normale cu mediile mediile µ(i,j) şi aceeaşi varianţă σ2(E) în raport cu caracterul Z. Extragem în mod întâmplător din subpopulaţii mn sondaje (probe, eşantioane) de volume p(i,j) (i=1,......., m; j=1,.......n). j=1,.......n). Datele reletiv la caracterul Z, din aceste sondaje le numim repetiţii, (replicate) şi le notăm cu Z(i,j,k) (i=1,........., m; j=1,......., n; k=1,.......,p(i,j)). Forma generală a modelului liniar este: Z(i,j,k)= µ+αX(i)+ αY(j)+αX.Y(i,j)+e(i,j,k) unde e(i,j,k) sunt variabile aleatoare normale, independente independente două câte două cu media 0 şi 2 varianţa σ (E). Reunim toate subpopulaţiile care corespund variantei X(i) fixate pentru orice j=1,....., n. Exemplarele din această reuniune vor avea faţă de caracterul Z media: n
µX(i)=(1/n). ∑ µ(i,j), iar efectul principal al variantei X(i) este : j =1
m
αX(i)=µX(i)- µ .
Avem
∑ i =1
αX(i)=0.
În mod analog se reunesc subpopulaţiile ce corespund variantei Y(j) fixate pentru orice i=1,......., m. m
Exemplarele din această reuniune au faţă de caracterul Z, media µY(j)=(1/m).
∑ i =1
µ(i,j),
iar efectul principal al variantei Y(j) este: αY(j)= µY(j)-µ. n
Avem
∑ j =1
αY(j)=0.
Cantitatea: αX.Y(i,j)= µ(i,j)- µX(i)-µY(j)+µ se numeşte efectul principal al interacţiunii variantei X(i) cu varianta Y(j). După modul de alegere al subpopulaţiilor după X şi Y, avem trei tipuri de modele : a) Model cu efecte fixe În acest caz ambii factori X, Y definesc efecte constante αX(i), αY(j), αX.Y(i,j). Ipotezele care se verifică sunt: µX(1)≠...........≠µX(m)≠ µ HX: µX(1)=...........=µX(m)=µ faţă de alternativa HX: 1) sau sub altă formă: H X: αX(i)=0 faţă de alternativa HX: αX(i) ≠0. 2) HY: µY(1)=...........=µY(n)= µ faţă de alternativa HY:µY(1)≠...........≠µY(n)≠ µ sau sub altă formă: H Y: αY(j)=0 faţă de alternativa: HY: αY(j) ≠0. 3) HX.Y: µ(i,j)= µX(i)+ µY(j) faţă de alternativa HX.Y: µ(i,j) ≠ µX(i)+ µY(j) sau sub altă formă: HX.Y: αX.Y(i,j)=0 faţă de alternativa: HX.Y: αX.Y(i,j) ≠0.
b)
Model cu efecte aleatoare :
În acest caz ambii factori definesc efecte aleatoare : αX(i) sunt variabile aleatoare N(0; σ2(αX)), αY(j) sunt variabile aleatoare N(0; σ2(αY)), iar αX.Y(i,j) sunt variabile aleatoare N(0; σ2(αX.Y)). Ipotezele care se verifică sunt: HX: σ2(αX)=0 faţă de HX: σ2(αX) ≠0 1) 2) HY: σ2(αY)=0 faţă de HY: σ2(αY) ≠0 3) HX.Y: σ2(αX.Y)=0 faţă de HX.Y: σ2(αX.Y) ≠0.
c) Modelul mixt: În acest caz unul din factori, de exemplu X, este cu efecte fixe, iar cel de-al doilea Y este cu efecte aleatoare. Efectele αX(i) sunt constante şi ipoteza care se verifică este: 1) HX: αX(i)=0 faţă de HX: αX(i) ≠0 Efectele αY(j) sunt variabile aleatoare de tip N(0; σ2(αY)) şi ipoteza care se verifică este : 2) HY: σ2(αY)=0 faţă de HY: σ2(αY) ≠0
Efectele αX.Y(i,j) sunt variabile aleatoare de tip N(0; σ2(αX.Y)) şi ipoteza care se verifică este: 3) HX.Y: σ2(αX.Y)=0
HXY: σ2(αX.Y) ≠0.
faţă de
În cazul celor trei modele, datele împreună cu calculele de sume si medii ale repetiţiilor pe variante (X,Y), X, Y şi pe total se trec în tabelul care urmează:
Repet.Z Variante (X,Y)
Medii pe Medii pe Medii pe Media Variante Variante Variante Totală (X,Y) X Y
Z(i,j,p(i,j))
(X(1),Y(1)) …………. (X(1),Y(n)) …………. (X(m),Y(1)) ………….. (X(m),Y(n))
Z(1,1,1),…,Z(1,1,p(1,1)) ………………………. Z(1,n,1),…,Z(1,n,p(1,n)) ……………………….. Z(m,1,1),…,Z(m,1,p(m,1)) ……………………….. Z(m,n,1),…,Z(m,n,p(m,n))
MZ(1,1) ………. MZ(1,n) ………. MZ(m,1) ……….. MZ(m,n)
MZX(1)
MZY(1)
……….
………
MZX(m)
MZY(n)
MZT
Notaţii: q=numărul de celule (i, j) nevide; m
pT=
n
∑∑ p(i,j);
n
px(i)=
i =1 j =1
m
∑ p(i,j);
pY(j)=
j =1
∑ p(i,j) i =1
CALCULE: a)
SPA şi GL: n p ( i , j )
m
SPAT=
∑∑ ∑ i =1 j =1
n p ( i , j )
m
2
[Z(i,j,k)-MZT] =
k =1
∑∑ ∑
Z2(i,j,k)-S2T/pT
cu
GLT=pT-1 grade de
i =1 j =1 k =1
libertate; m
SPA(X,Y)=
n
m
n
∑∑ p(i,j)[MZ(i,j)-MZ ] = ∑∑ T
i =1 j =1
2
S2(i,j)/p(i,j)-S2T/pT cu GL(X,Y)=q-1 grade de
i =1 j =1
libertate; m
SPAX=
m
∑ p (i)[MZ (i)-MZ ] = ∑ x
X
T
2
i =1
S2X(i)/px(i)-S2T/pT cu GLX=m-1 grade de
i =1
libertate; n
SPAY=
∑ j =1
libertate;
n
2
PY(j)[MZ Y(j)-MZT] =
∑ j =1
S2Y(j)/pY(j)-S2T/pT cu GLY=n-1 grade de
m
SPAX.Y=
n
m
n
m
∑∑ p(i,j)[MZ(i,j)-MZx(i)-MZ (j)+MZ ] = ∑∑ Y
T
i =1 j =1
2
2
S (i,j)/p(i,j)-
i =1 j =1
∑ i =1
n
S2X(i)/px(i)-
∑
S2Y(j)/pY(j)+S2T/pT=SPA(X,Y)-SPAX-SPAY cu GLX.Y=q-m-n+1=GL(X,Y)-GLX-GLY
j =1
grade de libertate; m
SPAE=
n p ( i , j )
∑∑ ∑ i =1 j =1
m
2
[Z(i,j,k)-MZ(i,j)] =
k =1
n p ( i , j )
∑∑ ∑ i =1 j =1
k =1
m
2
Z (i,j,k)-
n
∑∑
S2(i,j)/p(i,j)=SPAT-
i =1 j =1
SPA(X,Y) cu GLE=pt-q=GLT-GL(X,Y) grade de libertate.
b) S2 : S2X=SPAX/(m-1); S2Y=SPAY/(n-1); S 2X.Y=SPAXY/(q-m-n+1); S2E=SPAE/(pT-q)
c) F: FX=S2X/S2E>1 cu 2 2 FY=S Y/S E>1 cu 2 2 FX.Y=S X.Y/S E>1 cu
[m-1;pT-q]GL [n-1;p T-q]GL [q-m-n+1;p T-q]GL
Rezultatele de la punctele a)-c) se trec în tabelul sintetic de analiză a varianţei: Sursa de SPA GL S2 F variaţie X SPAX m-1 S 2X FX 2 Y SPAY n-1 SY FY 2 X.Y SPAX.Y q-m-n+1 S X.Y FX.Y 2 E SPAE pT-q SE T SPAT pT-1 Rapoartele Fisher FX, FY, FX.Y se compară cu valorile critice F0.05; F0.01; F0.001 extrase din tabelele 4,5,6 din Anexă, pentru perechile de grade de libertate corespunzătoare şi se acceptă sau se resping ipotezele formulate mai sus. Printr-un calcul asemănător cu cel din teorema 9.1 obţinem relaţiile: (1)M(S2X)=a(1,1).σ2(α)+a(1,2).σ2(β)+a(1,3).σ2(αβ)+σ2(E) (2)M(S2Y)=a(2,1).σ2(β)+a(2,2).σ2(β)+a(2,3).σ2(αβ)+σ2(E) (3)M(S2X.Y)=a(3,1).σ2(α)+a(3,2).σ2(β)+a(3,3).σ2(α.β)+σ2(E) (4)M(S2E)= σ2(E)
unde: a(1,1)=
1 m −1
[ pT −
1 pT
(
m
∑ p
2
i =1
(i))]
X
m
1
1
∑p m −1
a(1,2)=
[
i =1
1
a(1,3)=
m −1
[
m
∑ i =1
X
[
j =1
1
a(2,2)=
n −1
[ pT −
1
a(2,3)=
n −1
a(3,1)= -
[
n
∑ j =1
p (i,j))-
j =1
∑
∑p n −1
a(2,1)=
∑ (i ) (
2
1
(
pT
n
∑ p
2 Y
(j))]
j =1
n 1 ( p2(i,j))- 1 (∑ ∑ p2(i,j))] p p X (i ) j =1
n
1
n
1 pT
n
i = 1 j =1
T
m
1
Y
m
1
∑ p (i,j))- p (∑ p ( j)
(
(
2
i =1
m
2
(j))]
X
i =1
T
n
∑ p
2
(i))]
Y
j =1
m 1 ( p2(i,j))- 1 (∑ ∑ p2(i,j))] p pY ( j ) i =1
n −1
∑
m
n
i =1 j =1
T
a (2,1)
q − m − n +1 m −1 a (1, 2) a(3,2)= q − m − n +1
1
a(3,3)= 1 pT
(
m
q − m − n +1
m
[ pT −
∑ p i =1
1
X ( i )
n
(
∑ j =1
m 1 ( p2(i,j))+ p2(i,j)) j =1 pY ( j ) i =1 n
∑
∑
n
∑∑ p
2
(j))]
X
i =1 j =1
Cu aceşti coeficienţi alcătuim tabelul componentelor de varianţă: M(S2) M(S2X) M(S2Y) M(S2X.Y) M(S2E)
σ2(αX)
σ2(αY)
a(1,1) a(2,1) a(3,1) 0
a(1,2) a(2,2) a(3,2) 0
Avem estimatorii: σ*2(E)=S2E
σ2(αX.Y) a(1,3) a(2,3) a(3,3) 0
σ2(E) 1 1 1 1
σ
*2
unde
σ *2 ( α X ) S 2 X − S 2 E 2 2 −1 = σ *2 ( α Y ) = ⋅ − A S S Y E * 2 S 2 − S 2 σ α E X .Y ( X ⋅Y ) X .Y a(1,1) A= a(2,1) a(3,1)
a(1,2)
a (1,3)
a (2,2)
a (2,3)
a (3,2)
a (3,3)
În cazul balansat avem: p(i,j)=p; pT=mnp; pX(i)=np; p Y(j)=mp; q=mn Tabelul sintetic de analiza varianţei are forma: Sursa de SPA GL variaţie X SPAX m-1 Y SPAY n-1 X.Y SPAX.Y (m-1)(n-1) E SPAE mn(p-1) T SPAT Mnp-1
S2
F
S 2X S 2Y S 2X.Y S 2E -
FX FY FX.Y -
Tabelul cu componentele de varianţă are forma particulară: M(S2) σ2(αX) σ2(αY) σ2(αX.Y) σ2(E) M(S2X) np 0 p 1 2 M(S Y) 0 mp p 1 2 M(S X.Y) 0 0 p 1 2 M(S E) 0 0 0 1 Un caz particular al analizei varianţei completă balansată este cel în care p=1, deci avem câte o singură repetiţie ataşată fiecărei perechi de variante (X(i), Y(j)). În acest caz avem T=(X,Y), iar E are GL E=0 grade de libertate, deci vom lua E=X.Y, deci SPAE=SPA(XY)-SPAX-SPAY şi GLE=GL(X,Y)-GLX-GLY. Tabelul sintetic de analiza varianţei are forma: Sursa de SPA GL Variaţie X SPAX m-1 Y SPAY n-1 E SPAE (m-1)(n-1) T SPAT mn-1
S2
F
S 2X S 2Y S 2E -
FX FY -
Tabelul cu componentele de varianţă are forma:
M(S2) M(S2X) M(S2Y) M(S2E)
σ2(αX)
σ2(αY)
σ2(E)
n 0 0
0 m 0
1 1 1
Exemplu: Fie X=proteina digestibilă în raţia porcilor la îngrăşat şi Y= unităţile nutritive în raţia porcilor la îngrăşat şi Z=sporul lunar în greutate (kg)al porcilor la îngrăşat. Luăm m=3 variante X=X1(250g/zi); X 2(275g/zi); X3(300g/zi) şi n=2 variante Y=Y1(2.5UN) şi Y2(3UN).Pentru fiecare combinaţie de variante (X,Y) luăm câte p=2 repetiţii Z. Avem tabelul cu date:
Repet Z Variante (X,Y) (X1, Y1)
Z(i,j,p(i,j))
Medii pe Variante (X,Y)
14; 14.2
MZ(1, 1)=14.1
Medii pe variante X
Medii pe variante Y
Media Totală
MZY(1)=15.17 (X1, Y2)
15.2; 15.6
MZ(1, 2)=15.4
(X2, Y1)
15; 15.4
MZ(2, 1)=15.2
MZX(1)=14.75
MZT=15.67 (X2, Y2)
16; 16.2
MZ(2, 2)=16.1 MZX(2)=15.65
(X3, Y1)
16.1; 16.3
MZ(3, 1)=16.2
(X3, Y2)
16.9; 17.1
MZ(3, 2)=17
MZY(2)=16.17 MZX(3)=16.60
ANUL I INGINERIE ECONOMICA DANIEL
Matematica si Statistica Aplicata in Agricultura
Etape de calcul : a) SPA şi GL: m
p
n
2 SPAT = ∑∑∑ [ Z (i, j , k ) − MZ T ] = 10.2268 cu GL T =mnp-1=11GL i =1 j =1 k =1 m
n
SPA( X ,Y ) = p ∑∑ [ MZ (i, j ) − MZ T ] = 9.9868 2
cuGL ( X ,Y ) =mn-1=5GL
i =1 j =1
SPA X = np
m
∑ [ MZ
X
(i ) − MZ T ] = 6.8468 cu GL X =m-1=2GL
i =1 n
SPAY = mp ∑ [ MZ Y ( j ) − MZ T = 1.9200 cu GL Y =n-1=1GL j =1
SPA X ⋅Y = SPA( X ,Y ) − SPA X − SPAY = 1.2200 cu GL X ⋅Y
= GL( X ,Y ) − GL X − GLY = 2GL SPA E = SPAT − SPA( X ,Y ) = 0.2400 cu GL E = GLT − GL( X ,Y ) = 6GL b) S2 :
SPA X
S X 2 =
GL X
= 3.4234;
SPA X ⋅Y
S X 2 ⋅Y =
GL X ⋅Y
= 0.61;
S Y 2 =
SPAY
S E 2 =
SPA E
GLY GL E
c) F: S X 2
F X =
= 85.585 cu (2;6) GL
S E 2 2
F Y =
S Y 2 E
S
F X ⋅Y =
= 48 cu (1;6) GL
S X 2 ⋅Y 2 E
S
= 15.25 cu (2;6) GL
9
= 1.9200 = 0.04
RUSE
ANUL I INGINERIE ECONOMICA DANIEL
F 0.01
Matematica si Statistica Aplicata in Agricultura
RUSE
Din tabelele Fisher 4,5,6 din Anexă ,găsim valorile critice pentru (2;6) GL : F 0.05 = 5.14 ; = 10.92 ; F 0.01 = 27 ;
Cum F X > F 0.001 se acceptă ipoteza H adică µ X (1), µ X (2), µ X (3) diferă foarte semnificativ între ele adică influenţa variaţiei lui X asupra variaţiei lui Z este foarte semnificativă deci F x = 85.585 * * * . Cum F 0.01 < F X ⋅Y < F 0.001 se acceptă ipoteza H adică influenţa variaţiei interacţiunii X ⋅ Y asupra variaţiei lui Z este distinct semnificativă deci F X ⋅Y = 15.25 * * . Din tabelele Fisher 4,5,6 din Anexă, găsim valorile critice pentru (1,6) GL : F 0.05=5.99, F 0.01 = 13.74; F 0.001 = 35.51. Cum F Y > F 0.001 se acceptă ipoteza H deci µY (1), µ Y (2) diferă foarte semnificativ între ele adică influenţa variaţiei lui Y asupra variaţiei lui Z este foarte semnificativă deci F Y = 48 * * * . Tabelul sintetic de analiza varianţei este : Sursa de Variaţii Grade de Variaţie pătratice libertate (GL) (SPA) X 6.8468 2 Y 1.9200 1 X ⋅ Y 1.2200 2 E 0.2400 6 T 10.2268 11 Indicii de corelaţie sunt:
I c ( X ) = I c ( X .Y ) =
SPA X SPAT
SPA X ⋅Y SPAT
= 0.818***; I c (Y ) =
Varianţe ( S )
Rapoarte Fisher (F)
3.4234 1.9200 0.6100 0.400 -
85.585*** 48*** 15.25** -
2
SPAY SPAT
= 0.433*** ;
= 0.345**.
Aporturile variaţiilor lui X,Y, X ⋅ Y la variaţia lui Z,socotită egală cu 100 %, sunt: A X
=
SPA X SPAT
= 66.9%;
AY
=
SPAY SPAT
= 18.8%;
A X ⋅Y
= 11.9%.
Aportul variaţiei erorii la variaţia lui Z este: A E = 1 − A X − AY − A X ⋅Y = 2.4%. Testele Cochran şi Tukey se efectuează ca în secţiunea 5.1. Calculele precedente privitoare la analiza varianţei bifactorială completă balansată în populaţii omogene cu p repetiţii în celulă, pot fi făcute în EXCEL astfel : 10
ANUL I INGINERIE ECONOMICA DANIEL
Matematica si Statistica Aplicata in Agricultura
RUSE
Depunem în foaia de calcul Nr.1 datele în blocul de celule A 1:D5 asfel : A 1 2 3 4 5
Y1 Y2
B X1 14 14.2 15.2 15.6
C X2 15 15.4 16 16.2
D X3 16.1 16.3 16.9 17.1
Deschidem fereastra TOOLS în care activăm opţiunea DATA ANALYSIS Aici activăm opţiunea ANOVA:TWO-FACTOR WITH REPLICATION în care declarăm blocul de celule cu date A1:D5 şi numărul p=2 de repetiţii (replicate). Rezultatele se găsesc fie în foaia de calcul Nr. 2 ,fie tot în foaia de calcul Nr.1, prin declararea ca celule de rezultate , a altor celule decât cele din blocul de date A1:D5
11