2.4. PTRATUL LATIN I GRECO-LATIN ÎN ANALIZA DATELOR Ptratul latin reprezint un plan experimental incomplet pentru analiza a trei factori prin folosirea unui model trifactorial ANOVA, în cazul verificat al lipsei interaciunii între factori. În acest fel se msoar efectele pe care le au diferitele nivele ale anumitor variabile simultan, în timp ce efectele altor variabile ar trebui meninute la un nivel constant, sau aa cum se întâmpl în prelucrrile obinuite, ignorate i considerate fr o influen esenial asupra rezultatelor proiectrilor experimentale. Construcia ptratelor latine se bazeaz pe teoria corpurilor Galois, iar denumirea lor provine de la folosirea litere lit erelor lor din alfabetul latin lati n pentru desemnarea nivelelor factorului al treilea (tratamentul). Organizarea experimentului dup aceast metod presupune împrirea în Ä n³ tratamente, Än³ rânduri i Än³ coloane astfel încât fiecare tratament s apar o singur dat în fiecare fiecar e rând sau coloan corespunztoare cor espunztoare nivelurilor niveluril or celor dou variabile independente independe nte (respectiv din rând i coloan). Tratamentele vor fi distribuite în mod aleator în celulele tabelului dar niciodat pe linie ori coloan nu vom avea aceeai liter. Tabelele pot avea diverse diverse forme: f orme: TABEL 2 9
TABEL 2.10
TABEL 2.11
A
B
C
C
B
A
D
A
B
C
D
E
B
C
A
B
C
D
A
B
C
D
E
A
C
A
B
A
D
C
B
C
D
E
A
B
D
A
B
C
D
E
A
B
C
E
A
B
C
D
Spre exemplu, Primria dorete s aprecize, înainte de diversele licitaii pentru obinerea dreptului de folosire a panourilor publicitare, Ävaloarea³ amplasamentului acestora în locurile amenajate în acest scop. scop. Pentru o firm care liciteaz, Tabelul Tabelul 2.9 poate conine a) pe linii cele trei alternative pentru zona în care sunt amplasate: centru, intermediar, periferie; b) în coloana întâia zilele cuplate (sau oricare) luni, mari i miercuri ca începutul sptmânii de lucru, considerând similitudini în comportamentul Äsubiecilor³ în aceste zile dar deosebiri fa de cele din coloana a II-a, care cuprinde zilele joi i vineri, sau de Äweekend³ din coloana a III-a, zilele sâmbt i duminic. Ä Tratamentul³ poate consta din trimiterea unor observatori (studeni sau personal auxiliar instruit) în cursul dimineii (alternativa A), zilei (B) sau serii (C). Problema const în utilizarea eficient eficient a resurselor resurselor umane i de timp ori bani. bani. În loc loc de a obine informaii privind numrul de ceteni, maini mici i mari care se deplaseaz prin faa panourilor panour ilor în discuie din 3 zone x 3 Äzile omogeneÄ x 3 segmente segment e ÄomogeneÄ Äomogen eÄ ale zilei, ce înseamn 27 de surse de date ce trebuie investigate, experimentatorul care utilizeaz ptratele latine consider c sunt suficiente doar 9. Sigurana acestei convingeri rezult din proiectarea atent i tratamentul tratamentul adecvat al acestor surse. Astfel în zonele zonele cercetate nu se fac observaii observaii în toate zilele i la orice or, ci dup o planificare experimental atent spre exemplu: în zona central, la începutul sptmânii doar dimineaa (tratament A), în timpul sptmânii, la prânz i în weekend doar seara, în timp ce simultan, în zona a II-a (intermediar), la începutul sptmânii în timpul prânzului, în zilele de joi-vineri, seara; pentru zonele situate în periferie, la începutul sptmânii, seara, în timpul sptmânii, dimineaa, iar în weekend, la mijlocul zilei.
68 Analiza dispersional
Una dintre ipotezele importante de lucru este aceea c între variabilele analizate (inclusiv cu tratamentul) nu exist interaciuni. Panourile publicitare pot fi vzute în orice fel de zon în orice perioad de timp din sptmân sau zi. Dar poate c importante pentru Primrie sunt panourile plasate pe 4 mari artere de circulaie identificate ca fiind interesante pentru strbaterea localitii cercetate. De altfel, nu zilele sau chiar sptmânile sunt importante deoarece închirierea se face pe termen lung, aa c variabila din coloan trebuie s fie alta, spre exemplu poziia panoului publicitar (pe trotuar, la nivelul de 3-5 m, 5-8 m i peste 8 metri. ÄTratamentul³ poate consta în locul în care este situat panoul în sensul A-foarte aproape de centru, B-la distan de 2 km de centru, C-5 km de centru, D-foarte departe de centru. Aceasta înseamn c vom avea (pentru tabelul 210): 4 rânduri v 4 coloane v 4 forme ale tratamentului = 4 3 = 64 observaii. Aceste 64 de observaii se reduc la 16 deoarece avem 4 forme ale tratamentului (A, B, C, D) iar tratamentul este unul singur! Rezult c vom avea: 16 date observate în tabel = 4 2 = n2 uniti de test. Prin intermediul acestui tip de proiectare pot fi controlate simultan dou sau mai multe variabile independente care pot afecta concret rspunsul unitilor experimentale. Acest control simultan permite înlturarea efectelor variabilelor respective asupra erorii experimentale. Calculele analizei dispersionale împart dispersia total în efectele distincte ale tratamentului, coloanei, rândului i eroarea experimental.
Rolul ptratelor latine în studiile de pia este acela c prin organizarea experimentului se reduc cheltuielile materiale i umane (datorit tratamentului) iar controlul simultan permite înlturarea efectelor variabilelor de segmentare alese asupra erorii experimentale.
În cazul de mai jos, scopul este acela ca Primria s estimeze valoarea locurilor unde vor fi plasate postere i pe care le va închiria ctre firmele de publicitate din ora. Pentru aceasta, trebuie fcute msurtori ale traficului dus-întors din dreptul acelui loc unde va fi instalat posterul. Pentru a rezolva aceast problem trebuie s se apeleze la proceduri manageriale de organizare i control precum i la proceduri de experimente statistice pentru implementarea programului de lucru i obinerea datelor la faa locului i nu în ultimul rând, tratarea datelor pentru obinerea de informaii i cunotine. Definim problema drept nevoia de a msura ori evalua i ierarhiza punctele de trafic unde merit s fie afiate posterele. Aceasta înseamn Änumrarea³ persoanelor, mainilor mari-mici-medii, autobuzelor i sistematizarea informaiilor rezultate din datele culese la faa locului. Ipotezele de lucru sunt: (1) rezultatele msurtorilor difer lunar sau la un interval de timp de dou luni i în mod sigur, cele fcute primvara difer de cele fcute vara i mai ales în cursul unei zile; (2) rezultatele msurtorilor în locuri diferite variaz în zilele unei sptmâni (Luni de Mari, Miercuri«); (3) iar ziua de Luni din prima sptmân a lunii difer, ca trafic de ziua de Luni de celelalte ale lunii; (4) conceptul de Ämedie³ ascunde diferenele i nu corespunde realitii spre exemplu gospodin medie, salariu mediu, cultur medie, etc. TABELUL 2.12 Ore 6-9 S1 Joi
9 ± 12 12 ± 15 15 ± 18 Sâmbt Vineri Luni
18 ± 21 21 ± 23 Miercuri Mari
69
Analiza dispersional S2 Sâmb-t Vineri Joi Miercuri Mari Luni S3 Vineri Miercuri Mari Joi Luni Sâmbt S4 Luni Mari Miercuri Sâmbt Vineri Joi S5 Miercuri Joi Luni Mari Sâmbt Vineri S6 Mari Luni Sâmbt Vineri Joi Miercuri Not: S semnifica Äsector´ la care este ataat numrul sect.
Modelul matematic este urmtorul: x ijk = + i + j + k + ijk ,
i = j = k n !
(2.67)
în care fiecare variabil observat xijk este egal cu o medie a populaiei care sufer abaterea liniei E i , abaterea coloanei F j , abaterea datorat tratamentului K k i a unei erori experimentale ijk .
Dup ilustrarea a înc dou exemple de ptrate greco ±latine tabelele 2.13 i 2.14, pentru exemplificare vom reduce problema la ptratul latin 4*4*4.
TABELUL 2.13 / TABELUL 2.14 Ore ect. 1 Sect. 2 Sect. S
3 S
4 S
ect. ect.
5 ect. 6 PAN OU S
6-9 A / Joi
9-12 B/ Sâmbt C / Vineri
12 - 15 15 ± 18 18 - 21 21 - 23 C/ D / Luni E / Mier- F / Marti Vineri curi B/ A / Joi E/Mier- F / Marti D / Luni Sâmbt curi C/ E / Mier- F / Marti A / Joi D / Luni B/ Vineri curi Sâmbt D / Luni F / Marti E/Mier- B / C / Vineri A / Joi curi Sâmbt E/Mier- A / Joi D /Luni F / Marti B / C curi Sâmbt /Vineri F / Marti D /Luni B / C/ A / Joi E/MierSâmbt Vineri curi A = B= C= D= E= F= 1, 7, 13 2, 8, 14 3,9,15 4,10,16 5,11,17 6,12,18
LH
A
B
C
D
E
F
G
S 1
LH
D\
S F
V K
J P
M E
m]
S 2
D\
V E
M P
J F
S ]
mH
LK
S 3
J P
S K
V E
M ]
m\
L F
DH
S 4
V K
M H
J ]
mP
LE
D\
S F
S 5
M F
J P
mK
LE
DH
S ]
V \
S 6
S ]
m F
L\
DH
M K
V P
J E
U
mE
L]
DH
S \
V F
J K
M P
Se explicitez seturile de ipoteze statistice pentru situaia descris la începutul acestui subpunct pentru tabelul 2.15.:
70 Analiza dispersional
TABELUL 2.15 Zona OBS.
Reperele orare 800-1200 1200-1600
Zona 1 85 Zona 2 73 Zona 3 75 Zona 4 82 T.j 315
B D
79
C A
78
81 70 308
1600-2000 2000-2400
A B
76
D C
92
84 79 331
C A
78 D
B D
83 A
Ti. 318 313
75 C
28 321 1.280 3
90 B 326
Legend: A ± Luni, B ± Mari, C ± Miercuri, D ± Joi.
Rând (zona interviului) H0 numrul de persoane care îi amintesc reclama este aproape acelai indiferent de zon; () i , Ei = 0
H1
numrul de persoane care îi amintesc reclama este diferent, în zone diferite. ( ) i , Ei
{
0
Coloan (reperele orare) H0 numrul de persoane care îi amintesc reclama este semnificativ statistic egal cu media, indiferent de reperele orare; ( ) j , F j = 0
H1
numrul de persoane care îi amintesc reclama este diferit, pe repere orare diferite. () j , F j { 0
Tratament (ziua din sptmân) H0 numrul de persoane care îi amintesc reclama este aproape acelai indiferent de ziua din sptmân;
H1
( ) k , K k = 0
numrul de persoane care îi amintesc reclama este diferit în zile diferite; () k , K k { 0 Se calculeaz numrul de grade de libertate df 1 pentru fiecare factor de influen i numrul de grade de libertate df 2 pentru întregul tabel. df 1 = r - 1 = c - 1 = k - 1 = n - 1 = 4 - 1 = 3 df 2 = (n2 - 1) - (r - 1) - (c - 1 ) - (k - 1) = n2 - 3n + 2 = (n - 1)(n - 2) = 6 pentru = 0,05 avem Ft(3,6) = 4,76 Se determin factorul de corecie C:
71
Analiza dispersional
T i2 j C= r c
(2.67)
2
C !
1.280 = 102.400 16
Se determin suma ptratelor pe fiecare factor de influen m
§
SPR =
T i2. c
i =1
SPR !
3182 + ...... + 3212 - 102.400 = 30 4 n T2 . j
§
SPC =
r
j = 1
SPC !
(2.68)
-C
(2.69)
-C
3152 + ....... + 3262 - 102.400 = 82 4
Se calculeaz suma ptratelor SP pe tratament, care este cel de-al treilea factor. Pentru aceasta, vom calcula numrul totalul de persoane care i-au amintit reclama pe zi, indiferent de loc sau moment al zilei. Luni Mari Miercuri Joi Total general,
A = 79 + 84 + 83 + 82 = 328; B = 92 + 90 + 85 + 81 = 348; C = 76 + 70 + 75 + 75 = 296; D = 79 + 78 + 73 + 78 = 308; = 1.280.
Se determin suma ptratelor tratamentului: tr
SPTratament =
§
k = 1
T 2trat k
-C
(2.70)
2 + ..... + 3082 328 SPTratament ! - 102.400 = 392 4
Se determin suma ptratelor pe întregul tabel: m
SPT = §
n
§ x ij2 - C
i =1 j = 1
SPT ! 85 2 + 73 2 + ... + 90 2 - 102.400 = 524
(2.71)
72 Analiza dispersional
Se determin suma ptratelor pe eroarea experimental:
PE = SPT - SPR - SPC ± SPTratament
S
(2.72)
SPE = 524 - 30 - 82 - 392 = 20 Se determin media ptratelor MP fiecrui factor de influen : SPR
MPR =
(2.73)
df 1
MPR =
MPC =
30 = 10 3 SPC
(2.74)
df 1 82 MPC = = 27.33 3
MPTratamen t = MPTratament !
392 3
SPTratamen t
(2.75)
df 1
= 130,67
Se determin media ptratelor pentru eroarea experimental: MPE =
SPE df 2
(2.76)
20 = 3,33 6 Se determin raportul Fisher calculat pentru fiecare factor de influen (folosind formulele 2.18, 2.27).: MPR F r = MPE MPE =
F r = Fc =
10 3,33
= 3,00
MPC MPE
Fc =
27,33 = 8,21 3,33
73
Analiza dispersional F tratament =
MPTratamen t MPE
(2.77)
130,67 = 39,24 F tratament ! 3,33 Se compar valoarea tabelar cu valoarea calculat: Fr < 4,76; Fc > 4,76; Ftratament > 4,76 Concluziile sunt urmtoarele: nu sunt diferene semnificative între cei ce i-au reamintit reclamele ei fiind intervievai în zone diferite în schimb ziua este variabila care arat diferene semnificative, se pare c mari i luni memoria este mai proaspt fa de joi i miercuri, iar diferene mai mici dar semnificative statistic se regsesc la nivelul orelor în cursul zilei. Calculele realizate utilizând ANOVA prin Microsoft®EXCEL sunt redate cu explicaiile de rigoare în textul integrat mai jos