7. Metode za testiranje hipoteze Statističke metode (testovi) za testiranje hipoteze mogu da se podele u dve grupe: parametarske i neparametarske. Osnovna pretpostavka za parametarske testove je da je poznata raspodela popu popula laci cije je,, za razl razlik iku u od nepa neparam ramet etar arsk skih ih test testov ova a koji koji ne uzim uzimaj aju u u obzir obzir tip tip raspo raspodel dele. e. I parametarski i neparametarski testovi mogu da se koriste za testiranje hipoteze za jednu, dve ili vie populacija.
7.1. Testiranje Testiranje hipoteze za srednju vrednost jedne populacije !estiranjem hipoteze za srednju vrednost jedne populacije dokazujemo da li uzorak čija je srednja srednja vrednost vrednost " potiče potiče iz popula populacij cije e čija čija je srednja srednja vrednos vrednostt #. $ tu svrhu korist koristimo imo z%test z%test i Studentov t%test, a razlika izme&u ova dva testa je u tome to se z%test primenjuje kada je poznata standardna devijacija (') populacije, a t%test kada standardna devijacija populacije nije poznata. I za jedan i za drugi test je osnovna pretpostavka da su podaci normalno distribuirani.
z-Test ao to je ve rečeno z%test se koristi kada je poznata standardna devijacija ' populacije i kada su podaci normalno distribuirani. distribuirani. *ko je zaključak z%testa da se nulta hipoteza hipoteza prihvata, to znači da postoji velika verovatnoa da uzorak čija je srednja vrednost " potiče iz populacije sa srednjom vrednou #, odnosno da razlika izme&u " i # nije statistički značajna. $ suprotnom, uzorak sa srednjom srednjom vrednou vrednou " ne potiče iz populacije populacije sa srednjom srednjom vrednou # i razlika izme&u " i # je statistčki značajna. z%!est z%!est mo+e da se primeni kao jednostrani jednostrani i kao dvostrani, dvostrani, a izraz za izračunavanje izračunavanje vrednosti z glasi: z
"
Dvostrani z-test PRIMER 1. -eklarisana te+ina kutija sa čajem je // g, a merenjem 01 kutija dobijena je srednja
vrednost " 2 /1,3 g. Od ranije je poznato poznato da je standardna standardna devijacija devijacija za ovu populaciju populaciju ' 2 41 g. *ko +elimo da testiramo hipotezu da je izračunata srednja vrednost (srednja vrednost uzorka " ) jednaka deklarisanoj vrednosti (srednja vrednost populacije 5), postaviemo sledeu nultu i
A%0
Statistika u farmaciji/medicinskoj biohemiji
alternativnu hipotezu: 6/ : # 2 // , odnosno 64 : # 7 //. 4 Odabrani nivo značajnosti je 8 2 /,/1, a kada ove podatke uvrstimo u izraz za z dobijamo: z
"
./1,3 .// 41
1,3 .
4,9/
01
oristei tablicu standardizovane normalne raspodele vidimo da su granične vrednosti z koje odvajaju /,/01 delova povrine sa jedne i druge strane krive (regioni za odbacivanje hipoteze) jednake 4.;< i =4,;<, iz čega proizilazi da se vrednost z 2 4,9/ nalazi u regionu za prihvatanje hipoteze. -rugim rečima, donosimo odluku da se nulta hipoteza prihvata za odabrani nivo značajnosti, a zaključak je da ima dovoljno dokaza da je izračunata srednja vrednost uzorka jednaka srednjoj vrednosti populacije # 2 // g (odnosno, kutije sa čajem imaju tra+enu te+inu).
>rednost p koja odgovara izračunatoj vrednosti z je p(z ? %4,9/ i z @ 4,9/) 2 /,4<. -o ove vrednosti se dolazi tako to se u tablici normalne raspodele prona&e vrednost za povrinu levo od vrednosti z 2 %4,9/, to iznosi /,/1; i desno od z 2 4,9/ (4 = /,;<3A 2 /,/1;). Sabiranjem ove dve povrine (jer se radi o dvostranom testu) dobija se vrednost p 2 /,/A49, koja predstavlja verovatnou za ovaj primer. ako je p 2 /,/A49 @ 8 2 /,/1, nulta hipoteza se ne prihvata.
Iz ovog primera se vidi da se kod dvostranog z testa nulta hipoteza prihvata ako je izračunata vrednost z izme&u kritičnih vrednosti za izabrani nivo značajnosti 8 (manja je po apsolutnoj vrednosti od kritičnih vrednosti), odnosno ako je dobijeni nivo značajnosti p vei od izabranog nivoa značajnosti 8.
4
$ nultoj i alternativnoj hipotezi su # i // (a ne " i /1,3), zato to testiramo hipotezu da li je srednja vrednost populacije # jednaka očekivanoj vrednosti //, a to radimo koristei uzorak.
A%
S. Spasić: Predavanja 2008/2009.
Jednostrani z-test
I kod jednostranog, kao i kod dvostranog z%testa osnovna pretpostavka je da je raspodela normalno distribuirana i da je poznata varijansa populacije. ulta hipoteza ima znak ? ili @, a alternativna znak B ili C. Da izračunavanje z koristi se izraz koji je ve naveden, a nulta hipoteza se prihvata ako je: kod desnostranog testa izračunato z manje od kritične vrednosti koja odvaja region za odbacivanje za odabrani nivo značajnosti i kod levostranog testa ako je z vee od kritične vrednosti koja odvaja region za odbacivanje za odabrani nivo značajnosti. oristei podatke iz Erimera 4. mo+emo da testiramo hipotezu da je dobijena srednja vrednost te+ine sa čajem vea od deklarisane i u tom slučaju postaviemo sledeu nultu i alternativnu hipotezu: 6/ : # ? // , odnosno 6 * : # B // 0. Odabrani nivo značajnosti je i u ovom slučaju 8 2 /,/1, a koristei gornji izraz dobijamo istu vrednost z kao i u primeru 4.: PRIMER 2.
z
"
./1,3 .// 41
1,3 .
4,9/
01
od jednostranog testiranja hipoteze cela povrina regiona za odbacivanje hipoteze nalazi se sa jedna strane raspodele, u ovom slučaju sa desne. oristei tablicu standardizovane normalne raspodele vidimo da je granična vrednosti z koja odvaja /,/1 delova povrine sa desne strane raspodele (region za odbacivanje hipoteze) jednaka 4,<31 , iz čega proizilazi da se vrednost z 2 4,9/ nalazi u regionu za odbacivanje hipoteze. $ ovom slučaju donosimo odluku da se nulta hipoteza ne prihvata za odabrani nivo značajnosti, a zaključak je da nema dokaza da je izračunata srednja vrednost manja ili jednaka srednjoj vrednosti populacije 5 2 // g (odnosno kutije sa čajem imaju značajno veu te+inu od očekivane).
>rednost p koja odgovara dobijenoj vrednosti z je p(z @ 4,9/) 2 /,/1;. -o ove vrednosti se dolazi tako to se u tablici normalne raspodele prona&e vrednost za povrinu desno od z 2 4,9/ to iznosi 4 = /,;<3A 2 /,/1;. ako je p 2 /,/1; C 8 2 /,/1, nulta hipoteza se ne prihvata.
Eotrebno je pokazati da li je te+ina kutija sa čajem vea od // g, pa znak B ide u alternativnu hipotezu, a u nultu hipotezu znak ? , jer nult hipoteza podrazumeva da razlike nema, odnosno u ovom slučaju da je te+ina jednaka ili manja od // g. 2
A%3
Statistika u farmaciji/medicinskoj biohemiji
ao zaključak mo+e da se ka+e da se u ovom primeru nulta hipoteza ne prihvata zato to je izračunata vrednost z vea od kritične vrednosti z za izabrani nivo značajnosti 8 2 /,/1, odnosno zato to je izračunati nivo značajnosti p manji od izabranog nivoa značajnosti 8 2 /,/1.
!tudentov t-test !eorija normalne raspodele je razvijena iz velikog broja podataka i ne mo+e da se primeni kada je uzorak mali. ako praktičnim radom često ne mo+e da se dobije veliki broj podataka, primena statističkih testova baziranih na normalnoj raspodeli dovee do pogrenih zaključaka. Ovo je uočio irski hemičar F.S.Gosset, koji je razvio teorijsku raspodelu verovatnoe slučajne promenljive t za mali broj podataka uzetih iz normalne raspodele. Svoju teoriju je objavio 4;/9. godine pod pseudonimom HStudentH, tako da je ova raspodela nazvana Student%t raspodela. ada se radi sa malim brojem podataka nisu poznate prave vrednosti populacione standardne devijacije ' i srednje vrednosti #, tako da se u tom slučaju ' zamenjuje standardnom devijacijom uzorka % Sd, a # se zamenjuje sa " . $ ovom slučaju mora da se koristi nova raspodela koja nije zavisna od ', a Gosset je pokazao da je ona zavisna samo od broja podataka. Eostoji beskonačno mnogo t%krivih i sve zavise od broja podataka. *ko je broj podataka , onda t%krive identiikujemo preko broja stepena slobode (J ili d) koji iznosi %4. t%rive za različit broj stepena slobode razlikuju se izme&u sebe, ali su sličnog oblika. t%raspodela se pribli+ava normalnoj raspodeli kada se poveava broj podataka, a sasvim e se poklopiti kada broj podataka bude beskonačno veliki (sl. 4.).
!li"a 1. !tudentova t-"riva i standardna nor#alna raspodela
oncept t%raspodele je osnova za sve testove značajnosti kojima se upore&uju dve srednje vrednosti dobijene iz malog broja podataka. ritične vrednosti za veličinu t date su u obliku tabele za odre&eni broj stepena slobode i različite nivoe verovatnoe, a izvedene su na isti način kao i vrednosti u tabeli za standardizovanu normalnu raspodelu, odnosno iz povrine ispod t%krive. ao granica za prihvatanje ili odbacivanje nulte hipoteze najčee se koristi tablična vrednost t za verovatnou /,/1 je. *ko je izračunata vrednost t vea od tablične za verovatnou /,/1 i odre&eni broj stepena slobode, tada se nulta hipoteza odbacuje, odnosno razlika izme&u dve srednje vrednosti je statistički značajna, i obrnuto.
S. Spasić: Predavanja 2008/2009.
A%1
Dvostrani t-test
od dvostranog t%testa polazimo od pretpostavke da je raspodela normalno distribuirana i da standardna devijacija populacije nije poznata, tako da se koristi standardna devijacija uzorka. od ovog testa nulta hipoteza ima uvek znak 2, a alternativna znak 7. Da izračunavanje t%vrednosti koristi se sledei izraz: t2
" Sd
Izračunata vrednost t upore&uje se sa tabličnom za odabrani nivo značajnosti i odgovarajui broj stepena slobode. Kroj stepena slobode J za ovaj izraz jednak je %4. $koliko je izračunata vrednost t vea od tablične za izabrane kriterijume zaključak je da je razlika statistički značajna, odnosno nulta hipoteza se ne prihvata (odbacuje) i obrnuto. PRIMER $.: $ kontrolnom uzorku seruma, čiji je sadr+aj natrijuma 41 mmolLM (srednja vrednost
populacije 5), odre&en je natrijum 4< puta metodom plamene otometrije. Iz dobijenih podataka izračunata je srednja vrednost " 2 41,9 mmolLM sa standardnom devijacijom Sd 2 0,/3 mmolLM (srednja vrednost i standardna devijacija uzorka). Eoto nije poznata standardna devijacija populacije, ve samo standardna devijacija uzorka, koristimo t%test. !estiramo hipotezu da je dobijena srednja vrednost jedna"a očekivanoj vrednosti (srednjoj vrednosti populacije 5). Neenje: 6ipoteza se testira dvostranim testom, pa nulta i alternativna hipoteza glase: 6/ : # 2 41 i 64 : # 7 41. Ostali podaci su: J 2 4< = 4 2 41, 8 2 /,/1 , 2 4< , " 2 41,9 mmolLM, Sd 2 0,/3 mmolLM.
t2
4.1,9 % 4.1 0,/3
2
/,9 /,14
2 4,1<;
4<
!ablična vrednost t za J241 i p2/,/1 jednaka je 0,44, a kako je izračunata vrednost t manja, nulta hipoteza se prihvata i zaključak je da je dobijena srednja vrednost uzorka jednaka srednjoj vrednosti populacije (ili izme&u dobijene srednje vrednosti i očekivane vrednosti sadr+aja natrijuma u standardnom uzorku a seruma nema značajne razlike.
>e je ranije rečeno da t%raspodela zavisi od broja podataka, a to se direktno odra+ava na tumačenje rezultata. Eretpostavimo da je u prethodnom primeru broj podataka bio < (umesto 4<) i tada bi vrednost t bila jednaka:
A%<
Statistika u farmaciji/medicinskoj biohemiji
t2
4.1,9 % 4.1 0,/3
2
/,9 /,.3
2 0,.1
.<
ritična vrednost t za J21; i 82/,/1 iznosi 0,//, a kako je izračunata vrednost t vea od nje, zaključak je da se nulta hipoteza ne prihvata. Iako je izračunata srednja vrednost ista kao u prethodnom primeru, zaključak je suprotan upravo zbog veeg broja podataka.
Jednostrani t-test
I kod jednostranog, kao i kod dvostranog t%testa osnovna pretpostavka je da je raspodela normalno distribuirana i da standardna devijacija populacije nije poznata, pa se za izračunavanje koristi standardna devijacija uzorka. ulta hipoteza ima znak ? ili @, a alternativna znak B ili C. Da izračunavanje t koristi se izraz koji je naveden kod dvostranog testa, a nulta hipoteza se ne odbacuje ako je: kod desnostranog testa izračunato t manje od kritične vrednosti koja odvaja region za odbacivanje za odabrani nivo značajnosti i kod levostranog testa ako je t vee od kritične vrednosti koja odvaja region za odbacivanje za odabrani nivo značajnosti. PRIMER %.: Eroblem iz Erimera mo+emo da testiramo i jednostranim t%testom, pa testiramo hipotezu da je dobijena srednja vrednost vea od očekivane vrednosti (srednje vrednosti populacije
# 2 41). ulta i alternativna hipoteza glase 6/ : # ≤ 41 i 64 : # B 41. Ostali podaci su isti kao u Erimeru 1: J 2 4< = 4 2 41, 8 2 /,/1, 2 4<, " 2 41,9 mmolLM, Sd 2 /,;A mmolLM Izračunata vrednost t je ista kao u Erimeru 1: t2
4.1,9 % 4.1 0,/3
2
/,9 /,14
2 4,1<;
4<
ritična vrednost t za jednostrani test J241 i 82/,/1 iznosi 4,A1, a kako je izračunata vrednost t manja od nje, zaključak je da se nulta hipoteza prihvata. -rugim rečima izračunata srednja vrednost nije značajno vea od očekivane vrednosti.
A%A
S. Spasić: Predavanja 2008/2009.
7.2. Testiranje hipoteze za proporciju jedne populacije !estiranje hipoteze za srednju vrednost se koristi kada su podaci izra+eni skalom odnosa ili intervalnom skalom, jer se kod tih podataka izračunava srednja vrednost. ategorički podaci se grupiu i izra+avaju najčee kao proporcija (procenat), a za testiranje hipoteze da je proporcija neke varijable izračunata iz uzorka jednaka proporciji te varijable u populaciji koristi se z%test za proporciju. Ere izračunavanje vrednosti z, proverava se da li podaci slede normalnu raspodelu korienjem izraza p @ 1 i (4 % p) @ 1, gde je p = proporcija koja se testira >rednost z se izračunava iz izraza z
ps
p
p (4 p ) , n
gde je ps proporcija izračunata iz uzorka, a p je proporcija koja se testira. PRIMER &.' Eretpostavimo da sistem za pakovanje tableta daje 4/P neispravnih pakovanja i
mora da bude zamenjen novim. orienjem novog sistema u slučajnom uzorku od 0// kutija dobijeno je 44 neispravnih pakovanja. !estiramo hipotezu za 8 2 /,/1 da novi sistem daje jedna" broj neispravnih pakovanjaQ Neenje: Ervo se proverava da li je zadovoljen uslov da podaci slede normalnu raspodelu: p 2 0///,4 2 0/ @ 1 (4 % p) 2 0// (4%/,4) 2 49/ @ 1 Eoto je uslov zadovoljen postavljamo nultu i alternativnu hipotezu: 6 / : p 2 /,4 i 64 : p 7 /,4 Ostali podaci su: 2 0// 8 2 /,/1 p 2 /,4 ps 2 44L0// z
ps
p
44 0//
/,4/
p (4 p)
/,4/ (4 /,4/)
0//
0,40
Izračunata vrednost z je manja od %4,;< i nalazi se u regionu za odbacivanje, pa je zaključak da se nulta hipoteza ne prihvata, odnosno novi sistem za pakovanje ne daje jednak broj neispravnih pakovanja kao stari sistem.
A%9
Statistika u farmaciji/medicinskoj biohemiji
Eroblem u Erimeru 1 mo+e da se reava i kao jednostrani test, pa testiramo hipotezu da novi sistem daje #anji broj neispravnih pakovanjaQ Neenje: ulta i alternativna hipoteza glase: 6/ : p @ /,4 i 64 : p C /,4 Ostali podaci su isti kao u Erimeru A: 2 0// 8 2 /,/1 p 2 /,4 ps 2 44L0// 44 z
ps
p
0//
/,4/
p (4 p)
/,4/ (4 /,4/)
n
0//
0,40
Izračunata vrednost z je manja od %4,<31 (kritična vrednost z za jednostrani test i nivo značajnosti /,/1) i nalazi se u regionu za odbacivanje, pa je zaključak da se nulta hipoteza ne prihvata, odnosno sistem ne daje vei ili jednak broj neispravnih pakovanja (tako glasi nulta hipoteza). $ ovom slučaju va+i alternativna hipoteza koja ka+e da sistem daje manji broj neispravnih pakovanja, to znači da je razlika u broju neispravnih pakovanja izme&u starog i novog sistema značajna.
7.$. Testiranje hipoteze za srednje vrednosti dve nezavisne populacije !estiranje hipoteze za srednje vrednosti dve populacije podrazumeva testiranje razlike izme&u srednjih vrednosti dve nezavisne populacije, a u tu svrhu se koriste z%test i t%test. Osnovna pretpostavka za primenu ova dva testa je da su populacije normalno distribuirane i da su nezavisne jedna od druge.
z-Test za srednje vrednosti dve nezavisne populacije z%!est se i u ovom slučaju se primenjuje kao jednostrani ili kao dvostrani, uz pretpostavku da su raspodele obe populacije normalno distribuirane, da su nezavisne jedna od druge i da je poznata standardne devijacije obe populacije. Izraz za izračunavanje vrednosti z glasi:
A%;
S. Spasić: Predavanja 2008/2009.
z
"4
"0
0
'4
0
4
'0 0
ulta i alternativna hipoteza mogu da se postave na dva načina: 4. -vostrani z%test 6/ : #4 2 #0 = dve srednje vrednosti su jednake i 64 : #4 7 #0 = dve srednje vrednosti su različite ili 6/ : #4 % #0 2 / = razlika izme&u dve srednje vrednosti je jednaka nuli i 64 : #4 % #0 7 / = razlika izme&u dve srednje vrednosti je različita od nule. ulta hipoteza se prihvata ako je izračunato z manje od kritične vrednosti z koja odvaja desni region za odbacivanje, odnosno vee od kritične vrednosti z koja odvaja levi region za odbacivanje, za odabrani nivo značajnosti. 0. -esnostrani z%test 6/ : #4 ≤ #0 i 64 : #4 B #0 ili 6/ : #4 % #0 ≤ / i 64 : #4 % #0 B / ulta hipoteza se prihvata ako je izračunato z manje od kritične vrednosti koja odvaja region za odbacivanje za odabrani nivo značajnosti. . Mevostrani z%test 6/ : #4 ≥ #0 i 64 : #4 C #0 ili 6/ : #4 % #0 ≥ / i 64 : #4 % #0 C / ulta hipoteza se prihvata ako je z vee od kritične vrednosti koja odvaja region za odbacivanje za odabrani nivo značajnosti. PRIMER (.' Iz jedne serije tableta uzeto je 01 komada (4 2 01) i u njima je odre&en sadr+aj
aktivne supstance. Iz dobijenih podataka izračunata je srednja vrednost " 4 2 4/0 mg, a od ranije je poznato da je standardna devijacija populacije '4 2 0,1 mg. Iz druge serije tableta tako&e je uzeto 01 kom (0 2 01), a srednja vrednost sadr+aja aktivne supstance u njima je " 0 2 ;A mg, sa istom standardnom devijacijom '0 2 0,1 mg. !estiramo hipotezu za nivo značajnosti 8 2 /,/1 da su srednje vrednosti dve poluacije jednake: 6/ : #4 2 #0 i i 64 : #4 7 #0 . >rednost z je jednaka: z
"4 " 0 0 4
4
0 0
0
4/0 ;A 0,1
0
01
0,1
0
1 /,A/A
A,/A
01
ritične vrednosti z za nivo značajnosti /,/1 su jednake R 4,;<, to znači da se nulta hipoteza ne prihvata jer je izračunata vrednost z vea od 4,;<. Daključak je da ove dve srednje vrednosti nisu jednake, odnosno razlika izme&u njih je statistički značajna, odnosno ova dva uzorka su uzeta iz dve različite populacije.
!tudentov t-test za srednje vrednosti dve nezavisne populacije Studentov t%test za testiranje hipoteze za razliku srednjih vrednosti dve nezavisne populacije mo+e da se primenjuje kao dvostrani i jednostrani, uz pretpostavke da su obe populacije normalno distribuirane i da standardne devijacije dve populacije nisu poznate. Izrazi za izračunavanje t zavise od broja podataka u grupama. Izra)unavanje vrednosti t "ada dve *rupe i#aju jedna" +roj podata"a
ada se testira hipoteza za srednje vrednosti dve populacije sa istim brojem podataka u uzorku, t se izračunava prema sledeem izrazu:
A%4/
Statistika u farmaciji/medicinskoj biohemiji
"4
t2
"0
0
Sd4 : Sd0 % 4
0
gde je: % srednja vrednost grupe 4
"4
Sd4
% standardna devijacija grupe 4
"0
% srednja vrednost grupe 0
Sd0 % standardna devijacija grupe 0 2 4 2 0 Kroj stepena slobode za ovaj izraz je J 2 4 0 % 0 PRIMER 7.: $ dva kontrolna uzorka seruma odre&ena je koncentracija natrijuma. $ svakom
uzorku odre&ivanje je ponovljeno 41 puta ( 4 2 0 2 ). !estiramo hipotezu dvostranim testom da izme&u dve srednje vrednosti nema razlike. Iz dobijenih podataka izračunate su sledee srednje vrednosti i standardne devijacije: grupa 4: " 4 2 431,; mmolLM, Sd4 2 ,9< mmolLM grupa 0: " 0 2 439,; mmolLM, Sd0 2 ,4 mmolLl ulta i alternativna hipoteza glase: 6/ : 54 2 50 i 64: 54 7 50 8 /,/1 J 2 41 41 % 0 2 09 tablična vrednost t/,/1, J209 2 0,/39
Neenje: t
431,; 439,; .,9<
0
0
.,.4
.,/ 4,93A
.,/ 4,.1;
0,0/9
41 4
ritična vrednost t za p 2 /,/1 i J 2 09 jednaka je 0,/39, a kako je izračunata vrednost t vea od ove, nulta hipoteza se ne prihvata, odnosno nema značajne razlike izme&u srednjih vrednosti u ova dva uzorka. Izra)unavanje vrednosti t "ada dve *rupe i#aju razli)it +roj podata"a
Izraz za izračunavanje t kod pore&enja srednjih vrednosti dve grupe koje imaju različit broj podataka glasi: t2
"4 " 0 0
0
4 Sd4 : 0 Sd4 : 0 4 4 : 0 % 0 4 0
gde je: " 4 % srednja vrednost grupe 4
Sd4 % standardna devijacija grupe 4 4 % broj podatka u grupi 4 " 0 % srednja vrednost grupe 0
Sd0 % standardna devijacija grupe 0 0 % broj podataka u grupi 0
A%44
S. Spasić: Predavanja 2008/2009.
Kroj stepena slobode za ovaj izraz je J 2 4 0 % 0 PRIMER ,.: $ jednom uzorku seruma odre&ena je koncentracija ureje metodom sa diacetilmonoksimom (grupa 4) i metodom sa enolom i hipohloritom (grupa 0). Tetodom sa diacetilmonoksimom odre&ivanje je ponovljeno 4/ puta, a metodom sa enolom i hipohloritom 43 puta. !estiramo hipotezu dvostranim testom da izme&u dve srednje vrednosti nema razlike. Iz dobijenih podataka izračunate su sledee srednje vrednosti i standardne devijacije: grupa 4:
4 2 4/, " 4 2 A,44 mmolLM, Sd4 2 /,9A0 mmolLM
grupa 0:
0 2 43, " 0 2 <,; mmolLM, Sd0 2 /,00<9 mmolLl
Neenje: ulta i alternativna hipoteza glase: 6/ : 54 2 50 i 64: 54 7 50 8 /,/1 J 2 4/ 43 = 0 2 00 tablična vrednost t/,/1, J200 2 0,/A3
t2
A,44 % <,;. 4/ " /,.9A00 : 43 " /,00<9 0 4/ : 43 % 0
2 4,.01 "
4/ : 43 4/ " 43
ritična vrednost t za p 2 /,/1 i J 2 00 jednaka je 0,/A3, a kako je izračunata vrednost t manja od ove, zaključak je da se nulta hipoteza prihvata, odnosno razlika izme&u srednjih vrednosti ove dve grupe podataka nije značajna. ticaj razli)itih a"tora na testiranje hipoteze z- i t-testo#
a krajnji zaključak kod testiranja hipoteze i z% i t%testom utiču: % veličina razlike izme&u srednje vrednosti uzorka i srednje vrednosti populacije, odnosno dve srednje vrednosti % veličina uzorka % varijacija (veličina standardne devijacije) u uzorku >elika razli"a iz#e/u srednjih vrednosti daje veliku vrednost t (veu od kritične vrednosti za izabrani nivo značajnosti), to znači da je sa velikom razlikom te+e dokazati nultu hipotezu.
A%40
Statistika u farmaciji/medicinskoj biohemiji
0eli)ina uzor"a tako&e utiče na krajnji zaključak kod testiranja hipoteze. Uto je uzorak vei to je
te+e dokazati nultu hipotezu, jer veliki uzorak (veliko ) daje veliku vrednost z, odnosno t (veu od kritične vrednosti za izabrani nivo značajnosti).
PRIMER ' $ Erimeru 4 sa uzorkom od 2 01 i standardnom devijacijom ' 2 41 g, izračunata je
vrednost z 2 4,9/, a zaključak je bio da se nulta hipoteza prihvata jer se ova vrednost nalazila u regionu za prihvatanje (izme&u vrednosti %4,;< i 4,;<. Eodatke iz Erimera 4 emo izmeniti tako da poveamo uzorak sa 01 na <, deklarisana te+ina je // g, a merenjem < kutija dobijena je srednja vrednost " 2 /1,3 gV standardna devijacija populacije je ' 2 41 g. ulta i alternativna hipoteza glase 6/ : # 2 // , odnosno 6 4 : # 7 //, a odabrani nivo značajnosti je 8 2 /,/1. >rednost z je jednaka: z
"
./1,3 .// 41
1,3 0,1
0,4<
.<
Sa istom standardnom devijacijom i uzorkom od < podataka, dobija se vrednost z 2 0,4<, to znači da se nulta hipoteza ne prihvata jer se ova vrednost nalazi u regionu za odbacivanje (vea je od 4,;<). Iz ovog primera se vidi da se za istu apsolutnu razliku u te+ini dobija drugačiji zaključak, a razlog tome je vei uzorak. PRIMER 1.' $ Erimeru A su navedeni podaci za odre&ivanje koncentracije natrijuma u dva
uzorka, tako da je u svakom uzorku odre&ivanje je ponovljeno 41 puta (4 2 0 2 ). Daključak je bio da se nulta hipoteza ne prihvata jer je izračunato t 2 0,0/9, a tablična vrednost t za 8 /,/1 i J 2 09 je 0,/39. Eretpostavimo da je u svakom uzorku odre&ivanje ponovljeno po 4/ puta i da su izračunate srednje vrednosti i standardne devijacije iste kao u primeru A: " 4 2 431,; mmolLM, Sd4 2 ,9<
mmolLM, " 0 2 439,; mmolLM, Sd0 2 ,4 mmolLM. >rednost t je jednaka t
431,; 439,; .,9<
0
0
.,.4
.,/ 0,9A.
.,/ 4,<;1
4,A<;
4/ 4
!ablična vrednost t za p 2 /,/1 i J 2 49 jednaka je 0,4/4, to znači da se nulta hipoteza prihvata jer je izračunata vrednost t manja, odnosno nema značajne razlike izme&u srednjih vrednosti dobijenih u ova dva uzorka. Iz ovog primera se vidi da je sa manjim uzorkom bilo lake dokazati nultu hipotezu.
A%4
S. Spasić: Predavanja 2008/2009.
0eli"a standardna devijacija (velika varijacija) u uzorku daje malu vrednost t (manju od kritične
vrednosti za izabrani nivo značajnosti), to znači da je sa velikom standardnom devijacijom lake dokazati nultu hipotezu.
PRIMER 11' $ Erimeru 4 je. navedeno da je deklarisana te+ina kutija sa čajem je // g i da je
merenjem 01 kutija dobijena srednja vrednost " 2 /1,3 g sa standardnom devijacijom populacije ' 2 41, a zaključak je bio da se nulta hipoteza prihvata jer je izračunata vrednost z bila manja od kritične vrednosti. Eretpostavimo sada da je vrednost standardne devijacije populacije manja i iznosi ' 2 4/ g. >rednost z je jednaka: z
"
./1,3 .// 4/
1,3 0
0,A
01
ako su granične vrednosti z za nivo značajnosti /,/1 jednake R 4,;<, vidimo da je izračunata vrednost z vea od 4,;< i da se nalazi u regionu za odbacivanje nulte hipoteze. -rugim rečima, nulta hipoteza se ne prihvata i izračunata srednja vrednost nije jednaka srednjoj vrednosti populacije 5 2 // g. Daključak je da kutije sa čajem nemaju tra+enu te+inu jer je razlika u te+ini od 1,3 g statistički značajna. Iz ovog primera se vidi da se za istu apsolutnu razliku u te+ini dobija drugačiji zaključak, a razlog tome je manja standardna devijacija populacije.
7.%. testiranje hipoteze za srednje vrednosti dve zavisne populacije 3parove vrednosti4 ekada nije mogue da se u jednom uzorku materijala uradi veliki broj odre&ivanja, zbog prirode samog materijala, kao to nekad nije mogue da se istovremeno uradi veliki broj odreivanja, zbog prirode same metode. $ tom slučaju se u jednom uzorku materijala urade dva odre&ivanja jednom istom ili dvema različitim metodama (zavisi od prirode zadatka), zatim se u drugom uzorku materijala ponove druga dva odre&ivanja, s tim to sva odre&ivanja ne moraju da se rade istog dana. Izračunavanje vrednosti t na ovaj način primenjuje se i u slučajevima kada se procenjuje neki aktor uticaja (vreme, lekovi, način čuvanja uzoraka i dr.). Da te potrebe se različiti uzorci obra&uju pre i posle delovanja ispitivanog aktora, a značajnost njegovog uticaj se ocenjuje izračunavanjem vrednosti t. >rednost t se izračunava prema sledeem izrazu: t2
d Sd
A%43 gde
Statistika u farmaciji/medicinskoj biohemiji
d
predstavlja srednju razliku izme&u parova odre&ivanja, koja se izračunava prema izrazu:
( "4 % "0 ) d 2 Standardna devijacija Sdd izračunata je iz razlika d4, d0, ... , d prema izrazu: d2
d0 % d % 4
Sdd 2
0
Kroj stepena slobode je jednak J 2 % 4, gde je jednako broju parova vrednosti. PRIMER 12.: od 43 gojaznih osoba koje su podvrgnute nultoj dijeti odre&ena je koncentracija
holesterola na početku dijete i posle tri nedelje. Eokazati da li ima značajne promene u koncentraciji holesterola posle ove dijete (vrednosti su date u mmolLM) uzimajui u obzir nivo verovatnoe /,/1. pre dijete
posledijete d (pre%posle)
1,0
3,9
/,3
/,4<
1,0
3,A
/,1
/,01
1,
1,4
/,0
/,/3
1,1
1
/,1
/,01
3,;
3,3
/,1
/,01
3,0
3,3
%/,0
/,/3
<,9
<,
/,1
/,01
3,
0,A
4,<
0,1<
3,9
3,3
/,3
/,4<
Wd23,3
Wd02,;<
Neenje: 6/ : #pre 2 #posle i 64 : #pre 7 #posle d2
Sd 2
t2
3,3 ;
d0
J 2 ; % 4 2 9 8 2 /,/1
2 /,39;
.,;< % ; " (/,39;)0 9
2
4,9/A; 9
2
/,00< 2 /,3A1
/,39; /,39; 2 2 .,/;1 /,3A1 /,419 ;
ritična vrednost t za p 2 /,/1 i J2 9 jednaka je 0,/<, a kako je izračunata vrednost t vea od ove, zaključak je da se nulta hipoteza ne prihvata. -rugim rečima postoji značajna razlika izme&u vrednosti holesterola pre i posle primene dijete. to znači da je razlika značajna jer je ova vrednost manja od izračunate vrednosti t. ako je srednja razlika d sa negativnim predznakom, zaključak je da se u laboratoriji K dobijaju značajno vie vrednosti hlorida nego u laboratoriji *.
A%41
S. Spasić: Predavanja 2008/2009.
7.&. Testiranje hipoteze za proporciju dve populacije
t-test $ nekim slučajevima rezultati ne mogu da budu izra+eni u jedinicama koje imaju dimenziju, ve jednostavno kao HH ili H%H, odnosno HimaH ili HnemaH. Nezultati sa odredjenim obele+jem izra+avaju se kao procenat od ukupnog broja rezultata. od takvih rezultata dve grupe se upore&juju pomou vrednosti t koja se izračunava iz sledeeg izraza: t2
p4 % p 0 p4 X4
:
p0 X0
4
0
gde je: p4 % +eljeno obele+je u grupi 4 X4 % suprotno obele+je u grupi 4 4 % broj podataka u grupi 4 p0 % +eljeno obele+je u grupi 0 X0 % suprotno obele+je u grupi 0 0 % broj podataka u grupi 0. Obele+ja p i X se izra+avaju u procentima, pri čemu je p X 2 4//P, ili kao udeo do jedinice, pa je p X 2 4. Kroj stepena slobode je jednak J 2 4 0 % 0, a kako se kod ovakvih primera često radi sa velikim brojem podataka, tablična vrednost se pronalazi za J 2 .
PRIMER 1$.: od dece iz ravničarskog područja odredjen je hemoglobin i dobijeni su sledei
rezultati: od 3// dece iz grada 3/P je imalo sni+ene vrednosti hemoglobina, a od 04/ sa seoskog područja sni+en hemoglobin je imalo /P. Eokazati da li je značajno vei broj, odnosno procenat dece sa sni+enim hemoglobinom u gradu nego u selu. Neenje: 4 2 3//, p4 2 3/P, X4 2 4// % 3/ 2
t2
3/ % ./ 3/ " 3//
:
2
./ " A/
4/
2 0,1
4<
04/
Izračunata vrednost t vea je od tablične za p 2 /,/1 i J 2 gradu značajno vei broj sa sni+enim hemoglobinom.
(t 2 4,;A), to znači da je kod dece u
A%4<
Statistika u farmaciji/medicinskoj biohemiji
7.(. 5adaci za ve6+anje 4. -vema automatskim pipetama od 4 ml odmerena je vie puta destilovana voda, a zatim je merena te+ina te vode, da bi se uporedile zapremine koje te pipete odmeravaju. $porediti dobijene vrednosti i pokazati da li se zapremine značajno razlikuju. pipeta I: 4,/93 4,/<0 4,/A 4,/<1 4,/31 4,/19 4,/<1 4,/A1 pipeta II: 4,44/ 4,/;1 4,/9/ 4,4// 4,409 4,4/9 0. reatinin je odredjen u jednom uzorku seruma ponavljanjem 44 puta. -obijenim obojenim rastvorima izmerena je apsorbancija na spektrootometru (grupa *) i otokolorimetru (grupa K). Eokazati da li se merenjem na jednom i drugom aparatu dobijaju iste vrednosti. grupa *:
;;,9
;;,3
;;,;
;;,/
;;,0
;;,/
;;,3
grupa K:
;;,/
;;,0
;9,9
;;,3
;9,<
;9,A
;9,;
. a dva p6%metra izmeren je p6 jednog rastvora po 4/ puta. !reba pokazati da li se značajno razlikuju vrednosti dobijene na ova dva aparata, kao i da li p6%metri mere tačno ako rastvor ima p6 A,4. *:
A,44
A,41
A,43
A,4/
A,/;
A,41
A,40
A,43
K:
A,40
A,/<
A,/0
A,/9
A,44
A,/
A,/<
A,/9
3. Eokazati da li postoji značajna razlika izmedju vrednosti koje su dobijene odredjivanjem glukoze u kontrolnom serumu kada je odmeravanje vreno automatskom (*) i staklenom pipetom (K). *:
1,31
1,3/
1,10
1,3<
1,19
1,13
K:
1,3/
1,0
1,9
1,3<
1,<
1,3
1,3 1,
1. Eopulacija od 4< uzoraka ima srednju vrednost 34,1, a standardnu devijaciju 0,A;1. *ko je prava srednja vrednost populacije 3, da li je razlika značajnaQ <. -eklarisana te+ina pakovanja pudera za bebe je 0// g. a osnovu slučajnog uzorka od 1 pakovanja dobijena je srednja vrednost od 4;1 g sa standardnom devijacijom 9,01 g. Eokazati da li je te+ina značajno ni+a od deklarisane. A. aznačen sadr+aj kalcijuma u litru mineralne vode je 41/ mg. a osnovu slučajnog uzorka od 1/ litara mineralne vode dobijena je srednja vrednost 41< mg, sa srtandardnom devijacijom <,9A mg. Eokazati da li je dobijena vrednost kalcijuma u mineralnoj vodi značajno različita od naznačene. 9. od 0/ eksperimentalnih +ivotinja tretiranih novim lekom dolo je do poboljanja stanja kod 43 +ivotinja, a kontrolnoj grupi tretiranoj starim preparatom eekat poboljanja zapa+en je kod 9 od ukupno 41 +ivotinja. -a li je eekat novog leka značajno boljiQ ;. Ispitivana je lomljivost tableta prvog proizvodjača na osnovu slučajnog uzorka od 0// komada, u kome je utvrdjeno 4/ nesolidnih tableta, dok je u slučajnom uzorku od 49/ komada, iz poiljke drugog proizvodjača, utvrdjeno 4 nesolidnih tableta. Eokazati da li su značajno kvalitetnije tablete prvog proizvodjača.
A%4A
S. Spasić: Predavanja 2008/2009.
4/. Erodavac tvrdi da u njegovoj rudi ima 49P metala. a osnovu slučajnog uzorka od 3/ kg rude utvrdjeno je da u njjoj ima 41,AP metala. -obijena standardna devijacija iznosi A,0<. Eokazati da li je sadr+aj metala u rudi značajno ni+i od onog koji navodi prodavac. 44. Iz prispele porud+bine uvoznih pomorand+i utvrdjeno je da je kod slučajnog uzorka od 1/ kg te+ina kore pomorand+i 40P. Iz druge poiljke je izdvojen slučajni uzorak od <1 kg i kod njega je te+ina kore pomorand+i iznosila 4/,3P. Eokazati da li je kod druge poiljke pomorand+i te+ina kore značajno ni+a. 40. od 41 pacijenata lečenih >asole"%om odredjen je kreatinin pre i posle dvonedeljne terapije. Eokazati da li lek ima uticaja na unkciju bubrega uzimajui u obzir nivo verovatnoe /,/1 . pre terapije:
401
400
4//
99
4/1
;3
AA
40;
;<
44;
40
A1
posle terapije:
409
4/
;9
;1
4/;
4/9
A1
40A
4/1
401
40/
A;
4. Grupi od 41 pacijenata dat je jedan stimulansV pokazati da li postoji razlika u vrednosti pulsa pre i posle davanja stimulansa uzimajui u obzir nivo verovatnoe /,/4. pre:
<1
A0
19
<;
A;
A/
91
A9
9
9/
posle:
A4
9/
<1
AA
A4
90
<1
A/
;/
A9
A/