METODE INFERENSI PADA TABEL KONTINGENSI Meto Metode de infer inferen ensi si memai memainka nkan n pera perana nan n pent pentin ing g dala dalam m anal analis isis is data data kategorik kategorik yang tidak memiliki bentuk tabel kontingensi. kontingensi. Metode ini memerlukan memerlukan asumsi sampling berdistribusi Poisson, Multinomial, atau Binomial.
3.1. Selang Kepercayaan Pada Parameter bersama Tingkat akurasi penduga dari parameter bersama ditentukan oleh standar error dari distribusi sampling. Pada bagian ini, ditampilkan standar error dan selang kepercayaan untuk jumlah sampel yang besar.
3.1.1. Selang Pendugaan Pada Odds Rasio Odds rasio dari sampel θ ˆ = n11n 22 untuk tabel kontigensi berukuran 2 22 / n12 n 21 21 x 2 bernilai 0 atau ∞ jika terdapat nij
= 0 , dan tidak terdefinisikan jika terdapat
isian pada pada baris dan kolom kolom yang keduanya keduanya bernilai bernilai nol. Karena tabel tabel tersebut tersebut memiliki keluaran dengan nilai peluang yang positif, nilai harapan dan varians dari θ ˆ dan log θ ˆ tidak tersedia. (Dapat diperiksa bahwa hal ini juga berlaku pada metode metode Maximu Maximum m Likeli Likelihoo hood d Estima Estimator tor dari dari paramet parameter er model model yang yang diuraik diuraikan an pada bagian teraChir bab ini.) Dalam hal bias dan mean-squre error, Gart dan Zweifel (1967) dan Hadane (1956) menjelaskan bahwa penduga yang diperbaiki adalah sbb.
θ %=
(n11 + 0.5)( n 22 + 0.5) (n12 + 0.5)( n 21 + 0.5)
Dan log θ akan berlaku dengan baik (sebagaimana pada soal 14.4) Penduga θ ˆ dan θ memiliki memiliki distribusi distribusi normal normal yang yang asimptot asimptotik ik di sekitar sekitar θ . Kecuali jika n cukup besar, bagaimanapun juga, distribusinya akan cenderung untuk menceng. Untuk kasus dimana θ=1 misalnya, karena θ ˆ ≥ 0 maka nilai θ ˆ tidak bisa melebihi θ, namun dapat bernilai lebih besar pada peluang yang tidak meme memenu nuhi hi
syar syarat at..
Tran Transf sfor orma masi si
deng dengan an
log, log,
lebi lebih h
memi memili liki ki
stru strukt ktur ur
penjumlahan dibandingkan dengan perkalian, dan konvergen lebih cepat kepada distribusi normal. Standar error dugaan untuk log θ ˆ adalah
1/2
1 1 1 1 σˆ (log θ ˆ) = + + + n 11 n12 n21 n22 Yang diturunkan dari formula 3.1.7.
Normalitas untuk sampel besar dari log θ ˆ akan memenuhi
log θˆ ± z α /2 σˆ (log θ ˆ ) Merupak Merupakan an selang selang keperc kepercaya ayaan an Wald untuk log θ. Mengub Mengubah ah kedalam kedalam bentuk eksponensial (antilog) dari titik akhir memerlukan selang kepercayaan untuk θ. Selang ini ini disarankan disarankan oleh Woolf Woolf (1995) dan dan biasanya biasanya cukup berhasil berhasil , terle terlepa pas s dari dari sifa sifatn tnya ya yang yang konse konserv rvat atif if (seba (sebaga gaii cont contoh oh:: cakup cakupan an pelu peluan ang g sebenarnya lebih tinggi daripada nilai secara nominal.) Ketika θ ˆ = 0 atau ∞, selang Woolf tidak tersedia. Ketika θ ˆ = 0, kita perlu mengambil nilai 0 sebagai batas bawah, dan ketika θ ˆ = ∞, nilai ∞ digunakan sebaga sebagaii batas batas atas. atas. Untuk Untuk batasa batasan n lainny lainnya a dapat dapat diguna digunakan kan formula formula Woolf Woolf denga dengan n sed sed ikit ikit penye penyesu suai aian an,, seper seperti ti dilak dilakuka ukan n oleh oleh Gart Gart (196 (1966) 6),, deng dengan an mengganti {nij} menjadi {nij + 0.5} pada penduga dan standar error. Sebuah pendekatan yang lebih sementara membentuk selang dengan mengubah nilai uji (Cornfield (Cornfield 1956) atau uji rasio Likelihood Likelihood untuk θ (sebagaima (sebagaimana na dibahas dibahas pada 3.1.8).
3.1.2. Contoh Pada Aspirin dan Myocardial Infarction Myocardial Infarction Total Yes No Placebo 28 656 684 Aspirin 18 658 676 Dengan odds rasio θ ˆ = 1.56 mendekati θ %= 1.55 , maka selang kepercayaan untuk ,96(0,307) atau (-0,157; log θ adalah 0,445 ±1,96(0,307) (-0,157; 1,047). Interval penghubung untuk untuk [exp(-0,157),exp(1,047) atau (0,85;2,85). (0,85;2,85). Estimasi sebenarnya untuk θ adalah [exp(-0,157),exp(1,047) odds ratio cukup tidak tepat. Ketika selang kepeercayaan mengandung nilai 1,0 maka masuk akal bahwa odds sebe sebena narn rnya ya untu untuk k kema kemati tian an myoc myocar ardia diall infar infarct ctio ion n sama sama untu untuk k aspir aspirin in dan dan placebo. placebo. Jika sebenarnya sebenarnya terdapat terdapat manfaat manfaat efek aspirin namun odds ratio ratio tidak
akan terlalu besar, mungkin akan ditunjukkan manfaat sebab hubungan untuk kasus myocardial infarction dalam jumlah kecil.
3.1.3. Pendugaan Selang Pada Selisish Proporsi Selisih proporsi dan resiko relatif membandingkan distribusi bersyarat dari sebu sebuah ah varia variabe bell respo respon n untu untuk k dua dua kelom kelompo pok. k. Untuk Untuk pengu penguku kura ran n ini, ini, kita kita memperlakukan sampel sebagai binomial independen. Pada kelompok ke-i, yi memiliki distribusi binomial dengan jumlah sampel ni dan peluang sukses respon sebesar π i . Prop Propor orsi si
samp sampel el
π ˆi
= yi / ni memi memili liki ki
nila nilaii
hara harapa pan n
π i dan dan
vari varian ans s
ˆ 2 indepen ˆ1 dan π π i (1 − π i ) / ni . Kare Karena na π independen den,, maka keduan keduanya ya memilik memilikii selisi selisih h sebesar
E (πˆ1 − πˆ 2 ) = π1 − π 2 Dan standar error
π (1 − π 1) π 2(1 − π 2) σ ( πˆ1 − π ˆ 2 ) = 1 + n n2 1
1/2
ˆ 2 ) menggunakan Penduga σˆ ( πˆ1 − π menggunakan formula (3.3) dengan π i digantikan digantikan oleh π ˆi , maka
( πˆ1 − πˆ2 ) ± z α / 2σˆ ( πˆ1 − πˆ2 ) Merupakan selang kepercayaan wald untuk π 1 − π 2 . Sebagaimana selang Wald (1.1 (1.13) 3) untu untuk k prop propor orsi si tung tungga gal, l, yang yang biasa biasany nya a memi memilik likii pelua peluang ng cakup cakupan an sebenarnya kurang dari nilai koefisien kepercayaan, terutama ketika π 1 dan π 2 mendekati 0 atau 1.
3.1.4. Selang Pendugaan pada Resiko Relatif
ˆ 2 yang Resiko Resiko relatif relatif sampel sampel adalah adalah r = πˆ1 / π yang sebaga sebagaima imana na halnya halnya odds odds rasio, rasio, kovergen dengan sangat cepat ke bentuk normal pada skala logaritma. Standart error asimptotik untuk log r adalah
1/2
1 − π 1 1 − π 2 log r ) = σ (log + n π 1 1 π 2 n2
ˆ (log r ) yang akan memberikan hasil Selang wald mengeksponensialkan log r ± zα /2σ yang baik namun dapat menjadi konservatif.
3.1.5. Penurunan Standar Error dengan Metode Delta* Terdapat sebuah metode yang mudah dan sangat berguna untuk menurunkan standar error dari inferensi dengan jumlah sampel besar. Jika Tn merupakan statistik statistik yang berdistribusi normal asimptotik asimptotik disekitar disekitar parameter θ , nilai nilai n menunj menunjukka ukkan n keterga ketergantu ntunga nganny nnya a terhad terhadap ap jumlah jumlah sampel. sampel. Misalka Misalkan n terdap terdapat at sebuah sebuah pendug penduga a yang yang merupak merupakan an fungsi fungsi g(Tn) dari Tn. Maka dalam kondisi yang halus g(Tn) itu sendiri memiliki sebuah distribusi normal dengan jumlah sampel besar. Nilai standar error bergantung kepada seberapa cepat g(t) berubah pada t yang mendekati θ. Lebi Lebih h khusu khusus s untu untuk k n yang yang besa besar, r, dimis dimisal alka kan n bahw bahwa a T n berdistribusi normal disekitar disekitar θ dengan standar standar error σ / n . Hal ini terjadi ketika n → ∞ , den dengan gan
cdf
dari dari
konver erge gen n n (T n − θ ) konv
kepa kepada da
cdf cdf
dari dari
rand random om
vari variab abel el
berdistribusi normal dengan mean 0 dan varians σ 2 . Pembatasan ini merupakan contoh dari kasus konvergen dalam distribusi, yang ditulis sebagai d
n ( Tn − θ ) → N (0, σ 2 ) Jika g merupakan fungsi yang setidaknya dapat diturunkan sebanyak dua kali pada pada θ. Dengan menggun menggunaka akan n Ekspan Ekspansi si Deret Taylor Taylor untuk untuk g(t) g(t) dalam suatu suatu lingkungan lingkungan dimana dimana t=θ, pada bagian bagian 14.1.2. 14.1.2. telah telah ditunjukkan ditunjukkan bahwa n [ g (Tn ) − g (θ ) ] ≈
n ( Tn − θ ) g '(θ )
Untuk jumlah n besar dimana g '(θ ) = ∂g / ∂t hitung hitung keti ketika ka t=θ. Perhati Perhatikan kan bahw bahwa a jika Y : N (0, σ 2 ) maka cY : N (0, c 2σ 2 ) , maka d
n [ g (Tn ) − g (θ )] → N (0, [ g '(θ )]2 σ 2 )
Deng Dengan an kata kata lain lain g(T g(Tn) diper diperki kira raka kan n norm normal al di sekit sekitar ar g (θ ) dengan dengan varians varians
[ g '(θ )]2 σ 2 / n . Sebagaimana terlihat pada gambar 3.1. Secara lokal di sekitar θ, g(t) diperkirakan linier dengan kemiringan g '(θ ) . Maka g(Tn) diperkirakan normal, karena transformasi transformasi linier dari random variabel variabel adalah dengan sendirinya normal. Sebaran dari nilai g(T n) di sekitar g (θ ) adalah
| g '(θ ) | kali sebaran nilai Tn di sekitar θ. Jika kemiringan g pada θ adalah ½, maka g memetakan suatu daerah dari nilai T n ke daerah nilai g(Tn) sekitar setengah luasan. Hasi Hasill 3.6 3.6 dise disebut but seba sebaga gaii metod metode e delta delta.. Karen Karena a g '(θ ) dan σ 2
= σ 2 (θ )
biasanya bergantung kepada parameter parameter θ , varian asimptotiknya tidak diketahui. Selang kepercayaan dan ujinya mengganti Tn untuk θ dan menggunakan menggunakan hasil n [ g (Tn ) − g (θ ) ] / | g '(θ ) | σ (Tn ) yang merupakan asimptotik untuk normal standar.
Dengan kata lain,
g (Tn ) ± 1.96 | g '(θ ) | σ (Tn ) / n Merupakan Merupakan 95% selang kepercayaan kepercayaan statistik statistik Wald dengan sampel besar untuk
g (θ ) 3.1.6. Aplikasi Metode Delta untuk Sampel Logit* Kita Kita ilustr ilustrasi asikan kan metode metode delta delta untul untul fungsi fungsi estimas estimasii ML T n
∧
= π = y
n
adalah
parameter Binomial untuk π ,dimana y adalah banyaknya percobaan sukses dari ∧
sejuml sejumlah ah n percoba percobaan. an. Maka Maka E (Y ) = nπ dan Var (Y ) = nπ (1 − π ) , dan E (π ) = π ∧
∧
Var (π ) = π (1 − π ) / n . Selain itu, π memiliki distribusi normal sampel besar dengan
teorema limit pusat. ∧
∧
∧
∧
Maka fungsi log odds untuk π yaitu g (π ) = log[π / (1 − π )] disebut logit sampel.
(1 −π ). Maka diperoleh Evaluasi π dengan menurunkan persamaan 1 / π (1
∧ π π n log l o g − 1 − π ∧ 1− π
d → N 0, 1 . π (1 − π ) ∧
∧
∧
Normalitas asimtotik π Menyebar secara asimtotik normal pada log[π / (1 − π )] Varians Varians asimtotik asimtotik adalah varian distribusi distribusi normal yang kurang lebih merupakan merupakan distr dis tribu ibusi si sebe sebena narny rnya a untu untuk k samp sampel el n yang yang besa besar. r. Untu Untuk k
0 < π < 1 ,varians
−1
asimtotik [n π (1 − π )] untuk sampel logit terbatas. Sebaliknya, varian sebenarnya
ˆ =0 atau 1 dengan nilai peluang yang positif, ternyata tidak tersedia: karena π nilai nilai logit sebandi sebanding ng dengan dengan -∞ atau ∞ dengan dengan peluang peluang yang yang positi positiff.
Nilai Nilai
pelu peluan angn gnya ya konve onverg rgen en menu menuju ju 0 deng dengan an sang sangat at cepa cepatt ketik etika a juml jumlah ah n meningkat. Untuk sampel sampel n besar distribusi distribusi sampel logit logit sama pentingnya pentingnya dengan normal normal dimana rata-rata rata-rata log[π / (1 − π )] dan standa standarr devias deviasii [nπ (1 − π )]−1/2 .
Kemudi Kemudian an
untuk logit, varians asimtotik sebenarnya lebih besar dari varians sebenarnya. Dalam hal ini, metode bootstrap tidak dapat menolong untuk memperkirakan standar error untuk banyak pengukuran diskrit, sebab memiliki relasi yang lebih pada standart error asimtotik.
3.1.7. Aplikasi Metode Delta untuk Log Odds Rasio* Standar error untuk log odds rasio dan log resiko relative dihasilkan dari versi mult multip ipar aram amet eter er
meto metode de
delt delta. a.
Misa Misalk lkan an
ˆi multinomial (n, { π i } ) . Proporsi sampel π
,..., c} memi memilik likii { ni , i = 1,..
dist distrib ribus usii
= ni / n memiliki mean dan varians
E (πˆi ) = π i dan var(πˆi ) = π i (1 − π i ) / n ˆ j memiliki Pada Pada bagian bagian 14.1.4 14.1.4.. telah telah ditunj ditunjukk ukkan an bahwa bahwa untuk untuk i ≠ j , π ˆi dan π kovariansi
cov(πˆi , πˆ j )
= −π iπ j / n
Proporsi Proporsi sampel
memilikii ( πˆ1 , πˆ2 , ....., π ˆc− 1 ) memilik
distrib dis tribusi usi normal normal multiv multivari ariate ate dengan dengan
sampel besar. Untuk set fungsi tersebut, metode delta memberikan hasil berikut, yang dibuktikan pada bagian 14.1.4.
ˆ ) untuk sampel Jika g (π ) merupakan funsi turunan dari π i dengan nilai sampel g (π multinomial, maka
φ i
=
∂ g (π ) , ∂π i
i=1,…,c
Maka ketika n → ∞ distribusi
n [ g (πˆ ) − g (π ) ] / σ konvergen konvergen ke distribusi distribusi normal
standar dimana
σ2
= ∑ π iφi2 − ( ∑ πi φi )
2
Varians asimptotik tergantung kepada { π i } dan turunan parsial dari ukuran dengan memperhatikan { π i } . Pada prakteknya, menggantikan { π i } dan { φ i } pada (3.9) dengan nilai sampelnya akan menghasilkan estimasi Maximum Likelihood untuk σ ˆ 2 dan σ 2 . Selanjutnya σ ˆ 2 / n merupakan standar error dugaan untuk
ˆ ) . Selang Kepercayaan Wald untuk g (π ) adalah g (π
ˆ/ n g (πˆ ) ± zα /2 σ
ˆ untuk σ dalam (3.9), distribusi pembatas masih Dengan mengganti σ merupakan normal standar, namun konvergen secara lambat. Nilai yang setara pada distribusi distribusi dengan sampel besar dapat dijelaskan dijelaskan sebagai sebagai berikut: berikut: Proporsi Proporsi sampel konvergen secara peluang kepada lemah lemah pada pada jumlah jumlah yang yang besa besar. r.
{ π i }
, berdasarkan berdasarkan hukum bilangan bilangan
ˆ merupakan Karena Karena σ merupakan fungsi kontinu pada
ˆ akan konvergen dalam peluang kepada σ , dan σ / σ ˆ proporsi sampel, maka σ akan konvergen secara peluang ke 1. Sekarang
n
g (πˆ ) − g (π ) σˆ
=
n
g (πˆ ) − g (π ) σ σ σ ˆ
Bentuk pertama di sebelah kanan konvergen dalam distribusi ke normal standar, (3.9), sementara bentuk kedua di sebelah kiri konvergen dalam peluang ke 1.
Oleh karenanya produk yang dihasilkan dihasilkan juga memiliki dibatasi dibatasi oleh distribusi distribusi normal standar. Dengan mengaplikasikan metode delta ke log odds rasio, dengan menjabarkan
g (π ) = log θ
φ 11 =
φ12
=
= log π11 + log π 22 − log π12 − log π 21 ∂ (log θ ) 1 = π 11 ∂π 11 −1 π12
∑ ∑ π φ = 0 i
ij ij
j
karena
;φ21 =
−1 π 21
;φ 22 =
dan
σ2
1
π 22
= ∑ i ∑ j πij φ2 = ∑i ∑ j ( 1 / ij
πij ) . Maka
standar
error
asimptotik dari log θ ˆ untuk sampel multinomial { nij } adalah
σ (log θˆ) = σ / n = ˆij Karena nπ
(∑ ∑ i
1 / nπ j
ij
)
1/2
= nij maka standar error dugaan adalah (3.1)
Metode Metode delta delta juga juga dapat dapat ditera diterapka pkan n secara secara langsu langsung ng dengan dengan θ untuk
ˆ) . Namu mendapatkan σˆ (θ ˆ) dan selang selang keperca kepercayaa yaan n Wald Wald θˆ ± z α /2 σˆ ( θ Namun n hal hal ini ini sang sangat at
tida tidak k
disa disara rank nkan an
kare karena na
konver erge gen n θ ˆ konv
ke
norm normal al
lebih ebih
lamb lambat at
dibandingkan dengan log θ ˆ , dan selang yang dihasilkan dapat mengandung nilai nega negati tif. f. Hal Hal ini ini tida tidak k memb member erik ikan an hasi hasill yang yang seta setara ra deng dengan an hasi hasill yang yang didapatkan dari selang Wald yang menggunakan 1 / θ ˆ dan standar errornya.
3.1.8. Angka dan Profil Likelihood untuk selang Kepercayaan Standar Standar error yang didapatkan didapatkan dengan metode delta muncul muncul pada selang interval interval Wald. Namun, selang yang dihasilkan tersebut kadang kala kurang baik jika diterapkan pada jumlah sampel yang kecil hingga menengah. Selang alterna alternativ tive e lainny lainnya a dihasi dihasilka lkan n dengan dengan mencar mencarii kebalik kebalikan an dari dari rasio rasio likelih likelihood ood pada skor hasil tes. Meskipun memerlukan perhitungan yang lebih rumit, namun metode ini seringkali bekerja lebih baik.
Pertama Pertama kita gambarkan metode skor untuk selisih proporsi, proporsi, dimana skor tes memiliki statistik uji H 0 : π1 − π 2 = ∆ (Mee 1984; Miettinen dan Nurminen 1985)
z ( ∆) =
Dimana
( πˆ1 − π ˆ2 ) − ∆ {πˆ1( ∆) [ 1 − πˆ1 (∆ ) ] / n1 }+ {πˆ2 (∆ ) [1− πˆ 2 (∆ ) ] / n2 }
π ˆ1 ( ∆)
menya menyata taka kan n pend pendug uga a Maxi Maximu mum m Like Likelih lihoo ood d dari dari su subj bjek ek π 1
terhadap batasan π1 − π 2
= ∆ . Yaitu
π 2 yang memenuhi π1 − π 2
=∆
ˆ 2 (∆) merupakan nilai dari π 1 dan π ˆ1 (∆ ) dan π
dan memaksimalkan hasil dari dua fungsi massa
pelu peluan ang g bino binomi mial al.. Nila Nilaii ini ini tida tidak k memi memili liki ki bent bentuk uk yang yang clos closed ed form form dan dan ditentukan menggunakan metode numeric. Skor selang kepercayaan merupakan set dari ∆ sedmiki sedmikian an hingga hingga | z (∆ ) |< z α / 2 . Perhit Perhitung ungan an untuk untuk interv interval al terseb tersebut ut membutuhkan pengulangan (Nurminen, 1986). Demikia Demikian n halnya halnya pada pada resiko resiko relatif, relatif, performa performa yang yang sedikit sedikit lebih lebih baik baik dihasilkan dihasilkan berdasarkan berdasarkan suatu suatu selang yang menggunakan menggunakan metode skor (Bedrick, 1987; Grant dan Nam, 1988; Koopman, 1984; Miettinen dan Nurminen, 1985; Nurm Nurmine inen, n, 19 1986 86). ). Corn Cornfie field ld (195 (1956) 6) sert serta a Miet Mietti tine nen n dan dan Nurm Nurmin inen en (198 (1985) 5) menu menunj nju ukkan kkan
selan elang g
skor kor
untu untuk k
odds dds
rasi rasio. o.
Kita ita
memi memili lih h
untuk ntuk
tidak idak
mengg menggun unak akan an konti kontinu nuit itas as,, atau atau korek koreksi si samp samplin ling g terb terbat atas as deng dengan an sela selang ng terseb tersebut, ut, karena karena hasilny hasilnya a terlal terlalu u kaku. kaku. Fakta Fakta bahwa bahwa perhit perhitung ungan an selang selang skor skor lebi lebih h rumi rumitt diba diband ndin ingk gkan an deng dengan an sela selang ng sela selang ng Wald Wald,, seha seharu rusn snya ya tidak idak menja menjadik dikan an halan halanga gan n dalam dalam peng penggu guna naan anya ya di era mode modern rn ini ini karen karena a pada pada dasarnya prinsipnya sangatlah sederhana. Untuk selang kepercayaan kepercayaan yang berdasarkan berdasarkan uji rasio likelihood, likelihood, dapat digambarkan serupa dengan odds rasio. Likelihood multinomial untuk tabel 2 x 2 merupakan suatu fungsi dari { π 11 , π 12 , π 21} . Setara dengan hal itu, fungsi tersebut dapat dapat dituli dituliska skan n dalam dalam bentuk bentuk
{ θ , π1+ , π +1}
membalik uji rasio likelihood H 0 : θ
= θ 0 untuk memeriksa apakah θ 0
(lihat (lihat bagian bagian 2.4.1) 2.4.1).. Selanju Selanjutny tnya a berada dalam
selang kepercayaan, terdapat dua parameter gangguan. Penduga ML null π1+ (θ 0 ) dan π +1 (θ 0 ) yang memaksimalkan likelihood berdasarkan null, tersebut bervariasi sebagaimana θ 0 .
), πˆ +1 (θ0 )) )) , dilihat Fungsi Fungsi Profil Profil Log-Li Log-Likel kelihoo ihood d adalah adalah L(θ0 , πˆ1+ (θ0 ), dilihat sebaga sebagaii fungsi θ 0 . Untu Untuk k seti setiap ap θ 0 , fungsi fungsi ini memberik memberikan an log-lik log-likelih elihood ood biasa biasa yang yang membatasi
θ
= θ 0 .
Peri Periks ksa a
apak apakah ah
θ0
= θ ˆ
memaksimalkan memaksimalkan
ˆ +1 ) , yang ˆ1+ L(θ 0 , πˆ1+ , π yang muncu muncull pada pada prop propor orsi si sampe sampell π
Log-likelihoo Log-likelihood d
= n1+ / n dan
π ˆ +1 = n+1 / n .
Selang kepercayaan likelihood profil untuk θ adalah bagian dari θ 0 yang masingmasing
−2 L(θ0 , πˆ1+ (θ0 ), πˆ +1(θ0 )) − L(θˆ, πˆ1+ , πˆ +1) < χ12 ( α) Persamaan terbut mengandung seluruh θ 0 yang tidak ditolak di dalam uji rasio likelihood dengan ukuran nominal α. Pendekatan terkait dapat menggunakan fungsi likelihood bersyarat yang mengeliminasi parameter gangguan dengan memberikan syarat pada statistik cukupn cukupnya. ya. Hal ini sangat sangat mengun menguntun tungka gkan n ketika ketika terdapa terdapatt banyak banyak parame parameter ter gangguan. Berbeda dengan Wald, keuntungan dari penggunaan skor dan selang yang yang
berd berdas asar arka kan n
like likeli liho hood od
adal adalah ah
mere mereka ka
tida tidak k
terp terpen enga garu ruh h
seca secara ra
berlawanan ketika resiko relatif sampel atau odds rasio adalah 0 atau ∞.
3.2. Uji Kebebasan Kebebasan Pada Tabel Tabel Kontingensi Kontingensi Dua Arah Arah Untuk Untuk samplin sampling g multin multinomi omial al dengan dengan peluan peluang g
dalam { π ij } dalam
sebuah sebuah tabel tabel
kontingensi I x J, hipotesis null untuk kebeasan statistik adalah H 0 : π ij
= π i +π + j
untu untuk k seti setiap ap I dan dan j. Pada Pada samp sampel el mult multin inom omial ial indepe independ nden en pada pada kolom kolom I, berko berkores respo pond nden ensi si seca secara ra beba bebas s deng dengan an homo homogen genit itas as dari dari seti setiap ap pelua peluang ng keluaran dari setiap baris.
3.2.1. Uji Pearson dan Rasio Likelihood Chi kuadrat Pada Pada bagian bagian 1.5.2 1.5.2 telah telah diperk diperkenal enalkan kan statis statistik tik Pearson Pearson χ2 untuk untuk uji peluang multinomial. Sebuah uji dengan H0: kebebasan menggunakan χ2 dengan ni ditempatkan pada nij dan µij
= nπ i +π + j
ditempatkan pada µ i . Di sini µ ij
berada di dalam H0. Biasanya nilai { π i + } dan
= E (nij )
{ π + j } tidak diketahui. Penduga ML-
= n1+ / n dan
π ˆ +1 = n+1 / n , jadi
nya nya meru merupa pakan kan prop propor orsi si samp sampel el marg margina inall
π ˆ1+
dilakukan estimasi frekuensi harapan adalah { µij
= nπ i +π + j = ni + n+ j
/ n } maka nilai χ2
akan setara dengan
χ 2
= ∑i ∑ j
( n − µ ˆ ) ij
2
ij
ˆ ij µ
ˆ ij } Pearson Pearson (1900, 1904, 1922) menyatakan menyatakan bahwa mengganti mengganti { µ ij } dengan { µ tidak tidak akan akan mempeng mempengaru aruhi hi dis distrib tribusi usi χ2. Karen Karena a tabe tabell kont konting ingens ensii memi memilik likii sebanyak IJ kategori, dia menyarankan bahwa χ2 akan asimptotik chi-kuadrat
ˆij } memerlukan perkiraan nilai dengan derajat bebas = IJ-1. IJ-1. Sebaliknya, karena { µ
{ π i + } dan { π + j } df
maka berdasarkan bagian 1.5.6.
= (IJ − 1) − (I − 1)− (J − 1)= (I− 1)(J− 1)
Dimensi dari nilai { π i + } dan
{ π + j } merefleksikan batasan
∑ π =∑ π i
i+
j
+j
= 1 . R. A.
Fisher Fisher (1922) (1922) memperba memperbaiki iki error error yang yang diberi diberikan kan oleh oleh Pearson Pearson (Bagia (Bagian n 16.2). 16.2). Dalam Artikelnya dia memperkenalkan notasi dari derajat kebebasan. Skor Skor
uji uji
meng mengha hasi silka lkan n
stat statis isti tik k
χ 2,
seme sement ntar ara a
uji uji
rasi rasio o
like likeli liho hood od
meng mengha hasi silk lkan an hal hal yang yang berb berbed eda. a. Pada Pada samp sampli ling ng mult multin inom omia ial, l, baka bakall dari dari likelihood adalah.
∏ ∏ π
nij ij
i
j
,dimana seluruh π ij
Dengan Dengan H0: kebebas kebebasan, an, πˆij
π ˆij
= nij
≥ 0 dan ∑ ∑ π ij = 1
= πˆi + + π ˆ+ j =
i
j
ni+ n+ j / n . Dala Dalam m kasus kasus umum umum dima dimana na
/ n . Rasio dari likelihood setara dengan
Λ=
∏∏ n ∏ ∏ n i
j
( n + n+ )
i
j
i
n
nij
j
nij ij
Statis Statistik tik Chi-squ Chi-square are pada pada rasio rasio likelih likelihood ood adalah adalah dengan G 2 , setara dengan
−2log Λ ,
yang yang dinota dinotasik sikan an
G2
= −2 log Λ = 2 ∑ ∑ n ij log(n ij / µ ˆiji j ) i
Dimana { µ ij
= ni +n+ j
j
/ n} . Semakin besar nilai G 2 dan χ2, maka semakin kuat bukti
untuk menolak hipotesis kebebasan.
{ π ij } sampai
Dala Dalam m kasu kasus s yang yang umum, umum, ruan ruang g para paramet meter er terd terdir irii atas atas
dengan pembatasan linier H 0,
∑ ∑ π
ij
i
j
= 1 , sehingga dimensinya adalah IJ-1. IJ-1. Dibawah
J-1). { π ij } ditentukan oleh { π + } dan { π + j } , maka dimensinya adalah (I(I-1)+( J-1). i
Selisih Selisih pada dimens dimensii ini setara setara dengan dengan (I ( I-1)( J-1) J-1).. Untuk Untuk jumlah jumlah sampel sampel yang yang besar besar nilai nilai G 2 dan χ2 memilik memilikii batasa batasan n dis distrib tribusi usi Chi-kua Chi-kuadra dratt yang yang sama. sama. Faktanya keduanya kemudian setara secara asimptotik; χ2- G 2 konvergen dalam peluang ke nol (bagian 14.3.4). Hasil pembatasan untuk sampling multinomial juga dapat diterapkan dengan susunan sampling lainnya (Roy dan Mitra, 1956; Watson, 1959). Hasil Hasil perhitu perhitunga ngan n terseb tersebut ut jika diterap diterapkan kan ketika ketika jumlah jumlah n mening meningkat kat,, sehingga menyebabkan { µij
= nπ ij }
Keti Ketika ka jumla jumlahn hnya ya meni mening ngkat kat,,
meningkat, untuk jumlah kolom yang tetap.
dist distrib ribus usii
mult multin inom omial ial untu untuk k
lebih h { n } lebi ij
baik baik
diperkirakan diperkirakan dengan distribusi normal multivariat, multivariat, dimana G 2 dan χ2 ternyata lebih dekat kepada distribusi Chi-kuadrat. Kekonvergenan χ2 terhadap distribusi Chi Chi
kuad kuadra ratt
lebi lebih h
cepa cepatt
diba diband ndin ingk gkan an deng dengan an
Perhit itun unga gan n deng dengan an G 2 . Perh
menggunakan G 2 memberi memberikan kan hasil hasil yang yang lebih lebih buruk buruk ketika ketika n/IJ <5. Ketika Ketika besa besara ran n I atau atau J besa besar, r, maka maka hasi hasill χ2 cukup cukup memuask memuaskan an ketika ketika sebagi sebagian an frekuenasi yang diharapkan lebih kecil dari 1 namun lebih banyak melampaui 5. Metode sampel kecil (bagian (bagian 3.5) tersedia kapanpun terdapat keraguan apakah jumlah n cukup besar atau tidak.
3.3. Uji Chi-Kuadrat Ikutan Sebagaimana uji signifikansi sebagaimana umumnya, uji kebebasan Chikua kuadrat drat
memi memili liki ki
kegu keguna naan an
yang yang
terba erbattas. as.
Nila ilai
pelua eluang ng
yang ang
keci kecill
mengindikasikan bahwa terdapat bukti yang cukup terhadap adanya hubungan, namun namun menyedia menyediakan kan inform informasi asi yang yang sediki sedikitt tentan tentang g kekuata kekuatan n atau atau bentuk bentuk hubu hubung ngan an
ters terseb ebut ut..
Para Para
stat statis isti tisi si
tela telah h
lama lama
mewa mewasp spad adai ai
untu untuk k
tida tidak k
bergant bergantung ung sepenu sepenuhny hnya a terhad terhadap ap hasil hasil uji Chi kuadra kuadratt diband dibanding ingkan kan dengan dengan mempelajari sifat dari hubungan hubungan tersebut (Berkson, 1938; Cochran, 1954). Pada bagian ini akan didiskusikan lanjutan cara untuk uji tentang hubungan.
3.3.1. Residual Pearson dan Residual yang Distandarkan Perbandingan antar kolom yang diamati atau perkiraan frekuensi harapan memberi memberikan kan pertol pertolong ongan an untuk untuk memperli memperlihat hatkan kan sifat sifat dari dari keterga ketergantu ntunga ngan. n. Dibawa Dibawah h H0, selisi selisih h yang yang semakin semakin besar antara antara ( nij
− µ ˆij ) sering sering
terjadi terjadi dalam dalam
kolom dengan µ ij yang besar. Pada sampling Poisson misalnya, standar deviasi
− µ ij ) adalah
dari nij dan ( nij
( nij
− µ ij ) namun
standar deviasi dari ( nij n ; standar
proporsional terhadap
− µ ˆij ) adalah kurang dari
µ ij . Maka selisih yang mentah ini tidak
cukup. Residual Pearson didefinisikan sebagai eij =
ˆ ij nij − µ
( µ ˆij )
1/2
Percobaan untuk menyesuaikan hal ini. Residual Pearson terkait dengan Statistik Pearson
∑∑ e i
j
Dibawah
2 ij
= Χ2 . H0,
{ e } adalah ij
normal
asimptotik
dengan
mean
0.
Bagaim Bagaimana anapun pun,, pada pada 14.3.2 14.3.2 telah telah ditunj ditunjukk ukkan an bahwa bahwa varian varians s asimpt asimptoti otikny knya a adalah adalah kurang kurang dari dari 1.0, 1.0, yang yang merupa merupakan kan rata-ra rata-rata ta [(I [(I-1)( J-1)]/ J-1)]/(jumla (jumlah h kolom). kolom). Dengan memperbandingkan memperbandingkan residual Pearson Pearson terhadap terhadap nilai persentase persentase standar standar norm normal al membe memberik rikan an indi indika kato torr
kons konser erva vati tiff
bahw bahwa a
kolom kolom memil memiliki iki ting tingka katt
kesesuaian yang kurang. Residua Residuall Pearson Pearson yang yang dis distan tandar darkan kan adalah adalah asimpt asimptoti otik k terhad terhadap ap hasil hasil norm normal al stan standa darr yang yang diha dihasi silk lkan an dari dari memb membag agin inya ya deng dengan an stan standa darr erro errorr (haberman, 1973a dan bagian 14.3.2). Untuk H0: tidak terikat/bebas, maka
ˆ ij nij − µ
µ ˆ ij (1 − pi + )(1 − p+ j )
1/2
Jika nilai residual Pearson yang distandarkan bernilai lebih dari 2 atau 3 dalam nilai mutlak, maka hal ini mengindikasika mengindikasikan n terjadinya terjadinya kekurangsuaian kekurangsuaian H0 dalam kolom tersebut. Nilai yang lebih besar akan lebih sesuai jika derajat bebas besar sehingga terlihat jelas bahwa salah satunya memiliki kesempatan yang cukup besar.
3.3.2. Pendidikan dan Perbaikan Perbaikan Fundamental Fundamental Agama Agama Tabel 3.2 Pendidikan Pendidikan dan Kepercayaan Kepercayaan Agama Tingkat Tertinggi < SMA
SMA atau
Kepercayaan Agama Fundamenta Moderat Liberal
Total
lis 178 (137,8)1 (4,5)2 570
138 (161,5) (-2,6) 648
108 (124,7) (-1,9) 442
1660
(539,5) (2,6) 138
(632,1) (1,3) 252
(488,4) (-4,0) 252
642
424
Junior College
Sarjana
atau pascasarjan a (208,7) (244,5) (188,9) (-6,8) (0,7) (6,3) Total 886 1038 802 2726 Tabel diatas menunjukan residual standar Pearson untuk uji kebebasan. ∧
Misalnya n11 = 178 dan µ = 137,8. 137,8. 11
Hubungan Hubungan persamaa persamaan n Proporsi Proporsi marginal marginal
p1+= 424/27 424/2726= 26=0,1 0,156 56 dan p1+= 88 886/ 6/27 2726 26 = 0,32 0,325 5 dan dan diper diperol oleh eh resi residu dual al standart Pearson adalah 4,5. ∧
Sel Sel ini ini menu menunj njuk ukka kan n ktid ktidak akse sesu suaia aian n yang yang cukup cukup besa besarr anta antara ra n11 dan µ 11 daripada perkiraan jika variabel benar-benar independent. Tabel 3.2 menunjukkan residual positif yang cukup besar untuk subjek < SMA dan pandangan pandangan fundament fundamentalis alis dengan dengan liberal liberal..
diploma diploma atau lulusan lulusan dan pandanga pandangan n
Ini arti artinya nya bahwa bahwa subjek subjek lebih lebih
signif sig nifika ikan n pada bebera beberapa pa kombin kombinasi asi
daripa daripada da H0 : meramalkan meramalkan kebeba kebebasan san..
Serupa Serupa dengan, dengan, jika jika sedikit sedikit subjek subjek
dengan dengan level level pendid pendidikan ikan tinggi tinggi dan pandan pandangan gan liberal liberal daripa daripada da meramal meramalkan kan kebebasanya. Odds Ratio Ratio mendeskripsika mendeskripsikan n trend ini. Tabel 2x2 dibentuk dibentuk dari awal dan akhir baris dan awal dan akhir kolom pada tabel 3.2. diperoleh odds ratio (178x252)/ (108 (108X1 X138 38)= )=3, 3,0. 0. Diplo Diploma ma atau atau lulu lulusa san n esti estima masi si odds odds untu untuk k liber liberal al terp terpil ilih ih daripada fundamentalis adalah 3 kali estimasi odds untuk < SMA.
3.3.3. Mempartisi Chi-Kuadrat Chi-Kuadrat Jika Z merupakan random variabel berdistribusi normal standar. Maka Z2 memil memilik ikii dist distrib ribus usii chi-k chi-kua uadr drat at deng dengan an dera derajat jat beba bebas s 1. Rand Random om varia variabe bell berd berdis isttribu ribus si
chi
kuad kuadra ratt
deng denga an
deraj erajat at
bebas ebas
v
mere merepr pres esen enta tas sikan ikan
z12 + z22 + ...+ z 2v , dimana Z1,…,Zv merupakan random variabel berdistribusi normal stan standa darr yang yang sali saling ng beba bebas. s. Maka Maka jika jika rand random om vaia vaiabe bell ters terseb ebut ut dipa dipart rtis isii , misalnya menjadi v bagian yang masing masingnya mempunyai derajat bebas 1,
akibatnya
Χ12 dan Χ 22 merupakan merupakan random variabel chi
kuadrat kuadrat yang saling bebas
dan dan memil memilik ikii deraj derajat at kebeb kebebas asan an v1 dan v2. Deng Dengan an demik demikia ian n
Χ 2 = Χ12 + Χ22
memiliki distribusi chi kuadrat dengan derajat bebas v 1 + v2. Tambahan lain mengenai uji chi kuadrat adalah dengan mempartisi uji statistiknya sehingga setiap bagian merepresentasikan aspek tertentu dari efek yang berlaku. Dengan melakukan partisi dapat ditunjukkan bahwa hubungan yang terjadi merupakan selisih antara kategori tertentu atau pengelompokan kategori. Kita mulai dengan mempartisi uji kebebasan pada tabel 2 x J. Dengan mempartisi G 2 yang memiliki derajat bebas (J-1) menjadi J-1 bagian. Komponen ke j adalah G 2 untuk tabel 2 x 2 dimana kolom pertama mengkombinasikan kolom 1 melalui j pada tabel lengkap, dan kolom kedua adalah kolom j+1.Hal tersebut merupakan G 2 untuk uji kebebasan pada tabel 2 x J yang setara dengan statistik yang mengkombinasikan dua kolom pertama, ditambah dengan statistik yang mengkombinasikan dua kolom pertama dan kemudian membandingkannya denga dengan n kolo kolom m keti ketiga ga,, dan dan sete seteru rusn snya ya,, terga tergant ntun ung g kepa kepada da stat statis isti tik k yang yang mengkombinasikan J-1 kolom pertama dengan kolom terakhir. Setiap komponen memiliki derajat bebas 1. Sepe Sepert rtin inya ya
lebi lebih h
muda mudah h
untu untuk k
meng menghi hitu tung ng
ntuk G 2 untuk
(J-1 (J-1))
yang ang
memisahkan tabel 2 x2 yang memasangkan setiap kolom dengan pasangannya, katakan yang terakhir. Namun bagaimanapun juga, komponen statistik ini tidak bebas dan bukan merupakan penjumlahan G 2 untuk keseluruhan tabel secara lengkap. Untuk tabel I x J, komponen chi kuadrat yang saling bebas dihasilkan denga dengan n memba memband nding ingka kan n kolom kolom 1 dan dan 2 lalu lalu mengk mengkom ombi bina nasi sika kann nnya ya,, dan dan membandingkannya dengan kolom 3 , dst. Setiap statistik J-1 memilki derajat bebas I-1. Partisi yang lebih sempurna mengandung statistik sebanyak (I-1)(J-1) yang masing masing memiliki derajat bebas 1. Salah satu bentuk partisi tersebut dapat diterapkan pada (I-1)(J-1) memisahkan tabel 2 x 2 (Lancaster, 1949)
∑n
∑∑ n
ab
a
∑n a
a
b
aj
aj
nij
Dengan i=2,..,I =2,..,I dan j=2,…, J. J. Untuk lainnya dapat dilihat pada Giulia dan Haberman (1998) dan Goodman (1969a, 1971b).
3.3.4. Contoh: Asal dari dari Schizopherenia Schizopherenia Tabel 3.3 mengklasifikasikan sampel psychiatrist dengan gagasan psychiatrist sekolah mereka dan dan opini mereka pada asal Schizopherenia. Dimana G2 =23,04 dengan dengan df=4. df=4. Untuk Untuk lebih lebih memaha memahami mi hubung hubungan an ini, ini, kita kita partis partisii G2 kedalam empat komponen komponen saling saling bebas. bebas.
Ditampilkan Ditampilkan dalam tabel tabel 3.4. Untuk Untuk subtabel subtabel
awal awal perb perban andi ding ngan an pand pandan anga gan n ecle eclect ctic ic dan dan medi medica call
scho school ol pada pada asal asal
schizophrenia adalah biogenic atau environmental yang diklasifikasikan dalam 2 katego kategori. ri.
Pada Pada subtab subtabel el ini ini G2 = 0,29 dengan df = 1. Pada Subtabel kedua
perbandingan perbandingan dua dua sekolah dengan dengan menganggap menganggap bahwa bahwa
proporsi proporsi berasal berasal dari
kombina kombinasi si waktu waktu asal asal , lebih lebih dari dari biogenic biogenic atau atau environ environment mental. al. Subtab Subtabel el ini G2=1,36.
Tabel 3.3 Pengaruh Pandangan Sekolah Psychiatric dan Menganggap berasal Schizophrenia Schizophrenia Pandangan
Asal Schizophrnia
Sekolah Psychiatric Eclectic Medical Psychoanalytic
Biogenic
Environmental
Combiantion
90 13 19
12 1 13
78 6 50
Tabel 3.4 Kegunaan Subtabel Dalam Partisi Chi-Squared untuk table 3.3
Ecl Me d
Bio
En
Bio+E
Co
90
v 12
nv 102
m 78 6
13
1
Ecl Me
14
Bio
En
Bio+E
Co
Ecl+M
10
v 13
Ecl+M
nv 116
m 84
ed Psy
3 19
13
ed Psy
32
50
d
Dengan df =1. Penjumlahan dua komponen persamaan G2 untuk uji kebebasan kebebasan dengan dua baris awal pada tabel 3.3. Memberikan bukti kecil perbedaan antara pandangan eclectic dan school medical pada anggapan asal schizophrenia. Kemudian kita kombinasikan eclectic dan medical school dan membandingkan mereka mereka pada psychoa psychoanaly nalytic tic school school..
Pada Pada subtabel subtabel ketiga ketiga pada tabel tabel 3.4
membandingkan mereka pada klasifikasi (biogenic,environmental), memberikan G2=1 =12, 2,95 95 denga dengan n df=1 df=1.. Keemp Keempat at su subt btab abel el memba memband ndin ingka gkan n merek mereka a untu untuk k
(biogenetic (biogenetic atau environmenta environmental, l, kombinasi) kombinasi) dipisahkan, dipisahkan, memberikan memberikan G2=8,43 dengan df=1.
3.3.5. Aturan Partisi Goodman (1969a, 1971b) dan Lancaster (1949, 1969) memberikan aturan untuk menentukan jumlah komponen bebas dari chi kuadrat. 1. Jumlah Jumlah derajat derajat bebas bebas dari sub tabel tabel harus sama sama dengan dengan jumlah deraja derajatt bebas secara keseluruhan 2. Setiap kolom kolom dalam sub sub tabel harus harus dihitung dihitung hanya hanya sekali, sekali, dan setiap setiap sub tabel juga dihitung hanya sekali 3. Mas Masing ing
masi masing ng jum jumlah lah
marg margin inal al dari dari tabel abel seca secara ra leng lengka kap p
haru harus s
merupakan marginal dari hanya salah satu sub tabel. Untuk jumlah partisi yang pasti, ketika jumlah derajat bebas sub tabel dapa dapatt
dijum dijumla lahka hkan n
seper seperlu luny nya a
seme sement ntar ara a
tidak, k, maka maka G 2 tida
masi masing ng-m -mas asing ing
komponen tidak independen. Pada setiap statistik statistik G 2 , terdapat jumlah partisi yang pasti. Statistik
Χ 2
tidak memerlukan hasil penjumlahan yang sama dengan nilai Χ pada sub tabel. 2
Adalah cukup untuk untuk menggunakan menggunakan statistik statistik dimana statistik statistik
Χ 2 tersebut
Χ 2
untuk untuk mempart mempartisi isi su sub b tabel; tabel;
sama sekali tidak memerlukan partisi yang tepat
secara secara aljabar aljabar untuk tabel lengkap. Ketika hipotesis hipotesis null terpenuhi, terpenuhi,
Χ 2
tidak
memilik memilikii kesama kesamaan an asimpo asimpotik tik dengan dengan G 2 . Seba Sebaga gaii tamba tambaha han, n, ketika ketika tabel tabel memiliki jumlah yang kecil dalam uji chi kuadrat lebih aman untuk menggunakan
Χ 2 dalam menyelidiki sub tabel. 3.3.6.Batasan Uji Chi Kuadrat Uji kebebasan Chi kuadrat lebih digunakan untuk mengindikasikan adanya bukti bukti tentan tentang g tingka tingkatt suatu suatu hubung hubungan. an. Hal ini su sudah dah cukup cukup untuk untuk menjawa menjawab b seluru seluruh h pertan pertanyaa yaan n tentan tentang g set data. data. Daripa Daripada da bergan bergantun tung g terhad terhadap ap uji ini, ini, penyelidikan sifat hubungan yaitu: selidiki residual, dekomposisi chi kuadrat ke
dalam beberapa komponen, dan menduga parameter seperti odds rasio yang dapat menjelaskan keeratan hubungan. Uji Uji Chi Chi kuad kuadra ratt juga juga memi memili liki ki kete keterb rbat atas asan an dala dalam m jeni jenis s data data yang yang digunakan. Sebagai contoh, diperlukan jumlah sampel yang besar. Selain itu,
{ µ = n + n+ ij
i
j
/ n} yang digunakan dalam nilai G 2 dan
Χ 2
bergantung kepada total
marginal, namun tidak demikian halnya dengan urutan penempatan pada nbaris dan dan
kolo kolom. m. Deng Dengan an demi demiki kian an
G 2 dan
Χ 2 tida tidak k
beru beruba bah h
nila nilainy inya a
denga dengan n
pengu penguru ruta tan n seme sement ntar ara a bari baris s dan dan kolo kolom. m. Hal Hal ini ini meny menyeb ebab abka kan n bahw bahwa a kita kita memperlakukan kedua klasifikasi tersebut sebagai nominal.. Ketika setidaknya salah salah satu satu variab variabel el adalah adalah ordina ordinal, l, uji stati statisti stik k yang yang memper mempergun gunaka akan n urutan urutan tersebut menjadi lebih sesuai. (lihat uji di bagian 3.4).
3.3.7.Mengapa Menguji Kebebasan? Strukt Struktur ur ideal ideal sepert sepertii strukt struktur ur yang yang bebas bebas sangat sangat jarang jarang berlaku berlaku pada pada situasi praktis. Dengan jumlah sampel yang besar seperti pada tabel 3.2. maka nilai peluang yang didapatkan akan sangat kecil. Dengan memperhatikan hal terseb tersebut ut serta serta batasa batasan n yang yang telah telah diberik diberikan, an, maka maka salah salah satu satu alasan alasan untuk untuk memeriksa kebebasan dari distribusi bersama adalah untuk mendapatkan model yang paling paling cermat. cermat.
Jika model yang yang bebas tersebut tersebut memperkir memperkirakan akan peluang peluang
sebena sebenarny rnya a dengan dengan baik, baik, maka maka kecuali kecuali jumlah jumlah n sangat sangat besar, besar, penduga pendugaan an
ˆij berdasarkan model tersebut { π
= ni + n+ j / n 2 } dari peluang sel akan menjadi lebih
baik baik diband dibanding ingkan kan dengan dengan propor proporsi si sampel sampel
{ p = n ij
ij
/ n} . Maximu Maximum m Likelih Likelihood ood
yang bebas akan menduga perhitungan sampel dengan lebih halus, sehingga mengabaikan fluktuasi yang diakibatkan oleh random sampling. Rumus Mean-Squared error (MSE) MSE = Varians + (Bias) 2 Menjelaskan Menjelaskan mengapa penduga yang saling bebas dapat mempunyai MSE yang lebih kecil. Walaupun masih terdapat bias, mereka memiliki varians yang lebih kecil karena pendugaan didasarkan didasarkan oleh parameter parameter yang lebih sedikit ( { π i + } dan
dibandingkan { π + } dibandingkan j
dengan dengan
{ π } ). ij
Akibatn Akibatnya, ya, MSE akan akan lebih lebih kecil, kecil, kecuali kecuali n
sangat besar sehingga bentuk bias mendominasi varians. Dari tabel 3.5. dapat diilustrasikan bahwa π ij
= πi+ π + j [ 1 + δ (i − 2)( j − 2)] untuk
π i + = π + j = 1/3. Disini Disini -1 < δ < 1, dengan δ =0 menyatakan menyatakan bahwa model adalah bebas bebas.. Kebe Kebeba basa san n dapa dapatt memp memperk erkir iraka akan n hubu hubunga ngan n deng dengan an baik baik keti ketika ka δ mendekati 0. Dengan demikian, total nilai MSE untuk kedua penduga adalah MSE ( { pij } ) =
∑ ∑ E ( p
ij
i
j
− π ij ) 2 =∑ ∑ Var ( pij ) i
j
= ∑ ∑ π ij (1 −π ij ) / n = 1 − ∑ ∑ π 2ij / n i j i j MSE ( { π ij } ) =
∑ ∑ E (πˆ i
ij
− π ij ) 2
j
Tabel 3.5. Peluang Sel untuk Perbandingan Penduga (1+δ)/9 1/9 (1- δ)/9
MSE({ pij})=
1/9 1/9 1/9
(1- δ)/9 1/9 (1+δ)/9
1 8
4δ − n 9 81
1 4 4 4δ 2 2 2 2 ˆ π MSE({ ij })= + + 1 − + 2 − 3 n 9 9n 81 n n n
3.4 Tabel Dua Arah Dengan Klasifikasi Ordinal
uji chi-square X2 dan G2 mengab mengabaika aikan n beberap beberapa a informa informasi si ketika ketika digunakan digunakan untuk menguji independens independensii antar klasifikasi klasifikasi yang berupa ordinal. ordinal. Oleh Oleh kare karena na itu itu dipe diperl rluk ukan an stat statis isti tik k uji uji lain lainny nya a yang yang lebi lebih h baik baik untu untuk k melakukan uji independensi antar klasifikasi ordinal.
Tes
3.4.1 Alternatif Alternatif trend linear linear untuk uji independen independensi si
Analis Analisis is yang yang lebih lebih popule populerr saat saat ini menggu menggunak nakan an metode metode skor skor untuk untuk mengkategorikan dan meringkas trend linear. Uji statistik yang bisa menangkap adanya trend linear adalah uji korelasi Semak emakin in besar esar nila nilaii kore korela las si independen. Rumus yang digunakan adalah:
M 2
abs absolut olut,,
maka maka
dat data
sema emakin kin
tidak idak
= (n − 1)2 r 2
Nilai M2 akan meningkat seiring dengan meningkatnya nilai r dan n. Semakin besar nilai M2, semakin kecil nilai p-value, maka semakin menunjukkan ketidakindependennya. Namun tidak selalu jika M 2 besar berarti hubungan antar klasifikasi ters terseb ebut ut adala adalah h linea linear. r. Nilai Nilai M2 hany hanya a menu menunj njuk ukkan kan ada ada atau atau tidaknya independensi antar klasifikasi.
3.4.2 3.4.2 Contoh Contoh perban perbandin dingan gan antara antara penggu penggunaa naan n Tes uji chi-sq chi-squar uare e X2 dan G2 dengan M2 Tabel 2.8 Tabulasi silang antara Kepuasan Kerja dengan Pendapatan
Pendapatan (dalam Dollar)
Kepuasan Kerja Sangat Tidak Puas
Sedikit Puas
Cukup Puas
Sangat Puas
< 15.000 1 3 10 6 15.000 – 2 3 10 7 25.000 25.000 – 1 6 14 12 40.000 > 40.000 0 1 9 11 Sumber: General Social Survey, National Opinion Research Center, 1996.
Dari tabel di atas dapat dihitung nilai uji chi-square X 2=6,0 dan G2=6,8 deng dengan an df=9 df=9 (nila (nilaii p-val p-value ue nya nya = 0,74 0,74 dan dan 0,66 0,66). ). Dari Dari nila nilaii p-val p-value ue terseb tersebut ut ternya ternyata ta gagal gagal tolak tolak H0, arti artiny nya a bahw bahwa a tida tidak k ada ada hubu hubung ngan an antara kepuasan kerja dengan tingkat pendapatan. Namun apabila menggunakan score (1,2,3 dan 4) untuk kepuasan kerja dan (7,5; 20; 32,5; dan 6,0) untuk tingkat pendapatan, ternyata diperoleh nilai ilai kore korela las si r=0, r=0,2 2 dan dan uji uji stat tatisti istik k M2=(96-1)(0,2)2=3 =3,8 ,81 1 sert erta pvalue=0,51. value=0,51. Dengan Dengan uji 1 arah (trend positif), positif), dengan menggunaka menggunakan n M= =1,95 dan p-value = 0,026 ternyata berhasil menolak H 0. Jadi uji M2 lebih kuat dari pada chi-square.
3.4.3 Alternatif Alternatif trend Monoton Monoton untuk uji independens independensii
Selain Selain trend trend linear linear yang yang membut membutuhka uhkan n skorin skoring, g, alterna alternatif tif lainny lainnya a yang yang lebih fleksibel adalah dengan menggunakan gamma. Untuk sampel besar, gamma konvergen ke distribusi normal. Uji statis statistik tik . Dari tabel tabel 2.8 didapa didapatt nilai nilai = 0,221, 0,221, SE=0,1 SE=0,117 17 (denga ngan perhi rhitungan softw ftware SAS), sehing ingga dipe iperoleh nilai lai z=0,221/0,117 = 1,89 (p-value=0,03). Dengan tingkat keyakinan 95% nilai terletak terletak pada pada 0,221 1,96(0,117 1,96(0,117)) atau atau (-0,01 (-0,01 s.d s.d 0,45). 0,45). Jadi hubungan hubungan sebena sebenarny rnya a antara antara kepuas kepuasan an kerja kerja dengan dengan tingka tingkatt pendap pendapata atan n adalah adalah positif yang moderat.
3.4.4 Extra Extra Power untuk uji independen independensi si data ordinal ordinal 2 2 pengujian independensi independensi Uji X dan G adalah uji yang paling umum untuk pengujian antar variabel. amun untuk ntuk uji uji ind indepen epend densi ensi dat data yang ang bers berska kala la ordi ordina nall dan dan Namun menunjukkan adanya trend, maka statistik uji M 2 atau z (fungsi gamma) lebih kuat dari X 2 dan G2.
3.4.5 3.4.5 Pemilih Pemilihan an skor skor Ada beberapa cara penentuan skor, namun yang ideal adalah bahwa skala skor kor dipil ipilih ih dari konsens ensus (kese esepakat katan) para ahli, sehi ehingga interpretasinya tidak mengalami distorsi. Perbedaan sistem skor akan menghasilkan perbedaan interpretasi. Salah h satu satu meto metode de yang yang dise disepa paka kati ti oleh oleh para para ahli ahli adal adalah ah meto metode de Sala Spearman’s rho. rho. Metode ini digunakan ketika variabel yang diuji (X dan Y) adalah variabel ordinal dan M2 menggunakan midrank scores. Berikut adalah contoh bahwa perbedaan skor akan mempengaruhi hasil interpretasi Contoh: Tabel 3.7 Hubungan antara Konsumsi dengan Malformation
Malformation Absent Present Jumlah
Konsumsi Alkohol (Rata-rata Frekuensi Minum per hari) 0
<1
1 -2
3–5
≥6
1 7 .0 6 6 48
1 4 .4 6 4 38
7 88 5
1 26 1
37 1
17.114
14.502
793
127
38
Sumber: Graubard and Korn, 1987)
Apabila menggunakan skor sembarang untuk konsumsi alkohol (0; 0,5; 1,5; 4; 7), maka nilai M 2=6,57 dan p-value=0,01 p-value=0,01.. Dengan demikian maka H0 dito ditola lak k (ter (terda dapa patt hubu hubung ngan an anta antara ra kons konsum umsi si alko alkoho holl deng dengan an malformation).
Apabila menggunakan skor bertingkat (1, 2, 3, 4, 5), maka nilai M 2=1,83 dan p-value=0,18, Dengan demikian maka gagal tolak H0 (tidak terdapat hubungan antara konsumsi alkohol dengan malformation). Apabila Apabila menggunakan menggunakan skor midrank midrank (8557,5; (8557,5; 24.365,5; 24.365,5; 32.013; 32.473 32.473 2 dan 32.555,5), maka nilai M =0,35 dan p-value=0,55. Dengan demikian maka gagal tolak H0.
3.4.6 3.4.6 Uji Trend Trend untu untuk k I x 2 dan 2 x J 2 Dengan midrank skor untuk Y, uji M untuk tabel 2 x J cukup sensitif untuk perbedaan di dalam mean rank untuk dua baris. Uji ini dikenal dengan Wilcoxon atau Mann-Whitney test . Ketika Y mempunyai 2 tingkatan pada tabel I x 2, trend linear dalam stat statis isti tik k kemu kemudi dian an kemba kembali li ke trend trend linea linearr dala dalam m pelu peluan ang g kate katego gori ri respons. respons. Uji ini dikenal dikenal dengan Uji Trend Cochran-Armitage (dibahas pada bab 5.3.5).
3.4.7 Tabel Nominal Nominal dan Ordinal Ordinal Pengujian dengan teknik korelasi (M2) atau gamma ( ) adalah tepat apabila kedua klasifikasi data adalah ordinal. Namun ketika ada gabungan nominal dan ordinal, maka diperlukan statistik uji lain. Salah satunya adalah dengan cara merangkum tingkat variasi di antara rata-rata variabel ordinal pada kategori yang berbeda-beda dari variabel nominal. Ini akan didiskusikan pada bagian 7.5.3.
3.5 Uji Independensi Independensi dengan Sampel Kecil
Ketika n kecil, maka metode alternatif yang digunakan adalah exact smallsample distribution, distribution, bukan large-sample approximations. approximations.
3.5.1Uji Fisher’s exact untuk tabel 2 x 2 Sebuah Sebuah fungsi fungsi dis distrib tribusi usi tidak tidak tergan tergantun tung g pada pada parame parameter ter yang yang tidak tidak diketa diketahui hui dari pengkond pengkondisi isian an total marginal marginal pada pada tabel tabel kontin kontingen gensi. si. Parameter-parameter itu biasanya bukan fix variabel. Contohnya pada distribusi Poisson tidak mempunyai parameter yang fix. Pada distribusi multinomial hanya n yang fix. Dan pada distribusi binomial untuk tabel 2 x 2, hanya total marginal baris yang fix. Uji Fisher’s exact menggunakan distribusi hypergeometric sebagai berikut:
Rumus tersebut adalah distribusi dari
.
dimana
terlatak antara dan
Untuk tabel 2x2, Independensi terjadi ketika odds ratio θ=1. H0: θ=1. Pvalue adalah penjumlahan penjumlahan distribusi distribusi hypergeomet hypergeometric ric , t0 adalah notasi untuk nilai n 11 yang diobservasi.
3.5.2Fisher’s Tea Drinker Berikut diberikan contoh penggunaan rumus Fisher. Tabel 3.8 Percobaan Fisher’s Tea Tasting Guess Poured First Milk Tea Milk 3 1 Tea 1 3 Total 4 4 Sumber: Berdasarkan Percobaan oleh Fisher, 1935. Poured First
Total 4 4
Percobaan dilakukan oleh A. Fisher dengan koleganya Dr.Muriel Bristol. Kole Kolega gany nya a dimi dimint nta a untu untuk k memb membed edak akan an mana mana di anta antara ra 4 cang cangki kirr minuman yang ditambahkan susu atau teh terlebih dahulu. Misal t0 = 3 adalah tebakan kolega Fisher yang sesuai, maka probability ditambahkannya susu terlebih dahulu dalam cangkir minuman adalah:
Dengan cara sama diperoleh probabilitas n11=4 adalah 0,014, sehingga nilai P-val -value ue , maka maka gaga gagall tola tolak k H0, arti artiny nya a tida tidak k ada ada hubungan antara prediksi Dr.Bristol dengan kondisi sesungguhnya.
3.5.3P-Value dua arah untuk Uji Fisher’s Exact Untuk uji satu arah, nilai p-value yang sama dapat dihasilkan dari tabel ordinal tergantung dari besarnya n 11, besarnya odds ratio atau besarnya perbedaan proporsi. Untuk uji 2 arah, perbedaan kriteria memberikan perbedaan p-value. Untuk uji 2 arah, ada 4 pendekatan yang digunakan yaitu:
Pert Pertam ama, a, Penj Penjum umla laha han n
untu untuk k
deng dengan an P-va P-value lue nya nya adal adalah ah observasi t0. Yang kedua, menggunakan rumus: ,
meng menghi hitu tung ng t
seba sebaga gaim iman ana a untu untuk k nila nilaii
Dima Dimana na hype hyperg rgeo eome metr trik ik untuk statistik Pearson
. Bent Bentuk uk ini ini iden identi tik k deng dengan an yang diobservasi.
Yang ketiga, menggunakan bisa lebih dari 1.
Yang keempat, menggunakan ditambah probablitas yang dihasilkan di bagian ekor lain yang paling dekat tetapi tidak melebihi probabilitas ekor tersebut. Pada praktiknya, uji 2 arah lebih umum digunakan daripada uji 1 arah. Salah satu alasannya adalah adanya konsistensi dari tingkat kepercayaan 2 arah arah unt untuk meng menges esti tima mas si ukura kuran n yang yang memun emungk gkin inka kan n unt untuk membedakan antara 2 perlakuan.
, tetapi nilai ini
3.5.4Tentang suatu fenomena Diskret dan isu konservatif Distribusi Distribusi Hypergeometrik Hypergeometrik adalah distribusi distribusi diskret diskret untuk sampel kecil. Pada Pada umumny umumnya a dis distri tribus busii dis diskret kret tidak tidak dapa dapa menerim menerima a level level sig signif nifikan ikan yang fix, seperti 0,05. Hal ini menimbulkan stigma bahwa cara tersebut adalah konservatif (kuno). Cara lain untuk dapat menggunakan menggunakan level signikan yang fix (0,05) (0,05) adalah dengan rumus:
Atau dengan mid-P-value dengan rumus mid-P-value = (1/2)P(n11=3) + P(n11>3).
3.5.5Uji non-kondisional sampel kecil untuk independensi Asumsi sampling secara umum untuk analisis perbandingan antara 2 grup pada pada binary binary respon respons s adalah adalah bahwa bahwa baris2 baris2 merupa merupakan kan sampel sampel binomia binomiall yang yang indepe independen nden.. Untuk Untuk dis distri tribus busii poisson poisson dan multino multinomial mial,, tidak tidak ada distribusi marginal yang fix. Uji non-kondisional sampel kecil untuk independensi adalah:
Untuk nilai π1= π2, probabilitas pada tabel 1 adalah , supremum terjadi pada saat π=1/2. Sehingga P-value = 2(0,5)3(0,5)3=0,031
3.5.6Uji kondisional versus uji non-kondisional
Untu Untuk k stat statis isti tik k infe infere rens nsia ia deng dengan an nila nilaii tida tidak k nol nol (sep (seper erti ti inte interv rval al kepercayaan), Uji kondisional diterapkan hanya dengan odds ratio, tidak dengan yang lain. Uji non kondisional kondisional lebih powerful powerful dibanding dibanding uji kondisional kondisional (seperti Uji Fisher’s Fisher’s exact). Hanya saja secara komputasi, komputasi, uji non-kondisio non-kondisional nal lebih rumit dan kompleks. Akan tetapi jika marginal total secara alami berupa fixed variabel, maka Uji Fisher’s exact adalah yang terbaik. Meski dikategorikan konservatif, namun namun dengan dengan menggun menggunaka akan n mid-P-v mid-P-valu alue e akan akan bis bisa a mengur mengurang angii efek efek konservatif dari data diskret tersebut.
3.5.7Penurunan Distribusi Kondisional Exact Diasumsikan antar baris dalam tabel IxJ mempunyai distribusi multinomial yang yang indep indepen enden den.. Tota Totall bari baris s distribusi kondisional
adala adalah h fixed. fixed. I dies diesti tima masi si seba sebaga gaii .
Formula Hipotesis H0:
Fungsi Probabilitas multinomial dirumuskan:
Distribusi
Kontribusi Kontribusi
tergantung pada
(indpenden).
.
pada pembentukan pembentukan distribusi distribusi multinomial multinomial sebagaimana sebagaimana
rumus di atas tergantung pada data
.
Data Data
juga juga berd berdis istr trib ibus usii mult multin inom omia iall (n, (n, {π+j}) deng dengan an form formula ula::
Rumus pertama dibagi dengan rumus kedua akan menghasilkan distribusi multihypergeometrik dengan rumus sebagai berikut:
3.5.8Uji Independen Exact untuk Tabel IxJ Diberikan contoh tabel 3.9 tabulasi silang antara tingkat merokok dengan Myocardial infarction sebagai berikut: Tingkatan Merokok (batang rokok per hari) 0 1 - 24 > 25 Control 25 25 12 Myocardial 0 1 3 Infarction
Apabila menggunakan statistik uji X2 (yang mengabaikan kategorisasi data
ordina ordinal) l) diperol diperoleh eh nilai nilai exact exact , jadi jadi gagal gagal tolak H0, artinya tidak ada hubungan antara banyaknya merokok dengan myocardial infarction. Dengan uji kondisional, perhitungan marginal untuk baris 1 (25, 26, 11) dan dan untu untuk k bari baris s 2 (0, (0, 0, 4) akan akan dipe dipero role leh h prob probab abili ilita ta (ses (sesua uaii rumu rumus s multiple multiple hypergeometr hypergeometrik ik ) adal adalah ah 0,01 0,018, 8, jadi jadi H0 dito ditolak lak,, artin artinya ya ada ada hubungan antara banyaknya merokok dengan myocardial infarction.
3.6
Interv Interval al Keperc Kepercaya ayaan an dengan dengan Sampe Sampell Kecil Kecil untuk untuk Tabel Tabel 2x2
3.6.1 Inferensia Sampel kecil untuk Odds Ratio
Untuk distribusi distribusi multinomial multinomial
tergantung tergantung pada n dan
. Odds ratio
untuk tabel 2x2 adalah:
adalah fungsi dari
dan
Dan
berdistribusi multinomial dengan
parameter
Karena n11 adalah marginal total, maka distribusi distribusi kondisional kondisional
noncentral
hypergeometrik dengan hypergeometrik dengan rumus sebagai berikut:
Untuk
Sedangkan untuk Ha: θ≤θ0, nilai P-value adalah
n11=t0,
H0:
θ=θ0,
dan
Ha:
θ≥θ0,
nilai
P-value
adalah
Jika θ0=1, maka akan menjadi uji 1 arah Fisher’s exact. Estimasi parameter θ adalah dengan Conditional Maximum Likelihood. Likelihood.
3.6.2 Sampel Tea Tasting
Dari tabel 3.8 dengan Conditional Conditional ML, diperoleh diperoleh nilai estimasi estimasi θ sebesar sebesar 6,4. 6,4. Dengan Dengan tingka tingkatt keperca kepercayaa yaan n ≥ 0,95 0,95 dipero diperoleh leh nilai nilai interv interval al (0,2; (0,2; 626,2) Dengan uji 2 arah diperoleh interval yang lebih kecil yaitu (0,3; 306,2).
3.6.3 Dampak data diskret terhadap Inteval kepercayaan.
Untuk sampel kecil, uji independensi dan penentuan interval kepercayaan meng menggu guna naka kan n prob probab abil ilit ity y exac exactt (wit (with h cond condit itio iona nall dis distr trib ibut utio ion) n).. Oleh Oleh karenanya karenanya dikatakan dikatakan sebagai sebagai pendekatan pendekatan konservatif konservatif (sebab pengaruh pengaruh data diskret). Untuk Untuk sampel sampel besar, besar, bis bisa a dipilih dipilih antara antara pendeka pendekatan tan konser konservat vatif if atau atau liberal. Sebagai contoh, untuk data pada tabel 3.8, nilai P-value chi-square = 0,157 (gagal tolak H 0) dibandingkan dengan uji exact 2 arah dengan pvalue 0,486 (tolak H 0). Dengan Dengan tingka tingkatt keperca kepercayaa yaan n 95% pada pada sampel sampel besar esar,, Conf Confid iden enc ce inte interv rval al untuk ntuk odds odds rat ratio adal adalah ah (0,4; 0,4; 22 220, 0,9) 9) dibandingkan dengan Cornfield’s exact dengan confidence interval (0,2; 626,2). Secar ecara a norm normal al,, meto metode de exa exact lebi lebih h dian dianjjurka urkan n dari daripa pada da meto metode de approx approxima imate, te, meskipu meskipun n metode metode exact exact termasu termasuk k metode metode konser konservat vatif, if, terutama untuk sampel kecil. Metode untuk data diskret yang dianggap bisa mengkompromisasi metode kons konser erva vati tiff dan dan libe libera rall adal adalah ah deng dengan an mid-P mid-P-v -val alue ue.. Untu Untuk k estim estimas asii interv interval al odds odds ratio, ratio, mid-P-v mid-P-valu alue e bis bisa a sangat sangat konser konservat vatif, if, namun namun untuk untuk sampel kecil, mid-P-value bisa lebih akurat dari metode liberal (Cornfield exact interval). Contohnya untuk tabel 3.8 , dengan tingkat kepercayaan 95%, 95%, interv interval al yang yang dihasi dihasilkan lkan dengan dengan mid-P-v mid-P-valu alue e adalah adalah (0,31; (0,31; 309) 309) mempunyai mempunyai interval lebih pendek pendek dari pada interval interval Cornfield Cornfield yaitu (0,21; 626).
3.6.4 Inferensia Dengan Sampel Kecil untuk Perbedaan Proporsi Pen Pendeka dekattan kond kondis isio iona nall untuk ntuk meng menghi hila lang ngka kan n para parame metter yang ang mengganggu (tidak berarti) dapat dilakukan manakala tersedia statistik yang cukup, sehingga hanya beberapa model saja yang bisa menerima penggunaan pendekatan kondisional. Pendekatan non-kondisional meskipun penghitungannya lebih kompleks, namun tida tidak k membu membutu tuhk hkan an stat statis isti tik k yang yang cukup cukup untu untuk k mengh menghil ilan angka gkan n para parame meter ter pengganggu. Misal ada parameter pengganggu λ = π1 + π2. Maka bisa direkayasa dengan cara mensubstitusikan δ = π1 - π2, akan akan diperol diperoleh eh π1 = (λ+ δ)/2 dan π2 = (λ- δ)/2. Untuk δ = δ0 dan λ adalah fixed, maka P-value adalah supremum dari probability semua nilai λ, sehingga sehingga yang muncul adalah nilai δ0 yang tidak unik (lebih dari 1). Adapun confidence interval untuk π 1 - π2 adalah nilai-nilai δ0 dimana nilai Pvaluenya tidak tidak lebih dari α. Sebagai catatan tambahan: tambahan: Penyusunan 1 Interval 2 arah lebih baik dari pada 2 interval 1 arah yang terpisah. 3.7. Perluasan Untuk Untuk Tabel Multi Arah dan Respons Tanpa Tabulasi
Merupakan perluasan tabel multi arah untuk tabel kontingensi
3.7.1 Data Kategorik yang Tidak memerlukan Tabel Kontingensi
Model Model untuk untuk variab variable le respon respon katego kategorik rik dapat dapat sebaik sebaik variabl variable e penjela penjelas s kategorik Ketika seluruh atau sebagian besar variable adalah kategorik, maka tidak perlu selalu menjadi tabel kontingensi, tapi dapat dibuat menjadi bentuk garis data untuk setiap subjek Software akan membaca data kemudian menganalisa yang mungkin akan melibatkan tabel kontingensi. Sebagai ilustrasi diberikan contoh berikut : Subject Gender Race Education Opinion 1
f
w
2
1
2
m
b
3
1
3
m
w
1
2