Bab 2 Landasan Teori
2.1. Pengertia Pengertian n Uji Chi-Square
Uji chichi-square dibuat oleh Karl Pearson (1899) yang sering disebut juga dengan pearson chichi -square yang bisa digunakan untuk uji kecocokan ( goodness of fit test), ), uji kebebasan (test (test for independe independence nce)), pengujian homogenitas serta pengujian varians dan standar deviasi populasi tunggal.
Uji chichi-square adalah pengujian hipotesis mengenai perbandingan antara frekuensi frekuensi observasi observasi atau aktual dengan frekuensi frekuensi harapan atau ekspektasi. Frekuensi Frekuensi observasi observasi (O) adalah nilai yang didapat didapat dari dari hasil hasil percobaan. percobaan. Sedangkan Sedangkan frekuensi frekuensi harapan harapan (E) adalah nilai nilai yang dapat dapat dihitung dihitung secara secara teoritis. teoritis. Rumus umum uji uji chichi-square adalah: X2 = ∑
Oi -Ei ² E
Beberapa hal yang perlu diketahui berkenaan dengan distribusi chichi-square adalah: a. Dist Distrib ribus usii chichi-square memiliki satu parameter yaitu derajat bebas (db). b. Ni Nilai lai-n -nil ilai ai chichi-square dimulai dari nol disebelah kiri sampai nilai-nilai positif tak terhingga disebelah kanan. c. Prob Probab abili ilitas tas nila nilaii chichi-square dimulai dari sisi sebelah kanan. d. Luas daerah daerah dibawah dibawah kurva normal normal adalah 1. Nilai Nilai dari chichi-square bisa dicari jika kita memiliki informasi luas daerah disebelah kanan kurva serta derajat derajat bebas. bebas. Derajat bebas bebas adalah k-1 dimana dimana k adalah jumlah kategori. kategori. Misalnya Misalnya jika luas luas daerah disebelah disebelah kanan adalah adalah 0,1 0,1 dan derajat bebas sebanyak 7, maka nilai chichi-square adalah 12,017.
2.1.1. Faktor-Faktor Penting dalam Uji Chi-Square
Untuk menggunakan hipotesis chi-square kita harus mempunyai sampel ukuran yang cukup besar untuk menjamin kesamaan antara teori distribusi yang benar dan distribusi samplingchi-square (X2) akan ditaksir terlalu tinggi dan akan mengakibatkan terlalu banyak penolakan H0.
Untuk menghindari terjadinya kesimpulan yang tidak benar dari uji hipotesis chi-square (X2), ikutilah peraturan yang umum bahwa frekuensi yang diharapkan lebih kecil dari 5, yang terdapat di dalam salah satu bagian tabel kemungkinan terlalu kecil untuk digunakan. Pada saat tabel mengandung lebih banyak bagian dengan frekuensi yang diharapkan kurang dari 5, maka kita dapat mengkombinasikan ini semua untuk memperoleh frekuensi yang diharapkan yaitu 5 atau lebih.Tetapi dengan demikian kita mengurang mengurangii besarnya besarnya kategori kategori data data dan akan mencapai mencapai atau memperoleh lebih sedikit informasi dari data tabel kemungkinan.
Dalam pengujian chi-square untuk memutuskan apakah menerima atau menolak H0, yaitu hipotesis antara dua variabel yang saling bebas. Dua variabel tersebut adalah: a. Letaknya Letaknya terhadap terhadap metode-metod metode-metodee penggantian penggantian.. b. Daerah Daerah geog geografi rafis. s.
Uji chi-square dapat juga digunakan untuk memutuskan apakah keterangan-keterangan distribusi peluang seperti binomial, poisson dan normal adalah distribusi yang tepat. Uji chi-square memungkinkan kita untuk untuk bertany bertanyaa sejauh sejauh mana mana kita dapat dapat melakuk melakukan an asumsi asumsi yang yang mendasari keterangan-keterangan distribusi sebelum kita menyimpulkan apakah distribusi itu tidak terlalu panjang untuk dipakai dan apakah ada signifikansi yang berbeda antara pengamatan distribusi frekuensi dan teori distribusi.
Dengan cara ini kita dapat kebaikan yang tepat. Dari distribusi ini dapat menentukan apakah kita harus percaya bahwa pengamatan merupakan sampel penutup dari hipotesa mengenai teori distribusi.
Berikut ini adalah beberapa hal penting yang perlu kita pertimbangkan dalam prosedur pembuatan chi-square: chi-square: 1. Uji chi-square dirancang untuk digunakan dengan data frekuensi, sedangkan uji kolmogorv smirnov dirancang untuk digunakan dalam data kontinyu. 2. Uji kolmogorov smirnov boleh digunakan baik dalam uji-uji satu sisi maupun
dua
sisi.
Uji
chi-square
tidak
membedakan
arah
ketidaksesuaian yang terjadi antara data teramati dan data harapan. 3. Uji chi-square mempersyaratkan agar data dikelompokkan data dalam kategori, sementara uji kolmogorov smirnov tidak demikian. Dengan demikian uji kolmogorov smirnov lebih efisien dalam menggunakan data yang dikelompokkan. 4. Uji chi-square tepat bila digunakan dengan data nominal serta bila distribusi distribusi yang dihipotesis dihipotesiskan kan ini adalah data diskrit. diskrit. 5. Uji chi-square dilengkapi dengan data suatu prosedur koreksi yang jelas apabila parameter-parameter yang dikehendaki masih harus diduga dari data sampel.
Goodness of Fit Test Test ) 2.2. Uji Kecocokan ( Goodness Goodness
of
fit
test
adalah
suatu
test
yang
digunakan
untuk
membandingkan distribusi frekuensi pengamatan dan pencocokan nilai yang diharapkan atau teori-teori distribusi. Tekniknya adalah dengan menggunakan tipe goodness of fit test, test , yakni bahwa bahwa test tersebut tersebut digunakan digunakan untuk menguji apakah terdapat perbedaan yang cukup signifikan antar banyaknya banyaknya sampel yang diamati diamati dari dari objek yang masuk dalam masingmasingmasing kategori dengan banyaknya yang diharapkan berdasarkan H0.
Untuk dapat membandingkan sekelompok frekuensi yang diamati dengan kelompok frekuensi yang diharapkan, tentunya kita harus dapat menyatakan frekuensi manakah yang kita harapkan itu. Hipotesis nol (H0) menyatakan proporsi objek yang jatuh dalam masing-masing kategori di dalam populasi yang ditetapkan. Ini berarti, dari hipotesis nolnya kita dapat membuat deduksi apakah frekuensi yang diamati cukup mendekati frekuensi frekuensi yang diharapkan diharapkan atau mempunyai mempunyai kemungkinan kemungkinan besar untuk untuk terjadi di bawah H0.
Dalam goodness of fit test ada hal-hal hal-hal yang yang harus harus diperhat diperhatikan ikan adalah adalah antara lain: a. Adanya Adanya frekuensi observasi observasi atau frekuens frekuensii yang benar-benar benar-benar terjadi dalam eksperimen eksperimen dan dilambangkan dilambangkan dengan dengan O. b. Adanya Adanya frekuensi yang diharapkan diharapkan terjadi yang yang dilambangkan dilambangkan dengan E, diman dimanaa E=np. E=np. c. Deraj Derajat at bebas bebas adala adalah h k-1 k-1.. d. Nilai ilai chichi-square. square . e. Jumlah sampel sampel yang digunakan digunakan harus harus mencukupi mencukupi nilai harapan harapan paling sedikit 5 (e>5).
Untuk masing-masing kategori, terdapat suatu peluang bahwa suatu hasil pengamatan yang dipilih secara acak dari populasi yang dihipotesiskan akan masuk ke dalam kategori tersebut. Apabila hipotesis nolnya benar, maka kita dapat memperoleh frekuensi harapan (expected (expected frequency) frequency ) untuk masing-masing kategori. Untuk hipotesis nol, sampel ditarik dari sebuah popula populasi si yang yang mengikut mengikutii suatu suatu distribu distribusi si yang yang telah diteta ditetapkan pkan.. Sedangkan untuk hipotesis tandingan, sampel bukan berasal dari populasi dengan distribusi yang telah ditetapkan.
2.3.Uji Kolmogorov SmirnovGoodness of Fit Test
Uji kolmogorov smirnov adalah suatu uji nonparametrik untuk perbedaan antar distribusi-distribusi kumulatif, sebuah sampel uji menyangkut persesuaian antar distribusi kumulatif yang teliti dari nilai-nilai sampel dan fungsi fungsi distribusi kontinyu yang spesifik, spesifik, jadi hal tersebut merupakan suatu goodness of fit test. test .
Uji dua sampel menyangkut persesuaian antara dua distribusi yang diteliti diteliti yang menguji menguji suatu suatu hipotesis hipotesis apakah dua sampel sampel bebas berasal berasal dari distribusi kontinue identik, dan peka terhadap perbedaan populasi dengan melihat melihat pada lokasi, lokasi, dispersi dispersi atau skewness. skewness .
Uji sebuah sampel kolmogorov smirnov secara umum lebih efisien dibandingkan dengan uji chi-square untuk goodness of fit test dari sampel dalam jumlah kecil, dan dapat digunakan untuk sampel yang sangat kecil, diman dimanaa di dalam dalam uji uji chi-square tidak dapat diterapkan. Namun harus diingat bahwa uji chi-square dapat digunakan dalam hubungannya dengan distribusi diskrit, mengingat uji kolmogorov smirnov tidak dapat digunakan. Uji satu sampel sampel didasarkan didasarkan pada pada perbedaan absolu absolutt maksimum antara antara nilai-nilai dari distribusi kumulatif sampel acak yang berukuran n dan distribusi secara teoritis yang lebih spesifik.
Dalam
pengujian
satu
sampel
memperlihatkan
perjanjian
antar
pengamatan distribusi kumulatif dari nilai sampel dan menetapkan distribusi kontinyu. Dengan demikian pengujian ini sangat baik. Sedangkan pada pengujian dua sampel memperlihatkan perjanjian antara dua penga pengamat matan an distrib distribusi usi kumul kumulatif atif,, hipotesi hipotesiss dua samp sampel el ini menyatakan apakah kedua sampel saling bebas dari distribusi kontinyu yang sama.
Uji dua sampel kolmogorov smirnov didasarkan pada perbedaan absolut maksimum antara nilai-nilai dari dua distribusi kumulatif yang teliti secara prinsip. Uji dua sampel sangat mirip dengan uji satu sampel, nilainilai kritis yang diperlukan dapat diperoleh dari tabel-tabel khusus.
Uji sampel tunggal kolmogorov smirnov dapat kita ringkaskan dengan langkah-langkah sebagai berikut: 1. Tetapka Tetapkan n fungsi fungsi kumulati kumulatiff teoritis teoritis berdasa berdasarkan rkan distri distribus busii samplin sampling g teoritis. 2. Teta Tetapk pkan an H0 yang akan diuji. 3. Susunlah Susunlah skor observasi observasi berdasar berdasarkan kan ranking. ranking. 4. Hitung Hitung proporsi proporsi masing-masing masing-masing frekuensi frekuensi untuk untuk setiap interval. interval. 5. Hitung Hitung proporsi proporsi kumulatif frekuensi frekuensi observasi observasi dan observasi teoritis. teoritis. 6. Dengan rumus rumus mencari mencari deviasi maksimum maksimum maka dapat dapat ditentukan ditentukan besarnya deviasi mengamati selisih maksimum dari suatu frekuensi kumulatif yang telah dihitung. 7. Apabila Apabila sampel sampel lebih lebih besar besar dari 35, maka maka kriteria yang dipergunaka dipergunakan n adalah sesuai rumus yang diberikan pada bagian bawah tabel. 8. Bandingkan Bandingkan besarnya besarnya angka yang diperoleh diperoleh pada pada deviasi deviasi maksimum dengan angka dalam tabel. 9. Kriteria Kriteria pengambilan pengambilan keputusan keputusan adalah adalah apabila harga harga deviasi maksimum lebih kecil dari angka yang didapat dalam tabel maka H0 diterima.
Tes satu satu samp sampel el kolmogorov smirnov adalah suatu goodness of fit test artinya yang
diperlihatkan
adalah
tingkat
kesesuaian
antara
distribusi
serangkaian harga sampel (skor yang observasi) dengan suatu distribusi teoritis tertentu. Tes ini menetapkan apakah skor-skor dalam sampel dapat secara secara masuk masuk akal dianggap dianggap berasal dari dari suatu populas populasii dengan teoritis itu.
Singkatnya tes ini mencakup perhitungan distribusi frekuensi kumulatif yang akan terjadi di bawah distribusi teoritisnya, serta membandingkan distribusi frekuensi itu dengan distribusi frekuensi kumulatif hasil observasi. Distribusi teoritis tersebut merupakan representatif dari apa yang diharapkan di bawah H 0. Tes ini menetapkan suatu titik dimana kedua distribusi itu diyakini sebagai distribusi yang teoritis dan yang terobservasi memiliki perbedaan terbesar.
Dengan melihat distribusi sampling-n sampling-nya ya dapa dapatt kit kitaa keta ketahu huii aapa pakah kah perbedaan yang besar itu mungkin terjadi hanya karena kebetulan saja artinya distribusi sampling itu menunjukkan apakah perbedaan besar yang teramati teramati itu mungkin terjadi apabila observasi observasi itu benar-benar benar-benar suatu sampel dari distribusi teoritis itu.Misalkan f 0(x) = suatu fungsi distribusi frekuensikumulatif
yang
sepenuhnya
ditentukan
yakni
distribusi
kumulatif teoritis di bawah H0. Artinya harga n yang sembarangan besarnya, harga f0(x) adalah sembarangan proporsi kasus yang diharapkan mempunyai skor yang sama atau kurang dari pada x.
Misalkan SN(x) = distribusi frekuensi kumulatif yang terobservasi dari suatu sampel random dengan N buah observasi. Dimana x adalah sembarangan skor yang mungkin,
SN(x) = k/N, dimana k adalah
banyaknya observasi yang sama atau kurang dari x.
Dibawah hipotesis nol bahwa sampel itu telah ditarik dari distribusi teoritis tertentu, maka diharapkan bahwa untuk setiap harga x, S N(x) harus jelas mendekati f0(x) artinya artinya di bawah nol kita kita akan mengharapka mengharapkan n selisih antara SN(x) dan f0(x) adalah kecil dan ada dalam batas-batas kesalahan random. random . Test kolmogorov smirnov memusatkan perhatian pada penyimpangan terbesar. Harga f0(x) - SN(x) terbesar dinamakan deviasi maksimum.
Dmaks = f0( x ) - SN(x)
Distribusi sampling D di bawah H0 diketahui tabel E pada lampiran memberikan
harga-harga
kritis
tertentu
distribusi
sampling
itu
perhatikanlah bahwa signifikan suatu harga D tertentu adalah bergantung pada N.
Dalam perhitungan test kolmogor kolmogorov ov smirnov smirnov dilakukan langkah-langkah sebagai berikut: 1. Tetapkan Tetapkan fungsi kumulatif kumulatif teoritis, teoritis, yakni distribusi distribusi kumulatif kumulatif yang diharapkan di bawah H0. 2. Aturlah Aturlah skor-skor yang yang diobservasi diobservasi dalam suatu distribus distribusii kumulatif dengan memasangkan interval SN(x) dengan interval f0(x) yang sebanding. 3. Untuk tiap-tiap tiap-tiap jenjang jenjang pada distribus distribusii kumulatif, kumulatif, kurangilah kurangilah f0(x) dengan SN(x). 4. Dengan memakai rumus rumus yang yang ada, carilah carilah nilai nilai D (deviasi (deviasi maksimum). 5. Lihatlah Lihatlah tabel E untuk untuk menentukan menentukan harga kemungkinan kemungkinan dua dua sisi yang dikaitkan dengan munculnya harga-harga sebesar harga observasi di bawah H0. Jika P sama atau kurang dari α, maka H0 ditolak.
Tes dua sampel kolmogorov smirnov adalah suatu tes apakah dua sampel independen telah dicari dari populasi yang sama (dari populasi yang memiliki distribusi yang sama). Tes dua sisi peka terhadap segala jenis perbedaan dalam distribusi yang menjadi asal usul kedua sampel itu perbedaan-perbedaan
dalam
lokasi
(harga
tengah)
kemencengan
(skewness), skewness ), pemencaran dan lain-lain.Seperti tes satu sampel kolmogorov smirnov tes dua sampel ini memperhatikan kesesuaian antara dua sampel distribusi kumulatif tes satu sampel dan meperhatikan kesesuaian antara distribusi suatu himpunan harga sampel dengan suatu distribusi teoritis
tertentu, tes dua sampel ini memperhatikan kesesuaian antara dua himpunan harga-harga sampel.
Jika kedua sampel itu pada kenyataannya memang telah ditarik dari distribusi yang sama, maka distribusi kumulatif kedua sampel tadi dapat diharapkan cukup pendekatan satu dengan yang lainnya karena keduanya keduanya menunjukkan menunjukkan deviasi random saja dari pada distribusi populasi itu. Jika kedua distribusi populasi kumulatif kedua sampel itu jauh berbeda pada suatu titik manapun, ini menunjukkan bahwa sampelsampel berasal dari populasi yang berbeda. Dengan demikian suatu deviasi deviasi yang cukup cukup besar besar antara antara distribus distribusii kumulatif kumulatif kedua kedua sampel sampel tersebut adalah fakta untuk menolak H0.
Uji dan sampel kolmogorov smirnov merupakan uji yang serba guna, karena kepekaannya terhadap semua jenis perbedaan yang mungkin ada dalam dua distribusi. Uji kolmogorov smirnov dapat kita ringkas dalam langkahlangkah sebagai berikut: 1. AsumsiAsumsi-Asu Asumsi msi:: a. Data untuk untuk analisis analisis terdiri dari uji uji dua sampel acak bebas bebas berukuran berukuran m dan n. b. Data yang paling paling tidak diukur diukur menggunakan menggunakan skala ordinat. ordinat. 2. Hipotes Hipotesisis-Hip Hipote otesis sis Pada dasarnya sama dengan hipotesis pada uji sampel
kolmogorov
smirnov. smirnov. 3. Uji Uji Sta Statis tisti tik k Uji statistik kolmogorov kolmogorov smirnov dapat dilihat pada persamaan berikut: D = f0 - fe dimana : f0 = frekuensi kumulati relatif observasi fe = frekuensi kumulati relatif ekspektasi 4. Pengamb Pengambilan ilan Kepu Keputus tusan. an.
2.4.Uji Chi-SquareGoodness of Fit Test
Uji chi-squaregoodness chi-squaregoodness of fit test adalah suatu uji untuk menentukan apakah suatu populasi memiliki distribusi teoritik tertentu. Uji ini didasarkan pada seberapa baik kesesuaian antara frekuensi yang teramati dalam data, contoh dengan frekuensi harapan yang didasarkan pada distribusi yang dihipotesiskan chi-square goodness of fit test antara frekuensi yang teramati dengan frekuensi harapan didasarkan pada besaran: X2 = ∑
Oi -Ei ² E
dimana: X2= suatu suatu nilai nilai bagi bagi peuba peubah h acak x2 yang distribusi penarikan sampelnya sangat mendekati chi-square. chi-square. Oi= menyatakan menyatakan frekuensi frekuensi observasi observasi (teramati). (teramati). Ei= menyatakan frekuensi harapan bagi sel ke satu (ekspektasi)
Bila frekuensi yang teramati sangat dekat dengan frekuensi harapannya, nilai X2 akan kecil, hal ini menunjukkan adanya kesesuaian yang baik. Bila frekuensi yang teramati berbeda cukup besar tidak habis dari frekuensi harapannya, nilai X2 akan besar, sehingga kesesuaiannya akan buruk. Kesesuaian yang buruk akan membawa penolakan H 0, dengan demikian wilayah kritisnya akan jatuh. Nilai kritis X2 diperoleh dari tabel maka wilayah kritisnya adalah X2 > X2.
Kriteria keputusan ini tidak digunakan bila ada frekuensi harapan yang kurang dari 5. Pernyataan
ini mengakibatkan berkurangnya derajat
kebebasan. Besarnya derajat kebebasan yang berkaitan dengan distribusi chi-square yang digunakan di sini tergantung pada dua faktor, yaitu:
Banyaknya sel dalam percobaan yang bersangkutan. Banyaknya besaran yang diperoleh dari data pengamatan yang diperlukan dalam perhitungan frekuensi harapan.
Rumus yang digunakan dalam uji chi-square goodness of fit test: test : a. Uji ChiChi-Square 1 Samp Sampel el Disk Diskri ritt Tabel Tabel 5.2 5.2.1. .1. Chi-Square 1 Sampel Diskrit
k
Xi
Oi = fi
Pi
e
λ x .λ
Ei = n.Pi
X
2
2
(Oi Ei)
x!
E
b. Uji ChiChi-Square 1 Sampel Kontinyu Tabel Tabel 5.2 5.2.2. .2.Chi-Square Chi-Square 1 Sampel Kontinyu
Interval
k
LCB
Oi
UCB
Pi
Ei = n.Pi
X
2
(Oi Ei)
2
E
Dimana: k = Jumlah Jumlah kelas kelas P = Parameter dari distribu distribusi si yang diuji diuji Oi= Frekuensi observasi dari data ke-I Pi= Probabi Probabilita litass Ei= Frekuen Frekuensi si ekspekta ekspektasi si atau frekuen frekuensi si harapa harapan n X2 = Chi-square
c. Uji ChiSampelDiskr iskrit it atau Kontin Kontinyu yu Chi-Square 2 SampelD Tabel 5.2.3.Chi-Square 5.2.3.Chi-Square 2 Sampe Sampell Diskri Diskritt atau atau Konti Kontinyu nyu Kelas Ke-1 N1
N2
nr ∑ Kolom
O11
E11
(O11 – E11)2/E11 O21
E21
Kelas Ke-2
O12
E12
(O12 – E12)2/E12 O22
E22
(O21 – E21)2/E21
(O22 – E22)2/E22
...
...
Or1
Er1
Or2
...
...
...
Kelas Ke-c
O1c
(O1c – E1c)2/E1c O2c
(Or1 – Er1)2/Er1
(Or2 – Er2)2/Er2
B1
B2
... ...
E2c
(O2c – E2c)2/E2c
... Er2
E1c
... Orc
A1
A2 ...
Erc
(Orc – Erc)2/Erc Bc
∑ Baris
Ar N
Untuk dapat membandingkan sekelompok frekuensi yang diamati dengan kelompok yang diharapkan, tentunya kita harus dapat menyatakan frekuensi manakah yang diharapkan itu. Hipotesis nol menyatakan menyatakan proporsi proporsi objek yang jatuh ke dalam masing-masin masing-masing g kategori di dalam populasi yang ditetapkan. Ini berarti dari hipotesis nolnya kita dapat membuat deduksi berapakah frekuensi yang diharapkan. Teknik X 2 menguji apakah frekuensi yang diamati mendekati frekuensi yang diharapkan sehingga mempunyai kemungkinan besar untuk terjadi di bawah H0.
Pada distribusi sampling statistik chi-square dapat diketahui dengan menggunakan kurva. Dalam hal ini kita menggunakan distribusi t, untuk menggambarkan distribusi chi-square yang mempunyai derajat kebebasan yang berbeda. Jika harga derajat kebebasannya kecil maka kurva akan semakin simetris mendekati kurva normal.
Dengan itu kita mencari selisih antara yang diamati dengan yang diharapkan, mengkuadratkan selisih-selisih tersebut lalu membaginya dengan jumlah yang diharapkan lalu menjumlahkan hasil bagi tersebut.Sering terjadi penelitian yang dijalankan untuk mengetahui banyaknya subjek, objek jawaban respon yang terdapat dalam berbagai kategori misalnya sekelompok pasien diklasifikasikan menurut tipe kecenderungan utama dalam hal jawaban Rorschach mereka, dan penyelidik mungkin membuat ramalan bahwa tipe-tipe tertentu akan lebih sering terdapat dibandingkan dengan tipe-tipe lainnya.
Ada beberapa persoalan yang dapat diselesaikan dengan cara mengambil manfaat dari distribusi Chi-square, Chi-square, diantaranya seperti:
Menaksir simpangan baku. Menguji homogenitas varians beberapa populasi.
multinomial. Menguji proporsi untuk data multinomial.
Menguji independen antara dua faktor. Menguji kesesuaian kesesuaian antara data hasil pengamatan pengamatan dengan model Menguji distribusi, darimana data itu diduga kembali.
Menguji model distribusi berdasarkan hasil pengamatan. 2.5. Menguji Menguji Proporsi Proporsi Data Multinominal
Misalkan sebuah eksperimen menghasilkan peristiwa-peristiwa atau kategori A1, A2, ….., Ak yang saling terpisah masing-masing dengan peluang P1 = P(A1), …..P2 = P(A2), …..PK = P(AK). Akan diuji pasangan hipotesis H0 : Pi = P 0, I = 1,2, …, K, dengan Pi, sebuah harga yang diketahui Hi : Pi = Pi 0. Di sini tentu saja ΣPi = Σpi 0 = 1.
Pengujian yang ditempuh akan menggunakan data sebuah sampel acak berukuran n yang di dalamnya ada O 1 dari kategori satu (A1), O2 dari kategori dua (A2), ……, Ok dari kategori k (Ak).
Dengan harga Pi0 yang diberikan, kita dapat menghitung masing-masing frekuensi yang diharapkan E1 = n.P10,E2 = n.P20,
……
Ek = n.PK0, jelas
bahwa O1+ O2+….+ Ok = E1+ E1+….+ Ek = n. Harga-harga O1, O 2, …., O k merupakan nilai-nilai yang tampak sebagai hasil pengamatan, sedangkan E1, E 2, …. Ek merupakan nilai-nilai yang diharapkan terjadi atau nilai-nilai teoritis.
Agar mudah diingat, adanya kategori Ai, hasil pengamatan Oi dan hasil yang diharapkan Ei, sebaiknya disusun dalam daftar sebagai berikut: Tabel 5.2.4.TabelEidanOi Kategori
A1
A2
……
Ak
Pengamatan
O1
O2
……
Ok
Diharapkan
E1
E2
……
Ek
Untuk menguji hipotesis di atas, digunakan statistik: χ
2
k (Oi Ei) 2
i 1
Ei
atau
χ
2
k Oi 2
n i 1 Ei
Ternyata bahwa statistik di atas berdistribusi chi-square dengan dengan db db = (k-1). (k-1). Kriteria pengujian adalah tolak H0 jika X2> X2(1-α)(k-1) dengan α = taraf nyata untuk pengujian. Dalam hal lainnya, maka H0 diterima.
Sebagai hal khusus dari data multinomial adalah data binomial yang didapat apabila banyak kelas k = 2. Jika dalam hal ini kedua kategori disebut kategori I dan kategori II dengan peluang terjadinya kategori I dan II masing-masin masing-masing g (I - II), maka maka untuk untuk sebuah sampel sampel acak berukura berukuran n n diantaranya diantaranya didapat didapat x buah kategori kategori I.
Kita lihat bahwa distribusi chi-square yang digunakan hanya mempunyai derajat kebebasan satu ini mengakibatkan terlalu sering terjadi penolakan. H0 yang seharusnya diterima apabila rumus di atas digunakan. Selain daripada itu rumus di atas adalah pengkontinuitasan data diskrit yang dengan sendirinya harus diadakan penyesuaian seperlunya.Sebagai hal khusus dari data multinomial ialah data binomial yang didapat apabila banyak kategori k = 2. Jika dalam hal ini kedua kategori disebut kategori I dan kategori II dengan peluang terjadinya kategori I dan kategori II masing-masing π dan (1-π), maka untuk sebuah sampel acak berukuran n diantaranya didapat x buah kategori I, didapat dibuat daftar sebagai berikut: Tabel5.2.5.PengamatanPeluangTerjadiny Tabel5.2.5.PengamatanPeluangTerjadinyaKategori aKategori I danKategori II
Kategori
I
II
Jumlah
Pengamatan
x
n-x
N
Diharapkan
n.π
n.(1-π)
N
Statistik yang digunakan untuk menguji hipotesis H 0 : π = π0 melawan H1 : π ≠ π0adalah: X
2
2 (n n.π ) 0 n.π (1 π ) 0 0
dan tolak H0 jika X2 ≥ X2(1-α)(1) : sedangkan dalam hal lain H0 diterima.
Kita lihat bahwa distribusi chi-square yang digunakan hanya mempunyai satu derajat kebebasan. Ini mengakibatkan terlalu sering terjadinya penolakan H0 yang sebenarnya diterima apabila rumus di atas digunakan.
Khusus dalam hal ini, yakni dalam hal data binomial dimana digunakan distribusi chi-square dengan dk = 1. Rumus di atas perlu diperbaiki dengan menggunakan menggunakan koreksi koreksi kontinuit kontinuitas, as, yaitu harga mutlak 1x – n.π0. I harus dikurangi dengan setengah. Jadi rumus yang dipakai adalah: X
2
(1x n.π .1 - 1/2) 0 n.π (1 π ) 0 0
2
2.6.Menguji Kesamaan Poisson
Misalkan ada k(k>2) buah distribusi poisson dengan parameter λ1, λ2, …λk. Akan diuji pasangan hipotesis H 0 : λ1 = λ2 = …. = λk. H1 : paling sedikit 1 randa sama dengan tidak berlaku ).
Dari setiap populasi diambil sebuah sampel acak, berukuran n 1 dari populasi ke-1, n2 dari populasi ke-2 dan seterusnya berukuran n k dari populasi ke-k. Untuk tiap sampel dihitung banyak peristiwa yang mengikuti distribusi poisson. poisson. Jika banyak peristiwa ini dinyatakan dengan x1 + x2 +…..+ xn, maka rata-rata x adalah: x x 2 ... x n x 1 k
Statistik yang digunakan untuk menguji hipotesis H o adalah:
(x x ) 2 X i x
dan tolak H0 jika X2 ≥ X2(1-α)(k-1). Dalam hal lain H0 diterima.
2.7.Banyak Independen Antar Dua Dua Faktor
Banyak data hasil pengamatan yang dapat digolongkan ke dalam beberapa faktor, karakteristik atau atribut dengan tiap faktor atau atribut terdiri dari beberapa klasifikasi, kategori, golongan atau mungkin tingkatan. Berdasarkan hasil pengamatan terhadap fenomena demikian akan diselidiki diselidiki mengenai hubungan, hubungan, asosiasi asosiasi dan kaitan antar faktor. Jika ternyata tidak terdapat kaitan antara faktor-faktor, biasa dikatakan bahwa faktor-faktor itu bersifat independen atau bebas, tepatnya bebas statistik. Dengan kata lain akan dipelajari apakah terdapat atau tidak suatu kaitan diantara faktor-faktor itu.
Dalam bagian ini hanya akan dipelajari fenomena yang terdiri dari paling banyak dua faktor, selain daripada itu di sini akan dibahas juga ada tidaknya tidaknya pengaruh pengaruh mengenai beberapa beberapa taraf atau tingkatan tingkatan suatu faktor terhadap kejadian fenomena.
2.7.1. Asosiasi antara antara Dua Faktor dalam dalam Daftar Kontingensi Kontingensi B X K
Secara umum, untuk menguji independen antara dua faktor dapat dijelaskan sebagai berikut:
Misalkan sebuah sampel acak berukuran n telah diambil, dimana tiap pengamatan tunggal diduga terjadi karena adanya dua macam faktor, ialah faktor I dan faktor II. Faktor I terbagi atas B taraf atau tingkatan dan faktor faktor II terbagi terbagi atas atas K taraf. taraf. Banyak Banyak pengamatan pengamatan yang yang terjadi terjadi karena taraf ke-i faktor ke-I (I = 1,2,….., B) dan taraf ke-j faktor ke-II (j = 1,2,…..,K) akan menyatakan dengan Oij. Hasilnya dapat dicatat dalam sebuah daftar kontingensi B x K.
Tabel 5.2.6.Kontingensi B X K Untuk Hasil Pengamatan Terdiri Atas dua faktor
FAKTOR II (K TARAF)
B ( I R O T K A F
) F A R A T
Jumlah
1
2
K
1
O11
O12
O1k
n10
2
O21
O22
O2k
N20
…
…
…
…
…
B
nB1
nB2
OBK
nB0
nO1
nO2
nOK
n
Jumlah
…
2.8. Uji Kebebasan
Uji kebebasan yang dibicarakan pada modul ini adalah uji kebebasan chisquare, square , yaitu yang dapat pula dipakai untuk menguji hipotesis bahwa dua sampel saling bebas. Misalkan ingin diteliti apakah pendapat penduduk pemilih di Negara bagian Illionis mengenai perubahan pajak baru tidak ada hubungannya hubungannya dengan tingkat penghasilann penghasilannya. ya.
Perlu diingat bahwa yang mendasari keputusan mempunyai distribusi yang hanya merupakan lampiran distribusi chi-square. chi-square. Nilai X2 hitung tergantung pada frekuensi sel. Distribusi chi-square yang yang kontiny kontinyu u terlih terlihat at menghampiri menghampiri distribusi distribusi terok diskrit diskrit X2 amat dekat, asal banyakderajat kebebasan lebih besar dari 1. Dalam tabel kemungkinan 2 x 2, yang hanya mengandung derajat kebebasan satu, digunakan suatu koreksi yang disebut koreksi kontinyuitas Yates. Rumus yang telah dikoreksi menjadi: X² (dikoreksi) =
∑ (I0 -ei .I-0,5)²
ei
Bila frekuensi frekuensi sel harapan besar, hasil hasil yang dikoreksi dikoreksi dan tidak dikoreksi hamper sama. Bila frekuensi harapan antara 5 dan 10, koreksi Yates sebaiknya dipakai. Untuk frekuensi harapan kurang dari 5. sebaiknya uji tepat Fisher–Irwin yang dipakai.
Pembahasan mengenai uji ini dapat diperoleh dalam Basic Concepts of Probability and Statistics oleh Hodges dan Lehnmann. Uji Fisher–Irwin sesungguhnya dapat dihindari dengan memilih ukuran terok yang lebih besar.
2.9. Uji Kehomogenan dan Uji Beberapa Beberapa Proporsi
Sebagai pengganti pengujian kebebasan, di uji hipotesis bahwa proporsi populasi di tiap baris adalah sama. Yakni diuji hipotesis bahwa untuk menguji kehomogenan dapat pula dipakai untuk menguji hipotesis bahwa k parameter binomial mempunyai nilai yang sama. Dengan demikian ini merupakan perluasan uji dari pengujian yang membahas untuk menentukan selisih dua proporsi menjadi selisih k proporsi. Jadi ingin diuji k hipotesis nol. H0: P1 = P2 = ……. = Pk Lawan dari hipotesis tandingan H 1, bahwa proporsi populasi tidak semuanya sama. Yang sama dalam pengujian banyaknya peluang sukses atau peluang yang gagal tergantung pada banyaknya terok yang diambil.
2.10. 2.10. Uji Distribusi Distribusi Normal Normal Atau Uji Kenormalan Kenormalan
Dari uraian-uraia uraian-uraian n terdahulu, terdahulu, misalnya misalnya dalam uraian uraian tentang tentang berbagai distribusi sampling, teori menaksir, pengujian hipotesis, telah kita lihat betapa pentingnya untuk mengetahuimodel populasi yang dipelejari, terutama model normal. Asumsi bahwa populasi berdistribusi normal, asumsi asumsi normalitas, normalitas, telah melancarkan melancarkan teori teori dan metode sebegitu sebegitu rupa sehingga banyak persoalan yang dapat diselesaikan dengan lebih mudah dan cepat. Karenanya, cukup mudah dimengerti kiranya bahwa asumsi normalitas perlu dicek keberlakuannya agar langakah selanjutnya dapat dipertanggung jawabkan. Jika ternyata asumsi yang diambil tidak benar atau terlalu menyimpang, tidak hanya mengenai normalitas tetapi juga pengamatan bersifat independen (sampel acak), tidak terdapat kesalahan
varians dan
ketika mencatat hasil pengamatan, homogenitas tentang sebagainya,
bukan
saja
langkah-langkah
penelitian
tidak
dapat
dipertanggungjawabkan tetapi juga ternyata salah. Mengenai kesalahan yang mungkin terjadi terhadap hasil pengamatan, tidak ada uji statistik yang tersedia, kecuali penelitian atau pengamatan harus dilakukan secara teliti dan jujur. Soal keacakan mengenai sampel dapat diuji secara khusus dan ini akan dibicarakan kemudian.
Pengertian ini timbul daari kenyataan bahwa tidak selalu asumsi-asumsi, semua atau sebagian, dapat dipenuhi dengan tepat. Dalam beberapa hal, penyimpangan wajar dari syarat-syarat yang telah ditentukan sering tidak meng mengak akib ibat atka kan n
baha bahaya ya
yan yang g
heba hebat. t.
Mis Misal alny nya, a,
sed sedik ikit it
terj terjad adin inya ya
penyimpangan dari normalitas dan atau dari sifat homogenitas varians, varians, biasanya biasanya hanya hanya memberikan memberikan akibat buruk yang kecil terhadap terhadap hasil hasil pengujian dan kesimpulannya. Distribusi t atau distribusi student telah diketahui tidak sensitif terhadap penyimpangan wajar dari normalitas sehingga penggunaanya tidak dibatasi keras oleh asumsi normalitas. Sifat demikian, ialah tidak sensitif terhadap penyimpangan wajar dari syaratsyarat yang digariskan, dinamakan ajeg. Jika hal ini terjadi sehubungan dengan pengujian hipotesis, maka diperoleh uji ajeg.
Sekarang marilah kita tinjau mengenai uji normalitas. Persamaan distribusi normal dengan rata–rata dan simpangan baku dapat dilihat dalam modul 2. Jika sebuah sampel acak berukuran n telah diambil dengan rata-rata = x dan simpangan baku = s, maka kurva normal yang cocok atau sesuai sesuai dengan data data tersebut tersebut ( untuk keperluan ini ini data harus disusun dalam daftar distribusi frekuensi yang terdiri atas k buah kelas interval) ialah:
n s 2
x x 1 2 s e
2
Untuk keperluan pengujian, kita harus menghitung frekuensi teoritik E i dan mengetahui frekuensi nyata atau hasil pengamatan Oi. Frekuensi nyata Oi jelas didapat dari sampel, masing-masing menyatakan frekuensi dalam tiap kelas interval. Harga Ei, frekuensi teoritik, didapat dari hasil kali antara n dengan peluang atau luas dibawah kurva normal untuk interval yang bersangkutan. Ei = n . p Selanjutnya statistik X 2 dihitung dengan rumus: Χ 2
k
O i Ei 2
i 1
Ei
Dan untuk menentukan kriteria pengujian digunakan distribusi chisquaredengan square dengan db=(k-3) dan taraf .