Kata Pengantar Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas terbitnya buku ajar "Statistika Matematis II" ini. Buku ini merupakan lanjutan dari buku "Statistika Matematis I" dan menyajikan pengetahuan dasar yang dibutuhkan baik untuk mempelajari statistika secara matema-
STATISTIKA MATEMATIS II Edisi E-Book
tis dan penerapannya dalam pemecahan masalah sehari-hari. Buku ajar ini ditujukan bagi mahasiswa jurusan (pendidikan) matematika khususnya, tapi dapat juga dijadikan referensi bagi mahasiswa lainnya atau masyarakat pada umumnya, terutama yang tertarik untuk mengetahui atau mendalami ilmu statistika serta pembahasannya secara matematis. Materi buku ajar ini bersumber dari beberapa buku terkenal seperti (1) Dudewicz E.J.; Mishra,S.N.(1988) Modern Mathematical Statistics,(2) Roussas G.G.(1973) A First Course in Mathematical Statistics, dan
Oleh Dr.Phil. I Gusti Putu Sudiarta,M.Si Jurusan Pendidikan Matematika
(3) Walpole, Ronald.E.; Myers, Raymond H.; Myers, Sharon L.; Ye, Keying (2002) Probability and Statistics for Engineers and Scientists, serta bukubuku lainnya seperti yang tercantun dalam daftar pustaka. Buku ini terdiri dari 5 Bab, yang secara garis besar menyajikan sta-
Fakultas Matematika dan Ilmu Pengetahuan Alam
tistik induktif dengan pembahasan matematis, yang meliputi (1) distribu-
Universitas Pendidikan Ganesha
si pendekatan suatu distribusi variabel random, (2) konvergensi variabel random, (3) estimasi titik, (4) estimasi interval, serta (5) hipotesis statistik. Untuk membantu pemahaman yang lebih baik, ada beberapa hal
Februari, 2009
yang harus diperhatikan dalam menggunakan buku ajar ini sbb: (1) pada setiap awal bab, diberikan standar kompetensi dan indikator hasil belajar, yang diharapkan dapat membantu pembaca memusatkan perhatian atau lebih berkonsentrasi pada hal-hal yang dianggap penting; (2) pada setiap i
Statistika Matematis II/ Edisi E-book
akhir bab juga disajikan rangkuman, soal-soal dengan pembahasannya, dan soal-soal latihan dalam jumlah yang memadai, sehingga pembaca memiliki kesempatan untuk melakukan latihan secara mandiri dan mengevalusi sendiri hasil belajarnya. Buku ajar ini disusun sejak tahun 2005, dan sejak saat itu pula telah digunakan dalam perkuliahan di Universitas Pendidikan Ganesha.
Daftar Isi
Buku ini mengalami beberapa kali revisi baik berdasarkan saran-saran mahasiswa peserta kuliah, maupun dosen sejawat yang telah dengan seksama menelaah buku ini, antara lain Prof. Dr. I Gusti Putu Suharta, M.Si dan Drs. I Made Sugiarta,M.Si. Untuk semua dukungan tersebut penulis sampaikan terimakasih yang setinggi-tingginya. Namun demikian, penulis menyadari bahwa pada terbitan ini, tentu masih ada hal-hal yang perlu untuk disempurnakan. Untuk itu penulis sangat terbuka terhadap saran, kritik dan koreksi, baik dari teman sejawat, mahasiswa, pencinta matematika, maupun masyarakat pembaca umumnya. Akhirnya penulis berharap, semoga buku ajar ini dapat mem-
Kata Pengantar
i
1 Distribusi Pendekatan
1
1.1
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . .
1
1.3
Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.3.1
Konsep Dasar Distribusi Pendekatan . . . . . . . . .
2
1.3.2
Menentukan Distribusi Pendekatan . . . . . . . . . .
2
1.3.2.1
Melalui Fungsi Distribusi . . . . . . . . . . .
2
1.3.2.2
Melalui Fungsi Pembangkit Momen . . . .
8
1.3.2.3
Melalui Teorema Limit Pusat . . . . . . . . .
12
berikan manfaat yang sebesar-besarnya.
Singaraja, Februari 2009 I Gusti Putu Sudiarta
1.4
Soal-Soal dan Pembahasan
. . . . . . . . . . . . . . . . . . .
19
1.5
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . .
22
2 Konvergensi Variabel Random
ii
ISBN 978-602-8310-02-4
25
2.1
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . .
25
2.2
Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . .
25
2.3
Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
2.3.1
Konsep Dasar Variabel Random . . . . . . . . . . . .
26
2.3.2
Barisan Variabel Random . . . . . . . . . . . . . . . .
27
iii
Statistika Matematis II/ Edisi E-book
2.3.3
2.3.4
Statistika Matematis II/ Edisi E-book
Jenis-Jenis Konvergensi Variabel Random . . . . . . .
28
2.3.3.1
Konvergen dalam Distribusi . . . . . . . . .
28
4.1
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . 113
2.3.3.2
Konvergen dalam Probabilitas . . . . . . . .
33
4.2
Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . 113
Sifat-Sifat Konvergensi Variabel Random . . . . . . .
36
4.3
Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
2.4
Soal-Soal dan Pembahasan
. . . . . . . . . . . . . . . . . . .
41
2.5
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . .
46
3 Estimasi Titik
4 Estimasi Interval
113
4.3.1
Konsep Dasar Estimasi Interval . . . . . . . . . . . . . 114
4.3.2
Metode Menentukan Estimasi Interval . . . . . . . . . 117
51
4.3.2.1
Inversi Uji Statistik . . . . . . . . . . . . . . 117
4.3.2.2
Besaran Pivot
. . . . . . . . . . . . . . . . . 118
3.1
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . .
51
3.2
Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . .
51
4.3.3
Metode Evaluasi Estimasi Interval . . . . . . . . . . . 121
3.3
Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
4.3.4
Estimasi Interval Kepercayaan Khusus . . . . . . . . 124
3.3.1
Prinsip Reduksi Data . . . . . . . . . . . . . . . . . . .
52
4.3.4.1
Interval Kepercayaan untuk Mean . . . . . . 124
3.3.1.1
Azas Kecukupan
. . . . . . . . . . . . . . .
52
4.3.4.2
Interval Kepercayaan untuk Perbedaan Mean126
3.3.1.2
Teorema Halmos & Savage . . . . . . . . . .
55
4.3.4.3
Interval Kepercayaan untuk Variansi . . . . 127
Estimasi Titik . . . . . . . . . . . . . . . . . . . . . . .
59
4.3.4.4
3.3.2.1
Estimator Tak Bias . . . . . . . . . . . . . . .
60
Interval Kepercayaan untuk Rasio Dua Variansi . . . . . . . . . . . . . . . . . . . . . . 128
3.3.2.2
Estimator Konsisten . . . . . . . . . . . . . .
62
4.4
Soal-Soal dan Pembahasan
3.3.2.3
Estimator Efisien . . . . . . . . . . . . . . . .
63
4.5
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . . 131
3.3.2.4
Estimator Bayes . . . . . . . . . . . . . . . .
65
Metode Evaluasi Estimator Titik . . . . . . . . . . . .
67
3.3.3.1
Galat Kwadrat Rata-Rata . . . . . . . . . . .
67
5.1
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . 135
3.3.3.2
Estimator Terbaik . . . . . . . . . . . . . . .
70
5.2
Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . 135
3.3.3.3
Teorema Batas Bawah Cramer-Rao . . . . .
71
5.3
Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
Metode Estimasi Titik . . . . . . . . . . . . . . . . . .
79
5.3.1
Konsep Dasar Uji Hipotesis . . . . . . . . . . . . . . . 136
3.3.4.1
Metode Momen . . . . . . . . . . . . . . . .
79
5.3.2
Uji Rasio Likelihood . . . . . . . . . . . . . . . . . . . 137
3.3.4.2
Metode Maksimum Likelihood . . . . . . .
82
5.3.3
Metode Uji Evaluasi Hipotesis . . . . . . . . . . . . . 140
3.4
Soal-Soal dan Pembahasan . . . . . . . . . . . . . . . . . . . .
87
3.5
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.3.2
3.3.3
3.3.4
iv
ISBN 978-602-8310-02-4
. . . . . . . . . . . . . . . . . . . 129
5 Hipotesis Statistik
5.3.3.1
135
Probabilitas Kesalahan dan Fungsi Kekuatan Uji . . . . . . . . . . . . . . . . . . . . . 141 v
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
5.3.3.2
Uji Paling Kuat (Most Powerfull Test) . . . . . 144
5.3.3.3
Teorema Neyman-Pearson . . . . . . . . . . 147
5.3.3.4
Teorema Karlin-Rubin
5.3.3.5
Daerah Kritik Terbaik . . . . . . . . . . . . . 150
. . . . . . . . . . . . 149
5.4
Soal-Soal dan Pembahasan . . . . . . . . . . . . . . . . . . . . 152
5.5
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . . 188
Daftar Pustaka
195
Bab 1 Distribusi Pendekatan 1.1 Standar Kompetensi Memahami konsep dasar distribusi pendekatatan suatu barisan variabel random, dan mampu menerapkannya, baik dalam pemecaham masalah matematika, ilmu lain maupun dalam kehidupan sehari-hari
1.2 Indikator Hasil Belajar 1. Menjelaskan konsep dasar distribusi pendekatatan suatu variabel atau fungsi variabel random 2. Menentukan distribusi pendekatan suatu barisan atau fungsi variabel random dengan menggunakan fungsi distribusi. 3. Menentukan distribusi pendekatan suatu barisan atau fungsi variabel random dengan menggunakan fungsi pembangkit momen, 4. Menentukan distribusi pendekatan suatu barisan atau fungsi variabel random dengan menggunakan dalil limit pusat, 5. Memecahkan masalah yang berkaitan dengan distribusi pendekatan
vi
ISBN 978-602-8310-02-4
1
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
1.3 Uraian Materi
P embahasan
1.3.1 Konsep Dasar Distribusi Pendekatan
Distribusi dari X harus kita selesaikan lebih dahulu. Karena variabel random X berasal dari distribusi seragam pada (0, 1), untuk menentukan distribusi dari X akan digunakan teknik fungsi pembangkit momen. Se-
Pada kuliah Statistika Matematis I, telah dibahas distribusi variabel random maupun distribusi fungsi variabel random secara eksak. Sering dijumpai sebuah variabel random yang distribusinya bergantung pada bilangan nulat positif n atau mungkin juga sebuah statistik, yang meru-
belumnya kita akan menentukan dahulu fungsi pembangkit momen dari X. Fungsi pembangkit momen dari X adalah: Mx (t) = E(etx ) R 1 tx = 0 e .1 dx 1 tx 1 e =
pakan fungsi dari variabel random yang distribusinya juga bergantung pada bilangan positif n. Kadang-kadang ada masalah dalam mengitung distribusi peluang variabel random, karena sulit menentukan fungsi kepadatan peluangnya. Oleh karena itu dalam bab ini akan dibahas cara menentukan distribusi variabel random melalui pendekatan, apabila n
t et −1 t
=
x=0
; t 6= 0
Untuk t = 0 digunakan dalil L’Hospital
cukup besar. t
Limt→0 Mx (t) = Limt→0 (e −1) t t = Limt→0 e −1 t
1.3.2 Menentukan Distribusi Pendekatan Ada tiga cara dalam menentukan distribusi pendekatan tersebut yaitu melalui fungsi distribusi, fungsi pembangkit momen, dan teorema limit pusat. Ketiga cara tersebut akan dibahas secara satu persatu.
Jadi Mx (t) =
(
et −1 ; t
1;
t 6= 0 t=0
Dari sini dapat dilihat bahwa fungsi pembangkit momen dari X bergantung pada n, distribusi dari X juga bergantung pada n. Jadi kita tidak
1.3.2.1 Melalui Fungsi Distribusi
dapat menentukan fungsi kepadatan peluang dari X , sehingga tidak dapat pula menghitung peluang untuk harga tertentu.
Masalah :
Oleh karena itu, berikut ini akan dijelaskan suatu cara pendekatan untuk
Jika X adalah rerata dari sampel acak X1 , X2 , ..., Xn yang berasal dari dis-
menentukan distribusi dari sebuah variabel random bergantung pada bilangan bulat positif n.
tribusi dengan fungsi kepadatan peluang berbentuk: ( 1; 0 < x < 1 f (x) = 0; lainnya Hitung P (X < 0, 5). Kita menghadapai masalah dalam menghitung nilai ini, karena ternyata distribusi dari X, dan fungsi pembangkit momen dari X bergantung pada n, sehingga nilai dari P (X < 0, 5) tidak dapat dihitung dengan cara langsung. Bab 1. Distribusi Pendekatan
2
ISBN 978-602-8310-02-4
Sebagai kesepakatan dalam hal ini, fungsi distribusi akan dituis sebagai Fn dan fungsi kepadatan peluangnya ditulis sebagai fn . Apabila kita membahas barisan fungsi distribusi, maka kita harus menuliskan indeks n pada variabel randomnya. Misalkan penulisan: Fn X
Bab 1. Distribusi Pendekatan
=
Z
x −∞
p 3
1 2/2 √ e−ny dy 1/n. 2π ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
merupakan fungsi distribusi dari rerata X yang dihitung dari sampel acak berukuran n dan berasal dari distribusi N(0, 1). Def inisi Misalkan Fn (y) adalah fungsi distribusi dari variabel random Yn yang bergantung pada bilangan bulat positif n. Jika F (y)adalah fungsi distribusi dan Limt→0 Fn (y) = F (y) untuk setiap nilai y yang mengakibatkan F (y) kontinu, maka variabel random Yn dikatakan mempunyai distribusi pendekatan dengan fungsi distribusi F (y).
Statistika Matematis II/ Edisi E-book
2. Untuk 0 ≤ y < θ R y n−1 Fn (y) = 0 ntθn dt =
1 n y t 0 θn
=
Jadi :
Misalkan Yn menunjukkan statistik urutan ke-n dari sampel acak
limn→∞ Fn (y) =
F (y) =
Jawab: Fungsi kepadatan peluang dari Yn adalah:
F (y) = 0 f (x) dx = F (y) = F ′ (y) = 1θ Jadi gn (y) = n gn (y) = =
y n−1
θ n n−1 y θn
0
Ry
1 dx 0 θ
=
y θ
Bab 1. Distribusi Pendekatan
4
(
0, −∞ < y < θ 1, θ ≤ y < ∞
babkan F (y) kontinu, menurut definisi, variabel random Yn mempunyai distribusi pendekatan dengan fungsi distribusi F (y). Berikut ini akan diberikan sebuah contoh tenang sebuah variabel random yang mempunyai distribusi pendekatan degenerate. Contoh Misalkan X mempunyai fungsi distribusi berbentuk:
1 θ
; 0
Fn (x) =
Z
x
−∞
misalkan: √ √ t = n y→dt = n dy
Fungsi distribusi dari Yn adalah: 1. Untuk y < 0 Ry R <0 Fn (y) = 0 gn (t) dt = 0 0 dt = 0
0, −∞ < y < θ 1, θ ≤ y < ∞
Karena Limn→0 Fn (y) = F (y) pada masing-masing nilai y yang menye-
gn (y) = n(F (y))n−1f (y) ; a < y < b = 1 ; Lainnya Ry
(
Sekarang ambil fungsi distribusi dari Y adalah:
Apakah Yn mempunyai distribusi pendekatan ?
dengan :
0 ; y<0 y n ; 0≤y<θ θ 1 ; θ≤y<∞
= =
X1 , X2 , ..., Xn yang berdistribusi dengan fungsi kepadatan peluang berbentuk: ; 0
θ
1
Fn (y) =
1 θ
y n
3. Untuk θ ≤ y < ∞ Rθ Ry Fn (y) = 0 gn (t) dt + 0 gn (t) dt R <0 R θ ntn−1 dt + 0 0 dt = θn 0
Contoh :
f (x) = =
=
p
1 2/2 √ e−ny dy 1/n. 2π
batas-batasnya: ISBN 978-602-8310-02-4
Bab 1. Distribusi Pendekatan
5
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Untuk y = −∞ maka t = −∞ √ Untuk y = x , maka t = n x Fn (x) = =
R √n x
Kita akan menentukan fungsi kepadatan peluang dari Zn dengan menggunakaan teknik transformasi variabel random. Hubungan antara nilai yn dengan nilai Yn dengan nilai zn dari Zn diberikan sbb:
1 dt −t2 /2 √ √ e n 1/n. 2π R √n x 1 −t2 /2 √ e dt −∞ 2π
−∞
Statistika Matematis II/ Edisi E-book
√
Limn→∞ Fn (x) = 0 ; x < 0
Zn = n(θ − yn ) inversnya :
; x=0 = = 1 ; x>0
Jacobiannya : dyn −1 = dzn n dyn 1 = |J| = dzn n J=
Sekarang ambil fungsi distribusi dari X adalah : F (x) = 0 ; x < 0 = 1 ; x≥0 Ternyata Limn→∞ Fn (x) = F (x) untuk setiap nilai kontinu dari F (x). Dalam hal ini, Limn→∞ Fn (0) 6= F (0), tetapi F (x)tidak kontinu di x =
0. Dengan demikian variabel random X n mempunyai distribusi pendekatan dengan fungsi distribusi F (x). Distribusi pendekatannya adalah degenerate.
Fungsi kepadatan peluang dari Zn adalah: hn (z) =
1 θn
; 0 < z < nθ
=
0
;
Misalkan Yn menunjukkan statistik urutan ke-n dari sampel acak X1 , X2 , ..., Xn yang berdistribusi seragam pada (0, θ), θ > 0. Jika Zn = n(θ − Yn ),maka apakah Zn mempunyai distribusi pendekatan? Jawab: Fungsi kepadatan peluang dari X adalah: 1 θ
; 0
1. Untuk z < 0, Kn (z) =
= Bab 1. Distribusi Pendekatan
ny n−1 θn
0
0
hn (t) dt = Rz
1 0 θn
3. Misalkan : y = θ − nt ; dy = − n1 dt Batas-batasnya: Untuk t = 0, maka y = θ Untuk t = z, maka y = θ −
Lainnya ISBN 978-602-8310-02-4
0
θ−
Kn (z) = =
R θ− z
Kn (z) =
1
0
4. Untuk z ≥ nθ Bab 1. Distribusi Pendekatan
R <0
0 dt = 0
t n−1 n
dt
z n
; 0
6
Rz
2. Untuk 0 ≤ z < nθ, Kn (z) =
Fungsi kepadatan peluang dari Yn adalah: gn (y) =
lainnya
Fungsi distribusi dari Zn adalah
Contoh
f (x) = =
Zn n
yn = θ −
1 2
7
n
1 n−1 y (−n) θn 1 n θ y θ− z n θ n z n − 1 − nθ
dy
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Kn (z) = = Jadi :
R nθ 0
Kn (z) =
Misalkan variabel random Yn mempunyai fungsi distribusi Fn (y) dan fungsi pembangkit momennya M(t; n) ada untuk −h < t < h, h > 0 dan setiap n.
R nθ Rz hn (t) dt + nθ hn (t) dt 0 Rz n−1 1 θ − nt dt + nθ 0 dt = 1 θn
0
= 1− 1− Kn (z) = 1
z nθ
Limn→∞ Kn (z) =
0
;
Jika ada fungsi disribusi F (y) dengan funsgi pembangkit momennya M(t) untuk |t| ≤ h1 < h sedemikian hingga Limn→∞ M(t; n) = M(t), maka Yn dikatakan mempunyai distribusi pendekatan dengan fungsi distribusi F (y).
z≤0
; 0 ≤ z < nθ ; z ≥ nθ ;
Contoh Misalkan Yn adalah variabel random berdistribusi binomial dengan pa-
z≤0
= 1 − e−z/θ ; 0 < z < ∞
rameter n dan p. Jika rerata dari Yn adalah sama untuk setiap n, yaitu µ = np, sehingga p = nµ dengan µadalah konstanta, maka apakah ada
Sekarang ambil fungsi distribusi dari Z:
distribusi pendekatan dari Yn ? Jawab :
K(z) = 0 ; z<0 = 1 − e−z/θ ; z ≥ 0 merupakan
fungsi
ditribusi
yang
Statistika Matematis II/ Edisi E-book
kontinu
Fungsi kepadatan peluang dari Yn adalah dimana-mana,
serta
Limn→∞ Kn (z) = K(z)untuk semua nilai. Jadi Zn mempunyai pendekatan dengan fungsi distribusi K(z). Dalam hal ini, distribusi pendekatannya
F (yn ) =
n yn
pyn (1 − p)n−yn ; yn = 0, 1, 2, ..., n
=
tidak degenerate. Penentuan distribusi pendekatan dengan menggunakan fungsi distribusi bisa dinyatakan sebagai konvergen dalam distribusi yang akan dibahas lebih lanjut pada Bab II.
0
M(t; n) =
Selain menggunakan fungsi distribusi, penentuan disribusi pendekatan
=
Berikut ini diberikan sebuah teorema yang dikemukakan oleh Curtiss sebagai modifikasi dari teorema Levy dan Cramer yang menjelaskan bagaimana fungsi pembangkit momen dapat digunakan dalam menentukan distribusi secara pendekatan. T eorema
=
Pn
yn =0
etyn
Pn
yn =0
= =
ISBN 978-602-8310-02-4
tyn E(e! ) n pyn (1 − p)n−yn y n !
n y (pet ) n (1 − p)n−yn yn n ((1 − p) + pet ) n µ µ t h1 − n +t n en i µ(e −1) 1+ n
h Limn→∞ M(t; n) = Limn→∞ 1 + Bab 1. Distribusi Pendekatan
µ(et −1) n n
eµ (et − 1); t ∈ ℜ
Limn→∞ M(t; n) =
8
lainnya
Fungsi pembangkit momen dari yn adalah:
=
dapat dilakukan melalui fungsi pembangkit momen.
;
Kemudiankita akan menentukan fungsi pembangkit momen dari Yn .
1.3.2.2 Melalui Fungsi Pembangkit Momen
Bab 1. Distribusi Pendekatan
!
9
i
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari dist tribusi poison dengan rerata µdan M(t) = eµ(e −1) . Dengan demikian Yn dikatakan mempunyai distribusi pendekatan dengan distribusi
Statistika Matematis II/ Edisi E-book
Fungsi pembangkit momen dari Yn adalah: tYn M ) n Yn (t)h =h E(e iio (Zn −n) E exp t √2n h √ √ i e−tn/ 2 .E etZn / 2
M(t; n) =
penekatannya adalah Poisson dengan rerata µ.
=
Contoh :
etZn / 2 .MZn ( √t2n ) h i−n/2 √2 = e−(t n )(n/2) 1 − 2 √t2n q √ h √2 i −n/2 = et n − t n2 et 2/n)
=
√
=
Misalkan variabel random Zn berdistribusi chi-kuadrat dengan derajat ke−n) , maka tentukan distribusi bebasan = n. Jika variabel random Yn = (Z√n2n pendekatan dari Yn dengan menggunakan fungsi pembangkit momen.
√ Apabila et 2/n) diuraikan dengan Deret Taylor, maka akan diperoleh:
Jawab :
√
t
e Fungsi kepadatan peluang dari Zn adalah
=
0
;
Zn > 0
; lainnya
Fungsi pembangkit momen dari Zn adalah:
MZn (t) = E(etzn ) R ∞ tz (n/2)−1 −Zn /2 1 e dzn = 0 e n 2n/2 .Γ n zn ( 2) R∞ (n/2)−1 −Zn /2 1 = z e dzn 0 2n/2 .Γ( n ) n 2
Misalkan: u = zn ((1/2) − t) ; du = ((1/2) − t)dzn
MZn (t) =
1 2n/2 .Γ( n 2)
= = = Bab 1. Distribusi Pendekatan
R∞h 0
u (1/2)−t
=1+t
" r #2 " r #3 2 1 2 2 1 t t + + + ... n 2 n 6 n
i(n/2)−1
R
q h q i2 h q i3 1 + t n2 + 12 t n2 + 16 t n2 + ...− −n/2 q q h q i2 h q i3 t n2 1 + t n2 + 12 t n2 + 16 t n2 + ... q q h i−n/2 = 1 − t2 ( n2 ) + 21 t2 ( n2 ) + 16 t3 ( n2 ) n2 − 21 t3 ( n2 ) n2 + ... q i−n/2 h 2 = 1 − tn − 13 t3 ( n2 ) n2 + ...
M(t; n) =
h Limn→∞ M(t; n) = Limn→∞ 1 − M(t; n)
(1 − 2t)−n/2 ; t < 1/2
ISBN 978-602-8310-02-4
t2 n
− 31 t3 ( n2 )
Limn→∞ M(t; n) =
q
2 n
i−n/2 + ...
q i−n/2 − 31 t3 ( n2 ) n2 + ... i−n/2 h 2 Limn→∞ 1 − tn
h = Limn→∞ 1 −
= du e−u ((1/2)−t)
∞ (n/2)−1 −u 1 u e du ((1/2)−t)n/2 0 2n/2 .Γ( n 2) 1 n Γ 2 2n/2 .Γ( n ((1/2)−t)n/2 2)
10
r
Sehingga:
(n/2)−1 −Zn /2 1 zn e 2n/2 .Γ( n 2)
f (zn ) =
2/n)
t2 n
t2
e2
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari dist2 −n) tribusi normal standar, yaitu M(t) = e 2 . Jadi variabel random Yn = (Z√n2n mempunyai distribusi pendekatan berbentuk distribusi normal standar. Bab 1. Distribusi Pendekatan
11
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Apabila sebuah variabel random mempunyai disribusi pendekatan maka kita dapat menggunakan distribusi pendekatan itu sebagai distribusi yang sebenarnya. Misalnya dari hasil contoh di atas, kita dapat menggunakan
1. Teorema limit pusat yang pertama kali dikemukakan oleh Laplace pada tahun 1812 dan pembuktiannya yang lebih teliti dijelakan oleh Liapounoff pada tahun 1901.
distribusi Poisson sebagai pendekatan dari distribusi Binomial untuk n besar dan p kecil. Kemudian kita bisa menghitung peluang dari variabel ran-
T eorema Jika Xi , I = 1, 2, 3, ..., n adalah n buah variabel random yang saling
dom yang berdistribusi binomial dengan menggunakan distribusi poisson.
bebas sedemikian hingga E(Xi ) = µi dan Var (Xi ) = σi2 maka variabel random Sn = X1 + X2 + ... + Xn secara pendekatan berdistribusi P P N(µ; σ 2 ) dengan µ = ni=1 µi dan Var (Xi ) = ni=1 σi2
Contoh Misalnya variabel random Y berdistribusi binomial dengan n = 50 dan p = 0, 04. Hitung P (Y ≤ 1) dengan dua cara, yaitu cara eksak dan cara pendekatan.
2. Teorema limit pusat berikut ini dikemukakan oleh De-Moiure’s dan Laplace pada tahun 1833 T eorema (
Jawab :
Jika Xi =
1. Cara eksak Dalam hal ini, kita menyelesaikannya dengan menggunakan disribusi binomial. P (Y ≤ 1) = =
50 0
= P (Y ≤ 1) =
!
P (Y = 0) + P (Y =!1) 50 (0, 04)1(0, 96)49 (0, 04)0(0, 96)50 + 0 0, 1299 + 0, 2706 0, 4005
1 ; dengan peluang p 0 ; dengan peluang q = 1 − p
maka distribusi dari variabel random Sn = X1 + X2 + ... + Xn dengan Xi saling bebas dan berdistribusi identik, secara pendekatan akan berdistribusi N(np; npq) untuk n → ∞. Bukti : Fungsi pembangkin momen dari Xi adalah: Mxi (t) =
=
pet + q
Fungsi pembangkit momen dari Sn adalah:
P (Y ≤ 1) = =
P (Y = 0) + P (Y = 1) e−2 20 0!
+
e−2 21 1!
Msn (t) = = =
= 3.e−2 = 0, 4060
= = =
1.3.2.3 Melalui Teorema Limit Pusat Berikut ini akan dijelaskan beberapa teorema limit pusat, sbb: Bab 1. Distribusi Pendekatan
E [etxi ]
txi = xi =0 e f (xi ) t(1) = e .p + et(0) .q
2. Cara pendekatan Dalam hal ini, kita menyelesaikannya dengan menggunakan distrbusi poisson. µ = np = 50.0, 04 = 2
P1
12
ISBN 978-602-8310-02-4
E [etsn ] t(X +X +...+X ) n E e 1 2 E etX1 +tX2 +...+tXn tX tX e 1 + e 2 + ... + E etXn Mx1 (t) + Mx2 (t) + ... + Mxn (t) (pet + q).(pet + q)...(pet + q) (pet + q)n
Msn (t) = Bab 1. Distribusi Pendekatan
13
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari distribusi binomial dengan parameter n dan p.
Statistika Matematis II/ Edisi E-book
yang bebas dan berdistribusi identik dengan: E(Xi ) = µ; V ar(Xi ) = σ 2 ; i = 1, 2, ..., n
Sn −E(Sn ) Sn −np = √npq Jadi E(Sn ) = np dan Var (Sn ) = npq, misalkan : Z = √ Var (Sn )
Fungsi pembangkit momen dari Z adalah: Mz (t) = = = = = = =
=
Mz (t) =
tZ iio n Eh eh −np E exp t S√nnpq √ t e−tnp/ npq .Msn √npq n √ √ e−tnp/ npq pet/ npq + q n −tp/√npq t/√npq pe +q e −tq/√npq n √ + q.e−tp/ npq i n h e 3 3 2 2 t q t q √ + 6npq + ... + 2npq p 1 + √tq npq npq h io n t2 q 2 t3 q 3 √ +q 1 − √tq + 2npq + 6npq + .. npq npq h p 2 3 2 p + t pq + t2nq + 6npt √q npq + ... + q− n in p 2 3 2 t pq + t2nq + 6npt √q npq + ... n in h 3 t2 + t6√(q−p) + ... 1 + 2n npq
n t2 t3 (q − p) Limn→∞ Mz (t) = Limn→∞ 1 + + √ + ... 2n 6 npq n t2 2 = Limn→∞ 1 + Limn→∞ Mz (t) = et /2 2n Ternyata bentuk di atas merupakan fungsi pembangkit momen dari −np berdistribusi N(0; 1). Dendistribusi normal standar. Jadi Z = S√nnpq gan menggunakan teknik fungsi pembangkit momen dapat ditunjukkan Sn berdistribusi N(np; npq) 3. Berikut ini akan dijelaskan dalil limit pusat untuk n buah variabel random yang berdistribusi identik (pembuktiannya dilakukan oleh Lindeberg dan Levy) T eorema : Jika X1 + X2 + ... + Xn adalah n buah variabel random Bab 1. Distribusi Pendekatan
14
ISBN 978-602-8310-02-4
maka variabel random Sn = X1 + X2 + ... + Xn secara pendekatan berdistribusi normal dengan rerata µ = nµ dan variansi σ 2 = nσ 2
Bukti : Misalkan M1 (t) menunjukkan fungsi pembangkit momen dari (Xi − µ1 ) dan M(t) menunjukkan fungsi pembangkit momen dari Z = Snσ−µ .
Karena µ1 dan µ2 dari (Xi − µ1 ) diberikan dengan:
µ1 = E(Xi − µ1 ) = E(Xi ) − µ1 = µ1 − µ1 = 0 µ2 = E(Xi − µ1 )2 = σi2
maka fungsi pembangkit momen dari (Xi − µ1 ) adalah: M1 (t) = E et(xi −µ1 ) = E 1 + t(xi − µ1 ) + 12 t2 (xi − µ1 )2 + 16 t3 (xi − µ1 )3 + ... = 1 + tE(xi − µ1 ) + 21 t2 E(xi − µ1 )2 + 61 t3 E(xi − µ1 )3 + ... t
1 + t2 σi2 + 61 t3 E(xi − µ1 )3 + ...
M1 (t) =
Kita akan menguraikan dahulu Z, Z=
(X1 + X2 + ... + Xn ) − µ Sn − µ = σ σ
dengan : Bab 1. Distribusi Pendekatan
15
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
(i)
µ = = =
µ = (ii) σ = = = =
E(Sn ) = E(X1 + X2 + ... + Xn ) E(X1 ) + E(X2 ) + ... + E(Xn ) µ1 + µ1 + ... + µ1
p
σ = Jadi Z =
h Limn→∞ Mz (t) = Limn→∞ 1 +
t2 2n
Limn→∞ Mz (t) =
et
in 3 + 6σ1tn√n + ... in h t2 Limn→∞ 1 + 2n
=
E(Sn ) = nµ1 p Var (Sn ) p Var(X1 + X2 + ... + Xn )
Pn
2 /2
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari 1 berdistribusi N(0; 1). distribusi normal standar. Jadi Z = Snσ−nµ 1n
Var(X1 ) + Var(X2 ) + ... + Var(Xn ) p σ12 + σ12 + ... + σ12 ) √ σ1 n (X1 + X2 + ... + Xn ) − nµ1 √ = σ1 n
Statistika Matematis II/ Edisi E-book
4. T eorema: Jika X1 + X2 + ... + Xnmenunjukkan sampel acak distribusi yang mempunyai rerata µdan varians σ 2 , maka variabel random:
xi =0 (Xi
− µ1 ) √ σ1 n Yn =
Fungsi pembangkit momen dari Z adalah: tZ hE et√ Pn i (X −µ ) = E e σ1 n xi =0 i 1 i h t√ [(x −µ )+t(x2 −µ1 )+...+t(xn −µ1 )] = E e σ1 n 1 1 h t√ i [(x −µ )+t(x2 −µ1 )+...+t(xn −µ1 )] = E e σ1 n 1 1
Mz (t) =
i h t√ t√ t√ (x −µ ) (x −µ ) (x −µ ) = E e σ1 n 1 1 e σ1 n 2 1 ....e σ1 n n 1 t t t √ .Mx2 − µ1 √ ....Mxn − µ1 √ = Mx1 − µ1 σ1 n σ1 n σ1 n n t √ Mz (t) = Mx1 − µ1 σ1 n " #n 2 3 1 1 t t 2 2 √ √ = 1+ σ1 + σ1 + ... 2 σ1 n 6 σ1 n n t3 t2 √ + ... + = 1+ 2n 6σ1 n n
Pn
xi =1 (Xi
− µ1 ) √ σ1 n
akan berdistribusi N(0; 1) Bukti : Tentukan fungsi pembangkit momen dari Yn , kemudian kita h i t
akan menguraikan e oleh: h
X1 −µ √ σ n
berdasarkan deret Taylor, sehingga diper-
n h h i i2 i3 2 t3 X1√−µ + t2 Xσ1√−µ + 6n + ... 1 + t Xσ1√−µ n n σ n h in t2 t 2 E(X1 − µ) + 2nσ = 1 + σ1 √ 2 E(X1 − µ) + ... n h in 3 t2 + 6σ3tn√n E(X1 − µ)3 + ... = 1 + 2n in h 3 t2 Limn→∞ M(t; n) = Limn→∞ 1 + 2n + 6σ3tn√n E(X1 − µ)3 + ... h in t2 = Limn→∞ 1 + 2n
M(t; n) =
2 /2
et
Limn→∞ M(t; n) =
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari Pn Xi −nµ √ berdistribusi distribusi normal standar, sehingga Yn = xi =1 σ n N(0; 1).
5. T eorema: Jika X1 , X2 , ..., Xn menunjukkan sampel acak dari distribusi yang mempunyai rerata µ dan varians σ 2 , maka variabel ranx−µ √ akan berdistribusi normal standar. dom Yn = σ/ n
Bab 1. Distribusi Pendekatan
16
ISBN 978-602-8310-02-4
Bab 1. Distribusi Pendekatan
17
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Bukti : Fungsi pembangkit momen dari Yn adalah: MYn (t)
= = = = = = =
M(t; n)
=
ln M(t; n) =
M(t; n) = E(etyn ) h x−µ i t √ E e σ/ n h −tµ i tx √ √ E e σ/ n .e σ/ n i h t −tµ √ √ [X +X +...+Xn ] e σ/ n E e σ n 1 2 h t i −tµ t t √ √ X √ √ X X e σ/ n E e σ n 1 .e σ n 2 ...e σ n n h t i i h t i h t −tµ √ √ X √ X √ X e σ/ n E e σ n 1 .E e σ n 2 ...E e σ n n h i i i h h −tµ √ . t t t .Mx2 σ1 √ ....Mxn σ1 √ e σ/ n Mx1 σ1 √ n n n h h ii n −tµ √ t e σ/ n Mx1 σ1 √ hn i −tµ t √ + n.ln Mx √ 1 σ/ n σ1 n
h i Apabila kita menguraikan Mx1 σ1 t√n lebih lanjut, maka akan diperolehhhasil:i h h i2 i3 t t t t = 1 + µ′1 σ1 √ + 12 µ′2 σ1 √ + 61 µ′3 σ1 √ + ... Mx1 σ1 √ n n n n Sehingga:
ln M(t; n) =
−tµ √ +n.ln σ/ n
i2 i3 h h 1 ′ 1 ′ t t√ t √ + + ... Mx1 1 + µ′1 σ1 √ + µ µ 2 3 2 6 n σ1 n σ1 n
Kita akan menguraikan ln (1 + x) dengan perluasan deret Maclaurin, yaitu: ln (1 + x) = x − 21 x2 + 13 x3 − ...; |x| < 1 h
i2
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari x−µ √ berdistribusi N(0; 1). distribusi normal standar, sehingga : Yn = σ/ n Untuk menerapkan teorma limit pusat dalam menyelesaikan soal, seringkali diperlukan untuk mengubahnya lebih dulu dalam bentuk lain, yaitu: Jika X1 , X2 , ..., Xn adalah n buah variabel random yang saling bebas dan berdistribusi identik dengan rerata µ1 dan variansi σ 2 yang besarnya berhingga dan S1 = X1 + X2 + ... + Xn ; maka: i h Rb 2 1 ≤ b = φ(b) − φ(b) = a √12π e−x /n dx Limn→∞ P a ≤ Snσ−nµ 1n Sn −E(Sn ) ≤ b = φ(b) − φ(b) Limn→∞ P a ≤ √ V ar(Sn )
Limn→∞ P a ≤
X−E(X) q V ar (X )
h atau Limn→∞ P a ≤
h
i3
X−µ √1 σ1 n
≤ b = φ(b) − φ(b) i ≤ b = φ(b) − φ(b)
tung peluang dari variabel random yang mempunyai harga tertentu dengan menggunakan teorema limit pusat, dapat diselesaikan dengan bantuan tabel distribusi normal standar.
1.4 Soal-Soal dan Pembahasan 1. Misalkan X adalah rerata dari sampel acak berukuran 75 dari distribusi dengan fungsi kepadatan peluang berbentuk: f (x) = 1 ; 0 < x < 1
− µ′1 = µ2 = σ 2
Bab 1. Distribusi Pendekatan
µ′3 √ 6σ3 n
Limn→∞ ln M(t; n) = 21 t2 2 Limn→∞ M(t; n) = et /2
µ′1 = µ
µ′2
3 (µ′ ) µ′ µ′ − 2σ13 √3n + 23σ13 √n t3 + ... 3 (µ′ ) µ′ µ′ µ′ Limn→∞ ln M(t; n) = Limn→∞ 21 t2 + 6σ33√n − 2σ13 √3n + 23σ13 √n t3 + ...
ln M(t; n) = 0 + 12 t2 +
Jika kita memperhatikan ketiga bentuk di atas, maka untuk menghi-
t t + 16 µ′3 σ1 √ + ... Disini X = µ′1 σ1 t√n + 21 µ′2 σ1 √ n n Sehingga: h h i2 i3 −tµ t t 1 ′ 1 ′ t√ ′ √ +n √ √ ln M(t; n) = µ µ + + ... − µ + 2 3 1 2 6 σ n σ1 n σ1 n σ1 n 2 h h i2 i3 t t 1 µ′1 σ1 t√n + 12 µ′2 σ1 √ + 16 µ′3 σ1 √ + ... + 2 n n # 3 i2 i3 h h 1 ′ 1 ′ 1 t√ t√ t√ ′ µ1 σ1 n + 2 µ2 σ1 n + 6 µ3 σ1 n + ... − ... 3 i h ′ h √ h ′ i √ i µ µ µ′2 −µ′ n µ′ µ′ = −µσ n + σ1 t + 2σ22 + 2σ12 t2 + 6σ3 3√n − + 2σ1√2n t3 + ..
dengan:
Statistika Matematis II/ Edisi E-book
= 0; 18
ISBN 978-602-8310-02-4
Bab 1. Distribusi Pendekatan
19
lainnya ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Hitung P (0, 45 < X < 0, 55) Jawab : Kita akan menghitung dahulu E(X) dan Var (X). R1 µ = E(X) = 0 xdx = 21 R 1 µ′2 = E(X 2 ) = 0 x2 dx = 13
Jadi : σ 2 =Var (X) =Var (X) = Sehingga: P (0, 45 < X < 0, 55) = P = P (0, 45 < X < 0, 55) =
1 3
−
1 4
0,45−0,5 q
1 (75)(12)
=
<
1 12
X−µ √1 σ1 n
<
0,55−0,5 q
1 (75)(12)
P (−1, 50 < Z < 1, 50) 0, 866
2. Misalkan X1 , X2 , ..., Xn menunjukkan sebuah sampel acak dari distribusi b(1, p). Jika n = 100, p = 1/2, dan Y = X1 + X2 + ... + Xn ;
Statistika Matematis II/ Edisi E-book
P (Y = 48, 49, 50, 51, 52) = P (Y = 48) + P (Y = 49) + P (Y = 50) +P (Y = 51) + P (Y = 52) ! 100 1 100 = 0, 0375 P (Y = 48) = 48 ! 2 100 1 100 P (Y = 49) = = 0, 0780 49 ! 2 100 1 100 = 0, 0796 P (Y = 50) = 2 50 ! 100 1 100 P (Y = 51) = = 0, 0780 51 ! 2 100 1 100 P (Y = 52) = = 0, 0735 2 52 Sehingga: P (Y = 48, 49, 50, 51, 52) = 0, 0375 + 0, 0780 + 0, 0796+
maka hitung P (Y = 48, 49, 50, 51, 52)
Karena X berdistribusi Bernouli, maka:
0, 0780 + 0, 0735 P (Y = 48, 49, 50, 51, 52) = 0, 3826 Apabila kita membandingkan hasil pendekatan dengan hasil eksak,
(i)E(X) = p
maka akan terdapat perbedaan sebesar 0, 0016.
Jawab :
(ii)Var (X) = p(1 − p) Dengan menggunakan teknik fungsi pembangkit momen, maka Y dapat ditunjukkan berdistribusi b(n; p). Akibatnya:
3. Misalkan X1 , X2 , ..., Xn adalah n buah variabel random yang masingmasing berdistribusi χ (1). Jika Sn = X1 + X2 + ... + Xn dan n = 100
(i) E(Y ) = n.p = 100.1/2 = 50
, maka tentukan nilai a sedemikian hingga P (Sn < a) = 0, 95
(ii)Var (Y ) = np(1 − p) = 100.1/2(1 − 1/2) = 25
Jawab :
Karena kita melakukan perubahan dari variabel random diskrit ke kontinu, maka kita harus menggunakan faktor koreksi, yaitu dengan menambah dan megurangi 0, 5. Sehingga: Y −E(Y ) ≤√ P (Y = 48, 49, 50, 51, 52) = P 47,5−50 ≤ 5 V ar(Y )
52,5−50 5
= P (−0, 50 < Z < 0, 50) P (Y = 48, 49, 50, 51, 52) = 0, 381 Kemudian kita akan menghtiung hasi eksak dengan menggunakan
Dengan menggunakan teknik fungsi pembangkit momen, maka Sn akan berdistribusi χ (n). Akibatnya (a) E(Sn ) = n = 100 (b) Var (Sn ) = 2n = 200 Sehingga: P (Sn < a) = 0, 95
disribusi binomial. Bab 1. Distribusi Pendekatan
20
ISBN 978-602-8310-02-4
Bab 1. Distribusi Pendekatan
21
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
# Sn − E (Sn ) a − 100 P p = 0, 95 ≤ √ 200 V ar (Sn ) "
a − 100 P Z≤ √ = 0, 95 200
Statistika Matematis II/ Edisi E-book
Jika Zn = n(Y1 − θ), maka tentukan distribusi pendekatan dari Zn 3. Misalkan X1 , X2 , ..., Xn merupakan sebuah sampel acak berukuran n dari distribusi yang mempunyai fungsi kepadatan peluang berbentuk: e−x xµ−1 Γ(µ)
f (x) =
Dari tabel Distribusi Normal diperoleh:
= a − 100 √ = 1, 645 200
Jika X n = berlaku:
√ a = 100 + 1, 645 200 = 123, 264
Kemudian kita akan menghitung peluang di atas secara eksak dengan menggunakan tabel Distribusi Chi-Kuadrat. Karena P (Sn < a) = 0, 95; dengan menggunakan tabel Distribusi Chi-Kuadrat dengan derajat kebebasan n = 100 diperoleh hasil: a = 124, 342. Apabila kita membandingkan hasil pendekatan degan hasil eksak maka akan terdapat perbedaan sebesar 1, 078.
1. Misalkan X n menunjukkan rerata dari sampel acak berukuran N(µ; σ 2 ). Tentukan distribusi pendekatan dari X n 2. Misalkan Y1 menunjukkan statistik urutan pertama dari sampel acak berukuran n yang berasal dari distribusi dengan fungsi kepadatan peluang berbentuk: f (x) = e−(x−θ) ; θ < x < ∞ Bab 1. Distribusi Pendekatan
Pn
i=1
;
lainnya
Xi , maka perlihatkan bahwa untuk n −→ ∞ √
n(X n − µ) 7→ N(0, 1) (X n )1/2
dalam distribusi. 4. Jika variabel random acak Zn berdistribusi Poisson dengan parameter µ = n, maka perlihatkan bahwa distribusi pendekatan dari vari√ abel random acak Yn = (Zn −n)/ n adalah distribuai normal dengan rerata 0 dan variansi 1 5. Misalkan Xn menunjukkan rerata dari sampel acak berukuran n dari distribusi Poisson dengan parameter µ = 1. Perlihatkan bahwa fungsi pembangkit momen dari:
1.5 Soal-Soal Latihan
=
1 n
; x > 0, 0 < µ < ∞
0
0
22
;
lainnya
ISBN 978-602-8310-02-4
Yn =
√
n(Xn − µ)/α =
√ Jika diberikan dengan exp(−t n + n(e
√
n(Xn − 1)
√ t/ n
− 1))
6. Untuk soal nomer 5, selidiki distribusi pendekatan dari Yn untuk √
n → ∞. Petunjuk: Uraikan et/ deret maclaurin
n
dengan menggunakan perluasan
7. Misalkan Xn menunjukkan rerata dari sampel acak berukuran n dari distribusi dengan fungsi kepadatan peluang berbentuk Bab 1. Distribusi Pendekatan
23
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
f (x) = e−x ; =
0
x>0
; lainnya
(a) Perlihatkan bahwa fungsi pembangkit momen dari: √ √ √ √ Yn = n(Xn − 1) sama dengan m(t,n) = [et/ n (t n)et/ n ]n0 ; t < √ n
Bab 2
(b) Tentukan distribusi dari Yn untuk n → ∞ 8. Misalkan Xn menunjukkan rerata dari sampel acak berukuran 15 dari distribusi dengan fungsi kepadatan peluang berbentuk: f (x) = 3x2 ; 0 < x < 1 = 0 ; lainnya Hitung secara pendekatan P ( 53 < X < 54 ) 9. Misalkan
Sn2
menunjukkan variansi dari sampel acak berukuran n
dari distribusi N(µ, δ 2 ) Buktikan bahwa - α2
2 nSn n−1
konvergen stokastik ke
10. Misalkan X1 , X2 , ..., X10 adalah barisan peubah acak yang saling bebas dan berdistribusi identik dengan rerata µ dan variansi. Perlihatkan bahwa:
2.1 Standar Kompetensi Memahami konsep dasar konvergensi barisan variabel random dan mampu menerapkan dalam penentuan distribusi pendekatan khususnya, dan dalam pemecahan masalah matematika, ilmu lain dan dalam kehidupan sehari-hari pada umumnya.
2.2 Indikator Hasil Belajar 1. Menjelaskan konsep dasar konvergensi stokasitik barisan variabel
2 Σn i.Xi n(n+1) i=1
pµ − → 6 n (b) n(n+1)(2n+1) Σ i.Xi p µ i=1 − → (a)
Konvergensi Variabel Random
random 2. Menganalisis jenis-jenis konvergensi stokastik barisan variabel random 3. Menurunkan teorema-teorema dan sifat-sifat konvergensi barisan variabel random, seperti konvergen dalam distribusi, konvergen dalam probabilitas, konvergen dalam kwadrat rataan,dan lain-lain. 4. Menggunakan teorema dan sifat-sifat konvergensi barisan variabel random untuk menentukan distribusi pendekatan suatu variabel random
Bab 1. Distribusi Pendekatan
24
ISBN 978-602-8310-02-4
25
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
2.3 Uraian Materi
2.3.2 Barisan Variabel Random
2.3.1 Konsep Dasar Variabel Random
Masalah fundamental dalam teori kemungkinan adalah bagaimana menentukan konvergensi (sifat asimptotik) dari variabel random. Kita mulai
Sebelum membahas tentang konvergensi barisan variabel random, kita paparkan dulu konsep variabel random, konsep fungsi, kejadian-kejadian yang dihasilkan dari variabel random, dan beberapa contoh-contoh konkret tentang variabel random. Bagi pembaca yang cukup familiar dengan konsep varibel random, dipersilakan untuk melewatinya, dan langsung
dengan mencermati masalah sederhana berikut. Misalkan akan diukur panjang suatu benda, katakanlah panjangnya m(dalam hal ini dapat dipandang sebagai parameter yang tak diketahui). Mengingat pengukuran bersifat tidak akurat, maka hasil pengukuran panjang benda tersebut dapat dinyatakan dengan variabel random berikut.
menuju, ke sub bab, tentang konsep konvergensi barisan variabel random. x=m+v Random Variable sering diterjemahkan menjadi variabel random atau peubah acak. Untuk selanjunya demi alasan konsistensi akan digunakan is-
dengan v merupakan galat (kesalahan). Jika tak ada kesalahan sistematik
tilah variabel random. Secara intutif, variabel random dapat dipandang sebagai bilangan x(ζ)yang dihubungkan dengan suatu kejadian ζ dari su-
yang disengaja, maka v juga merupakan variabel random dengan rataan 0 atau E(v) = 0. Jika deviasi σ dari v relatif kecil dibandingkan m, maka x(ζ) dari pengukuran tersebut cukup baik untuk m. Dalam konteks ini,
atu percobaan random. Bilangan ini, misalnya dapat berupa angka kemenangan dalam permainan judi, angka voltage dari naik-turunnya tegangan listrik, angka lama hidup suatu bola lampu, atau sembarang bilangan hasil
dapat dikatakan bahwa rataan dari random variabel x adalah m dan variannya σ 2 . Hal ini dapat dinyatakan dalam bentuk pertidaksamaan Tche-
pengamatan pada percobaan random1 .
bycheff sbb:
Definisi
σ2 (2.1) ε2 Jika varian x relatif kecil dibanding ε atau σ ≪ εmaka probabilitas |x − m| < ε akan menuju 1,atau P (|x − m| < ε)7→ 1. Hal ini berarti bahwa suatu hasil pengamatan terhadap panjang benda m tersebut hampir pasti P (|x − m| < ε) > 1 −
Diberikan ruang probabilitas (Ω, A, P ), dengan Ω, A, P masing-
masing menyatakan ruang sampel, ruang kejadian dan probabilitas. Variabel random X didefinisikan sebagai fungsi dari (domain) Ω ke bilangan real. Ditulis: X : Ω → R
(almost certainly) terletak antara m − εdan m + ε. Akibatnya parameter m terletak antara x(ζ) − ε dan x(ζ) + ε. Untuk meningkatkan keakuratan hasil pengukuran terhadap m tersebut
Jadi variabel random merupakan fungsi dengan domain berupa ruang sampel dan kodomain bilangan real. 1 Istilah percobaan random digunakan untuk menggambarkan proses atau prosedur yang hasilnya tak dapat diprediksi secara pasti. Misalnya percobaan melantunkan sebuah mata uang. Hasilnya umumnya dinyatakan sebagai data, misalnya dinyatakan sebagai {Angka,Gambar} atau mungkin sebagai {0,1}. Jadi data tersebut dapat berupa data numerik (bilangan) maupun katagorik.
Bab 2. Konvergensi Variabel Random
26
ISBN 978-602-8310-02-4
dapat dilakukan dengan mengulang pengukuran tersebut, misalnya n kali. Hasil-hasil pengukuran tersebut dapat dinyatakan dalam bentuk ba¯ = risan variabel random Xn = (x1 , x2 , ..., xn ), dengan rata-rata sampel x Pn i=1 (x1 + x2 + ... + xn ), juga merupakan variabel random dengan rata2 rata m dan varian σn . Jika n cukup besar sehingga σ 2 ≪ n.m2 maka nilai ¯ (ζ) merupakan estimasi yang baik untuk parameter (yang tak diketahui) x Bab 2. Konvergensi Variabel Random
27
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
m.
Statistika Matematis II/ Edisi E-book
random Xn , kita katakan Xn konvergen ke X dalam distribusi dan ditulis d Xn → X jika ada fungsi distribusi dari X sehingga
Contoh: Masih berkaitan dengan masalah di atas, tentukanlah probabilitas bahwa x terletak antara 0, 9.m dan 1, 1.m, jika diestimasi dengan variabel random 2 x ¯ dan dengan mengasumsikan n cukup besar sedemikian sehingga σm.n 2 =
lim Fn (x) = F (x)
(2.2)
n→∞
10−4 .
untuk setiap titik x dimana F(x) kontinu. Xn konvergen ke X dalam distribusi juga dikatakan Xn mempunyai limit distribusi dengan fungsi dis-
Jawab: Dengan menggunakan ketidaksamaan Tchebycheff didapat:
tribusi F (x). T eorema Kekontinuan Levy :
¯ < 1.1.m) = P (−0, 1.m < x ¯ − m < 0, 1.m) P (0, 9.m < x σ2 P (|¯ x − m| < 0, 1.m > 1 − 2 , dengan ε = 0, 1.m ε 10−4 .m2 P (|¯ x − m| < ε = 1 − −2 10 n.m2 1 = 1− 100n Dari hasil ini didapat, misalnya untuk n = 10,maka probabilitas x terletak antara 0, 9.m dan 1, 1.m adalah 0,999 Untuk selanjutnya masalah konvergensi variabel random dapat dirumuskan sebagai berikut. Misalkan X1 , X2 , ... Xn barisan variabel random dengan distribusi bersama yang terletak pada ruang sampel yang sama Ω dan X variabel random yang lain yang juga terletak pada ruang sampel Ω. Selanjutnya masalah dapat dirumuskan menjadi: “Bagaimana jenis dan sifat konvergensi dari barisan variabel random Xn tersebut?”.
2.3.3 Jenis-Jenis Konvergensi Variabel Random 2.3.3.1 Konvergen dalam Distribusi
Misal Yn variabel random dengan fungsi distribusi Fn (y) dan Mn (y) ada untuk ∀t ∈ ℜ. Jika F (y) fungsi distribusi yang bersesuaian dengan M(t) d
sehingga Mn (t) → M(t) maka Yn → Y . Catatan :
Limn→∞ {1 + b/n + Ψ(n)/n}cn = ebc , jika Ψ(n) = 0 T eorema Limit P usat Jika X1 , X2 , ..., Xn ∼ (µ, σ 2 ), σ > 0 maka Yn = Y ∼ N(0, 1)
d
n(X n − µ)/σ → Y, dimana
Bukti Dalam pembuktian berikut, diasumsikan fpm dari x ada. Misal fpm dari X dan X − µ adalah M(t) dan m(t) maka m(t) = E(et(X−µ) ) = e−µt M(t)
juga ada. Karena m(t) merupakan f pm dari X − µ maka m(0) = 1, m′ (0) = E(X − µ) = 0, m′′ (0) = E(X − µ)2 = σ 2 . Menurut teorema Taylor, ada
Misalnya X1 , X2 , ..., Xn adalah barisan variabel random yang didefinisikan atas ruang sampel yang sama S. Jika Fn (x) fungsi distribusi dari variabel 28
√
bilangan ε antara 0 dan t sehingga m(t) = m(0)+ m′ (0)t+ m′′ (ε)t2 /2 = 1 + m′′ (ε)t2 /2. Di ruas kanan ditambah dan dikurangkan dengan σ 2 t2 /2 maka
Definisi
Bab 2. Konvergensi Variabel Random
(2.3)
ISBN 978-602-8310-02-4
m(t) = 1 + σ 2 t2 /2 + Bab 2. Konvergensi Variabel Random
29
[m′′ (ε) − σ 2 ] t2 . 2 ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Pandang "
n X
Mn (t) = E exp t
i=1
!
√
!#
Xi − nµ /σ n
n X −µ = E exp t √ σ n n t √ = m ; −h < t < h σ n
FYn (yn ) = P (Yn ≤ yn = P (max (X1 , X2 , ..., Xn ) ≤ yn
m dengan 0 < ε <
t √ σ n
t √
σ n
(2.6)
[m′′ (ε) − σ 2 ] t2 t2 + =1+ 2n 2nσ 2 √
Mn (t) =
FYn (yn ) = =
√
[m′′ (ε) − σ 2 ] t2 t2 + 1+ 2n 2nσ 2
n
P (X1 ≤ yn , X2 ≤ yn , ..., Xn ≤ yn ) P (X1 ≤ yn ).P (X2 ≤ yn )....P (Xn ≤ yn )
hR 0
−∞
Karena m′′ (t) kontinu di t = 0 dan jika n → ∞ maka ε → 0 maka diperoleh t d (m′′ (ε)−σ 2 ) → 0 akibatnya Mn (t) → et /2 . Jadi Yn → Y dimana Y ∼ N(0, 1)
Untuk yn ≥ θ, FYn (yn ) = = Jadi
f (x)dx +
R yn
in f (x)dx
0 hR R yn 1 in 0 dx 0dx + 0 θ −∞ yn n θ
=
(2.8)
n [P hR(X1 ≤ yn )]i yn f (x)dx −∞
Untuk yn < 0 maka FYn (yn ) = 0 Untuk 0 ≤ yn < θ,
(2.7)
dan −hσ n < t < hσ n sehingga
=
(2.5)
Menurut di atas diperoleh:
= =
(2.4)
hR 0
in Rθ Ry f (x)dx + 0 f (x)dx + 0 n f (x)dx hR i n Ry Ry 0 dx + 0 n θ1 dx + 0 n 0dx = 1 −∞
−∞
Contoh FYn (yn ) = = =
Misalkan X1 , X2 , ..., Xn adalah n buah variabel random yang saling bebas berdistribusi seragam pada (0, θ), θ > 0. Jika Yn = max (X1 , X2 , ..., Xn )dan variabel random Z didefinisikan sebagai P (Z = θ) = 1, maka buktikan
0 ; yn < 0 yn n ; 0 ≤ yn < θ θ yn n 1 ; θ
Limn→∞ FYn (yn ) = 0 ; yn < 0 = 1 ; yn ≥ θ
Yn − d Z → Jawab :
Karena didapat Limn→∞ FYn (yn ) = F (z), dengan F (z) adalah fungsi distribusi dari Z.
Fungsi kepadatan peluang dari X adalah:
Jadi Yn − d Z →
f (x) = =
1 θ
Contoh Diketahui barisan fungsi distribusi
; 0
Fn (x) =
Fungsi distribusi dari Yn adalah: Bab 2. Konvergensi Variabel Random
30
ISBN 978-602-8310-02-4
Bab 2. Konvergensi Variabel Random
(
31
0, x < n 1, x ≥ n
(2.9) ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Jelaslah bahwa lim Fn (x) = 0 = F (x) , karena F (x) = 0, ∀X bukan n→∞ fungsi distribungsi maka Xn tidak konvergen dalam distribusi.
diperoleh lim fn (x) = 0, untuk setiap x. Karena f (x) = 0 bukan n→∞ merupakan fkp, maka fn (x) tidak konvergen ke suatu fkp. Tetapi
Contoh Diketahui fungsi distribusi dari variabel random xn sbb:
Fn (x) =
Zx
−∞
1 2/2 e−nw dw (2π)1/2 (1/n)1/2
Fn (x) = (2.10)
√
lim Fn (x) = F (x) =
n→∞
(2.14)
0; x < 2 1; x ≥ 2
(2.15) d
n→∞
x. Ini berarti limit distribusi tidak dapat ditentukan oleh fkp.
√
Z nx
−∞
1 2 √ e−v /2 dv 2π
(2.11) 2.3.3.2 Konvergen dalam Probabilitas
dan
Misalkan Fn (y) menunjukkan fungsi distribusi dari variabel random Yn yang distribusinya bergantung pada n bilangan bulat positif. Jika c sebuah
0, x¯ < 0 1 Limn→∞ Fn (x) = , x¯ = 0 2 1, ¯x > 0
konstanta yang tidak bergantung pasa n, maka Yn dikatakan konvergen stokastik ke-c jika dan hanya jika untuk setiap ε > 0 berlaku:
Pandang fungsi distribusi
F (x) =
(
1 n 1 n
Karena lim Fn (x) = F (x) di setiap titik kontinu dari F (x) maka xn →
nw, sehingga
Fn (x) =
0; x < 2 + 1; x ≥ 2 +
dan
Apakah variabel random xn mempunyai limit distribusi? Jawab Misal v =
(
(
0, x < 0 1, x < 0
Limn→∞ P [|Yn − c| < ε] = 1 (2.12)
tidak kontinu di x = 0. Akan tetapi, untuk x 6= 0
Konvergen stokastik ke parameternya atau ke suatu konstanta, sering dinyatakan sebagai konvergen dalam peluang. Def inisi
lim Fn (x) = F (x)
(2.13)
n→∞
Jadi variabel random xn mempunyai limit distribusi dengan fungsi distri-
Misalkan Z1 , Z2 , ..., Zn adalah barisan variabel random yang didefinisikan atas ruang sampel S. Misalkan pula Z adalah variabel random lain yang didefinisikan atas ruang sampel S. Kita katakan Zn konvergen ke-Z dalam p
d
peluang (ditulis Zn → Z), jika untuk setiap ε > 0 berlaku:
busi F (x) atau xn → x.
Limn→∞ P [|Zn − Z| ≥ ε] = 0
Contoh Diketahui Xn barisan variabel random dengan fn (x) = Bab 2. Konvergensi Variabel Random
( 32
1; x = 2 +
1 n
(2.16)
Karena
0; x yang lain ISBN 978-602-8310-02-4
P {|Zn − Z| ≥ ε} + P {|Zn − Z| < ε} = 1 Bab 2. Konvergensi Variabel Random
33
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Jawab :
maka P {|Zn − Z| ≥ ε} → 0 ⇔ P {|Zn − Z| < ε} → 1
(2.17)
Penyelesaian masalah konvergen dalam peluang digunakan ketidaksamaan Chebysev, yaitu: P [|X − µx | ≥ kσx ] ≤
1 k2
Dari ketidaksamaan Chebysev: P [|X − µx | ≥ kσx ] ≤ Kita mengetahui bahwa E(Xi ) = λ dan Var(Xi ) = λ2 . P Karena x = n1 ni=1 Xi = n1 [X1 + X2 + ... + Xn ] , maka (i)
E (x)
1 k2
Berikut ini adalah langkah-langkah untuk penentuan konvergen stokastik, sbb:
E (x)
Jadi:
= =
E 1 n
1
n
[X1 + X2 + ... + Xn ]
1 λ P X − λ ≥ k √ ≤ 2 k n
1. Gunakan ketidaksamaan Chebyshev seperti yang dirumuskan di atas 2. Tentukan rerata dan variansi dari statistiknya.
=
[E (X1 ) + E (X2 ) + ... + E (Xn )] 1 (λ + λ... + λ) = λ n 1 V ar n [X1 + X2 + ... + Xn ] (ii) V ar (x) = = n−2 [V ar (X1 ) + V ar (X2 ) + ... + V ar (Xn )] 2 = n−2 (λ2 + λ2 ... + λ2 ) = λn
atau P [|X − µx | < kσx ] ≥ 1 −
1 k2
Misalkan
ε
= k. √λn
k = k2 =
3. Substitusikan nilai rerata dan variansi tersebut ke dalam ketidaksamaan Chebyshev
√ ε n λ ε2 n λ2
Sehingga: λ2 P X − λ ≥ ε ≤ 2 εn λ2 Limn−→∞ P X − λ ≥ ε ≤ Limn→∞ 2 = 0 εn
4. Lakukan modifikasi terhadap nilai di dalam harga mutlaknya, sedemikian hingga nilai tersebut sesuai dengan yang diharapkan. 5. Misalkan kσx = εdengan σx sudah disubstitusikan dan diperoleh nilai k. Kemudian tentukan nilai k 2 . 6. Beri limit untuk n → ∞ pada kedua ruasnya.
Dengan demikian X konvergen stokastik ke-λ.
Contoh Misalkan X1 , X2 , ..., Xn adalah sebuah sampel acak dari distribusi
Contoh Misalkan barisan variabel random (X1 , X2 , ..., Xn )∼ (µ, σ 2 ). Tunp jukkan apakah Xn → µ?
eksponensial dengan fungsi kepadatan peluang berbentuk:
Jawab
f (x) = = ke-λ.
1 −x/λ e λ
0
;
x>0
; lainnya
Perlihatkan bahwa x konvergen stokastik
Bab 2. Konvergensi Variabel Random
34
ISBN 978-602-8310-02-4
Diberikan ε > 0 √ P {|Xn − µ| ≥ ε} = P |Xn − µ| ≥ kσ/ n
Bab 2. Konvergensi Variabel Random
35
(2.18)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book √ dengan k = ε n/σ. Dengan menggunakan ketaksamaan Chebyshev diperoleh √ P |Xn − µ| ≥ kσ/ n ≤ 1/k 2 = σ 2 /(nε2 ) (2.19) P {|Xn − µ| ≥ ε} → 0; jika σ 2 finit dan n → ∞
(2.20)
Statistika Matematis II/ Edisi E-book
(b) variabel random gan d 6= 0
Catatan Syarat lim P (|Yn − c| < ε) = 1 sering digunakan sebagai defi-
Contoh Misalkan variabel random Yn berdistribusi b(n, p), dengan 0 < p < 1. Jika Un = √Yn −np ,maka: 1. Tentukan disribusi penndekatan dari Un .
n→∞
nisi konvergen dalam probabilitas dan orang mengatakan bahwa Yn konvergen ke c dalam probabilitas. Tipe konvergen yang terkuat diberikan oleh P ( lim Yn = c) = 1. Dalam kasus ini kita katakan Yn n→∞ konvergen ke c dengan probabilitas 1. Sehubungan dengan ini, mean sampel X n konvergen dengan probabilitas 1 ke mean µ dari suatu
distribusi. Hal ini disebut hukum kuat dari bilangan besar
2.3.4 Sifat-Sifat Konvergensi Variabel Random Berikut ini adalah beberapa sifat-sifat penting konvergensi variabel random, yang sering digunakan dalam menentukan distribusi pendekatan. 1. Misalkan Fn (u) menunjukkan fungsi distribusi dari variabel random Un yang distribusinya bergantung pada bilangan bulat positif n. Jika Un c
konvergen stokastik
2. Perlihatkan bahwa
Yn n
konvergen stokastik ke-p
3. Perlihatkan bahwa
Yn np
konvergen stokastik ke-1
4. Perlihatkan bahwa 1 −
M(t; n) = = = =
=
mudian Un konvergen stokastik ke-c, c > 0) dan P (Un < 0) = 0untuk √ √ setiap n. Dalam hal ini, Un konvergen stokastik ke- c.
= =
(a) variabel random Un Vn konvergen stokastik ke konstanta cd 36
ISBN 978-602-8310-02-4
konvergen stokastik ke-(1 − p)
1. Fungsi pembangkit momen dari Un adalah:
=
3. Jika variabel random Un dan Vn konvergen stokastik masing-masing ke konstanta c dan d, maka:
Yn n
P enyelesaian : Fungsi pembangkit momen dari Yn adalah: MYn (t) = ((1 − p) + pet )n
2. Misalkan Fn (u) menunjukkan fungsi distribusi dari variabel random Un yang distribusinya bergantung pada bilangan bulat positif n. Ke-
Bab 2. Konvergensi Variabel Random
konvergen stokastik ke konstanta c/d, den-
np(1−p)
p
Karena ∀ε > 0; P {|Xn − µ| ≥ ε} → 0 maka Xn → µ
Un konvergen stokastik ke-c (c 6= 0), maka ke-1.
Un Vn
tU n MU( n (t) = E e –) » E
t √Yn −np
e
np(1−p)
√ np √ tYn e−t 1−p E e np(1−p) √ np e−t 1−p MYn √ t np(1−p) n √ np √ t −t 1−p e (1 − p) + pe np(1−p) √ np n √ np −t √ t −t (1 − p)e n 1−p + pe np(1−p) n 1−p √ p √ t−tp t (1 − p)e n(1−p) + pe np(1−p) n q √ p t 1−p −t n(1−p) + pe np (1 − p)e
q √ p t 1−p Kemudian kita akan menguraikan e−t n(1−p) dan pe np menggunakan
perluasan deret MacLaurin, yaitu: Bab 2. Konvergensi Variabel Random
37
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
(i)
e−x = 1 − x +
(ii)
ex = 1 − x +
x2 2 x2 2
Jadi:
q p + ...dengan x = t n(1−p) q 3 − x6 + ...dengan x = t 1−p np
−
(i)
(ii) (iii)
disribusi normal standar. Jadi distribusi pendekatan dari Un adalah N(0; 1)
x3 6
o h n q q t3 p p p t2 + 2n(1−p) − 6n(1−p) + ... + M(t; n) = (1 − p) 1 − t n(1−p) n(1−p) n oin q q 2 3 1−p p 1 + t 1−p + t (1−p) + t (1−p) + ... np 2np 6np np h q q t2 p t3 p p p + 2n(1−p) − 6n(1−p) + ... − p+ = 1 − t n(1−p) n(1−p) q q 2 2 3 2 t p t p p p pt n(1−p) + 2n(1−p) − 6n(1−p) n(1−p) − ... + p+ in q q 2 3 1−p pt 1−p + t (1−p) + t (1−p) + ... np 2n 6n np
Kita akan menguraikan t, t2 , dan t3 satu persatu .
Statistika Matematis II/ Edisi E-book
suku-suku
q q q p p − t n(1−p) + pt 1−p pt n(1−p) np 2 t2 p t2 p2 − 2n(1−p) + t (1−p) 2n(1−p) 2n q q t3 p t3 p2 p p − 6n(1−p) + 6n(1−p) n(1−p) n(1−p)
yang
mengandung
q p −t n(1−p) q p +2pt n(1−p) q p = −t(1 − 2p) n(1−p) =
t2 2nq t3 (1−p) 1−p 6n np −t3 (2p−1)
=
+ =
6n
√
np(1−p)
2.
Yn n
konvergen stokastik ke-p
Untuk menyelesaikannya akan digunakan ketidaksamaan Chebyshev, yaitu: P [|Yn − µYn | < kσYn ] ≥ 1 − Karena Yn berdistribusi b(n; p), maka: µ Yn = np σY2n = np(1 − p) p atau σYn = np(1 − p) Jadi: h
i p 1 P |Yn − np| < k np(1 − p) ≥ 1 − 2 k p Yn 1 P n − p < k np(1 − p) ≥ 1 − 2 n k p Yn 1 P − p < k np(1 − p) ≥ 1 − 2 n k q nε2 Misalkan: ε = k p(1−p) dan k 2 = 1−p n Sehingga:
Sehingga: M(t; n) = =
1 − t(1 − 2p) 1+
t2 2n
q
p n(1−p)
− t(1 − 2p)
q
+
t2 2n
−
p n(1−p)
Limn−→∞ M(t; n) = q p t2 − = Limn−→∞ 1 + 2n − t(1 − 2p) n(1−p) h in 2 t = Limn−→∞ 1 + 2n
−
t3 (2p−1) 6n
√
np(1−p)
t3 (2p−1) 6n
√
np(1−p)
t3 (2p−1) 6n
√
np(1−p)
n + ... n + ...
n + ...
1 k2
Jadi
Yn p(1 − p) P − p < ε ≥ 1 − n nε2 Yn p(1 − p) =1 Limn−→∞ P − p < ε ≥ Limn−→∞ 1 − n nε2
Yn n
konvergen stokastik ke-p
3. Variabel random Ynpn konvergen stokastik ke-1 Untuk menyelesaikannya akan digunakan ketidaksamaan Chebyshev, yaitu:
t2
Limn−→∞ M(t; n) = e 2
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari Bab 2. Konvergensi Variabel Random
38
ISBN 978-602-8310-02-4
P [|Yn − µYn | < kσYn ] ≥ 1 − Bab 2. Konvergensi Variabel Random
39
1 k2
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book h i p 1 P |Yn − np| < k np(1 − p) ≥ 1 − 2 k p Yn 1 P np − 1 < k np(1 − p) ≥ 1 − 2 np k r Yn 1 1−p ≥1− 2 −1
Jadi
Yn 1−p P − 1 < ε ≥ 1 − np npε2 Yn 1−p =1 − 1 < ε ≥ Limn−→∞ 1 − Limn−→∞ P np npε2
Yn konvergen n
stokastik ke-1
4. Variabel random 1 − Ynn konvergen stokastik ke-(1 − p) Untuk menyelesaikannya akan digunakan ketidaksamaan Cheby-
Statistika Matematis II/ Edisi E-book
Sehingga: p(1 − p) Yn P 1 − − (1 − p) < ε ≥ 1 − np nε2 Yn p(1 − p) Limn−→∞ P 1 − − (1 − p) < ε ≥ Limn−→∞ 1 − np nε2 Yn − (1 − p) < ε ≥ 1 Limn−→∞ P 1 − np h i Jadi 1 − Ynpn konvergen stokastik ke-(1 − p)
2.4 Soal-Soal dan Pembahasan 1. Diketahui variabel random X1 , X2 , ... Xn i.i.d dengan fungsi kepadatan peluang:
f (x) =
shev, yaitu P [|Yn − µYn | < kσYn ] ≥ 1 −
1 k2
i h p 1 P |Yn − np| < k np(1 − p) ≥ 1 − 2 k p Yn 1 − p < k np(1 − p) ≥ 1 − 2 P n np k " # r Yn 1 p(1 − p) P ≥1− 2 −p
40
ISBN 978-602-8310-02-4
(
1 ;0 θ
< x < θ, 0 < θ < ∞ 0; untuk x yang lain
(2.21)
Misalkan dibentuk variabel random Yn = max(X1 , X2 , ...,Xn ), Tunw d jukkan apakah Fn → F, dan Yn → Y untuk suatu variabel random Y!
Jawab: Karena f (x) = θ1 untuk 0 < x < θ maka per definisi fungsi distribusi variabel random X didapat sbb: FX (x) = P (X ≤ x) Zx x 1 = dt = , 0 < x < θ θ 0 θ
(2.22)
Mengingat Yn adalah maksimum dari barisan variabel random X1 , X2 , ... Xn yang i.i.d, maka fungsi distribusi variabel random Yn didapat dengan sbb: Bab 2. Konvergensi Variabel Random
41
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Karena ada t sehingga M(t) = ∞, maka M(t) bukan fpm. Misal Fn (y) fungsi distribusi yang berkaitan dengan Yn , maka FYn (y) = P (Yn ≤ y) = P (X1 ≤ y, ...Xn ≤ y)
Fn (y) =
= P (X1 ≤ y)...(Xn ≤ y) n
mengingat 2.22 maka didapat
FYn (y) =
[ yθ ]n , 1,
0
0; y < −n
1; y ≥ −n
Jadi Fn (y) → F (y) = 1, ∀y dengan F (y) bukan fungsi distribusi sehingga Yn tidak konvergen ke suatu fungsi distribusi.
= [F (y)]
(
(
(2.23)
Untuk 0 < y < θ dan jika n → ∞ maka [ yθ ]n → 0, sehingga didapat:
3. Diketahui Xn dengan fmp P {Xn = 1} = 1/n, P {Xn = 0} = 1 − 1/n. d Tunjukkan bahwa Xn → X Jawab : Perhatikan bahwa, Mn (t) = 1/net + (1 − 1/n) ada ∀t ∈ ℜ. Mn (t) → 1. Jadi M(t) = 1 adalah fpm dari variabel random x yang degenerate di d
lim FYn (y) =
n→∞
(
x = 0. Menurut teorema di atas maka Xn → X 0, 0 < y < θ 1,
= FY (y)
y≥θ
dengan FY (y) merupakan suatu fungsi distribusi. Jadi dapat disimpulkan bahwa: FYn −w d Y , dimana Y adalah variabel random dengan → FY (y) dan Yn − → distribusi FY (y). 2. Diketahui {Yn } barisan variabel random dengan fungsi massa peluang (fmp). P {Yn = −n} = 1; n = 1, 2, ... Selidiki apakah Yn konvergen dalam distribusi ke suatu variabel random? Jawab : Perhatikan bahwa, Mn (t) = E(etYn ) = e−tn P (Yn = −n) = e−tn . Se-
hingga jika n → ∞ diperoleh
0; t > 0 −−∞ → M(t) = Mn (t) − n−→ 1; t = 0 ∞; t < 0
Bab 2. Konvergensi Variabel Random
42
ISBN 978-602-8310-02-4
d
4. Diketahui Yn ∼ B(n, p) maka µ = np dan p = µ/n. Apakah Yn → Y ? Jawab Mn (t) = E(etYn ) X n = etYn P Yn (1 − p)n−Yn Y n Yn =0 n X Yn n (1 − p)n−Yn P et = Y n Yn =0 n = pet + (1 − p) n µ(et − 1) = 1+ n
(2.24) (2.25) (2.26) (2.27) (2.28)
Jadi Mn (t) → µ(et − 1) ; ∀t. Karena ada distribusi poisson dengan mean µ mempunyai fpm µ(et − 1) maka menurut teorema di atas d Yn → Y. 5. Diketahui Zn ∼ χ2 (n). maka fpm dari Zn adalah(1 − 2t)−n/2 ; t < 1/2. Mean dan variansi dari Zn adalah n dan 2n. Tentukan limit distribusi √ dari Yn = (Zn − n)/ 2n Bab 2. Konvergensi Variabel Random
43
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
E(X) = 1/2 dan E(X 2 ) = 1/3 maka µ = 1/2 dan σ 2 = 1/12. √ √ n(X − µ)/σ < P 0, 45 < X < 0, 55 = P ( n(0, 45 − µ)/σ < √ n(0, 55 − µ)/σ = 0, 866.
Jawab : fpm dari √
Yn = E(etyn ) = e[t((Zn −n)/ √ −tn/ 2n
= e
√ tzn / 2n
E(e
2n)]
(2.29)
)
h i−n/2 ih √ −(t 2/n) n 1−2 √t 2
= e =
7. Jika p
√ ; t < ( 2n)/2 r √ !−n/2 r √2 2 t 2 n e n et n − t ;t < n 2 2n
(2.31)
Bukti
(2.32)
Diberikan ε > 0, P {|Xn + Yn − (a + b)| ≥ ε} ≤ P {|Xn − a| ≥ ε/2} + P {|Yn − b| ≥ ε/2} .2
√ Menurut teorema Taylor ada bilangan ε(n) antara 0 dan t 2/n se-
Karena kedua suku diruas kanan mendekati 0 untuk n → ∞, maka diperoleh ∀ε > 0 P {|Xn + Yn − (a + b)| ≥ ε} → 0. Jadi Xn + Yn → (a + b)|
hingga √2
t
e
n
r
=1+t
dan diperoleh
r r 2 2 2 2 3 ε(n) + 1/2(t ) + 1/6e (t ) n n n
√2 t2 Ψ(n) −n/2 ) et n = (1 − + n n
p
Xn → a dan Yn → b ⇒ Xn + Yn → (a + b)
(2.30)
(2.33)
8. Diketahui Yn ∼ B(n, p), 0 < p < 1. Tentukan limit distribusi dari p
(2.34)
dengan
Yn − np n(Yn /n)(1 − Yn /n)
Jawab :
Ψ(n) =
√
2t3 eε(n) √ 3 n
√ 3 2t4 eε(n) 2t ; n → ∞ ⇒ Ψ(n) → 0 − √ − 3n n
Perhatikan bahwa, menurut TLP
(2.35)
Yn − np d Un = p → N(0, 1) np(1 − p)
akibatnya 2 /2
Mn (t) → et
; ∀t
(2.36)
p
Jadi Yn → Y dengan Y ∼ N(0, 1) 6. Diketahui X = mean sampel random berukuran 75 dari distribusi
f (x) =
(
(2.37)
Hitung P 0, 45 < X < 0, 55
Jawab
Bab 2. Konvergensi Variabel Random
dan Vn =
1; 0 < x < 1 0; yang lain
ISBN 978-602-8310-02-4
(Yn /n)(1 − Yn /n) p(1 − p)
1/2
p
→1
(2.39)
Menurut teorema
2
44
p
Yn /n → p dan 1 − Yn /n → 1 − p ⇒ (Yn /n)(1 − Yn /n) → p(1 − p) ⇒ (Yn /n)(1−Yn /n) →1 p(1−p)
d
dengan fkp
p
(2.38)
Wn = Un /Vn = p
Yn − np
n(Yn /n)(1 − Yn /n)
d
→ N(0, 1)
(2.40)
gunakan ketaksamaan segitiga
Bab 2. Konvergensi Variabel Random
45
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
9. Diketahui X n dan Sn2 mean dan variabel sampel random yang berukuran n dari distribusi N(µ, σ 2 ), σ 2 > 0. Tentukan limit distribusi dari Wn = σX n /Sn .
6. Diketahui Xn ∼ G(n, β), dengan β bukan fungsi dari n. Tentukan limit distribusi dari Yn = Xn /n
Jawab : Telah dibuktikan bahwa X n dan Sn2 berturut-turut konvergen dalam probabilitas ke µ dan σ 2 . Menurut teorema, Sn konvergen dalam probabilitas ke σ dan menurut teorema 1, Sn /σ konvergen ke 1. Menurut teorema variabel random Wn = σX n /Sn mempunyai limit distribusi p
yang sama dengan X n . Jadi Wn → µ.
7. Diketahui Zn ∼ χ2 (n) dan Wn = Zn /n2 . Tentukan limit distribusi dari Wn .
8. Buktikan teorema kekontinuan Levy; Misal Yn variabel random dengan fungsi distribusi Fn (y) dan Mn (t) ada untuk ∀t ∈ ℜ. JikaF (y) fungsi distribusi ysng bersesuaian dengan M(t) sedemikian sehingd ga Mn (t) → M(t) maka Yn → Y
9. Buktikan teorema limit pusat berikut: Jika X1 , ..., Xn ∼ (µ, σ 2 ), σ > 0 √ d maka Yn = n(X n − µ)/σ → Y dimana Y ∼ N(0, 1).
2.5 Soal-Soal Latihan
10. Diketahui variabel random Yn mempunyai distribusi B(n, p).
1. Tuliskan definisi dari: d
(a) Xn konvergen ke X dalam distribusi (ditulis Xn → X
(a) Buktikan bahwa Yn /n konvergen dalam probabilitas ke p. (Hal
p
(b) Xn konvergen ke X dalam probabilitas (ditulis Xn → X)
ini merupakan suatu bentuk hukum lemah dari bilangan besar).
2. Misalkan xn mean sampel random yang berukuran n dari distribusi N(µ, σ 2 ). Tentukan limit distribusi dari xn 3. Misalkan Y1 statistik terurut pertama dari sampel random yang berukuran n dari distribusi yang mempunyai f.k.p f (x) = e−(x−θ) , θ < x < ∞ dan bernilai 0 untuk x yang lain. Jika Zn = n(Y1 −θ), tentukan limit distribusi dari Zn .
11. Misalkan Sn2 variansi sampel yang berukuran n dari distribusi N(µ, σ 2 ). Buktikan bahwa nSn2 /(n − 1) konvergen dalam probabilitas ke σ 2 .
12. Diketahui Wn variabel random dengan mean µ dan varians nbp dengan p > 0, µ dan b konstanta (bukan fungsi dari n). Buktikan bahwa
4. Diketahui f.k.p dari Yn adalah fn (y) =
(
1; y = n 0; y 6= n
(2.41)
5. Diketahui X1 , X2 , ..., Xn sampel random yang berukuran n dari disn X tribusi N(µ, σ 2 ) dengan µ > 0. Perlihatkan bahwa Zn = Xi tidak i=1
mempunyai limit distribusi.
46
Wn konvergen dalam probabilitas ke µ. (petunjuk gunakan ketaksamaan Chebyshev). 13. Misalkan Yn menyatakan statistik terurut ke-n dari sampel random
Perlihatkan bahwa Yn tidak mempunyai limit distribusi.
Bab 2. Konvergensi Variabel Random
(b) Buktikan bahwa1 − Yn/n konvergen dalam probabilitas ke 1 − p
ISBN 978-602-8310-02-4
berukuran n dari distribusi uniform pada interval (0, θ). Buktikan √ √ bahwa Zn = Yn konvergen dalam probabilitas ke θ. 14. Diketahui X n ∼ G(µ, 1). Buktikan bahwa limit distribusi p µ)/ X n adalah N(0, 1)
Bab 2. Konvergensi Variabel Random
47
√
n(X n −
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
15. Misal Y1 , ..., Yn dan X1 , ..., Xn dua sampel random yang independen dengan mean µ1 dan µ2 dan variansi bersama σ 2 . Tentukan limit distribusi dari (Y n − X n ) − (µ1 − µ2 ) q (2.42) σ n2 (Petunjuk : misalkan Z n =
n X
Zi /n dengan Zi = Yi - Xi
i=1
16. Diketahui Xn berdistribusi gamma dengan parameter α = n dan β, dengan β bukan fungsi dari n. Jika Yn = Xn /n, tentukan limit distribusi dari Yn .
Statistika Matematis II/ Edisi E-book
23. Diketahui Y ∼ B(72, 1/3). Hitung P (22 ≤ Y ≤ 28) 24. Diketahui X adalah mean sampel random ( berukuran 15 dari dis3x2 ; 0 < x < 1 tribusi yang mempunyai fkp f (x) = Tentukan 0, yang lain P (3/5 < X < 4/5) 25. Diketahui Y ∼ B(n; 0, 55). Tentukan nilai n terkecil sehingga P (Y /n > 1/2) ≥ 0, 95.
17. Diketahui Zn berdistribusi χ2 (n) dan Wn = Zn /n2 . Tentukan limit distribusi dari Wn . 18. Misalkan Z berdistribusi χ2 (50). Tentukan P (40 < x < 60) 19. Misalkan P = 0, 95 probabilitas bahwa seorang laki-laki dalam suatu grup hidup paling sedikit 5 tahun. Jika kita observasi 60 orang lakilaki dan jika diasumsikan independen, tentukan probabilitas bahwa paling sedikit 56 dari mereka hidup 5 tahun atau lebih. 20. Diketahui variabel random Zn mempunyai distribusi poisson dengan parameter µ = n. Perlihatkan bahwa limit distribusi dari vari√ abel random Yn = (Zn − n)/ n ∼ N(0, 1) 21. Diketahui X n mean dari sampel random berukuran n dari distribusi poisson dengan parameter µ = 1. (a) Buktikan bahwa fungsi pembangit moment dari Yn = √ √ √ µ)/σ = n(X n − 1) adalah exp −t n + n(et/ n − 1)
√
n(X n −
√
(b) Ekspansikan et/ n kedalam deret Maclaurin, kemudian tentukan limit distribusi dari Yn 22. Diketahui X mean sampel random berukuran 100 dari distribusi χ2 (50). Hitunglah P (49 < X < 51) Bab 2. Konvergensi Variabel Random
48
ISBN 978-602-8310-02-4
Bab 2. Konvergensi Variabel Random
49
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Bab 3 Estimasi Titik 3.1 Standar Kompetensi Memahami konsep dasar estimasi titik dan mampu menerapkannya, baik dalam pemecahan masalah matematika, ilmu lain maupun dalam kehidupan sehari-hari
3.2 Indikator Hasil Belajar Setelah mengerjakan bab ini mahasiswa diharapkan dapat: 1. Menjelaskan azas reduksi data dalam distribusi sampling 2. Menganalisis apakah suatu statistik merupakan statistik cukup 3. Menjelaskan prinsip dasar estimasi titik 4. Menentukan sifat-sifat estimator titik 5. Menggunakan ketaksamaan Cramer-Rao untuk menentukan estimator dengan varian minimum uniform (UMVUE) 6. Menentukan estimator suatu parameter dengan metode momen Bab 2. Konvergensi Variabel Random
50
ISBN 978-602-8310-02-4
51
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
7. Menentukan estimator suatu parameter dengan metode likelihood maksimum
T (x) adalah statistik cukup untuk θ, jika setiap inferensi tentang θ hanya tergantung pada sampel x, yaitu hanya melalui harga T (x). Artinya jika x dan y adalah dua titik sampel sedemikian hingga T (x) = T (y), maka inferensi tentang θ harus sama, tidak tergantung apakah X = x atau Y = y yang terobservasi.
3.3 Uraian Materi 3.3.1 Prinsip Reduksi Data Seperti dijelaskan pada bab sebelumnya, informasi dalam sampel x1 , ..., xn akan digunakan untuk melakukan inferensi tentang parameter θ. Namun pada umumnya data-data yang terobservasi dari sampel x1, x2 , ..., xn adalah daftar bilangan yang sulit untuk diinterpretasikan secara lengkap. Dengan kata lain, interpretasi data secara realistik biasanya dilakukan dengan prinsip reduksi. Masalahnya adalah seberapa jauh reduksi itu valid, sehingga tetap menghasilkan inferensi yang akurat terhadap nilai
T eorema Bila f (x | θ) adalah densitas dari x dan q(t | θ) adalah densitas dari T (x), maka T (x) adalah statistik cukup untuk θ jhj untuk setiap x dalam ruang sampel, rasio f (x | θ)/q(T (x) | θ) tidak tergantung pada θ. Catatan : Pθ (X = x dan T (x) = t(x)) Pθ (T (x) = t(x)) Pθ (X = x dan T (x) = t(x)) = Pθ (T (x) = t(x))
parameter-parameter populasi.
Pθ (X = x|T (X) = t(x)) =
Misalnya fungsi terukur T (x) adalah statistik yang mendefinisikan bentuk reduksi data, artinya dalam melakukan inferensi yang digunakan hanya T (x), bukan keseluruhan sampel terobservasi x. Dua data sampel x dan y akan diperlakukan sama asalkan T (x) = T (y).
=
Pθ (X = x) Pθ (T (X) = t(x)
=
f (x | θ) q(T (x))
3.3.1.1 Azas Kecukupan
(3.1)
Azas kecukupan (the sufficiency principle) menyatakan bahwa statistik cukup (A suffcient statistic) untuk parameter θ adalah statistik yang bisa menyerap sejumlah informasi tentang θ yang termuat dalam sampel. Setiap informasi tambahan dalam sampel, di samping harga statistik cukup, tidak memuat informasi tambahan tentang θ. Pertimbangan-pertimbangan di atas akan membawa pada teknik reduksi data yang dikenal sebagai azas kecukupan. Def inisi Bab 3. Estimasi Titik
Contoh
Misalkan Xi , ..., Xn adalah variabel random i.i.d berdistribusi Bernoulli dengan parameter θ, 0 < θ < 1. Akan ditunjukkan bahwa T (X) = Xi + ... + Xn adalah statistik cukup untuk θ. Perhatikan bahwa T (X) merupakan jumlah harga-harga Xi sedemikian sehingga T (X) mempunyai ditribusi Binomial (n, θ), sehingga:
52
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
53
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book f (x(θ)) = q(T (x)(θ)0 =
Q n xi X θ (1 − θ)1−xi ni , (t = xi ) t n−t t θ (1-θ) θ
P
P
xi
(1−xi )
(1 − θ) n ,( t θ t (1 − θ) n−t
θ t (1 − θ)n−t = n t θ t (1-θ) n−t
n Y
(3.2)
θ xi = θ
i
P
Pn exp −( (xi −x)2 + n(x − µ)2 ) / 2τ 2 f (x | θ) = (3.4) q(T (x) | θ) (2πτ 2 / n ) − 1/2 exp(− n (x − µ)2 /(2τ 2 )) n X = n−1/2 (2πτ 2 )−(n−1) / 2 exp(− (xi − x)2 /2τ 2 ) ( 2πτ 2 )
xi
)
n/2
i=1
1 = n t =
Statistika Matematis II/ Edisi E-book
yang tidak tergantung pada µ. Dengan menggunakan teorema sebelumnya, maka mean sampel adalah statistik cukup untuk µ.
1 Pn xi
Dengan menggunakan definisi, pertama-tama kita harus menduga mana statistik T (x) yang merupakan statistik cukup, kemudian menentukan
Karena rasio di atas tidak tergantung pada θ, maka T (x)adalah statistik cukup untuk θ.
densitas dari T (x) dan menyelidiki apakah rasio densitas x dan densitas T (x) tidak memuat θ. Cara tersebut memang kurang praktis.
Contoh 3.3.1.2 Teorema Halmos & Savage 2
2
Misalkan Xi , ..., Xn adalah i.i.d. ∽ N(µ, τ ) dengan τ diketahui adalah −
statistik cukup untuk µ. Tunjukkan bahwa mean sampel, T (x)= X n adalah statistik cukup untuk µ. = x1 +...+x n
f (x
n
µ) =πi=1 (2πτ 2 )−1/2 exp(−(xi − µ)2 /2τ 2 ) n X (xi − µ)2 /2τ 2 ) = (2πτ 2 )−n/2 exp(− |
= (2πτ 2 )−n/2 exp(−
i=1
2 −n/2
= (2πτ )
exp(−
n X i=1
2
(3.5)
Misalkan T (X) adalah statistik cukup. Pilih g (t(θ)) = P0 (T (x) = t) dan 2
(xi − x) + n(x − µ) /2τ )
Karena X ∼ N(µ, τ 2 /n), maka: Bab 3. Estimasi Titik
f (x|θ) = g (T (x)|θ) h(x)) Bukti :
(xi − x + x − µ)2 /2τ 2 ) 2
tistik cukup untuk θ jhj terdapat fungsi g(t|θ) dan h(x) sedemikian hingga untuk semua titik sampel x dan semua parameter θ berlaku;
(3.3)
i=1
n X
Misalkan f (x|θ) adalah densitas bersama dari sampel X. T (X)adalah sta-
h(x) = P (X = x|T (X) = T (x)) . Karena T (X) statistik cukup, maka distribusi probabilitas yang mendefinisikan h(x) tidak tergantung pada θ. Jadi, pemilihan h(x)dan g((t(x)) dapat dibenarkan dan untuk pemilihan ini di dapat
54
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
55
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
f (x|θ) = Pθ (X − x)
(3.6)
= P0 (X = x dan T (X) = T (x)) = P0 (T (X) = T (x)) P (X = x|T (X) = T (x))
Statistika Matematis II/ Edisi E-book
f (x | µ) = (2πτ 2 )−n/2 exp −
n X i=1
(xi − x)2 /2τ 2
!
exp −n(x − µ)2 /2τ 2
(3.9)
Kita dapat mendefinisikan:
= g (T (x)|θ) h(x)
2 −n/2
h(x) = (2πτ )
Sekarang andaikan faktorisasi di atas berlaku. Misalkan q(t|θ) adalah densitas dari T (x). Untuk menunjukkan bahwa T (X) merupakan statistik cukup, kita selidiki rasio f (x|θ) /q (T (x)|θ)
exp −
n X i=1
2
(xi − x) /2τ
2
!
(3.10)
dan bentuk ini tidak tergantung pada parameter µ. Faktorisasi di atas yang memuat µ tergantung pada sampel x hanya melalui T (X) = X. Sehingga didapat
Definisikan
AT (x) = {Y : T (Y ) = T (x)}
(3.7) g(t | µ) = exp −n(t − µ)2 /2τ 2
maka
dan perhatikan bahwa f (x|θ) g (T (x)|θ) h(x) = q (T (x)|θ) q (T (x)|θ) g (T (x)|θ) h(x) = P (def inisi densitas dari T ) AT (x) g (T (Y )|θ) h(y) =
(3.8)
g (T (x)|θ) h(x) P (karena T konstan padaAT (x) ) g (T (x)|θ) AT (x) h(y)
h(x) = P AT (x) h(y)
Karena rasio ini tidak tergantung pada θ, maka T (X) adalah statistik cukup untuk θ.
f (x | µ) = h(x)g (T (x) | µ)
(3.11)
(3.12)
Jadi, dengan menggunakan teorema Faktorisasi; T (X) = x adalah statistik cukup untuk µ. Dalam contoh-contoh di atas, statistik cukup adalah suatu fungsi berharga real dari sampel. Semua informasi tentang θ dalam sampel disarikan dalm satu bilangan T (X). Kadang-kadang informasi tidak dapat disarikan dalam satu bilangan dan sebagai penggantinya diperlukan beberapa bilangan. Untuk keadaan ini, statistik cukup berupa vektor, katakanlah − − − T (X ) = T1 (x), ..., Tn (x) . Keadaan ini sering terjadi bila parameter juga −
merupakan vektor, katakanlah θ = (θ1 , ..., θs ); biasanya r = s, walaupun tidak selalu teorema faktorisasi juga dapat digunakan untuk menentukan
Contoh
statistik cukup bernilai vektor. Untuk distribusi normal dalam contoh di atas, dapat dilihat bahwa densiContoh
tas dapat difaktorkan sebagai: Bab 3. Estimasi Titik
56
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
57
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Andaikan kembali bahwa x1 , x2 , ..., xn . adalah i.i.d ∽ N(µ, τ ) tetapi tidak seperti contoh di muka. Misalkan µ dan τ 2 kedua-duanya tidak −
diketahui, sehingga vektor parameter adalah θ = (µ, τ 2 ). Sekarang, bila menggunakan Teorema Faktorisasi, setiap bagian densitas yang
Statistika Matematis II/ Edisi E-book
Contoh Misalkan x1 , x2 , ..., xn . adalah i.i.d dengan densitas f (x|θ). Andaikan f (x|θ) adalah keluarga eksponensial dengan densitas
tergantung pada µ dan τ 2 harus dimasukkan dalam fungsi g. Terlihat − bahwa densitas tergantung pada sampel x hanya melalui
f (x|θ) = h(x)c(θ) exp
k X
Wi (θ) ti (x)
i=1
−
_
T1 (x) =X
(3.13)
−
T (X ) =
n X
t (Xj )...
i=1
−
(3.14)
(3.18)
Maka
dan
T2 (x) = s2 n X − = (xi − X )2 /(n − 1)
!
1
n X i=1
t (Xj ) k
!
(3.19)
adalah statistik cukup untuk θ.
3.3.2 Estimasi Titik
−
Jadi, kemudian dapat mendefinisikan h(x) = 1 dan
Kuantitas-kuantitas pada populasi, seperti mean (µ) atau varian (σ 2 ) yang umumnya tak diketahui. Kuantitas tersebut disebut dengan parame-
g(t|θ) = g(t1 , t2 |µ, τ 2 )
(3.15) 2 −n/2 2 2 = (2πτ ) exp − n(t1 − µ) + (n − 1)t2 / 2t
maka, dapat dilihat bahwa − − − − f (x| µ, τ 2 ) = g T 1 (X ), T 2 (X )|µ, τ 2 h(X )
(3.16)
Jadi, dengan menggunakan Teorema Faktorisasi,
ter populasi. Karakteristik (distribusi) suatu populasi tergantung pada parameter-parameter ini. Misalnya, distribusi Exponensial P (λ) tergatung pada parameter λ, distribusi Normal N(µ, σ 2 ) tergantung pada 2 parameter mean µ dan variansi σ 2 dan distribusi Binomial B(n, p) tergantung pada 2 parameter banyak percobaan n dan peluang sukses dala tiap percobaan p. Secara umum lambang θ digunakan sebagai lambang parameter populasi, sehingga distribusinya dapat tulis f (x; θ); θ ∈ Ω. Dalam hal ini himpunan Ω disebut ruang parameter dan {f (x; θ); θ ∈ Ω} disebut keluarga parametrik.
(3.17)
Jika pada populasi digunakan istilah parameter, maka pada sampel digunakan istilah statistik. Statistik didefinisikan sebagai kuantitas-kuantitas
Untuk keluarga eksponensial, dengan menggunakan Teorema Fak-
pada sampel. Contohnya; Xn dan Sn2 masing-masing merupakan statistik atau kuantitas (mean dan varian) dari sampel yang berukuran n yang mungkin diambil dari populasi berdistribusi f (x; θ) dengan θ tidak dike-
torisasi, penentuan statistik cukup sangat mudah untuk dilakukan.
tahui.
−
T (X ) =
− − − T 1 (X ), T 2 (X ) = (X , S 2 )
adalah statistik cukup untuk (µ, τ 2 ) dalam distribusi normal.
Bab 3. Estimasi Titik
58
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
59
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Dalam contoh ini, untuk mengestimasi parameter θ, diambil sampel random X1 , ..., Xn . Fungsi T = T (X1 , ..., Xn ) disebut statistik. Statistik T yang b digunakan untuk mengestimasi θ disebut estimator dari θ dan ditulis θ. Estimator θb adalah suatu variabel random yang mempunyai fungsi proba-
Karena E(X) = nθ, maka E(X/n) = 1/nE(X) = 1/n.nθ = θ. Jadi θb = X/n adalah estimator tak bias untukθ Contoh
bilitas tertentu yang disebut distribusi sampling.
Jika S 2 =
1 n−1
n X i=1
(Xi − X)2 adalah varian sampel random dari populasi
Contoh
N(µ, σ 2 ), tunjukkan bahwa E(S 2 ) = σ 2
Misal X1 , ..., Xn sampel random yang diambil dari populasi b(1, p) dengan P p tidak diketahui. Maka X = n1 ni=1 Xi adalah estimator untup p. Estima-
Bukti "
# n 1 X (Xi − X)2 n − 1 i=1 " n # X 2 1 = E (Xi − µ) − (X − µ) n−1 " ni=1 # X 1 E (Xi − µ)2 − nE(X − µ)2 = n − 1 i=1 # " n X 1 σ 2 − n.σ 2 /n = σ 2 = n − 1 i=1
tor yang lain misalnya T = 1/3, T = X1 , dan T = (X1 + X2 )/2.
E(S 2 ) = E
Perlu diperhatikan bahwa beberapa statistik dapat digunakan sebagai estimator terhadap suatu parameter. Dari sini mucul masalah: Statistik mana yang paling baik, atau misalnya statistik mana yang tak bias, efisien, dan konsisten? Ada beberapa jenis estimator penting berdasarkan sifat-sifatnya yang akan dibahas pada bagian ini, yaitu estimator tak bias, estimator konsisten, estimator esfisien, dan estimator minimum
3.3.2.1 Estimator Tak Bias
Jadi θˆ2 = S 2 adalah estimator tak bias untuk σ 2
Def inisi
Contoh
b = θ, untuk Suatu statistik θb disebut estimator tak bias untuk θ, jika E(θ) b 6= θ, maka θb disebut estimator bias. setiap θ ∈ Ω. Jika E(θ) Contoh
Jika X berdistribusi B(n, θ), tunjukkan bahwa X/n adalah estimator tak bias untuk θ!
Bab 3. Estimasi Titik
Misal X1 , ..., Xn berdistribusi i.i.d uniform U(0, θ). Kita ingin menentukan estimator untuk θ dengan statistik maksimum. Jadi T = maks( b Terlebih dahulu kita tentukan distribusi dari T. X1 , ..., Xn ) = Xmax = θ. 1 U(0, θ) ⇒ f (x, θ) = ; 0 < x < θ θ
P (T ≤ t) = P (Xmax ≤ t) = P (X1 ≤ t, X2 ≤ t, ..., Xn ≤ t)
60
ISBN 978-602-8310-02-4
(3.21) (3.22)
Karena X1 , ..., Xn independen maka P (T ≤ t) = P (X1 ≤ t) P (X2 ≤ t) ...P (Xn ≤ t)
Jawab
(3.20)
Bab 3. Estimasi Titik
61
(3.23)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book Karena identik maka G(t) = [F (t)]n dengan G(.) dan F (.) berturut-turut fungsi distribusi dari T dan X. Jadi g(t) =
dG(t) = n [F (t)]n−1 .f (t) dt
ntn−1 ;0 < t < θ θn
P {|Tn − θ| ≥ ε} ≤
E(Tn − θ)2 ε2
(3.28)
maka E(Tn − θ)2 → 0 adalah syarat cukup suatu estimator konsisten. Akibat definisi tadi, bila estimator dari θ yang memenuhi (3.25)
1. Tn estimator tak bias 2. V ar(Tn ) → 0
Sekarang kita tentukan
E(T ) =
Zθ
maka Tn adalah estimator konsisten tg(t)dt
(3.26)
0
=
Zθ
0
Contoh n ntn−1 θ t n = θ n+1
Karena E(T ) = 6 θ maka T adalah estimator bias. Tetapi jika dipilih T1 = n+1 X maka T1 adalah estimator tak bias untuk θ, sebab E(T1 ) = max n n+1 n θ n n+1
gen dalam probabilitas. Karena menurut ketaksamaan Chebyshev
(3.24)
Dari f (x, θ) = θ1 ; 0 < x < θ diperoleh F (x) = xθ , 0 < x < θ sehingga g(t) = n [t/θ]n−1 .1/θ =
Statistika Matematis II/ Edisi E-book
=θ
Diketahui X1 , ..., Xn berdistribusi i.i.d N(θ, 1). Perlihatkan bahwa X n adalah barisan estimator konsisten. Bukti 1. E(X n ) = 1/n.nθ = θ. Jadi X n estimator tak bias untuk θ 2. V ar(X n ) = 1/n → 0. Menurut akibat definisi di depan, maka X n estimator konsisten.
3.3.2.2 Estimator Konsisten Sejauh ini estimator yang dibicarakan hanya untuk sampel berhingga. Se-
3.3.2.3 Estimator Efisien
baliknya konsistensi adalah sifat asimptotis, yaitu menggambarkan sifat estimator bila ukuran sampel menjadi tak hingga. Konsistensi adalah sifat dari barisan estimator bukan dari estimator tunggal.
Berikut ini kita akan membandingkan dua estimator berdasarkan variansi dari estimator tersebut.
Barisan estimator Tn = Tn (X1 , ..., Xn ) disebut estimator konsisten dari θ
Def inisi
jika untuk setiap ε > 0 P {|Tn − θ| ≥ ε} → 0
(3.27)
Definisi di atas menyatakan bahwa estimator konsisten pasti juga konverBab 3. Estimasi Titik
62
ISBN 978-602-8310-02-4
Misalkan θb1 dan θb2 dua estimator tak bias untuk parameter θ. Estimator θb1 dikatakan lebih efisien daripada θb2 jika Bab 3. Estimasi Titik
V ar(θb1 ) < V ar(θb2 ) 63
(3.29)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Contoh
Statistika Matematis II/ Edisi E-book
dan E(T22 ) = n+1 Xmax n
Perhatikan kembali contoh T1 = maka T1 adalah estimator tak bias untuk θ. Dengan transformasi variabel diperoleh distribusi T1 g(t1) =
n+1 nn+1 tn−1 ; 0 < t1 < θ (n + 1)n θn 1 n
(3.30)
Selanjutnya akan dicari V ar(T1 )
E(T12 )
Zb
V ar(T2 ) = nampaklah bahwa V ar(T1 )= lebih efisien daripada T2 .
2(n + 1)θ2 n+2
(3.36)
2(n + 1)θ2 nθ2 − θ2 = n+2 n+2
θ2 n(n+2)
<
nθ 2 n+2
(3.37)
= V ar(T2 ), untuk n > 1. Jadi T1
3.3.2.4 Estimator Bayes
nn+1 n+1 = tn−1 dt1 , dengan b = θ (n + 1)n θn 1 n 0 (n + 1)2 θ2 = n(n + 2) t21
(3.31)
Pendekatan Bayesian dalam statistik secara fundamental berbeda dengan pendekatan klasik seperti yang telah kita bicarakan di muka. Meskipun demikian, beberapa aspek dari pendekatan Bayesian dapat berguna pada beberapa pendekatan statistik yang lain. Sebelum masuk pada metode pencarian estimator Bayes, kita bicarakan dahulu pendekatan Bayesian pada statistika.
V ar(T1 ) = E(T12 ) − {E(T1 )}2 (n + 1)2 θ2 = − θ2 n(n + 2) θ2 = n(n + 2)
(3.32)
berindeks θ dan berdasarkan harga-harga terobservasi dalam sampel, didapat pengetahuan tentang θ.
Kita dapat mencari estimator tak bias yang lain dengan menggunakan statistik minimum, namakan W = Xmin . Distribusi W sbb: g(w) = dan E(w) =
Zθ
0
n w (1 − )n−1 ; 0 < w < θ θ θ
(3.33)
w θ n w (1 − )n−1 dw = θ θ n+1
(3.34)
Jika dipilih T2 = (n + 1)Xmin sebagai estimator untuk θ maka T2 adalah estimator tak bias untuk θ. Sehingga diperoleh distribusi T2 g(t2 ) = Bab 3. Estimasi Titik
n t2 (1 − )n−1 ; 0 < t2 < (n + 1)θ (n + 1)θ (n + 1)θ 64
Dalam pendekatan klasik, parameter θ adalah kuantitas atau besaran tetap yang tidak diketahui. Sampel random x1 , ..., xn diambil dari populasi
Dalam pendekatan Bayesian, θ dipandang sebagai besaran yang variasinya digambarkan dengan distribusi probabilitas (disebut distribusi prior). Ini adalah distribusi subyektif berdasarkan pada keyakinan seseorang dan dirumuskan sebelum data diambil. Kemudian sampel diambil dari populasi berindeks θ dan distribusi prior disesuaikan dengan informasi sampel ini. Prior yang telah disesuaikan disebut distribusi posterior. Penyesuaian ini dilakukan dengan menggunakan aturan Bayes, karena itu dinamakan statistik Bayesian. Bila distribusi prior dinyatakan dengan π(θ) dan distribusi sampling dengan f (x | θ), maka distribusi posterior, yaitu distribusi bersyarat θ diberikan x adalah
π(θ | x) =
(3.35)
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
f (x | θ) π(θ) m(x) 65
(3.38) ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Perhatikan bahwa f (x,θ) = f (x | θ) π(θ) dimana m(x) adalah distribusi R marginal dari x yaitu m(x) = f (x | θ)π(θ)dθ
Jadi distribusi posterior adalah distribusi bersyarat, yaitu bersyarat terhadap observasi sampel. Sekarang distribusi posterior digunakan untuk memberi pernyataan tentang θ, yang dipandang sebagai besaran random. Sebagai contoh, mean distribusi posterior dapat digunakan sebagai titik estimator dari θ. Contoh
Statistika Matematis II/ Edisi E-book
Def inisi Misalkan F adalah kelas densitas f (x | θ). Kelas π dari distribusi prior disebut keluarga konjugat untuk F , bila distribusi posterior berada dalam kelas π untuk semua f ∈ F,semua prior dalam π, dan semua x ∈ χ. Contoh Jika X ∽ N(θ, τ 2 ) dan misalkan distribusi prior dari X adalah N(µ, τ 2 ). Distribusi posterior dari θ juga normal dengan mean dan variansi
P Misalkan X1 , ..., Xn adalah distribusi Bernoulli (1, p), maka Y = Xi adalah Binomial (n, p). Kita andaikan bahwa distribusi prior dari p adalah
µ = E(θ | x) =
τ2 σ2 x+ 2 τ 2 + σ2 σ + τ2
(3.41)
σ2 τ 2 + τ2
(3.42)
Beta (α, β). Distribusi bersama dari Y dan p adalah n y
f (Y, p) = [
=
!
p (1 − p)
n y
!
Y
n−Y
P (α + β) α−1 ][ p (1 − p)β−1 ] P (α)P (β)
V ar(x | θ) = (3.39)
P (α + β) Y +α−1 p (1 − p)n−Y +β−1 P (α)P (β)
Z
1
n
f (Y, p)dp =
y
0
!
3.3.3 Metode Evaluasi Estimator Titik Metode-metode yang dibicarakan dalam bab sebelumnya telah memberikan gambaran teknik yang masuk akal dalam menentukan estimator titik untuk suatu parameter. Karena kita biasanya dapat menerapkan lebih dari satu metode dalam suatu persoalan tertentu, maka kita dihadapkan pada persoalan memilih diantaranya. Memang metode yang berbeda bisa
Densitas marginal dari Y adalah
f (Y ) =
σ2
P (α + β) P (Y + α) P (n − Y + β) (3.40) P (α)P (β) P (n + α + β)
menghasilkan estimator yang sama (jika demikian, maka tugas kita sangat mudah), tetapi pada umumnya metode yang berbeda juga akan menghasilkan estimator yang berbeda.
Sehingga π(p | Y ) =
f (Y,p) f (Y )
=
P (α+β) P (n+α+β) P (α+α) P (n−α+β)
p
Y +α−1
(1 − p)
n−Y +β−1
Yang merupakan distribusi Beta (Y +α, n−y +β). Estimator alami untuk p adalah mean dari distribusi posterior, dan ini memberikan estimator Bayes a
untuk p adalah p = β =
Y +α α+β+n
Dalam bab ini akan diperkenalkan konsep dasar untuk mengevaluasi estimator dan menyelidiki kelakuan beberapa estimator terhadap kriteria ini. 3.3.3.1 Galat Kwadrat Rata-Rata
Bila kita mengestimasi parameter Binomial, kita tidak perlu memiliki distribusi prior dari keluarga beta. Tetapi, terdapat keuntungan dalam memilih keluarga beta, paling tidak kita mempunyai closed-form dari estimator. Secara umum, untuk sembarang distribusi sampling terdapat keluarga
Ukuran kualitas estimator yang paling umum adalah galat kuadrat ratarata atau Mean Square Error (MSE). MSE merupakan jumlah Variansi dan Biasnya
distribusi prior alami yang disebut keluarga konjugat.
Def inisi
Bab 3. Estimasi Titik
66
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
67
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
_
Galat kuadrat rata-rata (MSE) dari estimator T (x) terhadap parameter θ _ 2 adalah fungsi θ yang didefinisikan dengan Eθ (T (x) − θ) . Dengan mudah dapat kita lihat bahwa: _
2
Eθ (T (x) − θ) = V arT (x) + (Bias(T (x))2
a2
Dengan mudah dapat dilihat bahwa E(σ ) = E( n−1 s2 ) = n a2
a2
sehingga σ adalah estimator yang bias untuk σ 2 . Variansi σ dapat dihitung sebagai
(3.43)
a2
V ar σ = V ar(
_
_
n−1 2 s n
dengan Bias T (x) = Eθ T (x) − θ.
n−1 2 2(n − 1) 4 n−1 2 s )=( ) V ar(s2 ) = σ n n n2
a
Jadi MSE mempunyai dua komponen, variansi yang menguji variabelitas (precision) estimator dan bias mengukur (accuracy) dari estimator. Jadi untuk estimator tak bias kita mempunyai MSE = Eθ (T (x) − θ)2 =
Karena itu, MSE (σ 2 ) adalah a2
E(σ −σ 2 ) =
_
V ar T (x) . Contoh
2n − 1 4 n−1 2 2(n − 1)σ 4 +( σ − σ 2 )2 = ( )σ n2 n n2
Jadi kita mempunyai
_
Misalkan X1 , ..., Xn adalah i, i, d N(µ, σ 2 ). X dan S2 kedua-duanya adalah _ estimator tak bias untuk µ dan σ 2 , karena E(X ) = µ dan E(S 2 ) = σ 2 . MSE dari kedua estimator adalah
a2
E(σ −σ 2 ) = (
2 2n − 1 4 )σ < ( )σ 4 = E(s2 − σ 2 )2 . n2 n−1 a2
_
_
E(X −µ)2 = V ar(X ) =
Yang menunjukkan bahwa σ mempunyai MSE yang lebih kecil dari S 2 . Jadi dengan mengadakan timbal balik antara variansi dan bias, MSE dapat
σ2 n
(3.44)
diperbaiki. Catatan
2σ 4 E(s − σ ) = V arS = n−1 Banyak estimator tak bias yang masuk akal jika dilihat dari MSE-nya. Namun perlu ditekankan bahwa pengontrolan bias tidak otomatis pengon2
2 2
2
trolan MSE. Pada khususnya sering terjadi timbal balik antara varansi dan bias, sedemikian hingga sedikit kenaikan bias dapat ditukarkan dengan penurunan yang lebih besar pada variansi, yang hasilnya adalah perbaikan pada MSE. Contoh Estimator alternatif untuk σ 2 adalah estimator maksimum likelihood a2
σ = Bab 3. Estimasi Titik
n n−1 2 1 X _ s (xi − x)2 = n n
68
ISBN 978-602-8310-02-4
Hasil di atas tidak berarti bahwa S 2 tidak dapat dijadikan sebagai estimaa2
tor dari σ 2 . Hal di atas hanya mengatakan bahwa secara rata-rata σ lebih dekat ke σ 2 dibandingkan dengan σ bila MSE digunakan sebagai ukuran kebaikan. Pada umumnya, karena MSE adalah fungsi dari parameter, maka tidak ada estimator ”terbaik” untuk θ. Yang sering kita lihat adalah MSE dari dua estimator saling berpotongan, yang berarti kebaikan dari estimator hanya bersifat lokal. Salah satu cara untuk mengatasi tidak adanya estimator ”terbaik” adalah melalui pembatasan kelas estimator. Salah satu pembatasan yang kita bicarakan adalah melalui kelas tak bias. Misalkan kita ingin mengestimasi g(θ). Dalam hal ini kita hanya membatasi kelas estimator. CT = {T : ET = g(θ)} Bab 3. Estimasi Titik
69
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Untuk setiap T1 , T2 ∈ CT , Bias T1 =Bias T2 sehingga
Statistika Matematis II/ Edisi E-book
Contoh ini menunjukkan bahwa untuk menentukan UMVUE diperlukan penanganan yang menyeluruh. Salah satunya adalah dengan menentukan batas-bawah variansi estimator yang mungkin. Batas bawah variansi
MSE(T1 ) − MSE(T2 ) = V arT1 − V arT2 . Ini berarti bahwa, dalam kelas CT , perbandingan MSE sama dengan perbandingan Variansi.
3.3.3.2 Estimator Terbaik Tujuan dari bagian ini adalah menyelidiki metode penentuan estimator tak
ini dikenal dengan nama batas bawah Cramer-Rao atau Cramer-Rao lower bound disingkat CRLB sbb: Misalkan dalam melakukan estimasi g(θ) dari densitas f (x| θ) kita dapat menentukan batas bawah, variansi dari setiap estimator tak bias, katakanlah B(θ). Bila kemudian kita dapat menemukan estimator tak bias T ∗ sedemikian hinggaV ar(T ∗) = B(θ) maka berarti kita mendapatkan UMVUE estimator.
bias ”terbaik” yang akan definisikan kemudian. Estimator terbaik menurut pandangan klasik adalah estimator dengan variansi minimum dalam kelas (himpunan) estimator tak bias untuk parameter tersebut. Sifat efisiensi estimator hanya membandingkan dua estimator tak bias, akibatnya estimator yang lebih efisien belum tentu merupakan estimator terbaik. Def inisi Misalkan T ∗ merupakan estimator tak bias untuk g(θ) atau E(T ∗) = g(θ).
3.3.3.3 Teorema Batas Bawah Cramer-Rao Misalkan X1 Xn , ..., Xn adalah sampel dengan densitas f (x| θ) dan misal_ _ kan T (X ) = T (X1 , ..., Xn ) adalah sebarang estimator dengan E(T (X )) terdeferensialkan dalam θ. Andaikan densitas bersama f (x| θ) = f (x1 , ..., xn | θ) menentukan:
Jika untuk setiap estimator T yang memenuhi E(T ) = g(θ) berlaku V ar(T ∗) ≤ V ar(T ) untuk setiap θ maka T ∗disebut estimator tak bias terbaik (memiliki variansi minimum). Karena itu estimator terbaik ini disebut
dengan dengan estimator tak bias yang memiliki variansi minimum seragam atau uniformly minimum variance unbiased estimator disingkat UMVUE.
d dθ
Z
...
Z
_
_
_
h(x)f (x| θ)d x= _
Z
...
Z
_
h(x)
∂ _ _ f (x| θ)d x ∂θ
(3.45)
_
untuk setiap fungsi h(x) dengan E | h(x) | < θ. Maka
Menentukan estimator tak bias terbaik (bila ada) bukan pekerjaan yang
d
_
V ar (T (x)) ≥
mudah karena berbagai alasan dan salah satunya adalah sebagai berikut. Contoh
Eθ
dθ
_
Eθ T (x) _
∂ log f (x | θ ) ∂θ
2
(3.46)
Misalkan X1 , X2 ..., Xn adalah iid Poisson(λ). Jika x dan s2 masing-masing
Bukti
adalah mean dan variansinya maka dengan mudah dapat dicari: E(X) = λ dan E(S 2 ) = λ yang kedua-duanya merupakan estimator tak bias untuk
Bukti teorema ini sederhana tetapi cantik, dan merupakan pemakaian yang cerdik dari ketaksamaan Cauchy-Schwarz. Untuk sebarang dua va-
λ. Di sini kita tak cukup membandingkan V ar(X) dan V ar(S 2 ) saja. Ka_ _ rena untuk setiap konstanta a berlaku T (X ,S 2 ) =aX +(1 − a)S 2 adalah estimator tak bias untuk λ. Jadi dalam hal ini ada tak terhingga estimator
riabel random X dan Y berlaku
_
_
_
[Covar(X, Y )]2 ≤ (Var X) (Var Y )
tak bias. Bab 3. Estimasi Titik
70
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
71
(3.47)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Bila kita menyusun kembali 3.47, kita akan mendapatkan batas bawah dari variansi X, [Covar(X, Y )] Var Y
V arX ≥
_
Kelebihan teorema ini terletak pada pemilihan X dengan estimator T (X ) _
dan Y sama dengan besaran:
_
Eθ
_
∂ log f (x| θ) ∂θ
∂ log f (x|θ) . ∂θ
=
Z Z
=
=
...
Z
_
∂ f (x|θ) ∂θ _
= Eθ
f (x| θ)
!
(sif at log)
V ar
_
∂ f (x|θ) ∂θ _
_
f (x| θ)
Z
∂ f (x| θ) dx ∂θ
=
d dθ
Z
...
Z
...
∂ f (x| θ) _ _ d x (coretf (x| θ)) ∂θ
d dθ
Z
...
_
∂ log f (x| θ) ∂θ
_
_
_
...
_
_
_
_
_
T (X )f (x| θ)d x
=E
_
∂ log f (x| θ) ∂θ
2 !
V ar T (X ) ≥ qed1 .
_
f (x| θ)d x (sif at3.1)
_
d
E
dθ
ET (X ) _
2
∂ log f (x|θ) ∂θ
2
Untuk kasus sampel independen perhitungan batas bawah menjadi lebih sederhana. Perhitungan dalam penyebut menjadi perhitungan variabel random univariat, seperti yang ditunjukkan dalam corollary berikut ini.
d = 1 dθ
Akibat Cramer - Rao
=0
_
_
Misalkan X1 , ..., Xn adalah iid dengan densitas f(x| θ), misalkan T (X) = _
Karena itu _ _ _ ∂ log f (x| θ) _ ∂ log f (x| θ) = E T (X ). Cov T (X ). ∂θ ∂θ "
_
_
= E T (X ) Bab 3. Estimasi Titik
(3.49)
karena itu
_
f (x| θ)d x (def inisi)
Z
Z
Z
d = E(T (X) dθ _ ∂ log f (x|θ) Juga, karena E = 0 didapat ∂θ
∂ log f (x|θ) ∂θ
Pertama-tama kita harga harap:
=
∂ f (x|θ) ∂θ _
f (x| θ) 72
T (x1 , ..., xn ) sembarang estimator dari g(θ) dengan E(T (X )) fungsi θ yang _ terdeferensialkan. Bila densitas bersama f(x| θ) = πf (xi | θ) memenuhi (3.1), maka (3.48)
#
_ V ar T (X ) ≥ 1
ISBN 978-602-8310-02-4
d
nE
dθ
terbukti (qed = Qound Eart Demonstrandum)
Bab 3. Estimasi Titik
73
_
ET (X ) _
2
∂ log f (x|θ) ∂θ
2
(3.50)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Bukti
Untuk sembarang fungsi terdeferensialkan g(θ) sekarang kita mempunyai _ _ batas bawah pada variansi sebaran estimator T (X ) yang memenuhi ET (X _ ) = g(θ). Batas bawah tergantung pada g(θ) dan f (x| θ) dan independen
Kita hanya perlu menunjukkan bahwa
E
_
∂ log f (x| θ) ∂θ
2 !
= nEθ
_
∂ log f (x| θ) ∂θ
2 !
dari estimator yang sedang diselidiki. Karena itu T (X) adalah batas bawah _ seragam dari variansi, dan setiap estimator yang memenuhi ET (X )= g(θ) dan mencapai batas bawah ini adalah estimator tak bias terbaik dari g(θ).
Karena X1 , ..., Xn independen
Eθ
_
∂ log f (x| θ) ∂θ
=E
=E
2
=E
∂ logπ f (xi | θ) ∂θ
2 n X ∂ log f (xi | θ) ∂θ
2 n X ∂ log f (xi | θ) ∂θ
!
+
X
E
Lemma
2 !
_
Bila f (x| θ) memenuhi
!
∂ Eθ ∂θ
∂ log f (xi | θ) ∂ log f (xi | θ) ∂θ ∂θ
E
∂ log f (xi | θ) ∂ log f (xi | θ) ∂θ ∂θ
E
n X
E
∂ log f (xi | θ) ∂θ
=E
∂ log f (xi | θ) ∂θ
E
∂ log f (xj | θ) ∂θ
2 !
= nE
∂ log f (xi | θ) ∂θ
2 !
dan corollary terbukti. 2 n ∂ log π f (xi | θ) disebut informasi Fisher dari sampel. Besaran E ∂θ
Terminologi ini mencerminkan kenyataan bahwa informasi Fisher adalah balikan dari variansi estimator tak bias terbaik dari θ. Dengan informasi Fisher menjadi makin besar, variansi estimator tak bias terbaik menjadi
=
Z
∂ ∂θ
∂ log f (xi | θ) ∂θ
=0
∂ log f (x | θ) ∂θ
f (x | θ) dx
(3.51)
= nE
(3.52)
∂ 2 log f (xi | θ) ∂θ2
Misalnya diberikan variabel random Poisson. Dalam hal ini g(λ) = λ. Sehingga g 1 (λ) = 1. Karena Poisson adalah keluarga eksponensial, maka lemma berlaku. Karena itu
E
∂ n log π f (xi | λ) ∂λ
74
ISBN 978-602-8310-02-4
2 !
= −nE = −nE
n
= −nE
Bab 3. Estimasi Titik
∂ 2 log π f (x | λ) ∂λ2
e−λ λx ∂ log ∂λ x!
75
!
(3.53)
∂2 (−λ + x logλ − log x!) ∂λ2 = −nE(−
makin kecil. Ini berarti makin banyaknya informasi tentang θ. Bab 3. Estimasi Titik
Contoh
Karena itu
∂ log f (x | θ) ∂θ
(benar untuk kasus eksponensial), maka
untuk i 6= j kita mempunyai
x ) λ2 ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
= −n. −
d dθ
n n 1 E(x) = 2 .λ = λ2 λ λ _
_
Karena itu untuk sebarang estimator tak bias T (X ) harus berlaku V arT (X )≥
λ n
batas bawah C-R _
Karena V ar X ≥
λ n
d h(x) f (x|θ)dx = dθ R θ ∂ 1 = h(θ) + 0 h(x) ∂θ ( θ ) dx θ Rθ ∂f (x|θ) dx. 6= 0 h(x) ∂θ 0
Contoh Misalkan X1 , ..., Xn adalah iid dengan densitas f (x|θ) = 1/θ dan 0 < x < θ . = −1/θ, maka E
_
∂ log f (x|θ) ∂θ
2
θ2 n
( θ1
Rθ 0
h(x))dx
= 0 untuk semua θ. Karena itu, Teorema Cramer-Rao tidak
keluarga eksponensial parameter satu regular maka hal ini akan tidak terjadi yaitu bila estimator tak bias dari g(θ) ada, maka pasti akan ada estimator tak bias yang mencapai batas bawah Cramer-Rao. Tetapi, dalam kasuskasus lain, batas ini bisa tidak tercapai.
Misalkan X1 , ..., Xn adalah iidN(µ, σ 2 ), dan pandang estimator σ 2 dalam hal µ tidak diketahui. densitas normal memenuhi andaian Teorema Cramer-Rao, sehingga
Rθ 0
n Y n−1 θn
dy =
n n+1
θ
n Y adalah estimator tak bias untuk θ. Sekarang Ini menunjukkan bahwa n+1 kita hitung n n 2 n 2 n V ar( n+1 Y ) = ( n+1 ) V ar Y = ( n+1 ) EY 2 − ( n+1 θ )2 n 2 n n 2 ) n+1 θ − ( n+1 θ )2 = ( n+1 θ2 n ( n+2)
Yang secara seragam lebih kecil dari
d dθ
Rao dapat diterapkan adalah tidak ada jaminannya bahwa batas bawahnya cukup tajam, atau dengan perkataan lain harga batas bawah CramerRao lebih kecil dari variansi sebaran estimator tak bias. Bila f (x|θ) adalah
∂2 log ∂(σ 2 )2
dari Y adalah
=
h(x) 1θ dx =
Kelemahan metode pencarian UMVUE ini, walaupun Teorema Cramer-
Akan dicari estimator yang tak bias dan variansinya lebih kecil. Sebagai dugaan pertama pandang statistik cukup Y = Maks(X1 , ..., Xn ). Densitas f (Y |θ) = nY n−1 /θn , 0 < Y < θ, maka E[Y ] =
0
Contoh = 1/θ2
Teorema Cramer-Rao mengindikasikan bahwa bila T adalah sebarang estimator tak bias dari θ, maka V ar(T ) ≥
h(θ) θ
Rθ
berlaku.
, maka X adalah UMVUE dari λ.
yang dengan sendirinya agak terbatas penerapannya. Seperti telah kita ketahui densitas dalam kelas eksponensial akanmemenuhi persyaratan ini, tetapi secara umum andaian tersebut harus dilihat kebenaraannya.
∂ log f (x|θ) ∂θ
Rθ
Kecuali
_
Sangat penting untuk diingat bahwa kunci dalam Teorema Cramer-Rao adalah kemampuan untuk mendiferensialkan di bawah tanda integral
Karena
Statistika Matematis II/ Edisi E-book
θ2 . n
1 x− µ 2 1 e− 2 ( σ ) (2πσ 2 )1/2
=
( x − µ )2 1 − 4 2σ σ6
dan
−E
∂2 log f (x|µ, σ 2 ) ∂(σ 2 )2
= −E
1 ( x − µ )2 − 4 2σ σ6
=
1 2σ 4
Jadi, setiap estimator tak bias T dari σ 2 harus memenuhi V ar(T ) ≥ Kita telah mengetahui bahwa V ar(S 2 ) =
2σ4 . n−1
2σ4 n
Jadi S 2 tidak mencapai
CRLB
Ini menunjukkan bahwa Teorema Cramer-Rao tidak dapat diterapkan pa-
Dalam contoh di atas sebenarnya kita mempunyai pertanyaan yang belum terjawab, yaitu apakah ada estimator dari σ 2 yang lebih baik dari S 2 atau
da densitas ini. Untuk menunjukkan ini, gunakan aturan Leibnitz.
CRLB tak bisa dicapai?
Bab 3. Estimasi Titik
76
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
77
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Syarat pencapaian CRLB sebenarnya cukup sederhana. Hal ini mengingat bahwa terjadi dari pemakaian ketaksamaan Cauchy-Schwarz, sehingga syarat pencapaian batas bawah tersebut adalah syarat kesamaan dalam ketaksamaan Cauchy − Schwarz. Perhatikan juga bahwa corollary di bawah merupakan alat berguna karena secara implisit memberikan cara pada kita untuk mendapatkan estimator tak bias terbaik.
Statistika Matematis II/ Edisi E-book
Di sini kita mempunyai _ L µ, σ 2 | x =
1
_
Misalkan X1 , ..., Xn adalah iid f (x|θ ) memenuhi syarat-syarat Teorema Qn _ i=1 f (xi |θ) menyatakan fungsi likelihood. _
Bila T (X ) = T (X1 , ..., Xn ). adalah sembarang estimator tak bias dari g(θ), _ maka T (X ) mencapai Cramer-Rao Lower Bound jhj ∂ log L( θ | x ) ∂θ
n ∂ log L ( µ , σ 2 | x ) = ∂ σ2 2 σ4
Jika θb adalah estimator tak bias untuk θ dan
i=1
f (xi |θ))
!#2
_
≤ V arT (X )V ar
Dengan mengingat E(T ) = g(θ) dan E
∂ ∂θ
log
1 n.E [(∂ ln f (x)/∂θ)2 ]
(3.54)
maka θb adalah UMVUE
Ketaksamaan Cramer-Rao dapat ditulis sebagai
∂ log ∂θ
!
hui. Bila µ tak diketahui, CRLB tidak dapat dicapai
b = V ar(θ)
_
n X (Xi − µ)2 − σ2 n
Jadi dengan mengambil (σ 2 ) = 2σn4 menunjukkan bahwa estimator tak bisa P terbaik dari σ 2 adalah (Xi − µ)2 /n, yang dapat dihitung bila µ diketa-
Bukti
Cov T (X ),
σ2
Akibat
untuk suatu fungsi a(θ).
n Y
P (Xi − µ)2
_
_
a(θ)[T (X ) − g(θ)] =
"
e− 2
Karena itu
Akibat
Cramer-Rao. Misalkan L(θ| x)=
1
(2πσ 2 )n/2
Qn
i=1
∂ log ∂θ
!
n Y
f (xi |θ))
= 0 dan
i=1
f (xi |θ)
3.3.4 Metode Estimasi Titik Pada prinsipnya ada 2 metode estimasi titik yang paling sering dugunakan yaitu metode momen atau Moment Method of Estimation (MME) dan Maximum Likelihood Method of Estimation (MLE) yang akan diuraikan pada bagian berikut ini.
menggunakan hasil teorema yang mengatakan bahwa korelasi T dan Qn ∂ log i=1 f (xi |θ) harus ±1 ∂θ
3.3.4.1 Metode Momen
Contoh
x1 , x2 , ..., xn adalah sampel dari populasi dengan densitas f (x | θ1 , ..., θk ).
_
maka T (X ) − g(θ) harus sebanding dengan
Bab 3. Estimasi Titik
78
∂ ∂θ
log
Qn
i=1
f (xi |θ).
ISBN 978-602-8310-02-4
Metode momen yang diciptakan oleh Karl Pearson pada tahun 1800 adalah metode tertua dalam menentukan estimator titik. Misalkan
Bab 3. Estimasi Titik
79
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Estimator metode momen didapat dengan menyamakan k momen sampel pertama pada k momen sampel populasi, dan menyelesaikan sistem persamaan simultan yang dihasilkan.
m1 = µ1 (θ1 , ..., θk )
(3.56)
m2 = µ2 (θ1 , ..., θk ) . . .
Definisi
mr = µk (θ1 , ..., θr ) Contoh Misalkan X1 , ..., Xn adalah sampel random populasi yang i.i.d dengan distribusi f (x/θ1 , ..., θk ). Estimator metode momen adalah solusi dari persamaan µ′r = m′r (r = 1, 2, ..., k). Dalam hal ini µ′r = E(X r ) adalah momen n X populasi ke-r dan m′r = 1/n Xir adalah momen sampel ke-r, i=1
m1 = m2 =
1 n 1 n .
i=1 n X
Contoh
Misalkan X1 , ..., Xn adalah i.i.d Binomial (k, p), yaitu,
Lebih tepatnya untuk j = 1, 2...., k definisikan:
n X
Misalkan X1 , ..., Xn adalah i.i.d ∽ N(θ, τ 2 ). Dalam hal ini θ1 = θ dan θ2 = − P 2 τ 2 . Kita mempunyai m1 =X , m2 = n1 Xi , µ1 = θ, µ2 = θ2 + τ 2 . Di sini − P kita harus menyelesaikan X = θ dan n1 Xi2 = θ2 + τ 2
k x
P (Xi = x | p) = Xi1 , µ1 = EX 1
(3.55)
Xi2 , µ2 = EX 2
i=1
!
px (1 − p)k−x , x = 0, 1, ...k.
(3.57)
Di sini diandaikan bahwa k dan p kedua-duanya tidak diketahui. Dengan menyamakan dua momen sampel pertama dan momen populasi didapat sistem persamaan
.
mr
−
X = kp
. n 1 X k = X , µk = EX r n i=1 i
1X 2 Xi = kp(1 − p) + k 2 p2 n
(3.58) (3.59)
Hasilnya adalah: Momen populasi µj biasanya merupakan fungsi dari θ1 , ..., θr ,katakanlah −
−
tuk (m1, ..., mr ), di mana: Bab 3. Estimasi Titik
80
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
−2
−
∼ X X dan p = ∼ k= − − P 1 k X − n (Xi − X )2 ∼
µj (θ1 , ...θr ). Estimator metode momen (θ1 , ..., θk ) dari (θ1 , ..., θr ) dalam ben-
81
(3.60)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
_
3.3.4.2 Metode Maksimum Likelihood Metode maksimum likelihood adalah metode yang paling populer dalam
Persamaan _ =x .
dL (θ | x) dθi
= 0 menghasilkan
Pn
_
i=1
(xi − θ) = 0 hasilnya adalah θ
_
_
Karena itu x adalah calon MLE untuk membuktikan bahwa x benar-benar
menghasilkan estimator yang ditemukan oleh R.A Fisher.
maksimum global, harus ditunjukkan bahwa
Definisi
_
Misalkan X1 , ... Xn adalah i.i.d sampel dari populasi dengan densitas f (x | θ1 , ..., θk ). Fungsi likelihood didefinisikan sebagai:
d2 L(θ | x) |θ=x_ < 0 dθ2
(3.64)
Catatan
∼ −
n
L( θ |X ) = L(θ1 , ..., θk | X1 , ...Xn ) =π f (xi | θ1 , ..., θk ) _
_
(3.61)
Untuk setiap bilangan a berlaku
_
Untuk setiap titik sampel x, misalkan θ (x) adalah harga parameter di ∼ _ _ _ mana L( θ | X) sebagai fungsi θ dengan menganggap x konstan mencapai _ maksimumnya. Estimasi maksimum likelihood (MLE) dari θ berdasarkan _ _ _ sampel x adalah θ(x). Perhatikan bahwa dari konstruksinya, jelajah dari MLE berimpit dengan jelajah dari parameter. Secara intuitif, MLE adalah estimator yang masuk akal, karena MLE adalah titik parameter dengan sampel terobservasi paling mungkin terjadi. Meskipun demikian perhatikan juga sensitivitas perubahan data. Bila fungsi likelihood terdeferensialkan (dalam Estimator) maka calon MLE yang mungkin adalah harga-harga (θ1 , ..., θk ) sedemikian hingga
n X i=1
(xi − a)2 ≥
n X i=1
_
(xi − x)2
(3.65)
_
kesamaan berlaku bhb a = x . Ini berati bahwa untuk setiap θ berlaku _ 2 _ _ _ 1 P 1 P 2 e− 2 (xi −θ) ≤ e− 2 (xi −x) dengan kesamaan bhb θ =x. Karena itu x adalah MLE.
Dalam banyak kasus, di mana deferensiasi digunakan. Kita akan lebih mu_ _ dah bekerja pada logaritma alam dari L(θ |x) yaitu logL(θ |x). Dikenal se_ bagai log likelihood dari pada L(θ |x) nya sendiri. Hal ini dimungkinkan _
karena fungsi log naik tegas pada (0, ∞), yang berarti bahwa L(θ |x) dan _ log L(θ |x) mempunyai ekstrem yang sama. Contoh
_
dL (θ |x) = 0, i = 1, 2, ..., k dθi
(3.62)
Perhatikan bahwa 3.62 hanyalah syarat perlu untuk terjadinya maksi-
Misalkan x1 , ..., xn adalah i.i.d Bernoulli (p). Maka fungsi likelihood adalah
mum. _
n
L(p |x) = πi=1 pxi (1 − p)1−xi = py (1 − p)n−y
Contoh di mana y = Misalkan X1 , ..., Xn adalah i.i.d ∽ N(θ, 1), dan misalkan: ∼
_
n
L( θ | X) =πi=1 Bab 3. Estimasi Titik
1 1 P 1 1 2 2 e− 2 (xi −θ) = e− 2 (xi −θ) (2π)1/2 (2π)n/2
82
P
(3.66)
xi . Walaupun fungsi ini untuk diambil derivatifnya, na-
mun akan lebih mudah mengambil derivatif likelihoodnya. (3.63)
ISBN 978-602-8310-02-4
_
LogL(p |x) = y log p + (n − y) log(1 − p). Bab 3. Estimasi Titik
83
(3.67)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
_
Bila 0 < y < n, mendeferensialkan Log L(p |x) dan menyamakannya den-
_
n log(1−p), bila y=0
LogL(p |x) = {n log p, bila y=n
(3.68)
_
Dalam keadaan bagaimanapun Log L(p |x) fungsi monoton dari p, dan a
mudah dilihat bahwa p = y/n.
Hal penting yang perlu diperhatikan dalam mendapatkan MLE, adalah jelajah ruang parameter.
(θ− 12 ≤ x ≤ θ+ 21 ). yang lain
1
a
f (x | θ) = {0
gan nol memberikan hasil p = y/n. selanjutnya dengan mudah dapat dibuktikan bahwa y/n adalah maksimum global. Untuk y = 0 atau y = n, maka
_
1
bila maks xi − yang lain.
L(θ |x) = {0
Jadi setiap θ diantara maks xi −
1 2
1 ≤ 2
(3.70)
θ ≤ min xi +
dan min xi +
1 2
1 2
(3.71)
adalah MLE.
Barangkali salah satu sifat yang paling berguna dari MLE adalah sifat invariannya. Misalkan dalam hal ini kita tertarik pada estimasi g(θ) dengan θ → g(θ) fungsi satu-satu. Sifat invarian mengatakan a
a
bahwa kalau θ adalah MLE dari θ maka g( θ ) juga MLE dari g(θ). Misalkan η = g(θ). Maka g −1 (η) = θ. Selanjutnya
Contoh: _
0.
_
(a) Bila tidak ada batasan pada θ, kita telah mengetahui bahwa x _ adalah MLE dari θ. Tetapi bila x< 0, maka harga tersebut berada (b) Bila x< 0, maka L(θ |x) fungsi turun dari θ untuk θ ≥ 0 dan a
a
a
_
_
_
dan θ = 0 bila x< 0.
_ _ _ Supη L∗ (η |x) = Supη L g −1(η) |x = Supθ L(θ |x)
_
mencapai maksimum untuk θ = 0. Karena itu, θ =x bila x≥ 0
πi=1 f (xi | g −1(η) _ = L g −1 (η) |x
(3.72) (3.73)
dan
di luar ruang parameter. _
n
L∗ (η| x) =
1. Misalkan x1 , ..., xn adalah i.i.d ∽ N(θ, 1), tetapi diketahui bahwa θ ≥
_
(3.74) a
Jadi, maksimum dari L∗ (η |x) dicapai pada η = g(θ) = g( θ ), yang a
menunjukkan bahwa MLE dari g(θ) adalah g( θ ). _
2. Misalkan x1 , ..., xn adalah iid dengan distribusi seragam pada (0, θ). _
untuk θ
(3.69)
a
Maka θ = maks xi .
Misalkan x1 , ..., xn adalah i, i, d dengan distribusi seragam pada (θ − +
1 ). 2
Bab 3. Estimasi Titik
la fungsi likelihood terdiferensialkan, maka menyamakan turunanturunan parsial pertama sama dengan nol memberikan syarat perlu terjadinya ekstrim. Tetapi, dalam kasus multidimensi, penggunaan turunan kedua untuk menguji maksimum adalah pekerjaan yang membosankan, dan untuk menghindarinya metode lain bisa dicoba.
3. MLE belum tentu tunggal. 1 ,θ 2
Bila θ = (θ1 , ..., θk ) multidimensi, maka persoalan menentukan MLE adalah persoalan memaksimumkan fungsi beberapa variabel. Bi-
84
ISBN 978-602-8310-02-4
4. Misalkan X1 , ..., Xn adalah i.i.d ∽ N(θ, τ )2 dengan θ dan τ 2 keduaduanya tak diketahui, maka Bab 3. Estimasi Titik
85
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
_
L(θ, τ 2 |x) =
n P 1 − 21 (xi −θ)2 / θ 2 n e 2 2 (2πτ )
Statistika Matematis II/ Edisi E-book
3.4 Soal-Soal dan Pembahasan (3.75) 1. Jika x1, x2 , ...xr variabel random independen berdistribusi Poisson P (λi); dengan λi = ai λ, diketahui (ai > adiketahui), tunjukkan T (x) = Σxi adalah statistik cukup untuk λ
dan
n n n 1 X _ log L(θ, τ 2 |x) = − log 2n − log τ 2 − (xi − θ)2 /τ 2 2 2 2 i=1
Penyelesaian: (3.76)
Xi ∼ P (ai λ), berarti fungsi pembangkit momen dari Xi adalah:
Turunan-turunan parsial terhadap θ dan τ 2 adalah: n ∂ 1 X _ log L(θ, τ 2 |x) = 2 (xi − θ) ∂θ τ i=1
t
Mxi (t) = eai λ(e −1) dan fungsi padat peluangnya adalah:
f (xi | λ) =
dan n 1 X n ∂ 2 _ x) log L(θ, τ | + = − (xi − θ) ∂τ 2 2τ 2 2τ 4 i=1
Dengan menyamakan kedua turunan parsial tersebut dengan nol didapat penyelesaian: Pn θ =x dan τ 2 = n−1 i=1 (xi − θ)2 untuk membuktikan bahwa penyelesaian ini adalah maksimum global, pertama-tama perhatikanlah: P P _ _ bila θ 6=x, maka (xi − θ)2 ≥ (xi − x)2 . Karena itu untuk setiap a
_
Selanjutnya fungsi pembangkit momen dari distribusi Poisson λΣai adalah:
MT (x) (t) =
Sekarang persoalannya menjadi persoalan satu dimensi dan P _ 1 (τ 2 )− 2 exp − 21 (xi − x)2 /τ 2 P _ mencapai global maksimum pada τ 2 = n−1 (xi − x)2 . P _ _ Jadi kesimpulannya (x, n−1 (xi − x)) adalah MLE. Bab 3. Estimasi Titik
86
ISBN 978-602-8310-02-4
MΣxi (t)
r = πi=1 eai
λ(et −1)
r = πi=1 Mxi (t) : karena xi independen. t
eλ(e −1)Σai
=
Jadi: T (x) = Σxi berdistribusi P (λΣai )dengan fungsi padat peluang:
f (Σxi = t | λ) =
harga τ 2 .
P P _ 1 1 − 12 (xi −x)2 / τ 2 − 21 (xi −θ)2 / τ 2 ≥ n e n e (2πτ 2 ) 2 (2πτ 2 ) 2
(ai λ)xi e−ai λ ; xi = 0, 1, 2, .. xi
(λΣai )t e−λΣai ; t = 0, 1, 2, .. t
Sekarang perbandingan dari: V r πi=1 [e−aiλ (ai λ)xi xi !] f (x| )V ; dengan t = Σxi = f (Σxi =t| ) (λΣa )t e−λΣai t! i
= = =
r a xi −λΣai λΣxi πi=1 i e π r xi ! i=1 t −λΣa t i λ (Σai ) e t! Σxi π r axi i=1 i e−λΣai λ t! r πi=1 xi ! e−λΣai λt (Σai )t r a xi πi=1 t! r x ! (Σai )t πi=1 i xi r ai
.
.
= (Σat! )t .πi=1 xi ! bebas dari parameterλ i Terlihat bahwa hasil terakhir ini tidak bergantung pada parameter λ. Bab 3. Estimasi Titik
87
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Dengan demikian disimpulkan T (x) = Σri=1 xi adalah statistik cukup untuk λ 2. Misalkan f fungsi integrabel yang positif terdefinisi pada (0, ∼), dan misalkan Pθ (x) adalah fungsi kepadatan peluang pada (0, θ)dengan definisi:
Pθ (x) =
(
Statistika Matematis II/ Edisi E-book
• Fungsi padat peluang bersama dari xi adalah: −n2 − 1 Σ(x−r)2 dengan θ = σσ 2 dan yi adalah : e 2σ f (x | θ) = (2πσ 2 ) 1 2 −n2 − 2σ Σ(y−σ)2 e f y | θ = (2πσ )
• Rasio dari kedua persamaan ini adalah: −n2 − 1 Σ(x−r)2 e 2σ (2πσ2 ) f (x,v|θ) = 1 Σ(y−σ)2 f (u,v|θ) 2 −n2 −
C(θ)f (x)
; 0
0
; otherwise
Jika x1 , x2 , ...xn variabel random iid dengan densitas Pθ , tunjukkan x(n) adalah statistik cukup untuk θ Penyelesaian Misalkan: Z = x(n) = maximum xi ;1≤ i ≤ n, maka: P (Z ≤ z) = P (x1 ≤ z, x2 ≤ z, ..., xn ≤ z) F (z) ={P (x ≤ z)}n , sebab xi idd R z n f (z) = 0 Pθ (x)dx R z n R z n = 0 c(θ)f (x)dx = [c(θ)]n 0 f (x)dx Pθ (z) = F ′ (z) = [c(θ)]n
2
d dz
Z
2σ 1
2
e− 2σ (Σx 1
=
2 −Σy 2
)+ σ1 (Σx−Σy)
• Jelas rasio ini independen dari θ = σσ 2 ⇐⇒ Σx = Σydan Σx2 , Σy 2. Dengan demikian T (x) = (Σx, Σx2 )adalah himpunan statistik cukup minimal untuk θ = σσ 2
U (θ − a, θ + b), dengan a,b>o diketahui dan θǫΩ = IR. z 0
n f (x)dx
(a) Tentukan momen estimator untuk θ (3.77)
(b) Hitung variansinya Penyelesaian:
n n Pθ (xi ) = πi=1 c(θ)f (x) = [c(θ)]n {f (x)}n Pθ (x) = πi=1
(3.78)
Sekarang diambil rasionya diperoleh: = =
1 (a) x ∼ U (θ − a, θ + b) , berarti f (x | θ) = b+a dengan (θ − a ≤ x ≤ θ + b). Dihitung ekpektasi dari x, yaitu
f (x) = =
[C(θ)]n {f (x)}n R n d [C(θ)]n dz { 0z f (x)dx} {f (x)n } Rz n d f (x)dx} dz { 0
= =
Ternyata rasio ini independen dari θ, berarti dapat disimpulkan Z=
=
X(n) adalah statistik. cukup untuk parameter θ.
= 2
3. Misalkan x1 , x2 , ...xn variabel random iid dengan N(σ, σ ) ; σ > 0,
=
Tentukan himpunan dari statistik cukup minimal
=
Penyelesaian:
=
Bab 3. Estimasi Titik
e
1
4. Misalkan x1 , x2 , ...xn variabel random independen berdistribusi
Karena Xi iid maka:
Pθ (x) Pθ (Z=x(n) )
(2πσ )
e− 2σ Σ(x−σ) + 2σ Σ(y−r) 1 1 2 2 2 2 2 2 = e− 2σ Σ(x −2σx+σ ) + 2σ Σ(y −2σy+σ ) 2 2 2σ σ 2σ σ2 1 2 2 = e− 2σ (Σx −Σy )+ 2σ2 e Σx− 2σ2 − 2σ2 Σy+ 2σ2 1 1 1 2 2 = e− 2σ (Σx −Σy )+ σ Σx− σ Σy =
88
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
1 2(b+a)
1 2(b+a) 2
R θ+b x. 1 θ−a R θ+bb+a 1 xdx b+a θ−a 1 2 θ+b 1 x b+a 2 θ−a
(θ + b)2 − (θ − a)2
{θ + 2θb + b2 − θ2 + 2θa − a2 }
1 {2θb + 2θa + b2 + −a} 2(b+a) 1 {2θ (b + a) + (b2 − a2 )} 2(b+a) 1 {2θ (b + a) + (b + a) (b − a)} 2(b+a) θ + b−a 2
89
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book P Persamaan metode memennya adalah: n1 ni=1 xi = x = θΛ + b−a , 2 sehingga, momen estimator untuk parameter θ adalah θΛ = x − + b−a 2 (b) Untuk menghitung variansinya, terlebih dahulu dihitung E (x2 )sebagai berikut: R θ+b E (x2 ) = x. 1 dx θ−a 1 b+a θ+b 1 x3 θ−a = b+a 3 1 (θ + b)3 − (θ − a)3 = 3(b+a) =
= = = = =
1 3(b+a)
{(θ3 + 3θ2 b + 3θb2 + b3 ) − (θ3 − 3θ2 a + 3θa3 + a2 )} 1 {(3θ2 b + 3θ2 a + 3θb2 − 3θa2 + b3 + a3 )} 3(b+a) 1 {3θ (θb + θa + b2 − 3θa2 ) + (b3 + a3 )} 3(b+a) θ 2 (b2 −a2 ) (b3 +a3 ) θ 2 (b+a) + (b+a) + 3(b+a) (b+a) (b+a)(b2 −ab+a2 ) θ2 + θ(b−a)(b+a) + (b+a) 3(b+a) (b2 −ab+a2 ) θ2 + θ (b − a) + 3
Selanjutnya, dihitung variansi estimator θ, yaitu θΛ V θΛ
2 b−a b−a b−a =E −E x− x− x− 2 2 2 2 b−a b−a = E {x − E (x)}2 − E (x) + x− E 2 2 1 n 1 V (x) = V Σi=1 xi = 2 .V (Σni=1 xi ) n n 1 1 1 E x2 − E x2 .nV (x) = V (x) = n2( n n 2 ) b−a b2 − ab + a2 1 2 − θ+ θ + θ (b − a) + n 3 2
=
1 n
4b2 − 4ab − 4a2 − 3b2 − 6ab − 43a 12
1 (a + b) (a + b)2 = 12n 12n
2
=
1 n
4b + 2ab + a2 12
=
5. Jika x1 , x2 , ...xn variabel independen berdistribusi U (−θ, θ)dengan θǫΩ=(0, ∝) apakah metode momen memberikan suatu estimator untuk θ? Penyelesaian: 1 ; −θ ≤ x ≤ θ X ∼ U (−θ, θ), berarti f (x | θ) = 2θ Rθ Rθ 1 xdx E (x) = −θ f (x | θ) dx = −θ 2θ Jadi: 2 1 1 2 θ 1 2 = x = θ − (−θ) =0 2θ 2 4θ −θ Sehingga diperoleh persamaan metode momennya yaitu:
1 i Xi = X = 0, karena E (x) = 4θ .0 = 0 E (x) = n1 Σni=1 maka θ = 0atau θΛ = 0, dengan demiian metode momen tidak memberikan suatu estimator untuk θ.
= V = = = =
!) (b − a)2 b2 − ab + a2 − θ + θ (b − a) + θ + θ (b − a) + 3 4 ( ) ( ) 2 2 2 2 2 (b − a) 1 4b − 4ab − 4a − 3 (b − a)2 1 b − ab + a − = = n 3 4 n 12 1 = n
Statistika Matematis II/ Edisi E-book
(
2
Bab 3. Estimasi Titik
90
ISBN 978-602-8310-02-4
6. Jika x1 , x2 , ...xn variabel random iid berdistribusi binomial negatif dengan parameter θǫΩ (0, 1) r adalah MLE untuk θ Tunjukkan bahwa : r+x Penyelesaian:
• Xi =∼ binomial negatif, berarti :
f (x | θ) =
r+x−1 x
θr x Θ (1 − θ) dengan 0 < θ ≤ 1; x = 0, 1,
Fungsi likehoodnya adalah: Bab 3. Estimasi Titik
91
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
L (x | θ) = •
n πi=1
n = πi=1
r+x−1 x r+x−1 x
nr Σn x θ (1 − θ) i=1 i
nr Σn x θ (1 − θ) i=1 i
• Logaritma fungsi likehood adalah: r+x−1 n Σn x logL (x | θ) = log πi=1 θnr (1 − θ) i=1 i x r+x−1 = Σni=1 log + nr log θ + Σni=1 xi log (1 − θ) x
•
d dθ
[logL (x | θ)] =
nr θ
−
Σn i=1 xi 1−θ
• persamaan likehoodnya adalah:
nr θΛ
−
Σn i=1 xi (1−θ Λ )
= 0atau
nr 1 − θΛ − θΛ Σni=1 xi = 0 ⇔ nr 1 − θΛ − θΛ Σni=1 xi = 0 Λ Λ θ (1 − θ ) ⇒ nr − nrθΛ − θΛ Σni=1 xi = 0 ⇒ nr = θΛ (nr+) Σni=1 xi
θΛ =
nr Σni=1 xi nr r ; dengan =x = = n Σn x i nr + Σi=1 xi r+x n nr + i=1 n
Jadi calon MLE untuk parameter θadalah: θ =
r r+x
7. Jika x1 , x2 , ...xn variabel random iid berdistribusi exponensial negatif dengan parameter θǫΩ (0, ∝), Tunjukkan bahwa parameter θ.
1 x
adalah MLE bagi
Penyelesaian: • Xi∼ exponensial negatif, berarti fungsi kepadatan peluangnya adalah: f (x | θ) = θe−θx ; θ > 0; x > 0 0 ; x ≤ 0; θ > 0 Bab 3. Estimasi Titik
92
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
n • Logaritma fungsi likehood adalah: L (x | θ) = πi=1 θe−θx = n −θx θ θe
•
d dθ
[logL (x | θ)] =
n θ
− Σni=1 xi ;
d dθ
[logL (x | θ)] = − θn2 < 0
• Persamaan likehoodnya adalah : − θnΛ − Σni=1 xi = 0 atau n − θΛ Σni=1 xi = 0 ⇔ n − θΛ Σni=1 xi = 0 θΛ n Σn xi nn 1 ⇒ θΛ = n = Σn xi = : dengan i=1 = x i=1 Σi=1 xi x n n
• Jadi MLe untuk parameter θadalah θΛ =
1 x
8. Misalkan x1 , x2 , ...xn variabel random iid hdengan i p.d.f f (.; θ1 , θ2 ) 1) ; x > θ1 dimana yang diberikan oleh: f (x; θ1 , θ2 ) = θ12 exp (x−θ θ2 θ = (θ1 , θ2 ) εΩ = Rx (0, ∝). Tentukan MLE dari θ1 danθ2 . Penyelesaian: • Fungsi padat peluang x1 adalah:
1 (x − θ1 ) ; x > θ1 exp θ2 θ2
f (x | θ1 , θ2 ) =
• Fungsi likehoodnya adalah: n 1 L (θ | x) = πi=1 exp θ2
=
i h i = 1n exp − θ12 Σni=1 (x − θ1 ) h θ2 i θ2n exp − θ12 Σni=1 (x − θ1 )
h
(x−θ1 ) θ2
• Logaritma fungsi likehoodnya adalah: logL (θ | x) = −nlogθ2 −
1 n n d Σ (x1 − θ1 ) ; dan [logl] (θ | x) = θ2 i=1 dθ1 θ2
Karena dθd1 [logl (θ | x)] = θn2 ,maka metode pendiferensialan tidak dapt digunakan untuk memperoleh MLE dari θ1 , oleh sebab itu digunakan cara berikut. Telah hdiketahui bahwa i xi > θ1 ; ∀i , jadi L (θ | x) = θ2−n exp − θ12 Σni=1 (x − θ1 ) akan mencapai maksimum apabila 1 n Σ θ2 i=1
(x1 − θ1 )minimum, ini hanya dicapai apabila θ1 = x(i) .
Bab 3. Estimasi Titik
93
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Jadi parameter θ1 adalah θ1 = x(i) . Selanjutnya, dθd1 [logl (θ | x)] = − θn2 +
Σn i=1 (x−θ1 ) θ22
π (θ | α, β) =
• Persamaan likehoodnya adalah: −nθ2Λ2
+
θ2Λ Σni=1 θΛ3
(x − θ1 )
=⇔ −nθ2Λ2 + θ2Λ Σni=1 (x − θ1 ) = 0
Σn x −nx
Σn x −nθ
(b) Myatakan posterior mean, sebagai rata-rata tertimbang dari MLE θdan prior mean
Σni=1 (x − θ1 ) n nΣn x n−nx
(1) i=1 i θ2Λ = i=1 ni 1 = i=1 in (1) = n nx−nx(1) x − x(1) = = n Untuk membuktikan bahwa θ2Λ = x − x(1) benar-benar maksi-
mum global, harus ditunjukkan:
d [logL (θ | x)]θ2 =θΛ < 0; sebagai berikut 2 dθ1
2
1
θ y e−θ ;y y!
θ Σyi e−nθ jadi πyi !
=
distri-
busi posterior dari θadalah:
2
−n 3 < 0. (x−x(1) ) Dengan demikian disimpulkan bahwa MLE untuk parameter
θ2 adalah: θ2Λ = x − x(1) 9. Jika y1 , y2, ...y variabel random iid berdidstribusi Poisson dengan mean θdan distribusi Prior adalah gamma dengan parameter α, β 94
Penyelesaian:
• Distribusi bersama dari y adalah: f (y | θ) =
2Σn i=1 (x−θ1 ) 2 − n nθ2 1 n 2 [nθ2 − 2Σi=1 (x − θ2
θ1 )] x − x − 2Σx n 3 i + 2nx(1) (1) (x−x(1) ) 1 = nx − nx(1) − 2Σxi + 2nx(1) 3 (x−x(1) ) 1 = nx − 2nx + nx(1) 3 (x−x(1) ) 1 −nx + nx(1) = 3 (x−x(1) ) −n = 3 (x−x(1) ) d Karena n > 0dan x − x(1) > 0, maka dθ1 [logL (θ | x)]θ2 =θΛ = =
=
(c) Tentukan behaviour dari posterior mean dengan membuat variasi αdan n, serta MLE dan prior mean tetap.
• yi ∼ P (θ) , berarti densitas dari y adalah f (y | θ) = 0, 1, 2...
n
[logL (θ | x)]θ2 =θΛ =
Bab 3. Estimasi Titik
(a) tentukan distribusi posterior dari θ; posterior mean dan variansinya.
−nθ2Λ + Σni=1 (x − θ1 ) = 0 ⇒ θ2Λ =
d dθ1
β α θα−1 −βθ e ;θ > 0 r (α)
Pertanyaan:
atau
atau
Statistika Matematis II/ Edisi E-book
ISBN 978-602-8310-02-4
f y | θ .π (y | α, β) π (y | θ) = R ∝ f y | θ π (y | α, β) dθ 0
(3.79)
Dihitung dulu: R∝ 0
R∝ f y | θ π (y | α, β) dθ = 0 R∝ = 0 R∝ = 0 R∝ = 0 R∝ = 0
Substitusi 2 ke 1 diperoleh: a π θ|y = =
Bab 3. Estimasi Titik
θ Σyi e−nθ β α θ α−1 −βθ . r(α) e πyi ! θ Σyi e−nθ β α θ α−1 −βθ . r(α) e πyi ! θ Σyi e−nθ β α θ α−1 −βθ . r(α) e πyi ! θ Σyi e−nθ β α θ α−1 −βθ . r(α) e πyi ! θ Σyi e−nθ β α θ α−1 −βθ . r(α) e πyi !
(3.80)
θ Σyi e−nθ β α θ α−1 −βθ . r(α) .e πyi β α r (Σyi +α) πyi !r(α)(α+β)Σyi +α (n+β)Σyi +α Σyi +α−1 −(n+β)θ r(Σyi +α)
95
.θ
e
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Atau distribusi Posterior diatas dapat juga dihitung dengan cara sebagai berikut: π θ|y
α
f y | θ π (θ)
α k1 θ
α θ α−1 e−βθ
Σy . θπy!i r(α) Σyi +α−1 −n(n+β)θ
k. β
α
∝
e−nθ
(3.81)
Σyi +α
(n + β)
Z
∝
=
MLE dan prior mean.
θ
• Estimator maksimum likehood dari θadalah: n Fungsi likehood dari y: L (θ | y) = πi=1 f (yi | θ) =
Σyi +α−1 u
e du = 1
0
(n + β)Σyi +α r (Σyi + α) = 1 ⇒ k1 = Σyi +α r (Σyi + α) (n + β) ki
(3.82)
4 ke 3 diperoleh: (n + β)Σyi +α Σyi +α−1 −(n+β)θ π θ|y = θ e r (Σyi + α) • Sekarang dihitung “posterior mean” dari θ R∝ E (θ | y) = θπ (θ | y) dθ R ∝ (n+β)Σy0i +α Σy +α− −(n+β)θ .θ i .e dθ = r(Σyi +α) 0 Σy+α Σyi +α R ∝ (n+β) u du −u = r(Σyi +α) . 0 n+β .e . (n+β) R ∝ Σy+α −u 1 u e du = r(Σyi +α)(n+β) 0 E (θ | y) =
= Bab 3. Estimasi Titik
d {logL (θ | y)} = Σyθ i − n, syarat perlu adanya maksimum dθ d {logL (θ | y)} = 0, sehingga persamaan likehoodnya adalah: dθ Σyi − n = 0 ⇔ Σyi = nθΛ = 0. Jadi calon MLE dari θadalah: θΛ Σyi d2 Λ i θ = Σy = y karena dθ 2 {logL (θ | y)}]θ=θ Λ = − θ Λ < 0, maka n Σyi Λ MLE dari parameter θadalah θ = n = y.
• Prior Mean dari θadalah:
96
=
=
r(Σyi +α+2) (n+β)2 r(Σyi +α) (Σyi +α+1)(Σyi +α) (n+β)2
ISBN 978-602-8310-02-4
R∝
α α−1
θ β θ e−βθ dθ R ∝ βr(α) α θα e−βθ dθ = 0 r(α) R ∝ u α −u du βα = r(α) 0 β e β R ∝ α −u 1 u e du = r(α)β 0
E (θ) =
=
i
θ Σyi e−nθ n y ! πi=1 i
Logaritma dari fungsi likehood y adalah: logL (θ | y) = Σyi ogθ− nθ − logπyi,dan
r(Σyi +α+1) (n+β)r(Σyi +α) (Σyi +α)(Σyi +α−1) (n+β)(Σyi +α−1) (Σyi +α) (n+β)
• Selanjutnya dihitung “Variansi Posterior” dari θ (n+β)Σyi +α R ∝ Σyi +α+1 −(n+β)θ E (θ2 | y) = θ e dθ r(Σyi +α) 0 Σyi +α+1 (n+β)Σyi +α R ∝ u −u d = r(Σyi +α) 0 n+β .e . n+β R ∝ Σy +α+1 −u 1 i u e du = (n+β)2 r(Σy +α) 0 =
(Σyi +α+1)(Σyi +α)−(Σyi +α)2 (n+β)2 Σyi +α (n+β)2
=
e
θΣyi +α−1 eu dθ, maka :
ki
=
E (θ2 | y) − E (θ | y)2 n o2 i +α) i +α − Σy = (Σyi +α+1)(Σy n+β (n+β)2
b. Dinyatakan Posterior mean, sebagai rata-rata tertimbang dari
Z
0
=
Jadi variansi posterior dari θadalah: V (θ | y) =
Karena: k1
Statistika Matematis II/ Edisi E-book
0
1 r (α + r(α)β αr(α) . βr(α) α β
1)
i +α Telah diperoleh: Posterior mean dari θ : E (θ | y) = Σy , MLE (n+β) Σyi dari θ : θ = n = y Prior mean dari θ : E (θ) = αβ. Jadi Posterior dapat dinyatakan seabgai rata-rta tertimbang dari
MLE dan Prior mean, sebagai berikut: Σyi +α i = a Σy + bαβ ⇒ (n+β) n nβΣyi + nbα = (n + β) aβΣyi + Σyi +α aβΣyi +nbα = ⇒ n+β nβ Bab 3. Estimasi Titik
97
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
(n + β) nb atau ini dapat disajikan sebagai:
Σyi +1 n+β
= nβ = (n + β) aβdan nβα = (n + β) nβα
= =
atau a=
(i). Jika n besar dan αtetap, maka Posterior mean sama dengan MLE dari θ, yaitu:
Sehingga diperoleh:
Σyi n
β (αβ) + (n + β)
(3.83)
Dari persamaan * dapat diamati bahwa. (i) Jika n besar dengan β tetap, maka Posteriormean sama dengan MLE dari θ, yaitu n
o
Σyi β n + n+β (αβ) n+β n Σyi (1) n + (0) (αβ) Σyi n
E (θ | y) = limn→∝ = = =
y
(ii). Jika β besar dengan n tetap, maka posterior mean sama dengan mean prior dari θ, yaitu n
n n+β i (0) Σy n
E (θ | y) = limn→∝ = =
=
Σyi n
(αβ)
Dari persamaan terakhir ini dapat dilihat bahwa
β n dan b = (n + β) (n + β)
n Σyi + α = (n + β) (n + β)
n α n+ E(θ)
Σy
i +α n n+β Σy n. n i +α n+βα.α n.y+α 1 .α n+ E(θ) αβα (y) + n+ α E(θ)
n.
=
o β + n+β (αβ)
+ (1) (αβ) αβ E (θ)
Atau Posterior mean E (θ | y) diatas dapat dinyatakan sebagai berikut:
E (θ | y) = limn→∝
αβα n (y) + (αβ) = y n + αE (θ) n + αE (θ)
(ii). Jika α besar dan n tetap, maka posterior mean sama dengan mean prior, yaitu E (θ | y) = limn→∝ = =
n
n n+αE(θ)
(y) +
αβα n+αE(θ)
αβ E (θ)
o (αβ)
10. Misalkan y1 , y2 , ...yn variabel random iid berdistribusi Poisson dengan mean θ, dan distribusi prior adalah Gamma dengan parameter α, β π (θ | α, β) =
β α θα−1 −βθ e r (α)
Pertanyaan: tentukan estimator Bayes dari θuntuk fungsi-fungsi kerugian berikut, (i). L (a, θ) = (a, θ)2 (ii). L (a, θ) = θ (a, θ)−12 (iii). L (a, θ) = (a − θ)4 (iv). L (a, θ) =| a − θ | 11. Diketahui:x1 , x2 , ...xn variabel random iid berdistribusi B (l, θ) , θǫΩ = (0, 1). Tunjukkan x adalah UMVU estimator untuk θ. Penyelesaian:
Bab 3. Estimasi Titik
98
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
99
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
• Xi ∼ B (l, θ)maka densitas dari Xi adalah: f (xi | θ) = θxi (1 − θ)1−xi ; xi = 0, 1; i = 1, 2, ..., n • Densitas bersama dari xi adalah: f (x | B) = =
θ
n πi=1 f Σxi
(xi | θ) (1 − θ)n−Σxi
= θΣxi (1 − θ)n (1 − θ)−Σxi Σxi θ = (1 − θ)n 1−θ = Berdasarkan teorema faktorisasi, T (x) = Σxi adalah statistik cu-
Statistika Matematis II/ Edisi E-book ! −t n θ = • Karena (1 − θ)n 6= 0 maka Σnt=0 g (t) 1−θ t ! n θ , dan ini adalah poliΣnt=0 g (t) y t = 0; dengan y = 1−θ t ! n t nomial derajat n dalam y. Koefisien y adalah g (t) , karet na polinomial ! berniali nol ∀y, maka setiap koefisien harus = 0. n Karena 6= 0, berarti g (t) = 0, dengan t = 0, 1, 2, ..., n. Det ngan demikian, T (x) = Σxi adalah statistik cukup dan lengkap. • Selanjutnya, E [T (x)] = Σni=1 {xi } = Σni=1 E (xi ) = Σni=1 θ = nθ
kup untuk parameter θ • Sekarang ditunjukkan T (x) = Σxi adalah statistik cukup dan
Sekarang, misalkan:
lengkap xi ∼ B (1, θ),Mgfnya adalah Mx (t) = (1 − θ) + θet Mgf dari T (x) = Σxi adalah:
MT (x) (t) = MΣxi (t) = {Mx (t)}n , karena xi iid = {(1 − θ) + θet } ini adalah Mgf dari distribusi Binomial (n, θ).
Jadi diperoleh: xi ∼ B (1, θ) ⇒ T (x) = Σxi ∼ B (n, θ) Sehingga: densitas dari T (x) = Σxi adalah f (Σxi | θ) =
n t
!
θt (1 − θ)n−t ; dengan t = Σxi , dan t = 0, 1, 2, ..., n n
Keluarga distribusi f (Σxi = t | θ) =
t
!
θt (1 − θ)n−t adalah
lengkap sebab: Eθ [g (t)] =
Σnt=0 g (t)
n t
!
= (1 − θ)n Σnt=0 g (t) =
(1 − θ)n Σnt=0 g (t)
∀θ : 0 < θ < 1. Bab 3. Estimasi Titik
100
Σn T ∅ (T ) = = i = x, maka n n 1 Σxi 1 = Σni=1 E (xi ) = .nθ E [∅ (T )] = E n n n Berdasarkan teorema 1, disimpulkan ∅ (T ) =
T n
= xadalah
UMVU Estimator untuk parameter θ
12. Misalkan x1 , x2 , ..., xn variabel random berdistribusi gamma dengan α diketahui dan β = θǫΩ = (0, ∝)tidak diketahui. Tentukan, bahwa UMVUE dari θadalah: 1 n Σ xj nα j=1 Dan tentukan variannya, serta batas cramer-Rao. Penyelesaian: ⇒Xi ∼ Gamma (α, β = θ),maka densitas dari xi adalah: u (x1 , x2 , ..., xn ) =
θt (1 − θ)n−t ! n θt (1 − θ)−t t ! −t n θ t
1−θ
ISBN 978-602-8310-02-4
f (Xi | β = θ) =
1 xα−1 e−xi θ ; xi > 0, α diketahui , θ > 0 r (α) θα i
⇒Densitas bersama dari xi adalah: Bab 3. Estimasi Titik
101
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
1 n πi=1 xα−1 e−xi θ r(α)θ α i
f (x | β = θ) =
1 n 1 π n xα−1 e θ Σj=1 xi [r(α)]n θ nα i=1 i α−1 n 1 n πi=1 xi θ−nα e θ Σj=1 xi [r(α)]n θ nα
=
=
Berdasarkan teorema faktorisasi, berarti T (x) = Σn1 xi adalah statistik cukup untuk β = θ. ⇒Ditentukan distribusi dari T (x) = Σn1 xi sebagai berikut. Diketahui bahwa: Xi ∼ G (α, βθ =)maka, Mgf dari distribusi ibi adalah: Mxi (t) =
Statistika Matematis II/ Edisi E-book
haruslah:g (t) tnα−1 = 0. Dengan demikian statistik T (x) = Σxi adalah statistik cukup dn lengkap. E (T (x)) = E (Σxi ) = Σni=1 Exi ⇒Dihitung = Σni αθ = nαθ T 1 Misalkan ∅ (T ) = nα = nα Σnj=1 xj = U (x1 , x2 , .., xn ) Maka: E {∅ (T )} = E {U (x1 , x2 , .., xn )} 1 Σxj = E nα 1 = Σn (xj ) nα j=1 1 = αθn nα
(1 − θt)−α . Selanjutnya Mgf dari T (x) = Σn1 xi adalah:
2
MT (x) (t) =
=
MΣn1 xi (T ) n
Ternyata ∅ (T ) = U (x1 , x2 , .., xn ) = bias bagi θ
= [Mxi (t)] n = (1 − θt)−α
=
(1 − θt)−nα
Bentuk terakhir ini menyatakan T (x) = Σxi ∼ G (nα, θ =) 1 tnα−1 e−tθ ; t > 0 r (nα) θnα
V ar (U (x1 , x2 , .., xn )) = = =
(3.84)
⇒Sekarang ditunjukkan keluarga distribusi * adalah lengkap, yaitu: E {g (t)} =
Ru
Karena r (nα) > 0, θnα > 0, maka Z
0
u
g (t)
1 r(nα)θ nα
1 tnα−1 e−tθ dt r (nα) θnα
f (x | β = θ) = =
(3.85)
=
daini,
= =
karena xi iid
Bab 3. Estimasi Titik
102
1 Σxj V ar nα 1 ΣV ar (xj ) n2 α2 1 Σαθ2 n2 α2 1 nαθ2 n2 α2 θ2 nα
⇒Dihitung batas Cramer-Rao:
> 0,jadi
Karena persamaan * merupakan transformasi Laplace ri fungsi g (t) tnα−1 , maka menurut sifat tranformasi 2
= =
0 ⇒ g (t) = 0
1 nα−1 −tθ e dt g (t) r(nα)θ nα t 0 Ru 1 = r(nα)θnα 0 g (t) tnα−1 e−tθ dt
E {g (t)} =
estimator tidak
1 Dengan demikian, U (x1 , x2 , .., xn ) = ∅ (T ) = nα Σnj xj adalah UMVU estimator untuk θ 1 ⇒Selanjutnya duhitung variansi dari U (x1 , x2 , .., xn ) = nα Σnj xj yaitu:
Sehingga densitas dari T (x) = Σxi adalah: f (Σxi = t | β = θ) =
θ 1 Σn x adalah nα j j
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
1 xα−1 e−xθ ; x > 0logf (x | θ) r (α) θα log1 − log r (α) θ(α) + (α − 1) logx − xθ d −logr (α) − αlogθ + (α − 1) logx − xθ [logf (x | θ)] dθ 2 α d x − + 2 [logf (x | θ)] θ θ dθ α x 2 α2 2αx x2 − + 2 = 2 − 3 + 4 θ θ θ θ θ 103
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
E
2 α2 2α d = 2 − 3 E (x) + [logf (x | θ)] dθ θ θ α2 2α 1 = 2 − 3 αθ + 4 θ θ θ α α2 2α = 2 − 3 + 2+ θ θ θ
1 E x2 4 θ
αθ2 + αθ2
α2 α = 2 θ2 θ
Karena distribusi gamma memenuhi Teorema Cramer-Rao maka untuk sembarang estimator tak bias untukθ, sebut saja w = h (x), berla-
Statistika Matematis II/ Edisi E-book
Jadi T (x1 , x2 , .., xn )adalah estimator tak bias untuk µ. Dengan kata lain bias T (x1 , x2 , .., xn ) = E (T (x1 , x2 , .., xn )) − µ = µ − µ = 0. Jadi : limn→∞ {bias T (x1 , x2 , .., xn )} = 0 ⇒selanjutnya dihitung V ar [T (x1 , x2 , .., xn )]. n V ar T (x1 , x2 , .., xn ) = =
ku: V ar (w) ≥ =
1 2 d nE { dθ [logf (x|θ)]} 1 n α2
= =
θ
=
θ2 nα
= =
2
θ . Jadi batas Crame-Rao adalah nα Terlihat bahwa varians dari estimator tak bias U (x1 , x2 , .., xn ) = 1 Σn x sama nα j=1 j
dengan V ar (U (x1 , x2 , .., xn )) = V ar
batas 1 Σn x = nα j j
Dengan demikian: U (x1 , x2 , .., xn ) = bagi θ.
Cramer-Rao, yaitu: θ2 = batas Cramer-Rao nα
1 Σn x adalah UMVU estimator nα j j
=
Tunjukkan: T (x1 , x2 , .., xn ) = 2 [(n + 1)]−1 Σni ixi estimator konsisten untuk µ. Penyelesaian: ⇒ 2 Σn ixi 2(n+1) i
T (x1 , x2 , .., xn ) = = = = = = = = Bab 3. Estimasi Titik
2 2(n+1)
2 {x1 + 2x2 + 3x3 + .. + nxn } 2(n+1) 2 E {x1 + 2x2 + 3x3 + .. + nxn } 2(n+1)
{E (x1 ) + 2E (x2 ) + 3E (x3 ) + .. + nE (xn )} 2 {µ + 2µ + 3µ + ... + nµ} 2(n+1) 2 µ {1 + 2 + 3 + ... + n} 2(n+1) 2 µ 12 n (n + 1) 2(n+1)
ISBN 978-602-8310-02-4
o
4 V ar {x1 + 2x2 + 3x3 + .. + nxn } , [n(n+1)] 4 {V ar (x1 ) + 2V ar (x2 ) + ... + nV ar (x3n n2 (n+1)2 4 {σ 2 + 4σ 2 + 9σ 2 + ... + n2 σ 2 } n2 (n+1)2 4 {12 σ 2 + 22 σ 2 + 32 σ 2 + ... + n2 σ 2 } n2 (n+1)2 4σ2 {12 + 22 + 32 + ... + n2 } n2 (n+1)2 1 4σ2 n (n + 1) (2n − 1) n2 (n+1)2 6 n o 2
yaitu:
2 2 σ 3
Dari 1 dan 2,
2n − 1 n (n + 1)
2 2n − 1 = σ 2 limn→∞ =0 3 n (n + 1)
berdasarkan
teorema,
(3.87)
disimpulkan bahwa
T (x1 , x2 , .., xn ) = 2 [n (n + 1)]−1 Σni ixi adalah barisan estimator yang konsisten terhadap parameter µ. 14. Misalkan X1 , ..., Xn sampel random dari populasi N(µ, σ 2 ). Tunjukkanlah bahwa X adalah UMVUE untuk µ Bukti E(X) = 1/n.nµ = µ. Jadi X estimator tak bias untuk µ. V ar(X) = σ 2 /n. Sekarang akan dicari batas bawah Cramer-Rao f (x) =
µ
104
2 Σ0 ixi 2(n+1) i
2n+1 2σ = 3 n(n+1) Sekarang diambil limit dari V ar {T (x1 , x2 , .., xn )}untuk n → ∞,
limn→∞ 13. Misalkan x1 , x2 , .., xn variabel random iid, dengan E (xi ) = µ; E | xi |2 < ∞,dan V ar (x) = σ 2 .
V ar
(3.86)
Bab 3. Estimasi Titik
1 −1 −2 2 e−2 σ (x−µ) ; −∞ < x < ∞ σ(2π)1/2 105
(3.88)
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
ln f (x) = − ln σ(2π)1/2 −
1 (x − µ)2 2σ 2
(3.89)
(3.90)
Sehingga E
16. Diketahui X1 , ..., Xn adalah i.i.d N(µ, σ 2 ). Tentukan estimator untuk µ dan σ 2 dengan MME. Jawab:
1 ∂ ln f (x) = 2 (x − µ) ∂µ σ "
Statistika Matematis II/ Edisi E-book
Disini kita punya,
n X
Xir , m1 = X, µ1 = µ dan µ2 = µ2 + σ 2 . Solusi
i=1
∂ ln f (x) ∂µ
2 #
=
1 E σ2
"
(x − µ) σ
2 #
=
1 1 .1 = 2 σ2 σ
σ2 1 2 = n n.E (∂ ln f (x)/∂θ)
Jadi batas bawah Cramer-Rao adalah
(3.91)
(3.92)
n X dari sistem persamaan X = µ dan 1/n Xir = µ2 + σ 2 diperoleh i=1 P b2 = 1/n ni=1 (Xi − X)2 estimator metode momen µ b = X dan σ
17. Diketahui X1 , ..., Xn sampel random dari N(θ, 1), −∞ < θ < ∞. Tentukan MLE untuk θ Jawab:
σ2 . n
2
f (x/θ) = (2π)−1/2 e−1/2(x−θ)
(3.93)
2
Karena X estimator tak bias untuk µ dan V ar(X) = σn sama dengan batas bawah Cramer-Rao maka menurut akibat teorema Cramer-Rao
n
L(θ/x) = Πi=1 f (xi /θ)
X adalah UMVUE
"
= (2π)−n/2 exp −1/2
15. Misalkan X1 , ..., Xn i.i.d N(θ, 1). Tunjukkan bahwa barisan estimator P Xi . adalah konsisten. X¯n = n
= −n/2 ln(2π) − 1/2
Jawab:
_
Perhatikan bahwa Xn ∼ N(θ, n1 ), sehingga untuk n→ ∞: R ε n 1/2 −n/2 y2 R ε√n 1 1/2 −1/2 t2 √ = −ε ( 2π ) e dy = −ε√n ( 2π ) e dt = P (−ε n < z < √ ε n) → 1 _
Karena itu Xn adalah barisan estimator konsisten untuk θ. Secara umum perhitungan mendetail seperti di atas tidak perlu dilakukan untuk membuktikan konsistensi. Ingat untuk suatu estimator ¯ n − θ ≥ ǫ) ≤ Tn ketaksamaan Chebychev mengatakan bahwa P ( X E(Tn −θ)2 ǫ2
sehingga limit E(Tn −θ)2 = 0 adalah syarat cukup agar suatu barisan T n→∞ konsisten. selanjutnya kita dapat menulis
Persamaan
d ln L(θ/x) dθ
Perhatikan bahwa
= 0 menghasilkan
d2 ln L(θ/x) |θ=X < dθ 3
n X
i=1 n X i=1
n X i=1
(Xi − θ)2
(Xi − θ)2
#
(3.94) (3.95) (3.96)
(Xi − θ) = 0 atau θb = X.
0 Jadi θb = X adalah ELM untuk θ.
18. Diketahui X1 , ..., Xn sampel random dari f (x; θ) =
(
1 ; θ
0 < x ≤ θ dan 0 < θ < ∞ 0; untuk x yang lain
(3.97)
Tentukan MLE untuk θ Jawab:
E(Tn − θ)2 = E(Tn − ETn2 + E Tn − θ)2 =E(Tn − ETn2 )2 + (ETn − θ)2
Fungsi likelihoodnya, L(θ; x1 , ..., xn ) = θ1n ; 0 < xi ≤ θ merupakan fungsi dari θ yang monoton turun. Disini kita tidak dapat menen-
= V arTn + [Bias Tn ]2
tukan ELM denga turunan. Perhatikan bahwa, θ ≥ xi ∀i sehingga
Bab 3. Estimasi Titik
106
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
107
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
θ ≥ max(xi ). Ini berarti, L maksimum dicapai pada statistik terurut ke-n yaitu max(xi ). Jadi θb = max(xi ) adalah MLE untuk θ
8. Diketahui X1 , ..., Xn berdistribusi identik dan independen dengan Pn 2 E(Xi ) = µ dan E(|Xi |2 ) < ∞. tunjukkan bahwa T = n(n+1) i=1 Xi adalah estimator konsisten untuk µ. 9. Misalkan X1 , ..., Xn sampel dari U(0, θ). Perlihatkan bahwa T = n Y ( Xi )1\n adalah estimator konsisten untuk θe−1
3.5 Soal-Soal Latihan
i=1
1. Misalkan x1 , x2 , ...xm ; y1 , y2 , ...yn variabel random independen masing-masing berdistribusi N(ε, σ 2 ) dan N(η, τ 2 ). Tentukan statistik cukup untuk ketiga kasus berikut: a) ε, η, σ, τ sembarang dengan − ∼< ε, η <∼, τ, σ > 0 b) σ = τ dan ε, η, σ adalah sembarang
i=1
c) ε = ηdan ε, σ, τ adalah sembarang 2. Diketahui distribusi uniform f (x : θ) = 1θ ,0 ≤ x ≤ θ dan bernilai nol untuk x yang lain. Buktikan bahwa 2X estimator takbias untuk θ. 3. Diketahui θb1 dan θb2 adalah dua estimator takbias untuk θ dari dua eksperimen yang independent. Buktikan bahwa θb = c1 θb1 + c2 θb2 dengan c1 + c2 = 1 juga estimator tak bias untuk θ.
4. Diberikan sampel random yang berukuran n dari populasi yang mempunyai mean µ (diketahui) dan variansi σ 2 . Perlihatkan bahwa n X (Xi − µ)2 merupakan estimator bias untuk varians sampel S 2 = n1
σ2
11. Ukuran efisiensi estimator θb1 terhadap θb2 ditunjukkan oleh
var(θb2 ) . var(θb1 )
Tentukan efisiensi estimator µ b = X1 +2X4 2 +X3 terhadap X jika X1, X2 dan X3 sampel random dari N(µ, σ 2 )
12. Apakah estimator µ b pada soal no.10 konsisten?
13. Diketahui X1 , ..., Xn sampel random yang berdistribusi identik dan independen N(µ, µ); µ > 0. Tentukan estimator tak bias dan konsisten untuk µ2 . 14. Buktikan bahwa proporsi sampel nx adalah UMVUE untuk parameter Binomial θ.
i=1
b tidak 5. Perlihatkan bahwa jika θb estimator tak bias untuk θ dan V ar(θ) 2 2 b sama dengan 0, maka θ bukan estimator tak bias untuk θ .
6. Jika θb estimator dari θ dan bias oleh b = E( h estimator ini diberikan i b + b2 b − θ. Perlihatkan bahwa E (θb − θ)2 = V ar(θ) θ) 7. Perlihatkan, jika θb estimator konsisten untuk θ maka k θb (k 6= 0) estimator konsisten untuk kθ
Bab 3. Estimasi Titik
10. Jika X1 , ..., Xn i.i.d N(µ, σ 2 ). Buktikan p (n − 1)/2Γ [(n − 1)/2] s/Γ [(n/2)] estimator tak bias untuk 2 σ. Petunjuk: gunakan (n−1)S berdistribusi χ2(n−1) dengan σ2 n X 1 (Xi − X)2 S 2 = n−1
108
ISBN 978-602-8310-02-4
15. Diketahui X1 , ..., Xn sampel random i.i.d Gama(α, β); α diketahui dan 0 < β < ∞. tentukan UMVUE untuk β 16. Diketahui X1 , ..., Xn sampel random i.i.d Binomial (1, p); p ∈ (0, 1). Tentukan UMVUE untuk p.
17. Diketahui: x1 , x2 , ...xn variabel random iid berdistribusi exponensial negative, dengan parameter θǫΩ = (0, ∝). Gunakan teorema untuk menemukan UMVU Estimator dari parameter θ.
Bab 3. Estimasi Titik
109
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
18. Misalkan x variabel random berdistribusi binomial negatif dengan parameternya θǫΩ = (∝, 1) .Tentukan UMVU estimator dari g (θ) = 1θ dan cari variansnya.
24. Tentukan estimator momen untuk αdan β, jika x1 , x2 , ...xn variabel random iid berdistribusi Beta dengan parameter αdan β.
19. Diketahui: x1 , x2 , ...xn variabel random iid berdistribusi exponensial negative, dengan parameter θǫΩ = (0, ∝). Gunakan teorema untuk
(λ). Tentukan estimator untuk λ dengan metode momen dan likelihood maksimum.
20. Misalkan x variabel random berdistribusi binomial negatif dengan
26. Diketahui X1 , ..., Xn berdistribusi identik dan independen dengan distribusi f (x; θ) = (θ + 1)xθ ;0 < x < 1 dan nol untuk x yang lain. Tentukan estimator untuk θ dengan metode momen dan likelihood
menemukan UMVU Estimator dari parameter θ.
parameternya θǫΩ = (∝, 1) .Tentukan UMVU estimator dari g (θ) = 1θ dan cari variansinya. 21. Jika x1 , ..., xn nilai-nilai sampel random yang berukuran n dari populasi dengan distribusi f (x; θ) =
(
2(θ−x) ;0 θ2
Tentukan estimator untuk θ dengan metode momen 22. Diketahui X1 , ..., Xn berdistribusi identik dan independen (i.i.d) dengan distribusi seperti berikut : (a) f (x; θ) = θxθ−1 ; 0 < x < 1, 0 < θ < ∞, dan nol untuk x yang lain (b) f (x; θ) = (1/θ) exp [−x/θ] , 0 < x < ∞, 0 < θ < ∞, dan nol untuk x yang lain
(c) f (x; θ) = exp [−(x − θ)] , 0 < x ≤ ∞, −∞ < θ < ∞, dan nol untuk x yang lain. Dalam setiap kasus diatas, tentukan estimator untuk θ dengan metode likelihood maksimum
25. Diketahui X1 , ..., Xn berdistribusi identik dan independen poisson
maksimum. 27. Diketahui X1 , ..., Xn berdistribusi identik dan independen gama (α, β). Tentukan α b dan βb dengan metode momen dan likelihood maksimum. 28. Diketahui sampel random berukuran n dari populasi normal dengan mean µ diketahui, tentukan estimator untuk σ dengan metode likelihood maksimum 29. Diketahui Sampel random berukuran n dari populsi yang mempunyai distribusi f (x; θ) = e−(x−θ) untuk x > θ dan nol untuk x yang lain. Tentukan estimator untuk θ dengan metode likelihood maksimum. 30. Dalam banyak kasus, sepertipada distribusi binomial, Poisson, Normal dan sebagainya terjadi bahwa MLE mean yang diestimasi adalah mean sampel. Namun kasus ini tidak perlu selalu terjadi seperti pada kasus berikut. Misalkan x1 , x2 , ...xn variabel random independen dengan distribusi N (θ, θ) : θǫΩ (0, ∝). Tunjukkan bahwa: MLE dari parameter θadalah:
23. Misalkan x1 , x2 variabel random dengan fungsi padat peluang f (.; θ)yang diberikan oleh:
θ=
2 (θ − x) I(0,θ) (x) ; θǫΩ = (0, ∝) θ Tentukan estimator momen untuk θ.
1 2
"
1+
4 n 2 Σ x n i=1 j
2
−1
#
f (x | θ) =
Bab 3. Estimasi Titik
110
ISBN 978-602-8310-02-4
Bab 3. Estimasi Titik
111
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Bab 4 Estimasi Interval 4.1 Standar Kompetensi Memahami konsep dasar estimasi interval dan mampu menerapkan baik dalam pemecahan masalam matematika, ilmu lain, maupun dalam kehidupan sehari-hari.
4.2 Indikator Hasil Belajar Setelah mengerjakan bab ini Anda diharapkan dapat: 1. Menjelaskan konsep dasar estimasi interval suatu parameter populasi 2. Menentukan interval kepercayaan mean bila variansinya diketahui. 3. Menentukan interval kepercayaan mean bila variansinya tidak diketahui 4. Menentukan interval kepercayaan beda dua mean 5. Menentukan interval kepercayaan untuk varians 6. Menentukan interval kepercayaan untuk rasio dua varians Bab 3. Estimasi Titik
112
ISBN 978-602-8310-02-4
113
Statistika Matematis II/ Edisi E-book
4.3 Uraian Materi
Statistika Matematis II/ Edisi E-book
tergantung pada nilai θ dan distribusi sampling dari θ. Dengan kata lain, _ _ berdasarkan distribusi sampling θ kita pilih L(X )dan U(X ) sehingga
4.3.1 Konsep Dasar Estimasi Interval Sejauh ini telah dibicarakan estimasi titik untuk parameter populasi θ, di mana inferensinya adalah pendugaan harga tunggal terhadap θ. Estimator titik mempunyai kelemahan prinsip yaitu tidak memberikan informasi tentang ketepatan atau keakuratannya. Misalnya, µ b = X adalah estimator terbaik untuk µ dari N(µ, σ 2 ). Jika sampel random yang berukuran n diambil, dan diperoleh X = 3, 5. Apakah dapat diyakini bahwa µ sudah sangat dekat dengan 3, 5 itu ? Untuk mengatasi kelemahan ini, diperkenalkan tipe estimasi lain yaitu estimasi interval. Dalam estimasi interval, atau secara lebih umum disebut juga estimasi himpunan yang dijadikan masa_ lah utama adalah pernyataan bahwa ”θ ∈ c” dengan c ⊂ Ω dan c = c(x). _ _ Ini merupakan himpunan yang ditentukan oleh X =x yang terobservasi. Bila θ berharga real, maka estimator himpunan c adalah interval. Def inisi Estimasi interval untuk parameter θ adalah pasangan fungsi L(x1 , ..., xn ) _
_
dan U(x1 , ..., xn ) dan sampel yang memenuhi L(X ) ≤ U(X )untuk se_ _ _ _ _ mua x∈ χ. Bila X =x terobservasi, dibuat inverensi L(X ) ≤ θ ≤ U(X ). _ _ Interval random [L(X ),U(X )] disebut estimator interval. Seperti definisi _
_
_
P (L(X ) < θ < U(X )) = 1 − α dengan 0 < α < 1
_
terdahulu,[L(X ), U(X )] untuk estimator interval θ berdasar sampel ran_ _ _ dom X = (x1 , ..., xn ) dan [L(X ), U(X )] harga terealisasi dari interval. Meskipun kasus mayoritas yang dibicarakan adalah harga-harga berhingga untuk Ldan U, kadang-kadang kita juga tertarik pada estimasi interval sa_ tu sisi. Sebagai contoh, bila L(x) = −∞, maka kita mempunyai selang satu
sisi (−∞, U(x)). Dengan cara yang sama kita dapat mengambil U(x) = ∞ _ dan mempunyai interval satu sisi [L(x), ∞]. Def inisi
(4.1)
_
_
Interval L(X ) < θ < U(X ) disebut interval kepercayaan (1 − α)100% _ _ dan (1 − α) disebut koefisien kepercayaan. L(X )dan U(X ) berturutturut disebut limit kepercayaan bawah dan limit kepercayaan atas. Misalnya α = 0, 05 memberikan koefisien kepercayaan 0, 95 dan interval kepercayaan 95%. Perhatikan bahwa α yang lain bisa dipilih berdasarkan pertimbangan-pertimbangan statistik. Idealnya, α dipilih sedemikian sehingga panjang interval kepercayaan terpendek, tetapi cakupan probabilitas (1 − α) mendekati nilai 1 (kepastian) Contoh Untuk sampel X1 , X2 , X3 , X4 dan N(µ, 1), estimator interval dari µ adalah _ _ [x −1, x +1]. Ini berarti kita menyatakan bahwa µ berada dalam interval _ ini. Bila kita mengestimasi µ dengan x, P (¯ x = µ) = 0. Tetapi dengan estimator interval, kita mempunyai probabilitas positif untuk benar. Probabi_ _ litas bahwa µ tercakup oleh interval [x −1, x +1]dapat dihitung sebagai _
_
_
_
P [µ ∈ [x −1, x +1]] = P (x −1 ≤ µ ≤x +1) _
= P (−1 ≤x −µ ≤ 1) _
x−µ = P (−2 ≤ √ ≤ 2) 1/4
= P (−2 < z < 2) = 0, 9544. Artinya; lebih dari 95% peluang untuk mencakup parameter (µ) dengan _ _ menggunakan estimator interval [x −1, x +1]. Estimator interval digunakan sebagai pengganti estimator titik dengan tujuan untuk mendapat jaminan pencakupan parameter yang diselidiki. Kepastian jaminan ini dikuantifikasikan dalam definisi berikut.
_
Estimasi inteval untuk parameter θ adalah interval yang berbentuk L(X _
_
_
) < θ < U(X ) dengan L(X )dan U(X ) adalah suatu kuantitas yang tak Bab 4. Estimasi Interval
114
ISBN 978-602-8310-02-4
Def inisi Bab 4. Estimasi Interval
115
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Untuk estimator interval [L(x), U(x)]dari parameter θ cakupan probabi_ _ _ litas dari [L(x), U(x)] adalah probabilitas bahwa interval random. [L(x _ ), U(x)] mencakup parameter θ. Dalam notasi ini dinyatakan dengan _ _ _ _ Pθ (θ ∈ [L(x), U(x)|θ]) atau P (θ ∈ [L(x), U(x)|θ]).
Jika X1 , ..., Xn adalah sampel random populasi seragam (0, θ) dan misalkan Y = maks{X, ..., Xn }, jika ingin mencari estimator interval untuk θ. Pandang dua calon estimator: [aY, bY ], 1 ≤ a < b dan [Y + c, Y + d], 0 ≤ c <
Def inisi
Pθ (θ ∈ [aY, bY ]) = Pθ (aY ≤ θ ≤ bY ) = Pθ 1b ≤ yθ ≤ a1 = Pθ 1b ≤ T ≤ a1 ; (T = yθ ) R1 Jadi, Pθ 1b ≤ T ≤ a1 = 1a ntn−1 dt = ( a1 )n − ( 1b )n
_
_
_
_
Estimator interval [L(x), U(x)] untuk parameter θ, koefisien keperca_ _ yaan dari [L(x), U(x)]adalah infimum probabilitas cakupan atau inf _ _ θ Pθ ([L(x), U(x)]).
d dengan a, b, c, dan d konstanta. (Perhatikan bahwa θ perlu lebih besar dari Y ). Untuk interval pertama didapat:
b
Ada beberapa hal yang perlu diperhatikan dari definisi tersebut. 1. Sangat penting untuk di ingat bahwa interval adalah besaran random, bukan parameter. Akibatnya, bila kita menulis pernya_ _ taan probabilitas seperti Pθ (θ ∈ [L(x), U(x)|θ]), pernyataan probabilitas tersebut menunjuk ke x bukan θ. Dengan perkataan lain, _ _ pikirkan Pθ (θ ∈ [L(x), U(x)|θ]) yang seperti pernyataan tentang
random θ, sebagai sesuatu yang secara aljabar ekivalen dengan _ _ Pθ ([L(x) ≤ θ, U(x) ≥ θ) yaitu pernyataan tentang variabel random _
X . Estimator interval, bersama dengan ukuran kepercayaan, (biasanya koefisien kepercayaan) dikenal dengan nama interval kepercayaan. Interval kepercayaan dengan koefisien kepercayaan sama den-
Cakupan probabilitas interval pertama independen dengan harga θ. Jadi ( a1 )n − ( 1b )n adalah koefisien kepercayaan dari interval. Untuk interval lain, untuk θ ≥ d, perhitungan sejenis menghasilkan: Pθ (θ ∈ [Y + c, Y + d]) = Pθ (Y + c ≤ θ ≤ Y + d]) = Pθ 1 − dθ ≤ T ≤ 1 − θc R 1− c = 1− dθ ntn−1 dt θ
= (1 − θc )n − (1 − dθ )n
untuk keadaan ini, cakupan probabilitas tergantung pada θ. Selanjutnya Limθ→∞ (1 − θc )n − (1 − dθ )n = 0 yang menunjukkan koefisien kepercayaan estimator interval ini sama dengan nol.
gan (1 − α) disebut (1 − α) interval kepercayaan. 2. Hal penting lain berhubungan dengan cakupan probabilitas dan koefisien kepercayaan. Karena kita tidak mengetahui harga sebenarnya dari θ, kita hanya dapat menjamin probabilitas cakupannya sama dengan infimum koefisien kepercayaan. Dalam beberapa kasus hal ini tidak menjadi soal karena cakupan probabilitas merupakan fungsi konstan dari θ. Tetapi, dalam kasus yang lain cakupan proba-
4.3.2 Metode Menentukan Estimasi Interval Ada dua metode untuk menentukan estimator interval yaitu dengan inversi uji hipotesis statistik dan menggunakan besaran pivot. 4.3.2.1 Inversi Uji Statistik
bilitas merupakan fungsi dari θ. Ada hubungan antara estimasi interval dan uji hipotesis. Secara umum dapat dinyatakan bahwa setiap interval kepercayaan berkorespondensi denContoh Bab 4. Estimasi Interval
gan uji hipotesis dan sebaliknya. Jadi dari uji hipotesis dapat diturunkan 116
ISBN 978-602-8310-02-4
Bab 4. Estimasi Interval
117
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
estimasi interval. Namun karena uji hipotesis baru akan dibahas pada Bab V, maka pembahasan tentang hal ini disajikan pada Bab V Sub Bab mulai halaman ...
Tabel 4.1: Besaran Pivot Bentuk Densitas f (x − µ) 1 f ( σx ) σ 1 f ( x σ- µ ) σ
4.3.2.2 Besaran Pivot Metode yang paling bagus dalam mengkonstruksikan himpunan estimator dan menghitung cakupan probabilitas adalah penggunaan besaran pivot. Penggunaan besaran pivot (pivotal quantity) untuk mengkonstruksi himpunan kepercayaan disebut pivotal inverence. Def inisi _
Variabel random Q(X , θ) = Q(x1 , ..., xn , θ) disebut besaran pivot bila dis_ tribusi dari Q(X , θ) independen (tak mengandung) parameter populasi. _ _ _ Dengan kata lain: Jika X ∼ F (x |θ) maka Q(X , θ) mempunyai distribusi yang sama untuk semua harga θ. _
Fungsi Q(X , θ) biasanya secara eksplisit memuat parameter dan statistik, _
tetapi untuk sembarang himpunan A, Pθ Q(X , θ) ∈ A tidak dapat tergantung pada θ. Cara mengkonstruksikan himpunan kepercayaan dari pivot tergantung pada kemampuan mendapatkan pivot dan himpunan A sede_
mikian hingga himpunan {θ : Q(X , θ) ∈ A} adalah himpunan estmatator (interval kepercayaan) dari θ.
Jenis Densitas lokasi skala lokasi/skala
Besaran Pivot _ x −µ _ x _σ x−µ σ
Untuk membuktikan bahwa besaran-besaran di atas merupakan pivot, dapat ditunjukkan bahwa densitasnya independen dari parameter. Contoh Jika x1 , ..., xn sampel random dari populasi N(µ, σ 2 ), maka statistik t = _ x -√ µ adalah pivot, karena distribusi statistik t tidak tergantung pada pas/ n rameter µ dan σ 2 . Contoh P Misalkan x1 , ..., xn iid eksponensial (λ). Maka T = xi adalah statistik cukup untuk λ dan T ∼ Gamma(n, λ). Dalam pdf gamma t dan λ muncul
bersama-sama sebagai
t λ
dan kenyataannya bentuk pdf :
n −1 n−1 −
Gamma(n, λ) = (P (n)λ )
t
e
t λ
adalah keluarga skala. Jika Q(T, λ) = maka Q(T, λ) ∼ gamma n, λ( λ2 ) = gamma(n, 2) yang tidak tergantung pada λ. Besaran Q(T, λ) = 2T adalah pivot dengan λ 2T λ
gamma(n, 2) atau distribusi χ2 .
Kadang-kadang kita dapat melihat bentuk pdf untuk melihat apakah ada
Contoh Dalam kasus lokasi dan skala terdapat banyak besaran pivot. Di sini akan ditunjukkan beberapa. Misalkan x1 , ..., xn adalah sampel random densitas _ ( dalam tabel ) dan misalkan x dan s adalah mean sampel dan deviasi standar.
besaran pivot. Dalam contoh di atas, besaran λt terlihat dalam pdf dan ia _ menjadi pivot. Dalam pdf normal, besaran x σ- µ terlihat dan besaran ini juga merupakan pivot. Secara umum, misalkan pdf statistik T , f (t, θ) dapat dinyatakan | untuk suatu fungsi g dalam bentuk f (t, θ) = g (Q(t, θ)) | ∂Q(t,θ) ∂t dan fungsi monoton Q (dalam t untuk setiap θ). Maka Q(t, λ) merupakan pivot.
Bab 4. Estimasi Interval
118
ISBN 978-602-8310-02-4
Bab 4. Estimasi Interval
119
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
2T }. 9,59
Begitu mendapat pivot, selanjutnya bagaimana menggunakannya untuk _ membangun himpunan kepercayaan?. Bila Q(x, λ) merupakan pivot, maka untuk harga tertentu α dapat ditemukan bilangan-bilangan adan b yang
Untuk persoalan lokasi dengan kondisi variansi tidak diketahui pun pembangunan dan perhitungan interval pivot relatif mudah.
tidak tergantung pada θ dan memenuhi:
Contoh
Pθ (a ≤ Q(t, θ) ≤ b) ≥ 1 − α _
Jika X1 , ..., Xn iid N(µ, σ 2 ) maka
_
Maka untuk setiap θ0 ∈ Ω, A(θ0 ) = {x: a ≤ Q(x, θ0 ) ≤ b}adalah daerah penerimaan untuk uji taraf α dari H0 : θ = θ0 . Hal ini memberikan hasil
adalah pivot. Bila σ 2 diketahui, ki-
ta dapat menggunakan pivot ini untuk menghitung interval kepercayaan untuk µ. Untuk sebarang konstanta a
bahwa himpunan kepercayaan (1 − α) untuk θ adalah: _
_
( x−µ ) √ σ/ n
_
P (−a ≤
_
C(x) = {θ0 : a ≤ Q(x, θ0 ) ≤ b}
( x −µ ) √ ≤ a) = P (−a ≤ Z ≤ a) σ/ n _
_
Sehingga interval kepercayaan adalah {µ :x −a √σn ≤ λ ≤x +a √σn }. Bila σ 2 tidak diketahui, kita dapat menggunakan pivot skala-lokasi _
Karena
Contoh
( x−µ ) √ s/ n
_
( x−µ ) √ . s/ n
mempunyai distribusi _
Dalam contoh di muka telah didapatkan interval kepercayaan untuk λ dari pdf eksponensial dengan menginversikan LRT taraf α dari H0 : λ = λ0 vs H1 : λ 6= λ0 . Sekarang kita juga melihat bila kita mempunyai sampel P 2 X1 , ..., Xn kita dapat mendefinisikan T = Xi dan Q(T, λ) = 2λT ∼ X2n . Bila kita memilih konstantq a dan b sedemikian hingga memenuhi P (a ≤ 2 X2n ≤ b) = 1 − α, maka Pλ (a ≤
2T λ
≤ b) = Pλ (a ≤ Q(T, λ) ≤ b)
=1−α
A(λ) = {t : a ≤ ≤λ≤
s s _ _ {µ :x −tn−1, α2 √ ≤ µ ≤x +tn−1, α2 √ } n n dan ini merupakan interval kepercayaan (1 − α) klasik untuk µ berdasar
Dalam estimasi interval dua besaran dibandingkan satu dengan lainnya
2T ≤ b} λ
2t } a
yang merupakan interval keperca-
120
ISBN 978-602-8310-02-4
yaan (1 − α). Bila n = ω, interval kepercayaan 95% adalah {λ : Bab 4. Estimasi Interval
Jadi untuk α tertentu bila kita mengambil a = tn−1, α2 , kita mendapatkan bahwa interval kepercayaan (1 − α) adalah
4.3.3 Metode Evaluasi Estimasi Interval
Dengan menginversikan himpunan:
2t b
( x −µ ) √ ≤ a) = P (−a ≤ Z ≤ a). σ/ n
distribusi−t.
2 = P (a ≤ X2n ≤ b)
memberikan C(t) = {λ :
P (−a ≤
2T 34,17
≤λ≤
melalui ukuran dan kemampuan akurasi cakupannya. Tentu saja yang diinginkan adalah suatu interval yang mempunyai ukuran (panjang) yang kecil dan cakupan probabilitas besar. Cakupan probabilitas dari interval kepercayaan pada umumnya merupakan fungsi parameter. Karena itu, Bab 4. Estimasi Interval
121
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
ukuran yang paling banyak digunakan adalah kelakuan koefisien kepercayaan, yaitu infimum cakupan probabilitas ukuran dan probabilitas cakupan. Permasalahan dapat dirumuskan sbb: diberikan probabilitas cakupan
Tabel 4.3: Panjang interval kepercayaan a −1, 34 −1, 44 −1, 65
tertentu, carilah interval kepercayaan terpendek. Contoh Misalkan X1 , ..., Xn iid N(µ, σ 2 )dengan σ diketahui. Telah kita ketahui _ bahwa Z = σx/-√µn adalah besaran pivot dengan distribusi normal baku dan setiap anggota yang memenuhi P (a ≤ Z ≤ b) = 1 − α akan memberikan interval kepercayaan (1 − α)
σ σ _ {µ :x −b √ ≤ µ ≤x −a √ } n n _
Masalahnya menjadi: Berapa nilai a dan b yang terbaik ?, Dengan kata lain; Berapa nilai a dan b yang akan meminimumkan panjang interval ke-
b 2, 33 1, 96 1, 65
Probabilitas P (z < a) = 0, 09; P (z > b) = 0, 01 P (z < a) = 0, 075; P (z > b) = 0, 025 P (z < a) = 0, 05; P (z > b) = 0, 05
b-a 3, 67 3, 40 3, 30
Teorema Unimodal Misalkan f (x) pdf yang unimodal. Bila interval [a, b] memenuhi 1.
Rb a
f (x)dx = 1 − α
2. f (a) = f (b) > 0dan 3. a ≤ x∗ ≤ b, dengan x∗ modus f (x).
percayaan dengan tetap mempertahankan cakupan (1 - α)?. Perhatikan σ √ bahwa panjang interval kepercayaan sama dengan (b−a) . Karena faktor n σ √ adalah bagian dari setiap panjang interval, ia dapat diabaikan dan pern
maka [a, b]adalah interval kepercayaan yang terpendek di antara intervalinterval yang memenuhi kreteria nomer 1.
bandingan panjang hanya bisa berdasarkan pada harga b − a.
Bukti
Sehingga masalah sekarang menjadi; mencari pasangan bilangan a dan b yang memenuhi P (a < z < b) = 1 − α dan meminimumkan (b − a). Biasanya diambil a = z − z α2 dan b = z α2 tanpa menyebutkan apa yang
membuat optomal. Jika diambil 1 − α = 0, 90 maka setiap pasangan bilangan berikut memberikan interval 90%.
Pengalaman numerik ini menyarankan bahwa pemilihan a = −1, 65 dan b = 1, 65 memberikan interval kepercayaan terbaik. Perlu dicatat bahwa strategi untuk membagi interval dua sama besar (simetris) terbukti optimal dalam contoh di atas, tapi tidak selalu demikian. Untuk kasus di atas disebabkan oleh kenyataan bahwa tinggi dari pdf -nya adalah sama di −z α2
dan z α2 .
Bab 4. Estimasi Interval
122
ISBN 978-602-8310-02-4
Misalkan [a1 , b1 ] adalah sebarang interval dengan b1 − a1 < b − a. R b1 Akan ditunjukkan bahwa ini mengakibatkan a1 f (x)dx < 1 − α. Hasil ini akan dibuktikan hanya untuk a1 < a. Untuk kasus a < a1 dapat dibuktik-
an secara analog. Juga dua kasus yang perlu diperhatikan adalah b1 ≤ a dan b1 > a.
Bila b1 ≤ a maka a1 ≤ b1 ≤ a ≤ x∗ dan Rb R b1 f (x)dx ≤ f (b1 )(b1 −a1 ) ≤ f (a1 )(b1 −a1 ) < f (a)(b−a) ≤ a f (x)dx = 1−α a1
Bila b1 > a maka a1 ≤ a ≤ b1 < b, karena bila b1 lebih besar atau sama
dengan b, maka b1 − a1 lebih besar atau sama dengan b − a. Dalam keadaan ini, dapat ditulis: R b1 Rb Ra Rb f (x)dx = a f (x)dx + [ a1 f (x)dx − b1 f (x)dx] a1
Bab 4. Estimasi Interval
123
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book Ra Rb = 1 − α + [ a1 f (x)dx − b1 f (x)dx]
dan teorema terbukti bila dapat ditunjukkan bahwa pernyataan dalam kurung negatif. Sekarang, dengan menggunakan unimodalitas f, urutan a1 ≤ a ≤ b1 ≤ b, dan didapat: Ra Rb f (x)dx ≤ f (a)(a − a1 ) dan b1 f (x)dx ≥ f (b)(b − b1 ) a1 Jadi Ra Rb f (x)dx − b1 f (x)dx ≤ f (a)(a − a1 ) − f (b)(b − b1 ) a1 1
Statistika Matematis II/ Edisi E-book
Jika X adalah nilai mean sampel dari populasi normal dengan mean µ dan variansi σ 2 (diketahui). Tunjukkan interval kepercayaan (1 − α)100% untuk µ diberikan oleh: σ σ X − zα/2 . √ < µ < X + zα/2 . √ n n Penjelasan: X ∼ N(µ, σ 2 ) ⇒ X ∼ N(µ, σ 2 /n) ⇒ Z =
1
= f (a) [(a − a ) − (b − b )] bernilai negatif. q.e.d
Karena itu P
Contoh _
Untuk interval kepercayaan normal berdasarkan pivot sx/-√µn , kita mengetahui bahwa interval kepercayaan (1 − α) yang mempunyai panjang terpendek mempunyai bentuk x
−b √sn
_
X−µ √ ∼ N(0, 1) σ/ n
(4.3)
Perhatikan bahwa P −zα/2 < z < zα/2 = 1 − α dengan zα/2 adalah kuantitas sehingga P (Z > zα/2 ) = α/2
= f (a) [(b1 − a1 ) − (b − a)]
_
(4.2)
−a √sn
≤ µ ≤x mempunyai a = −tn−1, α2 dan b = tn−1, α2 . Panjang interval merupakan fungsi S, dengan bentuk umum: P anjang(s) = (b −
atau
X −µ √ < zα/2 = 1 − α −zα/2 < σ/ n
σ σ P (X − zα/2 . √ < µ < X + zα/2 . √ ) = 1 − α n n
(4.4)
(4.5)
Jadi interval kepercayaan (1 − α)100% untuk µ adalah: σ σ X − zα/2 . √ < µ < X + zα/2 . √ n n
(4.6)
a) √sn .
Selanjutnya, jika dipandang kriteria harga harapan panjang (s) dan menginginkan untuk mendapatkan interval (1 − α) untuk meminimumkan. Eσ (panjang (S) ) = (b − a) E√σnS = (b − a)C(n) √Sn . Maka Teorema di depan berlaku dan pemilihan a = −tn−1, α2 dan b = tn−1, α2 memberikan interval kepercayaan yang optimal.
Untuk sampel besar (n ≥ 30) dapat digunakan TLP, sehingga inte-
val kepercayaan 4.6berlaku juga untuk variabel random sembarang (bukan distribusi tidak normal).
2. Interval untuk mean µ, dengan variansi σ 2 tidak diketahui. Jika x adalah nilai mean sampel dari populasi normal dengan mean µ dan variansi σ 2 tidak diketahui, maka interval kepercayaan (1 − α)100% untuk µ adalah:
4.3.4 Estimasi Interval Kepercayaan Khusus X − tα/2,n−1 . √
4.3.4.1 Interval Kepercayaan untuk Mean 1. Interval untuk mean µ, dengan variansi σ 2 diketahui. Misalnya X variabel random yang berdistribusi N(µ, σ 2 ), dengan µ tidak diketahui. Bab 4. Estimasi Interval
124
ISBN 978-602-8310-02-4
S S < µ < X + tα/2,n−1 . √ n−1 n−1
(4.7)
Penjelasan: Karena variansinya σ 2 tidak diketahui maka dapat diganti dengan Bab 4. Estimasi Interval
125
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
variansi sampel:
Statistika Matematis II/ Edisi E-book
akibatnya,
n
1X (Xi − X)2 S = n i=1 2
(4.8)
sebagai estimator untuk σ 2 . Sebab jika xi berdistribusi N(µ, σ 2 ) maka √ nS 2 /σ 2 berdistribusi χ2(n−1) dan n(x − µ)/σ berdistribusi t(n−1) .
X − Y ∼ N(µ1 − µ2 , σ 2 /n + σ 2 /m) ⇒
Karena nS12 /σ 2 ∼ χ2(n−1) dan mS22 /σ 2 ∼ χ2(m−1) maka (nS12 + mS22 )/σ 2 ∼
χ2(n+m−2) . Diperoleh
4.3.4.2 Interval Kepercayaan untuk Perbedaan Mean T = Sering kali lebih memungkinkan untuk melakukan estimasi interval untuk
Interval untuk mean µ1 − µ2 dengan variansi σ 2 > 0 tidak diketahui.
X − Y − (µ1 − µ2 ) p : (nS12 + mS22 )/σ 2 (n + m − 2 1/2 (4.13) σ 2 /n + σ 2 /m
X − Y − (µ1 − µ2 ) = q ∼ t(n+m−2) nS12 +mS22 (1/n + 1/m n+m−2
selisih parameter populasi µ1 −µ2 daripada untuk masing-masing. Misalkan X1 , X2, ..., Xn dan Y1 , Y2, ..., Ym dua sampel random dari dua populasi yang independen N(µ1 , σ 2 ) dan N(µ2 , σ 2 ); σ > 0 tidak diketahui. Masalah yang dihadapi sekarang, bagaimana inferensi interval untuk parameter perbedaan mean yaitu µ1 − µ2 ?
P ( X − Y − aR < µ1 − µ2 < X − Y + aR) = 1 − α
dengan
R=
s
(1/n + 1/m
nS12 + mS22 n+m−2
(4.15)
(4.16)
Jadi interval kepercayaan (1 − α)100% untuk perbedaan mean adalah
diketahui, maka interval kepercayaan (1 − α)100% adalah:
dengan a = t(α/2;n+m−2) dan R =
(4.14)
Interval kepercayaan (1 − α)100% adalah P (−a < T < a) = 1 − α; dengan a = tα/2;n+m−2 dan
Jika X dan Y berturut-turut mean sampel berukuran n dan m yang saling independen dari populasi N(µ1 , σ 2 ) dan populasi N(µ2 , σ 2 ) ;σ 2 > 0 tidak X − Y − aR < µ1 − µ2 < X − Y + aR
X − Y − (µ1 − µ2 ) p ∼ N(0, 1) (4.12) σ 2 /n + σ 2 /m
(4.9)
q (nS12 +nS22 (1/n + 1/m) (n+m−2)
X − Y − aR < µ1 − µ2 < X − Y + aR X − Y − aR < µ1 − µ2 < X − Y + aR
(4.17)
Penjelasan: 4.3.4.3 Interval Kepercayaan untuk Variansi Variansi sampelnya berturut-turut S12 dan S22 . Perhatikan bahwa Setelah di drpan dibahas interval kepercayaan untuk mean µ, maka kini Xi (i = 1, 2, ..., n) ∼ N(µ1 , σ 2 ) ⇒ X ∼ N(µ1 , σ 2 /n)
(4.10)
dibahas interval kepercayaan untuk variansi σ 2 .
Yj (j = 1, 2, ..., m) ∼ N(µ2 , σ 2 ) ⇒ Y ∼ N(µ2 , σ 2 /m)
(4.11)
Interval untuk variansi σ 2 dengan mean µ yang tidak diketahui.
dan
Bab 4. Estimasi Interval
126
ISBN 978-602-8310-02-4
Bab 4. Estimasi Interval
127
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Jika X1 , X2, ..., Xn sampel random dari distribusi N(µ, σ 2 ) dengan µ tidak diketahui maka interval kepercayaan (1 − α)100% untuk σ 2 adalah: ns
2
χ2(1−α/2,n−1)
ns
< σ2 <
Statistika Matematis II/ Edisi E-book
Dengan metode likelihood diperoleh: n X b12 = S12 = 1/n (Xi − X)2 µ b1 = X, σ
2
χ2(α/2;n−1)
(4.18)
(4.23)
i=1
dan
n X µ b2 = X, σ b22 = S22 = 1/n (Yi − Y )2
Penjelasan:
(4.24)
i=1
Dengan menggunakan metode likelihood maksimum diperoleh σ b2 = S 2 = n X 1/n (Xi − X)2 dan variabel random nS 2 /σ 2 berdistribusi χ2(n−1) karena itu,
nS12 /σ12 ∼ χ2(n−1) .mS22 /σ22 ∼ χ2(m−1) dan independen ⇒ F =
i=1
P (χ2(α/2,n−1) < nS 2 /σ 2 < χ2(1−α/2,n−1) = 1 − α atau P
ns2 χ2(1−α/2,n−1)
2
<σ <
ns2 χ2(α/2;n−1)
!
=1−α
(4.19)
(4.20)
Jadi interval kepercayaan untuk σ 2 adalah ns2 ns2 < σ2 < 2 χ2(1−α/2,n−1) χ(α/2;n−1)
(4.21)
4.3.4.4 Interval Kepercayaan untuk Rasio Dua Variansi Interval kepercayaan untuk σ22 /σ12 dengan µ1 dan µ2 tidak diketahui. Jika X1 , X2, ..., Xn dan Y1 , Y2, ..., Yn dua sampel random yang saling independen dari populasi N(µ1 , σ 2 ) dan populasi N(µ2 , σ 2 ) dengan µ1 dan µ2 tidak diketahui, maka interval kepercayaan (1 − α)100% untuk σ22 /σ12 adalah mS22 /(m − 1) σ2 mS22 /(m − 1) 1 < 22 < F(1−α/2;n−1;m−1) (4.22) F(1−α/2;m−1;n−1) nS12 /(n − 1) σ1 nS12 /(n − 1)
(4.25)
Karena itu nS12 / [σ12 (n − 1)] P F(α/2;n−1;(m−1) < = 1 − α (4.26) < F (1−α/2;n−1;m−1) mS22 / [σ22 (m − 1)]
atau mS22 /(m − 1) σ22 mS22 /(m − 1) P F(α/2;n−1;(m−1) < < F = 1−α (1−α/2;n−1;(m−1) nS12 /(n − 1) σ12 nS12 /(n − 1) (4.27) atau σ2 mS22 /(m − 1) mS22 /(m − 1) 1 < 22 < F(1−α/2;n−1;m−1) = 1− P 2 2 F(1−α/2;m−1;n−1) nS1 /(n − 1) σ1 nS1 /(n − 1) (4.28) Jadi interval kepercayaan (1 − α)100% untuk σ22 /σ12 adalah mS22 /(m − 1) σ2 mS22 /(m − 1) < 22 < F(1−α/2;n−1;m−1) (4.29) 2 F(1−α/2;m−1;n−1) nS1 /(n − 1) σ1 nS12 /(n − 1) 1
4.4 Soal-Soal dan Pembahasan 1. Tentukan interval kepercayaan 95 % untuk mean dari N(µ, 9) dengan sampel berukuran 100 dan x = 5 Jawab:
Penjelasan: Bab 4. Estimasi Interval
nS12 / [σ12 (n − 1)] ∼ F(n−1;m−1) mS22 / [σ22 (m − 1)]
128
ISBN 978-602-8310-02-4
Bab 4. Estimasi Interval
129
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
(1 − α)100% = 95% ⇒ (1 − α) = 0, 95 Berdasarkan tabel Z, untuk (1 − α) = 0, 95 diperoleh zα/2 = 1, 96. Untuk σ 2 = 9 dan n = 100 diperoleh zα/2 . √σn = 1, 96.3/10 = 0, 588 Menurut teorema 8, interval kepercayaan 95% untuk µ adalah X − zα/2 . √σn < µ < X + zα/2 . √σn ⇔ 5 − 0, 588 < µ < 5 + 0, 588 ⇔ 4, 412 < µ < 5, 588 2. Diketahui X1 , X2, ..., X10 sampel random dari N(µ, σ 2 ) ; µ dan σ 2 keduanya tidak diketahui. Misalnya dari hasil eksperimen diperoleh x = 3, 22 dan s = 1, 05. Tentukan interval kepercayaan 90% untuk µ. Jawab: Berdasarkan Tabel t, diperoleh t(0,05;9) = 1, 833. Interval kepercayaan 90% untuk µ adalah 3, 22−2, 833.1, 05/3 < µ < 3, 22+1, 833.1, 05/3 ⇔ 2, 56095 < µ < 3, 87905
Statistika Matematis II/ Edisi E-book
4. Jika dari data yang diobservasi dari populasi normal diperoleh s = 2, 2 dan n − 16. Tentukan interval kepercayaan 98% untuk σ 2 ! Jawab: Dari tabel χ2 diperoleh χ2( 0,01;15) = 5, 23 dan χ2( 0,99;15) = 30, 6 sehingga diperoleh 16(2, 2)2 16(2, 2)2 < σ2 < ⇔ 2, 53 < σ 2 < 14, 81 30, 6 5, 23
5. Misalkan dua sampel random yang berukuran 10 dan 5 diambil dari dua populasi yang independet yaitu N(µ1 , σ 2 ) dan populasi N(µ2 , σ 2 ). Dari hasil observasi tersebut diperoleh S12 = 20, 0 dan σ2 S22 = 35, 6. Tentukan interval kepercayaan 95% untuk σ22 bila kedua 1
mean populasi tidak diketahui. Jawab:
3. Diketahui dua sampel random yang independen yang masingmasing berukuran 10 dan 7 yang diambil dari dua populasi berdistribusi N(µ1 , σ 2 ) dan N(µ2 , σ 2 ). Misalkan x = 4, 2, y = 3, 4, dan S22 = 32, tentukan interval kepercayaan 90% untuk µ1 − µ2 .
Dalam hal ini, 1 − α/2 = 0, 975, n = 10 dan m = 5. Berdasarkan
tabel F, diperoleh F(0,975;9;4) = 8, 90 dan F(0,975;4;9) = 4, 72 sehingga menurut teorema 12 1 5(35, 6)/4 σ2 5(35, 6)/4 < 2 < (8, 90) 4, 72 10(20, 0)/9 σ12 10(20, 0)/9
Jawab:
R=
s
(1/n + 1/m
(4.33)
nS12 + mS22 = n+m−2
r
(1/10 + 1/7)
490 + 224 = 3, 4 15 (4.30)
Dari tabel t diperoleh a = t(0,05;15) = 1, 753. Sehingga menurut teorema 11, diperoleh 0, 8−1, 753.3, 4 < µ1 −µ2 < 0, 8+1, 753.3, 4 ⇔ −5, 16 < µ1 −µ2 < 6, 76
atau 0, 4 <
σ22 < 17, 8 σ12
Jadi interval kepercayaan 95% untuk
σ22 σ12
(4.34)
(4.35)
adalah 0, 4 <
σ22 σ12
< 17, 8
4.5 Soal-Soal Latihan
(4.31)
1. Diketahui nilai observasi mean x dari sampel random yang berukuran 20 dari distribusi n(µ, 80) adalah 81, 2. Tentukan 95% interval
Jadi interval kepercayaan 90% untuk µ1 − µ2 adalah −5, 16 < µ1 − µ2 < 6, 76 Bab 4. Estimasi Interval
130
(4.32)
ISBN 978-602-8310-02-4
kepercayaan untuk µ Bab 4. Estimasi Interval
131
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
2. Misalkan x mean dari sampel random yang berukuran n dari distribusi n(µ, 9). Tentukan n sehingga P (x − 1 < µ < x + 1) = 0, 90
10. Diketahui dua variabel random X dan Y yang bebas secara probabilitas dengan distrubusi binomial yang mempunyai parameter n1 = n2 = 100, dan berurut p1 dan p2 . Dari observasi diperoleh x = 50
3. Diketahui sampel random yang berukuran 17 dari distribusi normal N(µ, σ 2 ) diperoleh x = 4, 7 dan s2 = 5, 76. Tentukan 90 % interval kepercayaan untuk µ. 4. Jika X1 , X2, ..., X9 sampel random berukuran 9 dari distribusi N(µ, σ 2 ) (a) Jika σ diketahui, tentukan peluang 95% interval kepercayaan untuk µ jika interval ini didasarkan pada variabel random √ 9(x − µ)/σ
dan y = 40.Tentukan interval kepercayaan 95% untuk p1 − p2 11. Diketahui X dan Y mean dari dua sampel random yang masingmasing berukuran n dari distribusi N(µ1 , σ 2 ) dan N(µ2 , σ 2 ); dengan σ diketahui. Tentukan n sehingga P ( X − Y − σ/5 < µ1 − µ2 < X − Y + σ/5) = 0, 90
(4.36)
12. Seperti teorema 10, tentukan interval kepercayaan (1−α)100% untuk σ 2 bila µ diketahui
(b) Jika σ tidak diketahui, tentukan nilai harapan dari panjang 95% interval kepercayaan untuk µ jika interval didasarkan pada va√ riabel random 8(x − µ)/S
13. Jika 8, 6; 7, 9; 8, 3; 6, 4; 8, 4; 9, 8; 7, 2; 7, 8; 7, 5 adalah nilai yang diobservasi dari sampel random yang berukuran 9 dari N(8, σ 2 ). Tentukan
5. Diketahui Y berdistribusi Binomial (n, p). Tentukan interval kepercayaan (1 − α)100% untuk p. (petunjuk : pertimbangkan Y /n sebagai
14. Dari hasil observasi suatu sampel random yang berukuran 15 dari distribusi N(µ, σ 2 ) diperoleh x = 3, 2 dan s2 = 4, 24 . Tentukan inte-
estimator untuk p; dengan Y banyak sukses dalan n percobaan
6. Dari soal no 9berapakah n terkecil yang menjamin (dengan probabilitas 1 − α) bahwa y/n terletak dalam jarak d dari p 7. Misalkan Y berdistribusi b(300, p). Jika nilai observasi dari Y adalah y = 75, tentukan interval kepercayaan 95% untuk p 8. Diketahui dua sampel random yang masing-masing berukuran 10 yang dari dua distribusi normal independen N(µ1 , σ 2 ) dan N(µ2 , σ 2 ) dari observasi diketahui x = 4, 8, S12 = 8, 64, y = 5, 6, S22 = 7, 88. Tentukan inteval kepercayaan 95% untuk µ1 − µ2 . 9. Tentukan interval kepercayaan untuk perbedaan µ1 − µ2 antara dua mean dari dua distribusi normal yang independen jika kedua vari-
132
rval kepercayaan 95% untuk σ 2 15. Diketahui dua sampel random independent yang berukuran n = 16 dan m = 10 diambil dari populasi independent N(µ1 , σ 2 ) dan N(µ2 , σ 2 ) . Misal x = 3, 6 dan s21 = 4, 14 dan Y = 13, 6 dan s22 = 7, 26. σ2
Tentukan interval kepercayaan 90% untuk σ22 bila kedua mean pupo1 lasi tidak diketahui. 16. Seperti teorema 11, tentukan interval kepercayaan (1 − α)100% bila kedua mean pupulasi diketahui.
17. Misalkan S12 dan S22 notasi variansi sapel random yang berukuran n dan m dari dua distribusi independen N(µ1 , σ 2 ) dan N(µ2 , σ 2 ).Tentukan interval kepercayaan (1 − α)100% untuk σ 2 18. Misalkan X1 , X2, ..., Xn sampel random yang berikuran 6 dari distrinusi Gamma(1 − β); β > 0 tidak diketahui. Tentukan interval keper-
ansinya diketahui (tidak perlu sama) Bab 4. Estimasi Interval
interval kepercayaan 90% untuk σ 2
ISBN 978-602-8310-02-4
Bab 4. Estimasi Interval
133
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
cayaan (1 − α)100% untuk β. Petunjuk : Pertimbangkan distribusi 6 X dari2 Xi /β i=1
19. Diketahui Y4 = order statistik ke -4 dari sampel random berukuran 4 dari disttribusi uniform (0, θ). Tentukan a dan b. Dengan 0 < a < b ≤ 1 sehingga P (aθ < Y4 < bθ) = 0, 95. Kemudian tentukan interval keperayaan 95% untuk θ.
Bab 5 Hipotesis Statistik 5.1 Standar Kompetensi Memahami konsep dasar uji hipotesis statistik dan mampu menerapkannya baik dalam pemecahan masalah matematika, ilmu lain, maupun dalam kehidupan sehari-hari
5.2 Indikator Hasil Belajar Setelah mengerjakan bab ini Anda diharapkan dapat: 1. Menjelaskan konsep dasar hipotesis dan hipotesis statistik 2. Menganalisis uji hipotesis berdasarkan uji ratio likelihood 3. Menjelaskan tipe kesalahan suatu uji hipotesis statistik 4. Membedakan antara hipotesis sederhana dengan hipotesis gabungan 5. Menentukan daerah kritis suatu uji hipotesis 6. Menentukan fungsi kekuatan uji hipotesis Bab 4. Estimasi Interval
134
ISBN 978-602-8310-02-4
135
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
7. Menggunakan teorema Neyman-Pearson untuk menentukan daerah kritik terbaik 8. Menentukan uji paling kuat seragam dari suatu uji hipotesis 9. Menentukan uji hipotesis dengan menggunakan uji rasio likelihood
H0 : θ ∈ Ω0 danH1 : θ ∈ Ωc0 dengan Ω0 suatu himpunan bagian dari ruang parameter dan Ωc0 adalah komplemennya dimana Ω0 ∪ Ωc0 = Ω = {θ; −∞ < θ < ∞} . Dalam uji hipotesa sesudah mengobservasi sampel, harus ditentukan apakah menerima H0 yang berarti menolak H1 atau menerima H1 yang berarti
5.3 Uraian Materi
menolak H0 .
5.3.1 Konsep Dasar Uji Hipotesis
Def inisi
Sejauh ini telah dibahas inferensi titik dan interval. Sekarang diperkenalkan metode inferensi yang lain yaitu uji hipotesis
Himpunan bagian ruang sampel dimana H0 ditolak disebut daerah penolakan atau daerah kritis. Komplemen daerah penolakan disebut daerah
Secara umum dapat didefinisikan bahwa Hipotesa adalah pernyataan tentang parameter populasi. Hal ini dapat berupa pernyataan bahwa µ1 = µ2 vs µ1 6= µ2 dan lain-lain. Sedangkan Hipotesis Statistik adalah pernyataan
tentang distribusi dari satu atau lebih sampel random yang diambil dari populasi. Tujuan dari uji hopotesis statistik adalah untuk memutuskan berdasarkan sampel, mana dari dua hopetesis (yang saling asing) yang benar. Dua hipotesis yang saling asing itu biasa disebut hipotesis nol (H0 ) dan hipotesis alteratif (H1 ). Misal H0 : g(x) ∼ N(10, σ 2 )
(5.1)
H1 : g(x) ∼ N(µ, σ ), µ 6= 10
(5.2)
2
Untuk mempermudah kedua hipotesis statistik ini cukup ditulis sbb:
penerimaan. Jika rentang H1 seluruhnya terletak pada satu sisi dari nilai H0 , alternatif itu dikatakan satu sisi. Jika H1 memuat semua nilai parameter kecuali satu nilai H0 maka alternatif itu disebut dua sisi. Jika pernyataan suatu hipotesis berkaitan hanya dengan satu distribusi maka disebut hipotesis tunggal (sederhana), sedangkan jika berkaitan lebih dari satu distribusi dinamakan hipotesis majemuk (gabungan). Sebagai contoh: H0 : µ ≤ 10 vs H1 : µ > 10 merupakan hipotesis majemuk. Jika H0 diganti dengan µ = 10 maka diperoleh hipotesis tunggal.
5.3.2 Uji Rasio Likelihood Metode rasio likelihood atau likelihood ratio test (LRT) dalam uji hipotesis berhubungan dengan estimator likelihood maksimum dan uji tersebut secara luas dapat diterapkan. Ingat bila x1 , ..., xn adalah sampel random dari populasi dengan densitas f (x|θ) (θbisa berupa vektor), fungsi likelihood didefinisikan sebagai
H0 : µ = 10 vs H1 : µ 6= 10 Def inisi
n
Dua buah peryataan (hipotesa) yang saling asing dalam persoalan uji hipotesa disebut hipotesa nol dan hipotesa alternatif. Masing-masing dinyatakan dengan H0 dan H1 . Bila θ menyatakan parameter populasi, format
Misalkan Ω dinyatakan ruang parameter. Uji rasio likelihood didefinisikan
umum dari hipotesa nol dan alternatif adalah:
sebagai berikut.
Bab 5. Hipotesis Statistik
136
ISBN 978-602-8310-02-4
_
L(θ|x1 , ..., xn ) = f (x |θ) =⊓i=1 f (xi |θ)
Bab 5. Hipotesis Statistik
137
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book _
LRT adalah uji yang menolak H0 untuk harga-harga λ(x) kecil. Dengan menggunakan 5.3 didapat daerah penolakan:
Def inisi Uji statistik rasio likelihood (LRT ) untuk uji H0 : θ ∈ Ω0 vsH1 : θ ∈ Ωc0 adalah ΩSup x) o L(θ|¯ ΩSup L(θ|¯ x)
λ(¯ xn ) =
_
_
{x : λ(x) ≤ C} = {x : | x −θ0 | ≥ dimana 0 < c < 1,dan 0 <
Uji rasio likelihood adalah uji sedemikian hingga daerah penolakan mem_ _ punyai bentuk:{x: λ(x) ≤ C}dengan C sembarang bilangan yang meme-
nuhi 0 ≤ C ≤ 1. Contoh
q
−2 log c n
r
−2 log c } n
< ∞. Jadi LRT adalah uji yang meno-
lak H0 bila mean sampel berbeda dengan θ0 melebihi harga tertentu yang ditetapkan.
Bila T (x) statistik cukup antara θ dengan densitas g(t|θ), maka dapat dipikirkan untuk mengkonstruksikan LRT berdasar pada T dan fungsi like_ lihoodnya L ∗ (θ|t) = g(t|θ) sebagai pengganti sampel x dan fungsi likeli_ hoodnya L(θ| x). Misalkan λ∗ (t) menyatakan uji statistik rasio likelihood _ berdasar T . Hal ini masuk akal karena semua informasi tentang θ dari x _
Misalkan x1 , ..., xn adalah sampel random dari populasi N(θ, 1). Pandang uji hipotesa H0 : θ = θ0 vsH1 : θ 6= θ0 . Di sini θ0 adalah bilangan tertentu. _ Karena H0 hanya menentukan satu bilangan, maka pembilang dari λ(x) _ adalah L(θ0 | x). MLE dari θ untuk ruang parameter tanpa kendala adalah _ _ _ mean sampel x. Jadi penyebut dari λ(x) adalah L(x |x). Sehingga statistik
LRT adalah
_
λ(x) =
P (2π)− n/2 exp [− (xi − θ0 )2 /2] P _ (2π)− n/2 exp [− (xi − x)2 /2]
_
da θ. Jadi,
_
X
_
Bila T (x) statistik cukup untuk θ, sedangkan λ∗ (t) dan λ(t) masing-masing _ _ _ adalah statistik LRT berdasar T dan x maka λ∗ T (x), dimana λ(x)untuk _ setiap x dalam ruang sampel.
_
λ(¯ xn ) =
_
(xi − x)2 + n(xi − θ0 )2
_ λ(x) = exp −n(xi − θ0 )2 /2 138
_
SupΩog(T (x)|θ) h(x) SupΩoL(θ|¯ x) = _ _ SupΩ L(θ|¯ x) SupΩ (g(T (x)|θ) h(x)
=
Jadi, statistik LRT adalah
Bab 5. Hipotesis Statistik
_
Dengan teorema faktorisasi, densitas dari x dapat ditulis sebagai f (x |θ) = _ g (T (x |θ) h(x) dengan g(t|θ) adalah densitas dan h(x) tidak tergantung pa-
Pernyataan untuk λ(x) dapat disederhanakan, karena: (xi − θ0 )2 =
T eorema
Bukti
h X i X _ = exp − (xi − θ0 )2 + (xi − x)2 /2
X
termuat dalam T (x).
=
(5.3)
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
SupΩof (¯ x | θ) SupΩ f (¯ x | θ) SupΩo g(T (¯ x) | θ) SupΩ g(T (¯ x) | θ) 139
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
=
Statistika Matematis II/ Edisi E-book
SupΩoL∗ (θ | x¯) SupΩ L∗ (θ | x¯)
Tabel 5.1: Kesalahan dalam Uji Hipotesis
_
∗
= λ T (x)
Hipotesis Benar
H0 H1
Keputusan Menerima H0 Menolak H0 Keputusan Benar Kesalahan Tipe I Kesalahan Tipe II Keputusan Benar
Contoh Misalkan X1 , ..., Xn adalah sampel random dari N(µ, σ 2 ); H0 : µ ≤ µ0 vs H1 : µ ≥ µ0 . σ 2 adalah parameter pengganggu.
Dalam memutuskan untuk menerima atau menolak hipotesa nol dievaluasi dan dibandingkan melalui probabilitasnya membuat kesalahan. Sekarang dibicarakan bagaimana probabilitas membuat kesalahan tersebut dapat dikontrol.
Statistik LRT adalah 5.3.3.1 Probabilitas Kesalahan dan Fungsi Kekuatan Uji maks L(µ, σ 2 |¯ x) {µ, σ 2 : µ ≤ µ0 , σ 2 > 0} λ(¯ x) = maks L(µ, σ 2 |¯ x) λ(¯ x) =
a
maks L(µ, σ 2 |¯ x) {µ, σ 2 : µ ≤ µ0 , σ 2 > 0} maks L(ˆ µ, σˆ2 |¯ x)
a2
dimana µ dan σ , adalah MLE dari µ dan σ 2 . Selanjutnya, bila µ ≤ µ0 , maksimum kendala sama dengan maksimum tanpa kendala, sedang un_
a
tuk µ> µ0 , maksimum kendala adalah L(µ0 , σ 2 | x).
Dalam uji hipotesis H0 : θ ∈ Ω0 vs H1 : θ ∈ Ωc0 dapat terjadi salah satu dari dua jenis kesalahan, yaitu kesalahan tipe I(α) dan kesalahan II(β), sbb: 1. Jika θ ∈ Ω0 tetapi uji hipotesis menolak H0 , maka uji telah membuat kesalahan tipe I.
2. Jika θ ∈ Ωc0 tetapi uji menerima H0 , maka uji telah membuat kesalahan tipe II.
Keadaan ini bisa digambarkan sbb:
Jadi
_
λ(x) =
1;
jika a2 _
L ( µ0 , σ | x ) a2
_
L(µ,σ |x)
a
µ ≤ µ0 a
; jika µ > µ0
5.3.3 Metode Uji Evaluasi Hipotesis Untuk prosedur uji hipotesa λ(x), fungsi uji adalah fungsi pada ruang _ _ sampel dengan nilai 1 bila x dalam daerah penolakan, dan nilai 0 bila x dalam daerah penerimaan. Bab 5. Hipotesis Statistik
Misalkan C daerah kritis (penolakan) untuk suatu uji hipotesis, maka untuk θ ∈ Ω0 uji membuat kesalahan bila X ∈ C, sehingga probabilitas kesalahan tipe I adalah P (X ∈ C). Untuk θ ∈ Ω0 c probabilitas kesalahan tipe
II adalah P (X ∈ C c ). Karena P (X ∈ C c ) = 1 − P (X ∈ C) maka P (X ∈ C) merupakan fungsi θ memuat semua informasi tentang uji dengan daerah kritis C. Selanjutnya didapat:
140
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
141
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
P (X ∈ C) =
(
Statistika Matematis II/ Edisi E-book
Jadi tingkat signifinkansi uji atau kekuatan uji di p = 1/2 adalah 0, 05 P (kesalahan tipe I),
jika θ ∈ Ω0
1 − P (kesalahan tipe II), jika θ ∈ Ωc0
Contoh
Def inisi Fungsi kuasa (power function) dari uji hipotesis dengan daerah penolakan C adalah fungsi dari θ yang didefinisikan K(θ) = P (X ∈ C)
Misalkan Xn ∼ Binomial(5, θ). Pandang uji H0 : θ <
sebut. Fungsi kuasa yang ideal adalah bernilai nol untuk θ ∈ Ω0 dan bernilai satu untuk θ ∈ Ωc0 . Namun bentuk ideal ini tidak dapat dicapai. Uji hipotesis baik bila fungsi kuasa memiliki nilai: 1. mendekati nilai 1 untuk θ ∈ Ωc0 dan
vs H1 : θ >
1 . 2
Fungsi kuasa untuk uji ini adalah:
(5.4)
Nilai fungsi kuasa di suatu titik parameter disebut kekuatan uji dititik ter-
1 2
β1 (θ) = P (x ∈ R) = P (x = 5) = θ5 Grafik β1 (θ)dapat kita lihat dalam gambar di bawah. Dalam
menyelidiki
fungsi
kuasa
ini,
walaupun
pro-
babilitas kesalahan tipe I dapat diterima sebagai kecil β1 (θ) ≤ ( 21 )5 = 0, 0312 untuk semua θ ≤ 21 , namun probabilitas ke salahan tipe II terlalu tinggi β1 (θ) terlalu kecil untuk semua θ > 21 .
Probabilitas kesalahan tipe II kurang dari 12 hanya jika θ > ( 21 )5 = 0, 87. Untuk mendapatkan probabilitas kesalahan tipe II yang lebih kecil, dapat dipertimbangkan menggunakan uji yang menolak H0 bila x = 3, 4, atau5 .
2. mendekati 0 bila θ ∈ Ω0 Def inisi
Fungsi kuasa untuk uji ini adalah Tingkat signifikansi dari uji (atau ukuran dari daerah kritis C) adalah supremum dari fungsi kekuatan uji kalau hipotesis nol besar. Berdasarkan definisi ini, tingkat signifikansi uji yang ditulis α merupakan probabilitas kesalahan tipe I. Jadi tingkat signifikansi uji αmerupakan: P (kesalahantipeI) = P (menolakH0 |H0 benar) = α Contoh Uji hipotesis H0 : p = 1/2vsH1 : p > 1/2; dengan p parameter distribusi binomial. Jika sampel berukuran 18 dan H0 ditolak untuk x ≥ 13. Dipertimbangkan tingkat signifikansi uji atau kekuatan uji bila H0 benar sbb:
P (menolak H0 | H0 benar) = P (X ≥ 13|p = 1/2) (5.5) 18 X 18 = (1/2)x (1 − 1/2)18−x = 0, 05 x x=13 Bab 5. Hipotesis Statistik
142
ISBN 978-602-8310-02-4
β2 (θ) = =
5 3
!
P (x = 3, 4, 5) ! 5 θ4 (1 − θ)1 + θ3 (1 − θ)2 + 4
5 5
!
θ5 (1 − θ)0 .
Grafik dari β2 (θ) juga diperlihatkan dalam gambar di atas. Dalam gambar tersebut terlihat bahwa uji kedua mempunyai probabilitas kesalahan tipe II lebih kecil dalam kasus β2 (θ) lebih besar untuk θ > 12 . Tetapi probabilitas kesalahan tipe I lebih besar untuk uji kedua; β2 (θ) lebih besar untuk θ ≤ 21 . Bila harus memilih diantara kedua tes tersebut, pertimbangannya adalah mana struktur kesalahan yang digambarkan oleh β1 (θ) atau β2 (θ) yang lebih diterima. Contoh Bab 5. Hipotesis Statistik
143
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Misalkan X1 , ..., Xn adalah sampel random dari populasi N(θ, σ 2 ), dan σ 2 diketahui. LRT untuk H0 : θ ≤ θ0 vsH1 : θ > θ0 adalah uji yang menolak x−θ0 ) √ > c. Fungsi kuasa uji ini adalah H0 bila (¯σ/ n _ _ x−θ x−θ θ0 √ −θ −θ √0 > c = P √ 0 > c + θ0 √ β(θ) = P σ/ = P Z > c + σ/ n σ/ n σ/ n n
tuk semua θ ∈ Ω0 . Demikian juga dengan probabilitas kesalahan tipe II, yaitu mempunyai fungsi kuasa yang besar untuk θ ∈ Ωc0 .
dapat dilihat bahwa probabilitas normal ini naik dari nilai 0 ke 1. Karena itu β(θ) fungsi naik dari θ dengan limθ→−∞ β(θ) = 0,limθ→∞ β(θ) = 0, dan β(θ) = αbilaP (Z > c) = α
las C dengan fungsi kuasa β(θ), disebut uji uniformly most powerfull (UMP) kelas C bila β(θ) ≥ β 1 (θ) untuk setiap θ ∈ Ωc0 dan setiap β 1 (θ) yaitu fungsi kuasa dari uji dalam kelas C .
Contoh
Def inisi
dengan Zvariabel random normal baku. Untuk θ naik dari −∞ sampai ∞,
Misalkan disyaratkan bahwa kesalahan tipe I maksimum 0, 1 dan kesalahan tipe II maksimum 0,2 untuk θ ≥ θ0 + σ. Hendak ditunjukkan bagaimana memilih c dan n, untuk mencapai persyaratan di atas menggunakan (¯ x−θ0 ) √ σ/ n
uji yang menolak H0 : θ ≤ θ0 bila fungsi kuasa uji sedemikian adalah:
> c. Seperti disebutkan di muka
θ0 − θ β(θ) = P Z > c + √ σ/ n
Def inisi Misalkan C adalah kelas uji untuk H0 : θ ∈ Ω0 vsH1 : θ ∈ Ωc0 . Uji dalam ke-
Daerah kritik C adalah daerah kritik paling kuat seragan ukuran α untuk uji hipotesis H0 lawan hipotesis alternatif H1 jika himpunan C adalah daerah kritik terbaik ukuran α untuk uji H0 lawan hipotesis sederhana H1 . Suatu uji yang didefinisikan pada daerah kritik ini disebut uji paling kuat seragam dengan tingkat signifikansi α dari uji hipotesis sederhana H0 lawan hipotesis gabungan alternatif H1 . Uji paling kuat seragam tidak selalu ada, tetapi kalau ada teorema Neyman − P erson dapat digunakan untuk mencarinya.
Karena β(θ) fungsi naik, maka persyaratannya dipenuhi bila β(θ) = 0, 1 dan β(θ + σ) = 0, 8
Contoh
Dengan memilih c = 1, 28, kita mendapatkan β(θ0 ) = P (Z > 1, 2) = 0, 1 (sebenarnya 0,1003 dari tabel) dan tidak tergantung n. Sekarang ingin √ dipilih n sedemikian hingga β(θ + σ) = P (Z > 1, 28 − n) = 0, 8.
Misalkan X1, X2 , ..., Xn sampel random dari distribusi n(0, θ) dengan varian θ tidak diketahui. Akan diperlihatkan bahwa ada uji paling ku-
dengan mengambil c = 1, 28 dan n= 5 persyaratan di atas dipenuhi.
kepadatan peluang bersama dari X1, X2 , ..., Xn adalah
Tetapi dari tabel P (Z > −0, 84) = 0, 8, sehingga dengan mengambil √ 1, 28 − n = −0, 84 dan menyelesaikan untuk n didapat n = 4, 49. Jadi
at seragam dengan tingkat signifikansi α untuk uji hipotesis sederhana ′ ′ H0 : θ = θ dengan θ adalah bilangan bulat posistif lawan hipotesis ga ′ ′ bungan alternatif H1 : θ > θ .Ruang parameter Ω = θ; θ ≥ θ . Fungsi L(θ; x1 , x2 , ..., xn ) =
5.3.3.2 Uji Paling Kuat (Most Powerfull Test)
1 2πθ
n/2
P 2 xi exp − 2θ
(5.6)
Seperti yang telah dipaparkan di depan, uji hipotesis berusaha untuk
Misalkan θ′′ bilangan yang lebih besar dari θ′ , k bilangan posisif dan C
mengontrol baik kesalahan tipe I yaitu paling besar sama dengan α un-
himpunan titik-titik dengan
Bab 5. Hipotesis Statistik
144
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
145
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
′
L(θ ; x1 , x2 , ..., xn ) ≤k L(θ′′ ; x1 , x2 , ..., xn )
(5.7)
Statistika Matematis II/ Edisi E-book
diatas maka C =
(
(x1 , x2 , ..., xn ) :
n X i=1
)
x2i ≥ c adalah daerah kritik terbaik ′
′
paling kuat seragam ukuran α untuk uji H0 : θ = θ lawan H1 : θ > θ . Jika
maka diperoleh
′
′′ n/2
θ θ′
" n # θ′′ − θ′ X 2 exp − xi ≤ k 2θ′ θ′′ i=1
(5.8)
i=1
i=1
5.3.3.3 Teorema Neyman-Pearson
atau ekivalen dengan n X
x1 , x2 , ..., xn nilai eksperimen dari X1, X2 , ..., Xn maka H0 : θ = θ ditolak n X ′ x2i ≥ c. ditingkat signifikansi α dan H1 : θ > θ diterima jika
x2i ≥
Himpunan C=
′′ 2θ′ θ′′ n θ − ln k =c ln θ′′ − θ′ 2 θ′
(
(x1 , x2 , ..., xn ) :
n X i=1
x2i ≥ c
)
(5.9)
penolakan C yang memenuhi kedua hal berikut: (5.10)
adalah daerah kritik terbaik untuk uji hipotesis sederhana H0 : θ0 = θ
i=1
ngan derajat bebas n. Karena α=P
i=1
x2i /θ′ ≥ c/θ′ ; H0
!
x ∈ C, jika f (x|θ1 ) > kf (x|θ0 )
(5.12)
x ∈ C c , jika f (x|θ1 )kf (x|θ0 )
(5.13)
′
lawan hipotesis sederhana θ = θ′′ . Sekarang tinggal menentukan c sehingga daerah kritik ini mempunyai ukuran α seperti yang diinginkan. Jika n X H0 benar variabel random x2i /θ′ mempunyai distribusi Khi-kuadrat den X
Misalkan H0 : θ = θ0 vs H1 : θ = θ1 dengan densitas yang bersesuaian dengan θi adalah f (x|θi ), i = 0, 1. Dengan menggunakan uji dengan daerah
(5.11)
c/θ′ dapat ditentukan dari tabel dan c ditentukan maka C = ( ) n X 2 (x1 , x2 , ..., xn ) : xi ≥ c adalah daerah kritik terbaik ukuran α un-
untuk suatu k ≥ 0 dan α = Pθ0 (x ∈ R) maka 1. Syarat cukup setiap uji yang memenuhi 5.12 dan5.13 adalah uji UMP taraf α 2. Syarat perlu, jika terdapat uji yang memenuhi kedua kondisi di atas dengan k > 0 maka setiap uji UMP taraf α adalah uji dengan ukuran α, kecuali mungkin pada himpunan A yang memenuhi Pθ0 (X ∈ A) = 0.
i=1
′
tuk uji H0 : θ = θ lawan hipotesis θ = θ′′ . Selain itu, untuk setiap bilangan θ′′ yang lebih besar dari θ′ maka argumen otomatis terpe-
nuhi. Jika θ′′′ adalah bilangan lain yang lebih besar dari θ′ maka C = ( ) n X (x1 , x2 , ..., xn ) : x2i ≥ c adalah daerah kritik terbaik ukuran α untuk i=1
′
uji H0 : θ = θ lawan hipotesis θ = θ′′′ . Oleh karena itu, menurut definisi
AkibatT eorema ¯ adalah Misalkan kondisi teorema Neyman-Person berlaku, dan jika T (X) statistik cukup untuk θ dan g(t|θ) adalah densitas T bersesuaian dengan θi , i = 0, 1. Maka setiap uji berdasar T dengan daerah penolakan S (himpunan bagian dari ruang sampel T ) adalah uji UMP taraf α bila dipenuhi kedua hal berikut:
Bab 5. Hipotesis Statistik
146
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
147
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Perhatikan bila k = 43 , maka kita harus menolak H0 untuk titik sampel x = 2 dan menerima H0 untuk x = 0 dan untuk x = 1 tak menentu. Tetapi bila kita menerima H0 untuk x = 1 kita mendapatkan uji UMP taraf α = 14
1. t ∈ Sbilag(t|θ1 ) > kg(t|θ) 2. t ∈ S c bilag(t|θ1 ) < kg(t|θ0 ) untuk suatu k ≥ 0, dengan α = Pθ0 (X ∈ S).
supremium di atas. Bila kita menolak H0 untuk x = 1 kita mendapatkan uji UMP taraf α = 43 seperti di atas.
Bukti
Def inisi _
¯ uji berdasar T mempunyai daerah penolakan C ={x: Dalam sampel asal X _ T (x) ∈ S} . Dengan teorema faktorisasi densitas dapat ditulis sebagai _ _ _ _ f (x |θi ) = g (T (x)|θi ) h(x), i = 0, 1, untuk suatu fungsi tak negatif h(x). Dengan mengalikan ketaksamaan pada nomer 1 di depan dengan fungsi tak negatif ini, didapat C memenuhi _
_
_
_
_
_
x ∈ Cbilaf (x |θi ) = g (T (x)|θi ) h(x) > kg (T (x)|θ0 ) h(x) = kf (x |θ0 ).
Hipotesa yang menyatakan bahwa parameter univariat besar, sebagai contoh H : θ ≥ θ0 , atau kecil, sebagai contoh H : θ < θ0 disebut hipotesa satu sisi. Sedangkan Hipotesa yang menyatakan bahwa parameter bisa besar atau kecil, sebagai contoh, H : θ 6= θ0 disebut hipotesa dua sisi. Banyak
persoalan yang mempunyai uji UMP taraf α berhubungan dengan uji hipotesa satu sisi dan densitas yang mempunyai sifat monotone Likelihood ratio.
dan _
_
_
_
_
_
x ∈ C c bilaf (x |θi ) = g (T (x)|θi ) h(x) < kg (T (x)|θ0 ) h(x) = kf (x |θ0 ).
5.3.3.4 Teorema Karlin-Rubin
Juga dari pernyataan nomer 2 didapat:
Pandang uji hipotesa H0 : θ ≤ θ0 vsH1 : θ > θ0 . Misalkan T adalah statistik cukup untuk θ dan keluarga densitas {g(t|θ) : θ ∈ Ω} dari T mempunyai sifat MLR (monotone likelihood ratio). Maka untuk t0 uji yang menolak H0
_
Pθ0 (X ∈ R) = Pθ0 ((T (x) ∈ S) = α. Jadi dengan syarat cukup dari Lemma Neyman-Pearson, Uji berdasar T adalah uji UMP taraf α.q.e.d.
bhb T > t0 adalah uji UMP taraf α, dengan α = Pθ0 (T > t0 ). Bukti
Contoh Misalkan x ∼ binomial(2, θ). Uji H0 : θ = 1/2vsH1 : θ = 3/4. Dengan menghitung rasio densitas didapat:
Karena densitas T mempunyai sifat MLR, fungsi kuasa β(θ) = Pθ0 (T > t0 ) tidak turun. Sehingga Supθ≤θ0 β(θ) = β(θ0 ) = α dan ini adalah uji taraf α. Dengan menggunakan bagian (b) dan (c) akibat teorema Neyman-Person, dan didapat:
f (0 | δ = 34 ) 1 f (2 | δ = 43 ) 3 f (1 | δ = 43 ) 9 = = = ; ; 4 f (2 | δ = 21 ) 4 f (1 | δ = 21 ) 4 f (0 | δ = 12 )
k 1 = inft∈τ
g(t|θ1) g(t|θ0 )
Dengan memilih 43 < k < 94 , maka Lemma Neyman-Pearson mengatakan bahwa uji yang menolak H0 bila x = 1 atau 2 adalah uji UMP taraf α = p(x = 1atau2, θ = 1/2) = 43 . Dengan memilih k < 14 atau k > 43
Jadi menurut akibat teorema Neyman-Person di depan uji adalah UMP
menghasilkan UMP taraf α = 1atauα = 0.
taraf α. q.e.d.
Bab 5. Hipotesis Statistik
148
ISBN 978-602-8310-02-4
dengan τ = {t|t > t0 }dan g(t|θ1) > 0 atau g(t|θ0 ) > 0
Bab 5. Hipotesis Statistik
149
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
5.3.3.5 Daerah Kritik Terbaik Misal C subset dari ruang sampel. C disebut daerah kritik terbaik berukuran α untuk uji hipotesis sederhana H0 : θ = θ′ lawan H1 : θ = θ′′ jika untuk setiap subset A dari ruang sampel dengan P [(X1, X2 , ..., Xn ) ∈ A; H0 ] = α berlaku 1. P [(X1, X2 , ..., Xn ) ∈ C; H0 ] = α
Statistika Matematis II/ Edisi E-book
maka sesuai dengan teorema, C merupakan daerah kritik terbaik. ketidaksamaanini sering dinyatakan dalam bentuk (dengan c1 dan c2 suatu konstanta) u1 (x1 , x2 , ..., xn ; θ′ , θ′′ ) ≤ c1
(5.16)
u2 (x1 , x2 , ..., xn ; θ′ , θ′′ ) ≤ c2
(5.17)
atau
Pandang bentuk u1 ≤ c1 . Karena θ′ dan θ′′ suatu konstanta, u1 (x1 , x2 , ..., xn ; θ′ , θ′′ ) suatu statistik dan jika f.k.p dari statistik ini dapat
2. P [(X1, X2 , ..., Xn ) ∈ C; H1 ] ≥ P [(X1, X2 , ..., Xn ) ∈ A; H1 ] Cara lain yang dapat digunakan menentukan daerah kritik terbaik adalah
ditentukan kalau H0 benar maka tingkat signifikansi dari uji H0 lawan H1 dapat ditentukan dari distribusi ini.
dengan menggunakan teorea Neyman-Pearson. Teorema Neyman-Pearson
Contoh
Misalkan X1, X2 , ..., Xn sampel random dari distribusi yang mempunyai f.k.p f (x; θ). Selanjutnya f.k.p bersama dari X1, X2 , ..., Xn adalah
f.k.p
L(θ; x1 , x2 , ..., xn ) = f (x1 ; θ)f (x2 ; θ)...f (xn ; θ)
Diketahui X1, X2 , ..., Xn sampel random dari distribusi yang mempunyai
(5.14)
Misalkan θ′ dan θ′′ nilai tertentu dari θ yang berbeda sehingga Ω = {θ; θ = θ′ , θ′′ } dan misalkan k bilangan posistif. Jika C subset dari ruang 1.
≤ k ; ∀ titik (x1 , x2 , ..., xn ) ∈ C
2.
L(θ ′ ;x1 ,x2 ,...,xn) L(θ ′′ ;x1 ,x2 ,...,xn)
> k ; ∀ titik (x1 , x2 , ..., xn ) ∈ C∗
√ P (1/ 2π)n [−( x2i )/2] L(θ′ ; x1 , x2 , ..., xn ) √ = P L(θ′′ ; x1 , x2 , ..., xn ) (1/ 2π)n exp [−( (xi − 1)2 )/2]
P (x ≥ c1 ; H1 ) =
Maka C adalah daerah kritik terbaik berukuran α untuk uji hipotesis sederhana H0 : θ = θ′ lawan hipotesis sederhana alternatif H1 : θ = θ′′ Satu hal yang ditegaskan oleh teorema ini adalah bahwa jika C himpunan dari semua titik-titik (x1 , x2 , ..., xn ) yang memenuhi L(θ ; x1 , x2 , ..., xn ) ≤ k; k > 0 L(θ′′ ; x1 , x2 , ..., xn ) Bab 5. Hipotesis Statistik
150
(5.19)
uji di θ = θ′′ = 1
3. α = P [(X1, X2 , ..., Xn ) ∈ C; H0 ]
′
(5.18)
Akan diuji hipotesis sederhana H0 : θ = θ′ = 0 lawan hipotesis alternatif H1 : θ = θ′′ = 1. Perhatikan bahwa
sampel sedemikian sehingga L(θ ′ ;x1 ,x2 ,...,xn) L(θ ′′ ;x1 ,x2 ,...,xn)
1 1 f (x; θ) = √ exp(− (x − θ)2 ); −∞ < x < ∞ 2 2π
(5.15)
ISBN 978-602-8310-02-4
Z∞
c1
√
2π
1 p
1/n
exp(−
(x − 1)2 dx 2(1/n)
(5.20)
Untuk contoh di depan, jika n = 25 dan jika α = 0, 05 maka dari tabel √ = 0, 329. Kekuatan dari uji ini dari H0 lawan H1 ditemukan c1 = 1,645 25 adalah 0, 05 kalau H0 benar dan Z∞
0,329
1 (x − 1)2 dx = √ p exp(− 2(1/25) 2π 1/25
Bab 5. Hipotesis Statistik
Z
∞
−3,355
151
√
1 −w2 /2 e dw = 0, 999,jika H1 ben 2π ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
5.4 Soal-Soal dan Pembahasan
Statistika Matematis II/ Edisi E-book
P embahasan :
1. Misalkan hipotesis yang diuji adalah parameter bernoulli p, yakni H0 : p = 1/5 lawan H1 : p 6= 1/5
K(θ) = P {(x1 , x2 ) ∈ C} Jika H0 benar, θ = 2 maka fkp bersama dari X1 dan X2 adalah
Misalkan pula dilakukan percobaan n = 60000 dengan hasil x =
f (x1 ; 2)f (x2 ; 2) = 1/4e−(x1 +x2 )/2 ; 0 < x1 < ∞, 0 < x2 < ∞
12489. Dengan menggunakan kriterium daerah kritis 0, 05, hitunglah x∗ yang memenuhi P (X ≥ X ∗ |H0 benar) = 0, 05
= 0, untuk x yang lain dan P [(x1 , x2 ) ∈ C] = 1 − P [(x1 , x2 ) ∈ C c ] 9,5 9,5−x Z Z 2 = 1− 1/4e−(x1 +x2 )/2 dx1 dx2 ∼ = 0, 05
P embahasan : Untuk lebih memudahkan perhitungan, kita gunakan teorema limit pusat, sehingga # X ∗ −60000(1/5 x − 60000(1/5) ≥p P (X ≥ X ∗|H0 benar) = P p 60000(1/5)(4/5) 60000(1/5)(4/5) "
dengan √x−60000(1/5)
60000(1/5)(4/5)
0
Jika H1 benar, θ = 4, f.k.p bersama dari X1 dan X2 adalah f (x1 ; 4)f (x2 ; 4) = 1/16e−(x1 +x2 )/4 ; 0 < x1 < ∞, 0 < x2 < ∞ = 0 ; untuk x yang lain
berdistribusi normla standar. Karena P (Z ≥
1, 64) = 0, 05 (dari tabel z), maka X∗ dapat dihitung dari persamaan 1, 64 =
Sehingga
X ∗ −12000 √ 9600
P [(x1 , x2 ) ∈ C] = 1−
Diperoleh X∗ = 12161. Karena dari data eksperimen kita peroleh x = 12489 > 12161, maka kita simpulkan H0 ditolak. 2. Diketahui variabel random X dengan f.k.p, 1 f (x; θ) = e−x/θ . θ
tingkat signifikani uji.
152
9,5 9,5−x Z 2 Z 0
0
1/16e−(x1 +x2 )/4 dx1 dx2 ∼ = 0, 31
Jadi, kekuatan uji 0, 05 untuk θ = 2 dan 0, 31 untuk θ = 4. Karena tingkat signifikansi adalah kekuatan uji bila H0 benar, maka tingkat signifikansi tes ini adalah 0, 05. Cara lain, dengan menggunakan tabel χ2 (2). Misalkan x1 + x2 = Y maka Y berdistribusi χ2 (4). Kekuatan uji kalau H0 benar diberikan
Uji hipotesis H0 : θ = 2 vs H1 : θ = 4. Dengan menggunakan sampel random X1 dan X2 berukuran 2, diputuskan menolak H0 bila C = {(x1 , x2 ); 9, 5 ≤ x1 + x2 < ∞} . Tentukan fungsi kekuatan uji dan Bab 5. Hipotesis Statistik
0
ISBN 978-602-8310-02-4
oleh P (Y ≥ 9, 5) = 1 − P (Y ≤ 9, 5) = 1 − 0, 95 = 0, 05 Kalau H1 benar, variabel random X/2 berdistribusi χ2 (2) sehingga variabel random Z = (x1 + x2 )/2 berdistribusi χ2 (4). Kekuatan uji Bab 5. Hipotesis Statistik
153
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
bila H1 benar adalah
Statistika Matematis II/ Edisi E-book
P embahasan :
Z∞ P (x1 + x2 ≥ 9, 5) = P (Z ≥ 4, 75) = 1/4ze−z/2 dz ∼ = 0, 31
Misalkan θ′′ suatu bilangan yang tidak sama dengan θ′ dan k bilangan positif. Perhatikan bahwa
4,75
P (1/2π)n/2 exp [− (xi − θ′ )2 /2] P ≤k n/2 (1/2π) exp [− (xi − θ′′ )2 /2]
Karena tingkat signifikansi adalah fungsi kekuatan kalau H0 benar, maka α = 0, 05 3. Pandang uji H0 : θ ∈ Ω0 vsH1 : θ ∈ Ωc0 . Misalkan uji berdasar statistik cukup T dengan daerah penolakan S memenuhi tiga syarat berikut:
atau
atau
(a) Uji adalah uji taraf α
) n X n ′′ 2 ′ 2 ≤k (θ ) − (θ ) exp − (θ − θ ) xi + 2 i=1 (
ma seperti dalam (b) dan untuk setiap θ1 ∈ Ωc0 terdapat k1 ≥ 0 sedemikian hingga 1
1
c
1
1
t ∈ Sbilag(t|θ ) > k g(t|θ0 )dant ∈ S bilag(t|θ ) < k g(t|θ0 ) Tunjukkan uji ini adalah uji UMP taraf α dari H0 versus H1 . P embahasan : Misalkan β(θ) adalah fungsi kuasa dari uji dengan daerah penolakan S. Tetapkan θ1 ∈ Ωc0 . Pandang uji H01 : θ = θ0 vsH11 : θ = θ1 , menurut akibat teorema Neyman-Person dan (a), (b), dan (c) mengakibatkan β(θ1 ) ≥ β ∗ (θ1 ) dengan β ∗ (θ) fungsi kuasa untuk taraf α lain dari H01 ,
yaitu setiap uji yang memenuhi β(θ) ≤ α. Tetapi, setiap uji tanpa α dari H0 memenuhi β ∗ (θ0 ) ≤ sup β ∗ (θ) ≤ α.
Jadi β(θ1 ) ≥ β ∗ (θ1 ) untuk setiap uji taraf α dari H0 . Karena θ1 sebarang maka soal terbukti. 4. Jika X1, X2 , ..., Xn sampel random dari distribusi n(θ, 1) dengan mean θ tidak diketahui. Perlihatkan bahwa tidak ada uji paling kuat ′ seragam dari hipotesis sederhana H0 : θ = θ dimana θ′ tertentu la′ wan hipotesis gabungan alternatif H1 : θ 6= θ . Ruang sampelnya Ω = {θ; −∞ < θ < ∞} .
Bab 5. Hipotesis Statistik
154
ISBN 978-602-8310-02-4
′
(θ′′ − θ′ )
(b) Terdapat θ0 ∈ Ω0 sedemikian hingga Pθ0 (T ∈ S) = α (c) Misalkan g(t|θ) menyatakan densitas dari T . Untuk θ0 yang sa-
′′
n X i=1
xi ≥
n ′′ 2 (θ ) − (θ′ )2 − ln k 2
(5.21)
(5.22)
(5.23)
Pertidaksamaan ini ekivalen dengan n X i=1
xi ≥
ln k n ′′ (θ + θ′ ) − ′′ jika θ′′ > θ′ 2 (θ − θ′ )
(5.24)
xi ≤
n ′′ ln k (θ + θ′ ) − ′′ jika θ′′ < θ′ 2 (θ − θ′ )
(5.25)
dan ekivalen ke n X i=1
′
Kedua ini mendifinisikan daerah kritik terbaik untuk uji H0 : θ0 = θ lawan H1 : θ = θ′′ bila θ′′ > θ′ dan θ′′ < θ′ . Akan tetapi daerah kritik terbaik uji hipotesis sederhana lawan hipotesis sederhana alternatif θ = θ′ + 1 tidak seperti daerah kritik terbaik daerah kritik terbaik ′ H0 : θ = θ lawan hipotesis sederhana alternatif θ = θ′ − 1. Jadi dalam kasus ini tidak ada uji paling kuat seragam. 5. Tentukan daerah kritik dari uji rasio likelihood untuk uji hipotesis nol H0 : µ = µ0 lawan H1 : µ 6= µ0 yang didasarkan sampel random berukuran n dari populasi normal dengan varians σ 2 diketahui. P embahasan : Karena ω = {µ0 } maka L(b ω ) = L(µ0 ). Karena Ω = ℜ maka dengan
menggunakan metode likelihood maksimum diperoleh µ b = x se-
Bab 5. Hipotesis Statistik
155
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
hingga L(b ω) = dan
sehingga
b = L(Ω)
1 √ σ 2π
n
1 √ σ 2π
"
#
"
#
n 1 X (xi − µ0 )2 exp − 2 2σ i=1
n
n 1 X (xi − x)2 exp − 2 2σ i=1
i h n λ = exp − 2 (x − µ0 )2 2σ Daerah kritiknya adalah h n i exp − 2 (x − µ0 )2 ≤ k 2σ atau (x − µ0 )2 ≥ − atau |x − µ0 | ≥
p
−
2σ 2 ln k n
(2σ 2
Statistika Matematis II/ Edisi E-book
lam Ω adalah L(θ1, θ2 ; x1 , x2 , ..., xn ) =
o n p x : |x − µ0 | ≥ − (2σ 2 ln k) /n 6. Diketahui X variabel random dengan distribusi n(θ1 , θ2 ) dan misalkan ruang parameter Ω = {(θ1 , θ2 ); −∞ < θ1 < ∞, 0 < θ2 < ∞} . Hipotesis gabungan H0 : θ1 = 0, θ2 > 0 dan hipotesis gabungan alternatif H1 : θ1 6= 0. Himpunan ω = {(θ1 , θ2 ); θ1 = 0, 0 < θ2 < ∞} adalah subset dari Ω dan H0 : (θ1 , θ2 ) ∈ ω. Tentukan uji H0 lawan H1 .
n/2
P 2 (xi − θ1 ) exp − = L(Ω) 2θ2
Distribusi bersama dari X1, X2 , ..., Xn disetiap titik dalam ω adalah L(0, θ2 ; x1 , x2 , ..., xn ) =
1 2πθ2
n/2
exp −
P
(xi ) 2 = L(ω) 2θ2
b Perhatikan bahwa Sekarang akan ditentukan L(b ω ) dan L(Ω). d ln L(ω) = 0 dθ P 2 2 n (xi ) − + = 0 2θ2 2θ2
Diperoleh
n
θ2 =
ln k) /n
dengan k akan ditentukan sehingga ukuran daerah kritik adalah α. Jadi daerah kritiknya adalah
1 2πθ2
Sehingga L(b ω) =
1X (xi )2 n i=1 ne−1 P 2π (xi )2
n/2
Dengan cara analog (dengan metode likelihood maksimum) diperoleh n X θ1 = x dan θ2 = (xi − x)2 /n i=1
sehingga
Karena itu,
b = L(Ω)
λ= P embahasan :
ne−1 P 2π ((xi − x)2 /n)
n/2
n/2 P (xi − x)2 P 2 (xi )
Misalkan X1, X2 , ..., Xn sampel random yang berukuran n > 1 dari distribusi ini. Distribusi bersama dari X1, X2 , ..., Xn disetiap titik daBab 5. Hipotesis Statistik
156
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
157
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
λ (x)adalah fungsi ........... dari Σ3i=1 xi Daerah kritik untuk uji ini adalah
Jadi daerah kritik rasio likelihood adalah
atau
7. Misalkan
P n/2 (xi − x)2 ≤k P 2 (xi ) x:
λ < C0
P (xi − x)2 2/n ≤ k P (xi )2
x1 , x2 , x3 random
variabel
Statistika Matematis II/ Edisi E-book
independen
atau
berdistribusi
B (1, P ). Uji hipotesis H0 : P = 0, 25 dengan tingkat signifikasi α berdasarkan LR Test Statistic dan dapatkan distribusinya!
0, 75 Σ3i=1 xi
3 L (P | x) = πi=1 P (xi = xi ) 1−x = P x1 (1 − P ) 1 .P x2 (1 − P )1−x2 .P x3 (1 − P )1−x3
Ω0 = Ω
{P = 0, 25}
= {P | 0 < P < 1}
Di bawah Ω0 didapat P Λ = P0 = 0, 25 , di bawah Ωdidapat MLE-P Σ3
x
i adalah P Λ = i=1 3 Sebab: logL (P | x) = Σ3i=1 xi .logP + (3 − Σ3i=1 xi ) logP (1 − p)
d.logL(P |x) dp
=
0
=
PΛ
=
λ (x)
Σ3i=1 x + (3 − Σ3i=1 xi ) . −1 P 1.p Λ (1−P )Σ3i=1 x−P Λ (3−Σ3i=1 xi ) Λ Λ P (1−P ) Σ3i=1 xi 3
=
x
=
SupP ǫΩ0 L(P |x) SupP ǫΩ L(P |x) 3 3 (0,25)Σi=1 xi (0,75)3−Σi=1 xi
= = Bab 5. Hipotesis Statistik
Σx
( Σx3 i ) (1− Σx3 i ) Σ3i=1 xi
(0,75)
3−Σ3 xi i=1
3(0,75) 3−Σ3i=1 xi
3(0,25) Σ3i=1 xi
158
3−Σ3i=1 xi
ISBN 978-602-8310-02-4
< C0
Σxi < C0∗ dan Σxi > C0∗∗ Dimana C0∗ dan C0∗∗ dapat ditung berdasarkan tingkat signifikasi αyang ditentukan dan distribusi binomial n − 3 dan p − 0, 25 maka
hubungan:
P Σ3i=1 xi < C0∗ ≈ α2 dan P Σ3i=1 xi > C0∗∗ ≈ α2
Diuji hipotesis H0 : P = 0, 25 vs H1 : P 6=, 25 Pandang Ruang Parameter:
3−Σ3i=1 xi
Dibawah H0 Σ3i=1 xi ∼ B (3, P = 0, 25) maka daerah kritik uji ini
P x1 +x2 +x3 (1 − P )3−x1 .x2 .x3 3 3 P Σi=1 xi (1 − P )3−Σi=1 xi
= =
2, 25 3 − Σ3i=1 xi
adalah berbentuk pasangan.
P embahasan : xi ∼ B (1, P ) ⇒ P (xi = xi ) = pxi (1 − P )1−xi , xi = 0, 1 i = 0, 1, 2, 3
Σ3i=1 xi
Jadi distribusi yang digunakan dalam uji ini adalah distribusi Binomial dengan trial = 3 dan Probabilitas sukses p = 0, 25. Sedangkan untuk n besar dapat digunakan pendekatan −2logλyang 2 berdistribusi Asimtotik X(1) . 8. Misalkan X1 , X2 , ...., X30 (n = 30) barisan variabel random berdistribusi Gamma dengan α = 10 dan β tidak diketahui. Kontruksikanlah MP test dari hipotesis H0 : β = 2 vs H1 : β = 3, pada level signifikasi 0, 05. P embahasan : (a) Diketahui Xi ∼ G (α, β) maka densitas dari Xi adalah: f (Xi | β) = Bab 5. Hipotesis Statistik
1 xα−1 e−xi β ; xi r(α)β α
159
> 0, α > 0, dan β > 0 ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
9. Misalkan X1 , X2 , ...., X30 (n = 30) variabel random independen berdistribusi N (µ, σ 2 )dengan µ tidak diketahui dan σ diketahui. Tunjukkan sampel size ndapat ditentukan, sehingga uji hipotesis H0 :
Dengan ruang parameter: Ω0 = {(α, β) | α = 10; β = 2} Ω = {(α, β) | α = 10; β = 3 > β0 = 2}
µ = 0 vs hipotesis H1 : µ = 1dapat dilakukan bila nilai-nilai αdan β telah ditentukan sebelumnya. Berapakah nilai numeris dari n, jika
(b) Densitas bersama dari xi pada Ω0 adalah h i30 1 30 1 30 f0 (x | β0 ) = r(10)2 πi=1 x9 e− 2 Σi=1 xi 10
α = 0, 05, β = 0, 9, dan σ = 1?
(c) Densitas bersama dari xi pada Ωadalah: i30 h 1 30 1 30 πi=1 x9 e− 3 Σi=1 xi f1 (x | β1 ) = r(10)3 10
P embahasan
(d) Rasio Likehoodnya adalah:
f1 (x|β1 ) f0 (x|β0 ) i30 h 1 30 1 30 x9 e− 3 Σi=1 xi πi=1 r(10)310 i30 h 1 30 − 1 30 x9 e 2 Σi=1 xi πi=1 10
R (Z, β0 , β1 ) = =
r(10)2 1
30
30
1
30 x9 e− 3 Σi=1 xi π 30 x9 e− 2 Σi=1 xi πi=1 i30 i30 h h . i=1
=
1
1
10
10
r(10)2 r(10)3 1 30 2 300 − 31 Σ30 i=1 xi + 2 Σi=1 xi .e 3 2 300 1 Σ30 x .e 6 i=1 i > C 3
= =
Statistika Matematis II/ Edisi E-book
(e) Dengan C suatu konstantaa tertentu, jadi dapat ditulis: 300 300 1 30 2 2 .e 6 Σi=1 xi > C atau 3 3
(a) Xi ∼ G (µ, σ 2 ) maka densitas dari Xi adalah: 2
1
−12
f (Xi | µ) = (2πσ 2 ) e 2σ2 (Xi −µ) ;-∞ < x < ∞ Dengan ruang parameter: Ω0 = {(α, σ 2 ) | µ = 0; σ > 0} Ω = {(α, σ 2 ) | −∞ < µ < ∞; σ > 0, µ = 1}
(b) Densitas bersama dari xi pada Ω0 adalah: f0 (x | µ = 0) = (2πσ 2 )
−n2 −
e
1 Σn x 2 2σ 2 i=1 i
(c) Densitas bersama dari xi pada Ωadalah: f1 (x | µ = 1) = (2πσ 2 )
−n2 −
e
1 Σn (x −1)2 2σ 2 i=1 i
(d) Rasio Likehoodnya adalah:
Ambil logaritma kedua ruas, diperoleh: f1 (x|µ=1)
R (Z, µ0, µ1 ) = 1 30 Σ x 6 i=1 i
Σ30 i=1 xi
> =
Log C − 300 Log 32 Log C − 300 (Log 2 − Log 3)
= Log C − 300 (0, 3010 − 0, 4771) = Log C + 52, 83 > 6 (Log C + 52, 83) = C0
=
Ø (Z) =
1
n
1
ISBN 978-602-8310-02-4
2
2
(5.26)
n
dengan C suatu konstanta tertentu. Bentuk di atas dapat ditulis:
e
160
n
n
e− 2σ2 Σi=1 xi − σ2 > C
=
1
1;Jika Σ30 i=1 xi > C0 0; Jika Σ30 i=1 xi ≤ C0
1
2
n
n
e σ2 Σi=1 xi .e σ2
(f) Karena Σxi ∼ G (nβ, α), maka C0 dapat dihitung berdasarkan: R∞ 1 Y 299 e−Y 2 dy = 0, 05 dengan Y = Σxi C0 r(300)2300
Bab 5. Hipotesis Statistik
e
= e− 2σ2 Σi=1 xi − 2σ2 Σi=1 (xi −2xi +1)
Jadi HP testnya berbentuk: (
f0 (x|µ=0) 2 1 2 n − 1 2 Σn i=1 xi − 2σ 2 Σi=1 (xi −1) 2σ
1 Σn x σ 2 i=1 i
>
C n
> e σ2
(5.27)
Ambil logaritma kedua ruas diperoleh: 1 Σn x σ2 i=1 i Σni=1 xi
Atau
Σn i=1 xi n
Bab 5. Hipotesis Statistik
n + LogC σ2 n + σ 2 LogC 2
> > >
1 2
+
σ2 LogC n
= C 0 ⇒ X > C0
161
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
(e) Jadi HP testnya berbentuk:
Ø (Z) =
(
Statistika Matematis II/ Edisi E-book
Sehingga diperoleh:
1;Jika X > C0
1 denganX = Σni=1 xi n
0; Jika X ≤ C0
√ (5.28)
2
(f) Karena xi ∼ N (µ, σ ), maka x ∼ N (µi, σ n) ; i = 0, 1..C0 di-
√ √ C0 n − n = −1, 28 √ 1, 64 − n = −1, 28 √ n = 1, 64 +1, 28 = 2, 92
tentukan dengan:
Pµ0 (x > C0 )
=α
= 0, 05 1 − Pµ0 (x ≤ C0 ) = 1 − 0, 05 Pµ0 (x ≤ C0 ) = 0, 95
Atau n = (2, 92)2 = 8, 53 ≃ 9
Atau: 0x 0x ≤ C0 −µ = 0, 95 Pµ0 x−µ σx σx C√ 0 −µ0x Pµ0 Z ≤ 1n = 0, 95 √ = 0, 95 Pµ0 (Z ≤ C0 n)
Jadi nilai n yang ditanyakan adalah sekitar 9. Jika niali n = 9 disubstitusikan ke (3) diperoleh C0 = 0, 55 sehingga MP Testnya adalah:
(g) Dengan menggunakan tabel distribusi normal starndard diperoleh:
√ C0 n = 1, 645
x−µ0x σx
0, 1
=
0, 1
=
0, 1
Penyelesaian
(h) Dengan menggunakan tabel distribusi normal standard diperoleh:
Bab 5. Hipotesis Statistik
√ Pµ1 Z ≤ C0 n = 0, 1 162
10. Misalkan x1 , x2 , ..., x30 variabel random independen berdistribusi N (µ, σ 2 ). Jika x = 3, 2, kontruksilah MP test dari hipotesis H0 : µ = 3; σ 2 = 4vs hipotesis alternatif H1 : µ = 3, 5; σ 2 = 4pada level signifikasi α = 0, 01
0, 1
=
1;Jika X > 0, 55 1 denganX = Σni=1 xi n 0; Jika X ≤ 0, 55
(5.29)
= 1 − 0, 9 = 0, 1 (1 − β = P )
0x ≤ C0 −µ σx 0x Pµ1 Z ≤ C√0 −µ 1n √ Pµ1 (Z ≤ C0 n)
Pµ1
(
apabila X ≤ 0, 55
Karena β = 0, 9dan berdasarkan di atas diperoleh: tidak menolak H0 | H1 salah. = Pµ1 (x ≤ C0 )
Ø (Z) =
Dengan kata lain H0 ditolak apabila X > 0, 55,H0diterima
Pµ0 (Z ≤ 1, 645) = 0, 95 sehingga didapat
Eµ1 [Ø (Z)]
(5.30)
Dari (3) dan (4) diperoleh:
2
Eµ0 [Ø (Z)] =
n (C0 − 1) = −1, 28
ISBN 978-602-8310-02-4
• Xi ∼ N (µ, σ 2 )densitas dari Xi adalah −12 − 12 (xi −µ)2 f (Xi | µ, σ 2 ) = (2πσ 2 ) e 2σ Dengan ruang parameter: Ω0 = {µ = 3; σ 2 = 4} Ω = {−∞ < µ < ∞; σ 2 > 0, µ = 1}
Ωc0 = {µ = 3, 5; σ 2 = 4} Bab 5. Hipotesis Statistik
163
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
• Densitas bersama dari xi pada Ω0 adalah: 1
C0 ditentukan dengan Eµ0 [Ø (Z)] = Pµ0 (x > C0 ) = αdengan α=0,01 Jadi:
2
(2π.4)−50 e− 8 Σi=1 (xi −3) 2 1 100 2 (8π)−50 e− 8 Σi=1 (xi −6xi +9)
f0 (x | µ, σ 2) =
100
Statistika Matematis II/ Edisi E-book
= 1 100 2 6 100 2 = (8π)−50 e− 8 Σi=1 xi + 8 Σi=1 xi −112,5
Eµ0 [Ø (Z)] =
• Densitas bersama dari xi pada Ωc0 adalah: 1
Bentuk ini diubah kebentuk distribusi normal standars, sebagai berikut:
2
(2π.4)−50 e− 8 Σi=1 (xi −3,5) 2 1 100 2 (8π)−50 e− 8 Σi=1 (xi −7xi +12,25)
f1 (x | µ, σ 2 ) = =
1
100
7
= (8π)−50 e− 8 Σi=1 xi + 8 Σi=1 xi −153,125 100
2
100
2
Pµ0
• Rasio Likehoodnya adalah: R (z, µ0 , µ1 ) = 1
f1 (x|µ,σ2 ) f0 (x|µ,σ2 ) 100 2
7
100 2
(8π)−50 e− 8 Σi=1 xi + 8 Σi=1 xi −153,125
=
1 100 2 6 100 2 (8π)−50 e− 8 Σi=1 xi + 8 Σi=1 xi −112,5 100 x2 −40,62,5 − 18 Σi=1 i
=
e
(5.31)
>C
e
> e40,62,5 .C
= 0, 99 = 0, 99 = 0, 99
dengan σX =
r
4 2 = , µ0 = 3 100 10
= 0, 99
Dengan menggunkan tabel distribusi normal standard dipero-
C0
=
17, 33 17,33 5
= 3, 466
Jadi MP test dari uji hipotesis diatas adalah: Ø (Z) =
(
1;Jika X > 3, 466 0; Jika X ≤ 3, 466
Dengan kata lain: Karena X = 3, 2 < C0 = 3, 466maka H0 tidak ditolak pada tingkat signifikasi α = 0, 01
1;Jika X > C0 Σ100 xi dengan i=1 = 3, 2 100 0; Jika X ≤ C0
Karena xi ∼ N (µ, σ 2 )dengan n=100, maka
σ2 4 x ∼ N µi , = N µi , : 1 = 0, 1 n 100
Bab 5. Hipotesis Statistik
C0 −µ0X σX
Pµ0 (Z ≤ 5C0 − 15)
> 40, 62, 5 + LogC > 325 + 8LogC
Σ100 x
Ø (Z) =
≤
Pµ0 Z ≤ Cσ0 −3 X 0 −3 Ø C210
(5.32)
i 8 > 325 + 100 LogC = C0 Jadi diperoleh: i=1 100 Sehingga MP tes dari uji hipotesis diatas berbentuk,
(
X−µ0X σX
5C0 − 15 = 2, 33 ⇒ 5C0 =
ambil logaritma kedua ruas pertidaksamaan (2), diperoleh: 1 100 2 Σ x 8 i=1 i 2 Σ100 i=1 xi
leh Pµ0 (Z ≤ 2, 33) = 0, 99, sehingga diperoleh:
dengan C suatu konstanta tertentu. Bentuk (1) diatas dapat ditulis sabagai: 2 − 81 Σ100 i=1 xi
= Pµ0 (x > C0 ) Pµ0 (x > C0 ) 1 − Pµ0 X ≤ C0 = 0, 01 Pµ0 X ≤ C0 = 1 − 0, 01 = 0, 99
164
ISBN 978-602-8310-02-4
11. Misalkan X variabel random yang densitasnya uniform µ (0, 1)disimbolkan dengan f0 atau berdistribusi triangular pada interval [0, 1]disimbolkan dengan , dimana f1 berbentuk: Bab 5. Hipotesis Statistik
165
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
f1 =
4x
; 0≤x<
Statistika Matematis II/ Edisi E-book
0.Pθ0 (x ≥ C0 ”) = 0, 05
1 2
4 − 4x ; 21 ≤ x ≤ 1 0 ; otherwise
⇐⇒ = = =
yang didasarkan pada observasi tungal X. Konstruksilah MP test dari hipotesis H0 : f = f0 vs hipotesis H1 : f = f1 pada level signifikansi α = 0, 05
= =
Penyelesaian:
= • Diuji hipotesis H0 : f0 (x) = 1I[0,1] (x) vs H1 : f1 (x)
=
Bentuk: Ω = {θ0 , θ1 }dengan f (x | θ0 ) = f0 (x); 0 ≤ x ≤ 1dan f (x | θ1 ) = f1 (x); 0 ≤ x ≤ 1 X ∼⌣ (0, 1)maka densitas dari X adalah:
1 ;0 ≤ x ≤ 1 f (x | θ0 ) = f0 (x) = 1−0
Disini: f (x | θ0 ) = f0 (x)danf (x | θ1 ) = f1 (x)karena observasi didasarkan pada observasi tunggal pada X. Rasio Likehoodnya adalah:
4x ; 0 ≤ x < 21 f (x | θ1 ) f1 (x) = = f1 (x) = 4 − 4x ; 12 ≤ x ≤ 1 f (x | θ0 ) f0 (x) 0 ; otherwise
4x > C atau 4 − 4x > C f1 (x) > C ⇔ ⇔ x > C4 atau x < 1 − 1/4C Dengan C suatu konstanta tertentu.
Jadi
sebut,C4 = C0′ dan 1 − 1/4C”maka MP tes dari uji hipotesis tersebut akan terbentuk: Ø (Z) =
(
1;Jika X >
= C0′ atau x < 1 − 1/4C = C0 ”
0; Jika X ≤ C0 dan x ≥ C0 ”
C0′ dan C0”dihitung
Nilai 0, 05, yaitu
C 4
dengan Eθ0 [Ø (x)] = αdengan α =
• Eθ0 [Ø (x)] = 1.Pθ0 (x > C0′ ) + 1.Pθ0 (x < C0 ”) + 0.Pθ0 (x ≤ C0′ ) + Bab 5. Hipotesis Statistik
166
ISBN 978-602-8310-02-4
= =
Pθ0 (x > C0′ ) + Pθ0 (x < C0 ”) Pθ0 (x > C0′ ) + 1 − Pθ0 (x < C0 ”) R1 R1 dx + 1 − co ” dx c′o R1 R1 dx c dx + 1 − 1− 4c 4 R 1 1 [x] c + 1 − 1− c dx 4
4
1 − 4c + 1 − [x]11− c
4
c 4
1− +1− 1− 1− 2 − 4c − 1 + 1 − 2 − 4c
c 4
c 4
= 0, 05 = 0, 05 = 0, 05 = 0, 05 = 0, 05 = 0, 05
c 2
= 2 − 0, 05 = 1, 95 C = 2 (1, 95) = 3, 9 Jika harga c=3,9 ini disubstitusikan
atau
= 005 = 0, 05 = 0, 05
masing-masing
ke
C0′ = 4c diperoleh C0′ = 3,9 = 0, 975dan 4 C0 ” = 1 − 4c = 1 − 0, 975 = 0, 025.
Jadi diperoleh harga C0′ = 0, 975 dan C0 ” = 0, 025. Sehingga MP tes dari uji hipotesis tersebut adalah: 1 ; Jika x x Ø (x) = 0 ; Jika x x
> 0, 975 atau < 0, 025 ≤ 0, 975 dan ≥
0, 025
Dengan kata lain: H0 (Hipotesa nol) ditolak jika x > 0, 975atau x < 0, 025 dan H0 diterima pada 0, 025 ≤ x ≤ 0, 975. Seperti yang
diilustrasikan gambar berikut:
12. Misalkan x1 , x2 , ..., xn variabel random iid dengan densitas (pdf) f0 atau f1 , diman f0 berdistribusi P (1) dan f1 berdistriubusi geometris dengan P = 12 . Tentukan MP tes dari hipotesis H0 : f = f0 vs H1 : f = f1 pada level signifikansi α = 0, 05 Penyelesaian: Bab 5. Hipotesis Statistik
167
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
−1
e VS H0 : f = f0 (x) = x! x−1 1 .2 = H1 : f = f0 (x) = 1 − 21 Bentuk Ω = {θ0 , θ1 }dengan f (x | θ0 ) = f0 (x) = x−1 1 f (x | θ1 ) = f1 (x) = 21 .2
• Diuju hipotesis
1 x−1 1 .2 2
e−1 dan x!
• Densitas bersama dari Xi untuk θ0 adalah: n πi=1 xi !
(i). Densitas dari xi adalah: in h bersama n θα n f (x | θ) = r(α) πi=1 xα−1 e−θΣi=1 xi i Keluarga distribusi ini adalah keluarga distribusi eksponensial,
n 1 Σi=1 xi −n 1 n 2n 2 n Σ x −n i 1 i=1 . 12 . 21 2 n x Σ 1 i=1 i 2
= =
• Rasio Likehoodnya adalah:
= =
sebab keluarga tersebut dapat ditulis ke dalam bentuk: f (x | θ) = C (θ) eQ(θ)T (x) h (x)
f (x|θ1 ) f (x|θ0 )
R (Z, f0 , f1 ) =
( 21 )
dengan:
Σn i=1 xi
C (θ) =
e−n π n xi ! i=1 ” “ n x π n πi=1 xi ! 12 i=1 i e−n
T (x) =
dengan C suatu konstanta tertentu. Atau bentuk diatas dapat ditulis sebagai: n πi=1 xi !
n
1 πi=1 xi 2
> C.e−n
(5.33)
Ambil logaritma kedua ruas dari (1) diperoleh: n Logπi=1 xi ! + Σni=1 xi log
1 2 1 2
Σni=1 xi logxi + Σni=1 xi {0 − 0, 3010} > logC − n Σni=1 xi logxi − 0, 3010Σni=1 xi > logC − n
Misalkan: logxi = ti maka, xi = eti Jadi: Σni=1 ti − 0, 3010Σni=1eti > Log − n 168
h
in θα r(α) Σni=1 xi
; Q (θ) = ; h (x) =
(5.34)
−θ
n πi=1 xα−1 i
Jelas Q (θ) = −θdecreasing pada (0, ∞), sebab Q (θ) = −1 < 0. Jadi berdasarkan proposisi 1 halaman 277 dari Roussas, keluarga ekponensial diatas memiliki sifat MLR dalam v (x) = −T (x) = −Σni=1 xi . (ii). Densitas bersama dari xi adalah: f (x | θ) =
> logC − n
Σni=1 xi logxi + Σni=1 xi log > logC − n n Σi=1 xi logxi + Σni=1 xi {log1 − log2} > logC − n
Bab 5. Hipotesis Statistik
13. Mislakan x1 , x2 , ...., xn variabel random iid dengan densitas (pdf) sebagai berikut: (i). f (x | θ) = θ α α−1 −θx x e I (x) ; θǫΩ = (0, ∞) α diketahui > 0 (ii). f (x | θ) = (0,∞) r(α) ! r+x−1 (1 − θ)x IA (x) ; A = {0, 1, 2...} θǫΩ = (0, 1). θr x
Penyelesaian:
dan densitas bersama dari xi untuk θ1 adalah: f (x | θ1 ) =
1 x 2
Tunjukkan densitas bersama dari (i) dan (ii) mempunyai sifat MLR (Monotone Likehood Ratio) dalam V (x1 , x2 , ..., xn ).
e−n
f (x | θ0 ) =
=
nr
θ π
= θnr π
r+x−1 x !
r+x−1 x
!
n
(1 − θ)Σi=1 xi n
eΣi=1 xi Log (1 − θ)
14. X ∼ Bin (θ, n) . Misalkan Ø (x)adalah uji UMP untuk H0 : θ ≤
θ0 vs H1 : θ > θ0 . Untuk n=6;θ0 = 0, 25 dan α = 0, 05; 0, 1 dan 0, 2. Tentukan uji bersama-sama dengan β (θ) fungsi kuasa untuk θ0 = 0, 3; θ0 = 0, 4.
Penyelesaian: ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
169
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
x ∼ Bin (θ, n), maka densitas dari x adalah: f (x | θ) = 6 x
=
n !x
=
!
Eθ0 [Ø (x)] =
n πi=1
6 = πi=1
=
6 πi=1
6 = πi=1
θx (1 − θn−x )
= 0, 7536
diperoleh: untuk c = 4 diperoleh P0,3 (x ≤ c) = 0, 9868 P0,3 (x = 4) = P0,3 (x ≤ 4) − P0,3 (x ≤ 3) Jadi: = 0, 9868 − 0, 9192 = 0, 0676 Sehingga diperoleh:
! 6 0, 25Σx 0, 7536−Σx x ! Σ6 xi 6 0,25 0, 7536 0,75 xi ! Σ6 x i 6 0, 7536 13 x! 1 6 6 0, 7536 eΣ xi log( 3 ) xi
T (x) =
Σs xi
;
6 h (x) = πi=1
dan Q (θ) =
Jadi bentuk UMP tes diatas adalah:
Log
0, 9868 − γ (0, 0676) = 0, 95 γ (0, 0676) = 0, 0368 γ = 0, 5444 Jadi UMP tes diatas menjadi:
Ø (x) =
6 xi 1
!
α = 0, 05
170
ISBN 978-602-8310-02-4
jika ;
x
0
bagi yang lain
> 4 jika x = 4
H0 ditolak dengan kendala 0,54444 Jika x = 4 Power of the test di 0,7 adalah: βØ (0, 7) = P0,7 (x > 4) + 0, 54444P0,7 (x = 4) = P0,3 (x ≤ 1) + 0, 54444P0,3 (x = 24) = 0, 3936 + (0, 54444) [P0,3 (x ≤ 2) − P0,3 (x ≤ 1)] = 0, 3936 + (0, 54444) . (0, 7208 − 0, 3936)
= 0, 3936 + 0, 1781 = 0, 5717 Dengan fungsi kuasa di 0,3 β (θ) = = Σ6x=4
• Sekarang dilihat untuk H0 : θ < 0, 3vsH1 : θ > 0, 3untuk
1 0, 54444
Dengan kata lain: H0 ditolak apabila x > 4
3
jika x > c 1 Ø (x) = γ jika x = c ; dengan Σn=1 i=1 xi = X ∼ Binθ 0 bagi yang lain
Bab 5. Hipotesis Statistik
= 0, 05
Dengan menggunakan tabel binomial untuk n = 6; θ0 =0,3
0, 25x (1 − 0, 25)6−x ! 6 0, 25x 0, 75x x
Jelas bentuk terakhir ini adalah berbentuk keluarga ekponensial dengan: c (θ)
Pθ0 (x > c) + γPθ0 (x = c)
1 − Pθ0 (x ≤ c) + γPθ0 (x = c) = 0, 05 Pθ0 (x ≤ c) − γPθ0 (x = c) = 0, 95
Densitas bersama dari x adalah: f (x | θ) =
Statistika Matematis II/ Edisi E-book
6 x
PθǫΩ1 (x > 4) + 0, 544PθǫΩ ! ( 1 (x >!4) ) 6 6−x 2 x 4 θ (1 − θ) + 0, 544 θ (1 − θ) x
• H0 : θ ≤ 0, 3 vs H1 : θ > 0, 3untuk α = 0, 1. Bab 5. Hipotesis Statistik
171
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Eθ0 Ø (x) =
Pθ0 (x > c) + γ.Pθ0 (x = c)
Eθ0 Ø (x) =
= 0, 1
= 1 − Pθ0 (x ≤ c) + γ.Pθ0 (x = c) = 0, 1 Pθ0 (x ≤ c) − γ.Pθ0 (x = c) = 0, 9
Statistika Matematis II/ Edisi E-book
(5.35)
Pθ0 (x > c) + γPθ0 (x = c)
= 0, 2
= 1 − Pθ0 (x ≤ c) + γPθ0 (x = c) = 0, 2 Pθ0 (x ≤ c) − γPθ0 (x = c) = 0, 8
Dengan menggunakan tabel binomial untuk n=6; θ0 = 0, 3untuk
Dengan tabel distrbusi binomial untuk n
c = 3 diperoleh Pθ0 (x ≤ c) = 0, 9192. Jadi: Pθ0 (x = 3) = Pθ0 (x = 3) − Pθ0 (x ≤ 2)
θ0 = 0, 3diperoleh: untuk c = 3, maka P0,3 (x ≤ c) = 0, 9192. Jadi: P0,3 (x = 3) = P0,3 (x = 3) − P0,3 (x ≤ 2)
= 0, 9192 − 0, 7208 = 0, 1994 Sehingga, jika nilai-nilai ini disubstitusikan ke * diperoleh: 0, 9192 − γ (0, 1994) = 0, 9 = 0, 0962 γ = 0,9192−0,9 0,1994 Sehingga UMP tes untuk hipotesa ini adalah:
Ø (x) =
1
;
=
6 dan
= 0, 1994
Harga-harga ini disubstitusikan ke * diperoleh 0,9192-γ0,1994 = 0,8 ⇒
= 0, 6132 γ= 0,9192−0,8 0,1994 Sehingga UMP test untuk hipotesa ini adalah:
jika x > 3
0, 0962 jika x = 3 0 bagi yang lain
Ø (x) =
Dengan kata lain:
H0 ditolak apabila x > 3 H0 ditolak dengan probabilitas 0,0962 jika x = 3
1
;
jika
x> 3
0, 6132 ; jika x= 3 0 ; bagi yang lain
Dengan kata lain:
H0 ditolak jika x > 3 H0 ditolak jika x = 3dengan probabilitas 0,6132.
Power of the tes di 0,7 adalah: βØ (0, 7) = P0,7 (x > 3) + 0, 0962P0,7 (x = 3) = P0,3 (x ≤ 2) + 0, 0962P0,3 (x = 3)
= 0, 7208 + 0, 0962 [P0,3 (x ≤ 3) − P0,3 (x ≤ 2)] = 0, 7208 + 0, 0962 [0, 9192 − 0, 7208] = 0, 7399 ! 6 Fungsi kuasa: β (θ) = Σ θx (1 − θ)6−x x ) ! ( 6 3 3 θ (1 − θ) 0, 0962 x3
0, 9192 − 0, 7208
=
(5.36)
Power of the tes di 0,7 adalah: βØ (0, 7) = =
P0,7 (x > 3) + 0, 6132P0,7 (x = 3) P0,3 (x ≤ 2) + 0, 6132P0,3 (x = 3)
= 0, 7208 + 0, 0962 [P0,3 (x ≤ 3) − P0,3 (x ≤ 2)] = 0, 7208 + 0, 6132.0, 1852 = 0, 8344
+
H0 : θ ≤ 0, 4 VS H1 : θ > 0, 4, dengan α = 0, 05. Eθ0 Ø (x) = P0,4 (x > c) + γP0,4 (x = c) = 0, 05 = 1 − P0,4 (x ≤ c) + γP0,4 (x = c) = 0, 05 (5.37) P0,4 (x ≤ c) − γP0,4 (x = c)
• H0 : θ ≤ 0, 3vs H1 : θ > 0, 3untuk α = 0, 2 Bab 5. Hipotesis Statistik
172
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
173
= 0, 95
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
Dengan tabel distribusi binomial untuk n = 6; θ0 = 0, 4 diperoleh untuk c = 4, maka P0,4 (x ≤ 4) = 0, 9590. Jadi P0,4 (x = 4) = 0, 1382.
βØ (0, 6) = P0,6 (x > 4) + 0, 4269P0,6 (x = 4) = P0,4 (x ≤ 1) + 0, 4269P0,4 (x = 2) = 0, 2333 + 0, 4269.0, 3110
Substitusikan nilai-nilai ini * diperoleh: 0, 9590 − γ0, 1382 = 0, 95 ⇒ γ = 0.0651
=
Sehingga UMP tes untuk hipotesa ini adalah:
Ø (x) =
1 ; 0, 0651 ; 0
jika jika
Untuk α = 0, 2:
x> c=4 x= 4
Eθ0 Ø (x) = P0,4 (x > c) + γP0,4 (x = c) = 0, 2 = 1 − P0,4 (x ≤ c) + γP0,4 (x = c) = 0, 2
; bagi yang lain
P0,4 (x ≤ c) − γP0,4 (x = c)
Power of the tes di 0,6 adalah:
Sehingga UMP tes untuk hipotesa ini adalah:
Untuk α = 0, 1 Ø (x) = (5.38)
Substitusikan nilai-nilai ke ** diperoleh: 0, 9590 − γ.0, 1382 = 0, 9 ⇒ γ = 0, 4269.
Ø (x) =
0
jika jika
x> 4 x= 4
; bagi yang lain
Power of the tes di 0,6 adalah:
Bab 5. Hipotesis Statistik
174
1 ; 0, 0752 ; 0
jika jika
x> 3 x= 3
; bagi yang lain
βØ (0, 6) = P0,6 (x > 3) + 0, 0752P0,6 (x = 3) = P0,4 (x ≤ 2) + 0, 0752P0,4 (x = 3) = =
0, 5443 + 0, 0752.0, 2765 0, 5651
15. Misalkan x1 , x2 , ...., xn variabel random berdistribusi eksponensial dengan parameter lokasi θdan densitas f (x | θ) =
Sehingga UMP tes untuk hipotesa ini adalah: 1 ; 0, 4269 ;
Power of the tes di 0,6 adalah:
Dengan tabel distribusi binomial untuk n = 6; θ0 = 0, 4 diperoleh untuk c = 4, maka P0,4 (x ≤ 4) = 0, 9590. Jadi P0,4 (x = 4) = 0, 1382.
= 0, 8
Substitusikan nilai-nilai ke *** diperoleh: 0, 8208 − γ.0, 2765 = 0, 8 ⇒ γ = 0, 0752.
0, 2333 + 0, 0651.0, 3110 0, 2535
Eθ0 Ø (x) = P0,4 (x > c) + γP0,4 (x = c) = 0, 1 = 1 − P0,4 (x ≤ c) + γP0,4 (x = c) = 0, 1 P0,4 (x ≤ c) − γP0,4 (x = c) = 0, 9
(5.39)
Dari tabel distribusi binomial pada n = 6; θ0 = 0, 4 diperoleh untuk c = 3, maka P0,4 (x ≤ 3) = 0, 8208. Jadi P0,4 (x = 4) = 0, 2765.
βØ (0, 6) = P0,6 (x > 4) + 0, 0651P0,6 (x = 4) = P0,4 (x ≤ 1) + 0, 0651P0,4 (x = 2) = =
0, 3660
exp {− (x − θ)} θ ≤ x < H0 : θ ≤ θ30 VS H1 : θ ≤ θ0
Tentukan UMP tes untuk
Penyelesaian: •
ISBN 978-602-8310-02-4
∞.
f (xi | θ) =
e−(xi −θ)
;θ ≤ x < ∞ f (x | θ) = e−(xi −θ) I(θ,∞) x(i) dan densitas bersamanya adalah:
Bab 5. Hipotesis Statistik
175
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book f (θ | x) = e−Σ(xi −θ) I(θ,∞) x(i) = e−Σ(xi −θ) enθ I(θ,∞) x(i) = x(i) danG (T | θ) = Dengan mengambil T (x) enθ I(θ,∞) x(i) serta h (x) = e−Σxi , maka T (x) = x(i) adalah
statistik cukup bagi θ. Selanjutnya ditunjukkan keluarga f (x | θ)mempunyai sifat MLR (Monotone Likehood Ratio) dalam T (x) = x(i) , yaitu ratio likehood dari f (θ | x)untuk θ1 < θ2 adalah: f (θ2 |x) = e(θ2 −θ1 ) I(θ,∞) x(i) yang merupakan fungsi tidak turun f (θ1 |x)
dalam x(i) , berarti {fθ ; θǫΩ}ini memiliki sifat MLR. Jadi MP tes uji diatas adalah: Ø (x) =
(
1 ;
jika
x(i) > C
Statistika Matematis II/ Edisi E-book 2α 2α ⇒ e−nc = ennθ0 ⇒ −nc = Log ennθ0 Atau −nc Log n2 α − nθ0 ⇒ c = θ0 − n1 Log n2 α Kesimpulan: H0 ditolak apabila xmin > θ0 − n1 Log n2 α
16. Misalkan x1 , x2 , ..., x30 random variabel independen berdistribusi G (α = 10, β),βtidak diketahui. Konstruksikanlah MP tes untuk uji hipotesa H0 : β = 2VS H1 : β = 3dengan α = 0, 05. Penyelesaian: • xi
1
∼
= = = = = = =
= = =
Sehingga: P (Y > c) = 3 Bab 5. Hipotesis Statistik
= =
⇒
f (xi | β)
=
0 ; bagi yang lain
P (Y = y) =
Jadi:
G (α = 10, β)
x9 e−xi β Dikonstruksikan MP tes untuk H0 : β = 2VS T(10) β 10 i H1 : β = 3. Berdasarkan Leuma Neyman-Pearson di dapat: f (x|β=3) f (x|β=2)
C dihitung dari densitas x(i) , seabgai berikut: Misalkan Y = x(i) = xmin
fy (y) =
=
d {P (Y = y)} dy d 1 − enθ e−ny dy 1 nθ −ny e e n −n(y−θ)
;θ ≤ y < ∞
n.e
R∞
1 nθ0 −ny e e dy c n 1 nθ0 e − n1 e−ny |∞ c n 1 nθ0 e − n1 e−nc n
176
= =
P (xmin ≤ y)
1 − P (xmin > y) 1 − {1 − P (x ≤ y)}n n on RY 1 − 1 − θ eθ e−x dx n 1 − 1 + eθ e−x |yθ n 1 − 1 + eθ e−x − 1 1 − enθ e−ny 1 − e−(y−θ)
= α = α = α ISBN 978-602-8310-02-4
=
(x|β=3) Log ff (x|β=2) =
1
30
1
30
30 x9 e− 3 Σxi T πi=1 ( (10) ) .(330 ) i 30 x9 e− 2 Σxi T πi=1 ( (10) ) .(230 ) i 2 30 −( 13 − 21 )Σ30 i=1 xi e 3 1 30 30 2 e− 6 Σi=1 xi 3 1 30 Σ x + 30Log 23 6 i=1 i
Didapat H0 akan ditolak jika:
1 30 Σ xi + 30Log 6 i=1
2 >k 3
2 Σ30 =c i=1 xi > 6 k − 30Log 3 Selanjutnya dibawah H0 akan dicari distribusi dari Σ30 i=1 xi −10 xi ∼ G (α = 10, β = 2) ⇒ Mxi (t) = (1 − 2t) MΣ30 xi (t) = (Mxi (t))30 30 = (1 − 2t)−10 = (1 − 2t)−300 600
= (1 − 2t)− 2 Ini adalah MGF dari x2(600) . Bab 5. Hipotesis Statistik
177
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Dengan demikian H0 akan ditolak apabila Σ30 i=1 xi > c Dimana c dapat dihitung berdasarkan tingkat signifikansi α = 0, 05 dan distribusi x2(600) , memenuhi:
Statistika Matematis II/ Edisi E-book
N (n, 0)dan di bawah H1 Σxi ∼ N (n.1, n.1) = N (n, n) . α 0, 05
P (Σ30 = 0, 05 atau i=1 xi > c) 1 − P (Σ30 i=1 xi ≤ c) = 0, 05 atau P (Σ30 = 0, 95 i=1 xi ≤ c)
P(Σx ≤ c) Σx−0 √ ≤ √cn n ⇔ P Z ≤ √cn ⇔ ∅ √cn
⇔P
Berdasarkan tabel distribusi x2(600) didapat c ≈ 61, 656
Untuk menguji H0 : β = 2 VS H1 : β = 3dengan tingkat signikansi α = 0, 05, H0 akan ditolak jika: Σ30 i=1 xi > 61, 656
µ = 1Untuk α = 0, 05, β = 0, 9, dan σ = 1. Tentukan ukuran dari sampel n. −12
f (x|µ=1) f (x|µ=0)
=
(
−1n2 − 1 Σn (xi −1)2 2πσ2 e 2σ 2
)
=
2 − 1 Σn (xi −0) (2πσ2 )−1n2 e 2σ 2 − 12 Σx2i −2Σxi +n−Σxi 2σ
=
e− 2σ2 (n−2Σxi )
=
e− 2σ2 .e σ2
e
(
)
n
Σxi
i − 2σn2 + Σx σ2 n Σi=1 xi
n
Σxi
=
0, 95 (5.40)
P (Σx ≤ c) √ √ P Σx−n ≤ c−n n n √ c 0, 1 = P Z ≤ √n − n √ 0, 1 = Ø √cn − n Dari tabel distribusi N (0, 1)didapat: 0, 1
=
√ c √ − n = −1, 28 n
(5.41)
Persamaan 1 disubstitusikan pada 2 didapat √
√
n =
√c n
n =
+ 1, 28 = 1, 64 + 1, 28 2, 92
⇒
n = (2, 92)2 ≈ 9
Jadi ukuran sampel adalah n = 9.
>
k
> Logk > σ 2 (Logk + σ 2 ) = c
178
18. Misalkan x1 , x2 , ...., x100 variabel independen berdistribusi N (µ, σ 2 ) .Jika x = 3, 2, Konstruksikan MP tes untuk hipotesis H0 : µ = 3, σ 2 = 4 VS H1 : µ = 3, 5, σ 2 = 4pada tingkat signifikansi α = 0, 01.
Untuk α = 0, 05, β = 0, 9 dan σ = 1, dibawah H0 Σxi ∼ N (n.0, n.1) = Bab 5. Hipotesis Statistik
0, 95
1
MP tes memberikan, H0 ditolak jika : e− 2σ2 .e σ2
=
= P (tidak menolak H0 | H0 salah)
2
1
0, 95 0, 95
1 − 0, 9 =
Penyelesaian: xi ∼ N (µ, σ 2 ) ⇒ f (xi | µ) = (2πσ 2 ) e− 2σ2 (xi −µ) σ diketahui Uji hipotesis H0 : µ = 0 VS H1 : µ = 1. Berdasarkan Leuma Neymman-Pearson di dapat:
= =
c Daritabeldistribusi N (0, 1) didapat √ = 1, 64 n 1−β
17. Soal Buku Roussas no 4 halaman 313. Misalkan x1 , x2 , ...., xn random variabel berdistribusi N (µ, σ 2 )dengan µtidak diketahui dan σdiketahui. Ingin dilakukan uji hipotesa H0 : µ = 0 VS H1 :
= P (Σxi > c) = P (Σx > c)
ISBN 978-602-8310-02-4
Penyelesaian: −12 − 12 (xi −µ)2 xi ∼ N (µ, σ 2 ) ⇒ f (xi | µ) = (2πσ 2 ) e 2σ akan dikonstruk2 sikan uji MP untuk: H0 : µ = 3, σ = 4 VS H1 : µ = 3, 5, σ 2 = 4. Lueman Neymaman-Pearson memberikan: Bab 5. Hipotesis Statistik
179
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
f (x|µ=3,5) f (x|µ=3)
(2π(4))−50 .e
=
Statistika Matematis II/ Edisi E-book
busi dengan p.d.f segitiga pada [0, 1]sebut f1 , yaitu:
− 1 Σ100 (x −3,5)2 2(4) i=1 i
2 − 1 Σ100 (x −3) (2π(4))−50 .e 2(4) i=1 i − 81 [(Σx2i −7Σx+(3,5)2 (100))−(Σx2i −6Σx+(9)(100))]
= e
f1 =
1
e− 8 [−Σx+325] 325 Σx e− 8 + 8
= = H0 akan ditolak jika:e− Σx 8
⇔ ⇔ ⇔
325 + Σx 8 8
−
325 8
Σx
Logk
> 8 Logk + c > 100 > c∗
Σx 100
x
325 8
= c = c∗
(5.42)
∗
Dimana c dapat dihtung berdasarkan tingkat α = 0, 01dan dsitribusi N (µ = 3, σ 2 = 2)(dibawah H0 ), yang memenuhi hubungan: α
∗
P (x > c )
=
P (x > c∗ ) ∗ P (x ≤ c ∗) c −3 x−3 ≤ 210 ⇔ 0, 99 = P 210 c∗ −3 ⇔ 0, 99 = P Z ≤ 210 ∗ c −3 ⇔ 0, 99 = Ø 210
Berdasarkan distribusi N (0, 1)didapat:
= 2, 33 ⇒ c∗ = ⇒ c∗ =
2 10
(2, 33) + 3
4x < C1 atau 4x − 4 > cC2 Yang ekivalen dengan: x < C1∗ atau x > C2∗ Dengan C1∗ dan C2∗ dapat dihitung berdasarkan tingkat signifikansi α = 0, 05dan distribusi uniform yang memenuhi:
3, 466
P (x < C1∗ ) = ⇒
x > c∗
R C1∗
1dx = 1dx = ∗ C
R01
2
Karena x = 3, 2 < c∗ = 3, 466maka H0 tidak ditolak pada tingkat signifikansi α = 0, 01
19. Misal x sampel random berdistribusi U(0,1) sebut f0 atau berdistri180
; yang lain
dan pada 21 ≤ x ≤ 1merupakan fungsi dari x yang memotong turun. Dengan demikian H0 akan ditolak jika:
Dari 1 telah didapat, H0 ditolak jika:
Bab 5. Hipotesis Statistik
0
Penyelesaian: H0 : f = f0 VS H1 : f = f1 Lueman Neymaman-Pearson memberikan: 4x ; 0 ≤ x < 12 f (x|f1 ) = 4 − 4x ; 12 ≤ x ≤ 1 f (x|f1 ) 0 ; yang lain Terlihat bahwa ratio ini untuk 0 ≤ x ≤ 12 fungsi λmemotong naik
⇔ 0, 01 = ⇔ 0, 99 =
c∗ −3 210
4x ; 0 ≤ x < 12 4 − 4x ; 12 ≤ x ≤ 1
Berdasarkan satu observasi x, konstruksikan MP tes untuk hipotesis H0 : f = f0 VS H1 : f = f1 dengan tingkat signifikansi α = 0, 05.
> k yaitu: >
ISBN 978-602-8310-02-4
0,05 2 0,05 2
α α atau P (x < C2∗ ) = 2 2
⇒ C1∗ = 0, 025 atau ⇒ 1 − C2∗ = 0, 025 ⇒ C2∗ 0, 975
• H0 ditolak jika: x < 0, 025atau x > 0, 975 20. Misalkan x1 , x2 , ...., xn random variabel iid berdistribusi dengan p.d.f f0 atau f1 , dengan f0 adalah P (1)dan f1 adalah geometrik P = 12 . Dapatkan MP test untuk hipotesis H0 : f = f0 VS H1 : f = f1 untuk
Bab 5. Hipotesis Statistik
181
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
tingkat signifikansi α = 0, 05. Penyelesaian: f0 = P (1) ⇒ f (xi | θ0 ) = xe!i ! , xi = 0, 1, 2... x f1 = geometrik P = 21 ⇒ f (xi | θ1 ) = 12 21 i , xi = 0, 1, 2. akan dicari MP test untuk H0 : f = f0 VS H1 : f = f1 : f (x | f1 ) = f (x | f0 )
1 2
1 Σxi 2 en πxi !
1 π n xi ! = . n i=1 n 2 e .2Σi=1 xi
Lueman Neymaman-Pearson memberikan, H0 adalah:
daerah penolakan
n xi ! 1 πi=1 . >k 2 en .2Σi=1n xi yang ekivalen dengan Σni=1 xi > c∗
H0 , Σni=1 xi
Statistika Matematis II/ Edisi E-book
dengan berdasarkan pada proposisi 1, hal. 277 (Roussas) dan dengan mengambil: Q (θ) = Logθ − θdanV (x1 , x2 , ...., xn ) = ΣxQ (θ)adalah fungsi turunan monoton dalam...........sebab. Q′ (θ) = θ1 − 1 < 0, untuk θǫ (0, ∞)dengan demikian keluarga
{g (t; θ) , θǫΩ = 0}adalah keluarga MLR dalam V −Σni=1 xi ! v+x−1 (1 − θ)x .IA (x) b. f (x; θ) = θv x A = {0, 1, 2, ...} , θǫΩ = (0, 1) f (x; θ) =
n = πi=1
∗
dibawah ∼ P (n)sehingga c dapat dihitung berdasarkan tingkat signifikansi α = 0, 05dan distribusi P (n)yang memenuhi: P (Σxi > c∗ ) P
(Σni=1 xi ≤ c∗ ) t −n ∗ Σct=0 n .et!
= 0, 95 = 0, 95
= = Bab 5. Hipotesis Statistik
(x) ; θǫ (0, ∞) ; α > 0 diketahui
θx π n xα−1 .e−θΣx (T (α))n i=1 n πi=1 xα−1 −θΣx+Σxlogθ n .e (T (α)) n 1 n α−1 .eΣx(logθ−θ) πi=1 x T (α)
182
n
θnr eΣi=1 xlog(1−e)
Q (θ) = Log (1 − θ)
V (x) =
Σx
Maka Q (θ)adalah fungsi monoton turunan sebab:
adalah MLR dalam V = V (x1 , x2 , ...., xn ). x a. f (x; θ) = Tθ(α) xα−1 e−θx .I(0,∞) (x) ; θǫ (0, ∞) ; α > 0 diketahui ! v+x−1 b. f (x; θ) = θv (1 − θ)x .IA (x) x A = {0, 1, 2, ...} , θǫΩ = (0, 1) Penyelesaian:
f (x; θ) =
1 − θΣxi
Dengan berdasarkan pada proposisi 1. Buku Rossas halaman 277 dan dengan mengambil :
Misalkanx1 , x2 , ...., xn random variabel dengan p.d.f diberikan dibawah ini. Pada setiap kasus. Perlihatkan bahwa p.d.f bersama dari x
θx xα−1 e−θx .I(0,∞) T (α)
r + xi − 1 xi
!
= 0, 05
6. Soal Roussas no 9 halaman 314
a. f (x; θ) =
r + xi − 1 xi !
n θnr πi=1
= −V (x) =
ISBN 978-602-8310-02-4
Q′ (θ) = =
−1 1−θ −1 θ−1
< 0, untuk θǫ (0, 1)
sehingga keluarga distribusi {g (t, θ) , θǫ (0, ∞)}adalah keluarga MLR dalam V (x) = −V (x) 21. Misalkan x1 , x2 , ...., xn sampel random dari distribusi exponensial dengan parameter lokasi θdan densitas f (x | θ) = e−(x−θ) , θ ≤ x < ∞. Tentukan UMP test untuk H0 : θ ≤ θ0 , H1 : θ ≤ θ1 .
Penyelesaian: xi ∼ f (xi | θ) = e−(xi −θ) n f (x | θ) = πi=1 e−(xi −θ) = e−Σxi +nθ Akan ditentukan UMP test untuk H0 : θ ≤ θ0 , H1 : θ ≤ θ1 . Bab 5. Hipotesis Statistik
183
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
• Keluarga distribusi {g (t, θ) , θǫΩ}adalah keluarga MLR, sebab untuk θ > θ1 f (x|θ) eΣxi +nθ = f (x|θ1 ) eΣxi +nθ1 , θ = θ1 e ∗ = enθ I(θ∗ ,∞) (x(i) ) Ratio ini adalah fungsi monoton naik dalam x(i) Min (x1 , x2 , ...., xn ) =
= =
∗
n(θ−θ1 )
[P (x > t)]n R ∞ −(x−θ) n e dx t −t θ n e .e
1 − F (t) =
F (t) f (t)
=
1 − enθ e−nt F ′ (t)
= = =
enθ e−nt n e−n(t−θ) ;t ≥ n
=
e
Sehingga c0 dihitung berdasarkan hubungan : Z
∞
t
• Selanjutnya T (x) = x(i) = Min (x1 , x2 , ...., xn )adalah statistik cukup untuk θsebab: f (x | θ) = eΣxi +nθ , θ < xi < ∞; θ < x(i) ≤ x(n) < ∞ = eΣx ene I(θ,∞) x(i)
1 −n(t−θ0 ) e dt = α n
22. Jika x ∼ B (n, θ), misalkan Ø (x) adalah uji UMP untuk H0 : θ ≤ θ0 VS H1 : θ > θ0 . Untuk n = 6 , θ0 = 0, 25, dan α = 0, 05 ; 0, 01 ; 0, 02. Tentukan uji bersama-sama dengan β (θ) fungsi kuasa untuk θ0 = 0, 3 , θ0 = 0, 25 , dan θ0 = 0, 5.
Bersarkan teorema faktorisasi didapat:
Penyelesaian: T (x) = x(i) = Min (x1 , x2 , ...., xn ) Adalah statistik cukup untuk θ Selanjutnya berdasarkan teorema Karlin-Rubin dapat dikonstruksi UMP test untuk hipotesis:
x ∼ B (n, θ) ⇒ f (x | θ) = θ0 VS H1 : θ 0 > θ0 1 B n C f (x|θ) f (x|θ1 )
=
berdasarkan teorema Karlin-Rubin terdapat c0 yang menolak H0 bhb T > c0 merupakan UMP taraf αdengan : α = Pθ0 (T > c0 ) Dengan kata lain, untuk H0 : θ ≤ θ0 , H1 : θ ≤ θ0 terdapat uji UMP taraf α, yang menolak H0 jika x(i) > c0 dengan c0 dapat ditentukan berdasarkan tingkat signifikansi αyang diberikan dan distribusi dari x(i) yang memenuhi Pθ0 (T > c0 ) = αkarena: Bab 5. Hipotesis Statistik
184
ISBN 978-602-8310-02-4
0 B @
H0 : θ ≤ θ0 , H1 : θ ≤ θ0 Kaerna keluarga distribusi {g (t, θ) , θǫΩ}adalah MLR dari T (x) = x(i) dan T (x)adalah statistik cukup untuk θ, maka
@
=
x
n x
n x
!
θx (1 − θ)n−x , x = 0, 1, 2...H0 : θ ≤
n−x
Aθ1x (1−θ1 ) 1
C x n−x Aθ0 (1−θ0 )
x θ1 θ0
, untuk θ1 > θ0
1−θ1 1−θ0
nx
1−θ1 xLog θθ10 + (n − x) Log 1−θ 0 (1−θ1 ) 1−θ1 = x Log θθ01 − Log (1−θ + Log 1−θ 0) 0 (x|θ) > Log k Sehingga untuk: Log ff(x|θ 1) Ekivalen dengan: “ ” Log
f (x|θ) f (x|θ1 )
x > c∗0 =
=
Logk−nLog (θ )
Log (θ1 ) −Log 0
1−θ1
“1−θ0 ” 1−θ1 1−θ0
UMP tes memberikan: Bab 5. Hipotesis Statistik
185
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
∗ 1 ; jika x > c0 Ø (x) = γ ; jika x = c∗0 0 ; jika x < c∗0
dimana c∗0 dapat ditentukan P (x > c∗0 ) + γP (x = c∗0 )
α P (x ≤
=
− γP (x =
Persamaan 1 menjadi:
c∗0 )
Selanjutnya akan dihitung uji kuasanya:
= 1 − P (x ≤ c∗0 ) + γP (x = c∗0 ) = 1−α (5.43)
= =
0, 9624 − 0, 8306 0, 1318
Persamaan 1 menjadi: 0, 9624 − γ0, 8306 = 0, 95 γ = 0, 094
• Untuk n = 6, θ0 = 0, 25, α = 0, 01 Dari tabel B (n = 6, θ0 = 0, 25, α = 0, 01)didapat untuk c∗0 = 4 P0,25 (x ≤ 4) = 0, 9954 P0,25 (x = 4) = P0,25 (x ≤ 4) − P0,25 (x ≤ 3) = 0, 9954 − 0, 9624 = 0, 033 Persamaan 1 menjadi:
0, 9954 − γ (0, 033) = 0, 99 γ = 0, 164 186
0, 9954 − γ (0, 033) = 0, 98 γ = 0, 467
P (x > c∗0 ) + γP (x = c∗0 )
Dari tabel Binomial (n = 6, θ0 = 0, 25)didapat: P0,25 (x ≤ c∗0 ) = 0, 9624 P0,25 (x = c∗0 ) = P0,25 (x ≤ c∗0 ) − P0,25 (x ≤ c∗0 − 1) Untuk c∗0 =⇒ = P0,25 (x ≤ 3) − P0,25 (x ≤ 2)
Bab 5. Hipotesis Statistik
• Untuk n = 6, θ0 = 0, 25, α = 0, 02 Dari tabel B (n = 6, θ0 = 0, 25, α = 0, 012)didapat c∗0 = 4 P0,25 (x ≤ 4) = 0, 9954 dan P0,25 (x = 4) = 0, 033
berdasarkan hubungan Eθ0 (Ø (x)) =
• Untuk n = 6, θ0 = 0, 25, α = 0, 05
c∗0 )
Statistika Matematis II/ Edisi E-book
ISBN 978-602-8310-02-4
β (θ) = Eθ (Ø (x)) β (θ) = Pθ1 (x > c∗0 ) + γPθ1 (x = c∗0 )
(5.44)
• Untuk θ1 = 0, 3, c∗0 = 3 dan γ = 0.094 Persamaan 2 menjadi: β0,3 (θ) = 1 − P (x = 0) − P (x = 1) − P (x = 2) + γ.P (x = 3) = =
1 − 0, 1176 − 0, 3025 − 0, 3341 + 0, 094. (0, 1852) 0, 273
• Untuk θ1 = 0, 3 , c∗0 = 4 dan γ = 0, 164
Persamaan 2 menjadi: β0,3 (θ) = P (x = 5) + P (x = 6) + 0, 164 (P (x = 4)) = 0, 0102 + 0, 0007 + 0, 164. (0, 0595) = 0, 0206
• Untuk θ1 = 0, 3 , c∗0 = 4 dan γ = 0, 467 β0,3 (θ) = P (x = 5) + P (x = 6) + 0, 467 (P (x = 4)) = 0, 0102 + 0, 0007 + 0, 467. (0, 0595) =
0, 0387
• Untuk θ1 = 0, 4 , c∗0 = 3 dan γ = 0, 094 β0,4 (θ) = P (x = 4) + P (x = 5) + P (x = 6) + γP (x = 3) = 0, 1382 + 0, 0369 + 0, 0041 + 0, 094. (0, 2765) = 0, 205 • Untuk θ1 = 0, 4, c∗0 = 4 dan γ = 0, 164 β0,4 (θ) = P (x = 5) + P (x = 6) + γP (x = 4) = 0, 0369 + 0, 0041 + 0, 164. (0, 1382) = Bab 5. Hipotesis Statistik
0, 064 187
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
• Untuk θ1 = 0, 4 , c∗0 = 4 dan γ = 0, 467 β0,3 (θ) = P (x = 5) + P (x = 6) + γP (x = 4) = 0, 0369 + 0, 0041 + 0, 467. (0, 1382) =
0, 106
Statistika Matematis II/ Edisi E-book
3. Diketahui X1 , X2 sampel random berukuran n = 2 dari distribusi yang mempunyai f.k.p f (x, θ) = θ1 e−x/θ , 0 < x < ∞ dan 0 untuk yang lain. Kita tolak H0 : θ = 2 dan terima H1 : θ = 1 jika nilai observasi dari X1 , X2 katakan X1 , X2 sedemikian sehingga
c∗0
• Untuk θ1 = 0, 5 , = 3 dan γ = 0, 094 β0,5 (θ) = P (x > 3) + γP (x = 3) = 1 − P (x ≤ 2) + γP (x = 3) = 1 − 0, 3437 + 0, 094 (0, 3125) =
0, 686
• Untuk θ1 = 0, 5 , c∗0 = 4 dan γ = 0, 164 β0,5 (θ) = P (x > 4) + γP (x = 4)
(5.45)
Jika ruang parameter Ω = {θ; θ = 1, 2} , tentukan tingkat signifikansi dari uji dan kekuatan uji kalau H0 salah. 4. Diasumsikan ketahanan dari suatu ban dan mill, katakan X, ber-
= 1 − P (x ≤ 3) + γP (x = 4) = 1 − 0, 6562 + 0, 164 (0, 2344) = 0, 382 • Untuk θ1 = 0, 5 , c∗0 = 4 dan γ = 0, 467 β0,5 (θ) = 1 − P (x ≤ 3) + γP (x = 4) = 1 − 0, 6562 + 0, 164 + 0, 467 (0, 2344) =
f (x1 ; 2)f (x2 ; 2) 1 ≤ f (x1 ; 1)f (x2 ; 1) 2
0, 453
distribusi normal dengan mean θ dan standar deviasi 5000. Berdasarkan pengalaman masa lalu diketahui bahwa θ = 30.000. Perusahaan mengklaim membuat ban dengan proses baru dengan mean θ > 30.000, dan misalkan θ = 35.000. Untuk mengecek ini kita uji H0 : θ ≤ 30.000, lawan H1 : θ > 30000. Kita observasi n nilai yang
independen dai X, misalnya x1 , x2 , ..., xn dan kita tolak H0 (terima H1 ) jika dan hanya jika x ≥ c. Tentukan n dan c sehingga fungsi kekuatan K(θ) dari uji mempunyai nilai K(30.000) = 0, 01 dan K(35.000) = 0, 98.
5.5 Soal-Soal Latihan
5. Misalkan X mempunyai distribusi Poisson dengan mean θ . Dipertimbangkan hipotesis sederhana H0 : θ = 1/2. dan hipotesis ga-
1. Misalkan X mempunyai f.k.p berbentuk f (x; θ) = θxθ−1 ; 0 < x < 1 dan 0 untuk x yang lain, dengan θ ∈ {θ; θ = 1, 2} . untuk uji hipotesis
sederhana H0 : θ = 2, gunakan sampel random X1 , X2 dan didefinisikan daerah kritis C = {((x1 , x2 ); 3/4 ≤ x1 x2 } .Tentukan fungsi kekuatan dari uji.
bungan alternatif H1 : θ < 1/2. Misalkan Ω = {θ; 0 < θ ≤ 1/2} Misalkan X1, X2 , ..., X12 sampel random yang berukuran 12 dari disribusi ini. Kita tolakH0 jika dan hanya jika nilai observasi dari Y = X1 + X2 + ... + X12 ≤ 2. Jika K(θ) adalah fungsi kekuatan 1 ). Sket uji, tentukan kekuatan dari K( 12 ), K( 31 ), K( 14 ), K( 61 ) dan K( 12 grafik dari K(θ). Berapakah tingkat signifikasnsi dari uji?
2. DiketahuiX berdistribusi binomial dengan parameter n = 10 dan p ∈ {p; p = 1/4, 1/2} Hipotesis H0 : p = 1/2 ditolak, dan hipotesis alternatif H1 : p = 1/4 diterima, jika nilai observasi X1 sampel random berukuran 1 lebih kecil atau sama dengan 3. Tentukan fungsi
adalah 0, 999 kalau H1 benar.
kekuatan dari uji. Bab 5. Hipotesis Statistik
6. Dalam contoh 4 diatas , misalkan H0 : θ = θ′ = 0 dan H1 : θ = θ′′ = −1. Perlihatkan bahwa uji terbaik dari H0 lawan H1 dapat menggunakan statistik x dan jika n = 25 dan α = 0, 05 maka kekuatan uji
188
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
189
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
7. Misalkan variabel random x mempunyai f.k.p f (x; θ) = 1θ e−x/θ ; 0 < x < ∞ dan 0 untuk x yang lain. Pertimbangkan hipotesis sederhana H0 : θ = θ′ = 2 dan alternatif H1 : θ = θ′′ = 4. jika x1 , x2 sampel
13. Misalkan X1, X2 , ..., Xn sampel random dari distribusi yang mempunyai f.k.p f (x; p) = px (1(− p)1−x ; x = 0, 1 dan 0 untuk ) x yang lain. n X xi ≤ c adalah daerah Perlihatkan bahwa C = (x1 , x2 , ..., xn ); ≤
random yang berukuran 2 dari distribusi ini . Perlihatkan bahwa uji terbaik dari H0 lawan H1 dapat menggunakan statistik x1 + x2 . 8. Ulangi soal 2 kalau H1 : θ = θ′′ = 6. Kemudian tentukan bentuk umum ini untuk setiap θ′′ > 2
i=1
kritik terbaik untuk uji H0 : p = 1/2 lawan H1 : p = 1/3. Gunakan teorema limit pusat untuk menentukan n dan c sehingga P
n X i=1
9. Misalkan X1, X2 , ..., X10 sampel random berukuran 10 dari distribusi normal n(0, σ 2 ). Tentukan daerah kritik terbaik ukuran α = 0, 05 untuk uji H0 : σ 2 = 1 lawan H1 : σ 2 = 2. Apakah ini merupakan daerah kritik terbaik ukuran 0,05 untuk uji H0 : σ 2 = 1 lawan H1 : σ 2 = 4? lawan H1 : σ 2 = 1?
xi ≤ c; H0
!
∼ = 0, 10 dan P
n X i=1
xi ≤ c; H1
!
∼ = 0, 80
(5.48)
14. Dua sampel random yang independen masing-masing berukuran n dari dua disribusi. Kita tolak H0 : θ = 0 dan terima H0 : θ > 0 jika dan hanya jika x − y ≥ c. jika K(θ) adalah kekuatan fungsi dari uji ini tentukan n dan c sehingga K(0) ∼ = 0, 05 dan K(10) ∼ = 0, 09. ′
10. Jika X1, X2 , ..., Xn adalah sampel random dari distribusi yang mempunyai f.k.p dari bentuk f (x; θ) = θxθ−1 ; 0 < x < 1 dan 0 untuk yang lain. Perlihatkan bahwa daerah kritik terbaik untuk ujiH1 : θ = 1
lawan H1 : θ = 2 adalah C =
15. Dalam contoh 5 diatas, H0 : θ = θ dengan θ′ bilangan tertentu dan H1 : θ < θ′ , perlihatkan bahwa himpunan (
n
(x1 , x2 , ..., xn ) ; c ≤Πi=1 xi
11. Misalkan X1, X2 , ..., X10 sampel random dari distribusi n(θ1 , θ2 ). Ten′ ′ tukan uji terbaik dari hipotesis sederhana H0 : θ1 = θ1 = 0, θ2 = θ2 = ′′ ′′ 1 lawan hipotesis alternatif H1 : θ1 = θ1 = 1, θ2 = θ2 = 4
n X (x1 , x2 , ..., xn ) : x2i ≥ c i=1
)
(5.49)
adalah daerah kritik paling kuat seragam uji H0 lawan H1 . ′
16. Dalam contoh 6 , H0 : θ = θ dengan θ′ bilangan tertentu dan H1 : ′ θ 6= θ , perlihatkan bahwa tidak ada uji paling kuat seragam untuk uji H0 lawan H1 .
12. Misalkan X1, X2 , ..., Xn sampel random dari distribusi normal n(θ, 100). Perlihatkan bahwa C = {(x1 , x2 , ..., xn ); c ≤ x}adalah daerah kritik terbaik untuk uji H0 : θ = 75 lawan H1 : θ = 78 Tentukan n dan c sehingga
17. Misalkan X1, X2 , ..., X25 sampel random berukuran 25 dari distribusi normal n(θ, 100). Tentukan daerah kritik paling kuat seragam dari ukuran α = 0, 01 untuk uji H0 : θ = 75 lawan H1 : θ > 75 18. Misalkan X1, X2 , ..., Xn sampel random darid istribusi normal
P [(X1, X2 , ..., Xn ) ∈ C; H0 ] = P (x ≥ c; H0 ) = 0, 05
(5.46)
n(θ, 16). Tentukan sampel berukuran n dan uji paling kuat seragam dari H0 : θ = 25 lawan H1 : θ < 25 dengan kekuatan fungsi K(θ) sehingga K(25) ∼ = 0, 10 dan K(23) ∼ = 0, 90.
P [(X1, X2 , ..., Xn ) ∈ C; H1 ] = P (x ≥ c; H0 ) = 0, 90
(5.47)
19. Diketahui suatu distribusi dengan f.k.p f (x; θ) = θx (1−θ)1−x ; x = 0, 1
dan
Bab 5. Hipotesis Statistik
190
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
191
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book
Statistika Matematis II/ Edisi E-book
dan bernilai 0 untuk x yang lain. Misalkan H0 : θ = 1/20 dan H1 : θ > 1/20.Gunakan teorema limit pusat untuk menentukan sampel berukuran n dari sampel random sehingga uji paling kuat sera-
24. Dalam contoh 2 diatas, bila n = 10, dan misalkan diperoleh x = 10 X 0, 6 dan (xi − x)2 = 3, 6. Jika uji sama dengn contoh apakah kita
gam dari H0 lawan H1 mempunyai fungsi kekuatan K(θ) dengan K(1/20) ∼ = 0, 09 = 0, 05 dan K(1/10) ∼
i=1
menolak atau menerima H0 : θ1 = 0 pada tingkat signifikansi 5%.
20. Dalam n percobaan binomial dengan parameter p akan diuji H0 : p = 1/2, lawan H1 : p 6= 1/2
(5.50)
Tunjukkan bahwa daerah kritik uji rasio likelihood adalah x ln x + (n − x) ≥ k
(5.51)
dengan x menyatakan banyak sukses. 21. Dalam soal no 1, tunjukkan bahwa daerah kritiknya juga dapat di tulis x − n ≥ c, dengan c suatu konstanta yang tergantung pada 2
ukuran daerah kritik.
22. Suatu sampel random yang berukuran n digunakan untuk menguji hipotesis nol dari populasi eksponensial dengan parameter θ sama dengan θ0 lawan hipotesis alternatif tidak sama θ0 . Tunjukkan daerah kritik uji rasio likelihood adalah xe−x/θ0 ≤ k
(5.52)
23. Suatu sampel random yang berukuran n dari populasi normal dengan mean dan varians tidak diketehui digunakan untuk uji hipotesis µ = µ0 lawan alternatif µ 6= µ0 . Perlihatkan bahwa nilai dari statistik rasio likelihood dapat ditulis λ= dengan t =
1+
t2 n−1
−n/2
(5.53)
x−µ √0 s/ n
Bab 5. Hipotesis Statistik
192
ISBN 978-602-8310-02-4
Bab 5. Hipotesis Statistik
193
ISBN 978-602-8310-02-4
Daftar Pustaka 1. Billingsley, P. (1979) Probability and Measure, John Wiley & Sons,USA 2. Dudewicz E.J. & Mishra, S.N.(1988) Modern Mathematical Statistics,John Wiley & Sons, Inc. Singapore 3. Lehmann, E.L. (1983) Theory of Point Estimation, John Wiley & Sons, Inc. USA 4. Nar Herrhyanto (2003) Statistika Matematis Lanjutan, CVPustaka Karya, Bandung 5. Papoulis,A & Pillai S. Unnikrishna, (2002) Probability, Random Variables, And Stochastic Processes, Mc Graw Hill, Inc, Singapore 6. Rohatgi,V.K. (1976) An Introduction to Probability Theory and Mathematical Statistics, John Wiley & Sons, USA 7. Roussas G.G. (1973) A First Course in Mathematical Statistics, Addison-Wesley Publishing Company, Inc. USA 8. Subanar (1994) Suplemen Teori Peluang, Fakultas MIPA UGM, Yogyakarta 9. Walpole, Ronald.E. & Myers, Raymond H. & Myers, Sharon L.& Ye, Keying (2002) Probability and Statistics for Engineers & Scientists, Prentice Hall,Inc, USD 194
195
Statistika Matematis II/ Edisi E-book
Daftar Pustaka
10. Walpole, Ronald.E. & Myers, Raymond H. (1986) Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuan, Penerbit ITB, Bandung. 11. Beberapa e-book dan e-text, terutama dari portal MIT Open Course Ware (http://ocw.mit.edu/OcwWeb/Mathematics/index.htm)
Bab 5. Daftar Pustaka
196
ISBN 978-602-8310-02-4