Politeknik Telkom
Statistika
STATISTIKA
POLITEKNIK TELKOM BANDUNG 2008 i
Politeknik Telkom
Statistika
HALAMAN PENGARANG DAN COPYRIGHT Penulis: 1. SRI SURYANI PRASETOWATI M.Si 2. YULIANT SIBARONI S.Si, M.T
Dilar ilara ang mene menerb rbit itk kan kemb embali, ali, meny enyebar ebarlu lua askan skan atau tau menyim menyimpan pan baik baik sebagi sebagian an maupun maupun seluru seluruh h isi buku buku dalam dalam bentu entuk k dan dan deng dengan an cara cara apap apapun un tanp tanpa a izin izin tert tertul ulis is dari dari Politeknik Telkom. Hak Hak cipt cipta a dili dilind ndun ungi gi Telkom 2008
unda undang ng-u -und ndan ang g
@
Poli Polite tekn knik ik
No part of this document may be copied, reproduced, printed, distributed, modified, removed and amended in any form by any any mean means s with withou outt prio priorr writ writte ten n auth author oriz izati ation on of Telkom Telkom Polytechnic. ii
Politeknik Telkom
Copyr opyriight ght reserved
@
Statistika
2008 008
Tel Telkom kom
Polyt olytec echn hniic.
All All
righ rights ts
KATA PENGANTAR
Assalamu’alaikum Wr. Wb Segala puji bagi Allah SWT karena dengan karunia-Nya courseware ini dapat diselesaikan. diselesaikan. Atas nama Politeknik Telkom, kami sangat menghargai dan ingin menyampaikan terima kasih kepada penulis, penerj penerjema emah h dan dan penyu penyunti nting ng yang yang telah telah membe memberik rikan an tena tenaga ga,, piki pikira ran, n, dan dan wakt waktu u sehi sehing ngga ga c ourseware ini dapat tersusun. Tak ada gading yang tak retak, di dunia ini tidak ada yang yang semp sempur urna na,, oleh oleh ka kare rena na itu itu ka kami mi hara harapk pkan an para para pengguna buku ini dapat memberikan masukan perbaikan demi pengembangan selanjutnya. Semoga courseware ini dapat memberikan manfaat dan membantu seluruh Sivitas Akademika Politeknik Telkom dalam memahami dan mengikuti materi perkuliahan di Politeknik Telkom. Amin. Wassalamu’alaikum Wr. Wb. Bandung, Agustus 2008
iii
Politeknik Telkom
Statistika
Christanto Triwibisono Wakil Direktur I Bidang Akademik & Pengembangan
DAFTAR ISI
DAFTAR ISI...........................................................................iv
1 MENGENAL DATA....... DATA.......................... ............................. ..........1 1 1.1 Populasi dan Sampel........................................... Sampel....................................................... ...............2 ...2 1.2 Skala Pengukuran.............................. Pengukuran........................................... .................. ........... ........... ........ ...3 3
2 STATISTIKA STATISTIKA DESKRIPTIF.......................... DESKRIPTIF..........................1 1 2.1 Ukuran Pemusatan..............................................................2 2.2 Ukuran Penyebaran.............................................................3 2.3 Ukuran Letak......................................................................3 2.4 Distribusi Frekuensi............................................................4 2.5 Penyajian dalam Bentuk Grafik..........................................6
3 PELUANG, PELUANG BERSYARAT, DAN KAIDAH BAYES ........................... ................................... ........3 3 3.1 Ruang Sampel dan dan Kejadian...............................................4 Kejadian............................................ ...4 3.2 Peluang...............................................................................5 3.3 Peluang Bersyarat...............................................................7 3.4 Kaidah Bayes....................................................................10
4 PEUBAH ACAK, DISTRIBUSI PELUANG DISKRET, DAN DISTRIBUSI PELUANG KONTINU.... KONTINU........... ............... ................................ ........................17 17 4.1 Peubah Acak ....................................................................18 4.2 Distribusi Peluang Diskret................................................19 4.3 Distribusi Peluang Kontinu..............................................19 iv
Politeknik Telkom
Statistika
Latihan ...................................................................................23
5 DISTRIBUSI PELUANG KHUSUS DISKRET DAN KONTINU .....................................1 5.1 Distribusi Peluang Diskret..................................................2 5.1.1 Distribusi Bernoulli dan Binomial..................................2 5.1.2 Distribusi Poisson..........................................................5 5.2 Distribusi Peluang Kontinu.............................................11 5.2.1 Distribusi Normal........................................................11 5.2.2 Distribusi Normal Baku .............................................13 5.2.3 Distribusi Uniform .......................................................15 5.2.4 Distribusi Eksponensial.................................................16 Latihan....................................................................................21
6 DISTRIBUSI SAMPLING DAN DALIL LIMIT PUSAT................................................1 6.1 Distribusi Sampling.........................................................2 6.2 Dalil Limit Pusat..............................................................3 DAFTAR ISI...........................................................................iv
1 MENGENAL DATA....................................1 1.1 Populasi dan Sampel..........................................................2 1.2 Skala Pengukuran..............................................................3
2 STATISTIKA DESKRIPTIF..........................1 2.1 Ukuran Pemusatan..............................................................2 2.2 Ukuran Penyebaran.............................................................3 2.3 Ukuran Letak......................................................................3 2.4 Distribusi Frekuensi............................................................4 2.5 Penyajian dalam Bentuk Grafik..........................................6
3 PELUANG, PELUANG BERSYARAT, DAN KAIDAH BAYES ...................................3 3.1 Ruang Sampel dan Kejadian...............................................4 3.2 Peluang...............................................................................5 3.3 Peluang Bersyarat...............................................................7 3.4 Kaidah Bayes....................................................................10
v
Politeknik Telkom
Statistika
4 PEUBAH ACAK, DISTRIBUSI PELUANG DISKRET, DAN DISTRIBUSI PELUANG KONTINU...........................................17 4.1 Peubah Acak ....................................................................18 4.2 Distribusi Peluang Diskret................................................19 4.3 Distribusi Peluang Kontinu..............................................19 Latihan ...................................................................................23
5 DISTRIBUSI PELUANG KHUSUS DISKRET DAN KONTINU .....................................1 5.1 Distribusi Peluang Diskret..................................................2 5.1.1 Distribusi Bernoulli dan Binomial..................................2 5.1.2 Distribusi Poisson..........................................................5 5.2 Distribusi Peluang Kontinu.............................................11 5.2.1 Distribusi Normal........................................................11 5.2.2 Distribusi Normal Baku .............................................13 5.2.3 Distribusi Uniform .......................................................15 5.2.4 Distribusi Eksponensial.................................................16 Latihan....................................................................................21
6 DISTRIBUSI SAMPLING DAN DALIL LIMIT PUSAT................................................1 6.1 6.2
Distribusi Sampling.........................................................2 Dalil Limit Pusat..............................................................3
vi
Politeknik Telkom
Statistika
1 MENGENAL DATA
Overview
Dalam sebuah penelitian, data adalah sebagai komponen utamanya. Tanpa data, kita tidak bisa membuat kesimpulan apapun berkaitan dengan penelitian yang telah dilakukan. Berkaitan dengan data, ada beberapa karakteristik data yang perlu untuk kita kenali antara lain sumber data (primer, sekunder) jenis pengambilan datanya (sampel,populasi) dan skala pengukurannya. Pengetahuan tentang karakteristik data ini tentunya sangat diperlukan agar analisa yang kita lakukan terhadap data menjadi lebih relevan dan lebih tepat.
Tujuan
1. Mahasiswa memahami konsep data primer ,sekunder, sampel , populasi. 2. Mahasiswa memahami skala pengukuran data 3. Mahasiswa dapat memberikan contoh data primer, sekunder, sampel dan populasi Mengenal Data
1
Politeknik Telkom
Statistika
4. Mahasiswa dapat memberikan contoh data sampel berdasarkan jenis skala pengukurannya 1.1 Populasi dan Sampel
Persoalan-persoalan yang muncul dalam berbagai bidang, hampir seratus persen berhubungan dengan data. Data dalam bidang statistika merupakan keterangan atau informasi mengenai suatu kejadian, biasanya dinyatakan dengan angka. Diharapkan nantinya data dapat memberikan informasi lebih banyak bagi yang bersangkutan. Sebelum membahas tentang data, terlebih dahulu akan dibahas sekilas tentang statistika, populasi, dan sampel. Statistika yaitu suatu ilmu yang mempelajari tentang data, meliputi teknik pengambilan data, pengolahan dan penyajiannya, kemudian analisis dan kesimpulan serta pengambilan keputusan dari kesimpulan yang diperoleh lewat analisis. Sedangkan data itu sendiri merupakan keterangan yang menggambarkan kondisi saat itu. Berdasarkan sumbernya data dibedakan menjadi dua, yaitu 1) data primer dan 2) data sekunder. Data primer adalah keterangan atau informasi secara umum yang diperoleh oleh dari penelitian peneliti sendiri. Sedangkan data sekunder merupakan data yang diambil dari penelitian orang lain pada suatu publikasi. Berkaitan dengan pengambilan data, terdapat dua istilah yaitu populasi dan sampel. Populasi adalah seluruh objek yang diamati. Sedangkan sampel adalah objek yang diamati adalah sebagian dari populasi. Diharapkan pengambilan sampel yang dilakukan dapat mewakili populasi. Beberapa hal yang mendasari pengambilan sampel adalah : Mengenal Data
2
Politeknik Telkom
Statistika
1. Waktu Bila waktu untuk penelitian terbatas, maka pengambilan sampel dapat dipilih sebagai alternatif pengambilan data. 2. Biaya Untuk penelitian mengenai suatu komponen yang harganya mahal, bila pengambilan populasi dilakukan, maka biaya yang dikeluarkan akan besar. Sehingga untuk biaya yang terbatas, perlu dilakukan pengambilan sampel. 3. Populasi tidak pasti Salah satu contoh populasi tidak pasti adalah, bila penelitian kita tentang orang berpenyakit flu burung, maka kita akan kesulitan menentukan populasinya, karena tanpa pemeriksaan akan sulit ditentukan seseorang kena flu burung atau tidak. Sehingga pengambilan sampel perlu dilakukan yaitu pasien flu burung pada suatu rumah sakit. 4. Ketelitian Hal ini berhubungan dengan waktu dan biaya yang terbatas. Misal biaya dan waktu penelitian terbatas, maka jumlah tenaga yang membantu penelitian akan menjadi pertimbangan, sehingga hasilnya pengolahannya berpengaruh pada tingkat ketelitian. 1.2 Skala Pengukuran
Skala pengukuran merupakan bagian yang paling mendekati pengukuran data baik secara diskret maupun kontinu. Skala ini sangat penting, karena berkaitan dengan pemilihan teknik analisis statistika yang sangat bergantung Mengenal Data
3
Politeknik Telkom
Statistika
pada sifat data dan skala pengukuran yang digunakan. Ditinjau berdasarkan skala pengukurannya, data dapat dibedakan menjadi beberapa kelompok, yaitu ( dari yang terendah sampai yang tertinggi ) : a. Skala Nominal Data yang termasuk dalam kelompok ini memiliki ciri bahwa data tidak memiliki tingkatan. Satu – satunya operator matematika yang berlaku adalah persamaan dan pertidaksamaan. Contohnya adalah data tentang jenis kelamin, agama, jenis penyakit dan sebagainya. b. Skala Ordinal Sudah ada tingkatan pada data yang masuk kelompok ini, hanya saja belum ada ketentuan jarak yang sama antar tingkatan,serta ada hubungan lebih dari. Contohnya adalah data tentang golongan kepegawaian, kepangkatan, nilai huruf, peserta kontes kecantikan, jenis komputer dan sebagainya. c. Skala Interval Selain sudah memiliki tingkatan seperti data pada skala ordinal, data yang masuk dalam kelompok ini juga memiliki sifat bahwa jarak antar tingkatan adalah sama. Hal ini diperiksa melalui selisih antar tingkatan selalu tetap Sebagai contoh data suhu yang diukur dalam Celcius, selisih antara suhu 30 dan 29 akan sama dengan selisih suhu 10 dan 11 atau dengan yang lainnya. Ciri lain dari data ini adalah nilai 0 belum memiliki arti sebenarnya ( tidak ada). Contohnya adalah suhu 0 derajat bukan berarti tidak ada suhu, tahun 0 bukan berarti tidak ada tahun.
Mengenal Data
4
Politeknik Telkom
Statistika
d. Skala Rasio Data yang memiliki skala ini memiliki tingkatan yang paling tinggi. Semua sifat pada skala interval juga ada pada data skala rasio ini. Tambahan sifat untuk jenis data ini adalah nilai 0 sudah memiliki arti yang sebenarnya ( tidak ada ). Contoh adalah data tentang berat, tinggi, harga, volume dan sebagainya. Dengan mengetahui jenis data yang akan diolah, maka kita dapat menentukan analisis yang tepat untuk data tersebut. Sebagai contoh data yang memiliki skala Nominal hanya dapat disajikan dalam bentuk pie chart, bar chart dan tidak dapat ditentukan ukuran − ukuran statistik seperti mean, standard deviation dan sebagainya. Data yang berskala Ordinal selain dapat dianalisa seperti nominal juga dapat dianalisa lebih lanjut tetapi sebelumnya harus ditransformasi ke bentuk numerik. Tetapi, kadang untuk pengolahan lebih lanjut, data berskala ordinal dan nominal dapat diolah dengan menggunakan statistika nonparametrik (tanpa distribusi). Sedangkan data yang berskala interval atau Rasio dapat dilakukan analisa yang lebih lengkap secara langsung. Analisa yang dapat dilakukan pada data dengan kedua skala terakhir ini relatif sama. Contoh Sebuah penelitian dilakukan untuk melihat pengaruh kenaikan BBM terhadap tingkat pengangguran di kota Bandung. Berikut adalah data yang bisa digunakan dalam penelitian ini : Data yang diperlukan antara lain data tentang tingkat pengangguran sebelum kenaikan BBM dan setelah kenaikan BBM Mengenal Data
5
Politeknik Telkom
Statistika
a. Data Sekunder i. Data tingkat pengangguran sebelum kenaikan BBM (misalkan data dari BPS atau hasil penelitian lainnya) ii. Data tingkat pengangguran setelah kenaikan BBM (misalkan data dari BPS hasil penelitian lainnya) b. Data Primer Yaitu data tingkat pengangguran setelah kenaikan BBM yang dicari sendiri melalui pendataan secara langsung c. Data Sampel Data tingkat pengangguran (sebelum dan kenaikan BBM) yang diambil dari sebagian penduduk kota Bandung d. Data Populasi Data tingkat pengangguran (sebelum dan kenaikan BBM) yang diambil dari seluruh penduduk kota Bandung e. Skala Pengukuran Data yang dikumpulkan dalam penelitian ini antara lain meliputi data tentang usia(rasio), agama (nominal), status perkawinan (nominal), Jenis Kelamin (nominal) dan status Bekerja (nominal).
Latihan 1. Suatu penelitian dilakukan untuk melihat hubungan antara jumlah sks dengan nilai IPK yang diperoleh mahasiswa Poltek Telkom. Tentukan data yang diperlukan untuk Mengenal Data
6
Politeknik Telkom
Statistika
penelitian ini beserta jenis datanya (kerjakan seperti contoh) 2. Suatu penelitian dilakukan untuk melihat hubungan antara frekuensi penggunaan laboratorium dengan biaya perawatan laboratorium tersebut . Tentukan data yang diperlukan untuk penelitian ini beserta jenis datanya (kerjakan seperti contoh)
Mengenal Data
7
Politeknik Telkom
Statistika
2
STATISTIKA DESKRIPTIF
Overview
Suatu data mentah menjadi kurang berguna bila hanya ditampilkan seperti aslinya. Sebagian orang bahkan sangat kesulitan ketika melihat data dalam bentuk numerik. Salah satu teknik dalam Statistika untuk menampilkan atau menyajikan suatu data agar lebih mudah untuk dipahami adalah Statistika Deskriptif. Dalam Statistika Deskriptif, secara umum data akan disajikan dalam bentuk tabel maupun dalam bentuk grafik tergantung dari jenis datanya. Walaupun tampilan data lebih sederhana, tetapi setiap orang dapat memiliki persepsi yang berbeda – beda berkaitan dengan data tersebut
Tujuan
1. Mahasiswa mengetahui konsep dan jenis - jenis ukuran pemusatan, ukuran penyebaran dan ukuran letak 2. Mahasiswa dapat menentukan ukuran pemusatan, ukuran penyebaran dan ukuran letak suatu data Statistika Deskriptif
1
Politeknik Telkom
Statistika
3. Mahasiswa dapat menyajikan data dalam histogram, boxplot dan diagram dahan dan daun
2.1
bentuk
Ukuran Pemusatan
Terdapat beberapa ukuran pemusatan dalam statistika deskriptif antara lain mean, median, dan modus. − Mean adalah rata−rata dari data dan dinotasikan dengan x atau µ, di mana x menyatakan rata−rata sampel dan µ menyatakan rata−rata populasi. Secara umum mean memiliki rumusan sebagai berikut : x i , n banyaknya sampel x = n
∑
x ∑ µ =
−
i
, N banyaknya populasi
N Median adalah nilai yang membagi suatu gugus data yang telah terurut menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah nilai median terdapat 50% data. Cara menentukan median sebagai berikut : Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil ke besar, maka untuk n ganjil median = X n +1 dan 2
1 X n + X n +1 . 2 2 2 Modus yaitu nilai yang paling sering muncul dalam suatu gugus data untuk n genap median =
−
Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah suatu gugus data, walaupun ada Statistika Deskriptif
2
Politeknik Telkom
Statistika
beberapa kasus yang membuat nilai mean menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim.
2.2
Ukuran Penyebaran
Beberapa ukuran penyebaran antara lain : − Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum dengan nilai minimum. − Variansi adalah nilai tengah dari kuadrat penyimpangan antara xi terhadap x . Variansi merupakan ukuran penyebaran yang sering digunakan dalam statistika inferensia. Variansi dinotasikan S2 untuk sampel dan σ2 untuk populasi. Variansi memiliki rumusan sebagai berikut :
S 2 σ
−
2
( x ∑ =
=
− x ) 2 n −1 ∑ ( xi − µ ) 2 i
, di mana n banyaknya sampel , di mana N banyaknya populasi
N Simpangan baku merupakan akar dari variansi.
2.3
Ukuran Letak
Kuartil menyatakan nilai−nilai yang membagi gugus data menjadi empat bagian yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data terletak di bawah Q1. Q2 sama dengan median. Sedangkan Q3 memiliki sifat bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalh desil, persentil dll.
Statistika Deskriptif
3
Politeknik Telkom
2.4
Statistika
Distribusi Frekuensi
Distribusi frekuensi yaitu penyajian data dalam bentuk tabel. Di mana pada tabel tersebut menampilkan ciri−ciri penting sejumlah data yang diperoleh dengan cara mengelompokkan data menjadi beberapa kelas, kemudian dari masing−masing kelas dihitung banyaknya pengamatan yang masuk. Langkah-langkah membuat tabel frekuensi : 1. Menentukan banyaknya kelas dengan kaidah Sturges yaitu N = 2 k −1 , dimana k =1 +3.3 log N . Banyaknya kelas sebaiknya antara 5 sampai 15. 2. Menentukan interval kelas (KI) KI =
range k
KI sebaiknya kelipatan 5. 3. Untuk komposisi kelas, perhatikan bahwa kelas tidak tumpang tindih. 4. Bila tabel distribusi frekuensi, nantinya digunakan untuk membuat histogram atau poligon, maka komposisinya diubah ke bentuk batas kelas (batas bawah kikurangi setengah dan batas atas di tambah setengah)
Bila data disajikan sebagai data kelompok (tabel frekuensi), maka ukuran pemusatan, penyebaran dan letak dapat dihitung dengan menggunakan rumusan sebagai berikut :
-
Ukuran Pemusatan
Statistika Deskriptif
4
Politeknik Telkom
Statistika n
∑= f x i
Mean : x
=
i
i 1 n
∑= f i
i 1
xi = titik tengan kelas, f i = frekuensi kelas
~ Median : x
= Bb +
( 12 f t − f sm ) f m
p f t =
Bb = batas bawah kelas median
total f m = frekuensi kelas median
frekuensi
p = interval kelas
f sm = frekuensi kumulatif sebelum median
Modus : xˆ = Bb a
= f m −
+
a a +b
p
f am
b
= f m − f bm
f m = frekuensi kelas modus
f am = frekuensi sebelum kelas modus f bm = frekuensi sesudah kelas modus
-
Ukuran Penyebaran
S
2
= p 2
n n ∑ ( f i i =1
Statistika Deskriptif
n ci ) − f i ∑ i =1 n ( n −1) 2
2 c i
5
Politeknik Telkom
-
Statistika
Ukuran Letak Kuarti ( Qi , Q2 , Q3 )
Qi
= Bb +
( 4i f t − f sp ) f p
p , i
= 1, 2, 3
f p = frekuensi pada kelas kuartil ke-i f sp = frekuensi sebelum kuarti
Pada tabel distribusi frekuensi, dapat juga diberikan coding untuk mempermudah perhitungan statistik. Coding dilakukan dengan cara membagi kelas menjadi dua yaitu kelas yang ditengah-tengah diberi kode nol, sedangkan dua kelas di bawah dan di atasnya diberi kode negatif dan positif.
2.5
Penyajian dalam Bentuk Grafik
−
Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya memiliki skala interval atau rasio, maka histogram dapat digunakan untuk menyajikan data.
−
Box plot merupakan bentuk penyajian data yang hanya menggunakan beberapa statistik yang disebut ringkasan lima angka yaitu nilai minimum, Q1, median, Q3, nilai maksimum. Pada box plot dapat juga ditentukan adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada data yang apabila dibandingkan dengan nilai data yang lain tidak konsisten. Pencilan dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar). Untuk menentukan pencilan digunakan rumusan sebagai berikut : Pagar dalam (p) p1 = Q1 − 1.5 ( Q3 − Q1 ) p 2= Q3 + 1.5 ( Q3 − Q1 )
Statistika Deskriptif
6
Politeknik Telkom
Pagar luar (P) P 1 = Q1 − 2 ( Q3
Statistika
P 2= Q3 + 2 ( Q3 − Q1 ) Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di luar pagar luar.
−
− Q1 )
Diagram dahan daun adalah salah satu teknik penyajian data yang menggunakan data asli secara langsung. Pada dasarnya dalam diagram dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun, dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom daun.
Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data, apakah simetri, menjulur ke kiri atau ke kanan. Sedangkan untuk memeriksa kemencengan ~ x − x digunakan metode Pearson yaitu Φ = . Jika Φ < 0 , data S menceng ke kiri dan Φ > 0 , data menceng ke kanan. Contoh 1 Data berikut adalah data penjualan voucher telepon di lima kota provinsi Jawa barat : Bul Bandu Sukabu Gar Tasi Bog an ng mi ut k or 1 42 8 32 56 51 2 45 14 33 60 58 3 51 25 41 58 57 4 61 43 52 62 67 5 69 54 62 63 81 6 76 64 72 68 88 7 78 71 77 69 94 Statistika Deskriptif
7
Politeknik Telkom
8 9 10 11 12
78 72 62 51 44
Statistika
69 58 47 29 16
75 68 58 47 35
71 69 67 61 58
93 85 74 61 55
Hasil yang diperoleh (dari pengolahan dengan minitab 15) adalah sebagai berikut :
Statistika Deskriptif
8
Politeknik Telkom
Statistika Deskriptif
Statistika
9
Politeknik Telkom
Statistika Deskriptif
Statistika
10
Politeknik Telkom
Statistika
Dari keempat kota (Bandung, Sukabumi, garut, dan tasik) rata-rata penjualan voucher telepon tiap bulannya adalah kota tasik yaitu 63.5 dengan variansi terkecil 26,091. Untuk kota Bandung dan Garut penjualan voucher tiap bulannya hampir merata, kota sukabumi penjualan terbanyak pada bulan-bulan terakhir, sedangkan untuk kota tasik penjualan terbanyak pada bulan-bulan pertama pada tahun tersebut. Contoh 2 Data berikut adalah banyaknya turis asing yang masuk ke kota-kota di negara bagian Amerika tiap bulannya. Bila informasi yang diperoleh seperti tampilan di bawah tabel, analisis apa yang dapat anda berikan?
Statistika Deskriptif
11
Politeknik Telkom
Mont h
Atlan ta
1 2 3 4 5 6 7 8 9 10 11 12
42 45 51 61 69 76 78 78 72 62 51 44
Statistika
Bismar New ck York 8 14 25 43 54 64 71 69 58 47 29 16
32 33 41 52 62 72 77 75 68 58 47 35
San Diego 56 60 58 62 63 68 69 71 69 67 61 58
Phoen ix 51 58 57 67 81 88 94 93 85 74 61 55
Informasi yang diperoleh : − Ukuran pemusatan, penyebaran, dan letak N : 60 Mean : 58.42 Median : 61 Modus : 58 Range : 86 Variansi : 338.383 Simp Simpan anga gan n baku baku : 18.3 18.395 95 Minimum :8 Maksimum : 94 Quarti 1, 2, 3 : 48, 61, 70.5
Statistika Deskriptif
12
Politeknik Telkom
-
Statistika
histogram dan boxplotnya sebagai berikut : Histogram Histogram of C7
15
y c 10 n e u q e r F 5
0 10
20
30
40
50
60
70
80
90
C7
Statistika Deskriptif
13
Politeknik Telkom
Statistika
Boxplot of C7
0
10
20
30
40
50
60
70
80
90
100
C7
Statistika Deskriptif
14
Politeknik Telkom
Statistika
Latihan 1. Untuk menentukan kela elayakan air sungai pada suatu daerah yang dikonsumsi oleh penduduk setempat, suatu susp suspen ensi si dite ditetes teska kan n pada pada samp sampel el air air sung sungai ai ters terseb ebut ut denga dengan n ko konse nsentr ntrasi asi terten tertentu. tu. Beriku Berikutt adala adalah h data data yang yang diperoleh 50 penelitian dari beberapa bagian suatu sungai yang diberi suspensi dengan konsentrasi yang berbedabeda :
55. 8
60. 9
37. 0
91. 3
65. 8
42. 3
33. 8
60. 6
76. 0
69. 0
45. 9
39. 1
35. 5
56. 0
44. 6
71. 7
61. 2
61. 5
47. 2
74. 5
83. 2
40. 0
31. 7
36. 7
62. 3
47. 3
94. 6
56. 3
30. 0
68. 2
75. 3
71. 4
65. 2
52. 6
58. 2
48. 0
61. 8
78. 8
39. 8
65. 0
60. 7
77. 1
59. 1
49. 5
69. 3
69. 8
64. 9
27. 1
87. 1
66. 3
Peluang, Peluang Bersyarat, Kaidah Bayes
1
Politeknik Telkom
Statistika
a. Buatlah diagram dahan daun b. Buat tabel distribusi frekuensi dan histogramnya c. Hitung ukuran pemusatan, penyebaran, dan letak, kemudian buat box plotnya d. Kesimpulan apa yang bisa dinyatakan dari data tersebut, berdasarkan a, b, c. 2.
Diketahui tabel distribusi frekuensi di bawah yang menyatakan jarak (dalam ribuan mil) yang ditempuh oleh 191 bis dari suatu travel dan bis gagal mencapai tujuan. Batas kelas Frekuensi 0.5 – 20.5
6
20.5 – 40.5
11
40.5 – 60.5
16
60.5 – 80.5
25
80.5 – 100.5
34
100.5 – 120.5
46
120.5 – 140.5
33
140.5 – 160.5
16
160.5 – 180.5
2
180.5 – 200.5
2
a. Buat histogramnya b. Hitung mean ,simpangan baku Q1 , Q 2 dan Q3 nya, beri penjelasan ! Peluang, Peluang Bersyarat, Kaidah Bayes
2
Politeknik Telkom
c. Buat Boxplot, pencilan/outlier ?
Statistika
periksa
apakah
terdapat
d. Estimasi proporsi dari semua bis yang beroperasi paling sedikit 100.000 mil dan gagal e. Berapakah proporsi dari semua bis yang beroperasi antara 50.000 sampai 125.000 mil dan gagal
3
PELUANG, PELUANG BERSYARAT, DAN KAIDAH BAYES
Overview
Dalam kehidupan nyata, sering kali kita dihadapkan dengan situasi yang tidak pasti dan dipaksa untuk mengambil keputusan yang paling tepat. Dalam Statistika, masalah yang berkaitan dengan ketidakpastian dapat dihubungkan dengan masalah probabilitas (peluang). Kejadian yang pasti terjadi memiliki peluang = 1, kejadian yang mustahil memiliki peluang = 0 sedangkan kejadian tidak pasti memiliki peluang antara 0 – 1. Dengan memahami konsep peluang ini, Peluang, Peluang Bersyarat, Kaidah Bayes
3
Politeknik Telkom
Statistika
diharapkan kita dapat mengambil keputusan yang tepat berdasarkan nilai peluang yang terbesar.
Tujuan
1. Mahasiswa memahami konsep ruang sampel, kejadian dan peluang. 2. Mahasiswa dapat menghitung peluang suatu kejadian 3. Mahasiswa dapat peluang kejadian A bila kejadian B terjadi dengan menggunakan konsep peluang bersyarat dan teorema Bayes
3.1
Ruang Sampel dan Kejadian
Ruang sample dari suatu eksperimen merupakan suatu himpunan semua kemungkinan hasil suatu eksperimen. Ruang sample dinotasikan dengan Ω. Sedangkan kejadian adalah himpunan bagian dari ruang sample. Kejadian dikelompokkan menjadi dua yaitu kejadian sederhana (kejadian yang terdiri dari satu hasil eksperimen) dan kejadian majemuk (kejadian yang terdiri lebih dari satu hasil eksperimen). Contoh Misal suatu eksperimen dilakukan dengan mengamati tiga buah mobil yang akan keluar dari pintu keluar parkir suatu supermarket, apakah belok ke kiri (L) atau ke kanan (R). Ruang sample untuk eksperimen tersebut adalah Ω= { LLL, RLL, LRL, LLR, LRR, RLR, RRL, RRR} . Berikut adalah beberapa contoh kejadian : Peluang, Peluang Bersyarat, Kaidah Bayes
4
Politeknik Telkom
Statistika
Kejadian Sederhana - A = { LLL } = adalah kejadian ketiga mobil keluar pintu parkir belok ke kiri - B = { RRR } = adalah kejadian ketiga mobil keluar pintu parkir belok ke kanan Kejadian Majemuk - C = { RLL, LRL, LLR } = adalah kejadian tepat satu mobil yang keluar pintu parkir belok ke kanan - D ={ LLL, RLL, LRL, LLR } = adalah kejadian paling banyak satu mobil yang keluar pintu parkir belok ke kanan
3.2
Peluang
Menurut Athanasios papoulis, untuk mempelajari peluang terdapat beberapa pendekatan yaitu :
teori
1. Definisi Aksioma
Misal Ω adalah ruang sampel yang berhingga dan A suatu kejadian dalam Ω . Definisi dari pendekatan aksiomatik adalah : untuk setiap kejadian A, peluang dari A ditulis sebagai P ( A) yang merupakan bilangan real dan memenuhi aksioma : 1. P ( A) ≥ 0 2. P ( Ω) =1 3. P ( A B ) = P ( A) + P ( B ) , A B = φ
Peluang, Peluang Bersyarat, Kaidah Bayes
5
Politeknik Telkom
Statistika
∞ ∞ = ∑ P ( Bila ruang sampel tak hingga, maka P Ai i =1 i =1 Sedangkan sifat-sifat peluang adalah : 1. P A =1 − P ( A) 2. P ( φ ) = 0 A ⊂ B 3. P ( A) ≤ P ( B ), 4. P ( A) ≤1 5. P ( A B ) = P ( A) + P ( B ) − P ( A B ) 6. Bila A1 , A2 , , An kejadian dalam
Ai
)
Ω , maka
n n n P Ai = ∑ P ( Ai ) − ∑ P ( Ai A j ) − i ≠ j i =1 i =1 − ( − 1) n−1 P ( A1 A2 An )
7. Bila A1 , A2 , , An kejadian saling lepas, maka
n n P Ai = ∑ P ( Ai ) , i =1 i =1
Ai
A j
= φ
i
≠
j
P ( A B ) ≤ P ( A) + P ( B )
2. Objektif
−
frekuensi relatif Andaikan percobaan acak diulang sebanyak n kali. Bila kejadian A terjadi n kali, maka peluang kejadian A terjadi adalah P ( A) yang didefiniskan sebagai berikut
P ( A)
= lim
n→∞
n ( A) n
( )
n A adalah frekuensi relatif
kejadian A Sifat-sifat :
Peluang, Peluang Bersyarat, Kaidah Bayes
6
Politeknik Telkom
n ( A )
≤1 n 2. Bila A dan B kejadian yang saling lepas, maka n ( A B ) n ( A) n ( B ) 1.
0≤
Statistika
=
n
−
n
+
n
kejadian equally likely Misal Ω adalah ruang sampel berhingga dengan n kejadian sederhana, yaitu
Ω = { S 1 , S 2 , , S n } . Andaikan
= P i , maka
P ( S i )
1. 0 ≤ P i
≤1
n
2.
∑ =
P i
=1
i 1
3. Bila
3.3
A = S i i∈ I
, maka
( )=
P A
P ( S ) = ∑ P ∑ ∈ ∈ i
S i A
Peluang Bersyarat
Peluang bersyarat dari kejadian A bila diketahui kejadian B, yang dinyatakan P A B didefinisikan sebagai berikut :
(
i
i I
)
- P ( A B )
= P ( A B )
, P B
- P ( B A)
P A B ) = (
, P A
( )
P B
( )
P A
diberikan atau dengan notasi
( ) >0 ( ) >0
Peluang, Peluang Bersyarat, Kaidah Bayes
7
Politeknik Telkom
Statistika
Dari definisi tersebut diatas, dapat diperoleh bahwa :
(
P A B
) = P ( B
) ( )
A P A
= P
( A B ) P ( B )
Berikut adalah beberapa aksioma peluang bersyarat : 1. P A B ≥0
( 2. P (
) B )
Ω
=1
3. P ( A1 A2 B ) = P ( A1 B ) + P ( A2 B) , A1
A2
≠0
Contoh 1 Data di bawah ini menyatakan banyaknya resistor berikut toleransinya :
Toleransi 5% 10% 10 14 28 16 24 8 62 38
Resistor (ohm) 22 47 100 Jumlah
kejadian A adalah kejadian terambilnya resistor 47 ohm B adalah kejadian terambilnya resistor dengan toleransi 5% C adalah kejadian terambilnya resistor 100 ohm Hitung : a. P ( A B ) b. P A C c. P B C d. P A B e. P A C Jawab : 28 = 0.28 a. P ( A B ) = 100
(
-
24 44 32 100
Berikut adalah definisi dari beberapa
-
-
Jumlah
)
(
(
)
)
Peluang, Peluang Bersyarat, Kaidah Bayes
(
)
8
Politeknik Telkom
Statistika
b. P ( A B )
=0
c. P ( A B )
=
d. P ( A B ) =
(
)
24
100 28
= 0.24
62
e. P A C =0 Contoh 2 Untuk memenuhi kebutuhan jumlah tenaga kerja, tiap tahun PT Telkom melaksanakan proses rekruitasi karyawan. Dari 100% pendaftar, yang lulus proses adalah 80%. Sebelum terjun ke lapangan, para karyawan baru diwajibkan tes pendidikan di divlat, ternyata yang lulus hanya 90%. Karena untuk memenuhi kebutuhan jumlah karyawan yang besar, PT Telkom memanggil lagi para pendaftar yang tidak lulus untuk tes pendidikan di divlat, dan yang lulus hanya 50%. Berapa prosenkah para pendaftar yang lulus divlat ? Jawab Berikut adalah diagram pohon dari pernyataan di atas :
Peluang, Peluang Bersyarat, Kaidah Bayes
9
Politeknik Telkom
Statistika
0.9
LD
LR 0.8
0.1
TLD
Rekruitasi
0.2
0.5 TL R
0.5
LD
TLD
Keterangan LR : Lulus proses rekruitasi TL : Tidak Lulus proses rekruitasi LD : Lulus Divlat TLD : Tidak Lulus Divlat Misal prosentase pendaftar yang lulus divlat = DP, maka
(
)
(
)
(
P DP = P ( LD LR ) P LR + P ( LD TLR ) P TLR
)
=( 0.9 ) 0.8 +( 0.5 ) 0.2 =0.82
Jadi pendaftar yang lulus divlat 82%
3.4
Kaidah Bayes
Peluang, Peluang Bersyarat, Kaidah Bayes
10
Politeknik Telkom
Statistika
Sebelum membahas kaidah bayes, terlebih dahulu dipelajari mengenai definisi partisi dari ruang sample. Partisi dari suatu ruang sample yaitu suatu himpunan dari kejadiankejadianyang saling lepas (mutually exclusive) n
F i . F 1 , F 2 , F 3 , ..., F n sedemikian sehingga Ω= i =1
Theorema : Bila F 1 , F 2 , F 3 , ..., F n adalah partisi dari Ω, maka untuk suatu kejadian E dalam Ω , berlaku n
( )
(
)
P E = ∑ P E F i . i =1
Theorema tersebut dapat digambarkan pada diagram di bawah ini
F1
F8 F4 E
F9
F7
F3 F2 F5
Peluang, Peluang Bersyarat, Kaidah Bayes
F6
11
Politeknik Telkom
Statistika
Theorema Bayes
Andaikan kejadian-kejadian F 1 , F 2 , F 3 , ..., F n merupakan partisi dari ruang sample Ω dan E adalah suatu kejadian, maka untuk suatu k berlaku
P ( F k E )
=
P ( F k ) P ( E F k )
n
P ( F ) P ( E F ) ∑ = i
i
i 1
Contoh 1
Sebuah pabrik penghasil video cassette recorder, membeli microchip khusus LS-24 dari tiga supplier yang berbeda, yaitu Hall electronics (HE), Schuller Sales (SS), dan Cranford Components (CC). Untuk memenuhi kebutuhan microchip tersebut, 30% dibeli dari HE, 20% dari SS, dan sisanya dari CC. Pabrik tersebut memiliki banyak pengalaman dalam hal microchip dari tiga supplier tersebut. Dari microchip pasokan tiga supplier tersebut 3% chip dari HE cacat, 5% dari SS cacat, 4% dari CC cacat. Pada saat chip LS-24 tiba, para kuli langsung mengangkut ke gudang, tanpa memeriksa asal supplier chip tersebut. Pada saat proses perangkaian, seorang karyawan memilih chip untuk dipasang pada sebuah VCR, dan menemukan chip tersebut cacat. Berapa peluang chip tersebut dipasok oleh SS? Jawab
Misalkan berikut adalah kejadian – kejadian yang terjadi HE : Terpilih supplier Hall electronics SS : Terpilih supplier Schuller Sales CC : Terpilih supplier Cranford Components Peluang, Peluang Bersyarat, Kaidah Bayes
12
Politeknik Telkom
Statistika
Pernyataan tersebut dapat didiagramkan sebagai berikut :
0.3
HE
0.03
cacat
bagus
Supplier Chip
0.2
SS
0.05
cacat
bagus
0.5
CC
0.04
cacat
bagus
Peluang bahwa chip yang cacat tersebut dipasok oleh SS adalah P ( SS C ) = P ( SS ) P ( C
=
(
) SS ) + P ( HE ) P ( C HE ) + P ( CC ) P ( C P ( SS ) P C SS
( 0.2 ) 0.05 = 0.303 ( 0.2 ) 0.05 + ( 0.3) 0.03 + ( 0.5) 0.04
Peluang, Peluang Bersyarat, Kaidah Bayes
13
Politeknik Telkom
Statistika
Contoh 2 Suatu pabrik memproduksi 3 buah produk A,B dan C yang
masing – masing berjumlah 1000,2000 dan 4000 buah. Peluang terambil akan cacat dari produk A =2%, Peluang terambil akan cacat dari produk B =3% dan Peluang terambil akan cacat dari produk C =5%. Bila diambil sebuah produk secara acak a.
Berapa peluang produk tsb cacat ?
b.
Bila ternyata produk tsb cacat, berapa peluang produk tsb adalah produk B ?
Jawab
Misalkan A
: Terambil produk A
B
: Terambil produk B
C
: Terambil produk C
F
: Terambil produk Fail / Cacat
P(A) = 1/7
P(F|A) = 0,02
P(B) = 2/7
P(F|B) = 0,03
P(C) = 4/7
P(F|C) = 0,05
a.
P(F) ?
Peluang, Peluang Bersyarat, Kaidah Bayes
14
Politeknik Telkom
P ( F )
Statistika
= P ( F | A ) P ( A ) + P ( F | B ) P ( B ) + P ( F | C ) P ( C ) = 0,02 1 + 0,03 2 + 0,05 4 = 0,04 7
b.
7
7
P(B|F) ?
P ( B | F )
=
P ( F | B ) P ( B ) P ( F )
=
0,03. 2 / 7 0,04
Peluang, Peluang Bersyarat, Kaidah Bayes
= 0,214
15
Politeknik Telkom
Statistika
Latihan 1. Suatu PT yang bergerak dalam bidang konsultan computer saat ini memiliki 3 buah proyek. Misal Ai menyatakan
= 0.22 , P ( A1 A2 ) = 0.11 , P ( A2 A3 ) = 0.07 ,
proyek ke-i, i = 1, 2, 3 dan diketahui P ( A1 )
P ( A3 ) = 0.28 , = 0.25 , P ( A1 A3 ) = 0.05 ,
P ( A2 )
P ( A1
A2 A3
a. A1 A2
) = 0.01 . Hitung peluang : b. A1c
c
A2
2. Suatu pabrik mempunyai empat buah mesin, yang menghasil barang yang sama. Mesin I dan II masingmasing menghasilkan 20% dari seluruh produk, sedangkan mesin III dan IV masing-masing menghasilkan 30% dari seluruh produk. Dari barang yang diproduksi oleh 4 mesin tersebut, diketahui cacat dengan rincian, 6% dari mesin I, 5% dari mesin II, 8% mesin III, dan 8% dari mesin IV. Pada saat pemeriksaan produk, diambil secara acak suatu barang. a. Berapa peluang barang tersebut cacat ? b. Bila barang tersebut cacat, berapa peluang bahwa barang tersebut hasil produksi mesin II ? 3. Salah satu tujuan diadakannya audit adalah untuk menemukan terjadinya beberapa kesalahan materi, kesalahan prosedur, maupun kesalahan-kesalahan dalam pencatatan informasi. Sebuah Kantor Akuntan Publik yang disewa oleh sebuah perusahaan X yang selama ini telah aktif melakukan pembukuan terhadap penjualan grosir maupun eceran. Selanjutnya diketahui bahwa 70% pelanggan merupakan pelanggan eceran dan diketahui
Peluang, Peluang Bersyarat, Kaidah Bayes
16
Politeknik Telkom
Statistika
kesalahan pembukuan penjualan eceran 10%, sedangkan kesalahan pembukuan penjualan grosir 20%. Apabila seorang auditor menemukan kesalahan, berapa peluang bahwa pembukuan tersebut berasal dari penjualan eceran ?
4 PEUBAH ACAK, DISTRIBUSI PELUANG DISKRET, DAN DISTRIBUSI PELUANG KONTINU
Overview
Konsep yang mendasari distribusi peluang adalah peubah acak. Peubah acak biasanya didefinisikan berdasarkan tujuan penelitian yang akan dilakukan. Berdasarkan jenis bilangannya, peubah acak dapat memiliki nilai yang diskret dan juga kontinu. Distribusi peluang diskret diturunkan berdasarkan peubah acak diskret, demikian juga distribusi peluang kontinu juga diturunkan berdasarkan peubah acak kontinu
Peluang, Peluang Bersyarat, Kaidah Bayes
17
Politeknik Telkom
Statistika
Tujuan
1. Mahasiswa mengetahui beberapa jenis distribusi khusus diskret dan kontinu 2. Mahasiswa dapat menghitung peluang kejadian dari beberapa distribusi khusus diskret dan kontinu 3. Mahasiswa dapat meyelesaikan berbagai persoalan dan fenomena nyata yang terkait dengan distribusi peluang diskret dan kontinu.
4.1
Peubah Acak
Pada suatu percobaan statistik, terdapat satu atau lebih karakteristik yang dapat diamati atau diukur. Tetapi kadang−kadang seseorang hanya tertarik untuk mengamati satu macam karakteristik saja. Biasanya setelah proses pengambilan titik sampel, dilanjutkan dengan pengelompokan yang berkaitan dengan nilai numerik . Misalkan percobaan pelemparan uang logam sebanyak 3 kali, dengan ruang sampel ( Ω) sebagai berikut, dimana A menyatakan angka dan G menyatakan gambar : S = { AAA, AAG, AGA, GAA, AGG, GAG, GGA, GGG} Selanjutnya bila hanya munculnya angka saja yang diamati, maka nilai numeriknya adalah 0, 1, 2, 3, dimana 0 menyatakan angka tidak pernah muncul, 1 menyatakan angka satu kali, 2 menyatakan angka dua kali, dan 3 menyatakan angka tiga kali. Untuk mengkaitkan ruang sampel dengan nilai numeriknya yang berupa bilangan real diperlukan suatu fungsi yang dinamakan peubah acak . Peluang, Peluang Bersyarat, Kaidah Bayes
18
Politeknik Telkom
Statistika
Peubah acak dinotasikan dengan huruf kapital, misal X, Y atau lainnya. Sedangkan nilai−nilainya dinyatakan dengan huruf kecil, misal x , y atau lainnya. Bila peubah acak tersebut didefinisikan pada ruang sampel diskret, maka peubah acaknya disebut peubah acak diskret, dan bila didefinisikan pada ruang sampel kontinu disebut peubah acak kontinu.
4.2
Distribusi Peluang Diskret
Distribusi peluang diskret yaitu sebuah tabel yang mencantumkan semua kemungkinan nilai dari suatu peubah acak beserta peluangnya, dimana fungsi peluang dari peubah acak diskret X didefinisikan sebagai P ( X = x ) = p ( x ) . Sedangkan fungsi distribusi kumulatif dari peubah acak diskret X yaitu F(x) didefinisikan sebagai berikut F ( x ) = P ( X ≤ x ) = ∑ p ( y ) , ∀ x y: y ≤ x
Mean dan Variansi
Mean X didefinisikan dengan rumus x p( x) Mean = E ( x) =
∑
Variansi = Var ( x) = E ( x 2 ) −( E ( x) ) 2 dimana 2
E ( x )
= ∑ x 2
p ( x )
Mean (kX) = K Mean(X) Var ( kX )
4.3
= k Var ( X )
Distribusi Peluang Kontinu
Peluang, Peluang Bersyarat, Kaidah Bayes
19
Politeknik Telkom
Statistika
Misalkan X adalah peubah acak kontinu, maka distribusi peluang dari X dari suatu fungsi peluang f ( x ) di antara x = a dan x = b , didefinisikan sebagai berikut : b
P (a
≤ X ≤ b) = ∫ f ( x) dx a
yang menyatakan luas daerah dibawah kurva f ( x ) antara x = a dan x = b .
di
Sedangan fungsi distribusi kumulatif dari peubah acak kontinu X, yaitu F ( x ) didefinisikan sebagai berikut : x
F ( x) = P ( X ≤ x) =
∫ f ( y ) dy −∞
Mean dan Variansi
Mean X didefinisikan dengan rumus Mean = E ( x ) = ∫ x f ( x ) dx Variansi = Var ( x) = E ( x 2 ) −( E ( x) ) 2 2
E ( x )
= ∫ x 2
dimana
f ( x) dx
Contoh 1 Suatu pengamatan mengenai nomor telepon yang di dial oleh mesin penerima secara acak untuk suatu area tertentu, dedefinisikan peubah acak X sebagai berikut: X
=
1 0
, bila nomor yang dipilih terdaftar , bila nomor yang dipilih tidak terdaftar
Peluang, Peluang Bersyarat, Kaidah Bayes
20
Politeknik Telkom
Statistika
Bila peluang sebuah nomor terdaftar = 0,3, maka dapat dibuat tabel distribusi peluang diskret dari pengamatan diatas yaitu P( x ) 0 0, 7 1 0, 3
x
= ∑ x p( x) = 0. 0,7 +1. 0,3 = 0,3 p( x ) = 0. 0,7 +1. 0,3 = 0,3
Mean(X) = E ( x) E ( x 2 )
= ∑ x 2
(
Var ( x) = E ( x 2 ) − E ( x)
)2
= 0,3 −(0,3) 2 = 0,21
Contoh 2
Misal diberikan tabel distribusi peluang diskret sebagai berikut X
( )
p x
x.p(x ) X 2. p(x)
1
2
3
4
0. 4 0, 4 0, 4
0. 3 0, 6 1, 2
0. 2 0, 6 1, 8
0. 1 0, 4 1, 6
Juml ah 1 2 5
Dengan perhitungan manual , peluang kumulatifnya adalah: F(1) = p(1) = 0.4 F(2) = P(X ≤ 2) = p(1) + p(2) = 0.4 + 0.3 = 0.7
Peluang, Peluang Bersyarat, Kaidah Bayes
21
Politeknik Telkom
Statistika
F(3) = P(X ≤ 3) = p(1) + p(2) + p(3) = 0.4 + 0.3 + 0.2 = 0.9 F(4) = P(X ≤ 4) = p(1) + p(2) + p(3) + p(4) = 0.4 + 0.3 +0.2 + 0.1=1 Mean(X) = E ( x )
= ∑ x
(
2
Var ( x) = E ( x ) − E ( x)
)2
p ( x )
=2
= 5 −( 2) 2 =1
Contoh 3
Misalkan saya berangkat ke kantor naik bus dan setiap 5 menit bus tiba di halte. Karena saya berangkat ke kantor tiap hari tidak selalu pada waktu yang sama, maka saya sampai di halte juga pada waktu yang tidak sama. Misalkan peubah acak X adalah waktu (kontinu) saya menunggu bus berikutnya dan X dalam interval [0, 5]. Fungsi padat peluang X didefinisikan sebagai berikut
15 f ( x) = 0
, 0 ≤ x ≤ 5 , lainnya
Grafik dari f ( x ) adalah
f(x) 0,2
x Akan dihitung : a. peluang saya akan menunggu antara 1 sampai 3 menit b. peluang saya menunggu paling lama 5 menit Peluang, Peluang Bersyarat, Kaidah Bayes
22
Politeknik Telkom
Statistika
c. Rata – rata waktu saya menunggu d. Peluang kumulatif Sehingga : a. P (1 ≤ X ≤ 3)
3
= ∫ 15
dx
1
b. P ( X ≤ 5) c.
E ( x)
=
= ∫ x
5
∫ −∞
1 5
3
= 5x 1 = 52 5
dx
f ( x ) dx
= ∫ 15
dx
=1
0
= ∫ x
1 5
dx
=
1 10
x
2
5 0
=
25 10
= 2,5
menit d. Sedangkan CDF dari f ( x ) dapat ditabelkan sebagai berikut : X 0 1 2 3 4 5 CD 0 0. 0. 0. 0. 1 F 2 4 6 8
Latihan 1. Buatlah suatu percobaan statistik dan tentukan peubah acaknya baik yang diskret maupun kontinu 2. Suatu bisnis layanan surat lewat komputer mempunyai 6 saluran telepon. Misalkan X menyatakan banyaknya saluran telepon yang digunakan pada suatu waktu tertentu. Diberikan tabel berikut yang berisi nilai x dan p(x) : X 0 1 2 3 4 5 6 P(x 0.1 0.1 0.2 0.2 0.2 0.0 0.0 ) 0 5 0 5 0 6 4 Peluang, Peluang Bersyarat, Kaidah Bayes
23
Politeknik Telkom
Statistika
Hitung peluang berikut ini : a. paling banyak 3 saluran yang digunakan b. paling sedikit tiga saluran yang digunakan c. antara 2 dan 5 saluran yang digunakan 3. Misalkan fungsi padat peluang dari magnitude X dari suatu dynamic load sebuah jembatan (dalam newtons) diberikan sebagai berikut :
18 + 83 x f ( x) = 0
, 0 ≤ x ≤ 2 , lainnya
− Cari rumus F(x) dari f(x) tersebut − Hitung P( 1 ≤ X ≤ 1.5) dengan menggunakan rumus F(x) − Hitung P( X > 1)
Peluang, Peluang Bersyarat, Kaidah Bayes
24
5
DISTRIBUSI PELUANG KHUSUS DISKRET DAN KONTINU
Overview
Dalam kehidupan nyata, terdapat beberapa kejadian yang memiliki bentuk sebaran tertentu. Bentuk sebaran data tersebut dapat didekati dengan beberapa jenis distribusi peluang khusus yang terdapat dalam statistika. Dalam suatu penelitian, adanya pengetahuan tentang bentuk/jenis distribusi suatu data akan sangat membantu peneliti dalam membuat estimasi – estimasi terkait dengan data yang diteliti.
Tujuan
1. Mahasiswa mengetahui beberapa jenis distribusi khusus diskret dan kontinu 2. Mahasiswa dapat menghitung peluang kejadian dari beberapa distribusi khusus diskret dan kontinu 3. Mahasiswa dapat meyelesaikan berbagai persoalan dan fenomena nyata yang terkait dengan distribusi peluang Distribusi Peluang Khusus
1
diskret dan kontinu.
5.1 Distribusi Peluang Diskret 5.1.1 Distribusi Bernoulli dan Binomial
Suatu percobaan dikatakan sebagai percobaan binomial, bila memenuhi asumsi−asumsi berikut : 1. Percobaan dapat diulang sebanyak n kali 2. Ulangan−ulangan identik dan setiap ulangan dapat menghasilkan satu dari dua kemungkinan outcome yang sama, biasanya dinotasikan dengan S (sukses) dan F (gagal). 3. Masing−masing ulangan saling bebas 4. Peluang sukses dari ulangan konstan , misalkan peluang sukses p Bila percobaan tersebut hanya terdiri dari 1 ulangan, maka percobaan tersebut dinamakan percobaan bernoulli. Fungsi peluang dari peubah acak X yang berdistribusi binomial sebagai berikut
n x n − x p p − ( 1 ) b( x ; n, p) = x 0
, x
= 0,1, 2, ..., n
, lainnya
Distribusi kumulatif dari peubah acak X yang berdistribusi binomial (X ∼ B (n, p) ) didefinisikan sebagai berikut P ( X ≤ x)
x
= B ( x ; n, p) = ∑b ( y ; n, p)
, x
= 0,1, 2, ...., n
y =0
Distribusi Peluang Khusus
2
Untuk menghitung peluang maupun distribusi kumulatif dari peubah acak X selain dengan perhitungan di atas dapat menggunakan tabel binomial. Sedangkan mean dan variansi dari peubah acak X yang berdistribusi binomial didefiniskan sebagai berikut : E(X) = n p Var(X) = n p (1 − p) Pada distribusi binomial, bila n dan p diubah-ubah sedemikian rupa, maka akan berpengaruh pada bentuk distribusinya. Dengan menggunakan program matlab berikut diperoleh gambar distribusi di bawah :
Gambar 5.1. Distribusi binomial n = 10 dan p = 0.5
Distribusi Peluang Khusus
3
Gambar 5.2 Distribusi binomial n = 10 dan p = 0.3
Gambar 5.3 Distribusi binomial n = 10 dan p = 0.8
Distribusi Peluang Khusus
4
Gambar 5.4 Distribusi binomial n = 15 dan p = 0.5 Dari keempat gambar tersebut dapat dikatakan bahwa : - untuk n yang sama, p = 0.5, distribusi binomial mendekati distribusi normal. - untuk n yang sama, p diperkecil, distribusinya menjulur ke kanan - untuk n yang sama, p diperbesar, distribusinya menjulur ke kiri - bila n diperbesar, p = 0.5, distribusinya menjulur ke kiri 5.1.2
Distribusi Poisson
Ciri−ciri dari percobaan poisson adalah : 1. Banyaknya hasil percobaan yang terjadi pada selang waktu atau suatu daerah tertentu tidak tergantung pada banyaknya hasil percobaan yang terjadi pada selang waktu atau daerah lain yang terpisah Distribusi Peluang Khusus
5
2. Peluang terjadinya satu hasil percobaan selama suatu selang waktu yang singkat sekali atau dalam suatu daerah yang kecil sebanding dengan panjang selang waktu tersebut atau besarnya daerah tersebut 3. Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat atau dalam derah yang kecil tersebut dapat diabaikan Suatu peubah acak X yang berdistribusi poisson, fungsi peluangnya didefinisikan sebagai berikut : P ( x ; λ ) =
x e −λ λ
x !
, x =0, 1, 2, ....
dimana λ > 0 Distribusi kumulatif dari peubah acak X yang berdistribusi poisson (X∼P(n,λ)) didefinisikan sebagai berikut P ( X ≤ x)
x
= ∑ P ( y ; λ )
, x
= 0,1, 2, ...., n
y =0
Untuk menghitung peluang maupun distribusi kumulatif dari peubah acak X selain dengan perhitungan di atas dapat menggunakan tabel poisson. Sedangkan mean dan variansi dari peubah acak X yang berdistribusi poisson dengan parameter λ, mempunyai nilai yang sama yaitu . Pada distribusi poisson, bila nilai λ diubah-ubah sedemikian rupa, maka akan berpengaruh pada bentuk distribusinya. Dengan menggunakan program matlab berikut diperoleh gambar distribusi di bawah :
Distribusi Peluang Khusus
6
Gambar 5.5 Distribusi poisson dengan
Gambar 5.6 Distribusi poisson dengan
Distribusi Peluang Khusus
λ=5
λ=2
7
Gambar 5.7 Distribusi poisson dengan
λ=7
Gambar 5.8 Distribusi poisson dengan
λ=8
Distribusi Peluang Khusus
8
λ = 10
Gambar 5.9 Distribusi poisson dengan
Dari kelima gambar tersebut, dapat dikatakan bahwa untuk x = 0…15 bila nilai λ lebih kecil dari 7, distribusinya menjulur ke kanan. Sedangkan untuk nilai λ lebih besar dari 7, distribusinya menjulur ke kiri. Sedangkan untuk nilai λ = 7 dan 8, distribusinya mendekati normal. Contoh 1 Misalkan suatu percobaan yang memenuhi percobaan binomial dengan n = 4, dan peluang sukses p. Dari percobaan tersebut dapat dihitung peluang dari semua outcome yang mungkin dan hasilnya sebagai berikut :
Outcom e SSSS SSSF SSFS SSFF
x 4 3 3 2
Peluang p4 p3 (1 − p) p3 (1 − p) p2 (1− p)2
Distribusi Peluang Khusus
Outcome FSSS FSSF FSFS FSFF
x 3 2 2 1
Peluang p3 (1 − p) p2 (1− p)2 p2 (1− p)2 p (1 − p)3 9
SFSS SFSF SFFS SFFF
p3 (1 − p) p2 (1− p)2 p2 (1− p)2 p (1 − p)3
3 2 2 1
FFSS FFSF FFFS FFFF
2 1 1 0
p2 (1− p)2 p (1 − p)3 p (1 − p)3 (1 − p)4
Sehingga dapat dihitung : b(3 ; 4, p) = P(FSSS) + P(SFSS) + P(SSFS) + P(SSSF) = 4 p3 (1 − p) Contoh 2 Misalkan 20% dari semua copy suatu textbook yang diuji kekuatan sampulnya rusak. Dan peubah acak X menyatakan banyaknya textbook yang sampulnya rusak dari 15 copy yang diambil secara acak. Hitung : a. Peluang paling banyak 8 copy textbook yang sampulnya rusak b. Peluang ada 8 copy textbook yang sampulnya rusak Jawab Perhitungan manual (dapat menggunakan tabel) :
a. P ( X ≤ 8)
8
= ∑b( y ; 15, 0.2) = B(8 ; 15, 0.2) = 0.999 y =0
b. P ( X = 8) = P ( X ≤ 8) − P ( X ≤ 7) = B (8 ; 15,
0.2) −B (7 ; 15, 0.2)
= 0.999 − 0.996 = 0.003 Contoh 3 Seorang penerbit buku−buku non teknik menyatakan bahwa buku−bukunya bebas dari kesalahan typograpical, sehingga peluang kesalahan dari sebuah halaman buku paling sedikit satu kesalahan adalah 0.005 dan kesalahan tiap halaman saling bebas. Distribusi Peluang Khusus
10
Berapa peluang bahwa satu dari novel−novel yang jumlah halamannya 400 akan tepat satu halaman yang salah b. Berapa peluang paling banyak tiga halaman yang salah a.
Jawab :
Bila S menyatakan bahawa sebuah halaman buku paling sedikit satu kesalahan dan F menyatakan tidak ada kesalahan pada halaman buku tersebut. Misalkan X menyatakan paling sedikit satu kesalahan pada tiap halaman dan berdistribusi binomial dengan n = 400, p = 0.005. Karena n nya besar dan p kecil mendekati 0, maka bisa dilakukan pendekatan dengan menggunakan distribusi poisson, dengan λ = n p = 2 , sehingga : a. P ( X =1) = b. P ( X ≤ 3) =
e
−2
21
1!
= 0.271
3
e −2 2 x
x 0
x !
∑=
= p(0) + p(1) + p(2) + p(3) = 0.135 + 0.271 + 0.271 + 0.18 = 0.857 5.2 Distribusi Peluang Kontinu 5.2.1
Distribusi Normal
Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik dari suatu distribusi normal disebut kurva normal, bentuknya seperti lonceng pada gambar dibawah ini. Suatu peubah acak X yang distribusinya Distribusi Peluang Khusus
11
berbentuk lonceng, dinamakan peubah acak normal. Persamaan matematika dari distribusi peluang peubah acak normal kontinu bergantung pada dua parameter yaitu µ (rataan) dan σ (simpangan baku). Dengan demikian fungsi densitas X dapat dinyatakan oleh :
( )
f x =
1
e
−12
(
)
x − µ 2 σ
2π σ
–
∞ < X < ∞.
x
µ
Sifat-sifat distribusi normal : ∞
1.
∫ f ( x ) dx
− ∞
1
=
2. f ( x ) ≥0 , ∀x f x = 0 dan 3. x lim →−∞
( )
( ) =0
lim f x
x →+∞
4. f ( x + µ ) = f ( − ( x − µ ) ) 5. Nilai maksimum dari f terjadi pada x − µ 6. Titik belok dari f terjadi pada x = µ ± σ Kurva setiap distribusi kontinu dibuat sedemikian rupa sehingga luas daerah dibawah kurva diantara dua koordinat x = x 1 dan x = x2 sama dengan peluang peubah acak X
Distribusi Peluang Khusus
12
antara x = x 1 dan x sebagai berikut :
x1
= x 2 .
Hal tersebut dapat digambarkan
x2
µ
x P ( x1
x 2
∫ n( x ; µ , σ ) dx =
x1
1
x 2
e ∫ 2π σ
− 12
(
)
x − µ 2 σ
< X < x2 ) =
dx
x1
= Luas daerah yang diarsir Untuk mengatasi kesulitan dalam menghitung integral fungsi densitas maka dibuat table luas kurva normal sehingga akan memudahkan dalam penggunaannya. 5.2.2 Distribusi Normal Baku Perhitungan luas dibawah kurva normal antara dua ordinat sembarang sangat bergantung pada nilai µ dan σ . Dalam hal ini, tak mungkin dibuat tabel yang berlainan untuk setiap µ σ . nilai dan Oleh karena itu, kita perlu mentransformasikan setiap peubah acak yang bermacammacam nilai µ dan σ nya , menjadi peubah acak normal dengan µ = 0 dan σ = 1. Transformasi tersebut berbentuk : Z =
X − µ
σ
Distribusi Peluang Khusus
13
dimana X merupakan peubah acak awal sebelum ditransformasi yang mempunyai rataan = µ dan variansi = σ . Sementara itu, Z merupakan peubah acak setelah ditransformasi. Distribusi normal dengan mean 0 dan variansi 1, dinamakan distribusi normal baku.
σ =1
z 1 z 2 0
z
Contoh 1 a. P (Z ≤ 1.25) = Φ (1.25) = 0.8944 ( pada tabel dilihat baris 1.2 kolom 0.05) b. P ( - 0.38 ≤ Z ≤ 1.25 ) = P ( Z ≤ 1.25 ) – P ( Z ≤ - 0.38 ) = Φ (1.25 ) - Φ (- 0.38 ) = 0.8944 – 0.3520
Distribusi Peluang Khusus
14
= 0.5424 Contoh 2 Misal peubah acak X menyatakan ketidaksesuaian voltase yang dispesifikasikan pada suatu diode yang dipilih secara acak. X berdistribusi normal dengan µ = 40 volt dan σ = 1.5 volt. Berapa peluang bahwa : a. Ketidakcocokan voltase antara 39 dan 42 volt b. Ketidakcocokan voltase minimal 45 volt Jawab
a. Ketidakcocokan voltase antara 39 dan 42 volt
39 − 40 ≤ 1.5
P ( 39 ≤ X ≤ 42 ) = P
= P ( - 0.67 =
X − 40 1 .5
≤
42 − 40 1.5
≤ Z ≤ 1.33 )
Φ (1.33 ) - Φ (- 0.67 ) = 0.9082 – 0.2514 = 0.6568
b. Ketidakcocokan voltase minimal 45 volt
X − 40 ≥ 45 − 40 1.5 1.5 = P ( Z ≥ 3.33 ) = 1 - Φ (3.33)
P ( X ≥ 45) = P
= 1 – 0.9996 = 0.0004
5.2.3 Distribusi Uniform
Distribusi Peluang Khusus
15
Bila X merupakan variabel random uniform kontinu yang terdefinisi pada selang (A,B) maka fungsi peluang dari X adalah
f ( x ; A, B) =
1
A ≤ x ≤ B
B − A 0
lainnya
Distribusi kumulatif dari peubah acak X yang berdistribusi uniform didefinisikan sebagai berikut
0 x − A P ( X ≤ x) = B −1 A
x < A A ≤ x < B x ≥ B
Sedangkan mean dan variansi dari peubah acak X yang berdistribusi uniform dapat dihitung dan bernilai: 1 E ( X ) = ( B + A) 2 1 Var ( X ) = ( B − A) 2 12 5.2.4 Distribusi Eksponensial Bila X merupakan variabel random eksponensial dengan parameter λ yang terdefinisi pada selang (0,∞) maka fungsi peluang dari X adalah
f ( x ; A, B) =
λ e −λ x
x ≥ 0
0
lainnya
Distribusi eksponensial paling sering digunakan sebagai model distribusi waktu dalam fasilitas pelayanan Distribusi Peluang Khusus
16
customers( waktu tunggu). Pengertian customers disini tidak harus berupa orang tetapi bisa berupa panggilan telepon misalnya. Dalam penggunaannya dalam model ini, distribusi eksponensial sangat berkaitan dengan distribusi Poisson yang telah dibicarakan dalam bab sebelumnya. Bila X menyatakan jumlah kejadian yang terjadi dalam selang waktu t, maka X akan berdistribusi Poisson. Jika α adalah mean X yaitu rata – rata jumlah kejadian per unit waktu, maka distribusi dari waktu antar 2 kejadian adalah eksponensial dengan parameter α. Penggunaan disribusi eksponensial yang lain adalah sebagai model waktu hidup dari suatu komponen. Biasanya dalam model ini λ disebut sebagai tingkat kegagalan. Mean dan variansi dari distribusi eksponensial dengan 1 1 , parameter λ berturut – turut . Pada distribusi λ λ 2 eksponensial, bila nilai λ diubah-ubah sedemikian rupa, maka akan berpengaruh pada bentuk distribusinya. Dengan menggunakan program matlab berikut diperoleh gambar distribusi di bawah :
Distribusi Peluang Khusus
17
Gambar 13. Distribusi eksponensial dengan
λ=2
Gambar 14. Distribusi eksponensial dengan
λ=5
Distribusi Peluang Khusus
18
Gambar 15. Distribusi eksponensial dengan
λ = 0.5
Dari ketiga gambar tersebut, dapat dikatakan bahwa untuk x = 0…10 bila nilai λ semakin besar, kurvanya semakin landai. Contoh 1 Dalam sebuah survai dilakukan pengamatan terhadap waktu kedatangan angkutan kota yang melewati sebuah jalan tertentu. Dari pengamatan selama 2 jam didapatkan hasil sebagai berikut : TABEL 1 N o 1 2 3 4 5 6
Jam 06.01. 03 06.02. 56 06.03. 14 06.04. 10 06.06. 57 06.08.
N o 11 12 13 14 15 16
Jam 06.17. 57 06.20. 57 06.24. 32 06.27. 44 06.28. 15 06.28.
Distribusi Peluang Khusus
N o 21 22 23 24 25 26
Jam 06.33. 43 06.33. 50 06.34. 14 06.36. 32 06.37. 53 06.38.
N o 31 32 33 34 35 36
Jam 06.47. 18 06.49. 55 06.50. 04 06.50. 22 06.56. 51 06.57.
N o 41 42 43 44 45 46
Jam 07.07. 07 07.09. 37 07.09. 49 07.09. 51 07.14. 30 07.14. 19
7 8 9 10
46 06.10. 45 06.12. 03 06.16. 03 06.17. 16
17 18 19 20
27 06.28. 33 06.28. 38 06.29. 45 06.31. 19
27 28 29 30
43 06.39. 11 06.44. 25 06.44. 47 06.46. 00
37 38 39 40
59 07.00. 59 07.01. 11 07.04. 52 07.06. 19
47 48 49 50
43 07.16. 45 07.17. 04 07.17. 23 07.17. 26
Dari data tersebut, kita dapat menghitung waktu tunggu / antar kedatangan angkutan kota antara pengamatan i dan i+1. Diperoleh 49 nilai yang dihitung dalam detik TABEL 2 N La N la N la N la N lam o ma o ma o ma o ma o a 1 11 18 21 31 15 41 15 113 0 7 7 0 2 12 21 22 32 42 18 5 24 9 12 3 13 19 23 13 33 43 56 2 8 18 2 4 14 24 34 38 44 27 121 31 81 9 9 5 15 25 29 35 45 110 12 0 68 13 6 16 26 36 18 46 12 119 6 28 0 3 7 17 27 31 37 47 18 5 4 12 19 8 18 28 38 22 48 240 67 22 1 9 9 73 19 94 29 73 39 87 49 3 10 20 14 30 40 50 41 4 78 48
Distribusi Peluang Khusus
20
Bila dihitung rata − ratanya nilainya adalah 96 detik. Ini menunjukkan bahwa rata − rata kedatangan angkutan kota adalah 96 detik. Menurut teori sebelumnya, waktu antar kedatangan ini akan berdistribusi eksponensial dengan 1 λ = . 96 Dari data pada tabel terakhir dapat dihitung antara lain nilai peluangnya. Misalkan dihitung waktu kedatangan kurang 80 detik. Dalam hal ini rumus yang digunakan adalah n( x ≤ 80) 27 = = 0,55 P(X ≤ 80) = n (S) 49 Dalam hal ini n ( x ≤ 80) menyatakan banyaknya titik sampel yang nilainya kurang atau sama dengan 80, sedangkan n(S) menyatakan banyak titik sampel. Contoh 2 Misal X peubah acak yang menyatakan waktu respon dari suatu komputer yang on-line (waktu antara user input dan tampil output-nya). Peubah acak X berdistribusi eksponensial dengan mean 5 detik. Berapa peluang waktu respon paling lama 10 detik dan waktu responya antara 5 sampai 10 detik. Jawab Bila µ = 1/λ = 5 , maka λ = 0.2 P ( X ≤ 10 ) = F (10) = 1 – e- (0.2) (10) = 1 – 0.135 = 0.865 P ( 5 ≤ X ≤ 10 ) = F (10) – F(5) = 0.233 Latihan
1. Bila 90% dari siswa yang baru mulai belajar pemrograman komputer akan gagal pada waktu menjalankan program pertamanya, Berapa peluang bahwa dari 15 siswa yang dipilih secara acak : Distribusi Peluang Khusus
21
a. Paling sedikit 12 siswa gagal menjalankan program pertamanya b. Antara 10 dan 13 siswa akan gagal menjalankan program pertamanya c. Paling banyak 2 siswa berhasil menjalankan program pertamanya 2.
Misal X menyatakan daya regang suatu komponen logam tertentu yang berdistribusi normal dengan µ = 10000 kg/ cm2 dan σ = 100 kg/cm2. Semua pengukuran dicatat sampai 50 kg/cm2 terdekat. Hitung peluang bahwa daya regang minimal 10150 kg/cm2 dan daya regang antara 9800 kg/cm2 sampai 10200 kg/cm2
3.
Diketahui bahwa mesin penerima panggilan dari suatu kantor konsultan per menitnya rata−rata menerima 6 panggilan. Berapa peluang bahwa : a. paling sedikit satu panggilan permenit b. dalam 4 menit paling sedikit 15 panggilan
4.
Dalam satu minggu suatu komputer pada suatu rental akan mengalami kelambatan merupakan peubah acak yang berditribusi poisson dengan λ = 0.3. Berapa peluang bahwa a. suatu komputer akan beroperasi tanpa mengalami kelambatan dalam waktu 2 minggu b. paling sedikit lima komputer akan mengalami kelambatan dalam satu minggu
5.
Misal X peubah acak yang menyatakan waktu yang diperlukan petugas perpustakaan untuk mengecek buku yang baru dipinjam dengan yang kembali. Nilai harapan untuk waktu pengecekan sekitar 20 detik. Hitung P ( X ≤ 30 ) dan P ( 20 ≤ X ≤ 30 )
Distribusi Peluang Khusus
22
6. Peubah acak X menyatakan waktu antar kedatangan pesawat pada sebuah bandara, dengan fungsi padat peluang sebagai berikut : 0.5 e−0.5 x , x > 0
( ) =
f x
0
, x lainnya
Berapa peluang menunggu paling sedikit 1 menit 7. Diketahui umur dinamo listrik yang diproduksi perusahaan tertentu menyebar normal dengan mean 6.4 dan simpangan baku 1.1 tahun. a. Jika sebuah dinamo diberi garansi 5 tahun, berapa peluang bahwa perusahaan akan memperbaiki dinamo tersebut sebelum habis masa garansinya ? b. Jika perusahaan menetapkan bahwa hanya sampai 1% produksinya diperbaiki sebelum habis masa garansinya, berapa tahun masa garansi yang diperlukan ? 8. Suatu sistem elektronika mengandung komponen dengan daya tahan T yang menyebar eksponensial dengan parameter λ = 0.2 . Bila 5 komponen dipasang pada sistem yang berbeda, berapa peluang bahwa paling sedikit 2 komponen masih berfungsi setelah akhir tahun ke-8 ? 9. Jika dalam setiap satu jam rata-rata terdapat 3 pesawat yang lepas landas. Tentukan peluang bahwa dalam periode satu jam tertentu jumlah pesawat yang lepas landas adalah : a. tepat tiga pesawat b. kurang dari 4 pesawat c. paling kurang 3 pesawat d. antara 2 dan 6 pesawat Distribusi Peluang Khusus
23
Distribusi Peluang Khusus
24
6
DISTRIBUSI SAMPLING DAN DALIL LIMIT PUSAT
Overview
Dalam sebuah penelitian, keberadaan data sampel sangat diperlukan. Seorang peneliti biasanya jarang menggunakan data populasi sebagai dasar pengolahannya karena penggunaan data populasi akan membuat biaya dan waktu menjadi tidak efisien. Bervariasinya bentuk distribusi data sampel terkadang juga dapat menyulitkan seorang peneliti untuk membuat kesimpulan tentang suatu populasi. Keberadaan dalil limit pusat cukup membantu kita dapat membuat estimasi peluang terkait dengan data sampel yang kita miliki.
Tujuan
1. Mahasiswa memahami konsep dalil limit pusat 2. Mahasiswa dapat menggunakan dalil limit pusat untuk membuat estimasi peluang dari suatu data sampel dari Distribusi Sampling, Dalil Limit Pusat
1
berbagai macam populasi
6.1
Distribusi Sampling
Dalam suatu penelitian, dengan berbagai pertimbangan, pengambilan sampel dilakukan dari pada pengambilan populasi, di mana sampel harus mewakili populasi. Pengambilan sampel dari populasi yang sama dilakukan secara acak, sehingga kombinasi yang muncul banyak sekali. Hal tersebut akan menyebabkan nilai statistik yang bervariasi dari sampel yang satu dengan yang lain. Sehingga suatu statistik dapat dipandang sebagai suatu peubah acak yang hanya bergantung pada sampel yang diamati dan mempunyai distribusi peluang yang disebut distribusi sampling. Misal dari suatu populasi diambil sampel berukuran n yang diulang sebanyak k kali. Kemudian dihitung rataannya, maka nilai tengah akan mempunyai distribusi yang dinamakan distribusi sampling dari nilai tengah. Sebaliknya, jika variansi yang diamati, maka distribusinya disebut distribusi sampling dari variansi. Tentunya distribusi sampling tersebut bergantung pada ukuran populasi, ukuran sampel, dan metode pengambilan sampel yaitu pengambilan sampel dengan pengembalian atau tanpa pengembalian. Keacakan dari sampel akan sangat menguntungkan dalam bentuk parameter dan bentuk distribusi. Adapun distribusi sampling dalam bentuk parameter adalah sebagai berikut : Misal X berdistribusi sabarang, dengan nilai tengah µ dan variansi σ2, maka : a. Rata-rata dari rata-rata sampel sama dengan mean populasi
Distribusi Sampling, Dalil Limit Pusat
2
∑ X i 1 = n µ = µ n n
E [ x ] = E
b. Variansi dari rata-rata sampel sama dengan variansi dari populasi dibagi ukuran sampel
∑ X i Var ( x ) = Var n =
1 n
2
2
n σ
=
1 1 Var ( ∑ X i ) = = 2 n 2 n
∑ Var ( X ) i
σ 2 n
Nilai Var ( x ) diatas sebenarnya adalah nilai untuk pengambilan sampel dengan pengembalian, hanya saja bila ukuran N relative besar terhadap n, maka Var ( x ) untuk pengambilan nilai sampel tanpa pengembalian akan mendekati nilai tersebut.
6.2
Dalil Limit Pusat
Banyak sekali uji dalam statistik yang mengasumsikan data berdistribusi Normal. Bila syarat ini tidak dipenuhi tentunya akan berakibat pada analsis serta kesimpulan yang diperoleh. Dalam penelitian kita sering menggunakan data sampel untuk menyimpulkan sesuatu. Menurut teorema limit Pusat serta teorema sampling bahwa bila suatu sampel berukuran n diambil dari suatu populasi yang besar atau takhingga dengan mean = µ dan Simpangan Baku = σ maka rataan sampel ( x ) akan berdistribusi Normal dengan mean =
µ dan Simpangan Baku =
σ
n
. Dengan eksperimen yang
sederhana akan ditunjukkan bahwa teorema ini berlaku. Esperimen ini mungkin belum sempurna karena jumlah
Distribusi Sampling, Dalil Limit Pusat
3
sampel yang dibangkitkan bukan merupakan keseluruhan kombinasi yang mungkin. Berikut adalah contoh pengacakan dari populasi distribusi Normal dengan mean = 0 dan simpangan baku = 1 dengan jumlah sampel = 80. dist Xbar dg ukuran sampel 5 15
y c 10 n e u q e r F 5
0 -1.0 -0.8 -0.6 -0.4 -0.2
0.0
0.2
0.4
0.6
0.8
C1
dist Xbar dg ukuran sampel 15 populasi normal 20
y c n e u 10 q e r F
0 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4 0.5
C2
Distribusi Sampling, Dalil Limit Pusat
4
dist Xbar dg ukuran sampel 30 populasi normal
15 y c n10 e u q e r F
5
0 -0.6 -0.5 -0.4 -0.3 -0.2 -0.1
0.0
0.1
0.2
0.3
C3
Variable C1 C2 C3
N 80 80 80
Mean Median Tr Mean -0.0662 -0.0462 -0.0615 0.0237 0.0136 0.0269 -0.0188 -0.0000 -0.0190
StDev SE Mean 0.4162 0.0465 0.2213 0.0247 0.1874 0.0210
P-Value (Anderson-Darling) C1 0.587 C2 0.897 C3 0.554 Dari P-value diatas dapat disimpulkan bahwa semua data x berdistribusi Normal untuk ukuran sampel 5,15 dan 30 berdasarkan hasil uji Anderson-Darling. Memang kalau dilihat ukuran sampel= 15 adalah yang paling kuat indikatornya tetapi ini tidak bisa dijadikan pegangan untuk menyimpulkan bahwa ukuran sampel = 15 adalah yang terbaik. Ada beberapa alasan antara lain karena jumlah sampel yang dibangkitkan adalah tidak maksimum. Bila ditinjau dari nilai mean dan StDev nya maka dapat dilihat untuk semakin besar Distribusi Sampling, Dalil Limit Pusat
5
sampel yang diambil ternyata akan mendekati mean populasinya (=0). Sedangkan simpangan bakunya akan semakin kecil untuk ukuran sampel yang makin besar sesuai teorema limit pusat. Dari hal ini dapat disimpulkan dengan pengambilan sampel yang besar maka taksiran untuk mean populasi akan semakin tepat. Bila hasil eksperimen diatas ditabelkan, maka akan diperoleh hasil sebagai berikut mean Simpanga Limit Pusat n baku Populasi
0
1
me an
Sampanga n baku
Sampel n=5
0.066 2
0.4162
0
0.447
Sampel n=15
0.023 7
0.2213
0
0.258
Sampel n=30
0.018 8
0.1874
0
0,183
Bila dilihat perbandingan antara hasil eksperimen dengan hasil yang berdasarkan teorema limit pusat maka dapat disimpulkan nilai –nilai mean dan simpangan baku pada sampel ukuran 5,15 dan 30 cukup dekat dengan hasil yang berdasarkan teorema limit pusat.
Distribusi Sampling, Dalil Limit Pusat
6
dist Xbar dg ukuran sampel 5 populasi Poisson lamda 2 20
y c n e u 10 q e r F
0 0.5
1.5
2.5
3.5
4.5
C4
dist Xbar dg ukuran sampel 15 populasi Poisson lamda 2
20 y c n e u q e 10 r F
0 1.4
1.6
1.8
2.0
2.2
2.4
2.6
2.8
3.0
C5
Distribusi Sampling, Dalil Limit Pusat
7
dist Xbar dg ukuran sampel 30 populasi Poisson lamda 2 15
y10 c n e u q e r F 5
0 1.5
2.0
2.5
C6
Variable C4 C5 C6 P-Value C4 C5 C6
N 80 80 80
Mean 1.9175 2.0267 1.9833
Median 2.0000 2.0000 1.9667
Tr Mean 1.9139 2.0130 1.9838
StDev SE Mean 0.5769 0.0645 0.3575 0.0400 0.2489 0.0278
0.008 0.090 0.331
Dari P-value diatas dapat disimpulkan bahwa data x berdistribusi Normal untuk ukuran sampel 15 dan 30 saja berdasarkan hasil uji Anderson-Darling. Indikator yang paling kuat ditunjukkan oleh untuk ukuran sampel = 30. Bila ditinjau dari nilai mean dan StDev nya maka kesimpulan yang hampir sama dapat diambil yaitu untuk semakin besar sampel yang diambil ternyata akan mendekati mean populasinya (λ=2). Sedangkan simpangan bakunya akan semakin kecil untuk ukuran sampel yang makin besar sesuai teorema limit pusat. Dari hal ini dapat disimpulkan dengan pengambilan sampel Distribusi Sampling, Dalil Limit Pusat
8
yang besar maka taksiran untuk mean populasi akan semakin tepat. Dari hasil pengujian dari beberapa macam populasi yang berbeda kemudian para ahli sepakat bahwa ukuran sampel = 30 adalah cukup baik sehingga distribusi rataan sampel menjadi Normal . Contoh 1 Nilai kesalahan baku dari nilai tengah penarikan sampel berukuran 36 sebuah populasi besar adalah 2. Berapa ukuran sampel tersebut harus dinaikkan agar kesalahan bakunya = 1,2 ? Jawab Diketahui sampel dengan n=36 dan
Bila diinginkan σ x
= 1,2
σ x
=2
n=?
Misalkan σ 2 : variansi populasi maka σ 2 4= σ 2 = 144 (nilai σ 2 ini tetap) σ x = n 36 Bila diinginkan σ x = 1,2 maka σ x
2
σ
2
σ
=
2
2
n
1,44
=
144 n
n = 100
Contoh 2 Sebuah pesawat terbang membawa 4 penumpang. Beban aman untuk 4 orang penumpang adalah 360 kg. Andaikan seorang penumpang dipilih secara acak dari distribusi normal dengan mean 75 kg dan simpangan baku 16 Jawab Diketahui X berdistribusi normal dengan σ x
µ x
= 75
dan
= 16
Distribusi Sampling, Dalil Limit Pusat
9
Misal Y=4X maka µ y = 300 dan σ y = 4 Peluang (terjadi overload) = P (4x > 360)
P Z >
x 16 =32
360 − 300
60 = P Z > = P ( Z > 1,875) = 0,032 32
32
Latihan 1. Bila diketahui data populasi X = {1,2,2,3,3,4} . Lakukan eksperimen sederhana untuk menunjukkan dalil limit pusat yaitu dengan mengambil sampel berukuran 3 tanpa pengulangan sebanyak maksimum kombinasi yang mungkin ! 2. Bila semua kemungkinan sampel berukuran 16 ditarik dari suatu populasi normal dengan nilai tengah 50 dan simpangan baku 5. hitung peluang nilai tengah sampel akan berada dalam selang µ x −1.9σ x sampai µ x − 0.4σ x ? 3. Sebuah perusahaan baterai mengatakan rata – rata umur baterai mereka 30 jam. Bila 16 unit sampel diambil secara acak dan didapatkan simpangan baku sampel = 5 jam, tentukan nilai rata – rata sampel terendah yang diijinkan bila perusahaan menetapkan batas µ ± 3 σ ? 4. Rata - rata banyaknya panggilan telepon / jam suatu perusahaan dalam 2 tahun terakhir = 4. Bila dicatat banyaknya telp dalam 2 hari dlm 2 thn terakhir tsb, hitung bahwa peluang bahwa rata – rata banyak nya telp/jam >= 5 ? 5. Masa pakai suatu komponen elektronik (dalam tahun) dinyatakan dalam X merupakan suatu peubah acak yang mengikuti distribusi eksponensial dengan pdf
f ( x ) =
x
1 −5 5 0
e
; x > 0
; x lainnya
Distribusi Sampling, Dalil Limit Pusat
10