Tugas II Riset Pemasaran dan Manajemen Resiko
BAB 7 MENDAPATKAN DISTRIBUSI DARI DATA
OLEH :
KELOMPOK V RISWANDI
H12107001
FADLI FADLI LANTERA LANTERA
H12107003 H1210700 3
HADIJAH
H12107005
SITI ZUHURIA ZUHURIA
H12107007
KHALILAH KHALILAH NURFADILAH NURFADILAH
H12107014
A. RANUWIRAWA RANUWIRAWAN N R.
H12107026
JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS HASANUDDIN MAKASSAR 2010
BAB 7 MENDAPATKAN DISTRIBUSI DARI DATA
dimulai denga dengan mendorong analis untuk meninja meninj au data yang telah telah Bab ini dimula tersedia tersedia dan k ar akteristik da dari variab riabel el yang ak an dimodelk an. Be ber ber apa apa teknik terse b terse but ut kemudia kemudi an di baha di bahass ya yang memungkink an analisis untuk mengguna menggun ak an da data yang tersedia tersedia untuk menentuk an distri b distri busi usi di pa di passang seca secar a em piris. uta ma dari pendek piris. Kele bi bihan han uta pendek atan intuitif ini adalah keseder han hanaan aa n penggun penggunaa aan n dan peng pengh hila ilanga ngan distri b distri busi usi teoritis ya yang tida tidak te pa te patt atau mem b mem bingungk ingungk an. Teknik ini kemudia kemudi an dijela dijelask an untuk distri b distri busi usi teoritis di pa di passang pad pada data yang dia dia mati, terma termasuk penggun penggunaa aan n pendug pendugaa ma ksimum likelih likeli hood, tingk at ke baik baik an sta statistik a dan plot. plot. Ak hirnya irnya, be be ber ber apa apa teknik ya yang di baha di bahass untuk mem ba mem bantu ntu model pro pro bab babilit ilitaas.
7.1 Menganalisis Sifat Data Yang Diamati
Se belum belum menco ba menco ba untuk menyesua menyesuaik an distri b distri busi usi pro pro bab babilit ilitaas untuk sa s atu set da data yang dia dia mati, ada baikny baiknyaa pert pertaama mem pertim pertim bangk bangk an sif at da dari va variab riabel el ya ya ng b ng bers ersaangkuta ngkutan. Sif at-sif at distri b distri busi usi atau distri b distri busi usi ya yang di p di pili ilih h untuk di pa di passang denga dengan data harus harus sesua sesuai denga dengan variab riabel el yang dimodelk an. Per angk at luna lunak se p se perti erti best fit telah telah mem bu buat distri b distri busi usi yang te pa te patt untuk da data yang sanga ngat mudah mudah dan dihap dihapus us perlu perlu untuk setiap seti ap penget pengetah ahu uan sta statistik ya yang menda mendala m. Produk- p Produk- produk roduk ini umumnya umumny a sanga ngat bergun bergunaa tetap tetapi, i, mela melalui otoma otomatisa tisasi dan kemudaha kemudahan n penggun penggunaa aan, n, senga senga ja ja mendorong penggun penggunaa untuk menco ba menco ba cocok untuk distri b distri busi usi se p se penu enuh hnya nya tida tidak pant pantaas. Sementa Sementar a saya sanga ngat mendukung penggun penggunaa aan n per per angk at luna lunak pa k pass distri b distri busi usi terse b terse but, ut, perlu perlu mem p mem pertim ertim bangk bangk an halhal-ha hall berikut berikut se belum belum menco ba cocok denga dengan: Se bu buah variab riabel el diskrit hany hanyaa dapat apat menga mengam bil bil sa satu nila nilai ya yang s p s pesifik, esifik, misa mis alnya lnya jumlah jumlah jem bat batan di se pa se panj njaang jalan r aya, tapi api pengukur pengukur an se p se perti erti volume as pal, pal, misa misalnya lnya, terus menerus. Se b Se bu uah variab riabel el yang diskrit di ala m bi biasanya nya, na mun tida tidak sela selalu, paling paling sesua sesuai untuk sua suatu distri b distri busi usi diskrit. Se b Se bu uah pengecu lian ya y ang sa sanga ngat umum adalah di ma m ana pengecuaalia selisih selisih anta ntar a nila nilai-nila i-nilai ya ng diijink an berse elaha n tida tida k signifik an di bandingk dengan berse b bel ahan bandingk an denga renta rentang bahwa ng bahwa variab riabel el dapa dapatt berl berlaangsung. Dala m kea kea daan aan tertentu, distri b distri busi usi diskrit bis bisaa sanga ngat er at didek ati denga dengan distri b distri busi usi kontinu untuk nila nil ai x yang bes besaar.Jik a se bu buah variab riabel el diskrit telah telah dimodelk a n
denga dengan distri b distri busi usi kontinu untuk kenya keny a manan, sif at diskrit denga denga n mudah mudah bis bisaa dima dimasukk an kem bali bali ke da dala m model analisis risiko. Distri busi busi harus harus dilengk api, api, dala m alasan, menca menc aku p renta rentang di ma mana variab riabel el yang dimodelk an seca secar a teoritis dapa dapatt di per per panj panjaang. Jik a distri b distri busi usi di pa di passang mungkin mela mela m paui paui jangk auan variab riabel, el, se b se bu uah model analisis risiko ak an mengha menghasilk silk an skena skenario mustah mustahil. il. Jik a distri b distri busi usi ga gagal untuk mem p mem per er panj panjaang sela sela ma renta rentang mungkin seluruh seluru h variab riabel, el, analisa lisa resiko tida tidak a k ak an mencermink an ketida ketidak pasti pastiaan ya yang b ng ben enaar da dari ma masalah. ah. Variab riabel el mungkin berkorel berkorelaasi denga dengan, atau fungsi, va variab riabel el la lain da dala m model da da n juga juga mungkin terk ait denga dengan variab riabel el lain di lua luar model ya yang, pad pada gilir annya nnya, mem p mem peng engaaruh ruhi variab riabel el ketiga ketiga dala m model analisis resiko. Ga Ga m bar bar 7.1 mengilustr asik an be be ber ber apa apa contoh contoh.
Gamb Gambar 7.1 Contoh dari keterikatan antara varia bel-variab el-variabel model: a. Langsung b Langsung b. Tidak langsung
Dala m contoh contoh (a), a), se b se bu uah bank, bank, pend pendapa apattanny nnya dimodelk an se ba se bag gai fungsi da dari bung bungaa dan nila nilai hi potek, potek, anta ntar a lain. Tingk at KPR b KPR berkorel erkorelaasi denga dengan tingk at bung bungaa k arena rena tingk at suku bung bungaa se bagi ba giaan bes besaar mendefinisik a n bag bagaima imana suku bung bungaa KPR seha seharusny rusnyaa. Hu bung bungaan ini harus harus diserta disertak an dala m model simula simulasi untuk mema memastik an bahwa hany hanyaa ak an mengha menghasilk silk a n skena skenario ya yang b ng ber er arti. Ada Ada dua dua pendek pendek atan untuk ini: 1. Tentuk an distri b distri busi usi untuk tingk at hi potek potek da dan bung bungaa berd berdaasark an da data historis da da n kemudia kemudi an mengkorela mengkorelasik an sa sam pling pling da dari distri b distri busi usi sela sela ma simula simulasi. 2. Tentuk an distri b distri busi usi suku bung bungaa dari data historis da dan hu bung bungaan (stok astik ) fungsiona fungsion al denga dengan tingk at hi potek. potek.
Pada contoh contoh ( b) ga m bar bar 7.1, adalah mengh menghitung harg hargaa tawar awar an untuk mema memasok tena tenaga kerja kerja untuk pekerj pekerjaa aan n atap. ap. Pemiliha Pemilihan n bahan bahan atap belum belum di p di putusk utusk an dan ketida ketidak pasti pastiaan ini memiliki im p im plik lik asi untuk ja jam or ang-ya ng-ya ng ak an di butu butuh hk an untuk mem ba mem bangun ngun atap dan k ayu untuk meleta meletakk an atap. ap. Ada Ada k arena rena itu meru pak pak an hu bung bungaan tida tidak langsung anta ntar a kedua kedua variab riabel el ya yang denga dengan mudah mudah bis bisaa sa ja ja terlewa terlewatk tk a n, dia dia tida tidak meliha meli hatt di lua luar kom p kom ponen onen la langsung da dari per per hitunga itungan bi biaya nya nya. Hila Hilang korela korelasi ini ak an mengha menghasilk silk a n meremeh meremehk a n penye penye ba bar r an bi biaya su bkontr bkontr aktor da dan ber ber potensi potensi menye bab menye babk k an dia dia untuk pen penawa awar r an harg hargaa ya ng terkena terkena dia dia untuk kerugia kerugi an yang signifik an. Hal ini dapa dapatt diliha dilihatt bahwa korela korelasi meru pa meru pak k a n bagi bagiaan penting penting da dari analisis risiko bany banyaak. Bab 10 menjela menjelask an be be ber ber apa apa teknik untuk model korela korel asi anta ntar va variab riabel. el. Jik a distri b distri busi usi diketah diketahui ui cocok dek at denga denga n jenis va variab riabel el yang dimodelk an, bi biasanya nya se bag bagai hasil hasil k arya rya ak ademis diter bitk bitk an, semua semua yang tersisa tersisa adalah untuk menemuk an par se perti erti ya yang dijela dijelask a n da dala m bagi par a meter fitting ter baik, baik, se p bagiaan 7.3.
7.2 PENERAPAN DISTRIBUSI EMPIRIS PADA DATA YANG DIAMATI
7.2.1 Pemode P emodella n Va Variab riabel el kontinu Jik a data yang dia dia mati kontinu da dan cuku p cuku p lua luas, bi biasanya nya cuku p cuku p untuk mengguna menggunak an plot plot frekuensi kumula kumul atif titik da data untuk menentuk an distri b distri busi usi p pro ro bab babilit ilitaasnya snya
Ga m bar bar 7.2 Menyesua Menyesu aik an distri b distri busi usi em piris piris kontinu pad pada data mengguna menggunak a n distri b distri busi usi kumula kumulatif Ga m bar bar 7.2 mengga mengga m bark bark an se b se bu uah contoh contoh denga dengan 18 titik da data. dia dia mati F(x) F(x) dih dihitung se ba se bag gai nila nilai-nila i-nilai yang diha dihar r apk apk an F (x) (x) yang ak an sesua sesuai denga denga n sam pling pling acak dari distri b distri busi, usi, ya yaitu
dima dimana i adalah peringk peringk at titik da data yang ter a mati da dan
adalah jumlah jumlah titik da data. y
minimum da da n
maksimum
untuk
distri b distri busi usi em piris piris su b su byektif yektif ditentuk an
berd berdaasark an penget pengetah ahu ua n analis da dari variab riabel. el. Untuk va variab riabel el kontinu, nila nilai-nila i-nilai ini umumnya umumnya di lua luar jangk auan dari data yang dia dia mati. Nila Nilai minimum da da n ma ksimum ya yang di p di pili ilih h adalah nol da dan 45. y
Data titik a titik adalah peringk peringk at da dala m uruta urut an anta ntar a nila nilai minimum da da n ma maksimum.
y
Pro babilit babilitaas kumula kumulatif
y
Ini formula formula untuk
untuk setiap setiap nila nilai
dih dihitung se ba se bag gai berikut: berikut:
diguna digunak an k arena rena tem pat pat semua semua
ter had hadap persentil persentil
kumula kumulatif diha di har r apk apk an yang ak an dia dia mati jik a titik da data di pili pilih h seca secar a acak dari distri b distri busi. usi. K arena rena itu mema mema ksima ksimalk an kesem pa kesem pattan mere plik plik asi distri b distri busi usi ya yang ben benaar. y
Kedua Kedua arr ay,
dan
, bers bersaa ma denga dengan nila nilai minimum da dan ma ksimum,
ma k a dapat apat diguna diguna k an se bag bagai ma masuk an la langsung ke da dala m distri b distri busi usi kumula kumulatif. Jik a ada jumlah jumlah data yang sa sanga ngat bes besaar, menja menjadi tida tidak pr pr aktis untuk mengguna menggun ak an semua semua titik da data untuk menentuk an distri b distri busi usi Kumula Kumulatif. Da Dala m k asus se p se perti erti itu, le b le bii h mudah mudah untuk mengkonversi da d ata ke dala m distri b distri busi usi Histogr a m pert pertaa ma. Jumlah Jumlah pit pitaa harus harus ditetap ditetapk k an denga denga n maksimum pr pr aktis ya yang menyeim bangk bangk an keha kehalus lusaan deta detail (jumlah (jumlah bes besaar bar bar ) denga dengan sering memiliki mendefinisik a n bes besaar a r arr ay distri b distri busi usi (a (angk a yang le bi bih rendah rendah dari ba ri bar r ). Ga m bar bar 7.3 mengga mengga m bark bark an se b se bu uah contoh contoh di mana 221 titik da data di plot plot da dala m bentuk bentuk h histogr a m sela sela ma renta rentang da dari da d ata yang dia di amati. Ana Analis menga menganggap nggap bahwa variab riabel el di bay bayangk an bis bisaa berkis berkisaar dari nol sa sa m pai pai 300. K arena rena tida tida k a k ada data yang dia dia mati denga denga n nila nilai di bawah 20 da dan di atas 280, berkis berkisaar h r histogr am bar bar p perlu erlu diu bah diu bah untuk menga menga komoda komodasi minima minimal su b su b jektif dan maksima ksimal. Car a termudah termudah untuk mencapa mencapaii tujua tujuan ini adalah untuk mem p mem perlu erluaas jangk auan dari bar bar p pert ertaa ma dan ter ak hir denga denga n non- p non- pro ro bab babilit ilitaas nol untuk menca mencaku p renta rent ang di p di perluk erluk an, tetap tetapii ta tan pa mengu bah mengu bah pro pro bab babilit ilitaasnya snya. Da D ala m contoh contoh ini, bar bar histogr a m denga dengan kisa kisar an 20-40 di p di perlu erluaas ke ber ber bag bagai 0-40 da dan bar bar denga dengan kisa kisar an 260-280 di perlu perluaas untuk kisa kis ar an 260-300. K a mi mungkin ak an memiliki sedikit mem b mem bes esaar- bes besaark an
taiis distri b distri busi. usi. Na Na mun, jik a jumlah jumlah bar bar pa pad da awalny awalnyaa di pili pilih h cuku p bes besaar, ak an ada sedikit peng pengaaruh ruh yang nya nyata pad pada model. {40, 60, ..., 420260}, ma m ak a
arr ay in put put ke da dala m distri b distri busi usi Kumula Kumulatif kemudia kemudian
arr ay {0.018,0.131, ..., 0.986,0.995} d an minimum da da n
ma ksimum, tentu sa s a ja ja 0 da dan 300 ma masing-ma sing-masing. Mengu bah distri busi busi Histogr a m menja menjadi distri b distri busi usi kumula kumulatif mungkin ta ta m pak pak sedikit bergun bergunaa ketik a Histogr a m dapa dapatt diguna digunak an da dala m sua suatu model analisis risiko. Na N a mun, teknik ini memungkink an analisis untuk memilih memili h ber ber bag bagai le bar bar ba barr sesua sesuai ke butu butuha hanny nnyaa, se perti perti da dalam contoh contoh di atas, dan oleh oleh k arena rena itu untuk mema mema ksima ksimalk an rincia rincian dala m distri b distri busi usi tem pa tem patt ya yang mem b mem butu utuh hk an. 7.2.2 Pemodelan Variabel Diskrit
Data dari variab riabel el diskrit dapa dapatt diguna digunak an untuk menentuk an distri b distri busi usi em piris piris dala m dua dua car a:
Ga m bar bar 7.3 Menyesua Menyesuaik an distri b distri busi usi em p em pirik irik denga dengan da d ata histogr a m mengguna menggunak an distri b distri busi usi kumula kumulatif
Jik a jumlah jumlah nila nilai x ini tida tidak ber ber bed bedaa bes besaar, frekuensi da data pad pada setiap setiap nila nilai x dapa dapatt diguna digunak an la langsung untuk menentuk an Disri b Disri bution ution Diskrit. Jik a jumlah jumlah nila nilai x ya y ang sa sanga ngat bes besaar, bi biasanya nya le b le biih mudah mudah untuk menga mengatur da data ke dala m bentuk bentuk histogr am dan kemudia kemudian menentuk an distri b distri busi usi kumula kumulatif, se p se perti erti di atas. Sif at diskrit va variab riabel el dapat apat di perken perkenaalk an kem ba kem bali li oleh oleh em bedding bedding distri b distri busi usi kumula kumulatif di dala m fungsi (...) (... ) sta standa ndar s p s pre reaadsh dsheet ROUND. O psi psi yang diur aik an di atas memiliki keunggula keunggul an bahwa distri b distri busi usi ber ber asal dari data yang dia dia mati ak an sa sanga ngat ter peng pengaaruh ruh oleh oleh su b su b jektivita jektivitas apapun apapun da d an bahwa penggun penggunaa aan n ma ksima ksimal da data yang telah telah di bu buat da d ala m mendefinisik an distri b distri busi. usi. Kerugia Kerugian ya yang jela jelas adalah bahwa proses proses ini cuku p cuku p sulit. Na Na mun, da data Distri b Distri busi usi f asilita silitas di Lotus 1-2-3, f a f asilita silitas Histogr a m di Excel da d an lapor apor an sta statistik BestFit semua semua bis bisaa mem bu buat menyortir da data dan mengh menghitung frekuensi kumula kumul atif sa sanga ngat mudah mudah..
7.3 PEMASANGAN SEBUAH DISTRIBUSI TEORITIS ATAS DATA DITINJAU
Bagi Bagiaan ini menjela menjelask an metode untuk menemuk an distri b distri busi usi teoritis ya yang paling paling sesua sesuai denga denga n data ya ng dia dia mati. Se bu buah jenis distri b distri busi usi teoritis dapa dapatt di pili pilih h se bag bagai yang paling paling te pa te patt agar sesua sesuai denga denga n da data untuk tiga tiga alasan: y
matema tematik a Distri busi busi adalah se bu buah model ya yang akur at ketida ketidak pasti pastiaan dala m va v ariab riabel el yang di p di pertim ertim bangk bangk an (liha (lihatt bagi bagiaan 7.1) 7.1)
y
Distri busi busi ak an cocok denga deng an data apabil apabilaa variab riabel el dari ty pe pe kecocok a n ini diketah diketahui ui denga dengan jela jelas. (liha (lihatt bagi bagiaan 7.1 la lagi) gi)
y
Ana Analisis seder han hana harus harus menemuk a n teori distri b distri busi usi da dari kecocok a n ter baik baik dari data, apapun apapun ya yang mungkin. Par ameter distri b distri busi usi ya yang mem bu buat jenis distri b distri busi usi ya yang ter baik baik sesua sesuai denga denga n data
yang tersedia tersedia dapat apat ditentuk an denga dengan be be ber ber apa apa car a. Teknik ya yang paling paling umum adalah denga dengan mengguna menggunak an estima estimator ma maksimum likelih likeli hood (MLEs) (MLEs). Par ameter (MLEs) (MLEs) dari distri b distri busi usi ditemuk an bahwa mema mema ksima ksimalk an ke pa ke pad datan pro pro bab babilit ilitaas gabung abungaa n untuk da data yang dia dia mati. MLEs sa sanga ngat bergun bergunaa k arena rena, untuk distri b distri busi usi bany banyaa k, merek a menyedia menyedia k a n car a ce pat pat untuk pa untuk par r a meter ter baik. baik. Se bag bagai contoh contoh, distri b distri busi usi Norma Normal didefinisik an oleh ole h mea mea n dan devia deviasi sta standa ndar dan MLEs perus perusahaa ahaan n mea mean da n devia deviasi sta standa ndar dari data yang dia dia mati.
7.3.1 Estimator Maksimum Likelihood(MLEs)
Estima Estimator ma maksimum likelih likelihood da dari sua suatu distri b distri busi usi adalah nila nilai-nila i-nilai par par a meter ya yang mengha menghasilk silk a n ke pad padatan maksimum pro pro bab babilit ilitaas gabung abungaan untuk da data yang dia dia mati. Da Dala m k asus distri b distri busi usi diskrit, MLEs mema mem a ksima ksimalk an pro pro bab babilit ilitaas aktua ktual dari distri b distri busi usi ya ya ng dapat apat mengha menghasilk silk a n data yang dia dia mati. Pertim bangk bangk an jenis distri b distri busi usi pro pro bab babilit ilitaas ya ng didefinisik an oleh oleh se b se bu uah par par a meter tungga tunggal, . Fungsi likelih likeli hood L( L() adalah se banding banding
denga dengan pro pro bab babilit ilitaas bahwa satu set poin poin n data ( ) dapat apat diha dihasilk silk an dari distri b distri busi usi denga denga n ke pad padatan pro pro bab babilit ilitaas f ( x) x) atau, dala m k asus distri b distri busi usi diskrit, ma massa ssa pro pro bab babilit ilitaas di b di berik erik an oleh oleh
L( L()) = ( ,) ,)
seh sehingga ingga L( L()) = f (
) * f (
,) ,)*«.* f (
,) ,)* f (
, ) )
Sela Selanjutnya njutnya menca mencari nila nilai ya ng mema mema ksima ksimalk an L( L(). Ha Hal ini ditentuk an denga dengan mela mela kuk a n diferensia diferensial parsi parsiaal L( L() ter had hadap da dan menuju ke nol:
= 0
Untuk b Untuk bee ber ber apa apa jenis distri b distri busi, usi, ini meru pa meru pak k an masalah aljaba ljabarr rela relatif ya yang seder han hana, untuk or ang lain pers persaa maan aan diferensia diferensial sanga ngat rumit da dan diselesa diseles aik an seca secar a numerik se ba se bag gai gantinya ntinya. Softwa Software re se p se perti erti BestFit telah telah mem bu buat proses proses ini sa sanga ngat mudah mudah untuk mela mela kuk a n seca secar a otoma otomatis, tetap tetapii ada contoh contoh seder han hana seca secar a rinci da dala m Bagi Bagiaan 7.3.2 untuk tujua tuju a n ilustr asi. 7.3.2 Contoh Derivasi MLEs
Contoh Contoh 7.1: Menentuk an MLE untuk distri b distri busi usi eks p eks ponensi onensiaal Distri b Distri busi usi eks p eks ponensi onensiaal memiliki sa satu par par a meter, . Pro babilit babilitaas fungsi ke pa ke pad datan f ( x) x) di berik berik an oleh oleh f ( x) x) =
ex p( p( )
fungsi likelih likeli hoo L oo L(( ) adalah, ah,
ex p( p ( ) = ex p( p (
L( L( ) =
Untuk mem p mem permud ermudah ah per per hitunga itunga n, kita kita mendefinisik an I () () = ln L ln L(( ):
)
I ( ) = -n In ( )-
Nila Nilai ma ma ksimum I ksimum I ( ), dan juga juga L( L( ), terja terjadi ketik a deriva derivatif pa tif parsi rsiaal ter had hadap ap ssa ma denga dengan nol, ya yaitu
= + = 0
Di berik berik an =
yaitu itu MLE MLE da dari distri b distri busi usi eks p eks ponensi onensiaal adalah mea mean da dari da data yang dia diamati. Contoh Contoh 7.2: Menentuk an MLEs untuk distri b distri busi usi Norma Normal, distri b distri busi usi Norma Normal meiliki dua dua par par ameter, mea mean dan devia deviasi sta standa ndar . Pro bab Pro babilit ilitaas fungsi ke pad padatan f(x) f(x) di berik berik an oleh oleh
) ex p( p ( ) Fungsi likelih likeli hood L ood L(, (, ) ) = ( ) ex p ( µ
f (x) (x) =
µ
Untuk mem p mem permud ermudah ah per per hitunga itunga n, kita kita kem bali bali definisik an I ( ) = ln L ln L(( ):
I (µ, (µ, ) ) = - ln(
) ± n ln -
µ
Nila Nilai maksimum I (, (, ) ), dan k arena rena itu L(, L(, ) ), terja terjadi deriva derivatif pa tif parsi rsiaal ketik a engk au seh sehu bung bungaan denga denga n dan s sa ma denga denga n nol, ya yaitu
= -2 + 2 µ 2 µn n=0 µ µ
Di berik berik an µ= Dima Dimana
=
adalah mea mean da dari da data, da da n
=0 = + µ
µ
Di berik berik an
=
= s µ
Dima Dimana s sta standa ndar devia deviasi dari data yaitu itu dan MLEs da dari distri b distri busi usi norma normal adalah mea mean dan devia deviasi sta standa ndar da dari da data yang dia dia mati. 7.3.3 Menemukan Parameter Fitting terbaik menggunakan pemecahan Linear
Gamb Gambar 7.4 mengilustrasikan spreadsheet Microsoft Excel di bentuk untuk menemukan parameter dari suatu distrib distribusi Rayleigh ter baik yang akan cocok dengan 18 poin dat a yang diamati.
Fungsi distri b distri busi usi kumula kumulatif untuk distri b distri busi usi R ayleigh yleigh F ( x) x) adalah F ( x) x) = 1- ex p ex p((-
/2
)
Dima Dimana b adalah par par a meter distri b distri busi usi itu. Microsoft Solver Solver di Excel E xcel dia di atur untuk menemuk a n nila nilai minimum untuk sel F21 (juml ah per per bed bedaa aan n absolut absolut anta ntar a di F di F di diaa mati da d an R ayleigh yleigh ( x) x) s) s) denga denga n mengu bah mengu bah nila nilai b di sel C23. Solusi solver untuk b adalah 4.51195, sesua sesu ai denga dengan cocok dita dita m pilk pilk a n da dala m bag bagan Ga Ga m bar bar 7.4.
7.3.4 Formalisme Entropi Maksimum
Forma Formalisme entro p entro pii maksimum adalah teknik untuk menentuk a n distri b distri busi usi da dari va v ariab riabel el ya yang mewa mewakili kili ketida ketida k pasti pastiaan ma maksimum da data yang dia diamati untuk va variab riabel el ya yang mungkin. Untuk distri b distri busi usi kontinu, H kontinu, H (x) (x) ditulis se ba se bag gai: H (x) (x) =
Dima Dimana f ( x) x) adalah pro pro bab babilit ilitaas da dari distri b distri busi.Teknik usi.Teknik ini dapa dapatt diter apk apk a n di ma mana kita kita hany hanyaa memiliki p memiliki penget engetah ahu ua n ya yang sa sanga ngat ter bat batas da dari va variab riabel el..
7.4 STATISTIK GOODNESS-OF-FIT
Goodness-of-fit sta st atistic telah telah bany banyaak dikem ba dikem bangk ngk an tapi api hany hanyaa 2 yang bi biasa diguna digunak a n. Yang paling paling umum adalah chi kua kua dr a (
dan sta statistik kolmogorov-Smirnoff (K-S) (K-S)
umumnya umumnya diguna diguna k an untuk diskrit da dan kontinu.
Data yang ak an dia dianalisis bis bisaa masuk da dala m salah satu bentuk bentuk goodness-of-fit sta st atistic. Goodness-of-fit sta st atistic tida tidak mudah mudah untuk di paha di pahami mi atau dita ditafsirk an.Tida n.Tidak mem b mem berik erik a n ukur an pro pro pab pability ility untuk da data se b se ben enaarnya rnya ber ber asal da dari distri b distri bution. ution. Ma Malah, ah, sta statistik goodnessof-fit mem berik berik a n peluang bahwa data acak yang diha di hasilk silk an dari distri b distri busi usi ak an mengha menghasilk silk a n nila nilai goodness-of-fit sta st atistic serendah serendah yang dih di hitung untuk da data yang dia dia mati. Seta Setar a denga dengan pro pro bab babilit ilitaas bahwa data itu, pad pada kenya kenyataanny aannyaa, ber ber asal dari pas pasanga ngan distri b distri busi, usi, k arena rena mungkin ada distri b distri busi usi ya ya ng memiliki bentuk bentuk ya yang sa ma dan le bi bih baik baik mengha menghasilk silk a n data ini da dan dia dia mati sanga ngat teliti untuk da data distri busi busi norma normal, k arena rena bany banyaak distri b distri busi usi cenderung ke bentuk bentuk norma normal da dala m kondisi tertentu.
Nila Nilai-nila i-nilai kritis ditentuk an oleh oleh tingk at ke perc percaayaan aa n yang di p di perluk erluk an nila nilai-nila i-nilai dari goodness-of-fit sta st atistic
ya yang memiliki pro ilitaas mele b mele biihi yang sa ma pro bab babilit
denga dengan keya keya kina kinan tertentu nila nil ai-nila i-nilai level kritis untuk dari
yang meru pa meru pak k an
distri busi, busi, bentuk bentuk da dan ber ber bag bagai distri b distri busi usi
tes ditemuk an langsung
didefinisik an oleh oleh der a ja jat fredom
Dima Dimana N = jumlah jumlah atau kela kelas histogr a m bat batang
= sejumlah sejumlah par par ameter ya yang diestima diestimasi untuk menentuk an distri b distri busi usi ya yang paling paling
sesua sesuai
7.4.1 Nilai Kritis dan Interval Keyakinan untuk Statistika Goodnesss-of-fit
Bentuk da da n ja jangk auan distri b distri busi usi didefinisik a n oleh oleh der a ja jat ke be be bas basan v: v =N-a -1. Dima Dimana jumlah jumlah N= Jumlah Jumlah bar bar h histogr a m atau kela kelas a = pa = par r a meter ya yang di p di perkir erkir ak an untuk menentuk a n distri b distri busi usi ya yang pa ng paling ling pa pass Ga m bar bar 7.5 menunjukk an plot plot kumula kumulatif turun untuk
(11) (11), yakni pa kni par r a
distri busi busi denga dengan
11 der a ja jat ke be be bas basan. Ini plot plot se bu buah kesem pat patan 80% (= interva interval keya keyakina kinan) bahwa nila nilai ak an terja terjadi yang le bi bih tinggi da dari 6,988 (nila (nil ai kritis pad pada tingk at ke perc percaayaan aa n 80%) 80%) untuk data yang se ben rnya dia dia m bil distri busi usi di pa di passang, ya yaitu hany kemungkina n benaarnya bil dari distri b hanyaa ada 20% kemungkina bahwa
nila nilai bis bisaa jadi ini kecil. Jik a analis konserva konservatif da dan menerima menerima kesem pa kesem pattan ini 80%
dari palsu palsu menola menolak sesua sesuai denga denga n, keya keyakina kinannya nnya interva interval = 80% da dan nila nilai kritis ya yang terk ait 6,988. Nila Nilai-nila i-nilai kritis untuk st atistik KS da dan AD telah telah ditemuk a n oleh oleh simula simulasi Monte Ca C arlo (Ste phens. phens. 1974, 1977; Cha C handr ndr a et al, 1981) 1981). Tab T abel el nila nilai kritis untuk sta st atistik KS juga juga sanga ngat sering ditemuk an da d alam buku buku- buku buku teks sta st atistik. Sa Sayangnya ngnya, KS sta standa ndar da n nila nilai-nila i-nilai AD penggun penggunaa aan n ter bat batas untuk mem ba mem bandingk ndingk an nila nilai kritis jik a le bi bih sedikit da dari sekita sekitar 30 titik data. Masalah muncul k arena rena sta statistik ini dir anca ncang untuk menguji cua cu aca distri b distri busi usi denga denga n par par a meter ya yang dikena dikenal bis bisaa mengha menghasilk silk an data yang dia diamati. Jik a par par a meter da dari distri b distri busi usi di pas pasang telah telah di perkir perkir ak an dari data terse b terse but, ut, KS da dan sta st atistik AD ak an mengha menghasilk silk an hasil hasil tes konserva konservatif, ya yaitu ada kemungkina kemungkin an le b le biih kecil da dari sua suatu distri b distri busi usi baik baik pa pass diterima diterima. Ukur an efek ini berv bervaaria riasi anta ntar a jenis distri b distri busi usi ya yang di pa di passang. Modifik asi sta statistik KS da da n AD telah telah ditentuk an untuk mengoreksi ma m asalah ini se bag ba gai berikut berikut (liha (lihatt manua nual BestFit
dimodifik asi KS
diter bitk bitk a n pad pada tahun ahun 1993) 1993) di ma mana n adalah jumlah jumlah titik da data dan dan sta statistik AD ma masing-ma sing-masing:
Kolmogorov-Smirnoff Kolmogorov-Smirnoff Statistics
Distri Distrib bution
Modified test statistic
Norma Normal
( - 0.01 +
).
)( + 0.26 + ) +0.12+ ).
Es ponenti ponentiaal
( ±
Wei bull bull and extreme Va Value
Lainnya innya
nderson-Darling Anderson-Darling
Distri Distrib bution
Statistics
Modified test statistic
). ( + ). )
Norma Normal
(1 +
Es ponenti ponentiaal
Wei bull bull and extreme Va Value Lainnya innya
7.4.2 Statistik Goodness of fit Chi Square
Sta Statistik Ch Chi Squa Square ( ) mengukur se ba se baik ik ma mana mem perkir perkir ak a n frekuensi distri b distri busi usi ya yang sesua sesuai di bandingk bandingk an denga denga n frekuensi da dari histogr am da data yang dia dia mati. Tes Ch Chi Squa Square mem b mem bu uat asumsi b sumsi berikut erikut : 1. Data yang dia dia mati b ti berisi erisi sa sa m pel pel acak da dari n titik da data inde pendent. pendent. 2. Ukur an sk ala bi bias nomina nominal (ya (yakni numeric) numeric) atau menurut angk a (numerica (numerical) 3. n titik da data dapat apat diurut ke da dala m bentuk bentuk h histogr a m denga dengan N kel N kelaas non-overlapping atau bar bar ya yang menutu p menutu p keseluruha keseluruhan n r ange ya yang mungkin da dari va variab riabel. el. Sta Statistik Ch Chi squa square dih dihitung se ba se bag gai berikut berikut :
dima dima na O(i) adalah frekuensi ya yang dia dia mati pa ti pad da histogr a m kela kelas ke-i ke-i atau bar bar da dan E(i) adalah frekuensi ya yang diha dihar r apk apk an da dari distri b distri busi usi ya yang sesua sesuai pad pada nila nilai x ya yang ja jatuh tuh denga denga n r ange-x pad pada bar bar h histogr a m ke-i ke-i. E(i) dih dihitung denga dengan :
Dima Dimana
= Fungsi distri b distri busi usi da dari fitted ri fitted distrib distri bution
= nila nilai x ba x battas atas pad pada histogr a m bar bar ke-i
nilai x ba x battas bawah pa bawah pad da histogr a m bar bar ke-i = nila K arena rena sta statistic menjumlah menjumlahk k an kua ku a dr at dari semua semua error
statistic , mak a sta dapat apat seca secar a tida tida k se s e banding, banding, sensitive ke nila nil ai error apapu apapun yang bes besaar misa misalnya lnya, jik a error dari 1 bar bar aadalah 3 k ali da dari ba ri barr ya yang la lain, seh sehingga ingga ak an mena mena m bah 9 k ali le bi bih pad pada sta statistic (asumsik an E(i) sa ma untuk kedua keduanya) nya)..
adalah yang paling paling umum diguna diguna k an pad pada sta statistic goodness of fit ya y ang diga diga m bark bark an di
sini da dan sa s anga ngat berg bergaantung pad pada jumlah jumlah ba barr N yang diguna digunak a n. Denga Dengan mengga mengganti nila nilai dari N, as lah satunya tunya dapat apat denga dengan mudah mudah mengga mengganti tingk atan anta ntar a 2 ti p ti pee distri b distri busi. usi. Sayangnya ngnya, tida tidak a k ada car a ce pat pat untuk memilih memili h nila nilai da dari N. Se bag bagai pandu panduaan, ba n, bag gaima ima napun, apun, aproksim aproksimaasi Scott Norma Normal, diguna diguna k an denga denga n mema mema k ai softwa software re BestFit ya yang bi biasanya nya tam pak pak untuk b untuk bekerj ekerjaa sanga ngat baik: baik:
Di mana n adalah jumlah jumlah titik da data. Pandua nduan lain yang bergun bergunaa adalah mema memastik an bahwa tida tidak a k ada bar bar ya yang memiliki frekuensi har har apan apan ya yang le bi bih kecil da dari sekita sekit ar 1, ya yakni untuk semua semua i. Catatan bahwa sta statistic tida tidak mem b mem butu utuh hk an semua semua atau bar bar histogr a m apapun apapun ya yang memiliki le ba le barr sa sama.
Sta Statistic paling paling bergun bergunaa untuk untuk fitting distrib distribution untuk da data diskrit da dan hany hanyaa satusatunya tunya sta statistic ya yang diga diga m bark bark an di sini ya yang dapat apat diguna digunak an untuk da data nomina nominal (ya (yakni non-numeric) non-numeric).
Contoh Contoh 7.4: Penggunaa Penggunaan n untuk da data kontinu Susuna Susunan data dari 156 titik memiliki distri b distri busi usi Norma Normal(70,20) l(70,20). Perta Perta ma-ta -ta ma, datanya nya ditem pa ditem patk tk an dala m bentuk bentuk histogr a m denga denga n 14 bar bar se bag bagai usula usulan mengguna menggunak an aproksim aproksimaasi norma normal Scott¶s (Tab (Tabel el 7.1(a)) 7.1(a)).. 4 bar bar ekstrim memiliki frekuensi har har apan apa n di bawah 1 untuk distri b distri busi usi norma normal (70,20) (70,20) denga dengan 156 peng pengaa matan. Bar Bar ini kemudia kemudi a n dikom bin binaasik an untuk mengha menghasilk silk a n revisi set da dari jar ak bar. bar. Bar Bar ekstrim sek ar ang memiliki frekuensi har har apan apan 1.02 Hi potesis potesis dari distri b distri busi usi Norma Normal (70,20) (70,20) Data data ng da tidak da datang da dari distri b distri busi usi Norma Normal (70,20) (70,20) Data tida Kesim p Kesim pul ulaan Test sta statistic memiliki nila nilai 21.0 da dari tab tabel el 7.1( b) 7.1( b).. Terdapa Terdapatt der a ja jat be be bas bas ketik a tida tidak a k ada par par a meter distri b distri busi usi ya yang ditentuk an da dari da data). a). Per hatik hatik an pad pada distri b distri busi usi (11) (11), pelu peluaang ya y ang ak an kita kita miliki nila nilai yang tinggi ketik a
benaar a r adalah ben
di bawah di bawah 2%. Kemudia Kemudian kita kit a menyim pulk pulk an bahwa data tida tidak da datang da dari distri b distri busi usi Norma Normal (70,20) (70,20).
Contoh Contoh 7.5: Penggunaa Penggunaan n untuk da data diskrit Kum pul pulaan da dari 136 titik da d ata di perc percaayai ber ber asal da dari distri b distri busi usi Poisson. MLE untuk pa untuk par r a meter untuk Poisson diestima diestimasik an denga denga n menga menga m bil bil mea mea n da dari titik da data: Data ditab ditabul ulaasik a n pad pada bentuk bentuk frekuensi pad pada tabel abel 7.2 da dan kemudia kemudian pad pada data terse b terse but ut frekuensi har har apan apa n da dari distri b distri busi usi Poisson(4.4559) Poisson(4.4559 ) yakni , di ma ma na
Tabel abel 7.1 Per hitunga itungan sta statistik data kontinu: (a) (a) menentuk an ja jar ak bar bar ya yang untuk da diguna digunak an; ( b) ( b) Per hitunga itungan denga dengan merevisi ja j ar ak bar bar
Histogram Bar Dari A Ke B
10 20 30 40 50 60 70 80 90 100 110 120 130
Frekuensi Harapan dari Normal (70,20)
10 20 30 40 50 60 70 80 90 100 110 120 130
0.22 0.80 2.73 7.27 15.15 24.73 31.59 31.59 24.73 15.15 7.27 2.73 0.80 0.22
Revisi Bar Dari A ke B
20
30 40 50 60 70 80 90 100 110 120
E(i) dari Normal (70,20)
O(i)
1.02 2.73 7.27 15.15 24.73 31.59 31.59 24.73 15.15 7.27 2.73 1.02
3 5 6 10 21 25 37 21 17 11 6 3
20
30 40 50 60 70 80 90 100 110 120
Perhitungan
Ch C hi squa squared
3.8435 29 1.88750 9 0.221857 1.75066 0.562592 1.37474 2 0.926499 0.562592 0.225908 1.913741 3.916813 3.8435 29
20.96755
Tabel abel 7.2 Per hitunga itungan sta statistik data diskrit : (a) (a) Tabul abulaasi da data; ( b) ( b) Per hitunga itungan untuk da Nilai x
0 1 2
Frekuensi Frekuensi Pengamata Pengamatan n O(i) O( i)
Frekuensi Frekuensi E(i) E(i) dari Poi Po isson(4.456) sson(4.456)
Nilai x
Frekuensi Frekuensi Pengamata Pengamatan n O(i)3 O( i)3
Frekuensi Frekuensi E(i) E(i) d ari Poi Po isson(4.456)4 sson(4.456)4
Perhit Perhitung unga an 2 {O(i){O(i)-E( E(i)} E(i) i)} -E(i)
0 8 18 20
1.57 9 7.036 15.675 23.282 25.936 23.113 17.165 10. 926 6.086 3.013 1.343 0.846
0 1
0 8 18 20
1.57 9 7.036 15.675 23.282 25.936 23.113 17.165 10. 926 6.086 3.013 2.189
1.579 0.13 21 0.344 9 0.46 27 0.36 20 0.1 932 0.0406 0.0785 0.601 9 0.3406 0.0163
Chi squared:
4.15 2
3 4 5 6 7 8
18 10 8
9
2
10 11+ Total
29 21
1 1 136
2
3 4 5 6 7 8
18 10 8
9
2
10+
2
29 21
Frekuensi har har apan apan da dari nila nilai 11+, dih dihitung se ba se bag gai 136- (jumlah (jumlah dari semua semua frekuensi har har apan apa n lainnya) innya),, adalah kur ang da dari 1. Jumlah Juml ah ba barr kemudia kemudian berkur berkur ang ditunjukk a n pad pada tabel abel 7.2( b) 7.2( b),, untuk mema memastik an bahwa semua semua frekuensi har har apan apan le bi bih bes besaar da dari 1. Hi potesis potesis
Data ber ber asal da dari distri b distri busi usi Poisson
tidak ber ber asal da dari ditri b ditri busi usi Poisson Data tida
Kesim p Kesim pul ulaan
Uji sta statistic memiliki nila nilai 4.152 pa 4.152 pad da tabel abel 7.2( b) 7.2( b).. Terdapa Terdapatt nila nilai der a ja jat ke be be bas basan ( ketik ketik a 1 par par ameter distri b distri busi, usi, mea mea n, ditentuk an da dari data). a). Per hatik hatik an distri b distri busi usi , pelu peluaang bahwa ng bahwa kita kita ak an mendapa mendapatk tk an nila nilai yang tinggi ketik a ben benaar di atas 90%. Ketik a ini adalah p ah pelu eluaang ya yang b ng bes esaar, kita kita tida tidak la laya k menola menolak dan kemudia kemudian menyim pulk pulk an bahwa data sesua sesuai untuk ditri b ditri busi usi Poisson (4.4559) (4.4559).
Contoh Contoh 7.6: Penggunaa Penggunaan n denga dengan da data nonnumeric Perma Permaina inan baru baru telah telah ditemuk an da dan, seh sehu bung bungaan denga dengan itu, perlengk perlengk apan apan ya ya ng seca secar a acak memilih memilih bol bolaa dari drum b drum ber er put putaar. Terdapa Terdapatt jumlah jumlah yang sa sa ma dari b ri bol olaa hita ita m, b m, biru, iru, mer ah, ah, hija ijau da dan puti putih h pad pada drum. Bola ola apapun apapun ya yang di p di pili ilih h, diga digantik an se belum belum seleksi berikutny berikutnyaa. Bola ola ber ber warn warnaa yang b ng ber er bed bedaa ber ber asal da dari pab ri pabrik rik ya yang b ng ber er bed bedaa seh sehingga ingga per per anca ncang p ng perm ermaaina inan ingin mema memastik an bahwa pemili pemiliha han n ben benaar- ben benaar a r acak. Mesin diuji 200 k ali, ditunjukk an pad pada tabel abel 7.3. A pa A pak k ah ah pelu peluaang bahwa ng bahwa b bol olaa menja menja di di p di pili ilih h seca secar a acak?
Tabel abel 7.3 Per hitunga itungan sta statistik data nonnumerik untuk da Warna rna Bola ola
Frekuensi Penga Penga matan O(i) O(i)
Frekuensi Ha Har apan apan E(i) E(i)
Per hitunga itunga n Ch Chi Squa Square {O(i) {O(i)-E(i) -E(i)}2/E(i) E(i)
Hita Hita m Biru Mer ah ah Hija Hijau Putih Putih
51 44 35 40 30 200
40 40 40 40 40
3.0250 0.4000 0.6250 0.0000 2.5000 6.5500
Ini adalah pert nyaan n ya yang ekuiva ekuivalen: apak eluaang bahwa ng bahwa frekuensi bol pertaanyaa apa k ah p ah pelu bolaa berdistri berdistri busi busi ser aga m? Uji dapat apat dih dihitung pa itung pad da frekuensi p frekuensi peng engaamatan da dan mema mema k ai frekuensi har har apan apa n dari , ditunjukk an pad pada tabel. abel.
Hi potesis potesis
Bola ola berdistri berdistri busi busi seca secar a acak
ola tida tidak berdistri berdistri b busi usi seca secar a acak Bola
Ke putus putusaan
Uji sta statistic memiliki nila nilai 6.44 pad pada tabel abel 7.3. Terdapa Terdapatt der a ja jat be be bas bas ( ketik ketik a tida tidak a k ada par par a meter distri b distri busi usi ya yang di b di butu utuh hk an untuk ditentuk a n dari data). a). Per hatik hatik an pad pada distri b distri busi usi , pelu peluaang bahwa kita kita ak an memiliki nila nilai yang tinggi untuk ketik a ben benaar kur ang da d ari 20%, seh se hingga ingga kita kita dapat apat layak menola menola k dan kemudia kemudi an sim pulk pulk an bahwa bol bolaa tida tidak di pili pilih h seca secar a acak.
7.4.3 Statistik Kolmogorov-Smirnov(K-S) Kolmogorov-Smirnov(K-S) K-S sta statistic didefinisik an se bag bagai berikut berikut
Dima Dimana diketah diketahui ui se bag bagai ja jar ak K-S N = jumlah jumlah tota total titik da data F(x) F(x) = Fungsi distri b distri busi usi da dari fitted ri fitted distrib distri bution = Percentil kumul kumulatif da dari tiap tiap titik da data i = Tingk at kumula kumulatif da dari titik da data Jadi, Sta Statistik K-S hany hanyaa terk ait denga dengan ja jar ak vertica vertical anta ntar a fungsi distri b distri busi usi kumula kumulatif pad pada fitted distrib distri bution dan distri b distri busi usi kumula kumulatif da dari da data. Ga Gam bar bar 7.6 mengilustr asik an konse p konse p dari fitted ri fitted data untuk distri b distri busi usi ser aga m(0,1) m(0,1).
Gamb Gambar 7.6 Perhitungan Jarak Kolmogorov-Smirnov untuk data fit pada distrib distribusi Seragam (0,1) y y
Data dia diatur da dala m uruta urutan mena menaik Persentil kumula kumulatif bagi bagiaan atas berikut: berikut:
bagiaan bawah dan bagi
dihitung se ba se bag gai dih
Di ma ma na i = tingk atan da dari titik da data dan n = jumlah jumlah tota total titik da data
y y
dih dihitung untuk distri b distri busi usi ser aga m (da (dalam hal hal ini
Jar ak ma maksimum anta ntar a
dan
dih dihitung untuk tiap tiap :
Di ma ma na y
mendapa mendapatk tk an nila nilai absolut absolut
Nila Nilai ma ma ksimum da dari ja jar ak sela selanjutnya njutnya adalah jar ak K-S :
Sta Statistik K-S bi biasanya nya le bi bih begun begunaa di bandingk bandingk an sta statistic di mana data dita ditaksir pa ksir pad da semua semua titik da data dan mengh menghinda indari masalah untuk menentuk an ik atan-ik atan untuk mem ba mem bagi gi data. Bag Bagaima imanapun apun nila nilainya inya hany hanyaa ditentuk an oleh oleh salah satu nila nilai yang memiliki ketida ketidakcocok an yang ter bes besaar da n tida tidak menga menga m bil bil lapor apor an dari lack(kekur anga ngan) dari fit melewa melewati ti ditri b ditri busi usi sisa sisa. Denga Denga n demikia demikian, pad pada ga m bar bar 7.7, ak an mem b mem berik erik an fit ter buruk buruk pad pada distri b distri busi usi pad pada (a) yang memiliki sa satu ketida ketidakcocok an ter bes besaar dis ba dis banding nding distri b distri busi usi pad pada ( b) yang memiliki gener al fit ya yang b ng buruk uruk di atas ja jar ak-x keseluruha keseluruhan. n.
Jar ak vertica vertical anta ntar a distri b distri busi usi yang dia dia mati dan teoritis ditri b ditri busi usi fitted pad pada semua semua titik, k atak a nlah nlah , itu sendiri memiliki distri b distri busi usi denga dengan r ataan aan dari nol da da n sta standa ndar devia deviasi yang di b di berik erik an denga denga n
Gamb Gambar 7.7 Bagaimana jarak jarak K-S dapat memb mem berikan ukuran fit yang salah karena kepercayaannya pada jarak tunggal paling b paling besar antara 2 distrib distri busi kumulatif dib dibanding melihat jarak di luar range yang mungkin: (a) distrib distri busi umumnya good fit kecuali di salah satu area tertentu; ( b ( b ) distrib distribusi umumnya poor fit tetapi dengan tidak satupun ketidakcocokan yang besar
Ukur an da dari sta standa ndar devia deviasi di lua luar ja jar ak x ditunjukk an pad pada ga m bar bar 7.8 untuk sejumlah sejuml ah ti pe pe distri b distri busi usi denga dengan . Posisi se panj panjaang sum bu-x bu-x le bi bih mungkin terja terjadi di ma mana paling paling bes besaar yang, ga ga m bar bar 7.8 tunjukk an, ak an bi biasanya nya kelua keluar dari dasar pa r pangk ngk al pro pro bab babilit ilitaas. Ketida Ketidaksensitif an dari sta statistic K-S ini pad pada lack(kekur anga ngan) fit pad pada ekstrim dan distri b distri busi usi adalah b ah ben enaar untuk sta st atistic Da Darling-Anderson.
Contoh Contoh 7.7: Penggunaa Penggunaan n Sta Statistik K-S
Tabel abel 7.4 mengilustr asik a n per per hitunga itungan jar ak dari sta statistic K-S untuk 12 ukur an dari persent persentaase oksigen ya y ang diha dihancurk ncurk an pad pada eks p eks perimen erimen biokimi biokimiaa. Data diuji pad pada distri busi busi Beta eta(16,45) (16,45) yang mana analisis se b se belumny elumnyaa menya menyatak an bahwa, bahwa, seha se harusny rusnyaa good fit . Proses per per hitunga itungannya nnya se bag bagai berikut. berikut.
Gamb Gambar 7.8 Variasi standar deviasi dari Statistik K-S K-S di luar range dari ber bagai distrib distribusi. Standar deviasi leb lebih besar, kesempatan leb le bih bahwa akan jatuh pada bagian range, yang menunjukkan menunjukkan bahwa statistic K-S akan cenderung focus pada derajat fit pada nilai x keluar dari ujung distri busi
Tabel abel 7.4 Per hitunga itungan Ja Jar ak K-S untuk contoh contoh 7.7
i
Data Pengamatan
Batas Bawah F(i)
Batas Atas F(i)
F(x) untuk Beta (16,45)
1 2 3 4 5 6 7 8 9 10 11 12
16.60% 19.75% 23.26% 25.17% 25.85% 27.38% 27.95% 29.49% 29.83% 31.20% 34.57% 39.87%
0.000 0.083 0.167 0. 250 0.333 0.417 0.500 0.583 0.667 0.750 0.833 0. 917
0.083 0.167 0. 250 0.333 0.417 0.500 0.583 0.667 0.750 0.833 0. 917 1.000
0.033 0.1 20 0.311 0.443 0.4 91 0.5 98 0.636 0.7 28 0.747 0.814 0. 925 0. 988
0.051 0.046 0.145 0.1 93 0.158 0.181 0.136 0.145 0.081 0.064 0.092 0.07 2
y
Data diurutk an mena menaik (a (ascending) scending)
y
Persentil kumula kumulatif bat batas atas
batas bawah dan bat
dihitung se ba se bag gai berikut: berikut: dih
Di ma ma na ABS(«) S(«) adalah nila nilai absolute. absolute.
y y
dih dihitung untuk distri b distri busi usi Beta eta mengguna menggunak an fungsi Excel BETADIST() ETADIST().
Nila Nilai ma ma ksimum da dari ja jar ak adalah jar ak sela selanjutnya njutnya dari K-S Pada contoh contoh ini, data ke-4, dita ditanda ndai denga dengan persegi itam pad pad pada titik da persegi hita pada gr afik pa fik pad da ga m bar bar 7.9.
Ga m bar bar 7.9 Mengh Menghitung ja jar ak K-S untuk contoh contoh 7.7
7.4.4 Statistik Anderson-Darling (A-D)
Sta Statistik A-D
didefinisik an se bag bagai :
Di ma ma na
n = jumlah jumlah bany banyaaknya knya titik da data F(x) = fungsi ditri b ditri busi usi da dari fitted distri b distri bution ution f(x) = fungsi ke pa ke pad datan da dari fitted distri b distri bution ution
i = tingk atan kumula kumulatif da dari titik da data Sta Statistik Da Darling-Anderson adalah versi ca canggih nggih dari sta statstik K-S da dan le bi bih kua kuat denga dengan alas an berikut berikut : y
y
y
mengga mengganti kerugia kerugian untuk p untuk peningk eningk atan va varia riansi da dari ja jar ak vertica vertical anta ntar a distri b distri busi usi , ya yang diga diga m bark bark an pad pada bagi bagiaan 7.4.3 da d an ga ga m bar bar 7.8
Jar ak vertica vertical anta ntar a distri busi busi adalah kua kua dr atik, mengga mengganti kerugia kerugia n da dari p ri peru eru bahan bahan pad pada varia riansi (va (varia riansi menja menja di kua kuadr at da dari sta standa ndar devia deviasi) si).
menim bang bang ja jar ank peng pengaa matan mengguna mengguna k an pelu peluaang nila nilainya inya ak an mengha menghasilk silk a n nila nilai-x
y
Jar ak vertica vertical diintegr asik a n di atas semua semua nila nilai da dari x ri x untuk mem b mem bu uat penggun penggunaa aan n ma ksimum pa ksimum pad da data peng pengaa matan (sta (st atistic K-S terliha terlihatt hany hanyaa pad pada jar ak vertica vertical ma ksimum) ksimum).
Oleh Oleh k arena rena itu sta statistik A-D b A-D biiasanya nya le b le biih bergun bergunaa mengukur fit d fit dari pa ri pad da sta statistik K-S k hususnya ususny a ketik a sanga ngat penting penting untuk menem pa menem patk tk an penek penek anan ya yang sa sa ma dala m menyesua menyesuaik an distri b distri busi. usi. Sela Selain itu, sta statistic A-D sa sanga ngat pr pr aktik al untuk mengh menghitung ma manua nual. Bag Bagaima ima napun, apun, pa paket ket softwa soft ware re se p se perto erto BestFit ak an mena mena m pilk pilk a n per per hitunga itungan seca secar a automa utomatic.
7.4.5 Menggunakan statistik Godness-fit untuk mengoptimalkan Distribution Fitting
Godness-of-fit sta st atistic dapa dapatt diguna digunak an denga dengan solusi linea linear untuk menemuk an par par a meter yang mengha menghasilk silk an fit terdek at da dari se bu buah distri b distri busi usi denga dengan da data peng pengaa matan. Ga Ga m bar bar 7.10 mengilustr asik a n hasil hasil da dari contoh contoh seder han hana pad pada Microsoft Excel.
fit t er i busii dengan mengopti l kan Gam ar 7.10 Menemukan paramet parame t er er fit t er aik unt unt uk uk d i t r ribus mengop tima mal kan st st ati sti stikk goodness-o f 2 fit (da fit (dal l am am hal hal iini X )
Prosesnya sebagai sebaga i ber i y
Para M
t:
dar i distr i busi busi dilengkap ilengkapii (at (atau k ira wa jar jar unt untuk paramet parameter pali pa ling ng cocok)
dite itetapkan. M
p unt untuk di distr i busi busi geomet geometr ik di di ber ber ikan ol oleh
titik dat Dimana adal adalah rat rata-rat a-rata dar i titik data. y
spreadsheet spreadsheet adal ada lah ter tulis lis yang menghit menghitung ung st statis tistik tik kebai keba ikan ka n-of-f of- f it it yang rel relevan 2
(dal (dalam hal ha l ini kasus X )Dengan M
(menggunakan gambar member ikan at atas)
di pl played di di sel sel terpi erpisah (dal (da lam C 2 kasus) bahwa pada st statis tistik tik
perhit perhitungan ungan nil nilaai meru juk juk
yang j yang juga uga dit ditamp ampil ilkan kan di di sel sel terpi erpisah (E11 pada cont contoh ini).
7.5 PL PL T GOODNE GOODNE
OF-FIT OF-FIT
Plot Goodness-of-f it Goodness-of-f it member ikan anali ana lissis perbandi perbandingan vi visual ual ant antara dat data dan di distr i busi busi f it it yang dil dilengkap engkapii gambaran kesel keseluruhan kesal kesa lahan dengan cara bahwa st s tatis tistik tik goodness-of-f it it tidak tidak dapat dapat dan memungk inkan anali ana liss untuk memili memilih h distr i busi busi yang pali paling ng cocok yang lebi ebih kualit kua litaatif tif dan intuitif. itif. 7.5.1 Perbandi Perbandingan kepadatan probabili probabilitas tas
Over lay plot histogram dar i dat data dengan fungsi fungs i kepadat kepadatan dar i distr i busi busi di pasang pasang bi biasanya perbandi perbandingan pali pa ling ng informati nformatiff (liha lihatt Gambar 7.11 (a)) Sangat Sanga t mudah unt untuk meli meliha hatt di mana perbedaan ut u tama dan apakah bent ben tuk umum dar i dat datayang digunakan. membandi membandingkan di distr i busi busi skal skala yang sama bai ba iknya.The dan j dan jum umllah bar hi histogram harus
diguna digunak an untuk semua semua plot plot jik a per per banding bandingaan langsung da dari be be ber ber apa apa distri busi busi cocok ak an dila dilakuk an untuk da data yang sa sa ma.
Gamb Gambar 7.11(a) Contoh plot goodness-of-fit: Per bandingan kepadatan peluang untuk Input dan Distri Distrib busi Normal;
7.5.2 Perbandingan Distribusi Probabillity
Se bu buah overla overlay plot plot frekuensi kumula kumul atif da data dan distri b distri busi usi di pa di passang k adang-k adang diguna digunak an (liha (lihatt ga g a m bar bar 7.11 ( b) ( b).. Na Na mun p mun plot lot ini memiliki sk ala yang sa sanga ngat sensitif dan frekuensi kumula kumul atif jenis distri b distri busi usi ya yang paling paling mengikuti jenis ya y ang sa sanga ngat miri p miri p kurva kurvaS.Th S.This dari plot plot k arena rena itu hany hanyaa ak an muncul per per bed bedaa aan n yang sanga ngat bes besaar anta ntar a data the b da n distri b distri botions otions di pa di passang dan umumnya umumnya tida tidak direkomenda direkomendasik an se bag bagai ukur an visua visual ke baik baik an fit.
Gamb Gambar 7.11( b ) Per bandingan Peluang kumulatif untuk input dan distri busi Normal;
7.5.3 Perbedaan antara Densitas probabilitas
Plot ini ber ber asal dari per per banding bandingaan ke pad padatan pro pro bab babilit ilitaas, di atas, mengga mengga m bark bark a n per per bed bedaa aan n anta ntar a ker apat apatan pro pro bab babilit ilitaas (liha (lihatt Ga Ga m bar bar 7.11(c)) 7.11(c)).. Ini memiliki sk ala jauh le b le biih sensitif di ba di bandingk ndingk an denga dengan plot plot la lain dijela dijelask an ukur an here.Th ere.The dari penyim penyim pang pangaan juga juga meru pak pak a n fungsi da dari jumlah jumlah kela kelas ( bar bar ) guna gunak an untuk p untuk plot lot uruta urutan histogr a m.In untuk mem b mem bu uat per per banding bandingaan langsung anta ntar a fungsi distri b distri busi usi ya yang lain cocok mengguna menggun ak an jenis plot, plot, analis harus harus mema memastik an bahwa jumlah jumlah ya ng sa sa ma dari kela kelas Histogr a m diguna digunak an untuk p untuk plots. lots.
Gamb Gambar 7.11(c) Per bandingan kepadatan peluang u ntuk Input dan Distri Distrib busi Normal;
7.5.4 Probabilitas-probabilitas (P-P)
Ini adalah p ah plot lot da dari distri b distri busi usi kumula kumulatif F kurva kurva di pa di passang (x) (x) ter had hadap frekuensi kumula kumul atif
untuk semua semua nila nilai
(liha (lihatt ga m bar bar 7.11 (d)) (d )).. Pencocok a n ter baik, baik, sema sema kin
dek at denga dengan plot plot ini ya yang menyeru pa menyeru paii ga garis lurus lurus da d an dapa dapatt bergun bergunaa jik a salah satu terta tertarik pa rik pad da pencocok pencocok a n er at persentil persentil kumula kumulatif da dan ia ak an mena mena m pilk pilk an per per bed bedaa aan n yang signifik an anta ntar a Pertengaha Pertengahan n dari distri b distri busi. usi. Bag Bagaima imanapun apun,, plot plot ya yang jauh le bi bih
pek pek a ter had hadap per per bed bedaa aan n da dala m fit da dari pa ri pad da per per banding bandingaan pro pro bab babilit ilitaas ke pa ke pad datan plot plot da dan k arena rena itu tida tidak sering diguna digun ak an dan juga juga bis bisaa agak mem b mem bingungk ingungk an bil bilaa diguna digunak a n untuk memeriksa memeriksa data diskrit ya yang cocok da da n cuku p cuku p baik baik dapat apat denga dengan mudah mudah ditutu p ditutu pi, i,
teruta teruta ma jik a hany hanyaa ada be be ber ber apa apa diijink an nila nilai-x.
Gamb Gambar 7.11(d) Plot P-P memb mem bandingkan Input dan distrib distri busi Normal;
7.5.5 Kuantil-Kuantil (Q - Q) Plot
Ini adalah plot plot da dari data yang dia dia mati
ter had hadap nila nilai-nila i-nilai x dima dima na
(lihatt ga m bar bar 7.11 (e)) (e)).. Se p Se perti erti plot plot P-P, pencocok pencocok an yang le bi bih baik, baik, (liha
yang le b le biih dek at denga denga n plot plot ini menyeru pa menyeru paii garis lurus. Plot ini dapa d apatt berm bermaanf aat aat jik a ada ya ng cuku p cuku p terta tertarik pa rik pad da pencocok pencocok an persentil persentil kumula kumulatif da dan ia ak an mena mena m pilk pilk a n
per per bed bedaa aan n yang signifik an anta ntar a ujung da dari distri b distri busi. usi. Bag Bagaima imanapun apun,, plot plot ini mem berik berik an ma masalah insensitivita insensitivit as sa sa ma denga dengan pet petaak P-P plot. plot.
.
Gamb Gambar 7.11(e) Plot Q-Q memb mem bandingkan Input dan D dan Distri istrib busi Normal;