BAB I PENDAHULUAN Statistika adalah sekelompok konsep dan metode untuk merencanakan, mengumpulkan informasi (data), mengolah atau menganalisis dan kemudian mengambil kesimpulan dalam situasi dimana ada ketidakpastian dan variasi. 1.1. Metode Statistik
Metode Statistik diklasifikasikan menjadi dua, yaitu : 1.
Statistik Deskriptif (Statistik Deduktif) Statistik deskriptif, yaitu statistik yang menggambarkan kegiatan yang berupa pengumpulan data, penyusunan data, pengolahan data dan penyajian dalam bentuk tabel, grafik, atau diagram agar memberikan gambaran yang teratur, ringkas dan jelas mengenai suatu keadaan atau peristiwa. Statistik deskriptif terdiri dari : a. Distribusi frekuensi yaitu penyusunan data dari nilai terkecil sampai nilai terbesar kemudian disajikan dalam bentuk tabel atau diagram. b. Ukuran tendensi sentral terdiri dari mean, median, modus, kuartil dan presentil. c. Ukuran penyebaran terdiri dari rentangan(rank), varians dan simpangan baku.
2.
Statistik Inferensia (Statistik Indukstif) Statistik Inferensia merupakan statistik yang berhubungan dengan kegiatan penarikan kesimpulan yang bersifat umum dari data yang telah disusun dan diolah. Hal yang berhubungan dengan dengan statistik inferensia diantaranya adalah : a. Melakukan penaksiran tentang karakteristik populasi dengan menggunakan data yang diperoleh dari sampel. b. Membuat prediksi atau ramalan tentang masalah untuk masa yang akan datang. c. Menentukan ada tidaknya hubungan antar karakteristik. d. Menguji hipotesa. e. Membuat kesimpulan secara umum mengenai populasi.
1.2. Kegunaan Statistik
Kegunaan Statistik diantaranya adalah sebagai berikut : 1.
Membantu peneliti dalam menggunakan sample sehingga peneliti dapat bekerja efisien dengan hasil yang sesuai dengan objek yang ingin diteliti.
2.
Membantu peneliti dalam membaca data yang telah terkumpul sehingga peneliti dapat mengambil keputusan yang tepat.
3.
Membantu peneliti untuk melihat ada tidaknya perbedaan antara kelompok lainnya atas objek yang diteliti.
4.
Membantu peneliti untuk melihat ada tidaknya hubungan antar variable yang satu dengan yang lainnya.
5.
Membantu peneliti dalam melakukan prediksi untuk waktu yang akan datang.
6.
Membantu peneliti untuk melakukan interpretasi atas data yang terkumpul.
1.3. Data
Data adalah sejumlah informasi yang dapat memberikan gambaran gambaran tentang suatu keadaan atau masalah baik yang berupa angka maupun kategori seperti : baik buruk, tinggi, rendah dan sebagainya. Syarat data antara lain lai n : 1.
Objektif yang berarti data tersebut menggambarkan keadaan sebenarnya.
2.
Relevan dengan permasalahn yang diteliti.
3.
Sesuai jaman (up (up to date) date) sebab perubahan waktu dan teknologi dapat mengakibatkan kejadian mengalami perubahan dengan cepat.
4.
Representative terhadap populasinya
5.
Sumbernya tepat dan dapat dipercaya.
Selanjutnya data dapat diklasifikasikan berdasarkan sifat, cara memperoleh, dan skala pengukuran sebagai berikut :
Tabel 1.1. Klasifikasi Data Kate gori
Sifat
Data
Kua Kualitat litatif if
Data yang yang tida tidak berb berbent entuk uk ang angka ka..
Kuantitati f
Data yang be rb rbe nt ntuk angka Data diperoleh dari pengumpulan sendiri.
Primer Cara memperoleh
Skala pegukuran
Penge rtian
Contoh
Kualitas absorpsi absorpsi glycol terhadap moisture Produksi sa sal es es gas hari an an Data pengujian sumur sembur alami
Sekunder
Data yang diperoleh dari pihaklain (suatu organisasi atau perusahaan) Data elektrifikasi KESDM dalam bentuk data yang sudah jadi.
Nominal
Data yang sifatnya hanya membedakan.
Status cadangan minyak bumi (proven, probable, possible)
Ordinal
Data yang dapat membedakan dan mengurutkan.
Menurutkan fosil berdasarkan umur geologi.
Interval
Data yang jaraknya sama tetapi tidak mempunyai mempunyai nol absolute (artinya walaupun datanya nol tetapi masih mempunyai mempunyai ni lai).
Temperature (deg C) yang masih memiliki nl ai dalam kondisi 0 deg C
Rasio
Data yang jaraknya sama dan mempunyai mempunyai nol absolute (artinya jika datanya nol maka nilai datanya tidak mempunyai arti).
Weight On Bit yang harus dinol-kan sebelum mulai operasi drilli ng atau WO/WS.
1.4. Populasi dan Sample
Populasi adalah
keseluruhan objek penelitian yang terdiri dari manusia, manusia, benda, hewan,
tumbuhan, gejala, nilai test atau peristiwa sebagai sumber data yang mewakili karakteristik tertentu dalam suatu penelitian. Berdasarkan sifat populasi digolongkan menjadi : 1.
Populasi Homogen Populasi homogen merupakan sumber data yang unsurnya mempunyai sifat yang sama sehingga tidak perlu mempersoalkan jumlahnya secara kuantitas.
2.
Populasi Heterogen Populasi heterogen adalah sumber data yang unsurnya memiliki sifat atau keadaan bervariasi sehingga perlu ditetapkan batasannya baik secara kualitatif maupun kuantitatif.
Sampel adalah sebagian dari jumlah dan karakteristi k yang dimiliki oleh polulasi tersebut.
1.5. Teknik Sampling
Teknik sampling merupakan suatu teknik atau cara mengambil sample yang representative dari populasi. Ditinjau dari pengambilan sampelnya, ada beberapa metode sampling, yaitu : 1.
Simple Random Sampling Jika suatu sampel dengan n elemen dipilih dari suatu pupulasi N elemen sehingga setiap kemungkinan sampel dengan n elemen mempunyai kesempatan yang sama untuk dipilih.
2. Proportionate Stratified Random Sampling Dalam metode ini, langkah pertama adalah populasi dikelompokkan dalam beberapa kelompok agar lebih homogen, kemudian dari masing-masing kelompok diambil sampel berukuran tertentu ( secara proporsional ) secara acak seperti pada metode pertama. 3.
Cluster Sampling Cluster sampling ialah sampel simple random dimana setiap sampling unit terdiri dari kumpulan atau kelompok elemen seperti bidang tanah terdiri dari beberapa petak tanah.
1.6. Pengenalan Minitab 18
Minitab merupakan program komputer yang dirancang untuk melakukan pengolahan stati stik. Minitab mengombinasikan kemudahan penggunaan layaknya Microsoft Excel dengan kemampuannya melakukan analisis statistik yang kompleks. Minitab dikembangkan di Pennsylvania State University oleh peneliti Barbara F. Ryan, Thomas A. Ryan, Jr., dan Brian L. Joiner pada tahun 1972. Minitab memulai versi ringannya OMNITAB, sebuah program analisis statistik oleh NIST. Pada laman awal minitab terdapat dua window, yaitu session dan worksheet. Session merupakan tempat untuk menampilkan semua perintah (command) yang telah dilakukan dalam bentuk program dan hasil dari pengolahan data yang tidak dapat ditampilkan dalam worksheet. Sedangkan worksheet sendiri adalah tempat untuk menginput data serta menampilkan hasil pengolahan data. Kegunaan Minitab: 1. Mengelola data dan file - spreadsheet untuk analisa data yang lebih baik. 2. Analisa regresi 3. Power dan ukuran sampel 4. Tabel dan grafik
5. Analisa multivariat – termasuk analisa faktor, analisa klaster, analisa korespondensi dan lainnya 6. Tes Nonparametrik - berbagai tes termasuk tes signal, run tes, friedman tes, dan lainnya 7. Time Series dan Forecasting – membantu menunjukkan kecenderungan pada data yang dapat digunakan untuk membuat dugaan. Time series plots, exponential smoothing, dan trend analysis. 8. Statistical Process Control 9. Analisa sistem pengukuran 10. Analisa varians - untuk menentukan perbedaan antar data.
Gambar 1.1 Tampilan Window dalam Minitab
Dalam minitab ini terdapat 11 menu bar beserta submenu diantaranya adalah : 1. File
Dalam menu file terdapat submenu file yang digunakan untuk membuka file, menginput data, menyimpan pekerjaan, dan lainnya seperti berikut ini.
Tabel 1.1. Fungsi Submenu File Submenu
New
Fungsi
Membuat Project atau Worksheet baru.
Open
Membuka project minitab, worksheet, graph yang telah disimpan.
Save Project
Menyimpan project minitab yang telah dikerjakan.
Save Project As
Menyimpan project minitab dengan nama yang berbeda atau tempat penyimpanan yang berbeda.
Save Session Window As Query Database (ODBC) Print Session Window
Menyimpan konten dari window yang aktif. Mengimport data dari file database. Mengeprint konten dari wi ndow yang aktif.
Print Setup
Mengatur ukuran kertas, halaman, dan printer yang akan digunakan.
Description
Menambah atau mengedit deskripsi dalam project yang dikerjakan.
Exit Recent Files
Keluar dari aplikasi mini tab. Tempat memilih file yang baru dikerjakan.
Gambar 1.1. Submenu File
2. Edit
Menu edit dalam minitab menyediakan fungsi-fungsi editing yang digunakan dalam proses pengolahan data. Tabel 1.2. Fungsi Submenu Edit Submenu
Fungsi
Undo Redo Clear Delete Copy Cut Paste
Mengembalikan pe kerjaan sebelumnya.
Worksheet Link
Memindahkan data yang telah disalin baik dari sel, atau file minitab atau word, excel, dan lain-lain.
Select All
Memili h atau menyorot semua data pada sel-sel untuk pengolahan
Edit Last Dialog
Mengedit dialog terakhir
Command Line Editor
Mengeksekusi perintah secara cepat atau mengekseksekusi ulang atau mengedit pe rintah yang digunakan pada sesi sebelumnya.
Membatalkan operasi undo. Menghilangkan nil ai dari area yang sudah diblok. Menghapus area yang sudah dipil ih. Menyalin pekerjaan yang dipilih. Menyalin dan menghapus pekerjaan yang dipil ih. Menampilkan pekerjaan yang di-copy atau di-cut.
Gambar 1.2. Submenu Edit
3. Data
Dalam menu data menampilkan submenu-submenu yang berfungsi mengoperasikan worksheet atau data yang sedang dijalankan. Tabel 1.3. Fungsi Submenu Data Submenu
Subset Worksheet Split Worksheet Merge Worksheet
Fungsi
Menampilkan se bagian worksheet. Membagi worksheet menj adi beberapa worksheet. Menggabungkan beberapa worksheet.
Unstack Columns
Memisahkan data pada satu kolom menjadi beberapa kolom berdasarkan kriteria tertentu.
Stack
Menggabung data pada kolom yang berbeda menjadi satu kolom.
Transpose Columns
Mengubah data kolom menjadi baris dan juga sebaliknya.
Sort Rank Delete Rows Erase Variables Recode Change Data Type Date/Time Concatenate Display Data
Mengurutkan data (mengurutkan suatu kolom berdasarkan kolom lainnya). Merangking data (membuat rangking suatu kolom). Menghapus baris. Menghapus variabel-variabel. Mengkonversi data (numerik ke numerik, numerik ke teks dsb) . Mengubah tipe data. Menginput data waktu. Menggabung dua atau lebih kolom yang berisi data text menjadi satu kolom, syarat penjang kolom sama. Menampilkan data.
Gambar 1.3. Submenu Data
4. Calc
Menu calc menyediakan submenu yang dapat digunakan untuk memasukkan formula, menampilkan distribusi peluang, atau membuat data berpola maupun acak. Tabel 1.4. Fungsi Submenu Calc Submenu
Calculator Columns Statistics Row Statistics Standardize Make Patterned Data
Fungsi
Untuk mel akukan perhitungan (penjumlahan, perkalian, pembagian, sinus, maksimum, eksponen, dan l ain-lain) Menghitung ukuran-ukuran statistik dari suatu kolom Menghitung ukuran-ukuran statistik dari suatu baris Menormalisasikan data Membuat suatu kolom(data) de ngan pola tertentu
Make Mesh Data
Membuat sebuah fungsi dua dimensi seperti permukaan berdasarkan pasangan nilai x dan y
Make Indicator Variables
Membuat variabel dummy untuk data kualitatif
Set Base Random Data Probability Distributions Matrices
Menetapkan titik awal untuk pembangkitan data acak. Bila kita tidak mengeset titik tersebut, maka titik tersebut akan ditentukan oleh minitab. Membangkitkan data acak dari berbagai di stribusi Menghitung peluang dan di stribusi kumulatif pe luang dan inversnya dari berbagai distribusi pel uang. Menghitung matriks dan operasi-operasinya
Gambar 1.4. Submenu Calc
5. Stat
Submenu-submenu dalam menu stat memungkinkan untuk menampilkan statistika deskriptif, analisis regresi, reliabilitas, analisis varian, dan lainnya. Tabel 1.5. Fungsi Submenu Stat Submenu
Basic Statistics Regression ANOVA DOE
Control Charts Quality Tools Reliability/Survival Multivariate Time Series Tables Nonparametrics Equivalence Test Power and Sample Size
Fungsi
Menunjukkan ukuran-ukuran statistika de skriptif, uji hipotesis, correlation, covariance, penentuan proporsi sample, dan uji normalitas. Menganalisis persamaan regresi baik lini er maupun non lini er untuk kuantitatif atau kualitatif. Menganalisis perbedaan varian. Menguji pengaruh variabel input terhadap variabel output yang dapat didesain secara screening, faktorial, response surface, mixture, dan taguchi. Memberikan penil aian stabilitas proses be rdasarkan nilai statistik untuk mengetahui variabel yang dapat dikendalikan. Melakukan analisis kapabilitas berdasarkan variabel control. Menampilkan probabilitas suatu unit yang terjadi pada periode tertentu. Menganalisis data dengan banyak varian. Menganalisis data waktu untuk peramalan. Membuat tabel kontingensi dan analisi s korespondensi. Menganalisis data kualitatif tanpa asumsi distribusi tertentu. Menguji e quivalensi data. Menghitung peluang menolak Ho ketika salah dan perbedaan minimum sebagai nilai proporsi alternatif pada uji proporsi.
Gambar 1.5. Submenu Stat
6. Graph
Di dalam menu bar Graph terdapat banyak graphic yang dapat digunakan unuk menunjukkan atau menganalisis suatu data seperti histogram, scatter plot, box plot, contour, stem and leaf diagram, serta grafik-grafik tertentu yang ditampilkan dalam dua atau tiga dimensi.
Gambar 1.6. Submenu Graph
7. Editor
Sub menu editor berbeda untuk setiap window yang aktif. Berikut ini adalah sub menu editor pada worksheet. Tabel 1.7. Fungsi Submenu Editor Worksheet Submenu
Fungsi
Find and Replace Sort Columns Cell Properties Format Column
Menemukan atau mengganti data dalam workshee t. Mengurutkan data dari yang terbesar atau terkecil. Memberikan highlight atau komentar pada cell .
Column Properties Conditional Formatting Formulas Subset Worksheet Worksheet Properties Insert Cells Insert Rows Insert Columns Move Columns
Memberikan format tertentu dalam kolom. Mengoperasikan kolom dengan menyembunyi kannya, mengatur ukuranya, atau mendeskripsik annya. Mengondisikan format-format tertentu pada kolom tersebut. Memasukkan formula dalam k olom. Menganalisis data dengan banyak varian. Memberikan deskrips pada worksheet yang aktif. Menambahkan cell . Menambahkan baris di atas baris yang dipili h. Menambahkan kolom Memindahkan kolom ke l okasi tertentu.
Gambar 1.7. Submenu Editor Worksheet
Sub menu editor pada Session adalah sebagai berikut : Tabel 1.8. Fungsi Submenu Editor Session Submenu
Next Command Previous Command Expand All Collapse All Show Command Line Add Note Delete Note Decimal Place Zoom
Fungsi
Memindahkan kursor ke command berikutnya. Memindahkan kursor ke command sebelumnya. Menampilkan session yang tersedia. Menyebunyikan table pada session. Menampilkan bahasa pemrograman yang akan dieksekusi. Menambahkan catatan pada session yang tel ah muncul. Mengahapus catatan pada sessi on. Penempatan desimal. Membesarkan atau mengecilkan tampilan tiap session.
Gambar 1.8. Submenu Editor Session
8. Tools
Menu tools berguna untuk menyediakan penyesuaian dalam toolbar, menu bar, hinggga proteksi project minitab yang dikerjakan. Tabel 1.9. Fungsi Submenu Tools Submenu
Quality Trainer Run an Exec Toolbars Status Bar Customize Options Manage Profiles File Security
Fungsi
Mengakses E-Learning untuk mempelajari analisis data statistik dengan miniab. Menjalankan file exec yang memuat command session minitab. Memunculkan toolbar tertentu untuk memudahkan pengoperasian minitab. Menampilkan atau menyembunyikan status bar yang berada di bawah window mini tab. Menyesuaikan menu, toolbar, pintasan keyboard agar memudahkan operasi minitab. mengubah dan menyimpan standard setting untuk berbagai macam operasi. Mengatur, menyimpan, dan membagikan menu, setting, dan toolbar yang telah dise suaikan. Memproteksi project mini tab dengan password atau hanya bisa dibaca.
Gambar 1.9. Submenu Tools
9. Window
Submenu
yang
terdapat
dalam
menu
window
digunakan
untuk
menampilkan,
menyembunyikan, atau menyusun window yang aktif dalam minitab. Tabel 1.10. Fungsi Submenu Window Submenu
Cascade Tile Minimize All Restore Icons Arrange Icons Refresh Close All Graphs Update All Graphs Now
Fungsi
Memunculkan setiap window yang aktif per layer. Memuncuklkan ke seluruhan window yang aktif. Menutup tampilan window yang terbuka. Membuka semua window yang telah ditutup. Menyusun tampilan icon di dasar window. Menyegarkan semua window yang terbuka. Menutup semua window grafik. Memperbarui window grafik yang datanya diubah.
Gambar 1.10. Submenu Window
10. Help
Dalam menu Help terdapat submenu yang digunakan untuk membantu user ketika mengalami kesulitan dalam mengoperasikan minitab. Submenu ini menghubungkan user ke tutorial web minitab atau laman petunjuk penggunaan minitab.
Gambar 1.11. Submenu Help
11. Assistant
Submenu dalam ini menu Assistant memudahkan user untuk memilih metode analisis yang tepat dalam pengaplikasiannya terhadap data yang dimiliki user. Pemilihan metode-metode tersebut sangat informatif dan mudah dipahami karena dalam bentuk flow chart.
Gambar 1.12. Submenu Assistant
BAB II STATISTIKA DESKRIPTIF Dalam penyajian statistika deskriptif terdapat beberapa ukuran statistik seperti ukuran pemusatan, ukuran penyebaran, p enyebaran, dan ukuran letak. Selain itu cara menyajikan data juga dapat dilakukan dalam bentuk grafik histogram, box plot, stem and leaf diagram, beserta analisis hasilnya. 2.1. Ukuran Pemusatan Data
Ukuran pemusatan data adalah nilai tunggal dari data yang dapat memberikan gambaran yang lebih jelas dan singkat tentang pusat data sekaligus merepresentasikan seluruh data yang meliputi mean, median, dan modus.
̅
1. Mean adalah rata-rata dari data dan dinotasikan dengan atau dimana menyatakan rata-rata sampel dan menyatakan rata-rata populasi. Secara umum mean memiliki rumusan sebagai berikut. 2. Median adalah nilai yang membagi suatu gugus data yang telah terurut menjadi 2 bagian yang sama. Median memiliki sifat bahwa di bawah nilai median terdapat 50% data. Cara menentukan median sebagai berikut : Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil ke besar ; besar ;
maka untuk n ganjil, dan untuk n genap,
3. Modus yaitu nilai yang paling sering muncul dalam suatu gugus data Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran pemusatan lainnya karena keakuratannya dalam menentukan nilai tengah suatu gugus data, walaupun ada beberapa kasus yang membuat nilai tengah menjadi kurang tangguh, misalkan ada nilai yang dianggap ekstrim. 2.2. Ukuran Penyebaran
Ukuran penyebaran adalah suatu ukuran yang menyatakan besaran nilai-nilai data berbeda atau bervariasi dengan nilai ukuran pusatnya atau besar penyimpangan nilai-nilai dengan nilai pusatnya. Beberapa ukuran penyebaran penyebaran antara lain :
1. Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum dengan nilai minimum. 2. Variansi adalah nilai tengah dari kuadrat penyimpangan antara
terhadap
̅
.
Variansi merupakan ukuran penyebaran yang sering digunakan dalam statistika inferensia. Variansi dinotasikan S2 untuk sampel dan
2
untuk populasi. Variansi
memiliki rumusan sebagai berikut :
( ̅) ( ̅)
3. Simpangan baku merupakan akar dari variansi.
2.3. Ukuran Letak
̅ ( ) √ ̅ ( ) √
Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian yang sama besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data terletak di bawah Q 1. Q2 sama dengan median. Sedangkan Q 3 memiliki sifat bahwa ¾ data terletak di bawah Q3. Untuk ukuran letak yang lainnya adalah desil, persentil dll. 2.4. Penyajian Grafik
Dalam menyajikan grafik, minitab memiliki berbagai jenis grafik dalam menu Graphs diantaranya adalah: 1. Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya memiliki skala interval atau rasio, maka histogram dapat digunakan untuk menyajikan data. 2. Box plot merupakan bentuk penyajian data yang hanya menggunakan beberapa statistik yang disebut ringkasan lima angka yaitu nilai minimum, Q 1, median, Q 3, nilai maksimum. Pada box plot dapat juga ditentukan adanya pencilan atau tidak. Pencilan yaitu suatu nilai pada data yang yang apabila dibandingkan dibandingkan dengan dengan nilai data yang yang lain tidak konsisten. Pencilan dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar). Untuk menentukan pencilan digunakan rumusan sebagai berikut : Pagar dalam (p)
( )
Pagar luar (P)
( ) ( ) ( )
Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara pagar dalam dan pagar luar. Sedangkan pencilan jauh sekali, bila data di luar pagar luar. 3. Diagram dahan daun daun adalah salah satu teknik penyajian data yang menggunakan data asli secara langsung. Pada dasarnya dalam diagram dahan daun, penyajian data terbagi atas dua kolom yaitu dahan dan daun, dimana dahan berisi data dengan satuan yang lebih besar dari pada kolom daun. Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data dapat berupa simetri, menjulur ke kiri, atau ke kanan. 2.5. Analisis Deskriptif Dengan Minitab 18
Analisis deskriptif adalah analisis yang bertujuan untuk menggambarkan keadaan data. Analisis deskriptif lebih berhubungan dengan pengumpulan data dan peringkasan data serta penyajian hasil peringkasan tersebut. Seperti data yang diperoleh dari sensus, survei, atau pengamatan lainnya yang masih berupa data mentah dan tidak terorganisir sehingga perlu penyajian yang baik dan teratur sebagai dasar pengambilan pengambilan keputusan. Pengolahan data dalam Minitab bisa dilakukan melalui menu Stat. Menu stat menyediakan beberapa metode analisa statistik. Apabila membutuhkan analisa data melalui grafik, kita dapat melakukannya melalui Graph dalam Minitab. Selain kedua menu tersebut, apabila pengguna Minitab akan melakukan perhitungan matematika atau statistik tertentu atau memanipulasi data sesuai dengan kebutuhan, maka kita dapat melakukannya melalui menu Data atau Calc. Output analisa data ditampilkan melalui window session atau disimpan dalam worksheet. Jika melakukan analisis grafik, maka window graph akan menampilkan outputnya. Sebagai contoh dalam operasi statistika desktriptif dengan minitab 18, kali ini menggunakan data score TOEFL dari 100 mahasiswa sebagai berikut :
Tabel 2.1 Score TOEFL Dari 100 Mahasiswa 15.7
16.2
18.2
16.3
17.9
18.1
16.8
17.6
18.1
16.7
16.7
16.0
17.4
17.0
18.6
17.1
14.1
17.5
17.0
17.6
15.6
16.0
17.7
16.1
18.6
15.2
17.1
19.5
17.0
16.9
16.9
16.7
17.3
16.3
17.3
17.0
15.6
15.6
17.9
16.0
17.7
18.2
14.7
17.1
15.2
17.0
17.8
16.1
18.2
16.5
17.7
18.8
14.6
16.5
16.6
15.6
14.9
17.5
16.1
18.5
15.8
16.9
17.3
17.1
15.9
17.1
17.1
16.4
15.6
16.3
Langkah-langkah untuk mengoperasikan minitab 18 untuk penyajian data tersebut adalah : 1. Input data yang tersedia pada
worksheet ke
dalam kolom C1:
Gambar 2.1 Input Data
2. Selanjutnya dari data tersebut kita dapat menyajikan ukuran-ukuran nilai dalam statistika deskriptif dengan cara pilih menu Stat
Basic Statistics
Display
Descritive Statistics. Lalu akan menampilkan window Display Descriptive Statistics.
Gambar 2.2 Display Descritive Statistics
3. Select kolom C1 ke dalam kolom Variables dengan cara klik 2x pada C1 .
Gambar 2.3 Window Display Descritive Statistics
4. Untuk menampilkan nilai-nilai ukuran pilih Statistics pada window Display Descriptive Statistics, lalu tentukan nilai yang ingin ditampilkan :
Gambar 2.4 Ukuran-Ukuran dalam Display Descritive Statistics
5. Selain itu, dalam window Display Descriptive Statistics juga dapat menampilkan grafik dengan cara memilih graphs. Kemudian tentukan jenis grafik yang ingin ditampilkan, lalu klik OK.
Gambar 2.5 Menampilkan Grafik pada Display Descritive Statistics
6. Lalu klik OK pada setiap window yang kemudian menampilkan output berupa grafik histogram beserta kurva kenormalan, boxplot, dan nilai-nilai ukuran statistika deskriptif pada window Session.
Gambar 2.6 Output Hasil Display Descritive Statistics
Selain bentuk penyajian statistika seperti yang di atas, dapat pula dalam berbagai bentuk grafik yang terdapat dalam menu Graphs. Penyajian data dalam bentuk tabel juga dapat dilakukan dalam aplikasi minitab ini dengan cara sebagai berikut : 1. Pilih menu Stat
Tables
Tally Individual Variables yang akan
memunculkan box Tally Individual Variables.
Gambar 2.7 Tally Individual Variables
2. Lalu isi kolom variables dengan select C1 pada window tersebut dan pada kolom Display pilih nilai-nilai yang ingin ditampilkan. (Tabel data variabel juga dapat ditampilkan dalam window worksheet bila Store result diceklis).
Gambar 2.8 Window Tally Individual Variables
3. Klik OK pada window sehingga tabel dengan nilai yang telah ditentukan sebelumnya ditampilkan dalam window Session.
Gambar 2.9 Tabel Frekuensi Data
Dari tabel ini kita dapat melihat frekuensi setiap nilai sekaligus frekuensi kumulatif. Selain itu, tabel ini juga menunjukkan persen frekuensi setiap nilai dan persen frekuensi kumulatif.
BAB III UJI KENORMALAN DATA 3.1. Distribusi Normal
Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik dari suatu distribusi normal disebut kurva normal. Suatu peubah acak X yang distribusinya memiliki penunjaman sama besar ke kanan dan ke kiri disebut peubah acak normal seperti pada gambar 3.1. Persamaan matematika dari distribusi peluang peubah acak normal kontinu bergantung pada dua parameter yaitu
(rataan)
dan (simpangan baku). Dengan demikian
fungsi densitas X dapat dinyatakan oleh
() √
Gambar 3.1 Kurva Distibusi Normal
Sifat-sifat distibusi normal :
( ) ∫ 2. () 3. () () 4. ( ) (( )) 5. Nilai maksimum dari f terjadi pada 6. Titik belok dari f terjadi pada 1.
3.2. Statistik Uji Kenormalan
Dalam statistika parametrik, distribusi normal mendasari beberapa uji statistik. Misal statistik t-student, Fisher, Khai Square, dll. Sehingga dalam pengolahan data statistik, biasanya
diasumsikan data berasal dari populasi yang berdistribusi normal. Ada dua cara untuk melihat kenormalan data yaitu secara visual dan dengan uji statistik. Secara visual dengan menggunakan histogram, dahan daun, box plot, tetapi cara ini bersifat subyektif. Biasanya dengan uji statistik, akan lebih obyektif untuk mengatakan data berdistribusi normal. Ada beberapa statistik uji kenormalan data antara lain : 1. Statistik Shapiro-Wilk W Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik ini merupakan rasio antara dua penduga ragam. Statistik ujinya dinamakan statistik W. Statistik W ini mengukur straightness dari plot quantil-quantilnya. Bila nilai dari W ≤ 1, maka data dikatakan normal. 2. Statistik Anderson-Darling Statistik ini dikembangkan oleh Anderson dan Darling tahun 1954. Statistik Anderson Darling berdasarkan pada fungsi distribusi empirik. Statistik ujinya dinamakan statistik yang merupakan kuadrat dari selisih antara luas histogram dengan luas daerah di bawah kurva normal. Bila nilai P-value ≥ α , maka data berdistribusi normal. Metode uji kenormalan ini biasanya digunakan untuk data berukuran besar. 3. Statistik Kolmogorov-Smirnov Statistik ini menggunakan fungsi distribusi kumulatif dan berdasarkan pada maksimum perbedaan antara dua distribusi, yaitu distribusi normal dengan distribusi data yang diamati. Biasanya digunakan untuk data berukuran ≤ 30. Bila nilai P-value ≥ α, maka data berdistribusi normal. 3.3.
Uji Kenormalan Data Dengan Minitab 18
Contoh kasus dalam hal ini adalah data produksi minyak bumi periode 10 bulan dari 8 lokasi sumur pengeboran seperti dalam tabel berikut : Tabel 3.1 Data Produksi Minyak Bumi Dalam 10 Periode Periode
Well 56
Well 59
Well 66
Well 68
Well 70
Well 77
Well 87
Well 99
1
507
468
500
498
449
513
558
486
2
677
763
738
608
433
460
485
552
3
633
661
420
425
451
345
377
455
4
503
573
571
534
414
575
635
443
5
477
498
466
588
589
547
499
503
6
636
672
597
597
521
576
568
485
7
402
365
582
351
585
622
685
736
8
464
504
501
526
414
471
527
508
9
309
463
390
413
393
581
590
486
10
495
519
482
468
489
392
510
542
Langkah-langkah untuk menguji kenormalan data tersebut dalam minitab adalah : 1. Input data dari tabel tersebut ke dalam kolom C1.
Gambar 3.2 Input Data
2. Kemudian pilih menu Stat
Basic Statistics
Normality Test . Muncul window
Normality Test.
Gambar 3.3 Menu Normality Test
3. Pada window Normality Test, isi box variables dengan kolom C1 lalu pilih metode normality test.
Gambar 3.4 Window Normality Test
4. Klik OK pada window yang akan menampilkan grafik distibusi peluang normal dengan metode Anderson-Darling.
Gambar 3.5 Grafik Distribusi Normal Anderson-Darling
5. Ulangi langkah ke-4 untuk metode Ryan-Joiner (Shapiro-Wilk) dan KolmogorovSmirnov.
Gambar 3.6 Grafik Distribusi Normal Ryan-Joiner
Gambar 3.7 Grafik Distribusi Normal Kolmogorov-Smirnov
Pada metode Anderson-Darling, nilai P-value yang diperoleh sebesar 0.286. Nilai ini lebih besar dari nilai α = 0.05 dengan Confidence Level 95%.
Untuk metode Ryan-Joiner
diperoleh nilai RJ = 0.992 dengan pendekatan P-value > 0.1 sehingga dapat dikatakan bahwa data
berdistribusi
normal.
Begitupula
dengan
metode
Kolmogorov-Smirnov
yang
menunjukkan nilai P-value = 0.118 yang artinya lebih besar daripada nilai α = 0.05. Berdasarkan nilai-nilai di atas yang didapat dari metode-metode berbeda, dapat dikatakan bahwa data yang diolah memiliki distribusi normal. Hal ini ju ga ditunjukkan dengan plot-plot data pada grafik berhimpit atau hampir mengikuti garis kenormalan. Dari ketiga nilai dengan metode yang berbeda di atas, terlihat bahwa statistik Anderson-Darling lebih powerfull untuk digunakan ukuran data yang besar.
BAB IV TRANSFORMASI DATA 4.1. Transformasi Satu Angkatan Data
Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan di analisa. Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data yang berdistribusi Normal dengan mean () dapat digambarkan seperti grafik berikut:
Gambar 4.1 Grafik Simetris Distribusi Normal
Bila dilihat, data yang berdistribusi Normal akan simetris terhadap
dan
sebagaian besar
data akan mengelompok di tengah. Dalam kenyataannya seringkali bentuk data yang diperoleh tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan seperti gambar berikut:
Gambar 4.2 Grafik Menjulur Ke Kanan
Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada gambar berikut :
Gambar 4.3 Grafik Menjulur Ke Kiri
Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu dilakukan suatu transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data yang akan ditransformsi hanya satu angkatan data. Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi Tukey yang digambarkan sebagai berikut :
Gambar 4.4 Fungsi Urutan Transformasi Tukey
Transformasi 10x akan membuat bentuk distribusi data menjadi menjulur ke kanan secara kuat, sedangkan transformasi
akan membuat bentuk distribusi data menjadi menjulur ke
kiri secara kuat. Sebagai contoh bila data yang dimiliki menjulur ke kanan secara lemah maka gunakan transformasi
√ agar
data dapat menjadi Normal. Sebaliknya bila data menjulur
kekanan secara sedang maka transformasi x 3 agar data menjadi Normal. Penentuan bahwa suatu data menjulur secara lemah, sedang atau kuat besifat subyektif sehingga akan lebih baik bila digunakan beberapa transformasi sekaligus kemudian dibandingkan hasilnya. Penentuan hasil kenormalan transformasi dilakukan melalui uji kenormalan. 4.2. Transformasi Beberapa Angkatan Data
Ketika memiliki beberapa angkatan data, biasanya ingin dilakukan pembandingan antara angkatan satu dengan angkatan
lainnya. Proses membandingkan ini lebih mudah ketika
semua angkatan data memiliki : 1. Bentuk distribusi baku 2. Sebaran data yang sama Ketika persyaratan di atas terpenuhi, untuk membandingkan angkatan-angkatan tersebut cukup dengan masing masing tarafnya ( nilai Median ) saja. Dalam penyamaan sebaran semua angkatan (membuat sebaran hampir sama), digunakan transformasi seperti pada tangga transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing masing angkatan diukur dengan d Q = Q3 - Q1 yaitu simpangan kuartil.
Penentuan transformasi yang tepat dilakukan adalah sebagai berikut: 1. Hitung taraf dari setiap angkatan. 2. Hitung sebaran dari setiap angkatan. 3. Tentukan Taraf Terbesar (TA), Taraf Terkecil (TB), Sebaran yang bersesuaian dengan TA(=SA) dan Sebaran yang bersesuaian dengan T B(=(SB) dari seluruh angkatan. 4. Hitung koefisien arah b yang memiliki rumus
( ) ( ) ( ) ( )
Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai dengan tabel berikut. Tabel 4.1 Transformasi Beberapa Angkatan Data Nilai b
Transformasi yang
(disekitar)
dipilih
Negatif
0.5
Keterangan Jika b semakin kecil, maka k semakin besar (k:bulat)
1 1.5
2
4.3. Transformasi Data Dengan Minitab 18
Berikut ini merupakan contoh data yang digambarkan dengan histogram menjulur ke kanan Tabel 4.1 Data Untuk Transformasi Data 7.2
2
9.6
2.1
2.4
3.6
9.1
3.6
2.9
15.3
5.6
1.7
4.8
3.1
2.3
4.4
1.7
3.6
2.3
3.4
9.7
1.9
10.4
4.8
2.1
4.6
2.1
1.9
5.3
6.3
2.9
8.8
3.7
4.9
5.2
3.4
3
1.7
8
1.5
2.3
4.8
7.5
1.5
2.9
3.4
5.7
11.9
6.4
1.3
14.3
5.5
8.3
7.6
3.2
3.4
11.4
4.9
3.8
15.3
2.6
3.6
4
4.4
4.1
17.3
8.1
1.9
13.7
1.8
6.8
6.5
2.4
12
3.5
3.8
3.7
3.4
4.6
5.9
1.8
10.9
1.7
3.7
0.5
2.4
0.9
2.5
2.9
2.8
3
3.7
5.8
5.5
5.9
6.9
6.5
8.3
9.3
4.9
Langkah-langkah dalam mentransformasikan data adalah sebagai berikut: 1. Input data ke dalam kolom C1.
Gambar 4.5 Input Data
2. Buat histogram dengan kurva kenormalan dari menu Graph tipe histogram With Fit, lalu klik OK .
Gambar 4.6 Menu Histogram
Histogram
pilih
Gambar 4.7 Tipe Histogram
3. Kemudian akan muncul histogram dengan kurva distribusi.
Gambar 4.8 Histogram Data
4. Kemudian lakukan uji kenormalan dengan metode Anderson-Darling dengan cara seperti pada bab sebelumnya. Dari ujia kenormalan ini diperoleh nilai P-value < 0.005. Hal ini menunjukkan data yang kita miliki belum berdistribusi normal.
Gambar 4.9 Uji Kenormalan Data C1
5. Agar data dapat berdistribusi normal, dapat dilakukan transformasi data dengan urutan fungsi selanjutnya, yaitu
√ melalui
menu Calc
Calculator. Lalu pada
window Calculator isikan setiap box seperti gambar di bawah ini dan klik OK .
Gambar 4.10 Menu Calculator
Gambar 4.11 Window Calculator
6. Ulangi langkah 2-4 untuk data kolom C2. Dari hasil transformasi
√ , diperoleh kurva
distribusi dan nilai P-value < 0.005 yang menunjukkan masih belum memiliki distribusi normal.
Gambar 4.12 Histogram dan Kurva Kenormalan Data C2
7. Kemudian dapat dilakukan transformasi data C1 dengan urutan transformasi selanjutnya, yaitu
sama
seperti langkah 3-6. Dari transformasi ini didapatkan
nilai P-value = 0.813 yang menunjukkan data berdistribusi normal karena nilai Pvalue lebih dari 0.005.
Gambar 4.13 Histogram dan Kurva Kenormalan Data C3
Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya menjulur kekanan
√ bentuk data menjadi menjulur ke kanan secara lemah, data menjadi normal. Nantinya yang diolah dengan
secara sedang, dengan transformasi sedangkan dengan transformasi
statistik adalah data bukan data aslinya. Sebagai eksperimen lainnya, lakukan tranformasi x 2 dan x3, simpan datanya masing-masing pada C4 dan C5 kemudian buat histogram maka diperoleh bentuk data akan semakin menjulur kekanan seperti ditunjukkan dari histogram berikut.
Gambar 4.14 Histogram Data C4 dan C5
BAB V HIPOTESIS DAN PROPORSI 5.1. Hipotesis Statistik
Hipotesis statistik merupakan hal sangat penting dalam statistika inferensia. Hipotesis statistik yaitu suatu anggapan atau pernyataan yang mungkin benar atau tidak mengenai satu populasi atau lebih. Suatu hipotesis dianggap benar atau salah, tidak bias diketahui dengan pasti kecuali dilakukan pemeriksaan terhadap seluruh populasi. Tetapi hal tersebut tidak efisien. Untuk mengatasi hal tersebut dilakukan pengambilan sampel secara acak. Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis yang dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar dan jika ditolak maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan bahwa perumusan suatu hipotesis sering dipengaruhi oleh bentuk peluang dari kesimpulan yang salah. Hipotesis yang dirumuskan dengan harapan akan ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut akan mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut hipotesis alternatif. Prosedur pengambilan kesimpulan kadangkadang dapat membawa pada kesimpulan yang salah. Dalam pengujian hipotesis statistik, ada dua jenis kesalahan yaitu: 1. Galat/kesalahan jenis pertama, yaitu penolakan hipotesis nol, padahal hipotesis nol benar. Peluang galat jenis I disebut taraf nyata yang dinotasikan dengan α. Biasanya taraf nyata disebut dengan ukuran wilayah kritis. 2. Galat/kesalahan jenis kedua, yaitu penerimaan hipotesis nol, padahal hipotesis nol salah. Peluang galat jenis II dinotasikan dengan β. Nilai dari β tidak mungkin dihitung, kecuali bila hipotesis alternatifnya lebih spesifik. Tabel 5.1 Kesalahan Dalam Pengujian Kesimpulan Pengujian Terima H0
Tolak H0
H0 Benar
H0 Salah
Keputusan Tepat
Kesalahan Type II
(1-α) = Confident Interval
β
Kesalahan Type I
Power Pengujian
α
(1- β)
Kesalahan type I dan II memiliki hubungan terbalik, menurunnya peluang yang satu akan menaikkan peluang yang lain. Dalam kesalahan type I, yaitu α dapat disebut sebagai taraf (derajat) signifikansi yang nilainya ditentukan oleh peluang diambilnya. Semakin kecil tingkat peluang kemelesetannya, semakin tinggi keberartiannya. Contohnya, niai α = 0.05 menunjukkan kemelesetan atau kekeliruan yang terjadi hanya sebanyak 5 kali dalam 100 kali pengamatan. Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu : 1. Hipotesis alternatif yang bersifat dua arah H0 : θ = θ0 H1 : θ θ0 Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yaitu wilayah yang letaknya pada masing-masing ujung dari sebaran statistik ujinya. 2. Hipotesis alternatif yang bersifat satu arah a. H0 : θ ≤ θ0
b.
H1 : θ > θ0
H0 : θ ≥ θ0 H1 : θ < θ0
Wilayah kritis untuk poin a terletak seluruhnya di ekor sebelah kanan dari sebaran statistik ujinya. Sedangkan untuk poin b sebaliknya.
Gambar 5.1 Pengujian Hipotesis
Dalam menentukan keputusan akhir untuk menerima atau menolak H 0, didasarkan pada wilayah kritis α dengan P-value yang mendukung keberartian suatu uji dalam bentuk peluang. P-value adalah taraf keberartian terkecil, sehingga nilai suatu uji statistik yang diamati masih berarti.Bila P-value ≤ α, maka H0 ditolak.
Prosedur pengujian hipotesis dapat mengikuti langkahlangkah berikut : 1. Merancang hipotesis nol dan hipotesis alternatif. 2. Menguji kenormalan. 3. Memilih taraf keberartian α. 4. Menguji kesamaan ragam. 5. Menentukan dan menghitung nilai statistik uji yang sesuai. 6. Menentukan daerah kritis dan membuat keputusan apakah menerima atau menolak H 0 (di mana pengambilan keputusan dapat didasarkan pada tiga hal yaitu nilai kristis dari statistik uji, selang kepercayaan, atau P-value). 7. Membuat kesimpulan akhir mengenai sampel yang diambil. 5.2. Pengujian Hipotesis Untuk Mean Tabel 5.2 Pengujian Hipotesis Untuk Mean H0
Uji Statistik
H1
̅ √
< 0
diketahui,
Daerah Kritis
Z < -zα Z > zα Z < -zα/2 dan Z > zα/2
> 0 0
n ≥ 30 = 0
̅ √ db = n – 1 ,
T < -tα T > tα T < -tα/2 dan
< 0 > 0 0
diketahui,
T > tα/2
n ≥ 30
(̅ ̅ ) (⁄ ) (⁄ )
1 dan 2 diketahui,
1 - 2 <
d0
1 - 2 >
d0
1 - 2 d0
n > 30 1 - 0 =
d0
(̅ ̅ ) (⁄) (⁄ )
db = n1 + n2 - 2 1 = 2 tetapi
tidak diketahui,
n ≤ 30
( ) ( )
1 - 2 <
d0
1 - 2 >
d0
1 - 2 d0
Z < -zα Z > zα Z < -zα/2 dan Z > zα/2
T < -tα T > tα T < -tα/2 dan T > tα/2
5.3. Pengujian Hipotesis Proporsi
Proporsi menyatakan perbandingan “banyaknya sukses” terhadap total pengamatan. Bila x menyatakan banyaknya sukses dari n ulangan, maka nilai proporsi p dihitung dengan rumus: . Uji proporsi dapat dilakukan terhadap satu nilai proporsi atau perbandingan beberapa nilai proporsi. Asumsi yang digunakan adalah proporsi berdistribusi binomial. Tabel 5.3 Uji Proporsi H0
Uji Statistik
P = P0
H1
( )
P < P0 P > P0
Dengan :
( ) (⁄ ) (⁄ )
P1 – P2 = d0
Dengan :
P P0
P1 - P2 < d0 P1 - P2 > d0 P1 - P2 d0
Daerah Kritis
Z < -zα Z > zα Z < -zα/2 dan Z > zα/2
Z < -zα Z > zα Z < -zα/2 dan Z > zα/2
5.4. Aplikasi Uji Satu Nilai Proporsi Dengan Minitab 18
Contoh kasus : Obat untuk ketegangan syaraf selama ini memiliki kefektifan 60%. Sebuah obat baru diuji terhadap 100 pasien, 70 orang sembuh sehingga tingkat keefektifannya 70%. Apakah obat baru tersebut bisa dikatakan lebih efektif dari obat lama? Langkah-langkah : 1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60% atau tidak, maka uji hipotesis yang dipilih adalah H0 : p = 0.6 H1 : p > 0.6 Taraf = 5% = 0,05
2. Untuk menguji pilih menu Stat
Basic Statistics
1 Proportion
Gambar 5.2 Menu 1 Proportion
3. Kemudian dialog box One-Sample Proportion seperti pada gambar. Dan pada dialog box options pilih Proportion > Hypothesized Proportion dalam Alternative Hypothesis dan metode yang digunakan mendekati distribusi normal.
Gambar 5.3 Window One-sample Proportion
Gambar 5.4 Window One-sample Proportion : Options
4. Output dari analisis ini terdapat pada window session seperti sebagai berikut.
Test and CI for One Proportion Method p: event proportion Normal approximation method is used for this analysis.
Descriptive Statistics N
Event
Sample p
95% Lower Bound for p
100
70
0.700000
0.624623
Test Null hypothesis
H₀: p = 0.6
Alternative hypothesis
H₁: p > 0.6
Z-Value
P-Value
2.04
0.021
Dari hasil yang telah didapat menunjukkan nilai z masuk ke dalam wilaya kritik karena Pvalue = 0.021 < 0.05 sehingga dapat disimpulkan bahwa tingkat kefektifan obat baru lebih tinggi dari obat lama.
5.5. Pengujian Perbandingan Dua Proporsi
Contoh Kasus : Suatu penelitian dilakukan untuk melihat proporsi lulusan SMA kotamadya Bandung (p 1) yang akan melanjutkan ke PT (Perguruan Tinggi) lebih tinggi dari lulusan SMA kabupaten Bandung (P 2) yang akan melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang diambil, diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan melanjutkan ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang akan melanjutkan ke PT. Langkah-langkah : 1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya Bandung( p1) yang akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan smu kabupaten Bandung( p2), maka uji hipotesis yang dipilih adalah H0 : p1 = p2 atau H0 : p1 – p2 = 0 H1 : p1 > p2 atau H0 : p1 – p2 > 0 Taraf = 5% = 0,025 2. Pilih menu Stat
selang
kepercayaan = 97,5 %
Basic Statistics
2 Proportions , lalu akan menampilkan kota
dialog seperti pada gambar.
Gambar 5.5 Window Two Sample Proportions
3. Klik box Options dan ubah Confidence Level menjadi 97.5% karena harga taraf dalam kasus sebesar 2.5% serta alternative hypothesis menjadi difference > hypothesized difference.
Gambar 5.6 Two Saple Proportions Options
4. Klik OK pada setiap window dan akan menujukkan output sebagai berikut.
Pada output yang dihasilkan menunjukkan nilai P-value = 0.002 < 0.025 sehingga H 0 tidat tertolak. Dengan kata lain, proporsi lulusan siswa SMA Kotamadya yang melanjutkan ke PT lebih tinggi daripada luluasan siswa SMA Kabupaten.
BAB VI ANALISIS REGRESI LINEAR 6.1. Regresi
Dalam pembahasan masalah penelitian biasanya dapat dijelaskan oleh dua atau lebih variabel yang saling berhubungan satu sama lain. Variabel-variabel yang saling berhubungan tersebut membentuk suatu persamaan matematis yang dapat digunakan untuk menentukan nilai sebuah variabel yang bergantung pada nilai variabel yang lain. Dalam statistika, hubungan fungsional antara variabel respons ( dinotasikan Y ) dengan variabel prediktor ( dinotasikan X ) disebut regresi antara Y dan X. Dengan demikian analisis regresi berguna dalam berbagai penelitian antara lain :
Model regresi dapat digunakan untuk mengukur kekuatan hubungan antara variabel respons dan variabel prediktor.
Model regresi dapat digunakan untuk mengetahui pengaruh suatu atau beberapa variabel prediktor terhadap variabel respons.
Model regresi berguna untuk memprediksi pengaruh suatu variabel atau beberapa variabel prediktor terhadap variabel respons.
6.2. Model Regresi Linear Sederhana
Persamaan matematika regresi linear sederhana adalah sebagai berikut :
β0 dan β1 merupakan parameter model dan adalah residual model Nilai ԑ selalu berubah-ubah pada setiap x sehingga sulit untuk ditebak, model ini kemudian diprediksi oleh ̂ dengan metode kuadrat terkecil yaitu untuk meminimasi jumlah kuadrat error ̂ . Selain itu, nilai koefisien korelasi determinasi R 2 yang memiliki nilai 0 sampai 1 juga dapat digunakan untuk melihat seberapa baik model regresi yang akan diperoleh dengan persamaan sebagai berikut : ̂ ( ) ( )
6.3. Aplikasi Regresi Linear Dalam Minitab 18
Untuk memahami analisis regresi linear sederhana, contoh kali ini menggunakan data dalam tabel 6.1 yang merupakan hasil penelitian mengetahui pengaruh kandungan nikotin suatu rokok terhadap kesehatan manusia. Berikut adalah data mengenai jumlah nikotin dalam rokok dan karbon monoksia yang dihasilkan pada 25 merk rokok. Tabel 6.1 Kandungan Nikotin dan Karbon Monoksida Dalam Rokok Karbon Monoksida (mg)
Nikotin (mg)
Karbon Monoksida (mg)
Nikotin (mg)
13.6
0.86
10.2
0.78
16.6
1.06
9.5
0.74
23.5
2.03
1.5
0.13
10.2
0.67
18.5
1.26
5.4
0.4
12.6
1.08
15
1.04
17.5
0.96
9
0.76
4.9
0.42
12.3
0.95
15.9
1.01
16.3
1.12
8.5
0.61
15.4
1.02
10.6
0.69
13
1.01
13.9
1.02
14.4
0.9
14.9
0.82
10
0.57
Dalam penaksiran garis regresi linear ini, kandungan nikotin dalam rokok digunakan untuk mengukur karbon monoksida. Dengan kata lain, nikotin merupakan variabel prediktor (x) sedangkan karbon monoksida sebagai variabel respons (y). Agar model yang dibuat tidak menyimpang jauh, hal pertama yang dilakukan untuk melakukan analisis regresi adalah memprediksi model. 1. Sebelumnya input data tersebut ke dalam dua kolom, yaitu C1 dan C2 seperti pada gambar.
Gambar 6.1 Input Data
2. Langkah untuk menaksir garis regresi dimulai pada menu Stat Fitted Line Plot.
Gambar 6.2 Menu Fitted Line Plot
Regression
3. Kemudian isi kan box pada window Fitted Line Plot seperti di bawah ini.
Gambar 6.3 Window Fitted Line Plot
4. Selanjutnya akan muncul ouput grafik Fitted Line Spot dan Regression Analysis pada window Session.
Gambar 6.4 Output Prediksi Model Regresi
Pada grafik Fitted Line Spot menjunjukkan taksiran garis regresi untuk model regresi linear. Selain itu, pada window Session juga ditampilkan hasil taksiran parameter model regresi linearnya, yaitu :
.
Kemudian, Standar
Deviasi model (S) dan Koefisien Determinasi (R 2) masing-masing sebesar 1.83 dan 85.7%.
Selain itu, output ini juga menunjukkan ANOVA yang berguna untuk memeriksa kecukupan model regresi linear yang telah dibuat. Suatu model regresi dikatakan sudah mewakili data apabila P-value model regresi dalam ANOVA tidak melebihi level toleransi (α) yan telah ditetapkan. 6.4. Analisis Regresi Linear Sederhana Dalam Minitab
Setelah mengetahui taksiran model yang tepat digunakan adalah regresi linear, kita dapat melakukan analisis regresi secara memperdalam dengan jalan sebagai berikut: 1. Pilih menu Stat
Regression
Regression
Fit Regression Model akan
menampilkan window Regression. Dalam box Response isikan variabel Karbon monokisida dan variabel Nikotin pada box Predictors .
Gambar 6.5 Window Regression
2. Kemudian klik Graphs , select Regular pada Residual for plots, dan Normal probability plot of residuals pada Residual plots untuk menampilkan grafik residual. Lalu klik OK .
Gambar 6.6 Window Regression Graph
3. Selanjutnya untuk menampilkan model regresi, ANOVA, dan unsual observation, klik Results pada window Regressions . Kemudian select output yang diinginkan seperti
pada gambar di bawah ini.
Gambar 6.7 Window Regression Results
4. Kemudian klik Storage pada window Regression, ceklis Fits dan Residuals seperti pada gambar.
Gambar 6.8 Window Regression Storage
5. Lalu klik OK pada setiap window. Output dari langkah-langkah ini berupa grafik residual dan tabel ANOVA, Regression Equation, Unsual Observsation pada window Session.
Gambar 6.9 Grafik Regresi
Regression Analysis: Karbon Monoksida versus Nikotin Analysis of Variance Source
DF
Adj SS
Adj MS
F-Value
P-Value
Regression
1
462.256
462.256
138.27
0.000
Nikotin
1
462.256
462.256
138.27
0.000
23
76.894
3.343
Lack-of-Fit
21
71.564
3.408
1.28
0.530
Pure Error
2
5.330
2.665
24
539.150
Error
Total
Model Summary S
R-sq
R-sq(adj)
R-sq(pred)
1.82845
85.74%
85.12%
78.40%
Coefficients Term
Coef
SE Coef
T-Value
P-Value
Constant
1.665
0.994
1.68
0.107
Nikotin
12.40
1.05
11.76
0.000
VIF
1.00
Regression Equation Karbon Monoksida
=
1.665 + 12.40 Nikotin
Fits and Diagnostics for Unusual Observations Obs
Karbon Monoksida
Fit
Resid
Std Resid
3
23.500
26.827
-3.327
-2.53
R
19
17.500
13.564
3.936
2.20
R
X
R Large residual X Unusual X
Dari persamaan regresi yang di dapat, yaitu:
memperlihatkan b0 sebesar 1.665 dan taksiran parameter dari b 1 sebesar 12.3. Hal ini berarti kandungan nikotin dalam rokok memperngaruhi peningkatan pengaruh karbonmoksida yang diahasilkan sebesar 12.4 kali. Angka 1.665 menunjukkan bahwa besar kandungan karbonmonoksida ketika kandungan nikotin bernilai 0 (nol).
Pada model regresi, ada asumsi bahwa distribusi residual mengikuti distribusi normal dengan rata-rata dan standar deviasi sekecil mungkin. Semakin kecil standar deviasi residual berarti nilai taksiran model makin mendekati nilai sebenarnya. Dalam regresi ada pula istilah Mean Square Error (MSE) yang merupakan carian residual (s2). Perlu diingat bahwa varian residual adalah kuadrat standar deviasi. Dari nilai MSE untuk model yang telah dibuat adalah 3.34 sehingga nilai standar deviasinya adalah:
√ Nilai 1.83 berarti bahwa sebagian besar kandungan nikotin dalam suatu rokok akan jatuh di sekitar 2s = 3.66. ANOVA sebenarnya merupakan uji hipotesis kesesuaian model dengan data yang ada. Dalam hal ini, hipotesisnya adalah: H0 : Ada salah satu parameter model (β0 atau β1) bernilai nol. H1 : Parameter model (β0 atau β1) tidak nol. Hipotesis awal menandakan model yang dibuat tidak sesuai dengan data. Sebaliknya, hipotesis alternatif berarti model yang dibuat sesuai dengan data. Uji kesesuaian model menggunakan P-value memiliki daerah penolakan pada :
Pada analisis regresi ini, kita menentukan level toleransi ( ) sebesar 0.005. Selain itu, uji kesesuaian model dapat juga menggunakan statistik F yang daerah penolakannya adalah sebagai berikut:
Pada tabel ANOVA menunjukkan statistik F sebesar 138.27. Bila digunakan α sebesar 5%, maka nilai = 4.28 yang ditunjukkan dari tabel (F)... yang ada di dalam lampiran. Sehingga nilai statistik F memenuhi daerah penolakan. Dengan kata lain menolak hipotesis awal. Berarti hasil analisis secara statistis tidak ada parameter model bernilai nol yang menunjukkan bahwa model regresi linear sederhana ini bisa dikatakan telah mewakili data.
6.5. Memeriksa Utilitas Model
Hubungan kandungan nikotin dalam suatu rokok dengan karbon monoksida yang dihasilkan rokok perlu diperiksa secara statistik. Oleh karena itu, parameternya perlu diuji dan dibandingkan dengan level toleransi ( ) yang ditentukan. Kali ini uji parameter model dilakukan dengan menggunakan statistic t. Adapun hipotesis dalam melaksanakan uji parameter ini adalah: H0 : β1 = 0 H1 : β1 0 Hipotesis awal (H0) pada hipotesis adalah parameter β1 (β1 = 0) tidak ada dalam model regresi dan hipotesis aleternatif adalah parameter β1 ada dalam model. Nilai statistic t juga dapat dikonversikan ke dalam P-value. Bila menggunakan P-value, maka daerah penolakannya adalah P-value < level toleransi (α). Untuk daerah penolakannya sendiri adalah:
Dalam hal ini:
df : derajat bebas n : banyaknya pengamatan k : banyaknya parameter Output yang ditampilkan pada tabel Coefficient menunjukkan bahwa statistik t untuk variabel kandungan nikotin dalam rokok adalah 11.76 dan P-value bernilai 0. Derajat bebas pada analisis ini sebesar 23. Dari tabel T ..., kita dapat mengetahui statisik t untuk level toleransi 0.05 dan derajat bebas sebesar 23 ( ) adalah 1.714. Hal ini menandakan nilai t-value lebih besar dari ( ) sehingga dapat disimpulkan menolak hipotesis awal pada level toleransi 0.05. Oleh karena itu, dugaan adanya pengaruh kandungan nikotin dalam rokok terhadap karbon monoksida yang dihasilkan oleh suatu rokok dapat diterima.
6.6. Memeriksa Ukuran Kecukupan Model
Untuk mengukur kecukupan regresi, dapat dilihat pada koefisien determinasi (R 2). Koefisien determinasi menjelaskan besarnya variasi respons yang dapat dipengaruhi oleh prediktor. Nilai ini dapat dilihat pada tabel Model Summary. Nilai koefisien determinasi model regresi adalah 85.74% yang artinya sebanyak 85.74% variasi sample jumlah karbon monoksida yang dihasilkan oleh suatu rokok dipengaruhi oleh kandungan nikotin dalam rokok. Koefisien korelasi, R, merupakan akar koefisien determinasi yang menjelaskan hubungan linear antara variabel respons dan prediktor. Nilai R berkisar 0 sampai dengan 1 yang besarnya semakin mendekati 1 berarti hubungan antarvariabel makin kuat. Dalam hal ini, koefisien korelasinya sebesar:
√ Dari sini dapat diketahui bahwa ada hubungan linear yang kuat antara kandungan nikotin dalam rokok dengan jumlah karbon monoksida yang dihasilkannya. Makin banyak variabel yang dimasukkan dalam model, makin meningkat nilai R 2. Di sisi lain, semakin banyaknya variabel ini menyebabkan model menjadi tidak efisien. Untuk itu, R 2 perlu ditingkatkan sensifitasnya, dalam hal ini ditunjukkan pada nilai R 2 adjusted. R 2 adjusted disesuaikan dengan jumlah variabel yang dimasukkan ke dalam model pada kasus ini sebesar 85.12%. perbedaan angka antara R 2 dan R 2 adjusted tidak berbeda jauh karena jumlah variabel dalam model hanya ada 1. 6.7. Membuat Nilai Taksiran
Pada window Worksheet terdapat nilai taksiran dan residual model data pengamatan yang masing-masing ditampilkan dalam kolom C3 dan C4 seperti pada gambar. Output tersebut memperlihatkan bahwa untuk kandungan nikotin 0.86 mg, perkiraan jumlah karbon monoksida yang dihasilkan suatu rokok sebesar 12.32 mg begitu pula seterusnya. Nilai-nilai taksiran dapat digunakan untuk menghitung nilai residual, sedangkan nilai residual digunakan untuk mendiagnosis model regresi.
Gambar 6.10 Fits and Residual
Diagnosis model dilakukan dengan memeriksa kesesuaian residual dengan asumsi yang disyaratkan. Untuk mendiagnosis model, diperlukan pemeriksaan distribusi residual beserta parameter-parameternya. Dalam hal ini, distribusi yang diinginkan adalah distribusi normal. 6.8. Interpretasi Gambar
Pada plot kenormalan residual, bila titik yang dihasilkan telah sesuai atau mendekati garis lurus yang ditentukan berdasarkan data (residual), maka residual dapat dikatakan telah mengikuti distribusi normal. Namun hal ini hanya sebatas keputusan secara visual sehingga dibutuhkan bukti secara statistis dengan melakukan uji kenormalan data secara kuantitatif. Dengan kata lain, residual model regresi linear sederhana yang dibuat telah mengiktui distribusi normal yang diinginkan sesuai dengan asumsi model regresi. Data residual model yang akan diuji berada pada kolom C3. Residual ini merupakan hasil analisis regresi yang telah dilakukan sebelumnya. Langkah-langkan untuk melakukan uji tersebut adalah sebagai berikut: 1. Pilih Stat
Basic Statistics
Normality Test. Kemudian akan muncul dialog box
dan isikan setiap kolom seperti pada gambar ....
Gambar 6.11 Window Normality Test
2. Selanjutnya klik OK dan akan menampilkan grafik uji kenormalan residual seperti pada gambar di bawah ini.
Gambar 6.12 Grafik Regresi Dengan Nilai Statistik