ANALISIS DISKRIMINAN Di susun untuk memenuhi tugas matakuliah Analisis Statisik Multivariat yang dibimbing oleh Ibu Trianingsih Eni Lestari
Anggota: Cindy Meilinda Wijaya
(409312417678) (409312417678)
Andrie Kurniawan
(409312417687) (409312417687)
Herlin Dwi Kartikasari
(409312419799) (409312419799)
Firqin Setara
(409312419800) (409312419800)
MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MALANG Oktober 2011
BAB I PENDAHULUAN 1.1.Latar Belakang
Analisis diskriminan merupakan teknik menganalisis data, dimana variabel dependen merupakan data kategorik ( nominal dan ordinal ) sedangkan variabel independen berupa berupa data interval atau rasio . Misalnya berdasarkan data dari nasabah peminjam kredit suatu bank, seperti penghasilan, umur, pekerjaan, tingkat pendidikan, ingin meramalkan apakah seseorang nasabah yang baru termasuk jujur atau tidak jujur. Analisis diskriminan ini termasuk dalam analisis multivariat dengan metode dependensi. Ada dua metode dalam analisis multivariat yaitu metode dependensi dan metode interdenpendensi . Metode dependensi yaitu variabel-variabelnya tidak saling bergantung satu dengan yang lain, sedangkan metode interdenpen i nterdenpendensi densi adalah antarvariabelnya ada saling ketergantungan. Variabel dependen adalah data kategorikal. Jika data kategorikal terdiri dari dua kelompok atau kategori disebut Two-Group Discriminant Analysis , sedangkan jika lebih dari dua Discriminant Analysis. Adapun yang menjadi latar kategori disebut dengan Multiple Discriminant
belakang penelitian ini adalah terkait dengan peranan dan aplikasi analisis diskriminan yang merupakan salah satu dari teknik t eknik statistik multivariat yang banyak digunakan dalam berbagai bidang ilmu yang terjadi dalam sebuah fenomena sosial, sosial, keuangan dan ekonomi. Analisis diskriminan digunakan asalkan pertanyaan penelitian mengarah pada variabel tak bebas (dependent variable ) yang berupa data kategori seperti : macet-lancar,untung-rugi, puas-tidak puas dan lainnya. Analisis diskriminan adalah metode untuk mencari dasar pengelompokan individu berdasarkan lebih dari satu variabel bebas. Analisis Diskriminan dipakai untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan beberapa variabel. Persamaan Fungsi Diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi individu kedalam kelompok berdasarkan skor variabel bebas . Pada penelitian bidang kesehatan , analisis diskriminan dilakukan untuk mengetahui apakah dari keempat variabel prediktor, yaitu perasaan cemas (feeling anxious), gelisah ( restless ), depresi (depressed ), ), putusasa ( hopeless ) dapat menentukan apakah seorang pasien akan didiagnosis didiagnosis pada kelompok tidak stress (normal)
atau stress . Pada Bank, analisis diskriminan juga dilakukan untuk mengklasifikasi Formulir Aplikasi untuk pinjaman, kartu kredit, dan asuransi dalam kategori berisiko rendah atau berisiko tinggi. ti nggi. 1.2.Rumusan Masalah
1. Bagaimana definisi analisis diskriminan? 2. Apa saja hal – hal – hal hal pokok yang mempengaruhi diskriminan analisis? 3. Bagaimana proses pengambilan keputusan untuk analisis diskriminan ? 4. Bagaiman aplikasi dalam menganalisis model diskriminan?
1.3.Tujuan
1. Mengetahui pengertian tentang analisis diskriminan 2. Untuk mengetahui tujuan dan syarat dari analisis diskriminan, menentukan banyaknya banyaknya sampel, dan mengetahui proses-proses dalam mencari model diskriminan. 3. Mengetahui proses pengambilan keputusan untuk analisis diskriminan . 4. Menganalisis model diskriminan dengan bantuan SPSS.
BAB 2 PEMBAHASAN 2.1 DEFINISI DISKRIMINAN ANALISIS
Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen adalah kategori (nominal atau nonmetrik) variabel dan variabel independen adalah variabel metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi (contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti rendah, sedang, dan klasifikasi tinggi. Analisis diskriminan mampu menangani baik dua kelompok atau beberapa kelompok (tiga atau lebih). Ketika dua klasifikasi yang terlibat, teknik ini disebut sebagai dua kelompok analisis diskriminan. Ketika tiga atau lebih klasifikasi diidentifikasi, teknik ini disebut sebagai analisis diskriminan ganda (MDA). Analisis diskriminan melibatkan menurunkan suatu variat. Diskriminan variat adalah kombinasi linear dari variabel independen dua (atau lebih) yang akan membedakan terbaik antara obyek (orang, perusahaan, dll) dalam kelompok didefinisikan suatu
priori .
Diskriminasi dicapai dengan menghitung bobot untuk masing-masing variate variabel independen untuk memaksimalkan perbedaan antara kelompok (yaitu varians antara kelompok relatif terhadap varians dalam kelompok). Para variate untuk analisis diskriminan, juga dikenal sebagai fungsi diskriminan, berasal dari persamaan seperti yang terlihat pada regresi berganda. Dibutuhkan bentuk sebagai berikut:
dimana
= diskriminan Z skor diskriminan j fungsi untuk objek k
= intercept
= bobot diskriminan untuk variabel independen
= variabel independen i ndependen untuk objek
Analisis diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis bahwa kelompok berarti satu set variabel independen untuk dua atau lebih kelompok yang sama. Dengan rata-rata skor diskriminan untuk semua individu dalam suatu kelompok tertentu, kita sampai pada kelompok rata-rata. Kelompok rata-rata ini disebut sebagai suatu titik berat. Ketika analisis melibatkan dua kelompok ada dua centroid, dengan tiga kelompok ada tiga centroid, dan sebagainya. Para centroid menunjukkan letak paling khas dari setiap anggota dari kelompok tertentu, dan perbandingan dari centroid kelompok menunjukkan seberapa jauh kelompok-kelompok yang dalam bentuk adalah fungsi diskriminan. Uji untuk signifikansi statistik dari fungsi diskriminan adalah ukuran umum dari jarak antara centroid kelompok, dihitung dengan membandingkan distribusi dari skor diskriminan untuk kelompok. Jika tumpang tindih cukup besar, fungsi adalah diskriminator yang buruk antara kelompok-kelompok. Dua distribusi skor diskriminan ditunjukkan pada gambar 1 lebih menggambarkan konsep ini. Diagram Diagram atas mewakili distribusi skor diskriminan untuk fungsi yang memisahkan kelompok-kelompok dengan baik, menunjukkan tumpang tindih
minim (daerah yang diarsir) antara kelompok. Diagram bawah menunjukkan distribusi skor diskriminan pada fungsi diskriminan yang merupakan diskriminator relatif miskin antara kelompok A dan B. daerah yang diarsir tumpang tindih merupakan contoh di mana misclassifying objek dari grup A ke kelompok B dan sebaliknya dapat terjadi.
2.2 HAL-HAL POKOK TENTANG ANALISIS DISKRIMINAN DI SKRIMINAN
Tujuan Analisis Diskriminan Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah :
Ingin mengetahui mengetahui apakah ada perbedaan yang jelas antar grup pada pada variabel dependen, atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan anggota grup 2.
Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut.
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk grup 1 atau grup 2, atau lainnya.
Syarat-Syarat yang harus Dipenuhi untuk Menggunakan Teknik Analisis Diskriminan
Variabel tergantung hanya satu dan bersifat non-metrik, artinya data harus kategorikal dan berskala nominal.
Variabel bebas terdiri lebih dari dua variabel dan berskala interval.
Semua variabel prediktor sebaiknya mempunyai distribusi normal multivariat, dan matrices variance-covariance kelompok
dalam kelompok harus sama untuk semua
Keanggotaan kelompok diasumsikan ekseklusif, maksudnya tidak satupun kasus yang termasuk dalam kelompok lebih dari satu. dan exhaustive secara kolektif, maksudnya semua kasus merupakan anggota satu kelompok
Tidak ada korelasi antar variabel independen. Jika dua variabel independen mempunyai korelasi yang kuat, dikatakan terjadi multikolinieritas.
Multivariate Multivaria te normality , atau variabel independen seharusnya berditribusi normal.
Jika tidak berdistribusi normal, hal ini akan menyebabkan masalah pada Regression ) bisa ketetapan fungsi (model) diskriminan. Regresi Logistik ( Logistc Regression
dijadikan alternative metode jika memang data tidak berdistribusi normal.
Matriks kovarians dari semua variabel independen seharusnya seharusnya sama ( equal.)
Tidak adanya data yang sangat ekstrem ( outlier ) pada variabel independen. Jika ada data outlier yang tetap diproses, Hal ini bisa berakibat berkurangnya ketetapan klasifikasi dari fungsi diskriminan. di skriminan.
Proses Dasar dari Diskriminan Analisis Proses dasar analisis diskriminan meliputi :
Memisah variabel-variabel menjadi variabel dependen dan variabel independen.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yaitu: 1. SIMULTANEOUS ESTIMATION , di mana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan. 2. STEP-WISE ESTIMATION , dimana variabel dimasukkan satu per satu ke dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari model.
Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan ’s Lambda, Pilai, F-test dan lainnya. Wilk ’s
Menguji ketetapan klasifikasi dari
fungsi diskriminan, termasuk mengetahui
ketepatan klasifikasi secara individual dengan Casewise Diagnotics.
Melakukan interpretasi terhadap fungsi diskrimminan tersebut.
Melekukan uji validasi fungsi diskriminan.
Jumlah Sampel pada Analisis Diskriminan
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam variabel independen, seharusnya seharusnya minimal ada 6x5=30 sampel. Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analysis sampel yang digunakan untuk Fungsi Diskrim Diskriminan, inan, serta holdout sample (split sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70
sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analisis sample dibandingkan dengan dengan hasil fungsi fungsi diskriminan dari holdout sample, sample, apakah terjadi perbedaan perbedaan yang besar atau tidak. Jika ketetapan klasifikasi kedua sampel hampir sama besar, dikatakn fungsi diskriminan dari analisis sampel sudah valid. Inillah yang disebut proses validasi silang (Cross Validation) dari fungsi diskriminan. Model dari Analisis Diskriminan Analisis diskriminan termasuk dalam multivariate dependence method, dengan model : Y1
=
Non metriks
X1+X2+…..+Xn Metrik
Keterangan :
Variabel Independen (X 1 dan Seterusnya) adalah data metrik, yakni data berjenis interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, kandungan zat besi dalam tubuh, dan seterusnya.
Variabel Dependen (Y1) adalah data kategorikal atau nominal, seperti golongan miskin (kode 1), golongan menengah (kode 2), golongan kaya (kode 3) dan sebagainya. Jika data kategorikal tersebut hanya terdiri atas dua kode saja (missal kode 1 untuk daerah banjir dan kode 2 untuk daerah non banjir), maka model bisa disebut Two-Group Discriminant Analysis . Sedang jika kode lebih dari dua kategori Discriminant ant Analysis. Analysis. disebut dengan Multiple Discrimin
Dari keterangan di atas, perhatikan adanya perbedaan dalam penempatan data yang sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia disebut secara langsung sekian tahun (17 tahun, 32 tahun dan sebagainya), maka data tersebut adalah rasio dan
otomatis diperlakukan sebagai variabel independen. Namun, jika usia seseorang penggolongan, n, dan dimasukka dimasukkan n dalam kategori-kat kategori-kategori egori tertentu, seperti dilakukan penggolonga
jika usia seseorang antara 15-20 tahun, ia digolong digolongkan kan Remaja, di atas 20 tahun digolongkan dewasa, maka data seseorang yang berusia 17 tahun tidak ditulis ‘17’, namun akan ditulis Remaja. Data hasil kategorisasi ini adalah data nominal dan termasuk variabel dependen. Dengan demikian, usia 17 tahun bisa menjadi variabel dependen atau independen tergantung bagaimana data tersebut akan diperlakukan, langsung diinput apa adanya atau dilakukan penggolongan. 2.3 PROSES PENGAMBILAN KEPUTUSAN UNTUK ANALISIS DISKRIMINAN Tahap 1 Tujuan dari Analisis Diskriminan
Kajian dari tujuan untuk menerapkan analisis diskriminan lebih lanjut harus mengklarifikasi sifatnya. Analisis diskriminan dapat mengatasi salah satu tujuan penelitian sebagai berikut 1. menentukan apakah ada perbedaan statistik yang signifikan antara profil rata skor pada satu himpunan variabel untuk dua (atau lebih) kelompok didefinisikan priori. 2. menentukan yang mana dari perhitungan variabel independen yang paling terjadinya perbedaan dalam profil skor rata-rata dua atau lebih kelompok. 3. menetapkan jumlah dan komposisi dimensi diskriminasi antara kelompok-kelompok yang terbentuk dari himpunan variabel independen 4. menetapkan prosedur untuk mengklasifikasikan objek (individu, perusahaan, produk, dll) ke dalam kelompok berdasarkan skor mereka pada sekumpulan variabel independen Tahap 2 Desain Penelitian untuk Analisis Diskriminan
1. memilih variabel dependen dan independen 2. ukuran sampel 3. pembagian sampel Tahap 3 Asumsi Analisis Diskriminan
1. dampak pada estimasi dan klasifikasi
2. dampak pada interpretasi Tahap 4 Estimasi dari Model Diskriminan serta Menilai Kesesuaian secara Keseluruhan
1. memilih metode estimasi 2. signifikansi statistik 3. menilai secara keseluruhan sesuai dengan model 4. casewise diagonistic Tahap 5 Interpretasi Hasil
1. bobot diskriminan 2. diskriminan beban 3. parsial nilai F 4. interpretasi dari dua atau lebih fungsi 5. metode interpretatif yang digunakan Tahap 6 Validasi Hasil
1. validasi prosedur 2. membuat profil perbedaan kelompok
2.4 APLIKASI DALAM MENGANALISIS MODEL DISKRIMINAN
1. Perumusan masalah Rumuskan permasalah yang akan dianalisis meliputi penentuan variabel independen dan variabel dependen. 2. Uji variabel Menguji apakah ada variabel yang berbeda secara nyata antara satu variabel dengan variabel lain. Menentukan Menentukan variabel variabel independen mana yang yang mempengaruhi mempengaruhi variabel dependen. Menguji varians dari setiap variabel. 3. Melakukan analisis diskriminan Menentukan model diskriminan dari permasalahan yang ada. Menguji ketepatan pengklasifikasian model. 4. Contoh kegunaan Fungsi Diskriminan
BAB 3 PENUTUP
Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen adalah kategori (nominal atau nonmetrik) variabel dan variabel independen i ndependen adalah variabel variabel metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi (contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dengan fungsi diskriminan sebagai berikut:
Tujuan dari analisis analisis diskriminan secara secara umum adalah mengetahui apakah ada perbedaan yang yang jelas antar grup pada variabel dependen, dependen, menentukan menentukan model diskriminan dari suatu permasalahan permasalahan.. Jika model tersebut sudah diperoleh selanjutnya akan dilakukan pengujian ketepatan klasifikasi model. Model dari analisis diskriminan dapat digunakan digunakan untuk mencari mencari hubungan antara variabel dependen dengan variabel depend dependen en dari permasalahan yang didapat.
BAB II PEMBAHASAN 2.1.Analisis Diskiminan (Analisis Fungsi Pembeda )
Menurut Johnson dan Wichern (2007) Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Suatu fungsi diskriminan layak untuk dibentuk, bila terdapat perbedaan nilai rataan di antara kelompok-kelompok yang ada. Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan untuk mengelompokkan atau mengklasifikasi mengklasifikasi suatu objek dalam dua kelompok atau lebih berdasarkan variabel independentnya. Sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian tersebut, asumsi analisis diskriminan yang harus dipenuhi adalah : 1. Variabel independen seharusnya berdistribusi normal multivariat ( Multivariate Multivariate Normality), jika data tidak berdistribusi normal,akan menyebabkan masalah pada
ketepatan fungsi (model) diskriminan. 2. Matriks varians kovarians grup dari semua variabel independen independen seharusnya sama. 3. Tidak ada data yang sangat ekstrim ( outlier ) pada variabel independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan. 4. Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel independen mempunyai korelasi yang kuat,dikatakan terjadi multikolinieritas. Untuk mengetahui adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel independen (r) yaitu jika nilai ni lai r > 0.6 menunjukkan adanya adanya multikolinieritas.
2.2.Fungsi Diskriminan Y b0 b1 X i1 b2 X i 2 ... b j X ij
dimana :
Y
= Nilai (skor) fungsi diskriminan dari responden ke-i
b0
= Intersep (konstanta), artinya jika nilai variabel X 0 , maka besar nilai Y b0
b j
= Koefisien fungsi diskriminan dari variabel ke-j ke -j
X ij = Variabel bebas ke-j dari responden ke-i , dimana i = 1,2,...,n
2.3.Jumlah 2.3.Jumlah Sampel pada Analisis Diskriminan
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam variabel independen, seharusnya seharusnya minimal ada 6x5=30 sampel. Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analisis sampel yang digunakan untuk untuk Fungsi Fungsi Diskriminan, serta holdout sample (split sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70
sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analysis sample dibandingkan dengan hasil fungsi fungsi diskriminan
dari holdout holdout sample, sample, apakah apakah terjadi
perbedaan yang besar ataukah tidak. Jika ketetapan klasifikasi kedua sampel hampir sama besar, dikatakn fungsi diskriminan dari analysis sampel sudah valid. Inillah yang disebut proses validasi silang (Cross Validation) dari fungsi diskriminan. 2.4.Tujuan Analisis Diskriminan
Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah :
Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan anggota grup 2?
Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut?
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk grup 1 atau grup 2, atau lainnya.
2.5.Proses Dasar dari Analisis Diskriminan
Proses dasar analisis diskriminan :
Memisah variabel-variabel menjadi variabel dependen dan Variabel Independen.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yaitu: 3. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan. 4. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari model.
Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s Lambda, Pilai, F test dan lainnya.
Menguji ketetapan klasifikasi dari
fungsi diskriminan, termasuk termasuk mengetahui mengetahui
ketetpan klasifikasi secara individual dengan casewise Diagnotics.
Melakukan interpretasi terhadap fungsi diskrimminan tersebut.
Melekukan uji validasi fungsi f ungsi diskriminan.
a. Algoritma Pokok Analisis dan Model Matematika Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai sebagai berikut: 1. Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi
sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa dilihat pada Pooled Within-Groups Matrices . 2.
Uji Vektor Rata-rata Kedua Kelompok
H 0 : 1 2 H 1 : 1 2
Diharapkan dari uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok. Pada SPSS, uji ini dilakukan secara univariate (jadi yang diuji bukan berupa vektor), dengan bantuan tabel Tests of Equality of Group Means . 3. Dilanjutkan pemeriksaan asumsi homoskedastisitas, homoskedastisitas, dengan uji
Box’s M.
Diharapkan
dari uji ini hipotesisi nol tidak ditolak ( H 0 : 1 2 ). 4. Pembentukan model diskriminan a. Kriteria Fungsi Linier Fisher
Pembentukan Fungsi Fungsi Linier (teoritis) Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang dihitung dari suatu fungsi linier Y ' X dimana ' menyatakan vektor yang berisi koefisien-koefisien variabel penjelas yang membentuk persamaan linier terhadap variabel respon, ' 1 , 2 , ..., p
X 1 X X 2 X k menyatakan matriks data padakelomok ke-k
X 11k X12 k . . . X 1 pk X 21k X22 k . . . X 2 pk i 1, 2, ...., n . . . j 1, 2, ...., p X k . . . . k 1, 2 . . X n1k X n2 k . . . X npk X ijk menyatakan observasi observasi ke-i variabel ke-j pada kelompok ke-k
Di bawah asumsi X k
N ( k .k ) maka
E ( X 1 ) 1 dan E X ( ) 2 2
k
E( X k k ) (X k k ) ' ; 1 2
1k . k . ; k adalah vektor rata-rata tiap variable X pada kelompok ke-k . pk 11 . . . .
12 .
.
22 .
.
.
.
.
.
.
.
.
.
.
. 1 p . 22 . . . . . pp
variansi variansi variab variabel el j apabila apabila j1 =j2
j1 j2 {
kovari kovarians ans varia variabel bel j1 dan j2 apabila apabila j1 ¹j2
Fisher mentransformasikan observasi-observasi x yang multivariate menjadi observasi observasi y yang univariate. Dari persamaan Y X diperoleh
ky E (Yk ) E( ' X ) ' k Y 2 var( ' X ) '
;
;
ky adalah rata-rata Y yang diperoleh dari X yang termasuk dalam kelompok ke-k Y 2 adalah varians Y dan diasumsikan sama untuk kedua kelompok.
Kombinasi linier yang terbaik menurut Fisher adalah yang dapat memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh dari x dari kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai berikut:
( 1Y 2Y ) 2
Y
2
'(1 2 )(1 2 ) ' '
Jika (1 2 ) makapersamaan di atas menjadi
( )
2
'
. Karena Σ adalah
matriks definit positif, maka menurut teori pertidaksamaan CauchySchwartz , rasio
( )
2
'
dapat dimaksimumkan jika
' c1 c 1 ( 1 2 )
dengan memilih c=1, menghasilkan kombinasi linier yang disebut kombinasi linier Fisher sebagai berikut: Y ' X (1 2 ) 1 X
Pembentukan Fungsi Linier (dengan bantuan SPSS) Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam model dapat dilihat pada tabel Canonical Discriminant Function Coefficient . Tabel ini akandihasilkan pada output apabila pilihan Function Coefficient bagian Unstandardized diaktifkan.
Menghitung discriminant score Setelah dibentuk fungsi liniernya, maka dapat dihitung skor diskriminan untuk tiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. penjelasnya.
Menghitung cutting score Cutting score (m) dapat dihitung dengan rumus sebagai berikut m
n11Y n2 2Y n1 n2
nk adalah jumlah sampel pada kelompok ke-k, k=1,2
Kemudian nilai-nilai discriminant score tiap observasi akan dibandingkan
dengan
cutting
score ,
sehingga
dapat
diklasifikasikan suatu observasi akan termasuk ke dalam kelompok yang mana. Suatu observasi dengan karakteristik x akan diklasifikasikan
sebagai
anggota
kelompok
kode
1
jika
y ( 1 2 ) ' 1x m, selain itu dimasukkan ke dalam kelompok
2(kodenol). Penghitungan m dilakukan secara manual, karena
SPSS tidak mengeluarkan output m. Namun, kita dapat menghitung m dengan bantuan tabel Function at Group Centroids dari output SPSS.
Penghitungan Hit Ratio (dalam model regresi logistik disebut percentage correct )
Setelah semua observasi diprediksi keanggotaannya, dapatdihitung hit
ratio ,
yaitu
rasio
antara
observasi
yang
tepat
pengklasifikasiannya pengklasifikasiannya dengan total seluruh observasi. b. Kriteria posterior probability probability Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x) berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option probabilities of group membership padabagian Save di kotak dialog utama.
P(k x)
pk f k ( x)
p
k
f k ( x)
k
Dimana pk adalah prior probability probability kelompok ke-k dan
f k ( x)
1 p
(2 )
2
1
exp 2
1 2
( x k ) ( x k ); k 0,1 1
Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok 0 jika P(k 0 x) P(k 1 x ) . b. Aplikasi dengan Menggunakan SPSS KASUS
Sebuah
perusahaan
bergerak
dalam
penjualan
Air
Mineral
Dalam
mengumpulkan data sekelompok konsumen air mineral dengan variabel berikut;
Tipe konsumen dari banyak tipe Air Mineral yang minum dengan kode:
Kemasan
Kode 0 = SEDIKIT (konsumne yang termasuk tipe sedikit minum air mineral) Kode 1 = BANYAK (konsumen yang termasuk tipe bnayak minum air Mineral)
Usia konsumen (tahun)
Berat badan konsumen (kilogram)
Tinggi badan konsumen (centimeter)
Pendapatan konsumen (ribuan rupiah/bulan)
Jam kerja konsumen dalam sehari (jam)
Kegiatan olahraga olahraga konsumen konsumen dalam sehari (jam)
Dari kasus diatas akan dilakukan analisis diskriminan untuk mengetahui:
Apakah ada perbedaan yang signifikan antara konsumen yang banyak minum air mineral dengan konsumen yang sedikit minum air mineral?
Jika ada perbedaan yang signifikan, variabel apa saja yang membuat perilaku konsumsi air mineral mereka berbeda?
Membuat model diskriminan dua faktor (tipe sedikit dan tipe banyak) untuk kasus tersebut
Menguji ketepatan model (fungsi) diskriminan
TAHAPAN PENGUJIAN ANALISIS DISKRIMINAN A. MENGUJI VARIABEL MENILAI VARIABEL YANG LAYAK UNTUK ANALISIS
Dari SPSS diperoleh output sebagai berikut,
Tests of Equality of Group Means Wilks' Lambda .945
F 4.247
BERAT
.934
TINGGI INCOME
1
73
Sig. .043
5.173
1
73
.026
.946
4.186
1
73
.044
.894
8.656
1
73
.004
JAMKERJA
1.000
.000
1
73
.994
OLAHRAGA
.946
4.183
1
73
.044
USIA
df 1
df 2
Analisis
Tabel diatas adalah hasilpengujian untuk setiap variabel bebas yang ada. Keputusan bisa diambil lewat dua cara.
Dengan angka Wilk’s Lambda Angka wilk’s Lambda berkisar antara 0 sampai 1. Jika angka angka mendekati 0 maka data tiap group cenderung berbeda, sedangkan jika angka mendekati 1 maka data tiap group cenderung sama. Dari tabel terlihat angka Wilk’s Lambda berkisar berkis ar antara 0.894 sampai 1.000. Dari kolom signifikan signifikan
dilihat bahwa hanya hanya variable variable Jam Kerja Kerja yang cenderung tidak
berbeda. Hal ini berarti jam kerja untuk mereka yang sedikit atau banyak mengkonsumsi mengkonsumsi air mineral tidak berbeda secara nyata.
Dengan F test Perhatikan angka signifikan. Jika sig. > 0.05 berarti tidak ada perbedaan antar grup Jika sig < 0.05 berarti ada perbedaan antar grup Analisis dari data diatas adalah
Variabel Usia, angka sig. < 0.05 (yaitu; 0.043). Hal ini berarti ada perbedaan antar grup, atau usia responden memengaruhi memengaruhi banyak sedikitnya mengkonsumsi mengkonsumsi air mineral.
Variabel Berat, angka sig. < 0.05 (yaitu; 0.026). Hal ini berarti ada perbedaan antar grup, atau berat badan responden memengaruhi banyak sedikitnya mengkonsumsi mengkonsumsi air mineral.
Variabel Tinggi, angka sig. < 0.05 (yaitu; 0.044). Hal ini berarti ada perbedaan antar grup, atau tinggi responden memengaruhi banyak sedikitnya mengkonsumsi mengkonsumsi air mineral.
Variabel Income, angka sig. < 0.05 (yaitu; 0.004). Hal ini berarti ada perbedaan antar grup, atau income responden memengaruhi banyak banyak sedikitnya mengkonsumsi mengkonsumsi air mineral.
Variabel Jam Kerja, angka sig. > 0.05 (yaitu; 0.994). Hal ini berarti tidak ada perbedaan antar grup, atau jam kerja responden tidak memengaruhi banyak sedikitnya mengkonsumsi mengkonsumsi air mineral.
Variabel Olah Raga, angka sig. < 0.05 (yaitu; 0.44). Hal ini berarti ada perbedaan antar grup, atau olah raga responden memengaruhi banyak sedikitnya mengkonsumsi mengkonsumsi air mineral.
Dari 6 varible tersebut ada lima variabel berbeda secara signifikan untuk dua group diskriminan, yaitu USIA, BERAT, TINGGI, INCOME, OLAH RAGA. Dengan demikian sedikit atau banyaknya konsumsi air mineral dipengaruhi oleh variabel-variabel tersebut. UJI VARIANS DARI SETIAP VARIABEL ,
Uji selanjutnya adalah menguji varians dari setiap variabel. Dapat dilakukan dengan dua cara yaitu dengan Box’s M atau a tau dilihat dari output LOG DETERMINANT. DETERMINANT. Analisis diskriminan mempunyai asumsi bahwa:
Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian, seharusnya seharusnya varians dari responden yang sedikit mengkonsumsi mengkonsumsi air mineral sama dengan varians dari responden yang banyak mengonsumsi air mineral.
Varians diantara variabel-variabel bebas seharusnya juga sama. Jika demikian, seharusnya seharusnya varians dari income sama dengan varians dari olah raga.
Kedua pengertian diatas bisa disimpulkan, seharusnya group covariance matrices adalah relatif sama, yang di uji dengan alat Box’s M dengan ketentuan:
HIPOTESIS
: group covariance matrices adalah relatif sama : group covariance matrices adalah berbeda secara nyata
Keputusan dengan dengan dasar signifikansi (lihat angka sig.) Jika sig >0.05 berarti diterima Jika sig<0.05 berarti ditolak
Dari SPSS diperoleh output sebagai berikut
Test Results Box's M F
29.866 Approx. Approx.
1.297
df1 df 1
21
df2 df 2
19569.371
Sig.
.163
Tests null hypothesis hy pothesis of equal equal populatio at ion n cov ariance ariance matrices.
Analisis
Dari tabel terlihat bahwa bahwa angka sig. sig. > 0,05, yaitu 0.163 yang menerima berarti group covariance matrices adalah relatif sama. Hal ini berarti data di atas sudah memenuhi
asumsi analisis diskriminan.
Log Determinants
6
Log Determinant 14.081
1.00
6
14.520
Pooled within-groups
6
14.706
MINUM .00
Rank
The The ranks and natural logarithms logarithms of determinants printed printed are those of the group group cov ariance ariance matrices.
Analisis
Terlihat angka log determinant untuk kategori SEDIKIT (14,081) dan BANYAK (14,520) tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua grup. B. MELAKUKAN ANALISIS DISKRIMINAN
Dari SPSS diperoleh output sebagai berikut
Group Statistics Valid N (listwise) MINUM .00
1.00
Total
USIA
Mean 31. 8684
Std. td. Dev iati iatio on 6. 1256
Unw Unweigh ighted ted 38
Weig Weight hte ed 38. 000
BERAT
57. 2105
11. 7661
38
38.000
TINGGI
158. 4474
5. 6650
38
38.000
INCOME
659. 4737
106. 7948
38
38. 000
JAMKERJA
5.2684
.1110
38
38 3 8. 000
OLAHRAGA
3.1974
.5538
38
38 3 8. 000
USIA
28. 9459
6. 1552
37
37. 000
BERAT
51. 8108
8. 4848
37
37. 000
TINGGI
161. 5676
7. 4444
37
37.000
INCOME
578. 9189
129. 5244
37
37. 000
JAMKERJA
5.2686
.1567
37
37 3 7. 000
OLAHRAGA
2.9054
.6778
37
37 3 7. 000
USIA
30. 4267
6. 2734
75
75. 000
BERAT
54. 5467
10. 5655
75
75.000
TINGGI
159. 9867
6. 7434
75
75.000
INCOME
619. 7333
124. 5313
75
75. 000
JAMKERJA
5.2685
.1345
75
75 7 5. 000
OLAHRAGA
3.0533
.6312
75
75 7 5. 000
Analisis
Tabel GROUP STATISTICS pada dasarnya berisi data statistic yang utama, yaitu rata -rata dan standar deviasi dari kedua grup konsumen. Misalnya, Konsumen yang termasuk tipe SEDIKIT meminum air mineral mempunyai berat badan rata-rata 57,21 kilogram. Sedangkan konsumen yang termasuk tipe BANYAK meminum air mineral mempunyai berat badan rata-rata 51,81 kilogram. Terlihat bahwa ada 38 responden yang tergolong sedikit mengonsumsi air mineral, sedangkan 37 responden lainnya tergolong banyak mengonsumsi air mineral. Semua variabel terisi angka 38 atau 37, maka pada kasus ini tidak ada data yang hilang, sehingga total data untuk semua variabel adalah 75 buah. Tentu ini adalah keadaan yang ideal.
Variables Entered/Removeda,b,c,d Min. Min. D Squared
Step 1 2 3
Ente ntered red
Stati tatisti stic c
I N C OME
.462
BERAT
.776
TI N GGI
1. 208
Between Groups .00 and 1.00
Exact F St at ist ic
df 1
df 2
Sig.
8.656
1
73.000
4. 367E-03
.00 and 1.00
7.170
2
72.000
1. 446E-03
.00 and 1.00
7.343
3
71.000
2. 351E-04
At each st ep, ep, the v ariable ariable that maximizes maximizes t he Mahala Mahalanobi nobis dist ance between between the t wo closest groups is entered. a. Maximum number of steps is 12. b. Maximum Maximum signif icance icance of F to ent ent er is .05. c. Minimum nimum signific ance of F to rem rem ov e is .10. d. F lev el, t olera olerance, nce, or VIN VIN insuf f icient icient f or f urther computation.
Analisis
Tabel ini menyajikan variabel mana dari variabel input yang bisa dimasukkan ke dalam persamaan diskriminan. Karena proses adalah stepwise (bertahap), maka akan dimulai dengan variabel yang mempunyai mempunyai angka F hitung ( statistic) terbesar. Tahap pemasukan variabel bebas:
Pada tahap pertama, angka F hitung variabel Income adalah terbesar, mencapai 8.656 maka pada tahap ini variabel Income terpilih.
Pada tahap kedua, dengan variabel yang berkurang satu, angka F hitung terbesar kedua adalah Berat,mencapai 7.170 maka pada tahap kedua ini i ni variabel Berat terpilih.
Pada tahap ketiga, dengan variabel sudah berkurang dua, angka F hitung terbesar ketiga adalah Tinggi, mencapai 7.343, maka pada tahap ketiga ini variabel Tinggi terpilih.
Ketiga variabel tersebut mempunyai angka sig. < 0.05 yaitu angka sig. Income adalah 4.367E-03 < 0.05, angka sig. Berat adalah 1.446E-03 < 0.05, angka sig. Tinggi adalah 2.351E-04 < 0.05.
Dengan demikian, dari lima variabel yang dimasukkan hanya ada tiga variabel yang signifikan. Dengan kata lain Income, Berat, Tinggi konsumen memengaruhi perilaku konsumen tersebut sedikit atau banyak minum air mineral.
Variables in the Analysis
Step 1
INCOME
2
INCOME BERAT
3
INCOME BERAT TINGGI
Tolerance 1.000
Sig. Sig. of of F to Remove .004
Min. D Squared
Between Groups
.997
.004
.276
.00 and 1.00
.997
.026
.462
.00 and 1.00
.993
.004
.647
.00 and 1.00
.944
.008
.721
.00 and 1.00
.943
.012
.776
.00 and 1.00
Analisis
Pada Step 1, variabel Income adalah variabel pertama yang masuk ke dalam model diskriminan. Karena variabel tersebut mempunyai mempunyai angka sig. of F to remove yang paling sedikit, yaitu 0.004. < 0.05
Pada Step 2, dimasukkan variabel kedua, yaitu Berat. Karena mempunyai angka sig. 0f F to remove sebesar 0.26 < 0.05.
Pada Step 3, dimasukkan variabel ketiga, yaitu Tinggi. Karena mempunyai angka sig. of F to remove sebesar 0.012 < 0.05.
Variables Not in the Analysis
Step 0
Tolerance USIA BERAT TINGGI INCOME JAMKERJA OLAHRAGA
1
USIA BERAT TINGGI JAMKERJA OLAHRAGA
2
USIA TINGGI JAMKERJA OLAHRAGA
3
USIA JAMKERJA OLAHRAGA
Min. Tolerance
Sig. Sig. of F to Enter
Min. D Squared
Between Groups .00 and 1.00
1. 000
1. 000
.043
. 227
1. 000
1. 000
.026
. 276
.00 and 1.00
1. 000
1. 000
.044
. 223
.00 and 1.00
1. 000
1. 000
.004
. 462
.00 and 1.00
1. 000
1. 000
.994
. 000
.00 and 1.00
1. 000
1. 000
.044
. 223
.00 and 1.00
.318
. 318
. 542
.484
.00 and 1.00
.997
. 997
. 026
.776
.00 and 1.00
.997
. 997
. 042
.721
.00 and 1.00
1. 000
1. 000
.952
. 462
.00 and 1.00
.538
. 538
. 953
.462
.00 and 1.00
.317
. 316
. 458
.812
.00 and 1.00
.943
. 943
. 012
1. 208
.00 and 1.00
.995
. 993
. 837
.778
.00 and 1.00
.537
. 537
. 876
.777
.00 and 1.00
.316
. 316
. 524
1. 238
.00 and 1.00
.958
. 908
. 779
1. 214
.00 and 1.00
.523
. 523
. 798
1. 213
.00 and 1.00
Analisis
Pada Step 0, keenam variabel secara lengkap ditayangkan dengan angka sig. of F to remove sebagai fakor uji. Angka sig. of F to remove variabel Income terkecil yaitu 0.004 < 0.05. Maka variabel Income dikeluarkan dari step 0, yang berarti variabel Income bukan termasuk variabel yang tidak dianalisis.
Pada Step 1, tersisa lima variabel. Angka sig. of F to remove variabel Berat terkecil yaitu 0.026 < 0.05. Maka variabel Berat dikeluarkan dari step 1, yang berarti variabel Berat bukan termasuk variabel yang tidak dianalisis.
Pada Step 2, tersisa empat variabel. Angka sig. of F to remove variabel Tinggi terkecil yaitu 0.012< 0.05. Maka variabel Tinggi dikeluarkan dari step 2, yang berarti variabel Tinggi bukan termasuk variabel yang tidak dianalisis.
Pada Step 3, tersisa t ersisa tiga variabel. Angka sig. of F to remove ketiga variabel tersebut lebih dari 0.05. Maka variabel variabel tersebut tidak dikeluarkan dari step 3, yang yang berarti variabel Tinggi termasuk variabel yang tidak dianalisis. Wilks' Lambda
Exact F
Number of Variables 1
Lambda . 894
2
2
3
3
Step 1
df 1
df 2
df 3
1
1
73
Stat ist ic 8.656
. 834
2
1
73
. 763
3
1
73
df 1 1
df 2 73. 000
Sig. 4. 367E-03
7.170
2
72. 000
1. 446E-03
7.343
3
71. 000
2. 351E-04
Wilk’s Lambda pada prinsipnya prinsipn ya adalah varians total dalam discriminant scores yang tidak bisa dijelaskan oleh perbedaan di antara grup-grup yang ada. Analisis
Pada Step 1, jumlah variabel varia bel yang dimasukkan ada satu Income dengan angka Wilk’s Lambda adalah 0.894. hal ini berarti 89,4 % varians tidak dapat dijelaskan perbedaan antara grup-grup.
Pada Step 2, dengan tambahan variabel Berat, angka Wilk’s Lambda turun menjadi 0.834.
Pada Step 3, angka Wilk’s Lambda turun menjadi 0.763. penurunan angka Wilk’s Lambda baik untuk model diskriminan, karena varians yang tidak bisa dij elaskan juga semakin kecil.
Summary of Canonical Discriminant Functions
Eigenvalues
Function 1
Eigenvalu value e % of Varian iance a .310 100.0
Cum Cumulativ tiv e % 100.0
Canonical Correlation .487
a. First 1 canonical discriminant functions were used in the analysis.
Analisis Canonical Correlation mengukur keeratan hubungan antara discriminant score dengan
grup (pada kasus ini, karena ada dua tipe konsumen, maka ada dua grup). Angka 0.487 menunjukkan keeratan yang cukup tinggi, dengan skala asosiasi antara 0 sampai 1.
Wilks' Lambda
Test Test of Function(s) Function(s) 1
Wilks' Lambda .763
C hi- squar e 19.321
df 3
Sig. .000
Analisis
Tabel diatas menyatakan menyat akan angka akhir dari Wilk’s Lambda. Angka Chi -Square sebesar 19.321 dengan tingkat signifikansi yang tinggi menunjukkan perbedaan yang jelas antara dua grup konsumen.
Structure Matrix Function INCOME
1 .618
USIAa
.521
BERAT
.478
OLAHRAGAa
.475
TINGGI
-.430
JAMKERJAa
-.069
Pooled within-groups correlations between discriminating v ariables and standardiz st andardized ed canonical discriminant f unctions uncti ons Variables Variables ordered by absolute size of correlation c orrelation within within f unction. uncti on. a. This v ariable ariable not used in the analy analy sis.
Analisis
Tabel diatas menjelaskan korelasi antara variabel independen dengan fungsi diskriminan yang terbentuk. Varibel Income paling erat hubungannya hubungannya dengan fungsi diskriminan, diikuti oleh variabel Berat dan Tinggi. Ti nggi.
anonical Discriminant Function Coefficients Function BERAT
1 .064
TINGGI
-.093
INCOME (Constant)
.006 7.884
Unstandardi Unstandardize zed d coef f icient icient s
Analisis
Tabel diatas menunjukkan FUNGSI DISKRIMINAN:
Kegunaan fungsi ini untuk mengetahui seorang konsumen air mineral masuk pada Grup yang kesatu atau tergolong pada Grup yang kedua.
Functions at Group C entroids entroids Function MINUM .00
1 .542
1.00
-.557
Unstandardized canonical discriminant f unct unct ions ions ev aluated aluated at at group group means means
Analisis
Karena ada dua tipe konsumen, maka disebut Two-Group Discriminant, dimana grup yang satu mempunyai Centroid (Grup Means) negative, dan grup yang satu mempunyai Centroid (Grup Means) positif. Angka pada tabel menunjukkan besaran Z yang memisahkan kedua grup tersebut. t ersebut.
Gambar :
BANYA
SEDIK
Z= - 0,557
Z= 0,542
0 N=3
N=3
Terlihat distribusi anggota grup dengan kode 0 (sedikit) ( sedikit) dan kode 1 (bany ( banyak) ak) , dimana dari 75 responden, 37 orang pada Grup Banyak, dan 38 orang ada pada Grup Sedikit.
Prior Probabiliti es for for Groups
Cases Used in Analy Analy sis MINUM .00
Prior .500
U nweighted 38
Weighted 38.000
1.00
.500
37
37.000
Total
1.000
75
75.000
Analisis
Tabel diatas memperihatkan komposisi ke 75 responden, yang dengan model diskriminan menghasilkan 37 responden ada di Grup Banyak dan 38 responden ada di Grup Sedikit.
Classification Function Coefficients MINUM BERAT
.00 3.50 .506E-02 -02
1.00 -3.48 .48E-0 E-02
TINGGI
3.587
3.690
3.64 .641E-02 -02
3.00 .007E-02 -02
-297.882
-306.557
INCOME (Constant)
Fisher's linear discriminan discriminantt f unctions
Analisis
Memberikan persamaan dengan pembagian berdasrkan Grup. Konsumen yang minum air mineral dalam kategori Sedikit:
SCORE = -297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME Konsumen yang minum air mineral dalam kategori Banyak:
SCORE = -306,557 – -306,557 – 3,48E-02 3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME
Selisih antara Grup Sedikit dengan Grup Banyak adalah (-297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME) - (306,557 – 3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME) Atau – 0,103 TINGGI + 0,00634 INCOME Z Score = 8,675 + 0,06986 BERAT – 0,103 Disebut fungsi diskriminan dari Fisher yang hampir sama dengan fungsi Unstandarized sebelumnya.
Analisis
Pada tabel Discriminant Score menunjukkan penghitungan score dari perilaku konsumen dalam mengonsumsi air mineral. Hasil score tersebut selanjutnya akan dibandingkan dengan cut off score, untuk mengetahui apakah konsumen masuk dalam Grup Sedikit atau Grup banyak.
Prior Probabiliti es for for Groups
Cases Used in Analy Analy sis MINUM .00
Prior .500
U nweighted 38
Weighted 38.000
1.00
.500
37
37.000
Total
1.000
75
75.000
Dari tabel diatas didapat jumlah responden Sedikit adalah 38 orang, sedangkan responden Banyak adalah 37 orang. Dengan demikian dengan mengaitkannya dengan angka grup centroid, didapat:
( ) ( ) atau praktis sama dengan 0 Perhitungan (angka kriris):
Dimana:
: Angka kritis, yang berfungsi sebagai cut off score : jumlah sampel dari grup A dan B, yang dalam kasus ini adalah grup Sedikit dan Banyak
: angka centroid pada Grup A dan B Perhitungan :
Penggunaan angka (Discriminating Z score):
Angka skor kasus diatas masuk ke grup Sedikit (kode 0)
Angka skor kasus dibawah masuk ke grup Banyak (kode 1)
Sebagai contoh:
Case number 1 (Rusdi) mempunyai score 1,571. Karena 1,571 > 0, maka Rusdi masuk pada grup 0 (Sedikit).
Case number 2 (Nina) mempunyai score 1,724. Karena 1,724 > 0, maka Nina masuk pada grup 0 (Sedikit).
Case number 15 (Esti) mempunyai mempunyai score -0,223. Karena Karena -0,223 < 0, maka Esti masuk pada grup 1 (Banyak).
Kesimpulan: Konsumen yang masuk pada tipe SEDIKIT adalah Rusdi, Nina, Lanny, Citra, Dina, Lenny, Rudi, Roby, Bambang, Yunus, Lestari, Erni, Hesty, Lilis, Lita, Rani, Hengky, Hana, Eli, Renata, Dewe, Jodan, Rina, Herman, Sobari, Rully, Leoni, Agnes, Deddy, Dodik, Conny, Mary, Susy, James, Joni, Melani, Susana, Titik, Nanik, Nuning. Konsumen yang masuk pada tipe BANYAK adalah Siska, Lusi, Esti, Hany, Susan, Lina, Baby, Andre, Gunawan, Lina, Vina, Sugeng, Handoko, Binsar, Fanny, Fenny, Yulita, Yulia, Richard, Rosy, Dimas, Kiky, Usman, Salim, Joni, Kristanto, Karim, Rusmin, Sulastri, Liliana, Prihardi, Suhardi, Tatik, Ninik, Gala. b,c Classification Resultsb,c
Predict Predicted ed Group Membership Original
Count
MINUM .00
Cross-validateda
Count %
1.00
Total
27
11
38
13
24
37
.00
71.1
28.9
100.0
1.00
35.1
64.9
100.0
.00
27
11
38
1.00
13
24
37
.00
71.1
28.9
100.0
1.00
35.1
64.9
100.0
1.00 %
.00
a. Cross validation is done only for those cases in the analysis. In cross v alidation, alidation, each case is classif classif ied ied by by the f unctions unctions deriv deriv ed f rom all cases cases ot her her than t han that that case. b. 68.0% of original original groupe grouped d cases corr c orrect ect ly classif ied. ied. c. 68.0% of cross-v alidated groupe grouped d cases correctly correctly classif ied.
Analisis
Pada tabel diatas, perhatikan bagian Original, terlihat bahwa mereka yang pada data awal adalah tergolong Sedikit, dan dari klasifikasi Fungsi Diskriminan tetap pada kelompok Sedikit adalah 27 orang. Sedangkan dengan model diskriminan, mereka yang awalnya masuk grup Sedikit, ternyata menjadi anggota grup Banyak adalah 11 orang. Demikian juga dengan grup Banyak yang tetap pada grup Banyak sejumlah 24 orang dan yang tidak di grup Banyak adalah 13 orang. Dengan demikian, ketepatan prediksi dari model adalah:
Karena angka ketepatan tinggi maka model diskriminan di atas sebenarnya sebenarnya bisa digunakan untuk analisis diskriminan. Setelah terbukti bahwa Fungsi Diskriminan mempunyai ketepatan prediksi yang tinggi, maka fungsi diskriminan tersebut bisa digunakan untuk memprediksi sebuah kasus, apakah akan diklasifikasikan ke tipe sedikit atau tipe banyak. Kesimpulan
Dari proses diskriminan, dimulai dimulai uji variabel sampai sampai analisis output, sehingga sehingga didapat kesimpulan yang terkait dengan tujuan awal.
Ada perbedaan yang signifikan antara konsumen yang banyak minum dengan konsumen yang sedikit minum air mineral. Hal ini dibuktikan pada analisis Wilk’s Lambda.
Variabel yang membuat perilaku konsumsi air mineral mereka berbeda adalah Berat Badan, Tinggi Bada, dan Income.
Model atau fungsi diskriminan untuk kasus tersebut adalah:
Model (fungsi) diskriminan diatas di atas mempunyai mempunyai ketepatan mengklasifikasi mengklasifikasi kasus sebesar 68 %. Karena diatas 50 %, ketepatan model dianggap tinggi dan model bisa digunakn untuk mengklasifikasi sebuah kasus pada tipe minum tertentu.
BAB III PENUTUP Kesimpulan
Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan untuk mengelompokkan atau mengklasifikasi mengklasifikasi suatu objek dalam dua kelompok atau lebih berdasarkan variabel independentnya. Asumsi analisis diskriminan yang harus dipenuhi adalah : Multivariate 5. Variabel independen seharusnya berdistribusi normal multivariat ( Multivariate Normality)..
6. Matriks varians kovarians grup dari semua variabel independen seharusnya seharusnya sama. 7. Tidak ada data yang sangat ekstrim ( outlier ) pada variabel independen i ndependen.. .. 8. Tidak ada korelasi yang kuat antar-variabel independen. Fungsi diskriminannya Y b0 b1 X i1 b2 X i 2 ... b j X ij Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam variabel independen, seharusnya minimal ada 6x5=30 sampel. Tujuan diskriminan secara umum adalah :
Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan anggota grup 2.
Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan.
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk grup 1 atau grup 2, atau lainnya.
Proses dasar analisis diskriminan :
Memisah variabel-variabel menjadi variabel dependen dan Variabel Independen.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yaitu: 5. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan. 6. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari model.
Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s Lambda, Pilai, F test dan lainnya.
Menguji ketetapan klasifikasi dari
fungsi diskriminan, termasuk termasuk mengetahui mengetahui
ketetpan klasifikasi secara individual dengan casewise Diagnotics.
Melakukan interpretasi terhadap fungsi diskrimminan tersebut.
Melekukan uji validasi fungsi diskriminan.