TUGAS MULTIVARIATE Studi Kasus Analisis Diskriminan
DOSEN PENGAMPU: Dr. Ir. Solimun, MS
OLEH: NUR AZIZAH - 176090500111001
PROGRAM STUDI MAGISTER STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS BRAWIJAYA MALANG 2017
1|P a g e
Nur Azizah
- Multivariate
Analisis Diskriminan I.
STUDI KASUS
Studi kasus pada makalah ini diperoleh data dari Direktori Perbankan Indonesia pada Bank Indonesia. Tujuan dari analisis ini untuk mengetahui variabel apa yang berperan kuat sebagai pembeda antara jenis-jenis Bank yang ada di Indonesia sehingga bank tersebut dikategorikan sebagai Bank Devisa, Bank Non Devisa dan Bank Campuran. Adapun variabel prediktor yang digunakan yaitu X 1-X4 dalam satuan %, dengan detail berikut:
Y
X1 X2 X3 X4
Jenis Bank, dimana klasifikasinya sebagai berikut be rikut 1: Bank Devisa 2: Bank Non Devisa 3: Bank Campuran Cadangan kerugian penurunan nilai (CKPN) aset keuangan terhadap aset produktif (Impairment provision on earning assets to total earning assets) (ROA) Return on Asset (ROA) (ROE) Return on Equity (ROE) Biaya Operasional terhadap Pendapatan Operasional (BOPO) (Operating Expenses to Operating Revenues)
Definisi tipe bank: Bank Devisa adalah bank umum swasta nasional devisa, yaitu bank yang sebagian besar modalnya
dimiliki oleh pihak swasta non asing dan dapat melakukan transaksi dengan luar negeri atau berkaitan dengan valuta asing. Bank Non Devisa adalah bank umum swasta nasional non devisa, yaitu bank yang sebagian besar
modal nya dimiliki oleh pihak swasta non asing dan hanya dapat melayani transaksi-transaksi di dalam negeri (domestik) dan tidak berakaitan dengan valuta asing. be rsama oleh satu atau lebih bank umum yang Bank Campuran adalah bank umum yang didirikan bersama berkedudukan di Indonesia dan didirikan oleh WNI (dan atau badan hukum Indonesia yang dimiliki sepenuhnya oleh WNI), dengan satu atau lebih bank yang berkedudukan di luar negeri. Data diperoleh dari Perhitungan Rasio Keuangan (Financial Ratio Calculations) 26 Bank di Indonesia pada Desember 2012 dimana Bank Devisa sebanyak 9 bank, Bank Non Devisa sebanyak 8 bank dan Bank Campuran sebanyak 9 bank. Berikut hasil output dari software yang digunakan untuk melakukan analisis diskriminan. Dimana software yang digunakan antara lain: 1. Software Stata 2. Software NCSS 3. Software XLStat 4. Software SAS
2|P a g e
Nur Azizah
- Multivariate
II.
HASIL OUTPUT
1. Software Stata a) Uji Manova
Dengan memasukkan coding pada software Stata, diperoleh hasil output sebagai berikut: manova x1 x2 x3 x4 = y
Output: Number of obs = W = Wilks' lambda P = Pillai's trace
26 L = Lawley-Hotelling trace R = Roy's largest root
Source | Statistic df F(df1, df2) = F Prob>F -----------+-------------------------------------------------y | W 0.4477 2 8.0 40.0 2.47 0.0280 | P 0.6418 8.0 42.0 2.48 0.0266 | L 1.0335 8.0 38.0 2.45 0.0300 | R 0.7756 4.0 21.0 4.07 0.0135 |-------------------------------------------------Residual | 23 -----------+-------------------------------------------------Total | 25 -------------------------------------------------------------e = exact, a = approximate, u = upper bound on F
e a a u
b) Uji Asumsi
-
Normalitas
. mvtest normality x1 x2 x3 x4, univariate stats(all)
Output: Test for univariate normality --------------------------------------------------------------------| ------- joint ----- Variable | Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+------------------------------------------------------x1 | 0.0029 0.0395 10.53 0.0052 x2 | 0.3571 0.3462 1.90 0.3871 x3 | 0.1788 0.9200 1.99 0.3696 x4 | 0.0153 0.1013 7.48 0.0238 --------------------------------------------------------------------Test for multivariate normality Mardia mSkewness = Mardia mKurtosis = Henze-Zirkler = Doornik-Hansen
3|P a g e
10.41385 29.94428 1.460683
chi2(20) chi2(1) chi2(1) chi2(8)
= = = =
52.675 4.785 23.486 43.895
Prob>chi2 Prob>chi2 Prob>chi2 Prob>chi2
Nur Azizah
= = = =
0.0001 0.0287 0.0000 0.0000
- Multivariate
-
Homoskedastisitas . mvtest covariances x1 x2 x3 x4, by(y)
Output: Test of equality of covariance matrices across 3 samples Modified LR chi2 = Box F(20,1839.9) = Box chi2(20) =
54.6124 2.02 40.94
Prob > F = Prob > chi2 =
0.0048 0.0038
c) Analisis Diskriminan . estat canontest Canonical linear discriminant analysis | | Like| Canon. EigenVariance | lihood Fcn | Corr. value Prop. Cumul. | Ratio F df1 df2 Prob>F ----+---------------------------------+-----------------------------------1 | 0.6609 .77564 0.7505 0.7505 | 0.4477 2.4725 8 40 0.0280 e 2 | 0.4528 .257866 0.2495 1.0000 | 0.7950 1.8051 3 21 0.1771 e --------------------------------------------------------------------------Ho: this and smaller canon. corr. are zero; e = exact F
. estat structure Canonical structure | function1 function2 -------------+---------------------x1 | -.0011598 -.1963836 x2 | -.0678182 -.4909404 x3 | -.6637531 -.3722427 x4 | -.0302743 .8913214 . estat loadings, unstandardized standardized Canonical discriminant function coefficients | function1 function2 -------------+---------------------x1 | .1156154 -.3979644 x2 | .9856944 .4336542 x3 | -.2144329 -.014611 x4 | .0007809 .1006879 _cons | .7053033 -8.375548
Standardized canonical discriminant function coefficients | function1 function2 -------------+---------------------x1 | .1302309 -.448273 x2 | 1.201698 .5286844 x3 | -1.630042 -.1110677 x4 | .0098345 1.267977
. estat summarize Estimation sample candisc
Number of obs =
26
------------------------------------------------------------ Variable | Mean Std. Dev. Min Max -------------+----------------------------------------------groupvar | y | 2 .8485281 1 3 -------------+-----------------------------------------------
4|P a g e
Nur Azizah
- Multivariate
variables
| x1 | 1.190385 1.085779 .06 4.42 x2 | 2.095769 1.207169 .29 4.71 x3 | 13.85923 8.55736 .22 32.58 x4 | 80.87308 13.26249 42.41 97.77 ------------------------------------------------------------. discrim lda x1 x2 x3 x4, group (y) Linear discriminant analysis Resubstitution classification summary +---------+ | Key | |---------| | Number | | Percent | +---------+ | Classified True y | 1 2 3 | Total -------------+------------------------+------1 | 8 0 1 | 9 | 88.89 0.00 11.11 | 100.00 | | 2 | 1 6 1 | 8 | 12.50 75.00 12.50 | 100.00 | | 3 | 2 3 4 | 9 | 22.22 33.33 44.44 | 100.00 -------------+------------------------+------Total | 11 9 6 | 26 | 42.31 34.62 23.08 | 100.00 | | Priors | 0.3333 0.3333 0.3333 |
2. Software NCSS a) Uji Manova
Tidak dapat dilakukan uji manova karena output yang dihasilkan sebagai berikut:
Sehingga pengecekan manova akan kita skip pada software ini
5|P a g e
Nur Azizah
- Multivariate
b) Uji Asumsi
-
Normalitas Normality Tests Report
Dataset
C:\...\3 Categori\Data Analisis Diskriminan 3 Kategori.NCSS
Normality Test Section of X1
Test Name Shapiro-Wilk W Anderson-Darling Martinez-Iglewicz Kolmogorov-Smirnov D'Agostino Skewness D'Agostino Kurtosis D'Agostino Omnibus
Test Value 0.854 1.160 1.580 0.200 2.980 2.059 13.121
Prob Level 0.0017 0.0050
0.0029 0.0395 0.0014
10% Critical Value
5% Critical Value
1.169 0.156 1.645 1.645 4.605
1.265 0.170 1.96 1.96 5.991
Decision (Alpha = 5%) Reject normality Reject normality Reject normality Reject normality Reject normality Reject normality Reject normality
Plots Section of X1
Normality Tests Report Dataset
C:\...\3 Categori\Data Analisis Diskriminan 3 Kategori.NCSS
Normality Test Section of X2
Test Name Shapiro-Wilk W Anderson-Darling Martinez-Iglewicz Kolmogorov-Smirnov D'Agostino Skewness D'Agostino Kurtosis D'Agostino Omnibus
6|P a g e
Test Value 0.962 0.320 0.978 0.087 0.921 -0.942 1.735
Prob Level 0.4271 0.5332
0.3571 0.3462 0.4199
10% Critical Value
5% Critical Value
1.169 0.156 1.645 1.645 4.605
1.265 0.170 1.96 1.96 5.991
Decision (Alpha = 5%) Can't reject normality Can't reject normality Can't reject normality Can't reject normality Can't reject normality Can't reject normality Can't reject normality
Nur Azizah
- Multivariate
Plots Section of X2
Normality Tests Report Dataset
C:\...\3 Categori\Data Analisis Diskriminan 3 Kategori.NCSS
Normality Test Section of X3
Test Name Shapiro-Wilk W Anderson-Darling Martinez-Iglewicz Kolmogorov-Smirnov D'Agostino Skewness D'Agostino Kurtosis D'Agostino Omnibus
Test Value 0.950 0.539 1.083 0.166 1.344 0.100 1.817
Prob Level 0.2261 0.1672
0.1788 0.9200 0.4031
10% Critical Value
5% Critical Value
1.169 0.156 1.645 1.645 4.605
1.265 0.170 1.96 1.96 5.991
Decision (Alpha = 5%) Can't reject normality Can't reject normality Can't reject normality Can't reject normality Can't reject normality Can't reject normality Can't reject normality
Plots Section of X3
7|P a g e
Nur Azizah
- Multivariate
Normality Tests Report Dataset
C:\...\3 Categori\Data Analisis Diskriminan 3 Kategori.NCSS
Normality Test Section of X4
Test Name Shapiro-Wilk W Anderson-Darling Martinez-Iglewicz Kolmogorov-Smirnov D'Agostino Skewness D'Agostino Kurtosis D'Agostino Omnibus
Test Value 0.917 0.581 1.231 0.101 -2.424 1.639 8.563
Prob Level 0.0379 0.1311
0.0153 0.1013 0.0138
10% Critical Value
5% Critical Value
1.169 0.156 1.645 1.645 4.605
1.265 0.170 1.96 1.96 5.991
Decision (Alpha = 5%) Reject normality Can't reject normality Can't reject normality Can't reject normality Reject normality Can't reject normality Reject normality
Plots Section of X4
-
Homoskedastisitas Equality of Covariance Matrices Report
Dataset Group
C:\...\3 Categori\Data Analisis Diskriminan 3 Kategori.NCSS Y
Bartlett-Box Homogeneity Tests Bartlett Value 3.2661 1.1503 1.9054 4.9040 54.6124
Variable X1 X2 X3 X4 Box's M
8|P a g e
DF1 2 2 2 2 20
DF2 1180 1180 1180 1180 1840
F Approx 1.54 0.54 0.90 2.32 2.02
F Prob 0.213796 0.581063 0.406756 0.098478 0.004848
Nur Azizah
Chi2 Approx 3.08 1.08 1.79 4.62 40.94
Chi2 Prob 0.214821 0.581776 0.407693 0.099339 0.003794
- Multivariate
c) Analisis Diskriminan Discriminant Analysis Report Dataset Dependent Prior Prob's
C:\...\3 Categori\Data Analisis Diskriminan 3 Kategori.NCSS Y Equal
Linear Discriminant Functions Y Variable 1 Constant -59.94957 X1 -2.94697 X2 10.22433 X3 0.0949913 X4 1.240069
2 -66.15358 -3.147075 11.93797 -0.2065504 1.331101
Classification Count Table for Y Predicted Actual 1 2 1 8 0 2 1 6 3 2 3 Total 11 9 Reduction in classification error due to X's = 53.8% Reduction in classification error due to X's = X1, X2, X3, X4
3 -56.43758 -2.627222 12.04145 -0.3192515 1.217673
3 1 1 4 6
Canonical Variate Analysis Section Inv(W)B Ind'l Total Canon Canon Fn Eigenvalue Pcnt Pcnt Corr Corr2 1 0.775640 75.0 75.0 0.6609 0.4368 2 0.257866 25.0 100.0 0.4528 0.2050 The F-value tests whether this function and those below it are significant.
Total 9 8 9 26
F-Value 2.5 1.8
Numer DF 8.0 3.0
Denom DF 40.0 21.0
Prob Level 0.0280 0.1771
Wilks' Lambda 0.447724 0.794997
Canonical Coefficients Canonical Variate Variate1 Variate2 0.705304 8.375549 0.115615 0.397964 0.985694 -0.433654 -0.214433 0.014611 0.000781 -0.100688
Variable Constant X1 X2 X3 X4
Std. Canonical Coefficients Canonical Variate Variable Variate1 Variate2 X1 0.130231 0.448273 X2 1.201698 -0.528685 X3 -1.630042 0.111068 X4 0.009834 -1.267977 Variable-Variate Correlations Canonical Variate Variable Variate1 Variate2 X1 -0.001160 0.196384 X2 -0.067818 0.490940 X3 -0.663753 0.372243 X4 -0.030274 -0.891321
9|P a g e
Nur Azizah
- Multivariate
3. Software XLStat a) Uji Manova Wilks' Lambda test (Rao's approximation): Lambda F (Observed value) F (Critical value) DF1 DF2 p-value alpha
0.4460 2.3623 2.1936 8 38 0.0359 0.05
Pillai's trace: Trace
0.6461
F (Observed value)
2.3862
F (Critical value)
2.1802
DF1
8
DF2
40
p-value
0.0332
alpha
0.05
Hotelling-Lawley trace: Trace F (Observed value) F (Critical value) DF1 DF2 p-value alpha
1.0354 2.3920 2.3383 8 25 0.0457 0.05
Roy's greatest root: Root
0.7654
F (Observed value)
3.8270
F (Critical value)
2.8661
DF1
4
DF2
20
p-value
0.0181
alpha
0.05
10 | P a g e
Nur Azizah
- Multivariate
b) Uji Asumsi
-
Normalitas
XLSTAT 2014.5.03 - Normality tests - on 10/8/2017 at 8:06:19 PM Data: Workbook = 3 Kategori.xlsx / Sheet = Sheet1 / Range = Sheet1!$B:$E / 26 rows and 4 columns Significance level (%): 5 Anderson-Darling test (X1):
A²
1.1242
p-value
0.0050
alpha
0.05
P-P plot (X1) 1
n o i t 0.9 u b 0.8 i r t s i 0.7 d e 0.6 v i t a 0.5 l u m0.4 u c l 0.3 a c i t 0.2 e r o 0.1 e h 0 T
0
0.2
0.4
0.6
0.8
1
Empirical cumulative distribution
Anderson-Darling test (X2):
A²
0.3100
p-value
0.5329
alpha
0.05
P-P plot (X2) 1 n 0.9 o i t u 0.8 b i r t s 0.7 i d e 0.6 v i t a l 0.5 u m u 0.4 c l a 0.3 c i t e r 0.2 o e h 0.1 T
0 0
0.2
0.4
0.6
0.8
1
Empirical cumulative distribution
11 | P a g e
Nur Azizah
- Multivariate
Anderson-Darling test (X3):
A²
0.5220
p-value
0.1672
alpha
0.05
P-P plot (X3) 1 n 0.9 o i t u 0.8 b i r t s i 0.7 d e 0.6 v i t a l 0.5 u m u 0.4 c l a 0.3 c i t e r 0.2 o e h 0.1 T
0 0
0.2
0.4
0.6
0.8
1
Empirical cumulative distribution
Anderson-Darling test (X4):
A²
0.5625
p-value
0.1311
alpha
0.05
P-P plot (X4) 1 n 0.9 o i t u 0.8 b i r t s i 0.7 d e 0.6 v i t a l 0.5 u m u 0.4 c l a 0.3 c i t e r 0.2 o e h 0.1 T
0 0
0.2
0.4
0.6
0.8
1
Empirical cumulative distribution
12 | P a g e
Nur Azizah
- Multivariate
-
Homoskedastisitas
Box test (Chi-square asymptotic approximation): -2Log(M)
50.1745
Chi-square (Observed value)
37.0403
Chi-square (Critical value)
31.4104
DF
20
p-value
0.0116
alpha
0.05
Box test (Fisher's F asymptotic approximation): -2Log(M)
50.1745
F (Observed value)
1.8223
F (Critical value)
1.5768
DF1
20
DF2
1687
p-value
0.0144
alpha
0.05
c) Analisis Diskriminan
Diperoleh output sebagai berikut XLSTAT 2014.5.03 - Discriminant Analysis (DA) - on 10/8/2017 at 6:41:46 PM Y / Qualitative: Workbook = Book1 / Sheet = Sheet1 / Range = Sheet1!$A:$A / 26 rows and 1 column X / Quantitative: Workbook = Book1 / Sheet = Sheet1 / Range = Sheet1!$B:$E / 26 rows and 4 columns Within-class covariance matrices are assumed to be equal Prior probabilities are taken into account Significance level (%): 5 Seed (random numbers): 4485746 Discriminant Analysis:
Multicolinearity statistics: Statistic
X1
X2
X3
X4
Tolerance
0.8780
0.2736
0.4636
0.4567
VIF
1.1390
3.6554
2.1572
2.1895
The risk to reject the null hypothesis H0 while it is true is lower than 3.59%. Eigenvalues: F1
F2
0.7654
0.2700
Discrimination (%)
73.9260
26.0740
Cumulative %
73.9260
100.0000
Eigenvalue
13 | P a g e
Nur Azizah
- Multivariate
Scree plot 0.9
100
0.8 80
0.7 e 0.6 u l a 0.5 v n 0.4 e g i E 0.3
60 40
0.2
20
0.1 0
0 F1
) % ( y t i l i b a i r a v e v i t a l u m u C
F2
axis
Bartlett's test for eigenvalue significancy: F1 Eigenvalue Bartlett's statistic
F2
0.7654
0.2700
16.5509
4.8992
0.0351
0.1793
p-value Variables/Factors correlations: F1
F2
X1
-0.0030
-0.2115
X2
0.1507
-0.5418
X3
0.7875
-0.3231
X4
-0.0335
0.9197
Canonical correlations: F1
F2
0.6667
0.4110
Canonical discriminant function coefficients: F1
F2
Intercept
-1.3298
-8.7415
X1
-0.1111
-0.3307
X2
-0.9398
0.5827
X3
0.2144
-0.0311
X4
0.0050
0.1038
Standardized canonical discriminant function coefficients: F1
F2
X1
-0.1258
-0.3747
X2
-1.1487
0.7121
X3
1.5878
-0.2301
X4
0.0646
1.3306
Functions at the centroids: F1
F2
1
1.0351
-0.2141
2
-0.1307
0.6749
3
-0.9334
-0.3109
14 | P a g e
Nur Azizah
- Multivariate
Confusion matrix for the estimation sample: from \ to 1 2 3 Total
% correct
1
8
0
1
9
88.89%
2
1
5
1
7
71.43%
3
2
2
5
9
55.56%
Total
11
7
7
25
72.00%
4. Software SAS a) Uji Manova
Dengan memasukkan coding pada SAS berikut: proc glm data=analisis_diskriminan;
class Y; model X1 X2 X3 X4 = Y; manova h=_all_/printe printh; run;
Diperoleh Output: MANOVA Test Criteria and F Approximations for the Hypothesis of No Overall Y Effect H = Type III SSCP Matrix for Y E = Error SSCP Matrix S=2 Statistic Wilks' Lambda Pillai's Trace Hotelling-Lawley Trace Roy's Greatest Root
M=0.5
N=9
Value
F Value
Num DF
Den DF
Pr > F
0.44772423 0.64182568 1.03350641 0.77564036
2.47 2.48 2.52 4.07
8 8 8 4
40 42 26.353 21
0.0280 0.0266 0.0354 0.0135
NOTE: F Statistic for Roy's Greatest Root is an upper bound. NOTE: F Statistic for Wilks' Lambda is exact.
b) Uji Asumsi
-
Normalitas
Dengan memasukkan coding pada SAS berikut: proc univariate data=analisis_diskriminan NORMAL;
var X1 X2 X3 X4; run;
Diperoleh Output: The UNIVARIATE Procedure Variable: X1 Tests for Normality
15 | P a g e
Test
--Statistic---
-----p Value------
Shapiro-Wilk Kolmogorov-Smirnov Cramer-von Mises Anderson-Darling
W D W-Sq A-Sq
Pr Pr Pr Pr
0.854397 0.199914 0.175872 1.124145
< > > >
W D W-Sq A-Sq
0.0017 <0.0100 0.0097 <0.0050
Nur Azizah
- Multivariate
The UNIVARIATE Procedure Variable: X2 Tests for Normality Test
--Statistic---
-----p Value------
Shapiro-Wilk Kolmogorov-Smirnov Cramer-von Mises Anderson-Darling
W D W-Sq A-Sq
Pr Pr Pr Pr
0.961748 0.087126 0.045107 0.309847
< > > >
W D W-Sq A-Sq
0.4271 >0.1500 >0.2500 >0.2500
The UNIVARIATE Procedure Variable: X3 Tests for Normality Test
--Statistic---
-----p Value------
Shapiro-Wilk Kolmogorov-Smirnov Cramer-von Mises Anderson-Darling
W D W-Sq A-Sq
Pr Pr Pr Pr
0.949531 0.165786 0.093294 0.522032
< > > >
W D W-Sq A-Sq
0.2261 0.0656 0.1343 0.1744
The UNIVARIATE Procedure Variable: X4 Tests for Normality
-
Test
--Statistic---
-----p Value------
Shapiro-Wilk Kolmogorov-Smirnov Cramer-von Mises Anderson-Darling
W D W-Sq A-Sq
Pr Pr Pr Pr
0.916826 0.110629 0.075067 0.56251
< > > >
W D W-Sq A-Sq
0.0379 >0.1500 0.2352 0.1360
Homoskedastisitas
Dengan memasukkan coding pada SAS berikut: proc discrim data=analisis_diskriminan method=normal pool=test;
class Y; var X1 X2 X3 X4; run;
Diperoleh Output: The DISCRIM Procedure Test of Homogeneity of Within Covariance Matrices Notation: K
= Number of Groups
P
= Number of Variables
N
= Total Number of Observations - Number of Groups
N(i) = Number of Observations in the i'th Group - 1
V
RHO
16 | P a g e
__ N(i)/2 || |Within SS Matrix(i)| = ----------------------------------N/2 |Pooled SS Matrix| _ | 1 = 1.0 - | SUM ----|_ N(i)
-
_ 2 1 | 2P + 3P - 1 --- | ------------N _| 6(P+1)(K-1)
Nur Azizah
- Multivariate
DF
= .5(K-1)P(P+1)
Under the null hypothesis:
_ _ | PN/2 | | N V | -2 RHO ln | ------------------ | | __ PN(i)/2 | |_ || N(i) _|
is distributed approximately as Chi-Square(DF). Chi-Square
DF
Pr > ChiSq
40.938108
20
0.0038
Since the Chi-Square value is significant at the 0.1 level, the within covariance matrices will be used in the discriminant function.
c) Analisis Diskriminan Coding: data analisis_diskriminan;
input Y datalines; 1.00 2.00 1.00 1.28 1.00 1.21 1.00 1.33 1.00 2.53 1.00 0.06 1.00 0.93 1.00 0.58 1.00 1.19 2.00 0.74 2.00 0.13 2.00 0.15 2.00 0.63 2.00 0.22 2.00 1.06 2.00 0.93 2.00 4.42 3.00 0.19 3.00 1.22 3.00 3.64 3.00 0.57 3.00 1.38 3.00 0.36 3.00 0.07 3.00 2.38 3.00 1.75 ;
X1
X2
X3
3.18 1.70 3.59 1.49 3.11 0.66 2.41 2.74 1.83 4.71 0.58 1.22 1.11 0.52 2.34 1.78 0.98 2.70 2.10 3.95 0.88 1.98 1.32 3.57 0.29 3.75
15.78 17.54 30.44 14.60 22.98 13.14 17.67 27.44 19.47 32.58 0.22 11.04 9.75 3.34 7.89 10.29 9.52 10.69 16.82 25.37 5.16 11.08 8.46 9.69 0.49 8.89
75.03 84.51 62.41 87.71 71.35 93.03 79.93 76.73 81.42 74.03 93.95 91.43 90.59 96.67 76.54 88.16 97.77 69.10 79.23 77.79 90.54 55.17 86.85 42.41 96.57 83.78
X4;
proc candisc data=analisis_diskriminan;
class Y; var X1 X2 X3 X4; run;
The CANDISC Procedure Adjusted Approximate Canonical Canonical Standard Correlation Correlation Error
17 | P a g e
Squared Canonical Correlation
Nur Azizah
- Multivariate
1 2
0.660926 0.452772
0.583227 0.424716
1 2
0.7756 0.2579
Difference 0.5178
0.436823 0.205003
Test of H0: The canonical correlations in the current row and all that follow are zero
Eigenvalues of Inv(E)*H = CanRsq/(1-CanRsq) Eigenvalue
0.112635 0.158999
Proportion 0.7505 0.2495
Likelihood Approximate Cumulative Ratio F Value Num DF 0.7505 1.0000
0.44772423 0.79499721
2.47 1.81
Den DF
8 3
40 21
Pr > F 0.0280 0.1771
Total-Sample Standardized Canonical Coefficients Variable X1 X2 X3 X4
Can1
Can2
-0.125532762 -1.189899871 1.834979818 -0.010357191
-0.432101354 0.523494168 -0.125031725 1.335371515
Raw Canonical Coefficients Variable X1 X2 X3 X4
Can1
Can2
-.1156153984 -.9856943908 0.2144329388 -.0007809389
-.3979644004 0.4336543578 -.0146110164 0.1006878693
Linear Discriminant Function for Y Variable
1
2
3
Constant X1 X2 X3 X4
-59.94957 -2.94697 10.22433 0.09499 1.24007
-66.15358 -3.14708 11.93796 -0.20655 1.33110
-56.43758 -2.62722 12.04145 -0.31925 1.21767
Number of Observations and Percent Classified into Y
18 | P a g e
From Y
1
2
3
Total
1
8 88.89
0 0.00
1 11.11
9 100.00
2
1 12.50
6 75.00
1 12.50
8 100.00
3
2 22.22
3 33.33
4 44.44
9 100.00
Total
11 42.31
9 34.62
6 23.08
26 100.00
Priors
0.33333
0.33333
0.33333
Nur Azizah
- Multivariate
III. PEMBAHASAN Setelah kita gunakan 4 software diatas, kita amati hasil output dari software Stata, NCSS, XLStat dan SAS. 1. Uji Manova
Dengan hipotesis sebagai berikut H0: Tidak terdapat perbedaan dari variabel X 1, X2, X3, X4 antar kategori variabel Y H1: Terdapat perbedaan dari variabel X 1, X2, X3, X4 antar kategori variabel Y Hasil output p-value
Uji Wilks' lambda Pillai's trace Lawley-Hotelling trace Roy's largest root
Stata 0.0280 0.0266 0.0300 0.0135
NCSS
XLStat 0.0359 0.0332 0.0457 0.0181
-
SAS 0.0280 0.0266 0.0354 0.0135
Dilihat dari uji Manova diatas, terlihat bahwa nilai signifikansi menggunakan Wilks’s lambda, Pillai’s trace, Lawley-Hotelling trace dan Roy’s largest root mempunyai p-value kurang dari 0.05 (), maka dapat disimpulkan bahwa terdapat perbedaan yang signifikan dari variabel X 1-X4 antar kategori variabel Y dengan kata lain variabel prediktor secara simultan mempunyai pengaruh yang bermakna terhadap variabel respons. 2. Uji Asumsi a) Uji Normalitas Normalitas Univariate
H0: Variabel X i menyebar normal, dimana i = 1, 2, 3, 4 H1: Variabel X i tidak menyebar normal, dimana i = 1, 2, 3, 4 Hasil output p-value
Variabel X1 X2 X3 X4
Stata (2 ) 0.0052 0.3871 0.3696 0.0238
NCSS (Anderson Darling) 0.0050 0.5332 0.1672 0.1311
XLStat (Anderson Darling) 0.0050 0.5329 0.1672 0.1311
SAS (Anderson Darling) <0.0050 >0.2500 0.1744 0.1360
Dari hasil output diatas, pada software NCSS, XL Stat dan SA terlihat bahwa X 2, X3 dan X4 memenuhi asumsi normalitas karena p-value lebih dari (0.05). Namun pada sotware Stata, variabel signifikan pada (0.05) dan tidak signifikan pada (0.10). Sedangkan variabel X 1 (0.000)
19 | P a g e
Nur Azizah
- Multivariate
tidak terpenuhi asumsi normalitasnya pada semua software karena p-value-nya kurang dari (0.05). Normalitas Multivariate
H0: Data berasal dari populasi yang berdistribusi normal multivariate H1: Data berasal dari populasi yang tidak berdistribusi normal multivariate Hasil output hanya menggunakan software Stata Mardia mSkewness = Mardia mKurtosis = Henze-Zirkler = Doornik-Hansen
10.41385 29.94428 1.460683
chi2(20) chi2(1) chi2(1) chi2(8)
= = = =
52.675 4.785 23.486 43.895
Prob>chi2 Prob>chi2 Prob>chi2 Prob>chi2
= = = =
0.0001 0.0287 0.0000 0.0000
Secara simultan, asumsi normalitas pada semua variabel tidak terpenuhi karena p-value pada pada Mardia mSkewness, Mardia mKurtosis, Henze-Zirkler dan Doornik-Hansen ) kurang dari (0.05). b) Uji Homoskedastisitas
Dengan hipotesis sebagai berikut: H0: Asumsi homoskedastisitas terpenuhi H1: Asumsi homoskedastisitas tidak terpenuhi Hasil output p-value
Stata
NCSS
XLStat
SAS
(Box-2)
(Box’s M)
Box test (Chi-square asymptotic approximation)
(2)
0.0038
0.0038
0.0116
0.0038
Besar peranan relatif pada Stata, NCSS dan SAS menghasilkan nilai yang sama persis sedangkan output XLStat hanya sedikit beda 0.078 dibandingkan 3 software lain. Dari nilai Box- 2 diatas, tampak bahwa p-value (0.0038) untuk semua software kurang dari (0.05). Sehingga dapat dikatakan bahwa asumsi homoskedastisitas tidak terpenuhi. Meskipun asumsi pada variabel-variabel tersebut tidak terpenuhi baik asumsi normalitas maupun homoskedastisitas, namun variabel-varibel prediktor tersebut tetap digunakan untuk pengujian analisis diskriminan.
20 | P a g e
Nur Azizah
- Multivariate
3. Analisis Diskriminan Fungsi Diskriminan
Fungsi diskriminan yang terbentuk sebanyak = min (g-1,p), dimana g = 3 dan p =4, min (3,4) = 3 Software
Stata NCSS XLStat SAS
Model Y1 0.705 + 0.116 X1 + 0.986 X2 - 0.214 X3 + 0.0007 X4 0.705 + 0.116 X1 + 0.986 X2 - 0.214 X3 + 0.0007 X4 -1.3298 - 0.1111X1 - 0.9398 X2 + 0.2144 X3 + 0.0050 X4 -0.116 X1 - 0.986 X2 + 0.214 X 3 - 0.0007 X4
Model Y1 -8.376 – 0.398 X1 + 0.434 X 2 – 0.015 X3 + 0.101 X4 8.376 + 0.398 X1 - 0.434 X2 + 0.015 X 3 - 0.101 X4 -8.7415 -0.3307 X1 + 0.5827 X2 0.0311 X3 + 0.1038X4 -0.398 X1 + 0.434 X 2 - 0.015 X 3 + 0.101 X4
Hasil output pada Stata dan NCSS terlihat sama persis. Sedangkan pada SAS hanya berbeda tanda positif dan negatif pada koefisiennya serta tidak terdapat koefisien intercept. Disisi lain, besar output pada XLStat terlihat hampir sama untuk semua koefisien kecuali koefisien intercept di model Y1. a) Peranan Relatif Fungsi Diskriminan
Peranan relative untuk semua software sebagai berikut: Peranan Relatif Y1 Peranan Relatif Y2
Stata 75% 25%
NCSS 75% 25%
XLStat 74% 26%
SAS 75% 25%
Besar peranan relatif pada semua software menghasilkan nilai yang sama persis sedangkan output XLStat hampir sama. Terlihat bahwa peranan relatif Y 1 (75%) lebih besar dibandingkan dengan Y 2 (25%). b) Uji Validitas Fungsi Diskriminan Dari tabel uji Wilk’s Lambda diperoleh
Fungsi Diskriminan Fungsi 1 s/d 2 Fungsi 2
p-value
Stata 0.0280 0.1771
NCSS 0.0280 0.1771
XLStat 0.0351 0.1793
SAS 0.0280 0.1771
Terlihat bahwa output Stata, NCSS dan SAS menghasilkan output yang sama persis sedangkan output XLStat hampir sama. Besar p-value untuk fungsi 1 s/d 2 pada software diatas terlihat signifikan karena besarnya kurang dari (0.05) sedangkan fungsi 2 tidak signifikan ( p-value > (0.05)). Sehingga pada studi kasus ini hanya menggunakan 1 fungsi diskriminan saja.
21 | P a g e
Nur Azizah
- Multivariate
Korelasi Kanonik
Besar nilai korelasi kanonik sebesar Korelasi Kanonik Rc1 Rc2
Stata 0.66 0.45
NCSS 0.66 0.45
XLStat 0.67 0.41
SAS 0.66 0.45
Terlihat bahwa besar korelasi kanonik pada output Stata, NCSS dan SAS menghasilkan output yang sama persis sedangkan output XLStat hampir sama. Berdasarkan fungsi diskriminan 1 , kontribusi pengaruh CKPN , ROA, ROE dan BOPO terhadap tipe bank sebesar (0.66) 2 = 0.4356 = 43.56%. Sedangkan fungsi diskriminan 2 sebesar (0.45)2 = 0.2025 = 20.25%. Jika dilihat dari nilai signifikansi terlihat bahwa fungsi diskriminan 2 tidak signifikan . Selain itu, besar peranan relatifnya juga kecil yaitu 25% (fungsi diskriminan 2) dan kontribusi variabel bebas berdasarkan fungsi diskriminan 2 (20.52%). Sehingga diambil keputusan hanya menggunakan fungsi diskriminan 1. Akurasi model
Hit ratio
Stata 69.2%
NCSS 69.2%
XLStat 69.2%
SAS 69.2%
Besar Hit ratio untuk semua software bernilai sama yaitu sebesar 69.2%. Cara penghitungan Hit ratio diperoleh dari jumlah klasifikasi yang benar/jumlah total pengamatan x 100%. Hasil output diatas diperoleh dari Hit ratio = ( 8+6+4) / 26 * 100% = 69.2%. Berarti model ini cukup baik, yaitu menghasilkan tingkat akurasi yang cukup tinggi jika digunakan untuk prediksi sebesar 69.2%. Variabel Bebas Sebagai Pembeda Terkuat
Dengan mempertimbangkan bahwa fungsi diskriminan yang digunakan hanya satu, maka fungsi diskriminan baku dapat digunakan untuk menentukan variabel pembeda terkuat untuk jenis bank tersebut. Software
Stata NCSS XLStat SAS
Model Zy = 0.13 ZX1 + 1.20 Z X2 - 1.6 ZX3 + 0.01 ZX4 Zy = 0.13 ZX1 + 1.20 Z X2 - 1.6 ZX3 + 0.01 ZX4 Zy = -0.13 ZX1 -1.15 ZX2 + 1.6 ZX3 + 0.065 Z X4 Zy = -0.13 ZX1 -1.19 ZX2 + 1.8 ZX3 – 0.01 ZX4
Secara keseluruhan, besar koefisien untuk semua software hampir sama hanya saja yang membedakan adalah tanda positif dan negatif nya. Misalkan pada software Stata dan NCSS, koefisien Zx1, Zx2 dan Zx4 bernilai positif sedangkan Z x3 bernilai negatif. Pada software XLStat dan SAS koefisien Z x1, Zx2 dan Zx4 bernilai negatif sedangkan Z x3 bernilai positif. Namun pada software
22 | P a g e
Nur Azizah
- Multivariate
XL Stat koefisien Z x1, Zx2 bernilai negatif sedangkan Z x4 dan Zx3 bernilai positif dengan besar Z X4 yang sedikit berbeda sebesar 0.055. ROE (Return on Equity ) mempunyai koefisien terbesar, hal ini berarti bahwa ROE mempunyai daya pemisah terkuat terhadap jenis bank, apakah Bank Devisa, Bank Non Devisa atau Bank Campuran. Variabel terkuat kedua adalah ROA ( Return on Asset ) dan variabel terlemah adalah biaya operasional terhadap pendapatan operasional (BOPO). Koefisien dari ROE bernilai positif, artinya semakin tinggi ROE maka akan berpengaruh ke jenis Bank Devisa. Sebaliknya, ROA dan BOPO mempunyai koefisien negatif, sehingga kenaikan ROA dan biaya operasional terhadap pendapatan operasional (BOPO) akan berpengaruh ke jenis Bank Campuran.
Kesimpulan
Uji Manova menjadi syarat dilakukannya analisis diskriminan.
Analisis diskriminan tetap dapat dilakukan meskipun terdapat penyimpangan asumsi normalitas dan homoskedastisitas. Akan tetapi hasil pendugaan model yang diperoleh akan bersifat bias.
Aplikasi analisis diskriminan pada studi kasus ini digunakan untuk menentukan variabel prediktor mana yang merupakan pembeda terkuat pada masing-masing kategori.
Variabel ROE (Return on Equity ) menjadi pembeda terkuat terhadap jenis Bank Devisa, Bank Non Devisa atau Bank Campuran.
Secara keseluruhan, hasil output yang diperoleh pada software Stata, NCSS, XLStat dan SAS akan menghasilkan output yang sama.
23 | P a g e
Nur Azizah
- Multivariate
Lampiran Data: Y
X1
X2
X3
X4
1.00
2.00
3.18
15.78
75.03
1.00
1.28
1.70
17.54
84.51
1.00
1.21
3.59
30.44
62.41
1.00
1.33
1.49
14.60
87.71
1.00
2.53
3.11
22.98
71.35
1.00
0.06
0.66
13.14
93.03
. .
. .
. .
. .
. .
.
. 0.93
. 1.78
. 10.29
. 88.16
4.42
0.98
9.52
97.77
3.00 3.00
0.19 1.22
2.70 2.10
10.69 16.82
69.10 79.23
3.00 3.00
3.64
3.95
25.37
77.79
3.00 3.00
0.57 1.38 0.36
0.88 1.98 1.32
5.16 11.08 8.46
90.54 55.17 86.85
3.00
0.07
3.57
9.69
42.41
3.00 3.00
2.38
0.29
0.49
96.57
1.75
3.75
8.89
83.78
2.00 2.00
24 | P a g e
Nur Azizah
- Multivariate