Metodele si tehnicile de analiza a datelor sunt cele mai adecvate instrumente utilizabile pentru identificarea unor structuri cauzale ce apar peste tot in jurul nostru, mai ales in mediul economic. Proc Proces esul ul de anal analiz izaa a date datelo lorr apar aparee ca fiin fiind d un proc proces es spec specif ific ic de tran transf sfor orma mare re informationala, proces care are ca intrari datele primare, iar ca iesiri informatii sintetizatoare. sintetizatoare. Conceptul cel mai important si cel mai frecvent intalnit in analiza datelor, care, de fapt, intra si in alcatuirea numelui acestui tip de activitate stiintifica, este reprezentat de data. Datele reprezinta expresii cantitative si calitative ale unor fenomene si procese din realitatea inconjuratoare. Proiectul Proiectul de fata isi propune sa analizeze anumiti indicatori indicatori financiari financiari ai firmelor firmelor cotate pe Bursa de Valori Bucuresti, cu scopul de a defini indicatorii cei mai reprezentativi care ilustreaza performanta financiara a companiilor listate. Datele folosite pentru analiza au preluate de pe site-ului Bursei de Valori Bucuresti si de pe site-ul .!td.ro .!td.ro,, pentru anul "##$ si privesc %& de companii listate pe bursa la una din cele " cate'orii. Variabilele (indicatorii financiari ai firmelor) luate in considerare au fost (pentru fiecare firma)* - Cifra de afaceri - +r. de salariati - Profit net - ndi ndice ce de lichi chidit ditate ate - ent entab abil ilit itat atea ea econ econom omic icaa - ndi ndice cele le P P (Pr (Pric icee ar arni nin' n' ati atio) o)// - ndi ndice cele le P0 P0 (a (arn rnin in' ' per per 0har 0hare) e)// Valorile initiale ale datelor folosite in analiza sunt prezentate in tabelul de mai jos* Cifra de afaceri (mii Nr. Profit net Rentabilitate Indicator RON) salariati (mii (mii RON RON)) Lich Lichid idit itat ate e econ econom omic ica a (%)P (%)PER ER EPS EPS (RON (RON)) Companii Simbol 1Aerostar Bacau ARS 152697.74 1609 9503.72 2.34 0.0622 7.03 0.0811 2Alro Slatina ALR 1968015.55 3908 247226.96 1.42 0.1256 3.64 0.3464 3Amonil Slobozia AMO 216879.37 859 6927.94 1.11 0.0319 2.23 0.0062 4Antibiotice asi 215805.95 1523 10572.76 1.82 0.049 15.49 0.0232 A! Azomures 5 !". #ures A"O 1144100.22 2494 50540.75 3.35 0.0442 1.61 0.0961 6Bermas Sucea$a !RM Casa %e Buco$ina Club %e 7 #unte !CM C&!'' !ranselectrica 8 Bucuresti 9Comel( Bistrita Compa S. A. 10 Sibiu 11Con%ma" SA 12Contor )roup SA *a(ora SA 13 #e%ias
23072.06
258
917.52
1.49
0.0398
7.94
0.0426
4689.44
76
650.19
1.71
0.1386 14.41
0.0039
EL CM#
2924508.22 125959.06
2188 1096
41943.08 2086.94
1.28 1.02
0.0143 19.22 0.0166 53.29
0.5722 0.0891
CMP COMI C$C
310818.16 145313.19 44533.91
1840 917 376
439.64 8890.13 981.91
1.35 2.02 1.19
0.0014 47.28 0.0612 4.59 0.022 15.38
0.002 0.0514 0.0063
A#R
269018.68
1112
2736.32
1.38
0.0102 13.91
0.0028
1
'ner"opetrol 14 Campina ENP +lamin"o nternational 15 Bucuresti #LA mpact *e$eloper 16 , Contractor S.A. IMP #ec-el 17 !ar"o$iste COS 18#e(in Sinaia ME# il !erminal 19 Constanta OIL 20/etrom SNP /ro%plast 21 Bucuresti PPL Santierul &a$al 22 rso$a SNO 23Sinteza ra%ea S" 24Siretul /ascani SR S&!)& 25 !A&S)A SA $N 26Socep Constanta SOCP 27!eraplast SA RP 28!!A& S.A. MPN !ransil$ania Constructii SA 29 Clu COR !urism +eli S.A. 30 Baile +eli E !urism -oteluri restaurante 31 #area &ea"ra E#O 32C# esita &CM ae Apcarom 33 Buzau APC 34rancart A%u% 'NC
23928.02
241
103.58
1.19
0.0043 31.28
0.0512
1057166.76
249
402.7
1.17
0.0004 58.04
0.0005
151688.18
160
8258.69
2.91
0.0544
0.76
0.0413
1107164.18 27405.43
3513 106330.96 611 165
1.64 2.26
0.096 1.17 0.006 36.57
1.5444 0.0312
134573.36 16750726.46
1273 1025.68 29 29861 1022387.5
0.86 1.48
0.0076 90.86 0.061 10.03
0.0018 0.018
66132.79
279
5151.06
7.59
0.0779 24.25
0.1361
125966.96 12287.24 14224.37
778 108 373
15404.01 52.47 310.18
1.87 7.16 3.67
0.1223 2.94 0.0043 32 327.58 0.0218 15.56
1.3485 0.0008 0.002
4918 239007.09 626 7613.71 540 19322.14 964 9794.49
1.72 10.79 2.12 0.63
0.2135 6.01 0.1294 7.22 0.0991 6.17 0.0333 15.85
20.2998 0.0222 0.0649 0.024
1119389.99 58818.01 194916.1 294472.57
58939.83
347
5532.68
2.16
0.0939
3.85
7.7978
55448.04
844
9639.95
1.08
0.1739
8.75
0.0194
39232.58 146012.01
589 2298
11811.75 1095.44
8.07 0.85
0.3011 9.48 0.0075 19.36
0.0612 0.0116
87390.13 115072.96
243 989
2137.55 5743.1
1.92 1.32
0.0245 15.19 0.0499 6.43
0.029 0.0083
nainte de a fi utilizate in analiza, datele initiale au fost normalizate prin raportarea diferentei dintre fiecare variabila si media sa la varianta acesteia. Valorile normalizate care au fost preluate in 020 sunt prezentate in tabelul de mai jos* +irma
Cifraafaceri Nrsalariati
Profitnet
Lichiditate RentabeconPER nPER
ARS
10.08 10.08637 63775 75 13.14 13.14867 867646 646 10.20 10.20223 2239 9 34.7 34.7203 20389 89
ALR
9.455 9.455731 731048 048 12.69 12.69377 377274 274 8.8 8.8878 878534 534 35.1118 35.111845 45
30.54 30.54794 7941 1 15.88 15.8848 48 8.839 8.83906 06
AMO
10.06 10.06408 408062 062 13.29 13.29707 707915 915 10.2 10.2164 16481 81 35.24 35.24374 3748 8
31.92 31.92838 8381 1 15.90 15.9097 97 8.931 8.93161 61
A!
10.06 10.06445 445353 353 13.16 13.16569 56933 33 10.19 10.19632 6328 8 34.94 34.94164 1647 7
31.67 31.67645 6454 4 15.675 15.6756 6 8.926 8.92698 98
A"O
9.741 9.741961 961521 521 12.97 12.97356 356128 128 9.975 9.975342 3429 9 34.290 34.290639 639
31.74 31.74717 717 15.9 15.9207 207 8.9071 8.90715 5
!RM
10.13 10.13140 140982 982 13.41 13.41599 599917 917 10.24 10.24971 9713 3
35.08 35.08206 206
31.81 31.81199 1994 4 15.808 15.8089 9 8.921 8.92171 71
!CM
10.13 10.13779 779599 599 13.45 13.45201 201156 156 10.2 10.2511 51191 91 34.98 34.98845 8451 1
30.35 30.35641 6418 8 15.69 15.6947 47 8.932 8.93223 23
"
31.48 31.48198 1985 5
EPS
15.82 15.825 5 8.9112 8.91123 3
EL
9.123442838 13.03410958
10.02288 35.171414
32.187674 15.6098 8.77763
CM#
10.09566659 13.2501839 10.243247 35.282043
32.153789 15.0083 8.90906
CMP
10.03144602 13.10296843 10.252355 35.141629
32.377724 15.1144 8.93275
COMI
10.08894291 13.28560267 10.205632 34.856548
31.496717 15.8681 8.91931
C$C
10.12395391 13.39265048 10.249357 35.209708
32.074233 15.6776 8.93158
A#R
10.04596728 13.24701797 10.239656 35.128864
32.248077 15.7035 8.93253
ENP
10.13111245 13.41936297 10.254213 35.209708
32.334999 15.3968 8.91937
#LA
9.772162446 13.41778001 10.252559 35.218218
32.392456 14.9244 8.93316
IMP
10.08672822 13.43539046 10.209123 34.477857
31.596898 15.9357 8.92206
COS
9.754793204 12.77193149 9.6668756 35.018236
30.984024 15.9284 8.51315
ME#
10.12990439 13.34615097 10.253873 34.754429
32.309954 15.3035 8.92481
OIL
10.09267396 13.21516086 10.249115 35.350122
32.286382
14.345 8.93281
SNP
4.320176233 7.558445952 4.6019461 35.086315
31.499664
15.772
8.9284
31.250684
15.521
8.89627
PPL
10.1164504
13.4118439 10.226305 32.486541
SNO
10.09566384 13.31310664 10.169616 34.920372
30.596558 15.8972 8.56644
S"
10.13515649 13.44567971 10.254496 32.669503
32.334999 10.1656 8.93308
SR
10.13448353 13.39324409 10.253071 34.154481
32.07718 15.6744 8.93275
$N
9.750545924 12.49392378 8.9333016 34.984196
29.25295
SOCP
10.11899157 13.34318292 10.212689 31.124957
30.491957 15.8216 8.92726
RP
10.07171072 13.36019976 10.147952 34.813998
30.938354 15.8402 8.91564
MPN
10.03712453 13.27630277 10.200631 35.447986
31.907755 15.6693 8.92677
COR
10.11894925 13.39838872 10.224195 34.796978
31.014963 15.8811 6.81193
E
10.12016231 13.3000472 10.201486 35.256513
29.836359 15.7946 8.92802
E#O
10.12579561 13.35050412 10.189478 32.282303
27.962379 15.7817 8.91665
&CM
10.08870014 13.01234385 10.248729 35.354377
32.287855 15.6073 8.93014
APC
10.10906554 13.41896723 10.242967 34.899097
32.037402 15.6809 8.92541
'NC
10.09944845 13.27135602 10.223032 35.154394
31.663195 15.8356 8.93104
15.843 3.41079
Analiza corelatiilor dintre variabile (descrierea bidimensionala)
%
mpiric, am observat existenta anumitor le'aturi intre variabilele analizate, insa 'radul corelatiei poate fi mai bine identificat prin calculul urmatorilor indicatori* - coeficientul de corelatie Pearson/ - covarianta. Corelatia dintre variabile conduce la redundanta informationala, lucru care poate distorsiona analiza, precum si concluziile acesteia. 3nul dintre obiectivele analizei multidimensionale a datelor este tocmai reducerea acestei redundante. n cazul corelarii variabilelor, reprezentarea 'eometrica a acestora nu este una orto'onala iar interpretarea distantelor dintre obiecte in acest spatiu este alterata. 4utput-ul obtinut prin rularea pro'ramului in 020 este dupa cum urmeaza*
!-e C /roce%ure Partial 'ariables* + 'ariables*
&rsalariati /' '/S Ci(raa(aceri /ro(itnet entabecon ic-i%itate
Sim,le Statistics 'ariable
N
Mean
Std e-
Sm
Minimm
Ma/imm
Partial 'ariance
Partial Std e-
Label
Nrsalariati
34
13.07096
1.00000
444.41264
13.45201
7.55845
&rsalariati
PER
34
15.48001
1.00000
526.32025
15.93568
10.16564
/'
EPS
34
8.67055
1.00000
294.79873
8.93316
3.41079
'/S
Cifraafaceri
34
9.84121
1.00000
334.60103
10.13780
4.32018
0.03174
0.17815
Ci(raa(aceri
Profitnet
34
9.95317
1.00000
338.40793
10.25450
4.60195
0.02863
0.16921
/ro(itnet
Rentabecon
34
31.44546
1.00000
1069
32.39246
27.96238
0.84299
0.91814
entabecon
Lichiditate
34
34.66558
1.00000
1179
35.44799
31.12496
1.00658
1.00328
ic-i%itate
n tabloul 0imple 0tatistic, se calculeaza pentru fiecare din cele 5 variabile media, abaterea standard, valoarea minima si maxima, varianta partiala si abaterea standard partiala. 0e remarca ca pentru toate variabilele valoare 06DV71, deoarece variabilele modelului au fost normalizate initial.
&
Pearson Partial Correlation Coefficients0 N 1 + Prob 2 3r3 nder 45* Partial Rho15 Cifraafaceri Cifra_afaceri_
Profit_net
1.#####
#."%$#&
Profitnet
Lichiditate
Lichiditate
#."%$#&
-#.1###%
#.##9"1
#.185"
#.98"&
#.855$
1.#####
#.%:195
#.19:95
#.#&95
#.#%
1.#####
#.9981&
#.185" Rentab_econ
Rentabecon
-#.1###%
#.%:195
#.98"&
#.#&95
#.##9"1
#.19:95
#.9981&
#.855$
#.#%
#.##11
#.##11 1.#####
Din analiza matricea de corelatii Pearson din tabloul ;Pearson Partial Correlation Coefficients; observam ca variabilele sunt putin corelate intre ele, sin'ura corelatie mai puternica fiind intre entab
, cu p-value de #.##11.
9
:
5
Analiza componentelor principale 2naliza componentelor principale este o tehnica de analiza multidimensionala ce urmareste descompunerea variabilitatii din spatiul cauzal initial intr-un numar mai redus de componente/ aceste componente nu se suprapun informational si redau cu pierderi minime continutul factorilor considerati la inceput. Pentru acest proiect analiza componentelor principale trebuie sa sintetizeze distinctiile dintre firmele listate la bursa, existente la nivelul celor 5 factori studiati, printr-un numar mic de componente ce au avantajul necorelarii. Componentele principale sunt combinatii liniare ale variabilelor ori'inale extrase pe criteriul maximizarii variantei (varianta fiind o masura a cantitatii de informatie retinuta). 2ceasta modalitate de obtinere sprijina obiectivul optimalitatii* pierderea cu care se face transformarea variabilelor initiale sa fie minima. 2m pornit de la un numar de %& de observatii pentru fiecare analizand cate 5 variabile. ezultatele obtinute in urma rularii analizei componentelor principale in 020 sunt urmatoarele* Re6ltate Anali6a Com,onentelor Princi,ale Obser-ations
34
'ariables
7
Media si varianta pentru fiecare dintre cele 5 variabile sunt redate in tabelul de mai jos* Sim,le Statistics Cifraafaceri Mean 9.841206729 St
1.000000000
Nrsalariati
Profitnet
Lichiditate
Rentabecon
PER
EPS
13.07096000
9.953174291
34.66557540
31.44545654
15.48000741
8.670550923
1.00000000
1.000000000
1.00000000
1.00000000
1.00000000
1.000000000
Matricea de covarianta este redata in tabelul de mai jos. 0e remarca ca varianta totala este e'ala cu numarul de variabile, respectiv 5. Co-ariance Matri/ Cifraafaceri Cifraafaceri
Nrsalariati
Profitnet
Lichiditate
Rentabecon
PER
EPS
1.000000000
0.982417621
0.966643680
0.116063880
0.005245987
0.075948423
0.000776150
Nrsalariati 0.982417621
0.999999999
0.983599602
0.126512001
0.044432509
0.095456419
0.077070303
Profitnet
0.966643680
0.983599602
1.000000000
0.105090675
0.127585829
0.101241468
0.156207488
Lichiditate
0.116063880
0.126512001
0.105090675
0.999999999
0.372595168
0.270928644
0.069740490
$
Co-ariance Matri/ Cifraafaceri
Nrsalariati
Profitnet
Lichiditate
Rentabecon
PER
EPS
Rentabecon
0.005245987
0.044432509
0.127585829
0.372595168
1.000000002
0.296137974
0.409586392
PER
0.075948423
0.095456419
0.101241468
0.270928644
0.296137974
1.000000000
0.099927176
EPS
0.000776150
0.077070303
0.156207488
0.069740490
0.409586392
0.099927176
1.000000000
otal 'ariance 7.0000000007
Componentele principale sunt ordonate in tabelul ;i'envalues of the Covariance Matrix? in ordine descrescatoare a informatiei retinute, procent din varianta totala. n tabelul ;i'envalues of the Covariance Matrix? coloana ;Proportion? releva procentul din informatia initiala a fiecarei variabile care se re'aseste sintetizata in componentele principale extrase. Dupa cum putem observa, cele mai mari cantitati extrase sunt pentru Cifra din varianta totala, a doua componenta principala explica "".&8> din varianta totala, cea de-a treia componenta principala explica 1$> din varianta totala, iar cea de-a patra explica 1".1> din varianta totala. 0e observa ca primele % componente au valori proprii mai mari decat 1 (Coloana ei'envalue), acestea sunt retinute pentru analiza. le cumuleaza $%,91> din informatia totala. 2dau'area unei noi componente ar mari acest procent la 89,:#>. Ei7en-ales of the Co-ariance Matri/ Ei7en-ale
ifference
Pro,ortion
Cmlati-e
8
3.01094821
1.43669959
0.4301
0.4301
9
1.57424862
0.31404618
0.2249
0.6550
1.26020244
0.41331133
0.1800
0.8351
+
0.84689111
0.56796502
0.1210
0.9560
:
0.27892609
0.26094675
0.0398
0.9959
;
0.01797933
0.00717513
0.0026
0.9985
<
0.01080421
0.0015
1.0000
i'envectors reda coeficientii variabilelor ori'inale in ecuatiile liniare ale componentelor principale. n acelasi timp, ea su'ereaza natura componentelor prin evidentierea puternicei corelatii
8
cu anumite variabile iniale. 2stfel, componenta 1 se afla in le'atura cu Cifra
Prin9
Prin
Prin+
Prin:
Prin;
Prin<
Cifraafaceri 0.562514
.112034
0.101713
.057534
.031154
0.774654
.237299
Nrsalariati 0.570073
.060575
0.079807
.009543
.024649
.192276
0.792029
Profitnet
0.570573
0.011273
0.084071
0.031533
0.020160
.592460
.561107
Lichiditate
.103893
0.297098
0.738088
.274478
.529524
.020699
.001682
Rentabecon 0.061213
0.724416
0.112382
.188650
0.646097
0.068067
0.034380
PER
.104376
.302446
0.620077
0.586885
0.410268
0.014679
0.012916
EPS
0.087210
0.528330
.185251
0.735013
.363123
0.081577
0.013662
Decizia asupra num@rului de componente principale se poate fundamenta Ai pe seama urm@torului 'rafic*
1#
Dupa al doilea punct de pe 'rafic ce simbolizeaza cea de-a doua componenta, panta se reduce si forma 'raficului se aplatizeaza. raficul de mai jos reprezinta 'raficul primelor " componente principale si poate fi utilizat pentru a determina anumite trenduri urmate de variabile. 0e remarca ca 0+P este in extrema dreapta a 'raficului inre'istrand valori ridicate pentru cifra de afaceri si profitul net, in timp d e D2 se afla in extrema stan'a cu valori mult mai reduse pentru cifra de afaceri si profitul net. 2dmitand ca primele doua componente principale sunt dintr-o distributie normala, 'raficul su'ereaza ca punctele de extrem (0+P, 6+, 4) ar putea fi eliminate din analiza.
11
Analiza factoriala 2naliza factoriala isi propune identificarea unor factori ascunsi, necuantificabili, care sa explice variabilele considerate initial. ntr-o prima varianta, toate variabilele explicative sunt supuse testului de identificare a factorilor comuni. he #ACOR Procedre nitial +actor #et-o%: /rincipal +actors Prior Commnalit= Estimates* SMC Cifraafaceri 0.97417168
Profitnet 0.97949979
Rentabecon
Lichiditate
Nrsalariati
PER
EPS
0.55562171
0.37898420
0.98339848
0.28796072
0.41353694
Ei7en-ales of the Redced Correlation Matri/* otal 1 +.:<8<: A-era7e 1 5.;:85: Ei7en-ale
ifference
Pro,ortion
Cmlati-e
8
2.97532151
1.91088706
0.6506
0.6506
9
1.06443445
0.44231353
0.2328
0.8834
0.62212092
0.39413530
0.1360
1.0194
+
0.22798562
0.23569428
0.0499
1.0692
:
.00770866
0.01065775
0.0017
1.0676
;
.01836641
0.27224750
0.0040
1.0635
<
.29061391
0.0635
1.0000
1"
4 (actors ;ill be retaine% b< t-e #&')'& criterion.
Din tabelul ;Prior Communalit stimates? se evidentiaza 0MC (0Euared Multiple Correlation) pentru fiecare variabila. Din tabelul ;i'envalues of the educed Correlation Matrix? in care este explicata varianta totala ni se su'ereaza ca doar & factori vor fi retinuti de criteriul M++. eprezentarea 'rafica este redata mai jos* nitial +actor #et-o%: /rincipal +actors Scree Plot of Eigenvalues | 3.0 + 1 | | | | | 2.5 + | | | | | 2.0 + | | E | i | g | e 1.5 + n | v | a | l | u | 2 e 1.0 + s | | | | | 3 0.5 + | | | 4 | | 0.0 + 5 6 | | | 7 | | -0.5 + ---------+---------+---------+---------+---------+---------+---------+---------+--------0 1 2 3 4 5 6 7 Nu!er
1%
orma initiala a matricii factor este redata in tabelul ;actor Pattern?, iar varianta explicata de fiecare din factori este redata in tabelul ;Variance xplained b ach actor?. 6abelul ;inal Communalit stimates? exprima proportia variantei variabilelor retinute de factorii comuni.
#actor Pattern Cifraafaceri
#actor8 Cifraafaceri 0.97791
#actor9
#actor
#actor+
0.12563
0.08414
0.06941
Profitnet
Profitnet
0.99023
0.05942
0.03561
0.06637
Rentabecon
Rentabecon
0.08173
0.79116
0.07485
0.12148
Lichiditate
Lichiditate
0.13668
0.29927
0.59842
0.06439
Nrsalariati
Nrsalariati 0.99220
0.04956
0.04011
0.00168
PER
PER
0.12712
0.25272
0.44477
0.28780
EPS
EPS
0.11168
0.51312
0.22501
0.34209
'ariance E/,lained b= Each #actor #actor8
#actor9
#actor
#actor+
2.9753215
1.0644344
0.6221209
0.2279856
#inal Commnalit= Estimates* otal 1 +.>>?>; Cifraafaceri 0.98399855
Profitnet 0.98976186
Rentabecon
Lichiditate
Nrsalariati
PER
EPS
0.65297735
0.47049895
0.98851977
0.36068147
0.44342455
nitial +actor #et-o%: /rincipal Components /rior Communalit< 'stimates: &'
1&
Ei7en-ales of the Correlation Matri/* otal 1 < A-era7e 1 8 Ei7en-ale
ifference
Pro,ortion
Cmlati-e
8
3.01094821
1.43669959
0.4301
0.4301
9
1.57424862
0.31404618
0.2249
0.6550
1.26020244
0.41331133
0.1800
0.8351
+
0.84689111
0.56796502
0.1210
0.9560
:
0.27892609
0.26094675
0.0398
0.9959
;
0.01797933
0.00717513
0.0026
0.9985
<
0.01080421
0.0015
1.0000
2 (actors ;ill be retaine% b< t-e &+AC! criterion.
Doar " factori vor fi retinuti de analiza factoriala. #actor Pattern
#actor8
#actor9
Cifraafaceri
Cifraafaceri
0.97608
0.14057
Profitnet
Profitnet
0.99006
0.01414
Rentabecon 0.10622
0.90892
Rentabecon Lichiditate
Lichiditate
Nrsalariati
Nrsalariati 0.98920
PER
PER
19
0.18028
0.18111
0.37277 0.07600 0.37948
#actor Pattern
#actor8
EPS
EPS
0.15133
#actor9 0.66289
'ariance E/,lained b= Each #actor #actor8
#actor9
3.0109482
1.5742486
#inal Commnalit= Estimates* otal 1 +.:>:8?< Cifraafaceri 0.97249084
Profitnet 0.98042493
Rentabecon
Lichiditate
Nrsalariati
PER
EPS
0.83741291
0.17145413
0.98428469
0.17680472
0.46232462
6abelele urmatoare exprima rezultatele rotatiei orto'onale a celor " factori si matricea transformarilor orto'onale corespunzatoare, prin folosirea Varimax.
otation #et-o%: arima Ortho7onal ransformation Matri/ 8
9
8
0.99287
0.11924
9
0.11924
0.99287
Rotated #actor Pattern
#actor8
#actor9
Cifraafaceri
Cifraafaceri
0.98588
0.02317
Profitnet
Profitnet
0.98131
0.13210
Rentabecon
Rentabecon 0.00292
Lichiditate
Lichiditate
Nrsalariati
Nrsalariati 0.99120
1:
0.22344
0.91510 0.34861 0.04249
Rotated #actor Pattern
#actor8
#actor9
PER
PER
0.13457
0.39837
EPS
EPS
0.07120
0.67621
'ariance E/,lained b= Each #actor #actor8
#actor9
2.9905202
1.5946767
#inal Commnalit= Estimates* otal 1 +.:>:8?< Cifraafaceri 0.97249084
Profitnet 0.98042493
Rentabecon
Lichiditate
Nrsalariati
PER
EPS
0.83741291
0.17145413
0.98428469
0.17680472
0.46232462
eprezentarea 'rafica este redata de 'raficul de mai jos* Plot of "actor2#"actor1. $egen%& ' ( 1 o!s) * ( 2 o!s) etc. "actor2 | 4+ | | | ' | | | 3+ | | | ' | | | 2+ | | | | | ' | ' 1+ | | ' | ' '' | ' ' | '
15
| 0+ '' | ' ' | ''* ' | '' | ''' ' | *'' | ' -1 + * | | | ' | | | -2 + | --+-----------+-----------+-----------+-----------+-----------+-----------+-----------+-1 0 1 2 3 4 5 6 "actor1
Analiza Cluster: Clusterizarea este, alaturi de clasificare si discriminare, o metoda de recunoastere a formelor, avand ca scop identificarea unor niveluri de structurare naturala, latenta, a obiectelor pe anumite 'rupe, sau clase. Dezvoltarea acestor metode de-a lun'ul timpului si diversificarea se datoreaza necesitatii ce caracterizeaza multe domenii de activitate pentru* tipolo'ii, modele predictive de incadrare intr-o clasa, esentializare a unui volum mare de informatie , etc. 2partenenta unui obiect la o anumita clasa se realizeaza prin prisma caracteristicilor sale, date prin variabile explicative cu o putere de discriminare mare. n functie de conditiile in care se realizeaza aceasta clasificare se distin' metode supervizate, sau controlate, si nesupervizate (necontrolate). Diferenta consta in cunoasterea, sau nu, apriorica, a apartenentei obiectelor din esantionul considerat la una din starile naturii (clase posibile). 2naliza cluster urmareste or'anizarea datelor sub forma unor structuri informationale semnificative, relevante. 2ceasta este folosita atat pentru clasificarea variabilelor, cat si pentru cea a obiectelor si este o metoda exploratorie, deoarece input-ul acestei analize nu include setul complet de invatare (informatii despre apartenenta la clase a obiectelor unui esantion). a 'rupeaza obiectele in urma evaluarii dupa diferite metode a distantelor dintre ele,astfel incat sa se obtina o variabilitate minima in fiecare clasa si o variabilitate maxima intre clasele construite. n cazul de fata, clasificarea relevanta este cea a obiectelor, respectiv cea a firmelor listate la bursa. Metoda folosita initial in analiza este cea de clasificare ierarhica. n cazul clasificarii ierarhice numarul de clustere nu este cunosc, iar al'oritmul ne furnizeaza solutii multinivel ce difera intre ele prin numar de clustere si 'rad de a're'are. 2le'erea numarului optim de clase se realizeaza in functie de obiectivele cercetatorului si de rezultatele obtinute prin calcul statistic. ntre metodele de clasificare ierarhica se face distinctia dintre*
1$
•
•
2l'oritm de clasificare prin a're'are F al'oritm ascendent care comaseaza succesiv clasele pana la obtinerea uneia sin'ure. 2l'oritm de clasificare prin deza're'are sau divizare F al'oritm descendent care porneste de la un sin'ur cluster pe care il imparte succesiv, obtinandu-se mai multe subdiviziuni.
he CL&SER Procedre =ar%>s #inimum ariance Cluster Anal
6abelul ;i'envalues of the Covariance Matrix? reprezinta matricea de covarinta a valorilor proprii. Pe coloana ;Cumulative? re'asim proportia variantei asociate fiecarei valori proprii. 0e remarca ca abaterea standard este 1, iar patratul distantei dintre variabile este %.5&1:95. Ei7en-ales of the Co-ariance Matri/ Ei7en-ale
ifference
Pro,ortion
Cmlati-e
8
3.01094821
1.43669959
0.4301
0.4301
9
1.57424862
0.31404618
0.2249
0.6550
1.26020244
0.41331133
0.1800
0.8351
+
0.84689111
0.56796502
0.1210
0.9560
:
0.27892609
0.26094675
0.0398
0.9959
;
0.01797933
0.00717513
0.0026
0.9985
<
0.010804 21
0.0015
1.0000
Root@Mean@Sare otal@Sam,le Standard e-iation
1
Root@Mean@Sare istance !etBeen Obser-ations 3.741657
6abelul ;Cluster Gistor? prezinta istoricul clusterelor, primele " coloane cuprinzand numarul clusterului si numele clusterelor a're'ate. iecare variabila este identificata prin C=n, unde n este numarul clusterului. 3rmatoarele coloane reprezinta numarul de observatii in noul cluster si coeficientul semipartial " . 3rmatoare valoare reprezinta scaderea proportiei variantei inre'istrata prin unirea a " clustere. Coeficientul de corelatie multipla " reprezinta proportia variantei inre'istrate de fiecare cluster. 0e observa ca daca datele sunt 'rupate in % clustere, proportia variantei incorporate de clustere este 95>. Valoarea asteptata pentru " este data de coloana 0H. 2ceste asteptati sunt aproximate sub ipoteza nula ca datele au o distributie uniforma. 3rmatoarele % coloane reprezinta valorile criteriului cubic de clusterizare (CCC), pseudo (P0), si statistica t" (P06"). 2ceste statistici sunt utile pentru a estima nr de clustere.
18
Clster 4istor= NCL
Clsters oined
#RED
SPRSD
RSD
ERSD
CCC
PS#
PS9
ARS
COMI
2
0.0001
1.00
.
.
366
.
9
!RM
'NC
2
0.0001
1.00
.
.
330
.
8
C$C
A#R
2
0.0001
1.00
.
.
298
.
5
AMO
CL9
3
0.0002
.999
.
.
263
1.7
9?
CM#
CMP
2
0.0002
.999
.
.
236
.
9>
CL
A!
3
0.0003
.999
.
.
218
3.1
9<
CL8
APC
3
0.0003
.999
.
.
206
2.0
9;
CL5
MPN
4
0.0004
.998
.
.
183
2.9
9:
ENP
ME#
2
0.0005
.998
.
.
168
.
9+
CL9?
#LA
3
0.0005
.997
.
.
158
2.2
9
SNO
RP
2
0.0006
.997
.
.
151
.
99
CL9>
IMP
4
0.0007
.996
.
.
143
3.9
98
CL9<
&CM
4
0.0007
.995
.
.
137
3.5
95
!CM
CL9
3
0.0008
.994
.
.
133
1.4
8?
CL98
CL9:
6
0.0010
.994
.
.
128
2.4
8>
A"O
SR
2
0.0013
.992
.
.
120
.
8<
CL9+
OIL
4
0.0016
.991
.
.
113
4.2
8;
ALR
COS
2
0.0022
.988
.
.
103
.
8:
CL9;
CL8?
10
0.0024
.986
.
.
96.1
5.7
8+
CL99
CL8>
6
0.0025
.984
.
.
92.1
4.3
8
CL95
E
4
0.0025
.981
.
.
90.6
3.7
89
CL8:
EL
11
0.0044
.977
.
.
83.8
6.8
88
PPL
SOCP
2
0.0055
.971
.
.
77.6
.
85
CL8+
CL89
17
0.0087
.963
.
.
68.5
8.7
?
CL8;
CL8
6
0.0094
.953
.
.
63.5
6.2
"#
i e
Clster 4istor= NCL
Clsters oined
#RED
SPRSD
RSD
ERSD
CCC
PS#
PS9
>
CL85
CL8<
21
0.0137
.939
.
.
57.6
10.0
<
CL?
COR
7
0.0162
.923
.
.
54.1
5.2
;
CL88
E#O
3
0.0251
.898
.714
12.7
49.4
4.6
:
CL>
CL< 28
0.0520
.846
.667
10.3
39.9
19.0
+
CL;
S" 4
0.1206
.725
.604
4.78
26.4
7.9
CL:
$N 29
0.1551
.570
.507
1.82
20.6
33.9
9
CL
CL+ 33
0.1697
.401
.355
1.04
21.4
12.2
8
CL9
SNP
0.4007
.000
.000
0.00
.
21.4
34
i e
raficul urmator prezinta trei statistici pentru estimarea numarului de clustere. Varfurile 'raficului CCC cu valori mai mari decat " sau % indica clustere bune. Valorile intre # si " indica posibile clustere. 4 alta metoda de stabilire a numarului de clustere este prin statistica pseudo . Valorile relativ mari indica un numar bun de clustere.
"1
Dendo'rama este 'raficul care evidentiaza structura clusterelor, componenta lor si etapele de a're'are in urma carora au fost obtinute. 2ceasta ne poate ajuta sa decidem asupra numarului optim de clase ce trebuie retinute in analiza, prin aparitia unor 'ap-uri.
""
3n astfel de 'ap este evidentiat si in 'raficul urmator prin linia rosie* ea intersecteaza dendo'rama in : puncte, ceea ce ne su'ereaza formarea a sase clustere.
"%
"&
irmele din cele : 'rupe sunt* rupa 1 * 0+P • rupa " * 06I • rupa % * 4, 04CP, PP= • rupa & * 6+ • rupa 9 * C46, 63, 6P, 0+4, BCM, C40, 2= • rupa : * 4=, =2, CMP, CM, 6=, M, +P, 3CM, 2PC, D2, CC, • MP+, V+C, BM, 2M4, 06, 2I4, MP, 26B, C4M, 20
"9