DIV4. Rai DIV6. Judecata de Apoi DIV8. Puterea rugăciunii
DIV5. Horoscop Credinţe religioase magice
DIV3. Ghicit DIV7. Vrăjitorie DIV2. Telepatie
Analiza factorială – diagrama DIV1. Viaţa de după moarte
Credinţe religioase creştine esenţiale
DIV4. Rai DIV6. Judecata de Apoi DIV8. Puterea rugăciunii
DIV5. Horoscop Credinţe religioase magice
DIV3. Ghicit DIV7. Vrăjitorie DIV2. Telepatie
Variabilele latente: ce urmărim? Prin urmare ce urmărim la o variabilă latentă?:
1. Cât de bine a avut loc substituţia: cât de corelată este variabilă latentă cu variabilele manifeste (observate). 2. Cât din variabilitatea norului de puncte surprinde variabila latentă
Adică suntem interesaţi de varianţa şi corelaţia variabilelor
1
2
Forma algebrică a ecuaţiilor: ce interpretăm
Atunci când realizăm analiza vom interpreta: 1. hi2 – comunalităţile (cantitatea de varianţă extrasă dintr-o variabilă de către factori) 2. λi2 – valorile proprii (varianţa pe care o sintetizează un factor) 3. bij – saturaţiile (coeficienţii de regresie în care variabilele latente sunt variabile indepenente, iar variabilele manifeste sunt variabilele dependente). Ele sunt raportate în tabelul numit pattern matrix sau factor matrix Interpretarea factorilor se face în funcţie de corelaţiile dintre factori şi variabilele manifeste şi se raportează într-un tabel structure matrix.
Dacă rotaţia este ortogonală atunci structure matrix coincide cu pattern matrix Dacă rotaţia este oblică atrunci structure matrix este diferită de pattern matrix.
Analiza factorială: algoritmul de calcul
1. Calculăm matricea de corelaţie între variabile. 2. Supunem matricea la o descompunere în valori proprii (DVP): (1) obţine o serie de vectori proprii = variabile latente şi (2) valori proprii asociate = varianţele acestor variabile latente. Algoritmul DVP este un algoritm iterativ şi urmăreşte să extragă pe rând variabilele latente astfel încât să maximize varianţa acestora. După ce a extras o variabilă latentă, va încerca să surprindă variabilitatea rămasă. Aceste variabile latente sunt perpendiculare = necorelate între ele
3. Pentru că algoritmul DVP extrage variabile latente perpendiculare, vom roti variabilele latente astfel încât să obţinem o adecvare maximă a variabilelor la date:
Rotirea poate fi la rândul ei perpendiculara, sau Rotirea poate fi oblică
O distincţie centrală: componente / factori
Algoritmul DVP porneşte de la matricea de corelaţie, însă o poate face în două moduri. Variabilitatea fiecărei variabile poate fi compusă din: A. Variabiliatea comună (suprinsă de factor) + variabilitate unică B. Variabilitate comună (surprinsă de factor) + variabilitate eroare (indicată de fidelitate) + variabilitate unică
Variabilitate eroare Putem presupune că fiecare variabilă este măsurată cu o anumită eroare, prin urmare variabilitatea acesteia nu este adevărata variabilitate. Varianţa măsurată = Varianţa reală + Varianţă eroare Varianţa reală este măsurată cu ajutorul fidelităţii (reliabilităţii). Atunci când extragem variabilele latente putem încercăm ca în loc de varianţa măsurată să folosim varianţa “reală”, iar pe diagonalele matricii de corelaţie să punem în loc de σx să avem αCrombah
În cazul A. Spunem că se extrag COMPONENTELE PRINCIPALE, care sunt simple combinaţii liniare a variabilelor manifeste B. Spunem că sunt extraşi FACTORII LATENŢI
Extragerea componentelor principale
Deschideţi baza de date BOP 2000 mai.
Pentru a extrage componentele principale în SPSS, selectaţi Data Reduction | Factor… din meniul Analyze.
Selectarea variabilelor
1. Mutaţi variablele div1- div11 în secţiunea Variables.
2. Click pe butonul Descriptives… pentru a obţine statistici de evaluare a adecvării modelului la date .
Statistici de evaluare a adecvarea analizei factoriale 1. Marcaţi Univariate descriptives pentru a afla câte cazuri valide au fost introduse în analiză. 2. Selectaţi Initial solution pentru a obţine statisticile necesare pentru a determina câte componente principale să păstraţi.
3. Marcaţi Coefficients pentru a obţine matricea e corelaţie, necesară pentru a evalua în ce măsură analiza factorială este adecvată pentru aceste variable.
6. Click butonul Continue.
5. Marcaţi Antiimage, o altă statstică necesară evaluării adecvării modelului.
4. Selectaţi KMO and Bartlett’s test of sphericity pentru a obţine statistici necesare evaluării adecvării analizei factoriale pentru aceste variable.
Metoda de extragere
Click pe Extraction… pentru a selecta modelul
Metoda de extragere se referă la metoda matematică şi la asumpţiile pe care le facem relativ la model când calculăm factorii sau componentele.
Metoda de extragere 3. Click butonul Continue .
1. Pentru început retinem metoda implicită Principal components. 2. Scree plot este o reprezentare grafică care ne ajută să selectăm numărul adecvat de componente principale. Metoda componentelor principale porneşte de la asumpţia că (a) varianţa unei variabile se descompune în varianţa comună şi varianţa unică şi (b) ca nu avem erori de măsurare
Rotaţia soluţiei iniţiale
3. Click butonul Continue
1. Selectăm metoda de rotaţie. Pentru început selectăm o metodă ortogonală: Varimax
2. Solicităm reprezentarea grafică a relaţiei dintre componentele extrase şi variabilele introduse în analiză
Încheiere solicitare output
1. Click OK
Scale de măsurare
Variabilele sunt ordinale. Nivelul solicitat de măsurare este intervale sau rapoarte. Pentru că scalele ordinale folosesc proprietatea ordinalităşii numerelor (nu şi cea a caridinalităţii) unii analişti le consideră numerice şi prin urmare se consideră că se satisface cerinţa acestei metode.
Totuşi simulările au arătat că atunci când se foloseşte corelaţia Pearsons pentru variabile ordinale (şi cu dihotomice) analiza factorială NU poate extrage corect componentele principale sau factorii latenţi!
Metoda este însă suficeint de acurată dacă se folosesc corelaţii adecvate pentru aceste scale de măsură:
Dihotomice: r tetracorhic Ordinale: τb Cea mai eficentă formă de corelaţie pentru variabilele ordinale este corelaţia policorhică o generaliza a corelaţiei tetracorhice şi care porneşte de la asumpţia că variabila ordinală este o variabilă continuă şi îi adaugă cozi marginale. Această corelaţie nu este implementată încă în SPSS
O altă soluţie este să se realizeze o analiză de omogenitate care este o descompunere în componente principale nonliniară
Cerinţe legate de mărimea eşantionului şi numărul variabilelor 1. Numărul de cazuri valide pentru acest set de variable este 1219. Pentru a realiza o analiza a Descriptiv e Statistics componentelor principale este bine pentru validitatea interpretării să Dvs. personal credeþi în Viaþa de dupã moarte? avem pentr 100 cazuri. Dvs. personal credeþi în Telepatie (transmiterea gândurilor)? Dvs. personal credeþi în Ghicit (cafea, cãrþi, etc.)? Dvs. personal credeþi în Rai? Dvs. personal credeþi în Horoscop? Dvs. personal credeþi în Judecata de Apoi? Dvs. personal credeþi în Vrãjitorie? Dvs. personal credeþi în Puterea rugãciunii? Dvs. þineþi zilele de sãrbãtoare religioasã (nu lucraþi)? Anul acesta Dvs. aþi þinut postul de Paºte … ? Aþi apelat vreodatã contra cost la ghicitoare sau astrologi, direct sau prin reviste/telefoane?
2. Raportul dintre numărul de cazuri şi variabile ar trebui să fie 5 to 1 (unii analişti merg la 2 la 1). Noi avem 1219 cazuri şi 12 variabile. Raportul este 101 la 1. Este foarte bun.
Adecvarea analizei factoriale: existenţa unor corelaţii subtanţiale Analiza componentelor principale necesită ca unele corelaţii între variabilele incluse în analiză să fie mai mari de 0.30. Pentru acest set de variabile există 8 corelaţii mai Correlation Matrixa mari de 0.30. Corelaţiile care îndeplinesc cerinţa sunt subliniate cu galben.
Correlation
Dvs. personal credeþi în Viaþa de dupã moarte? Dvs. personal credeþi în Viaþa de dupã moarte? 1.000 Dvs. personal credeþi în Telepatie (transmiterea gândurilor)? .244 Dvs. personal credeþi în Ghicit (cafea, cãrþi, etc.)? .107 Dvs. personal credeþi în Rai? .574 Dvs. personal credeþi în Horoscop? .071 Dvs. personal credeþi în Judecata de Apoi? .535 Dvs. personal credeþi în Vrãjitorie? .114 Dvs. personal credeþi în Puterea rugãciunii? .361 Dvs. þineþi zilele de sãrbãtoare religioasã (nu lucraþi)? -.109 Anul acesta Dvs. aþi þinut postul de Paºte … ? -.193 Aþi apelat vreodatã contra cost la ghicitoare sau astrologi, .057 direct sau prin reviste/telefoane?
a. Determinant = .109
Dvs. personal credeþi în Telepatie (transmiterea gândurilor)? .244 1.000 .250 .129 .294 .149 .306 .126 .046 .036
Dvs. personal credeþi în Ghicit (cafea, cãrþi, etc.)? .107 .250 1.000 .095 .283 .114 .494 .073 .019 .021
Dvs. personal credeþi în Rai? .574 .129 .095 1.000 .110 .631 .081 .441 -.170 -.200
Dvs. personal credeþi în Horoscop? .071 .294 .283 .110 1.000 .113 .216 .130 .026 .037
Dvs. person credeþi î Judecata Apoi? .5 .1 .1 .6 .1 1.0 .1 .4 -.1 -.2
.092
.284
.069
.176
.0
Adecvarea analizei factoriale: corelaţii parţiale şi adecvarea eşantionării SPSS raportează atât covariaţia anti-imagine, cât şi corelaţia anti-imagine. Corelaţiile anti-imagine indică coeficienţi de corelaţie parţiali (corelaţia dintre două variabile, când sunt ţinuţi constante celelalte variabile)
1. În afara diagonalei Dacă corelaţiile parţiale sunt mici atunci între factorii unici există corelaţie mică Noi dorim ca ele să fie cât mai mici pentru ca să există posibilitatea factorilor comuni.
2. Pe diagonală sunt raportaţi Măsuri Kaiser-Meyer-Olkin ale adecvării eşationului . Ele raportează corelaţiile unei variabile la coeficieţii săi parţiali, iar cerinţa este ca este valori să fie mai mari ca 0.50 pentru fiecare variabilă. Toate Măsurile de adecvare a eşationului depăşesc 0.05.
Adecvarea analizei factoriale: corelaţii parţiale şi adecvarea eşantionării KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity
Approx. Chi-Square df Sig.
2. Testul de sfericitate Bartlett verifică cu ajutorulu unui test χ în ce măsură există o diferenţă între matricea de corelaţie propriu-zisă şi o matrice de corelaţie în care corelaţiile ar fi 0 şi varianţele 1 (matricea identitate). În cazul nostru diferenţa este semnificativă p < 0.001.
.761 2692.643 55 .000
1. O măsură globală de adecvare a eşantionării este KMO = 0.761 pentru acest set de variabile. El este mai mare de 0.50 prin urmare continu[m analiza.
Numărul de factori care trebuie extraşi: criteriul valorilor proprii mai mari ca 1 Total Variance Explained
Extraction Sums of Squared Loadings Total % of Variance Cumulative % 2.898 26.343 26.343 1.946 17.691 44.034 1.113 10.114 54.148
Rotation Sums of Squared Loadings Total % of Variance Cumulative % 2.537 23.066 23.066 2.061 18.736 41.802 1.358 12.346 54.148
Extraction Method: Principal Component Analysis.
Criteriul valorilor proprii mai mari ca 1 indică că am putea avea 3 componente. Acest criteriu tinde să supraestimeze numărul componentelor princiale necesare pentru a reproduce datele. Acesta este criteriu implicit în SPSS.
Aceste componente principale explică din totalul varianţei (11) doar 5.95, adică 54.148. Un alt criteriu pentru selectarea numărului de componente principale este să trecem pragul de 70.0% în explicarea varianţei. Acest criteriu tinde să supraestimeze CP.
Numărul de factori care trebuie extraşi: graficul Scree Plot