Traian Rotariu, Gabriel Bădescu, Irina Culic, Elemer Mezei, Cornelia Mureşan, Metode Statistice aplicate în ştiinţele sociale, Editura Polirom 2000 Frecvenţe: dacă tre să determinăm numărul de ţări dintre toate statele lumii care sunt: dezvoltate, mediu dezvoltate şi slab dezvoltate, înseamnă că trebuie să găsim câte ţări sunt din prima categorie, câte din a adoua şi câte din a treia (căutarea frecvenţelor caracteristicii respective pentru populaţia luată în obiectivul cercetării, sau a numărului de indivizi statistici care populează fiecare clasă a caracteristicii) Cap. 3 Indicatori ai caracteristicilor cantitative Indicatori= valori ataşate variabilelor statistice cantitative, prin intermediul cărora se încearcă exprimarea, de o manieră sintetică, a informaţiilor conţinute în distribuţia de frecvenţe respectivă. 1. Indicatori de poziţie (de nivel, ai tendinţei centrale) redă într-o singură valoare numerică, nivelul general al valorilor seriei sau ordinul de mărime al acestor valori. Spre exemplu media: valoare care se obţine împărţind suma valorilor tuturor indicatorilor din populaţie la numărul acestora, valoare comună pe care ar trebui să o ia fiecare individ din populaţie, astfel încât să păstreze neschimbată suma valorilor. Proprietăţi: 1. media este o valoare cuprinsă în intervalul ale cărui capete le constituie valoarea minimă şi maximă ale seriei de valori, 2. val medie a unei populaţii descompuse în s subpopulţii este media mediilor din subpopulaţii, ponderate cu mărimea fiecărei subpopulaţii, 3. media e o unitate de măsură exprimată în aceeaşi unitate de măsură în care sunt exprimate şi valorile variabilei respective, 4. suma abaterilor valorilor de la medie este nulă, 5. media aritmetică rămâne neschimbată dacă frecvenţele se * sau se / cu acelaşi număr, 6. valoarea medie poate fi calculată chiar dacă nu cunoaştem distribuţia caracteristicilor, ci numai suma valorilor. Media este relevantă dacă populaţia este omogenă. Mediana: valoarea mediană este cea care are în stânga sa tot atâtea valori cât şi în dreapta sa. Se poate determina numai când şirul de valori e fără soţ, altfel considerăm cele două valori mediane, din care facem media aritmetică Modul este valoarea luată cu cea mai mare frecvenţă, valoarea ce caracterizează individul tipic al populaţiei. Pt variabilele continue, tre să se construiască intervale de valori, apoi să se găsească intervalul modal, adică a intervalului cu cea mai ridicată frevenţă. Există distribuţii plurimodale (graficele au mai multe cocoaşe) şi unimodale. Ordinea acestora este cea din dicţionar: MEDIA (1/3) < MEDIANA< (2/3)MODUL 2. Indicatori de dispersie(împrăştiere, variaţie) Urmăresc să măsoare gradul de împrăştiere a indivizilor în cadrul seriei de valori pe care aceştia le iau. Ei caracterizează o populaţie statistică din punctul de vedere al omogenităţii/eterogenităţii în raport cu o variabilă dată. Amplitudinea se calculează ca diferenţă dintre cea mai mare şi cea mai mică valoare. Această valoare nu are o acurateţe prea mare pt că se iau în calcul douar două valori, care pot fi mult diferite de seria celorlalte valori, deci care nu reflectă în mod real situaţia din populaţie. Abaterea intercuartilă Cuartilele sunt valorile care corespund indivizilor statistici aflaţi pe acele poziţii –în ierarhia formată pornind de la cel cu valoarea cea mai mică la cel cu valoarea cea mai mare, care împart mulţimea indivizilor în patrru părţi egale- (Xmin, Q1), (Q1, Q2), (Q2, Q3), (Q3, Xmax. A doua cuartilă, Q2 este chiar mediana) Abaterea intercuartilă este I=Q3-Q1 Indicele de împrăştiere al lui Gini este media aritmetică a diferenţelor dintre toate perechile de valori, diferenţe luate în valoare absolută Abaterea medie Ex: avem 5 note: 5,6,7,9,10.
1
Mediana este 7, abaterile de la ea vor fi 5-7=2, 6-7=1, 7-7=0, 7-9=2, 7-10=3, deci Am(Me)= (2+1+0+2+3):5=8:5=1,6 Media este 7,4 abnaterea medie este (2.4+1.4+0.4+1.6+2.6):5=8.4:5=1,68 note, valoare mai mare decât cea a abaterii de la mediană Abaterea standard (deviaţie standard, dispersie) (este o măsură a gradului de eterogenitate, diversitate, inegalitate, pentru indivizii ce formează populaţia respectivă) sau abaterea medie pătratică se calculează prin ridicarea la pătrat a diferenţelor dintre valorile individuale şi o mărime constantă, arbitrar aleasă, a, urmată de însumarea pătratelor respective şi de raportarea la numărul cazurilor observate, adică n. Cea mai mică abatere standard este cea faţă de medie. Pătratul indicatorului poartă denumirea de varianţă. Proprietăţi: - dacă valorile variabilei se înmulţesc cu o constantă, a, atunci şi abaterea standard se multiplică cu aceeaşi valoare - dacă la valorile variabilei se adună sau se scad o aceeaşi valoare, abaterea standard rămâne nemodificată Teorema de descompunere a varianţei S-a constatat că dacă populaţia statistică este concepută ca fiind formată dintr-o mulţime de grupuri, atunci media generală a caracteristicii este egală cu media mediilor la nivelul fiecărui grup. Astfel, varianţa totală se descompune în suma varianţei intragrupale şi a celei intergrupale Coeficientul de variaţie arată ce fracţiune din medie corespunde unei abateri standard. Cu cât coef e mai aproape de 0, cu atât grupurile sunt mai omogene 3. Indicatori ai formei distribuţiei Forma distribuţiei: în ce măsură distribuţia se abate de la cazul-limită al simetriei în jurul valorilor centrale (distribuţia normală ideală). Pentru aceată problemă se introduc indicatori ai oblicităţiii - În ce măsură distribuţia este mai plată sau mai boltită, se exprimă prin indicatori ai boltirii, sau de exces Indicatorii de oblicitate (skewness) oblicitatea distribuţiei, în sensul de deplasare spre stânga sau spre dreapta a valorii modale, generează poziţii şi distanţe diferite între indicatorii tendinţei centrale, adică între medie şimod. Indicatorul propus de Pearson. Valoarea este nulă pt distribuţii simetrice, pozitivă pt curbe înspre dreapta, negativă pt curbe spre stânga Indicatori ai boltirii (kurtosis) exprimă înălţimea cocoaşei curbei, comparativ cu cea normală. Valorile pozitive indică distribuţii leptocurtice (cu cocoaşa înaltă) şi valorile negative, cele platicurtice (cu cocoaşa aplatizată). -
Cap. 4 Elemente de teoria probabilităţilor Noţiuni elementare: - experienţă (acţiune ce se poate repeta de multe ori, în condiţii identice: datul cu zarul) - proba (fiecare dat cu zarul) - cazul (rezultatul: ce cifre ies), mulţimea tuturor rezultatelor posibile e E - evenimentele sunt afirmaţii legate de rezultatul unei probe a unui experiment - ev imposibil e ev caracterizat de mulţimea vidă, ev sigur e notat cu E şi se prod pt toate probele experienţei. A şi B sunt incompatibile dacă A intersectat cu B e mulţimea vidă. Ev care apare când apare A şi nu apare B este A\B. A include B înseamnă că producerea lui A atrage după sine producerea lui B. - Frecvenţele relative se obţin prin împărţirea frecvenţelor de apariţie la numărul de probe efectuate
2
Teoria probabilităţii pleacă de la convingerea că există o valoare-limită a frecvenţei relative de apariţie a unui eveniment, pentru un număr mare de probe. Deci, pt fiecare experienţă există o funcţie, numită probabilitate, definită de mulţimea tuturor evenimentelor cu valori (0,1), interval dat de frecvenţa relativă de apariţie a evenimentului respectiv. Distribuţia de probabilitate a unei variabile se referă la probabilităţile de apariţie a diferitelor valori posibile ale apariţiei. Schema hipergeometrică ? p. 69 Schema binominală? P.70 Distribuţia normală: reprezentarea grafică a cărei distribuţii este o curbă de forma unui clopot , simetrică faţă de centrul dat de valoarea lui m (media distribuţiei) şi a cărei formă este determinată de valoarea abaterii standard a distribuţiei. Importanţa acestei curbe este accea că aproximează distribuţiile multor variabile întâlnite în aplicaţiile din ştiinţele sociale. Se mai utilizează în multe metode de inferenţă statistică, premiţându-ne să estimăm valorile anumitor indicatori pentru variabile, cu o eroare stabilită şi un risc de a greşi mic. Distribuţia normală de parametrii a cărei medie este 0 şi a cărei abatere standard este 1, se numeşte distribuţie normală standard. Probabilităţi condiţionate Definim evenimentele A şi B ca fiind independente dacă P(Aintersectat cu B)=P(A)xP(B) (realiy ev A nu infl ev B) Dacă unul din ev ar infl celălalt ev, atunci acest ev ar tre să se realiz, ca secvenţă de timp, înaintea celuilalt ev. … Probabilitatea evenimentului B, în ipoteza realizării lui A Teorema lui Bayes Având un câmp de probabilitate (E, P(E), P), finit sau infinit, discret sau continuu, un eveniment oarecare posibil, A (P(A)>0), şi un ev oarecare B, numim probabilitatea lui B condiţionată de A, valoarea notată cu P(B/A)=P(Aintersectat cu B)/P(A). Se observă că dacă evenimentele sunt independente, atunci P(B)=P(B/A) Teorema probabilităţii condiţionate Având (E, P(E), P) un câmp de probabilitate, Ai (i=1,2,...n) uun sistem complet de evenimente (două câte două se exclud şi reuniunea cu Ai egal E) şi B un ev oarecare, atunci: P(B)= P(A1)xP(B/A1)+ P(A2)xP(B/A2)+ ................P(An)xP(B/An)
Cap. 5 Eşantioanarea Eşantionarea sau selecţia reprezintă setul de operaţii cu ajutorul cărora, din ansamblul populaţiei vizate de cercetare, se alege o parte, numită eşantion, parte ce va fi supusă în mod nemijlocit investigaţiei. Alegerea tre făcută aî, prin intermediul acestui studiu redus, să se obţină concluzii cu valabilitate generală, adică dând seama de întreaga populaţie. Eşantionarea este o realitate impusă, nu numia datorită costurilor mai mici, dar şi pt că investigarea întregii populaţii este absurdă. Eşantionul tre să fie reprezentativ, capacitatea lui de a reproduce cât mai fidel structurile şi caracteristicile populaţiei din care este extras. Erori de eşantionare: - în loc să culegem date de la toţi indivizii, le culegem numai de la o parte a acestora. - Erori datorate persoanelor care culeg informaţia d, eroarea maximă, ce exprimă diferenţa cea mai mare acceptată dintre o valoare v* găsită în eşantion şi valoarea v găsită în populaţie (de exemplu ne spune cu cât se poate abate media de vârstă a indivizilor din eşantion de media de vârstă a indivizilor din populaţie). Se mai poate calcula în funcţie de abaterea standard, indicator de dispersie... Nu se poate vorbi de reprezentativitate în general, ci numai în raport cu o caracteristică dată
3
P, nivel de probabilitate sau de încredere, care arată ce şanse sunt ca eroarea reală comisă, atunci când valoarea v (fireşte, necunoscută) este aproximată prin v*, să nu depăşească limita d. Pentru nivelul de probabilitate, nivelul minim acceptat este de 0,95, ceea ce înseamnă că şansele de a greşi estimarea nu trebuie să fie mai mari de 5%. Reprezentativitate unui eşantion este cuplul d, P. Cele două mărimi, d şi P nu sunt independente. Cu toate acestea, în condiţii egale, scăderea erorii antrenează scăderea probabilităţii. Nu putem ameliora simultan şi precizia estimării, şi siguranţa acesteia, restul condiţiilor fiind identice. Reprezentativitatea este o noţiune relativă. Gradul de reprezentativitate al unui eşantion dep de : - caracteristicile populaţiei (pt estimarea unor caracteristici ale unei pop omogene va fi nevoie de un nr mai mic de indivizi. Pt a caracteriza niv de omogenitate al unei pop se fol indicatorul de dispersie: abaterea standard) Eroarea de eşantionare e dp cu abaterea standard. - mărimea eşantionului: cu cât mărimea e mai mare, cu atât reprezentativitatea e mai mare, dar nu într-o rel dp. Reprezentativitatea atinge repede un niv ridicat, aî nu e necesară o creştere f mare a eşantionului. Mărirea eşantionului se face de obicei pt a creşte reprezentativitatea în cadrul subpopulaţiilor. - tehnicile de eşantionare eşantioane aleatoare, probabilistice: alegerea se face într-o manieră pur întâmplătoare, se elimină intervenţia subiectivă. Fiecare individ are om şansă calculabilă şi nenulă de a fi inclus în eşantion. Reprezentativitatea eşantionului se poate calcula numai pt eşantioanele strict probabilistice. Fiecare tehnică de eşantionare aleatoare pp formul specifice de estimare a erorii. eşantioane nealeatoare 1. eşantioanarea simplă aleatoare se procedează prin tragere la sorţi: tabele cu numere întâmplătoare: se generează serii lungi de numere de 4,5,6, sau maimulte cifre, numerele sunt dispuse întâmplător. Cercetătorul are o listă cu indivizii din populaţie, fiecare ind primeşte un nr de la 1 la N 2. eşantionarea prin stratificare Se porneşte de la o divizare a populaţiei după un criteriu, o caracteristică A, în s clase de efective: N1, N2, ..... Ns, cifre care prin însumare dau efectivul total al populaţiei. Întrucât este greu să se stab un singur crit după care să se facă eşantionarea, aceasta ia în calcul împărţirea pop după mai multe crit, cum ar fi cel de vârstă, sex, ocupaţie, niv de şcolarizare. Acest tip de eşantion e mai reprezentativ decât cel aleator, pt că e ales pe anumite criterii căutate 3. eşantionarea multistadială: într-un prim stadiu se alege un eşantion de grupuri de cel mai înalt rang, apoi, din fiecare dintre acestea, un eşantion de rang 2, etc.În final se va alege un eşantion de indivizi, care, de cele mai multe ori, cuprinde întreg efectivul ultimului eşantion de grupuri. Scopul principal este reducerea costurilor şi timpului de cercetare. Este însă mai puţin reprezentativ decât unul simplu aleator Estimarea valorilor medii se face prin - extragerea a mai multor subeşantioane şi calcularea mediilor acestora. Dacă media lor este aceeaşi cu cea din populaţie, atunci eşantionul este corect alcătuit. - Dacă eşantionarea e simplă aleatoare, abaterea standard a variabilei este de radical din n ori mai mică decât abaterea standard a variabilei x. (mărind eşantionul se măreşte concentrarea valorilor mediei din eşantioane de cea din populaţie) - Distribuţia valorilor variabilei mediei din eşantion urmează o curbă normală (Gauss) - Abaterea standard a variabilei x în populaţie este suficient de bine aproximată de abaterea standard a aceleiaşi variabile într-un eşantion oarecare. Ex: PP că avem un eşantion de 1600 de persoane, frecvenţa cu care se declară votul pt un p este de 20%. Pt a calcula reprezentativitatea , mai întâi se estimează eroarea standard ( e 1%, după o formulă?), apoi se alege un nivc de probabilitate P e 95%, căruia îi coresp o eroare max de 2e. Se trage concluzia că există 95% şanse ca p respectiv să aibă, în întreaga populaţie, un procent de susţinători cuprins între 18% şi 22% - pt eşantionarea simplă aleatoare nerepetate (fără reintroducerea în urnă a individului extras) p.100 - pt eşantionarea prin stratificare p.101
4
Teste de semnificaţie Probl semnif diferenţei dintre 2 mărimi se pune atunci când se compară 2 valori, dintre care cel puţin 1 este obţinută printr-o procedură de cercetare selectivă. Teste de semnificaţie pentru eşantioane mari: - Testul Z sau T se aplică în cazul eşantioanelor mari şi serveşte la testarea semnificaţiei diferenţei dintre 2 mărimi sau la testarea unei mărimi (dacă ea este sau nu semnificativ diferită de 0) - Testarea semnificaţiei diferenţei dintre 2 medii sau proporţii 1. când 1 dintre mărimi este calculată la nivel de populaţie şi cealaltă la nivel de eşantion. Z nu este altceva decât nr de erori standard. Dacă Z e mai mare de 2, mai exact de 1,96, atunci diferenţa este semnificativă la nivelul de probabilitate de 0,95, adică 95%. Dacă Z depăşeşte valoarea de 2,6, atunci diferenţa este semnificativă la nivelul de 0,99, iar când Z trece de 3,3 diferenţa este semnificativă la nivelul de 0,999. Acestea sunt cele 3 praguri de probabilitate cel mai des utilizate One sample statistics N (nr de oam in Mean St. Deviation Std. Error Mean esantion) (media) (abaterea (eroarea standard standard) a var rezident) REZIDENT 1298 .5470 .4980 1.4E-2 One –Sample test Gradele de liberatate ale eşantionului Test Value=0.543 95% Confidence Interval of the Difference (intervalul de confidenţă Df Sig(2Mean T (Z) pentru niv de încredere de (N-1) tailed) difference 95%) Lower Upper REZIDENT .289 1297 .773 3.995E-03 -2.E-02 3.1E-02 (77.3%) Sunt 77.3% şanse pentru a obţine valoarea 0,289pentru T, în ipoteza că cekle două valori sunt egale Pentru intervalul de confidenţă: acesta se înmulţeşte cu 100 şi rezultă că este situat în intervalul –0,02 şi 0,31. Întrucât conţine valoarea 0, deci e posibil ca diferenţa dintre cele 2 medii să fie 0, deci nu putem respinge ip ca cele 2 valori să fie egale (simbolul E-02 înseamnă înmulţit cu 10 la –2. Ex: 4,1 E2 înseamnă 410) 2. Pentru compararea a două mărimi medii, respectiv proporţii. Dacă nivelul de probabilitate depăşeşte valoarea de 0,95 se respinge ipoteza nulă, ipoteză care , în cazul de faţă, înseamnă că mediile sau proporţiile celor 2 populaţii (din care s-au extras eşantioanele ale căror valori se compară) sunt identice sau, altfel spus, că cele 2 eşantioane provin din aceeaşi populaţie. Ex: pp că într-o anchetă s-a studiat câte un eşantion din 2 judeţe şi s-a stab că în cazul primului , pe un eş de 700 de oam 25,8% votau cu X, iar pe al doilea, pe un eş de 1300 pt X votau 21,3%. Există o diferenţă de atitudine? Ipoteza nulă este pp că populaţiile celor 2 judeţe sunt identice, din punctul de vedere analizat, şi că diferenţa dintre procentele 25,8 şi 21,3 se datorează fluctuaţiilor normale de eşantionare. După calcule ajungem la T=2,25, deci se depaseste val critică de 1,96%, pt pragul de probabilitate de 0,95. P este 0.9756, deci vom respinge ipoteza nulă pt că există 97,56% şanse ca realmente în prima populaţie partidul nostru să aibă mai mulţi aderenţi decât în a doua. Testarea semnificaţiei coeficientului de corelaţie Trebuie să se testeze valorile mici ale coeficientului de corelaţie, adică dacă se obţine pe eşantion o anumită corelaţie, ea se regăseşte (cu acelaşi semn) la nivelul populaţiei.
5
Testul hi pătrat p.108 Teste de semnificaţie pentru eşantioane mici: Testul t Este corespondentul testului Z, utilizabil în judecarea diferenţelor dintre 2 valori medii sau proporţii, pt cazul când numărul indivizilor din eşantion este mic (nu mai mare de 60), t= (a-b)/e A şi b sunt cele 2 valori care se compară, dintre care cel puţin una e obţinută pe eşantion, iar e este eroarea standard, calculată la fel ca mai înainte, numai că la numitor se pune n-1 în loc de n Semnificaţia coeficienţilor de corelaţie se pune cu mult mai multă acuitate în cazul eşantioanelor mici...? Testul Fisher Procedură prin care se decide dacă dispersia unei caracteristici este diferită în 2 populaţii reprezentate prin 2 eşantioane mici. Cap. 6 Asocierea caracteristicilor calitative Metodele statistice se împart în nonparamertice (calitative, având la baza caracteristici construite pe scala nominală sau ordinală) şi cele parametrice, (cantitative, când se lucrează cu caracteristici construite pe scale de intervale sau de rapoarte). Asocierea este realizată atunci când distribuţia simultană a indivizilor statistici după 2 sau mai multe caracteristici calitative, adică variabile nominale sau ordinale. (asocierea este sinonimă cu contingenţa –grup de oameni având o compoziţie omogenă-). Asocierea evidenţiază comportamentul simultan al indivizilor faţă de cele 2 variabile, induce oarecum ideea de abordare simetrică a factorilor studiaţi. Un tabel de contingenţă este cel în care ne permite analiza comportamentului indivizilor în funcţie de o variabilă, în măs în care, după cealaltă var, sunt identici. Etapele asocierii: - analiza bivariată (asocierea a 2 caracteristici) o 2 caracteristici (dihotomice) O caracteristică dih e una care decupează din mulţimea indivizilor pe aceia care posedă o anumită proprietate, distingându-i de cei care nu o posedă. De ex. sexul, şi orice var calitativă. Având 2 var dih, indivizii ce formează populaţia statistică se repartizează în 4 categorii. Pe prima diagonală asocierea este pozitivă, în timp ce pe a doua diagonală, asocierea este negativă. Astfel, legătura dintre variabile poate avea intensităţi diferite. De aceea, după descoperirea existenţei sau nu a unei asocieri , este calcularea unui coeficient care să măsoare această intensitate. Coeficienţii de asociere: (0-lipsa asocierii,1-asociere maximă), (+1 e pt asoc poz,-1 e pt asoc neg) Asocierea perfectă nu se poate realiza decât în cazul în care distribuţiile de frecvenţe ale celor 2 var luate separat coincid. În principiu, coeficienţii propuşi pt măsurarea asocierii pot fi simetrici (se încearcă o măsurare globală a relaţiei statistice între cele 2 var) şi asimetrici (poziţiile variabilelor nu sunt identice, una fiind considerată anterioară, independentă sau predictivă în raport cu cealaltă). Nici o rel statistică ne este o garanţie pt existenţa unei relaţii reale de determinare sau de cauzalitate între fenomenele sociale transpuse în formă statistică. Coeficienţi de asociere pentru caracteristicile dihotomice: - coeficientul fi concentrarea valorilor pe prima diagonală, înseamnă că coef vor primi val pozitivă - coeficientul Yule (ia val între –1 şi +1), se anulează în cazul în care variabilele sunt statistic independente - coeficientul Y (Putem vorbi de un sens al asocierii numai pt că am presupus că o clasă desemnează prezenţa unui atribut , iar cealaltă absenţa acestuia, semnul + se atribuie în caz de concordanţă , adică prezenţă sau absenţă simultană a atributelor. Astfel am interpretat practic caracteristica dihotomică drept o variabilă ordinală)
6
o variabile categoriale (religie, naţionalitate) Două caracteristici a căror structură o constituie un sistem de clase, în număr superior lui 2, clase care pot fi stări calitative propriu-zise (deci trepte ale unei scale nominale) sau stări calitative rezultate dintr-o reducţie de scală, în sensul că se renunţă la ordonarea claselor sau a intervalelor de valori. Deci nu introducem nici o ipoteză asupra sistemului de categorii, situându-ne în situaţia variabilelor nominale. Nu mai putem vorbi de un sens al asocierii, toţi coeficienţiivor fi pozitivi, mişcându-se pe intervalul (0,1). Existenţa asocierii se stabileşte, ca şi mai înainte prin apelul la situaţia de independenţă. Măsurarea asocierii se realizează prin mai mulţi indici: - Coeficientul de contingenţă C (al lui Pearson). Acesta nu se poate apropia de valoarea 1 decât dacă tabelul este din ce în ce mai mare - Coeficientul V al lui Cramer - Coeficientul Lambda: se defineşte ca proporţia cu care se reduc erorile , prin introducerea var independente. Neajunsul acestui copeficient este că el se poate anula şi în cazul existenţei unei asocieri. - Coeficientul Tau - Coeficientul de incertitudine U. Acest coef uzează de noţ de entropie: gradul de nedeterminare sau de incertitudine faţă de plasarea indivizilor în categoriile respectivei caracteristici o variabile ordinale Există o ordine a claselor caracteristicii, ceea ce implică, pe de o parte, necesitatea de a vorbi de un sens al asocierii, observând dacă există o concordanţă sau discordanţă legată de ordonările respective. Indicatori: - coeficienţii lui Kendall - Coeficientul gama (+1 dacă nu e nici o discordanţă, -1 dacă nr concordanţelor e nul şi 0 dacă nr concordanţelor egal nr discordanţelor)
-
analiza multivariată (asocierea simultană a mai multor caracteristici) Este orice procedură statistică de evidenţiere şi evaluare a rel dintre 3 sau mai multe caracteristici, indiferent de tipul scalei pe care s-au construit. Este vorba de caracteristici de tip calitativ, variabile categoriale. Ideea analizei multivariate este că prin modele statistice adecvate se pot reproduce condiţiile experimentului, adică o relaţie dintre 2 var (cauză-efect) se validează dacă se regăseşte în situaţia când sunt controlate (menţinute constante) alte variabile. Putem întâlni o situaţie în care de ex. factorul „pagubele produse de un incendiu” B este corelat cu „amploarea mijloacelor materiale şi umane folosite de pompieri pt stingerea focului”, A. Cu toate acestea, A şi B derivă din C „gravitatea incendiului”. Utilitatea descoperirii faptului că A şi B sunt consecinţe ale lui C este că se va respinge ipoteza unei relaţii de determinare între A şi B. Un alt subtip este cel în care variabila C este intermediară, el mijlocind influenţa lui A asupra lui B. Caracterul ideal al acestui subtip este atunci când toată influenţa lui A asupra lui B se transmite prin C. A C B Ex: mobilitatea socială: A este originea soc, C niv şcolar al indivizilor, iar B este statusul indivizilor Un alt subtip: var cauzală A şi cea test C sunt independente statistic. Lipsa de asociere între A şi C poate fi naturală sau artificială. De ex dacă ne interesează inf vârstei tineri-vârstnici (A) asupra asupra atitudinii politice B: (st-dr), luând ca variabilă test mediul urban sau rural, şi ştiind că mediul rural diferă mult de cel urban în privinţa reprezentării pe vârste. Cerinţa este ca lotul experimental să coincidă cu cel de control, din pdv al caract C: „elaborare de relaţii parţiale”. Sunt evidenţiate 2 subtipuri: - C anterior lui A - C intermediar: A stimul, B răspuns, C condiţie
7