Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
CUVÂNT ÎNAINTE Statistica economic ă este disciplina care î şi propune ini ţierea studenţilor din anul I specializarea Finan ţe – Bănci şi E.C.T.S., forma de înv ăţământ ID în studiul statisticii, însuşirea metodelor şi procedeelor specifice acesteia. Lucrarea are un scop didactic, formativ şi instructiv, iar prin aplica ţiile prezentate este, în acelaşi timp, şi un ghid practic la îndemâna celor interesa ţi, care fac cuno ştinţă cu elementele teoretice fundamentale ale obiectului şi metodei de cercetare a statisticii, cu principiile, procedeele şi instrumentele specifice utilizate în modelarea realit ăţilor lumii economice. Cursul este structurat pe module de studiu, fiecare având un num ăr de lecţii, iar cunoştinţele sunt asimilate prin parcurgerea pa şilor de învăţare. Ritmul mediu recomandat de studiu individual este, conform programei analitice, de 2 ore săptămânal, dar pentru parcurgerea fiec ărui modul se recomand ă un timp de înv ăţare propriu acestuia. Fiecare modul are precizat înc ă de la început: obiectivele specifice; rezultatele a şteptate; competenţe dobândite ca urmare a parcurgerii modulului; timpul mediu necesar pentru asimilarea modulului, iar în final: rezumate; concluzii; exemple ilustrative; recomandări bibliografice; teste de autoevaluare; teme de control (conform cu calendarul disciplinei). Astfel structurat ă, materia se parcurge u şor, asigurând preg ătirea gradual ă a studenţilor.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
5
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Modulul I STATISTICA ŞI ROLUL EI ÎN CUNOAŞTEREA FENOMENELOR ŞI PROCESELOR ECONOMICE. OBSERVAREA, SISTEMATIZAREA SISTEMATIZAREA ŞI PREZENTAREA DATELOR STATISTICE Lecţia 1. Statistica şi rolul ei în cunoaşterea fenomenelor şi proceselor economice Lecţia 2. Observarea, sistematizarea şi prezentarea datelor statistice Lecţia 3. Indicatorii statistici Obiectivele specifice modulului: Definirea noţiunilor de obiect şi metodă a Statisticii Introducerea no ţiunilor de observare, prelucrare şi sistematizare a datelor statistice Introducerea no ţiunii de indicatori statistici Prezentarea no ţiunilor de baz ă utilizate în statistic ă Rezultatele aşteptate: Însuşirea noţiunii de fenomen de mas ă Folosirea no ţiunii de tabel statistic simplu şi de tabel cu dubl ă intrare Aplicarea grup ării statistice pentru sistematizarea şi prezentarea datelor statistice Competenţe dobandite ca urmare a parcurgerii modulului: Deprinderea folosirii metodei grup ării statistice Realizarea de referate aplicative legate de problematica modulului Discuţii cu specialişti în domeniu Timpul mediu necesar pentru asimilarea modulului: 6 ore
6
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Lecţia 1 STATISTICA ŞI ROLUL EI ÎN CUNOAŞTEREA FENOMENELOR ŞI PROCESELOR ECONOMICE Pasul 1 - Noţiuni introductive. Statistica – apari ţia şi dezvoltarea sa ulterioar ă Ce este Statistica şi de ce se studiaz ă această disciplină? În ce domenii de activitate se utilizează? Când au ap ărut primele înregistr ări de date statistice? Acestea sunt câteva întreb ări pe care ni le punem în mod firesc şi la care vom g ăsi răspunsul în cadrul acestui capitol. Înainte de a da o defini ţie Statisticii şi de a răspunde la întrebarea de ce se studiaz ă aceasta, să începem prin a observa în ce domenii se folose şte Statistica. Astfel, auzim sau citim aproape în fiecare zi în mass-media despre rata infla ţiei, deficitul bugetar, indicele puterii de cump ărare, salariul mediu pe economie, valoarea co şului zilnic, cursul de schimb al principalelor valute sau clasamentul echipelor de fotbal sau clasamentul pe medalii al ţărilor participante la Olimpiada de var ă de la Beijing din acest an. Ce reprezint ă toate aceste informaţii? Cum se ob ţin ele? Cum se pot ele interpreta? Sunt câteva întreb ări pe care poate nu ni le punem atunci când venim în contact cu aceste informa ţii, dar care totu şi pot contura un prim răspuns la întreb ările: în ce domenii se folose şte Statistica şi de ce se studiaz ă această disciplină. Astfel toate aceste informa ţii din mass-media, şi nu numai, reprezint ă date statistice, al c ăror scop şi utilitate sunt evidente. De asemenea, tot date statistice sunt şi informaţiile referitoare la rata mortalit ăţii, rata natalităţii, gradul de ocupare a popula ţiei active sau rata şomajului pe jude ţe sau la nivelul întregii ţări. Astfel, se constat ă că datele statistice sunt necesare în toate domeniile de activitate. În opinia profesorului univ. dr. Elisabeta Jaba în lucrarea „Statistic ă”, Ed. Economica, Bucure şti, 1997, „utilizarea informa ţiei disponibile pentru a ajunge la cunoa şterea faptelor şi, pe această bază, la ameliorarea deciziilor din orice domeniu al activit ăţii umane devine posibil ă prin statistic ă”. Definiţie Astfel putem spune c ă statistica este ştiinţa care studiază aspectele cantitative ale fenomenelor social-economice de mas ă, fenomene care variaz ă în timp şi spaţiu, pornind de la conţinutul calitativ al acestora. Clasificare Se consideră că „rădăcinile istorice ale statisticii moderne sunt: • statistica practică, în sensul unor înregistr ări sistematice sau izolate, ce pot fi asimilate unor observ ări statistice utilizate şi azi; • statistica descriptivă , ca disciplină de învăţământ şi de concepere a statisticii practice necesară conducerii de stat;
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
7
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
ilor, ca fundamentare conceptual ă şi • aritmetica politică şi calculul probabilităţ ilor mod de interpretare a fenomenelor în statistica modern ă”1 . 1) Statistica practică reprezintă cea mai veche form ă de activitate statistic ă şi datează
conform documentelor descoperite, de mai multe milenii. În opinia profesorului Elisabeta Jaba în lucrarea „Statistic ă” activitatea statistic ă în forma sa incipient ă, cunoscută sub denumirea şi de „prestatistică” datează de peste 6 milenii şi se practica sub form ă de numărătoare a popula ţiei şi de evidenţă a bunurilor materiale. Aceasta servea unor scopuri fiscale, militare, demografice şi administrative. Înc ă din antichitate se efectuau un fel de recensăminte statistice (inventarieri) în Egipt, China, Grecia, Imperiul Roman referitoare la numărul popula ţiei (census), la inventarierea aurului sau a p ământului (cadastru). Dup ă ocuparea Daciei, administra ţia romană introduce practica unor statistici privind eviden ţa populaţiei, produc ţiei şi consumului, cunoscute sub denumirea de „ tabularium”. Odată cu dezvoltarea me şteşugurilor şi a comerţului, are loc o prim ă scindare a informaţiilor în dou ă categorii: cele ţinute în interesul negustorilor şi comercian ţilor priva ţi cu ajutorul contabilit ăţii şi cele culese pentru a fi puse la dispozi ţia conducerii statului. Termenul de statistică provine de la cuvântul „status” cu sensul de stare, s tare, situa ţie, poziţie şi „din cuvântul 2 stato, cu în ţeles limitat de stat”. De asemenea, în aceea şi perioadă, eviden ţa căsătoriilor, naşterilor şi deceselor, era realizat ă de către preoţi. 2) Statistica descriptivă apare şi se dezvolt ă în secolele al XVI-lea şi al XVII-lea în cadrul universit ăţilor, alături de practica statistic ă. Această şcoală a fost numit ă astfel, întrucât reprezentanţii săi considerau c ă statistica trebuie s ă se ocupe de descrierea situa ţiei geografice, economice şi politice a unui stat. Statistica descriptivă realiza doar „descrierea statelor sau a unor p ărţi ale acestora f ără să se ocupe şi de cunoa şterea regularit ăţilor care se manifestau în interiorul lor, a legilor care guvernau aceste fenomene. 3) Aritmetica politică apare în Anglia, odat ă cu publicarea lucr ării lui William Petty – „Aritmetica politic ă”, şi reprezint ă un curent nou şi important în dezvoltarea statisticii ca ştiinţă. „În concep ţia acestui curent, statistica reprezint ă un mijloc de analiz ă a datelor înregistrate prin care se cercetează cauzele, legităţile de manifestare a fenomenelor de mas ă, de tip colectiv” 3. Şcoala aritmeticii politice pune bazele statisticii moderne, întrucât introduce no ţiuni precum: medie, propor ţie, regularitate, cauzabilitate, reprezentativitate şi utilizează metode cantitativ numerice pentru studierea fenomenelor economice şi sociale. Încep s ă se efectueze numeroase cercet ări în domeniul demografiei şi criminalităţii, de către L.A.I. Quételet, pe 1
Biji, E.M.; Petcu, N.; Wagner, P., Lilea, E.; Vătui, M. – „Statistică”, Ed. Didactică şi Pedagogică, Bucureşti, 1999, p. 10 şi Balei, T; Biji, E.; Tövissi.; Wagner, P.; Isaic-Maniu, Al.; Korka, M.; Porojan, D. – „Statistică teoretică şi economică”, Ed. Didactică şi Pedagogică, Bucureşti, 1996, p. 12. 2 Balei, T.; Anghelache, C; Ţiţan, E. – Op. cit., p. 14. 3 Jaba, E., - „Statistică”, Ed. a II-a, Ed. Economică, Bucureşti, 1998, p. 9.
8
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
baza legii numerelor mari şi a probabilit ăţilor, motiv pentru care Quételet este considerat şi fondatorul statisticii moderne. Începând din a doua jum ătate a secolului al XVIII-lea, o dat ă cu apariţia calculului probabilit ăţ ilor statistica utilizează metodele matematice tot mai frecvent, în vederea ăţ ilor determinării cauzelor care genereaz ă fenomenele şi procesele din societate, dar şi pentru cercetarea legilor care le guverneaz ă şi nu în ultimul rând şi pentru realizarea previziunii ştiinţifice. Apare ulterior statistica inductivă, ai cărei reprezentan ţi de seamă au fost: Fisher, Jule, Pearson, Cebâ şev, Marcov şi alţii. Astfel, statistica începe s ă fie folosită nu doar pentru studierea trecutului şi prezentului, ci şi pentru elaborarea unor ipoteze asupra modului în care se vor comporta în viitor acelea şi fenomene.
Pasul 2 - Obiectul şi metoda Statisticii Definiţie Statistica are ca obiect de studiu fenomenele social-economice de mas ă în cadrul cărora acţionează legile statistice şi care variază în timp şi spaţiu. În opinia prof. univ. dr. Elisabeta Jaba în lucrarea „Statistic ă”4, obiectul de studiu al Statisticii îl constituie „mi şcările curente-continue ale fenomenelor şi proceselor ce- şi au existenţa sub formă de colectivit ăţi”. Se precizează în aceeaşi lucrare c ă profesorul Alexandru B ărbat considera c ă: „fenomenele, nu pot deveni obiect de studiu al statisticii în forma lor de substan ţă materială, ci numai sub formă de mişcare, şi anume, sub form ă de mişcări curente-continue”. 5 Definiţie Fenomenele de masă denumite şi fenomene de tip colectiv, fenomene stochastice sau fenomene atipice, sunt acele fenomene care apar ca rezultat al influen ţei exercitate de un num ăr mare de cauze şi condiţii variabile, cu grade şi sensuri diferite de influenţă. Astfel, fenomenele de mas ă sunt acele fenomene care se produc într-un num ăr mare de cazuri, variaz ă de la un caz la altul şi sunt de fapt forme individuale de manifestare concretă sub raport organizatoric, în timp şi spaţiu. Legile statistice care ac ţionează în cadrul acestor fenomene de mas ă evidenţiază de fapt tendinţa predominant ă în cadrul formelor individuale de manifestare a fenomenelor, dar aceasta nu se poate identifica la nivelul fiec ărui element component al colectivit ăţii totale supuse cercet ării. În vederea determin ării şi verificării legilor statistice care guverneaz ă fenomenele de mas ă trebuiesc analizate toate formele individuale de manifestare a fenomenului cercetat, astfel încât s ă se poată manifesta legea numerelor mari.
4 5
Jaba, E. – Op. cit., p. 12. Bărbat, A. – „Teoria statisticii sociale”, Editura Didactică şi Pedagogică, Bucureşti, 1972, p. 30.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
9
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Concluzie Obiectul Statisticii, îl reprezint ă studierea fenomenelor social-economice de mas ă în cadrul cărora acţionează legile statisticii, precum şi studierea aspectelor cantitative ale fenomenelor de mas ă, dar având în vedere con ţinutul calitativ al acestora. Definiţie Metoda Statisticii este constituită din ansamblul opera ţiilor, tehnicilor, procedeelor, principiilor metodologice şi metodelor de investigare statistic ă a fenomenelor de mas ă, „în variaţia lor curent ă-continuă în timp, în spa ţiu şi din punct de vedere calitativ” 6. Clasificare Aceste procedee şi metode utilizate în cadrul procesului de cercetare statistic ă se aplică în cadrul urm ătoarelor etape: 1. definirea problemei; 2. observarea statistic ă; 3. prelucrarea şi analiza datelor statistice; 4. analiza şi interpretarea rezultatelor; 5. formularea concluziilor statistice. 1. Definirea problemei presupune stabilirea scopului observ ării, a fenomenului observat şi elaborarea planului de cercetare. 2. Observarea statistic ă constă în înregistrarea fiec ărui caz în parte; aceasta se realizează fie prin raport ări statistice, dări de seam ă, înregistr ări exhaustive ale unei popula ţii (recensăminte, etc.), fie prin sondaje. 3. Prelucrarea şi analiza datelor statistice. Prelucrarea datelor statistice presupune: sistematizarea datelor, prelucrarea lor cu ajutorul metodelor statistice în vederea elimin ării abaterilor individuale, calcularea indicatorilor statistici, m ăsurarea gradului de intensitate a legăturilor, m ăsurarea influen ţei factorilor, determinarea func ţiilor de regresie, extrapolarea în vederea prognoz ării fenomenului cercetat, precum şi estimarea parametrilor şi verificarea ipotezelor statistice. Procesul de cercetare statistic ă se finalizează cu etapa de analiz ă şi interpretare a rezultatelor, precum şi cu cea de formulare a concluziilor care trebuie s ă evidenţieze variante probabile de apari ţie a fenomenului respectiv în viitor. În perioada actual ă, statistica este considerată o disciplină de grani ţă, care asigur ă cercetărilor ştiinţifice un caracter interdisciplinar şi care se aplic ă în toate domeniile în care fenomenele de mas ă pot fi exprimate cantitativ-numeric şi variază ca form ă de manifestare în timp şi spaţiu. Apariţia şi dezvoltarea în ultima perioad ă a unor ştiinţe precum: cibernetica, informatica economic ă şi de gestiune, econometria, teoria sistemelor, biometria ş.a. au 6
Jaba, E. – Op. cit., p. 13.
10
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
impulsionat utilizarea din ce în ce mai mult a metodelor statistice. În practic ă, interdependen ţa dintre statistică şi celelalte discipline se concretizeaz ă în analiza teoretic ă ce se realizează înaintea oricărui studiu statistic, şi mai ales în formularea concluziilor statistice privind fenomenele cercetate cu ajutorul metodelor statistice.
Pasul 3 - Noţiuni de bază utilizate în Statistic ă În vederea realiz ării unor cercet ări statistice corecte şi pentru evitarea unor interpret ări confuze, statistica utilizeaz ă un limbaj unitar, format din no ţiuni (concepte) de baz ă precum: colectivitate statistic ă, unitate statistic ă, caracteristici statistice şi indicatori statistici. Definiţie Colectivitatea statistică denumită şi popula ţ ie ie statistică reprezintă totalitatea elementelor care au caracteristici esen ţiale comune, adic ă totalitatea elementelor omogene. Clasificare Colectivităţile statistice pot fi: statice şi dinamice. În cazul colectivit ăţilor statice timpul este constant, iar în cazul celor dinamice, spa ţiul şi forma organizatoric ă sunt constante. Colectivit ăţ ile statice exprimă o stare şi reprezintă un existent (stoc) la un moment dat, ăţ ile în timp ce colectivit ăţ ăţ ile ile dinamice exprimă un proces sau un flux, adic ă o devenire în timp, iar elementele componente trebuie înregistrate pe un interval de timp, şi nu doar la un moment dat ca în cazul colectivit ăţilor statice. Exemple Exemplul 1: Colectivit ăţi statice: Populaţia municipiului Gala ţi la data de 1 ianuarie 2008. Suprafaţa arabilă a României la data de 1 ianuarie 2008. Exemplul 2: Colectivit ăţi dinamice: Căsătoriile încheiate în municipiul Gala ţi în cursul anului 2008. Naşterile din municipiul Gala ţi în cursul lunii aprilie 2008. Clasificare Prof. univ. dr. Elisabeta Jaba apreciaz ă în lucrarea „Statistic ă” că o colectivitate statistică poate fi în func ţie de gradul de cuprindere, fie o colectivitate totală atunci când cuprinde totalitatea elementelor componente, fie o colectivitate par ţ ial ială , de selec ţ ie ie (e şantion) atunci când cuprinde un num ăr reprezentativ de unit ăţi extrase dintr-o colectivitate total ă ce nu poate fi înregistrat ă în totalitate, din cauz ă că ar fi neeconomic ă sau pentru c ă prin înregistrare, elementele colectivit ăţii ar fi distruse. Definiţie Unităţ ile ile statistice sunt acele elemente care formeaz ă colectivitatea statistic ă, iar ansamblul acestor unit ăţi reprezint ă volumul sau efectivul colectivit ăţii (n). Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
11
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Unităţile statistice trebuie s ă fie independente şi obiective astfel încât s ă poată fi studiate fie separat, fie la nivelul întregii colectivit ăţi. De asemenea, unit ăţile statistice trebuie definite clar în vederea identific ării lor corecte în momentul observ ării şi înregistrării astfel încât să nu se creeze confuzii şi să se obţină date nereale. Clasificare Unităţile statistice se clasific ă din mai multe puncte de vedere, astfel: 1. unităţ i statice şi dinamice, în mod analog cu acele colectivit c olectivit ăţi pe care le compun şi din care provin. 2. unităţ i statistice simple şi complexe. Cele simple sunt acele unit ăţi statistice compuse dintr-un singur element, în timp ce unit ăţile statistice complexe sunt formate din mai multe unit ăţi simple şi sunt rezultatul modului de organizare socio-economic al colectivit ăţii. Exemple Exemplul 3: Unităţi statistice simple: - persoana (individul); - elevul; - studentul. Unităţi statistice complexe: - familia; - clasa de studiu; sec ţia; anul de studiu. Unităţ i statistice active şi pasive. Cele active sunt cele care transmit în mod direct date statistice despre ele, precum şi despre unit ăţile statistice pe care le reprezint ă, iar unităţile statistice pasive sunt cele despre care se transmit datele statistice. Definiţie Caracteristicile statistice denumite şi variabile statistice sau variabile aleatoare sunt acele criterii care definesc unit ăţile unei colectivit ăţi statistice, adic ă „acea proprietate care este comună tuturor unit ăţilor unei colectivit ăţi statistice”7, dar care variaz ă ca formă de manifestare sau ca nivel de dezvoltare. „Varia ţia nivelului unei caracteristici de la o unitate la alta dă caracteristicilor statistice caracterul de variabile aleatoare” 8. Clasificare Variabilele sau caracteristicile statistice se clasific ă după mai multe criterii, astfel: 1) după importan ţ a lor , caracteristicile pot fi: a) esen ţ iale iale – cele care se reg ăsesc la nivelul tuturor unit ăţilor colectivităţii statistice; b) neesen ţ iale iale – cele care se reg ăsesc doar la unele dintre unit ăţile colectivităţii. 2) după con ţ inutul inutul lor pot fi: 7 8
Balei, T.; Anghelache, C.; Ţiţan, E. – Op. cit., p. 19. Jaba, E. – Op. cit., p. 20.
12
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
a) de timp – eviden ţiază apartenenţa unităţilor statistice la un moment dat sau la un interval de timp; iu (teritoriale) – eviden ţiază apartenenţa unităţilor statistice la un b) de spa ţ iu anumit „teritoriu; altfel spus arat ă situarea în teritoriu a unit ăţii”9; c) atributive (calitative) – „exprim ă esenţa, natura unit ăţilor”10. 3) după modul de exprimare sunt: a) numerice (cantitative) – cele măsurabile şi care pot fi exprimate numeric; b) nenumerice (calitative) – cele care nu pot fi m ăsurate numeric şi care sunt exprimate prin cuvinte. 4) după modul de manifestare, caracteristicile statistice sunt: a) alternative (binomiale sau binare) – sunt cele care nu pot lua decât dou ă valori; Exemple Un candidat la un examen poate fi admis Exemplul sau respins, astfel se pot asocia valorile 4: DA pentru admis sau NU pentru respins; de asemenea, se pot asocia coduri numerice 1 pentru DA şi 0 pentru NU. b) nealternative – cele care pot lua valori distincte pentru fiecare unitate a colectivităţii statistice. 5) după felul varia ţ iei iei pot fi: ie discontinuă (discret ă a) caracteristici cu varia ţ ie ă) – cele care nu pot lua decât anumite valori în cadrul unui anumit interval de valori; ie continuă – cele care pot lua orice valoare în b) caracteristici cu varia ţ ie cadrul unui anumit interval de valori. 5) după modul de ob ţ inere inere, sunt: a) caracteristici primare – cele care se ob ţin în cursul procesului de culegere a datelor; b) caracteristici derivate – cele care se ob ţin după prelucrarea datelor culese, pe baza unui anumit model de calcul. Definiţie Indicatorul statistic reprezint ă „rezultatul numeric al unei num ărători, al unei măsurători statistice a fenomenelor şi proceselor de mas ă sau al unui calcul asupra datelor obţinute printr-o înregistrare statistic ă”11. 9
Isaic-Maniu, Al.; Korka, M., Porojan, D. – Op. cit., p. 22. Jaba, E. – Op. cit., p. 22. 11 Jaba, E. – Op. cit., p. 26. 10
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
13
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Clasificare Indicatorii statistici se pot clasifica dup ă mai multe criterii, şi anume: 1) după modul de ob ţ inere inere, pot fi: a) primari – „sunt rezultatul unei m ăsurători statistice şi exprimă, în m ărime absolută, o dimensiune oarecare a unei colectivit ăţi sau a unui element al acesteia” 12; b) deriva ţ i – sunt acei indicatori ob ţinuţi după prelucrarea indicatorilor primari. 2) după gradul de cuprindere, pot fi: a) sintetici – „expresii numerice ale categoriilor economice de sintez ă”13 – de exemplu P.I.B., P.I.N., P.G.B., etc.; b) analitici – evidenţiază structura unei colectivit ăţi, precum şi factorii de influen ţă. 3) după modalitatea de exprimare, sunt: rimi absolute; a) indicatori exprima ţi sub form ă de mă rimi b) indicatori exprima ţi sub form ă de mă rimi rimi relative; c) indicatori exprima ţi sub form ă de mă rimi rimi medii. Lecţia 2 OBSERVAREA, SISTEMATIZAREA ŞI PREZENTAREA DATELOR STATISTICE Pasul 1 - Noţiuni introductive Cercetarea statistic ă este un proces complex de culegere a datelor, de prelucrare a acestora şi ulterior de analiz ă şi interpretare a rezultatelor. Altfel spus, cercetarea statistic ă reprezintă procesul de cunoa ştere a fenomenelor de mas ă cu ajutorul metodelor statistice” 14. Cercetarea statistică se realizează pe parcursul a trei etape, şi anume: 1. observarea statistic ă sau culegerea datelor; 2. prelucrarea datelor statistice; 3. analiza şi interpretarea rezultatelor. Astfel, „datele individuale ob ţinute prin observarea statistic ă sunt supuse, apoi, prelucrării statistice, proces prin care î şi pierd individualitatea, reg ăsindu-se doar prin trăsăturile lor esen ţiale cristalizate, prin generalizare şi abstractizare, în informa ţii statistice”15. În cadrul procesului de cercetare statistic ă se întocme şte un program de cercetare statistică care sistematizeaz ă problemele ce trebuie rezolvate în cele trei etape ale cercet ării. 12
Ibidem, p. 26. Idem, p. 26. 14 Balei, T.; Anghelache, C.; Ţiţan, E. – Op. cit., p. 22. 15 Jaba, E. – Op. cit., p. 29. 13
14
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 2 - Observarea statistică Definiţie Observarea statistic ă reprezintă „un proces complex de identificare, m ăsurare şi înregistrare a fenomenelor de masă, de tip colectiv, în forma lor individual ă şi concretă de manifestare”16. Observarea statistic ă este de fapt înregistrarea tuturor valorilor (variantelor) caracteristicilor cuprinse în programul cercet ării, după o metodologie unitar ă. Datele obţinute în urma observării statistice trebuie s ă îndeplinească condiţia de volum şi condiţia de calitate. Condiţia de volum se refer ă la necesitatea culegerii datelor de la un num ăr suficient de mare de unităţi statistice, astfel încât legea numerelor mari s ă se poată manifesta, adică influenţa factorilor aleatori s ă se poată compensa reciproc şi astfel să se obţină o valoare tipic ă pentru întreaga masă de fenomene de acela şi conţinut. Condi ţia de calitate se refer ă la necesitatea culegerii unor date autentice, întrucât altfel nu se vor ob ţine rezultate reale, ci acestea vor fi afectate de erori. În vederea eficientiz ării acestei activit ăţi de culegere a datelor se elaboreaz ă în prealabil un program al observ ării statisticii. Definiţie Programul observ ării statistice urm ăreşte rezolvarea unor probleme referitoare la: scopul observării, obiectul observ ării, delimitarea colectivit ăţii, definirea unit ăţilor de observare, programul observ ării, formularele de înregistrare, timpul şi locul observ ării, problemele organizatorice. 1. Scopul observă rii trebuie să se subordoneze scopului cercet ării statistice. 2. Obiectul observă rii se referă la colectivitatea ce este supus ă cercetării statistice sau la unităţile care se înregistreaz ă în func ţie de scopul urm ărit. 3. Delimitarea colectivităţ iiii supuse cercetării trebuie realizat ă atât în timp, cât şi în spaţiu pentru a nu exista neclarit ăţi în cursul opera ţiei de culegere a datelor. ilor de observare . Unităţile de observare sunt elementele 4. Definirea unităţ ilor componente ale colectivit ăţii supuse cercet ării statistice. Este important ca în cazul unei observări totale să nu se omit ă nici o unitate statistic ă, iar în cazul unei observ ări parţiale nu trebuie omis ă nici o unitate reprezentativ ă. 5. Programul observ ă rii cuprinde de fapt o list ă a tuturor caracteristicilor ce trebuiesc înregistrate, precum şi modalităţile concrete de culegere a datelor. „El se concretizeaz ă în întrebări, care sunt înscrise în formulare statistice ( fi şe – care se completeaz ă pentru o singur ă unitate de observare şi liste – care se completeaz ă pentru mai multe unit ăţi)”17. 6. Formularele de înregistrare sunt însoţite de norme metodologice şi tehnice imprimate direct pe formularul respectiv sau în alte anexe denumite „instruc ţiuni de 16 17
Idem, p. 29. Balei, T.; Anghelache, C.; Ţiţan, E. – „Statistică”, Ed. Economică, Bucureşti, 1996, p. 24.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
15
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
înregistrare”. Formularele „cuprind un sistem de indicatori ce urmeaz ă a fi completa ţi, cazul rapoartelor statistice, sau un set de întreb ări, cazul chestionarului” 18. Formularele completate „reprezintă punctul de plecare în prelucrarea statistic ă”19. şi locul observă rii. 7. Timpul ş Timpul observă rii poate fi privit din dou ă puncte de vedere astfel: timpul la care se referă datele înregistrate şi timpul înregistr ării. „Timpul la care se refer ă observarea se alege în aşa fel încât fenomenul observat s ă fie surprins într-o stare normal ă, caracteristic ă”20. Locul observ ă rii este acel loc în care exist ă fenomenul suspus cercet ării. 8. Problemele organizatorice se refer ă la îndeplinirea tuturor condi ţiilor în vederea ăşurării observării statistice în condi ţii cât mai bune. În acest scop se recruteaz ă şi se desf ăş instruieşte personalul care culege datele, se întocme şte lista unit ăţilor de înregistrare, se organizează teritoriul şi se întocme şte harta acestuia, se organizeaz ă activităţile conexe procesului de culegere a datelor, se elaboreaz ă devizul şi se asigură fondurile necesare derulării întregii activit ăţi.
Pasul 3 - Metode de observare statistică Clasificare Metodele de observare statistic ă se clasifică după mai multe criterii, şi anume: 1) din punct de vedere al gradului de cuprindere al num ă rului ăţ i în cadrul rului de unit ăţ procesului de observare, pot fi: a) observă ri totale (înregistrări totale); iale (înregistrări parţiale). b) observă ri par ţ iale 1.a. Observă rile rile totale se realizează prin înregistrarea tuturor unit ăţilor colectivit ăţii, după criterii unitare potrivit programului observ ării. În aceast ă categorie sunt cuprinse înregistrări, precum: recensă mântul mântul şi raport ă r ile statistice (d ă ările ările rile de seamă statistice); 1.b. Observă rile prin înregistrarea doar de la o parte din unit ăţile rile par ţ iale iale se realizează prin înregistrarea colectivităţii (eşantion sau colectivitate de selec ţie), parte care trebuie s ă fie reprezentativ ă în raport cu întreaga colectivitate. 2) din punct de vedere al modului în care este caracterizat fenomenul, observările pot fi: a) statice – cele care înregistreaz ă date referitoare la volumul şi structura unei colectivit ăţi statice, delimitat ă ca volum la un moment dat; b) dinamice – cele care înregistreaz ă derularea unui proces care evolueaz ă în timp, care este într-o continu ă transformare. 3) din punct de vedere al modului de organizare, observările pot fi: 18
Jaba, E. – Op. cit., p. 33. Idem, p. 34. 20 Ibidem, p. 34. 19
16
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
a) cu caracter permanent denumite şi curente, continue – cele în care datele sunt înregistrate sistematic; b) observă ri speciale – sunt organizate de c ătre organul oficial central de statistic ă de fiecare dată când este necesar, în vederea realiz ării unei analize cât mai aprofundate a fenomenelor complexe existente în societate. 4) din punct de vedere al timpului de efectuare, observările se pot clasifica, astfel: - observări curente – cele în care unit ăţile colectivităţii sunt observate permanent; - observări periodice (de momente) – sunt observ ări special organizate în vedere obţinerii de date asupra colectivit ăţilor neincluse în observa ţiile curente; - observări unice (ocazionale) vizează fenomene cu caracter de discontinuitate. Cele mai utilizate metode de observare statistic ă sunt: 1 – recens ământul; 2 – rapoartele statistice (d ările de seamă statistice); 3 – ancheta prin sondaj; 4 – ancheta statistic ă; 5 – monografia, ş.a.
Pasul 4 - Prelucrarea şi sistematizarea datelor statistice Definiţie Prelucrarea statistică este procesul prin care datele înregistrate sunt sistematizate şi modelate statistic, rezultând astfel o serie de indicatori statistici care pot caracteriza statistic fenomenul studiat. În cadrul procesului de prelucrare statistic ă, datele înregistrate î şi pierd individualitatea în vederea ob ţinerii indicatorilor statistici care pot eviden ţia trăsăturile esenţiale comune ale colectivit ăţii cercetate, rela ţiile de interdependen ţă dintre fenomene, precum şi modificările care se produc în structura colectivit ăţii respective. „Prelucrarea statistic ă se folose şte în dou ă sensuri, într-un sens mai larg care este sinonim cu con ţinutul etapei de cercetare statistic ă, deci de trecere de la date individuale la indicatori generalizatori şi într-un într-un sens mai restrâns, care se refer ă la prelucrarea primar ă, adică la sistematizarea datelor observ ării ca prim ă operaţie a acestei etape”21. Sistematizarea datelor statistice „presupune ordonarea acestora în func ţie de omogenitatea lor. Rezultatul sistematiz ării se prezint ă într-o form ă comod de manevrat, prin serii, tabele şi grafice”22. Astfel, colectivit ăţile statistice se împart în grupe omogene, în funcţie de una sau mai multe variabile esen ţiale, comune tuturor unit ăţilor statistice; aceast ă operaţie poartă denumirea de grupare statistică sau clasificare statistică, iar grupele
21
Biji, E.; Petcu, N.; Wagner, P.; Lilea, E.; Vătui, M. – „Statistică”, Editura Didactică şi Pedagogică, Bucureşti, 1999, p. 43 22 Jaba, E. – Op. cit., p. 49 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
17
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
rezultate se mai numesc şi clase. Variabila dup ă care se grupează unităţile colectivităţii poartă denumirea de caracteristică de grupare. Gruparea are un rol deosebit de important în ob ţinerea unor indicatori statistici corec ţi, întrucât modul de grupare permite evidenţierea tipurilor calitative existente în cadrul colectivităţii cercetate. „În urma grup ării statisticii rezult ă şiruri de date ordonate dup ă variaţia, în sens cresc ător sau descrescător, a caracteristicilor de grupare” 23.
Pasul 5 - Metoda grup ării statistice Definiţie Gruparea statistic ă constă în centralizarea unit ăţilor unei colectivit ăţi pe grupe omogene din punct de vedere al uneia sau mai multor caracteristici. O grup ă este considerat ă ca fiind omogen ă atunci când unit ăţile aparţin aceluia şi tip calitativ, adic ă diferă foarte pu ţin între ele. Gruparea este o operaţie absolut necesar ă atunci când volumul datelor înregistrate este mare, întrucât ofer ă o anumită claritate asupra colectivit ăţii cercetate. Clasificare Grupările statistice se pot clasifica dup ă mai multe criterii, astfel: 1. după numărul caracteristicilor de grupare, pot fi: a) gruparea simplă se realizează după o singură caracteristic ă de grupare, de exemplu gruparea I.M.M.- urilor dup ă Cifra de Afaceri anual ă realizată; b) gruparea combinat ă ă (complexă ) se realizează după variaţia simultan ă a două sau mai multe caracteristici de grupare; se grupeaz ă unităţile după o primă caracteristică numită caracteristic ă primară, obţinându-se o prim ă grupare; fiecare grup ă astfel obţinută se împarte în subgrupe dup ă variaţia celei de a doua caracteristici de grupare (caracteristica secundar ă); fiecare subgrup ă se va divide în func ţie de varia ţia celei de a treia caracteristici de grupare, ş.a.m.d., dar se recomand ă ca gruparea combinat ă să se realizeze pentru maxim 3-4 caracteristici de grupare pentru a nu se diviza foarte mult colectivitatea cercetată; 2. după natura caracteristicii de grupare, pot fi: a) grupă ri ri după caracteristici de timp sau de spa ţ iu iu – se realizeaz ă atunci când timpul sau spaţiul sunt caracteristici esen ţiale pentru datele de grupare; se ob ţin grupe omogene ce caracterizeaz ă dezvoltarea fenomenelor în timp sau în profil teritorial; b) grupă ri ri după o caracteristică calitativă , pot fi: b.1. grupă rile după o caracteristic ă calitativă exprimată atributiv (prin cuvinte) poartă denumirea de clasific ări şi evidenţiază grupele tipice din cadrul colectivit ăţii; 23
Idem, p. 50
18
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
b.2. grupă rile după o caracteristică calitativă exprimată numeric (cu varia ţ ie ie discretă , cu varia ţ ie ie continuă ) conduc la ob ţinerea de şiruri de date
ordonate. În cazul caracteristicilor cu varia ţie discretă gruparea se face pe variante, iar în cazul caracteristicilor cu varia ţie continu ă, gruparea se realizeaz ă pe intervale de varia ţie. Pasul 6 - Probleme legate de gruparea statistică
Definiţie O serie reprezint ă o ordonare de date numerice în ordine cresc ătoare sau descrescătoare, în func ţie de mărimea acestora. Diferen ţa dintre num ărul cel mai mare şi cel mai mic reprezint ă câmpul de varia ţie a datelor sau amplitudinea seriei. Exemplul 1: Dacă se iau în analiz ă 50 societăţi comerciale, iar cifra de afaceri lunar ă cea mai mare este de 35 mii lei, iar cea mai mic ă este de 2 mii lei, câmpul de variaţie sau amplitudinea este de: 35 - 2 = 33 mii lei. Pentru a rezuma o mare cantitate de date este necesar ă împărţirea acestora în clase (grupe). Dup ă aceea se procedeaz ă la determinarea num ărului de date care apar ţin fiecărei clase, iar acest num ăr se nume şte frecven ţ a clasei. Ordonarea într-un tabel a datelor pe clase şi corespunzător a frecven ţelor fiecărei clase se nume şte distribu ţ ie ie de frecven ţ e. Exemplul 2: Distribuţia frecvenţelor pentru 1000 de firme în func ţie de cifra de afaceri lunară. Distribuţia cifrei de afaceri CA Numărul de (mii lei) firme 0,5 - 1 270 1 - 1,5 330 1,5 - 2 100 2 - 2,5 150 2,5 - 3 50 3 - 3,5 50 3,5 - 4 20 4 - 4,5 10 4,5 - 5 20 TOTAL 1000 Prima clasă, de exemplu, cuprinde firmele cu o cifr ă de afaceri lunar ă cuprinsă între 0,5 şi 1 mii lei şi este indicată cu simbolul 0,5-1. Deoarece 270 de firme au cifra de afaceri lunară aparţinând acestei clase, frecven ţa absolută a primei clase va fi 270. Datele ordonate pe baza distribuţiei frecvenţelor se numesc date regrupate. Prin regrupare se pot pierde multe informaţii cu privire la datele individuale, dar regruparea prezint ă avantajul unei vederi sintetice asupra datelor ini ţiale şi observarea rela ţiilor dintre acestea. 19 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Definiţii Notaţia utilizată pentru definirea unei clase, de exemplu 0,5-1 (vezi tabelul 2.1.) se numeşte intervalul clasei respective. Numerele 0,5 şi 1 se numesc limitele clasei; numărul mai mic, 0,5, se nume şte limită inferioară a clasei, iar num ărul mai mare, 1, se nume şte limita superioară a clasei. Termenele de clas ă şi interval al clasei se utilizeaz ă de fapt, f ără a se face distincţie între ele, deoarece intervalul unei clase este de fapt simbolul utilizat pentru clasa respectivă. Amplitudinea intervalului unei clase este diferen ţa dintre limita superioar ă şi limita inferioară a acelei clase şi se mai nume şte şi amplitudinea clasei sau mă rimea rimea intervalului de grupare. Dacă toate intervalele de clas ă ale unei distribu ţii de frecven ţă au aceea şi amplitudine, atunci amplitudinea comun ă se va nota cu „K”. În acest caz, K se poate determina şi ca diferenţă între limitele inferioare a dou ă clase succesive sau ca diferen ţă între limitele superioare a dou ă clase succesive. Pentru datele din tabelul 2.1., K = 1 – 0,5 = 1,5 - 1 = 2 – 1,5 = …= 5 – 4,5 = 0,5 mii lei Mărimea intervalelor de grupare se determin ă în funcţie de amplitudinea de varia ţie a caracteristicii (A) şi numărul de grupe (h), pe baza rela ţiei: Exemplul 3:
K =
A h
,
unde
A = xmax –xmin, iar xmax = valoarea maxim ă a caracteristicii x; xmin = valoarea minim ă a caracteristicii x; h = num ărul de grupe. Valoarea central ă a unei clase se ob ţine însumând unei clase şi împărţind suma ob ţinută la 2.
limita inferioar ă şi cea superioar ă a
Exemplul 4:
Valoarea central ă a primei clase din tabelul 2.1. va fi:
0, 5 + 1 = 0,75 . 2
Exemplul 5:
Valoarea central ă a ultimei clase din tabelul 2.1. va fi:
4, 5 + 5 = 4,75 . 2
Valoarea central ă a unei clase se poate determina şi cu rela ţia: xi = xmin +
k
2
= xmax −
unde: xmin = limita inferioar ă a grupei; xmax = limita superioar ă a grupei; k = mărimea intervalului. 20
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
k
2
,
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Reguli generale pentru formarea distribuţiilor de frecvenţe 1. Se determin ă cea mai mare şi cea mai mic ă valoare a datelor seriei pentru a stabili câmpul de varia ţie sau amplitudinea (diferen ţa dintre cea mai mare valoare şi cea mai mică valoare). 2. Se divide câmpul de varia ţie într-un num ăr stabilit de clase cu aceea şi amplitudine. Dacă nu este posibil atunci se vor utiliza clase cu diferite amplitudini (intervale de clas ă inegale). Num ărul claselor este de regul ă cuprins între 5 şi 20. 3. Se determin ă numărul de valori care apar ţin fiecărei clase. Acest num ăr reprezint ă frecvenţa clasei respective. Pasul 7 - Prezentarea datelor statistice în tabele Seriile statistice rezultate în urma grup ării şi centralizării datelor statistice se sistematizează cu ajutorul tabelelor statistice. Aceste tabele statistice pot fi simple sau cu dublă intrare. Clasificare Rezultatul sistematiz ării datelor prin grupare îl reprezint ă distribu ţ iile iile statistice denumite şi serii statistice. Seriile statistice se clasific ă după mai multe criterii, astfel: 1) după numă rul caracteristicilor de grupare , pot fi: a) seriile unidimensionale (univariate) prezintă două şiruri paralele de date, dintre care primul şir reprezint ă valorile caracteristicii de grupare, iar cel de-al doilea şir reprezint ă frecvenţa de apari ţie, adică numărul de unităţi statistice care corespund fiec ărei variante. b) seriile bidimensionale (bivariate) „prezintă variaţia unităţilor unei colectivit ăţi simultan dup ă două caracteristici de grupare” 24. c) seriile multidimensionale (multivariate) prezintă variaţia unităţilor unei colectivit ăţi statistice simultan dup ă trei sau mai multe caracteristici de grupare. 2) după natura caracteristicii de grupare, pot fi: a) serii de timp (dinamice) prezintă valorile caracteristicii în raport cu timpul; b) serii de spa ţ iu iu (teritoriale) prezint ă variaţia în teritoriu a fenomenului cercetat; c) serii calitative prezintă variaţia unităţilor colectivit ăţii statistice dup ă o caracteristică calitativă. Definiţii Orice tabel statistic trebuie s ă cuprindă următoarele elemente: 1. Titlul tabelului trebuie să precizeze caracteristica de distribu ţie şi colectivitatea cercetată. 2. Titlurile interioare cuprind colectivitatea observat ă şi sistemul de caracteristici pentru care s-au centralizat datele. 24
Jaba, E. – Op. cit., p. 58
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
21
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
se înscrie în titlul tabelului dac ă este comună pentru toate elementele, sau în titlurile interioare, dac ă elementele sunt exprimate în unit ăţi de măsură diferite. 4. Notele se menţionează sub tabel şi sunt marcate cu (*). 5. Sursa datelor se menţionează sub tabel, în mod explicit. 6. Macheta tabelului trebuie s ă prezinte toate rubricile completate iar când datele nu există, rubrica respectiv ă se completează cu simbolul „ - „. Tabelul simplu se utilizează pentru prezentarea unei serii statistice unidimensionale. Tabelul simplu se prezint ă astfel: 3. Unitatea de mă sur sur ă ă
Caracteristica
Modelul unui tabel simplu Frecvenţa Efectivul relativă cumulat
Frecvenţa absolută
xo – x1 . . . xi-1 – xi . . . xk-1 – xk
n1 . . . ni . . . nk n
Total
Frecvenţa relativă cumulată
f 1 . . . f i . . . f k k
N 1 . . . N i . . . N k k
F 1 . . . F i . . . F k k
1
-
-
Sursa: Jaba, E - „Statistic ă ”, ”, Ed. Economic ă , Bucure şti, 1998, p. 62.
unde:
n=
∑n ; i
f =
i
ni
∑n
∑f
;
i
= 1, i = 1, k .
i
i
Tabelul cu dubl ă intrare se utilizează pentru bidimensionale. Tabelul cu dubl ă intrare se prezint ă astfel:
prezentarea unei serii statistice
Modelul unui tabel cu dubl ă intrare yi xi x1 . . . xi . .
22
y1
...
y j
...
y p
ni.
n11 . . . ni1 . .
... . . . ... . .
n1j . . . nij . .
... . . . ... . .
n1p . . . nip . .
n1. . . . ni. . .
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
.
.
xm n.j
nm1 n.1
Anul I, semestrul I
. ... ...
. nmj n.j
. ... ...
. nmp n.p
. nm. n..
Sursa: Jaba, E. – Statistic ă , Ed. Economică , Bucure şti, 1998, p. 62
Tabelul combinat – este acel tabel în care colectivitatea este sistematizat ă sub formă de grupări combinate, dup ă două sau mai multe caracteristici. Tabelul de asociere – se folose şte pentru a prezenta şi caracteriza leg ătura dintre dou ă caracteristici alternative. Tabelul de asociere se prezint ă astfel:
Modelul unui unui tabel tabel de asociere yi xi x1 x2
y1
Total
y2
a c a+c
b d b+d folosit şi
a+b c+d (a+b)+( c+d)= (a+c)+( b+d)
Total Tabelul de asociere poate fi pentru caracteristici nealternative, transformate în variabile alternative, utilizând spre exemplu media (unit ăţi sub şi peste nivelul mediu)” 25.
Lecţia 3 INDICATORII STATISTICI „În sensul cel mai larg, indicatorul statistic este expresia numeric ă a unor fenomene, procese, activit ăţi sau categorii economice şi sociale, definite în timp, spa ţiu şi structură organizatoric ă şi care se regăsesc cu o anumit ă periodicitate în statisticile oficiale, na ţionale şi internaţionale.”26 Indicatorii statistici se ob ţin în urma procesului de cercetare statistic ă, şi au „un conţinut real, obiectiv determinat, o formul ă proprie de calcul şi o formul ă specifică de exprimare”27 . Indicatorii statistici rezulta ţi în urma cercet ării statistice se împart în dou ă mari categorii, şi anume: 1 – indicatori primari sau exprima ţi în mărimi absolute; 2 – indicatori deriva ţi sau exprima ţi în mărimi relative.
25
Popescu, I. D. – Op. cit., p. 61. Balei,T.; Biji, E.; Tövissi, L.; Wagner, P.; Isaic-Maniu, Al.; Korka, M.; Porojan, D. – „Statistică teoretică şi economică”, Editura Didactică şi Pedagogică, Bucureşti, 1996, p. 64. 27 Balei,T.; Anghelache, C.; Ţiţan, E. – „Statistică”, Editura Economica, Bucureşti, 1996, p. 42. 26
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
23
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 1 - Indicatori primari primari sau exprima exprimaţi în mărimi absolute Definiţie Indicatorii primari se ob ţin în urma sistematiz ării datelor, şi „prezintă, sub form ă de mărimi absolute, volumul unui ansamblu de unit ăţi sau valoarea unei caracteristici, pe total sau pe grupe” 28. Indicatorii primari sau absolu ţi exprimă nivelul caracteristicii cercetate. Aceşti indicatori se ob ţin „fie prin înregistrare direct ă, fie prin însumare par ţială sau totală a datelor individuale de acela şi fel”29. Clasificare Indicatorii primari sau absolu ţi se împart în dou ă categorii, şi anume: • Indicatori de nivel; • Indicatori ai varia ţiei absolute. Indicatorii de nivel exprimă valoarea caracteristicii cercetate sau volumul unui ansamblu de caracteristici. Indicatorii de nivel pot fi: • indicatori individuali rezultă în urma înregistr ării directe şi eviden ţiază nivelul (valoarea) caracteristicii cercetate pentru fiecare unitate statistic ă; • indicatori sintetici „în m ărimi absolute se ob ţin prin agregarea datelor ş datelor şi reprezint ă rezultatul centraliz ării pe grupe sau pe ansamblul colectivit ăţii. Însumarea direct ă a elementelor considerate în calculul indicatorilor sintetici este posibil ă doar pentru elemente omogene. /…/ Agregarea, în cazul elementelor eterogene, impune folosirea unor coeficien ţ i de echivalen ţă . În economie, agregarea elementelor se face, de regul ă, în unităţi valorice (prin intermediul pre ţului) sau în unit ăţi de timp de munc ă (ore-om, de exemplu)”30. Indicatorii varia ţ iei iei absolute se obţin „prin compararea, sub form ă de scădere a două nivele ale aceluia şi indicator”31. Varia ţ ia ia absolută (spor) şi simbolizat ă prin ∆ x1/ 0 se determin ă cu rela ţiile urm ătoare: ∆ x1/ 0 = xi − xi , la nivelul fiec ărui element „i” sau ∆ x1/ 0 = ∑ xi − ∑ xi , la nivelul ansamblului fenomenului X. Indicatori exprima ţi în mărimi absolute au o sfer ă ă de comparabilitate redus ă. Aceştia reprezintă elementele de baz ă pentru determinarea unor indicatori deriva ţi, exprima ţi în mărimi relative şi mărimi medii. 1
0
1
0
28
Jaba, E. – Op. cit., p. 93. Balei, T.; Anghelache, C.; Ţiţan, E. – Op. cit., p. 42. 30 Jaba, E. – Op.cit., p. 94. 31 Idem, p. 94. 29
24
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 2 - Indicatorii deriva derivaţi sau exprimaţi în mărimi relative Definiţie Indicatorii deriva ţi se obţin prin prelucrarea indicatorilor exprima ţi în mărimi absolute, prelucrarea acestora se realizeaz ă prin „diferite metode şi procedee de calcul (compara ţii, abstractizări, generaliz ări)”32. Mărimile relative rezultate în urma raport ării sunt exprimate printr-un num ăr întreg, sau printr-o frac ţie. În vederea cre şterii semnifica ţiei rezultatului, acesta se înmul ţeşte cu 100, 1.000 sau 10.000 şi se va exprima astfel, în procente, promile, prodecimile, ş.a.m.d.; se procedează astfel, atunci când indicatorul care se raporteaz ă este foarte mic fa ţă de baza de raportare, iar rezultatul nu ar fi sugestiv. Indicatorii exprima ţi în mărimi relative sunt instrumente absolut necesare pentru analiza activit ăţilor economice, dar ridic ă o serie de probleme în ceea ce prive şte alegerea bazei de raportare şi asigurarea comparabilit ăţii datelor raportate. Clasificare Mărimile relative utilizate în cadrul analizei statistice se s e pot grupa astfel: • mărimi relative de structur ă ă ; • mărimi relative de coresponden ţă sau de coordonare; • mărimi relative ale dinamicii; • mărimi relative de intensitate; • mărimi relative ale planului sau programului. Definiţii M ă rimile relative de structură (ponderi sau greutăţ i specifice sau frecven ţ e relative) evidenţiază raportul dintre parte şi întreg, şi exprim ă ponderea unui anumit element în totalul colectivităţii din care face parte. Se determin ă cu ajutorul rela ţiilor: a)
f i =
b)
gi
ni
, unde
∑ ∑ x = ∑ ∑ x ni
∑ f = 1 , i = 1, n , pentru frecven ţe;
ij
j
ij
j
, unde
i
∑g
i
i = 1, m , atunci când se cunosc =1, i r = 1 ,
valorile centralizate pe
j
grupe; c)
g=
1
∑
xi ni
⋅ xi ni , atunci când se cunosc numai produsele de frecven ţe.
i
32
Balei, T.; Anghelache, C.; Ţiţan, E. – Op.cit., p. 43.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
25
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Mărimile relative de structur ă calculate faţă de aceea şi bază de raportare, dau prin însumare 1 (dacă sunt exprimate în coeficien ţi) sau 100 (dac ă sunt exprimate în procente); aceste mărimi relative au proprietatea de adunare şi de scădere. Mărimile relative de structur ă se reprezintă cu ajutorul diagramelor de structur ă (diagramele circulare şi diagramele prin suprafeţe prezentate în cap. 2.3.3.) M ă rimile relative de coresponden ţă sau de coordonare arat ă raportul numeric care există între „doi indicatori de acela şi fel, aparţinând unor grupe ale acelora şi colectivit ăţi statistice sau unor colectivit ăţi statistice de acela şi fel, dar situate în spa ţii diferite”33. Mărimile relative de coordonare se determin ă pe baza rela ţiilor: K A / B =
unde:
X A X B
×100
sau
K B / A =
X B X A
×1.000 ,
X A = nivelul grupei A; X B = nivelul grupei B;
indici ai dinamicii. Mărimile relative ale dinamicii mai sunt denumite şi ritmuri sau indici Indicii dinamicii caracterizeaz ă variaţia medie relativ ă a fenomenelor în timp şi în spaţiu pentru a realiza o compara ţie a acestora, precum şi pentru a m ăsura influenţa diverşilor factori asupra unui fenomen complex. Clasificare Aceşti indicatori se împart în: 1. Indici cu bază fixă – reprezint ă raportul între nivelul unui fenomen la un moment dat şi cel înregistrat în perioada de baz ă; 2. Indici cu bază mobil ă – reprezint ă raportul între nivelul unui fenomen la un moment dat şi cel înregistrat în perioada anterioar ă, deci la dou ă momente de timp consecutive. În func ţie de complexitatea fenomenului supus cercet ării statistice, aceste m ărimi relative (indicatorii utiliza ţi pentru caracterizarea nivelului şi varia ţiei în timp) se grupeaz ă astfel: a) Indicatorii exprimaţi prin mărimi absolute – exprim ă nivelul sau modific ările de nivel ale unui fenomen care evolueaz ă în timp. • sporul absolut „exprimă cu câte unit ăţi de măsură s-a modificat valoarea individual ă dintr-o perioad ă faţă de o perioad ă bază de compara ţie (fixă sau mobilă)”34; altfel spus, evidenţiază cu cât s-a modificat un fenomen la un moment dat fa ţă de un alt moment, considerat ca baz ă de compara ţie; • sporul cu bază fixă se calculează ca diferenţă între orice termen al seriei şi termenul iniţial, astfel: ∆ yi / 0 = yi − y0 33
Balei,T.; Biji, E.; Tövissi, L.; Wagner, P.; Isaic-Maniu, Al.; Korka, M.; Porojan, D. – Op. cit., p. 73. Isaic-Maniu, Al., Mitruţ, C., Voineagu, V. – „Statistica pentru managementul afacerilor”, Ed. Economică, Bucureşti, 1995, p. 248 34
26
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
•
Anul I, semestrul I
sporul cu bază în lanţ se calculează ca diferenţă între doi termeni consecutivi ai seriei, astfel: ∆ yi / 0 = yi − yi −1
b) Indicatorii exprimaţi prin mărimi relative – se ob ţin prin raportarea a dou ă nivele absolute. • ritmul sau indicele de variaţie sau indicele de dinamic ă „se exprimă sub formă de coeficient sau în procente şi semnifică de câte ori (de cât la sut ă) s-a modificat valoarea caracteristicii fa ţă de perioada baz ă de compara ţie (fixă sau mobilă)”35 arată de câte ori a crescut sau a sc ăzut nivelul unui fenomen la un moment dat fa ţă de un moment baz ă de comparaţie; • ritmul cu baz ă fixă se determină astfel: y
Ri / 0 =
•
yi y0
sau Ri y / 0 =
yi y0
⋅100 ;
ritmul cu bază mobilă se calculează cu ajutorul rela ţiei: yi
y
Ri / i −1 =
yi −1
sau Ri y / i −1 =
yi yi −1
⋅ 100 ;
ritmul sporului – „arată cu cât la sut ă s-a modificat nivelul înregistrat, din caracteristica analizată, într-o anumit ă perioadă faţă de nivelul din perioada baz ă de compara ţie”36, adică arată cu cât s-a modificat (procentual) nivelul fenomenului în perioada curent ă faţă de perioada baz ă de raportare; • ritmul sporului cu bază fixă se determină pe baza rela ţiei: •
ri y/ 0 =
•
∆ yi / 0 y0
=
yi − y0 y0
=
yi y0
− 1 = Ri / 0 − 1
ritmul sporului cu bază mobilă se calculează astfel: ri y/ i −1 =
∆ yi / i −1 yi −1
=
yi − y i −1 yi −1
=
yi yi −1
− 1 = Ri / i −1 − 1
c) Indicatorii medii – eviden ţiază fie nivelul, fie varia ţia termenilor unei serii. „Pentru caracterizarea tendin ţei centrale în seriile de termeni absolu ţi şi relativi, este necesar să se calculeze indicatorii medii specifici: nivelul mediu, modificarea medie absolut ă, indicele mediu de dinamic ă, ritmul mediu al modific ării relative”. 37
35
Isaic-Maniu, Al., Mitruţ, C., Voineagu, V. – Op. cit., p. 250 Idem, p. 251 37 Ibidem, p. 253 36
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
27
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
sporul mediu sau nivelul mediu – „reflectă modificarea medie pe unitatea de timp înregistrată de un fenomen într-o perioad ă. Se calculeaz ă ca o medie a sporurilor individuale •
cu bază în lanţ, după relaţia:
∆ y =
∑ ∆ /
i i −1
n
=
∆n / 0 n
=
yn − y0 38 „ ; n
ritmul mediu al variaţiei – denumit şi indice mediu de variaţie, evidenţiază de câte ori s-a modificat în medie pe an nivelul unui fenomen într-o anumit ă perioadă (fenomenul evolueaz ă după o progresie geometric ă); • ritmul mediu al sporului – eviden ţiază în expresie relativ ă cu cât s-a modificat în medie pe an nivelul unui fenomen într-o anumit ă perioadă. r = R − 1 sau r = R − 100 . Mărimile relative de intensitate arată raportul dintre doi indicatori absolu ţi, de natură diferită, dar între care exist ă o relaţie de interdependen ţă. Se determin ă în general pe baza rela ţiei •
xi =
yi zi
unde: yi, zi = caracteristici primare, şi arată câte unităţi din valoarea caracteristicii „ yi” revin la o singur ă unitate a valorii caracteristicii „ zi” sau x =
∑ y ∑ z
i
i
pentru nivelul total al caracteristicii „ xi”. În vederea cre şterii semnifica ţiei rezultatului, raportul se poate înmul ţi cu 100, 1.000 sau 10.000, atunci când ordinul de m ărime dintre indicatorii yi şi zi este foarte mare. Mărimile relative de intensitate „eviden ţiază gradul, intensitatea de r ăspândire a fenomenului în raport cu variabila la care se raporteaz ă”39. Mărimile relative de intensitate sunt utilizate în economie pentru a exprima eficien ţa economică, gradul de înzestrare tehnic ă a muncii, coeficientul de mecanizare şi automatizare a muncii, productivitatea muncii etc. Mărimile relative ale planului (programului) se calculează în ţările cu economie de piaţă, doar la nivelul agen ţilor economici pentru a urm ări modul de realizare a programelor de aprovizionare, produc ţie şi desfacere. M ărimile relative ale planului se reprezint ă grafic cu ajutorul diagramelor prin coloane. Pentru determinarea m ărimilor relative ale planului (programului), se utilizeaz ă relaţiile: 1.
38 39
k pl / 0 =
x pl x0
⋅100
denumit coeficientul sarcinii de plan;
Jaba, E. – Op. cit, p. 376 Jaba, E. – Op. cit, p. 99
28
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
2.
k 1/ pl =
3.
k 1/ 0 =
x1 x pl
x1 x0
⋅ 100
⋅ 100
Anul I, semestrul I
denumit coeficientul realiz ării planului;
denumit coeficientul de dinamic ă.
Între cele trei m ărimi relative exist ă relaţia: Perioada de baz ă Realizat
k1/ 0 = k pl / 0 ⋅ k 1/ pl , unde:
Perioada curent ă Planificat (programat)
Realizat
x0 x pl x1 Sursa: Balei, T; Biji, E.; Tövissi, L; Wagner, P.; Isaic-Maniu, Al.; Korka, M; Porojan, D – Statistica teoretică şi economică, Editura Didactică şi Pedagogică, Bucureşti, 1996, p. 74.
REZUMAT Statistica este ştiinţa care studiaz ă aspectele cantitative ale fenomenelor socialeconomice de mas ă, fenomene care variaz ă în timp şi spaţiu, pornind de la con ţinutul calitativ al acestora. Statistica are ca obiect de studiu fenomenele social-economice de mas ă în cadrul cărora acţionează legile statistice şi care variaz ă în timp şi spaţiu. Metoda Statisticii este constituit ă din ansamblul opera ţiilor, tehnicilor, procedeelor, principiilor metodologice şi metodelor de investigare statistic ă a fenomenelor de mas ă, în varia ţia lor curent ă-continuă în timp, în spa ţiu şi din punct de vedere calitativ. CONCLUZII Studiind acest modul a ţi dobândit cuno ştinţe referitoare la obiectul de studiu şi metoda statisticii, precum şi cele legate de prelucrarea, sistematizarea şi prezentarea datelor statistice. EXEMPLE ILUSTRATIVE 1. (a) Ordona ţi următoarele 10 firme în func ţie de profitul net pe care l-au realizat în cursul anului 2007, într-o serie. Firma Profit net (mii lei) J 10 I 9 H 5,5 G 2 F 7 E 4 D 3 C 2,5 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
29
Rodica Pripoaie, Statistică economică, Note de curs
B A
Anul I, semestrul I
8 5,8
(b) Determina ţi câmpul de varia ţie . Rezolvare :
(a) Seria în ordine cresc ătoare a m ărimii profitului net se prezint ă astfel: G(2), C(2,5), D(3), E(4), H(5,5), A(5,8), F(7), B(8), I (9), J(10). Seria în ordine descresc ătoare a mărimii profitului net se prezint ă astfel: J(10), I (9), B(8), F(7), A(5,8), H(5,5), E(4), D(3), C(2,5),G(2). b) Deoarece cea mai mic ă profitului net este realizat ă de firma G în valoare de 2 mii lei, iar cea mai mare de c ătre firma J în valoare de 10 mii lei, câmpul de varia ţie al profitului net este de 10 – 2 = 8 mii lei. le i. 2. În tabelul urm ător este prezentat ă distribuţia frecvenţelor pentru cifra de afaceri în cazul analizei acestui indicator la nivelul a 100 de firme.
Frecvenţa firmelor după produc ţia marf ă Numărul de Cifra de afaceri (lei ) firme 40.000 - 60.000 15 60.000 - 80.000 20 80.000 - 100.000 30 100.000 - 120.000 25 120.000 - 140.000 10 TOTAL 100 Se cere să se determine: a) Limita inferioar ă a clasei a patra; b) Limita superioar ă a clasei a doua; c) Valoarea central ă pentru clasa nr. 5; d) Amplitudinea clasei a patra; e) Frecvenţa clasei a doua; f) Frecvenţa relativă a primei clase; g) Clasa cu frecven ţa cea mai mare; h) Procentul firmelor care au o cifr ă de afaceri mai mare de 80.000 lei; i) Procentul firmelor care au o cifr ă de afaceri mai mic ă de 100.000 lei. Rezolvare: a) Răspuns: 100.000 lei. b) Răspuns: 80.000 lei.
30
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
c)Valoarea central ă pentru clasa nr. 5 este =1/2(120.000 + 140.000) = 130.000 lei. d) Amplitudinea clasei a patra = limita superioar ă a clasei a patra - limita inferioar ă a clasei a patra = (120.000 - 100.000) = 20.000 lei. În acest exemplu toate clasele au aceea şi amplitudine : 20.000 lei. e) Răspuns: 20 f) Răspuns: 15/100 = 0,15 = 15 %. g) Răspuns: clasa a treia (80.000 - 100.000) lei. Această clasă se numeşte clasă modală, iar frecven ţa sa se nume şte frecvenţa clasei modale. h) Num ărul total al firmelor care au o cifr ă de afaceri lunar ă mai mare de 80.000 lei = 30+25+10 = 65. Procentul firmelor cu o cifr ă de afaceri mai mare de 80.000 lei = 65/100 = 0,65 = 65 %. i) Num ărul firmelor care au o cifr ă de afaceri lunar ă mai mică de 100.000 lei = 15 + 20 + 30 = 65. Procentual, aceste firme reprezint ă : 65/100 = 0,65 = 65 %.
3. Dacă valorile centrale ale unei distribu ţii de frecven ţe pentru indicatorul „Datorii totale” (exprimat în mii lei), observat la 50 de firme sunt: 4, 7, 10, 13, 16. Se cere: a) amplitudinea claselor; b) limitele claselor. Rezolvare:
Amplitudinea claselor = diferen ţa comună între valorile valorile centrale succesive = 7 – 4 =10 – 7 = 13 – 10 = 16 – 13 = 3 mii lei. l ei. b) Deoarece toate clasele au aceea şi amplitudine, pentru determinarea limitelor claselor proced ăm astfel: 1/2(4 + 7) = 5,5; 1/2(7 + 10) = 8,5; 1/2(10 + 13) = 11,5; 1/2(13 + 16) = 14,5.
Limita inferioar ă a primei clase este: 5,5 - 3 = 2,5, iar limita superioar ă a ultimei clase va fi: 14,5 + 3 = 17,5.
4. Se dă distribuţia frecvenţelor pentru indicatorul „profitul net” (exprimat în mii lei) urmărit în cazul a 100 de firme, în cadrul tabelului Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
31
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Profitul net (mii lei) 0-5 5 - 10 10 - 15 15 - 20 20 - 25 TOTAL
Număr de firme 10 4 28 3 5 50
Construiţi: a) histograma b) poligonul frecven ţelor
Rezolvare:
Histograma 5. Folosind datele din problema 3 construi ţi: a) distribu ţia frecven ţelor relative; b) histograma acestei distribu ţii de frecven ţe relative; c) poligonul frecven ţelor relative. Rezolvare:
a) Distribuţia frecven ţelor relative este prezentat ă în tabelul urm ător şi se ob ţine din distribuţia frecvenţelor din problema 3 împ ărţind frecven ţa fiecărei clase la frecven ţa totală şi exprimând rezultatul în procente. Profitul net Frecvenţa (mii lei) relativă % 1-3 20 3-5 8 5-7 56 32
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
7-9 9-11 TOTAL
Anul I, semestrul I
6 10 100
b) şi c) histograma frecven ţelor relative şi poligonul frecven ţelor relative se ob ţin luând pe axa absciselor Profitul net, iar pe axa ordonatelor frecven ţa relativă, ca în figura 2.21.
Histograma frecvenţelor relative şi poligonul frecvenţelor relative RECOMANDĂRI BIBLIOGRAFICE • • • • •
Tudor Baron, Elena Biji şi colab. – Statistică teoretică şi economică, Ed. Didactică şi Pedagogic ă, Bucureşti, 1996 Elena-Maria Biji, Eugenia Lilea, Elisabeta Ro şca, Mihaela Văzui – Statistică aplicată în economie – Ed. Universul Dalsi, Bucure şti, 2000 Elisabeta Jaba – Statistică, Ed. Economic ă, Editia a IV-a, Bucure şti, 2007 Ianuarie-Doru Popescu – Bazele statisticii, Ediţia a III-a revizuit ă şi completată, Ed. Funda ţiei Academice Danubius, Gala ţi, 2000 Rodica Pripoaie – Statistică Economică, Ed. Didactic ă şi Pedagogic ă, Bucureşti, 2008
TESTE DE AUTOEVALUARE 1. Se dau datele din tabelul urm ător: Date convenţionale x 0 2 3 5 8 9 11 13 15 18 20
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
25
30
37
40
33
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
y 10 50 100 260 650 820 1220 1700 2260 3250 4010 6260 9010 1370 16000
Se cere: a) Grupaţi datele precedente dup ă caracteristica x şi respectiv y în 5 grupe egale; b) Determina ţi valoarea central ă pentru fiecare grup ă de la punctul a); c) Găsiţi clasa cu frecven ţa cea mai mare; d) Determina ţi frecven ţele relative pentru cele 5 clase de la punctul a); e) Procentul firmelor pentru care x este mai mare decât 16 şi procentul firmelor pentru care y este mai mare decât 3200; f) Determina ţi frecvenţele absolute cumulate ascendent şi descendent pentru cele 5 clase; g) Determina ţi frecven ţele relative cumulate ascendent şi descendent; h) Construiţi poligonul frecven ţelor şi histograma pentru gruparea datelor de la punctul c); i) Construiţi curba frecven ţelor absolute cumulate ascendent şi descendent; j) Construiţi curba frecven ţelor relative cumulate ascendent şi descendent. Rezolvare:
K y Se determină: K x
a) x
0–8 8 – 16 16 – 24 24 – 32 32 – 40 TOTAL b) x
0–8 34
16000-10 = 3200 h 5 A 40-0 = = =8 h 5 =
A
=
Date convenţionale Frecvenţa f i y absolută 5 0 – 3200 4 3200 – 6400 2 6400 – 9600 2 9600 – 12800 2 12800 – 16000 15 TOTAL Valori centrale Valoarea centrală a y clasei 4 0 – 3200
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Frecvenţa f i absolută 9 3 1 0 2 15 Valoarea centrală a clasei 1600
Rodica Pripoaie, Statistică economică, Note de curs
8 – 16 16 – 24 24 – 32 32 - 40
12 20 28 36
Anul I, semestrul I
3200 – 6400 6400 – 9600 9600 – 12800 12800 - 16000
4800 8000 11200 14400
c) Pentru caracteristica x clasa cu frecven ţa cea mai mare este [0 – 8] cu frecven ţa absolută 5, aşa cum se observ ă din tabelul de la punctul a). Pentru caracteristica y clasa cu frecvenţa cea mai mare este [1 – 3200] cu frecven ţa absolută 9, aşa cum se observ ă din tabelul de la punctul a).
Frecvenţe relative Frecvenţa relativă(%) y
d)
x
f i
0–8 8 – 16 16 – 24 24 – 32 32 - 40 TOTAL
∑ f
f i
i
33,33 26,67 13,33 13,33 13,33 100
Frecvenţa relativă(%)
0 – 3200 3200 – 6400 6400 – 9600 9600 – 12800 12800 - 16000 TOTAL
∑ f i
60 20 6,67 0 13,33 100
e) Procentul firmelor pentru care x este mai mare decât 16 este: 13,33 + 13,333 + 13,333 = 40% (de la punctul d). Procentul firmelor pentru care y este mai mare decât 3200 este: 20 + 6,67 + 13,33 = 40% (de la punctul d).
f) x
0–8 8 – 16 16 – 24 24 – 32 32 - 40 TOTAL
Însumarea frecvenţelor Frecvenţe Frecvenţe absolute cumulate absolute ascendent descendent 5 5 15 4 9 10 2 11 6 2 13 4 2 15 2 15 0
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
35
Rodica Pripoaie, Statistică economică, Note de curs
y
1 – 3200 3200 – 6400 6400 – 9600 9600 – 12800 12800 - 16000 TOTAL g) x
0–8 8 – 16 16 – 24 24 – 32 32 - 40 TOTAL
y
0 – 3200 3200 – 6400 6400 – 9600 9600 – 12800 12800 - 16000 TOTAL
Însumarea frecvenţelor Frecvenţe Frecvenţe absolute cumulate absolute ascendent descendent 9 9 15 3 12 6 1 13 3 0 13 2 2 15 2 15 0 Însumarea frecvenţelor (%) Frecvenţe Frecvenţe absolute cumulate absolute ascendent descendent 33,33 33,33 100,00 26,67 60,00 66,67 13,33 73,33 40,00 13,33 86,67 26,67 13,33 100,00 13,33 100 0 Însumarea frecvenţelor (%) Frecvenţe Frecvenţe absolute cumulate absolute ascendent descendent 60 60 100 20 80 40 6,67 86,67 20 0 86,67 13,33 13,33 100 13,33 100 0
h)
36
Anul I, semestrul I
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
i) 20 15 i f
ascendent
10
descendent
5 0 8
16
24
32
40
x
Curba frecvenţelor absolute pentru caracteristica x 20 15 i f
ascendent
10
descendent
5 0 320 3200
6400 400
9600 9600 y
1280 12800 0 1600 16000 0
Curba frecvenţelor absolute pentru caracteristica y j) 120 100 80 60 40 20 0
ascendent descendent
8
16
24
32
40
Curba frecvenţelor relative cumulate pentru caracteristica x 120 100 80 ascendent
60 40
descendent
20 0 3200 3200
6400 6400
960 9600
1280 12800 0 1600 16000 0
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
37
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Curba frecvenţelor relative cumulate pentru caracteristica y. TEMĂ DE CONTROL 1. În urma unei anchete de sondaj pe un e şantion de 10 firme reprezentativ pentru o colectivitate general ă, privind m ărimea Cifrei de Afaceri s-au ob ţinut datele din tabelul următor: CA Firma – mii lei – A 2 B 30 C 10 D 15 E 20 F 30 G 17 H 5 I 12 J 13 Se cere: a) Construiţi diagrama în bare; b) Construiţi diagrama circular ă; c) Construiţi diagrama prin coloane; d) Construiţi diagrama prin suprafe ţe. 2. Se extinde analiza privind Cifra de afaceri realizate în cursul anului 2007 de la cele 10 firme (din problema 7) luând în analiz ă alte 5 firme: K – 11 mii lei; L – 18 mii lei; M – 9 mii lei; N – 24 mii lei; O – 50 mii lei. Se cere: a) ordona ţi cele 15 firme într-o serie, cresc ător şi descrescător; b) determina ţi noul câmp de varia ţie.
38
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
3. Utilizând datele din problema 2 şi având în vedere c ă în analiză se vor lua în considerare şi alte 7 firme, care au urm ătoarele valori ale indicatorului „Cifra de afaceri”: 77 mii lei, 84 mii lei, 85 mii lei, lei , 43 mii lei, 90 mii lei, 80 mii lei, 94 mii lei, determina ţi: a) frecven ţa fiecărei clase; b) valoarea central ă pentru fiecare clas ă; c) frecven ţele relative; d) clasa cu frecven ţa cea mai mare; e) clasa cu frecven ţa cea mai mic ă; f) procentul firmelor cu o CA mai mare de 60 mii lei; g) procentul firmelor cu o CA mai mic ă de 80 mii lei. 4. a) Construiţi histograma şi poligonul frecven ţelor pentru distribu ţia frecven ţelor din problema 3; b) Construi ţi histograma frecven ţelor relative şi poligonul frecven ţelor relative pentru distribuţia frecven ţelor relative din problema 9. 5. a) Construiţi distribuţia frecven ţelor cumulate ascendent şi descendent pentru datele din problema 3; b) Construi ţi distribuţia procentual ă cumulată ascendent şi descendent pentru datele din problema 3.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
39
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Modulul II INDICATORII TENDINŢEI CENTRALE (MĂRIMILE MEDII) Lecţia 1. Indicatorii tendin ţei centrale (mărimile medii) Lecţia 2. Mediana Lecţia 3. Modul (Dominanta) Lecţia 4. Analiza statistic ă a variaţiei faţă de tendinţa centrală Obiectivele specifice modulului: Introducerea no ţiunilor de tendin ţă centrală, medie, median ă şi mod Introducerea no ţiunilor de varia ţie şi asimetrie. Determinarea mediei aritmetice, geometrice, armonice şi geometrice simple şi ponderate Determinarea medianei în cazul seriilor simple şi în cazul distribu ţiilor de frecven ţă Determinarea modului în cazul seriilor simple şi în cazul distribu ţiilor de frecven ţă Determinarea indicatorilor simpli şi sintetici ai varia ţiei Rezultatele aşteptate: Înţelegerea no ţiunilor de baz ă ale tendinţei centrale Înţelegerea no ţiunii de medie simpl ă şi ponderat ă Determinarea corect ă a medianei şi a modului pentru o serie de frecvenţe Înţelegerea no ţiunilor de baz ă ale variaţiei şi asimetriei Înţelegerea no ţiunii de amplitudine, abatere individual ă faţă de medie medie Determinarea corect ă a abaterii medie liniar ă, dispersiei, abaterii medie pătratice şi a coeficientului de varia ţie pentru o serie simpl ă şi pentru o serie de frecven ţe Competenţe dobandite ca urmare a parcurgerii modulului: Deprinderea folosirii no ţiunilor de: mediei aritmetice, geometrice, armonice şi geometrice simple şi ponderate Deprinderea folosirii no ţiunilor de medie, median ă şi mod Calculul diferitelor tipuri de medii simple şi ponderate Calculul medianei şi a dominantei
40
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Calculul abaterii medie liniar ă, dispersiei, dispersiei, abaterii medie medie pătratice şi a coeficientului de varia ţie pentru o serie simpl ă şi pentru o serie de frecvenţe Realizarea de referate aplicative legate de problematica modulului
Timpul mediu necesar pentru asimilarea modulului: 6 ore
Lecţia 1 INDICATORII TENDINŢEI CENTRALE (MĂRIMILE MEDII) Pasul 1 – Noţiuni introductive Indicatorii cei mai utiliza ţi pentru caracterizarea tendin ţei centrale a unei variabile statistice sunt: media aritmetic ă, mediana şi modul (dominanta). „Mediile sunt m ărimi statistice care exprim ă, în mod sintetic şi generalizat, ceea ce este normal, esen ţial, tipic pentru unit ăţile unei colectivit ăţi distribuite dup ă o anumită caracteristică”40. Dacă media este reprezentativă pentru seria respectiv ă, adică colectivitatea cercetat ă este omogenă, atunci prin înlocuirea fiec ărui termen al seriei cu valoarea mediei, suma termenilor va fi aceea şi. Media este o valoare reprezentativ ă pentru o serie de date; întotdeauna ea se va afla în interiorul intervalului valorilor respective ordonate cresc ător sau descresc ător (între xmin şi xmax ), motiv pentru care mai este denumit ă şi indicator de pozi ţie. Se pot defini diverse tipuri de medii, dar cele mai utilizate sunt: media aritmetic ă, media geometric ă, media armonic ă, mediana şi modul. Clasificare La rândul lor, fiecare medie poate fi calculat ă sub formă de: a) medie simplă, în cazul seriilor simple (în care variantele caracteristicii este înregistrat ă doar la nivelul unei unit ăţi statistice); b) medie ponderată, în cazul seriilor de frecven ţe (în care variantele caracteristicii sunt regăsite la nivelul mai multor unit ăţi statistice, cu frecven ţe diferite).
Pasul 2 - Media aritmetic aritmetică Definiţie Media aritmetică este o medie fundamental ă de calcul, simbolizat ă prin „ x ” pentru o distribuţie empirică şi prin „ µ ” pentru o variabil ă aleatoare. Media „ µ ” a unei variabile 40
Jaba, E. – Op. cit., p. 103.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
41
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
aleatoare discrete x, cu func ţia de probabilitate P(X=x) se calculează potrivit rela ţiei µ = ∑ x ⋅ P( X = x) , în timp ce pentru o variabil ă aleatoare continu ă „ X”, cu func ţia de densitate f(x) se determină astfel: µ = ∫ x ⋅ f ( x)ddxx . Media
x
a unei distribu ţii empirice
„reprezintă valoarea pe care ar purta-o fiecare unitate statistic ă dacă distribuţia ar fi omogenă”41. Clasificare Media aritmetică simplă se calculează cu ajutorul rela ţiei: x =
1 n
n
∑1 x
i
i=
Media aritmetică ponderată se calculează pe baza rela ţiei: x=
1 m
∑1
ni
m
∑1
xi ni
sau
m
x=
i=
∑1 i=
xi fi , unde
m
∑1 f = 1 i
i=
i=
Exemplul 1:
Să se determine media aritmetic ă a numerelor: 5, 6, 8, 11, 15. x =
Exemplul 2:
5 + 6 + 8 + 11 + 15 =9 5
Să se determine media aritmetic ă ponderată pentru urm ătoarea distribu ţie de frecvenţe:
Determinarea mediei aritmetice ponderate Profitul net anual Frecvenţa f x x f i i i i (mii lei) 0-2 40 1 40 2-4 50 3 150 4-6 90 5 450 6-8 15 7 105 8 - 10 5 9 45 TOTAL 200 - 790 x =
∑ xi f i 790 = = 3,95 mii lei 200 ∑ f i
Deci, PN anual mediu al celor 200 firme este de 3,95 mii lei.
Proprietăţile mediei aritmetice 1. Pentru verificarea exactităţii calculelor: 41
Jaba, E. – Op. cit., p. 106
42
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
a) media aritmetic ă este cuprins ă între varianta minim ă şi maxim ă a caracteristicii; xmin ≤ x ≤ xmax
b) suma abaterilor valorilor individuale ale variabilei aleatoare fa ţă de media lor este egală cu zero, c ăci media aritmetic ă anihilează toate abaterile în plus sau în minus de la nivelul s ău: n
∑ ( xi − x) = 0 pentru media aritmetic ă simplă; i =1 n
∑ ( xi − x) ⋅ f i = 0 pentru media aritmetic ă ponderată. i =1
2. Pentru simplificarea calculului a) media calculat ă din variantele caracteristicii mic şorate cu o constant ă „a” este mai mică decât media variantelor caracteristicii cu acea constant ă „a”. n
∑ ( xi − a) f i
( xi − a) = i =1
n
n
=
∑ fi
∑ xi f i i =1 n
∑ fi
i =1
i =1
n
a∑ fi − ni =1 = x − a ∑ fi i =1
b) media calculat ă din variantele caracteristicii mic şorate prin împ ărţire la o constant ă „k ” este mai mică decât media real ă de „k ” ori. n x 1n i ⋅ fi ( ) ∑ ∑ ( xi ⋅ f i ) x xi k i =1 k = i =1 n = ( )= n k
∑ f i
k
∑ f i
i =1
i =1
Combinând rela ţiile obţinute la propriet ăţile 2 (a) şi (b) rezult ă o formul ă de calcul simplificat ă a mediei aritmetice. xi − a f i k i =1 x= ⋅k + a n ∑ f i n
∑
i =1
c) dacă se micşorează frecvenţele f 1 , f 2 , …, f n prin împ ărţire la o constant ă „c” aleasă arbitrar, media nu se schimb ă n n f 1 n ∑ x ⋅ i i
i =1
c
f ∑ i i =1 c n
∑ xi f i
= c i =1n
1 f ∑ i c i =1
=
∑ xi f i i =1 n
∑ f i
= x
i =1
Combinând propriet ăţile 2 (a), (b) şi (c) se obţine: x =
∑
xi − a f i ⋅ k c ⋅k + a n f ∑ i i =1 c
unde: k - mărimea intervalului de grupare; Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
43
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
a – centrul intervalului cu frecven ţa cea mai mare.
Pasul 3 - Media armonic armonică Definiţie Se folose şte atunci când nu se cunosc frecven ţele f 1 , f 2 , …, f n şi nici volumul general al acestora. Clasificare 1 1 1 n 1 • Media armonică simplă - se folose şte pentru seriile simple + +L + = ∑ . x1
Înlocuim xi = xh şi obţinem: 1 xh
+L+
1
n
1
n
n
1
=∑ ⇒ = ∑ ⇒ xh = xh i =1 xi xh i =1 xi
n N
∑
1
x2
xn
i =1
xi
.
xi
i =1
Media armonic ă a numărului de studen ţi în cazul grupelor anului I secţia Finanţe – Bănci este: - grupa 1: 25 studen ţi; - grupa 2: 30 studen ţi; - grupa 3: 20 studen ţi. 3 3 Media armonic ă va fi: xh = = = 24,32 studenţi. 1 1 1 11 + + 25 30 20 100 • Media armonică ponderată - se determin ă pornind de la media aritmetic ă ţinând cont de faptul c ă nu se cunosc frecven ţele „fi”, dar se cunosc produsele „x if i”. „Media armonică este o mărime definită ca inversă a mediei aritmetice calculat ă din inversele valorilor caracteristicii” 42. Media armonic ă se foloseşte îndeosebi pentru determinarea indicelui mediu armonic al pre ţurilor. Exemplul 4: Să se determine media armonic ă ponderată pentru distribu ţia din tabelul următor Exemplul 3:
Media armonică Grupe de firme după PN anual (mii lei) 0–2 2–4 4–6 6–8 42
xi
x f i i
1/ xi
1 3 5 7
40 150 450 105
1 1/3 1/5 1/7
Jaba, E. – Op. cit., p. 115
44
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
1 xi
⋅ xi f i
40 50 90 15
Rodica Pripoaie, Statistică economică, Note de curs
8 - 10 TOTAL
Anul I, semestrul I
9 -
45 790
1/9
5 200
n
xh =
∑ xi f i i =1
=
1
n
∑ xi f i
790 = 3,95 mii lei. 200
xi
i =1
Pasul 4 - Media pătratică Definiţie Se folose şte când nivelul variabilei prezint ă creşteri din ce în ce mai mari, modificându-se aproximativ dup ă o func ţie exponen ţială. „Media p ătratică ridicată la pătrat este media aritmetic ă a pătratelor valorilor xi”43. Clasificare • Media pătratică simplă n
x12 + x12 + L + x12 = ∑ xi2 i =1
Înlocuim xi = x p şi obţinem: n
2
2
2
n
2
n
∑ xi2
i =1
n
x p + x p + L + x p = ∑ xi2 ⇒ n x p = ∑ x12 ⇒ x p = i =1
Exemplul 5:
.
Să se determine media p ătratică simplă pentru caracteristica „cifr ă de afaceri” în cazul a trei firme cercetate, şi anume: CAx= 8 mii lei/lun ă; CAy= 12 mii lei/lun ă; CAz= 20 mii lei/lun ă. x p =
•
i =1
8 2 + 12 2 + 20 2 ≅ 14,24 mii lei /lună 3
Media pătratică ponderată x12 f1 + x22 f 2 + L + xn2 f n = ∑ xi2 fi i =1 n
Înlocuim xi = x p
43
2
2
2
n
2 ⇒ x p f1 + x p f 2 + L + x p f n = ∑ xi f i i =1
Ibidem, p. 116
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
45
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
n
n
2
2
n
n
i =1
i =1
⇒ x p ( f1 + f 2 + L + f n ) = ∑ xi2 f i ⇒ x p ∑ f i = ∑ xi2 f i ⇒ x p = i =1
∑ xi2 f i i =1 n
∑ f i i =1
Exemplul 6:
Să se determine media p ătratică ponderată pentru urm ătoarea distribu ţie de frecvenţe:
Grupe de firme după CA lunară – mii lei 0–2 2–4 4–6 6–8 8 - 10 TOTAL 7.020 x p = ≅ 4,84 mii lei. 300
Media pătratică Frecvenţa
x 2i
xi
f i
20 80 160 30 10 300
1 3 5 7 9 -
1 9 25 49 81 -
x 2 f i i
20 720 4.000 1.470 810 7.020
Pasul 5 - Media geometric geometrică
Acest tip de medie se utilizeaz ă pentru calculul indicelui mediu, c ăci fenomenele socio-economice în evolu ţia lor se caracterizeaz ă în general printr-o încetinire de ritm, chiar dacă volumul absolut al cre şterii este din ce în ce mai mare. mare. Media geometric ă se calculează numai pentru numere pozitive. „Media geometric ă a „n” date pozitive se define şte ca rădăcina de ordin „n” din produsul acestora” ace stora” 44.
Clasificare • Media geometric ă simplă n
x1 x2 ⋅ K ⋅ xn = ∏ xi
Înlocuim:
i =1
n
( )
xi = xg ⇒ xg xg ⋅K ⋅ xg = ∏ xi ⇒ xg
14243 " n " ori
44
i =1
n
n
= ∏ xi ⇒ xg = i =1
Ibidem, p. 114
46
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
n
n
∏x . i
i =1
(1)
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Logaritmăm expresia (1) şi obţinem:
1 ∑ ln x n
1 1 ln x g = ln n ∏ xi = ln ∏ xi = ∑ ln xi ⇒ x g = e n n
n
n
i =1
•
n
i
i =1
n i =1
i =1
.
Media geometric ă ponderată x1 f1 x2f 2 ⋅K ⋅ xn f = ∏ xi f n
n
i
f
f
fn
n
1 2 f ⇒ x g x g ⋅K ⋅ x g = ∏ xi ⇒
i =1
Înlocuim xi = x g
i
i =1
n
⇒ ( x g )
∑1 f i
i=
n
n
= ∏ xi f ⇒ x g = ∑ f ∏ xif i
i =1
(2)
i
i
i =1
Logaritmăm expresia (2) şi obţinem: n
⇒ ln ( xg ) = ln
∑1 f
1
n
i
f ∏ xi = i
i=
i =1
n
∑ f i i =1
1
n
ln ∏ xi f = i
i =1
n
∑ fi
∑ln ( xi ) =
1
fi
i =1
n
∑ f i
∑( f i lnx i ) ⇒
i =1
1 ∑ ( f ln x )
n
⇒ x g = e
∑1 f
i
i
i
i=
Pasul 6 - Relaţia dintre media aritmetic ă, media geometric ă, media armonică şi media pătratică Definiţie Media geometric ă a unei serii de numere pozitive x 1, x2, …,xn este mai mică sau cel mult egală cu media lor aritmetic ă, dar este mai mare sau cel pu ţin egală cu media lor armonică, în timp ce media aritmetic ă este mai mică decât media pătratică xh ≤ xg ≤ xa < x p . Exemplul 7:
Fie numerele: 1, 3 şi 9. 1+ 3 + 9 x a = = 4, 33; x g = 3 1 ⋅ 3 ⋅ 9 = 3; 3 3 12 + 32 + 92 x h = ≅ 2, 08; x p = 1 1 1 3
≅ 5, 51
+ +
1 3 9
Deci
xh < x g < xa < x p . Adic ă
2,08 < 3 < 4,33 < 5,51.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
47
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Lecţia 2 MEDIANA Pasul 1 – Definiţie Mediana este acea valoare a caracteristicii care ocup ă locul central în cadrul variantelor seriei ordonate cresc ător sau descresc ător, deci mediana împarte seria în dou ă părţi egale.
Pasul 2 În cazul seriilor simple, pot apare dou ă situaţii: 1. dacă seria are un num ăr impar de termeni, mediana este acea variant ă a n +1 caracteristicii cu rangul , după ce în prealabil seria a fost ordonat ă. 2 Exemplul Fie seria format ă din cifra de afaceri a 5 firme (exprimat ă în 8: mii lei): 4; 7,25; 2; 2,75; 4,25. Ordonare: 2; 2,75; 4; 4,25; 7,25. Locul Medianei este dat de rangul
n +1
2
=
5 +1 = 3 ⇒ Termenul 2
al III-lea este mediana ⇒ T3 = Me = 4 mii lei. 2. dacă seria are un num ăr par de termeni, mediana este dat ă de semisuma termenilor centrali, dup ă ce în prealabil seria a fost ordonat ă. Exemplul 9:
Fie seria din exemplul anterior la care se adaug ă alte 3 firme (CA exprimat ă în mii lei): 8; 10; 2,50. Ordonare: 2; 2,50; 2,75; 4; 4,25; 7,25; 8; 10. Me =
4 + 4, 25 = 8,125 4 mii lei. 2
Pasul 3 – Relaţii de calcul În cazul seriilor de distribu ţie, mediana se determin ă cu una din urm ătoarele rela ţii de calcul:
∑ f − f i
♦ M e = xM + e
48
cm −1
2
f M e
⋅k
, dacă ∑ f i = nr. par sau
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
∑ f + 1 − f i
cm −1
2
♦ M e = xM +
f M e
e
⋅ k , când
∑f
i
r = nr. impar impa
unde: x M - limita inferioar ă a intervalului median; intervalul median este es te primul interval pentru care este respectat ă condiţia: e
♦ f cm cm ≥
∑ f , dacă ∑ f = nr. par i
i
2
sau ♦ f cm cm ≥
∑ f + 1 , dacă ∑ f = nr. impar; i
i 2 f i - frecven ţele caracteristicii x i; f cm-1 cm-1 - frecven ţele cumulate pân ă la intervalul median; k - mărimea intervalului; f Me Me - frecven ţa intervalului median; f cm cm – frecven ţa cumulat ă.
Lecţia 3 MODUL (DOMINANTA) Pasul 1 – Definiţie Modul (dominanta) reprezint ă ă valorile caracteristicii cu frecven ţ a cea mai mare. Dominanta (modul) se calculează rapid ş ie cu privire la tendin ţ a şi ofer ă ă o primă informa ţ ie centrală a unei distribu ţ ii. ii.
Pasul 2 - Relaţie de calcul M o = xM o +
unde:
x M o
∆1 ∆1 + ∆ 2
⋅k ,
- limita inferioară a intervalului modal; intervalul modal este intervalul cu
frecvenţă maximă; ∆1 - diferen ţa dintre frecven ţa intervalului modal şi frecvenţa intervalului premodal; ∆2 - diferen ţa dintre frecven ţa intervalului modal şi frecvenţa intervalului postmodal; k - mărimea intervalului modal. Exemplul 10:
Se dă distribuţia de frecven ţe din tabelul urmator:
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
49
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Profitul lunar mediu Nr. firme din net (mii lei) eşantionul analizat 1-2 50 2-3 120 interval 3-4 20 modal 4-5 6 5-6 2 TOTAL 200 Modul: Intervalul modal (cu frecven ţa cea mai mare) este: (2,3) mii lei. M o = 2 +
1 20 − 50 30 ⋅1 = 2 + ⋅ 1 = 2, 23 mii lei . 30 + 1 0 0 (120 − 50) + (120 − 20)
Pasul 3 – Relaţia dintre mediană, mod şi media aritmetic ă Metoda Pearson de determinare a modului se bazeaz ă pe relaţia care există între M o , M e şi x a în reparti ţiile moderat aritmetice, şi anume : M o= 3 M e - 2 x a În cazul unei distribu ţii unimodale simetrice, media aritmetic ă, mediana şi modul se găsesc în aceea şi poziţie, ca în figur ă. Me = M0 = Xa
Xa
=
Me
=
M0
În cazul distribu ţiilor unimodale asimetrice, valorile centrale ( M e , , M o, xa ) nu mai coincid, ci se pot situa astfel:
50
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
X a M e
Xa
≤
X a
M 0 Me
≤
Anul I, semestrul I
M0
M0
M e ≤
Me
M 0 ≤
Xa
Lecţia 4 ANALIZA STATISTICĂ A VARIAŢIEI FAŢĂ DE TENDINŢA CENTRALĂ Pasul 1 – Noţiuni introductive Indicatorii dispersiei, asimetriei şi boltirii se calculeaz ă alături de indicatorii tendin ţei centrale pentru a caracteriza mai bine o distribu ţie, întrucât „se poate ca dou ă distribuţii observate, relativ la aceea şi variabilă, să aibă aceeaşi valoare a tendin ţei centrale dar s ă fie diferite prin dispersie sau concentrare” 45. Indicatorii dispersiei, asimetriei şi boltirii ofer ă informaţii despre „modul în care termenii seriei se abat între ei sau de la medie. /…/ Media nu este suficient ă ca indicator de analiză deoarece ascunde structura colectivit ăţii pe grupe şi nu se pot cunoa şte abaterile termenilor seriei fa ţă de media lor, datorate ac ţiunii cauzelor întâmpl ătoare”46. Pentru caracterizarea varia ţiei fenomenelor se utilizeaz ă două grupe de indicatori: 1. indicatori simpli; 2. indicatori sintetici. Pasul 2 - Indicatorii simpli ai variaţiei Definiţie Indicatorii simpli ai variaţiei arată gradul de împr ăştiere a unit ăţilor colectivit ăţii supusă cercetării faţă de media aritmetic ă a valorilor seriei respective. Ace şti indicatori pot fi exprimaţi atât prin m ărimi absolute, cât şi prin mărimi relative. Clasificare Indicatorii simpli ai varia ţiei sunt: 45 46
Jaba, E. – Op. cit., p. 145 Balei, T.; Anghelache, C.; Ţiţan, E. – Op. cit., p. 70
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
51
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
- absolută - amplitudinea varia ţiei - relativă - abatere absolut ă - abaterea fiec ărei variante de la medie: - abatere relativ ă
Pasul 3 Definiţii Amplitudinea variaţiei sau câmpul de varia ţie este diferen ţa dintre valoarea maxim ă şi valoarea minim ă; aceasta se mai nume şte şi amplitudine absolută. A = xmax - xmin Exemplul 1:
Amplitudinea varia ţiei pentru cifra de afaceri ob ţinută de o firm ă pe ultimele 4 luni (exprimat ă în mii lei) + 4; + 4,8; +1,5; +1,75 este A = 4,8 – 1,5 = 3,3 mii lei ssau au câmpul de varia ţie se poate indica simplu, doar precizând cea mai mic ă şi respectiv, cea mai mare valoare. În acest exemplu, câmpul de varia ţie poate fi indicat astfel: (1,5 mii lei – 4,8 mii lei).
Amplitudinea relativă (Ar) este raportul dintre amplitudinea absolut ă şi media aritmetică a valorilor seriei cercetate. x − xmin A ⋅100 Ar = ⋅100 = max xa xa Clasificare Abaterea fiecărei variante de la medie poate fi: • abatere absolut ă ă (d i) se determin ă ca diferenţă între fiecare variant ă înregistrată şi media aritmetică a valorilor seriei respective. Se determin ă cu rela ţia: di = xi − x a • abatere individuală relativă se determină ca raport între fiecare abatere individual ă absolută şi media aritmetic ă a seriei, cu ajutorul rela ţiei: dr =
di xa
⋅ 10 0 =
xi − xa xa
xi
⋅100 ⇒ d r =
xa
− 1 ⋅100
Pasul 4 - Indicatorii sintetici ai variaţiei Definiţii Indicatorii sintetici ai variaţiei se calculeaz ă întrucât indicatorii simpli ai varia ţiei nu cuantifică toată variaţia caracteristicii analizate; indicatorii sintetici ai varia ţiei arată gradul de variaţie al tuturor termenilor seriei. 52 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Clasificare Indicatorii sintetici ai varia ţiei sunt: 1. abaterea medie liniar ă; 2. dispersia; 3. abaterea medie p ătratică; 4. coeficientul de varia ţie. Definiţii şi relaţii de calcul Abaterea medie liniară ( d ) se determină ca o medie aritmetic ă simplă sau ponderat ă a abaterilor termenilor seriei fa ţă de medie ( x ), dar în valoare absolut ă. Se determin ă cu rela ţia: 1)
d =
2) d =
∑ x − x i
n
pentru o serie simpl ă;
∑ x − x ⋅ f , pentru o serie de frecven ţe. ∑ f i
i
i
Exemplul 2:
Determina ţi abaterea medie liniar ă a variaţiei numărului de salaria ţi ai unei firme pe ultimii şase ani, ştiind că numărul salariaţilor a fost: 57; 80; 100; 90; 110; 115. Calcul ăm media aritmetic ă: x a =
∑ x
i
n
=
75 + 80 + 1 00 + 9 0 + 1 10 + 1 15 = 95 salariaţi. 6
Abaterea medie liniar ă d = d =
Exemplul 3:
7 5 − 9 5 + 8 0 − 95
∑ x − x i
a
n + 10 0 − 95 +
⇒
90 − 95 + 1 10 − 9 5 + 11 5 − 9 5
6
⇒ d = 13,33
Determina ţi abaterea medie liniar ă a variaţiei cifrei de afaceri anuale pentru 150 de firme analizate. Se dau datele din tabelul urm ător:
Date statistice a n e i v c f e r F ţ
Grupe de firme în func ţie de CA (mii lei) 0–4 4–8 8 – 12 12 – 16
40 80 20 5
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
i e l i i xi − a m k
xi − a k
⋅ f i
xi − x a
xi − xa f i
4,13 0,13 3,87 3,87 7,87 7,87
165,2 10,4 77,4 39,35
i
x
2 6 10 14
-1 0 +1 +2
-40 0 20 10
53
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
16 - 20 TOTAL
5 150
18 -
+3 +5
15 +5
11,87 59,35 27,87 351,7
Se alege ca origine arbitrar ă o valoare „a” care se determin ă ca fiind centrul intervalului care are frecven ţa maximă; astfel, se observ ă că intervalul cu frecven ţa maximă este intervalul (4 - 8), iar centrul acestui interval este a = 6. a = 6
x = k = 4
d =
∑
( xi − a ) k f i
∑
f i
⋅ k + a =
5 ⋅ 4 + 6 = 6.13 mii lei 150
∑ xi − xa fi 351,7 = ≅ 2,345 . 150 150 ∑ f i
t ermenii unei serii fa ţă de media Abaterea medie liniară arată cu cât se abat în medie, termenii lor; acest indicator este relevant doar pentru seriile omogene. Dispersia ( ∇ 2 ) se calculeaz ă ca medie aritmetic ă simplă sau ponderat ă a pătratelor abaterilor termenilor fa ţă de media lor: • •
∑ ( x − x ) pentru serii simple : ∇ 2 =
2
a
i
;
n
∑( x − x ) pentru serii de distribu ţie : ∇ 2 = ∑ f i
2
a
fi
.
i
Abaterea medie pătratică (abaterea standard) sau devia ţia standard ( ∇ ) se calculează ca medie p ătratică din abaterile variantelor seriei de la media lor aritmetic ă, astfel: 2
•
•
pentru serii simple:
∇=
∑ ( x − x ) ;
pentru serii de distribu ţie:
a
i
n
∇=
∑( x − x ) ∑ f i
a
2
fi
.
i
Metoda simplificată de calcul a dispersiei (metoda originii arbitrare)
54
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Calcularea dispersiei pentru seriile de distribu ţie cu ajutorul formulei:
∑(x − x ) ∇2 = ∑ f i
a
2
fi
este dificilă, fapt pentru care se folose şte urm ătoarea formul ă:
i
2
xi − a ∑ k f i ⋅ k 2 − xa − a 2 , 2 ∇ = ( )
∑ f i
unde: a – centrul intervalului care are frecven ţa maximă; k - mărimea intervalului de grupare.
Coeficientul de variaţie (v) se calculează ca raport procentual între abaterea medie pătratică şi media aritmetic ă a seriei, liniară şi media aritmetic ă a seriei:
v=
vd =
∇ x a
d x a
⋅100 , sau ca raport procentual între abaterea medie
⋅100 .
Semnifica ţ ia ia coeficientului de varia ţ ie ie Coeficientul de varia ţie ia valori cuprinse între 0 şi 100 %. Cu cât valoarea sa este mai apropiată de 0, cu atât varia ţia este mai slabă, seria este mai omogen ă şi media este mai reprezentativă. Dacă valoarea coeficientului de varia ţie este mai mare de 30 - 35 - 40 % se apreciază că media nu este suficient de reprezentativ ă şi „datele trebuie s ă fie separate în serii componente, pe grupe, în func ţie de varia ţia unei alte caracteristici de grupare” 47, fapt pentru care acesta se folose şte ca test de verificare în aplicarea metodei grup ării. Pasul 5 - Media, dispersia dispersia şi al ţ i indicatori ai varia ţ iei iei unei caracteristici alternative
Caracteristica alternativă este cea care are doar dou ă variante posibile. De exemplu, din punct de vedere calitativ produsele pot fi bune calitativ sau cele care nu corespund din punct de vedere al calit ăţii (rebuturile); de asemenea rezultatul la examenul de ob ţinere a permisului auto poate fi: admis sau respins, ş.a.m.d. Cele dou ă variante ale unei caracteristici alternative se exprim ă după cum s-a observat, prin cuvinte, şi nu numeric. Din aceast ă cauză se atribuie variantei afirmative valoarea conven ţională „1” şi variantei neafirmative valoarea convenţională „0”. Frecvenţa Variantele caracteristicii absolută relativă x1 = 1
n1
n1 n
= p
47
Biji, E., Balei, T., „Statistică teoretică şi economică”, Editura Didactică şi Pedagogică, Bucureşti, 1991, p. 95 96 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
55
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
x2 = 0
n2
n2
TOTAL
n
=q
n1 + n 2 = n p + q = 1
unde: p = frecvenţa relativă a variantei afirmative a caracteristicii; q = frecvenţa relativă a variantei neafirmative a caracteristicii; n1 = frecven ţa absolută a variantei afirmative a caracteristicii; n2 = frecven ţa absolută a variantei neafirmative a caracteristicii. Demonstraţii Media caracteristicii alternative se determin ă pe baza rela ţiei mediei aritmetice ponderate, astfel: x =
∑ x f = x1 ⋅ f1 + x2 ⋅ f 2 = 1⋅ n1 + 0 ⋅ n2 ⇒ n1 + n2 n1 + n2 ∑f i
i
i
x =
n1 n1 + n2
=
n1 n
=p
Deci, x = p , adică media aritmetică a caracteristicii alternative este chiar „ p” frecvenţa relativă a variantei afirmative a caracteristicii. Dispersia (varianţa) caracteristicii alternative se determin ă pornind de la rela ţia de calcul a dispersiei pentru o serie de frecven ţe, după cum urmează: ∇
2
∑( x − x ) = ∑f i
i
2
=
2
fi
∑( x − p) = ∑f i
fi
2
=
(1 − p ) p + ( 0 − p ) q
2
⇒∇ =
2
( xi − p ) p + ( xi − p ) q p+q
i
2
p+q
2
q2 p + p2q p+q
=
pq ( q + p )
( p + q)
=
= pq
Deci, ∇ 2 = pq = p (1 − p ) , adică se determină ca produs între frecven ţa relativă a variantei afirmative ( p) şi frecven ţa relativă a variantei neafirmative ( q). Abaterea medie pătratică ( ∇ ) se determină pe baza rela ţiei: ∇ = ∇2 =
pq =
p (1 − p )
Atunci când colectivitatea supus ă cercetării este împărţită în grupe omogene, se pot determina varian ţele de grup ă ( ∇ p2 ), media varian ţelor de grup ă ( ∇ p2 ), precum şi varianţa mediilor de grup ă faţă de media general ă ( δ p2 ); de asemenea este valabil ă şi regula adun ării dispersiilor.
56
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 6 - Indicatorii asimetriei asimetriei şi boltirii Definiţii Se defineşte noţiunea de asimetrie absolut ă (as), adică diferenţa dintre nivelul mediu şi mod, astfel: as = x − M 0
Pentru cuantificarea gradului de asimetrie se folosesc mai multe metode: 1. Metoda Pearson - presupune determinarea coeficientului: C asp =
unde:
x a − M o
∇
,
M0 = modul; ∇ = abaterea medie p ătratică; x a = media aritmetic ă. Observa ţ ie ie
•
−1 ≤ C asp ≤ 1 ;
•
Dacă
Casp < 0 ⇒ x a < M o şi distribuţia prezint ă o asimetrie stâng ă;
•
Dacă
Casp = 0 ⇒ x a = M o ,
•
Dacă
Casp >0 ⇒ x a >M o şi distribu ţia prezint ă o asimetrie dreapt ă;
•
Dacă
C asp = ± 1 seria are o asimetrie pronun ţată;
distribuţia este simetric ă;
Pentru distribu ţiile moderat asimetrice −0, 3 ≤ C asp ≤ 0, 3 . 2. Metoda Fisher - presupune calcularea coeficientului: •
C asF =
3 ( x a − M e ) ∇
,
unde: M e = mediana C asF asF ia valori între -3 şi +3 şi cu cât se apropie de zero seria este mai simetric ă. Toate celelalte observa ţii cu excep ţia ultimei observa ţii de la C asP rămân valabile.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
57
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
REZUMAT Indicatorii cei mai utiliza ţi pentru caracterizarea tendin ţei centrale a unei variabile statistice sunt: media aritmetic ă, mediana şi modul (dominanta). Media este o valoare reprezentativă pentru o serie de date; întotdeauna ea se va afla în interiorul intervalului valorilor respective ordonate cresc ător sau descresc ător (între xmin şi xmax ), motiv pentru care mai este denumit ă şi indicator de pozi ţie. Se pot defini diverse tipuri de medii, dar cele mai utilizate sunt: media aritmetic ă, media geometric ă, media armonic ă, mediana şi modul. Indicatorii dispersiei, asimetriei şi boltirii se calculeaz ă alături de indicatorii tendin ţei centrale pentru a caracteriza mai bine o distribu ţie. Indicatorii dispersiei, asimetriei şi boltirii oferă informaţii despre felul în care termenii seriei se abat între ei sau de la medie. CONCLUZII Studiind acest modul a ţi dobândit cuno ştinţe referitoare la no ţiunile de m ărime medie, indicatori ai tendin ţei centrale, tipuri de medii. De asemenea, a ţi acumulat cuno ştinţe despre indicatorii varia ţiei, dispersiei şi asimetriei.
EXEMPLE ILUSTRATIVE 1. Pentru acordarea unui credit unei firme, banca ia în calcul mai mul ţi indicatori, printre care şi solvabilitatea firmei respective pe ultimele 12 luni. Firma are urm ătoarele valori ale solvabilit ăţii pe ultimele 12 luni: ianuarie iulie ⇒ S = 0,60 ⇒ S = 0,80 februarie august ⇒ S = 0,55 ⇒ S = 0,80 martie septembrie ⇒ S = 0,75 ⇒ S = 0,70 ⇒ S = 0,75 ⇒ S = 0,75 aprilie octombrie ⇒ S = 0,60 ⇒ S = 0,70 mai noiembrie ⇒ S = 0,60 ⇒ S = 0,68 iunie decembrie Banca acord ă creditul dac ă solvabilitatea firmei pe ultimele 12 luni este mai mare de 70%. Se cere să se determine dac ă firma obţine creditul. Rezolvare:
S=
∑S = 1 (0,6 + 0,55+ 0,70+ 0,75+ 0,60+ 0,60+ 0,80+ 0,80+ 0,75+ 0,75+ 0,70+ 0,68) = 0,69S = 0,69 . i
n
12
Deoarece 58
S = 69%
< 70% ⇒ firma respectiv ă nu va ob ţine creditul solicitat.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
2. În urma unei analize statistice generale, la o firm ă, s-au ob ţinut urm ătoarele date, cu privire la salaria ţii din cadrul firmei. Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 12
Vechime - ani 10 8 7 2 1 10 6 5 7 5 4 2
Salariul lunar (sute lei) 7 7 6 3,5 3 7,5 5 4 6 4,5 4 3
Se cere: 1. Să se calculeze mediana pentru vechime şi pentru salariu; 2. Să se grupeze cei 12 salaria ţi în func ţie de vechimea în munc ă, respectiv m ărimea salariului pe 3 grupe cu intervale egale; 3. Să se calculeze mediana şi modulul pentru seria de frecven ţe de la punctul 2. Rezolvare: 1a. - Pentru vechime:
Ordonare: 1; 2; 2; 4; 5; 5; 6; 7; 7; 10, 10; Locul medianei este dat de rangul
n +1
2
=
T + T 7 12 + 1 , adică Me= = 6,5 ⇒ Me = 6 2 2
5+6 = 5,5 ani 2
- Pentru salariu: Ordonare: 3; 3; 3,5; 4; 4; 4,5; 5; 6; 6; 7; 7; 7,5. 1b.
Locul medianei este dat de rangul =
n +1
2
=
T + T 7 12 + 1 , adică Me = 6,5 ⇒ Me = 6 2 2
4.5 + 5 = 4,75 sute lei 2
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
59
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
2.Gruparea datelor:
Tabelul 4. 10. Prezentare tabelar ă Grupe de muncitori dup ă vechime - ani -
Frecvenţa
[1 – 4) [4 – 7) [7 – 10] TOTAL
3 4 5 12
Grupe de muncitori dup ă salariul lunar - sute LEI [3 – 4,5) [4,5 – 6) [6 – 7,5] TOTAL
Frecvenţa 5 2 5 12
Frecvenţa cumulat ă fcm 3 7 12 Frecvenţa cumulat ă fcm 5 7 12
∑ f − f i
3. a) Mediana: M e = xMe+
cm −1
2
f Me
⋅ k
- pentru vechime, intervalul median este [4 - 7) întrucât acesta este primul interval care îndepline şte condiţia ca f cm cm ≥
∑ f = 12/2 = 6, deci: i
2
12 −3 2 Me = 4+ ⋅ 3 = 6,25 ani. 4 - pentru salariu, intervalul median este [4,5 - 6) întrucât acesta este primul interval care îndepline şte condiţia ca f cm cm ≥
∑ f = 12/2 = 6, deci: i
2
12 −5 M e = 4, 5 + 2 ⋅1, 5 = 5, 25 sute lei. 2 b) Modul: M o = xMo +
∆1 ∆1 + ∆ 2
⋅k
- pentru vechime intervalul modal este [7 - 10): M o = 7 +
60
5−4 ⋅ 3 = 7, 5 ani (5 − 4 ) + ( 5 − 0)
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
- pentru salariu intervalele modale sunt dou ă, şi anume: [3 – 4,5), respectiv [6 – 7,5), astfel vor avea dou ă module relative, şi anume: M o1 = 3 +
(5 − 0) ⋅ 1, 5 = 3, 3, 9375 sute lei ( 5 − 0) + ( 5 − 2 )
M o 2 = 6 +
(5 − 2) ⋅ 1, 5 = 6, 6, 5625 sute lei ( 5 − 2 ) + ( 5 − 0)
2. Determina ţi amplitudinea absolut ă şi relativă pentru varia ţia profitului brut în cazul a 6 firme, cunoscând datele din tabelul urm ător: 3. PB Firma - mii leiA 12 B 4 C 16 D 2 E 18 F 20 Rezolvare: A = xmax - xmin = 20 - 2 = 18 Ar = x a =
A x a
⋅ 1 00 =
∑ x
i
n
=
18 ⋅ 1 0 0 = 15 0 % 12
1 2 + 4 + 1 6 + 2 + 18 + 20 = 12 6
4. Pe baza datelor din problema 3 calcula ţi abaterea fiec ărei variante de la medie. Rezolvare:
a) abaterea absolut ă:
di = xi − xa
b) abaterea relativ ă:
d r =
Firma A B C
d i xa
⋅100
Determinarea abaterilor PB d = x − x - mii LEI12 0 4 -8 16 4 i
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
i
a
d r =
d i xa
⋅ 100
0 -66,67 33,33 61
Rodica Pripoaie, Statistică economică, Note de curs
D E F x a =
∑ x
i
n
=
2 18 20
Anul I, semestrul I
-10 6 8
-83,33 50 66,67
1 2 + 4 + 1 6 + 2 + 18 + 20 = 12 mii lei 6
5. Pentru cazul celor 5 firme din problema 3 calcula ţi abaterea medie liniar ă pentru profitul brut. Rezolvare: d =
∑ x − x i
a
n
Abaterea medie liniară PB x Firma - mii lei A 12 B 4 C 16 D 2 E 18 F 20 TOTAL 72
i
d =
∑ x − x i
n
a
=
− x a
0 8 4 10 6 8 36
36 = 6 mii LEI 6
6. Calculaţi coeficientul de asimetrie dup ă metoda Pearson şi Fisher pentru urm ătoarea serie de distribu ţie: Grupe de firme în func ţie de Frecvenţa f i mărimea salariului mediu - sute LEI 700 - 900 20 900 - 1100 30 1100 - 1300 55 1300 - 1500 35 1500 - 1700 10 TOTAL 150 Rezolvare:
62
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
a) Metoda Pearson C asp =
xa − M o
(1)
∇
Coeficienţii de asimetrie Grupe de firme în func ţie de mărimea n e xi −a salariului mediu v a c xi - sute LEI e k r ţ
xa =
∑
xi − a k f i
f i
∑
20 30 55 35 10 150
800 1000 1200 1400 1600
xi − a k f i
-40 -30 0 35 20 -15
4 1 0 1 4 10
80 30 0 35 40 185
-2 -1 0 1 2 0
⋅k + a ,
a = 1200
−15
⋅ 2 0 0 + 12 00 = 11 8 0 ⇒ x a = 1 1 8 0 ⇒ x a = k = 200 150
M 0 = x M 0 +
∆1 ∆1 + ∆ 2
M o = 1100 +
2
xi −a k
F
700 - 900 900 - 1100 1100 - 1300 1300 - 1500 1500 - 1700 TOTAL
2
xi −a f i k
(2)
⋅ k , k = 20 0
5 5 − 30 25 ⋅ 2 00 = 11 00 + ⋅ 20 0 = 25 + 20 20 ( 55 − 3 0 ) + ( 5 5 − 35 )
5 9
= 1100 + ⋅ 200 = 1211,11 ⇒ M o = 1211,11
( 3)
2
x − a ∑ i k f i 2 2 185 185 2 2 ∇= ⋅ k − ( xa − a ) = ( 200) −(1180 −1200) =
∑ f i
150 150
37 37 370 ⋅ 200 ⋅ 200 − 202 = ⋅ 20 ⋅ 200 − 202 = 20 −1 = 30 3 3 20 122, 33 ≅ 221, 208 ⇒ ∇ = 221, 208
(4)
Înlocuim rezultatele (2), (3) şi (4) în (1) şi obţinem:
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
63
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
1180 − 1211,11 31,11 =− = −0,14 → distribuţia este moderat asimetric ă şi 221, 208 221, 208 reprezintă o asimetrie stângă, deoarece C asp = −0,14 < 0. C asp =
b) Metoda Fisher C asF =
3 ( x a − M e )
(5)
∇
Pe baza calculelor de la punctul a), cunoa ştem media aritmetic ă şi abaterea standard: x a = 1180
∇=
221,208 f i
Calculăm mediana:
Me = xM e +
∑ 2 − f f M e
cm−1
⋅k
150 − 50 25 1 00 0 2 M e = 1100 + ⋅ 20 0 = 1 1 00 + ⋅ 20 0 = 1 10 0 + = 11909, 90 55 55 11
(6)
Înlocuim rezultatele (2), (4) şi (6) în (5) şi obţinem: C asF =
• • • • •
3 (1180 − 1190, 90 90) = − 0,14 ⇒ distribuţia prezint ă o asimetrie stâng ă. 221,208
RECOMANDĂRI BIBLIOGRAFICE Tudor Baron, Elena Biji şi colab. – Statistică teoretică şi economică, Ed. Didactică şi Pedagogic ă, Bucureşti, 1996 Elena-Maria Biji, Eugenia Lilea, Elisabeta Ro şca, Mihaela Văzui – Statistică aplicată în economie – Ed. Universul Dalsi, Bucure şti, 2000 Elisabeta Jaba – Statistică, Ed. Economic ă, Editia a IV-a, Bucure şti, 2007 Ianuarie-Doru Popescu – Bazele statisticii, Ediţia a III-a revizuit ă şi completată, Ed. Funda ţiei Academice Danubius, Gala ţi, 2000 Rodica Pripoaie – Statistică Economică, Ed. Didactic ă şi Pedagogic ă, Bucureşti, 2008
TESTE DE AUTOEVALUARE 1. În urma unei anchete statistice cu privire la profitul net lunar realizat de c ătre 200 de firme s-au ob ţinut datele din tabelul urm ător: 64
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Grupe de firme după profitul Net - mii lei (0 – 2] (2 – 4] (4 – 6] (6 – 8] (8 – 10] TOTAL a) b) c) d) e) f) g) h)
Anul I, semestrul I
Frecvenţe relative (%) f r =
f i
∑
f i
⋅100
20 40 15 20 5 100
Se cere: Să se reprezinte poligonul frecven ţelor relative şi histograma pentru seria de frecven ţe Determinaţi valoarea central ă pentru fiecare grup ă; Stabiliţi clasa cu frecven ţa relativă maximă (intervalul modal); Determinaţi frecvenţele absolute; Determinaţi frecvenţele cumulate: ascendent şi descendent atât pentru frecven ţele absolute cât şi pentru frecven ţele relative; Determinaţi media aritmetic ă a Profitului Net prin cele dou ă metode: direct ă şi simplificată; Determinaţi media pătratică şi geometric ă; Calculaţi mediana şi modulul. Rezolvare:
a)
Poligonul frecvenţelor relative şi histograma PN b) Grupe de firme după PN Valoarea centrală a – mld. clasei (Xi) (0 – 2] 1 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
65
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
(2 – 4] (4 – 6] (6 – 8] (8 – 10]
3 5 7 9
c) Intervalul modal este (2 – 4] şi are frecven ţa relativă 40%, iar frecven ţa absolută: fr =
f i
∑ f
⋅ 10 0 ⇒ f i = f r ⋅
i
∑f
i
=
40 ⋅ 200 = 80 firme 100
d) Grupe de firme după PN
Frecvenţe relative (%) f r =
f i
∑ f
Frecvenţe absolute f i= f r ⋅ ∑ f i
⋅100
i
(0 – 2] (2 – 4] (4 – 6] (6 – 8] (8 – 10] TOTAL
20 40 15 20 5 100
40 80 30 40 10 200
e) PN
Frecv. absolute f i
0–2 2–4 4–6 6–8 8– 10 Total
66
Frecv. absolute cumulate
Frecv. relative f i
ascendent descendent
∑
f i
⋅100
40 80 30 40 10
40 120 150 190 200
200 160 80 50 10
(%) 20 40 15 20 5
200
-
0
100
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Frecv. relative cumulate ascendent descendent 20 60 75 95 100
100 80 40 25 5
-
0
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Metoda direct ă: x = ∑ xi f i
f)
∑ f x − a ∑ k f = ⋅ k + a, ∑ f i
i
Metoda simplificat ă:
i
xa
i
„a” poate fi orice constant ă, dar pt. simplificarea calculelor îl vom alege ca fiind centrul intervalului cu frecven ţa maximă, adică în acest exemplu a = 3 şi k = 2
PN
xi
f i
x f i i
0–2 2–4 4–6 6–8 8 – 10 TOTAL
1 3 5 7 9 -
40 80 30 40 10 200
40 240 150 280 90 800
Metoda direct ă: x a
=
∑ x f = 800 = 4 ∑ f 200 i
xi − a
xi − a
k
k
-1 0 1 2 3 5
-40 0 30 80 30 100
⋅ f i
xi2 ⋅ f i
40 720 750 1960 810 4.280
i
i
xi − a
Metoda simplificat ă:
xa =
g) Media pătratică: x p =
∑
k f i
f i
∑
⋅k + a =
∑ x 2 f ⇒ x ∑ f i
i
p
i
1
∑ Media geometric ă: xg = e ∑ f
=
100 ⋅2 +3 = 4 200
4.280 ≅ 4,63 200
( fi ln xi )
i
PN 0–2 2–4 4–6 6–8 8 – 10 TOTAL xg =
1 ⋅235.991 200 e
xi
f i
2 xi f i
1 3 5 7 9
40 80 30 40 10 200
40 720 750 1.960 810 4. 280
ln xi
f i ln xi
0 1,099 1,603 1,946 2,197 6,845
0 87,900 48,283 77,836 21,972 235,991
Frecvenţa cumulată f cm cm 40 120 150 190 200
= e1.18 =3,254
h) Intervalul median este cel care con ţine mediana, iar locul medianei este 100 , deci, intervalul (2 – 4 ] este intervalul median. 67
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
∑ f − f i
M e = xMe +
cm −1
2
f Me
Anul I, semestrul I
200 − 40 ⋅ k = 2 + 2 ⋅2 80
Me = 3,5 M o = xMo +
∆1 ∆1 + ∆ 2
⋅k
, intervalul modal este intervalul cu frecven ţă maximă, adică tot
intervalul (2 – 4 ]: M o = 2 +
80 − 4 0 ⋅ 2 ≅ 2, 89 mii LEI. ( 80 − 4 0 ) + ( 8 0 − 3 0 )
TEMĂ DE CONTROL 1. O întreprindere a realizat în primele şase luni ale anului trecut urm ătoarele valori ale ratei rentabilit ăţii economice, şi anume: Rata rentabilităţii Luna economice Ianuarie 13 % Februarie 10 % Martie 9% Aprilie 12 % Mai 12 % Iunie 15 % Să se determine media ratei rentabilit ăţii economice pentru semestrul I al anului precedent. 2. În urma unei anchete statistice cu privire la valoarea CA în cadrul a 500 de firme sau obţinut următoarele date: Grupe de firme dup ă CA Frecvenţa f i - mii lei (0 - 4] 100 (4 - 8] 120 (8- 12] 180 (12 -16] 75 (16 -20] 25 TOTAL 500 Să se determine: 1. CA medie a celor 500 de firme (metoda direct ă şi metoda simplificat ă); 2. Media armonic ă ponderată, media p ătratică şi media geometric ă ponderată; 3. Mediana, modul, quartilele şi decilele. 68
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
3. Pe baza unei cercet ări statistice privind dependen ţa de pie ţele de aprovizionare şi desfacere pentru 1000 de firme luate în calcul au rezultat urm ătoarele date: a) Dependenţa de pieţele de Frecvenţa aprovizionare din ţară (%) f i 0 - 20 100 20 - 40 200 40 - 60 200 60 - 80 400 80 - 100 100 TOTAL 1.000 b) Dependenţa de piaţa de desfacere internă (%) 0 - 20 20 - 40 40 - 60 60 - 80 80 - 100 TOTAL
Frecvenţa f i 50 150 200 400 200 1.000
Se cere să se determine: 1. media aritmetic ă, prin metoda direct ă şi simplificată atât pentru cazul a) cât şi pentru cazul b); 2. media pătratică şi media geometric ă; 3. mediana, modul. 4. Pe baza unei anchete statistice în cadrul unei firme cu privire la salariul tarifar al celor 14 salaria ţi s-au obţinut urm ătoarele: Salariul tarifar Vechimea în muncă Salariat - sute lei - ani A 17 10 B 5 1 C 6 2 D 7 3 E 6 2 F 7 4 G 8 5 H 9 5 I 9 7 J 10 7 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
69
Rodica Pripoaie, Statistică economică, Note de curs
Salariat K L M N
Salariul tarifar - sute lei 12 10 5 13
Anul I, semestrul I
Vechimea în muncă - ani 9 8 1 9
Se cere: 1. Calcula ţi mediana pentru salariul tarifar şi pentru vechime; 2. Grupa ţi cei 14 salaria ţi în func ţie de vechimea în munc ă şi respectiv salariul tarifar pe 5 grupe cu intervale egale; 3. Calcula ţi mediana, modul şi quartilele pentru seria de frecven ţe de la punctul 2; 4. Să se determine media aritmetic ă ponderată pentru seria de frecven ţe de la punctul 2, prin cele dou ă variante de calcul. 5. Determina ţi amplitudinea absolut ă şi relativă pentru varia ţia valorii vânz ărilor la export pentru cinci firme, pe baza datelor din tabel: Valoarea vânzărilor la export Firma (mil. USD) A 13 B 14 C 18 D 16 E 19
70
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Modulul III SONDAJUL STATISTIC ŞI UTILIZAREA LUI ÎN ECONOMIE Lecţia 1. Teoria elementar ă a sondajului Lecţia 2. Tipuri de sondaj Obiectivele specifice modulului: Introducerea no ţiunii de sondaj statistic. Studiul modalit ăţilor de alc ătuire a e şantionului. Studiul avantajelor cercet ării prin sondaj Studiul diferitelor tipuri de sondaj Rezultatele aşteptate: Înţelegerea no ţiunilor de baz ă ale teoriei elementare a sondajului Determinarea corect ă a indicatorilor numerici asocia ţi unui anumit tip de sondaj Înţelegerea sondajului pentru o caracteristic ă numerică şi pentru o caracteristic ă nenumerică (alternativ ă) Competenţe dobandite ca urmare a parcurgerii modulului: Deprinderea folosirii no ţiunilor de sondaj şi de eroare medie de reprezentativitate, eroare maxim ă admisă şi de volum al e şantionului. Folosirea corect ă a modalit ăţilor de alc ătuire a e şantionului. Calculul indicatorilor asocia ţi fiecărui tip de sondaj repetat şi nerepetat, pentru o caracteristic ă alternativă sau nealternativ ă. Timpul mediu necesar pentru asimilarea modulului: 6 ore
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
71
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Lecţia 1 TEORIA ELEMENTARĂ A SONDAJULUI Pasul 1 – Noţiuni introductive Fenomenele şi procesele social-economice sunt nenum ărate şi foarte complexe, motiv pentru care nu pot fi cercetate în întregimea lor; astfel, se analizeaz ă doar o parte din unit ăţile statistice ale fiec ărei colectivit ăţi, adică doar un eşantion sau o colectivitate de selec ţie. Teoria sondajului este de fapt, studiul rela ţiilor existente între o popula ţie şi eşantionul extras din popula ţia analizat ă. Această teorie este important ă întrucât în unele situa ţii sondajul statistic este singura metod ă de obţinere a informa ţiilor, de exemplu când cercetarea întregii colectivităţi originare este nera ţională, datorit ă caracterului distructiv al metodei de cercetare (controlul calit ăţii produselor) sau neeconomic ă, deoarece necesit ă costuri mari pentru analiza tuturor unit ăţilor popula ţiei originare.
Pasul 2 - Cerinţa generală a unui sondaj Principala cerin ţă a unui sondaj este aceea ca rezultatul s ă fie reprezentativ pentru întreaga colectivitate, adică eşantionul studiat s ă fie reprezentativ pentru colectivitatea originară. Prin reprezentativitate se înţelege ca în e şantionul selectat s ă se regăsească aceleaşi tr ăsături esenţiale ca şi în popula ţia originar ă. Se admite ca suficient de reprezentativ sondajul care nu conduce la erori fa ţă de colectivitatea originar ă mai mari de ± 5%. Pasul 3 - Avantajele cercetării prin sondaj 1. Sondajul este mai operativ şi mai economic decât observarea total ă. 2. Erorile de înregistrare prin sondaj sunt mai mici deoarece persoanele care realizează sondajul sunt specializate mai bine decât persoanele care fac observ ări totale. 3. În cazul observ ării unor erori sistematice, sondajul se poate repeta. 4. Timpul necesar pentru ajungerea la concluzii este mult mai mic decât în cazul unei observaţii totale.
Pasul 4 - Procedee de alcătuire a eşantionului Eşantioanele care se formeaz ă din popula ţia originară trebuie să îndeplinească condiţia de reprezentativitate. Pentru aceasta trebuiesc îndeplinite urm ătoarele condi ţii: 1. populaţia originar ă să fie cât mai omogen ă; 2. unităţile care vor forma e şantionul să fie extrase la întâmplare; 3. eşantionul să fie suficient de mare pentru ca în el s ă apară trăsăturile populaţiei originare; 72
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
4. independenţa unităţilor extrase între ele. Respectând aceste condi ţii sondajul va genera abateri mici fa ţă de indicatorii populaţiei originare. Alegerea unit ăţilor ce vor forma e şantionul se poate face: a) pe baza unei scheme probabilistice; b) în mod dirijat. a) Alegerea probabilistică a unităţilor eşantionului se face înl ăturând orice interven ţie subiectivă, asigurând caracteristica întâmpl ătoare a includerii unit ăţilor în e şantion. „Eşantionarea probabilistic ă se aplică, de obicei , când nu se cunoa şte structura colectivit ăţii totale dup ă caracteristica considerat ă în studiu”48. Se utilizează trei procedee: 1. procedeul tragerii la sor ţi sau al loteriei; 2. procedeul selec ţiei bazate pe tabelul cu numere aleatoare; 3. procedeul alc ătuirii mecanice. b) Alegerea eşantionului în mod dirijat presupune alegerea unit ăţilor componente ale eşantionului dup ă un criteriu ra ţional prestabilit. „Se aplic ă în sondajul realizat asupra colectivităţilor grupate în grupe tipice, deci a c ăror structur ă este cunoscut ă”49.
Formarea eşantionului antionului prin tragerea la sorţi (procedeul loteriei) Se poate realiza sub dou ă forme: ie întâmplă toare toare repetat ă 1. cu restituirea unit ăţii extrase (selec ţ ie ) ; ă); 2. f ără restituirea unităţii extrase ( selec ţ ie ) . ă). ie întâmplă toare toare nerepetat ă 1. Selecţia întâmplătoare repetată are următoarele caracteristici: • volumul colectivit ăţii originare ( N ) rămâne constant cât dureaz ă extragerea unităţilor pentru formarea e şantionului; • la fiecare extragere orice unitate a colectivit ăţii originare are aceea şi probabilitate de a fi selec ţionată (1/ N ); ); • aceeaşi unitate a colectivit ăţii originare poate fi selectat ă de mai multe ori, ceea ce influenţează negativ precizia rezultatului selec ţiei. 2. Selecţia întâmplătoare nerepetată are următoarele particularit ăţi: -1), • volumul colectivit ăţii originare scade consecutiv cu câte o unitate sau serie ( N -1), pe măsură ce creşte numărul extragerilor pentru formarea e şantionului, de volum „n”. La sfârşitul extragerilor volumul colectivit ăţii originare este ( N-n); • scăderea continu ă a volumului colectivit ăţii generale face ca unit ăţile care particip ă la extragerea urm ătoare să aibă o probabilitate din ce în ce mai mare de a fi incluse în e şantion; 48 49
Ibidem, p. 238 Idem, p. 239
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
73
Rodica Pripoaie, Statistică economică, Note de curs
•
Anul I, semestrul I
aceeaşi unitate nu poate fi inclus ă de mai multe ori în e şantion ceea ce conduce la erori de reprezentativitate mai mici decât selec ţia întâmplătoare repetat ă.
Procedeul selecţiei bazate pe tabelul cu numere aleatoare Tabelele cu numere aleatoare se întocmesc cu ajutorul ma şinilor de amestecat numere. Numerele din tabel sunt a şezate pe coloane şi rânduri într-o ordine absolut întâmpl ătoare, f ără nici o regularitate în succesiunea lor. Pentru formarea e şantionului tot la întâmplare se stabilesc coloanele şi rândurile pentru citirea numerelor întâmpl ătoare. Dacă anumite numere din tabel dep ăşesc pe cele din colectivitatea originar ă, acestea se exclud din selec ţie. Şi în acest caz, alegerea coloanelor de selec ţie se poate face în mod repetat sau nerepetat. Procedeul alcătuirii mecanice a e şantionului Unităţile colectivităţii generale se înscriu într-o anumit ă ordine, într-un tabel din care se aleg apoi unit ăţile aflate la distan ţe egale. Forma cea mai simpl ă a procedeului selec ţiei mecanice o reprezint ă selecţia pe baza listei colectivităţii generale, dup ă ce anterior a fost p = N/n). Prima unitate se selec ţionează la întâmplare din primele stabilit pasul de num ărare ( p N/n unităţi, a doua unitate selec ţionată este unitatea aflat ă la distanţă de un pas fa ţă de prima unitate, ş.a.m.d., unitatea „ n” a eşantionului se afl ă la distanţă de (n-1) paşi faţă de prima unitate selecţionată.
Lecţia 2 TIPURI DE SONDAJ Pasul 1 – Noţiuni introductive Clasificare Există mai multe tipuri de sondaj, şi anume: - sondaj simplu; - sondaj mecanic; - sondaj tipic (stratificat); - sondaj de serii. Fiecare tip de sondaj poate fi: repetat şi nerepetat. Pentru toate tipurile de sondaj se calculeaz ă trei indicatori: 1 - eroarea medie de sondaj sau eroarea medie de reprezentativitate ( µ ); 2 - eroarea limit ă ă admisă , notată cu: - ∆ x pentru caracteristici nealternative; - ∆w pentru caracteristici alternative; 74
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
3 - volumul e şantionului pentru caracteristici alternative şi nealternative.
Pasul 2 - Sondajul simplu repetat şi nerepetat Dacă extragem un num ăr dintr-o urn ă, putem alege dac ă numărul extras va fi reintrodus în urn ă sau nu. Dacă numărul extras se va reintroduce în urn ă, sondajul se nume şte sondaj repetat, în caz contrar sondaj nerepetat. Popula ţia originară poate fi finit ă, sau infinit ă. Dacă, de exemplu, extragem succesiv 5 bile în mod nerepetat dintr-o urn ă cu 50 bile, se formează un eşantion dintr-o popula ţie finită; dacă se arunc ă o moned ă de 50 de ori şi formăm un eşantion din num ărul de „fe ţe A” ale monedei ob ţinute, acest e şantion se formeaz ă dintr-o populaţie infinită. Definiţii şi relaţii de calcul Sondajul simplu repetat 1. eroarea medie de sondaj „ µ ” se determină din relaţiile: a) pentru caracteristica nealternativ ă: ∇ 20 = ∇ 2s ∇ 02
n n −1 → n
2
2
= n µ
2
µ= ∇ s
n n −1
→
2
2
µ= ∇s
n n −1
≅
∇ 2s n
⇒
=µ
∇ 2s n
≅
∇02 n
(1)
b) pentru caracteristica alternativă: Caracteristica alternativă este caracteristica ale c ărei variante nu se exprim ă numeric (cantitativ), ci prin cuvinte (calitativ) şi nu admite decât una sau alta dintre variante. De exemplu, atunci când se urm ăreşte calitatea produselor, r ăspunsurile care se dau sunt: - da, când produsul este corespunz ător calitativ; - nu, când produsul este necorespunz ător d.p.d.v. calitativ. Dacă vom considera r ăspunsurile efective ca fiind cele dou ă variante ale caracteristicii, atunci pentru exprimarea lor cantitativ ă se vor asocia urm ătoarele valori conven ţionale: - pentru DA, x1 = 1, p - frecven ţa relativă a variantei x1; - pentru NU, x2 = 0, q - frecven ţa relativă a variantei x2; p + q = 1
∑ x f = x1 f1 + x2 f2 = 1⋅ p + 0 ⋅ q = p = p f1 + f 2 p+q p+q ∑f ( x − x ) f (1− p)2 p + ( 0 − p)2 q q2 p + p2q pq( q + p) ∑ 2 ∇ = = = = = pq f p q p q p q + + + ∑ i
xa =
i
i
a
i
i
i
µ =
∇20 n
=
pq n
=
p (1 − p ) n
, p =
M N
(2)
M - răspunsuri afirmative din colectivitatea N - volumul colectivit ăţii generale.
general ă;
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
75
Rodica Pripoaie, Statistică economică, Note de curs
Notăm cu
w=
m n
Anul I, semestrul I
(3)
,
unde: m - răspunsuri afirmative din colectivitatea de selec ţie (eşantion); n - volumul e şantionului. w (1 − w )
Din (2) şi (3) ⇒ µ ≅
(4)
n
2. Eroarea limită admisă (eroarea maximă admisă) este produsul dintre coeficientul de siguran ţă „t” şi eroarea medie de sondaj. - pentru caracteristica nealternativ ă: ∆ x = t µ = t - pentru caracteristica alternativ ă: ∆w = t µ = t
∇ s2 n
(5);
w(1 − w) n
.
(6)
3. Volumul eşantionului se calculează pornind de la formula erorii limit ă admise (5) şi respectiv (6): - pentru caracteristica nealternativ ă: ∆x 2 = t 2
∇ s2 n
→n=
t 2∇ 2s
(7)
n
- pentru caracteristica alternativ ă: 2
∆w = t
2
w (1 − w ) n
→n=
t 2 w (1 − w )
(8)
∆w2
Pentru determinarea volumului e şantionului este necesar ă mai întâi stabilirea coeficientului de siguran ţă şi a erorii limit ă admise. Sondajul simplu nerepetat Se calculează aceiaşi indicatori ca şi în cazul sondajului simplu repetat, folosindu-se aceleaşi relaţii cu menţiunea că ele se vor corecta cu un coeficient: k =
N −n N −1
N −n
≅
N
= 1−
n N
(9)
Deci, obţinem: 1. Eroarea medie de sondaj s ondaj - pentru caracteristica nealternativ ă: µ =
n ∇ 02 1 − ≅ n N
n ∇ s2 1 − n N
(10)
- pentru caracteristica alternativ ă: µ =
76
p (1 − p ) n
w (1 − w ) n n 1 − ≅ 1 − n N N
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
(11)
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
2. Eroarea limită admisă - pentru caracteristica nealternativ ă: ∇ 20 ∇ 2s n n ∆x = t µ = t 1− ≅ t 1 − n N n N
(12)
- pentru caracteristica alternativ ă: ∆w = t µ = t
p (1 − p )
w (1 − w ) n n 1 − 1 − N ≅ t n N
n
(13)
3. Volumul eşantionului - pentru caracteristica nealternativ ă: (din rela ţia (12)): n=
2 2 t ∇0 2
∆ x +
2
2 2 t ∇0
N
2
t ∇ s
≅
2
2
∆x +
(14)
2
t ∇ s N
- pentru caracteristica alternativ ă (din rela ţia (13)): 2
n=
t p (1 − p ) 2
∆w +
t 2 p (1 − p ) N
2
≅
t w (1 − w) 2
∆w +
t 2 w (1 − w)
(15)
N
Pasul 3 - Sondajul mecanic Sondajul mecanic este apropiat de sondajul simplu, dar se deosebe şte prin modul de formare al e şantionului, care genereaz ă erori mai mici. Formulele de calcul pentru indicatorii ce arată mărimea erorilor sunt acelea şi ca şi în cazul sondajului simplu. Pasul 4 - Sondajul tipic Sondajul tipic (stratificat) este utilizat în studiul fenomenelor eterogene, când hazardul nu ar conduce la formarea unui e şantion reprezentativ, deci nu se poate aplica sondajul simplu sau cel mecanic. Pentru a forma e şantioane reprezentative în cazul fenomenelor eterogene se procedeaz ă la separarea colectivit ăţii neomogene în grupe calitativ omogene dup ă caracteristicile esenţiale astfel încât grupelor calitativ omogene „N i” din colectivitatea general ă „N” le corespund grupele calitativ omogene „n i” din e şantionul „n”. Se calculează apoi mediile de grup ă şi dispersiile de grup ă, iar pe baza acestora se determin ă media întregului e şantion şi media colectivit ăţii generale. Influen ţa factorilor întâmpl ători din cadrul grupelor este reflectat ă cu ajutorul dispersiilor par ţiale. Media dispersiilor parţiale se calculează cu rela ţia:
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
77
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
m
∑1 ∇ 2 N i
2
∇i =
i
i=
m
∑1 N
, ∑ N i = N , pentru colectivitatea general ă
(16)
m
i =1
i
i=
m
şi
∇ 2s =
∑1 ∇2 n is
i=
m
∑1 n
i
m
, ∑ ni = n pentru colectivitatea de sondaj.
(17)
i =1
i
i=
Pentru calculul celor trei indicatori specifici studiului erorilor în cazul sondajului tipic se înlocuie şte dispersia general ă cu media dispersiilor parţiale. Există mai multe tipuri de sondaj tipic, dar forma cea mai des folosit ă este sondajul tipic propor ţional, în care: n N
=
ni Ni
→ ni = N i ⋅
n
n = Ni ⋅ k , k = N N
.
(18)
Deci, indicatorii în cazul sondajului tipic repetat se determin ă cu relaţiile: 1. eroarea medie de sondaj: - pentru caracteristica nealternativ ă: µ =
∇is2 n
,
(19) m
- pentru caracteristica alternativ ă: µ =
wi (1 − wi ) n
=
∑1 w (1 − w ) n i
i
i=
m
∑1 n
i
⋅
1
, (20) deoarece
n
i
i=
m
∑1 w (1 − w ) n i
wi (1 − wi ) =
i
i=
m
∑1 n
i
.
i
i=
2. eroarea limită admis ă: - pentru caracteristica nealternativ ă: ∆ x = t µ (21), în care µ se determină pe baza relaţiei (19); - pentru caracteristica alternativ ă: ∆w = t µ (22), în care µ se determină pe baza rela ţiei (20). 3. volumul eşantionului este format din volumele grupelor calitativ omogene din cadrul e şantionului şi se deduce din formula de calcul a erorii limit ă admise. n = n1 + n2 + ... + nm ⇒ n =
m
∑1 n
i
.
(23)
i=
unde 78
ni =
2
2
∆ x
2
t ∇is
pentru caracteristici nealternative
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
(24)
Rodica Pripoaie, Statistică economică, Note de curs
sau
ni =
t 2 wi (1 − wi )
∆2w
Anul I, semestrul I
,
(25) m
pentru caracteristica alternativ ă şi
∑1 w (1 − w ) n i
wi (1 − wi ) =
i
i
i=
m
∑1 n
.
i
i=
În cazul sondajului tipic nerepetat formulele celor trei indicatori sunt acelea şi ca şi în cazul sondajului tipic repetat, dar corectate cu coeficientul: N −n
k =
N −1
≅
N −n N
=
1−
n N
.
Pasul 5 - Sondajul de serii Se utilizează în cazul colectivit ăţilor compuse din unit ăţi complexe, de sine st ătătoare şi nu din unit ăţi simple. Unit ăţile complexe nu pot fi considerate ca grupe calitativ omogene, deoarece unit ăţile simple ce intr ă în componen ţa lor au caracteristici proprii şi se deosebesc una de alta. Pentru formarea unui e şantion reprezentativ pentru întreaga colectivitate se extrag prin sondaj simplu sau mecanic unit ăţile complexe. Apoi se înregistreaz ă şi prelucrează datele unităţilor simple ce alc ătuiesc unităţile complexe ce au fost extrase şi care formeaz ă eşantionul. Pe baza acestor date se calculeaz ă mediile de serie şi apoi dispersia dintre serii care va înlocui dispersia general ă ( ∇ 02 ) din sondajul simplu, cu rela ţiile: r
2
δ x =
∑1 ( x − x ) i
2
s
dispersie simplă,
i=
r
(26)
unde: r - num ăr de serii; xi - media de serie; xs
- media de e şantion; m
sau
2
δ x =
∑1 ( x − x ) i
s
i=
m
∑1 n
2
ni
(ponderat).
i
i=
Deoarece ∇ 20 = ∇2 + δ 2 , → δ x2 ≤ ∇02 rezultă că erorile de reprezentativitate calculate în cazul sondajului de serii sunt mai mici sau cel mult egale cu erorile ce se produc când se organizează un sondaj simplu. Formulele de calcul pentru indicatorii privind studiul erorilor devin: 1. eroarea medie de sondaj (de reprezentativitate) Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
79
Rodica Pripoaie, Statistică economică, Note de curs
- sondaj de serii repetat: µ = - sondaj de serii nerepetat:
δ x 2 r
δ x 2 R − r µ = ⋅ r R −1
Anul I, semestrul I
(28) (29)
unde: R - numărul seriilor din colectivitatea general ă; r - numărul seriilor din colectivitatea de sondaj. Deoarece num ărul de serii este relativ mic, în sondajul de serii se rii nu se mai renun ţă la (1) în coeficientul de corec ţie. 2. eroarea limită admis ă ∆ x = t µ
, unde:
∆w = t µ
t - coeficientul de siguran ţă din formula Laplâce µ - din rela ţia (28) sau (29).
3. volumul eşantionului se obţine din formula erorii limit ă admise: r =
t 2 δ x2
∆ x2
- pentru sondajul de serii repetat 2
r =
2
Rt δ x
( R − 1) ∆ x2 + t 2 δ 2x
pentru sondajul de serii nerepetat.
Aceste relaţii rămân valabile şi în cazul sondajului de serii cu caracteristic ă alternativă, înlocuindu-se doar dispersia caracteristicii nealternative cu dispersia caracteristicii alternative.
REZUMAT Fenomenele şi procesele social-economice sunt nenum ărate şi foarte complexe, motiv pentru care nu pot fi cercetate în întregimea lor; astfel, se analizeaz ă doar o parte din unit ăţile statistice ale fiec ărei colectivit ăţi, adică doar un eşantion sau o colectivitate de selec ţie. Teoria sondajului este de fapt, studiul rela ţiilor existente între o popula ţie şi eşantionul extras din popula ţia analizat ă. Această teorie este important ă întrucât în unele situa ţii sondajul statistic este singura metod ă de obţinere a informa ţiilor, de exemplu când cercetarea întregii colectivităţi originare este nera ţională, datorit ă caracterului distructiv al metodei de cercetare (controlul calit ăţii produselor) sau neeconomic ă, deoarece necesit ă costuri mari pentru analiza tuturor unit ăţilor popula ţiei originare. Principala cerin ţă a unui sondaj este aceea ca rezultatul s ă fie reprezentativ pentru întreaga colectivitate, adică eşantionul studiat s ă fie reprezentativ pentru colectivitatea originară. Prin reprezentativitate se înţelege ca în e şantionul selectat s ă se regăsească aceleaşi tr ăsături esenţiale ca şi în popula ţia originar ă. Se admite ca suficient de reprezentativ sondajul care nu conduce la erori fa ţă de colectivitatea originar ă mai mari de ± 5%. Sondajul are mai multe avantaje, cum sunt: 80
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Sondajul este mai operativ şi mai economic decât observarea total ă. • Erorile de înregistrare prin sondaj sunt mai mici deoarece persoanele care realizeaz ă sondajul sunt specializate mai bine decât persoanele care fac observ ări totale. • În cazul observ ării unor erori sistematice, sondajul se poate repeta. • Timpul necesar pentru ajungerea la concluzii este mult mai mic decât în cazul unei observaţii totale. •
CONCLUZII Studiind acest modul a ţi dobândit cuno ştinţe referitoare la no ţiunile de sondaj şi tipuri de sondaj. De asemenea, au fost studiate diversele tipuri de sondaj şi importan ţa acestora în cadrul activit ăţii de prognoz ă. EXEMPLE ILUSTRATIVE 1. O populaţie originar ă este formată din cinci firme, fiecare având o cifr ă de afaceri trimestrială (în mii lei) de: 1, 3, 5, 8 şi 13. Considerând toate e şantioanele care pot fi formate din două firme, prin extragere repetat ă, din popula ţia originar ă, se cere: a) media popula ţiei originare; b) abaterea medie p ătratică a popula ţiei originare; c) media distribu ţiei mediei eşantioanelor; d) abaterea medie p ătratică a distribuţiei mediei eşantioanelor, adic ă eroarea standard a mediei. Rezolvare:
a)
CA =
1 + 3 + 5 + 8 + 1 3 30 = = 6 mii lei 5 6 2
2
2
2
2
(1 − 6 ) + ( 3 − 6) + ( 5 − 6 ) + (8 − 6 ) + (13 − 6) b) ∇CA = = 5 25 + 9 + 1 + 4 + 49 88 = = = 17, 6 şi ∇CA ≅ 4,195. 5 5 2
c) Eşantioanele de dou ă firme care pot fi formate prin extragere repetat ă din popula ţia originară sunt în num ăr de 25. (1, 1) (1, 3) (1, 5) (1, 8) (1, 13) (3, 1) (3, 3) (3, 5) (3, 8) (3, 13) (5, 1) (5, 3) (5, 5) (5, 8) (5, 13) (8, 1) (8, 3) (8, 5) (7, 8) (8, 13) (13, 1) (13, 3) (13, 5) (13, 8) (13, 13) corespunzător media fiec ărui eşantion este: 1 2,0 3,0 4,5 7,0 2,0 3 4 5,5 8 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
81
Rodica Pripoaie, Statistică economică, Note de curs
3,0 4,5 7,0
4 5,5 8
Anul I, semestrul I
5 6,5 9
6,5 8,0 10,5
9 10,5 13
(1)
şi media distribu ţiei mediei e şantioanelor este: CAs =
sum suma tutu tuturo rorr mediil diilor or din din (1) 150 = =6 25 25
care demonstreaz ă faptul că CAs = CA . d) Dispersia ∇ 2s a distribuţiei mediei e şantioanelor se ob ţine scăzând media
( CA ) = 6 din toate numerele (mediile e şantioanelor) din rela ţia (1), ridicând fiecare rezultat la s
pătrat, însumând cele 25 de numere astfel ob ţinute şi împărţind apoi la 25. 2 2 2 2 2 2 2 ∇ s2 = (1 − 6 ) + ( 2, 0 − 6 ) + ( 3, 0 − 6 ) + ( 4, 5 − 6 ) + ( 7, 0 − 6 ) + ( 2, 0 − 6 ) + ( 3 − 6 ) +
2
+ ( 4 − 6) +
2
2
2
2
2
2
2
( 5, 5 − 6 ) + (8 − 6 ) + (3, 0 − 6 ) + ( 4− 6 ) + (5− 6 ) + (6, 5− 6 ) + (9− 6 ) +
2
2
2
2
+ ( 4, 5 − 6 ) + ( 5, 5 − 6 ) + ( 6, 5 − 6 ) + (8 − 6 ) + 2 2 + (10, 5 − 6 ) + (13 − 6) / 25 =
2
2
2
2
(10, 5− 6 ) + (7, 0− 6 ) + (8− 6 ) + (9− 6 ) +
220 = 8, 80 = 8, 96 = 2, 993 25
Ceea ce demonstrează faptul, că pentru o popula ţie finită
2
∇s =
∇2 n
,adică
17,6 = 8, 8 ( unde n = 2) . 2
2. Rezolvaţi problema 1 în cazul în care extragerea este nerepetat ă. Rezolvare:
Punctele a) şi b) sunt cele din problema 1, CA = 6 şi ∇2 = 17, 6; ∇ = 4,19.
c) Eşantioanele formate din câte dou ă firme care se pot forma prin extragere nerepetat ă din popula ţia originar ă sunt în num ăr de: 2
C 5 =
5! 4 ⋅ 5 = = 10 2 !3! 1 ⋅ 2
şi anume: (1,3), (1,5), (1,8), (2,13), (3,5), (3,8), (3,13), (5,8), (5,13), (8/,13). Eşantionul (1,3), de exemplu, este considerat acela şi ca şi eşantionul (3,1). Corespunzător mediile e şantioanelor sunt: 2; 3; 4,5; 7; 4; 5,5; 8; 6,5; 9; 10,5, şi media distribuţiei mediei e şantioanelor este: CAs =
ceea ce demonstreaz ă că: 82
suma suma tutur tuturor or medi mediil ilor or esan esantio tioan anel elor or din ( 2) 60 = =6 10 10
CAs = CA .
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
d) Dispersia distribu ţiei mediei e şantioanelor este: ∇s2 = ( 2, 0 − 6 ) + ( 3, 0 − 6 ) + ( 4, 5 − 6) + ( 7, 0 − 6) +( 4 − 6) +( 5, 5 − 6) +( 8 − 6) + 2
2
2
2
2
2
2
2
2
+ ( 6, 5 − 6) + ( 9 − 6) + (10, 5 − 6) 2 / 10 =
66 = 6, 6, deci ∇s = 6, 6 0 = 8,124 10
ceea ce demonstreaz ă faptul că: ∇2s =
∇ 2 N − n 17 , 6 5 − 2 ⋅ ⋅ ⇔ 6, 6 = 6, ,adică 6, 6 = 6, 6 n N − 1 2 5 −1
n = 2 N = 5
3. Se dau 10 firme, cu cifra de afaceri, respectiv: Firma CA (mii lei) Firma A 20 F B 10 G C 15 H D 12 I E 18 J
CA (mii lei) 14 16 10 20 15
Considerând că cele 10 firme reprezint ă un eşantion de 5% extras întâmpl ător şi repetat, calculaţi limitele între care va fi cuprins ă cifra de afaceri medie în colectivitatea generală dată, ştiind că probabilitatea cu care se garanteaz ă rezultatul este 0,9973. Rezolvare: n = 10
5 10 5 1 0 ⋅ 1 00 → N = → → = = 200 de firme 5 N 100 N 100 Coeficientul de siguran ţă t = 3. n
Dacă
=
Sondaj simplu repetat : 2
1. Eroarea medie de sondaj µ = x =
∇0 n
∑ CA = 150 = 15 mii lei 10
10
2 2 2 2 2 ( 20 − 15) + (10 − 15 ) + (15 − 15) + (12 − 15) + (18 − 15 ) 2 + 10 2 ∑ ( xi − x ) = = 120 ∇0 = n (14 − 15)2 + (16 − 15)2 + (10 − 15)2 + (20 − 15 )2 + (15 − 15)2 10
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
83
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
120 = 12 = 3.46 mii lei n 10 2. Eroarea limit ă ă admisă ∆ x = t ⋅ µ = 3 ⋅ 3.46 = 10,38 mii lei µ =
∇ 20
=
x − ∆ x ≤ CA0 ≤ x + ∆ x
15 − 10,38 ≤ CA0 ≤ 15 + 10,38 mii lei 4,62 ≤ CA0 ≤ 25,38miilei
RECOMANDĂRI BIBLIOGRAFICE • Tudor Baron, Elena Biji şi colab. – Pedagogică, Bucureşti, 1996
Statistică teoretică şi economică, Ed. Didactică şi
• Elena-Maria Biji, Eugenia Lilea, Elisabeta Ro şca, Mihaela V ăzui – economie – Ed. Universul Dalsi, Bucure şti, 2000
Statistică aplicată în
Statistică, Ed. Economic ă, Editia a IV-a, Bucure şti, 2007 • Ianuarie-Doru Popescu – Bazele statisticii, Ediţia a III-a revizuit ă şi completat ă, Ed. Fundaţiei Academice Danubius, Gala ţi, 2000 • Rodica Pripoaie – Statistică Economic ă, Ed. Didactic ă şi Pedagogic ă, Bucure şti, 2008 • Elisabeta Jaba –
TESTE DE AUTOEVALUARE 1. Se efectuează un sondaj simplu pe un e şantion de 500 de firme ce reprezint reprezint ă 3% din colectivitatea general ă, privind m ărimea CA. Probabilitatea cu care se garanteaz ă rezultatul este de 0,9973. Se ob ţin datele din tabelul 8.6. CA - mii lei 0,3 2,1 1,7 2,3 0,7 0,8 1,5 1,2 0,6 2,0 2,5 2,4 84
Numărul de firme
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
f i
2 1 7 2 4 8 3 8 2 1 1 2
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
0,1 Total a) b) c) d) e) f)
4 45
Se cere: Grupaţi datele din tabelul 8.7. în 5 grupe egale; Determinaţi valorile centrale ale fiec ărei clase, precum şi intervalul median şi cel modal; Calculaţi mediana şi modul; Calculaţi media aritmetic ă şi dispersia general ă prin metoda simplificat ă; Calculaţi coeficientul de asimetrie Pearson şi Fisher; Calculaţi limitele între care va fi cuprins ă CA în colectivitatea general ă dacă: • sondajul este repetat; • sondajul este nerepetat. Rezolvare:
CA - mii lei (0 - 0,5] (0,5 - 1,0 ] (1,0 - 1,5 ] (1,5 - 2,0 ] (2,0 - 2,5 ] TOTAL
a. Frecvenţă absolută f i
60 140 110 130 60 500
b. CA - mil. RON(0 - 0,5 ] (0,5 - 1,0 ] (1,0 - 1,5 ] (1,5 - 2,0 ] (2,0 - 2,5 ] TOTAL
Valoarea centrală 0,25 0,75 1,25 1,75 2,25 -
f i
60 140 110 130 60 500
Intervalul median este intervalul care con ţine mediana; cum locul medianei este: U ( Me ) =
∑ f = 500 = 250 i
2
2
deci, intervalul median este (1,0 - 1,5 ]. Intervalul modal este intervalul cu frecven ţa cea mai mare, adic ă (1,5-2,0].
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
85
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
∑ f − f i
d.
cm−1
2
Me = x Me +
f Me
⋅ k,
k=0,5
500 − 200 2 Me = 1 + ⋅ 0, 5 11 Me = 1,227 mii lei M 0 = x M 0 +
M 0 = 1, 5 + M 0 = 1, 7
∆1 ∆1 + ∆ 2
⋅k
13 0 − 1 1 0 ⋅ 0, 5 (130 − 110) + (130 − 60)
mii lei
e. CA - mii lei (0 - 0,5] (0,5 - 1,0 ] (1,0 - 1,5 ] (1,5 - 2,0 ] (2,0 - 2,5 ] TOTAL
xi − a
xi
f i
0,25 60 0,75 140 1,25 110 1,75 130 2,25 60 500
2
k
xi − a k
-3 -2 -1 0 1 -5
9 4 1 0 1 15
xi − a k
2
⋅ f i
-180 -280 -110 0 60 -510
xi − a k ⋅ f i
540 560 110 0 60 1270
Media aritmetică prin metoda simplificată este dată de relaţia: xi − a
∑ xa = x a =
k f i
⋅ f i
∑ −510
500
⋅ k + a,
a=1,75 k=0,5
24 ⋅ 0, 5 + 1, 75 = 1, 24
mii lei
Dispersia prin metoda simplificat ă este dată de rela ţia: σ 02 =
xi − a 2 ∑ k f i
∑ f
(
⋅ k − xa − a
)
2
, a=1,75 k=0,5 xa =1,24
i
86
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
1270 2 ⋅ 0, 5 − (1, 24 − 1, 75) = 1, 40265 ⇒ σ 0 = σ 02 = 1,1843 mii lei 500 x − M 0 1, 2 244 − 1, 7 = ≅ 0,39 f. C asp = a σ 1,1843 σ 02 =
C asF =
3 ( x a − M e ) σ
=
3 (1, 24 24 − 1, 22 227) = 0,03 1,1843
i) Sondaj simplu repetat 1. Eroare medie de sondaj (de reprezentativitate) µ =
σ 02 n
=
1,40265 ≅ 0,053 500
2. Eroarea limit ă ă (maximă ) admisă p = 0, 9973 ⇒ t = 3;
∆x = t µ = 3 ⋅ 0, 0, 053 =
0,159
Deci, x − ∆ x ≤ CA ≤ x + ∆ x 1,081 mii lei < CA < 1,399 mii lei
ii) Sondaj simplu nerepetat 1. Eroare medie de sondaj (de reprezentativitate) µ =
σ 02
n 0,40265 1− = (1 − 0, 03) = 0, 052 n N 500
ă (maximă ) admisă 2. Eroarea limit ă ∆ x = t µ = 3 ⋅ 0, 05 052 = 0,156
Deci, x − ∆x ≤ PN ≤ x + ∆x 1,084 mii lei ≤ PN ≤ 1,396 mii lei
TEMĂ DE CONTROL 1. O populaţie originar ă este formată din 10 firme, fiecare având o Cifr ă de Afaceri trimestrială de: 2, 7, 6, 8, 9, 10, 15, 18, 20, 25 (mii lei). Considerând toate e şantioanele care pot fi formate din dou ă firme, prin extragere repetată, din popula ţia originar ă , se cere: a) media popula ţiei originare; b) abaterea medie p ătratică a popula ţiei originare; c) media distribu ţiei mediei eşantioanelor;
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
87
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
d) abaterea medie p ătratică a distribuţiei mediei eşantioanelor, adic ă eroarea standard a mediei. 2. Rezolvaţi problema 1 în cazul în care extragerea este nerepetat ă. 3. Patru sute de firme au o Cifr ă de Afaceri medie de 2,05 mii lei trimestrial şi o abatere pătratică medie de 1,5. Determina ţi probabilitatea ca un e şantion de 40 de firme s ă aibă o CA totală : a) cuprins ă între 70 şi 80 mii lei trimestrial; b) superioar ă lui 100 mii lei trimestrial. 4. Se analizează 800 firme, cu cifra de afaceri, respectiv:
CA lunară - mii lei 0,5 0,7 0,9 1,0 1,2 1,5 1,7 2,1 2,5 2,7 2,9 3,0 TOTAL
Nr. de firme 170 100 300 40 10 20 10 10 20 10 10 10 800
Considerând c ă cele 800 de firme reprezint ă un e şantion de 10% extras întâmpl ător şi repetat, calculaţi limitele între care va fi cuprins ă cifra de afaceri medie în colectivitatea originară, ştiind c ă probabilitatea cu care se garanteaz ă rezultatul este 0,9962. 5. Rezolvaţi problema 4 pentru cazul în care cele 800 de firme reprezint ă un e şantion de 10% extras întâmpl ător şi nerepetat din colectivitatea general ă.
88
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Modulul IV ANALIZA DE REGRESIE ŞI DE CORELAŢIE Lecţia 1. Analiza de regresie Lecţia 2. Metode de analiz ă a legăturilor statistice Lecţia 3. Metode de corelaţie Lecţia 4. Corelaţia neparametrică Obiectivele specifice modulului: Introducerea no ţiunii de regresie şi de corela ţie. Studiul regresiei liniare şi neliniare. Studiul corela ţiei liniare şi neliniare. Studiul corela ţiei neparametrice. Rezultatele aşteptate: Însuşirea noţiunii de coeficient şi de raport de corela ţie. Învăţarea modului de ob ţinere a coeficien ţilor de corela ţie neparametrică Spearman, Kendall şi Feschner Însuşirea metodei interpol ării şi a metodei celor mai mici p ătrate. Competenţe dobândite ca urmare a parcurgerii modulului: Deprinderea folosirii corecte a metodei celor mai mici p ătrate. Deprinderea determin ării corecte a ecua ţiei de regresie. Folosirea corect ă a metodelor de regresie şi de corela ţie. Folosirea corect ă a metodelor de corela ţie neparametric ă. Timpul mediu necesar pentru asimilarea modulului: 6 ore
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
89
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Lecţia 1 ANALIZA DE REGRESIE Pasul 1 – Noţiuni introductive „Analiza de regresie este o metod ă statistică care permite studierea şi măsurarea relaţiei care există între două sau mai multe variabile, precum şi descoperirea legii relative la forma legăturilor dintre variabile. /…/ Analiza de corela ţie este o metod ă statistică prin care se măsoară intensitatea leg ăturii dintre variabile. Dup ă forma modelului de regresie, corela ţia poate fi tratat ă ca o corela ţie simplă sau ca o corela ţie multiplă. De asemenea, se eviden ţiază gradul de influen ţă a variabilei /variabilelor factorilor asupra variabilei rezultative” 50. Fenomenele social – economice sunt influen ţate de numero şi factori esenţiali şi întâmplători, între care exist ă diverse legături, de diferite intensit ăţi şi sensuri. Clasificare Legăturile statistice dintre fenomenele şi procesele social-economice se pot clasifica în funcţie de mai multe criterii, şi anume: 1) dup ă numă rul variabilelor pot fi: a) legături simple; b) legături multiple. 2) dup ă sensul legă turii pot fi: a) legături directe; b) legături inverse. 3) dup ă forma legă turii pot fi: a) legături liniare (rectilinii); b) legături neliniare (curbilinii, logaritmice, exponen ţiale, semilogaritmice, etc.).
50
Jaba, E. – Op. cit., p. 326
90
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 2 – Metoda empiric ă a interpolării Pentru a determina o ecua ţie care să lege variabilele, un prim pas este înregistrarea datelor care indic ă valorile corespunz ătoare variabilelor considerate. Se poate utiliza raţionamentul individual pentru a trasa o curb ă interpolant ă. Această metodă se numeşte metoda empirică a interpolării. Dacă se cunoaşte tipul ecuaţiei pentru aceast ă curbă este posibil să obţinem constantele ecua ţiei alegând atâtea puncte pe curb ă câte constante sunt în ecuaţie. De exemplu, dac ă interpolanta este o dreapt ă, sunt necesare dou ă puncte, iar dac ă este o parabol ă, sunt necesare trei puncte. Metoda are dezavantajul c ă diferiţi observatori ob ţin curbe diverse. Tipul cel mai simplu al unei interpolante este dreapta, a c ărei ecua ţie poate fi scris ă sub forma: x2 ,y2) pe dreapt ă, se pot y = a0 + a1 x , dacă se dau oricare dou ă puncte ( x1 ,y1) şi ( x determina constantele a0 şi a1. Pasul 3 - Metoda celor mai mici pătrate Pentru a evita interven ţia ra ţionamentului individual în construirea curbei interpolante este necesară găsirea „celei mai bune interpolante”. x2 ,y2),..., ( x xn ,yn). Pentru o valoare În fig. 4.1. punctele date sunt indicate cu ( x1 ,y1), ( x dată a lui x, de exemplu x1, poate apare o diferen ţă între valoarea lui y1 şi valoarea corespunzătoare determinat ă de curba C . Notăm această diferenţă cu D1, deoarece se nume şte deviaţie sau eroare şi poate fi pozitiv ă, negativă sau nulă. Analog, în coresponden ţă cu valorile x2 ,...,xn obţinem devia ţiile D2 ,...,Dn. O altă măsură a „exactităţii interpol ării” efectuate pentru centrul curbei C este dată de suma S = D12 + D22 + ... + Dn2 interpolarea cea mai bun ă este aceea pentru care suma S este cea mai mică.
Interpolantă curbilinie Dintre toate curbele interpolante pentru ni şte puncte date, curba care are proprietatea că suma S = D12 + D22 + ... + Dn2 este minimă se nume şte cea mai bună interpolare.
O curbă cu
această proprietate este curba celor mai mici pătrate.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
91
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 4 - Dreapta celor mai mici pătrate x2 ,y2),..., Dreapta celor mai mici p ătrate interpolante pentru un grup de puncte ( x1 ,y1), ( x ( x xn ,yn) poate avea expresia: y = a + bx
unde, constantele a şi b trebuiesc determinate rezolvând simultan ecua ţiile: ∑ y = a ⋅ n + b∑ x 2 ∑ xy = a∑ x + b∑ x
care sunt ecuaţiile normale ale dreptei celor mai mici pătrate.
Lecţia 2 METODE DE ANALIZĂ A LEGĂTURILOR STATISTICE Pasul 1 – Noţiuni introductive Legăturile statistice existente între factorii care influen ţează fenomenele şi procesele social-economice pot fi analizate cu ajutorul mai multor metode care se împart în dou ă mari categorii: 1) Metode elementare; 2) Metode analitice. Pasul 2 – Metodele elementare de analiză a legăturilor statistice Clasificare 1. Metoda seriilor paralele sau interdependente constă în compararea a dou ă serii în paralel, în ordine cresc ătoare sau descresc ătoare a caracteristicii factoriale pentru a determina existenţa sau inexisten ţa legăturii, precum şi direcţia acesteia. Această metodă se utilizează doar în cazul unui num ăr mic de unit ăţi cercetate, altfel se va aplica metoda grup ărilor. 2. Metoda grupărilor statistice se aplică în cazul în care exist ă un număr mare de variante. Unit ăţile colectivităţii cercetate sunt grupate în func ţie de variabila factorial ă (independentă), iar pentru variabila rezultativ ă (dependentă) se determină o serie de indicatori derivaţi (de regul ă mărimi relative sau medii); pe baza acestor compara ţii se determină existenţa legăturii, direcţia şi intensitatea acesteia. 3. Metoda tabelului de corela ţie (tabelul cu dubl ă intrare) presupune gruparea unităţilor colectivit ăţii cercetate dup ă variaţia simultană a ambelor caracteristici (factorial ă şi rezultativă); se utilizează de regul ă, intervale de grupare egale, iar num ărul grupelor trebuie s ă fie aproximativ acela şi pentru ambele caracteristici. 92
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
„În func ţie de modul de repartizare a frecven ţelor în tabelul de corela ţie se poate aprecia direcţia legăturii şi intensitatea ei. În ambele cazuri direc ţia legăturii este dat ă de poziţia diagonalei în jurul c ăruia se grupeaz ă frecvenţele; când diagonala leag ă unghiul stâng de jos al tabelului cu unghiul drept de sus, leg ătura este direct ă, iar când une şte unghiul stâng de sus cu unghiul drept de jos, se apreciaz ă că între cele dou ă caracteristici exist ă legătură în sens invers. /…/ Concentrarea intens ă a frecven ţelor în jurul diagonalei indic ă existenţa unei legături strânse între caracteristici” 51. 4) Metoda grafică „presupune reprezentarea grafic ă a perechilor de valori ale variabilelor într-un sistem de axe de coordonate. Cu ajutorul acestei metode se poate stabili existenţa, sensul, forma şi intensitatea corela ţiei”52. Se realizează un grafic denumit şi corelogramă pe baza tabelelor utilizate pentru sistematizarea datelor.
Pasul 3 - Metode analitice de de analiză a legăturilor statistice Adeseori, pe baza unor date e şantionare trebuie s ă estimăm valoarea unei variabile Y corespunzătoare unei valori date pentru o variabil ă X . Se poate ob ţine aceasta estimând valoarea lui Y pentru centrul unei curbe a celor mai mici p ătrate care interpoleaz ă datele eşantionare. Curba rezultant ă se numeşte curbă de regresie a lui Y pentru X , deoarece Y este estimat pentru centrul lui X . Dacă dorim să estimăm valoarea lui X pentru centrul lui Y , pentru o valoare dat ă trebuie să utilizăm curba de regresie a lui X pentru Y , care se reduce la schimbarea variabilelor în diagrama dispersiei. În general dreapta sau curba de regresie a lui Y pentru X nu este aceea şi cu dreapta sau curba regresiei lui X pentru Y . Problemele care implic ă mai mult de dou ă variabile pot fi tratate în mod analog cu problemele cu dou ă variabile.
Regresia simplă liniară Regresia simplă liniară este o metod ă analitică utilizată pentru calculul indicatorilor sintetici ai leg ăturii dintre variabile, a intensit ăţii şi direcţiei legăturii. Cea mai simpl ă legătură dintre dou ă variabile x şi y este cea a regresiei liniare, adic ă atunci când mul ţimea punctelor ( x x, y) se grupeaz ă în jurul unei drepte: y = a + bx , unde: a - ordonata la origine; b - coeficient de regresie. Regresia liniară se aplică atunci când variabilele variaz ă în progresie aritmetic ă. Termenul de „regresie” deriv ă din latină şi înseamnă „întoarcere” şi a fost introdus de statisticianul englez FRANCIS GALTON. Determinarea parametrilor dreptei de regresie şi a oricărei func ţii de regresie se poate face prin: 1. metoda punctelor selec ţionate 2. metoda celor mai mici p ătrate 51 52
Ibidem, p. 164 Jaba, E. – Op. cit., p. 330
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
93
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
1. Metoda punctelor selec ţionate - constă în determinarea a dou ă puncte situate pe o dreaptă trasată vizual pe grafic, de regul ă câte un punct la una din extremit ăţi. Rezultă un sistem de două ecuaţii cu dou ă necunoscute. y1 = a + bx1 y2 = a + bx2 1 x1 y1 1 x2 y2 x1 ,y1), ( x x2 ,y2) sunt punctele cunoscute. unde: a şi b sunt necunoscute şi ( x
Metoda punctelor selecţionate 1 y x2 1 y x − y2 x1 ∆ ∆ ; b= b = a= a = 2 = 1 2 1 x1 1 ∆ ∆ x2 − x1 1 x2 1 y1
⇒ y =
x1
y1 x2 − y 2 x1 x2 − x1
+
y2 − y1 x2 − x1
y1 y2 x1
=
y2 − y1 x2 − x1
x2
⋅ x
Metoda punctelor selec ţionate este subiectivă, de aceea se utilizeaz ă metoda celor mai mici pătrate. 2. Metoda celor mai mici p ătrate - se bazează la determinarea parametrilor de regresie pe principiul conform c ăruia „suma pătratelor diferen ţelor dintre valorile empirice şi cele teoretice (date de ecua ţia de regresie) s ă fie minimă”. Cazul (x ,i y ) i
94
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
∑ ( y − y ) → minim 2 S = ∑ ( y − a − bx ) → minim S=
2
i
i
xi
i
∂S =0 2∑( yi − a − bxi ) ( −1) = 0 na + b∑ xi = ∑ yi ∂a ⇒ ⇒ ⇒ 2 ∂S = 0 2∑( yi − a − bxi ) ( −xi ) = 0 a∑ xi + b∑ xi = ∑ xi yi ∂b
Lecţia 3 METODE DE CORELAŢIE Pasul 1 – Noţiuni introductive Determinarea ecua ţiei de regresie arat ă legătura dintre dou ă variabile, dar nu arat ă cât de puternic ă este legătura dintre variabilele corelate. Corela ţia indic ă gradul rela ţiei dintre variabile, intensitatea leg ăturii şi cât de bine ecua ţia de regresie descrie rela ţia dintre variabile. Dacă toate valorile variabilelor satisfac exact ecua ţia, spunem c ă variabilele sunt perfect corelate sau că există o corelaţie perfectă. Când sunt prezente doar dou ă variabile se vorbe şte de corelaţie simplă şi respectiv, regresie simplă. În cazul în care sunt prezente mai mult de dou ă variabile se vorbe şte de corelaţie multiplă şi regresie multiplă. Pasul 2 -Corelaţia liniară Dacă x şi y sunt dou ă variabile, se poate construi într-un sistem de coordonate carteziene, cu punctele ( x, y) o diagramă a dispersiei. După modul de distribuire a punctelor ( x x, y) se poate aprecia existen ţa, forma, direc ţia şi intensitatea leg ăturii. Concentrarea punctelor în jurul unei drepte ne indic ă faptul c ă între variabile exist ă o legătură liniară sau apropiată de o ecua ţie liniară. Legătura liniar ă este directă dacă atunci când x creşte, y creşte şi invers, legătura liniară este indirectă dacă atunci când x creşte, y scade.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
95
Rodica Pripoaie, Statistică economică, Note de curs
a) Corelaţie liniară directă (pozitivă)
Anul I, semestrul I
b) Corelaţie liniară indirectă (negativă)
Se apreciază că între variabile nu există legături (nu sunt corelate) dac ă punctele se dispersează: (a) aproape uniform pe întregul spa ţiu al graficului, (b) în jurul unei drepte paralele cu axa Oy sau (c) în jurul unei drepte paralele cu axa Ox.
a)
b)
c) Variabile independente independente Dacă punctele se situează chiar pe o dreapt ă atunci legătura dintre variabile este o legătură de tip func ţional directă sau inversă.
a) Legătur tură funcţională directă 96
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
b) Legătur tură funcţională inversă
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Legătura funcţională Concentrarea punctelor în jurul unei curbe ne indic ă faptul că între variabile exist ă o legătură neliniară care poate fi: pozitiv ă sau negativă. Pasul 3 - Coeficientul de corelaţie Coeficientul de corela ţie arată cât de puternic ă este legătura dintre variabilele corelate, adică intensitatea legăturii. Coeficientul de corelaţie simplă liniară (r) se calculează ca medie aritmetică simplă a produsului abaterilor normate ale celor dou ă variabile. x ,i yi, 1) 1. Cazul ( x
Abaterile normate sunt z x =
Deci, =
r = rxy = ryx =
xi − x
∇ x
∑ ( z z ) ⇒ r = x
y
n
şi z y =
∑
yi − y
∇y
.
xi − x yi − y ⋅ ∇ x ∇y = n
∑ ( x − x ) ⋅ ( y − y ) = cov ( x, y ) i
i
n∇ x ∇ y
Unde cov ( x, y ) =
1 n
∇ x∇ y
∑ ( x − x ) ( y − y) i
i
Coeficientul de corela ţie este o mărime abstractă care ia valori între -1 şi +1 ⇒ −1 ≤ r ≤ +1 Observa ţ ii: ii:
1. Dacă r = 1 legătura dintre variabile este de tip func ţional (fiec ărei valori a lui x îi corespunde o valoare a lui y şi numai una), iar între variabile este o corelaţie pozitivă (directă) perfectă. 2. Dacă r = -1 legătura este tot de tip func ţional, dar între variabile este o corelaţie negativă (inversă) perfectă. 3. Dacă r = 0 variabilele nu sunt corelate liniar (nu şi independente, deoarece între variabile poate exista o corela ţie neliniară). Îns ă, dacă variabilele sunt independente atunci r = 0.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
97
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Interpretarea valorilor coeficientului de corelaţie Cu cât coeficientul de corela ţie „r” se apropie mai mult de valorile extreme (-1 şi +1) cu atât intensitatea leg ăturii este mai puternic ă, şi invers, cu cât „r” se apropie mai mult de 0 cu atât legătura este mai slab ă, iar dac ă r = 0 între variabile nu exist ă o legătură liniară, dar poate fi o leg ătură neliniară. Pasul 4 - Raportul de corelaţie Raportul de corelaţie ( η ) se obţine prin extragerea r ădăcinii pătrate din coeficientul de determina ţie η = η d 2 .
Coeficientul de determinaţie (η d 2 )
mă soar soar ă ei factorului x asupra ă ponderea influen ţ ei
variabilei y şi se determină ca raport între dispersia valorilor teoretice şi dispersia valorilor empirice ale variabilei y. Pentru aceasta se procedeaz ă la descompunerea variabilei empirice y pe factori de influen ţă. Dispersia variabilei empirice y se descompune în dispersia valorilor empirice fa ţă de valorile teoretice ale variabilei şi dispersia valorilor teoretice y x faţă de media
lor, astfel: Variabile empirice Dispersia reziduală
yi c yxi
a
b
y
xi
Tipuri de dispersii 2
∑ ( y − y ) (dispersia generală); a = ∇2 = i
y
98
n
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Valori teoretice (numai de influenţa factorului x)
Rodica Pripoaie, Statistică economică, Note de curs
∑ ( y =
xi
b = ∇ y2 x 2 c = ∇ yy x
− y)
2
(dispersia valorilor teoretice ale variabilei fa ţă de media lor);
n
∑ ( y =
i
Anul I, semestrul I
− yxi
)
2
(dispersie rezidual ă).
n
2
∇ y
2 ∇ yy xi
2
∇ y
xi
Relaţia dintre dispersii Dispersia generală ∇ y2 reflectă influenţa tuturor factorilor care ac ţionează asupra variabilei dependente y, inclusiv influen ţa variabilei independente x, iar dispersia valorilor teoretice y x faţă de media lor y măsoară numai influen ţa variabilei independente x asupra i
variabilei dependente, iar influen ţa celorlalţi factori care au ac ţionat asupra variabilei y, cu excepţia variabilei x, este dată de dispersia rezidual ă.
a
Pentru cazul ( x , i, y , i, ni) obţinem: η =
( ∑ yi ni )
2
∑ y n + b∑ x y n − ∑ n 2 ( ∑ y n ) 2 ∑ y n − ∑ n i
i
i
i
i
i
i
i
i
i
i
Pentru cazul tabelului de corela ţie obţinem: a
∑ y n. j
j
+b
∑x y n i
j
ij
−
( ∑ y j n. j )
2
∑∑n
ij
η =
∑ y 2 n. j
j
−
( ∑ y j n. j )
2
∑∑n
ij
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
99
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Lecţia 4 CORELAŢIA NEPARAMETRICĂ Pasul 1 – Noţiuni introductive Metodele neparametrice fac abstrac ţie de tipul distribu ţiilor variabilelor corelate şi nu utilizează valorile caracteristicilor, ci rangurile lor. În acest scop unit ăţile statistice se ordonează crescător sau descresc ător în func ţie de variabila factorial ă şi se atribuie fiec ărei variante câte un rang. Clasificare Cele mai importante metode neparametrice de studiere a corela ţiei sunt: 1. metoda Spearman 2. metoda Kendall 3. metoda Feschner turi func ţ ionale ionale Pasul 2 - Metoda Spearman - are la bază ideea că în cazul unei legă turi directe, între variabile trebuie să existe o concordan ţă deplină între rangurile celor două variabile corelate şi invers, o discordan ţă totală în cazul legă turilor turilor func ţ ionale ionale inverse.
Relaţie de calcul Spearman a stabilit urm ătorul coeficient de corela ţie al rangurilor: θ = 1 −
6∑ d i 2 n3 − n
,
unde: d i - diferen ţa între rangurile celor dou ă variabile; n - numărul perechilor de valori corelate. Coeficientul lui Spearman este cuprins între -1 şi 1.În cazul unei leg ături func ţionale directe există o concordan ţă deplină a rangurilor şi θ = 1, iar în cazul unei leg ături func ţionale inverse θ = −1 .
Pasul 3- Metoda Kendall Relaţie de calcul Coeficientul lui Kendall se determin ă cu ajutorul rela ţiei: γ =
unde: 100
S
1 n ( n − 1) 2
S = P−Q
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
,
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
∑p Q = ∑q P=
i
i
- numărul de ranguri superioare rangului „ i” al variabilei dependente care exist ă pe coloana respectivă după fiecare rang qi - numărul de ranguri inferioare rangului „ i” al variabilei dependente care exist ă pe coloana respectivă după fiecare rang. În prealabil se ordoneaz ă crescător variantele variabilei independente şi se înscriu alăturat rangurile corespunz ătoare pentru variabila dependent ă pi
Observa ţ ie ie
−1 ≤ γ ≤ +1 ;
în cazul unei leg ături func ţionale directe γ = 1; în cazul unei leg ături func ţionale inverse γ = - 1; pentru un num ăr suficient de mare al lui n, între coeficien ţii lui Spearman şi al lui Kendall există relaţia: θ =
3γ . 2
Pasul 4 - Metoda Feschner - presupune determinarea unui coeficient de concordan ţă denumit coeficient simplu de covaria ţ ie ie diferen ţ ial ială . K =
c − d n
,
unde: c, d - num ărul de concordan ţe, respectiv discordan ţe de semne ale abaterilor; ∆xi = x i − xi−1 ; ∆yi = yi − yi−1
sau ∆xi = xi − x; ∆yi = yi − y, k ∈[ −1,1]
Observa ţ ii ii Dacă există numai concordan ţe de semne
c = n c−d n−0 = =1 ⇒ ⇒ K = n n d = 0
2. Dacă există numai discordan ţe de semne d = n c−d 0−n ⇒ ⇒ K = = = −1 = c 0 n n
3. Dacă numărul concordan ţelor este egal cu num ărul de discordan ţe, atunci: c = d ⇒ K =
c − d
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
n
=0
101
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Coeficientul lui Feschner are dezavantajul c ă ţine seama doar de semnele abaterilor şi nu de m ărimea acestor abateri ∆ xi şi ∆ yi, de aceea se calculeaz ă un coeficient ponderat de concordanţă: k =
unde:
C−D C+D
,
pentru ca care ∆x ∆y >0 ; ∑ ∆x ∆y , pe D = ∑ ∆x ∆y , pentru care ∆x ∆y < 0 ;
C=
i
i
i
i
i
i
i
i
k ∈ [ −1,1] .
Aceşti doi coeficien ţi au dezavantajul c ă pot avea valoarea ±1, chiar dac ă legătura dintre variabile nu este de tip func ţional, adic ă abaterile ∆ xi, ∆ yi nu sunt propor ţionale, fapt pentru care se calculeaz ă un alt coeficient ponderat de concordan ţă care înlătură acest neajuns. K c =
∑ ∆ x 2 2 ∑ ( ∆ x ) ∑ ( ∆y ) i
i
i
REZUMAT Problemele de programare liniar ă apar în procesele de modelare matematic ă. Agoritmul Simplex ofer ă o cale relativ rapid ă de rezolvare a acestora, spre deosebire de situaţia determinării extremelor func ţiilor ce poate conduce la rezolvarea unui sistem de ecuaţii neliniare. Algoritmul simplex dual apare, de regul ă, în situa ţia reoptimiz ării şi/sau parametriz ării unei probleme de programare liniar ă, conducând la ob ţinerea, de la o solu ţie preexistent ă, a soluţiei problemei transformate. Problema de transport este deosebit de util ă în situaţia alocării unor rute de transport în situaţia în care cheltuielile de transport sunt suportate de c ătre o singur ă firmă.
CONCLUZII Studiind acest modul a ţi dobândit cuno ştinţe referitoare la programarea liniar ă. Aţi învăţat algoritmul Simplex şi modul de aplicare a lui în diferite situa ţii generate de restric ţii, funcţia obiectiv sau natura variabilelor. De asemenea, a ţi învăţat modaitatea de reoptimizare a unei probleme de programare liniar ă.
102
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
EXEMPLE ILUSTRATIVE 1. În urma unei analize privind un e şantion de 10 muncitori dintr-o colectivitate generală de 100 de muncitori s-au ob ţinut datele: Productivitatea muncii Salariul - sute lei - sute lei 5 6 6 7 8 9 10 10 13 12 15 14 17 16 18 18 19 18 20 20 Se cere să se m ăsoare legătura dintre „W m” şi salariul folosind metoda coeficientului de corelaţie. Rezolvare:
Wm Salariul sute lei sute lei xi
x =
2
xi − x
y i − y
6 7 9 10 12 14 16 18 18 20
-9 -7 -5 -3 0 2 4 5 6 7
-7 -6 -4 -3 -1 1 3 5 5 7
81 49 25 9 0 4 16 25 36 49
49 36 16 9 1 1 9 25 25 49
130
0
0
294
220
yi
4 6 8 10 13 15 17 18 19 20 Total 130
( x − x ) ( x − x ) ( y − y ) ⋅ ( y − y ) 2
∑ x = 130 = 13 ; i
n
10
y=
∑y
i
n
=
i
i
i
xi ⋅ yi
xi 2
yi 2
63 42 20 9 0 2 12 25 30 49
24 42 72 100 156 210 272 324 342 400
16 36 64 100 169 225 289 324 361 400
36 49 81 100 144 196 256 324 324 400
252
1942
1984
1910
i
130 = 13 10
I. Metoda directă Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
103
Rodica Pripoaie, Statistică economică, Note de curs
r xy =
xa =
y a r xy =
Anul I, semestrul I
∑ ( x − x) ⋅( y − y) i
i
n∇ x ∇ y
∑
yi
n
=
∑( y − y )
130 = 13 ∇ x = 10
2
i
n
∑( y − y )
∑ y =
130 = = 13 ∇ y = n 10
294 = 5, 42 10
=
220 = 4, 69 10
2
i
i
=
n
2,52 = 0,99 10 ⋅ 5, 42 42 ⋅ 4, 69 69
Deci, între „Wm” şi salariu există o legătură foarte puternic ă. II. Metoda simplificată r xy =
∑x y −∑x ∑ y n ∑ x 2 − ( ∑ x ) 2 n ∑ y 2 − ( ∑ y ) 2 n
i
i
r xy =
i
i
i
i
i
i
1 0 ⋅ 19 4 2 − 1 3 0 ⋅ 1 3 0 = 0,99 (10 ⋅ 1984 − 1698) (10 ⋅ 1910 − 16900)
Deci, între productivitatea muncii şi salariu exist ă o legătură foarte puternic ă.
2. Să se calculeze raportul de corela ţie dintre productivitatea muncii şi salariu pentru datele din problema 1. Rezolvare:
Raportul de corela ţie pentru cazul liniar (x i, yi, 1) cu formula:
a
η =
( ∑ yi )
∑ y + b∑ x y − 2 y ( ) ∑ ∑ y 2 − n i
i
i
2
n
i
i
unde:
y xi = a + bxi ;
S=
104
∑( y − y i
) = ∑ ( yi − a − bxi ) → mi nim ⇒ 2
xi
2
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
∂S =0 ∂a 2∑ ( yi − a − bxi ) ( −1) = 0 na + b∑ xi = ∑ yi ⇒ ⇒ ⇒ 2 ∂S = 0 2∑ ( yi − a − bxi ) ( − xi ) = 0 a∑ xi + b∑ xi = ∑ xi yi ∂b n ∑ xi ∑ yi ∑ xi ∑ xi2 ∑ xi yi
∑ y ∑ x x y ∑ x2 x2 ∑ y − ∑ x ∑ x y ∑ ∑ = = 2 n x n∑ x 2 − ( ∑ x ) ∑ ∑ x ∑ x2 i
a=
∆a ∆
i
i
i
i
i
i
i
i
i
i
1 30 ⋅ 1 98 4 − 13 0 ⋅ 1 9 42 ⇒ a = 1,857 2 1 0 ⋅ 1 9 8 4 − ( 1 30 )
∑y ∆ ∑x ∑x y b= = ∆ n ∑x ∑ x ∑ x2 n
i
i
b
i
i
=
i
i
⇒b =
i
i
i
a=
i
∑x y − ∑x ∑ y 2 2 n∑ x − ( ∑ x )
n
i
i
i
i
i
=
i
10 ⋅1942 −130⋅130 ⇒ 2 10 ⋅1984 − (130)
i
25,2 = 0,857 29,4
Deci, y x
i
şi η =
857 + 0, 85 857 xi = 0, 85 0, 85 857 ⋅ 130 + 0, 85 857 ⋅ 1942 −
(1302 ) 10
2
1910 −
(130 ) 10
η = 0,99 ⇒ între productivitatea muncii şi salariu exist ă o legătură foarte puternic ă.
3. Printr-un sondaj s-au colectat urm ătoarele date, considerate semnificative pentru angajaţii unei firme. Salarii (sute lei) Vechime (ani) 0 - 10 10 - 20
5-10
10-15
15-20
TOTAL
10 6
6 12
4 5
20 23
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
105
Rodica Pripoaie, Statistică economică, Note de curs
20 - 30 TOTAL
Anul I, semestrul I
4 20
15 33
8 17
27 70
Se cere: a) dacă salariile depind liniar de vechime determina ţi parametrii de regresie prin metoda simplificat ă. b) determina ţi intensitatea legăturii dintre vechime şi salariu utilizând coeficientul de corelaţie. Rezolvare:
a)
y xi = a + bxi → metoda celor mai mici p ătrate
S=
∑( y
2
i
− y xi ) =
∑ ( y − a − bx ) i
2
i
minim
→
⇒
∂S =0 2∑( yi − a − bxi ) ( −1) = 0 a∑∑nij + b∑ xi ni. = ∑ yi n. j ∂a ⇒ ⇒ ⇒ 2 y a b x x − − − = S 2 0 ∂ ( ) ( ) ∑ a∑ xi ni. + b∑ xi ni. = ∑∑ xi y j nij i i i =0 ∂b ∑ ∑ nij ∑ xi ni.
∑ x n . ∑ y n. ∑ x2 n . ∑ ∑ x y n i
i
j
i
i
j
i
i
ij
∑ y n. ∑ x n . x y n ∑ x2 n . ∑ x2 n . ∑ y n. − ∑ x n . ∑∑ x y n ∆ ∑∑ a= = = 2 ∆ n ∑ x2 n . − ( ∑ x n . ) ∑∑n ∑ x n . ∑ ∑ ∑ x n . ∑ x2 n . a
j
j
i i
i
j ij
i
ij
i
i
i
j
i i
i i
i
j
i i
ij
i
i
i
j ij
i i
i
∑∑n ∑ y n. ∆ ∑ x n . ∑∑ x y n = ∑∑n ∑∑ x y n − ∑ x n . ∑ y n. b= = 2 ∆ n ∑ x2 n . − ( ∑ x n . ) ∑∑n ∑ x n . ∑ ∑ ∑ x n . ∑ x2n . ij
b
j
j
i
j ij
i i
ij
ij
i
i i
i i
i
ij
j ij
i
i i
i
i
Pentru metoda simplificat ă vom avea: x*2 n . ∑ y* n. − ∑ x*n . ∑ ∑ x* y* n ∑ a= 2 ∑ ∑ n ∑ x*2n . − ( ∑ x*n . ) i
i
j
ij
106
j
i
i
i
i
i
i
j
ij
i
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
i i
j
j
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
n ∑ ∑ x* y* n − ∑ x*n . ∑ y* n. ∑ ∑ b= 2 *2 * n x n x n − ( ) ∑∑ ∑ . ∑ . ij
i
ij
şi
j
i
ij
i
i
i
i
j
j
i
y xi = a + bxi
Salarii Sute lei
Vechime - ani -
yi xi
0 - 10
-1
5-10
10-5
∑x y n
15-20
i
ni.
xi
*
17,5
xi ni.
xi n.
6
4
20
-1
-20
20
+6
6
12
5
23
0
0
0
0
4
15
8
27
1
27
27
+4
20 -1 -20 20 +6
33 0 0 0 0
17 1 17 17 7
70 0 -3 37 10
0
47
47
10
7,5 -1 10
12,5 0
*
j ij
j
*2
1
5 10 - 20
0 15
20 - 30
1 25
n.j * y j * y j n.j * y j n.j ∑ x* y*n i
j
ij
j
Deci,
a=
47 ⋅ ( −3) − 7 ⋅10 −211 = −0,0651 2 = 3241 70 ⋅ 47 47 − ( 7)
b=
70 ⋅10 − 7 ⋅ ( −3) 721 = 0,22246 2 = 3241 70 ⋅ 47 47 − ( 7)
y x = − 0,06 ,0651 + 0,222 ,22246xi i
b)
r xy =
∑ ∑ n ∑ ∑ x * y * n − ∑ x * n . ∑ y * n. 2 n ∑ x *2 n . − ( ∑ x * n . ) ∑ ∑ n ∑ y *2 n. − ( ∑ y * ∑ ∑ ij
ij
r xy =
i
i
i
i
70 ⋅10 1 0 − 0, 7 ( −3) 70 ⋅ 47 − ( 7 ) 2 70 ⋅ 37 − ( −3)2
j
ij
i
i
ij
=
i
j
j
j
j
j
2 n. j )
721 = 0,2492882 2892,2346
Deci, între vechime şi salariu exist ă o legătură directă, dar slab ă.
4. Calculaţi intensitatea legăturii dintre vechime şi salarii pentru datele ob ţinute prin sondajul de la problema 3 utilizând raportul de corela ţie. Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
107
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Rezolvare: a
∑ y n. * j
j
+b
∑∑ x y n * *
i
j
ij
−
( ∑ y j n. j )
2
∑∑ n
ij
η =
∑ y*2n. j
( ∑ y n. ) *
j
−
j
2
j
∑∑n
ij
Pe baza calculelor din problema 10 ⇒ 2
( −3) 22246⋅ 10 − −0, 0651⋅ ( −3) + 0, 22 70 = 2,2913286 = 0,2492863 η = 2 36,871429 ( −3) 37 − 70
Deci, între vechime şi salariu există o legătură directă, dar slabă.
5. În urma unui sondaj efectuat pe un e şantion de 10 muncitori dintr-o colectivitate generală de 100 de muncitori s-au ob ţinut datele: Date de sondaj Nr. Productivitatea muncii Salariul crt. - sute lei - sute lei 1 6 7 2 7 6 3 9 10 4 11 14 5 14 13 6 16 15 7 18 17 8 19 19 9 20 21 10 21 20 Se cere să se determine leg ătura dintre cele dou ă variabile: productivitatea muncii şi salariul utilizând metoda de corela ţie neparametric ă Spearman. Rezolvare: θ = 1 −
108
6∑ di 2 n3 − n
,
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
unde: di - diferen ţa între rangurile celor dou ă variabile n - numărul perechilor de valori corelate. Pentru determinarea rangurilor, vom ordona cresc ător în func ţie de productivitatea muncii ( x xi). Nr. Rangul după Rangul după salarii 2 di = R x − Ry d i yi) crt. productivitatea muncii ( xi) ( y 1 1 2 -1 1 2 2 1 1 1 3 3 3 0 0 4 4 5 -1 1 5 5 4 1 1 6 6 6 0 0 7 7 7 0 0 8 8 8 0 0 9 9 10 -1 1 10 10 9 1 1 TOTAL 6 i
θ = 1 −
i
6⋅6 36 = 1− = 0, 9606 3 10 − 10 99 0
Coeficientul lui Spearman având valoarea 0,9606 rezult ă că între cele dou ă variabile: productivitatea muncii şi salariul, exist ă o legătură directă şi foarte puternic ă.
6. Se cunosc urm ătoarele date: Popula ţia Judeţul - mii loc. A 775 B 625 C 869 D 347 E 482 F 725 G 1920
Produc ţia industrială - mil. USD 2875 2645 3035 2475 2377 2950 4050
Se cere să se determine leg ătura dintre cele dou ă variabile: popula ţia ( xi) şi produc ţia industrială ( y yi) utilizând metoda de corelare neparametric ă Spearman. Rezolvare: θ = 1 −
6∑ di 2 n3 − n
,
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
109
Rodica Pripoaie, Statistică economică, Note de curs
unde: di - diferen ţa între rangurile celor dou ă variabile n - numărul de valori corelate. Rangul după Rangul după variabila yi Judeţul variabila xi (prod. ind.) (populaţia) D 1 2 E 2 1 B 3 3 F 4 5 A 5 4 C 6 6 G 7 7 TOTAL
Anul I, semestrul I
di
-1 1 0 -1 1 0 0 0
2
di
1 1 0 1 1 0 0 4
6⋅ 4 24 = 1− = 0, 92857 3 7 −7 3 36 θ = 0,92857 θ = 1 −
Deoarece coeficientul lui Spearman are valoarea 0,92857 rezult ă că între cele două variabile: popula ţia şi produc ţia industrial ă există o legătură directă şi foarte puternic ă.
7. Pe baza datelor din problema 5 se cere s ă se determine coeficientul de corela ţie Kendall şi să se interpreteze rezultatul. Rezolvare: γ = +
unde:
S
1 n ( n − 1) 2
,
S = P−Q
∑p Q = ∑q P=
i
i
- numărul de ranguri superioare rangului „i” al variabilei dependente care exist ă pe coloana respectiv ă după fiecare rang; qi - numărul de ranguri inferioare rangului „i” al variabilei dependente care exist ă pe coloana respectiv ă după fiecare rang; n - num ărul perechilor de valori corelate.
pi
Vom nota cu xi - productivitatea muncii şi cu yi - salariul. 110
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Nr. Productivitatea muncii crt. - sute lei 1 2 3 4 5 6 7 8 9 10
6 7 9 11 14 16 18 19 20 21
Salariul - sute lei -
Anul I, semestrul I
Rangul după variabila
7 6 10 14 13 15 17 19 21 20 TOTAL
xi
1 2 3 4 5 6 7 8 9 10
Rangul după pi variabila yi
2 1 3 5 4 6 7 8 10 9
8 8 7 5 5 4 3 2 0 0 42
qi
1 0 0 1 0 0 0 0 1 0 3
∑ p = 42 ⇒ S = P − Q = 42 − 3 = 39 Q = ∑q = 3 P=
i
i
γ =
39
=
39 = 0,8666 5⋅9
1 ⋅ 10 (10 − 1) 2 Deoarece γ = 0,8666 înseamnă că între cele dou ă variabile: productivitatea muncii şi
salariul exist ă o legătură directă şi puternic ă.
RECOMANDĂRI BIBLIOGRAFICE • • • • •
Tudor Baron, Elena Biji şi colab. – Statistică teoretică şi economică, Ed. Didactică şi Pedagogic ă, Bucureşti, 1996 Elena-Maria Biji, Eugenia Lilea, Elisabeta Ro şca, Mihaela V ăzui – Statistică aplicată în economie – Ed. Universul Dalsi, Bucure şti, 2000 Elisabeta Jaba – Statistică, Ed. Economic ă, Editia a IV-a, Bucure şti, 2007 Ianuarie-Doru Popescu – Bazele statisticii, Ediţia a III-a revizuit ă şi completată, Ed. Funda ţiei Academice Danubius, Gala ţi, 2000 Rodica Pripoaie – Statistică Economică, Ed. Didactic ă şi Pedagogic ă, Bucureşti, 2008
TESTE DE AUTOEVALUARE Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
111
Rodica Pripoaie, Statistică economică, Note de curs
1. Se dau datele din tabelul urm ător: Număr Salarii muncitori - sute lei 4-8 8 - 12 12 - 16 16 - 20 20 - 24 Total a) b) c) d) e)
f)
f i
12 33 45 18 12 120
Anul I, semestrul I
Productivitatea muncii - sute lei 2-8 8 - 14 14 - 20 20 - 26 26 - 32 Total
Număr muncitori f i
18 25 50 15 12 120
Se cere: Determinaţi valorile centrale ale fiec ărei clase; Calculaţi media aritmetic ă prin metoda simplificat ă pentru salarii şi productivitatea muncii; Calculaţi dispersia prin metoda simplificat ă pentru cele dou ă serii de frecven ţe; Calculaţi mediana şi modul, precum şi coeficientul de asimetrie Pearson şi Fisher pentru cele două serii de frecven ţe; Determinaţi limitele între care variaz ă salariul mediu şi productivitatea muncii medie, dacă eşantionul de 120 muncitori reprezint ă 5% din colectivitatea general ă, iar probabilitatea cu care se garanteaz ă rezultatul este 0,9973 şi sondajul realizat este simplu repetat; Se dă gruparea combinat ă a salariilor şi a “Wm” în 5 grupe egale;
Productivitate 2 - 8 8 - 14 14 - 20 20 - 26 16 - 32 Total Salarii 11 17 23 29 yi 5 (sute lei) xi 4–8 0,6 8 4 12 8 – 12 1,0 10 10 10 13 33 12 – 16 1,4 11 27 7 45 16 – 20 1,8 10 8 18 20 - 24 2,2 12 12 Total 18 25 50 1,5 12 120 g) Determinaţi parametrii a şi b prin metoda celor mai mici p ătrate, varianta simplificat ă pentru y = a + bx
112
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Rezolvare:
a)
Salarii - sute lei -
f i
4–8 8 – 12 12 – 16 16 – 20 20 - 24 Total
xi
12 33 45 18 12 120
6 10 14 18 22 -
Productivitatea muncii - sute lei 2–8 8 – 14 14 – 20 20 – 26 26 - 32 Total
f i
xi
18 25 150 15 12 120
5 11 17 23 29 -
b) f i Salarii - sute lei 4–8 12 8 – 12 33 12 – 16 45 16 – 20 18 20 – 24 12 Total 120
6 10 14 18 22
Metoda simplificat ă: • •
xa =
pentru salarii: xa =
a
xi − a f i a
-2 -1 0 1 2 0
-24 -33 0 18 24 -15
xi −a
xi
∑
xi − a k f i
Productivitate - sute lei 2–8 8 – 14 14 – 20 20 – 26 26 - 32 Total
f i
xi −a
xi
18 25 150 15 12 120
5 11 16 23 29
a
xi −a f i a
-2 -1 0 1 2 0
-36 -25 0 15 24 -22
k+a
f i
∑
−15
⋅ 4 + 14 = 13, 5 mil. lei; 120 −22 pentru W m: xa = ⋅ 6 + 16 = 14, 59 mil. lei 120
Salarii - sute lei 4–8 8 – 12 12 – 16 16 – 20 20 – 24 Total
f i
xi
12 33 45 18 12 120
6 10 14 18 22
Productivitate - sute lei 4–8 8 – 12
2
xi − a
f i
xi
18 25
5 11
2
a
xi − a a
xi − a a f i
-2 -1 0 1 2 0
4 1 0 1 4 10
48 33 0 18 48 147
xi −a
2
2
a
xi − a a
xi −a a f i
-2 -1
4 1
72 25
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
113
Rodica Pripoaie, Statistică economică, Note de curs
12 – 16 16 – 20 20 – 24 Total Metoda simplificat ă: σ 2 =
Anul I, semestrul I
150 15 12 120
xi − a 2 ∑ k f i
∑ f
17 23 29
0 1 2 0
(
)
⋅ k 2 − xa − a
0 1 4 10
0 15 48 160
2
i
•
147 2 2 ⋅ ( 4) − (13, 5 − 14) = 19, 35 ⇒ σ = σ 2 ≅ 4, 40 ; 120 160 160 pentru W m: σ 2 = ⋅ ( 6)2 −(1, 49 −14)2 = 47,19 ⇒ σ = σ 2 = 6,87 . 120 120
pentru salarii: σ 2 =
•
Indicatorul ∑ f i Me = x + Me
− f cm −1
2
f Me
⋅k
∆ 1 M =x + 0 M 0 ∆ +∆ ⋅ k 1 2
Salarii
M = 13,23
0
xa − M 0 C = aSP σ C = aSF
Productivitate 120 − 43 Me = 14 + 2 ⋅ 6 = 16 16, 04 50 50 − 25 ⋅6 M 0 =14+ (50 − 25) +( 50 −15) M 0 =16,5
120 − 45 ⋅ 4 = 13 Me = 12 + 2 13, 3 45 45 − 33 ⋅4 M = 12 + 0 ( 45 − 33) + ( 45 − 18)
C = aSP
3( xa − M e )
C = aSF
σ
13, 5 − 13, 23 23 = 0,06 4,40
= C aSP
3(13,5 −13,3) = 0,136 4,40
= C aSF aSF
14,9 − 16,5 = −0,23 6,87
3(14,9 −16,04 ,047) 6,87
e. Sondaj simplu repetat.
Indicatorul
Salarii
19,35 = 0,40 120 n ∆ x = t µ , t = 3 ∆ x = 3 ⋅ 0, 40 = 1, 2
µ =
Deci,
σ 02
µ =
x − ∆ x ≤ S 0 ≤ x + ∆ x
Productivitatea muncii 47.19 = 0.63 µ = 120 ∆ x = 3 ⋅ 0, 63 = 1, 89
x − ∆ x ≤ W m 0 ≤ x + ∆ x
12.3 ≤ S 0 p 14.7 sutelei 13.01 ≤ W m 0 p 16.14 sutelei
f. 114
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
= −0,498
Rodica Pripoaie, Statistică economică, Note de curs
Productivitate - sute lei Salarii (sute lei)
xi
4–8 8 – 12 12 – 16 16 – 20 20 – 24 Total
6 10 14 18 22
Anul I, semestrul I
2-8
8 - 14
14 - 20
20 - 26
26 - 32
5
11
17
23
29
8 10 18
4 10 11 25
13 27 10 50
7 8 1,5
12 12
yi
Total
12 33 45 18 12 120
Pentru determinarea parametrilor a, b se rezolv ă sistemul de ecua ţii normale: a ∑ ∑ nij + b∑ xi*ni = ∑ yj * nj * 2* * a ∑ xi ni. + b∑ xi ni. = ∑ ∑ xi y j * nij
2- 8 Productivitate 8 14 Salarii yi 5 11 (sute lei) xi 6 8 4 4–8 10 10 10 8– 12 14 - 11 12 – 16 18 - 16 – 20 22 - 20 – 24 Total nj 18 25 * y j -2 -1 * y j n. j -25 36
∑ x * y * n i
j
ij
14 - 20 - 26 20 26 32 17 23 29
- - - 12 12 13 - 33 27 7 - 45 10 8 - 18 - - 12 12 50 1,5 12 120 0 1 2 0 0
52 18 0
120 a + ( −15 ) b = −22 120 a −15b = −22 ⇒ −15a + 147b = 126 −15a + 147b = 126
Total xi* xi*ni . -2 -1 0 1 2 -
-24 -33 0 18 24 -15 -15
xi ni .
∑ x* y * n
48 33 0 18 48 147
40 30 0 8 48 126
*2
i
j
ij
15 24 -22 8
48 126
120 −15 −22 −15 147 126
−22 −15 a=
∆a ∆
=
126 147 −22 ⋅147 + 15 ⋅126 −1344 = = = − 0,077 120 −15 120 ⋅147 −15 2 17415 −15 147
120 ∆b −15 b= = 120 ∆ −15
−22
126 120 ⋅126 −15 ⋅ 22 = = 0,849 −15 120 ⋅147 −15 2 147
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
115
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Deci, y = - 0,077 + 0,849x
TEMĂ DE CONTROL 1. Se dă ecuaţia de gradul doi: Y = a + bx + cx 2. Determina ţi parametrii a, b, c prin metoda celor mai mici p ătrate în mod direct şi apoi simplificat pentru urm ătoarele date. Salarii sute lei Vechime yi ani xi 0-2,5 1,25 2,5-5 3,75 5-7,5 6,25 7,5-10 8,75 10-12,5 11,2 5 12,5-15 13,7 5 15-17,5 16,2 5 TOTAL
4-6 6-8 8-10 10-12
12-14
14-16 16-18
8
7
9
11
13
15
17
TOTAL
3 2 -
4 5 6 -
7 3 7
2 4
2
-
-
3 6 12 11 13
-
-
-
-
5
7
8
20
-
-
-
-
-
4
6
10
5
15
17
6
7
11
14
75
2. În urma unui sondaj s-au ob ţinut urm ătoarele date: Nr. crt. 1 2 3 4 5 6 7 8 9 10 116
Vechime - ani -
Salariul brut - sute lei-
xi
yi
7 3 10 15 4 2 27 35 1 8
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
12 11 15 14 12 13 17 22 9 18
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Se cere să se m ăsoare legătura dintre vechime şi salarii folosind metoda coeficientului de corelaţie, prin metoda direct ă şi prin metoda simplificat ă.
3. Printr-un sondaj s-au ob ţinut urm ătoarele date: Salarii brute - sute lei Productivitatea muncii - sute lei5 - 10 10 - 15 15 - 20 TOTAL
5 - 10
10 - 15
15 - 20
TOTA L
8 4 2 14
4 6 7 17
2 5 2 9
14 15 11 40
Se cere să se determine intensitatea leg ăturii dintre productivitate şi salarii utilizând coeficientul de corela ţie.
4. Pe baza datelor din problema 2 determina ţi coeficientul de corela ţie neparametric ă Spearman, Kendall şi Feschner. 5. Se cunosc urm ătoarele date: Judeţul A B C D E F G H I J
Populaţia - mii loc. -
Producţia industrială - mil. lei -
xi
yi
257 832 493 580 690 785 325 375 925 635
1985 2835 2350 2400 2500 2620 2100 2970 2350 2425
Se cere să se determine leg ătura dintre cele dou ă variabile: popula ţia ( xi) şi produc ţia industrială ( y yi) utilizând metoda de corela ţie neparametric ă Spearman.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
117
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Modulul V ANALIZA SERIILOR CRONOLOGICE Lecţia 1. Serii cronologice Lecţia 2. Analiza statistică a sezonalităţii seriilor cronologice Lecţia 3. Indicii Obiectivele specifice modulului: Introducerea no ţiunii de serie cronologic ă. Introducerea no ţiunii de modific ări specifice seriilor cronologice Prezentarea metodelor de ajustare a seriior cronologice Prezentarea metodei extrapol ării seriilor cronologice Introducerea no ţiunii de indice Prezentarea metodelor de descompunere a unui fenomen complex – metoda substituţiei în lanţ şi a metodei influen ţelor izolate ( a restului nedescompus) Rezultatele aşteptate: Însuşirea modului de calcul a unui indice Aprofundarea metodei extrapol ării seriilor cronologice. Învăţarea modului de descompunere a unui fenomen complex prin metoda substituţiei în lanţ şi a metodei influen ţelor izolate ( a restului nedescompus) Competenţe dobândite ca urmare a parcurgerii modulului: Deprinderea folosirii corecte a conceptului de serie cronologic ă. Deprinderea folosirii corecte a indicilor. Folosirea corect ă a metodelor de extrapolare a seriilor cronologice, precum şi a celor de descompunere a unui fenomen complex. Timpul mediu necesar pentru asimilarea modulului : 4 ore
118
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Lecţia 1 SERII CRONOLOGICE Pasul 1 – Noţiuni introductive Definiţie O serie temporal ă (cronologică) este constituit ă dintr-o multitudine de observ ări efectuate la anumite momente determinate, în general la intervale de timp egale. Exemple de serii temporale sunt: produc ţia anuală totală de oţel a României României pentru un num ăr de ani, temperatura orar ă anunţată de institutul meteorologic al unui ora ş. Matematic, o serie temporală este definit ă de valorile y1 , y2, ..., ale unei variabile y la momentele t 1 , t 2, ... , t n. Deci, y este funcţie de t şi putem scrie: y = F (t).
Seriile temporale se pot reprezenta într-un sistem de coordonate ortogonale în care pe axa Ox se reprezint ă timpul, iar pe Oy valorile variabilei, ca în figura
Reprezentarea grafică a unei serii temporale Pasul 2 - Modificările caracteristice seriilor temporale Putem considera graficul unei serii temporale ca fiind cel din fig.5.1; acesta este descris de un punct care se deplaseaz ă în func ţie de timp. Pentru multe cazuri, este analog cu particula fizic ă care se deplaseaz ă sub acţiunea unei for ţe fizice. În acest caz for ţa fizică este reprezentat ă de o combina ţie de for ţe economice, sociologice, psihologice, etc. Seriile temporale au anumite modificări caracteristice sau variaţii caracteristice. Analiza acestor modificări este deosebit de important ă îndeosebi pentru anticiparea modificărilor viitoare ale anumitor fenomene şi procese social-economice.
Clasificarea modificărilor seriilor temporale Modific ările caracteristice seriilor temporale pot fi clasificate în patru grupe principale, şi anume: 119 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
1. Modificări seculare sau pe termen lung. se referă la direcţia general ă pe care graficul unei serii temporale o are pe parcursul unui interval mare de timp. În graficul precedent aceast ă modificare secular ă denumită şi variaţie seculară sau trend, este indicat ă de curba trendului . Pentru orice serie temporal ă se poate aproxima o dreaptă a trendului. 2. Modificări ciclice sau variaţii ciclice: se referă la oscilaţii pe termen lung în apropierea dreptei sau curbei trendului. Aceste cicluri, cum sunt numite, pot fi şi periodice, adică au aceeaşi evoluţie la intervale egale de timp. În afaceri şi în activitatea economic ă, modificările sunt considerate ciclice dac ă se repetă după un interval de timp mai mare de un an. Un important exemplu de modific ări ciclice sunt considerate ciclurile activit ăţii economice, reprezentate de intervale de prosperitate (boom economic), recesiune, depresiune şi relansare economic ă. 3. Modificări sezoniere sau variaţii sezoniere: se referă la seriile temporale care au o evoluţia identică sau aproape identic ă pentru lunile calendaristice ale corespondente unor ani succesivi. Deoarece modific ările sezoniere în general se refer ă la o periodicitate anual ă, în teoria economic ă şi în afaceri totu şi conceptul poate fi extins considerând periodicitatea ca fiind orice interval de timp, precum: ziua, ora, s ăptămâna, etc. 4. Modificări neregulate sau întâmpl ătoare: se referă la modificări sporadice ale seriei temporale care se produc datorit ă unor evenimente întâmpl ătoare cum sunt: inunda ţiile, grevele, alegerile, etc. În general se consider ă că aceste evenimente produc varia ţii care durează doar un scurt timp dar totu şi pot fi atât de puternice încât s ă cauzeze noi modific ări ciclice sau de alt gen. Pasul 3 - Analiza seriilor s eriilor temporale (cronologice) Definiţii Prin serie cronologică se înţelege o serie statistic ă care caracterizeaz ă schimbarea unui fenomen în timp. Ca orice serie statistic ă, seria cronologic ă se compune din 2 şiruri: primul arat ă timpul (intervalul sau momentul); al doilea fenomenul studiat. Seria cronologic ă se mai nume şte şi serie de timp sau serie dinamică. În timp, seriile cronologice pot înregistra schimbări ascendente sau descendente. Metode de analiz ă a seriilor cronologice Seria cronologic ă prezintă în mod sistematic date cu privire la evolu ţia proceselor economice, la dezvoltarea vie ţii sociale, politice, culturale, etc. O metod ă simplă şi eficientă, de analiză prealabilă a seriei cronologice este reprezentarea grafică a seriei. Pentru determinarea sensului şi amplorii aspectului dinamic al fenomenelor social-economice. Cronograma este reprezentarea grafic ă tipică a seriei cronologice: - se mai nume şte historiogram ă; 120
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
- se execut ă într-un sistem de axe rectangulare, de obicei în cadranul 1 al acestuia; pe abscisă se reprezint ă timpul prin marcarea momentelor pentru seriile de momente sau a intervalelor în cazul seriei de intervale, iar pe axa ordonat ă se reprezintă termenii seriei. Dacă se urmăreşte evoluţia mai multor indicatori şi între m ărimile acestora exist ă diferenţe pronun ţate ceea ce îngreuneaz ă reprezentarea grafic ă se recurge la scara logaritmic ă. Alte forme de reprezentare grafic ă a seriei cronologice sunt: diagramele polare şi radiale. Diagramele polare sau diagramele radiale sunt folosite pentru reprezentarea seriilor cronologice afectate de varia ţii sezoniere ciclice. Aceast ă diagramă se construie şte de obicei cu ajutorul re ţelelor radiale. Circumferin ţa cercului serve şte pentru notarea ciclurilor periodice ale timpului (trimestre sau luni ale anului, zile ale s ăptămânii, ore ale zilei, etc.), iar raza serveşte pentru reprezentarea termenilor seriei. 10.2.2. Indicatorii seriilor cronologice Analiza statistică a seriei cronologice se realizează cu sistem de indicatori care caracterizează relaţiile cantitative dintre termenii seriei pe o anumit ă perioadă sau pe toat ă perioada la care se refer ă aceşti termeni. În urma unei prelucr ări simple ob ţinem trei tipuri de indicatori: absoluţi, relativi şi medii care permit caracterizarea din punct de vedere statistic a mişcărilor şi schimbărilor ce au avut loc în via ţa economic ă şi socială precum şi determinarea tendinţelor obiective de dezvoltare a acestora.
Clasificare şi relaţii de calcul a) Indicatorul absolut măsoară nivelul volumului seriei precum şi volumul sporului. Nivelul absolut al seriei este îns ăşi valoarea absolut ă a fiecărui termen notat cu y1 , y2 , ..., yn. Volumul absolut al unei serii de intervale se poate determina prin însumarea termenilor ei: y1 + y2 + L + yn = ∑ yi . Sporul absolut sau creşterea absolută poate fi calculat fie ca o diferen ţă dintre oricare din termeni şi termenul ini ţial al seriei considerat ca baz ă: ∆ y = yn − y0 . n
0
El poate fi determinat şi sub form ă de lanţ calculând diferen ţa între 2 termeni consecutivi ai seriei: ∆ y = yn − yn−1 . n
∑∆
yn
n−1
Pentru seriile de interval se poate calcula şi volumul sporului fie ca bază în lanţ = ∆ y adunând sporurile ∆ y = yn − yn −1 , fie ca o diferen ţă dintre ultimul termen şi
n−1
n
0
n
n−1
termenul ini ţial considerat ca baz ă. b) Indicatorul relativ, în general, rezult ă din aceiaşi termeni ca şi indicatorii modificărilor absolute; deosebirea const ă în aceea c ă în acest caz compara ţia se face prin raportarea termenului comparat la termenul baz ă de comparaţie.
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
121
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Aceşti indicatori ai modific ării relative în limbajul statistic îi întâlnim sub denumirea de indici dinamici sau simplu, indici. Îi not ăm simbolic cu I. În analiza statistic ă a seriilor cronologice se folosesc ca indicatori relativi: 1. ritmul (indicele de cre ştere sau rata de creştere) 2. ritmul sporului 3. valoarea absolut ă a unui procent de cre ştere 1. Ritmul se poate calcula, de asemeni, în func ţie de scopul urm ărit ca indice cu baz ă fixă prin raportarea fiec ărui termen al seriei la un termen considerat ca baz ă, şi care este de obicei termenul ini ţial al seriei. I n = 0
yn y0
Se mai poate determina ca indice în lan ţ, prin raportarea fiec ărui termen al seriei la termenul precedent: I n
n −1
=
yn yn−1
Indicele de cre ştere de obicei e în procente (rela ţiile se înmulţesc cu 100). Între şirul de indici în lan ţ există relaţii de trecere reciprocă. Prin înmul ţirea indicilor în lan ţ ai tuturor perioadelor precedente pân ă la termenul „ n” se ob ţin indici cu baz ă fixă ai acestor termeni. Prin împărţirea succesivă a indicilor cu baz ă fixă se obţin indici în lan ţ. Aceste relaţii între sporuri şi între ritmuri ne permit s ă reconstituim valorile absolute ale seriei cronologice când cunoaştem valoarea absolut ă dintr-un an şi sporul sau indicii cu baz ă fixă sau în lanţ. 2. Ritmul sporului notat cu R se obţine prin raportarea volumului sporului la termenul considerat ca baz ă: R =
∆n
0
y0
=
yn − y0 y0
=
yn y0
−1
Ritmul sporului exprim ă câte unităţi de spor revin la o unitate de baz ă. Ritmul sporului se poate calcula şi în lanţ: R =
∆ yn
n−1
yn −1
=
yn − yn −1 yn −1
=
yn yn −1
−1
Ritmul sporului ofer ă informaţii similare cu indicele de dinamic ă; în practic ă se utilizează acela care ofer ă posibilit ăţi de percepere, în ţelegere şi interpretare mai bune ale informaţiilor. 3. Valoarea absolută a unui procent de cre ştere se determină ca raport dintre indicatorul modific ării absolute şi ritmul sporului. 122
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
A =
∆ R
Anul I, semestrul I
- se poate determina cu baz ă fixă sau cu baz ă în lanţ:
- cu baz ă fixă: An
= 0
- cu baz ă în lanţ: An
yn − y0 y y = 0 , An = 0 yn − y0 0 100 100 ⋅ 100 y0
= n −1
yn − yn −1 y = n −1 yn − yn−1 ⋅100 100 yn−1
Utilizarea acestui indicator arat ă aspecte noi ale tendin ţei de evolu ţie neevidenţiate prin indicatorii absolu ţi nici prin cei relativi. Astfel, procentul de cre ştere de la un termen la altul, poate avea o tendin ţă de diminuare îns ă valoarea unui procent de modificare s ă înregistreze în acelaşi timp o tendin ţă opusă. Aceasta confirm ă încă o dată necesitatea utilizării simultane şi combinat ă atât a datelor absolute cât şi a celor relative evitându-se astfel unilateralitatea analizei şi asigurându-se abordarea sistemic ă multilaterală a fenomenului studiat. Alegerea bazei de raportare e important ă deoarece de m ărimea acesteia depinde valoarea indicatorilor analitici rezulta ţi din compara ţii. Pentru a evita arbitrariul, posibilit ăţile de manipulare şi folosirea pe aceast ă cale a datelor privitoare la o istorie parcurs ă se recomandă ca alegerea bazei de compara ţie să se fundamenteze pe o argumentare solid ă, raţională, ştiinţifică. Astfel, dac ă prezintă interes evidenţierea regularit ăţii dezvoltării de la un termen la altul se alege baza în lan ţ, iar dacă se doreşte determinarea liniei generale de dezvoltare se stabile şte o baz ă fixă, comun ă pentru toţi termenii compara ţi. Baza de raportare ăşurării procesului care se poate considera omogen trebuie să reprezinte un termen tipic al desf ăş cu termenii compara ţi şi care nu e afectat de perturba ţii majore sau de o conjunctur ă economică anormală. c) Indicatorii medii folosiţi în analiza statistic ă a seriei cronologice sunt: 1. nivelul mediu 2. sporul absolut mediu 3. ritmul mediu de cre ştere 4. ritmul mediu al sporului. Aceşti indicatori se calculeaz ă din indicatorii absolu ţi şi relativi, dup ă formula calitativă generală a mediei, care însumeaz ă repartizarea valorii sintetizate a termenilor printro operaţiune invers ă celei prin care s-a f ăcut sintetizarea pe fiecare termen inclus în analiz ă. 1. Nivelul mediu sau valoarea medie a termenilor seriei cronologice are sens dac ă termenii sunt omogeni din punct de vedere statistic (f ără oscilaţii exagerate fa ţă de medie). Se calculează diferit pentru seriile de intervale şi seriile de momente: - pentru seriile de intervale se folose şte formula mediei aritmetice
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
y =
∑ y ; n
123
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
- pentru seriile de momente se utilizeaz ă formula mediei cronologice simple, dac ă intervalele dintre momente sunt egale sau media cronologic ă ponderată când distanţa dintre ele este neegal ă. 2. Sporul absolut mediu notat cu ∆ se calculează prin raportarea sporurilor absolute cu bază fixă şi în lanţ, la numărul termenilor seriei minus unul; cele 2 sporuri medii sunt egale deoarece între sporurile cu baz ă în lanţ şi cele cu baz ă fixă există relaţia: suma sporurilor cu bază în lanţ este egală cu sporul cu baz ă fixă a ultimului termen. 3. Indicele sau ritmul mediu de cre ştere e media celor ( n-1) indici cu baza în lan ţ calculaţi. Pentru calcularea acestui indice se folose şte formula mediei geometrice; ritmul mediu de cre ştere: I = n−1
yn y0
.
4. Ritmul mediu al sporului R exprimă în procente diferen ţa dintre: - indicele sporului - 1 atunci când este exprimat în coeficien ţi - R = I − 1 ; - indicele sporului - 100 când e exprimat în procente - R = I − 100 .
Pasul 4 - Descompunerea seriilor cronologice Definiţii Analiza statistică a seriilor cronologice nu se limiteaz ă numai la calcularea indicatorilor absolu ţi, relativi şi medii. Analiza statistic ă e capabilă să adâncească informaţiile obţinute pentru elaborarea unor previziuni şi prognoze pe diferite termene sau orizonturi de timp, pe termen scurt, mediu sau lung. În acest scop se procedeaz ă la extrapolarea seriei cronologice adic ă la obţinerea unor valori care prelungesc seria dincolo de limitele pentru care dispunem de date certe, de date empirice. Reprezentarea grafic ă realizată după elucidarea problemei referitoare la omogenitatea şi probabilitatea datelor ne va facilita constatarea existenţei unor abateri de la ceea ce constituie tendin ţa centrală, linia general ă a fenomenului studiat. În afar ă de tendinţa centrală, seriile cronologice suficient de lungi cuprind şi alte tipuri de mişcări care explică abaterile (perturba ţiile ce apar între aceste serii). Componenţă Termenii unei serii cronologice se descompun de obicei în urm ătoarele componente: 1. tendinţa centrală (T ) de dezvoltare pe o durată mai lungă sau trend, şi arată direcţia fundamental ă a mişcării. 2. oscilaţiile sezoniere (S) create de factori naturali (anotimp, luni) fie de factori sociali (sărbători, concedii) sunt de scurt ă durată. I ) numite şi reziduale care apar ca rezultat al unor 3. oscilaţiile întâmplătoare ( I factori întâmpl ători (calamit ăţi naturale, măsuri excepţionale cu caracter politic, economic, administrativ) 124
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
4. variaţiile ciclice (C ) sunt proprii procesului reproduc ţiei capitaliste De obicei oscila ţiile întâmplătoare şi cele ciclice sunt analizate împreun ă.
Pasul 5 - Metode de ajustare a seriilor cronologice Aceste metode sunt utilizate în dou ă scopuri: - fie pentru determinarea tendin tendin ţei centrale; - fie proced ăm la extrapolarea tendin ţei centrale, adic ă la prelungirea valorii calculate dincolo de ultima valoare absolut ă sau empirică.
Clasificare Ajustarea seriei cronologice se realizeaz ă prin următoarele trei grupe de metode: 1. grafice; 2. mecanice ; 3. analitice. 1. Metodele grafice sunt mai pu ţin riguroase în trasarea liniei generale a tendin ţei centrale dar nu pot fi neglijate fiind preliminare pentru folosirea metodei analitice, întrucât oferă o indica ţie asupra func ţiei matematice care corespunde cel mai bine valorilor empirice ale seriei cronologice. Reprezentarea grafic ă se poate realiza sub forma unei cronograme, numită şi historiogramă sau prin diagrame polare şi radiale. 2. Metodele mecanice cele mai cunoscute sunt: a) metoda sporului mediu b) metoda indicelui (ritmului) mediu c) procedeul mediilor mobile. a) Metoda sporului mediu este cea mai simpl ă metodă mecanică de ajustare. Calculăm sporul absolut ∆ , prin sc ăderea primului termen al seriei ( y1) din ultimul termen ( y yn), împărţim apoi sporul absolut astfel ob ţinut la numărul anilor la care se refer ă seria cronologică, mai puţin unu şi obţinem sporul mediu, astfel: ∆ y =
yn − y1 n −1
,
unde: yn - nivelul fenomenului y în ultimul an de istorie; k - orizontul de prognoz ă; y1 - nivelul fenomenului y în primul an; n - numărul de ani istorie. Adăugând sporul mediu la primul termen al seriei şi ob ţinem valoarea calculat ă pentru anul al II-lea şi în continuare proced ăm la fel pentru anii urm ători. Termenii ajusta ţi formează o progresie aritmetic ă cu raţia ∆ . Formula corespunz ătoare metodei sporului mediu este: f ( t ) = y0 + ∆ ⋅ t
unde: f - tendinţa centrală; Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
125
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
y0 - primul termen al seriei; ∆ - sporul mediu.
Pentru t = 0 → f ( t ) = y0 ; t = n → f ( t ) = yn . Prognoza fenomenului respectiv pentru un orizont de prognoz ă k se realizează pe baza relaţiei: yk* = yn + k ⋅ ∆y
unde: yn - nivelul fenomenului y în ultimul an de evolu ţie; k - orizontul de prognoz ă; n - numărul de ani considera ţi în cadrul analizei. Deficienţa esenţială a acestei metode const ă în faptul c ă tendinţa centrală este determinată exclusiv din valorile primului şi ultimului termen al seriei, influen ţa termenilor intermediari fiind absent ă. b) Metoda indicelui (ritmului) mediu - ia în calcul termenul ini ţial al seriei ( y0) şi ritmul mediu aplicându-se formula: k
( ) , unde k = orizontul de prognoz ă.
f ( t ) = y0 ⋅ It −1
În acest caz termenii extremi se unesc printr-o curb ă exponenţială, iar termenii ajusta ţi intermediari formeaz ă o progresie geometric ă cu raţia I . c) Procedeul mediilor mobile - se mai nume şte şi metoda mediei glisante sau alunecătoare. Pornind de la caracterul mediei aritmetice, de compensare a erorilor, procedeul mediilor mobile presupune substituirea termenilor reali ai seriei cu medii calculate succesiv din anumi ţi termeni ai seriei; cu cât num ărul de termeni din care se calculeaz ă media mobil ă e mai mare cu atât ajustarea e mai pronun ţată; mediile mobile se calculeaz ă din 2, 3 sau mai mulţi termeni ai seriei, num ărul acestora fiind stabilit în func ţie de periodicitatea oscila ţiilor pe care le prezint ă seria. Numărul termenilor cu care se formeaz ă media e de obicei impar. Pentru a se putea asocia cu nr. egal de termeni anteriori sau posteriori celui central. Dac ă, totuşi în calcule se introduce un num ăr par de termeni (2 n), media se va plasa în punctul
n +1
2
de pe un interval
luat în calcul. O tr ăsătură ce avantajeaz ă procedeul mediilor mobile fa ţă de alte metode const ă în flexibilitatea ei, în posibilitatea utiliz ării f ără ipoteze prealabile rigide care foarte rar pot fi îndeplinite în practic ă. 3) Aplicarea metodei analitice de ajustare constă în următoarele: • alegerea unei func ţii (ecuaţie) care s ă exprime cât mai bine fenomenul cercetat şi să fie în concordan ţă cu datele reale ale seriei cronologice; 126
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
• folosirea metodei celor mai mici p ătrate pentru g ăsirea valorilor calculate corespunzătoare celor empirice astfel încât suma p ătratelor diferen ţelor dintre valorile reale şi
cele calculate ( yi − y x ) să fie minimă; i
• valorile calculate care satisfac postulatul de mai sus permit g ăsirea liniei tendin ţei
centrale. Recurgem la metoda celor mai mici p ătrate din 3 motive: - ne ajută să găsim valorile calculate fie c ă am ales pentru ajustarea valorilor reale o funcţie liniară, fie c ă funcţia aleasă e curbilinie; - ne reaminte şte conceptul abaterii medii p ătratice, a c ărei însemnătate am subliniat-o; - linia sau curba pe care o ob ţinem prin minimizarea sumei p ătratelor diferen ţelor, ne dă o ajustare mai bun ă decât o oricare alt ă linie sau curb ă; de exemplu cea ob ţinută prin minimizarea sumei valorilor absolute ale abaterilor. Pentru alegerea ecuaţiei ce urmează a fi folosită pentru ajustarea, seriei cronologice se pot lua în considerare dup ă caz, ecua ţia liniară, a parabolei, a hiperbolei, a func ţiei exponen ţiale sau a unui polinom de un grad oarecare. În cazul fenomenelor economice cel mai des î şi găseşte aplicabilitatea ecua ţia liniară. Astfel, dacă se constată că, modificarea absolut ă, de obicei sporul de la un termen la altul (adică sporul cu baza în lan ţ) este constant sau aproximativ constant, modelul e linia dreaptă şi ecuaţia: y x = a + bxi . Acest model corespunde la un model de evolu ţie în progresie i
aritmetică cu raţia egală cu coeficientul unghiular b. Coeficientul b este viteza de schimbare a lui y x când xi se schimbă cu o unitate. Când viteza de varia ţie (sporurile cu baza în lan ţ) i
alcătuiesc aproximativ o linie dreapt ă şi acceleraţia evoluţiei (diferenţele absolute de ordinul 2 numite şi sporuri ale sporurilor) sunt aproximativ constante, ca model de ajustare se recomandă parabola de gradul II: y x = a + bxi + cxi2 . Linia definit ă a parabolei de gradul II are i
un punct de inflexiune, o valoare maxim ă sau minim ă. Dacă tendinţa centrală are mai multe puncte de inflexiune atunci pentru caracterizarea ei se poate utiliza o parabol ă de grad superior. Gradul parabolei ce se alege ca model se stabile şte prin metoda diferenţelor succesive. Relativa stabilitate a acestora indic ă gradul parabolei ce poate fi aleas ă ca model de tendinţă centrală. În situa ţia în care, între termenii seriei cronologice se înregistreaz ă o creştere relativă aproximativ constant ă, deci dac ă se poate admite c ă termenii cresc aproximativ în progresie geometric ă, ca model de ajustare se utilizeaz ă curba exponen ţială: x y x = a ⋅ b , b este aproximativ egal cu indicele mediu de cre ştere. i
i
Estimarea parametrilor modelului tendin ţei de evolu ţie se face cu metoda celor mai mici pătrate, în modelele de evolu ţie, în locul variabilei exogene (independente) apare variabila timpului ( x). Valorile variabilei timp pot fi intervale sau momente de timp, dup ă cum seria cronologic ă ajustată e o serie de intervale sau de momente. Întrucât timpul e o mărime care statistic se m ăsoară cu ajutorul scalei de intervale al c ărei specific este c ă punctul 127 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
de origine (punctul zero al scalei) şi unitatea de m ăsură a variaţiei timp se aleg convenabil în mod arbitrar; la rezolvarea sistemului de ecua ţii normale ce se ob ţin prin aplicarea metodei celor mai mici p ătrate se face o simplificare esen ţială prin aceea c ă valorile lui x se stabilesc astfel încât: ∑ xi = 0 . Dacă seria este alc ătuită dintr-un num ăr impar de termeni se alege ca origine x = 0 termenul median, restul fiind plasa ţi simetric fa ţă de x = 0, se noteaz ă cu - 1, + 1, - 2, + 2, ... etc. Dacă seria e format ă dintr-un num ăr par de termeni, termenii centrali se noteaz ă cu „- 1” şi „+ 1” şi în continuare fiec ărei valori reale de timp i se atribuie tot la distan ţe de câte 2 unităţi, valori conven ţionale de timp. O altă metodă posibilă, utilizată uneori, se face prin atribuirea termenilor centrali a valorilor „- 0,5”, „+ 0,5” şi în mod simetric urm ătorii „-1,5”; „+ 1,5”, îns ă aici apar în calculele pregătitoare, zecimalele. Cu aceste soluţii vom avea sistemul de ecua ţii normale, concretizat pe baza expresiei de calcul a parametrilor regresiei liniare: na + b∑ xi = ∑ yi , dar 2 a ∑ xi + b∑ xi = ∑ xi yi ∑ yi a= n na = y ∑ xi = 0 ⇒ b∑ x∑2 = i∑ x y ⇒ ∑ xi yi i i i b = ∑ xi 2
unde: a - indic ă nivelul mediu al seriei cronologice; b - coeficientul unghiular, viteza de schimbare a lui y când x se schimbă cu o unitate. În cazul modelului de ajutare a parabolei estimarea parametrilor a, b şi c se efectuează cu sistemul ecua ţii normale. na + b∑ x + c∑ x2 = ∑ yi 2 3 a ∑ x + b∑ x + c ∑ x = ∑ xi yi a x 2 + b x3 + c x 4 = x 2 y ∑ ∑ ∑i i ∑ ∑ xi = 0 (prin sistemul de simplificare f ăcut) 3 x = 0 ∑ i na + c∑ xi 2 = ∑ yi Obţinem: b∑ xi 2 = ∑ xi yi a x 2 + c x 4 = x 2 y ∑i ∑i i ∑ i
Estimarea parametrilor modelului exponenţial (6) unde y = ab x se face pe baza modelului liniarizat prin logaritmare. Deci, log y = log a + xlog b. Pentru linia tendin ţei centrale panta liniei este log b, b putând fi considerat ca ritm mediu de cre ştere. 128
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Ecuaţiile normale ale formulei logaritmate a func ţiei exponen ţiale sunt: ∑ log yi = n log a + ( log b ) ∑ xi 2 ∑ xi log yi = ( log a ) ∑ xi + ( log b ) ∑ xi
Alegând
originea
astfel
∑ x = 0 ,
încât
ecuaţiile
normale
devin:
∑ log yi = n log a 2 ∑ xi log y = ( log b ) ∑ xi
Avem: log a = ∑
log yi n
; log b = ∑
xi log yi
∑ x 2
.
i
Lecţia 2 ANALIZA STATISTICĂ A SEZONALITĂŢII SERIILOR CRONOLOGICE Pasul 1- Noţiuni introductive Variaţiile sezoniere ale seriilor cronologice sunt frecvent întâlnite în practica statistic ă a oscilaţiilor periodice legate în special de modificarea anotimpurilor. Pentru a eviden ţia efectul factorului sezonier asupra termenilor seriei cronologice e necesar s ă se excludă din aceasta influen ţa celorlalte dou ă componente respectiv tendin ţa central ă şi abaterea întâmplătoare. În cazul seriilor statistice ce se pot considera sta ţionare trebuie excluse numai abaterile aleatoare. Metoda de baz ă a analizei sezonalit ăţii constă în aceea c ă după ce s-a stabilit c ă influenţa factorului sezonier se manifest ă aditiv sau multiplicativ se estimeaz ă valorile componente. Oscila ţiile sezoniere sunt considerate a avea caracterul unei serii periodice în sensul că se repetă cu o anume regularitate mai mare sau mai mic ă în fiecare perioad ă, respectiv, în fiecare an. Seriile cu adev ărat periodice exist ă numai teoretic dar varia ţiile sezoniere sunt destul de apropiate de aceste modele. La baza construirii modelului unei serii cronologice st ă presupunerea c ă ele sunt determinate de cauze sistematice şi nu întâmpl ătoare. Analiza statistic ă a variaţiilor sezoniere prezint ă un mare interes practic deoarece spre exemplu permite s ă se explice varia ţiile ce se constat ă în unele domenii ale produc ţiei, ale circulaţiei mărfurilor, ale transporturilor maritime şi fluviale, în turism sau s ă determine momentul când trebuie s ă se constituie stocuri în vederea schimb ării sezoanelor. Astfel în timp ce produc ţia de bere poate avea abateri foarte mici de la un trimestru la altul îns ă desfacerea berii prezint ă oscila ţii foarte mari cu caracter sezonier. Varia ţii periodice pot fi întâlnite şi în unele domenii ale vie ţii economice la periodicit ăţi mai mici (o lun ă sau un Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
129
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
trimestru, ca de exemplu în domeniul produc ţiei energiei electrice sunt în timpul unei săptămâni sau în timpul unei zile. În cazul analizei statistice a varia ţiilor sezoniere ca şi în cazul analizei tendin ţei centrale se urm ăreşte un dublu scop: 1. este necesar s ă se cunoască amploarea acestor varia ţii găsindu-se metode pentru măsurarea lor dar şi pentru calcularea unui indice al sezonalit ăţii valabil pentru o întreag ă serie de perioade anuale; 2. este necesar s ă se cunoasc ă evoluţia fenomenelor de mas ă cu eliminarea varia ţiilor sezoniere. Ideea care st ă la baza calcul ării variaţiilor sezoniere const ă în posibilitatea utiliz ării acestei părţi din totalul anului care este datorat ă fiecărei din cele 12 luni ale anului sau celor patru trimestre. Factorul întâmpl ător ce se poate ivi într-un anumit an este considerat ca fiind independent de cel ce s-a putut ivi în anul precedent. Aceasta înseamn ă că dacă vom însuma valorile pentru o anumit ă lună sau pentru un anumit trimestru dintr-o serie de ani, a ni, perturba ţiile cauzate de factorii întâmpl ători se vor compensa reciproc. Dac ă vom elimina apoi tendin ţa centrală ceea ce va r ămâne va fi varia ţia sezonieră care se poate exprima printr-un indice sau coeficient al sezonalit ăţii.
Pasul 2 – Metode de calcul Pentru a calcula indicele sau coeficientul sezonier exist ă mai multe metode dintre care ne vom ocupa de metoda mediilor simple şi metoda mediilor mobile . Metoda mediilor simple permite explicarea ideii care st ă la baza celorlalte metode într-o formă elementară cu toate c ă această metodă în practică se folose şte foarte pu ţin. Să presupunem c ă avem o serie de date trimestriale pe 3 ani. Vom însuma mai întâi valorile fiecărui trimestru din cei trei ani şi apoi raportând rezultatul la num ărul anilor anilor (3), vom obţine media aritmetic ă a fiecărui trimestru. Aceast ă medie reprezint ă date din care a fost eliminat ă influenţa factorilor întâmpl ători. Pentru a determina efectul sezonalit ăţii va trebui s ă eliminăm influenţa tendinţei centrale a seriei folosind în acest scop metoda celor mai mici p ătrate. Obţinem creşterea tendinţei centrale echivalent egal ă pe fiecare trimestru. Valoarea tendin ţei centrale astfel calculat ă pe fiecare trimestru o sc ădem din media trimestrial ă respectivă şi vom avea date reprezentând numai sezonalitatea. Pentru a calcula indicele sau coeficientul sezonalităţii trimestriale împ ărţim datele care reprezint ă numai sezonalitatea pentru trimestrul respectiv la media acestora la nivelul unui an. Deci, indicele sezonalit ăţii pe fiecare din cele patru trimestre se va determina separat raportând fiecare medie trimestrial ă determinată pe mai mul ţi ani pe care o not ăm cu yi la media general ă trimestrială a anilor respectivi, notat ă cu y0 ,
130
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Indicele sezonalit ăţii se determină cu ajutorul rela ţiei: I s =
yi y0
.
Metoda mediilor mobile este metoda cea mai frecvent folosit ă pentru m ăsurarea variaţiilor sezoniere. În cazul mediilor mobile trebuie s ă ţinem seama de m ărimea valului sezonier în func ţie de care se stabile şte periodicitatea termenilor pentru a nu modifica tendin ţa fenomenului cercetat. Indicele în aceast ă situaţie se determină f ăcând raportul: I s =
yi yi
unde: yi - media observat ă a trimestrului respectiv,
yi
- media centrat ă.
Pasul 3 - Probleme ale extrapolării seriilor cronologice Extrapolarea seriilor cronologice este un instrument frecvent folosit pentru elaborarea previziunilor şi prognozelor. Extrapolarea seriilor cronologice trebuie folosit ă însă cu discernământ şi prudenţă pentru viitorul apropiat. Prognoza viitorului mai îndep ărtat presupune folosirea şi a altor metode având caracter calitativ. Extrapolarea datelor statistice are la bază metodele folosite la ajustare. Trebuie s ă se ia în considerare la efectuarea extrapolării următoarele trei aspecte: 1. Cunoaşterea formei de evolu ţie a fenomenului în etapa anterioar ă pe o perioad ă lungă de timp şi divizată în subperioade dac ă din analiza statistic ă rezultă modificări ale tendinţei. 2. Identificarea factorilor care determin ă evoluţia fenomenelor studiate şi măsura în care influenţa lor se păstrează sau se modific ă în etapele ce urmeaz ă. 3. Alegerea perioadei la care se refer ă seria cronologic ă analizată astfel încât s ă fie semnificativă pentru dezvoltarea fenomenelor şi să cuprindă un num ăr suficient de termeni pentru a putea face o interpretare corect ă. În raport cu forma de dezvoltare preconizat ă se pot obţine atâtea variante câte procedee s-au folosit la ajustarea seriilor pe perioada expirat ă, dar oricare ar fi metoda aleas ă pentru determinarea tendin ţei centrale, rezultatul va suferi într-o m ăsură mai mică sau mai mare de păcatul artificialit ăţii, de aceea s-au preconizat noi metode de analiza statistic ă a seriilor cronologice capabile s ă explice simultan tendin ţele „seculare” şi oscilaţiile de tot felul astfel încât ceea ce este unitar în realitate s ă fie unitar şi în analiză. Noile metode nu mai constă în eliminări succesive ale elementelor seriei cronologice ci ele ţintesc spre descompunerea simultan ă a componentelor. Aceste metode sunt cunoscute sub denumirea de analiza spectrală a seriilor cronologice. Metoda constă în disocierea simultan ă prin procedee simple care presupun doar operaţiuni aritmetice elementare a componentelor seriilor cronologice. Una dintre cele mai Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
131
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
simple metode const ă în construirea unui tabel în care pe coloane însum ăm lunile anului, iar pe rânduri anii cuprin şi în studiu. Calcul ăm mediile coloanelor şi liniilor, respectiv, determinând ceea ce este comun unei anumite luni de-a lungul anilor şi respectiv ceea ce este comun anilor indiferent de ceea ce se întâmpl ă în lunile corespunz ătoare anilor respectivi. Am descompus astfel seria real ă în două componente printr-o singur ă operaţiune, adică în mod simultan. Tabelul îndepline şte funcţia unui dublu filtru. Filtrul vertical determină componenta sezonier ă, iar filtrul orizontal determin ă tendinţa centrală. Prin adunare sau multiplicare (modelul aditiv sau multiplicativ) aceste dou ă componente se pot constitui într-o serie calculată care la rândul ei poate fi comparat ă cu seria real ă. F ăcându-se diferen ţa dintre valorile reale şi cele calculate se ob ţine componenta întâmpl ătoare (rezidual ă); printr-o singură operaţiune de filtrare am ob ţinut deci cele trei componente ale seriei cronologice: tendinţa centrală, sezonalitatea şi componenta întâmpl ătoare.
Lecţia 3 INDICII Pasul 1 – Noţiuni introductive Cu ajutorul indicilor se poate m ăsura variaţia în timp şi spaţiu a unui fenomen complex în func ţie de modificarea factorilor de influen ţă. Indicii se calculeaz ă sub forma unui raport dintre valorile unui indicator statistic, la dou ă momente diferite, sau în dou ă spaţii diferite, ori în func ţie de o alt ă caracteristică oarecare. Indicii arat ă variaţia relativă a unor variabile sau a unei grupe de variabile în func ţie de timp, spa ţiu sau alt ă categorie specificat ă.
Pasul 2 – definiţii şi relaţii de calcul Indicele, la momentul „ t ” faţă de momentul ini ţial „0”, se determin ă pe baza rela ţiei: x
I t / 0 =
xt x0
,
unde: xt - indicatorul la momentul „t”; x0 - indicatorul în perioada de baz ă, sau
x
I 1/ 0 =
x1 x0
,
unde: x1- indicatorul în perioada curent ă; x0 - indicatorul în perioada de baz ă. În general indicii se exprim ă în procente, prin înmul ţirea în formula general ă cu 100. Indicii statistici reprezint ă un raport între nivelul unui indicator sau fenomen din dou ă unităţi diferite de timp sau de spa ţiu. 132
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Pasul 3 - Tipuri de indici. Clasificare Indicii se pot clasifica dup ă mai multe criterii, şi anume: 1. După sfera de cuprindere: a) Indici elementari (individuali) - m ăsoară variaţia unui element în timp, spa ţiu sau pe categorii, cu ajutorul rela ţiilor: i1/ x 0 =
x1 x0
;
i1/ f 0 =
f 1 f 0
;
i1/ xf 0 =
x1 f 1 x0 f 0
,
unde: x - factorul calitativ; f - factorul cantitativ; 1 - perioada curent ă; 0 - perioada de baz ă. Cei mai utilizaţi indici elementari sunt: p1
•
indicele elementar de pre ţ:
i1/ p 0 =
•
indicele elementar al produc ţiei:
i1/q 0 =
•
indicele elementar al valorii produc ţiei:
, unde p - preţul;
p0 q1
, unde q - producţia;
q0
i1/ pq0 =
p1q1 p0 q0
.
b) indicii sintetici - m ăsoară variaţia unui fenomen complex (compus din elemente ce nu pot fi comensurate nemijlocit adic ă din elemente nonaditive) în raport cu timpul, spa ţiul sau o caracteristic ă oarecare. Forma general ă a unui indice sintetic este aceea de indice agregat. Pot fi: - indici generali (totali) - construi ţi pentru o colectivitate; - indici parţiali ia li (de grup) grup) - construiţi pentru o subcolectivitate sau un grup. Un indice sintetic poate avea una din urm ătoarele forme: pentru caracteristica cantitativ ă: I 1/ z 0 = ∑
z1
•
∑ z0
z
I 1/ 0 =
•
pentru cazul aditiv;
∑ z1 x0 pentru cazul nonaditiv. ∑ z0 x0
pentru caracteristica calitativ ă x: I 1/ x 0 =
x1 x0
=
∑ x1 z1 : ∑ x0 z0 ∑ z1 ∑ z0
pentru cazul aditiv; I 1/ x 0 = ∑
zx1
∑ zx0
pentru cazul nonaditiv.
2. După perioada de compara ţie: a) indicii cu bază fixă se obţin prin raportarea nivelului unui indicator în diferite momente sau spa ţii, la aceeaşi valoare a indicatorului din perioada de baz ă: Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
133
Rodica Pripoaie, Statistică economică, Note de curs
•
individual
•
sintetic
it 0 =
it 0 =
zt z0
Anul I, semestrul I
, unde t = 1, n ;
∑ x z0 , unde ∑ x0 z0 t
t = 1, n ;
b) Indicii cu bază mobilă se obţin prin raportarea nivelului unui indicator la un anumit moment „ t ” la nivelul indicatorului la momentul „ t - 1” anterior: •
individual
•
sintetic
it t −1 =
it t −1 =
zt zt −1
, unde t = 1, n ;
∑ x z0 , . unde ∑ x 1z0 t
t = 1, n .
t −
3. După procedeul de calcul: a) Indicii agregaţi sunt indicii sintetici cei mai cunoscu ţi în care mărimile ce se compară au expresia unor agregate:
∑ z1 x0 ∑ z0 x0 ∑ z0 x1 I 1/ 0 = ∑ z0 x0 I 1/ z 0 = x
(1) sau I 1/ z 0 = ∑
z1 x1
∑ x z (3) sau I 1/ 0 = ∑ 1 1 ∑ x0 z1
z0 x1
x
(2) (4).
Ponderile indicilor agrega ţi pot fi din perioada de baz ă (rel. 1 şi 3) sau din perioada curentă (rel. 2 şi 4). b) Indicii medii care se calculeaz ă ca medie simpl ă sau ponderat ă a indicilor individuali şi pot fi: • indice mediu aritmetic se calculează ca medie aritmetic ă simplă sau ponderat ă a indicilor individuali; • indice mediu armonic se calculează ca medie armonic ă simplă sau ponderat ă a indicilor individuali; • indice mediu geometric se calculează ca medie geometric ă simplă sau ponderată a indicilor individuali; • indice median care este dat de valoarea median ă a indicilor individuali dintr-o repartiţie statistică a indicilor individuali cu valori aranjate în ordine cresc ătoare sau descrescătoare; • indice modal care este dat de valoarea modal ă a indicilor dintr-o reparti ţie statistică a indicilor individuali. 4. După modul de evidenţiere a influenţei structurii. a) Indice cu structură variabilă (indice al valorii medii) este indicele sintetic al elementelor calitative dintr-un ansamblu de elemente aditive având expresia unui raport între nivelul mediu de comparat şi nivelul mediu baz ă de comparaţie. 134 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
* x1 z1 ∑ x0 z0 ∑ x1 z1 ∑ , unde: I 1/ 0 = = = : * z z x z x0 ∑1 ∑0 ∑ 00
x1
x
z * =
z
∑ z
şi
∑ z* = 1
Dacă în indicele cu structur ă variabilă în forma agregat ă introducem indicii individuali obţinem: z1
I 1/ x 0 =
∑ x1 z1 : ∑ x0 z0 = ∑ x1 z1 : ∑ z1 = ∑ x1z1 : z0 = ∑ z1 ∑ z0 ∑ x0 z0 ∑ z0 ∑ x0 z0 i 10 z
z
x
x1 z1 ⋅ 0 ⋅ i 1 x1 z0 ⋅ 0 ⋅ i 1 ∑ ∑ x0 0 z1 0 ∑ x1 z1 ⋅ 0 = = = ∑ x0 z0 z1 ∑ x0 z0 ∑ x0 z0 z
z
i1
z
=
z0
∑ x0 z0 ⋅ i1 0 ⋅ i10 , unde = ∑ x0 z0 x
z
x
i1 = 0
x1 x0
, i 1z = 0
z1 z0
Deci, indicele cu structur ă variabilă este un indice mediu ponderat calculat pe baza produsului indicilor individuali. b) Indice cu structur ă fixă este indicele valorii medii din care s-a eliminat efectul structurii şi are urm ătoarea formă pentru cazul factorului calitativ: x ( x )
I 1/ 0
* * * x1 z1 ∑ x0 z1 ∑ x1 z1 ∑ = = : , unde ∑ z1* ∑ z1* ∑ x0 z1*
z* =
z
∑
z
şi
∑ z* = 1
c) Indice al variaţiei structurii sau indice de structură (al schimbărilor structurale) este indice al factorului structural şi are forma: x ( z )
I 1/ 0
x0 z1* ∑ x0 z0* ∑ = : ∑ z1* ∑ z0*
Între aceşti indici (a, b şi c) există relaţia: Icu struct. variabil ă = Icu structură fixă × Ide structur ă Aceşti indici se utilizeaz ă în analiza salariilor, analiza productivit ăţii, analiza pre ţului mediu, analiza ratei de mortalitate. Alte tipuri de indici sunt: - indicele simplu - acel indice în care nu intervin ponderi (de ex. o medie simpl ă de indici individuali ai pre ţurilor); Prin pondere se înţelege un coeficient de comensurare folosit la calculul unui indice sintetic pentru o colectivitate de elemente necomensurate nemijlocit, având func ţia de: • comensurare a elementelor necomensurabile Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
135
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
stabilirea importan ţei relative a fiec ărui element în colectivitatea statistic ă. - indice ponderat - indicele în care se folosesc ponderile, teoretic orice indice sintetic este un indice ponderat; - indice general (total) este indicele sintetic construit pentru o colectivitate; Exemplul 1: Indicele general al pre ţurilor cu am ănuntul. - indice de grup (par ţial) este indicele sintetic construit pentru o subcolectivitate sau un grup. Exemplul 2: Indicele de grup al pre ţurilor produselor de pe pia ţa ţărănească. - indice cu ponderi constante este indicele sintetic dintr-o serie de indici în care ponderile r ămân neschimbate indiferent de num ărul perioadelor. •
Are următoarea formă: I n
0
xw ∑ x1w0 ∑ x2 w0 , ,L , ∑ n 0 ∑ x0 w0 ∑ x0 w0 ∑ x0 w0
=
- indice cu ponderi variabile este indicele sintetic dintr-o serie de indici în care ponderile se schimb ă cu fiecare perioad ă. Are următoarea formă: I t
t −1
∑ x1w1 ∑ x2 w2 xw , ,L , ∑ n n ∑ x0 w1 ∑ x1 w2 ∑ xn−1wn
=
Pasul 4 - Indicii sintetici Indicii sintetici (generali) se calculeaz ă la nivelul unor grupe sau la nivelul colectivităţii eterogene şi sintetizează variaţia medie a indicatorului studiat. Construirea indicilor sintetici se poate realiza în urm ătoarele variante: 1. Varianta Laspeyres utilizează ponderi constante din perioada de baz ă: I1 x/ 0 =
∑ x1 f 0 = L1 , I1/ 0 = ∑ x0 f 1 = L1 , ∑ x0 f 0 0 ∑ x0 f 0 0 x
f
f
unde: x - factor de tip calitativ; f - factor de tip cantitativ; 1 - perioada curent ă; 0 - perioada de baz ă. 2. Varianta Paasche utilizează ponderi constante din perioada curent ă: I1 x/ 0 =
∑ x1 f 1 = P1 , I1/ 0 = ∑ x1 f 1 = P1 , ∑ x0 f 1 0 ∑ x1 f 0 0 x
f
unde: x - factor de tip calitativ; f - factor de tip cantitativ; 1 - perioada curent ă; 0 - perioada de baz ă. 136
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
f
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
3. Varianta Edgeworth utilizează ca pondere suma ponderilor din perioada de baz ă şi perioada curent ă. x
I1/ 0 =
∑ x1 ( f0 + f1 ) = E 1 , I1/ 0 = ∑ ( x0 + x1 ) f1 = E 1 . ∑ x0 ( f0 + f1 ) 0 ∑ f0 ( x0 + x1 ) 0 x
f
f
4. Varianta Fischer calculează indicii sintetici ca medie geometric ă a indicilor Laspeyres şi Paasche. I 1x =
Lx1 ⋅ P1x =
I 1f =
L1f ⋅ P1f =
0
0
0
0
0
0
∑ x1 f0 ⋅ ∑ x1 f1 = F1 ∑ x0 f0 ∑ x0 f1 0 ∑ x0 f1 ⋅ ∑ x1 f1 = F1 . ∑ x0 f0 ∑ x1 f0 0 x
f
Pasul 5- Metode de calcul a indicilor sintetici Calculul indicilor sintetici se poate realiza: 1. prin agregare - indicii sintetici se calculeaz ă prin însumarea m ărimilor absolute ale grupelor colectivit ăţii şi raportarea lor în perioada curent ă faţă de perioada de baz ă. Exemplul 3:
Indicele agregat al pre ţurilor , I 1 p / 0 =
∑ p1q1 ∑ p0 q1
unde:
p1q1 - valoarea produc ţiei din perioada curent ă în preţurile perioadei curente; p0q1 - valoarea produc ţiei din perioada curent ă în preţurile perioadei de baz ă. 2. ca medii ale indicilor individuali a) ca medie aritmetică ponderat ă a indicilor individuali. f
1 x0 f 0 ∑ i x f ( ) f ∑ ∑ x0 f1 1/ 0 0 0 0 I 1/ 0 = = = ∑ x0 f0 ∑ x0 f0 ∑ x0 f0 f
x
Exemplul 4:
Indicele sintetic al volumului fizic al produc ţiei calculat ca medie aritmetic ă ponderată a indicilor individuali ai volumului fizic al produc ţiei. q
1 p0 q0 ∑ i q p q0 ∑ ∑ p0 q1 1/ 0 ( 0 0 ) I 1/ 0 = = = ∑ q0 p0 ∑ q0 p0 ∑ q0 p0 q
q
unde:
q
i1
0
- indicele individual a volumului fizic al produc ţiei
p0q0 - valoarea produc ţiei din perioada de baz ă în preţurile perioadei de baz ă.
b) ca medie armonică ponderată a indicilor individuali. Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
137
Rodica Pripoaie, Statistică economică, Note de curs
I 1/ x 0 =
Anul I, semestrul I
∑ x1 f1 = ∑ x1 f1 = ∑ x1 f1 = ∑ x1 f1 x 1 1 x0 f 1 ∑ i x1 f1 ∑ x1 x1 f1 ∑ x0 x1 f1 ∑
x
1/ 0
1
x0
Exemplul 5:
Indicele sintetic al pre ţurilor calculat ca medie armonic ă a indicilor individuali ai pre ţurilor. p
I 1/ 0 =
∑ p1q1 = ∑ p1q1 = ∑ p1q1 = ∑ p1q1 p 1 1 ∑ i p1q1 ∑ p1 p1q1 ∑ p0 p1q1 ∑ p0 q1 p
1/ 0
1
p0
c) indicii mărimilor medii se calculează raportând valorile medii ale unui indicator calitativ la nivelul unei colectivit ăţi omogene în perioada curent ă faţă de perioada de baz ă. x1 f1 ∑ x0 f0 ∑ x1 f1* ∑ I 1/ 0 = , = = : x0 ∑ f1 ∑ f0 ∑ x0 f0* x1
x
unde:
f i * =
f i
∑ f i
x
I 1/ 0 =
x1 x0
se nume şte indice cu structur ă variabilă şi se descompune în doi indici:
• indice cu structur ă fixă: x ( x )
I 1/ 0
x1 f1 ∑ x0 f1 ∑ x1 f1* ∑ x1 f1 ∑ ; = = = = : * f f x f x f x0 ∑1 ∑1 ∑ 01 ∑ 01 x1
• indicele varia ţiei structurii: x( f )
I 1/ 0
x0 f1 ∑ x0 f0 ∑ x0 f1* ∑ . = = = : x0 ∑ f1 ∑ f0 ∑ x0 f0* x1
Relaţia dintre cei trei indici este:
* x ( f ) x x I x1 = I 1( ) ⋅ I 1 .
0
0
0
Pasul 6 - Metode de descompunere descompunere a dinamicii unui indicator indicator complex Un indicator complex poate fi prezentat sub form ă de produs de factori: a) cazul bifactorial y = x ⋅ f ; 138
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
b) cazul trifactorial y = x ⋅ w ⋅ f ; c) cazul qvadruplu y = x ⋅ w ⋅ z ⋅ f . Modificarea unui indicator complex poate fi calculat ă absolut cu relaţia: a) ∆ y1 = ∑ x1 f1 − ∑ x0 f0 ; 0
∑ x1w1 f1 − ∑ x0 w0 f0 ; c) ∆ 1 = ∑ x1w1 z1 f1 − ∑ x0 w0 z0 f0 ; 0 b)
y
∆1 = 0
y
sau relativ cu rela ţia:
∑ x1 f 1 ; ∑ x0 f 0 xw f b) I 1/ 0 = ∑ 1 1 1 ; ∑ x0 w0 f0 xwz f c) I 1/ 0 = ∑ 1 1 1 1 . ∑ x0w0z 0 f0 a) I 1/ y 0 = y
y
Descompunerea modific ării absolute sau relative a unui indicator complex se realizează în statistică cu ajutorul a dou ă metode: - metoda substitu ţiei în lan ţ; - metoda restului nedescompus (a influen ţelor izolate).
Pasul 7 - Metoda substitu ţiei în lanţ Metoda substituţiei în lanţ constă în modificarea, mai întâi, a factorului cantitativ ( f ). ). După modificare, factorul cantitativ r ămâne la nivelul perioadei curente pe tot parcursul procedeului de descompunere.
Descompunerea relativă va fi: ∆ 1(
y f )
0
y ( x )
∆1
0
Metoda substituţiei în lanţ a) cazul bifactorial : y
I 1/ 0 =
∑ x1 f 1 ∑ x0 f 0
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
139
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
x0 f 0 → x0 f1 → x1 f1
∑ x0 f 1 ; ∑ x0 f 0
I 1/ (0 ) = y f
I 1/ (0 ) = y x
∑ x1 f 1 ∑ x0 f 1
Proba: I1 y/ 0 = I1y/(0x ) ⋅ I1y/(0f ) b) cazul trifactorial
∑ x1w1 f1 ∑ x0 w0 f0
I 1/ y 0 =
x0 w0 f 0 → x0 w0 f1 → x0 w1 f1 → x1 w1 f1 I 1/ (0 ) = y f
∑ x0w0 f1 ; I 1/ (0 ) = ∑ x0 w1 f1 ; I 1/ (0 ) = ∑ x1w1 f1 ∑ x0w0 f0 ∑ x0w0 f1 ∑ x0 w1 f1 y w
y x
Proba: I1 y/ 0 = I1y/(0f ) ⋅ I1y/(0w) ⋅ I1y/(0x) c) cazul qvadruplu I 1/ y 0 =
∑ x1w1z1 f1 ∑ x0w0z 0 f0
x0 w0 z0 f 0 → x0 w0 z0 f1 → x0 w0 z1 f1 → x0 w1 z1 f1 → x1 w1 z1 f1
∑ x0w0z 0 f1 ; I 1/(0 ) = ∑ x0w0 z1 f 1 ∑ x0w0z 0 f 0 ∑ x0w0z 0 f1 ∑ x0 w1 z1 f1 ; I 1/(0 ) = ∑ x1w1z1 f1 I 1/ (0 ) = ∑ x0w0 z1 f1 ∑ x0 w1 z1 f1 I 1/ (0 ) = y f
y z
y w
y x
Proba:
y( f
)
y( z )
y( w)
y( x)
I1 y/ 0 = I1/ 0 ⋅ I1/ 0 ⋅ I1/ 0 ⋅ I 1/ 0
Descompunerea modificării absolute va fi: a) cazul bifactorial:
∑ x0 f1 − ∑ x0 f0 ∆ 1( ) = ∑ x1 f1 − ∑ x0 f1 0 ∆ 1(
y f )
=
0
y x
∆ y1 = 0
∑ x1 f 1 − ∑ x0 f 0
Proba: ∆ y1/ 0 = ∆1y/(0x ) + ∆1y/(0f ) b) cazul trifactorial
∑ x1w1 f1 − ∑ x0 w0 f0 ∆ 1( ) = ∑ x0 w0 f1 − ∑ x0 w0 f0 0 ∆ y1 = 0
y f
140
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
∑ x0 w1 f1 − ∑ x0 w0 f1 ∆ 1( ) = ∑ x1w1 f1 − ∑ x0 w1 f1 0 ∆ 1(
y w)
=
0
y x
Proba: ∆ y1/ 0 = ∆1y/(0f ) + ∆1y/(0w) + ∆1y/(0x) c) cazul qvadruplu:
∑ x1w1 z1 f1 − ∑ x0 w0 z0 f0 ∆ 1( ) = ∑ x0 w0 z0 f1 − ∑ x0 w0 z0 f0 0 ∆ 1( ) = ∑ x0 w0 z1 f1 − ∑ x0 w0 z0 f1 0 ( ) ∆ 1 = ∑ x0 w1 z1 f1 − ∑ x0 w0 z1 f1 0 ( ) ∆ 1 = ∑ x1w1 z1 f1 − ∑ x0 w1 z1 f1 0
∆ y1 = 0
y f
y z
y w
y x
Proba:
y( f
)
y( z )
y( w)
y( x)
∆ y1/ 0 = ∆1/ 0 + ∆1/ 0 + ∆1/ 0 + ∆1/ 0
Pasul 8 - Metoda restului nedescompus (a influen ţelor izolate) Se bazează pe ipoteza c ă modificarea fiec ărui factor are loc în condi ţiile în care celălalt a rămas neschimbat, deci la nivelul perioadei de baz ă.
Metoda influenţelor izolate Modificarea relativ ă va fi: a) Cazul bifactorial: y = x ⋅ f I 1/ y 0 =
∑ x1 f 1 ; I 1/(0 ) = ∑ x0 f 1 ; I 1/(0 ) = ∑ x1 f 0 ∑ x0 f 0 ∑ x0 f 0 ∑ x0 f 0 y f
y x
.
Mărimea prin care difer ă produsul indicilor factoriali I1y/(0x ) ⋅ I 1y/(0f ) faţă de valoarea modificării generale relative I y1 se numeşte „rest nedescompus”, adică rezultatul influen ţelor 0
concomitente a celor doi factori (aria ABCD din fig. 11.2). x0 f 0 → x0 f1 → x1 f1 x1 f 0 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
141
Rodica Pripoaie, Statistică economică, Note de curs
I x1 I f = 0
Anul I, semestrul I
∑ x1 f1 : ∑ x1 f0 ∑ x0 f1 ∑ x0 f0
b) Cazul trifactorial: z = xwf
∑ x1w1 f1 ; I 1/(0 ) = ∑ x0w0 f1 ∑ x0w0 f0 ∑ x0w0 f0 ∑ x0 w1 f0 ; I 1/ (0 ) = ∑ x1w0 f0 I 1/ (0 ) = ∑ x0w0 f0 ∑ x0w0 f0 ∑ x1w1 f1 : ∑ x0 w1 f0 : ∑ x0 w0 f1 I 1 0 = ∑ x1w0 f0 ∑ x0 w0 f0 ∑ x0 w0 f0 y f
I 1/ y 0 = y w
y x
x I wI f
Proba:
y( f
)
y ( w)
y( x )
I1y/ 0 = I1/ 0 ⋅ I1/ 0 ⋅ I1/ 0 ⋅ I1x0IwI f
Demonstra ţie: ∑ x1w1 f1 ∑ x0w0 f1 ∑x0w1 f0 ∑x1w0 f0 ∑x1w1 f1 ∑x0w0 f0 ∑x0w0 f 0 ⇒ = ⋅ ⋅ ⋅ ⋅ ⋅ ∑ x0w0 f0 ∑ x0w0 f0 ∑x0w0 f0 ∑ x0w0 f0 ∑x1w0 f0 ∑ x0w1 f0 ∑x0w0 f1 xw f xw f ⇒∑ 1 1 1 =∑ 1 1 1 ∑ x0 w0 f 0 ∑ x0 w0 f 0
c) Cazul qvadruplu: y = xwzf
∑ x1w1z1 f1 ; I 1/(0 ) = ∑ x0w0 z 0 f1 ; I 1/(0 ) = ∑ x0w0 z1 f 0 ∑ x0w0z 0 f 0 ∑ x0w0z 0 f 0 ∑ x0w0 z0 f 0 ∑ x0w1z0 f0 ; I 1/(0 ) = ∑ x1 w0 z0 f0 I 1/ (0 ) = ∑ x0w0z 0 f0 ∑ x0w0 z0 f 0 ∑ x1w1 z1 f1 : ∑ x0 w1 z0 f0 : ∑ x0 w0 z1 f0 : ∑ x0 w0 z0 f1 I 1 0 = ∑ x1w0 z0 f0 ∑ x0 w0 z0 f0 ∑ x0 w0 z0 f0 ∑ x0 w0 z0 f0 y f
y
I 1/ 0 = y w
y z
y x
x I wI z I f
Proba:
y( f
)
y( z )
y( w)
y( x)
I1y/ 0 = I1/ 0 ⋅ I1/ 0 ⋅ I1/ 0 ⋅ I 1/ 0 ⋅ I 1x/I0wI z I f
Modificarea absolută a variaţiei indicatorului complex va fi: a) cazul bifactorial: y ( f ) y ∆ 1 = ∑ x1 f1 − ∑ x0 f 0 ; ∆ 1 = ∑ x0 f1 − ∑ x0 f0 0
0
∑ x1 f0 − ∑ x0 f0 = ( ∑ x1 f1 − ∑ x0 f1 ) − ( ∑ x1 f0 − ∑ x0 f0 )
∆ 1( ) = y x
0
∆ x1I f 0
Proba: ∆1y/ 0 = ∆1y/(0x ) + ∆1y/(0f ) + ∆1x/I0f b) cazul trifactorial y ( f ) ∆ y1 = ∑ x1w1 f1 − ∑ x0 w0 f0 ; ∆ 1 = ∑ x0 w0 f1 − ∑ x0 w0 f0
0
142
0
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
∆ 1(
y w )
=
0
Anul I, semestrul I
∑ x0 w1 f0 − ∑ x0 w0 f0 ; ∆ 1(0 ) = ∑ x1w0 f 0 − ∑ x0 w0 f 0 y x
∑ x1w1 f1 − ∑ x1w0 f0 ) − ( ∑ x0 w1 f0 − ∑ x0 w0 f0 ) − − ( ∑ x0 w0 f1 − ∑ x0 w0 f0 ) ∆ x1I wI f = ( 0
Proba: ∆1y/ 0 = ∆1y/(0f ) + ∆1y/(0w) + ∆1y/(0x) + ∆1x/I0wI f c) cazul qvadruplu: y ( f ) ∆ y1 = ∑ x1w1 z1 f1 − ∑ x0 w0 z0 f0 ; ∆ 1 = ∑ x0 w0 z0 f1 − ∑ x0 w0 z0 f0 ;
0
0
x0 w0 z1 f0 − ∑ x0 w0 z0 f0 ; ∆ 1( ) = ∑ x0 w1 z0 f0 − ∑ x0 w0 z0 f0 ; ∑ 0 0 ∆ 1( ) = ∑ x1w0 z0 f0 − ∑ x0 w0 z0 f0 0 ∆1 = ( ∑ x1w1z1 f1 − ∑ x1w0 z0 f 0 ) − ( ∑ x0w1z0 f 0 − ∑ x0w0 z0 f 0 ) − 0 − ( ∑ x0 w0 z1 f 0 − ∑ x0 w0 z0 f 0 ) − (∑ x0 w0 z 0 f1 − ∑ x0w0 z0 f 0 ) y ( z )
∆1
y w
=
y x
xIw I z I f
Proba:
∆1y/ 0 = ∆1/(0 ) + ∆1/(0 ) + ∆ 1/(0 ) + ∆ 1/(0 ) + ∆ x1I wI z I f y f
y z
y w
y x
0
Repartizarea restului nedescompus se poate face în urm ătoarele variante: - se atribuie integral unuia dintre factori; - se repartizeaz ă în mod egal pe factori; - se repartizeaz ă proporţional cu influen ţele independente ale factorilor. Se vor determina coeficienţii de importanţă cu relaţiile: a) cazul bifactorial y x )
K x =
∆ 1(
y f )
0
y( f )
∆1
0
y( x )
+ ∆1
;
K f =
0
∆ 1(
0
y( f
∆1
0
)
+ ∆ 1(
y x)
0
Abaterile absolute recalculate vor fi: *y f y f y xI f *y x y x y xI f ∆1 / 0( ) = ∆1/(0 ) + K f ⋅ ∆1/(0 ) ; ∆1 / 0( ) = ∆1/(0 ) + K x ⋅ ∆1/(0 )
Proba: ∆ y1/ 0 = ∆1*/y0( f ) + ∆1*/y0( x) b) cazul trifactorial Coeficien ţii de importan ţă în acest caz se calculeaz ă cu rela ţiile: y x )
K x =
∆ 1(
y f )
0
y( f )
∆1
0
y ( w)
+ ∆1
0
y( x)
+ ∆1
0
;
K f =
∆ 1(
0
y( f
∆1
0
)
y( w)
+ ∆1
0
+ ∆ 1(
y x)
0
y w)
K w =
∆ 1(
0
y( f )
∆1
0
y( w)
+ ∆1
0
+ ∆ 1(
y x)
0
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
143
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Abaterile absolute recalculate vor fi: *y f )
= ∆1/(0 ) + K f ⋅ ∆1/(0
* y w)
= ∆1/(0 ) + K w ⋅ ∆1/(0
∆1 / 0( ∆1/ 0(
y x I wI f )
y f
y x Iw I f )
y w
*y x
∆1/ 0( ) = ∆1/(0 ) + K x ⋅ ∆1/(0
y x I wI f )
y x
Proba: ∆ y1/ 0 = ∆1*/y0( f ) + ∆1*/y0( w) + ∆1*/y0( x) c) cazul qvadruplu Coeficien ţii de importan ţă vor fi: y x )
K x =
∆ 1(
0
y( f )
∆1
0
y( w)
+ ∆1
+ ∆1 ( ) + ∆ 1(
0
y z
y x)
0
0
y f )
K f =
∆ 1(
0
y( f
∆1
)
0
y( w)
+ ∆1
+ ∆1 ( ) + ∆ 1(
0
y z
y x)
0
0
y z )
K z =
∆ 1(
0
y( f
∆1
)
0
y ( w)
+ ∆1
+ ∆1 ( ) + ∆ 1(
0
y z
y x)
0
0
y w)
K w =
∆ 1(
0
∆ 1(
y f)
0
+ ∆ 1(
y w)
0
+ ∆1 ( ) + ∆ 1( y z
y x)
0
0
Abaterile absolute recalculate vor fi: *y x
∆1/ 0( ) = ∆1/(0 ) + K x ⋅ ∆1/(0 * y ( w)
∆1 / 0
y x I wI z I f
y x
y ( w)
)
y( x IwI z I f )
*y z
∆1/ 0( ) = ∆1 /(0 ) + K z ⋅ ∆1/(0 *y f )
∆1/ 0(
= ∆1/ 0 + K w ⋅ ∆1 / 0
y x I wI z I f )
y z
= ∆1/(0 ) + K f ⋅ ∆1/(0
Proba:
y x I wI z I f )
y f
* y( f )
∆ y1/ 0 = ∆1/ 0
* y( w)
+ ∆1/ 0
* y( z)
* y( x)
+ ∆1/ 0 + ∆1/ 0
REZUMAT O serie temporal ă (cronologică) este constituit ă dintr-o multitudine de observ ări efectuate la anumite momente determinate, în general la intervale de timp egale. Termenii unei serii cronologice se descompun de obicei în urm ătoarele componente: • tendin ţa centrală (T ) de dezvoltare pe o durat ă mai lungă sau trend, şi arată direcţia fundamental ă a mişcării. • oscilaţiile sezoniere (S) create de factori naturali (anotimp, luni) fie de factori sociali (sărbători, concedii) sunt de scurt ă durată. 144
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
I ) numite şi reziduale care apar ca rezultat al unor oscilaţiile întâmplătoare ( I factori întâmpl ători (calamit ăţi naturale, m ăsuri excepţionale cu caracter politic, economic, administrativ) • variaţiile ciclice (C ) sunt proprii procesului reproduc ţiei capitaliste. Cu ajutorul indicilor se poate m ăsura variaţia în timp şi spaţiu a unui fenomen complex în func ţie de modificarea factorilor de influen ţă. Indicii se calculeaz ă sub forma unui raport dintre valorile unui indicator statistic, la dou ă momente diferite, sau în dou ă spaţii diferite, ori în func ţie de o alt ă caracteristică oarecare. Indicii arat ă variaţia relativă a unor variabile sau a unei grupe de variabile în func ţie de timp, spa ţiu sau alt ă categorie specificat ă.
•
CONCLUZII Studiind acest modul a ţi dobândit cuno ştinţe referitoare la modul de calcul al indicilor, la metodele utilizate pentru studierea seriilor cronologice, precum şi cele referitoare la descompunerea unui fenomen complex cu ajutorul metodei substitu ţiei în lan ţ şi a restului nedescompus ( a influen ţelor izolate).
EXEMPLE ILUSTRATIVE 1. Să se estimeze evoluţia CA la S.C. X S.A. în anul 2011, prin metoda abaterii absolute medii ştiind că evoluţia acestui indicator în perioada 2003 - 2007 a fost: Anul 2003 2004 2005 2006 2007
CA - mii lei 12 15 18 20 24
Rezolvare:
Abaterea medie se calculeaz ă cu formula: ∆ y =
yn − y1 n −1
şi yk* = yn + k ⋅ ∆y ,
unde: yn - nivelul fenomenului y în ultimul an de istorie; k - orizontul de prognoz ă; y1 - nivelul fenomenului y în primul an; n - numărul de ani. Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
145
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
24 − 12 = 3 mii lei 5 −1 4 ∗ = 24 + 4 ⋅ 3 = 36 mii lei CA2011 CA2007 − CA2003
∆CA =
=
2. Pe baza datelor din problema 1 s ă se prognozeze evolu ţia cifrei de afaceri pentru anul 2011 folosind metoda geometric ă şi metoda autoregresiei. Rezolvare: Metoda geometric ă :
I CA = ∗
CA
∗
CA
CA2007
n −1
CA2003
=
5 −1
24 ≅ 1.18 12
= CA2007 ⋅ ( I CA )
k
2007+ k 2011
= 24 ⋅ (1.18)4 = 48.13 mii lei
Metoda autoregresiei n
∑2 CA
k
I CA = k =
n −1
⋅ CAk −1
∑1 CA
⇒
2
k
k =
I CA =
CA2004 ⋅ CA2003 + CA2005 ⋅ CA2004 + CA2006 ⋅ CA2005 + CA2007 ⋅ CA2006 2 2 2 2 + CA2004 + CA2005 + CA2006 CA2003
15 ⋅ 12 + 18 ⋅15 + 20 ⋅ 18 + 24 ⋅ 20 2 2 2 2 (12) + (15 ) + (18) + ( 20 ) 1290 I CA = ≅ 1,18 1093 ⇒ I CA =
∗
CA
2011
= 24 ⋅ (1.18)4 = 48.13 mii lei
3. Se dau datele: 146
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Anul „n-1” Anul „n” Produs Valoarea prod. Cantitate Curs de revenire Valoarea prod. Cantitate Curs de revenire € - to mii lei/€ € - to mii lei/€ A 15000 150 40 2250 180 41 B 2000 100 40 3000 150 40 C 2300 115 41 2800 100 41 Să se determine: - indicii generali; - indicii factoriali; - abaterile absolute, pentru indicatorul „valoarea exportului” prin metoda substitu ţiei în lanţ cazul trifactorial. Rezolvare:
Anul „n-1” Anul „n” Preţ Cantitate Curs de revenire Preţ Cantitate Curs de revenire Produs (€/to) (to) mii lei/€ (€/to) (to) mii lei/€ p0 q0 p1 q1 cr1 cr0 A 10 150 40 12,5 180 41 B 20 100 40 20 150 40 C 20 115 41 28 100 41 Total 365 430 Produs A B C Total
q1 p1C r1
92250 120000 114800 327050
q0 p0C r0
q1 p0C r0
60000 80000 94300 234300
72000 120000 82000 274000
q1 p1C r0
90000 120000 114800 324800
Preţ (€/to) = Valoarea produc ţiei (€) : Cantitate (to) VE = q ⋅ p ⋅ C r (mii lei) q0 p0Cr0 → q1 p0 Cr0 → q1 p1 Cr0 → q1 p1 Cr1
∑ q1 p1C 1 = 327050 = 1,3958 ∑ q0 p0 C 0 2343000 ∑ q1 p0C 0 = 274000 = 1,169 I 1/ 0 = ∑ q0 p0C 0 234300 ∑ q1 p1C 0 = 324800 = 1,185 I 1/ 0 = ∑ q1 p0C 0 274000 ∑ q1 p1C 1 = 327050 ≅ 1,007 I 1/ 0 = ∑ q1 p1C 0 324800 I 1/VE 0 =
r
r
q
r
r
p
r
r
C r
r
r
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
147
Rodica Pripoaie, Statistică economică, Note de curs
Proba:
Anul I, semestrul I
C
VE q p I1/ 0 = I1/ 0 ⋅ I1/ 0 ⋅ I1/ 0r
1,395 ,3958 = 1,169 ⋅1,185 ⋅1,007 ,007
Abaterile absolute:
∑ q1 p1C 1 − ∑ q0 p0C 0 = 327050 − 234300 = 92750 ∆ 1 = ∑ q1 p0C 0 − ∑ q0 p0 C 0 = 274000 − 234300 = 39700 0 ∆ 1 = ∑ q1 p1C 0 − ∑ q1 p0C 0 = 324800 − 274000 = 50800 0 ∆ 1 = ∑ q1 p1C 1 − ∑ q1 p1C 0 = 327050 − 324800 = 2250 0 VE
∆1 = 0
r
r
q
r
r
p
r
r
C r
r
r
Proba: ∆1V/E0 = ∆1q/ 0 + ∆1p/ 0 + ∆1C / 0 92750 = 39700 + 50800 + 2250 r
RECOMANDĂRI BIBLIOGRAFICE • Tudor Baron, Elena Biji şi colab. – Pedagogică, Bucureşti, 1996
Statistică teoretică şi economică, Ed. Didactică şi
• Elena-Maria Biji, Eugenia Lilea, Elisabeta Ro şca, Mihaela V ăzui – economie – Ed. Universul Dalsi, Bucure şti, 2000
Statistică aplicată în
Statistică, Ed. Economic ă, Editia a IV-a, Bucure şti, 2007 • Ianuarie-Doru Popescu – Bazele statisticii, Ediţia a III-a revizuit ă şi completat ă, Ed. Fundaţiei Academice Danubius, Gala ţi, 2000 • Rodica Pripoaie – Statistică Economic ă, Ed. Didactic ă şi Pedagogic ă, Bucure şti, 2008 • Elisabeta Jaba –
TESTE DE AUTOEVALUARE 1. Să se estimeze evolu ţia CA la S.C. X S.A. în anul 2009, prin metoda abaterii absolute medii ştiind că evoluţia acestui indicator în perioada 2003 – 2007 a fost: Anul CA - mii lei 2003 8,7 2004 8,85 2005 9,15 2006 9,40 2007 9,85 2. PN în perioada 2003 – 2007 la S.C. S.C. Y S.A. a avut urm ătoarea evolu ţie: 148
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
Anul PN - mii lei 2003 4,00 2004 4,10 2005 4,25 2006 4,45 2007 4,60 Se cere s ă se prognozeze valoarea PN pe anii 2008 - 2012 folosind metoda abaterii absolute medii.
3. La S.C. Z S.A. indicatorul profitul brut (PB) în perioada 2003-2007 a avut următoarele valori: Anul PB - mii lei 2003 7,00 2004 7,50 2005 7,85 2006 8,25 2007 8,75 Se cere să se prognozeze evolu ţia indicatorului PB pân ă în anul 2012 folosind metoda celor mai mici p ătrate. 4. Se dau datele: S.C. A B C D E
Producţia - mii tone -
Preţul unitar - mii lei -
Costuri unitare - mii lei -
q0
q1
p0
p1
c0
c1
8100 7300 6500 6400 6250
8500 7500 6600 6700 6450
1000 2000 4000 3000 500
1200 2500 4200 3050 600
800 1800 3750 2500 400
820 1900 3800 2700 400
Se cere să se determine: - produc ţia marf ă, costurile şi profitul; - rata rentabilit ăţii (a profitului); - indicii de grup şi abaterea absolut ă pentru costuri; - indicii: Paasche, Laspeyres, Marshall - Edgeworth, Fischer şi relaţia lui Borkiewiecz.
5. Pe baza datelor din problema 4 se cere:
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
149
Rodica Pripoaie, Statistică economică, Note de curs
Anul I, semestrul I
- Să se determine indicii generali şi factoriali precum şi abaterile absolute pentru indicatorul „valoarea produc ţiei”, aplicând metoda substitu ţiei în lanţ şi a restului nedescompus, cazul bifactorial. - Să se verifice rela ţiile dintre indicii factoriali şi cel de grup, precum şi cea dintre abaterile absolute pe factori şi abaterea absolut ă totală.
TEMĂ DE CONTROL 1. Se cunosc datele din tabelul urm ător: Vânzări Producţie Produsul (mii lire egiptene) (mii to) Anul „n-1” Anul „n” Anul „n-1” Anul „n” A 105 132 5 6 B 199,5 615 21 41
Curs de revenire (lei / lire egiptene) Anul „n-1” Anul „n” 4600 8450 4700 8600
Se cere să se calculeze: 1. Indicii, abaterile şi efectuarea probelor de verificare prin metoda restului nedescompus; 2. Indicii Paasche şi Laspeyres; 3. Indicele Marschal - Edgeworth.
2. În urma unei analize la SC X S.A. s-a constatat c ă în ultimii ani s-au ob ţinut urm ătoarele valori ale CA: CA Anul - mii lei 2000 6,90 2001 7,08 2002 7,29 2003 7,36 2004 7,57 2005 7,70 2006 7,85 2007 8,08 Se cere: a) Calculaţi mediana pentru seria simpl ă a CA; b) Calculaţi media aritmetic ă şi simplă a CA; 150 Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
Rodica Pripoaie, Statistică economică, Note de curs
c) d) e) f)
Anul I, semestrul I
Determinaţi abaterea medie liniar ă şi abaterea medie p ătratică; Calculaţi coeficientul de varia ţie în cele dou ă forme ale sale; Calculaţi mediile mobile de ordinul I, II, III şi IV; Estima ţi evoluţia CA la SC X SA pentru anul 2012 prin metoda abaterii absolute medii şi prin metoda celor mai mici p ătrate.
3. Se dau datele din tabelul urm ător: Ziua 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
Cursul acţiunii lei 10 12 14 18 16 22 24 28 25.6 25 21
Se cere: 1. Construiţi cronograma pentru datele respective.; 2. Calculaţi media aritmetic ă simplă a cursului ac ţiunii; 3. Calculaţi indicatorii simpli şi sintetici ai varia ţiei; 4. Determina ţi mediana pentru seria simpl ă din tabelul precedent; 5. Cunoscând c ă, cursul ac ţiunii evolueaz ă după o ecua ţie de forma y = ab x, determina ţi parametrii a şi b prin metoda celor mai mici p ătrate; 6. Determina ţi prin metoda indicelui mediu şi metoda autoregresiei valoarea cursului acţiunii în ziua 15; Dacă dispuneţi de 2.000 lei şi cumpăraţi acţiuni în ziua 11 şi le vinde ţi în ziua 17, iar comisionul perceput de SVM este de 8%, ce profit ob ţineţi?
Copyright © 2009 Universitatea Danubius. Toate drepturile rezervate
151