UNIVERSITATEA „GEORGE BACOVIA” BACĂU
STATISTICĂ Note de curs
Prof. univ. dr. Puiu Tatiana
Bacău, 2008
2
Bacău, 2008
2
CUPRINS Modulul 1. INTRODUCERE ÎN STUDIUL STATISTICII STATISTICII 1.1. Scurt istoric al evoluţiei statisticii 1.2. Obiectul şi metoda statisticii 1.3. Concepte (noţiuni) de bază folosite în statistică 1.4. Etapele demersului statistic Sumar Întrebări Modulul 2. OBSERVAREA STATISTICĂ 2.1. Definiţia şi principiile observării statistice 2.2. Metode şi lucrări de observare statistică 2.3. Programul unei observări statistice special organizate 2.4. Erorile statistice de observare Sumar Întrebări Modulul 3. PRELUCRAREA PRIMARĂ PRIMARĂ A DATELOR STATISTICE 3.1. Necesitatea prelucrării datelor statistice 3.2. Sistematizarea datelor statistice 3.2.1. Procedee de sistematizare 3.2.2. Tipologia grupărilor statistice 3.2.3. Probleme ale grupării statistice 3.2.4. Clasificări folosite în statistica macroeconomică Sumar Întrebări Aplicaţii rezolvate şi propuse Modulul 4. PREZENTAREA DATELOR STATISTICE 4.1. Serii statistice 4.2. Tabele statistice 4.3. Grafice statistice Sumar Întrebări Aplicaţii propuse Modulul 5. INDICATORI STATISTICI EXPRIMAŢI ÎN MĂRIMI ABSOLUTE ŞI RELATIVE 5.1. Indicatori statistici în mărimi absolute 5.2. Indicatori statistici în mărimi relative Sumar Întrebări Aplicaţii rezolvate şi propuse Modulul 6. INDICATORI STATISTICI ÎN MĂRIMI MEDII 6.1. Definire, condiţii de calitate şi clasificare 6.2. Media aritmetică 6.3.Media armonică 6.4. Media pătratică 6.5. Media geometrică 3
6.6. Modul (Dominanta) 6.7. Mediana 6.8. Relaţii între valorile tendinţei centrale Sumar Întrebări Aplicaţii rezolvate şi propuse Modulul 7. INDICATORI Al DISPERSIEI 7.1. Indicatori simpli ai dispersiei 7.2. Indicatori sintetici ai dispersiei Sumar Întrebări Aplicaţii rezolvate Modulul 8. SERII CRONOLOGICE 8.1. Definiţie, clasificare, proprietăţi 8.2. Indicatori statistici utilizaţi în caracterizarea seriilor cronologice 8.2.1. Indicatori absoluţi ai seriei cronologice 8.2.2. Indicatori relativi ai seriei cronologice 8.2.3. Indicatori medii ai seriei cronologice Sumar Întrebări Aplicaţii rezolvate şi propuse Modulul 9. INDICII STATISTICI 9.1. Noţiunea de indice statistic şi problemele teoretice ale construirii sale 9.2. Tipuri de indici 9.2.1. Indici agregaţi 9.2.2. Indici calculaţi ca mărimi medii 9.2.3. Indici calculaţi ca raport de medii Sumar Întrebări Aplicaţii rezolvate Modulul 10. SERII TERITORIALE 10.1. Definiţie, clasificare şi particularităţi. 10.2. Indicatori statistici utilizaţi în caracterizarea seriilor teritoriale 10.3. Ierarhizarea unităţilor teritoriale 10.4. Indicii teritoriali 10.5. Extrapolarea în analiza teritorială Sumar Întrebări Aplicaţie propusă BIBLIOGRAFIE
4
Modulul 1. INTRODUCERE ÎN STUDIUL STATISTICII 1.1. Scurt istoric al evoluţiei statisticii Statistica a apărut ca activitate practică, din necesitatea cunoaşterii, într-o formă măsurabilă, a realităţii înconjurătoare şi a evoluat de-a lungul secolelor, pe un drum lung şi sinuos, spre statutul de ştiinţă de sine stătătoare. Deşi statisticieni de renume consideră că nu se poate vorbi despre statistică înainte de mijlocul secolului al XVII-lea, totuşi lucrări cu caracter statistic s-au întocmit cu mult înainte de această perioadă. Astfel de lucrări, cu specific militar şi fiscal, destinate a evidenţia resursele umane şi materiale ale statelor au fost întocmite în Egiptul antic, în Grecia antică, în Roma antică etc. Termenul de statistică derivă din latinescul „status”, cu sensul de stare politică. Se atribuie profesorului german Gottfried Achenwall crearea şi introducerea (1746) termenului de „statistică” pentru a desemna o ştiinţă a descrierii statului. Statistica, ca ştiinţă, a apărut în urmă cu aproximativ trei secole. În secolele al XVII-lea şi al XVIII-lea s-a creat şi dezvoltat, în Germania şi Anglia, un curent de gândire care îşi propunea să descrie într-o formă sistematică situaţia diferitelor state constituite în acea epocă, prin prisma unor caracteristici precum: populaţia, industria, comerţul, finanţele. Acesta s-a manifestat prin şcoala descriptivă germană şi şcoala engleză a aritmeticii politice. În cadrul şcolii descriptive germane statistica a apărut ca o ştiinţă menită să descrie statul feudal prin intermediul datelor. Ea era orientată spre întocmirea de monografii şi spre compararea resurselor statelor. Principalii reprezentanţi ai acestui curent de gândire sunt profesorii universitari germani Herman Conring (1606-1681), Gottfried Achenwall (1719-1772) şi A. L. Schloser (1735-1809). În spiritul şcolii descriptive au fost întocmite şi în ţările române, în secolele al XVIII-lea şi al XIX-lea, o serie de lucrări care reprezintă contribuţii valoroase la dezvoltarea statisticii. Astfel, Dimitrie Cantemir (1673-1723) a scris „Descrierea Moldovei”, monografie cu caracter geografic, economic, social, politic şi cultural, a cărei valoare ştiinţifică l-a impus printre cei mai de seamă reprezentanţi ai statisticii descriptive europene şi i-a conferit titlul de membru al Academiei din Berlin. Nicolae Şuţu (1798-1871), datorită lucrărilor „Notions statistiques sur la Moldavie” şi „Quelques observations sur la statistique de la Roumanie”, în care a descris situaţia economică cu ajutorul datelor statistice, este considerat printre fondatorii statisticii româneşti. George Bariţiu (1812-1893) a descris cu ajutorul cifrelor starea social-economică a populaţiei din Transilvania. El a publicat numeroase articole în acest domeniu în revistele „Gazeta de Transilvania” şi „Foaie pentru minte, inimă şi literatură”. Profesorul universitar Alexandru Bărbat l-a considerat drept întemeietorul unei adevărate şcoli statistice în Transilvania. Spre deosebire de şcoala descriptivă germană, şcoală tradiţională, care punea accentul pe descrierea fenomenelor cu ajutorul cifrelor, în Anglia celei de a doua jumătăţi a secolului al XVIIlea a apărut şi s-a dezvoltat o concepţie modernă, prin şcoala aritmeticii politice, orientată spre analiza fenomenelor social-politice şi căutarea legităţilor care le determină manifestarea, pe baza datelor şi calculelor matematice.
5
Principalii reprezentanţi ai şcolii aritmeticii politice sunt John Graunt (1620-1674), William Petty (1623-1687), considerat părintele economiei politice şi întemeietorul statisticii ca ştiinţă şi Edmund Halley (1662-1742). Pe linia şcolii engleze a aritmeticii politice se înscrie şi activitatea statistică desfăşurată de Ion Ionescu de la Brad şi Dionisie Pop Marţian. Ion Ionescu de la Brad (1818-1891) este un pionier al cercetării monografice româneşti, prin cele trei monografii de judeţe pe care le-a realizat: Agricultura română din judeţul Dorohoi, Agricultura română din judeţul Mehedinţi şi Agricultura română din judeţul Putna. De asemenea, el este organizatorul primului recensământ modern al populaţiei din Moldova (1859) şi autorul primului curs de statistică în limba română. Dionisie Pop Marţian (1829-1865) este primul director al Oficiului Central al Statisticii din România, organizatorul primului recensământ modern al populaţiei din Ţara Românească (1860) şi întemeietorul primei reviste româneşti de statistică (Analele statistice). O dezvoltare deosebită a înregistrat statistica datorită progreselor din domeniul matematicii, în general, şi al calculului probabilităţilor, în special. Contribuţii remarcabile la progresul statisticii au avut savanţi precum: Pascal (1623-1662) şi Fermat (1601-1667), creatorii teoriei probabilităţilor; Jacques Bernoulli (1654-1705), autorul legii numerelor mari; Pierre-Simon Laplace (1749-1827) şi Carl Friedrich Gauss (1777-1855), autorii legii normale a repartiţiei, a metodei celor mai mici pătrate şi a teoriei erorii probabile a mediei. În timp, statistica a devenit un instrument indispensabil tuturor ştiinţelor sociale. Un eveniment deosebit în această direcţie îl constituie contribuţia remarcabilă adusă de matematicianul, statisticianul şi demograful belgian Adolphe Quetelet (1796-1874) prin ceea ce el a numit „statistica morală”, adică aplicarea teoriei probabilităţilor la studiul fenomenelor sociale. Alături de contribuţia sa la teoria statisticii, amintim că este iniţiatorul, în 1853, a primului Congres Internaţional de Statistică. Adevăratul început al statisticii moderne poate fi localizat la sfârşitul secolului al XIX-lea şi începutul secolului al XX-lea şi se datorează în mod deosebit lucrărilor lui Karl Pearson (18571936), care a pus bazele statisticii internaţionale prin elaborarea testelor privitoare la semnificaţia diferenţelor dintre valorile calculate şi cele empirice şi a lui Ronald A. Fischer (1890-1962), care a elaborat teoria riguroasă a tragerii concluziilor din datele observate. A doua jumătate a secolului al XX-lea este caracterizată prin diversificarea domeniilor de aplicaţie ale metodelor statistice şi prin contribuţia unor savanţi precum Neyman şi Egon Pearson. De asemenea, merită amintiţi pentru contribuţia lor la dezvoltarea statisticii româneşti din secolul XX: academician Octav Onicescu (1892-1983), doctor Sabin Manuilă (1894-1964), Anton Golopenţia (1909-1951), Gheorghe Mihoc (1906-1981), Nicolae Georgescu-Roegen (1906-1994). Statistica a evoluat şi continuă să evolueze sub impulsul necesităţilor practicii, ale dezvoltării forţelor de producţie, al cuceririlor ştiinţei şi tehnicii. Ea şi-a lărgit continuu sfera de aplicaţie, constituindu-se în statistici specializate, aplicate: statistica demografică, statistica economică, statistica matematică, statistica medicală, statistica juridică, statistica informaţională etc. Dar, indiferent de gradul de diversificare al statisticii în viitor, baza ei a rămâne statistica teoretică, care oferă posibilitatea de descriere într-o formă concentrată a principalelor relaţii şi tendinţe ce se manifestă în colectivităţile studiate. În urma succintei prezentări a evoluţiei statisticii rezultă că drumul parcurs de aceasta este similar cu al tuturor ştiinţelor, de la activităţile practice la elaborările teoretice ştiinţifice.
1.2. Obiectul şi metoda statisticii Statistica este ştiinţa care are drept obiect de studiu variaţia curentă-continuă în timp, în spaţiu şi din punct de vedere calitativ a fenomenelor şi proceselor de tip colectiv, în scopul descrierii acestora şi a descoperirii legilor care guvernează manifestarea lor. Ca disciplină ştiinţifică, statistica modernă cuprinde: 6
statistica descriptivă sau formală, care are drept obiectiv culegerea datelor şi prelucrarea acestora în scopul obţinerii informaţiilor statistice cu privire la starea şi evoluţia colectivităţilor; • inferenţa statistică sau statistica inductivă, care are drept obiectiv determinarea caracteristicilor unei colectivităţi oarecare pornind de la cunoaşterea unui eşantion din aceasta; ea presupune măsurarea incertitudinii rezultatelor şi determinarea riscurilor pe care le implică luarea unei decizii pe baza unor informaţii ce nu pot fi exhaustive; • analiza statistică, care are drept obiectiv descoperirea a ceea ce este permanent, esenţial, legic în variaţia fenomenelor şi proceselor de tip colectiv şi măsurarea influenţei factorilor care le determină variaţia în timp, în spaţiu şi din punct de vedere calitativ. Particularităţile obiectului statisticii: • statistica studiază fenomenele social-economice de masă (de tip colectiv, stohastice sau fenomene atipice), care prezintă proprietatea de a fi variabile în timp şi spaţiu şi în cadrul cărora acţionează legile statistice; • statistica studiază fenomenele de masă din punct de vedere cantitativ, numeric. Totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor de investigare statistică a fenomenelor şi proceselor de tip colectiv formează metodologia sau metoda statisticii. Particularităţile metodei statisticii: • observarea faptică reprezintă procesul complex de obţinere a datelor cu privire la colectivităţile economico-sociale prin observarea, măsurarea şi înregistrarea unităţilor componente sub aspectul caracteristicilor urmărite; • exprimarea numerică este necesară datorită caracterului de masă a fenomenelor studiate de statistică. Tehnicile, procedeele şi metodele de investigare statistică se folosesc în studii concrete ale fenomenelor şi proceselor de masă şi sunt sistematizate şi organizate pe etapele cercetării statistice: culegerea datelor, prelucrarea şi analiza acestora. •
1.3. Concepte (noţiuni) de bază folosite în statistică Noţiunile fundamentale ale statisticii sunt: colectivităţile, unităţile, caracteristicile şi indicatorii statistici. Colectivitatea statistică, noţiune întâlnită şi sub denumirea de populaţie sau univers statistic, reprezintă o asociaţie de elemente unite între ele printr-o trăsătură esenţial comună denumită omogenitate. Exemple de colectivităţi statistice: studenţii unei facultăţi înscrişi în primul an de studiu; piesele fabricate într-o întreprindere pe parcursul unei luni; căsătoriile realizate într-un oraş într-o perioadă analizată; personalul unei firme la un moment dat, etc. Rezultă: - colectivităţile se compun din fiinţe, lucruri, precum şi evenimente, fapte referitoare la acestea; - colectivităţile statistice sunt reale şi finite, spre deosebire de colectivităţile teoretice, infinite studiate de matematică. Omogenitatea statistică a elementelor unei colectivităţi reprezintă proprietatea acestora de a fi, esenţial, de aceeaşi natură calitativă, de a aparţine aceluiaşi teritoriu şi aceluiaşi timp (moment sau interval de timp). Pentru corecta caracterizare şi delimitare a colectivităţilor statistice se impune clasificarea lor, care se poate face în funcţie de diverse criterii, astfel: a) după gradul de cuprindere sau numărul elementelor componente se deosebesc: - colectivităţi totale, care cuprind totalitatea elementelor componente; - colectivităţi parţiale (eşantioane sau colectivităţi de selecţie), care cuprind un număr reprezentativ de elemente dintr-o colectivitate totală care, din motive diferite, nu poate fi înregistrată în totalitate. 7
b) după natura elementelor componente se disting: - colectivităţi statice sau de stări, a căror elemente componente sunt fiinţe sau lucruri, care se definesc la un moment dat şi a căror volum se determină prin numărarea elementelor existente la acel moment; - colectivităţi dinamice sau de mişcări, a căror elemente componente sunt evenimente, fapte, care se produc în mod continuu; volumul acestor colectivităţi se determină prin înregistrarea elementelor în momentul producerii şi însumarea lor pentru un interval de timp ales. Statică (de stări) Totală Dinamică (de mişcări) Colectivitate statistică (univers, populaţie) Statică (de stări) Parţială Dinamică (de mişcări)
Fig. 1.1 - Clasificarea colectivităţilor statistice
Unităţile statistice reprezintă elementele componente ale unei colectivităţi statistice. În funcţie de componenţa sau gradul de complexitate se disting: - unităţi statistice simple, formate dintr-un singur element (exemplu: studentul în cadrul grupei de studenţi); - unităţi statistice complexe, formate din două sau mai multe unităţi simple şi care depind de modul de organizare (exemplu: familia, grupa de studenţi în cadrul anului de studiu). Simplă Unitate statistică Complexă
Fig. 1.2 - Clasificarea unităţilor statistice
Caracteristicile sau variabilele statistice reprezintă însuşiri, proprietăţi sau trăsături esenţiale purtate de toate unităţile statistice ale unei colectivităţi. O caracteristică statistică se notează cu literă majusculă (exemplu: X, Y, etc.), iar variantele sau valorile, care reprezintă formele concrete de manifestare ale caracteristicii la nivelul fiecărei unităţi statistice se notează cu literă mică (xi, yi, etc). Mulţimea valorilor posibile ale unei caracteristici X reprezintă domeniul de variaţie al acesteia şi se notează astfel: X: (x1, x2, ..., xn) sau X: (xi), i = 1,2,...,n
8
Frecvenţa sau ponderea reprezintă numărul de unităţi la care se înregistrează aceeaşi valoare xi a caracteristicii. Ea se poate exprima în unităţi absolute (frecvenţă absolută), caz în care se notează cu n i sau cu ajutorul mărimilor relative (frecvenţă relativă), caz în care se notează cu f i (f i = ni / ∑ni). Mulţimea perechilor (xi, ni) sau (xi, f i), i = 1,2,...,n alcătuieşte o distribuţie (serie) statistică. Caracteristicile statistice se clasifică după diverse criterii, după cum urmează: a) în funcţie de natura lor se disting: - caracteristici de timp, care desemnează apartenenţa unităţilor la un anumit moment sau interval de timp; - caracteristici de spaţiu (teritoriale), care desemnează apartenenţa unităţilor la un anumit teritoriu; - caracteristici calitative, care exprimă esenţa, natura unităţilor. b) în funcţie de modul de manifestare pot fi: - caracteristici alternative (binare, binomiale), care nu pot lua decât două valori (exemplu: admis-respins; masculin-feminin; prezent-absent); - caracteristici nealternative, care pot lua valori diferite pentru câte unităţi statistice există în colectivitate. c) în funcţie de modul de exprimare există: - caracteristici atributive (nenumerice), care se exprimă prin cuvinte şi nu se pot măsura numeric (exemplu: meseria, naţionalitatea, religia); - caracteristici cantitative (numerice), care se exprimă prin cifre (exemplu: vârsta, salariul) şi pot fi discrete (exprimate prin numere întregi) sau continue (exprimate pe intervale). Unităţile statistice componente ale unei colectivităţi au, în acelaşi timp, un mare număr de caracteristici. În cadrul unei cercetări statistice se înregistrează şi se prelucrează doar acele caracteristici care interesează în analiza întreprinsă. Indicatorul reprezintă expresia numerică cu ajutorul căreia se caracterizează cantitativ un fenomen social-economic din punct de vedere al compoziţiei, structurii, schimbării timpului, al legăturii reciproce cu alte fenomene. De timp Alternativă Caracteristică (variabilă) statistică
Atributivă (nenumerică)
Calitativă
Discretă Nealternativă
Cantitativă (numerică) Continuă
De spaţiu (teritoriale)
Fig. 1.3 - Clasificarea caracteristicilor statistice
Indicatorul statistic reprezintă rezultatul numeric al unei numărări, al unei măsurări statistice a fenomenelor şi proceselor de masă sau al unui calcul asupra datelor obţinute printr-o înregistrare statistică. Indicatorul statistic trebuie să îndeplinească două condiţii principale de valabilitate ştiinţifică: - să aibă un conţinut ştiinţific bine determinat, o definiţie sau o formulă a sa; - să îndeplinească condiţia de comparabilitate (calitativă –un anumit indicator nu poate avea două definiţii; în timp – posibilitatea oricărui indicator de a fi comparat direct sau cel puţin indirect cu altul anterior; în teritoriu – atât pe plan naţional, cât şi internaţional). 9
Orice indicator statistic are drept trăsături esenţiale: - conţinutul real, reflectând fenomene şi procese concrete; - forma numerică, fiind rezultatul unui proces de cuantificare sau determinare; - caracterul aproximativ, precizia reflectării depinzând de factori multipli. Indicatorii statistici se pot clasifica după diverse criterii, cum ar fi: a) în funcţie de modul de determinare se disting: - indicatori primari, care sunt rezultatul unei măsurători statistice; - indicatori derivaţi, care se obţin prin prelucrarea statistică a indicatorilor primari. b) în funcţie de forma de exprimare există: - indicatori statistici exprimaţi în mărimi absolute; - indicatori statistici exprimaţi sub formă relativă; - indicatori statistici exprimaţi sub formă de mărimi medii; - indicatori statistici exprimaţi sub formă de indici; - indicatori statistici exprimaţi sub formă de ecuaţii de estimare. c) în funcţie de gradul de cuprindere, indicatorii statistici pot fi: - indicatori statistici sintetici, reprezentând expresii numerice ale categoriilor economice de sinteză (exemplu: produsul intern brut şi net, valoarea adăugată brută şi netă, venitul naţional disponibil, rata inflaţiei); - indicatori statistici analitici, reprezentând, în general, expresia numerică a componenţei pe grupe sau a structurii unei colectivităţi. Primari
Absoluţi Relativi
Derivaţi Medii
Indicatori statistici Analitici
Indici
Sintetici
Ecuaţii de estimare
Fig. 1.4 – Clasificarea indicatorilor statistici Conţinutul şi formele pe care le îmbracă indicatorii statistici, precum şi etapa în care sunt elaboraţi sunt strâns legate de funcţiile pe care le îndeplinesc. Funcţiile indicatorilor statistici sunt următoarele: • funcţia de măsurare, derivând din însuşi obiectul statisticii, care studiază aspectele cantitative ale determinărilor calitative ale fenomenelor de masă, fenomene care sunt supuse acţiunii legilor statistice ce se manifestă în condiţii concrete, variabile în timp şi spaţiu. Măsurarea se face fie prin observare directă la nivelul fiecărei unităţi, fie printr-o operaţie de agregare sau dezagregare a datelor statistice în structura orizontală sau verticală a sistemului. În urma acestor operaţii rezultă indicatori exprimaţi în unităţi concrete de măsură, deci în mărimi absolute; • funcţia de comparare se manifestă atunci când se urmăresc modificările ce apar în volumul, structura şi dinamica fenomenelor ce fac obiectul studiului statisticii. În urma comparării rezultă fie indicatori exprimaţi în mărimi absolute (dacă compararea s-a făcut ca diferenţă), fie indicatori derivaţi, exprimaţi în mărimi relative, în unităţi abstracte (coeficienţi, procente, promile, etc, dacă compararea s-a realizat ca raport); 10
funcţia de analiză apare datorită relaţiilor care există între parte şi întreg, între factor şi rezultat în cadrul studiului fenomenelor de masă. Cu ajutorul acestei funcţii se depistează şi se înlătură acele valori care se îndepărtează semnificativ de la legitatea specifică de variaţie a fenomenelor studiate. • funcţia de sinteză presupune sintetizarea valorilor individuale diferite într-o singură expresie numerică care va exprima ceea ce este esenţial şi tipic pentru o colectivitate. În urma sintezei rezultă indicatori sub formă de mărimi medii sau agregate. • funcţia de estimare se manifestă îndeosebi în teoria sondajului statistic unde, pe baza unor indicatori calculaţi pe eşantionul reprezentativ, se estimează indicatorii corespunzători pentru colectivitatea totală. Indicatorii rezultaţi au forma unor ecuaţii de estimare. • funcţia de verificare a ipotezelor şi de testare a semnificaţiei unor indicatori statistici este specifică investigaţiei statistice. Funcţiile indicatorilor statistici se manifestă într-o permanentă complementaritate. În practica socio-economică, pentru caracterizarea multilaterală a stării şi dezvoltării unor colectivităţi se folosesc sisteme de indicatori care se realizează sub îndrumarea organului central de statistică. •
1.4. Etapele demersului statistic Demersul statistic sau investigaţia statistică reprezintă totalitatea operaţiilor de culegere a datelor statistice, de sistematizare, grupare şi prelucrare, de stocare şi regăsire, analiză şi interpretare, deci totalitatea acţiunilor concrete care se desfăşoară de la declanşarea unei cercetări statistice şi până la finalizarea ei. Demersul statistic cuprinde trei etape principale: - observarea statistică; - prelucrarea datelor statistice; - analiza şi interpretarea rezultatelor. Observarea statistică este prima etapă a unei investigaţii statistice în care se înregistrează, după criterii unitare, datele individuale cu privire la fenomenul de masă studiat. Culegerea datelor statistice se poate realiza fie prin procedee de înregistrare totală, folosind rapoartele statistice sau recensămintele, fie prin procedee de înregistrare parţială (la nivelul unui eşantion), folosind sondaje, anchete, monografii. În urma observării fenomenelor reale se obţin date statistice. Prelucrarea datelor statistice reprezintă a doua etapă a demersului statistic şi presupune: - sistematizarea datelor obţinute prin observarea statistică; operaţia se poate realiza prin centralizare şi grupare, rezultând indicatori primari şi distribuţii (serii) statistice; - prezentarea tabelară sau grafică a seriilor statistice; - calcularea indicatorilor derivaţi (indicatori ai valorii centrale, ai dispersiei, ai formei de repartiţie, ai variaţiei în timp şi spaţiu); - măsurarea gradului de intensitate a legăturilor statistice; - măsurarea influenţei factorilor asupra variaţiei fenomenelor; - aproximarea modelelor de regresie şi de fond; - prognozarea fenomenelor; - estimarea parametrilor şi verificarea ipotezelor statistice. În urma prelucrării datelor statistice se obţin indicatori primari şi derivaţi, informaţii statistice asupra fenomenelor studiate. Analiza şi interpretarea rezultatelor reprezintă a treia etapă a investigaţiei statistice, în care informaţiile ce apar după prelucrarea datelor se confruntă şi se compară între ele în vederea formulării concluziilor statistice care vor fi folosite în luarea deciziilor asupra fenomenelor reale. Adesea etapa prelucrării datelor se îmbină cu cea de analiză, dat fiind că prelucrarea pe o treaptă superioară se efectuează numai după analiza rezultatelor obţinute în urma prelucrării anterioare. 11
Cele trei etape ale demersului statistic, deşi se desfăşoară separat în timp şi spaţiu, se condiţionează reciproc deoarece sunt legate între ele atât prin obiectul şi scopul investigaţiei, cât şi prin unitatea şi principiile metodologice folosite. În figura 1.5 este prezentată proiectarea unei investigaţii statistice.
Condiţii ale realizării demersului statistic
Definirea problemei: scopul şi obiectivele investigaţiei proiectate
Analiză teoretico-ştiinţifică şi practică Documentare asupra investigaţiilor similare
Observarea statistică Etapele demersului statistic
Prelucrarea datelor statistice
Banca de date
Analiza şi interpretarea datelor
Utilizarea rezultatelor demersului statistic
Decizii asupra fenomenelor reale
Fig. 1.5 – Proiectarea unui demers statistic
Sumar Statistica a apărut ca activitate practică, din necesitatea cunoaşterii, într-o formă măsurabilă, a realităţii înconjurătoare şi a evoluat de-a lungul secolelor, pe un drum lung şi sinuos, spre statutul de ştiinţă de sine stătătoare. Statistica este ştiinţa care are drept obiect de studiu variaţia curentă-continuă în timp, în spaţiu şi din punct de vedere calitativ a fenomenelor şi proceselor de tip colectiv, în scopul descrierii acestora şi a descoperirii legilor care guvernează manifestarea lor. Totalitatea operaţiilor, tehnicilor, procedeelor şi metodelor de investigare statistică a fenomenelor şi proceselor de tip colectiv formează metodologia sau metoda statisticii. Noţiunile de bază folosite în statistică sunt: colectivitatea, unitatea, caracteristica şi indicatorul statistic.
12
Colectivitatea statistică, noţiune întâlnită şi sub denumirea de populaţie sau univers statistic, reprezintă o asociaţie de elemente unite între ele printr-o trăsătură esenţial comună denumită omogenitate. Unităţile statistice reprezintă elementele componente ale unei colectivităţi statistice. Caracteristicile sau variabilele statistice reprezintă însuşiri, proprietăţi sau trăsături esenţiale purtate de toate unităţile statistice ale unei colectivităţi. Indicatorul statistic reprezintă rezultatul numeric al unei numărări, al unei măsurări statistice a fenomenelor şi proceselor de masă sau al unui calcul asupra datelor obţinute printr-o înregistrare statistică. Demersul statistic sau investigaţia statistică reprezintă totalitatea operaţiilor de culegere a datelor statistice, de sistematizare, grupare şi prelucrare, de stocare şi regăsire, analiză şi interpretare, deci totalitatea acţiunilor concrete care se desfăşoară de la declanşarea unei cercetări statistice şi până la finalizarea ei. Demersul statistic cuprinde trei etape principale: - observarea statistică; - prelucrarea datelor statistice; - analiza şi interpretarea rezultatelor. Întrebări 1. În ce constă necesitatea şi importanţa statisticii 2. Exemplificaţi contribuţiile româneşti la dezvoltarea ştiinţei statisticii 3. Care sunt particularităţile obiectului statisticii 4. Care sunt particularităţile metodei statisticii 5. Definiţi şi clasificaţi conceptele de bază folosite în statistică 6. Care sunt etapele demersului statistic - detaliaţi
13
Modulul 2. OBSERVAREA STATISTICĂ 2.1. Definiţia şi principiile observării statistice Observarea statistică sau culegerea datelor este prima etapă a demersului statistic. Ea reprezintă un proces complex de identificare, măsurare şi înregistrare a fenomenelor de tip colectiv, în forma lor concretă şi individuală de manifestare. Această etapă are o importanţă hotărâtoare în ansamblul unei investigaţii statistice deoarece de calitatea desfăşurării ei depind rezultatele ce se vor obţine în celelalte etape şi, în final, calitatea informaţiilor statistice. autenticităţii datelor ; este principiul de bază care constă în realizarea concordanţei dintre datele î Pentru ca observarea să răspundă cerinţelor demersului statistic este necesar ca în această etapă să se respecte unele principii, şi anume: • asigurarea nregistrate şi realitatea fenomenelor observate. Principiul se referă la volumul datelor înregistrate, calitatea lor, precum şi la obţinerea în timp util a acestora; • eficienţa procesului de observare ; este principiul care presupune înregistrarea doar a datelor cerute prin programul observării şi nu a tuturor datelor posibile despre colectivitatea luată în studiu. În ţara noastră, sistemul informaţional statistic, care produce şi gestionează informaţiile statistice, a fost organizat în perioada 1952-1989 ca un sistem centralizat (Direcţia Centrală de Statistică), iar după 1990, ca un sistem relativ centralizat şi totodată desconcentrat, concretizat în Comisia Naţională pentru Statistică, Direcţii Judeţene pentru Statistică, departamente şi organisme de sinteză. Conform prevederilor legii statisticii (Legea nr. 11/1994) funcţionarea statisticii publice în România trebuie să respecte o serie de principii fundamentale, precum: autonomia metodologică, confidenţialitatea, transparenţa, deontologia statistică. Aceeaşi lege prevede obligativitatea agenţilor economici de a întocmi continuu sau la cerere raportări statistice în forma şi la termenele stabilite, folosind o metodologie unitară de calcul a indicatorilor raportaţi.
2.2. Metode şi lucrări de observare statistică Observarea statistică se realizează prin metode variate generate atât de diversitatea formelor în care există şi se manifestă colectivităţile, cât şi de scopul urmărit, modul de organizare a activităţii social-economice şi posibilităţile practice de cuprindere şi înregistrare a acestora. În funcţie de gradul de cuprindere a colectivităţii se disting: • metoda de înregistrare totală, care constă în înregistrarea caracteristicilor tuturor unităţilor componente ale colectivităţii; • metoda de înregistrare parţială, care constă în înregistrarea caracteristicilor unei părţi (eşantion, colectivitate de selecţie) din colectivitatea care trebuie studiată. Datele înregistrate la nivelul eşantionului se extind apoi, pe baza inferenţei statistice, la întreaga colectivitate căruia îi aparţine. În funcţie de natura colectivităţii şi timpul înregistrării se disting: • metoda de înregistrare curentă, care se foloseşte pentru înregistrarea colectivităţilor de mişcări (fapte şi evenimente). Înregistrarea unităţilor colectivităţii se face permanent, după criteriul 14
cronologic al apariţiei lor, iar volumul colectivităţii se determină prin cumularea unităţilor înregistrate pe o perioadă stabilită. Înregistrarea curentă foloseşte, în special, rapoartele sau dările de seamă statistice; • metoda de înregistrare periodică, care se foloseşte pentru înregistrarea colectivităţilor de stări (fiinţe şi lucruri). Înregistrarea unităţilor colectivităţii se face la anumite momente stabilite, iar volumul colectivităţii se determină prin numărarea unităţilor înregistrate la momentele respective. Înregistrarea periodică poate fi totală (cazul recensământului) sau parţială (cazul sondajului, anchetei statistice); • metoda înregistrărilor ocazionale, care se referă la fenomene cu caracter de discontinuitate. În figura 2.1 sunt prezentate metodele şi lucrările practicate în observarea statistică. Din figură rezultă că rapoartele statistice şi recensământul sunt lucrări de observare totală (prima curentă, iar a doua periodică), iar lucrări de observare parţială, special organizate sunt sondajul, ancheta, observarea părţii principale şi monografia statistică (acestea pot fi periodice, ocazionale sau unice).
Continui
Observări permanente Rapoartele statistice Observări totale
Sondajul statistic
În funcţie de necesităţi: - periodice - unice
Ancheta statistică Observări special organizate Observarea părţii principale
Observări parţiale
Monografia statistică
Periodice
Recensăminte
Fig. 2.1 – Metode şi lucrări practicate în observarea statistică În continuare prezentăm succint aceste lucrări de observare statistică. 15
Recensământul face parte din categoria observărilor special organizate totale. El reprezintă o lucrare ştiinţifică de înregistrare exhaustivă, la un moment dat, a unei colectivităţi de stări. Prin intermediul recensământului se culeg date de la toate unităţile colectivităţii studiate (persoane, animale, locuinţe, întreprinderi etc.). Recensământul bunurilor materiale este întâlnit şi sub denumirea de inventariere statistică . Recensământul, îndeosebi al populaţiei, este o lucrare statistică de amploare, care trebuie riguros organizată şi elaborată şi care trebuie să respecte o serie de principii, între care: - universalitatea, care presupune cuprinderea întregii populaţii a unui teritoriu dat; - periodicitatea, reprezentând necesitatea repetării, la intervale aproximativ egale (de exemplu, în domeniul populaţiei se recomandă să se repete la 10 ani, în domeniul economic la 5 ani, în domeniul animalelor la 1 an etc.). Datorită eforturilor financiare, umane şi materiale care sunt antrenate de recensăminte, perioada dintre ele tinde să se mărească. (Recensământul populaţiei în România s-a desfăşurat după cum urmează: 1859-1860 primul recensământ modern; 1899; 1912; 1930; 1941; 1948; 1956; 1966; 1977; 1992; 2002); - comparabilitatea, care presupune necesitatea asigurării concordanţei metodologice de efectuare în timp şi spaţiu, atât pe plan naţional, cât şi internaţional; - simultaneitatea înregistrării, care presupune înregistrarea tuturor datelor la un moment critic, acelaşi pe întregul teritoriu; - caracterul nelimitativ al caracteristicilor cuprinse în programul observării; - caracterul ştiinţific şi aplicativ general al recensământului. În cazul recensământului populaţiei programul observării statistice trebuie să cuprindă: - date pentru identificarea precisă a persoanelor recenzate; - date referitoare la caracteristicile demografice, economico-sociale, culturale etc.; - alte date solicitate de organele guvernamentale. Datele obţinute cu ajutorul recensămintelor se verifică prin organizarea unor recensăminte de probă, efectuate de aceleaşi organe de statistică. În ţara noastră, în perioada 18-27 martie 2002 s-a efectuat ultimul recensământ al populaţiei şi al locuinţelor. Scopul acestuia a fost de a obţine date statistice privind numărul şi distribuţia teritorială a populaţiei, a structurilor sale demografice şi socio-economice, date referitoare la gospodăriile populaţiei, precum şi la fondul locativ, condiţiile de locuit şi clădirile în care se situează locuinţele. Datele obţinute permit cunoaşterea mai aprofundată a resurselor umane, a forţei de muncă de care dispune societatea românească la începutul mileniului trei, a repartizării populaţiei şi a forţei de muncă în profil teritorial şi pe activităţi economice, a situaţiei gospodăriilor, dar şi a modificărilor intervenite în structura, distribuţia teritorială şi utilizarea fondului locativ, faţă de situaţia înregistrată la recensămintele anterioare din ţara noastră. Raportul statistic (darea de seamă statistică) face parte din categoria observărilor totale permanente bazate pe criteriul cronologic al apariţiei şi manifestării unităţilor colectivităţilor de fapte şi evenimente. Raportul statistic este un document oficial, în cele mai multe cazuri tipizat, elaborat de C.N.S., cu precizarea indicatorilor care se raportează şi a metodologiei de calcul a acestora, a numărului de exemplare în care se completează şi a beneficiarilor, a termenului de predare şi a responsabilităţilor celor care semnează pentru autenticitatea datelor înscrise. Prin raportul statistic fiecare agent economic este obligat să raporteze, la diferite intervale, organelor statului, rezultatele obţinute în activitatea sa într-o anumită perioadă de timp. Sondajul statistic face parte din categoria observărilor statistice special organizate, parţiale. El presupune înregistrarea unui eşantion reprezentativ extras, după principiile selecţiei, din colectivitatea totală. Datele înregistrate asupra eşantionului sunt supuse prelucrării, iar rezultatele obţinute stau la baza estimării informaţiilor asupra populaţiei totale. Sondajul statistic are o arie largă de răspândire, fiind frecvent folosit în cercetarea bugetelor de familie, înregistrarea preţurilor pe piaţa liberă, controlul calităţii produselor, sondarea opiniei publice. Ancheta statistică este tot o observare special organizată, parţială. Ea presupune culegerea datelor pe baza unor chestionare la care indivizii răspund benevol. De regulă cei care intră în 16
posesia chestionarelor nu formează un eşantion reprezentativ şi ca atare, rezultatele anchetei sunt orientative, fără pretenţia de rigurozitate ştiinţifică. În ţara noastră, în anul 1990 a fost înfiinţată o instituţie specializată în studierea opiniei publice, Institutul Român pentru Studierea Opiniei Publice (I.R.S.O.P.), care lucrează prin intermediul sondajelor şi anchetelor statistice. Observarea părţii principale sau observarea masivului principal de date , ca formă de observare parţială special organizată, este folosită pentru studierea unor colectivităţi structurate pe grupe de mărimi şi importanţă diferită. Se înregistrează date doar pentru grupele cu o pondere sau importanţă mare în colectivitatea totală, iar rezultatele obţinute se extind la întreaga populaţie. Monografia este o observare special organizată, prin intermediul căreia se supune investigaţiei statistice numai o singură unitate complexă din colectivitatea totală. Unitatea este supusă unui program de investigare foarte detaliat, pentru a se realiza o cunoaştere multilaterală şi în profunzime a acesteia. Obiectul de studiu al unei monografii îl poate constitui o localitate sau un proces social-economic (industrializarea, colectivizarea, privatizarea etc.). Rezultatele obţinute în cercetările monografice, spre deosebire de restul cercetărilor prin sondaj, nu se extind asupra întregii colectivităţi, ci caracterizează doar obiectul studiat.
2.3. Programul unei observări statistice special organizate Observările statistice special organizate sunt operaţiuni de amploare, care implică importante resurse umane, materiale şi financiare. Pentru a asigura cu cheltuieli minime date care să răspundă cerinţei de autenticitate, de continuitate şi comparabilitate, în timp, în spaţiu şi din punct de vedere calitativ, aceste observări trebuie foarte bine organizate. Orice observare statistică special organizată se desfăşoară după un program care cuprinde atât probleme metodologice, cât şi probleme organizatorice. Problemele metodologice ale programului unei observări statistice special organizate presupun: fixarea scopului observării, delimitarea colectivităţii, definirea unităţilor statistice, alegerea caracteristicilor ce urmează a fi înregistrate, elaborarea formularelor statistice şi alegerea timpului şi locului înregistrării. Fixarea scopului observării este foarte importantă deoarece acest obiectiv se identifică cu scopul întregului demers statistic. Delimitarea colectivităţii se face în timp şi spaţiu, cu ajutorul nomenclatoarelor şi clasificărilor existente sau a unor criterii care să permită delimitarea conform cu scopul observării. Definirea unităţilor statistice constă în determinarea conţinutului esenţial al acestora, a formelor concrete sub care pot fi întâlnite, precum şi a limitelor reale şi convenţionale între care se pot manifesta. Alegerea caracteristicilor ce urmează a fi înregistrate reprezintă o problemă importantă ce trebuie rezolvată deoarece, într-un program de observare statistică nu trebuie cuprinse toate caracteristicile pe care le posedă unităţile colectivităţii studiate, ci doar acelea care concordă cu scopul cercetării. Elaborarea formularelor statistice se face în funcţie de scopul observării. Formularul statistic reprezintă instrumentul tehnic prin care se realizează culegerea datelor noi. În practica observării statistice, formularele se găsesc sub formă de listă sau fişă. Fişa, de regulă, se completează pentru o singură unitate statistică şi se foloseşte atunci când caracteristicile cuprinse în program sunt numeroase sau când unităţile statistice sunt dispersate în spaţiu. Lista este un formular folosit pentru înregistrarea caracteristicilor pentru mai multe unităţi. Atât fişele, cât şi listele se completează după norme metodologice şi tehnice prin care se precizează modul de efectuare a înregistrării. Alegerea timpului înregistrării presupune luarea în considerare a două aspecte: timpul la care se referă datele înregistrate şi timpul în care se efectuează înregistrarea lor. Timpul la care se 17
referă datele este timpul în care există, se manifestă colectivitatea studiată. De obicei el este anterior timpului de înregistrare, existând şi posibilitatea ca el să coincidă cu înregistrarea. Timpul la care se referă datele poate fi un moment critic sau de referinţă (cazul colectivităţilor de fiinţe şi lucruri) sau o perioadă – lună, trimestru, semestru, an (cazul colectivităţilor de fapte şi evenimente). De exemplu, în cazul recensământului populaţiei şi al locuinţelor din 2002, timpul la care se referă datele înregistrate, momentul de referinţă al recensământului a fost ora „0” din ziua de 18 martie. Timpul în care s-a efectuat înregistrarea datelor a fost de 10 zile, în perioada 18-27 martie 2002. Pentru indicatorii de producţie sau vânzări, timpul la care se referă datele este luna, trimestrul, etc., perioadă în care acestea sunt luate în evidenţă prin documentaţia primară, în mod continuu, curent, iar timpul înregistrării, a completării formularelor îl reprezintă primele zile ale perioadei următoare. Locul înregistrării este cel în care există şi se manifestă colectivitatea. Rezolvarea problemelor organizatorice ale programului unei observări statistice special organizate are ca scop favorizarea desfăşurării în cele mai bune condiţii a culegerii datelor. Între cele mai importante probleme organizatorice se numără: • studierea materialelor rezultate din cercetările anterioare; • recrutarea şi instruirea cadrelor care urmează să participe la investigaţia statistică; • elaborarea măsurilor de îndrumare şi control; • organizarea teritoriului în care urmează a se desfăşura observarea; • organizarea activităţilor legate de procesul de înregistrare; • iniţierea unor acţiuni de popularizare asupra scopului observării; • elaborarea devizului lucrării şi asigurarea fondurilor necesare.
2.4. Erorile statistice de observare Eroarea statistică reprezintă diferenţa dintre o dată sau un indicator statistic şi valoarea concretă, reală corespunzătoare. Identificarea erorilor statistice depinde de informaţiile anterioare referitoare la nivelul datelor sau indicatorilor respectivi. În majoritatea cazurilor erorile sunt depistate datorită experienţei statisticienilor. Erorile pot să apară în orice etapă a demersului statistic, drept pentru care ele se clasifică în: - erori de observare; - erori de prelucrare; - erori de analiză şi interpretare. Cele mai des întâlnite sunt erorile de observare sau înregistrare, erori care apar în procesul culegerii datelor statistice. Erorile de prelucrare sunt mai puţin întâlnite, mai ales în condiţiile folosirii tehnicii automatizate şi cibernetizate pentru prelucrarea datelor statistice. Erorile de analiză şi interpretare sunt cele mai grave îndeosebi atunci când rezultatele analizei statistice pe o perioadă expirată sunt folosite în calcule de prognoză. Eroarea de observare reprezintă diferenţa dintre valoarea determinată statistic prin înregistrare (x) şi valoarea reală (x r ) a nivelului caracteristicii înregistrate. • Eroarea absolută (e): e = x - x r • Eroarea relativă ( ε ): ε = e / xr = (x - xr ) / xr sau exprimată
18
procentual ε (%) = (e/xr ) · 100
Eroarea efectivă nu se poate calcula. Pe baza experienţei statisticianului se fixează o ˆ ) pe care eroarea valoare absolută sau relativă denumită eroare maximă admisibilă ( eˆ sau ε efectivă nu o poate depăşi. •
•
Eroarea absolută limită: e = x − x r ≤ eˆ
•
Eroarea relativă limită: ε
=
x − xr xr
ˆ ≤ ε
Erorile de selecţie reprezintă diferenţele dintre valoarea indicatorilor obţinută în urma prelucrării datelor din eşantion şi valoarea aceloraşi indicatori obţinută în urma observării totale. Ele pot fi erori de acoperire şi erori de reprezentativitate. Numărul şi mărimea erorilor de observare depind direct proporţional de volumul colectivităţii observate şi precizia mijloacelor de înregistrare, fiind de asemenea influenţate de gradul de instruire şi competenţă al anchetatorilor şi statisticienilor. Erorile care apar în procesul observării statistice se pot datora obiectului observat, anchetatorului, metodei şi mijloacelor de observare, precum şi influenţei condiţiilor externe în care se realizează înregistrarea. După modul de producere erorile de observare statistică pot fi: - erori întâmplătoare; - erori sistematice; - greşeli. Erorile întâmplătoare sunt involuntare şi se caracterizează prin faptul că diferă între ele atât ca mărime, cât şi ca sens; ca urmare, există posibilitatea compensării lor şi deci influenţa lor asupra rezultatului observării este mică. Erorile sistematice au caracteristic faptul că se produc de regulă într-un singur sens şi pe măsură ce creşte volumul observaţiilor ele se cumulează, contribuind la denaturarea valorii indicatorilor de ansamblu. Greşelile sunt erori grosolane care pot să apară în observările statistice şi care nu pot fi evaluate. În scopul asigurării autenticităţii datelor obţinute într-o observare statistică se acţionează atât pentru prevenirea, cât şi depistarea erorilor. Prevenirea erorilor de observare presupune efectuarea unor operaţii precum: - testarea formulelor şi a tehnicilor de observare; - recrutarea şi instruirea anchetatorilor; - popularizarea lucrărilor de înregistrare statistică. Pentru depistarea erorilor înregistrate datele oricărei observări trebuie supuse controlului statistic, care poate fi: control de volum, control aritmetic, control logic şi control al documentelor de evidenţă primară folosite pentru completarea formularelor. Lucrările de prevenire a erorilor şi de control a datelor înregistrate au în vedere eliminarea sau diminuarea erorilor sistematice şi a greşelilor care pot să apară într-o observare statistică. Alături de acestea, pentru obţinerea unor rezultate cât mai reale, se impune evaluarea cât mai precisă a erorilor întâmplătoare, care rămân şi influenţează în mod inevitabil rezultatele. Preocupări pentru studiul erorilor de înregistrare şi a metodelor de estimare a acestora se întâlnesc încă din secolul al XVIII-lea. Trebuiesc amintite îndeosebi contribuţiile lui Laplace şi Gauss (legea normală a repartiţiei, metoda celor mai mici pătrate, eroarea probabilă a mediei). Controlul datelor statistice face legătura între observarea şi prelucrarea datelor statistice. •
Sumar 19
Observarea statistică sau culegerea datelor este prima etapă a demersului statistic. Ea reprezintă un proces complex de identificare, măsurare şi înregistrare a fenomenelor de tip colectiv, în forma lor concretă şi individuală de manifestare. Observarea statistică se realizează prin metode variate generate atât de diversitatea formelor în care există şi se manifestă colectivităţile, cât şi de scopul urmărit, modul de organizare a activităţii social-economice şi posibilităţile practice de cuprindere şi înregistrare a acestora. În funcţie de gradul de cuprindere a colectivităţii se disting: • metoda de înregistrare totală, care constă în înregistrarea caracteristicilor tuturor unităţilor componente ale colectivităţii; • metoda de înregistrare parţială, care constă în înregistrarea caracteristicilor unei părţi (eşantion, colectivitate de selecţie) din colectivitatea care trebuie studiată. Datele înregistrate la nivelul eşantionului se extind apoi, pe baza inferenţei statistice, la întreaga colectivitate căruia îi aparţine. În funcţie de natura colectivităţii şi timpul înregistrării se disting: • metoda de înregistrare curentă, care se foloseşte pentru înregistrarea colectivităţilor de mişcări (fapte şi evenimente). Înregistrarea unităţilor colectivităţii se face permanent, după criteriul cronologic al apariţiei lor, iar volumul colectivităţii se determină prin cumularea unităţilor înregistrate pe o perioadă stabilită. Înregistrarea curentă foloseşte, în special, rapoartele sau dările de seamă statistice; • metoda de înregistrare periodică, care se foloseşte pentru înregistrarea colectivităţilor de stări (fiinţe şi lucruri). Înregistrarea unităţilor colectivităţii se face la anumite momente stabilite, iar volumul colectivităţii se determină prin numărarea unităţilor înregistrate la momentele respective. Înregistrarea periodică poate fi totală (cazul recensământului) sau parţială (cazul sondajului, anchetei statistice); • metoda înregistrărilor ocazionale, care se referă la fenomene cu caracter de discontinuitate. Întrebări 1. Care sunt principiile care trebuie respectate în procesul observării statistice 2. Care sunt criteriile în funcţie de care se clasifică metodele de observare statistică? Ce clasificări se obţin? 3. Ce este recensământul şi care sunt principiile care stau la baza efectuării lui 4. Precizaţi principalele probleme metodologice şi organizatorice cuprinse în programul unei observări statistice special organizate 5. Tipuri de erori statistice
20
Modulul 3. PRELUCRAREA PRIMARĂ A DATELOR STATISTICE 3.1. Necesitatea prelucrării datelor statistice În urma înregistrării statistice se obţin date individuale cu privire la fenomenul sau procesul observat. Aceste date caracterizează fiecare unitate în parte fără a oferi o imagine a existenţei unor posibile legături între unităţile observate sau între anumite caracteristici ale acestora. Pentru a putea stabili trăsăturile esenţiale comune, relaţiile de interdependenţă dintre fenomene, structura şi modificările structurale intervenite în timp este necesar să se treacă de la datele individuale izolate la un sistem de indicatori cu care se poate caracteriza statistic activitatea studiată. /8, p.43/. Această trecere se face prin procesul de prelucrare statistică. Prelucrarea statistică reprezintă un proces complex în care datele înregistrate îşi pierd individualitatea, prin sistematizare şi tratare statistică, transformându-se în indicatori primari şi derivaţi, în informaţii statistice asupra fenomenelor studiate. În sens restrâns, noţiunea de prelucrare statistică se foloseşte pentru a desemna prelucrarea primară, adică sistematizarea datelor obţinute prin observare.
3.2. Sistematizarea datelor statistice Sistematizarea datelor înregistrate reprezintă prima fază care se realizează în etapa de prelucrare statistică şi vizează obţinerea distribuţiilor (seriilor) statistice. Ea presupune ordonarea datelor în funcţie de omogenitatea lor. Procesul de sistematizare a datelor se desfăşoară ca un ansamblu de operaţii cuprinzând /9, p.50/: a) strângerea tuturor formularelor de înregistrare la locul de prelucrare şi desprinderea din formulare a datelor individuale; b) sortarea şi totalizarea datelor la nivelul întregii colectivităţi sau pe grupe de unităţi omogene. Din punct de vedere organizatoric, sistematizarea datelor statistice se poate realiza descentralizat şi centralizat. Sistematizarea descentralizată a datelor statistice presupune realizarea operaţiunilor la nivelul unităţilor teritorial administrative (Direcţii Judeţene de Statistică), la nivel departamental sau într-un sistem informaţional independent. Sistematizarea centralizată presupune realizarea operaţiunilor de prelucrare primară direct la Comisia Naţională pentru Statistică. Indiferent de nivelul la care se realizează sistematizarea, indicatorii obţinuţi ajung la Comisia Naţională pentru Statistică şi, prin urmare, ea trebuie să se realizeze după o metodologie unică, elaborată de organul central de statistică. 3.2.1. Procedee de sistematizare Sistematizarea datelor se realizează prin două procedee: centralizarea şi gruparea statistică. Centralizarea datelor statistice presupune totalizarea unităţilor statistice sau a valorilor unei caracteristici la nivelul grupelor tipice sau al colectivităţii observate. Din acest proces rezultă indicatori statistici de nivel (exemplu: numărul de autoturisme dintr-un judeţ la un moment dat, numărul de căsătorii dintr-un judeţ într-o anumită perioadă). 21
Deoarece, în cercetările statistice, interesează nu doar indicatorii totalizatori, de ansamblu ai unei colectivităţi, ci şi structura acesteia, mutaţiile de structură şi contribuţia factorilor la aceste modificări, se procedează la sistematizarea datelor prin grupare. Gruparea statistică reprezintă o centralizare pe grupe omogene a unităţilor unei colectivităţi după variaţia uneia sau a mai multor caracteristici de grupare. Din acest proces rezultă şiruri de date ordonate după variaţia caracteristicilor de grupare. Metoda grupării statistice este folosită în toate domeniile de activitate, adesea putând să aibă un caracter permanent şi oficial şi regăsindu-se astfel în publicaţiile statistice.
3.2.2. Tipologia grupărilor statistice Grupările statistice se pot clasifica după diverse criterii. Astfel: a) după natura caracteristicii de grupare se întâlnesc grupări cronologice, grupări teritoriale şi grupări calitative. a1) Grupările cronologice sunt cele rezultate în urma folosirii drept caracteristică de grupare a unei variabile de timp (exemplu: sistematizarea colectivităţii agenţilor economici dintr-un judeţ după caracteristica anul înfiinţării). a2) Grupările teritoriale se obţin în urma separării colectivităţii în grupe după o caracteristică de spaţiu. Cele mai întâlnite sunt grupările pe judeţe sau regiuni în statistica naţională şi grupările pe ţări în statistica internaţională. a3) Grupările calitative se obţin prin separarea unităţilor unei colectivităţi în grupe omogene după o caracteristică calitativă. La rândul lor, grupările calitative se diferenţiază, după forma de exprimare a caracteristicii, în grupări după o caracteristică calitativă exprimată cifric şi grupări după o caracteristică calitativă exprimată atributiv (prin cuvinte). • Gruparea după o caracteristică calitativă exprimată cifric conduce la obţinerea unor şiruri de date sistematizate pe baza cărora se calculează indicatorii statistici derivaţi şi se poate efectua: - pe variante de variaţie, în cazul caracteristicilor discrete (variantele de variaţie sunt exprimate în numere întregi), când amplitudinea variaţiei este foarte mică şi numărul variantelor caracteristicii de grupare este redus. De exemplu: gruparea studenţilor dintr-un an de studiu după nota obţinută la un examen; gruparea apartamentelor dintr-un bloc după numărul camerelor componente; - pe intervale de variaţie, în cazul caracteristicilor continue cu un număr mare de valori. De exemplu: grupare populaţiei unei ţări după vârstă. Intervalele pot fi egale (de exemplu gruparea populaţiei pe intervale cincinale: 0-4, 5-9, 1014,.... folosită în calcule demografice cu caracter general) sau neegale, caz în care grupările se numesc şi tipologice (de exemplu, gruparea populaţiei pe grupe tipice, în populaţie tânără – intervalul 1-19 ani, populaţie adultă – intervalul 20-59 ani şi populaţie vârstnică – 60 de ani şi peste). • Gruparea după o caracteristică calitativă exprimată atributiv mai poartă denumirea de clasificare . Când caracteristica de grupare prezintă o gamă largă de variante, acestea sunt cuprinse în nomenclatoare. Nomenclatoarele sunt elaborate de Comisia Naţională pentru Statistică şi se revizuiesc periodic, putând să apară grupe noi sau altele să dispară. Clasificările statistice se elaborează pe baza nomenclatoarelor specifice statisticilor naţionale şi internaţionale. b) după numărul caracteristicilor de grupare se întâlnesc grupări simple şi grupări combinate. b1) grupările simple sunt cele care se obţin prin separarea unităţilor unei colectivităţi după variaţia unei singure caracteristici cuprinse în programul observării statistice. De exemplu: gruparea studenţilor dintr-un an de studiu după caracteristica religie; gruparea agenţilor economici dintr-un judeţ după cifra de afaceri. 22
b2) grupările combinate sau complexe presupun separarea unităţilor unei colectivităţi după variaţia simultană a două sau mai multe caracteristici de grupare. Aceste grupări sunt utilizate în vederea interpretării interdependenţei statistice dintre fenomene. Tehnica grupării combinate constă în delimitarea grupelor după o caracteristică primară, după care se divid în subgrupe după o caracteristică secundară ş.a.m.d. De exemplu, studierea întreprinderilor industriale dintr-un judeţ după mărime presupune gruparea lor după mai multe caracteristici între care: capitalul fix investit, numărul angajaţilor, cifra de afaceri. Nu se recomandă folosirea unui număr prea mare de caracteristici la obţinerea grupărilor combinate, pentru a nu se fărâmiţa prea mult colectivitatea şi a nu se pierde din esenţialitatea fiecărei grupe în întregul ansamblu. În practica statistică numărul de caracteristici folosite simultan în grupare nu depăşeşte 4-5, deşi mărirea acestuia conduce la creşterea gradului de omogenitate al unităţilor cuprinse în grupe. Grupările combinate se pot realiza atât pentru caracteristici cifrice, cât şi atributive. De exemplu, întreprinderile industriale pot fi grupate pe ramuri de activitate, iar în cadrul acestor grupe după cifra de afaceri sau după capitalul fix investit.
3.2.3. Probleme ale grupării statistice Realizarea unor grupări corecte reprezintă o problemă metodologică importantă a statisticii, de calitatea sa depinzând valoarea informaţiilor rezultate. Se impune astfel ca grupările statistice să se realizeze pe baza unei analize complexe privind cantitatea şi calitatea fenomenelor investigate. Această analiză presupune: a) precizarea scopului pentru care se face gruparea. Acesta concordă cu obiectul cercetării. Aceleaşi date statistice pot fi grupate diferit, fie pentru sistematizarea materialului brut în vederea prelucrării, fie pentru analiza directă, în cazul grupelor tipice bine conturate; b) selectarea şi combinarea caracteristicilor de grupare, a acelor caracteristici după care se face separarea unităţilor colectivităţii în grupe omogene; c) alegerea numărului de grupe în care urmează să se împartă unităţile colectivităţii se bazează pe analiza fenomenului şi trebuie să răspundă scopului pentru care se face gruparea. Există mai multe posibilităţi de stabilire a numărului de grupe [sau intervale (k)]. Astfel: · D.V. Huntsbergs propune relaţia: k = 1+3,31·log n, în care n este numărul unităţilor din colectivitate; · Brooks şi Carruthers propun relaţia: k < 5 log n · Croxton şi Cowden propun ca numărul de grupe să fie cuprins între şase şi şaisprezece. De multe ori se apelează la experienţa statisticianului în vederea alegerii numărului de grupe în care se împart colectivităţile studiate. d) determinarea mărimii intervalului de variaţie , în cazul caracteristicilor exprimate cifric, se face în funcţie de amplitudinea de variaţie a caracteristicii şi de numărul de grupe în care se sistematizează datele. Relaţia de calcul este: l = Ax /k = (x max - xmin) / k
în care: l = mărimea intervalului; Ax = amplitudinea de variaţie a caracteristicii; xmax, xmin = valoarea maximă, respectiv minimă a caracteristicii de grupare „X”; k = numărul de grupe.
23
În cazul colectivităţilor de volum mare pentru grupările ce folosesc caracteristici cu o amplitudine mare a variaţiei, mărimea intervalului de variaţie se determină folosind formula lui Sturges, propusă în anul 1926: l = xmax – xmin / 1 + 3,322 log n în care: n este numărul unităţilor din colectivitate e) delimitarea grupelor de variaţie şi separarea unităţilor pe intervale presupune rezolvarea problemei limitelor intervalelor. În cazul în care limita superioară a unui interval coincide cu limita inferioară a intervalului următor, pentru evitarea includerii unor unităţi în ambele intervale, se impune întocmirea unei note care să precizeze limita inclusă în interval. Intervalele pot fi închise, cu ambele limite precizate, sau deschise, când este precizată doar o limită (superioară sau inferioară). Prelucrarea statistică presupune închiderea intervalelor. Aceasta se face astfel: - când intervalele de grupare sunt egale, intervalul deschis se închide la aceeaşi mărime cu intervalele închise; - când intervalele de grupare sunt inegale, intervalele deschise se închid luând mărimea primului interval închis alăturat. Separarea unităţilor colectivităţii pe intervale de variaţie reprezintă aflarea frecvenţei de distribuţie. Datele sistematizate prin grupare se înscriu în tabele statistice. Indiferent de scopul şi obiectul sistematizării, grupările trebuie să îndeplinească mai multe condiţii, printre care cele mai importante sunt /8, p.51/: • completitudinea datelor , adică realizarea grupării se face folosind totalitatea unităţilor observate sau un număr suficient de mare de date, care să asigure reprezentativitatea colectivităţii studiate; • omogenitatea grupelor şi subgrupelor , folosind în acest scop variabile esenţiale de grupare, care să asigure o variaţie minimă între valorile caracteristicilor numerice sau a formelor de manifestare concretă a caracteristicilor pentru toate unităţile din aceeaşi grupă sau subgrupă; • unicitatea includerii unităţilor într-o singură clasă dacă gruparea este simplă, sau într-o singură grupă dacă este o grupare combinată. această condiţie este necesar să fie respectată, deoarece există cazuri, în special pentru unităţile complexe, care pot fi încadrate în acelaşi timp la două sau mai multe grupe pentru valorile numerice care coincid cu una din limitele intervalelor dacă ele se prezintă cu variaţie continuă. În astfel de situaţii pentru a evita înregistrările repetate, trebuie să se stabilească anumite convenţii cu care să se trateze în mod unitar rezolvarea acestor cazuri particulare; • continuitatea variaţiei grupelor în cazul variabilelor numerice, ceea ce practic înseamnă că nu există grupe cu frecvenţe nule care ar duce la întreruperea grupării. Dacă gruparea utilizată îndeplineşte în acelaşi timp aceste condiţii, este o grupare taxonomică şi deci poate fi realizată cu ajutorul prelucrării automatizate.
3.2.4. Clasificări folosite în statistica macroeconomică Statistica macroeconomică are ca sarcină principală determinarea indicatorilor pe întreaga economie. Cadrul conceptual al statisticii macroeconomice este asigurat de sistemul metodologiilor statistice, însoţit de sistemul clasificărilor şi nomenclatoarelor statistice. Fără o concepţie unitară a acestora nu se pot efectua calculele indicatorilor, analizele la nivelul economiei naţionale, comparaţiile internaţionale. În cadrul acţiunilor de armonizare şi aliniere la standardele internaţionale, de actualizare permanentă a strategiei de dezvoltare a sistemelor informaţionale în conformitate cu priorităţile 24
naţionale şi cu tendinţele mondiale, Comisia Naţională pentru Statistică este autorizată să stabilească nomenclatoarele şi clasificările de interes general utilizate la colectarea, prelucrarea, analiza şi diseminarea datelor economico-sociale prin care se asigură caracterizarea corectă şi completă a economiei naţionale, precum şi furnizarea de date comparabile organismelor internaţionale. În acest context, între cele mai importante clasificări realizate de către Comisia Naţională pentru Statistică se află Clasificarea activităţilor din economia naţională (CAEN) şi Clasificarea produselor şi serviciilor asociate activităţilor (CPSA) , adoptate prin HG nr. 656/1997, respectiv HG nr. 53/1999. În baza actelor normative menţionate, utilizarea celor două clasificări este obligatorie pentru întregul sistem instituţional, agenţi economici cu capital majoritar de stat sau privat, organizaţii patronale, profesionale, politice, sindicale, asociaţii şi alte persoane juridice şi fizice care îşi desfăşoară activitatea pe teritoriul României, în toate documentele oficiale care se referă la activitatea desfăşurată sau la produsele şi serviciile realizate. Clasificarea activităţilor din economia naţională are ca obiect stabilirea unui cadru unitar de grupare a tuturor activităţilor economice şi sociale în raport cu natura şi funcţiile pe care le îndeplinesc în sistemul diviziunii sociale a muncii, pe categorii omogene de clasificare din punct de vedere al activităţilor cuprinse în ele. CAEN nu se constituie într-o clasificare a ramurilor şi subramurilor economiei naţionale, ci într-o grupare univocă a tuturor activităţilor, după genul acestora, pe categorii de clasificare cât mai omogene. Ca urmare, există atât situaţii în care categoriile de clasificare se identifică cu ramurile şi subramurile, cât şi situaţii în care ramurile se constituie din mai multe categorii de clasificare, prin agregare. Clasificarea CAEN reprezintă o expresie a disponibilităţii de armonizare şi aliniere a sistemului de clasificări românesc la sistemul clasificărilor internaţionale. Clasificarea CAEN este derivată din Nomenclatorul Activităţilor din Comunitatea Europeană (NACE) şi prin tabele de corespondenţă se asigură legătura cu Clasificarea Internaţională Standard a Activităţilor elaborată de organismele de specialitate ale ONU (CITI). În CAEN, activităţile economico-sociale sunt grupate pe cinci trepte (secţiuni, subsecţiuni, diviziuni, grupe şi clase), constituite după principiul omogenităţii, ca totalitate de activităţi care au drept caracteristici comune: - natura bunurilor şi serviciilor prestate (componenţa lor fizică, stadiul de fabricaţie, necesităţile pe care le pot satisface); - modul de folosire a bunurilor şi serviciilor de către agenţii economici (consum intermediar, consum final, formarea capitalului etc.); - materia primă, procesele tehnologice, organizarea şi finanţarea producţiei. Importanţa acestor caracteristici variază în funcţie de gradul de detaliere a categoriilor din CAEN. Cele 5 trepte de grupare sunt codificate după cum urmează: - secţiunea - 1 literă 19 entităţi - subsecţiunea - 2 litere 34 entităţi - diviziunea - 2 cifre 60 entităţi - grupa - 3 cifre 226 entităţi - clasa - 4 cifre 546 entităţi Exemplu: Secţiunea D = Industria extractivă Subsecţiunea DB = Industria extractivă de produse neenergetice Diviziunea 14 = Alte activităţi extractive Grupa 141 = Extracţia minereurilor pentru industria materialelor de construcţii Clasa 1411 = Extracţia pietrei pentru construcţii 1412 = Extracţia pietrei calcaroase, gipsului şi a cretei 25
1413 = Extracţia de ardezie C.A.E.N. permite clasificarea tuturor activităţilor din economia naţională, pe 19 secţiuni, după cum urmează:
Secţiunea A B C D E F G H I J K L M N O P R S T
Denumirea activităţii - Agricultură - Silvicultură, exploatare forestieră şi economia vânatului - Pescuit şi piscicultură - Industrie extractivă - Industrie prelucrătoare - Energie electrică şi termică, gaze şi apă - Construcţii - Comerţ cu ridicata şi cu amănuntul, repararea şi întreţinerea autovehiculelor, motocicletelor şi a bunurilor personale şi casnice - Hoteluri şi restaurante - Transport şi depozitare - Poşta şi telecomunicaţii - Activităţi financiare, bancare şi de asigurare - Tranzacţii imobiliare, închirieri şi activităţi de servicii prestate în principal întreprinderilor - Administraţie publică - Învăţământ - Sănătate şi asistenţă socială - Alte activităţi de servicii colective, sociale şi personale - Activităţi ale personalului angajat în gospodării personale - Activităţi ale organizaţiilor şi organismelor extrateritoriale
Clasificarea activităţilor din economia naţională serveşte în calculele macroeconomice la caracterizarea proceselor de producţie, la echilibrarea resurselor şi a utilizărilor de bunuri şi servicii.
Sumar Prelucrarea statistică reprezintă un proces complex în care datele înregistrate îşi pierd individualitatea, prin sistematizare şi tratare statistică, transformându-se în indicatori primari şi derivaţi, în informaţii statistice asupra fenomenelor studiate. Sistematizarea datelor înregistrate reprezintă prima fază care se realizează în etapa de prelucrare statistică şi vizează obţinerea distribuţiilor (seriilor) statistice. Ea presupune ordonarea datelor în funcţie de omogenitatea lor. Sistematizarea datelor se realizează prin două procedee: centralizarea şi gruparea statistică. Centralizarea datelor statistice presupune totalizarea unităţilor statistice sau a valorilor unei caracteristici la nivelul grupelor tipice sau al colectivităţii observate. Din acest proces rezultă indicatori statistici de nivel (exemplu: numărul de autoturisme dintr-un judeţ la un moment dat, numărul de căsătorii dintr-un judeţ într-o anumită perioadă). Gruparea statistică reprezintă o centralizare pe grupe omogene a unităţilor unei colectivităţi după variaţia uneia sau a mai multor caracteristici de grupare. Din acest proces rezultă şiruri de date ordonate după variaţia caracteristicilor de grupare. Grupările statistice se pot clasifica după diverse criterii. Astfel: a) după natura caracteristicii de grupare se întâlnesc grupări cronologice, grupări teritoriale şi grupări calitative. 26
b) după numărul caracteristicilor de grupare se întâlnesc grupări simple şi grupări combinate. Tehnica grupării combinate constă în delimitarea grupelor după o caracteristică primară, după care se divid în subgrupe după o caracteristică secundară ş.a.m.d. Grupările combinate se pot realiza atât pentru caracteristici cifrice, cât şi atributive. Grupările statistice trebuie să se realizeze pe baza unei analize complexe privind cantitatea şi calitatea fenomenelor investigate. Această analiză presupune: a) precizarea scopului pentru care se face gruparea b) selectarea şi combinarea caracteristicilor de grupare c) alegerea numărului de grupe d) determinarea mărimii intervalului de variaţie e) delimitarea grupelor de variaţie şi separarea unităţilor pe intervale
Întrebări 1. În ce constă sistematizarea datelor statistice şi care sunt procedeele de sistematizare 2. Care sunt condiţiile pe care trebuie să le îndeplinească grupările statistice 3. Prezentaţi schematic tipologia grupărilor statistice
Aplicaţii rezolvate şi propuse Aplicaţia 1. Asupra unui eşantion de 60 de muncitori care lucrează într-o întreprindere industrială s-au înregistrat următoarele date cu privire la vechimea în muncă, în ani împliniţi (date convenţionale): 21 25 26 19 25 22 20 28 27 35 10 15 17 19 19 26 7 13 15 7 7 10 12 7 10 13 13 16 16 16 21 23 21 23 23 39 30 7 12 12 2 1 16 19 23 32 15 22 19 23 32 22 27 17 21 19 22 27 17 17 Se cere să se sistematizeze datele prin grupare pe variante de variaţie şi pe 7 intervale de variaţie egale. a) Gruparea pe variante de variaţie (x i) presupune ordonarea datelor în sens crescător sau descrescător şi obţinerea frecvenţei de apariţie a fiecărei variante. Rezultatele obţinute sunt prezentate în tabelul 3.1. Sistematizarea datelor pe variante de variaţie
Tabelul 3.1 Număr muncitori ni 1 1 5 3 3 3 3 4 4
Vechimea în muncă (ani) xi 1 2 7 10 12 13 15 16 17 27
19 20 21 22 23 25 26 27 28 30 32 35 39 Total
6 1 4 4 5 2 2 3 1 1 2 1 1 60
b) Gruparea pe intervale egale de variaţie, în cazul în care se cunoaşte numărul de grupe (k=7), presupune aflarea, mai întâi, a mărimii intervalului de variaţie (l), conform formulei: l = Ax / k = (xmax – xmin) / k = (39-1) / 7 = 5,43 ≈ 6 ani Dacă nu se cunoaşte numărul de grupe, mărimea intervalului se determină conform formulei lui Sturges: l = Ax / (1+3,322·log60) = 38 / (1+3,322·log60) = 5,5 ≈ 6 ani Deoarece mărimea intervalului determinată prin cele două metode este aproximativ egală, se apreciază că numărul de grupe (k=7) este stabilit corect, în concordanţă cu amplitudinea de variaţie a caracteristicii şi cu volumul eşantionului Urmează apoi delimitarea grupelor de variaţie şi separarea unităţilor pe intervale de variaţie, adică determinarea frecvenţei pe fiecare interval. Rezultatele obţinute sunt prezentate în tabelele 3.2 – 3.5 şi reprezintă distribuţia muncitorilor din eşantionul observat după caracteristica „vechime în muncă”.
Varianta I - Tabelul 3.2 Vechimea în Număr muncă (ani) muncitori xi ni 0-6 2 6-12 8 12-18 17 18-24 20 24-30 8 30-36 4 36-42 1 Total 60 Notă: limita inferioară este inclusă în interval.
Varianta II - Tabelul 3.3 Vechimea în Număr muncă (ani) xi muncitori ni 0-6 2 6-12 11 12-18 14 18-24 20 24-30 9 30-36 3 36-42 1 Total 60 Notă: limita superioară este inclusă în interval.
Varianta III - Tabelul 3.4 Vechimea în Număr
Varianta IV - Tabelul 3.5 Vechimea în Număr 28
muncă (ani) xi 0-5 6-11 12-17 18-23 24-29 30-35 36-41 Total
muncitori ni 2 8 17 20 8 4 1 60
muncă (ani) xi 1-6 7-12 13-18 19-24 25-30 31-36 37-42 Total
muncitori ni 2 11 14 20 9 3 1 60
Aplicaţia 2 Asupra unui eşantion de 50 de studenţi dintr-o facultate s-au înregistrat următoarele date cu privire la sex, limba străină studiată şi vârstă (date convenţionale), prezentate în tabelul 3.6. Nr. crt. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Sexul F F M M F M F M M F F F M M F F M M M F F F M F M
Limba străină engleză franceză germană germană engleză franceză franceză germană engleză engleză franceză germană germană germană engleză germană germană engleză engleză germană germană engleză germană engleză engleză
Vârsta (ani) 19 20 19 20 21 22 19 26 28 22 24 30 20 19 19 20 21 22 23 29 20 20 22 24 22
Nr. crt. 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
Sexul F F F M M M F F M F F M F F M M M M M M M M M M M
Tabelul 3.6 Limba Vârsta străină (ani) engleză 26 germană 27 germană 27 engleză 21 franceză 21 germană 23 germană 23 franceză 27 engleză 28 germană 30 germană 30 germană 30 engleză 23 franceză 19 franceză 20 engleză 20 engleză 21 engleză 28 germană 28 engleză 22 germană 29 engleză 24 franceză 29 germană 25 engleză 25
Se cere să se sistematizeze datele după variaţia fiecărei caracteristici în parte, cu precizarea tipului acestora; sistematizarea după caracteristica numerică se va face pe variante de variaţie şi pe 5 intervale de variaţie egale. 29
30
Modulul 4. PREZENTAREA DATELOR STATISTICE Datele statistice se prezintă sub formă de: - serii statistice; - tabele statistice ; - grafice.
4.1. Serii statistice Seriile (distribuţiile) statistice reprezintă rezultatul sistematizării datelor prin grupare. Seria statistică este o corespondenţă între două şiruri de date statistice sistematizate într-o succesiune logică, în care primul şir reprezintă variaţia caracteristicii de grupare (valorile sau variantele caracteristicii, intervalele de valori sau grupele de variante, momentele sau intervalele de timp, unităţile teritoriale etc.), iar cel de-al doilea şir reprezintă rezultatul centralizării frecvenţelor de apariţie şi/sau a valorilor caracteristicii de grupare. Seriile statistice se pot clasifica în funcţie de numărul şi de natura (conţinutul) caracteristicilor de grupare: a) După numărul caracteristicilor de grupare, seriile statisticii pot fi univariate (se mai numesc şi serii unidimensionale sau serii independente), bivariate şi multivariate (serii statistice condiţionate). Seriile statistice univariate rezultă din sistematizarea datelor după o singură caracteristică, iar seriile statistice bivariate şi multivariate rezultă din sistematizarea datelor simultan după două sau mai multe caracteristici. Cele mai des întâlnite şi utilizate sunt seriile univariate şi bivariate. b) După natura caracteristicii de grupare, seriile statistice pot fi : cronologice, teritoriale şi calitative. Seriile statistice cronologice, numite şi serii de timp sau dinamice sunt cele provenite dintr-o grupare cronologică şi arată evoluţia unui fenomen în timp. Forma generală de prezentare a unei serii cronologice este redată în tabelul 4.1. Tabelul 4.1 Nivelul caracteristicii (yi)
Caracteristica de timp (ti) 0 1 2 : i : n
y0 y1 y2 : yi : yn
În funcţie de natura colectivităţii care se studiază în timp, seriile statistice cronologice pot fi de momente, care prezintă variaţia unei colectivităţi de stări (fiinţe, lucruri) şi în care nivelurile caracteristicii nu se pot cumula, însumarea acestora fiind lipsită de sens şi serii statistice cronologice de intervale, care prezintă variaţia unei colectivităţi de mişcări (fapte, evenimente) şi în care nivelurile caracteristicii se pot cumula. 31
Seriile statistice teritoriale sau de spaţiu sunt cele provenite dintr-o grupare teritorială şi exprimă variaţia unui fenomen în teritoriu. Forma generală de prezentare a unei serii teritoriale este redată în tabelul 4.2. Tabelul 4.2 Nivelul caracteristicii ni
Unităţi teritoriale xi A B C : I : Z
na nb nc : ni : nz
Seriile teritoriale sunt utilizate în statisticile naţionale şi internaţionale, pentru sistematizarea informaţiilor statistice pe judeţe, ţări sau alte forme teritorial administrative. Nivelurile caracteristicii într-o serie teritorială se pot însuma. Seriile statistice calitative sunt rezultatul grupării după caracteristici calitative. Ele pot fi : • cu caracteristica exprimată atributiv (prin cuvinte); • cu caracteristica exprimată cifric, fie pe variante de variaţie (caracteristică discretă), fie pe intervale de variaţie (caracteristică discretă). Forma generală de prezentare a unei serii calitative este redată în tabelul 4.3.
Caracteristică calitativă xi x1 x2 x3 : xi : xn
Tabelul 4.3 Frecvenţa de apariţie ni n1 n2 n3 : ni : nn
Orice valoare (xi) a caracteristicii de grupare cu frecvenţa sa de apariţie (n i) formează termenul seriei (xini), elementul de bază al seriei statistice. Şirul frecvenţelor într-o serie se poate exprima atât în mărimi absolute, reprezentând frecvenţele absolute, notate prin ni, cât şi în mărimi relative, reprezentând frecvenţele relative, notate prin f i. În cazul seriile statistice univariate, frecvenţele relative se calculează conform relaţiilor : • f i = ni/∑ni , când se exprimă sub forma de coeficient; • f i = ni/∑ni ⋅ 100 , când se exprimă sub formă procentuală; • ∑f i = 1 sau ∑f i = 100%. Alături de seriile prezentate se mai întâlnesc şi serii descriptive, care reprezintă liste cuprinzând înşiruirea unităţilor statistice şi valorile corespunzătoare ale caracteristicii studiate. De exemplu, lista alfabetică a candidaţilor admişi la facultate cu media obţinută la examenul de admitere. 32
4.2. Tabele statistice Tabelele statistice reprezintă o formă raţională de prezentare a datelor statistice şi sunt utilizate în toate etapele cercetării statistice. Prezentarea datelor în tabele statistice permite atât o vizualizare comodă, cât şi posibilitatea sistematizării lor în vederea aplicării procedeelor de calcul a indicatorilor derivaţi. Principalele elemente ale unui tabel statistic sunt : - titlul general, care se notează deasupra tabelului şi trebuie să fie scurt, clar şi complet, definind exact colectivitatea şi caracteristicile studiate; - macheta tabelului este formată dintr-o reţea de linii paralele, orizontale şi verticale, care definesc rândurile şi coloanele. La întretăierea dintre rânduri şi coloane se formează rubricile tabelului, care conţin obligatoriu date numerice şi denumiri textuale. Când pentru anumite rubrici nu se cunosc datele ce ar trebui înscrise, acestea se completează cu trei puncte (…), iar dacă nu există date se completează cu o linie orizontală (-); - titlurile interioare sunt notate în capul liniilor şi coloanelor tabelului şi trebuie să fie exprimate clar şi concis; - unitatea de măsură în care se exprimă datele prezentate în tabel se precizează în titlul general, când este aceeaşi pentru toate elementele sau în titlurile interioare, când în tabel sunt prezentate elemente exprimate diferit; - notele explicative însoţesc tabelul statistic atunci când este necesar să se precizeze sursa de informaţii sau observaţii cu privire la noţiunile folosite, metodologia de calcul a indicatorilor etc. Tabelele statistice sunt extrem de variate, întocmindu-se în funcţie de scopul prelucrării sau analizei statistice. Cel mai adesea tabelele statistice sunt utilizate pentru prezentarea seriilor statistice. Astfel, pentru prezentarea unei serii statistice univariate se foloseşte tabelul simplu (tabelul 4.4 si 4.5), iar pentru prezentarea unei serii bivariate se foloseşte tabelul cu dublă intrare (tabelul 4.6).
Caracteristica xi x1 x2 : xi : xm TOTAL
Tabelul 4.4 Frecvenţa absolută ni n1 n2 : ni : nm
Caracteristica xi x1 x2 : xi : xm TOTAL
∑ni = n
yj
y1
∑f i = 1
Tabelul 4.6 y2 …… yj ……yp ni·
xi x1
n11 n12 ..….n1j……n1p 33
Tabel 4.5 Frecvenţa relativă f i f 1 f 2 : f i : f m
n1·
x2 : xi : xm n⋅ j
n21 : ni1 : nm1 n⋅ 1
n22……n2j……n2p : : : ni2……nij……nip : : : nm2……nmj….nmp n⋅ 2……n⋅ j…..n⋅ p
n2· : ni· : nm· n..
în care: nij – reprezintă efectivul care poartă simultan nivelul i al caracteristicii X şi nivelul j al caracteristicii Y; ni· , respectiv n·j reprezintă efectivele marginale; n.. – reprezintă volumul colectivităţii studiate.
4.3. Grafice statistice Reprezentarea grafică a seriilor statistice este o metodă des folosită în teoria şi practica statistică care permite vizualizarea informaţiilor, sesizarea mai uşoară a ansamblului de date cu privire la variaţia valorilor observate, a legăturilor care există între ele, a evoluţiei lor în timp etc. De asemenea, permite observarea facilă a proporţiilor şi rapoartelor în care se află datele reprezentate. Prin puterea de sugestie reprezentările grafice sunt folosite în popularizarea datelor statistice, în informarea opiniei publice asupra unor fenomene economice, sociale, politice etc. Ele au avantajul de a prezenta într-o formă simplă, sugestivă şi atrăgătoare trăsăturile esenţiale ale fenomenelor în condiţii determinate de timp şi spaţiu. Într-o accepţiune generală, graficele constau în exprimarea datelor statistice din tabele prin linii sau puncte, figuri geometrice, simboluri şi alte mijloace specifice /8,p.72/. Graficele îndeplinesc următoarele funcţii mai importante /14,p.39/ : - funcţia de prezentare a unui masiv de date într-o formă intuitivă; - funcţia de popularizare a unor fenomene din diverse sectoare de activitate; - funcţia de analiză. Graficele sunt folosite în statistică atât ca o metodă de prezentare a rezultatelor cercetărilor statistice, cât şi ca mijloc de alegere a metodelor şi procedeelor de calcul statistic şi ca instrument de analiză şi interpretare a fenomenelor studiate. Întocmirea corectă a unui grafic statistic presupune respectarea următoarelor elemente de bază : titlul graficului, legenda, inclusiv notele explicative, reţeaua graficului, scara de reprezentare, sursa de informaţii a datelor din grafic. Titlul graficului trebuie să fie scurt, clar, precis şi complet şi dacă este posibil să reproducă titlul tabelului statistic ale cărui date le reprezintă. De regulă, este plasat sub figura graficului, iar dacă acesta face parte dintr-un text, titlul poate fi inclus în fraza ce precede graficul. Legenda şi notele explicative se utilizează pentru a defini concis anumite simboluri folosite în reprezentarea grafică sau pentru a atenţiona asupra aspectelor metodologice ale calculării indicatorilor reprezentaţi şi a modului de prezentare a lor în grafic. Reţeaua graficului se constituie în general dintr-un sistem de linii paralele orizontale, verticale, oblice, cercuri concentrice, sectoare de cerc cu rolul de a plasa corect punctele pe grafic. În reprezentarea grafică a fenomenelor social-economice se folosesc reţele rectangulare (ortogonale), reţele curbilinii şi reţele suplimentare. În cele mai multe cazuri, pentru construirea graficelor se apelează la sistemul coordonatelor rectangulare . În acest sistem poziţionarea unui punct în plan se face în raport cu două axe perpendiculare (abscisa punctului – axa x-ilor şi ordonata punctului – axa y-ilor) care definesc patru cadrane (vezi figura 4.1).
34
+ y Cadranul II x’
Cadranul I
-
+ Cadranul III
x
Cadranul IV
- y’ Fig. 4.1 - Sistemul de coordonate rectangulare În mod frecvent, la construirea graficelor se foloseşte numai cadranul I şi uneori cadranele I şi IV împreună. În sistemul de axe rectangulare fiecare punct este determinat în mod unic prin cele două coordonate (x i,yi). Scara de reprezentare /8,p.74-75/ se alege ţinând seama de ordinul de mărime al indicatorilor de reprezentat, de gradul şi forma de variaţie dintre ei şi de scopul urmărit. Scara de reprezentare este o linie ale cărei puncte pot fi citite ca numere bine determinate. Ea se compune dintr-o linie care se numeşte suportul scării şi dintr-un şir de puncte nenumerotate cu ajutorul cărora se realizează diviziunea liniei. Diviziunile scării sunt numerele care corespund punctelor extreme ale scării. Lungimea scării este întreaga distanţă dintre punctele extreme ale scării. Alegerea unităţii de lungime a scării se face în funcţie de spaţiul destinat figurii graficului şi în aşa fel încât să se surprindă forma reală de variaţie a indicatorilor de reprezentat. Dacă se prezintă corelat mai multe caracteristici statistice, atunci scările de reprezentare trebuie să fie astfel stabilite, încât să poată cuprinde toate valorile indicatorilor şi să redea într-o formă armonioasă proporţia reală dintre ele. Pe suportul scării se trec numai valorile care marchează distanţele proporţionale cu unitatea de măsură a scării de reprezentare. Distanţa dintre două puncte învecinate de pe suportul scării poartă numele de interval grafic, iar diferenţa dintre valorile numerice ale acestor puncte reprezintă intervalul numeric. Scările pot fi: rectilinii şi curbilinii, după cum suportul este o dreaptă sau o curbă. Pentru a putea reda cât mai fidel imaginea reală a fenomenelor studiate, se pot folosi scări uniforme, la care diviziunile de pe suportul scării sunt echidistante între ele, şi scări neuniforme, ca de exemplu, scara logaritmică la care diviziunile suportului sunt fixate în funcţie de valoarea logaritmică a indicatorilor. În practică, cel mai adesea se foloseşte scara uniformă care trebuie să îndeplinească unele condiţii: • unitatea de lungime aleasă să fie aceeaşi pentru toţi indicatorii pe care îi cuprinde graficul; • atât scările verticale, cât şi cele orizontale trebuie dispuse în aşa fel încât să permită citirea uşoară a graficului; • scara aleasă trebuie să permită folosirea completă şi raţională a spaţiului respectiv, adică în acel spaţiu să încapă toţi indicatorii seriei respective, fără să se atingă plafonul reţelei; • deasupra notaţiilor numerice ale scării trebuie să se arate întotdeauna denumirea unităţilor de măsură (în cazul scărilor verticale). Dintre reţelele curbilinii care folosesc sistemul coordonatelor polare, reţeaua polară sau radială are un domeniu mai larg de aplicare în reprezentarea grafică. 35
Reţeaua polară (radială) folosită în reprezentările grafice este formată din cercuri concentrice. Diagramele cu reţea polară sunt folosite în special pentru reprezentarea grafică a sezonalităţii unui fenomen social-economic. Scările neuniforme se folosesc numai în cazuri speciale pentru completarea analizei statistice, când din graficul construit pe scară uniformă nu reiese destul de clar care este forma de variaţie sau de legătură dintre indicatorii prezentaţi. Sursa de date se trece de regulă sub grafic şi este obligatorie în toate cazurile în care se folosesc date reale. În practica statistică aceleaşi date pot fi reprezentate folosind mai multe tipuri de grafice. De regulă se alege tipul de grafic care permite evidenţierea uşoară şi rapidă a relaţiilor dintre indicatorii studiaţi. Principalele tipuri de grafice vor fi grupate în funcţie de tipul seriei care se reprezintă. Seriile statistice univariate calitative se reprezintă grafic astfel: a) pentru caracteristicile cifrice discrete se foloseşte: - poligonul frecventelor; - curba frecvenţelor (curba de densitate), curba frecventelor cumulate crescător (curba de repartiţie), curba frecvenţelor cumulate descrescător (curba de fiabilitate); - diagrama în formă de coloane sau benzi; - diagrama în batoane. b) pentru caracteristicile cifrice continue se foloseşte: - histograma; - histograma în trepte; - poligonul sau curba frecvenţelor. c) pentru caracteristicile atributive se folosesc diagramele de structură (dreptunghi, pătrat, cerc, semicerc de structură). Seriile statistice bivariate calitative se reprezintă grafic astfel: a) pentru ambele caracteristici exprimate cifric: - norul de puncte; - corelograma. b) pentru ambele caracteristici exprimate atributiv se folosesc diagramele de structură construite în acelaşi plan; c) pentru cazul unei caracteristici exprimate atributiv şi una cifric se folosesc diagrame specifice, de tipul „piramida vârstelor”. Seriile cronologice (de timp) se reprezintă grafic prin: - cronogramă: liniară, prin benzi, prin coloane; - diagramă polară: prin segmente de dreaptă, prin sectoare de cerc. Seriile teritoriale (de spaţiu) se reprezintă grafic prin: - cartogramă; - cartodiagramă. Poligonul frecvenţelor este un grafic care se utilizează pentru reprezentarea seriilor calitative cu caracteristica exprimată cifric pe variante de variaţie sau pe intervale de variaţie. Pentru realizarea graficului pe axa absciselor se înscriu variantele caracteristicii sau intervalele de variaţie egale sau neegale, iar pe axa ordonatelor frecvenţele. Se ridică perpendiculare a căror înălţime este proporţională cu frecvenţa, de pe axa absciselor, din dreptul diviziunilor corespunzătoare variantelor sau, după caz, din mijlocul segmentelor care reprezintă mărimea intervalelor. Unind vârfurile acestor perpendiculare printr-o linie frântă se obţine poligonul frecvenţelor. Dacă vârfurile perpendicularelor sunt unite printr-o linie curbă, graficul obţinut poartă denumirea de curba frecvenţelor. Histograma este un grafic care se foloseşte pentru reprezentarea seriilor calitative cu caracteristica exprimată cifric pe intervalele de variaţie. Pentru realizarea graficului pe axa absciselor se delimitează intervalele de valori egale sau neegale, iar pe axa ordonatelor se trec 36
frecvenţele ordonate strict crescător. De pe axa absciselor se ridică dreptunghiuri care au drept laturi mărimea intervalului de variaţie şi frecvenţa corespunzătoare. Histograma în trepte se construieşte similar, doar că perpendicularele de pe axa absciselor care despart dreptunghiurile nu se mai trasează. Graficul rezultat va avea aspectul unor trepte. Diagrama prin benzi este graficul în care datele statistice sunt reprezentate prin ariile unor dreptunghiuri construite cu bazele pe axa ordonatelor şi despărţite prin spaţii egale. Lungimea benzilor este proporţională cu mărimea indicatorilor reprezentaţi, iar lăţimea este aceeaşi pentru toate dreptunghiurile. Diagrama prin coloane se construieşte similar cu cea prin benzi, diferenţa provenind din faptul că bazele dreptunghiurilor se află pe axa absciselor. Diagrama de structură este graficul în care este reprezentată structura unei colectivităţi. Se construieşte frecvent prin dreptunghi, pătrat, cerc, semicerc. Suprafeţele acestora sunt direct proporţionale cu volumul colectivităţii, iar părţile acestora sunt reprezentate prin porţiuni de suprafaţă, stabilite în aceeaşi proporţie în care se găsesc părţile respective faţă de volumul colectivităţii. Cronograma sau historigrama este graficul care se foloseşte pentru reprezentarea seriilor dinamice (cronologice, de timp). Realizarea graficului se face într-un sistem de coordonate rectangulare, de obicei în cadranul I al acestora; pe axa absciselor se reprezintă timpul, iar pe axa ordonatelor indicatorii seriei cronologice. Cronograma se poate construi prin benzi, prin coloane sau liniară. Diagrama polară (radială) se foloseşte de obicei pentru reprezentarea variaţiei sezoniere. Pentru realizarea sa se construieşte un cerc cu raza proporţională cu nivelul mediu al fenomenului reprezentat; se împarte cercul într-un număr de sectoare egal cu numărul perioadelor de variaţie; se trasează sectoare de cerc cu raza proporţională cu nivelul atins de fenomen în perioadele considerate. Graficul realizat poartă denumirea de diagrama polară din sectoare de cerc . Similar se construieşte diagrama prin segmente de dreapta , cu diferenţa că nivelul atins de fenomen se evidenţiază prin marcarea acestuia pe rază; vârfurile razelor se unesc prin segmente de dreaptă. Cartograma este graficul folosit pentru prezentarea intensităţii de manifestare a fenomenelor în profil teritorial. Se realizează cu ajutorul hărţii ţării sau regiunii pe care se delimitează unităţile teritoriale; pentru a reda intensitatea fenomenului se folosesc haşurări sau culori diferite. Cartodiagrama este graficul folosit pentru prezentarea distribuţiei în spaţiu a unui fenomen. El se realizează combinând cartograma cu diagramele de structură. Corelograma este graficul în care este reprezentată seria de repartiţie bidimensională. Realizarea sa se face într-o reţea construită de axele absciselor şi axele ordonatelor în care se trec valorile variabilei independente şi ale variabilei dependente, formând aşa-numitul câmp de corelaţie; sensul şi intensitatea legăturii dintre cele două caracteristici apar cu destulă claritate.
Sumar Datele statistice se prezintă sub formă de: serii statistice; tabele statistice; grafice. Seria statistică este o corespondenţă între două şiruri de date statistice sistematizate într-o succesiune logică, în care primul şir reprezintă variaţia caracteristicii de grupare (valorile sau variantele caracteristicii, intervalele de valori sau grupele de variante, momentele sau intervalele de timp, unităţile teritoriale etc.), iar cel de-al doilea şir reprezintă rezultatul centralizării frecvenţelor de apariţie şi/sau a valorilor caracteristicii de grupare. Seriile statistice se pot clasifica în funcţie de numărul şi de natura (conţinutul) caracteristicilor de grupare: a) După numărul caracteristicilor de grupare, seriile statisticii pot fi univariate (se mai numesc şi serii unidimensionale sau serii independente), bivariate şi multivariate (serii statistice condiţionate). 37
b) După natura caracteristicii de grupare, seriile statistice pot fi : cronologice, teritoriale şi calitative. Tabelele statistice reprezintă o formă raţională de prezentare a datelor statistice şi sunt utilizate în toate etapele cercetării statistice. Principalele elemente ale unui tabel statistic sunt : - titlul general - macheta tabelului - titlurile interioare - unitatea de măsură - notele explicative Reprezentarea grafică a seriilor statistice este o metodă des folosită în teoria şi practica statistică care permite vizualizarea informaţiilor, sesizarea mai uşoară a ansamblului de date cu privire la variaţia valorilor observate, a legăturilor care există între ele, a evoluţiei lor în timp etc. Într-o accepţiune generală, graficele constau în exprimarea datelor statistice din tabele prin linii sau puncte, figuri geometrice, simboluri şi alte mijloace specifice.
Întrebări 1. Care sunt formele sub care se pot prezenta datele statistice 2. Definiţi şi clasificaţi seriile statistice 3. Principalele elemente ale unui tabel statistic 4. Prezentaţi graficele specifice principalelor tipuri de serii statistice
Aplicaţii propuse Aplicaţia 1. Extrageţi din Anuarul Statistic al României o serie statistică; caracterizaţi şi reprezentaţi grafic această serie.
Aplicaţia 2. Din Anuarul Statistic al României extrageţi date referitoare la populaţia ţării pe sexe la două momente de recensământ; reprezentaţi grafic respectivele date.
38
Modulul 5. INDICATORI STATISTICI EXPRIMAŢI ÎN MĂRIMI ABSOLUTE ŞI RELATIVE Indicatorii statistici se pot clasifica după diverse criterii, între care şi forma lor de exprimare. Conform acesteia se disting indicatori statistici în mărimi absolute, mărimi relative, mărimi medii, indici şi ecuaţii de estimare.
5.1. Indicatori statistici în mărimi absolute În statistică, mărimile absolute reprezintă valori definite prin ele însele, independent de orice sistem de referinţa [9, p.93]. Indicatorii exprimaţi în mărimi absolute se obţin în cadrul prelucrării primare a datelor, au un conţinut concret şi o formă concretă de exprimare. Dat fiind ca se obţin în procesul prelucrării primare aceşti indicatori mai poartă numele de indicatori primari. Indicatorii absoluţi se caracterizează prin aceea ca ei sunt exprimaţi în unităţi de măsură însumabile şi pot fi consideraţi independenţi de alţi indicatori. Unităţile de măsură în care se exprimă indicatorii absoluţi pot fi: naturale sau fizice (bucăţi, kilograme, metri liniari, metri cubi, persoane etc.); natural – convenţionale (tone combustibil convenţional etc.); de timp de muncă (ore, zile, luni, om-ore, etc.); unităţi valorice (mii lei, milioane lei, etc.) Mărimile absolute sunt folosite pentru exprimarea indicatorilor de nivel şi a indicatorilor variaţiei absolute. Indicatorii de nivel se obţin în procesul de înregistrare statistică, exprimând valoarea caracteristicii observate la fiecare dintre unităţile colectivităţii (indicatori individuali) sau în procesul sistematizării datelor prin centralizare pe grupe sau pe ansamblul colectivităţii (indicatori sintetici). Indicatorii variaţiei absolute se obţin prin compararea pe bază de diferenţă a două nivele ale aceluiaşi indicator. Ei mai poartă denumirea de spor absolut. Indicatorii absoluţi se regăsesc la toate nivelele şi structurile sistemului informaţional statistic, în toate fazele de agregare şi dezagregare a fenomenelor. Dar, datorită faptului că nu permit o apreciere calitativă a fenomenului cercetat ei au o sferă de comparabilitate restrânsă. Cu toată această limită, indicatorii absoluţi se constituie ca o bază de plecare indispensabilă oricărei analize statistice.
5.2. Indicatori statistici în mărimi relative În statistică, mărimile relative reprezintă rezultatul comparării pe bază de raport a doi indicatori statistici absoluţi şi exprimă printr-un singur număr proporţiile indicatorului raportat (indicatorul din numărătorul raportului) faţă de indicatorul bază de raportare (indicatorul din numitorul raportului). Mărimile relative se exprima sub formă de coeficienţi, procente, promile, prodecimile, procentimile etc. Exprimarea sub formă de coeficienţi arată câte unităţi din indicatorul absolut raportat revin la o singură unitate a indicatorului bază de raportare. Folosirea coeficienţilor se face de regulă atunci când ordinul de mărime al celor doi indicatori este apropiat.
39
Exprimarea sub formă de procente este cea mai sugestivă şi arată câte unităţi din indicatorul absolut raportat revin la 100 de unităţi ale indicatorului bază de raportare. Folosirea procentelor este folosită în analiza structurii unui fenomen, în analiza dinamicii unui fenomen faţă de o anumită bază fixă sau mobilă şi de asemenea când între indicatorii comparaţi există diferenţe mici ca mărime. În cazul în care indicatorul din numărătorul raportului este cu mult mai mic decât cel din numitorul acestuia, rezultatul raportului se înmulţeşte cu 10 3 , 10 4 , 10 5 , exprimarea sa devenind sub formă de promile, decimile, procedimile şi arătând câte unităţi ale indicatorului de raportat revin la 1.000, 10.000, respectiv 100.000 de unităţi ale indicatorului bază de raportare. De exemplu, numărul de născuţi vii la 1.000 locuitori, numărul de studenţi sau de medici ce revin la 10.000 locuitori, numărul de bolnavi internaţi în spital într-un an la 100.000 locuitori etc. Obţinerea mărimilor relative în statistică este o operaţie foarte uşoară, prin simpla comparare, prin raportarea a doi indicatori. Dificultăţi pot să apară dacă nu sunt respectate următoarele cerinţe: • între indicatorii comparaţi să existe o legătură logică (de corespondenţă, de condiţionare, de cauzalitate); • indicatorii raportaţi să fie comparabili din punct de vedere al sferei de cuprindere, al metodologiei de calcul etc.; • baza de comparaţie să aibă o anumită semnificaţie în evoluţia fenomenului studiat. În funcţie de domeniul de aplicare, de scopul analizei şi de informaţiile de care se dispune în statistică se calculează următoarele tipuri de mărimi relative: • mărimi relative de structură; • mărimi relative de coordonare sau corespondenţă; • mărimi relative de intensitate; • mărimi relative de variaţie (ale dinamicii); • mărimi relative ale planului. Mărimile relative de structură exprimă raportul dintre parte şi întreg şi se pot calcula atunci când colectivitatea supusă analizei a fost împărţită pe grupe, subgrupe sau clase după variaţia uneia sau mai multor caracteristici de grupare. Mărimile relative de structură au denumiri diferite în funcţie de natura seriei a cărei structură se analizează astfel: - pentru o serie statistică atributivă, cronologică, teritorială, mărimile relative poartă denumirea de ponderi sau greutăţi specifice; - pentru o serie de distribuţie cu frecvenţe, mărimile relative de structură poartă denumirea de frecvenţe relative. Mărimile relative de structură se notează cu f i sau g i şi se calculează conform formulei: f i =
ni
∑ni
∑f i = 1, pentru
i
= 1, n
Calculul sub formă procentuală presupune înmulţirea raportului cu 100: f i =
ni
∑ni
·100
∑f i = 100%, pentru
i
= 1, n
Mărimile relative de structură se pot reprezenta sugestiv prin grafice – diagrame de structură (dreptunghi, pătrat, cerc, semicerc). Mărimile relative de structură se exprimă şi în dinamică, exprimând modificările care au loc în structura unui fenomen în timp. 40
Mărimile relative de coordonare sau de corespondenţă se folosesc pentru a compara doua grupe ale aceleiaşi colectivităţi sau două colectivităţi situate în spaţii diferite dar coexistente în timp. Mărimi Mărimile le relati relative ve de coord coordona onare re admit admit propri proprieta etatea tea de revers reversibi ibilita litate te şi se calcu calculea lează ză conform relaţiilor: K A/B A/B = X A / X B sau K B/A B/A = X B / X A
în care:
XA şi XB reprezintă cele două niveluri absolute comparate; K A/B A/B · K B/A B/A = 1 (datorită proprietăţii menţionate).
Mărimile relative de coordonare se exprimă, de regulă, sub formă de coeficient. Există şi posibilitatea exprimării sub formă de de procente sau promile, promile, arătând în acest caz câte unităţi dintr-o grupa revin la 100, respectiv la 1000 de unităţi din cealaltă grupă. Mărimile relative de intensitate se calculează ca raport între doi indicatori absoluţi, de natură diferita, dar între care există o relaţie de interdependenţa. interdependenţa. Se determină conform relaţiei: K = X / Y
în care:
K = mărime relativă de intensitate; X = fenomenul de raportat; Y = fenomenul ales ca bază de raportare.
Mărimile relative de intensitate se exprimă în unităţile concrete de măsură ale celor două fenomene şi evidenţiază gradul, intensitatea intensitatea de răspândire răspândire a fenomenului fenomenului de la numărător în raport cu fenomenul de la numitor. În economie se determină numeroase mărimi relative de intensitate: productivitatea muncii; eficienţa fondurilor fixe; gradul de utilizare a maşinilor-unelte; recolta medie la hectar; venitul naţional pe cap de locuitor; eficienţa folosirii timpului de muncă etc. De asemen asemenea ea,, acest acestee mărimi mărimi au o largă largă uti utiliz lizare are în demog demograf rafie, ie, pentru pentru carac caracter teriza izarea rea mişcării naturale şi migratorii a populaţiei.
Mărimile relative ale dinamicii, cunoscute şi sub denumirea de indici sau ritmuri de variaţie, se folosesc în scopul caracterizării evoluţiei în timp a fenomenului analizat şi sunt specifice seriilor cronologice (dinamice). Mărimile relative ale dinamicii se calculează raportând două valori ale aceluiaşi indicator înreg înregist istrat ratee pentru pentru două momente momente sau două perioade perioade diferit diferitee de timp. În raport raport cu baza de comparaţie aleasă aleasă se pot calcula: calcula: • mărimi relative ale dinamicii cu bază fixă, conform relaţiei: K i / 0 = •
X i X 0
·100
mărimi relative ale dinamicii cu bază mobilă, conform relaţiei: K i / i −1 =
X i X i −1
41
·100
Aceste mărimi se exprimă sub formă de coeficienţi sau procente. Aspecte suplimentare referitoare la calculul mărimilor relative ale dinamicii se vor prezenta în Modulul 8.
Mărimile relative ale planului se utilizează de fiecare dată când un fenomen se desfăşoară organizat, planificat. Agenţii economici, indiferent de specific, calculează astfel de mărimi în vederea cunoaşterii evoluţiei activităţii desfăşurate. Pentru calculul mărimilor relative ale planului se folosesc următoarele informaţii preluate din evidenţele agentului economic: Xpl - nivelul planificat al fenomenului analizat într-o perioadă curentă; X0 - nivelul realizat în perioada de bază; X1 - nivelul realizat în perioada curentă. Pe baza comparării sub forma de raport a celor trei elemente se calculează: calculează: • mărimea relativă a sarcinii de plan (K pl/0 pl/0): K pl / 0 =
•
X pl X 0
·100
mărimea relativă a realizării planului (K 1/pl 1/pl): K 1/ pl =
X 1 X pl
·100
De regulă, mărimile relative ale planului se exprimă procentual. Adesea se reţine doar valoarea ce depăşeşte 100, arătând procentul de depăşire al planului sau procentul de creştere programat.
Sumar Indicatorii statistici se pot clasifica după diverse criterii, între care şi forma lor de exprimare. Conform acesteia se disting indicatori statistici în mărimi absolute, absolute, mărimi relative, mărimi medii, indici şi ecuaţii de estimare. În statistică, mărimile absolute reprezintă reprezintă valori valori definite prin ele însele, însele, independe independent nt de orice sistem de referinţă. Indicatorii exprimaţi în mărimi absolute se obţin în cadrul prelucrării primare a datelor, au un conţinut concret şi o formă concretă de exprimare. Mărimile absolute sunt folosite pentru exprimarea indicatorilor de nivel şi a indicatorilor variaţiei absolute. Indicatorii de nivel se obţin în procesul de înregistrare statistică, exprimând valoarea carac caracter terist istici iciii observ observate ate la fieca fiecare re dintre dintre unităţ unităţile ile colec colectiv tivită ităţii ţii (indic (indicato atori ri indivi individua duali) li) sau sau în procesul sistematizării datelor prin centralizare pe grupe sau pe ansamblul colectivităţii (indicatori sintetici). Indicatorii variaţiei absolute se obţin prin compararea pe bază de diferenţă a două nivele ale aceluiaşi indicator. Ei mai poartă denumirea de spor absolut. În statistică, mărimile relative reprezintă rezultatul comparării pe bază de raport a doi indicatori statistici absoluţi şi exprimă printr-un singur număr proporţiile indicatorului raportat (indicato (indicatorul rul din numărătorul numărătorul raportulu raportului) i) faţă de indicatoru indicatorull bază de raportare raportare (indicatorul (indicatorul din numitorul raportului).
42
În funcţie de domeniul de aplicare, de scopul analizei şi de informaţiile de care se dispune în statistică se calculează următoarele tipuri de mărimi relative: • mărimi relative de structură; corespondenţă; • mărimi relative de coordonare sau corespondenţă; • mărimi relative de intensitate; • mărimi relative de variaţie (ale dinamicii); mărimi relative ale planului. •
Întrebări 1. Definiţi indicatorii statistici şi clasificaţi-i după forma lor de exprimare 2. Prezentaţi modul de determinare a mărimilor relative 3. Prezentaţi exemple de mărimi relative din domeniul economic
Aplicaţii rezolvate şi propuse. Aplicaţia 1. În tabelu tabelull 5.1 este este prezen prezentat tatăă situaţ situaţia ia studen studenţil ţilor or înscri înscrişi şi în învăţă învăţămân mântul tul superi superior, or, în România, pe grupe de specializare în anul universitar 1996 – 1997. Tabelul 5.1 Efectivul persoane (ni) 1 Tehnică 95.792 2 Medico-farmaceutică 32.714 3 Economica 87.472 4 Juridică 48.268 5 Universitar - pedagogică 83.430. 6 Artistică 6.812 Total 354.488 Sursa: Anuarul Statistic al României, CNS, 1997. Nr. crt.
Specializarea
Frecvenţa relativă (f i) 0,270 0,093 0,247 0,136 0,235 0,019 1,000
Procentul % 27,0 9,3 24,7 13,6 23,5 1,9 100,0
Se cere cere să se caracterizeze caracterizeze seria şi să se calculeze calculeze frecvenţele frecvenţele relative corespunzătoare. corespunzătoare. Rezolvare: Serie univariată, univariată, calitativ calitativăă atributivă atributivă.. Prezintă Prezintă efectivul efectivul populaţie populaţieii (studenţi (studenţi înscrişi înscrişi în învăţământul superior) după caracteristica atributivă ”specializare”. ”specializare”. Calculul frecvenţelor relative: f i =
ni
n
i ·100 şi ∑f i = 100% şi ∑ f i = 1 sau f i = n n ∑i ∑ i
Exemplu: f i = 95.792 / 354.488 = 0,270 sau f i = (95.792 / 354.488) · 100 = 27,0% Calculul frecvenţelor relative şi al al procentelor permite comparări comparări în timp şi spaţiu, spaţiu, care nu se pot realiza pe baza frecvenţelor absolute.
43
Aplicaţia 2. Produsul intern brut pe ramuri ale economiei naţionale (calculat în preţuri curente), în România, în 1980 şi 1990 este prezentat în tabelul 5.2. Tabelul 5.2 (în miliarde lei) Ramura 1980 1990 Industrie 325,3 407,0 Agricultură şi silvicultură 78,0 152,0 Alte ramuri 213,6 285,0 Total 616,9 844,0 Sursa: Anuarul Statistic al României, CNS, 1991 Se cere: a) Să se calculeze mărimile relative de structură şi să se reprezinte grafic structura colectivităţii. b) Să se calculeze cu cât s-a modificat structura pe ramuri în 1990 comparativ cu 1980. Rezolvare: a) - se calculează mărimile relative de structură, după relaţia: f i =
ni
∑ni
·100
Exemplu: pentru industrie, mărimea relativă de structură, în 1980: f ind = (325,3 / 616,9) · 100 = 52,731 ≈ 52,7% - se procedează similar pentru celelalte ramuri, pe fiecare an în parte. Rezultatele sunt prezentate în tabelul 5.3 - reprezentarea grafică a structurii colectivităţii se face cu ajutorul diagramei de structură (figura 5.1).
Alte ramuri
Alte ramuri
Industrie Industrie
Agr. Si silv.
Agr. Si silv.
1980
1990
Fig. 5.1 Structura produsului intern brut pe ramuri ale economiei naţionale, în România, în 1980 şi 1990.
44
b) pentru a calcula cu cât s-a modificat structura pe ramuri în 1990 comparativ cu 1980 se determină mărimile relative ale modificării structurii: - creşterea (descreşterea) absolută: (±) = f i – f 0 Exemplu: pentru industrie ∆ = 48,2% - 52,7% = -4,5% - creşterea (descreşterea) relativă: (±) = (f 1 / f 0) · 100 - 100 Exemplu: pentru industrie (48,2 / 52,7) · 100 - 100 = 91,5 - 100 = -8,5% Structura şi modificarea structurii produsului intern brut pe ramuri ale economiei naţionale, în România, în 1980 şi 1990.
Ramura Industrie Agricultură şi silvicultură Alte ramuri Total
Structura (%) 1980 1990 52,7 48,2 12,7 18,0 34,6 100,0
33,8 100,0
Tabelul 5.3 Modificarea structurii (%) Absolută Relativă 4,5 8,5 5,3 41,7 0,8 -
2,3 -
Aplicaţia 3. 5.4.
Populaţia judeţului Bacău pe medii, la 1 iulie 1994 se prezintă conform datelor din tabelul
Total populaţie: mediul urban mediul rural Sursa: Anuarul Statistic al României, CNS, 1995 din care:
Tabelul 5.4 Număr persoane 742.901 374.747 368.154
Se cere să se calculeze mărimile relative de coordonare (corespondenţă). Rezolvare: - pentru mediul urban: populaţia urban K U/R = populaţia rural
din
mediul
din mediul
374.7 47 · 100 = 368.1 54
· 100 ≈ 102 persoane
K U/R = 102 persoane din mediul urban revin la 100 persoane din mediul rural 45
- pentru mediul rural: populaţia rural K R/U = populaţia urban
din
mediul
din mediul
368.1 54 · 100 = 374.7 47
· 100 ≈ 98 persoane
K R/U = 98 persoane din mediul rural revin la 100 persoane din mediul urban
Aplicaţia 4. Producţia de cereale boabe, în România, în perioada 1990-1994 se prezintă conform tabelului 5.5. Anii 1990 1991 Producţia de cereale 17.173,5 19.306,6 boabe (mii tone) Sursa: Anuarul Statistic al României, CNS, 1995.
1992
1993
12.288,5
15.493,1
Tabelul 5.5 1994 18.183,8
Se cere să se calculeze mărimile relative ale dinamicii, cu bază fixă şi cu bază mobilă. a) mărimi relative ale dinamicii cu bază fixă: K i / 0 =
yi y0
K 91 / 90 = K 92 / 90 = K 93 / 90 K 94 / 90
·100
19 .306 ,6 17 .173 ,5 12 .288 ,5
·100 =112 ,4%
·100 = 71,6% 17 .173 ,5 15 .493 ,1 = ·100 = 90 ,2% 17 .173 ,5 18 .183 ,8 = ·100 =105 ,9% 17 .173 ,5
b) mărimi relative ale dinamicii cu bază mobilă: K i / i −1 = K 91 / 90 = K 92 / 91 = K 93 / 92 = K 94 / 93
yi yi−1
·100
19 .306 ,6 17 .173 ,5 12 .288 ,5 19 .306 ,6 15 .493 ,1
·100 =112 ,4%
·100 = 63 ,6%
·100 =126 ,1% 12 .288 ,5 18 .183 ,8 = ·100 =117 ,4% 15 .493 ,1
46
Aplicaţia 5. Mişcarea naturală a populaţiei judeţului Bacău în anul 1994 este prezentată în tabelul 5.6. Tabelul 5.6 Număr persoane
Indicatorul Populaţia la 1 iulie 1994 Născuţi vii Decedaţi Spor natural Căsătorii Divorţuri Născuţi morţi Decedaţi în vârstă sub 1 an
742.901 9.869 7.398 2.471 5.439 1.522 60 267
Se cere să se determine mărimile relative de intensitate posibile. Rezolvare: • Rata de natalitate: numărul născuţilor vii populaţia la 01.07.1994
· 1000 =
9.869 742.9 · 1000 ≈ 13,3 ‰ 01
· 1000 =
7.398 742.9 · 1000 ≈ 10,0 ‰ 01
· 1000 =
2.471 742.9 · 1000 ≈ 3,3 ‰ 01
· 1000 =
5.439 742.9 · 1000 ≈ 7,3 ‰ 01
• Rata de mortalitate:
numărul decedaţilor populaţia la 01.07.1994 • Rata sporului natural:
sporul natural populaţia la 01.07.1994 • Rata nupţialităţii:
numărul căsătoriilor populaţia la 01.07.1994
47
• Rata divorţurilor:
numărul divorţurilor populaţia la 01.07.1994
· 1000 =
1.522 742.9 · 1000 ≈ 2,0 ‰ 01
· 1000 =
60 742.9 01
• Rata morti-natalităţii:
numărul născuţilor morţi populaţia la 01.07.1994
· 1000 ≈ 0,08 ‰
• Rata mortalităţii infantile:
numărul decedaţilor sub 1 an populaţia la 01.07.1994
· 1000 =
267 742.9 01
· 1000 ≈ 0,36 ‰
Aplicaţia 6. În tabelul 5.7 sunt prezentaţi următorii indicatori demografici şi economici, la nivelul României, în anul 1994.
Nr.crt. Indicatorul UM 1 Populaţia (la 1.07.) mii locuitori Populaţia ocupată 2 mii persoane (la sfârşitul anului) Fondurile fixe (la sfârşitul 3 anului) (valoare completă miliarde lei de inventar) 4 Produsul intern brut miliarde lei Sursa: Anuarul Statistic al României, CNS, 1995.
Tabelul 5.7 Valoare 22.756,0 10.062,0 26.583,0 19.737,5
Se cere să se calculeze mărimile de intensitate posibile. Rezolvare: - Rata globală de activitate =
numărul populaţiei ocupate numărul populaţiei totale
· 100 = 44,22 mii lei / pers.
valoarea F.F. nr. pers. ocupate
· 100 = 44,22 mii lei / pers.
- Gradul de înzestrare tehnică a muncii =
- Productivitatea muncii pe o persoană ocupată =
Aplicaţia 7. 48
PIB nr. pers. ocupate
= 1961,6 mii lei / pers.
Se cunosc următoarele date cu privire la cifra de afaceri a unei societăţi comerciale (date convenţionale): Tabelul 5.8 Perioada curentă
Indicatorul
Perioada de bază - realizat x0
planificat xpl
realizat x1
Cifra de afaceri
980
1050
1100
Se cere să se calculeze mărimile relative ale planului. Rezolvare: a) mărimea relativă a sarcinii de plan (coeficientul sarcinii de plan): K pl / 0 =
X pl X 0
·100 =
1050 980
·100 = 107 ,1%
b) mărimea relativă a îndeplinirii planului (coeficientul îndeplinirii planului): K 1 / pl =
X 1 X pl
·100 =
1100 1050
·100 = 104,8%
c) mărimea relativă a dinamicii (coeficientul de dinamică) K 1 / 0 =
X 1 X 0
·100
=
1100 980
·100 = 112,2%
Aplicaţia 8. Se cunosc următoarele date cu privire la populaţia României ocupată pe ramuri ale economiei, la sfârşitul anului 1994: Tabelul 5.9 Populaţia ocupată (mii persoane)
Ramura
Agricultură si silvicultură 3647 Industrie 2882 Construcţii 563 Comerţ 636 Transporturi 462 Tranzacţii imobiliare şi alte servicii 438 Învăţământ 437 Alte ramuri 946 Total 10011 Sursa: Prelucrat după Anuarul Statisticii României, CNS, 1995. 49
Se cere să se calculeze mărimile relative de structură şi să se reprezinte grafic structura colectivităţii.
Aplicaţia 9. Populaţia României, pe sexe, la recensământul din 7 ianuarie 1992 este prezentată în tabelul 5.10. Tabelul 5.10 persoane Total populaţie 22.810.035 masculin 11.213.763 din care: feminin 11.596.272 Sursa: Anuarul Statistic al României, CNS, 1995. Se cere să se calculeze mărimile relative de coordonare.
Aplicaţia 10. În tabelul 5.11. sunt prezentate date cu privire la populaţia României înregistrată la diverse momente de recensământ. Se cere să se calculeze mărimile relative ale dinamicii cu bază fixă şi bază mobilă.
Aplicaţia 11. În tabelul 5.12. sunt prezentate date cu privire la suprafaţa şi efectivul populaţiei pe continente în anul 1993.
Tabelul 5.11 Numărul populaţiei
Data recensământului 29.XII.1930 14.280.279 25.I.1948 15.872.624 21.II.1956 17.489.450 15.III.1996 19.103.163 5.I.1977 21.559.910 7.I.1992 22.810.035 Sursa: Anuarul Statistic al României, CNS, 1995.
50
Continentul
Populaţia (milioane persoane)
Africa 689 America 752 Asia 3.349 Europa 726 Oceania 28 Total mondial 5.544 Sursa: Anuarul Statistic al României, CNS, 1995
Tabelul 5.12 Suprafaţa mii Km2 30.041 42.059 31.739 5.972 8.537 118.348
Să se calculeze mărimea relativă de intensitate şi să se precizeze denumirea ei.
51
Modulul 6. INDICATORI STATISTICI ÎN MĂRIMI MEDII 6.1. Definire, condiţii de calitate şi clasificare În categoria indicatorilor statistici derivaţi un loc important îl deţin indicatorii în mărimi medii, întâlniţi şi sub denumirea de medii. Mediile sunt indicatori statistici care exprimă, în mod sintetic şi generalizant, ceea ce este normal, esenţial, tipic pentru unităţile unei colectivităţi distribuite după o anumită caracteristică. Media sintetizează într-o singură expresie numerică toate valorile individuale, punând în evidenţă ceea ce este esenţial şi comun tuturor unităţilor. Ea are un caracter abstract. În mod frecvent, valoarea mediei nu coincide cu nici una din valorile individuale din care s-a calculat. În vederea asigurării unui conţinut cât mai real mediilor calculate se recomandă ca determinarea să se bazeze pe valorile înregistrate dintr-o observare totală. Dacă nu se dispune de astfel de date, care ar permite evidenţierea tuturor factorilor care determină variaţia caracteristicii, se pot folosi şi date provenind din observări parţiale. În acest caz mediile calculate sunt semnificative numai dacă eşantionul observat este reprezentativ pentru colectivitatea totală. Media este semnificativă numai dacă populaţia observată are un grad ridicat de omogenitate. Dacă populaţia este eterogenă se va proceda la împărţirea acesteia pe grupe, se vor calcula medii la nivelul fiecărei grupe, iar apoi se va afla media la nivelul ansamblului, ca o medie a mediilor grupelor, ca nivel generalizant pe total colectivitate. Consideraţiile expuse conduc la concluzia că o medie îşi poate îndeplini rolul său în cunoaştere doar în măsura în care sunt satisfăcute o serie de condiţii. Condiţiile de calitate pe care trebuie să le îndeplinească o medie pentru a fi corect utilizată au fost precizate în anul 1945 de către statisticianul englez G.U.Yule. Acestea sunt: • media trebuie să fie precis definită, fie printr-o definiţie, fie printr-o formulă; • media trebuie să fie reprezentativă; condiţia se poate îndeplini doar dacă media se calculează pentru colectivităţi omogene din punct de vedere al caracteristicii de distribuţie; • media trebuie să posede proprietăţi simple şi evidente, făcând posibilă înţelegerea sensului ei general chiar de către nespecialişti; • media trebuie să poată fi calculată cu uşurinţă şi rapiditate şi să se preteze la calcule algebrice ulterioare; • media trebuie să fie puţin sensibilă la fluctuaţiile de eşantionare în cazul în care datele provin dintr-un sondaj statistic. Deoarece, de regulă, nu toate condiţiile prezentate pot fi îndeplinite de orice mărime medie, pentru ca aceasta să aibă un conţinut cât mai real este necesar ca alegerea tipului de medie să se facă în funcţie de forma de variaţie şi de sursele de informaţie cu privire la caracteristicile studiate. Clasificarea mărimilor medii se poate face după rolul pe care îl au în analiza statistică şi după modul de obţinere. a) după rolul lor în analiza statistică se disting: - mărimi medii fundamentele (aritmetică, modul, mediană) - mărimi medii cu aplicaţii speciale (geometrică, armonică, pătratică, progresivă, cronologică, mobilă) b) după modul de obţinere există: - mărimi medii de calcul (aritmetică, geometrică, armonică) 52
-
mărimi medii de poziţie (modul, mediană, medială)
Obţinerea mărimilor medii de calcul presupun efectuarea a 2 categorii de operaţii: acumularea termenilor seriei (prin însumare sau produs) şi revenirea (prin împărţire sau extragere de radical) la un nivel reprezentativ pentru toţi termenii incluşi în calcul. • Mărimile medii de poziţie se află prin depistarea termenului care ocupă poziţia centrală într-o distribuţie statistică. La rândul lor, mărimile medii de calcul se pot determina ca medii simple şi medii ponderate. Mediile simple se folosesc în cazul seriilor simple, adică se calculează pentru seriile în care variantele caracteristicii de distribuţie au frecvenţe singulare sau egale între ele: X:(x i , n i ), i = 1, n unde n =n 2 = ….= n i . Mediile ponderate se folosesc în cazul seriilor cu frecvenţă, adică se calculează pentru seriile în care variantele caracteristicii de distribuţie cu frecvenţe diferite: X:(x i , n i ), i = 1, n unde n ≠ n 2 ≠ ….≠ n i . •
1
1
6.2. Media aritmetică Media aritmetică este o mărime fundamentală de calcul, media cea mai frecvent folosită în statistica social – economică. Media aritmetică ( x ) a unei distribuţii empirice reprezintă valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi omogenă. Ea este rezultatul sintetizării într-o singură expresie numerică a tuturor nivelurilor individuale observate, fiind calculată prin raportarea totalului valorilor individuale ale caracteristicii la numărul total al unităţilor.
Media aritmetică simplă se calculează pentru seriile simple, atunci când n 1 = n2 = …. = ni. Se foloseşte relaţia: n
x=
∑x i =1
i
,
n
unde: x i = nivelurile individuale ale caracteristicii; n
∑xi = nivelul centralizat al caracteristicii; i =1
n = volumul colectivităţii (numărul unităţilor observate). Într-o colectivitate statistică se întâlnesc foarte rar cazuri în care numărul variantelor să coincidă cu numărul unităţilor. De obicei, fenomenele de masă sunt numeroase şi aceeaşi valoare a caracteristicii apare de mai multe ori. În acest caz media aritmetică se va calcula ca o medie ponderată.
2
≠
Media aritmetică ponderată se calculează pentru seriile cu frecvenţă, atunci când n ….≠ n i . Se foloseşte relaţia:
53
1
≠
n
m
m
∑ xi ni x
=
i =1 m
=
∑ni
∑x
i
f i
1 i=
i =1
Relaţia de calcul prezentată se foloseşte în cazul caracteristicii discrete (prezentată pe variante de variaţie). În cazul seriilor în care caracteristica de distribuţie este prezentată pe intervale de variaţie, x ' i se înlocuieşte cu x i , care reprezintă mijlocul intervalului corespunzător. Relaţia de calcul devine: K
K
' ∑ xi ni
x
=
i =1 K
=
∑ ni
' x ∑ i f i
i =1
i =1
unde: x i' = mijlocul intervalului (x i −1 , x i ) x i' =
xi −1 + xi 2
Media unei caracteristici alternative În cazul unei colectivităţi statistice studiate după variaţia unei caracteristici alternative, unităţile statistice componente pot lua două valori: posedă însuşirea sau posedă opusul ei: Distribuţia unei colectivităţi după o caracteristică alternativă este prezentată în tabelul 6.1. Media caracteristicii alternative se calculează plecând de la o medie aritmetică ponderată. x=
∑ xi ni ∑ni
=
1·n1 + 0·(n − n1 )
n
=
n1 n
= P
Deci media aritmetică a caracteristicii alternative este o mărime de structură, reprezentând numărul unităţilor care posedă caracteristica în totalul unităţilor colectivităţii. Pentru a uşura interpretarea se poate exprima sub formă procentuală. Valori ale caracteristicii (xi) Da = 1
Tabelul 6.1 - Distribuţia generală a frecvenţelor Frecvenţe Frecvenţe absolute (ni) relative p=
n1
Nu = 0
n − n1
Total
n
q=
6.3.Media armonică Media armonică este o mărime de calcul cu aplicaţii speciale. 54
n − n1 n
n1 n
=1− p
p+q = 1
Media armonică ( x ) se defineşte ca fiind egală cu valoarea inversă a mediei aritmetice calculată din valorile inverse ale caracteristicii. Se calculează ca o medie armonică simplă sau ponderată, după cum seria este cu frecvenţe egale sau cu frecvenţe diferite, conform urmatoarelor relaţii: • pentru seria simplă: h
xh =
n n
1
∑x i −1
•
i
pentru seria cu frecvenţe: m
∑n
i
xh =
i =1 m
1
∑x i =1
ni
i
În economie, media armonică se foloseşte în special la calculul indicelui mediu armonic al preţurilor, la calculul salariului mediu şi fondul de salarii pe secţii, la calculul producţiei medii la hectar la o cultură dintr-o fermă agricolă, când se cunosc recolta medie şi recolta totală pe parcelele acesteia.
6.4. Media pătratică Media pătratică este o mărime de calcul cu aplicaţii speciale. Media pătratică ( x ) este definită prin pătratul său, şi anume, media pătratică ridicată la pătrat este media aritmetică a pătratelor valorilor x i . Se pot calcula medii pătratice simple sau ponderate, după cum seriile sunt cu frecvenţe egale sau cu frecvenţe diferite. Relaţiile de calcul sunt următoarele: p
•
pentru seria simplă: n
n
∑ x sau i 1
∑ xi
2
2 i
=
xp = •
n
(x p )2 =
i =1
n
pentru seria cu frecvenţe: m
m
∑x
∑ xi n i 2
2 i i
xp =
n
i =1 m
sau ( x p ) 2 =
i =1 m
∑ ni
∑ ni
i =1
i =1
Media pătratică se utilizează de regulă atunci când predomină valorile ridicate ale caracteristicii şi se doreşte a se da mai mare importanţă acestora.
55
Media pătratică se poate calcula şi în cazul în care termenii seriei au valori negative. Ea este întotdeauna mai mare decât media aritmetică a aceloraşi termeni, indiferent de semnul pe care îl au, deoarece prin ridicare la pătrat toţi termenii devin pozitivi. Media pătratică se aplică în calculul abaterii medii pătratice, care este unul din cei mai utilizaţi indicatori de variaţie.
6.5. Media geometrică Media geometrica este o mărime de calcul cu aplicaţii speciale. Ea se aplică numai pentru serii cu termeni pozitivi.
Media geometrică produsul acestora. •
( x g )
a n date pozitive se defineşte ca rădăcină de ordin n din
Media geometrică simplă se calculează conform relaţiei : 1
n n x g = n x1 ⋅ x 2 ⋅ ...... ⋅ x n = n ∏ xi = ∏ xi i =1 i =1 n
•
Media geometrică ponderată se calculează conform relaţiei: m
x g =
∑ i =1
1
m
ni
x1 ⋅ x ⋅ ...... ⋅ x n1
n2 2
nm n
=
∑n
i
i =1
n n ∑ x = ∏ xi ∏ i =1 i=1 m
m
ni
i
i
i
Media geometrică se utilizează cel mai frecvent în cazul seriilor cronologice, la calculul ritmurilor medii de variaţie în timp a fenomenelor. Între mărimile medii prezentate există următoarea relaţie: xh < xg < x < x p
În calculul nivelului mediu al unei serii univariate se foloseşte de regulă media aritmetică, iar celelalte tipuri de medii prezentate se folosesc complementar, dacă distribuţia prezintă anumite particularităţi sau în vederea aprofundării analizei.
6.6. Modul (Dominanta) Modul sau dominanta este o mărime fundamentală, de poziţie. Modul (Mo) unei distribuţii statistice reprezintă acea valoare a caracteristicii care corespunde celei mai mari frecvenţe. Deci, modul este valoarea caracteristicii cea mai des observată, de unde şi denumirea de dominantă (Do) a seriei sub care mai este întâlnit în literatura de specialitate. Din definiţie rezultă că acest indicator se determină doar în cazul seriilor cu frecvenţe diferite (n ≠ n 2 ≠ …≠ n i ). Caracteristicile se pot prezenta pe variante de variaţie sau pe intervale de variaţie. Modul se poate determina pe cale algebrică sau prin metoda grafică. Determinarea modului în cazul unei serii cu caracteristica exprimată pe variante de variaţie presupune găsirea valorii caracteristicii care corespunde frecvenţei maxime. 1
56
Determinarea grafică a modului presupune reprezentarea grafică a seriei prin diagrama în batoane sau prin poligonul frecvenţelor şi observarea valorii x i care corespunde frecvenţei maxime (figura 6.1) ni
ni
Mo
Xi
Mo
Xi
Fig. 6.1. Determinarea grafică a modului, în cazul unei caracteristici discrete. Determinarea modului în cazul unei serii cu caracteristica exprimată pe intervale de variaţie egale presupune parcurgerea următoarelor operaţii: aflarea frecvenţei maxime ( n i = nmax ); • aflarea intervalului modal ( xi −1 , xi ) corespunzător frecvenţei maxime; • • determinarea modului, prin interpolare în intervalul modal, pe baza relaţiei: Mo = xi−1 + d
∆1 , ∆1 + ∆ 2
în care: xi 1 = limita inferioară a intervalului modal; d = mărimea intervalului modal ( d = xi − xi−1 ); ∆1 = diferenţa dintre frecvenţa intervalului modal şi frecvenţa celui precedent ( ∆1 = ni − ni−1 ) ∆2 = diferenţa dintre frecvenţa intervalului modal şi frecvenţa celui următor −
( ∆2
= ni − ni +1 )
Determinarea grafică a modului în cazul variabilelor continue se realizează cu ajutorul histogramei (figura 6.2).
57
Fig. 6.2 – Determinarea grafică a modului în cazul variabilelor continue Modul este o mărime medie care prezintă avantajul de a se determina foarte uşor, chiar în condiţiile în care nu se cunosc limitele extreme ale primului şi ultimului interval al seriei. Se utilizează pentru a realiza o primă estimare a valorii centrale a unei distribuţii statistice, dar prezintă inconvenientul de a nu fi la fel de exact ca alte medii, datorită faptului că în calcul nu sunt implicate toate valorile caracteristicii. Cu toate limitele, modul este frecvent utilizat în practica economică, mai ales în activitatea de comerţ şi stă la baza calculului şi aprecierii gradului de asimetrie a distribuţiilor statistice.
6.7. Mediana Mediana este o mărime fundamentală, de poziţie. Mediana (Me) reprezintă valoarea centrală a unei serii statistice, ordonate în mod crescător sau descrescător şi care împarte unităţile colectivităţii observate în două părţi egale: 50% din unităţi au valori mai mari decât mediana şi 50% au valori mai mici decât mediana. Indiferent de tipul seriei la determinarea medianei trebuie rezolvate două probleme: • aflarea locului medianei; • calculul valorii medianei. Locul medianei corespunde valorii calculează conform relaţiilor: U U
Me
Me
=
=
n 2
Me
, valoare numită unitate mediană şi care se
, în cazul în care n > 100;
n +1 2
U
, în cazul în care n < 100;
în care: n = volumul colectivităţii. Determinarea medianei necesită ordonarea prealabilă, crescătoare sau descrescătoare, a valorilor caracteristicii. Apoi, aflarea sa se realizează diferenţiat, în funcţie de tipul seriei. Determinarea medianei în cazul unei serii simple cu număr impar de termeni presupune aflarea termenului central, conform relaţiei: 58
U
Me
=
n +1 2
Determinarea medianei în cazul unei serii simple cu număr par de termeni presupune calculul mediei aritmetice simple a celor doi termeni centrali ai seriei. Determinarea medianei pentru o serie cu frecvenţă, cazul unei caracteristici discrete presupune parcurgerea următoarelor operaţii: •
determinarea şirului frecvenţelor cumulate:
N i =
i
∑n
h
;
h =1
determinarea unităţii mediane ( U Me ) şi poziţionarea sa în şirul frecvenţelor cumulate, cu respectarea condiţiei: N i ≥ U Me ; • în dreptul frecvenţei cumulate egale sau mai mare decât unitatea mediană se află valoarea caracteristicii egală cu mediana. •
Determinarea medianei pentru o serie cu frecvenţă, cazul unei caracteristici continue presupune parcurgerea următoarelor operaţii: determinarea şirului frecvenţelor cumulate ( N i ); • determinarea unităţii mediane ( U Me ) şi poziţionarea sa în şirul frecvenţelor • cumulate, cu respectarea condiţiei: N i ≥ U Me ; • în dreptul frecvenţei cumulate egale sau mai mare decât unitatea mediană, pe şirul valorilor caracteristicii, se află intervalul median; • determinarea medianei, prin interpolare în intervalul median, conform relaţiei: Me = xi −1 + d
U Me − N i −1 ni
în care: xi − 1 = limita inferioară a intervalului median;
d = mărimea intervalului median ( d = xi − xi−1 ); U
median;
Me
= unitatea mediană ( U Me
N i −1 =
ni
=
n 2
);
frecvenţa cumulată corespunzătoare intervalului anterior celui
= frecvenţa intervalului median.
Şi mediana se poate determina pe cale grafică. Mediana este mărimea medie care corespunde cel mai bine imaginii de mijloc a seriei. Ea are o largă aplicabilitate în practica economică, servind la determinarea duratei medii de viaţă, la studiul mortalităţii etc.
Generalizarea medianei – quantilele Pentru seriile de distribuţie cu tendinţă pronunţată de asimetrie, caracterizate printr-o amplitudine mare a variaţiei, se determină şi alţi indicatori de poziţie, care se calculează similar medianei şi poartă denumirea generică de quantile. Quantilele reprezintă valori ale caracteristicii care separă seria în “r” părţi ale căror efective sunt egale. Numărul “r” indica ordinul quantilelor. Astfel, quantila de ordin 2 împarte efectivul seriei în două părţi egale (mediana), quantila de ordin 4 împarte efectivul seriei în 4 părţi egale (quartile Q), quantila de ordin 10 împarte efectivul seriei în 10 părţi egale (decile D), iar quantila de ordin 100 împarte seria în 100 părţi egale (centile C). 59
Exemplificăm modul de calcul al decilelor (D), care sunt valori ale caracteristicii ce împart volumul colectivităţii în 10 părţi egale. Ele sunt în număr de nouă şi se notează D1 , D2 ,......., D9. Se determină conform relaţiilor: U D − N i −1 1
D1 = xi −1 + d
,......... .......... ......... D9 = xi −1 + d
nD
1
în care: U
D1
=
1⋅
∑n
i
10
U
D9
− N i −1
nD
,
9
,......... .......... ....... U
D9
=
9⋅
∑n
i
= unităţile decilice.
10
Între quantile există următoarea relaţie: M e = Q2 = D5 = C 50
6.8. Relaţii între valorile tendinţei centrale Într-o distribuţie unimodală perfect simetrică, relaţia între cele trei mărimi medii fundamentale (medie aritmetică, mod şi mediană), numite şi mărimi ale tendinţei centrale, este următoarea: x = Mo = Me
În cazul unei distribuţii unimodale uşor asimetrice, cele trei valori centrale ocupă locuri diferite, relaţia dintre ele putându-se exprima prin una din următoarele formule echivalente: x − Mo = 3( x − Me )
Mo = 3Me − 2 x Me − Mo = 2( x − Me ).
Pe baza mărimilor medii de calcul şi de poziţie prezentate se pot determina, în continuare, indicatori de variaţie şi asimetrie care permit realizarea unei analize mai aprofundate a seriilor de repartiţie.
Sumar Mediile sunt indicatori statistici care exprimă, în mod sintetic şi generalizant, ceea ce este normal, esenţial, tipic pentru unităţile unei colectivităţi distribuite după o anumită caracteristică. Clasificarea mărimilor medii se poate face după rolul pe care îl au în analiza statistică şi după modul de obţinere. a) după rolul lor în analiza statistică se disting: - mărimi medii fundamentele (aritmetică, modul, mediană) - mărimi medii cu aplicaţii speciale (geometrică, armonică, pătratică, progresivă, cronologică, mobilă) b) după modul de obţinere există: - mărimi medii de calcul (aritmetică, geometrică, armonică) - mărimi medii de poziţie (modul, mediană, medială) Media aritmetică este o mărime fundamentală de calcul, media cea mai frecvent folosită în statistica social – economică. 60
Media aritmetică ( x ) a unei distribuţii empirice reprezintă valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi omogenă. Media armonică este o mărime de calcul cu aplicaţii speciale. Media armonică ( x ) se defineşte ca fiind egală cu valoarea inversă a mediei aritmetice calculată din valorile inverse ale caracteristicii. Media pătratică este o mărime de calcul cu aplicaţii speciale. Media pătratică ( x ) este definită prin pătratul său, şi anume, media pătratică ridicată la pătrat este media aritmetică a pătratelor valorilor x i . Media geometrica este o mărime de calcul cu aplicaţii speciale. Ea se aplică numai pentru serii cu termeni pozitivi. h
p
Media geometrică ( x ) a n date pozitive se defineşte ca rădăcină de ordin n din produsul acestora. Modul sau dominanta este o mărime fundamentală, de poziţie. Modul (Mo) unei distribuţii statistice reprezintă acea valoare a caracteristicii care corespunde celei mai mari frecvenţe. Deci, modul este valoarea caracteristicii cea mai des observată, de unde şi denumirea de dominantă (Do) a seriei sub care mai este întâlnit în literatura de specialitate. Mediana este o mărime fundamentală, de poziţie. Mediana (Me) reprezintă valoarea centrală a unei serii statistice, ordonate în mod crescător sau descrescător şi care împarte unităţile colectivităţii observate în două părţi egale: 50% din unităţi au valori mai mari decât mediana şi 50% au valori mai mici decât mediana. g
Întrebări 1. Cum se definesc indicatorii statistici în mărimi medii 2. Condiţia pe care trebuie să o îndeplinească o colectivitate statistică pentru ca media să fie semnificativă 3. Condiţiile de calitate pe care trebuie să le îndeplinească o medie pentru a fi corect utilizată 4. Domenii de aplicare a mediei armonice în economie 5. Ce indicatori medii de poziţie se utilizează în cazul seriilor de distribuţie cu pronunţată tendinţă de asimetrie şi o amplitudine mare a variaţiei 6. Care sunt relaţiile care există între mărimile tendinţei centrale ale unei distribuţii statistice
Aplicaţii rezolvate şi propuse Aplicaţia 1. Cifra de afaceri a unei societăţi comerciale în perioada 1992-1998 se prezintă astfel (în mii lei, date convenţionale): 275.300; 320.800; 475.000, 755.000; 820.600; 911.750; 1.209.020. Se cere să se calculeze cifra medie de afaceri a societăţii pentru perioada considerată. Rezolvare: Se determină calculând media aritmetică simplă: x= x=
∑ xi n
275 .300 + 320 .800 + 475 .000 + 755 .000 + 820 .600 + 911 .750 +1.209 .020 7
61
=
4.767 .470 7
= 681 .067 ,1(mii
Aplicaţia 2. Vechimea în muncă (în ani) a unui număr de 20 angajaţi a unei societăţi comerciale se prezintă astfel (date convenţionale): 7, 12, 5, 3, 2, 8, 10, 12, 6, 9, 4, 3, 7, 8, 3, 11, 14, 10, 9, 7. Se cere să se calculeze vechimea medie a celor 20 angajaţi. Rezolvare: Se determină calculând media aritmetică simplă: x=
x=
∑ xi n 7 + 12 + 5 + 3 + 2 + 8 + 10 + 12 + 6 + 9 + 4 + 3 + 7 + 8 + 3 + 11 + 14 + 10 + 9 + 7 20
=
150 20
= 7,5(ani )
Aplicaţia 3. Distribuţia elevilor dintr-o clasă după notele obţinute la un test (date convenţionale) este prezentată în tabelul 6.2. Tabelul 6.2 Nota obţinută xi 5 6 7 8 9 10 Total
Nr. elevi ni 2 5 6 7 8 2 30
xi ni 10 30 42 56 72 20 230
Se cere să se determine nota medie obţinută de elevii clasei. Rezolvare: Se determină calculând media aritmetică ponderată, cazul unei caracteristici discrete: m
∑x n i
x=
i
i =1 m
∑n
i
i =1
x=
230 30
= 7,66
Aplicaţia 4. 62
Distribuţia angajaţilor unei firme după vechimea în muncă (date convenţionale) este prezentată în tabelul 6.3. Rezolvare: Se determină calculând media aritmetică ponderată, cazul unei caracteristici continue. K
∑xn ' i
x=
i
, xi' =
i =1 K
xi−1 + xi
∑ ni
2
i=1
x=
415 30
= 13,8(ani )
Tabelul 6.3 Vechimea (ani) Nr. angajaţi Elemente de calcul xi ni x’i x’ini 2–6 5 4 20 7 – 11 6 9 54 12 – 16 8 14 112 17 – 21 7 19 133 22 – 26 4 24 96 Total 30 415 Se cere să se determine vechimea medie a angajaţilor.
Aplicaţia 5. Distribuţia studenţilor dintr-un an după rezultatele la un examen (date convenţionale) este prezentată în tabelul 6.4. Tabelul 6.4 Nr. studenţi Ni 2 12 13 22 42 10 9 100
Nota obţinută xi 4 5 6 7 8 9 10 Total
Se cere să se determine grafic şi algebric modul seriei. 63
Rezolvare: • Determinarea pe cale grafică presupune reprezentarea grafică a seriei prin diagrame în batoane şi găsirea valorii caracteristicii căreia îi corespunde batonul de înălţime maximă. Mo=8
ni
42
22
0
12
13
5
6
10
9
9
10
2 4
7
8
Xi
Fig. 6.3. Distribuţia studenţilor după rezultatele la un examen Determinarea numerică presupune următoarele operaţii: - se citeşte frecvenţa maximă a seriei: nmax = 42 - se citeşte, în dreptul frecvenţei maxime, valoarea caracteristicii corespunzătoare, valoare egală cu modul: Mo=8. •
Aplicaţia 6. Distribuţia firmelor dintr-un sector de activitate după cifra de afaceri obţinută într-o lună (date convenţionale) este prezentată în tabelul 6.5. Cifra de afaceri (mil. lei) xi
Tabelul 6.5 Nr. firme ni
- 50 16 50 - 55 30 55 - 60 35 60 - 65 60 65 - 70 50 70 - 75 14 75 şi peste 5 Total 210 Notă: limita inferioară este cuprinsă în interval Se cere să se determine valoarea modală a seriei. 64
Rezolvare: se găseşte frecvenţa maximă nmax = 60 se citeşte, în dreptul frecvenţei maxime, intervalul modal (60-65) se determină modul, prin interpolare în intervalul modal, după formula:
-
Mo = xi−1 + d
∆1 ∆1 + ∆ 2
Mo = 60 + (65 − 50 )
(60 − 35 ) (60 − 35) + (60 − 50 )
= 60 + 5 ⋅
25 35
= 60 + 3,57 = 63,57 millei
Aplicaţia 7. Distribuţia angajaţilor dintr-o firmă după numărul copiilor (date convenţionale) este prezentată în tabelul 6.6. Tabelul 6.6 Nr. Copiilor xi
Nr. angajaţilor ni
0 1 2 3 4 5 6 Total
16 14 24 8 5 2 1 70
Ni 16 30 54 62 67 69 70
Se cere să se determine mediana. Rezolvare: i
determinarea şirului frecvenţelor cumulate: N i
-
= ∑ nh h =1
calcularea unităţii mediane şi găsirea locului ei în şirul frecvenţelor cumulate, respectând condiţia N i ≥ U Me
-
Me
U
Me
U
-
=
=
n +1 2
70 +1 2
(n <100 )
,
= 35 ,5
în dreptul lui
N i ≥ U Me
se află nivelul caracteristicii egal cu mediana
N i = 54 ≥ U Me
65
xi = Me = 2
copii
Aplicaţia 8. Distribuţia muncitorilor unui atelier după producţia zilnică obţinută (date convenţionale) este prezentată în tabelul 6.7. Tabelul 6.7 Producţia zilnică (buc) xi
Nr. muncitori ni
Ni
20 – 30 3 30 – 40 9 18 40 – 50 50 – 60 12 60 – 70 8 Total 50 Notă: limita inferioară este cuprinsă în interval.
3 12 30 42 50
Se cere să se determine mediana. Rezolvare: i
determinarea şirului frecvenţelor cumulate: N i
-
= ∑nh h =1
calcularea unităţii mediane şi găsirea locului ei în şirul frecvenţelor cumulate, respectând condiţia N ≥ U -
Me
i
Me
U
Me
U
= =
n +1
,
2 50 +1 2
(n <100
)
= 25,5 Me
-
în dreptul lui N ≥ U se află intervalul median (40-50) se determină mediana prin interpolare în intervalul median, după formula: i
Me
Me = xi + d ⋅
U
− N i−1 ni
Me = 40 + (50 − 40) ⋅
25,5 −12 18
= 40 + 10 ⋅
13,5 18
= 40 + 7,5 = 47,5
buc.
Aplicaţia 9. Numărul mediu al salariaţilor, pe judeţe, în România, în 1994, este prezentat în tabelul 6.8. Se cere: a) să se grupeze datele pe intervale egale (şase) şi să se prezinte într-un tabel statistic; 66
b) să se caracterizeze distribuţia rezultată şi să se reprezinte grafic; c) să se determine nivelul mediu utilizând media aritmetică, modul şi mediana. Rezolvare: a) se determină mărimea intervalului de variaţie: l =
xmax − xmin 1 + 3,322 lg n
=
290 − 50 1 + 3,322 ⋅1,6
=
238 6,315
= 37 ,68 ≈ 40
mii persoane
sau l =
A K
=
238
Nr. crt.
6
= 39,66 ≈ 40
Judeţul
mii persoane
Nr. salariaţi
Nr. crt.
Judeţul
1 Alba 122 21 Harghita 2 Arad 131 22 Hunedoara 3 Arges 217 23 Ialomiţa 4 Bacău 190 24 Iaşi 5 Bihor 178 25 Maramureş 6 Bistriţa-Năsăud 68 26 Mehedinti 7 Botoşani 81 27 Mureş 8 Brasov 249 28 Neamţ 9 Brăila 119 29 Olt 10 Buzău 117 30 Prahova 11 Caraş Severin 103 31 Satu Mare 12 Călăraşi 73 32 Sălaj 13 Cluj 240 33 Sibiu 14 Constanţa 244 34 Suceava 15 Covasna 63 35 Teleorman 16 Dâmbovita 140 36 Timiş 17 Dolj 177 37 Tulcea 18 Galaţi 186 38 Vaslui 19 Giurgiu 52 39 Vâlcea 20 Gorj 137 40 Vrancea Sursa: Anuarul Statistic al României, CNS, 1995.
Tabelul 6.8 mii persoane Nr salariaţi 96 199 72 200 135 71 173 134 108 290 97 61 144 157 93 221 65 90 112 79
Distribuţia judeţelor României după numărul mediu al salariaţilor, în 1994 (în mii persoane) şi diverse elemente de calcul sunt prezentate în tabelul 6.9. b) serie univariată, calitativă cu caracteristica exprimată cifric, pe intervale de variaţie egale. - se poate prezenta grafic prin: 67
histogramă poligonul frecvenţelor curba frecvenţelor
-
Tabelul 6.9 Nr. judeţe Elemente de calcul Număr salariaţi ni xi' xi' ni N i 50 – 90 11 70 770 11 90 – 130 9 110 990 20 130 – 170 7 150 1050 27 170 – 210 7 190 1330 34 210 – 250 5 230 1150 39 250 – 290 1 270 270 40 Total 40 5560 Notă: limita superioară este cuprinsă în interval. ni
11 10
9 7
7 5
1 0 50
90
130
170
210
250 Xi
Fig. 6.4. Distribuţia judeţelor României după numărul mediu al salariaţilor, în 1994. c) - media aritmetică: x=
x=
∑ xi ni ∑ni 5560 40
= 139
mii persoane
- modul: nmax =11
intervalul modal = (50-90) 68
Mo = xi −1 + d ⋅
Mo = 50 + 40 ⋅
∆1 ∆1 + ∆2 11 11 + (11 − 9)
= 50 + 40 ⋅
11 13
= 50 + 33,85 = 83,85 ≈ 84
mii persoane
- mediana: n<100 Me
U
Me
U
=
=
n +1 2 40 +1 22
= 20 ,5
- intervalul median se află în dreptul lui Me
M e = xi − 1 + d ⋅
Me = 130 + 40
U
−
Me
N i ≥ U
⇒ (130 −170 )
N i − 1
ni
20,5 − 20 7
= 130 + 40 ⋅
0,5 7
= 132 ,86 ≈ 133
mii persoane
Aplicaţia 10. Distribuţia studenţilor dintr-un an de studiu după caracteristica „vârstă” (date convenţionale) este prezentată în tabelul 6.10. Tabelul 6.10 Numărul studenţilor ni
Vârsta (ani) xi 18 19 20 21 23 25 Total
10 25 55 18 8 4 120
Se cere: a) să se caracterizeze seria; b) să se reprezinte grafic seria; c) să se determine media aritmetică, modul şi mediana. 69
Aplicaţia 11. Distribuţia născuţilor vii, după grupa de vârsta a mamei, în anul 1990 este prezentată în tabelul 6.11. Se cere: a) să se caracterizeze seria; b) să se reprezinte grafic; c) să se determine media aritmetică, modul şi mediana. Tabelul 6.11 Număr născuţi vii ni
Grupa de vârstă a mamei xi
Sub 15 ani 580 15 - 19 ani 47.326 20 - 24 ani 140.573 25 - 29 ani 66.617 30 - 34 ani 38.980 35 - 39 ani 16.501 40 - 44 ani 3.952 45 - 49 ani 217 Total 314.746 Sursa: Anuarul Statistic al României, C.N.S., 1995, p.102.
70
Modulul 7. INDICATORI Al DISPERSIEI 1(IMPRASTIERII) Valorile tendinţei centrale ne ajută să depistăm ceea ce este normal în manifestarea fenomenelor observate. Pentru caracterizarea unei distribuţii aceste mărimi nu sunt suficiente. Orice colectivitate are o anumită organizare internă, definită de modul în care valorile individuale ale caracteristicii se dispersează sau concentrează în jurul valorii centrale, generând o anumită formă a distribuţiei observate. Astfel, se poate ca două distribuţii observate, relativ la aceeaşi variabilă, să aibă aceeaşi valoare a tendinţei centrale, dar să fie diferite prin dispersie sau concentrare. Din acest motiv se impune ca indicatorii tendinţei centrale ai unei variabile să fie completaţi cu alţi indicatori. Dispersia exprimă gradul de împrăştiere a valorilor individuale ale unei distribuţii în jurul valorii centrale şi este datorată influenţei factorilor aleatori. Dispersia sau gradul de variaţie a valorilor individuale în jurul mediei se măsoară cu ajutorul unui sistem de indicatori simpli şi sintetici ai dispersiei, în cazul seriilor unidimensionale, respectiv, al unui sistem de indicatori factoriali ai dispersiei, în cazul seriilor bi- şi multidimensionale (bi- şi multivariate).
7.1. Indicatori simpli ai dispersiei (imprastierii) Indicatorii simpli ai dispersiei măsoară câmpul de împrăştiere al caracteristicii, precum şi împrăştierea fiecărui nivel individual al caracteristicii faţă de nivelul lor mediu. Indicatorii simpli ai dispersiei sunt: amplitudinea variaţiei şi abaterea individuală. Aceşti indicatori pot fi calculaţi fie în mărimi absolute, fie în mărimi relative. Amplitudinea variaţiei. Amplitudinea variaţiei se poate calcula atât în mărime absolută (A), cât şi în mărime relativă (A%), după relaţiile: A = x max − xmin
;
A% =
xmax − xmin x
·100
în care: xmax, xmin = nivelul maxim, respectiv minim al variabilei X; x = nivelul mediu al variabilei X . Acest indicator prezintă dezavantajul de a nu ţine seama de toate valorile observate. Mărimea sa este sensibilă la valorile extreme, care în cazul când sunt aberante denaturează imaginea fenomenului de dispersie. Abaterea individuală. Abaterea individuală, se poate calcula fie în mărime absolută (d i), fie în mărime relativă (di%), după relaţiile: d i = xi − x ; d i %
1
=
xi − x x
·100
după Jabe, E. – Statistică, Editura Economică, Bucureşti, 1999, p.145-153. 71
Amplitudinea variaţiei, fiind calculată numai pe baza valorilor extreme ale variabilei observate, reflectă doar întinderea domeniului de variaţie, nu oferă posibilitatea cunoaşterii structurii interne de variaţie, iar abaterea individuală nu poate da informaţii decât la nivelul fiecărei variante xi, pierzând imaginea dispersiei pe ansamblul distribuţiei.
7.2. Indicatori sintetici ai dispersiei Indicatorii sintetici ai dispersiei exprimă, în mod sintetic, împrăştierea tuturor nivelurilor individuale ale unei caracteristici faţă de nivelul lor mediu. Ca indicatori sintetici ai dispersiei se calculează: abaterea medie liniară, varianţa (dispersia), abaterea medie pătratică (deviaţia standard) şi coeficientul de variaţie. Indicatorii sintetici pot fi calculaţi ca mărimi medii, cu sferă de aplicabilitate numai la variabile comparabile şi ca mărimi relative , cu sferă largă de comparabilitate.
Abaterea medie liniară ( d ). Abaterea medie liniară se calculează ca medie aritmetică a valorilor absolute ale abaterilor individuale |d i|. Abaterea medie liniară arată variaţia medie, în plus şi în minus, de la valoarea medie a distribuţiei şi este cu atât mai mică cu cât valorile sunt mai grupate în jurul mediei. Se obţine după relaţiile:
∑ d
∑x
i
d =
=
i
n
i
−x
, când n 1=n2=...=nn
i
n
respectiv,
∑ d n d = ∑n i
∑ x − xn = ∑n
i
i
i
i
i
i
i
, când n1≠n2≠...≠nn.
i
Specific pentru calculul abaterii medii liniare este faptul că abaterile individuale (d i) se iau fără să se ţină seama de semnul lor, deoarece dacă s-ar folosi valorile algebrice, nivelul abaterii ( xi − x ) = 0 ). medii liniare ar fi egal cu zero (vezi proprietatea mediei: ∑ i În calculul abaterii medii liniare se poate utiliza oricare altă mărime medie, alta decât media aritmetică. De exemplu, considerând mediana, se poate calcula abaterea mediană absolută, după relaţia:
∑x
i
d M =
− Me
i
n
Dar, în acest caz, intervine dezavantajul aproximării introdus prin mediană. Varianţa (dispersia) 2. Varianţa, ca indicator, se calculează ca medie aritmetică a pătratelor valorilor abaterilor individuale faţă de media lor, după relaţiile:
∑ ( xi − x )
∑ d i
2
σ
2
=
i
n
=
i
respectiv 72
n
2
∑ ( xi − x )
∑ d i ni 2
σ
2
=
i
∑ ni
=
2
ni
i
∑ ni
i
i
Se observă că varianţa, fiind o valoare la pătrat, este o mărime abstractă. Este un indicator folosit ca bază de calcul al abaterii mediei pătratice, al indicatorilor de corelaţie şi al altor indicatori ai variaţiei. Abaterea medie pătratică (deviaţia standard) σ . Acest indicator sintetic al dispersiei se calculează ca medie pătratică a abaterilor individuale. Se obţine după relaţia:
∑(x
∑ d n 2 i
σ
i
i
=
∑n
=
− x ) ni 2
i
i
=
∑n
i
σ
2
i
i
i
Intervalul mediu de variaţie. Pe baza indicatorilor sintetici ai dispersiei se poate calcula intervalul mediu de variaţie. Acesta este definit de următoarele limite:
x − d x − σ , respectiv x ± σ = x ± d = x + d x + σ Atât abaterea medie liniară cât şi abaterea medie pătratică se exprimă în unităţile de măsură în care este exprimată variabila X. Ca urmare, atunci când se fac analize comparative între gradul de variaţie a două sau mai multor distribuţii după caracteristici exprimate în unităţi de măsură diferite, este necesar ca, unităţile de măsură folosite pentru exprimarea indicatorilor sintetici să fie aduse la aceeaşi bază de semnificaţie. Acest pas se poate realiza prin intermediul coeficientului de variaţie (ν ). Coeficientul de variaţie ( ). Coeficientul de variaţie este o măsură relativă a dispersiei. Se calculează ca raport procentual între abaterea medie liniară sau abaterea medie pătratică şi media aritmetică, după relaţiile: υ
=
d x
·100
, respectiv υ =
σ
x
·100
Expresia relativă a coeficientului de variaţie, comparativ cu ceilalţi indicatori ai dispersiei calculaţi în mărimi medii ( d ; σ ), măreşte sfera de comparabilitate a acestuia. Cu ajutorul coeficientului de variaţie pot fi comparate dispersiile diferitelor distribuţii după variabile exprimate în unităţi de măsură diferite. Coeficientul de variaţie poate lua valori cuprinse între: 0< ν <100%. Când ν tinde spre zero, se consideră o variaţie slabă şi deci o colectivitate omogenă, iar media are un grad de reprezentativitate ridicat. Cu cât nivelul coeficientului de variaţie tinde spre 100% cu atât variaţia este mai intensă, colectivitatea mai eterogenă, iar media are un nivel de reprezentativitate mai scăzut. Ca urmare, coeficientul de variaţie poate fi folosit şi ca test de semnificaţie a reprezentativităţii mediei, considerându-se următoarele praguri de semnificaţie: 0 < v < 17%: media este strict reprezentativă; 17% 50%: media nu este reprezentativă. 73
Sumar Dispersia exprimă gradul de împrăştiere a valorilor individuale ale unei distribuţii în jurul valorii centrale şi este datorată influenţei factorilor aleatori. Indicatorii simpli ai dispersiei măsoară câmpul de împrăştiere al caracteristicii, precum şi împrăştierea fiecărui nivel individual al caracteristicii faţă de nivelul lor mediu. Indicatorii simpli ai dispersiei sunt: amplitudinea variaţiei şi abaterea individuală. Aceşti indicatori pot fi calculaţi fie în mărimi absolute, fie în mărimi relative. Indicatorii sintetici ai dispersiei exprimă, în mod sintetic, împrăştierea tuturor nivelurilor individuale ale unei caracteristici faţă de nivelul lor mediu. Ca indicatori sintetici ai dispersiei se calculează: abaterea medie liniară, varianţa (dispersia), abaterea medie pătratică (deviaţia standard) şi coeficientul de variaţie. Indicatorii sintetici pot fi calculaţi ca mărimi medii, cu sferă de aplicabilitate numai la variabile comparabile şi ca mărimi relative , cu sferă largă de comparabilitate.
Întrebări 1. Definiţi dispersia şi indicatorii simpli şi sintetici ai acesteia 2. Care sunt indicatorii simpli ai dispersiei şi modul lor de calcul 3. Care sunt indicatorii sintetici ai dispersiei şi modul lor de calcul 4. Pragurile de semnificaţie ale coeficientului de variaţie în caracterizarea reprezentativităţii mediei
Aplicaţii rezolvate Aplicaţia 1. Considerăm un produs vândut prin cinci magazine. Fiecare magazin a practicat alt preţ (mii lei): 100, 110, 120, 130, 140. Se cere să se calculeze preţul mediu de vânzare al produsului şi varianţa acestuia. Rezolvare: Preţul mediu de vânzare se determină cu ajutorul mediei aritmetice. Gradul de dispersie se poate calcula cu ajutorul indicatorilor simpli şi sintetici ai dispersiei. Elementele de calcul sunt sintetizate în tabelul 7.1. Tabelul 7.1 Elemente de calcul xi 1 100 110 120 130 140 Total
(x
i
−x
2 -20 -10 0 +10 +20 0
(x
i
−x x
·100
3 -16,67 -8,33 0 8,33 16,67 74
xi −x
4 20 10 0 10 20 60
(x
i
−x
5 400 100 0 100 400 1000
)
2
* Preţul mediu de vânzare : x=
1
∑ xi n
=
600 5
i
= 120
mii lei
* Indicatorii simpli ai dispersiei: - Amplitudinea variaţiei (A), în mărimi absolute: A = xmax – xmin = 140 – 100 = 40 mii lei în procente:
A% =
xmax − x min x
·100 =
40 120
·100 = 33,3%
Rezultatele obţinute ne arată că, în această situaţie, câmpul de variaţie al preţului de vânzare al produsului prin cele cinci magazine este de 40 mii lei, ceea ce reprezintă 33,3% din preţul mediu de vânzare al produsului.
Abaterea individuală (d i):
(
d i = xi − x
) respectiv
d =
xi − x x
·100
este calculată în col.2 şi
3 din tabelul 7.1. * Indicatorii sintetici ai dispersiei:
Abaterea medie liniară (d ) :
∑ xi − x d =
i
=
n
60 5
= 12
mii lei
Preţul de vânzare prin cele cinci magazine se abate în medie faţă de preţul mediu cu 12 mii lei, în ambele sensuri, intervalul mediu de variaţie stabilit cu ajutorul acestui indicator având următoarele limite:
x − d = 1 2− 10 2= 1 0 mii lei x ± d = x + d = 1 2+ 10 =2 1 3 ∑ ( xi − x )
∑ d i
2
Varianţa (
2
): σ 2
=
i
n
=
2
i
=
n
Abaterea medie pătratică ( ): σ =
1000 5
∑ ( xi − x )
= 200
2
i
n
ni =
200 = 14,142
mii lei
Intervalul mediu de variaţie are următoarele limite:
x − σ = 1 2 − 01 ,41 4= 1 0,85 mii lei x ± σ = x + σ = 1 2 + 01 ,41 4= 1 3,14 Aceasta înseamnă că 68% din unităţile colectivităţii practică un preţ cuprins între 105,86 şi 134,14 mii lei. 75
Comparând rezultatele, se observă că > d , fapt explicat prin aceea că σ, fiind calculată ca o medie pătratică, reflectă într-o măsură mai mare influenţa factorilor întâmplători, adică abaterile mai mari faţă de medie, comparativ cu d . Abaterile extreme, prin ridicarea la pătrat, au o influenţă mai mare decât abaterile intermediare mai apropiate de medie. Ca urmare, abaterea medie pătratică caracterizează mai bine variaţia fenomenelor. σ
Coeficientul de variaţie (ν): υ =
σ
14 .14
x
120
·100 =
·100 = 11,78 %
arată o dispersie relativ mică, (ν < 17%), deci o colectivitate omogenă, ceea ce înseamnă că media este semnificativă pentru distribuţie.
Aplicaţia 2. Firmele dintr-un sector de activitate se distribuie, după cifra de afaceri lunară conform datelor din tabelul 7.2. Să se determine indicatorii simpli şi sintetici ai dispersiei şi să se analizeze rezultatele obţinute.
Rezolvare: Elementele de calcul sunt prezentate în tabelul 7.3. Tabelul 7.2. Date convenţionale Număr firme Cifra de afaceri (mil. lei) (ni) (xi) 176-178 178-180 180-182 182-184 184-186 186 şi peste
20 25 40 35 30 10
Total
160
Tabelul 7.3 Elemente de calcul necesare obţinerii indicatorilor dispersiei xi 176-178 178-180 180-182 182-184 184-186 186Total
ni 20 25 40 35 30 10 1600
xi'
xi' ni
xi' − x
xi' −x
177 179 181 183 185 187 -
354 4475 7240 6405 5550 1870 29080
-4,75 -2,75 -0,75 1,25 3,25 5,25 -
4,75 2,75 0,75 1,25 3,25 5,25 -
xi'
−x ·n ( x
95,00 68,75 30,00 43,75 97,50 52,50 387,50
* Indicatorii simpli ai dispersiei Amplitudinea variaţiei: A = xmax – xmin = 188 – 176 = 12 mil. lei 76
i
' i
−x
)
2
(x
' i
− x ) ni 2
22,5625 451,2500 7,5625 189,0625 0,5625 22,5000 1,5625 54,6875 10,5625 316,8750 27,5625 275,6250 1310,0000
xmax − xmin
A% =
x
·100 =
∑x n Media: x = ∑n ' i
i
i
=
i
12 181,75
29080 160
·100 = 6,60%
= 181,75 mil. lei
i
Rezultatele obţinute arată un câmp de variaţie a cifrei de afaceri egal cu 12 milioane lei, valoare ce reprezintă 6,6% din nivelul mediu al întregii distribuţii. * Indicatorii sintetici ai dispersiei
∑ xi − x ni Abaterea medie liniară:
d =
∑ni
=
387 ,50 160
= 2,42
mil. lei
i
Intervalul mediu de variaţie stabilit cu ajutorul acestui indicator are următoarele limite:
x − d = 1 8 ,17 5− 2,4 2= 1 7 ,93 mil. lei x + d = 1 8 ,17 5+ 2,4 2= 1 8 ,71 7 Varianţa:
2 σ
∑ ( x − x) = ∑n
2
i
ni
= 8,1875
i
Abaterea medie pătratică:
σ
=
2
σ
= 8,1875 = 2,86
mil. lei
Intervalul mediu de variaţie stabilit cu ajutorul acestui indicator are următoarele limite:
x − σ = 1 8,71 5− 2,8 6= 1 7,88 x ± σ = x + σ = 1 8,71 5+ 2,8 6= 1 8,64
mil. lei
Coeficientul de variaţie: υ =
σ
2,86
x
181 ,75
·100 =
= 1,57 %
Valoarea coeficientului de variaţie indică o omogenitate mare a colectivităţii şi, ca urmare, o reprezentativitate bună a mediei pentru întreaga colectivitate.
77
Modulul 8. SERII CRONOLOGICE 8.1. Definiţie, clasificare, proprietăţi Seria cronologică reprezintă corespondenţa între două şiruri de date statistice, sistematizate într-o succesiune logică, în care primul şir arată variaţia caracteristicii de timp, iar al doilea şir variaţia fenomenului sau caracteristicii studiate, de la o unitate de timp la alta. Seriile cronologice se regăsesc în literatura de specialitate şi sub denumirea de serii de timp, serii dinamice sau cronici. Clasificarea seriilor cronologice se poate face în funcţie de modul de definire a timpului la care se referă datele şi după modul de exprimare a indicatorilor din care este formată seria. a) după modul de definire a timpului, prin momente (T i ) sau prin intervale (t i = T i -T i −1 ) se
disting:
serii cronologice de momente (sau de stocuri), definite prin cuplurile de valori (T i , y i ), care prezintă volumul unei colectivităţi de stări (fiinţe, lucruri) la diferite momente. Caracteristic acestui tip de serie este faptul că termenii ei nu se pot cumula în scopul obţinerii unui indicator totalizator, deoarece cuprinde înregistrări repetate. Exemple de serii cronologice de momente: populaţia unei ţări la anumite date; valoarea capitalului fix al unei firme la sfârşitul fiecărui an, stocul de marfă al unei unităţi de desfacere la anumite momente de timp etc. serii cronologice de intervale (sau de fluxuri), definite prin cuplurile de valori (t i , • y i ), care prezintă nivelul unui fenomen în diferite intervale de timp. Fiecare valoare din serie este rezultatul acumulărilor într-o perioadă de timp delimitată de două momente distincte. Drept intervale pot fi utilizate: ora, ziua, luna, trimestrul, anul, în funcţie de natura fenomenului analizat şi de scopul cercetării. Caracteristic acestui tip de serie este faptul ca termenii ei se pot cumula, indicatorul obţinut având o semnificaţie bine precizată. Exemple de serii cronologice de intervale: producţia obţinută, cifra de afaceri, volumul desfacerilor pe anumite perioade etc. b) după modul de exprimare a indicatorilor din care este formată seria se disting: serii cronologice formate din indicatori absoluţi, care reprezintă forma de bază a • seriilor de timp. Ele asigură cea mai cuprinzătoare prelucrare şi permit obţinerea altor serii de indicatori derivaţi pentru analiza fenomenului. serii cronologice formate din indicatori relativi, care se obţin în urma prelucrării • unor serii de mărimi absolute. Indicatorii relativi se pot prezenta sub formă de mărimi relative de coordonare, de dinamică sau de structură. În cazul acestor serii este obligatoriu ca în titlul tabelului în care sunt prezentate sau în afara acestuia să se specifice care este baza de raportare, pentru corecta interpretare a datelor. serii cronologice formate din indicatori medii, care se obţin din caracteristici • calitative calculate ca raport a două mărimi cantitative (productivitatea muncii, randamentul mediu, recolta medie la hectar etc.) sau pentru caracteristici cantitative, în care fiecare •
78
valoare ce se referă la o perioadă de timp, se obţine ca medie (numărul mediu lunar al salariaţilor, valoarea medie anuală a capitalului fix etc.) La analiza seriilor cronologice trebuie avute în vedere unele proprietăţi ale acestora, şi anume: variabilitatea, omogenitatea, periodicitatea şi interdependenţa termenilor prezentaţi. / 8,p.278 – 280/ Variabilitatea termenilor unei serii cronologice provine din faptul că fiecare termen se obţine prin centralizarea unor date individuale diferite ca nivel de dezvoltare. Aceste diferenţieri apar, pe de o parte, ca urmare a acţiunii factorilor întâmplători şi, pe de altă parte, ca urmare a faptului că în dinamică legile sociale şi economice se manifestă ca tendinţă, imprimând fenomenelor forme diferite de variaţie. Cu cât acţiunea comună a acestor factori este mai puternică, cu atât variaţia în cadrul seriei este mai mare şi tendinţele de scurtă şi de lungă durată mai greu de sesizat. Având în vedere această trăsătură, este necesar ca, analizând o serie cronologică, să se măsoare atât gradul şi forma de influenţă a factorilor esenţiali, care imprimă fenomenului o lege specifică de evoluţie, cât şi gradul de abatere de la această tendinţă generală rezultat din influenţa factorilor neesenţiali, cu caracter întâmplător. Omogenitatea termenilor trebuie înţeleasă în sensul că în aceeaşi serie nu pot fi înscrise decât fenomene de acelaşi gen, care sunt rezultatul acţiunii aceloraşi cauze esenţiale. Asigurarea omogenităţii observaţiilor de-a lungul unei perioade de timp presupune menţinerea aceleiaşi metodologii de calcul şi evaluare a indicatorilor care urmează să fie analizaţi în dinamică, a criteriilor de clasificare a colectivităţii studiate şi nomenclatoarelor şi intervalelor de grupare, menţinerea unităţii social–economice sau administrativ–teritoriale asupra căreia s-au făcut observaţii, cât şi a unităţii de măsurare a timpului. Practic, înseamnă că de fiecare dată când se analizează o serie statistică trebuie să se verifice dacă datele provin din aceeaşi sursă, au acelaşi grad de cuprindere a unităţilor şi au fost folosite aceleaşi principii şi metode de prelucrare, cu alte cuvinte dacă este asigurată comparabilitatea datelor înscrise în aceeaşi serie. O altă trăsătură caracteristică a seriilor cronologice o constituie periodicitatea termenilor din care este formată seria, ceea ce înseamnă de fapt asigurarea continuităţii datelor din punct de vedere a variabilei de timp care poate da posibilitatea interpretării seriei cronologice ca o funcţie analitică [ yi = f (t i )] . Variabila de timp poate fi înregistrată cu periodicităţi diferite. De aceea, alegerea unităţii de timp la care se referă datele unei serii cronologice trebuie făcută în raport cu scopul cercetării, conţinutul şi posibilităţile de măsurare a fiecărui indicator. De exemplu, producţia industrială se poate urmări atât în unităţi de timp mici (ziua, luna, decada), cât şi în unităţi de timp mari (trimestrul, semestrul, anul). În cazurile când unele caracteristici sunt influenţate în variaţia lor de schimbarea anotimpurilor, cu alte cuvinte apar fenomene cu caracter sezonier (lunar sau trimestrial) este obligatoriu să se folosească o astfel de periodizare a seriei. În studiul seriilor cronologice se pune problema, atât a alegerii unităţilor de timp la care se referă fiecare indicator, cât şi a lungimii etapei pentru care se prezintă datele, cu precizarea anului de bază. Ca an de bază se alege acel an care prezintă o anumită semnificaţie în evoluţia fenomenului studiat. De exemplu, în cazul unei întreprinderi se poate lua ca an de bază acela în care s-au produs modificări în ceea ce priveşte structura organizatorică a procesului de producţie sau a procesului de muncă, modificarea relaţiilor de proprietate, redimensionarea, retehnologizarea etc. Rezultă că această proprietate este definitorie pentru elaborarea corectă a unei serii cronologice şi a indicatorilor care pot fi utilizaţi la analiza în dinamică a fenomenelor luate în studiu. Interdependenţa termenilor unei serii cronologice apare ca urmare a respectării principiului unităţii de timp şi spaţiu şi structurii organizatorice. Ca atare, indicatorii prezentaţi sunt valori succesive ale aceloraşi fenomene înregistrate la nivelul aceleiaşi unităţi teritorial-administrative sau orice unitate statistică complexă care poate fi înregistrată autonom. Aceasta face ca valoarea fiecărui indicator să depindă într-o oarecare măsură de valoarea indicatorului precedent, ca urmare a 79
faptului că relaţiile de cauzalitate se manifestă în condiţii asemănătoare de la o unitate de timp la alta. Luând în consideraţie toate aceste particularităţi, analiza statistică a seriilor cronologice trebuie să se bazeze pe un sistem de indicatori, care să caracterizeze multiplele relaţii cantitative din interiorul seriei şi pe toată perioada la care se referă datele. Ca atare, problemele care se pun şi trebuie rezolvate la analiza seriilor cronologice sunt: • alegerea lungimii seriei şi elaborarea ei astfel încât, pe cât posibil, să îndeplinească condiţia legii numerelor mari, adică să aibă un număr suficient de date pentru orizontul de analiză statistică cu care să se fundamenteze corect prognozele de lungă şi scurtă durată; • calculul şi analiza unui sistem de indicatori statistici absoluţi, relativi şi medii necesari caracterizării seriei; • identificarea trendului (tendinţei) de evoluţie a fenomenelor din cadrul seriei prin utilizarea metodelor de ajustare statistică şi testelor de verificare a ipotezelor privind forma obiectivă de evoluţie pe perioada luată în calcul; • calculul şi analiza sezonalităţii şi a altor forme de evoluţie cu caracter ciclic; • interpolarea şi extrapolarea seriilor cronologice potrivit scopului cercetării statistice.
8.2. Indicatori statistici utilizaţi în caracterizarea seriilor cronologice Seriile cronologice pot fi caracterizate utilizând un sistem de indicatori exprimaţi în mărimi absolute, relative şi medii.
Indicatorii absoluţi cuprind: • nivelurile absolute ale termenilor seriei; • volumul absolut (nivelul totalizant) al termenilor seriei; • modificarea (sporul) absolută. Indicatorii relativi cuprind: • ritmul sau indicele de variaţie; • ritmul sporului; • valoarea absolută a unui procent de creştere (scădere). Indicatorii medii rezultaţi din prelucrarea unei serii cronologice sunt: • nivelul mediu; • sporul mediu; • ritmul mediu al variaţiei; • ritmul mediu al sporului. 8.2.1. Indicatori absoluţi ai seriei cronologice Indicatorii absoluţi ai unei serii cronologice se exprimă în unităţile concrete de măsură ale fenomenului studiat. Nivelul absolut reprezintă valoarea y i a fiecărui termen al seriei cronologice. Volumul absolut sau nivelul totalizant (Y) se obţine însumând nivelurile absolute ale termenilor seriei. Y =
n
∑y
i
= y1 + y2 + .... + yn
i =1
80
Indicatorul are semnificaţie şi deci se calculează numai pentru seriile cronologice de intervale.
Sporul (modificarea) absolut ( ∆) exprimă, în mărime absolută, cu cât a crescut sau a descrescut un fenomen, într-o perioadă sau moment faţă de o altă perioadă sau un alt moment considerat ca bază de comparare. Sporul absolut poate fi calculat fie faţă de nivelul unei singure perioade (a unui singur moment) considerată ca bază de referinţă, fie de la o perioadă de timp (moment) la alta. În primul caz se obţine sporul absolut cu bază fixă, iar în cel de-al doilea caz se obţine sporul absolut cu bază mobilă sau în lanţ. Sporul absolut cu bază fixă (Δi/0) se calculează ca diferenţă între oricare termen (y i) şi termenul iniţial (y0), conform relaţiei: Δi/0 = yi – y0 Sporul absolut cu bază mobilă sau în lanţ ( ∆i / i 1 ) se calculează ca diferenţă între doi termeni consecutivi, conform relaţiei: −
∆i / i −1 = yi − yi −1
Semnificaţia sporului absolut este următoarea: ∆>0 arată o creştere a fenomenului; ∆ = 0 arată o evoluţie constantă a fenomenului; ∆ < 0 arată o scădere a fenomenului. Între sporurile cu bază fixă şi cele cu bază mobilă există anumite relaţii care permit trecerea de la unele la altele. Aceste relaţii sunt: n
•
∑∆i / i 1 = ∆n / 0 −
i =0
•
∆i / 0 − ∆i −1 / 0 = ∆i / i −1
Relaţiile între sporuri se folosesc în cazul în care nu se dispune de date absolute, ci se cunosc doar modificările cu bază fixă şi mobilă şi se doreşte reconstituirea seriei.
8.2.2. Indicatori relativi ai seriei cronologice Indicatorii relativi ai unei serii cronologice se exprimă sub formă de coeficienţi sau procente, fiind rezultatul comparaţiei sub formă de raport între nivelul fenomenului dintr-o perioadă (moment) şi nivelul aceluiaşi fenomen înregistrat într-o perioadă (moment) de referinţă. În cadrul indicatorilor relativi ai seriilor cronologice se includ ritmul sau indicele de variaţie şi ritmul sporului. Ritmul sau indicele de variaţie (R) arată de câte ori s-a modificat nivelul unui fenomen într-o anumită perioadă (moment) faţă de nivelul aceluiaşi fenomen dintr-o altă perioadă (moment) considerată ca bază. În funcţie de baza de raportare se pot calcula ritmuri de variaţie cu bază fixă sau cu bază mobilă. Ritmul de variaţie cu bază fixă (R i / 0 ) se calculează ca raport între oricare termen (y i) şi termenul ales ca bază (y 0 ), conform relaţiilor:
81
yi
Ri / 0 =
, respectiv
Ri / 0 =
Ritmul de variaţie cu bază mobilă ( Ri
/ i −1
y0
yi y0
⋅100
)se calculează ca raport între oricare
termen (yi) şi termenul anterior (yi-1), conform relaţiilor: Ri / i −1 =
yi yi −1
, respectiv Ri / i −1 =
yi yi −1
⋅100
Semnificaţia ritmului de variaţie este următoarea: R >1 arată o creştere a fenomenului; R=1 arată o evoluţie staţionară a fenomenului; R < arată o scădere a fenomenului. Dacă ritmul de variaţie se exprimă în procente, interpretarea de mai sus se face în raport cu 100. Între ritmurile de variaţie cu bază fixă şi cele cu bază mobilă există anumite relaţii care permit trecerea de la o formă la alta. Aceste relaţii sunt: n
•
∏R
i / i −1
= Rn / 0
i= 0
•
Ri / 0 ÷ Ri −1 / 0 = Ri / i−1
Ritmul sporului (r) arată cu cât s-a modificat, în mărime relativă, nivelul fenomenului în perioada (momentul) raportată faţă de nivelul aceluiaşi fenomen înregistrat într-o altă perioadă (moment) aleasă ca bază de raportare. În funcţie de baza de raportare se pot calcula ritmuri ale sporului cu bază fixă sau cu bază mobilă. Ritmul sporului cu bază fixă ( r ) se calculează ca raport între sporul absolut cu bază fixă a fiecărei perioade (moment) şi nivelul fenomenului în perioada (momentul) de bază, conform relaţiilor: i /0
r i / 0 =
∆i / 0 y0
=
yi − y0 y0
=
yi y0
− 1 = Ri / 0 − 1 ,
respectiv, r i / 0 =
∆ i/0 y0
⋅ 100 =
yi − y0i y0
⋅ 100 = Ri / 0 − 100 ,
când exprimarea este procentuală. Ritmul sporului cu bază mobilă (r i/i-1) se calculează ca raport între modificarea absolută cu bază în lanţ a fiecărei perioade (moment) şi nivelul fenomenului în perioada (momentul) precedentă, conform relaţiilor: r i / i −1 =
∆i / i −1
yi −1
=
yi − yi −1 yi −1
respectiv, 82
=
yi yi −1
−1 = Ri / i −1 −1 ,
r i / i −1 =
∆i / i −1
yi−1
⋅100 =
yi − yi−1 yi −1
⋅100 = Ri / i −1 −100 ,
când exprimarea este procentuală. Semnificaţia indicatorului ritmul sporului este următoarea: r >0 indică o creştere a fenomenului; r = 0 indică o evoluţie constantă a fenomenului; r <0 indică o scădere (descreştere) a fenomenului. În analiza seriilor cronologice trebuie precizat că în timp ce ritmurile cu bază fixă sunt comparabile între ele, având acelaşi numitor, cele cu bază mobilă nu se pot compara nemijlocit. De aceea este necesar să se calculeze un indicator intermediar care este valoarea absolută a unui procent de creştere. Valoarea absolută a unui procent de creştere (A%) exprimă câte unităţi din sporul/deficitul înregistrat într-un an revin la fiecare procent din ritmul sporului corespunzător. Valoarea absolută a unui procent de creştere cu bază fixă se calculează ca raport între sporul absolut cu bază fixă şi ritmul sporului corespunzător aceleiaşi perioade, conform relaţiei: A% ( y i / 0 ) =
∆i / 0
r i / 0
Valoarea absolută a unui procent de creştere cu bază mobilă se calculează conform relaţiei: A% ( y i / i 1 ) =
∆i / i −1
r i / i −1
−
Acest indicator se exprimă în unitatea de măsură a fenomenului analizat; el face legătura între indicatorii absoluţi şi cei relativi.
8.2.3. Indicatori medii ai seriei cronologice Indicatorii medii sunt mărimi calculate prin sintetizarea întregii serii cronologice, pe baza indicatorilor absoluţi sau relativi ai acesteia. În analiza statistică a seriilor cronologice, ca indicatori medii se folosesc: nivelul mediu, sporul absolut mediu, ritmul mediu al variaţiei şi ritmul mediu al sporului. Nivelul mediu ( y ) se calculează diferit, în funcţie de tipul seriei cronologice. a) Pentru seria de timp de intervale nivelul mediu se determină folosind formula mediei aritmetice simple aplicată termenilor seriei, astfel: n
∑y
i
y=
i =1
n
,
în care n = numărul de termeni ai seriei. b) Pentru seria de timp de momente nivelul mediu de determină cu ajutorul mediei cronologice. În acest caz există două posibilităţi: • Când momentele sunt egal distanţate se foloseşte formula mediei cronologice simple: y1 ycr = 2
+ y2 + ........ + yn−1 +
n −1
83
yn 2 ;
Când momentele sunt inegal distanţate se foloseşte formula mediei cronologice ponderate: y + y3 y + yn y1 + y2 ⋅ t 1 + 2 ⋅ t 2 + .......... ....... + n−1 ⋅ t n−1 2 2 2 ycr = t 1 + t 2 + .......... ....... + t n−1 •
sau y1 ycr =
în care
t i
t 1 2
+ y2
t 1 + t 2
+ .......... ....... + yn
2 t 1 + t 2 + .......... ....... + t n−1
t n−1 2
= mărimea intervalelor dintre două momente consecutive.
Sporul absolut mediu ( ) reflectă modificarea medie pe unitatea de timp înregistrată de un fenomen într-o perioadă. Se calculează conform relaţiei: ∆=
∑∆i / i 1 −
n
=
∆n / 0
n
=
yn − y0 n
,
în care n = numărul sporurilor cu bază mobilă. Relaţia se foloseşte atât în cazul seriilor cronologice de intervale, cât şi a celor de momente. Deoarece acest indicator se calculează utilizând doar primul şi ultimul termen al seriei, el are semnificaţie numai dacă seria este omogenă. Ritmul mediu al variaţiei ( R ) este indicatorul care indică de câte ori s-a modificat, în medie, pe an, nivelul unui fenomen într-o perioadă. Se calculează, de regulă, după metoda mediei geometrice, conform relaţiei: R=n
∏
Ri / i−1 = n Rn / 0 = n
yn y0
,
în care n = numărul ritmurilor de variaţie cu bază mobilă.
Ritmul mediu al sporului ( r ) indică, în expresie relativă, cu cât s-a modificat în medie pe an nivelul unui fenomen într-o perioadă. Se calculează pe baza ritmului mediu al variaţiei, conform relaţiei: r = R −1 , respectiv r = R −100
în cazul exprimării procentuale.
Sumar Seria cronologică reprezintă corespondenţa între două şiruri de date statistice, sistematizate într-o succesiune logică, în care primul şir arată variaţia caracteristicii de timp, iar al doilea şir variaţia fenomenului sau caracteristicii studiate, de la o unitate de timp la alta. Clasificarea seriilor cronologice se poate face în funcţie de modul de definire a timpului la care se referă datele şi după modul de exprimare a indicatorilor din care este formată seria. 84
a) după modul de definire a timpului, prin momente (T i ) sau prin intervale (t i = T i -T i −1 ) se disting: - serii cronologice de momente (sau de stocuri), definite prin cuplurile de valori (T i , y i ), care prezintă volumul unei colectivităţi de stări (fiinţe, lucruri) la diferite momente. - serii cronologice de intervale (sau de fluxuri), definite prin cuplurile de valori (t i , y i ), care prezintă nivelul unui fenomen în diferite intervale de timp. b) după modul de exprimare a indicatorilor din care este formată seria se disting: - serii cronologice formate din indicatori absoluţi - serii cronologice formate din indicatori relativi - serii cronologice formate din indicatori medii La analiza seriilor cronologice trebuie avute în vedere unele proprietăţi ale acestora, şi anume: variabilitatea, omogenitatea, periodicitatea şi interdependenţa termenilor prezentaţi. Seriile cronologice pot fi caracterizate utilizând un sistem de indicatori exprimaţi în mărimi absolute, relative şi medii. Indicatorii absoluţi cuprind: • nivelurile absolute ale termenilor seriei; • volumul absolut (nivelul totalizant) al termenilor seriei; • modificarea (sporul) absolută. Indicatorii relativi cuprind: • ritmul sau indicele de variaţie; • ritmul sporului; • valoarea absolută a unui procent de creştere (scădere). Indicatorii medii rezultaţi din prelucrarea unei serii cronologice sunt: • nivelul mediu; • sporul mediu; • ritmul mediu al variaţiei; • ritmul mediu al sporului.
Întrebări 1. Definiţi seriile cronologice şi precizaţi alte denumiri sub care pot fi întâlnite în literatura de specialitate 2. Clasificaţi seriile cronologice după modul de definire a timpului şi modul de exprimare a indicatorilor care o compun şi exemplificaţi din domeniul economico-social 3. Precizaţi graficele specifice acestor tipuri de serii 4. Care sunt proprietăţile seriilor cronologice; discuţie 5. Definiţi şi indicaţi modul de calcul al indicatorilor absoluţi, relativi şi medii care pot caracteriza o serie cronologică 6. Indicaţi relaţiile care există între sporurile cu bază fixă şi cele cu bază mobilă 7. Indicaţi relaţiile care există între ritmurile de variaţie cu bază fixă şi cele cu bază mobilă 8. Care este semnificaţia mărimii sporului absolut şi a ritmului de variaţie 9. Denumiţi şi indicaţi formula de calcul a indicatorului care face legătura între indicatorii absoluţi şi cei relativi
Aplicaţii rezolvate şi propuse Aplicaţia 1. Producţia de carne în România, în perioada 1985-1994 este prezentată în tabelul 8.1. 85
Se cere: a) să se caracterizeze seria; b) să se calculeze indicatorii absoluţi ai variaţiei în timp, cu bază fixă şi bază mobilă şi să se verifice valorile obţinute; c) să se calculeze indicatorii relativi ai variaţiei în timp, cu bază fixă şi bază mobilă; d) să se determine valoarea absolută a unui procent de creştere cu bază fixă şi bază mobilă; e) să se determine nivelul mediu şi sporul absolut mediu.
Anii
Producţia de carne (mii tone)
Anii
Tabelul 8.1 Producţia de carne (mii tone)
1985 986 1990 1986 962 1991 1987 1006 1992 1988 810 1993 1989 699 1994 Sursa: Anuarul Statistic al României, CNS, 1995.
947 855 623 626 601
Rezolvare: a)
Serie cronologică de intervale.
b) Calculul indicatorilor absoluţi se face după formulele: Volumul absolut: Y = ∑ yi Sporul cu bază fixă: ∆i / 0 = yi − y0 Sporul cu bază mobilă: ∆i / i −1 = y i − y i −1 Y= 986+962+1006+810+699+947+855+623+626+601=8115 mii tone Rezultatele calculului pentru sporul absolut sunt prezentate în tabelul 8.2, coloanele 3 şi 4
Anii
Producţia de carne (mii tone) yi
1 1985 1986 1987 1988 1989 1990 1991
Tabelul 8.2 Determinarea sporului absolut Sporul absolut (mii tone) ∆ cu bază mobilă cu bază fixă y i − y 0 y −y i
2 986 962 1006 810 699 947 855
3 0 -24 +20 -176 -287 -39 -131 86
i −1
4 -24 +44 -196 -111 +248 -92
1992 1993 1994 Total
623 626 601 8115
-363 -360 -385 -
-232 +3 -25 -385
Verificarea valorilor obţinute se face pe baza relaţiei dintre sporurile cu bază fixă şi cele cu bază mobilă:
∑∆
i / i −1
= ∆n / 0
Relaţia se verifică: (col 3, c)
∆94 / 85 = −385 ; col 4, ∑∆i / i −1 = −385
Calculul indicatorilor relativi este prezentat în tabelul 8.3, coloanele 3,4,5,6.
Ritmul variaţiei cu bază fixă:
Ri / 0 =
Ritmul variaţiei cu bază mobilă: Ritmul sporului cu bază fixă:
1 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994
Producţia de
yi y0
⋅100
Ri / i −1 =
r i / 0 =
Ritmul sporului cu bază mobilă:
Anii
)
∆i / 0 y0
r i / i −1 =
yi y i −1
⋅100
⋅100 ∆ i / i −1
y i −1
⋅100
Ritmul variaţiei (%) R
carne(mii tone)
cu bază fixă
cu bază mobilă
yi
( y i / y 0 ) ⋅100
( y i / y i −1 ) ⋅100
2 986 962 1006 810 699 947 855 623 626 601
3 100,00 97,56 102,03 82,15 70,89 96,04 86,71 63,18 63,49 60,95
4 97,56 104,57 80,52 86,30 135,48 90,29 72,87 100,48 90,01
d) Valoarea absolută a unui procent de creştere: • cu bază fixă: A% ( y i / 0 ) =
∆i / 0 r i / 0
87
Tabelul 8.3. Ritmul sporului (%) r cu bază fixă
cu bază mobilă
(∆i / 0 / y 0 ) ⋅100 (∆i / i −1 / y i −1 ) ⋅100
5 0 -2,44 2,03 -17,85 -29,11 -3,96 -13,29 -36,82 -36,51 -39,05
6 -2,44 4,57 -19,48 -13,70 35,48 -9,71 -27,13 0,48 -3,99
A
%
( y86 / 85 ) =
A
%
( y87 / 85 ) =
A
%
( y90 / 85 ) =
A
%
− 24 = 9,8 − 2,43 20
= 9,8
2,03 −39
mii tone
mii tone
= 9,8 mii tone − 3,96 −385 ( y94 / 85 ) = = 9,8 mii tone −39 ,05
Valorile rezultate arată că faţă de producţia anului de bază (1985) unui procent de creştere a producţiei de carne îi corespunde un spor absolut de 9,8 mii tone. • cu bază mobilă: A % ( yi / i −1 ) =
A
%
( y86 / 85 ) =
A
%
( y87 / 86 ) =
A
%
( y90 / 89 ) =
A
%
( y94 / 93 ) =
− 24 = 9,8 − 2,43 44 4,57
= 9,6
248 35 ,48 − 25
−3,99
∆i / i −1
r i / i −1
mii tone
mii tone
= 6,9
mii tone
= 6,3
mii tone
Rezultatele obţinute arată că unui procent de creştere a producţiei într-un an faţă de anul anterior îi corespunde un anumit spor absolut, egal cu valorile calculate. e) Indicatorii medii ai seriei: Nivelul mediu: ( y ) y= y=
∑ yi n 8115
= 811 ,5
10
Sporul mediu:
mii tone
(∆ )
n
∑∆ ∆= ∆=
i / i −1
i =0
=
n − 385
9
∆n/ 0 n
= −42 ,7
mii tone
n = numărul sporurilor cu bază mobilă
Aplicaţia 2. Numărul de elevi înscrişi într-o şcoală generală în perioada 1990-000 (date convenţionale începutul anului şcolar) este prezentat în tabelul 8.4. Tabelul 8.4 88
Anii 1990
Număr elevi 550 t1=2
1992
650
t2=2 1994
550
t3=2
1996
600
t4=2
1998
650 t5=2
2000
600
Se cere: a) să se caracterizeze seria; b) să se determine numărul mediu al elevilor înscrişi în şcoala generală în perioada 1990 – 2000. Rezolvare: a) Serie statistică cronologică de momente egal distanţate. b) Calculul numărului mediu al elevilor se realizează cu ajutorul mediei cronologice simple: y1 y cr = 2
+ y2 + y3 + y4 + y5 +
550 y cr =
2
y6 2
n −1
+ 650 + 550 + 600 + 650 + 6 −1
600 2
=
3025 5
= 605
elevi
Aplicaţia 3. Numărul bibliotecilor proprietate publică din România (la sfârşitul anului) este prezentat în tabelul 8.5. Tabelul 8.5 Anii Număr biblioteci 1980 21.145 t1=5 1985 21.448 t2=1 1986 21.422 t3=3 1989 16.873 t4=1 1990 16.665 t5=2 1992 13.999 t6=2 1994 13.866 Sursa: Anuarul Statistic al României, CNS, 1995. Se cere: a)
să se caracterizeze seria; 89
b) să se calculeze numărul mediu anual al bibliotecilor din România în perioada 1980 – 1994. Rezolvare: a) Serie statistică cronologică de momente inegal distanţate. b) Calculul numărului mediu al bibliotecilor în perioada 1980 – 1994 se realizează cu ajutorul mediei cronologice ponderate. y1 + y2 y cr =
⋅ t 1 +
2
y2 + y3 2
yn−1 + yn 2
⋅ t n−1
t 1 + t 2 + .......... .. + t n−1 2 1.1 4 5+ 2 1.4 4 8
2 1.4 4 8+ 2 1.4 4 2
2 1.4 4 2+ 1 6.8 7 6
2
2
2
y c r =
⋅5+
⋅1+
⋅3+
14
16.873 + 16 .665 2
+
=
⋅ t 2 + .......... +
⋅1 +
16.665 + 13 .999 2 14
⋅2 +
13.999 +13.866 2
⋅2
106 .482 ,5 + 21 .445 + 57 .472 ,5 +16 .769 + 30 .664 + 27 .865 14
=
=
260 .698 14
=18 .621 ,3 ≈18 .621
biblioteci
Aplicaţia 4. Cifra de afaceri a unei societăţi comerciale a fost în 1998 cu 225 milioane lei mai mare decât în 1995, ceea ce reprezintă o creştere relativă cu 12,50%. Se cere să se determine cifra de afaceri a societăţii în anii 1995 şi 1998. Rezolvare: r 1 / 0 =
∆i / 0
y0
r 1998 / 1995 = 0,125 = y95 =
y98 − y95 y95
225 millei
y95
225 0,1250
= 1.800 ,0millei
y98 = y 95 + ∆98 / 95 y98 = 1.800 + 225 = 2.025 millei Deci : y 95 = 1.800 millei y98 = 2.025 millei
Aplicaţia 5. 90
Populaţia emigrantă din România în perioada 1989 – 1994 este prezentată în tabelul 8.6. Tabelul 8.6 Anul Emigranţi 1989 41.363 1990 96.929 1991 44.160 1992 31.152 1993 18.446 1994 17.146 Sursa: Anuarul Statistic al României, CNS, 1995. Se cere: a) să se caracterizeze seria; b) să se calculeze indicatorii absoluţi şi relativi ai variaţiei în timp, precum şi valoarea absolută a unui procent de creştere cu bază fixă şi bază mobilă; c) să se determine indicatorii medii ai seriei.
Aplicaţia 6. Pentru caracterizarea vânzărilor dintr-un produs, în tabelul 8.9 sunt prezentate date cu privire la evoluţia ritmului sporului. Anul Ritmul sporului
I -
II 1,5
III 2,0
IV -0,75
V 2,5
Tabelul 8.9 VI 1,0
Se mai cunoaşte că în ultimul an s-au vândut cu 20.000 bucăţi produse mai mult decât în primul an. Se cere să se reconstituie seria de date în valori absolute.
Aplicaţia 7. Efectivele de bovine în România în perioada 1981 – 1995 (la începutul anului) sunt prezentate în tabelul 8.7. Tabelul 8.7 Bovine (mii capete) 6.485 6.692 6.559 6.416 6.291 3.683
Anul 1981 1986 1988 1989 1990 1993 91
1995 3.481 Sursa: Anuarul Statistic al României, CNS, 1995. Se cere: a) să se caracterizeze seria; b) să se determine indicatorii absoluţi şi relativi, cu bază fixă şi bază mobilă; c) să se determine numărul mediu al efectivelor de bovine din România în perioada 1981-1995.
Aplicaţia 8. Parcul de tractoare din agricultura României în perioada 1988 – 1994 (la sfârşitul anului) este prezentat în tabelul 8.8. Tabelul 8.8 Anul Tractoare (bucăţi) 1988 165.072 1990 127.065 1992 146.790 1994 161.223 Sursa: Anuarul Statistic al României, CNS, 1995. Se cere: a) să se caracterizeze seria; b) să se determine numărul mediu de tractoare din România în perioada 1988 – 1994.
92
Modulul 9. INDICII STATISTICI 9.1. Noţiunea de indice statistic şi problemele teoretice ale construirii sale. Metoda indicilor statistici constituie una dintre principalele modalităţi de analiză a variaţiei în timp şi spaţiu a unui fenomen complex, în funcţie de modificarea factorilor de influenţă. Indicii statistici se calculează ca raport între două nivele ale aceluiaşi fenomen, înregistrate fie pentru momente (perioade), fie pentru spaţii diferite. Adesea mărimile comparate îmbracă forma unor fenomene complexe, a căror variaţie este determinată de influenţa unor factori ce trebuie identificaţi. După natura lor aceşti factori se grupează în două categorii: • factori cantitativi, notaţi cu f i , care apar sub formă de unităţi ale colectivităţii, jucând deseori rolul de frecvenţe. Sunt factori de natură extensivă (exemple: numărul salariaţilor, cantităţile de produse, fondurile fixe etc.); • factori calitativi (x i ), de natură intensivă, exprimaţi sub formă de caracteristici ale unităţilor luate în calcul (exemple: costurile producţiei, preţurile de vânzare ale produselor, productivitatea muncii etc.). Unele valori individuale ale factorilor cantitativi pot fi însumate direct, în timp ce altele nu sunt însumabile. Valorile factorilor calitativi sunt întotdeauna neînsumabile direct. Pentru determinarea nivelului totalizator al valorilor luate în calculul indicilor, atunci când acestea nu sunt însumabile direct, este necesară folosirea ponderilor. Ponderea are rolul de comăsurător al valorilor factorilor neînsumabili, figurând întotdeauna cu aceeaşi valoare atât la numărătorul cât şi la numitorul raportului. Rolul de pondere îl pot avea atât factorii cantitativi cât şi cei calitativi.
9.2. Tipuri de indici Indicii statistici se pot clasifica folosind diverse criterii. După natura variaţiei pe care o măsoară , indicii statistici pot fi: indici ai dinamicii, care rezultă prin compararea nivelului unui fenomen din • perioada curentă cu nivelul aceluiaşi fenomen dintr-o perioadă anterioară; indici teritoriali sau de spaţiu, care rezultă din compararea aceluiaşi fenomen, • înregistrat în aceeaşi perioadă de timp, în două unităţi teritoriale; indici ai planului, care rezultă din compararea nivelului realizat cu nivelul planificat • al aceluiaşi fenomen (indicele realizării planului) sau din compararea nivelului planificat cu nivelul realizat într-o perioadă anterioară (indicele sarcinii de plan). După felul bazei de calcul, indicii statistici pot fi: indici cu bază fixă; • indici cu bază mobilă (în lanţ) •
Aceşti indici sunt trataţi ca ritmuri ale variaţiei, cu bază fixă şi mobilă şi se determină conform relaţiilor: ii / 0 = y
yi y0
sau
iiy/ 0 =
93
yi y0
⋅100
şi y
ii / i −1 =
yi yi −1
sau
yi
y
ii / i −1 =
yi −1
⋅100
După sfera de cuprindere a fenomenului, format din mărimi simple sau din mărimi complexe, incluzând mărimi simple cu ponderi diferite, indicii statistici pot fi: indici individuali, simbolizaţi cu „i”, care exprimă variaţia relativă la nivelul unei • singure unităţi de observare; indici de grup, simbolizaţi cu „I”, care exprimă variaţia relativă la nivelul unei • grupe sau pe întregul ansamblu.
Indicii individuali sau simpli se calculează după relaţiile: i1y/ 0 =
y1 y0
sau
y i1 / 0 =
yi y0
⋅100
în care: i1y/ 0 = indicele individual al fenomenului Y;
y0 şi y1= nivelul fenomenului Y înregistrat în perioada de bază, respectiv curentă. În teoria indicilor se recomandă ca perioada curentă să fie simbolizată cu „1”, iar perioada de bază cu „0”. Indicii de grup arată variaţia în timp a elementelor unui ansamblu. Ei nu sunt o însumare a indicilor individuali, ci o medie a acestora. Se pot determina sub formă de indici agregaţi, indici calculaţi ca mărimi medii sau indici calculaţi ca raport de medii.
9.2.1. Indici agregaţi Indicii agregaţi sunt indicii de grup care se calculează prin raportarea nivelului agregat al unui fenomen din două perioade comparate: de bază şi curentă. Nivelul agregat al unui fenomen y se obţine prin însumarea elementelor componente: ∑yi , pentru elemente omogene, respectiv ∑xi f i , pentru elemente eterogene ( yi = xi f i ). Relaţia de calcul a indicelui agregat simplu şi a indicelui agregat ponderat este:
∑ yi1 y 1/ 0
I
=
∑ yi 0
∑ xi1 f i1 respectiv
y 1/ 0
I
i
=
i
∑ xi 0 f i 0
=
∑ x1 f 1 ∑ x 0 f 0
i
(Pentru a evita încărcarea formulelor cu prea multe simboluri se renunţă la indexarea sumei şi se înţelege că însumarea cuprinde toate elementele constitutive ale colectivităţii). Relaţia de mai sus se poate descompune în doi indici factoriali derivaţi din aceasta I 1y/(0f ) şi I 1y/(0x ) . Fiecare din aceşti doi indici pun în evidenţă influenţa unui singur factor asupra variaţiei variabilei complexe, în condiţiile în care celălalt factor rămâne constant, jucând rolul de pondere, după cum urmează:
94
y f
I 1 /(0 ) =
∑ x ⋅ f 1 şi ∑ x ⋅ f 0
y ( x)
I 1 / 0 =
∑x1 f ∑x0 f
Ponderile nu sunt elemente abstracte , ci sunt variabile cantitative sau calitative şi provin din perioada curentă sau cea de bază. În funcţie de ponderea folosită se pot construi diferiţi indici agregaţi. Indicele agregat tip Laspeyres a fost propus de statisticianul belgian E. Laspeyres în • 1864 şi se construieşte folosind drept ponderi nivelul variabilei din perioada de bază. Relaţiile de calcul sunt următoarele: - pentru factorul cantitativ: - pentru factorul calitativ:
I 1y/(0f ) = y( x)
I 1 / 0 =
∑ x0 ⋅ f 1 ∑ x0 ⋅ f 0
∑x1 f 0 ∑x0 f 0
Se apreciază că doar indicele factorului cantitativ se poate calcula după sistemul de ponderare propus de Laspeyres, indicele factorului calitativ nefiind suficient de semnificativ, deoarece nu ţine seama tocmai de variaţia produsă prin dependenţa sa de structura colectivităţii. Indicele agregat tip Paasche a fost propus de statisticianul german H. Paasche în • 1874 şi se construieşte folosind drept ponderi nivelul variabilei din perioada curentă. Relaţiile de calcul sunt următoarele:
∑ x1 ⋅ f 1 ∑ x1 ⋅ f 0 ∑x f = ∑x f
- pentru factorul cantitativ:
I 1y/(0f ) =
- pentru factorul calitativ:
y ( x)
I 1 / 0
1
1
0
1
Indicele agregat tip Edgeworth se construieşte prin cumularea cantităţilor din perioada de bază cu cele din perioada curentă şi folosirea lor ca pondere la măsurarea variaţiei relative a factorului calitativ. Relaţia de calcul este: •
y ( x)
I 1 / 0 =
∑x1 ( f 0 + f 1 ) ∑x 0 ( f 0 + f 1 )
Acest indice se foloseşte de obicei la măsurarea variaţiei relative a preţului. Ele prezintă dezavantajul că poate fi particularizat doar pentru variaţia unui factor calitativ, ponderea fiind factorul cantitativ ale cărui valori pot fi însumate. Valorile factorului calitativ neputând fi însumate direct, el nu poate fi folosit drept pondere în acest caz. Indicele ideal al lui Ficher se construieşte folosind ponderile din ambele perioade, ca o medie geometrică a celor doi indici agregaţi, de tip Laspeyres şu de tip Paasche, conform relaţiilor: •
- pentru factorul cantitativ:
I 1 /(0 ) = y f
∑ x ⋅ f ⋅ ∑ x ⋅ f ∑ x ⋅ f ∑ x ⋅ f 0
1
1
1
0
0
1
0
95
- pentru pentru factorul calitativ:
I 1y/ (0x ) =
∑x1 ⋅ f 0 ⋅ ∑x1 ⋅ f 1 ∑x0 ⋅ f 0 ∑x0 ⋅ f 1
În practică acest indice, datorită dificultăţilor de calcul, se foloseşte în mod deosebit în statistica internaţională, în comparaţiile unor indicatori sintetici ai dezvoltării economiilor naţionale. Existenţa Existenţa mai multor multor sisteme de ponderare ponderare provine provine din faptul faptul că nici una din relaţiile relaţiile de calcul indicate nu satisface satisface integral folosirea în studiul variaţiei complexe a fenomenelor. fenomenelor. În practica statistică se aplică în mod curent sistemul de ponderare propus de Laspeyres, fie o variantă care provine din combinarea sistemului lui Laspeyres cu sistemul lui Paasche. Alegerea variantei este determinată de existenţa datelor necesare calculării indicilor. Pentru mai buna înţelegere a problemei propunem o aplicaţie concretă pe indicii agregaţi care măsoară dinamica valorii, volumul fizic şi al preţurilor (aplicaţia 1).
9.2.2. Indici calculaţi ca mărimi medii Indicii calculaţi ca mărimi medii se pot construi în cazul cazul în care se cunosc valorile indicilor individuali şi ponderea complexă ( xi f i ) numai dintr-o perioadă. • Indicele mediu aritmetic se calculează conform relaţiei: y 1/ 0
I
i ⋅ x ⋅ f =∑ ∑ x f y 1/ 0
0
0
•
0
0
Indicele mediu armonic se calculează conform relaţiei: I 1y/ 0 =
∑x1 ⋅ f 1 1
∑i y
⋅ x1 f 1
1/ 0
Modul de calcul şi interpretarea rezultatelor se regăsesc în aplicaţiile referitoare la indicele volumului fizic şi al preţurilor (aplicaţiile 2 şi 3).
9.2.3. Indici calculaţi ca raport de medii În teoria şi practica economică se întâlnesc întâlnesc adesea cazuri cazuri în care este necesar să se calculeze calculeze indici de grup pentru variabile calitative, care au caracter de medii. Este vorba despre variabile cu largă utilizare în practica economică precum: productivitatea medie a muncii; salariul mediu; eficienţa medie a fondurilor fondurilor fixe; rata medie a rentabilităţii; rentabilităţii; durata medie a creditelor etc. Dinamica acestor variabile medii se determină cu un sistem special de indici calculaţi ca raport de medii care poartă denumirea de indici ai valorilor medii. Indicii din această categorie se calculează după relaţia: x
I 1 / 0 =
x1 x0
Nivelul mediu, la nivelul ansamblului, se obţine ca o medie aritmetică ponderată a variabilei calitative, ponderată cu factorul cantitativ, după următoarea relaţie:
96
x=
∑x ⋅ f , ∑ f
în care: x = variabila calitativă; f = factorul cantitativ. În funcţie de elementele componente componente ale valorii medii a fenomenului fenomenului studiat studiat se calculează calculează trei tipuri de indici cu roluri diferite în analiza statistică. ) se calculează ca raport între nivelul mediu din Indicele Indicele bifactorial bifactorial ( I perioada curentă şi nivelul mediu din perioada de bază, conform relaţiei: x ( x , f ) 1/ 0
•
I 1x/(0x , f ) =
x1 x0
=
∑ x1 f 1 : ∑ x0 f 0 ∑ f 1 ∑ f 0
Acest indice exprimă modificarea relativă a nivelului mediu în perioada curentă faţă de perioada de bază, sub influenţa celor doi factori (calitativ şi cantitativ).
Indicele Indicele cu structură structură fixă ( I ) se calculează ca raport între media calculată pe baza nivelului totalizator din perioada curentă şi acelaşi nivel totalizator din perioada de bază ponderat cu factorul cantitativ din perioada curentă, conform relaţiei: x( x) 1/ 0
•
I 1x/(0x ) =
∑x1 f 1 : ∑x0 f 1 ∑ f 1 ∑ f 1
=
∑x1 f 1 ∑x0 f 1
Acest indice exprimă modificarea relativă a nivelului mediu în perioada curentă faţă de perioada de bază sub influenţa factorului calitativ.
Indicele cu structură variabilă ( I ) se calculează pornind de la ipoteza că s-a schimbat numai distribuţia factorului cantitativ, deci structura colectivităţii. Relaţia de calcul este: x ( f ) 1/ 0
•
x ( f )
I 1 / 0
=
∑x0 f 1 : ∑x0 f 0 ∑ f 1 ∑ f 0
Acest Acest indice indice exprim exprimăă modific modificare areaa relati relativă vă a nivelu nivelului lui mediu mediu sub influen influenţa ţa factor factorulu uluii cantitativ. Între indicii calculaţi ca raport de medii există următoarea relaţie: I 1x/(0x , f ) = I 1x/(0x ) ⋅ I 1x/(0f )
Modul de calcul al indicilor valorilor medii şi interpretarea rezultatelor se regăsesc în aplicaţia referitoare la indicii productivităţii medii a muncii (aplicaţia ( aplicaţia 4).
Sumar 97
Metoda indicilor statistici constituie una dintre principalele modalităţi de analiză a variaţiei în timp şi spaţiu a unui fenomen complex, în funcţie de modificarea modificarea factorilor de influenţă. Indicii statistici se calculează ca raport între două nivele ale aceluiaşi fenomen, înregistrate fie pentru momente (perioade), fie pentru spaţii diferite. Indicii statistici se pot clasifica folosind diverse criterii. După natura variaţiei pe care o măsoară , indicii statistici pot fi: care rezult rezultăă prin prin compa comparar rarea ea nivelu nivelului lui unui unui fenome fenomenn din indici indici ai dinami dinamicii cii,, care • perioada curentă cu nivelul aceluiaşi fenomen dintr-o perioadă anterioară; indici teritoriali sau de spaţiu, care rezultă din compararea aceluiaşi fenomen, • înregistrat în aceeaşi perioadă de timp, în două unităţi teritoriale; indici ai planului, care rezultă din compararea nivelului realizat cu nivelul planificat • al aceluiaşi fenomen (indicele realizării planului) sau din compararea nivelului planificat cu nivelul realizat într-o perioadă anterioară (indicele sarcinii de plan). După felul bazei de calcul, indicii statistici pot fi: indici cu bază fixă; • indici cu bază mobilă (în lanţ) • Aceşti indici sunt trataţi ca ritmuri ale variaţiei, cu bază fixă şi mobilă. format at din din mărim mărimii simp simple le sau sau din din mări mărimi mi Dupăă sfera Dup sfera de cupri cuprinde ndere re a fenome fenomenul nului ui,, form complexe, incluzând mărimi simple cu ponderi diferite, indicii statistici pot fi: indici individuali, simbolizaţi cu „i”, care exprimă variaţia relativă la nivelul unei • singure unităţi de observare; indici de grup, simbolizaţi cu „I”, care exprimă variaţia relativă la nivelul unei • grupe sau pe întregul ansamblu. Indicii de grup arată variaţia în timp a elementelor unui ansamblu. Ei nu sunt o însumare a indicilor individuali, ci o medie a acestora. acestora. Se pot determina sub formă formă de indici agregaţi, agregaţi, indici calculaţi ca mărimi medii sau indici calculaţi ca raport de medii.
Întrebări 1. Definiţi indicii statistici şi realizaţi clasificarea acestora după diverse criterii 2. Precizaţi natura factorilor a căror influenţă determină variaţia fenomenelor complexe; exemplificaţi 3. Indicaţi tipurile de indici agregaţi care se pot calcula în funcţie de ponderea folosită în construcţia lor 4. Care dintre indicii agregat se utilizează în măsurarea variaţiei relative a preţului? De ce ?
Aplicaţii rezolvate Aplicaţia 1. Se consideră că o firmă fabrică trei produse pentru care se cunosc cantităţile produse şi preţurile unitare în perioada de bază şi perioada curentă (tabelul 9.1).
Prod rodusul
U /M
Date convenţionale - Tabelul 9.1 Cantitatea (q) Preţul unitar (p) mii lei perioada de perioada perioada de perioada bază (q0) curentă (q1) bază (p0) curentă (p1) 98
a A B C
b tone bc. m
1 100 500 200
2 110 600 400
3 1000 10 300
4 1100 15 250
Se cere: a) să se calculeze dinamica volumului fizic al producţiei, a preţurilor şi a volumului valoric pentru fiecare produs fabricat; b) să se calculeze indicii de grup ai valorii volumului fizic şi ai preţurilor şi să se verifice relaţia dintre ei; c) să se determine modificarea absolută a volumului valoric al producţiei şi contribuţia absolută a celor doi factori de influenţă. Rezolvare: Datele tabelului 9.2., coloanele 5-10 reprezintă elemente de calcul care permit analiza modificării relative şi absolute a volumului fizic, preţurilor unitare şi valorii pe fiecare produs şi pe total. a) Dinamica volumului fizic al producţiei, al preţurilor şi valorii pentru fiecare produs se determină cu ajutorul indicilor individuali , conform relaţiilor: q1
i1 / 0 = q
q0 p1
i1 / 0 = p
i1 / 0 = v
p0
v1 v0
=
q1 ⋅ p1 q0 ⋅ p0
Rezultatul calculelor se află în tabelul 9.2, coloanele 8-10. b) Indicele de grup al volumului valoric al producţiei se calculează conform formulei: I 1v/ 0 =
v I 1 / 0 =
∑v1 ∑v0
=
220 .000 165 .000
∑ q1 p1 ∑ q0 p0 = 1,3333
sau 133,33%
Pe ansamblul celor trei produse valoarea producţiei a crescut în perioada curentă faţă de perioada de bază de 1,3333 ori sau a crescut cu 33,33 %. Pornind de la faptul că valoarea este un fenomen complex (v = q x p), rezultă că modificarea sa provine din modificările survenite în nivelul cantităţilor şi a preţurilor la fiecare produs în parte. Tabelul 9.2
Cantitatea (q) Produs q0
q1
Preţul unitar (p) p0 p1
Valoarea producţiei (v) q0p0
q1p1 99
Indici individuali (i1/0) q1p0
i1q/ 0
i1p/ 0
i1v/ 0
0 A B C Total
1 2 3 4 5 100 110 1000 1100 100000 500 600 10 15 5000 200 400 300 225 60000 - 165000
6 121000 9000 90000 220000
7 110000 6000 120000 236000
8 1,10 1,20 2,00 -
9 1,10 1,50 0,75 -
10 1,21 1,80 1,50 -
Evidenţierea influenţei celor doi factori (cantitatea şi preţul) asupra modificării volumului valoric al producţiei, pe total, presupune calcularea indicelui de grup al volumului fizic şi a indicelui de grup al preţurilor. Indicele de grup al volumului fizic al producţiei se calculează ca un indice agregat de tip Laspeyres, care foloseşte ponderarea cu preţul perioadei de bază, conform formulei: I 1q/ 0 =
q
I 1 / 0 =
∑ q1 p 0 ∑q 0 p 0 236 .000 165 .000
= 1,4303
sau 143,03%
Indicele de grup al preţurilor se calculează ca un indice agregat de tip Paasche, care foloseşte ponderarea cu volumul fizic al producţiei din perioada curentă, conform formulei: p
I 1 / 0 =
p
I 1 / 0 =
∑ q1 p1 ∑ q1 p 0 220 .000 236 .000
= 0,9322
sau 93,22%
Rezultă că modificarea valorii producţiei cu 33,33% se datorează creşterii volumului fizic; influenţa modificării preţurilor este negativă. Între cei trei indici de grup există relaţia: I 1v/ 0 = I 1q/ 0 ⋅ I 1p/ 0
1,3333 = 1,4303 x 0,9322
⇒ relaţia se verifică.
c) Modificarea absolută a volumului valoric al producţiei se calculează conform formulei: ∆1 / 0 = ∑q1 p1 − ∑q 0 p 0 v
∆v1 / 0 = 220.000
– 165.000 = 55.000 mii lei
Această modificare absolută este rezultatul modificărilor absolute a cantităţilor şi preţurilor la fiecare produs în parte. Modificarea absolută a volumului fizic al producţiei se determină conform formulei: ∆q1 / 0 = ∑q1 p0 − ∑q0 p0
100
∆1 / 0 = 236.000 – 165.000 = 71.000 mii lei q
Modificarea absolută a preţurilor se calculează conform formulei: ∆1 / 0 = ∑q1 p1 − ∑q1 p 0 p
∆1p / 0 = 220.000 – 236.000 = -16.000 mii lei
Relaţia dintre modificările absolute se verifică. v
q
p
∆1 / 0 = ∆1 / 0 + ∆1 / 0
55.000 =71.000 – 15.000
Rezultă că sporirea valorii producţiei (100%) a fost determinată de creşterea producţiei fizice (factor ce influenţează cu 129%) în timp ce preţurile au influenţat cu –29%.
Aplicaţia 2. Referitor la o societate comercială se cunosc datele privind mărfurile vândute în perioada de bază şi dinamica volumului fizic, prezentate în tabelul 9.3.
Date convenţionale - Tabelul 9.3 Indicii individuali Valoarea mărfurilor vândute ai volumului fizic in perioada de bază (mii lei)
Marfa A B C Total
v0 = q0 p0
i1 / 0
100.000 5.000 60.000 165.000
1,1 1,2 2,0 -
q
Se cere să se determine dinamica volumului fizic al vânzărilor pe total societate. Rezolvare: În mod obişnuit, dinamica volumului fizic se determină cu ajutorul indicelui agregat de tip Laspeyres; în situaţia prezentată acest indicator nu se poate calcula din lipsă de date. În acest caz se utilizează indicele de grup al mediei aritmetice, care se calculează conform relaţiei: q 1/ 0
I
i ⋅v =∑ ∑v q 1/ 0
0
0
q
I 1 / 0 =
i ⋅q ⋅ p =∑ ∑q p q 1/ 0
0
0
0
0
1,1 ⋅100 .000 +1,2 ⋅ 5.000 ⋅ 2,0 ⋅ 60 .000 165 .000
101
=
236 .000 165 .000
= 1,4303
sau 143,03%
Aplicaţia 3 Referitor la volumul valoric al producţiei unei firme în anul curent şi variaţia preţurilor faţă de anul anterior se cunosc datele prezentate în tabelul 9.4. Date convenţionale - Tabelul 9.4 Indicii individuali Volumul valoric al producţiei ai preţurilor în anul curent (mii lei)
Produs
p
v1 = q1 p1
i1 / 0
121.000 9.000 90.000 220.000
1,1 1,5 0,75 -
A B C Total
Se cere să se determine dinamica preţurilor pe total firmă. Rezolvare: În mod obişnuit, dinamica preţurilor se determină cu ajutorul indicelui agregat de tip Paasche; în situaţia prezentată acest indicator nu se poate calcula din lipsă de date. În acest caz se utilizează indicele de grup mediu armonic, care se calculează conform relaţiei: y
I 1 / 0 =
∑q1 ⋅ p1 1
∑i p
⋅ q1 p1
1/ 0
220 .000
p
I 1 / 0 =
1 1.1
⋅121 .000 +
1 1,5
⋅ 9.000 +
1 0,75
= ⋅ 90 .000
220 .000 110 .000 + 6.000 +120 .000
=
220 .000 236 .000
= 0,9322
sau 93,22% Rezultatul indică o scădere a preţurilor pe total firmă cu 6,78%, ceea ce reprezintă o creştere a eficienţei activităţii unităţii.
Aplicaţia 4 Volumul producţiei şi numărul mediu al muncitorilor din trei societăţi comerciale este prezentat în tabelul 9.5.
Societatea
Date convenţionale - Tabelul 9.5 Volumul producţiei (q) Numărul mediu al (mii lei) muncitorilor (N)
q
0
q
1
102
N
0
N
1
I II III Total
1000 2000 3000 6000
1500 2800 4750 9050
100 180 200 480
100 185 250 535
Se cere: a) să se calculeze indicii individuali ai productivităţii muncii; b) să se calculeze dinamica productivităţii medii a muncii şi să se evidenţieze influenţa
factorilor asupra acesteia cu ajutorul indicilor calculaţi din mărimi medii; c) să se verifice relaţia dintre indicii productivităţii medii.
Rezolvare: În tabelul 9.6. sunt prezentate elementele de calcul necesare în rezolvarea aplicaţiei. a) Productivitatea muncii se calculează după formula: w=
q N
Productivitatea muncii în cele trei societăţi, în perioada de bază şi curentă, este determinată în coloanele 5 şi 6 ale tabelului 9.6. Indicii individuali ai productivităţii muncii se calculează după formula: i1w/ 0 =
w1 w0
Rezultatele calculului acestor indici la nivelul celor trei societăţi se află în coloana 7 a tabelului 9.6.
Elemente de calcul - Tabelul 9.6
Vol. Prod q q 0 1 2 I 1000 1500 II 2000 2800 III 3000 4750 Total 6000 9050 S.C.
0
1
Nr. muncitori N N 3 4 100 100 180 185 200 250 480 535 0
1
Productivitatea w i1 / 0 W W 5 6 7 10 15 1,50 11,1 15,1 1,36 15 19 1,27 12,5 16,9 1,35 0
w0 N 0
W 1 N 1 w0 N 1
1
8 1000 2000 3000 6000
9 1500 2800 4750 9050
10 1000 2053 3750 6803
b) Dinamica productivităţii medii a muncii se calculează cu ajutorul indicelui bifactorial (indice calculat ca raport de medii):
103
I 1w/ 0 =
w
I 1/ 0 =
w1 w0
∑w1 N 1 : ∑w0 N 0 ∑N 1 ∑N 0
=
9050 535
:
6000 480
= 16 ,916 : 12 ,5 = 1,353
sau 135,3%
Acest indice evidenţiază o creştere a productivităţii medii a muncii 35,3% creştere realizată pe seama celor doi factori de influenţă: productivitatea individuală şi structura muncitorilor. Influenţa productivităţii individuale asupra productivităţii medii se determină cu ajutorul indicelui cu structură fixă: •
w( w)
I 1/ 0
=
I 1w/ (0w) =
∑w1 N 1 : ∑w0 N 1 ∑N 1 ∑N 1 9050 6803
= 1,3303
=
∑w1 N 1 ∑w0 N 1
sau133,03%
Influenţa structurii personalului asupra productivităţii medii se determină cu ajutorul indicelui cu structură variabilă (a variaţiei structurii) •
w ( N )
=
w ( N )
=
I 1 / 0 I 1 / 0
c)
∑w0 N 1 : ∑w0 N 0 ∑N 1 ∑N 10 6803 535
:
6000 480
=12 ,716 : 12 ,5 =1,0173
sau 101,73%
I 1w/ 0 = I 1w/ (0w) ⋅ I 1w/ (0N )
1,353 = 1,3303 x 1,0173 ⇒ relaţia se verifică.
Modulul 10. SERII TERITORIALE 10.1. Definiţie, clasificare şi particularităţi. Seria teritorială (seria de spaţiu) prezintă corespondenţa dintre două şiruri de date şi anume: un şir de date format din unităţi administrativ teritoriale şi un şir de date format din valorile caracteristicii. Deci, o serie teritorială exprimă valorile unei variabile statistice ordonate în raport cu unităţile administrative sau diviziunile teritoriale de care aparţin. Unităţile teritoriale cuprinse într-o serie de spaţiu pot fi comune, municipii, oraşe, judeţe dacă analiza se face pe plan naţional, sau pot fi ţări, continente sau alte diviziuni regionale dacă analiza se face pe plan internaţional. Clasificarea seriilor teritoriale se face în funcţie de conţinutul termenilor, după cum urmează: • serii teritoriale alcătuite din mărimi absolute; 104
•
serii teritoriale alcătuite din mărimi derivate.
Seriile teritoriale, folosite în analiza variaţiei în spaţiu a diferitelor caracteristici economicosociale, prezintă următoarele particularităţi: independenţa termenilor; omogenitatea; simultaneitatea; variabilitatea. Independenţa termenilor reprezintă proprietatea acestora de a nu se condiţiona reciproc. Ca urmare, unităţile de spaţiu luate în studiu pot fi analizate atât separat, cât şi în procesul de comparare sau de totalizare la nivelul seriei. Omogenitatea se referă la metodologia unitară pe care trebuie să se bazeze toţi indicatorii care se compară. Ei trebuie să aibă acelaşi conţinut economico-social, aceeaşi definiţie statistică şi mod de calcul şi aceeaşi sferă de cuprindere. Simultaneitatea este proprietatea care se referă la perioada sau momentul observării statistice. Toate variantele diferitelor caracteristici statistice care se studiază se referă la unul şi acelaşi moment al observării sau la una şi aceeaşi perioadă de înregistrare. Variabilitatea constă în faptul că orice caracteristică statistică ce urmează a fi supusă analizei teritoriale este rezultatul combinării influenţei factorilor esenţiali cu cei întâmplători. Din aceasta cauză caracteristicile sunt diferite de la o unitate teritorială la alta.
10.2. Indicatori statistici utilizaţi în caracterizarea seriilor teritoriale Analiza statistică în teritoriu a fenomenelor se realizează cu ajutorul unui sistem de indicatori, care răspunde atât scopului cercetării, cât şi naturii fenomenelor investigate. Folosirea unui sistem de indicatori permite, pe de o parte, reliefarea diferenţierilor existente între unităţile teritoriale şi, pe de altă parte, evidenţierea aspectului tipic şi semnificativ al fenomenelor, uniformitatea seriei. Asemenea seriilor cronologice, seriile statistice teritoriale pot fi caracterizate utilizând un sistem de indicatori exprimaţi în mărimi absolute, relative şi medii. Indicatorii absoluţi ai seriilor teritoriale se exprimă în unităţile concrete de măsură ale caracteristicii şi sunt de două feluri: indicatori de nivel şi indicatori de decalaj. Indicatorii de nivel ( y i ) exprimă volumul caracteristicii înregistrat în fiecare dintre unităţile teritoriale care alcătuiesc seria. Indicatorul de decalaj ( ∆) exprimă, în mărimi absolute, avansul (decalajul) unei unităţi teritoriale faţă de altă unitate teritorială aleasă drept bază de comparaţie. Fie două unităţi administrativ-teritoriale A şi B, pentru care nivelul unei caracteristici Y este ya şi yb. Indicatorul de decalaj se calculează conform relaţiilor: ΔA/B = yA - yB sau ΔB/A = yB - yA
Indicatorii relativi ai seriilor teritoriale se exprimă sub formă de coeficienţi sau procente, fiind rezultatul comparării prin raportare a nivelului caracteristicii din două unităţi teritoriale. În cadrul indicatorilor relativi ai seriilor teritoriale se cuprind indicatorii sau indicii teritoriali şi rata de decalaj. Indicatorii (indicii) teritoriali (i) sunt cel mai frecvent utilizaţi şi se obţin prin raportarea nivelurilor unei caracteristici înregistrată în spaţiu, conform relaţiilor: iA / B =
yA yB
, respectiv
iA/ B =
yA yB
⋅100 în cazul exprimării procentuale
sau 105
iB / A =
yB yA
, respectiv
iB / A =
yB yA
⋅100 în cazul exprimării procentuale
Rata de decalaj (devansare), numită şi decalaj (avans) relativ ( ∆% ) se determină ca raport
între indicatorul de decalaj şi unul dintre indicatorii de nivel luat ca bază de comparare, conform relaţiilor: ∆%A / B =
y A − yB yB
⋅100 = (i A / B −1) ⋅100
sau ∆%B / A =
yB − y A yA
⋅100 = (iB / A −1) ⋅100
Adesea, în practica statistică, este dificil de ales o unitate administrativ-teritorială drept bază de raportare. În asemenea situaţii se recurge la folosirea mediei aritmetice, modului sau medianei drept bază de raportare.
Indicatorii medii ( ) se exprimă prin nivelul mediu al seriei teritoriale, calculat în funcţie de conţinutul termenilor, după cum urmează: • pentru seriile teritoriale alcătuite din mărimi absolute nivelul mediu se calculează pe baza mediei aritmetice simple; • pentru seriile teritoriale alcătuite din mărimi relative de structură şi intensitate nivelul mediu se calculează pe baza mediei aritmetice ponderate; • pentru seriile teritoriale alcătuite din mărimi relative ale dinamicii nivelul mediu se calculează pe baza mediei geometrice simple. y
Alţi indicatori statistici se folosesc în scopul caracterizării gradului de uniformitate al distribuţiei în spaţiu. Astfel se calculează prin două procedee coeficientul repartiţiei teritoriale (al concentrării în spaţiu). • Coeficientul Gini (C) reprezintă o primă variantă de determinare a uniformităţii distribuţiei în teritoriu. Denumirea este dată după numele statisticianului italian Corrado Gini. Indicatorul constă în extragerea rădăcinii pătrate din suma pătratelor ponderilor celor „n” unităţi teritoriale, în totalul colectivităţii, conform relaţiei : C = ∑g
2 i
, i =1, n
în care: gi = ponderea unităţii administrativ teritoriale „i” în totalul colectivităţii Coeficientul Gini în valori în intervalul - dacă c =
1
n
1 ,1 n
şi se interpretează astfel:
înseamnă că toate cele „n” unităţi teritoriale au aceleaşi ponderi, egale între
ele şi deci distribuţia în spaţiu este absolut uniformă; - dacă c = 1 înseamnă că variabila cercetată se concentrează într-o singură unitate teritorială. În situaţia în care unităţile teritoriale care se compară au forme diferite de organizare (comparaţii între ţări, zone geografice, continente) coeficientul Gini prezintă unele dezavantaje de interpretate. Pentru asigurarea comparabilităţii colectivităţilor cu organizare teritorială diferită se foloseşte o formulă corectată prin interpolare: 106
'
C =
2 n∑ g i −1
n −1
În acest caz coeficientul Gini corectat i-a valori în intervalul [0,1], indiferent câte unităţi ar avea colectivitatea analizată.
Energia informaţională a coeziunii sistemului (E) reprezintă o a doua variantă de măsurare a uniformităţii distribuţiei în teritoriu. Acest indicator îi aparţine academicianului român Octav Onicescu, care a adaptat unele noţiuni specifice sistemelor la necesităţile de analiză spaţială a colectivităţilor. Conceptul de energie informaţională defineşte colectivitatea ca sistem, iar unităţile teritoriale ca stări ale sistemului. În acest consens energia informaţională serveşte ca indicator al repartiţiei teritoriale şi se determină conform relaţiei: •
E =
∑g
2 i
, i =1, n
1
Energia informaţională ia valori în intervalul ,1 n Pentru folosirea în practica statistică internaţională, energia informaţională a coeziunii sistemului se ajustează conform relaţiei:
E = '
∑ g
2 i
1−
−
1
n
1
n
În acest caz rezultatul se încadrează în intervalul [0,1], indiferent câte unităţi prezintă colectivitatea cercetată.
10.3. Ierarhizarea unităţilor teritoriale Analiza fenomenelor economico-sociale în plan teritorial, atât la nivelul naţional cât şi internaţional, presupune ierarhizarea unităţilor teritoriale după diferite criterii. O ierarhizare corectă, conformă cu realitatea, nu se poate face folosind un singur indicator, oricât de semnificativ ar fi el. Se recomandă analiza pe baza unui sistem de indicatori statistici. Orice acţiune de ierarhizare a unităţilor teritoriale începe cu identificarea şi selectarea indicatorilor care vor sta la baza caracterizării multilaterale a fiecăreia dintre unităţi. Se fac mai întâi o serie de ierarhizări provizorii pe baza fiecărui indicator ales, apoi se alege metoda de agregare într-un singur indicator pe baza căruia se realizează ierarhizarea definitivă a unităţilor cuprinse în analiză. Există mai multe posibilităţi de ierarhizare a unităţilor teritoriale, între care mai des utilizate sunt: metoda rangurilor; metoda matricială; metoda observării distanţei relative. Dintre acestea o vom prezenta pe prima. Metoda rangurilor (14, p. 174) se bazează pe o ierarhizare în funcţie de mărimea nivelului caracteristicii; astfel se atribuie ranguri (numere de ordine) fiecărei unităţi teritoriale. Unitatea cu un nivel al caracteristicii cel mai mare primeşte rangul unu, şi aşa mai departe, în mod succesiv, până la unitatea care înregistrează nivelul cel mai mic al caracteristicii, care primeşte rangul cel mai mare. Dacă o unitate de spaţiu înregistrează mai multe caracteristici (criterii) după care se face ierarhizarea, pentru fiecare din aceste variabile se atribuie ranguri în mod succesiv. În tabelul 10.1 este prezentat în mod sintetic modul de aplicare al metodei rangurilor. 107
Unitatea teritorială 0 A B C D E
Rangul atribuit în funcţie de Caracteristica a Caracteristica b Caracteristica c 1 2 3 2 1 4 3 2 3 1 3 5 4 5 2 5 4 1
Tabelul 10.1 Scor Rang total final 4 5 7 1 8 2 9 3 11 5 10 4
În coloanele 1,2 şi 3 sunt realizate clasamente provizorii pe baza fiecăreia dintre cele trei caracteristici. Pentru fiecare unitate teritorială se însumează (pe orizontală) rangurile atribuite şi se obţine în coloana 4 scorul final. Apoi, pentru scorurile obţinute se acordă ranguri (scorul cel mai mic obţine rangul cel mai mic, scorul cel mai mare, rangul cel mai mare) care se înscriu în coloana 5, care prezintă ierarhizarea finală a celor cinci unităţi teritoriale în funcţie de cele trei caracteristici cuprinse în analiză. Metoda rangurilor folosită în ierarhizarea unităţilor teritoriale prezintă atât avantaje cât şi unele dezavantaje. Între avantaje trebuie subliniat că este uşor şi rapid de aplicat; principalul dezavantaj vine din cele două nivelări ale caracteristicilor: prima dată când se atribuie rangurile pentru fiecare caracteristică; a doua oară când se atribuie ranguri pentru scorurile totale. Prin aceste niveluri, diferenţele dintre două niveluri ale caracteristicii, în unităţi teritoriale diferite, sunt înlocuite cu o progresie aritmetică având raţia unu.
10.4. Indicii teritoriali Indicii teritoriali măsoară variaţia nivelului unor caracteristici observate în colectivităţi coexistente în timp, dar situate în spaţii diferite (notate cu A şi B). Ei se calculează ca raport între termenii unei serii statistice de spaţiu. La determinarea indicilor teritoriali o primă problemă care trebuie rezolvată este cea a alegerii bazei de raportare şi a sistemului de ponderare. Baza de raportare se alege ţinând cont de raţionamente economice sau sociale. De asemenea, trebuie reţinut că o unitate teritorială nu poate fi menţinută foarte mult timp ca bază de raportare deoarece evoluţia continuă a vieţii economico-sociale conduce la aprecierea sau deprecierea sa; nu se alege drept bază de raportare o unitate teritorială de excepţie, ci una a cărei parametri de dezvoltare să justifice efectuarea comparaţiei. În legătură sistemul de ponderare se aplică aceleaşi principii de la indicii dinamicii, deci indicii teritoriali se determină ca indici individuali (i) şi indici de grup (I). Indicii teritoriali individuali (i) se obţin prin raportarea nivelului unei caracteristici (Y) înregistrată în acelaşi timp în două unităţi teritoriale (A şi B). Relaţia de calcul este: i Ay / B =
yA yB
sau
iBy / A =
yB yA
Între cei doi indici teritoriali individuali, diferiţi din punct de vedere al sensului comparării, există o relaţie de reversibilitate în spaţiu: 108
i Ay / B ⋅ i BY / A = 1
Facem precizarea că în analizele statistice nu se utilizează simultan cele două sensuri de comparaţie. Indicii teritoriali de grup (I) se obţin prin raportarea nivelului fenomenului complex din unitatea teritorială A la nivelul aceluiaşi fenomen complex din unitatea teritorială B. Fenomenul complex se notează cu ∑yi în care apare şi factorul de ponderare, frecvenţa. Relaţia generală de calcul a unui indice teritorial de grup este: I Ay / B =
∑yA ∑ yb
=
∑x A ⋅ f A ∑xB ⋅ f B
Dacă factorul cantitativ este direct însumabil atunci factorul calitativ se manifestă la nivelul ansamblului de elemente cercetate ca o medie. În acest caz indicele teritorial de grup apare ca un raport între două medii conform relaţiei: I Ax / B =
xA
=
xB
∑ y A ÷ ∑ yB ∑ f A ∑ f B
Y
f
= I A / B ÷ I A / B
Se observă că şi în profilul teritorial se manifestă legătura dintre variabila complexă şi factorii săi de influenţă: I Ay (/ xB, f ) = I Ax / B ⋅ I Af / B
Dacă factorul cantitativ nu este direct însumabil comparaţiile în spaţiu se realizează ponderând factorul cantitativ cu xA sau cu xB. Indicele de grup care exprimă variaţia factorului cantitativ în spaţii diferite se calculează conform relaţiei: f
I A / B =
∑x ∑x
A
f A
A
f B
sau
I Af / B =
∑xB ⋅ f A ∑xB ⋅ f B
Dacă factorul calitativ nu este direct însumabil, comparaţiile în spaţiu se realizează ponderând factorul calitativ cu f A sau cu f B. Indicele de grup care exprimă variaţia factorului calitativ în spaţii diferite se calculează conform relaţiei: X
I A / B =
∑x A f A sau ∑xB f A
I AX / B =
∑x A ⋅ f B ∑xB ⋅ f B
Pentru a se asigura reversibilitatea factorilor se utilizează, de obicei, un indice Fischer a cărui formulă este: f
I A / B =
∑x ∑x
A
f A
A
f B
·
∑x ∑x
B
f A
B
f B
şi
109
, pentru factorul cantitativ
I AX / B =
∑ x A f A · ∑ X A ⋅ f B , pentru factorul calitativ ∑ xB f A ∑ X B ⋅ f B
Indicii de grup teritoriali se folosesc atât în comparaţiile în spaţiu la nivel naţional, cât şi în comparaţiile internaţionale
10.5. Extrapolarea în analiza teritorială O problemă deosebită care apare în cadrul analizei seriilor de spaţiu o constituie realizarea prognozelor în profil teritorial. Prognoza prin exploatarea seriilor teritoriale trebuie să rezolve aspecte precum: în cât timp nivelul indicatorului analizat se poate dubla sau tripla; cât timp îi este necesar unei unităţi teritoriale pentru a ajunge din urmă o altă unitate teritorială; ce ritm trebuie impus pentru a se ajunge la un anumit nivel. Pentru rezolvarea acestor probleme se folosesc diverse tehnici de extrapolare. • Coeficienţii de devansare arată de câte ori creşte nivelul unităţii raportate faţă de evoluţia nivelului unităţii constituite ca bază de raportare. Astfel, dacă se notează cu I A indicele cronologic determinat pentru unitatea teritorială A şi cu IB indicele cronologic determinat pentru unitatea teritorială B, coeficientul de devansare se va calcula conform relaţiei: I A / B =
I A I B
Când se cunoaşte ritmul mediu anual de dezvoltare a unei unităţi teritoriale şi se pune problema calculării după ce număr de ani fenomenul s-ar modifica de un anumit număr de ori sau de câte ori se va modifica fenomenul după un anumit timp se utilizează următoarea relaţie: •
I = K t
în care:
= indicele mediu de creştere în timp a fenomenului; t = numărul de ani după care se va produce schimbarea de K ori; K = coeficientul de schimbare a fenomenului după trecerea celor t ani (dacă fenomenul se dublează K= 2, dacă se triplează K=3 etc.) I
Deoarece unităţile teritoriale evoluează cu niveluri şi ritmuri de dezvoltare diferite, se pune problema de a afla când va ajunge din urmă o unitate de spaţiu o altă unitate (se consideră că evoluţia fenomenului analizat în cele două unităţi se va face în progresie geometrică, cu raţia egală cu indicele mediu de creştere). •
Se cunosc nivelurile absolute y A şi yB pentru momentul de calcul (y A < yB), şi, de asemenea, se cunosc indicii medii de creştere pentru cele două unităţi teritoriale I A şi IB (IA > IB). Se notează cu ' ' y A şi yB nivelul fenomenului din momentul final t. Se doreşte ca la momentul t cele două nivele absolute y 'A şi yB' să aibă aceeaşi valoare. '
yA
= 110
'
yB
t
y 'A = y A ⋅ I A
şi
t
y B' = y B ⋅ I B
t
t
y A ⋅ I A = y B ⋅ I B
Aplicând logaritmul în ultima relaţie se obţine: log y A + t log I A = log y B + t log I B t =
log y B − log y A log I A − log I B
,
în care: t = numărul de ani după care cele două nivele absolute ale unităţilor teritoriale vor fi egale.
Sumar Seria teritorială (seria de spaţiu) prezintă corespondenţa dintre două şiruri de date şi anume: un şir de date format din unităţi administrativ teritoriale şi un şir de date format din valorile caracteristicii. Clasificarea seriilor teritoriale se face în funcţie de conţinutul termenilor, după cum urmează: • serii teritoriale alcătuite din mărimi absolute; • serii teritoriale alcătuite din mărimi derivate. Seriile teritoriale, folosite în analiza variaţiei în spaţiu a diferitelor caracteristici economicosociale, prezintă o serie de particularităţi: independenţa termenilor; omogenitatea; simultaneitatea; variabilitatea. Analiza statistică în teritoriu a fenomenelor se realizează cu ajutorul unui sistem de indicatori, care răspunde atât scopului cercetării, cât şi naturii fenomenelor investigate. Asemenea seriilor cronologice, seriile statistice teritoriale pot fi caracterizate utilizând un sistem de indicatori exprimaţi în mărimi absolute, relative şi medii. Indicatorii absoluţi ai seriilor teritoriale se exprimă în unităţile concrete de măsură ale caracteristicii şi sunt de două feluri: indicatori de nivel şi indicatori de decalaj. Indicatorii relativi ai seriilor teritoriale se exprimă sub formă de coeficienţi sau procente, fiind rezultatul comparării prin raportare a nivelului caracteristicii din două unităţi teritoriale. În cadrul indicatorilor relativi ai seriilor teritoriale se cuprind indicatorii sau indicii teritoriali şi rata de decalaj. Indicatorii medii ( y ) se exprimă prin nivelul mediu al seriei teritoriale, calculat în funcţie de conţinutul termenilor, după cum urmează: • pentru seriile teritoriale alcătuite din mărimi absolute nivelul mediu se calculează pe baza mediei aritmetice simple; • pentru seriile teritoriale alcătuite din mărimi relative de structură şi intensitate nivelul mediu se calculează pe baza mediei aritmetice ponderate; • pentru seriile teritoriale alcătuite din mărimi relative ale dinamicii nivelul mediu se calculează pe baza mediei geometrice simple. Alţi indicatori statistici se folosesc în scopul caracterizării gradului de uniformitate al distribuţiei în spaţiu. Astfel se calculează prin două procedee coeficientul repartiţiei teritoriale (al concentrării în spaţiu): coeficientul Gini şi energia informaţională a coeziunii sistemului. Întrebări 1. Definiţi şi clasificaţi seriile teritoriale 111
2. În ce constau particularităţile seriilor teritoriale 3. Precizaţi indicatorii absoluţi utilizaţi în caracterizarea seriilor teritoriale şi modul lor de calcul 4. Precizaţi indicatorii relativi utilizaţi în caracterizarea seriilor teritoriale şi modul lor de calcul 5. Indicaţi modul de calcul al nivelului mediu al seriei teritoriale în funcţie de conţinutul termenilor săi
Aplicaţie propusă Din Anuarul Statistic al României extrageţi o serie teritorială. Determinaţi indicatorul de decalaj şi rata de decalaj al fenomenului analizat, luând drept bază de comparaţie nivelul înregistrat în judeţul Bacău. Determinaţi nivelul mediu al fenomenului. Sistematizaţi datele seriei pe cinci intervale egale de variaţie şi caracterizaţi seria astfel obţinută.
BIBLIOGRAFIE 1. Andrei Tudorel, Stancu Stelian – Statistica – teorie şi aplicaţii -, Editura All, Bucureşti, 1995. 2. Anghelache Constantin, Niculescu Emanuela – Statistică – indicatori, formule de calcul şi sinteze , Editura Economică, Bucureşti, 2001. 3. Baron Tudor, Anghelache Constantin, Ţiţan Emilia – Statistică , Editura Economică, Bucureşti, 1999. 4. Baron Tudor, Ţiţan Emilia, Matache Simona, Ciuchiţă Lucian – Manual practic de statistică , Editura Expert, Bucureşti, 1999. 5. Bădiţă Maria, Cristache Silvia Elena – Statistică – aplicaţii practice, Editura Mondan, Bucureşti, 1998. 6. Bărbat Alexandru – Teoria statisticii sociale , Editura Didactică şi Pedagogică, Bucureşti, 1972. 7. Biji Elena Maria, Baron Tudor (coordonatori) – Statistică teoretică şi economică , Editura Didactică şi Pedagogică, Bucureşti, 1991. 8. Biji Elena Maria, Wagner Pavel, Lilea Eugenia, Petcu Nicoleta, Vătui Mihaela – Statistică , Editura Didactică şi Pedagogică, Bucureşti, 1999. 9. Jaba Elisabeta – Statistică , Editura Economică, Bucureşti, 2006. 10. Korka Mihai, Begu Liviu - Stelian, Tuşa Erika – Bazele statisticii pentru economişti , Editor Tribuna Economică, Bucureşti, 2002. 112