UNIVERSITATEA “ALEXANDRU IOAN CUZA” IASI
Coordonatori:
Studenta:
Conf. univ. dr. Danut Jemna
Ciridariu Andreea-Catalina
Lect. univ. dr. Dana Viorica
Anul I, Stiinte Economice Grupa 1315
IASI, 2012
Structura proiectului 1. Introducere Se va enunta obiectivul specific al cercetarii.
2. Analiza statistica a unei serii de date inregistrate la un moment dat 2.1 Alegerea variabilelor statistice Se vor identifica patru variabile statistice, doua variabile cantitative si doua variabile calitative. Datele vor fi introduse in Excel. 2.2 Analiza statistica univariata a variabilelor statistice 2.2.1 Analiza statistica univariata a variabilelor cantitative 2.2.2 Analiza statistica univariata a variabilelor calitative 2.3 Analiza statistica bivariata a varibilelor statistice 2.3.1 Analiza statistica bivariata pentru doua variabile cantitative 2.3.2 Analiza statistica bivariata pentru doua variabile calitative 2.4 Estimarea prin interval de incredere a mediei 2.5 Testarea statistica 2.5.1 Testarea ipotezelor asupra unui esantion 2.5.2 Testarea ipotezelor asupra a doua esantioane i ndependente 2.5.3 Testarea ipotezelor asupra a trei si mai multe esantioane independente i ndependente
3. Analiza statistica descriptiva a unei serii de timp 3.1 Alegerea variabilei statistice Se va alege o variabila cantitativa, pentru care se vor inregistra valorile pentru 10 perioade de timp (ani, semestre, trimestre, luni sau zile). 3.2 Analiza statistica folosind indici statistici simpli 3.2.1 Indici absoluti 3.2.2 Indici relativi 3.2.3 Indici exprimati prin valori medii
4. Concluzii Bibliografie
1. Introducere
Statistica este, conform definitiei date de matematicianul roman Grigore Constantin Moisil (19061973), „mijlocul cel mai puternic de cercetare a faptelor sociale”, iar Herbert George Wells ( 18661946), un celebru scriitor englez, spunea despre aceasta: „ Intr-o zi gandirea statistica va fi la fel de necesara, oricarui cetatean folositor societatii, ca si scrisul si cititul.”.
Principalul obiectiv urmarit in cadrul acestui proiect este redarea anumitor informatii din domeniul educatiei, din Anuarul statistic 2010 al Romaniei, cu scopul evidentierii legaturilor statistice intre variabile , acestea din urma reprezentand r eprezentand insusiri, trasaturi esentiale purtate de unitatile statistice ale unei colectivitati. Scopul acestei lucrari este de a realiza o cercetare asupra facultatilor si studentilor din fiecare judet, dar si asupra absolventilor pe nivel de invatamant. Rezultatul numeric al numararii, al masurarii statistice a fenomenelor si proceselor de masa sau al calculelor asupra datelor obtinute prin inregistrarea statistica poarta denumirea de indicator statistic. Dupa modul de determinare, indicatorii statistici pot fi primari sau derivati, dupa gradul de cuprindere acestia se clasifica in indicatori statistici sintetici si indicatori statistici analitici, iar dupa forma de exprimare, ei pot fi sub forma de marimi absolute, relative sau medii. Indicatorii statistici au un continut real, adica reflecta fenomene si procese concrete.
2. Analiza statistica a unei serii de date inregistrate la un moment dat 2.1 Alegerea variabilelor statistice
In sprijinul cercetarii am ales distributia judetelor Romaniei, inclusiv Municipiul Bucuresti, dupa numarul facultatilor si numarul studentilor inscrisi (cele doua variabile cantitative) si distributia absolventilor din Romania dupa sex si dupa nivelul de educatie (cele doua variabile calitative).
2.2 Analiza statistica univariata a variabilelor statistice
2.2.1 Analiza statistica univariata a variabilelor cantitative
Distributia judetelor din Romania Romania dupa numarul de facultati, facultati, in anul universitar 2009-2010 Nr. Crt
Judet
Facultati
1
Alba
9
2 3
Arad
25
Arges
16
4 5
Bacau
9
Bihor
25
6
Bistrita-Nasaud
3
7 8
Botosani
1
Braila
3
9
Brasov
23
10 11
Bucuresti Buzau
1
12
Calarasi
1
13 14
Caras-Severin
2
Cluj
50
15 16 17
Constanta
29
Dambovita
10
18
Dolj
23
19 20
Galati
19
Covasna
165
2
Giurgiu
0
21 22
Gorj
7
Harghita
4
23
Hunedoara
5
24 25 26
Ialomita
2
27 28
Maramures
11
Mehedinti
5
29
Mures
16
30 31
Neamt
4
Olt
2
32 33 34
Prahova
5
Salaj
2
Satu Mare
6
35
Sibiu
21
36 37
Suceava
10
Teleorman
38
Timis
47
39 40 41
Tulcea
0
Valcea
5
Vaslui
0
42
Vrancea
1
Iasi
51
Ilfov
1
3
Descriptive Statistics Mean
14,85714286
Median
5
Mode Standard Deviation
1 27,26524763
Sample Variance Kurtosis
743,3937282
Skewness Range Minimum
4,381519106
Maximum
165
Sum Count
624
22,98669017 165 0
42
Media Mediile sunt marimi statistice care exprima, in mod sintetic si generalizant, ceea ce este normal, esential, tipic pentru unitatile unei colectivitati distribuite dupa o anumita caracteristica.
̅
In medie, aproximativ 15 facultati sunt distribuite in fiecare judet al Romaniei, conform datelor culese din Anuarul statistic 2010.
Mediana Mediana reprezinta acea valoare a caracteristicii car acteristicii unei serii ordonate, crescator sau descrescator, pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii observate.
sau
, n<100
50% dintre judetele Romaniei au pana in 5 facultati inclusiv, iar 50% au peste 5 facultati inclusiv.
Modul Modul reprezinta valoarea caracteristicii cea mai frecvent intalnita intr-o distributie, adica valoarea ce corespunde frecventei dominante. Cel mai frecvent, numarul facultatilor din Romania, distribuite pe judet, este egal cu 1.
Deviatia standard (abaterea medie patratica) Deviatia standard reprezinta media patratica a abaterilor individuale.
∑ ∑(̅)
In medie, numarul de facultati distribuite pe judete se abate de la medie cu 27,26.
Varianta (dispersia) Varianta reprezinta media aritmetica a patratelor valorilor abaterilor individuale fata de media lor.
Coeficientul de boltire Pearson
∑∑(̅ )
Coeficientul de boltire masoara excesul fata de boltirea unei distributii normale Gauss-Laplace.
∑∑( ̅)
moment centrat
Distributia judetelor dupa numarul de facultati este leptocurtica, deoarece coeficientul de boltire Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii medii.
Coeficientul de asimetrie Pearson Indicatorii de asimetrie dau informatii asupra modului de repartizare a frecventelor de o parte sau alta a valorii centrale a unei serii, asimetria reprezentand deviatia de la forma simetrica de distribuitie.
Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia facultatilor pe judete este o distributie asimetrica. Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea modului, rezultand o asimetrie la dreapta.
Amplitudinea variantei Amplitudinea variantei reprezinta diferenta dintre valoarea maxima si va loarea minima in care se incadreaza numarul facultatilor distribuite pe judet. Numarul minim de facultati distribuite pe judetele Romaniei este 0, in timp ce numarul maxim de facultati este de 165, iar in total, pe teritoriul tarii s-au inregistrat ca fiind 624 facultati.
Coeficientul de variatie Coeficientul de variatie se calculeaza ca raport procentual intre abaterea medie patratica si media aritmetica.
̅
183,56% , de unde rezulta ca media facultatilor pe judet este nereprezentativa.
Distributia judetelor din Romania Romania dupa numarul de de studenti inscrisi, in anul anul universitar 2009-2010 Nr. Crt
Judet
Studenti inscrisi
1
Alba
7259
2 3
Arad
19537
Arges
17982
4 5
Bacau
7468
Bihor
19182
6
Bistrita-Nasaud
7 8
Botosani Braila
1830
9
Brasov
58976
10 11
Bucuresti Buzau
224
12
Calarasi
467
13 14
Caras-Severin Cluj
60371
15 16 17
Constanta
36860
18
Dolj
35667
19 20
Galati
20117
21 22
Gorj
5749
Harghita
1388
23
Hunedoara
5907
24 25 26
Ialomita
27 28
Maramures
5883
Mehedinti
2960
29
Mures
11682
30 31
Neamt
969
Olt
557
32 33 34
Prahova
35
Sibiu
36 37
Suceava Teleorman
38
Timis
39 40 41
Tulcea
0
Valcea
6060
Vaslui
0
42
Vrancea
Covasna Dambovita
Giurgiu
Iasi Ilfov
Salaj Satu Mare
1651 293
285720
3415
870 8214
0
315 58418 251
8569 428 1939 24211 9917 607 43265
141
Descriptive Statistics Mean
18459,97619
Median
5816
Mode
0
Standard Deviation
45554,65417
Sample Variance
2075226516
Kurtosis
30,29080983
Skewness
5,20069816
Range
285720
Minimum
0
Maximum
285720
Sum
775319
Count
42
Media In medie, aproximativ 18.460 de studenti au fost inscrisi in fiecare judet al Romaniei, conform datelor culese din Anuarul statistic 2010.
Mediana 50% dintre judetele Romaniei au pana in 5.816 studenti inscrisi inclusiv, iar 50% au peste 5.816 studenti inscrisi inclusiv.
Modul Cel mai frecvent, numarul studentilor inscrisi in Romania, distribuiti pe judet, este egal cu 0.
Deviatia standard In medie, numarul de studenti inscrisi pe judete se abate de la medie cu aproximativ 45.554 .
Coeficientul de boltire Pearson Distributia judetelor dupa numarul de studenti inscrisi este leptocurtica, deoarece coeficientul de boltire Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii medii.
Coeficientul de asimetrie Pearson Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia studentilor inscrisi pe judete este o distributie asimetrica. Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea modului, rezultand o asimetrie la dreapta.
Numarul minim de studenti inscrisi pe judetele Romaniei este 0, in timp ce numarul maxim de studenti inscrisi este de 285.720, iar in total, pe teritoriul tarii s-au inregistrat ca fiind inscrisi 775.319 studenti in anul universitar 2009-2010.
Coeficientul de variatie
246,77% , de unde rezulta ca media studentilor inscrisi pe judet este nereprezentativa.
2.2.2 Analiza statistica univariata a variabilelor calitative
Distributia absolventilor din Romania, Romania, in anul scolar scolar / universitar 2008-2009, dupa dupa sex Sex
Absolventi
Feminin
381.639
Masculin TOTAL
357.793 739.432
Absolventi in anul scolar/universitar scolar/universitar 2008-2009
Feminin
48% 52%
Masculin
Distributia absolventilor din Romania, Romania, in anul scolar scolar / universitar 2008-2009, dupa dupa nivelul de educatie Nivelul educatiei
Absolventi
Invatamant gimnazial
204.018
Invatamant liceal Invatamant profesional si de ucenici
202.113
Invatamant postliceal si de maistri Invatamant superior
250000.0 200000.0 150000.0 100000.0 50000.0
100.901 17.574 214.826
Invatamant gimnazial Invatamant liceal Invatamant profesional si de ucenici Invatamant postliceal si de maistri Invatamant superior
.0
2.3 Analiza statistica bivariata a varibilelor statistice
2.3.1 Analiza statistica bivariata pentru doua variabile cantitative
Distributia judetelor din Romania Romania dupa numarul de de facultati si dupa numarul numarul de studenti inscrisi, in anul universitar 2009-2010 Nr. Crt
Judet
Facultati
Studenti inscrisi
1
Alba
9
7259
2 3
Arad
25
19537
Arges
16
17982
Bacau
9
7468
Bihor
25
19182
Bistrita-Nasaud
3
1651
7 8
Botosani
1
293
Braila
3
1830
9
Brasov
23
58976
10 11
Bucuresti
165
285720
Buzau
1
224
12
Calarasi
1
467
13 14
Caras-Severin
2
3415
Cluj
50
60371
15
Constanta
29
36860
16 17
Covasna
2
870
Dambovita
10
8214
18 19 20
Dolj
23
35667
Galati
19
20117
Giurgiu
0
0
Gorj
7
5749
4 5 6
21 22 23
Harghita
4
1388
Hunedoara
5
5907
24
Ialomita
2
315
25 26
Iasi
51
58418
Ilfov
1
251
27 28
Maramures
11
5883
Mehedinti
5
2960
29
Mures
16
11682
30 31
Neamt
4
969
Olt
2
557
32
Prahova
5
8569
33 34
Salaj
2
428
Satu Mare
6
1939
35 36 37
Sibiu
21
24211
Suceava
10
9917
3
607
38
Timis
47
43265
39 40
Tulcea
0
0
Valcea
5
6060
41
Vaslui
0
0
42
Vrancea
1
141
Teleorman
Coeficientul de corelatie Pearson
∑ ( ) (̅)( )
dispersia
-1 < r < 1
Legatura Legatura dintre numarul de facultati si numarul de studenti inscrisi, pe judete, in anul universitar 2009-2010 350000 300000 250000 200000 150000 100000 50000 0 0
20
40
60
80
100
120
140
160
180
Coeficientul de corelatie Pearson este egal cu 0,978 , de unde rezulta ca exista o legatura directa intre x (numarul de facultati) si y (numarul studentilor inscrisi), deoarece r>0, iar pentru ca r>0,7 si tinde spre 1, x are o influenta pozitiva asupra lui y, existand o corelatie intre cele doua variabile cantitative.
2.3.2 Analiza statistica bivariata pentru doua variabile calitative
Distributia absolventilor din Romania, Romania, in anul scolar scolar / universitar 2008-2009, dupa dupa sex si dupa nivelul de educatie Sex
Invatamant gimnazial
Invatamant liceal
Invatamant profesional si de ucenici
Invatamant postliceal si de maistri
Invatamant superior
Feminin Masculin
100346
103574
38303
11406
128010
103672
98539
62598
6168
86816
TOTAL
204018
202113
100901
17574
214826
Absolventi in anul scolar/universitar 2008-2009 250000 200000 150000 100000 50000 0
Masculin Feminin
2.4 Estimarea prin interval de incredere a mediei
Inferenta statistica permite trecerea de la o valoare statistica calculate pe baza datelor dintr-un esantion, la valoarea adevarata necunoscuta. Esantionul este un subansamblu de unitati extrase dintr-o colectivitate pe care dorim sa o cunoastem, observarea fiind partial in cazul cand volumul esantionului este mai mic decat volumul colectivitatii totale, aceasta din urma purtand numele si de populatie mama. Estimarea reprezinta procedeul prin care se afla valoarea unui paramtru al populatiei, pe baza datelor inregistrate la nivelul unui esantion extras din aceasta. Estimatorul este statistica utilizata pentru a estima un parametru al populatiei. Estimatia este valoarea unui estimator al unui parametru, si este calculate pe baza a n observatii obtinute la nivelul esantionului, purtand si numele de valoare tipica de sondaj. Estimarea prin interval de incredere inseamna aflarea limitelor de incredere ale unui interval care acopera valoarea adevarata a unui parametru al populatiei, tinand seama de fluctuatiile distributiei de selectie a estimatorului parametrului considerat.
O reprezentativitate satisfacatoare a esantionului pentru populatie presupune asumarea unui risc de cel mult
.
Din totalul judetelor Romaniei se extrage un esantion de volum mic n=21 de judete, care au fost
observate dupa numarul de facultati. Folosind procedeul esantionarii aleatoare mecanice cu pas de numarare, rezulta fractia de selectie
2, pasul de numarare putand lua valoarea 1 sau 2. In
continuare, alegem pasul de numarare egal cu 1, de unde va rezulta urmatorul tabel:
Nr. Crt
Judet
Facultati
1
Alba
9
2
Arges
16
3
Bihor
25
4
Botosani
5
Brasov
23
6
Buzau
1
7
Caras-Severin
2
8
Constanta
29
9
Dambovita
10
10
Galati
19
11
Gorj
7
12
Hunedoara
5
13
Iasi
51
14
Maramures
11
15
Mures
16
16
Olt
2
17
Salaj
2
18
Sibiu
21
19
Teleorman
3
20
Tulcea
0
21
Vaslui
0
1
La nivelul esantionului s-au obtinut
∑ ̅ 253,
163. Se cere sa se estimeze prin
interval de incredere numarul mediu de facultati la nivelul tuturor judetelor din Romania, pentru un risc asumat
5%.
Cand varianta la nivelul populatiei nu este cunoscuta, folosim statistica Student (t) in scopul determinarii intervalului de incredere al mediei, t fiind recomandat si in cazul esantioanelor de volum mic (n<30).
̂√ √ ( ) ̅ √ √ ̅ √ √ [ ]
Cu o incredere de 95%, se poate afirma ca numarul mediu de facultati la nivelul tuturor judetelor Romaniei este acoperit de intervalul
.
2.5 Testarea statistica
2.5.1 Testarea ipotezelor asupra unui esantion
Ne propunem sa aflam, la nivelul aceluiasi esantion , daca numarul mediu de facultati este egal cu valoarea numarului mediu de facultati din totalul judetelor Romaniei, si daca ponderea numarului de facultati mai mare decat media acestora este egala cu ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor.
a)
Testarea mediei
Pentru aceleasi date de la problema estimarii prin interval de incredere a mediei, se cere sa se verifice daca exista diferente semnificative intre numarul mediu de facultati la nivelul esantionului si numarul mediu de facultati la nivelul intregii tarii, egal cu 14,85. Etapele testarii: 1) Formularea ipotezelor
:
presupune ca nu exista diferente intre cele doua populatii (partiala si totala)
:
2) Alegerea statisticii test Deoarece
()
volumul esantionului, vom alege statistica t.
3) Alegerea unui prag de semnificatie
|| ||
Alegem
4) Stabilirea regulilor de decizie se respinge se accepta
̅ √ √
pentru test
5) Calcularea valorii statisticii test
||
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare de unde rezulta decizia de acceptare a ipotezei nule. de
Cu o incredere de 95%, se poate afirma ca nu exista ex ista diferente semnificative intre numarul mediu de facultati la nivelul esantionului si numarul mediu de facultati la nivelul intregii tari.
b) Testarea proportiei
La nivelul esantionului, se observa ca proportia judetelor cu un numar de facultati mai mare decat media aritmetica este de 38,09%. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente semnificative intre ponderea numarului de facultati mai mar e decat media acestora si ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor, de 30,95%. Etapele testarii: 1) Formularea ipotezelor
() :
presupune ca nu exista diferente intre cele doua populatii (partiala si totala)
:
2) Alegerea statisticii test
Deoarece
volumul esantionului, vom alege statistica t.
3) Alegerea unui prag de semnificatie
|| ||
Alegem
4) Stabilirea regulilor de decizie se respinge se accepta
() ()
pentru test
5) Calcularea valorii statisticii test
||
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare de unde rezulta decizia de acceptare a ipotezei nule. de
Cu o incredere de 95%, se poate afirma ca nu exista ex ista diferente semnificative intre ponderea numarului de facultati mai mare decat media acestora si ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor Romaniei.
2.5.2 Testarea ipotezelor asupra a doua esantioane independente
Ne propunem sa aflam, la nivelul celor doua esantioane de volum egal, rezultate in urma folosirii procedeului esantionarii aleatoare mecanice cu pas de numarare, daca exista dieferente semnificative intre numarul mediu de facultati din primul esantion de judete si valoarea numarului mediu de facultati din cel de-al doilea esantion esantion de judete, pe teritoriul teritoriul Romaniei.
Nr. Crt
Judet
Facultati
1 2
Alba
9
Arges
3
Bihor
4 5
Botosani Brasov
23
6 7
Buzau
1
Caras-Severin
2
Nr. Crt
Judet
Facultati
Arad
25
16
1 2
Bacau
9
25
3
Bistrita-Nasaud
3
1
4 5
Braila
3
Bucuresti
165
6 7
Calarasi Covasna Giurgiu
0
1
Cluj
50
8 9 10
Constanta
29
Dambovita
10
Galati
19
8 9 10
11
Gorj
7
11
Harghita
4
12 13
Hunedoara
5
Ialomita
2
Iasi
51
12 13
Ilfov
1
14
Maramures
11
14
Mehedinti
5
15 16 17
Mures
16
15 16 17
Neamt
4
Prahova
5
Satu Mare
6
18 19
Teleorman
20 21
Olt
2
Salaj
2
Sibiu
21
2
Dolj
23
Suceava
10
3
18 19
Timis
47
Tulcea
0
20
Valcea
5
Vaslui
0
21
Vrancea
1
Se cunosc
,
Etapele testarii:
1) Formularea ipotezelor
() :
presupune ca nu exista diferente intre cele doua populatii
:
2) Alegerea statisticii test Deoarece
volumul esantionului, vom alege statistica t.
3) Alegerea unui prag de semnificatie Alegem
pentru test
iar iar
4) Stabilirea regulilor de decizie
|| || ||
se respinge se accepta
5) Calcularea valorii statisticii test
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare de unde rezulta decizia de acceptare a ipotezei nule. de
Cu o incredere de 95%, se poate afirma ca nu exista ex ista diferente semnificative intre mediile facultatilor celor doua esantioane de judete, la nivelul Romaniei.
2.5.3 Testarea ipotezelor asupra a trei si mai multe esantioane independente
Analiza dispersionala ANOVA consta in descompunerea variatiei totale a unui ansamblu de date, inregistrate pentru o variabila x, in componente definite dupa sursa variatiei si compararea acestora pentru a stabili daca factorii considerati cauza au influenta semnificativa asupra variabilei x. Pentru un esantion de 42 de judete din totalul judetelor Romaniei, o bservate dupa regiuni si dupa numarul de facultati, s-au inregistrat datele de mai jos. Pentru un risc asumat de 5%, sa se testeze daca numarul de facultati este influentat de regiune.
Nr. Crt
Regiune
Facultati pe judete
1
Nord-Vest
25
3
50
11
6
2
2
Centru
9
23
2
4
16
21
3
Nord-Est
9
1
51
4
10
0
4
Sud-Est
3
1
29
19
0
1
5
Sud (Muntenia)
16
1
10
0
2
5
6
Bucuresti-Ilfov
1
165
7
Sud-Vest (Oltenia)
23
7
5
2
5
8
Vest
25
2
5
47
3
Nr. Crt
Regiune
Count
Sum
Average
Variance
1
Nord-Vest
6
97
16,16667
345,3667
2
Centru
6
75
12,5
77,9
3
Nord-Est
6
75
12,5
372,3
4
Sud-Est
6
53
8,833333
148,9667
5
Sud (Muntenia)
7
37
5,285714
33,2381
6
Bucuresti-Ilfov
2
166
83
13448
7
Sud-Vest (Oltenia)
5
42
8,4
69,8
8
Vest
4
79
19,75
434,25
Source of Variation
SS
df
MS
F
P-value
F crit
2,562726
0,031129
2,293832
Between Groups
10527,09762
7
1503,87109
Within Groups
19952,04524
34
586,82486
Total
30479,14286
41
Etapele testarii: 1) Formularea ipotezelor
:
presupune ca nu exista diferente intre cele 8 populatii
:
2) Alegerea statisticii test
Pentru verificarea ipotezei nule, in ANOVA se foloseste statistica test F (raportul Fisher), calculat ca raport intre doi estimatori ai variantei:
()
grade de libertate
estimatorul variantei intergrupe estimatorul variantei intragrupe
numarul de grupe
volumul esantionului
̅ ( ) ( )
variatia intergrupe (masoara variatia mediilor grupelor fata de media lor) – componenta efect
variatia intragrupe (masoara variatia in interiorul fiecarei grupe) – componenta eroare
variatia totala
estimatorul variantei totale
3) Alegerea unui prag de semnificatie
Alegem
( ̅ ) pentru test
4) Stabilirea regulilor de decizie se respinge
se accepta
5) Calcularea valorii statisticii test
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare de unde rezulta decizia de respingere a ipotezei nule. de
Cu o incredere de 95%, se poate afirma ca regiunea influenteaza numarul de facultati, pe teritoriul Romaniei. Din tabel, se observa ca P-value =0,03 este mai mic decat asemenea, decizia de respingere a ipotezei nule.
=0,05 , rezultand, de
3. Analiza statistica descriptiva a unei serii de timp
3.1 Alegerea variabilei statistice
Studierea seriilor cronologice presupune caracterizarea variatiei in timp a unui fenomen, prin masurarea cresterilor sau descresterilor de nivel si a modificarilor de structura si prin determinarea influentei factorilor sub incidenta carora are loc evolutia fenomenelor. O metoda specifica pentru observarea si analiza seriilor cronologice este cea a indicatorilor statistici ai dinamicii, in marimi absolute, relative si medii, folosita si in cadrul acestui proiect, in scopul redarii nivelului si a modificarii de nivel in timp a unui fenomen. Din Anuarul statistic 2010 al Romaniei, au fost extrase date cu privire la numarul de licee pe profiluri, pe o perioada de 10 ani scolari. Seriile de timp de intervale descriu nivelul unui fenomen in diferite interval de timp, cum este si cazul distributiei liceelor la nivelul tarii, pe o perioada de 10 ani scolari.
Distributia liceelor din Romania, in perioada 2000-2010 An scolar
Numar de licee
2000-2001
1406
2001-2002
1418
2002-2003
1427
2003-2004
1436
2004-2005
1452
2005-2006
1449
2006-2007
1460
2007-2008
1466
2008-2009
1486
2009-2010
1677
Distributia liceelor pe profiluri, pe pe teritoriul Romaniei, in perioada perioada 2000-2010
Tipuri de licee
2000/ 2001
2001/ 2002
2002/ 2003
2003/ 2004
2004/ 2005
2005/ 2006
2006/ 2007
2007/ 2008
2008/ 2009
2009/ 2010
Licee si colegii teoretice Licee industriale Licee agricole
530
529
529
548
555
554
557
558
560
554
434
437
450
451
456
455
469
483
487
605
100
92
74
61
49
44
35
23
22
53
Licee silvice Licee agromontane Licee veterinare Licee economice, administrative si de servicii Licee de informatica Licee de metrologie Scoli normale Licee de arta
14
21
20
19
17
17
15
12
10
10
4
5
6
5
4
3
3
3
3
4
6
11
17
18
17
17
14
15
18
20
78
85
94
102
117
125
130
136
150
171
15
15
15
15
15
15
15
15
15
15
1
1
1
1
1
1
1
1
1
1
39
39
37
33
31
30
30
28
27
25
44
44
44
43
45
45
45
45
45
45
31
30
31
30
32
32
33
34
34
33
5
5
5
5
4
4
4
4
4
3
73
73
72
72
74
73
74
73
73
74
9
8
9
10
12
11
12
13
14
41
23
23
23
23
23
23
23
23
23
23
1406
1418
1427
1436
1452
1449
1460
1466
1486
1677
Licee cu program de educatie fizica Licee militare Seminarii teologice Licee speciale Licee sanitare TOTAL
Evolutia numarului de licee de pe teritorul Romaniei, pe o perioada de 10 ani scolari 1700 1650 1600 1550 1500 1450 1400 1350 1300 1250
Evolutia numarului de licee de pe teritorul Romaniei, pe o perioada de 10 ani scolari 1700 1650 1600 1550 1500 1450 1400 1350 1300 1250
3.2 Analiza statistica folosind indici statistici simpli
Indicele reprezinta un indicator obtinut ca raport intre nivelul fenomenului la un moment dat si nivelul aceluiasi fenomen pentru o alta perioada.
3.2.1 Indici absoluti
Indicatorii absoluti exprima in unitati concrete de masura, nivelul sau modificarile de nivel ale unui fenomen privit in evolutia sa in timp.
Nivelul absolut Nivelul absolut reprezinta valoarea Nivelul absolut
a fiecarui termen al seriei cronologice.
1406 1418 1427 1436 1452 1449 1460 1466 1486 1677
Volumul absolut In cazul seriilor de timp de intervale, volumul absolut se obtine prin insumarea nivelurilor absolute.
14.677
Sporul absolut Modificarea absoluta (cresterea sau descresterea absoluta) arata cu cat s-a modificat un fenomen intr-o perioada, fata de o alta perioada considerata baza de comparare.
Sporul cu baza fixa se calculeaza ca diferenta intre oricare termen al seriei si termenul initial.
Sporul absolut cu baza fixa 0 12 21 30 46 43 54 60 80 271
Din tabel reiese faptul ca, fata de anul scolar 2000-2001, luat ca baza comparabila, in toti ceilalti s-a inregistrat o crestere a numarului de licee la nivelul Romaniei.
Sporul cu baza mobila se calculeaza ca diferenta intre doi termeni consecutivi.
⁄
Sporul absolut cu baza in lant 12 9 9 16 -3 11 6 20 191
Din tabel se observa ca exista un singur spor negativ, calculat pentru perioada anilor scolari 20042005, 2005-2006. De aici ai ci rezulta ca numarul de licee de pe teriroriul tarii a fost intr-o continua crestere, dar de la anul scolar 2004-2005 la anul scolar 2005-2006 s-a inregistrat o scadere a acestora, egala cu 3. Tot din tabel reiese faptul ca cea mai mare crestere inregistrata la nivelul tarii, a fost in perioada anilor scolari 2008-2009 si 2009-2010, cu un numar de 191 de licee.
3.2.2 Indici relativi
Indicatorii relativi se obtin prin raportarea a doua nivele comparate si se exprima sub forma de coeficient sau procente.
Ritmul de variatie Indicele de variatie arata de cate ori a crescut sau a scazut nivelul unui fenomen intr-o anumita perioada, fata de nivelul aceluiasi fenomen dintr-o a lta perioada considerata ca baza.
Ritmul variatiei cu baza fixa :
Ritmul variatiei cu baza fixa 1 1,008535 1,014936 1,021337 1,032717 1,030583 1,038407 1,042674 1,056899 1,192745
In toti anii scolari, fata de cel luat ca baza co mparabila 2000-2001, s-a inregistrat o crestere a numarului de licee pe teritoriul Romaniei, cea mai mare crestere fiind in anul scolar 2009-2010.
Ritmul variatiei cu baza mobila :
⁄ ⁄
Ritmul variatiei cu baza mobila 1,008535 1,006347 1,006307 1,011142 0,997934 1,007591 1,00411 1,013643 1,128533
Singura valoare mai mica decat 1 corespunde perioadei dintre anii scolari 2004-2005 si 2005-2006, ceea ce inseamna ca atunci s-a inregistrat o scadere a numarului de licee la nivelul tarii.
Ritmul sporului Rata de crestere arata cu cat s-a modificat, in marime relativa, nivelul fenomenului in perioada raportata fata de nivelul din perioada de raportare.
Ritmul sporului cu baza fixa :
Ritmul sporului cu baza fixa 0 0,008535 0,014936 0,021337 0,032717 0,030583 0,038407 0,042674 0,056899 0,192745
Fata de anul scolar 2000-2001 luat ca baza de comparare, anul scolar 2009-2010 inregistreaza cea mai mare rata de crestere a numarului de licee la nivelul Romaniei, de 19,27%.
Ritmul sporului cu baza mobila :
⁄ ⁄ ⁄ ⁄ ⁄ ⁄
Ritmul sporului cu baza mobila
0,008535 0,006347 0,006307 0,011142 -0,00207 0,007591 0,00411 0,013643 0,128533
Fata de anul scolar 2004-2005, in anul scolar 2005-2006 se inregistreaza o scadere a numarului de licee din Romania, cu 0,207%. Cea mai mare rata de crestere a liceelor la nivelul tarii s-a inregistrat intre anii scolari 2008-2009 si 2009-2010, de 12,85%.
3.2.3 Indici exprimati prin valori medii
Nivelul mediu In cazul seriilor de timp de intervale, nivelul mediu este calculat ca medie aritmetica a termenilor seriei.
1467,7
∑
La nivelul tarii, pe o perioada de 10 ani scolari, nivelul mediu de licee inregistrat este de aproximativ 1.468 .
Sporul mediu Sporul mediu reflecta modificarea medie pe unitate de timp inregistrata de un fenomen, intr-o perioada. El se calculeaza ca medie aritmetica a sporului cu baza mobila
30,11
∑ ⁄
In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent scolar, de aproximativ 30 de licee.
Ritmul mediu al variatiei Ritmul mediu arata de cate ori s-a modificat in medie pe o perioada de timp, nivelul unui fenomen. El se calculeaza ca medie geometrica a indicilor de variatie cu baza mobila.
∏ ⁄
1,0197
In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent de
aproximativ 1,02 ori.
4. Concluzii
Scopul acestei lucrari practice a fost cel de realizare a unor c ercetari asupra numarului de facultati si a numarului de studenti din fiecare judet din anul universitar 2009-2010, asupra absolventilor pe nivel de invatamant si sex de pe intreg teritoriul tarii in anul scolar/universitar 2008-2009 , dar si asupra numarului de licee din Romania, pe o perioada de 10 ani scola ri. In urma prelucrarii datelor culese din Anuarul statistic 2010 al Romaniei, s-a ajuns la urmatoarele cateva concluzii: exista o legatura directa si pozitiva intre numarul de facultati si numarul d studenti inscrisi la nivelul judetelor Romaniei, regiunea influenteaza numarul facultatilor de pe teritoriul tarii, iar numarul de licee din Romania a cunoscut o crestere semnificativa in ultimii 10 ani, m ai ales in anul scolar 2009-1010. Majoritatea calculelor si analizelor au fost realizate cu ajutorul programului de calcul tabelar Excel din pachetul Microsoft Office, folosindu- se chiar programul de completare “Pachet de instrumente pentru analiza -VBA”, in scopul finalizarii cu usurinta a acestui proiect.
Bibliografie
Jaba, Elisabeta, Statistica, ed. a3-a rev., Bucuresti, Bucuresti, Editura Economica, 2002 Jaba,Elisabeta, Pintilescu, Statistica:teste grila si probleme, ed. a2-a rev., Iasi, Editura Sedcom Libris, 2007 www.insse.ro , Institutul National de Statistica