OSNOVNE STATISTIČKE METODE ZA NEMATEMATIČ ARE (Boris Petz, Sveučilišna naklada Liber)
1. ZAŠTO STATISTIKA? 2. MJERE CENTRALNE TEDENCIJE 3. MJERE VARIJABILNOSTI
1. ZAŠTO STATISTIKA? “Statistički način mišljenja jednog će dana za svakodnevni život građana postati jednako neophodan kao znanje čitanja i pisanja.” H. G. Wel Wells ls (186 (18666-19 1946 46). ).
Statistika je obrada broj čanih podataka radi jasnijeg prikazivanja. Statistička metodologija postala je u suvremenom životu donekle čak dio “općeg obra obrazo zovan vanja ja”” i “op “opće kulture”, jer je npr. teško zamisliti danas čovjeka bilo koje struke, struke, ako posjeduje visoko obrazovanje, da mu ne bi bili poznati čke k e sredine”, sredine”, “varijabiliteta pojmovi “aritmeti “aritmeti č “varijabiliteta”” i tome slično.
1. ZAŠTO STATISTIKA?
Postoje četiri razine na kojima suvremeni čovjek treba statistiku:
Poznavanje statistike potrebno je zbog prać enja struč ne i znanstvene literature. Poznavanje statistike potrebno je pri obradi rezultata, prikupljenih istraživanjem ili eksperimentom, radi deskripcije i analize tih rezultata. Poznavanje statistike potrebno je u znanstvenom i stručnom radu radi zaključ ivanja iz konkretnog slučaja na “opći zakon”. Poznavanje statistike potrebno je pri planiranju istraživanja i eksperimenata.
2. MJERE CENTRALNE TENDENCIJE
2.1. ARITMETIČKA SREDINA 2.2. ZAJEDNIČKA ARITMETIČKA SREDINA 2.3. NEKE DRUGE MJERE CENTRALNE TENDENCIJE 2.3.1. CENTRALNA VRIJEDNOST 2.3.2. DOMINANTNA VRIJEDNOST 2.3.3. GEOMETRIJSKA SREDINA 2.3.4. HARMONI Č NA SREDINA
2. MJERE CENTRALNE TENDENCIJE 2.1. ARITMETIČKA SREDINA
•
Najčešća i najpoznatija mjera “prosjeka” je aritmetička sredina, kao i najčešće izvođen račun za statističke potrebe. Osnovna formula za izra čunavanje aritmetičke sredine glasi: ARITMETIČKA SREDINA = SUMA SVIH REZULTATA BROJ REZULTATA
što se statističkim simbolima piše:
X ∑ X = N
2. MJERE CENTRALNE TENDENCIJE 2.2. ZAJEDNIČKA ARITMETIČKA SREDINA
•
Često
se u praksi događa da smo neku pojavu izmjerili nekoliko puta i svaki put izra čunali aritmetičku sredinu iz više mjerenja. Ako konačno želimo dobiti zajedni č ku aritmetičku sredinu svih tih mjerenja (različit broj mjerenja) izračunavamo po sljedećoj formuli: Zajedni č ka
X =
N 1 X 1 + N 2 X 2 ........ + N n X n N 1 +
N 2
+ ........ + N n
2. MJERE CENTRALNE TENDENCIJE 2.3. NEKE DRUGE MJERE CENTRALNE TENDENCIJE
2.3.1. CENTRALNA VRIJEDNOST
Centralna vrijednost (C) je vrijednost koja se u nizu rezultata, poredanih po veličini, nalazi točno u sredini. Prednost centralne vrijednosti pred aritmetičkom sredinom sastoji se u tome što na nju ne utje če vrijednost pojedinih rezultata, pa prema tome jedan vrlo ekstremni rezultat neće ništa promijeniti vrijednost C , koja je uvjetovana samo brojem rezultata. Praktična upotreba vrijednosti C sastoji se u lociranju optimalnog položaja.
2. MJERE CENTRALNE TENDENCIJE 2.3. NEKE DRUGE MJERE CENTRALNE TENDENCIJE Primjer: Ako u jednom mjerenju dobijemo ovih 11 rezultata: 7 9 4 7 8 7 10 6 6 9 8, pa ih poredamo po veličini: 4 6 6 7 7 7 8 8 9 9 10. Budući da imamo 11 rezultata, srednji rezultat je šesti rezultat (jer imamo 5 rezultata ispred i 5 rezultata iza njega) pa je C =7, položaj rezultata koji zauzima centralna vrijednost, može se odrediti pomoću formule: Položaj C = (N+1)/2. Ako je broj rezultata paran, centralna se vrijednost izračunava tako da se zbroje dva srednja rezultata, a suma podijeli s 2: Primjer: Kad bismo imali rezultate: 4 5 5 6 8 9, C = (5+6)/2 = 5,5 .
2. MJERE CENTRALNE TENDENCIJE 2.3.2. DOMINANTNA VRIJEDNOST
Dominantna vrijednost (D) je ona vrijednost koja je u nizu mjerenja najčešće postignuta (dakle koja “dominira”).
Primjer: Uzorak od 550 bračnih parova ima ukupno 1660 djece. Prosjek za utvr đivanje gradnje stanova računao bi na 3,02 djeteta po bračnom paru i znatno pogriješio u procjeni. Broj djece: 0 1 2 3 4 5 6 7 8 9 10 11 12 Broj bračnih parova s tim brojem djece: 70 90 108 86 70 47 30 20 15 5 4 3 2. D vrijednost je dvoje djece (108 bra čnih parova).
Prednost D vrijednosti ispred aritmetičke sredine je što na nju ne utječe ni broj ni vrijednost rezultata, ve ć samo frekvencija pojedinih rezultata.
2. MJERE CENTRALNE TENDENCIJE 2.3.3. GEOMETRIJSKA SREDINA
Geometrijska sredina (G) izračunava se prema formuli:
G = n x1 • x2 • x3 ........ • xn
2. MJERE CENTRALNE TENDENCIJE 2.3.3. GEOMETRIJSKA SREDINA
Pretežno se koristi kao prosje čna mjera brzine nekih promjena (ako broj nije negativan ili nula).
Primjer: Ako mjesto A ima 1960. 2000 stanovnika, 1961. 9000, a 1962. 18 000 stanovnika, onda je populacija 1961. bila 4,5 puta veća od populacije u 1960., a populacija 1962. dva puta veća od 1961. Postavimo li pitanje koliko je puta prosječ no populacija svake godine porasla, izračunat ćemo pomoću geometrijske sredine: G=
4,5 • 2 = 9 = 3 puta
2. MJERE CENTRALNE TENDENCIJE 2.3.4. HARMONI ČN A SREDINA
Harmoni č na sredina (H) koristi se kad želimo dobiti prosjeke nekih odnosa (npr. prosje čne km/h, prosječni broj slova u minuti). H se ne može izra čunati ako je bilo koji broj negativan ili nula. H se izračunava prema formuli:
N H = 1
∑ x
2. MJERE CENTRALNE TENDENCIJE 2.3.4. HARMONI ČN A SREDINA
Primjer: Ako je automobilist, udaljenost od 100 km vozio brzinom od 100 km/h, a natrag je išao brzinom od 50 km/h, kojom je prosječnom brzinom vozio?
H =
2 1 100
+
1 50
= 66,7 km / h
2. MJERE CENTRALNE TENDENCIJE Z A D A C I ZA V J E Ž B U
Izračunajte aritmetičku sredinu, centralnu vrijednost i dominantnu vrijednost za niže navedene podatke: 10 , 8, 6, 0, 8, 3, 2, 2, 8, 0; b) 1, 3, 3, 5, 5, 5, 7, 7, 9; c) 120, 5, 4, 4, 4, 2, 1, 0. U kojem od prethodnih slučajeva aritmetička sredina predstavlja neprikladnu mjeru centralne tendencije i zašto? a)
3. MJERE VARIJABILNOSTI
3.1. RASPON 3.2. SREDNJE ODSTUPANJE 3.3. STANDARNA DEVIJACIJA 3.4. KOEFICIJENT VARIJABILNOSTI
3. MJERE VARIJABILNOSTI
3.1. RASPON
Kod mjerenja mnogih pojava možemo opaziti da se rezultati grupiraju oko jedne srednje vrijednosti. Jedino pod tom pretpostavkom i imamo pravo ra čunati neku vrijednost, npr. aritmetičku sredinu, jer želimo da nam ona na neki na čin reprezentira sve naše rezultate. Naime, sama aritmetička sredina nije nam još nikakva garancija da se rezultati grupiraju oko te aritmeti čke sredine i zato je uvijek potrebno znati kako i koliko se oni grupiraju, tj. da li nam je dobivena aritmeti čka sredina dobar ili loš reprezentant naših rezultata.
3. MJERE VARIJABILNOSTI
3.1. RASPON
Najjednostavnija (ali i najnetočnija) mjera grupiranja rezultata oko neke srednje vrijednosti je tzv. “raspon”, tj. razlika između najvećeg i najmanjeg rezultata.
Primjer: Prilikom dva puta mjerenja po 10 mjerenja neke pojave, dobili smo ova dva niza rezultata (rezultati su poredani po veličini): mjerenje: 8 8,5 8,5 9 9 9 9 9,5 9,5 10 1. Mjerenje: 1 2 3 5 9 9 13 15 16 17. 2. U oba slučaja suma rezultata = 90 i aritmeti čka sredina = 9,0 što govori da se u prvom mjerenju rezultati bolje grupiraju oko aritmetičke sredine, a u drugom ne.
3. MJERE VARIJABILNOSTI
3.1. RASPON
U prvom je slučaju raspon 10 – 8 = 2, a u drugom slučaju 17 – 1 = 16. Prema tome, prva aritmetička sredina mnogo je “vrednija”, jer ona znatno reprezentira rezultate iz kojih je dobivena. Međutim, “raspon” je vrlo nesigurna i varljiva mjera varijabilnosti rezultata, jer bilo koji osamljeni ekstremni rezultat znatno povećava raspon a da se grupacija rezultata oko aritmetičke sredine ipak nije bitno promijenila. Osnovni se nedostatak raspona sastoji u tom što je on obično to veći što je veći broj mjerenja neke pojave.
3. MJERE VARIJABILNOSTI
3.2. SREDNJE ODSTUPANJE
Zanima li nas prosječna veličina odstupanja pojedinačnih rezultata (bez obzira na smjer odstupanja), možemo izračunati srednje odstupanje prema formuli:
srednje odstupanje =
∑
X − X N
3. MJERE VARIJABILNOSTI
3.2. SREDNJE ODSTUPANJE
U formuli oznake o zagradi predstavljaju apsolutnu veli č inu odstupanja, dakle bez obzira na predznak.
Primjer: Ako imamo ove rezultate: Rezultati: 5 7 4 6 5 6 5 2 4 6/∑ = 50, Odstupanja: 0 2 1 1 0 1 0 3 1 1/∑ = 10
X = 50 / 10 = 5,0
Srednje odstupanje = 10/10 = 1.
Rezultati, prema tome, prosječ no odstupaju od aritmetičke sredine za 1.
3. MJERE VARIJABILNOSTI
3.3. STANDARNA DEVIJACIJA
Kada bismo prosječno odstupanje računali vodeć i računa o predznaku, onda bismo uvijek kao sumu dobili nulu. Razlog tome već nam je poznat: aritmetička sredina, kao težište rezultata, je vrijednost od koje suma odstupanja iznad i ispod nje uvijek iznosi 0. Jedan od načina da se izbjegnu predznaci odstupanja je taj da se odstupanja kvadriraju. Ako tako kvadrirana odstupanja zbrojimo i izračunamo im aritmetičku sredinu, dobit ćemo mjeru varijabiliteta koja se u statistici naziva “varijanca”.
( X − X ) varijanca = s2 = ∑ N − 1
2
3. MJERE VARIJABILNOSTI
3.3. STANDARNA DEVIJACIJA
Međutim korijen iz varijance može se – kako ćemo vidjeti – prikazati kao potpuno definirani razmak na skali rezultata. Taj drugi korijen iz varijance nazvan je standardna devijacija i označava se sa s ili S.D. Ili σ, i to zato što se ta mjera koristi kao standard za mjerenje varijabiliteta rezultata. S=
2
s
3. MJERE VARIJABILNOSTI
3.3. STANDARNA DEVIJACIJA Primjer: Rezultati X 8 8,5 8,5 9 9 9 9 9,5 9,5 10 Σ=90
X = 9,0
x − x
( X − X )
-1 -0,5 -0,5 0 0 0 0 0,5 0,5 1
1 0,25 0,25 0 0 0 0 0,25 0,25 1
∑ ( X − X )
2
= 3,00
2
s=
3 9
s=
0,3333 = 0,58
3. MJERE VARIJABILNOSTI
3.3. STANDARNA DEVIJACIJA
Standardna devijacija pokazuje nam koliko vrijedi dobivena aritmeti č ka sredina. Kada su rezultati “simetrično” i “normalno” grupirani oko aritmetičke sredine onda je u intervalu koji obuhva ća X ± 1s, 68,26 % svih rezultata, odnosno X ± 2 s, 95,44 % svih rezultata i konačno X ± 3s, 99,73 % svih rezultata. Stoga ukoliko u našem primjeru na jednu i na drugu stranu “dodamo” vrijednost standardne devijacije aritmetičkoj sredini: ( 9-0,58=8,42 tj. 9,0+0,58=9,58), 68,26 % svih rezultata nalazi se između 8,42 i 9,58.
3. MJERE VARIJABILNOSTI
3.4. KOEFICIJENT VARIJABILNOSTI
Kada su nam poznate aritmetička sredina i standardna devijacija nekih rezultata, onda su ti rezultati potpuno definirani i možemo ih uspoređivati s nekim drugim rezultatima. Ako imamo dvije razli č ite aritmeti čk e sredine teško je naprvi pogled odmah ustanoviti koji rezultati relativno više variraju? Da bismo mogli međusobno uspoređivati varijabilnost razli č itih pojava i svojstava, služimo se tzv. koeficijentom varijabilnosti (V) koji nam pokazuje koliki postotak vrijednosti aritmetičke sredine iznosi vrijednost standardne devijacije: V =
s • 100 X
3. MJERE VARIJABILNOSTI
3.4. KOEFICIJENT VARIJABILNOSTI
Koeficijent varijabilnosti vrlo je korisna mjera u svim onim slučajevima kada želimo znati: u kojem svojstvu neka grupa varira više, a u kojem manje; koja od grupa varira više, a koja manje u istom svojstvu. Primjer: Jednim mjerenjem zagrebač ke školske djece 1951. utvr đ eno je da 10-godišnji dje č aci (N=612) imaju visinu X = 134,4cm sv = 6,06cm, a težinu X t = 29,2kg , st = 3,89kg , variraju li više dječaci u visini ili u težini?
v
V v =
V t =
6,06 • 100 134,4 3,89 • 100 29,2
= 4,51%
= 13,32%
3. MJERE VARIJABILNOSTI
3.4. KOEFICIJENT VARIJABILNOSTI
Prema tome, dječaci variraju u težini znatno više nego u visini. Primjer 2: Prilikom tog istog mjerenja utvr đeno je da 10-godišnje djevojčice (N=684) imaju visinu X v = 134,9cm, sv = 6,43cm, a težinu X t = 29,7 kg , st = 4,78kg. Variraju li u visini više dje čaci ili djevoj čice? Visina: V za dje čake = 4,51 % V za djevojčice =
V v =
6,43 • 100 134,9
= 4,77%
Težina: V za dječake = 13,32 % V za djevojčice =
V t =
4,78 • 100 29,7
= 16,09%
Prema tome, 10-godišnje djevojčice variraju u visini i težini nešto više od 10-godišnjih dječaka.
3. MJERE VARIJABILNOSTI
Z A D A C I ZA V J E Ž B U
Izračunajte standardnu devijaciju za podatke a), b) i c) iz zadatka u poglavlju “Mjere centralne tendencije”! Izračunajte koeficijent varijabiliteta za podatke iz prethodnog zadatka!