Primjer 1:
Data je tabela osoba na privremenom radu u inostranstvu, prema starosti stanovništva: God. starosti 15 – 20 20 – 25 25 – 30 30 – 35 35 – 40 40 – 45 45 – 50 50 – 55 55 - 60 a) b) c) d)
Br. osoba 20083 52860 41249 38252 30499 20113 10273 3079 2706
Odrediti prosječnu starost osoba na privremenom radu u inostranstvu. Računski i grafički odrediti najčešću starost osoba na privremenom radu u inostranstvu. Računski i grafički odrediti medijanu i kvartile. Izračunati srednje apsolutno odstupanje starosti osoba na privremenom radu u inostranstvu od prosječne starosti. Rješenje:
Ri
f i
15 – 20 20 – 25 25 – 30 30 – 35 35 – 40 40 – 45 45 – 50 50 – 55 55 - 60
ci
20083 52860 41249 38252 30499 20113 10273 3079 2706
∑
17,5 22,5 27,5 32,5 37,5 42,5 47,5 52,5 57,5
351452,5 1189350,0 1134347,5 1243190,0 1143712,5 854802,5 487967,5 161647,5 155595,0
219114
6722065,0
13,18 8,18 3,18 1,82 6,82 11,82 16,82 21,82 26,82
ci − x
⋅
f i
264661,63 432309,76 131105,46 69680,18 208052,25 237768,02 172808,39 67188,73 72579,27
S i ր
20083 72943 114192 152444 182943 203056 213329 216408 219114
1656153,69
n
6722065 = 30,68 N i =1 219114 Prosječna starost osoba na privremenom radu u inostranstvu iznosi 30,68 godina. a) X =
b) f max M o
1
ci − x
ci f i
=
∑
ci ⋅ f i
=
52860 ⇒ M o ∈ [20 − 25[
= L1 M + o
a M o
( f
M o
f M o
− f M −1
) ( f
− f M −1 + o
o
M o
− f M +1 o
)
=
20 + 5
52860 − 20083 = 23,69 (52860 − 20083) + (52860 − 41249)
Najčešća starost osoba na privremenom radu u inostranstvu iznosi 23,69 godina. Grafičko određivanje modusa:
1
Histogram apsolutnih frekvenc ija 60000 50000
e j i c n 40000 e v k e r f 30000 e n t u 20000 l o s p a
10000 0 15 – 20
c)
N
=
2
20 – 25
Mo
=
30 – 35
35 – 40
40 – 45
45 – 50
50 – 55
55 - 60
intervali
219114 = 109557 ≤ 114192 ⇒ M e ∈ [ 25 − 30[ 2 N
M e
25 – 30
L1M e
2
+ aM
− S ր M −1 e
=
f M e
e
25 + 5 ⋅
109557 − 72943 = 29, 44 41249
50% osoba na privremenom radu u inostranstvu ima manje ili jednako 29,44 godina, dok 50% osoba na privremenom radu u inostranstvu ima više od 29,44 godina. N
4
=
219114
= 54778,5 ≤
4
N Q1
=
L1Q1
4
+ aQ
72943 ⇒ Q1 ∈ [ 20 − 25[
− S ր Q −1 1
1
f Q1
=
20 + 5 ⋅
54778,5 − 20083 = 23, 28 52860
25% osoba na privremenom radu u inostranstvu ima manje ili jednako 23,28 godina, dok 75% osoba na privremenom radu u inostranstvu ima više od 23,28 godina. 3 ⋅ N 3 ⋅ 219114 = = 164335,5 ≤ 182943 ⇒ Q3 ∈ [ 35 − 40[ 4 4 3 ⋅ N − S ր Q −1 3 164335,5 − 152444 4 Q3 = L1Q3 + aQ3 = 35 + 5 30499 f Q3
= 36,95
75% osoba na privremenom radu u inostranstvu ima manje ili jednako 30,95 godina, dok 25% osoba na privremenom radu u inostranstvu ima više od 36,95 godina.
Medijanu i kvartile grafički određujemo na poligonu rastuće kumulativne frekvencije. n
1656153,69 = 7,56 219114 N i=1 Prosječno apsolutno odstupanje starosti osoba na privremenom radu u inostranstvu od prosječne starosti iznosi 7,56 godina. MAD =
1
∑
ci
− X ⋅
f i
=
2
Primjer 2: Sedmične zarade zaposlenih u kompaniji Todd date su u tabeli:
Sedmična zarada ($) 550 650 750 850 950 1050 1150 a) b) c) d)
Br. zaposlenih 8 10 16 14 10 5 2
Odrediti prosječnu zaradu zaposlenih u kompaniji. Izračunati i protumačiti varijansu i standardnu devijaciju. Izračunati koeficijent asimetrije i protumačiti. Izračunati koeficijent spljoštenosti i protumačiti. Rješenje:
( x
X )
f i
xi
550 650 750 850 950 1050 1150
8 10 16 14 10 5 2 65
4400 2420000 -247,692 6500 4225000 -147,692 12000 9000000 -47,6923 11900 10115000 52,30769 9500 9025000 152,3077 5250 5512500 252,3077 2300 2645000 352,3077 51850 42942500
Σ
⋅
f i
2
xi
xi
⋅
f i
i
−
( x
i
−
X)
3
⋅
f i
( x
i
−
X)
4
⋅
f i
-121570316 30112032089 -32216149 4758077434 -1735661,4 82777695,46 2003663,2 104806997 35331780 5381301831 80308493 20262450642 87457362 30811901331 49579172 91513348020
n
51850 = 797,69 65 i =1 Prosječna sedmična zarada zaposlenih u kompaniji Todd iznosi 797,69 KM. a) X =
1
∑ x ⋅ f = N i
i
2 1 7 2 = ⋅ ∑ ( xi ⋅ f i ) − X N i 1
42942500 2 − 797,69 = 24340,83 ⇒ σ = 156,02 65 = Prosječno linearno odstupanje zarada zaposlenih od prosjeka iznosi 156,02 KM. b)
2
σ
c) µ 3
=
∑ [( x N
) ⋅ f ] = 49579172 = 762756,49
7
1
⋅
i
− X
3
i
i =1
α 3 =
µ 4 =
µ 3
=
3
σ
∑ [( x N ⋅
i =1
α 4 =
µ 4
= 4
σ
65
762756,49 = 0, 201 > 0 ⇒ blago desno asimetrična distribucija 156,023
7
1
=
i
)
− X
4
⋅
f i
]
=
91513348020 65
= 1407897662
1407897662 = 2,376 < 3 ⇒ blago spljoštena distribucija 156,024
3
Primjer 3:
Pratili smo koliko je vremena potrebno za izvršavanje jedne radne aktivnosti i za 30 observacija dobili podatke (u minutama): 15 17 22
23 16 16
18 14 20
16 12 17
17 14 19
14 12 21
23 18 23
16 13 15
19 19 21
20 16 18
a) Formirati statističku distribuciju frekvencija sa intervalnim grupisanjem tako da donja granica prvog razreda bude 12 a amplituda 2. b) Predstaviti grafički statističku distribuciju frekvencija. c) Izračunati prosječno trajanje jedne radne aktivnosti. d) Izračunati i objasniti medijanu i kvartile. e) Izračunati i objasniti koeficijent varijacije i interkvartilnog odstupanja. Koji je bolji predstavnik zadanih podataka: aritmetička sredina ili medijana? Rješenje: a) Ri
f i
ci
12 – 14 14 – 16 16 – 18 18 – 20 20 – 22 22 – 24
3 5 8 6 4 4
13 15 17 19 21 23
∑
2
ci f i
30
S i ր
ci f i
39 75 136 114 84 92
507 1125 2312 2166 1764 2116
540
9990
3 8 16 22 26 30
b) histogram 9 8 c n e v k e r f e n t u l o s p a
7 6 5 4 3 2 1 0 12 – 14
14 – 16
16 – 18
18 – 20
20 – 22
22 – 24
razredi
poligon apsolutnih frekvencija
4
9 8 e j i 7 c n e 6 v k e 5 r f e 4 n t u l
3
o s p 2 a
1 0 0
5
10
15
20
25
centri intervala
n
540 = 18 30 i =1 Prosječno vrijeme potrebno za izvršavanje radne aktivnosti iznosi 18,0667 minuta. c) X
d)
=
N
2
1
∑ c ⋅ f = N i
=
30 2
i
= 15 ≤ 16 ⇒ M e ∈
N M e
=
L1M e
+ a M
e
2
[16 − 18[
− S ր M −1 e
= 16 + 2 ⋅
f M e
15 − 8 8
= 17, 75
50% radnih aktivnosti traje 17,75 minuta i manje, dok 50% radnih aktivnosti traje više od 17,75 minuta. N
4
=
30 4
=
7,5 ≤ 8 ⇒ Q1 ∈ [14 − 16[ N
Q1
L1Q1
=
4
+ aQ
1
− S ր Q −1 1
f Q1
= 14 + 2 ⋅
7,5 − 3 5
= 15,8
25% radnih aktivnosti traje 15,8 minuta i manje, dok 75% radnih aktivnosti traje više od 15,8 minuta. 3 ⋅ N 3 ⋅ 30 = 4 4 Q3
=
L1Q3
=
+ aQ
3
22,5 ≤ 26 ⇒ Q3 ∈ [ 20 − 22[ 3 ⋅ N − S ր Q −1 3 4 f Q3
=
20 + 2 ⋅
22,5 − 22 4
= 20, 25
75% radnih aktivnosti se završi za 20,25 minuta i manje, dok se 25% radnih aktivnosti završi za više od 20,25 minuta. d) 3 ⋅100 = 16, 67% 18 X Relativno izraženo variranje podataka oko aritmetičke sredine iznosi 16,67%. V =
σ
⋅100 =
5
2
σ =
1
n
∑c N ⋅
2
i
⋅
fi
−
X 2
=
i =1
9990 2 − 18 30
= 333 − 324 = 9
9 =3 Prosječno linearno odstupanje vremena izvršenja aktivnosti od prosječnog vremena (aritmetičke sredine) iznosi 3 minute. σ =
20,25 − 15,8 ⋅100 = 12,34% Q3 + Q1 20,25 + 15,8 Relativno izraženo variranje podataka oko medijane iznosi 12,34%. VQ
=
Q3 − Q1
⋅ 100 =
Bolji predstavnik zadatih podataka je medijana jer podaci manje variraju u odnosu na medijanu nego u odnosu na aritmetičku sredinu.
Primjer 4:
Broj izgrađenih stanova po opštinama jednog kantona bio je: 43 80 603 505
120 120 430 180
55 220 205 430
570 230 320 208
250 220 405 350
420 70 207 80
a) Formirati raspored frekvencija tako da veličina intervala bude 100 stanova (intervalno grupisanje). b) Naći i objasniti prosječan broj izgrađenih stanova. c) Izračunati i objasniti Q1 . d) Koliko bi najmanje izgrađenih stanova trebala imati opština da se nađe u gornjih 25% (po broju izgrađenih stanova)? e) Izračunati i objasniti medijanu.
Rješenje: a) xi
0-100 100-200 200-300 300-400 400-500 500-600 600-700 Σ
b)
X =
f i
ci
5 3 7 2 4 2 1 24
50 150 250 350 450 550 650
ci
⋅
f i
250 450 1750 700 1800 1100 650 6700
S ր i
5 8 15 17 21 23 24
F ր i
pi
0,21 0,13 0,29 0,08 0,17 0,08 0,04 1
0,21 0,34 0,63 0,71 0,88 0,96 1
∑ c ⋅ f = 6700 = 279,17 i
N
i
24
6
Prosječan broj izgrađenih stanova po opštinama iznosi približno 279. c)
N
4
=6≤
S ր Q1 = 8 ⇒ Q1 ∈ [100 − 200[ N
Q1
=
L1Q1
4
+ aQ ⋅
− S ր Q −1 1
=100 + 100 ⋅
f ( RQ1 )
1
6−5 3
= 133,33
Tumačimo da 25% opština ima manje ili jednako od 133 izgrađena stana dok 75% opština ima više od 133 izgrađena stana. 3 ⋅ N = 18 ≤ S ր Q = 21 ⇒ Q3 ∈ [ 400 − 500[ 3 4 3 ⋅ N − S ր Q −1 3 18 − 17 4 Q3 = L1Q3 + aQ3 ⋅ = 400 + 100 ⋅ f ( RQ3 ) 4
d)
=
425
Opština bi trebala imati više od 425 izgrađenih stanova. e)
N
2
= 12 ≤
S ր M e = 15 ⇒ M e ∈ [ 200 − 300[ N
M e
=
L1M e
+ a M ⋅ e
2
− S ր M −1 e
f ( R M e )
= 200 + 100 ⋅
12 − 8 7
=
257,14
Tumačimo da 50% opština ima manje ili jednako od 258 stanova, dok 50% opština ima više od 258 stanova.
Primjer 5:
Dnevne zarade 11 stručnjaka iznose 70 KM, 70 KM, 80 KM, 80 KM, 80 KM, 80 KM 80 KM, 90 KM, 90 KM, 90 KM, 100 KM. a) b) c) d)
Koliko iznosi prosječna zarada (u KM) stručnjaka u ovoj grupi? Pojavu predstaviti krivom rastuće apsolutne kumulante. Odrediti mod i medijanu date distribucije frekvencija te protumačiti dobijene rezultate. Odrediti i protumačiti Q1 i Q3 .
Rješenje: xi
f i
xi ⋅ f i
S ր i
70 80 90 100 ∑
2 5 3 1 11
140 400 270 100 910
2 7 10 11
F ր i
pi 0,182
0,182
0,454
0,636
0,273
0,909
0,091
1
1
7
a) X =
∑ x ⋅ f = 910 = 82,73 i
i
11 Prosječana dnevna zarada 11 stručnjaka iznosi 82,73 KM. N
b) a n v i t a l u m a u j k i a c n n e t v u k l o e r s f p a a ć u t s a r
12 10 8 6 4 2 0 70
80
90
100
iznos primanj a
c) f max
= 5 ⇒ Mo = 80 KM
Najčešća dnevna zarada stručnjaka iznosi 80 KM. N
2
= 5,5 ≤
S ր M e = 7 ⇒ M e
= 80 KM
Zbog velikog odstupanja stvarne od teorijske kumulante, tumačimo da 63,6% stručnjaka ima dnevnu zaradu 80 KM ili manje, dok 36,4% stručnjaka imaju dnevnu zaradu višu od 80 KM. d)
N
4
=
2, 75 ≤ S ր Q1 = 7 ⇒ Q1 = 80 KM
Zbog velikog odstupanja stvarne od teorijske kumulante, tumačimo da 63,6% stručnjaka ima dnevnu zaradu 80 KM ili manje, dok 36,4% stručnjaka imaju dnevnu zaradu višu od 80 KM. .
3 ⋅ N = 8, 25 ≤ S ր Q = 10 ⇒ Q3 3 4
= 90 KM
Zbog velikog odstupanja stvarne od teorijske kumulante, tumačimo da 90,9% stručnjaka ima dnevnu zaradu 90 KM ili manje, dok 9,1% stru čnjaka imaju dnevnu zaradu višu od 90 KM.
8
Primjer 6:
Dati su podaci o 34 čeličane prema stepenu iskorištenosti kapaciteta: stepen iskorištenosti kapaciteta 60-65 65-70 70-75 75-80 80-85 85-90 90-95 95-100
broj čeličana
5 2 4 3 5 6 5 4
Izračunati i objasniti: a) prosječan stepen korištenja kapaciteta b) najčešći stepen iskorištenja kapaciteta c) stepen korištenja kapaciteta koji dijeli ovu statističku seriju na pola. Rješenje: xi
f i
ci
60-65 65-70 70-75 75-80 80-85 85-90 90-95 95-100 suma a) X = b) f M M o
o
=
5 2 4 3 5 6 5 4 34
N
2
i
=
312,5 135 290 232,5 412,5 525 462,5 390 2760
5 7 11 14 19 25 30 34
i
34 = 6 ⇒ M o ∈ [85 − 90[
LM o
N
+ aM ⋅ o
f M o
( f
−
f Mo 1 −
−
LM e
+ a M ⋅ e
2
f M o 1 −
)+( f
= 17 ⇒ 19 > 17 ⇒ M e ∈
N M e
62,5 67,5 72,5 77,5 82,5 87,5 92,5 97,5
S ր i
∑ c ⋅ f = 2760 = 81,18
M o
c)
ci ⋅ f i
Mo
−
f M o 1
f M e
)
6−5 ( 6 − 5) + ( 6 − 5)
= 87, 5
[ 80 − 85[
− S ր M −1 e
+
= 85 + 5 ⋅
= 80 + 5 ⋅
17 − 14 5
= 83
9
Primjer 7:
Poznati su podaci o procentu seoskog stanovništva za 45 opština: procenat seoskog stanovništva 10-15 15-20 20-30 30-34 34-40
broj domaćinstava 8 16 10 7 4
Izračunati: a) prosječan procenat seoskog stanovništva po opštini. b) najčešći procenat seoskog stanovništva. Rješenje: xi
f i
ci
10-15 15-20 20-30 30-34 34-40 suma
8 16 10 7 4 45
a) X = b) f M M o
' o
=
ci ⋅ f i
12,5 17,5 25 32 37
f i '
ai
100 280 250 224 148 1002
5 5 10 4 6
1,6 3,2 1 1,75 0,67
∑ c ⋅ f = 1002 = 22,27% i
i
45
N
= 3, 2 ⇒
LM o
M o ∈ [15 − 20[
+ aM ⋅ o
f M o ' − f M o 1 ' −
( f
M o
'
−
f Mo 1 −
'
)+( f
' Mo
−
f M o 1 +
'
)
= 15 + 5 ⋅
3, 2 − 1, 6 ( 3, 2 − 1, 6 ) + ( 3, 2 − 1)
= 17,1%
Primjer 8:
Poznati su podaci o starosti korisnika mobilne telefonije: starost pretplatnika 10-20 20-30 30-40 40-50 50-60 60-70 70-80
broj pretplatnika 6 19 35 44 47 29 20
a) Nacrtati histogram i kumulativnu krivu. 10
b) Izračunati i objasniti prosječnu starost pretplatnika. c) Odrediti gornju granicu starosti za 50% mlađih pretplatnika. d) Odrediti koja je starost najzastupljenija u ovoj seriji. Rješenje: xi
f i
10-20 20-30 30-40 40-50 50-60 60-70 70-80
F ր i
p i
6 19 35 44 47 29 20 200
0,03 0,095 0,175 0,22 0,235 0,145 0,1
ci
0,03 0,125 0,3 0,52 0,755 0,9 1
ci ⋅ f i
15 25 35 45 55 65 75
90 475 1225 1980 2585 1885 1500 9740
a) histogram
50 a k i n t a l p t e r p j o r b
40 30 20 10 0 10.0-
20-30
30-40
40-50
50-60
60-70
70-80
20.0 starost
kumulativna kriva
e n v i t a e l j e r i c e n n e v v i t k a e r l u f m u k
80 70 60 50 40 30 20 10 0 0
0.5
1
1.5
razredne sredine
b) X =
∑ c ⋅ f = 9740 = 48,7 - prosječna starost i
i
200
N
c) 0,52 > 0, 5 ⇒ M e ∈ [ 40 − 50[ M e
=
LM e
+ a M ⋅ e
0,5 − F ր M −1 e
p M e
= 40 +10 ⋅
0, 5 − 0, 3 0,22
= 49, 09
11
d) f M M o
o
=
=
47 ⇒ M o ∈ [50 − 60[
LM o
+ aM ⋅ o
f M o
(
f M o
−
f Mo 1 −
−
f M o 1
) ( +
−
f Mo
−
f M o 1 +
)
= 50 + 10 ⋅
47 − 44 ( 47 − 44 ) + ( 47 − 29)
= 51, 43
12