ITEP VISOKA ŠKOLA ZA INFORMACIONE TEHNOLOGIJE, EKONOMIJU EKONOMIJU I PREDUZETNIŠTVO
TEMA 1: OSNOVI DESKRIPTIVNE STATISTIKE
aša Mičić Prof. dr S aša sa sasa.m .mii ci c@sat @satwor k.n k. net mar t 2017 2017.. go g odi ne
DEFINISANJE STATISTIKE • Riječ statistika potiče o latinske riječi statisticus • Sumerci iz Mesopotamije riječ statistika koristili 5000
goina prije Hrista, vezano za poatke, način prikupljanja i objašnjenja u vezi sa prikupljanjem, obradom i evidencijom raznih taksi i poreza. • Prvi pristup statistici – nauka koja se bavi prikupljanjem, klasifikacijom i interpretacijom interpretacijom
numeričkih informacija. Povezana Povezana sa teorijom vjerovatnode rai kvalitetne ocjene parametara cjeline ispitivane pojave, onosno populacije slučajne promjenjive. • Drugi pristup –svaki podatak, skup informacija, svaka
slučajna promjenjiva se naziva Statistika.
UPOTREBA STATISTIKE • Korišdenje pojma statistike pojavilo se mnogo ranije
o pojma vjerovatnode. vjerovatnode. • Predmet Statistike je prikupljanje, organizacija i
prestavljanje informacija i poataka pomodu tabela i grafikona.
• Pojavom pojma vjerovatnode u 17.vijeku povezanog
sa igrama na sredu kroz raove matematičara Fermata i Paskala korišdenje Statistike obija na značaju. • Kome treba statistika? • Svima: inžinjerima, menažerima, matematičarima, ekolozima, ekolozima, biolozima, psiholozima, pravnicima, pravnicima,
političarima, proizvođačima...
DEFINICIJA • U statistici posmatra se konačan ili beskonačan skup elemenata, koji se zove statistički skup, statistička masa ili populacija i obilježava sa
1 , 2 , (omega) Primjer:
Populacija je:
skup svih građana neke ržave, skup svih stuenata naše škole, skup svih mjerenja neke veličine i sl.
OBILJEŽJE može posmatrati posmatrati sa stanovišta stanovišta jene ili • Svaka populacija se može više osobina, koje nazivamo obilježje.
• Za posmatranu populaciju neka obilježja su važna, ruga nisu. Naprimjer, ako posmatramo studente jednog fakulteta, • bitna obilježja su: njihov broj, prolaznost na ispitima, srednje ocjene,
užina stuiranja i slično, • nebitna obilježja su: njihova visina,
težina i slično.
OBILJEŽJE • Obilježja mogu biti : numerička, koja se izražavaju brojem i atributivna, koja se izražavaju opisno.
• Numerička obilježja su naprimjer:
ako u populaciju stuenata posmatramo, visinu i težinu, a atributivna su pol i boja očiju. • Da bi se i na atributivna obilježja mogli primjeniti
matematički matematički metoi, neophono je se oni preveu na
jezik matematike matematike.
• Za matematiku matematiku su o interesa samo numerički poaci, poaci , odnosno oni koji se mogu izraziti brojem.
• Do statističkih poataka se olazi se
sistematski, po jasno utveđenom planu.
• U procesu proučavanja pojava statistika statistika se
služi oređenim metoama.
UZORAK Često ispitivanja obilježja cijele populacije mogu a buu: • složena, • neracionalna, a • poneka i nemoguda
jer populacija može može a ima beskonačno beskonačno mnogo elemenata ili konačno mnogo, mnogo, ali a je taj broj veliki. • Iz tih razloga efiniše se neki poskup uočene populacije i nazivamo ga uzorak.
• Definicija: • Bilo koji podskup U, populacije nazivamo uzorak .
PROST UZORAK • U vezi sa uzorcima postavlja se niz teorijskih i praktičnih pitanja u vezi formiranja formiranja uzorka. • Zaključci na osnovu uzorka nisu sasvim pouzani, ved manje ili
više vjerovatni. vjerovatni. Uzorak tako birati da se :
• obezbijei ovoljna pouzanost zaključka. • treba da bude reprezentativan. • obaciti sve subjektivne faktore, tako a uzorak bue što više objektivan. • To se postiže slučalnim izborom, što znači a takvim izborom
svaka svaka jeinica ima istu vjerovatnodu vjerovatnodu a bue izabrana kao element uzorka.
•
Ovakav uzorak zove se prost uzorak.
Proces obrade podataka • Obraa poataka poataka je proces koji u sebe uključuje: 1. Prikupljanje statističkih poataka – putem: popisa,
eviencija, statističkih izvještaja, reovnih i povremenih anketa. 2. Klasifikovanje na kvalitativne, atributivne podatke i
kvantitativne poatke, numeričke poatke. 3. Uređivanje znači sve kvantitativne poatke, poatke, u sklau sa ciljevima premeta istraživanja ureiti tako a za statističku statističku obrau buu što upotrebljiviji. 4. Grupisanje znači a ato statističko obilježje u istraživanju istraživanju treba posmatrati posmatrati i sa aspekta nijansi, klastiranjem s obzirom na kriterijum 5. Utvrđivanje i izbor ogovarajude frekvence, empirijskih podataka koji se ponavljaju.
Neuređeni i uređeni poaci 1. Neuređeni podaci – – ako imamo imamo numeričke numeričke empirijske empirijske
podatke, preuzete iz nekih od izvora podataka,
prestavljene prestavljene na način a numerički poaci nisu poređani o najmanje o najvede vrijenosti. (5,3,1,2,4,4,2) (5,3,1,2,4,4,2) - neuređena stat. stat. serija. se rija. 2. Uređeni podaci – – ukoliko ukoliko su numerički empirijski podaci, preuzete iz nekih od izvora podataka ili
naknano preuređeni, prestavljeni prestavljeni na način o najmanje o najvede vrijenosti u statističkoj statističkoj seriji. (2, statistička serija. 2, 3, 4, 4, 5) - uređena statistička
Sređivanje i grafičko prikazivanje kvalitativnih podataka Primjer : Studenti završne godine ITEP -a se izjašnjavali gdje bi željeli da se zaposle posle diplomiranja.
Kvalitativna promjenljiva
Kategorija ili modalitet
Tabela raspodjele frekvencija
V r s ta ta zapos lenj a
B ro r oj s tu tudenata
Privatne firme
44
Državni oragani vlasti
26
Sopstvena firma
20
Ne zna
10
frekvencija
N =100 =100
Negrupisani i grupisani podaci •
Negrupisani podaci – – kaa cilj istraživanja istraživanja oređene oređene pojave
nije utvrđivanje numeričkih nijansi ili numeričkih razlika u jedinicama mjere te te pojave – negrupisani numerički statistički statistički poaci.
•
Prihod u pet pogona jedne fabrike fabrike u hiljadama KM (40, 50, 5 0, 60, 70, 80) Grupisani podaci – – ako je cilj istraživanja istraživanja oređenog oređenog
statističkog obilježja i a se utvre numeričke razlike, u jeinicama mjere, statističk statističkog og obilježja, jer se oređene oređene jeinice mjere statističk statističkog og obilježja u statističk statističkoj oj seriji ponavljaju.
Prestavljaju Prestavljaju se: kao cijele numeričke vrijenosti (iskretno stat. obilježje ili prekina slučajna promjenjiva) i kao intervalne numeričke vrijenosti (kontinuirano (kontinuirano stat. obilježje ili neprekina slučajna promjenjiva)
Grafičko prikazivanje kvalitativnih grupisanih podataka
Grupisani kvalitativni podaci mogu grafički prikazati pomoću: • štapićastog dijagrama dijagrama • strukturnog kruga ( pite )
se
Štapidasti ijagram
Štapićasti dijagram je je grafikon grafikon u kome se na apscisi nalaze kategorije, a na ordinati frekvencije ili relativne frekvencije frekvencije
određenih kategorija. 50
45
40
35
a j i 30 c n e 25 v k e 20 r F 15
10
5
0
Privatne firme
Državni oragani Sopstvena firma vlasti
Vrsta zaposlenja
Ne zna
Strukturni krug (pita) Strukturni krug ili pita je je vrsta grafikona grafikona u vidu kruga
podeljenog na kružne isečke od kojih svaki predstavlja relativnu frekvenciju ili procentualno učešće svake kategorije u osnovnom skupu ili uzorku.
Državni
oragani vlasti, 26, 26%
β=0,26·360°=93,6°
Privatne firme, 44, 44%
α=158,4° Ne zna, 10, 10%
Sopstvena firma, 20, 20%
γ=0,20·360°=72° δ=0,10·360°=36° Krug ima 360 stepeni. Da bi smo prikazali prikazali učešće učešće ili relativnu frekvenvciju frekvenvciju kao kružne isečke, 360 množimo sa relativnom frekvencijom svake kategorije. kategori je. Npr. Npr. 0,44·360°=158,4°
3. Negrupisani i grupisani podaci •
Diskretni raspored – – istraživano istraživano statističk statističko o obilježje
grupisano na osnovu cijelih brojeva Primjer: planirani prihod po pogonima jedne fabrike u hiljadama KM predstavljen u tabeli:
•
Planirani prihod
40
50
60
70
80
Broj pogona
4
3
2
2
1
Kontinuirani raspored – – istraživano istraživano statističk statističko o obilježje
grupisano na bazi intervalnih numeričkih vrijenosti Primjer: planirani prihod po pogonima jedne fabrike u hiljadama KM predstavljen u tabeli: Planirani prihod
30-40
40-50
50-60
60-70
70-80
Broj pogona
4
3
2
2
1
4. Klase i granice klase •
Klase – su grupe statističkog statističkog obilježja, iste cijele cijele numeričke
vrijenosti, kaa je riječ o iskretnom statističkom statističkom obilježju, ili iste intervalne numeričke vrijenosti ako se rai o kontinuiranom statističkom obilježju. Primjer 4.1.: Ako je uviom u tromjesečnu evienciju o olasku na posao utvrđeno a su u rasponu o jean o pet dana bolovanja imali zaposleni kao u tabeli:
•
Broj dana bolovanja
1
2
3
4
5
Broj zaposleni
20
27
15
7
2
Kažemo a je ispitivano statističko statističko obilježje obilježje poijeljeno u pet grupa iste cijele numeričke numer ičke vrijenosti. Ove grupe zovemo klase iskretnog statističkog statističkog obilježja.
Sređivanje i grafičko prikazivanje (numeričkih) kvantitativnih podataka Primjer : Data je raspodjela raspodjela frekv frekvencija encija za starosnu starosnu strukturu strukturu svih svih 50 zaposlenih u jednoj firmi. Kvantitativna promjenljiva Drugi grupni interval Donja granica
četvrtog grupnog intervala
S tar tar os t
B r oj zapos lenih leni h
18 - 30
12
31 - 43
19
44 - 56
14
57 - 69
5 Gornja granica četvrtog grupnog intervala
Frekvencije Frekvencij drugog grupnog intervala
4. Klase i granice klase Primjer 4.2.: Neka je uviom u tromjesečnu evienciju o olasku na posao utvrđeno a je broj bolovanja, prema broju zaposlenih koji su koristili bolovanje, izgledao kao u tabeli:
•
Broj dana bolovanja
0-1
1-2
2-3
3-4
4-5
Broj zaposleni
20
27
15
7
2
Kažemo a je ispitivano statističko statističko obilježje obilježje poijeljeno u pet grupa iste intervalne numeričke vrijenosti. Ove grupe zovemo klase kontinuiranog statističkog obilježja.
4. Klase i granice klase •
Granice klase su imanentne klasama sa intervalnim
numeričkim vrijenostima obilježja. • To su vije numeričke vrijenosti obilježja, gje je onja vrijenost obilježja niža a gornja vrijenost obilježja viša vrijenost. Raspon između te vije tačke se zove užina (ili širina) intervala. granice klase na va načina: • Oređivanje granice 1. Prvi način gje postoji razlika između gornje granice prethonog i onje granice sljeedeg intervala: (10,2-10,4; 10,5-10,7; 10,8-11,0) 2.
Drugi način gje nema razlike razlike između gornje granice prethonog i onje granice sljeedeg intervala: (10,2-10,4; 10,4-10,6; 10,6-10,8)
4. Klase i granice klase •
Klasna sredina. Numerička sreina aritmetičke sreine
između onje i gornje granice intervala zove zove se sreina intervala statističkog obilježja (x m). Primjer: neka je premet statističkog statističkog istraživanja istraživanja priho izražen u hiljaama KM u nekoj fabrici: fabrici: P r i h od ( x )
10-15
15-20
20-25
25-30
i neka se zahtijeva a ovo statističko obilježje prestavimo pomodu klasnih sreina, obijamo: Prihod (xm)
12,5
17,5
22,5
27,5
Raspodjela frekvencija numeričkih podataka Raspodjela Raspodje la fre frekven kvencija cija numeričkih podataka je tabelarni prikaz dva niza podataka: vrijednosti promjenljive prikazane grupnim intervalima i njima odgovarajući brojevi jedinica posm osmatr atran anjja (fre (frekv kve encij ncije) e).. Ovako ako prik rikaz azan anii podac odacii su grupisani podaci . vrijednost Granična vr
grup upn nog intervala predstavlja aritmetičku sredinu gornje granice jednog grupnog intervala i donj onje gran anic ice e na nare red dnog nog gru rupn pnog og inte interv rval ala. a.
Širina grupnog intervala = gornja granična vrednost - donja granična vrednost Sredin Sre dina a gru grupnog pnog interva intervala la = = ( do donja nja gr gran anic ica a + + gor gornj nja a gr gran anic ica a)/2
5. Frekvencija podataka •
Apsolutna frekvencija. To je broj (f), koji pokazuje koliko
poataka se onosi na svaku pojeinačnu klasu ispitivanog obilježja (x) statističkog skupa. Ilustracije rai, ako je at statistički skup o (n) elemenata statističkog statističkog obilježja obilježja (x) kao u tabeli: x
x1
x2
x3
...
xn
f
f 1
f 2
f 3
...
fn
pri čemu su realni brojevi: x: (x 1, x2, x3,... xn) mogude realne vrijenosti elemenata skupa statističkog statističkog obilježja (x); a realni brojevi f: (f 1, 1, f 2, 2, f 3,... 3,... f n) su frekvencije (ili učestalosti) učestalosti) pojavljivanja vrijenosti statističkog obilježja (x) u naveenom skupu, taa kolekciju parova: [(x1,f 1), 1), (x2,f 2), 2), (x3,f 3) 3),...(xn,f n)] nazivamo raspodjelom
(ili rasporeom) apsolutne frekvencije (f) obilježja (x) posmatranog statističkog skupa.
5. Frekvencija podataka •
Zbir (suma) vrijednosti svih apsolutnih frekvencija klasa
ispitivanog obilježja (x) u atoj statističkoj statističkoj seriji (f1, f2, f2 , f3,... fn) označava označava se sa (n) ili ∑f; a matematički se izražava izražava kao: n=∑f=f 1+f 2+f 3,...+fk, gdje je f:(f 1, pojavljivanja klase statističkog statističkog obilježja 1, f 2, 2, f 3,... 3,... f k)=broj pojavljivanja x:(x1, x2, x3,... xk) u statističkoj seriji.
5. Frekvencija podataka Primjer 5.1.: Poaci o nevnoj proaji pakovane pakovane soli, izraženi u kilogramima, prema broju prodajnih centara komercijalnog sektora jednog rudnika soli, koji su prodavali samo po jednu vrestu pakovane pakovane soli, prikazani su u tabeli: Dnevna prodaja (x)
1
2
3
4
5
Broj prodajnih centara (f)
20
15
12
7
6
Zaatak: a) Oreiti sve pojeinačne apsolutne frekvencije za svaki element statističkog obilježja b) Pokaži a zbir apsolutnih frekvencija svih klasa obilježja iznosi 60 prodajnih centara.
Rješenje: a) (x1,f 1)=(1,20); (x2,f 2)=(2,15); (x3,f 3)=(3,12); (x4,f 4)=(4,7); (x5,f 5)=(5,6);
b) n=∑f=f 1+f 2+f 3+f 4+f 5=20+15+12+7+6=60
5. Frekvencija podataka •
Relativna frekvencija. Numerička vrijenost iskazana kao
kao količnik količnik pojeinačnih apsolutnih vrijenosti frekvencija i ukupne sume frekvencija, naziva se relativna frekvencija
istraživanog statističkog obilježja. Označava se malim latiničnim slovom (p) i matematički prestavlja prestavlja kao: p=f/∑f gdje je: p=relativna frekvencija, f=f 1, 1, f 2, 2, f 3,... 3,... f k=pojeinačna apsolutna frekvencija
∑f=n=f 1+f 2+f 3...+fk=suma svih apsolutnih frekvencija, suma svih jeinica mjere istraživanog istraživanog stat. obilježja ∑p=p1+p2+p3...+pk=1
5. Frekvencija podataka •
Primjer: Neka imamo iskontinuirano iskontinuirano statističko statističko obilježje kao na primjeru i ako treba izračunati relativne relativne frekvencije ona saglasno poacima učinidemo kao u tabeli: Prodaja soli (x)
Br. prodajni centara (f)
Relativne frekvenci frekvencije je p=f/∑f
1
20
0,33
2
15
0,25
3
12
0,20
4
7
0,12
5
6
0,10
Suma (∑)
60
≈1,00
Raspodjela frekvencija frekvencija (30 + 31) 31)/2 /2 = 30 30,5 ,5 Granična vrijednost 1. intervala = (30
Širina 1. intervala = 30,5 – 17 17,5 ,5 = 13 Sredin Sre dina a 1. inte interv rvala ala = = (18 (18 + 30 30)/ )/2 2 = 24 Donja gornja granica
Frekvencija intervala
Granična vrednost intervala
Širina
intervala
Sredina grupnog intervala
18 - 30
12
17,5 – 30,5
13
24
31 - 43
19
30,5 – 43,5
13
37
44 - 56
14
43,5 - 56,5
13
50
57 - 69
5
56,5 – 69,5
13
63
Raspodela relativnih frekvencija i procentualna raspodela Na osnovu tabele raspojele frekvencija možemo izračunati raspodjelu relativnih frekvecija i procentualnu raspodelu. Frekvencija grupnog intervala Relativna frekvenc frekvencija ija = grupnog intervala Zbir svih frekvencija
Procentualno učešće = Relativna frekvencija X 100
5. Frekvencija podataka •
Kumulativna frekvencija. Ako apsolutne ili relativne frekvencije sukcesivno sumiramo po klasama – tada dobijamo novi pokazatelj frekvencije koji zovemo kumulativna frekvencija (apsolutna ili relativna).
•
Postoje vije vrste kumulativa: 1) kumulativ “oozo” i 2) kumulativ “oozgo”. Označava se sa (C), a u ineksu za apsolutnu frekvenciju (Cf ) ili oznaka za relativnu ferkvenciju (Cp)
•
Kumulativ “oozo” pokazuje koliko jeinica statističkog skupa podijeljenog na klase ima vrijednost (x) manju (ili jednaku) od nekog nekog unaprijed datog broja broja (x).
•
Kumulativ “oozgo” pokazuje koliko jeinica statističkog skupa poijeljenog na klase ima vrijenost (x) vedu (ili jednaku) od nekog nekog unaprijed datog broja broja (x).
Raspodela kumulativnih frekvencija frekvencija ”manje od” ili “odozdo” Donja gornja granica
Frekve ncija
Granična vrijednost intervala
18 - 30
12
17,5 – 30,5
12
12/50=0,24
31 - 43
19
30,5 – 43,5
12+19=31
31/50=0,62
44 - 56
14
43,5 - 56,5
12+19+14=45
45/50=0,90
57 - 69
5
56,5 – 69,5
12+19+14+5=50
50/50=1,00
Kumulativna frekvencija
Kumulativna relativna frekvencija
Kumulanta Kumulanta je kriva koja pokazuje raspodjelu kumulativnih frekvencija i dobija se kada spoje tačke koje odgovaraju gornjim (donjim) granicama grupnih intervala i kumulativnim frekvencijama odgovarajućih grupnih intervala.
Moguće je nacrtati i kumulantu za raspodelu kumulativnih relativnih frekvencija i za kumulativnu procen procentua tualnu lnu ra raspo spodel delu. u.
Kumulanta Kumulanta Kumulanta za z a raspodelu kumulativnih kumulativnih frekvencija a 60 j i c n 50 e v k 40 e r f a 30 n v i t a 20 l u m10 u K 0 17,5
3 0, 5
43 , 5
56,5
Starost radnika u godinama
69,5
Granična vrijednos intervala
Kumulanta za kumulativnu procentnu raspodelu 120 100
a a n j 80 v i i c t n a e 60 l u v k m e u f r 40 K 20 0 17,5
30,5
43,5
56,5
Starost radnika u godinama
69,5
5. Frekvencija podataka •
Primjer: Neka sa za zaato kontinuirano kontinuirano obilježje o obiti jenog preuzeda preuzeda izraženo izraženo u hiljaama KM, prema broju broju pogona traži: a) kumulativ “oozo” “oozo” za broj pogona i apsolutne frekvencije broja pogona; b) kumulativ “oozgo” “oozgo” za broj pogona i relativne frekvencije broja pogona
Dobit (x)
Broj pogona (f)
Relativne ferkv fe rkvenc encije ije (p)
Kumul. apsol. frekvencije
Kumul. relat. frekvencije
“odozdo” Cf
“odozdo” Cp
10-20
20
0,20
20
0,20
20-30
10
0,10
30
0,30
30-40
40
0,40
70
0,70
40-50
30
0,30
100
1,00
Suma (∑)
100
1,00
5. Frekvencija podataka •
Primjer: Neka sa za zaato kontinuirano kontinuirano obilježje o obiti jenog preuzeda preuzeda izraženo izraženo u hiljaama KM, prema broju broju pogona traži: a) kumulativ “oozgo” “oozgo” za broj pogona i apsolutne frekvencije broja pogona; b) kumulativ “oozgo” “oozgo” za broj pogona i relativne frekvencije broja pogona
Dobit (x)
Broj pogona (f)
Relativne ferkv fe rkvenc encije ije (p)
Kumul. apsol. frekvencije
Kumul. relat. frekvencije
“odozgo” Cf
“odozgo” Cp
10-20
20
0,20
100
1,00
20-30
10
0,10
80
0,80
30-40
40
0,40
70
0,70
40-50
30
0,30
30
0,30
Suma (∑)
100
1,00
6. Grafičke metoe prezentovanja distribucije frekvencija •
•
Grafikon se konstruiše u vije imenzije koorinatnog sistema, tako tako što se na apscisnoj osi nanosi vrijenost klasa statističkog statističkog obilježja, obilježja, a na orinatnoj osi se nanose ogovarajude ogovarajude frekvencije. Načini grafičkog grafičkog prikazivanja istribucija frekvencija u koordinatnom koordinatnom sistemu: a) histogram histogram i b) poligon
•
apsolutnih ili Histogram je grafički prikaz raspojele apsolutnih relativnih frekvencija za kontinuirano statističko obilježje na način a konstruišemo konstruišemo pravougaonike pravougaonike sa visinama jenakim frkvencijama.
Grafičko prikazivanje grupisanih podataka Histogram se koristi za grafičko prikaziva ivanje raspodjele frekvencija, raspodjele relativnih frekvencija i procentualne raspodjele. Histogram je dijagram koji se sastoji od niza spojenih pravougaonika čije su osnovice grupni intervali naneti na x-osu, a visine su frekvencije grupnog intervala (ili relativne frek fr ekve venc ncij ije e ili pr proc ocen entu tual alna na učešća) nanete na y-osu.
HISTOGRAM
Grafičko prikazivanje grupisanih podataka Histogram frekven fr ekvencij cija a 20
a j i 15 c n e 10 v k e r 5 F 0 18 - 30
31-43 1
44-56
Starosni intervali
57-69
Grafičko prikazivanje grupisanih podataka Histogram relativnih frekvencija 0.4 e j i 0.35 c n 0.3 e v k 0.25 e r f 0.2 e n 0.15 v i t 0.1 a l e R0.05
0 18-30
1
31-43 44-56 Starosni intervali
57-69
HISTOGRAM
Grafičko prikazivanje grupisanih podataka Histogram Histogram učešća 40% 35% 30% e 25% ć š e 20% č U15%
10% 5% 0%
18-30
1
31-43 44-56 Starosni intervali
57-69
Oblici histograma
Histogram može biti: 1.
Simetričan
2. Asimetričan 3.
Uniformni ili pravougaoni.
Oblici histograma Simetričan histogram 35
30
25
a j i c20 n e v k15 e r F 10
5
0 1
Promenljiva
Oblici histograma Simetričan histogram 9 8 7 a j i 6 c n 5 e v k 4 e r F 3 2 1 0
1
Promenljiva
Oblici histograma Histogram Histogram asimetričan ulevo 35 30 a25 j i c n20 e v k15 e r F10
5 0 1
Promenljiva
Oblici histograma Histogram Histogram asimetričan udesno 12 10 a j i 8 c n e 6 v k e r 4 F
2 0
1
Promenljiva
Oblici histograma Uniformni (pravougaoni) histogram 12 10 a j i 8 c n e 6 v k e r F 4
2 0
1
Promenljiva
Deskriptivna statistika grafičke metode - his histo togr gram am
Definicija: Frekvencija je broj Frekvencija f f i neke određene vrijednosti xi obeležja X je pojavljivanja te vrijednosti u posmatranom skupu podataka.
Neuređeni statistički skup 11 16
9 10
15 17 10 20 10 16 11 14 11 17 11 12 17 12 10 16 15 12 13 16
14 17 14 15 14
4
7 14
15 17 15 10 15 18 15 16 15
9 13 16
11 18 11
6
raspodjela frekvencija
xi
f i
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 0 1 1 0 2 5 6 3 2 5 8 6 5 2 0 1
Deskriptivna statistika grafičke metode met ode - hist histogr ogram am
Definicija: Relativna Relativna frekvencija f ri neke vrednosti xi obeležja X je je frekvencija frekvencija f i podeljena sa ukupnim brojem podataka N . xi
f i
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 0 1 1 0 2 5 6 3 2 5 8 6 5 2 0 1
N
f i svi i
N = 48
f ri
f i N
x i
f ri
f ri (%)
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.021 0 0.021 0.021 0 0.042 0.104 0.125 0.063 0.042 0.104 0.167 0.125 0.104 0.042 0 0.021
2.1 0 2.1 2.1 0 4.2 10.4 12.5 6.3 4.2 10.4 16.7 12.5 10.4 4.2 0 2.1
Empirijska raspodjela histogram
Crtanje histograma (za diskretnu raspodjelu): 1. odrediti frekvencije ili relativne frekvencije 2.
na apscisi označiti moguće vrijednosti obilježja X
3.
nacrtati pravougaonik visine f i ili f ri koja je data na ordinati
9 8 7 6 5 f i 4 3 2 1
6. Grafičke metoe prezentovanja distribucije frekvencija •
Poligon je takva grafička grafička slika slika istribucije istribucije frekvencija gje gje na
horizontalnu horizontalnu apcisnu osu nanosimo aritmetičku sreinu donje i gornje granice intervalnih grupa kontinuiranog
statističkog statističkog obilježja, obilježja, a na vartikalnu osu frekvencije, tačke tačke spajamo užima u izlomljenu liniju.
POLIGON
Grafičko prikazivanje grupisanih podataka Poligon je dijagram koji se dobija spajanjem tačaka čije su Poligon je koordinate sredine grupnih intervala na x-osi i frekvencije inte interv rval ala a na y-osi. Kada je reč o dugačkoj seriji podataka i sa povećanjem broja grupnih intervala, a smanjenjem njihove širine poligon frek fr ekve venc ncij ija a post postaj aje e glat glatka ka kriv kriva. a. Ova kriva se naziva kriva raspodele frekvencija . Poligon u kojem se na y-osi nala lazze rela lattivne frekvencije naziva se poligon relativnih frekvencija , a poligon sa učešćima če šća š ća . prik pr ikaz azan anim im na y-osi naziva se poligon u č e
POLIGON
Grafičko prikazivanje grupisanih podataka Poligon frekvencija 20 18 16 a j i14 c 12 n e 10 v k 8 e r F6 4 2 0
0
1 8 - 30
3 1 - 43
44 - 56
Starosni intervali
57 - 69
71-
Primjer •
Neka je zaata slučajna neprekina promjenjiva kao što slijedi:
1.
X
f
2-4
3
4-6
2
6-8
1
8-10
5
Suma (∑)
11
Odr Odredit editii relat elativ ivnu nu frek frekv venci enciju ju p
Oreiti kumulativnu frekvenciju “oozo” Cf 3. Oreiti kumulativnu frekvenciju “oozgo” C f 4. Načiniti histogram histogram 5. Načiniti poligon 2.
Rješenje Srednja vrijednost intervala (xn)
(f)
Relativne ferkvencije
Kumul. apsol. frekvencije
Kumul. apsol. frekvencije
(p=f/∑f)
“odozdo” Cf
“odozgo” Cp
3
3
3/11
3
11
5
2
2/11
5
8
7
1
1/11
6
6
9
5
5/11
11
5
Suma (∑)
11
1,00