Naziv djela: Statistika u ekonomiji i menadžmentu Drugo izdanje Autor: Prof. dr Rabija Somun-Kapetanović Izdavač: Ekonomski fakultet u Sarajevu Glavni i odgovorni urednik: Dekan, prof. dr Muris Čičić Recenzenti: Prof. dr Divna Janković Prof. dr Želimir Vučković Urednik: Prof. dr Hasan Muratović Lektor: Dr Aiša Softić DTP: Engin Mešanović Štampa: VMG Grafika, Mostar Tiraž: 300 Godina izdanja: 2008. ---------------------------------------------------------------------------CIP – Katalogizacija u publikaciji Nacionalna i univerzitetska biblioteka Bosne i Hercegovine, Sarajevo 330. 45: 512. 2] (075. 8) SOMUN-Kapetanović, Rabija Statistika u ekonomiji i menadžmentu / Rabija Somun-Kapetanović. – 2. izd. – Sarajevo : Ekonomski fakultet, 2008. – 424 str. : graf. prikazi ; 24 cm Bibliografija: str. 423-424 ISBN 978-9958-25-008-8 I. Kapetanović, Rabija Somun – vidi Somun-Kapetanović, Rabija COBISS.BH-ID 16445958 ------------------------------------------------------------------------
Dr Rabija Somun-Kapetanović
STATISTIKA U EKONOMIJI I MENADŽMENTU DRUGO IZDANJE
Sarajevo, 2008. godine
PREDGOVOR PRVOM IZDANJU Postoji više pristupa prezentaciji statističke metodologije. Dva ekstremna slučaja su prezentacije kompletno matematizirane i apstraktne i prezentacije potpuno deskriptivne, bez provjere i izvođenja dokaza. Pristup koji smo mi primijenili u prezentaciji nalazi se između ova dva ekstremna slučaja i ima dva osnovna cilja. To su prezentacija i aplikacija analiziranih metoda i razumijevanje i interpretacija dobijenih rezultata. Ova knjiga je namijenjena prvenstveno studentima ekonomije, menadžmenta i ostalih društvenih nauka. Iako su bazni koncepti statistike univerzalni, naš pristup je baziran na analizi, prezentaciji i aplikaciji osnovnih koncepata u domenu ekonomije i menadžmenta. Osnovne definicije, osobine i rezultati su izvedeni i dokazani u mjeri u kojoj smo to smatrali korisnim za razumijevanje i aplikaciju prezentirane problematike. Sadržaj ovog izdanja knjige je rezultat dugogodišnjeg autorovog iskustva u nastavi iz oblasti Kvantitativne ekonomije i predmeta: Matematičke metode u ekonomiji, Međusektorska analiza, Operaciona istraživanja, Statistika, Eksperimentalna statistika, Statistika u ekonomiji i menadžmentu, Poslovna statistika, Kvantitativne metode i Demografija na Ekonomskom fakultetu u Sarajevu, Fakultetu ekonomskih nauka i upravljanja Univeziteta Louis Pasteur u Strasbourg-u (Faculté des sciences économiques et de gestion de l’Université Louis Pasteur de Strasbourg) i Instituta za demografiju Univerziteta Marc Bloch u Strasbourg-u (Institut de démographie de l’Université Marc Bloch de Strasbourg). Ova knjiga je koncipirana prema nastavnom programu predmeta Statistika u ekonomiji i menadžmentu koji se izučava na prvoj godini Ekonomskog fakulteta u Sarajevu. Sastavljena je iz šest poglavlja sa sljedećim naslovima: Statistika i statistička istraživanja, Analiza i sinteza podataka, Regresiona i korelaciona analiza, Dinamička analiza i mjerenje evolucije, Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće te Teorija i metode uzoraka i statističko zaključivanje. U svakom poglavlju su definisani, analizirani i formalizirani osnovni pojmovi i kategorije koji su zatim aplicirani na konkretnim primjerima. Aplikacija analiziranih metoda je vršena na statističkim podacima objavljenim u publikacijama Federalnog zavoda za statistiku Bosne i Hercegovine, Agencije za statistiku Bosne i Hercegovine i Nacionalnog instituta za statistiku i ekonomske studije (INSEE) Francuske. Na kraju svakog poglavlja su prezentovani lista
5
teorijskih pitanja, riješeni zadaci i zadaci sa elementima rješenja. U prilogu su date tablice teorijskih distribucija vjerovatnoće. Posebnu zahvalnost izražavam recenzentima prof. dr Divni Janković i prof. dr Želimiru Vučkoviću čije su primjedbe i prijedlozi doprinijeli poboljšanju teksta. Autor je odgovoran za eventualne greške i propuste. Zahvaljujem i mojim saradnicama posebno mr Emini Resić, koja je pažljivo pročitala tekst, pripremila tablice u prilogu, i u svim fazama izrade ovog udžbenika mi pružila veliku pomoć, kao i Adeli Delalić i Almiri ArnautBerilo. Svim ostalim koji su doprinijeli da ova knjiga bude napisana i objavljena iskreno zahvaljujem. Knjigu posvećujem mojoj majci za 99. rođendan i za njenu beskrajnu ljubav, plemenitost i dobrotu. Nadam se da će ova knjiga zadovoljiti potrebe studenata i svih onih koji koriste statističke metode u svom radu. Unaprijed zahvaljujem za sve primjedbe, sugestije i konstruktivne kritike koje bi mogle poboljšati prezentovani tekst. Sarajevo, aprila 2006.g. Prof. dr Rabija Somun-Kapetanović
PREDGOVOR DRUGOM IZDANJU Zadovoljstvo mi je prezentovati drugo izdanje knjige „Statistika u ekonomiji i menadžmentu“. U ovom izdanju su izvršene određene izmjene, dopune i korekcije teksta prvog izdanja. Zahvaljujem mojim saradnicima mr Emini Resić, Adeli Delalić i Ademiru Abdiću koji su svojim sugestijama doprinijeli poboljšanju teksta za drugo izdanje ove knjige. Sarajevo, marta 2008. godine Prof. dr Rabija Somun-Kapetanović
6
SADRŽAJ POGLAVLJE 1. STATISTIKA I STATISTIČKA ISTRAŽIVANJA
15
1.1.
15
POJAM STATISTIKE
1.2. NAUČNI PRISTUP STATISTIČKOM ISTRAŽIVANJU 1.2.1. Prikupljanje podataka 1.2.1.1. Metode prikupljanja podataka 1.2.2. Obrada podataka
17 17 17 19
1.3. STATISTIČKI SKUP I STATISTIČKE VARIJABLE 1.3.1. Statistički skup i njegove karakteristike 1.3.2. Pojam, proces mjerenja i karakteristike statističke varijable 1.3.2.1. Nominalna skala 1.3.2.2. Ordinalna skala 1.3.2.3. Intervalna skala 1.3.2.4. Metrička skala 1.3.3. Primjer projekta istraživanja 1.3.4. Statistički pojmovi i definicije 1.3.5. Prezentacija statističkih podataka 1.3.5.1. Tabelarna prezentacija 1.3.5.2. Grafička prezentacija
19 19 20 21 21 22 22 22 23 25 28 31
POGLAVLJE 2. ANALIZA I SINTEZA PODATAKA
39
2.1. FREKVENCIJE I KUMULATIVNE FREKVENCIJE 2.1.1. Definicije 2.1.2. Formalizacija definicija
39 39 40
2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI 2.2.1. Kvalitativne varijable 2.2.1.1. Kvalitativna nominalna varijabla 2.2.1.2. Kvalitativna ordinalna varijabla 2.2.2. Kvantitativne varijable 2.2.2.1. Kvantitativna prekidna varijabla 2.2.2.2. Kvantitativna neprekidna varijabla
44 44 44 45 45 45 45
2.3.
45
GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE
7
2.4. 2.4.1.
2.4.2. 2.4.3. 2.4.4. 2.4.5. 2.4.6.
2.4.7.
MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE Aritmetička sredina 2.4.1.1. Jednostavna aritmetička sredina 2.4.1.2. Ponderisana aritmetička sredina 2.4.1.3. Osobine aritmetičke sredine Geometrijska sredina Harmonijska sredina Kvadratna i kubna sredina Mod ili centar aktivnosti Medijana ili centar pozicije 2.4.6.1. Određivanje medijane u uređenoj seriji 2.4.6.2. Određivanje medijane za statističku distribuciju frekvencija 2.4.6.3. Medijana i kumulativna frekvencija 2.4.6.4. Karakteristike medijane Kvantili 2.4.7.1. Određivanje kvantila u uređenoj seriji 2.4.7.2. Određivanje kvantila u intervalno grupisanoj seriji 2.4.7.3. Kvartili 2.4.7.4. Decili 2.4.6.5. Centili
47 48 48 49 50 53 54 55 56 58 58 59 60 62 62 62 63 63 65 65
2.5. MJERE DISPERZIJE ILI VARIJACIJE 2.5.1. Apsolutne mjere disperzije 2.5.1.1. Raspon varijacije 2.5.1.2. Interkvantilno apsolutno odstupanje 2.5.1.3. Box Plot 2.5.1.4. Srednje apsolutno odstupanje 2.5.1.5. Varijansa 2.5.1.6. Standardna devijacija 2.5.2. Relativne mjere disperzije 2.5.2.1. Interkvantilna relativna odstupanja 2.5.2.2. Koeficijent kvartilne devijacije 2.5.2.3. Koeficijent varijacije 2.5.2.4. Standardizovane varijable 2.5.3. Čebiševa teorema 2.5.4. Primjer grafičke sinteze parametara pozicije i disperzije 2.5.5. Pregled mjera srednje vrijednosti i varijacije
66 67 67 67 67 69 71 74 75 75 76 76 76 77 78 79
2.6. 2.6.1. 2.6.2. 2.6.3.
80 80 81 84
8
MJERE OBLIKA DISTRIBUCIJE Momenti distribucije frekvencija Mjere asimetrije Parametri spljoštenosti
2.7. MJERE KONCENTRACIJE 2.7.1. Lorenzova kriva 2.7.2. Ginijev koeficijent 2.7.2.1. Određivanje Ginijevog koeficijenta metodom trapeza 2.7.2.2. Određivanje Ginijevog koeficijenta metodom trouglova 2.7.3. Medijala
87 87 91 92 93 95
2.8. 2.9.
96 98
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
POGLAVLJE 3. REGRESIONA I KORELACIONA ANALIZA
111
3.1. MODELIZACIJA VEZA IZMEĐU VARIJABLI 3.1.1. Etape konstrukcije modela 3.1.1.1. Dijagram (oblak) rasipanja
111 112 112
3.2.
KOVARIJANSA
113
3.3. 3.3.1. 3.3.2. 3.3.3.
REGRESIONA ANALIZA Kriterij izbora regresione prave i metod najmanjih kvadrata Pretpostavke o osobinama stohastičnosti modela Aplikacija analiziranih metoda
116 117 120 121
3.4.
MJERENJE REPREZENTATIVNOSTI REGRESIONOG MODELA Koeficijent determinacije Koeficijent korelacije Standardna greška regresionog modela Koeficijent varijacije regresionog modela Aplikacija različitih oblika regresionog modela 3.4.5.1. Linearni model 3.4.5.2. Eksponencijalni model 3.4.5.3. Stepeni model 3.4.5.4. Logaritamski model Spearmanov koeficijent korelacije ranga
126 126 128 129 130 130 131 134 135 135 140
3.4.1. 3.4.2. 3.4.3. 3.4.4. 3.4.5.
3.4.6.
3.5. MODEL VIŠESTRUKE REGRESIJE 3.5.1. Koeficijent multiple determinacije, multiple linearne korelacije, koeficijenti parcijalne korelacije i korelaciona matrica 3.5.2. Analiza numeričkog primjera
141 142
3.6. 3.7.
145 146
TEORIJSKA PITANJA RIJEŠENI ZADACI
140
9
POGLAVLJE 4. DINAMIČKA ANALIZA I MJERENJE EVOLUCIJE
153
4.1.
153
APSOLUTNA I RELATIVNA PROMJENA
4.2. INDEKSI 4.2.1. Individualni indeksi 4.2.1.1. Indeksi sa stalnom bazom (bazni indeksi) 2.1.2. Indeksi sa promjenljivom bazom (lančani, verižni indeksi) 4.2.2. Osobine indeksa 4.2.3. Relacije između baznih i lančanih indeksa 4.2.3.1. Pretvaranje lančanih indeksa u bazne 4.2.3.2. Pretvaranje baznih u lančane indekse 4.2.3.3. Pretvaranje indeksa na stalnoj bazi u indekse na drugu stalnu bazu 4.2.4. Agregatni indeksi 4.2.4.1. Konstrukcija agregatnih indeksa Laspeyres i Paasche metodom agregiranja 4.2.4.2. Konstrukcija indeksa Laspeyres i Paasche pomoću ponderisanih sredina 4.2.4.3. Formule za računanje i osobine agregatnih indeksa 4.2.4.4. Fischerov indeks cijena 4.2.4.5. Agregatni indeks vrijednosti i njegova dekompozicija 4.2.4.6. Inflacija i deflator
160 161 162
4.3. VREMENSKE (HRONOLOŠKE) SERIJE 4.3.1. Konstitutivni elementi vremenske serije 4.3.2. Metod pokretnih sredina za određivanje trenda 4.3.2.1. Određivanje tendencije metodom pokretnih sredina neparnog reda 4.3.2.2. Određivanje tendencije metodom pokretnih sredina parnog reda 4.3.3. Aditivni model 4.3.4. Multiplikativni model 4.3.5. Metod najmanjih kvadrata za određivanje dugoročne tendencije (trenda) 4.3.5.1. Linearni trend 4.3.5.2. Parabolični trend 4.3.5.3. Eksponencijalni trend
193 194 195
4.4. 4.5.
209 210
10
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
164 171 181 181 182 182 183 185 187 188 191 191 192
196 198 202 202 203 204 207 208
POGLAVLJE 5. OSNOVI VJEROVATNOĆE I TEORIJSKE DISTRIBUCIJE VJEROVATNOĆE 5.1. Uloga i značaj eksperimenta u statistici 5.1.1. Slučajni eksperiment, skup mogućih rezultata eksperimenta i događaji 5.1.1.1. Vrste događaja 5.1.1.2. Osobine skupova 5.2. 5.2.1. 5.2.2. 5.2.3.
5.2.4.
5.2.5. 5.2.6. 5.2.7.
5.2.8.
DEFINISANJE VJEROVATNOĆE Eksperimentalni pristup definisanju vjerovatnoće Teorijska definicija vjerovatnoće Teoreme vjerovatnoće 5.2.3.1. Teorema aditivnosti 5.2.3.2. Teorema multiplikativnosti 5.2.3.3. Uslovna vjerovatnoća i nezavisnost slučajnih događaja 5.2.3.4. Bayesova teorema Kombinatorika 5.2.4.1. Permutacije 5.2.4.2. Kombinacije 5.2.4.3. Varijacije Slučajna ili stohastička varijabla 5.2.5.1. Prekidna slučajna varijabla 5.2.5.2. Neprekidna slučajna varijabla Čebiševa teorema Prekidne distribucije (zakoni, rasporedi) vjerovatnoće 5.2.7.1. Uniformni zakon vjerovatnoće 5.2.7.2. Bernoullijeva distribucija vjerovatnoće 5.2.7.3. Binomna distribucija vjerovatnoće 5.2.7.4. Poissonova distribucija vjerovatnoće 5.2.7.5. Hipergeometrijska distribucija vjerovatnoće 5.2.7.6. Tabelarni pregled prekidnih distribucija Neprekidne distribucije vjerovatnoće 5.2.8.1. Neprekidna uniformna distribucija 5.2.8.2. Normalna distribucija vjerovatnoće ili Laplace-Gaussova distribucija 5.2.8.3. Aproksimacije distribucija vjerovatnoće 5.2.8.4. Hi-kvadrat χ 2 distribucija 5.2.8.5. Studentova t distribucija 5.2.8.6. Ficher-Snedecorova (F) distribucija 5.2.8.7. Tabelarni pregled neprekidnih distribucija vjerovatnoće 5.2.8.8. Centralna granična teorema
( )
229 229 230 232 235 235 236 237 239 239 240 240 241 244 244 244 245 245 246 250 252 253 253 255 257 261 266 266 267 267 269 279 283 285 288 290 290
11
5.3. 5.4.
5.2.8.9. Šematski prikaz prekidnih i neprekidnih distribucija vjerovatnoće
291
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
292 293
POGLAVLJE 6. TEORIJA I METODA UZORAKA I STATISTIČKO ZAKLJUČIVANJE
305
6.1. OSNOVE TEORIJE UZORAKA 6.2. VRSTE UZORKA I METODE ZA IZBOR UZORKA 6.2.1. Slučajni uzorci 6.2.1.1. Jednostavni slučajni uzorak 6.2.1.2. Sistematski uzorak 6.2.1.3. Uzorak sa nejednakom vjerovatnoćom izbora jedinica 6.2.1.4. Stratifikovani uzorak 6.2.1.5. Uzorak skupina 6.2.1.6. Višestepeni uzorak 6.2.1.7. Višefazni uzorci 6.2.1.8. Panel uzorak 6.2.1.9. Namjerni uzorci
306 311 311 312 315 316 317 317 318 319 320 320
6.3.
PROCJENE OBILJEŽJA OSNOVNOG SKUPA NA OSNOVU UZORKA
6.4. ODREĐIVANJE INTERVALA POVJERENJA 6.4.1. Intervalna procjena aritmetičke sredine osnovnog skupa 6.4.1.1. Intervalna procjena aritmetičke sredine osnovnog skupa čija je varijansa poznata 6.4.1.2. Procjena intervala aritmetičke sredine osnovnog skupa čija je varijansa nepoznata 6.4.1.3. Interval povjerenja za aritmetičku sredinu osnovnog skupa čija distribucija nije poznata 6.4.2. Procjena intervala povjerenja za proporciju 6.4.3. Intervalna procjena standardne devijacije i varijanse osnovnog skupa 6.4.3.1. Intervalna procjena standardne devijacije 6.4.3.2. Intervalna procjena varijanse osnovnog skupa pomoću hi-kvadrat distribucije na osnovu poznate varijanse malog uzorka 6.4.3.3. Interval povjerenja za varijansu velikog uzorka 6.4.4. Interval povjerenja totala osnovnog skupa 6.4.5. Interval povjerenja za medijanu
12
321 327 327 327 331 332 334 336 336 337 337 338 338
6.4.6. Ocjena intervala za parametre modela linearne regresije 6.4.7. Intervalna procjena koeficijenta korelacije
339 340
6.5. TESTIRANJE HIPOTEZA 6.5.1. Formulisanje hipoteza 6.5.1.1. Donošenje odluke i greške tipa I i II 6.5.1.2. Empirijski nivo značajnosti p-vrijednost 6.5.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa 6.5.2.1. Varijansa osnovnog skupa poznata 6.5.2.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n ≥30 6.5.2.3. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n<30 6.5.3. Test hipoteze za proporciju 6.5.3.1. Dvosmjerni test hipoteze za proporciju 6.5.3.3. Jednosmjerni test za proporciju na donju granicu 6.5.4. Testiranje hipoteze o varijansi osnovnog skupa 6.5.4.1. Dvosmjerni test 6.5.4.2. Test hipoteze za varijansu na gornju granicu 6.5.5. Testiranje hipoteze o značajnosti parametara u regresionom modelu 6.5.5.1. Pojedinačni test značajnosti parametra regresionog modela 6.5.5.2. Testiranje značajnosti svih varijabli u modelu 6.5.5.3. Testiranje hipoteze o razlici (jednakosti) airtmetičkih sredina dva osnovna skupa 6.5.5.4. Testiranje hipoteze o jednakosti aritmetičkih sredina više osnovnih skupova – Analiza varijanse 6.5.5.5. Testiranje hipoteze o jednakosti koeficijenta korelacije dva osnovna skupa
342 342 344 345 346 346 350 351 355 355 356 357 357 358 358 359 360 360 363 365
6.6.
NEPARAMETARSKI TESTOVI
366
6.7. 6.7.
TEORIJSKA PITANJA RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
366 368
PRILOG 1. - STATISTIČKE TABLICE PRILOG 2. - PRIJEVODI TERMINA IZ EXCELA
393 421
LITERATURA
423
13
POGLAVLJE 1
STATISTIKA I STATISTIČKA ISTRAŽIVANJA
1.1. POJAM STATISTIKE Naziv statistika potiče od novolatinskog termina ratio status i italijanskog ragione di stato što znači državni interes i izvedenice statista koja predstavlja osobu sposobnu za vođenje državnih poslova. Pojam statistika možemo definisati na više načina, zavisno od toga da li ga definišemo u užem ili širem smislu i da li se definicija odnosi na statistiku kao nauku ili na pojam koji predstavlja skup numeričkih podataka. Navodimo sljedeće definicije i značenja pojma statistika. 1. Statistika predstavlja grupu naučnih metoda koje omogućuju prikupljanje podataka o masovnim pojavama, njihovu prezentaciju, analizu, tumačenje i korištenje u razne svrhe, prvenstveno u svrhu informisanja i donošenja odluka. 2. Statistika je nauka koja proučava varijacije masovnih pojava i njihovih elemenata u vremenu i prostoru u cilju informisanja i donošenja odluka. 3. Statistika predstavlja skup uređenih numeričkih podataka o raznim prirodnim ili društvenim pojavama koje prikupljaju i objavljuju statističke, naučnoistraživačke i druge ustanove.
15
Statistika u ekonomiji i menadžmentu
Prve dvije definicije određuju pojam statistike kao nauke koja se bavi izučavanjem masovnih pojava (npr. proizvodnja, prodaja, rađanje itd.). Masovne pojave istražujemo na osnovu informacija o obilježjima elemenata koji ih sačinjavaju. Elemente koji posjeduju niz obilježja na osnovu kojih se istražuju varijacije masovne pojave nazivamo statističkim jedinicama. Skup statističkih jedinica (elemenata ili individua) nazivamo statistički skup ili populacija. Cilj statistike je, dakle, proučavanje varijacija obilježja elemenata statističkog skupa prvenstveno kvantitativnim metodama u cilju utvrđivanja zakonitosti koje vladaju među raznim pojavama. Statistiku kao naučnoistraživačku metodu možemo podijeliti na deskriptivnu i inferencijalnu (analitičku, induktivnu, matematičku) statistiku. U prvom dijelu ove knjige ćemo analizirati metode deskriptivne statistike koje predstavljaju bazu kvantitativnih metoda koje se primjenjuju u ekonomiji. Da bismo preciznije odredili pojam deskriptivne statistike navodimo nekoliko definicija. 1. Deskriptivna statistika je naučna metoda informisanja o masovnim pojavama koja, koristeći kvantifikaciju i formalizaciju, omogućava donošenje odluka. 2. Deskriptivna statistika je metoda kvantitativne deskripcije masovnih pojava. 3. Deskriptivna statistika predstavlja skup metoda koje omogućavaju opis, prezentaciju i rekapitulaciju podataka koji su najčešće vrlo brojni.1 Metode inferencijalne statistike se zasnivaju na teoriji vjerovatnoće. Polazeći od analize uzorka kao dijela osnovnog skupa, metodama inferencijalne statistike je moguće ocijeniti osobine osnovnog skupa uz odgovarajući nivo pouzdanosti.
1
16
B.Goldfarb; C.Pardoux: Introduction à la méthode statistique, Dunod, Paris, 1993., str.1.
Poglavlje 1. – Statistika i statistička istraživanja
1.2. NAUČNI PRISTUP STATISTIČKOM ISTRAŽIVANJU Naučno istraživanje ima za cilj da analizira i objasni realnost i da omogući i olakša razumijevanje univerzuma. U toj funkciji naučni pristup u stvaranju i konstrukciji znanja se bazira vrlo često, ali ne samo i ekskluzivno, na korištenju podataka o masovnim pojavama. Da bi mogli biti korišteni, podaci o masovnim pojavama moraju biti obrađeni i analizirani. Etape naučnog pristupa u istraživanju na bazi podataka su predstavljene u šemi 1.1.
Definisanje ciljeva Prikupljanje podataka Obrada i analiza podataka Provjera podataka Definisanje problematike istraživanja
Šema 1.1.
Zaključci i donošenje odluka
Tumačenje i interpretacija
Etape naučnog pristupa u istraživanju
Prve dvije etape zavise od svakog konkretnog istraživanja. Predmet naše analize će biti treća etapa, koja obuhvata više faza, i četvrta etapa statističkog zaključivanja i donošenja odluka. 1.2.1. Prikupljanje podataka Podatak je činjenica koja može, ali i ne mora, biti brojčana i koja predstavlja informaciju koju možemo koristiti u našem istraživanju. Za prikupljanje podataka možemo koristiti više metoda. 1.2.1.1. Metode prikupljanja podataka •
Direktno posmatranje (evidentiranje)
Direktno posmatranje predstavlja najjednostavniji način prikupljanja podataka. Pod posmatranjem podrazumijevamo svaku činjenicu koja se odnosi na jednu situaciju, fenomen ili slučaj, pod uslovom da oni ne mogu biti promijenjeni posmatranjem. Naprimjer, možemo posmatrati broj osoba prisutnih u amfiteatru, boju table, boju očiju, itd. Veliki broj podataka 17
Statistika u ekonomiji i menadžmentu
prikupljen na ovaj način sadržan je u evidencijama, registrima i drugim dokumentima (npr.: podaci o broju rođenih, broju umrlih, o prodaji određenog proizvoda, temperaturi, medicinskim tretmanima, itd.) •
Anketa
Anketa se sastoji u ispitivanju određenog broja osoba jedne populacije. Ova metoda omogućava prikupljanje podataka koji se ne mogu prikupiti direktnim posmatranjem i koje je teško prikupiti na drugi način. Domeni primjene ove metode su naprimjer: analiza tržišta kojom želimo saznati koje proizvode više koristimo, šta jedemo, kako se oblačimo, koje knjige čitamo itd. Postoje također ankete mišljenja, profesionalne ankete, sociološke ankete, itd. Prikupljanje podataka ovom metodom podrazumijeva realizaciju više etapa. Potrebno je precizno definisati potrebnu informaciju u funkciji cilja i predmeta istraživanja, sredstva kojima raspolažemo, rok za prikupljanje podataka. Pošto se anketa odnosi na osobe jedne populacije potrebno je precizno definisati populaciju. Tip ankete koji se najčešće primjenjuje u praksi je anketa određenog broja osoba populacije. Odabrani broj osoba iz populacije se naziva uzorak. Izbor uzorka se vrši primjenom različitih metoda koje zavise od cilja istraživanja, ograničenja i raspoloživih informacija o populaciji. Načini realizacije ankete su također brojni. Vrlo je bitno pripremiti kvalitetan, precizan i jasan upitnik. Zatim se mogu angažovati anketari koji će direktno realizovati anketu. Postoji mogućnost slanja upitnika putem pošte ili realizacija ankete telefonskim pozivima. Ova dva postupka realizacije ankete su manje pouzdani i impliciraju više metodoloških problema koje je potrebno riješiti prilikom obrade ankete. •
Popis
Popis je oblik prikupljanja podataka pri kojem se obuhvataju sve jedinice statističkog skupa u određenom trenutku. Popis je najobuhvatniji način prikupljanja podataka. Pošto zahtijeva veliki utrošak sredstava i vremena provodi se samo u određenim vremenskim intervalima, npr. svakih 10 godina. •
Eksperiment
Prikupljanje podataka eksperimentisanjem podrazumijeva sistematsku i kontrolisanu realizaciju eksperimenta sa namjerom da se izučavaju razni 18
Poglavlje 1. – Statistika i statistička istraživanja
fenomeni, porede situacije ili provjere hipoteze. Potrebno je naglasiti da se postupak eksperimenta strogo kontroliše prema unaprijed razrađenom protokolu. •
Izvještaji i ostale indirektne metode prikupljanja podataka
Sljedeći postupak prikupljanja podataka obuhvata metode čija je zajednička karakteristika da ne analiziraju direktno jednu situaciju ili fenomen (dakle nema direktnog posmatranja) nego neke njihove posljedice. Kao primjer ovog postupka prikupljanja podataka možemo navesti razne izvještaje kojima se podaci prikupljaju periodično, istorijske dokumente, itd. 1.2.2. Obrada podataka Obrada prikupljenih podataka podrazumijeva realizaciju tri osnovne etape koje prethode donošenju odluka: • Eksploatacija podataka (upoznavanje podataka, evidentiranje i sređivanje da bi se imala globalna vizija prikupljenih podataka). • Deskriptivna analiza slijedi poslije prve etape i cilj joj je da opiše i predstavi prikupljene podatke pomoću tabela, grafičkih prikaza, izračunavanja osnovnih parametara. Bitni postupci u ove dvije etape su klasiranje, vizualizacija i sinteza prikupljenih podataka. • Treća faza obuhvata ocjenu intervala povjerenja za analizirane parametre i provjeru hipoteza koje se odnose na istraživani fenomen. Analiza prikupljenih podataka bi trebala omogućiti realizaciju treće faze čiji cilj je generalizacija dobijenih rezultata i donošenje odluka.
1.3. STATISTIČKI SKUP I STATISTIČKE VARIJABLE 1.3.1. Statistički skup i njegove karakteristike Statistički skup čine jedinice čija su obilježja (osobine, karakteristike) predmet istraživanja statističkom metodom. Statistički skup po obimu može biti konačan ili beskonačan. Statistički skup može biti realan u slučaju kada je sastavljen od jedinica koje postoje. Hipotetični skup čine jedinice koje se definišu nekim modelom. Da bi se mogao analizirati, statistički skup mora biti definisan. Definisati statistički skup znači odrediti obilježja koja mora 19
Statistika u ekonomiji i menadžmentu
imati svaka jedinica da bi se mogla smatrati elementom tog skupa. Statistički skup se definiše pojmovno, prostorno i vremenski. Pojmovna definicija skupa utvrđuje pripadnost skupu s obzirom na pojam jedinice (elementa). Uobičajeno je da se za veliki broj skupova pojmovne definicije utvrde zakonom ili aktima raznih institucija. Npr. statistički skup (populaciju) studenata predstavljaju osobe koje su upisane na visokoškolske ustanove i koje imaju studentska prava i obaveze. Možemo definisati skup nezaposlenih, skup aktivnog stanovništva, skup visokoškolskih institucija, skup privatnih preduzeća, itd. Prostorna definicija definiše prostor kojem pripadaju jedinice statističkog skupa. Vremenska definicija određuje vrijeme u kojem se statističke jedinice posmatraju i analiziraju. Osnovni skup može biti definisan u vremenskom trenutku ili vremenskom intervalu. U vremenskom trenutku se definišu npr. broj stanovnika, broj preduzeća, broj zaposlenih, osnovna sredstva. Uobičajeno je da se u vremenskom intervalu posmatra npr. poslovni rezultat ili proizvodnja nekog proizvoda u godini, trimestru ili mjesecu. Često se zbog nemogućnosti obuhvatanja svih elemenata skupa pojmovna i/ili prostorna definicija sužavaju. Npr. zbog teškoća i troškova identifikacije pod nezaposlenim se smatraju osobe prijavljene u zavodima za zapošljavanje. Predmet statističkih istraživanja su obilježja (svojstva, karakteristike) jedinica posmatranog skupa. Skup podataka o posmatranom obilježju za sve jedinice predstavlja osnovni skup ili populaciju. Skup podataka o posmatranom obilježju za dio jedinica skupa predstavlja uzorak koji služi kao osnova za zaključivanje o osnovnom skupu (populaciji). 1.3.2. Pojam, proces mjerenja i karakteristike statističke varijable Obilježja po kojima se razlikuju jedinice statističkih skupova nazivaju se varijable. Rezultati prikupljanja podataka o obilježjima jedinica statističkog skupa su najčešće prezentovani u formi skupa vrijednosti u kojem se procesom prebrojavanja i mjerenja pridružuju jedinicama skupa brojevi ili oznake prema određenim pravilima. Pravila pridruživanja su definisana mjernim skalama. Mjeriti varijablu elementa statističkog skupa znači 20
Poglavlje 1. – Statistika i statistička istraživanja
konstruisati podatak koji se nalazi na mjernoj skali. Postoji više tipova mjernih skala koje se razlikuju po logičkim i matematičkim operacijama koje se mogu primijeniti na analiziranu varijablu. 1.3.2.1. Nominalna skala Nominalna skala je predstavljena u obliku liste obilježja po kojima se razlikuju elementi statističkog skupa. Nominalna obilježja mogu biti atributivna i geografska. Skala može predstavljati dva (npr. pol muški ženski) ili više modaliteta (nacionalnost, mjesto stanovanja, zanimanje, privredne djelatnosti: industrija i rudarstvo, poljoprivreda i ribarstvo, šumarstvo, vodoprivreda, građevinarstvo, promet i veze, trgovina, ugostiteljstvo i turizam, zanatstvo, stambeno-komunalne djelatnosti, financijske i druge usluge). Modalitetima nominalne varijable se mogu pridružiti brojevi koji služe kao identifikatori ili kodovi. Matematičke operacije na ovoj skali nisu dozvoljenje. Jedina operacija koja se može primijeniti je prebrojavanje. Poredak kategorija je arbitraran. Ime skale i varijable se često koriste i kao sinonimi. Nomenklatura je uređen popis modaliteta nominalne varijable, kojima se pripisuje nomenklaturni broj. Nomenklature su konvencije, koje se donose zakonski ili dogovorom državnih organa ili međunarodnih organizacija. 1.3.2.2. Ordinalna skala Ordinalna skala pridružuje elementima skupa obilježja koja se mogu porediti, rangirati i klasirati prema nekom logičkom redosljedu. Ordinalne varijable se mogu prebrojavati i upoređivati i u ovom slučaju se mogu koristiti operatori (>, =, <), ali matematičke operacije nisu dozvoljene. Ordinalna varijabla naziva se i varijabla ranga. Kao primjere ovog tipa varijabli navodimo varijablu ekonomska razvijenost zemalja prema sljedećim modalitetima: razvijene zemlje, zemlje u razvoju i nerazvijene zemlje. Ako posmatramo populaciju studenata prve godine Ekonomskog fakulteta konstatujemo da su elementi ili statističke jedinice te populacije studenti. Varijabla mjerena na ovoj skali može biti ocjena na ispitu ako su njeni modaliteti: odličan, vrlodobar, dobar, dovoljan, nedovoljan. Modalitete ove skale možemo kodirati. Dozvoljena je i njihova transformacija uz uslov da se njom ne mijenja poredak modaliteta.
21
Statistika u ekonomiji i menadžmentu
1.3.2.3. Intervalna skala Na intervalnoj skali obilježjima elemenata populacije se pridružuju brojevi. Razlike u mjerenim obilježjima elemenata su predstavljene razlikama brojeva na intervalnoj skali. Položaj nule i mjerna jedinica su određeni arbitrarno. Nulu možemo postaviti na skali gdje želimo ali se mora uvijek zadovoljiti osobina ove skale da razlike među mjerenim obilježjima odgovaraju razlikama brojeva na intervalnoj skali. Tipičan primjer intervalne skale su temperaturne skale npr. Celzijusova ili Farenhajtova skala. Operacije dozvoljene na ovoj skali su prebrojavanje, poređenje i oduzimanje. 1.3.2.4. Metrička skala Omjerna, metrička ili numerička skala posjeduje «prirodnu nulu» koja ukazuje na odsustvo posmatranog obilježja. Vrijednosti pridružene elementima predstavljaju vrijednosti numeričke varijable. Na numeričkoj skali su dopuštene osnovne matematičke operacije i zbog toga ova skala ima najbolje metričke osobine i omogućava najširu i najprecizniju analizu. Razlike i omjeri između mjerenih obilježja su izraženi numerički i imaju precizno značenje. Numeričke varijable mogu biti prekidne (diskretne) i neprekidne (kontinuirane). Numerička varijabla koja može poprimiti konačno ili prebrojivo mnogo cjelobrojnih vrijednosti naziva se prekidnom (diskretnom), kao npr. broj članova porodice, broj studenata upisanih na određeni fakultet, itd. Numerička varijabla je kontinuirana ako može poprimiti neograničen broj vrijednosti (ili bilo koju vrijednost iz nekog intervala) npr. visina, težina, itd. Statističke varijable (promjenljive) mjerene na nominalnoj i ordinalnoj skali nazivaju se kvalitativne varijable. Varijable mjerene na intervalnoj i numeričkoj skali su kvantitativne varijable. 1.3.3. Primjer projekta istraživanja 1) Oblast istraživanja Koja populacija (statistički skup) je predmet našeg istraživanja? Studenti Ekonomskog fakulteta u Sarajevu. 2) Objekat istraživanja Šta želimo posmatrati na ovoj populaciji? Mjeriti kvalitet studija. Potrebno je kompletirati upitnik i anketirati određen broj studenata. 22
Poglavlje 1. – Statistika i statistička istraživanja
3) Period realizacije ankete: 2 puta godišnje na kraju semestra. Na kraju ove etape statističar raspolaže podacima koje treba obraditi. 4) Obrada podataka • Kratki rok: - Prezentiranje rezultata - Analiza rezultata - Upoređivanje rezultata - Traženje veza • Dugi rok: - Mjerenje evolucije Osnovno pitanje koje se postavlja je: kako obraditi podatke da bi se dobila korisna informacija? 5) Prezentacija rezultata • Dekanu i prodekanu • Upravnom odboru • Nastavnicima i administraciji • Studentima 6) Donošenje odluka Koje odluke treba donijeti da bi se poboljšao kvalitet studija? Obrada podataka predstavlja sadržaj naše analize. Nema recepta koji nam omogućava da znamo koju obradu treba primijeniti na podatke u svakom konkretnom slučaju. Ostaje nam istraživanje, znanje, iskustvo, rad i razmišljanje o svakom konkretnom slučaju. 1.3.4. Statistički pojmovi i definicije • • • • • •
Statistički skup koji je predmet istraživanja se naziva populacija. Elementi populacije se nazivaju statističke jedinice. Broj elemenata (statističkih jedinica) koji čine populaciju naziva se veličina populacije. Aplikacija koja svakom elementu populacije pridružuje jednu vrijednost naziva se statistička varijabla. Kategorije ili vrijednosti koje može imati jedna statistička varijabla nazivaju se modaliteti. Broj elemenata statističkog skupa koji posjeduju posmatrani modalitet naziva se frekvencija modaliteta. 23
Statistika u ekonomiji i menadžmentu
Primjer 1.1. Tabela 1.1. Nastavnici sa punim radnim vremenom na visokoškolskim ustanovama u Federaciji Bosne i Hercegovine od 2001/2002 do 2004/2005 godine Nastavnici Redovni profesor Vanredni profesor Docent Ostali Ukupno
2001/2002 332 248 251 50 881
2002/2003 312 257 276 47 892
2003/2004 325 254 295 54 928
2004/2005 313 275 304 55 947
Statistički godišnjak Federacije Bosne i Hercegovine 2002, Federalni zavod za statistiku, Sarajevo, str.325. Statistički godišnjak Federacije Bosne i Hercegovine 2004, Federalni zavod za statistiku, Sarajevo, str. 259. Statistički godišnjak Federacije Bosne i Hercegovine 2005, Federalni zavod za statistiku, Sarajevo, str. 287.
Analizu podataka prezentovanih u tabeli 1.1. ćemo izvršiti za 2004/2005 godinu. • Posmatrana populacija su nastavnici sa punim radnim vremenom na visokoškolskim ustanovama Federacije Bosne i Hercegovine • Statistička jedinica je nastavnik. • Veličina populacije je 947 nastavnika. • Populacija je analizirana prema varijabli «naučno zvanje nastavnika». • Varijabla ima četiri modaliteta: redovni profesor, vanredni profesor, docent i ostali. • Prikupljeni podaci se odnose na 2004.-2005. akademsku godinu. • Frekvencija modaliteta npr. redovni profesor je 313. U ovom slučaju radi se o kvalitativnoj ordinalnoj varijabli i njen grafički prikaz je dijagram sa stupcima.
24
Poglavlje 1. – Statistika i statistička istraživanja
350 300 250 200 150 100 50 0
2001/2002 redovni profesori
Grafikon 1.1.
2002/2003
2003/2004
vanredni profesori
docenti
2004/2005 ostali
Nastavnici na visokoškolskim ustanovama u Federaciji Bosne i Hercegovine
1.3.5. Prezentacija statističkih podataka Prikupljene statističke podatke možemo prezentovati na više načina. Najčešći oblici prezentacije podataka su: • Tabelarni • Grafički • Formalni • Deskriptivni Raspoložive podatke možemo predstaviti u tabelarnom obliku kompletirajući negrupisane statističke serije i uređene i grupisane statističke serije. Analizirat ćemo i na konkretnim primjerima ilustrovati negrupisanu statističku seriju, statističku seriju uređenu po veličini ili rangiranu statističku seriju, grupisanu statističku distribuciju frekvencija i intervalno grupisanu distribuciju. • Negrupisanu seriju možemo formalizirati na sljedeći način: •
{xi; i=1,...., N} (1.1) Uređenu ili rangiranu statističku seriju dobivamo ako podatke rangiramo (uredimo) po rastućem redosljedu i formaliziramo sljedećom relacijom: {x(i); (i)=1,...., N}
(1.2)
25
Statistika u ekonomiji i menadžmentu
•
gdje (i) predstavlja rang opservacije. Seriju možemo urediti i po opadajućem redosljedu. Na uređenoj statističkoj seriji jednostavnije je uočiti najveći i najmanji podatak i eventualno neuobičajene vrijednosti podataka. Na osnovu uređene statističke serije moguće je kompletirati grupisanu seriju ili statističku distribuciju frekvencija koju izražavamo na sljedeći način:
{( x ; f ) , j
•
j
j = 1, 2,...., J
}
(1.3)
gdje fj predstavlja frekvenciju modaliteta xj. Ova serija sadrži dvije kolone. U prvoj koloni su predstavljeni modaliteti, a u drugoj koloni frekvencije koje pridružujemo odgovarajućim modalitetima. U ovom slučaju vrlo jednostavno uočavamo najmanji i najveći podatak u seriji bez posmatranja cijele serije uređenih podataka. Određujemo najčešći podatak (mod) i raspolažemo sa frekvencijom svakog modaliteta. Kada je broj podataka vrlo veliki, možemo kompletirati intervalno grupisanu distribuciju. Amplituda (širina, veličina) intervala je jednaka broju modaliteta koji pripadaju tom intervalu i dobija se kao razlika između desne (gornje) xj i lijeve (donje) xj-1 granice svakog intervala:
a j = x j − x j −1
(1.4)
Treba imati u vidu amplitude intervala prije interpretacije rezultata i pažljivo posmatrati podatke da bi se moglo izvršiti grupisanje u intervale, razrede ili klase. Svakom intervalu se pridružuje odgovarajuća frekvencija. Grupisanje podataka u intervale i broj intervala zavisi od cilja grupisanja i može se vršiti primjenom raznih metoda. Intervali se mogu kompletirati tako da se razmak između najveće i najmanje vrijednosti podijeli na k podintervala koji se ne preklapaju. Cilj je da se u jednom intervalu grupišu relativno slične vrijednosti. Pošto ne postoji egzaktan način za određivanje broja intervala mogu se koristiti praktična iskustvai intuicija. U praksi se često primjenjuje Sturgesovo pravilo prema kojem se broj intervala k za grupisanje N podataka aproksimira sljedećim izrazom: k = 1+ 3,3 log N
26
(1.5)
Poglavlje 1. – Statistika i statistička istraživanja
Broj intervala se najčešće kreće između pet i petnaest, a rijetko prelazi dvadeset pet. Svaki interval ima donju i gornju granicu. Uobičajeno je da između gornje granice i-tog i donje granice (i+1) intervala vlada određen odnos. Ako je vrijednost gornje granice i-tog intervala jednaka vrijednosti donje granice (i+1) intervala radi se o pravim (preciznim) granicama intervala. Kada ovaj odnos nije zadovoljen radi se o nominalnim granicama intervala. Prave se granice najčešće određuju tako da se donja granica umanjuje, a gornja uvećava za polovinu razlike između gornje granice i-tog i donje granice (i+1) intervala. Interval se naziva otvorenim kada prvi interval nema donje ili posljednji interval gornje granice. Na sljedećim primjerima ćemo ilustrovati grupisanje podataka u intervale. Tabela 1.2. Starosna struktura stanovništva Federacije BiH u 2000. godini Nominalne granice intervala sa jednim otvorenim intervalom Starosna struktura u godinama 0-14 15-64 65 i više Ukupno
Broj stanovnika 588 210 1 896 277 316 513 2 801 000
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2001, Sarajevo, 2001, str. 48.
Tabela 1.2a. Starosna struktura stanovništva Federacije BiH u 2000. godini Prave granice intervala sa dva otvorena Starosna struktura u godinama
Broj stanovnika
-14,5[ [14,5-64,5[ [64,5 i više Ukupno
588 210 1 896 277 316 513 2 801 000
Prikupljene podatke možemo prezentirati na više načina. Najčešće prezentacije koje ćemo mi koristiti su tabelarna i grafička prezentacija.
27
Statistika u ekonomiji i menadžmentu
1.3.5.1. Tabelarna prezentacija •
Tabelarna prezentacija kvalitativne varijable
U sljedećoj tabeli možemo sintetizirati prezentaciju podataka o kvalitativnoj statističkoj varijabli: Tabela 1.3. Prezentacija kvalitativne statističke varijable Modaliteti varijable M1 M2 .............. MJ-1 MJ Ukupno
Frekvencija fj f1 f2 ................ f J-1 fJ J
∑f
j
=N
Relativna frekvencija pj p1 p2 ................. p J-1 pJ 1 ili 100%
j =1
Zbir relativnih frekvencija je uvijek jednak 1 ili 100% ukoliko ga izrazimo u procentima. •
Tabelarna prezentacija kvantitativne varijable
Kada se pojedini modaliteti pojavljuju više puta podatke možemo grupisati tako da svakom modalitetu pridružimo odgovarajuću frekvenciju. Modalitete je zbog preglednosti potrebno rangirati po veličini. U tabeli 1.4. sintetiziramo prezentaciju rangiranih i grupisanih podataka o kvantitativnoj prekidnoj varijabli. Tabela 1.4. Statistička distribucija frekvencija Vrijednosti varijable (modaliteti) xj
Frekvencija fj
Relativna frekvencija pj
x1 x2 ...................... x J-1 xJ Ukupno
f1 f2 ......................... f J-1 fJ N
p1 p2 ...................... p J-1 pJ 1 ili 100%
28
Poglavlje 1. – Statistika i statistička istraživanja
Sintetiziranu prezentaciju podataka o kvantitativnoj prekidnoj varijabli grupisanoj u intervale predstavljamo u tabeli 1.5. Tabela 1.5. Intervalno grupisana distribucija Vrijednosti varijable xj grupisane u intervale [x0; x1[ [x1; x2[ .............. [xJ-2; xJ-1[ [xJ-1; xJ] Ukupno
Frekvencija fj
f1 f2 ................ f J-1 fJ N
Amplituda (širina intervala) aj a1 a2 ................ a J-1 aJ
Centri intervala xcj
Relativna frekvencija pj
xc1 xc2 ................ xc J-1 xcJ
p1 p2 ................ p J-1 pJ 1 ili 100%
Na sljedećem primjeru ćemo ilustrovati prezentaciju podataka u obliku negrupisane serije, uređene rangirane serije, grupisane statističke distribucije frekvencija i intervalno grupisane distribucije. Tabela 1.6. Ocjene studenata koji su položili ispit iz predmeta Statistika 30.06.2005.g. Ocjena (X) Ocjena (X) Ocjena (X) Negrupisana serija Uređena serija Uređena serija 8 6 10 9 6 10 9 6 10 7 6 10 10 7 10 7 7 10 6 7 10 10 7 10 6 7 10 10 7 9 8 7 9 10 7 9 9 8 9 7 8 9
29
Statistika u ekonomiji i menadžmentu
Tabela 1.6. nastavak 7 10 10 10 8 10 7 6 8 10 7 9 6 9 8 8 7 8 9 7
8 8 8 8 8 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10
9 8 8 8 8 8 8 8 7 7 7 7 7 7 7 7 6 6 6 6
U prvoj koloni tabele ocjene su predstavljene u obliku negrupisane (neuređene) distribucije. U drugoj koloni ocjene su rangirane po rastućem redosljedu i kompletirana je uređena rangirana serija podataka. Treća kolona također predstavlja uređenu rangiranu seriju podataka, ali po opadajućem redosljedu. Naredna faza je grupisanje podataka i predstavljanje u statističkoj distribuciji frekvencija. Tabela 1.7. Statistička distribucija frekvencija OCJENA xj 6 7 8 9 10 Ukupno
30
FREKVENCIJE fj 4 8 7 6 9 34
Poglavlje 1. – Statistika i statistička istraživanja
Ocjene možemo grupisati u intervale i kompletirati intervalno grupisanu distribuciju. U sljedeće tri tabele prezentujemo različite mogućnosti grupisanja u intervale podataka o ocjenama studenata na ispitu. Tabela 1.8. Intervalno grupisana distribucija Ocjene [6-7[ [7-9[ [10]
Frekvencije fj 4 21 9
Tabela 1.9. Intervalno grupisana distribucija Ocjene [6-8[ [8-9[ [10]
Frekvencije fj 12 13 9
Tabela 1.10. Intervalno grupisana distribucija Ocjene [6-8] [9-10]
Frekvencije fj 19 15
1.3.5.2. Grafička prezentacija Postoji više vrsta grafičkih reprezentacija. Najčešće korišten oblik grafičkog predstavljanja su dijagrami koji se dijele na: stigmograme, linearne dijagrame, površinske dijagrame i stereograme. Navoditi i davati primjere za sve vrste grafičkih prezentacija je ogroman, ali ne osobito koristan posao jer nam novi programi koji su u upotrebi omogućuju da odaberemo prezentaciju koja najviše odgovara svakom konkretnom slučaju. Zbog toga savjetujemo korisnicima da koriste program Excel koji pruža široku paletu od 14 tipova, odnosno 73 podtipa grafikona. Na sljedećoj slici vidimo polaznu stranu Excela za crtanje grafikona.
31
Statistika u ekonomiji i menadžmentu
Performanse novih programa nam omogućuju da konstruišemo sve bolje grafikone koji sve češće postaju način da se prenese informacija. Ali potrebno je biti vrlo oprezan. Grafikoni mogu biti korišteni, pored informisanja koje je njihov osnovni cilj, i u svrhu dezinformisanja. Jedan dobro konstruisan grafikon je često rječitiji nego desetine fraza. Mi ćemo u toku izlaganja sadržaja ove knjige primjenjivati različite tipove grafičkih prezentacija. Nabrajati i analizirati sve oblike grafičke prezentacije je nepotrebno. Osnovna funkcija jednog grafikona je da olakša prezentaciju, čitanje i interpretaciju podataka. Potrebno je prezentovati podatke da bi se informisalo. Zbog toga, izbor tipa prezentacije zavisi od razmišljanja i strpljenja, i često je potrebno uraditi više pokušaja da bi se odabrala “prava” prezentacija. Ne treba miješati suštinu i formu jer je precizan i jednostavan grafikon korisniji od grafikona komplikovanog, vizuelno privlačnijeg, ali bez smisla. Neophodno je uvijek biti precizan i kompletirati: naslov grafikona, nazive predstavljenih podataka, označiti precizno razmjeru i jedinice mjere, eventualno primjer čitanja grafikona, staviti estetiku u službu funkcionalnosti i razumijevanja grafikona. Ne treba potcijeniti vrijeme potrebno za konstrukciju jednog grafikona koristeći programe na računaru.
32
Poglavlje 1. – Statistika i statistička istraživanja
Ako je prezentacija podataka2 dovoljna za donošenje odluka dio našeg posla je tim završen. Međutim u većini slučajeva statističar je obavezan da analizira i sintetizira podatke: ako su podaci brojni i različiti; da bi se uporedile dvije populacije različitih veličina; da bi se olakšalo mjerenje evolucije, itd.
2
5402
3921
Slovacka
BiH
38614 1967 Poljska
Slovenija
2342
396 Malta
Letonija
10176
3467 Litvanija
Madarska
1348
10247 Ceška
Estonija
807
8933
Švedska Velika Britanija Kipar
10331
5205 Finska
Portugal
16066
8128 Ausrija
Holandija
447 Italija
Luxemburg
Irska
Španija
Francuska
3933
11048 Grcka
5379
Grafikon 1.2.
Njemacka
0
Belgija
20 000
10356
60 000 40 000
57881
59823 41611
80 000
Danska
broj stanovnika u 000
100 000
59080
82506
U sljedećim tabelama prezentiramo statističke podatke i odgovarajuće grafičke prikaze.
Stanovništvo 25 zemalja Evropske unije i Bosne i Hercegovine u 2002.g. Izvor: Eurostat, 2005.
“Prosječan statističar je oženjen sa 1,75 žena koje čine sve što je moguće da ga udalje od kuće 2,25 noći u sedmici sa samo 50% uspjeha. Nagib njegovog čela je 2%, on posjeduje 5/8 jednog računa u banci i ima 3,06 djece koji ga napola izluđuju. 1,65 od njegove djece su dječaci. Samo 0,07% od svih statističara su potpuno razbuđeni za njihovim doručkom, u toku kojeg oni popiju 1,68 šoljica kafe i prospu ostatak od 0,32 na njihov stolnjak. Subotom uveče on angažuje 1/3 babysitter da čuva njegovo 3,06 djece, u slučaju da 5/8 njegove punice koja živi sa njima u kući ne pristane da čuva djecu za polovinu cijene.”. W.F.Mirch (1950) citiran u T.H.Wonnacott i R.J.Wonnacott, Statistique, Economica, Paris, 1995, str. 23. Navedena deskriptivna prezentacija nema nikakvog smisla i potpuno je nerazumljiva. Ovo je primjer kako ne treba raditi.
33
Statistika u ekonomiji i menadžmentu
Tabela 1.11. Bruto društveni proizvod u Federaciji Bosne i Hercegovine, tekuće cijene 1999 Bruto domaći proizvod, u 000 KM Bruto domaći proizvod po stanovniku, u KM
2000
2001
2002
2003
2004
6.142.147 6.722.631 7.273.874 7.942.665 8.268.120 8.897.202 2.187
2.400
2.577
2.805
2.912
3.125
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, Federalni zavod za statistiku, Sarajevo, str.90.
9000000 6000000 3000000 0
1999
2000
2001
2002
2003
2004
Bruto društveni proizvod u Federaciji BiH, tekuće cijene, u milionima KM
Grafikon 1.3.
2004
3.125
2003
2.912
2002
2.805
2001
2.577
2000
2.400
1999
2.187 0
Grafikon 1.4.
34
500
1000
1500
2000
2500
3000
Bruto društveni proizvod po stanovniku u Federaciji BiH, u KM
3500
Poglavlje 1. – Statistika i statistička istraživanja
Primjer 1.2. Tabela 1.12. Nezaposlene osobe prema stručnoj spremi u Federaciji BiH, stanje 31.decembra 2004. g.
UKUPNO VSS VŠS SSS VKV, KV PKV, NSS NKV
Ukupno 325.738 4.989 4.267 71.333 123.552 11.795 109.802
žene 150.447 2.823 2.616 43.430 44.388 4.621 52.569
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str. 247.
350,000 300,000
ukupno
250,000
žene
200,000 150,000 100,000 50,000 0
UKUPNO
Grafikon 1.5.
VSS
VŠS
SSS
VKV, KV
PKV, NSS
NKV
Nezaposleni prema stručnoj spremi u Federaciji BiH u 2004. godini
35
Statistika u ekonomiji i menadžmentu
VSS 2%
NKV 34%
VŠS 1%
PKV, NSS 4%
Grafikon 1.6.
NKV 34%
PKV, NSS 3%
Grafikon 1.7.
SSS 22%
VKV, KV 37%
Nezaposleni prema stručnoj spremi u 2004. godini
VSS 2%
VŠS 2%
SSS 29%
VKV, KV 30% Nezaposlene žene prema stručnoj spremi u 2004. godini
Primjer 1.3. Tabela 1.13. Upisani studenti na visokoškolskim ustanovama u Federaciji BiH 96/97 97/98 98/99 99/00 00/01 01/02 02/03 03/04 04/05 Ukupno 28.072 34.477 39.273 43.839 47.242 48.866 51.771 54.425 58.834 Žene
14.392 17.757 20.176 22.635 24.721 26.331 28.264 30.166 32.337
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str. 281.
36
Poglavlje 1. – Statistika i statistička istraživanja 70000 60000
ukupno
žene
50000 40000 30000 20000 10000 0
1996/97
Grafikon 1.8.
1997/98
1998/99
1999/00
2000/01
2001/02
2002/03
2003/04
2004/05
Upisani studenti na visokoškolskim ustanovama u Federaciji BiH
37
POGLAVLJE 2
ANALIZA I SINTEZA PODATAKA
2.1. FREKVENCIJE I KUMULATIVNE FREKVENCIJE 2.1.1. Definicije • • • • •
Apsolutna frekvencija je broj (učestalost) pojavljivanja jednog modaliteta. Kumulativna rastuća apsolutna frekvencija jednog modaliteta je jednaka zbiru frekvencija modaliteta za koje varijabla ima vrijednost manju ili jednaku od tog modaliteta. Kumulativna opadajuća apsolutna frekvencija jednog modaliteta je jednaka zbiru frekvencija modaliteta za koje varijabla ima vrijednost striktno veću od tog modaliteta. Relativna frekvencija je jednaka apsolutnoj frekvenciji modaliteta podijeljenoj sa totalnom frekvencijom. Relativna frekvencija predstavlja proporciju jedinica osnovnog skupa koji imaju posmatrani modalitet. Kumulativna rastuća relativna frekvencija jednog modaliteta je jednaka proporciji modaliteta za koje varijabla ima vrijednost manju ili jednaku od tog modaliteta.
39
Statistika u ekonomiji i menadžmentu
• •
Kumulativna opadajuća relativna frekvencija jednog modaliteta je jednaka proporciji modaliteta za koje varijabla ima vrijednost striktno veću od tog modaliteta. Prema navedenim definicijama zbir kumulativne rastuće relativne frekvencije jednog modaliteta i kumulativne opadajuće relativne frekvencije istog modaliteta je jednak jedinici (ili 100% ako frekvencije izrazimo u procentima).
2.1.2. Formalizacija definicija •
Formalizaciju koju ćemo koristiti za izražavanje gore navedenih definicija predstavljamo sljedećim simbolima i izračunavamo na sljedeći način: fi
apsolutna frekvencija
pi relativna frekvencija-struktura
pi =
fi N j
Sj apsolutna kumulativna frekvencija S j = ∑ f i i =1 j
Fj relativna kumulativna frekvencija F j = ∑ p i
(2.1)
i =1
N broj podataka •
Kumulativnu rastuću distribuciju frekvencija na osnovu vrijednosti prekidne varijable formiramo na sljedeći način:
S ( X = x1 ) = f1 S ( X ≤ x2 ) = f1 + f 2 ................ S ( X ≤ x j ) = f 1 + f 2 + ... + f j ................ S ( X ≤ x k ) = f 1 + f 2 + ... + f j + ... f k = N j-ti član kumulativne distribucije možemo napisati u obliku:
40
(2.2)
Poglavlje 2. – Analiza i sinteza podataka j
S ( x j ) = ∑ fi , j = 1, 2,..., k .
(2.3)
i =1
S(xj ) = f ( X ≤ x j ) Osobine kumulativne rastuće distribucije apsolutnih frekvencijama su:
⎧0 , ⎪ S ( x j ) = ⎨0 ≤ S ( x j ) ≤ N , ⎪ , ⎩N
x j < xmin xmin ≤ x j ≤ xmax x j > xmax (2.4)
S ( xi ) ≤ S ( x j ),
xi < x j
j-ti član kumulativne rastuće distribucije relativnih frekvencija izražavamo u sljedećem obliku: j
F ( x j ) = ∑ pi , j = 1, 2,..., k , i =1
F ( x j ) = p( X ≤ x j )
(2.5)
Osobine rastuće kumulativne distribucije sa relativnim frekvencijama su:
⎧0 , ⎪ F ( x j ) = ⎨0 ≤ F ( x j ) ≤ 1, ⎪ , ⎩1
x j < xmin xmin ≤ x j ≤ xmax x j > xmax (2.6)
F ( xi ) ≤ F ( x j ),
xi < x j
Objašnjenje vrijednosti kumulativne distribucije frekvencija proizilazi iz načina njenog formiranja. S(xj) predstavlja broj modaliteta posmatranog skupa čija je vrijednost jednaka ili manja od xj. Analognim postupkom kompletiramo izraz za kumulativnu distribuciju relativnih frekvencija. Kumulativna distribucija relativnih frekvencija F(xj) pokazuje proporciju modaliteta posmatranog skupa čija je vrijednost jednaka ili manja od xj.
41
Statistika u ekonomiji i menadžmentu
Prema definiciji, zbir kumulativne rastuće relativne frekvencije jednog modaliteta i kumulativne opadajuće relativne frekvencije istog modaliteta je jednak jedinici (ili 100%). Ako je data distribucija frekvencija sa intervalima S(xj) predstavlja broj modaliteta sa vrijednošću varijable koja je jednaka ili manja od gornje granice j-tog intervala, a F(xj) proporciju modaliteta čija je vrijednost jednaka ili manja od gornje granice j-tog intervala. Na sljedećem primjeru ćemo kompletirati kumulativnu rastuću relativnu frekvenciju i objasniti njeno značenje. Primjer 2.1. Tabela 2.1. Statistička distribucija frekvencija završenih stanova prema broju soba u Federaciji Bosne i Hercegovine u 2004.g. Broj soba 1 2 3 4 5 Ukupno
Frekvencija fj 184 238 115 35 2 574
Relativna frekvencija pj 0,321 0,415 0,200 0,061 0,003 1
Kumulativna rastuća relativna frekvencija Fj 0,321 0,736 0,936 0,997 1 -
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str.157.
U našem primjeru kumulativna frekvencija za broj soba manje ili jednako tri je jednaka 93,6%. Dakle, F(3)=93,6%, što znači da 93,6% završenih stanova u Federaciji Bosne i Hercegovine u 2004. g. ima 1, 2, ili 3 sobe. Na primjeru sljedeće distribucije frekvencija ćemo ilustrovati izračunavanje kumulativnih frekvencija i njihov grafički prikaz.
42
Poglavlje 2. – Analiza i sinteza podataka
Primjer 2.2. Tabela 2.2. Statistička distribucija frekvencija ocjena na ispitu iz predmeta Statistika Ocjena xj 6 7 8 9 10 Ukupno
fj 4 8 7 6 9 34
Sj + 4 12 19 25 34
Sj 30 22 15 9 0
pj 0,118 0,235 0,206 0,176 0,265 1,000
Fj+ 0,118 0,353 0,559 0,735 1
Fj 0,882 0,647 0,441 0,264 0,000
U tabeli Sj+ i Sj predstavljaju rastuće i opadajuće apsolutne kumulativne frekvencije, a Fj+ i Fj rastuće i opadajuće relativne kumulativne frekvencije.
Apsolutne frekvencije
35
Sj+
Sj-
30 25 20 15 10 5 0 6
Grafikon 2.1.
7
Ocjene
8
9
10
Kumulativne rastuce i opadajuce apsolutne frekvencije
43
Statistika u ekonomiji i menadžmentu
relativne frekvencije
1
Fj+
Fj -
0.8 0.6 0.4 0.2 0
6
Grafikon 2.2.
7
8
9
10 ocjene
Kumulativne rastuce i opadajuce relativne frekvencije
2.2. KLASIFIKACIJA STATISTIČKIH VARIJABLI Mi smo već u uvodnom dijelu naglasili da je osnovna dihotomija statističkih varijabli na kvalitativne i kvantitativne varijable. Modaliteti jedne varijable određuju njen tip. 2.2.1. Kvalitativne varijable Varijabla je kvalitativna ako se njeni modaliteti ne mogu kvantitativno izraziti. Modaliteti ove varijable su deskriptivno izraženi kao atributivna ili geografska obilježja. Naprimjer pol, bračno stanje, zaposleni prema stepenu stručnog obrazovanja, tip stana su kvalitativne varijable. Postoje dvije grupe kvalitativnih varijabli. To su kvalitativna nominalna i kvalitativna ordinalna varijabla. 2.2.1.1. Kvalitativna nominalna varijabla Varijabla je kvalitativna nominalna ako su njeni modaliteti dati u obliku atributivnih ili geografskih obilježja koje nije moguće klasirati prema nekom redosljedu (rangu) koji ima smisla. Naprimjer, varijabla «pol» čija dva modaliteta su: žena i muškarac. Kvalitativne varijable se mogu kodirati. Numeričko kodiranje npr. 1 za «ženu» i 2 za «muškarca» je arbitrarno i nikakve matematičke operacije sa kodiranim vrijednostima nisu dozvoljene. 44
Poglavlje 2. – Analiza i sinteza podataka
2.2.1.2. Kvalitativna ordinalna varijabla Varijabla je kvalitativna ordinalna ako je moguće klasirati njene modalitete prema nekom redosljedu koji ima smisla. Naprimjer, varijabla ocjena izražena sljedećim modalitetima: odličan, vrlodobar, dobar, dovoljan i nedovoljan. 2.2.2. Kvantitativne varijable Varijabla je kvantitativna ako su njeni modaliteti mogu kvantificirati i ako su brojčano izraženi. Primjeri ovog tipa varijable su: broj studenata na univerzitetu, broj soba u studentskom domu, težina studenata prve godine Ekonomskog fakulteta u Sarajevu, plata u KM, broj članova porodice itd. Kvantitativne varijable se dijele na prekidne (diskretne) i neprekidne (kontinuirane). 2.2.2.1. Kvantitativna prekidna varijabla Varijabla koja može poprimiti konačan broj izolovanih, odnosno diskretno raspoređenih vrijednosti se naziva se naziva kvantitativna (numerička) prekidna varijabla. Varijabla je kvantitativna prekidna ako su njeni modaliteti prebrojivi i najčešće cjelobrojni. Prebrojavamo npr. broj studenata u amfiteatru ili broj zaposlenih na fakultetu itd. 2.2.2.2. Kvantitativna neprekidna varijabla Varijabla je kvantitativna kontinuirana ako su vrijednosti njenih modaliteta neprebrojive. Ova varijabla može uzimati bilo koju vrijednost iz intervala koji pripada skupu realnih brojeva. Varijabla je kvantitativna kontinuirana ako su vrijednosti njenih modaliteta dobijene na osnovu mjerenja. Npr.: mjerimo visinu studenata. U praksi je jednostavno odrediti da li je jedna varijabla kvalitativna nominalna ili ordinalna. Ponekad je teško odrediti da li je jedna kvantitativna varijabla prekidna ili neprekidna.
2.3. GRAFIČKI PRIKAZI PREKIDNE I NEPREKIDNE VARIJABLE Grafička prezentacija koja se najčešće koristi u slučaju prekidne varijable je dijagram sa stupcima. Najznačajnija grafička prezentacija kontinuirane varijable je histogram. U slučaju serije intervalno grupisanih podataka sa 45
Statistika u ekonomiji i menadžmentu
jednakom amplitudom intervala, visina pravougaonika koji čine histogram je proporcionalna frekvenciji svakog intervala. Za seriju intervalno grupisanih podataka sa različitom amplitudom svakog intervala potrebno je izračunati frekvencije po jedinici amplitude koje nazivamo korigovane frekvencije i u tom slučaju površina svakog pravougaonika je proporcionalna frekvenciji intervala. Na prva dva grafikona ilustrujemo grafičko predstavljanje kvantitativne prekidne varijable. Ovu varijablu predstavljamo dijagramom sa stupcima na grafikonu 2.3. i njenu kumulativnu krivu na grafikonu 2.4.
x Grafikon 2.3.
Dijagram sa stupcima
1
x Grafikon 2.4.
46
Kumulativna kriva prekidne varijable
Poglavlje 2. – Analiza i sinteza podataka
Kvantitativnu neprekidnu varijablu predstavljamo histogramom i kumulativnom krivom. Histogram je predstavljen na grafikonu 2.5., a kumulativna kriva na grafikonu 2.6.
x Grafikon 2.5.
Histogram
x Grafikon 2.6.
Kumulativna kriva
2.4. MJERE SREDNJE VRIJEDNOSTI ILI MJERE CENTRALNE TENDENCIJE Mjere srednje vrijednosti mogu biti potpune (izračunate, izvedene) i pozicione (položajne, nepotpune). U potpune mjere srednje vrijednosti 47
Statistika u ekonomiji i menadžmentu
ubrajamo aritmetičku, geometrijsku, harmonijsku, kvadratnu i kubnu sredinu. Pozicione mjere srednje vrijednosti su: mod, medijana i kvantili. 2.4.1. Aritmetička sredina Aritmetička sredina je prosječna srednja vrijednost. Aritmetička sredina jedne statističke serije je jednaka zbiru opservacija podijeljenim sa veličinom serije. Aritmetička sredina izražava prosječnu vrijednost jedne serije ili distribucije podataka i predstavlja najznačajniju mjeru centralne tendencije. 2.4.1.1. Jednostavna aritmetička sredina •
Aritmetička sredina negrupisane (neuređene) serije {xi; i = 1,...., N} se utvrđuje koristeći sljedeći izraz: x=
1 N
N
∑x
i
=
i =1
1 ( x1 + x2 ...... + xN ) N
(2.7)
Za seriju:
{xi } = { 2,0,10,8,4,0,6,4,6,2,6} , {xi; i=1,....,11} aritmetička sredina je jednaka
x= •
2 + 0 + 10 + 8 + 4 + 0 + 6 + 4 + 6 + 2 + 6 = 4,36 11
Aritmetička sredina uređene serije {x(i); (i)=1,..., N} gdje (i) predstavlja rang opservacije je jednaka: x=
1 N
N
∑x
i
i =1
=
1 ( x1 + x2 ...... + xN ) N
Za seriju:
{xi } = {0,0,2,2,4,4,6,6,6,8,10} , {x(i); (i)=1,....,11} aritmetička sredina je: 48
(2.8)
Poglavlje 2. – Analiza i sinteza podataka
x=
0 + 0 + 2 + 2 + 4 + 4 + 6 + 6 + 6 + 8 + 10 48 = = 4,36 11 11
2.4.1.2. Ponderisana aritmetička sredina •
Ponderisana
{( x ; f ) , j
aritmetička
j = 1, 2,...., J
j
}
sredina
grupisane
statističke
serije
gdje fj predstavlja frekvenciju modaliteta xj
je jednaka:
x=
1 N
J
∑f j =1
⋅ xj =
j
( f1 ⋅ x1 + f 2 ⋅ x2 + ... + f J ⋅ xJ )
(2.9)
N
Za seriju {( 0 ; 2 ), ( 2 ; 2 ), ( 4 ; 2 ), ( 6 ; 3 ), ( 8 ;1 ), ( 10 ;1 ) } , u kojoj su dati parovi u kojima prvi broj predstavlja modalitet a drugi frekvenciju, aritmetička sredina je jednaka: 6
x= x= •
∑f
j
j =1
xj
f1 x1 + f 2 x 2 + f 3 x3 + f 4 x 4 + f 5 x5 + f 6 x6 f1 + f 2 + f 3 + f 4 + f 5 + f 6
=
N
2 ⋅ 0 + 2 ⋅ 2 + 2 ⋅ 4 + 3 ⋅ 6 + 1 ⋅ 8 + 1 ⋅ 10 = 4,36 2 + 2 + 2 + 3 +1+1
Aritmetička sredina statističke serije sa relativnim frekvencijama je jednaka: J
x = ∑ p j x j gdje je p j = j =1
i
J
∑p j =1
•
j
fj N
(2.10)
=1
Aritmetička sredina statističke serije grupisane u intervale se utvrđuje primjenom sljedećeg izraza:
x=
1 N
J
∑f j =1
j
⋅ xc j =
( f ⋅x 1
c1
+ f 2 ⋅ xc2 + ... + f J ⋅ xcJ N
)
(2.11)
gdje xc predstavlja centar intervala i izračunava se pomoću sljedećeg izraza: 49
Statistika u ekonomiji i menadžmentu
xcj =
x j −1 + x j
(2.12)
2
(2; 2), (4 ; 2), (6 ; 3), (8;1), (10;1)} grupisanu u intervale predstavljamo u sljedećoj tabeli. Seriju
{(0 ; 2),
Tabela 2.3. Intervalno grupisana distribucija Intervali 0-2 4-6 8-10 Ukupno
Frekvencija 4 5 2 11
x≈
Centri razreda 1 5 9 -
4 ⋅1 + 5 ⋅ 5 + 2 ⋅ 9 = 4,27 11
Za izračunavanje aritmetičke sredine je potrebno primijeniti odgovarajuću formulu u zavisnosti od raspoloživih podataka. Aritmetičku sredinu možemo nazvati i centrom gravitacije, centrom koji predstavlja prosječnu vrijednost posmatrane serije kojoj teže, gravitiraju ostale vrijednosti u seriji. Aritmetička sredina izravnava apsolutne razlike između svih podataka u analiziranom skupu. Aritmetičku sredinu možemo računati samo za kvantitativne varijable. Dakle, za statističku seriju čije su varijable mjerene na nominalnoj i ordinalnoj skali ne možemo računati aritmetičku sredinu. 2.4.1.3. Osobine aritmetičke sredine •
Ako su vrijednosti svih obilježja u seriji jednake konstanti i aritmetička sredina je jednaka toj konstanti c:
x1 = x2 = .... = xN = c ⇒ x = c x=
50
1 N
N
∑ xi = i =1
1 N
N
1
∑ c = N ⋅ Nc = c i =1
(2.13)
Poglavlje 2. – Analiza i sinteza podataka
•
Aritmetička sredina je rijetko jednaka jednoj od posmatranih vrijednosti, ali promjena vrijednosti samo jednog modaliteta značajno utiče na aritmetičku sredinu. Zbog toga je aritmetička sredina vrlo osjetljiva na ekstremne vrijednosti posmatrane varijable. U računanju aritmetičke sredine uzimaju se vrijednosti svih modaliteta.
•
Aritmetička sredina je veća od najmanje i manja od najveće vrijednosti varijable3:
min xi < x < max xi •
(2.14)
Zbir odstupanja između modaliteta i njihove aritmetičke sredine je jednak nuli. N
N
i =1
i =1
∑ ( xi − x ) = ∑ xi − N ⋅ x = 0
(2.15)
Po analogiji, možemo pokazati da je zbir odstupanja svih vrijednosti obilježja od njihove aritmetičke sredine jednak nuli i za grupisane podatke. J
∑ f (x j =1
j
j
− x) = 0
(2.16)
Posljedica navedene osobine je sljedeća: aritmetička sredina odstupanja između opservacija i njihove aritmetičke sredine je jednaka nuli.
1 N
N
∑( x i =1
i
− x) = 0
(2.17)
Ova osobina vrijedi i u slučaju grupisanih podataka. •
Osobina agregiranja aritmetičke sredine
Ako na osnovu varijable X analiziramo populaciju veličine N sastavljenu od potpopulacije veličine N1, odgovarajuće aritmetičke sredine x1 i potpopulacije veličine N2, i njene aritmetičke sredine x2 . Aritmetička sredina varijable X za populaciju se dobija korištenjem sljedećeg izraza:
3
Izuzetak je slučaj kada su vrijednosti svih obilježja u seriji jednake konstanti, pa je i aritmetička sredina niza jednaka toj konstanti.
51
Statistika u ekonomiji i menadžmentu
x=
N1 x1 + N 2 x 2 f x + f 2 x2 = 1 1 N1 + N 2 f1 + f 2
(2.18)
Ova osobina se može generalizirati na n potpopulacija. Ilustraciju ove osobine ćemo pokazati na sljedećem primjeru. Tabela 2.4. Godišnje neto plate državnih službenika u 2000. godini Službenici
Frekvencija u hiljadama fj
Kategorija A Kategorija B Kategorija C Ukupno
Prosječna godišnja neto plata u eurima x
769,6 300,7 469,9 1540,2
29 549 21 698 17 576 ?
Izvor: Tableau de l’economie francaise (TEF), 2002-2003, INSEE, strana 93.
Prosječna godišnja neto plata svih službenika:
x= •
N1 x1 + N 2 x2 + N 3 x3 = 24 363,4€ N1 + N 2 + N 3
Aritmetička sredina zbira statističkih varijabli
Ovu osobinu ćemo ilustrovati na primjeru zbira dvije statističke varijable. Posmatrajmo za N domaćinstava podatke o njihovoj potrošnji ci i njihovoj štednji ši. Ako budžet domaćinstva i označimo sa bi za svako i možemo kompletirati sljedeću relaciju4:
bi = ci + ši ⇒ B = C + Š
b=
1 N
N
∑ bi = i =1
1 N
N
∑ (ci + ši ) = i =1
1 N
N
∑ ci + i =1
1 N
N
∑š i =1
i
=c +š
(2.19)
Aritmetička sredina zbira dvije statističke varijable je jednaka zbiru aritmetičkih sredina te dvije varijable. Dakle, ako imamo jednu statističku 4
52
Za označavanje modaliteta ili vrijednosti varijabli koristimo mala slova, a za označavanje statističkih varijabli koristimo velika slova.
Poglavlje 2. – Analiza i sinteza podataka
varijablu izraženu u obliku zbira dvije statističke varijable, njena aritmetička sredina je jednaka zbiru aritmetičkih sredina te dvije varijable. Ako je Z=X+Y, aritmetička sredina varijable Z je jednaka zbiru aritmetičkih sredina varijabli X i Y:
z=x+y
(2.20)
Ovu osobinu možemo generalizirati i zaključiti da je aritmetička sredina zbira n statističkih varijabli jednaka zbiru aritmetičkih sredina n statističkih varijabli. •
Aritmetička sredina linearne kombinacije statističkih varijabli
Linearnu kombinaciju statističkih varijabli definišemo sljedećom relacijom: yi = a + bxi
(2.21)
gdje su a i b parametri. Gornju relaciju možemo napisati u obliku Y = a+bX čija je aritmetička sredina jednaka:
y = a + bx
(2.22)
Navedenu osobinu možemo objasniti na sljedeći način. Ako sve opservacije pomnožimo jednim brojem tada će i aritmetička sredina biti pomnožena tim brojem. Ukoliko dodamo određeni broj svim opservacijama jedne serije, aritmetička sredina će biti uvećana za taj broj. Kada pomnožimo sve ocjene iz jednog predmeta sa 2 tada će i aritmetička sredina ocjena iz tog predmeta biti pomnožena sa 2. Ako dodamo 5 poena svim ocjenama iz jednog predmeta, aritmetička sredina ocjena iz tog predmeta se uvećava za 5 poena. Na ovaj način definisane su osobine aditivnosti i linearnosti aritmetičke sredine. Posebnu pažnju treba obratiti na izračunavanje aritmetičke sredine u slučaju intervalno grupisane distribucije sa stvarnim intervalima. 2.4.2. Geometrijska sredina Geometrijska sredina za serije negrupisanih podataka je jednaka N- tom korijenu iz proizvoda vrijednosti varijable i izračunava se prema sljedećoj formuli: 53
Statistika u ekonomiji i menadžmentu N
G = N x1 ⋅ x2 ⋅ .... ⋅ x N = N ∏ xi , xi > 0 , i = 1, N
(2.23)
i =1
Za izračunavanje geometrijske sredine jedne serije koriste se svi podaci i potrebno je da budu pozitivni. Logaritamski oblik ove funkcije praktičniji za primjenu dat je sljedećim izrazom:
log G =
1 N
N
∑ log x i =1
(2.24)
i
Konstatujemo da je logaritam geometrijske sredine varijable X jednak aritmetičkoj sredini logaritama njenih vrijednosti. Geometrijska sredina statističke distribucije frekvencije je jednaka: J
J
G = N x1f1 ⋅ x2f2 ⋅ .... ⋅ xJf J = N ∏ x j j , N = ∑ f J , x j > 0, j = 1, J f
j =1
(2.25)
j =1
Logaritamski oblik ponderisane geometrijske sredine je izražen sljedećom relacijom:
log G =
J 1 J log , f x N = fj ∑ j j ∑ N j =1 j =1
(2.26)
Geometrijska sredina se najčešće primjenjuje u slučajevima kada se pojave ponašaju po geometrijskoj progresiji, za izračunavanje prosječnih pokazatelja porasta i razvoja u dinamičkoj analizi pojava, za izračunavanje srednje vrijednosti vremenskih serija i kod lančanih indeksa. Geometrijska sredina izravnava odnose, tj. proporcionalne promjene između uzastopnih podataka u analiziranoj seriji. 2.4.3. Harmonijska sredina Harmonijska sredina se definiše kao recipročna vrijednost aritmetičke sredine recipročnih vrijednosti varijable X. Harmonijska sredina za seriju negrupisanih podataka se izračuna pomoću sljedećeg izraza:
54
Poglavlje 2. – Analiza i sinteza podataka
H=
N
=
N
1 ∑ i =1 xi
N 1 1 1 1 + + ... + + ... + x1 x2 xi xN
, xi ≠ 0
(2.27)
Harmonijska sredina za statističku distribuciju frekvencija je data izrazom: J
H=
∑ j =1 J
∑ j =1
J
fj
f + f 2 + ... + fi + ... + f J + = 1 = fi fJ f1 f 2 fj + + ... + + ... + x1 x2 xi xJ xj
∑f j =1 J
fj
∑x j =1
j
, xj ≠ 0
(2.28)
j
Postupak izračunavanja ove sredine je jednostavan. Poteškoća je u uočavanju slučajeva u kojima se može primijeniti. Izračunava se u slučaju kada su originalni podaci izraženi u vidu recipročnih veličina. Recipročne veličine se kreću u obrnutom pravcu od kretanja pojave koju izražavaju. Produktivnost rada je tipičan primjer primjene ove sredine jer veća produktivnost rada znači veću proizvodnju uz manji utrošak rada. Ako su sve vrijednosti varijable pozitivne, vrijedi sljedeća relacija odnosa izmedu tri analizirane potpune mjere srednje vrijednosti: min xi ≤ H ≤ G ≤ x < max xi
(2.29)
2.4.4. Kvadratna i kubna sredina Kvadratna sredina se izražava u sljedećem obliku: N
∑x
x2 =
2 i
i =1
(2.30)
N
Kubna sredina je data sljedećim izrazom: N
x3 =
3
∑x i =1
3 i
N
(2.31)
Odnos između pet prezentiranih sredina je sljedeći: min xi ≤ H ≤ G ≤ x ≤ x 2 ≤ x 3 < max xi
(2.32)
55
Statistika u ekonomiji i menadžmentu
2.4.5. Mod ili centar aktivnosti Mod je jedna od najstarijih pozicionih vrijednosti koja se jednostavno utvrđuje. Mod se definiše kao modalitet varijable koji se najčešće pojavljuje, tj. modalitet koji ima najveću frekvenciju. Najčešći su slučajevi unimodalnih serija. Međutim, potrebno je naglasiti da serija može biti bimodalna ili višemodalna ukoliko se u jednoj seriji nalazi više modaliteta koji imaju najvišu frekvenciju. Primjer 2.3. Određivanje moda Tabela 2.5. Nastavnici sa punim radnim vremenom na visokoškolskim ustanovama u Federaciji Bosne i Hercegovine u 2001/2002 godini Nastavnici Redovni profesor Vanredni profesor Docent Ostali Ukupno
Frekvencije u fj 332 248 251 50 881
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine, Federalni zavod za statistiku, Sarajevo, 2002.
Mod je, kao što smo već naglasili, modalitet varijable koji ima najveću frekvenciju. To je u našem primjeru modalitet redovni profesor. Grafički je vrlo jednostavno u ovom slučaju odrediti mod. 350 300 250 200 150 100 50 0
MOD
Redovni profesor Grafikon 2.7.
Vanredni profesor
Docent
Ostali
Nastavnici na visokoškolskim institucijama u Federaciji Bosne i Hercegovine u 2001/2002.
U slučaju intervalno grupisanih distribucija, poslije određivanja modalnog intervala koji ima najveću frekvenciju (ili najveću frekvenciju po jedinici 56
Poglavlje 2. – Analiza i sinteza podataka
amplitude u slučaju da intervali nemaju istu amplitudu), mod možemo izračunati linearnom interpolacijom korištenjem sljedeće formule:
M o = xMo + aMo ⋅
f 2 − f1 ( f 2 − f1 ) + ( f 2 − f 3 )
(2.33)
gdje je: xMo lijeva granica modalnog intervala,
aMo f1 f2 f3
amplituda (širina) modalnog intervala, frekvencija prethodnog intervala, frekvencija modalnog intervala, frekvencija narednog intervala.
Tabela 2.6. Starosna struktura stanovništva Federacije BiH u 2000. godini Starosna struktura xj 0-14 15-64 65 i više Ukupno
Amplituda intervala aj 15 50 26 -
Broj stanovnika fj 588 210 1 896 277 316 513 2 801 000
Gustoća intervala ili korigovana frekvencija fj / a j 39 214 37 925,5 12 173,6 -
U ovom primjeru intervali nemaju jednake amplitude pa je za utvrđivanje modalnog intervala potrebno izračunati broj stanovnika po jedinici amplitude (dijeli se frekvencija broj stanovnika sa amplitudom intervala) ili gustoću intervala da bi se odredila modalna klasa. U ovom slučaju modalna klasa je klasa od 0 do 14. U slučaju da koristimo relativne frekvencije formula je analogna gore navedenoj, osim što umjesto apsolutne frekvencije fj koristimo relativnu frekvenciju pj. Postoji i sljedeća formula pomoću koje možemo utvrditi aproksimativnu vrijednost moda u unimodalnim i nesimetričnim distribucijama: Mo ≈ 3Me-2
(2.34)
Prema ovom izrazu, mod je približno jednak tri medijane umanjene za dva. 57
Statistika u ekonomiji i menadžmentu
Modalna klasa zavisi od grupisanja u intervale koje smo prethodno izvršili. Kao i uvijek prije i poslije određivanja moda u svakom konkretnom slučaju treba se upitati: Da li ovaj pokazatelj ima smisla i da li nam omogućava ili ne dodatnu korisnu informaciju? 2.4.6. Medijana ili centar pozicije Medijana spada u pozicione srednje vrijednosti. Medijana je vrijednost obilježja koja u seriji uređenoj po veličini (rastućem ili opadajućem redosljedu) zauzima centralnu poziciju (rang) i dijeli seriju na dva jednaka dijela. Njena teorijska kumulativna frekvencija je 50%. Dakle, teorijski 50% podataka ima vrijednost manju ili jednaku medijani i preostala polovina podataka vrijednosti veće od medijane. Medijana je poziciona srednja vrijednost i za izračunavanje medijane nisu bitne vrijednosti svih podataka nego njihov rang u seriji. 2.4.6.1. Određivanje medijane u uređenoj seriji Određivanje medijane zavisi od broja podataka u seriji. Analiziraćemo slučajeve određivanja medijane ukoliko je broj podataka neparan i ukoliko je broj podataka paran. •
Neparan broj podataka
U uređenoj seriji {x(i); (i)=1,..., N}, gdje (i) predstavlja rang podatka, a N neparan broj podataka, medijana se izračunava koristeći sljedeću formulu:
Me = x⎛ N +1 ⎞
(2.35)
⎜ ⎟ ⎝ 2 ⎠
Uređena statistička serija od 11 podataka: 1 2 3 4 5 6 7 8 9 42 48 53 58 60 64 68 79 88
Rang (i): Podaci (xi):
Me = x⎛ N +1 ⎞ = x ⎛ 9 +1 ⎞ = x (5) = 60 ⎜ ⎟ ⎝ 2 ⎠
58
⎜ ⎟ ⎝ 2 ⎠
Poglavlje 2. – Analiza i sinteza podataka
•
Paran broj podataka
U uređenoj seriji {x(i); (i)=1,..., N}, gdje (i) predstavlja rang podatka, a N paran broj podataka medijana se izračunava koristeći sljedeću formulu: x⎛ N ⎞ + x⎛ N ⎞ ⎜ +1⎟ ⎝2 ⎠
⎜ ⎟ ⎝2⎠
Me =
(2.36)
2
U uređenoj seriji veličine 10: 1 2 3 4 5 6 7 8 9 10 42 48 53 58 60 64 68 79 88 90
Rang (i): Podaci (xi):
x⎛ N ⎞ + x⎛ N Me =
⎞ ⎜ +1 ⎟ ⎝ 2 ⎠
⎜ ⎟ ⎝ 2⎠
2
x⎛ 10 ⎞ + x⎛ 10 =
⎞ ⎜ +1 ⎟ ⎝ 2 ⎠
⎜ ⎟ ⎝ 2 ⎠
2
=
x(5) + x( 6) 2
=
60 + 64 = 62 2
2.4.6.2. Određivanje medijane za statističku distribuciju frekvencija Tabela 2.7. Statistička distribucija frekvencija završenih stanova prema broju soba u Federaciji Bosne i Hercegovine u 2004. g. Broj soba xj 1 2 3 4 5 Ukupno
Frekvencije fj 184 238 115 35 2 574
Rang (i) 1 - 184 185 - 422 423 - 537 538 - 572 573 - 574
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str.157.
Medijana je jednaka aritmetičkoj sredini modaliteta koji zauzima rang 287 (574/2=287) i modaliteta koji zauzima rang 288.
x⎛ N ⎞ + x⎛ N Me =
⎞ ⎜ +1⎟ ⎝2 ⎠
⎜ ⎟ ⎝2⎠
2
=
x( 287 ) + x( 288) 2
=
2+2 =2 2 59
Statistika u ekonomiji i menadžmentu
U seriji grupisanoj u intervale, medijana se računa na sljedeći način:
N − S Me−1 Me = xMe + aMe ⋅ 2 f Me
(2.37)
gdje je: lijeva granica medijanskog intervala, xMe amplituda medijanskog intervala, aMe frekvencija medijanskog intervala, fMe SMe-1 kumulativna frekvencija predmedijanskog intervala, N zbir svih frekvencija. Praktičnije je računati medijanu ukoliko koristimo kumulativne relativne frekvencije:
Me = xMe + a Me ⋅ = xMe
F ( Me) − FMe−1 p Me
0,50 − FMe−1 + a Me ⋅ p Me
(2.38)
gdje je: lijeva granica medijanskog intervala, xMe amplituda medijanskog intervala aMe
FMe FMe-1 pMe
teorijska kumulativna relativna frekvencija medijane, kumulativna relativna frekvencija predmedijanskog intervala, relativna frekvencija medijanskog intervala.
Medijana se grafički može odrediti na osnovu kumulativnog dijagrama frekvencija. Kumulativnu krivu dobijemo spajanjem kumulativnih frekvencija koje odgovaraju svakom modalitetu ili u slučaju intervalno grupisanih serija gornjim granicama svakog intervala. 2.4.6.3. Medijana i kumulativna frekvencija U uređenoj seriji (klasiranoj po rastućem ili opadajućem redosljedu podataka) broj podataka koji prethode medijani je jednak broju podataka 60
Poglavlje 2. – Analiza i sinteza podataka
koji se nalaze poslije medijane. Na osnovu ove definicije mogli bismo zaključiti da je kumulativna frekvencija medijane uvijek jednaka 50 %. Provjerićemo da li je to tačno na jednom primjeru za koji smo neophodne podatke kompletirali i prezentirali u tabeli 2.8. Tabela 2.8. Određivanje kumulativne frekvencije medijane Opservacije Rang Frekvencije Kumulativne Relativne Kumulativne fi (i) frekvencije frekvencije relativne x(i) Si frekvencije pi Fi
42 48 50 52 54 58 58 58 64 68 70 Ukupno
1 2 3 4 5 6 7 8 9 10 11 -
1 1 1 1 1 1 1 1 1 1 1 11
1 2 3 4 5 6 7 8 9 10 11
0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,99≈1,00
0,09 0,18 0,27 0,36 0,45 0,54 0,63 0,72 0,81 0,90 0,99≈1,00
Me = x⎛ N +1 ⎞ = x⎛ 11+1 ⎞ = x( 6) = 58 ⎜ ⎟ ⎝ 2 ⎠
⎜ ⎟ ⎝ 2 ⎠
Konstatujemo da 5 podataka prethodi medijani koja je jednaka 58 i 5 podataka se nalazi poslije medijane. Uočavamo da se podatak 58 ponavlja tri puta i da je kumulativna rastuća frekvencija ovog modaliteta jednaka 0,72 (dakle 72%), što je znatno više od 50% koliko je teorijska kumulativna frekvencija medijane. Dakle, u slučaju kada jedna vrijednost zauzima centralni rang u seriji, ali i više ostalih rangova, odgovarajuća kumulativna frekvencija se može znatno razlikovati od teorijski pretpostavljene.
61
Statistika u ekonomiji i menadžmentu
2.4.6.4. Karakteristike medijane Medijana je parametar centralne pozicije u seriji na koju ekstremne vrijednosti nemaju uticaja jer medijana ne zavisi od vrijednosti podataka nego od njihovog ranga, pozicije u seriji. Ako su npr. greškom evidentirane neke ekstremne vrijednosti one neće uticati na medijanu. Posmatrajmo dvije uređene serije veličine 11: Rang (i): Varijabla X1: Varijabla X2:
1 2 3 4 5 6 7 8 9 10 11 42 48 50 52 54 58 59 63 74 78 80 42 48 50 52 54 58 59 63 74 78 200
U oba slučaja medijana je jednaka 58. Kako u uređenoj seriji polovina podataka prethodi medijani i polovina podataka se nalazi poslije medijane, medijana se naziva također kvantil reda 0,5 (ili reda 50%). 2.4.7. Kvantili U uređenoj seriji {x(i)} kvantil reda p koji označavamo sa xp je jednak vrijednosti varijable za koju postoji proporcija opservacija koje su jednake ili manje od xp i komplementarna proporcija (1-p) opservacija koje su veće od xp:
F (xp ) ≤ N ⋅ p
i F * ( x p ) > N (1 − p)
0 < p <1
(2.39)
ili u apsolutnim kumulativnim frekvencijama
S(xp ) ≤ N ⋅ p
i S* ( x p ) > N (1 − p )
0 < p <1
(2.40)
2.4.7.1. Određivanje kvantila u uređenoj seriji Ako u uređenoj seriji postoji vrijednost xj za koju je
S j −1 < N ⋅ p < S j , tada je x p = x j 62
(2.41)
Poglavlje 2. – Analiza i sinteza podataka
uz pretpostavku da je S=0 ako je j=1. Ako u uređenoj seriji postoji vrijednost xj takva da Sj=Np tada je vrijednost kvantila reda p jednaka:
xp =
x j + x j +1
(2.42)
2
2.4.7.2. Određivanje kvantila u intervalno grupisanoj seriji Poslije određivanja kvantilne klase, kvantile određujemo korištenjem sljedeće relacije:
x p = xq + a q ⋅
Np − S q −1 fq
(2.43)
gdje je: xq donja granica kvantilnog intervala aq Sqfq
amplituda kvantilnog intervala 1
kumulativna frekvencija predkvantilnog intervala frekvencija kvantilnog intrevala
Koristeći kumulativne relativne frekvencije kvantile izračunavamo koristeći sljedeći izraz:
x p = xq + aq ⋅
F ( x p ) − Fq −1 pq
(2.44)
2.4.7.3. Kvartili Kvartili se označavaju sa Q1, Q2, Q3 i predstavljaju kvantile reda p=1/4, p=1/2 i p=3/4 ili reda 25%, 50% i 75%. Kvartili su vrijednosti varijable koji distribuciju uređenu po veličini dijele na 4 jednaka dijela. U uređenoj seriji prvi kvartil Q1 je jednak modalitetu vrijednosti varijable od kojeg 25% elemenata skupa ima jednaku ili manju vrijednost i 75% elemenata skupa ima veću vrijednost posmatranog obilježja. Dakle, 25% opservacija prethode Q1 i 75% opservacija se nalaze poslije Q1. Medijana je jednaka drugom kvartilu Me=Q2. 63
Statistika u ekonomiji i menadžmentu
•
Određivanje kvartila u intervalno grupisanoj distribuciji
U intervalno grupisanoj distribuciji prvi kvartil određujemo koristeći sljedeći izraz:
N − SQ1 −1 Q1 = xQ1 + aQ1 ⋅ 4 f Q1
(2.45)
gdje je: x Q1 donja granica kvartilnog intervala a Q1 amplituda kvartilnog intervala S Q1-1 kumulativna apsolutna frekvencija pretkvartilnog intervala f Q1 apsolutna frekvencija kvartilnog intrevala N broj podataka u seriji Praktičnije je utvrditi prvi kvartil koristeći kumulativne relativne frekvencije:
Q1 = xQ1 + aQ1 ⋅
F (Q1 ) − FQ1 −1
= xQ1 + aQ1 ⋅
pQ1 0,25 − FQ1 −1
(2.46)
pQ1
gdje je: x Q1 donja granica kvartilnog intervala a Q1 amplituda kvartilnog intervala FQ1 kumulativna relativna teorijska frekvencija FQ1-1 kumulativna relativna frekvencija pretkvartilnog intervala relativna frekvencija kvartilnog intrevala p Q1 N broj podataka u seriji Za određivanje trećeg kvartila u intervalno grupisanoj distribuciji koristimo sljedeće izraze zavisno od toga da li smo računali apsolutne kumulativne frekvencije:
3N − S Q3 −1 Q3 = xQ3 + aQ3 ⋅ 4 f Q3 64
(2.47)
Poglavlje 2. – Analiza i sinteza podataka
gdje je: x Q3 donja granica kvartilnog intervala a Q3 amplituda kvartilnog intervala S Q3-1 kumulativna apsolutna frekvencija pretkvartilnog intervala apsolutna frekvencija kvartilnog intrevala f Q3 N broj podataka u seriji ili relativne kumulativne frekvencije:
Q3 = xQ3 + aQ3 ⋅
F (Q3 ) − FQ3 −1
= xQ3 + aQ3 ⋅
pQ3 0,75 − FQ3 −1
(2.48)
pQ3
gdje je: x Q3 donja granica kvartilnog intervala amplituda kvartilnog intervala a Q3 FQ3 kumulativna relativna teorijska frekvencija FQ3-1 kumulativna relativna frekvencija pretkvartilnog intervala relativna frekvencija kvartilnog intrevala p Q3 N broj podataka u seriji 2.4.7.4. Decili Decili se označavaju sa D1, D2, …..D9, predstavljaju kvantile reda 10%, 20%, ..., 90%. Ima ih devet i dijele uređenu statističku seriju na 10 jednakih dijelova. U uređenoj seriji 20% opservacija prethodi D2, a 80% opservacija se nalazi poslije D2. 2.4.6.5. Centili Centili se označavaju sa C1, C2, ..C95, … C99 i predstavljaju kvantile reda 1%, 2%, .., 95%, ..., 99%. Ima ih, dakle, 99 i dijele uređenu statističku seriju na 100 jednakih dijelova. U uređenoj seriji 1% podataka prethodi C1 i 99% podataka slijedi poslije C1. Kao i za medijanu, kumulativna frekvencija kvantila reda p % je vrlo blizu p % kada su podaci istovremeno mnogobrojni i različiti. 65
Statistika u ekonomiji i menadžmentu
Primjer 2.4. U sljedećem primjeru ćemo analizirati i komentarisati medijanu i decile. Ako je statistička tabela prezentovana u sljedećem obliku, normalno je pretpostaviti da su sve kumulativne frekvencije vrlo blizu teorijskih vrijednosti za svaki od analiziranih parametara. Tabela 2.9. Distribucija neto plata u preduzećima u Francuskoj u 2000.g. Decili
D1 D2 D3 D4 Medijana=D5 D6 D7 D8 D9
Godišnje plate u eurima 10 780 12 490 13 930 15 420 17 130 19 200 22 030 26 470 35 700
Kumulativne frekvencije u% 10 20 30 40 50 60 70 80 90
Izvor: Tableau d’économie francaise (TEF) 2002-2003, INSEE, Paris, str. 91.
Medijanska plata je 17130 €. To znači da je 50% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako 17130 €. Vrijednost sedmog decila nam daje informaciju da je 70% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 22030€. 305 godišnjih neto plata je bilo veće od 22030€.
2.5. MJERE DISPERZIJE ILI VARIJACIJE Postoje dva pristupa konstrukciji parametara disperzije: 1. Mjerenje odstupanja između dva podatka u seriji ili između dva parametra centralne tendencije, 2. Mjerenje odstupanja podataka od nekog reprezentativnog parametra. Mjere disperzije možemo klasificirati na apsolutne i relativne. Apsolutne mjere disperzije su: raspon varijacije, interkvantilno apsolutno odstupanje, srednje apsolutno odstupanje, varijansa i standardna devijacija. 66
Poglavlje 2. – Analiza i sinteza podataka
Relativne mjere disperzije su: interkvantilna relativna odstupanja, koeficijent varijacije i koeficijent kvartilne devijacije. 2.5.1. Apsolutne mjere disperzije 2.5.1.1. Raspon varijacije Raspon varijacije predstavlja apsolutno odstupanje između maksimalne i minimalne vrijednosti varijable: RV = xmax-xmin
(2.49)
Ovaj pokazatelj je jednostavan za računanje i tumačenje, ali ima ozbiljan nedostatak jer uzima u obzir samo dvije, i to ekstremne vrijednosti serije i ne daje informaciju o varijabilitetu pojava unutar serije. 2.5.1.2. Interkvantilno apsolutno odstupanje Da bi se otklonio nedostatak raspona varijacije, konstruisani su parametri koji «eliminišu» određenu proporciju opservacija na početku i na kraju serije, dakle određenu proporciju najmanjih i najvećih vrijednosti. Interdecilno odstupanje D9-D1 eliminiše 10% opservacija na početku serije i 10% opservacija na kraju serije. Na taj način dobijamo mjeru disperzije koja se odnosi na 80% centralnih opservacija. Najčešće korištena interkvantilna odstupanja su: Interkvartilno odstupanje Interdecilno odstupanje Intercentilno odstupanje
IQ=Q3-Q1 ID=D9-D1 IC=C99-C1
(2.50) (2.51) (2.52)
Interkvantilna odstupanja treba primjenjivati u zavisnosti od analiziranog problema i potrebe da se detaljnije analizira jedan dio distribucije. Najčešće se primjenjuje interkvartilno odstupanje. 2.5.1.3. Box Plot Box plot je grafička prezentacija koja omogućava istovremeno posmatranje pozicionih mjera srednjih vrijednosti i interkvartilnog odstupanja kao mjere 67
Statistika u ekonomiji i menadžmentu
disperzije. Ovaj grafički prikaz omogućava vizuelno pozicioniranje 50% vrijednosti podataka unutar box-a i na taj način omogućava analizu disperzije. Za konstukciju Box Plota treba izračunati vrijednosti tri kvartila. Nacrtamo pravougaonik (box - kutiju) čiju osnovu predstavlja interkvartilno odstupanje. Bočne strane su određene vrijednostima prvog i trećeg kvartila. Pravougaonik je presječen na dva dijela medijanom. Od desne i lijeve strane pravougaonika povučemo linije do maksimalne i minimalne vrijednosti varijable. Box plot nam omogućuje da sagledamo na jednostavan i ilustrativan način osnovne karakteristike serije.
25%
25%
25%
25%
xmin
xmax Q1
Grafikon 2.8.
Q3
Me Box plot
U slučaju da serija sadrži netipične i ekstremne vrijednosti krakovi postaju previše dugi što otežava interpretaciju. U tim slučajevima se preporučuje računanje graničnih vrijednosti prema relaciji: a1=Q1–1,5(Q3-Q1) a2=Q3+1,5(Q3-Q1)
(2.53)
Ove granice su udaljene od bočnih strana pravougaonika za 1,5 njegovu dužinu. Praktična iskustva su pokazala da se većina serija koje ne sadrže netipične vrijednosti nalazi u intervalu (a1, a2). Mogu se računati i granice udaljene od pravougaonika za dvije ili tri njegove dužine da bi se odredile netipične ili ekstremne vrijednosti.
68
Poglavlje 2. – Analiza i sinteza podataka
2.5.1.4. Srednje apsolutno odstupanje Srednje apsolutno odstupanje spada u mjere disperzije koje se konstruišu kao odstupanje modaliteta od nekog reprezentativnog parametra. Da bismo konstruisali srednje apsolutno odstupanje, analizirat ćemo četiri sljedeće faze. Faza 1: Izabrati reprezentativni pokazatelj Za reprezentativni pokazatelj odabiremo aritmetičku sredinu zbog njenih karakteristika i prednosti u odnosu na ostale parametre srednje vrijednosti i zbog osobine koju možemo provjeriti koristeći teoremu König-Huygens-a. Odaberimo bilo koji parametar centralne tendencije koji možemo označiti sa k. Aritmetička sredina odstupanja opservacija od tog parametra je jednaka: 1 N
N
∑ ( xi − k )
2
=
i =1
=
1 N 1 N
1 = N =
1 N
N
∑(x
− x + x − k)
i
i =1 N
∑ ⎡⎣( x
i
i =1 N
∑ ⎡⎣( x
i
i =1
2
− x ) + ( x − k )⎤ ⎦
2
(2.54)
− x ) + 2 ( x − k )( xi − x ) + ( x − k ) ⎤ ⎦ 2
N
2
∑ ( xi − x ) + 2 ( x − k ) 2
i =1
1 ⎡N ⎤ 2 ( xi − x )⎥ + ( x − k ) ∑ ⎢ N ⎣ i =1 ⎦
⎛ ⎞ Kako je drugi član u gornjem izrazu jednak nuli ⎜ ∑ ( xi − x ) = 0 ⎟ sljedi: ⎝ i ⎠
1 N
N
2 ∑ ( xi − k ) = i =1
1 N
N
∑ (x i =1
− x ) + (x − k ) 2
i
2
(2.55)
Prvi član na desnoj strani izraza ne zavisi od k i predstavlja varijansu varijable X. Slijedi da gornji izraz ima minimalnu vrijednost kada je:
(x − k)
2
= 0, odnosno kada je x = k
(2.56)
Konstatujemo da je aritmetička sredina najbolji reprezentativni pokazatelj centralne tendencije jer su vrijednosti odstupanja opservacija od aritmetičke 69
Statistika u ekonomiji i menadžmentu
sredine manje nego odstupanja opservacija od bilo kojeg drugog parametra centralne tendencije. Faza 2: Mjeriti odstupanje između svakog modaliteta i aritmetičke sredine Za svaki modalitet računamo odstupanje: yi = xi - x Faza 3: Da bismo sintetizirati u jednom broju poziciju svih izračunatih odstupanja, računamo njihovu aritmetičku sredinu. Ovako izračunata aritmetička sredina odstupanja modaliteta od njihove aritmetičke sredine je jednaka nuli zbog toga što se anuliraju pozitivna i negativna odstupanja od aritmetičke sredine. Faza 4: Da bismo izbjegli anuliranje pozitivnih odstupanja od aritmetičke sredine sa negativnim odstupanjima od aritmetičke sredine, računamo za svaki modalitet apsolutnu vrijednost odstupanja od aritmetičke sredine: zi = ⏐xi - x ⏐ Završna faza je utvrđivanje prosječnog apsolutnog odstupanja koje je jednako aritmetičkoj sredini apsolutnih odstupanja između modaliteta i njihove aritmetičke sredine. Formule za računanje prosječnog apsolutnog odstupanja MAD5: • za negrupisanu seriju:
•
1 N
N
∑x i =1
70
i =1
xi − x
(2.57)
i
=
1 ( x1 + x2 ...... + xN ) N
(2.58)
za statističku distribuciju frekvencija:
MAD =
5
N
∑
za uređenu seriju:
x= •
1 N
=
MAD
1 N
J
∑ j =1
J
f j x j − x , gdje je N = ∑ f j
(2.59)
j =1
MAD je skraćenica od engleskog izraza sa srednje apsolutno odstupanje - Mean Apsolutely Deviation.
Poglavlje 2. – Analiza i sinteza podataka
•
za statističku distribuciju relativnih frekvencija: J
J
MAD = ∑ p j x j − x , gdje je
∑p
j =1
j =1
j
=1
(2.60)
Pri računanju treba primijeniti odgovarajuću formulu u zavisnosti od raspoloživih podataka. Srednje apsolutno odstupanje je parametar koji je jednostavno objasniti. Veća vrijednost srednjeg apsolutnog odstupanja ukazuje na veću disperziju podataka u odnosu na njihovu aritmetičku sredinu. Srednje apsolutno odstupanje ne može biti jednako nuli, osim u slučaju kad su svi modaliteti jednaki, ali tada se problem sinteze podataka ne postavlja. Ovaj parametar se rijetko koristi i ima više teorijsku nego praktičnu vrijednost. 2.5.1.5. Varijansa Za konstrukciju varijanse primjenjujemo četiri faze. Prve tri faze su iste kao faze koje smo analizirali za konstrukciju srednjeg apsolutnog odstupanja (MAD). Postupak za rješavanje četvrte faze je različit. Da bismo izbjegli anuliranje pozitivnih odstupanja od aritmetičke sredine sa negativnim odstupanjima od aritmetičke sredine, za svaku opservaciju računamo kvadratno odstupanje od aritmetičke sredine (xi - x )2 i zatim računamo njihovu aritmetičku sredinu. Varijansa je jednaka aritmetičkoj sredini kvadrata odstupanja između modaliteta i njihove aritmetičke sredine. Formule za računanje varijanse: • za negrupisanu seriju:
Var ( X ) = σ X2 = •
1 n (xi − x )2 ∑ n i =1
(2.61)
za uređenu seriju:
Var ( X ) = σ X2 =
1 N
∑ (x N
( i ) =1
(i )
− x)
2
(2.62)
71
Statistika u ekonomiji i menadžmentu
•
za statističku distribuciju frekvencija:
Var ( X ) = σ X2 = •
1 N
∑ f (x J
j =1
j
− x)
2
j
(2.63)
za statističku distribuciju relativnih frekvencija:
Var ( X ) = σ X2 = ∑ p j (x j − x ) , gdje je J
2
j =1
J
∑p j =1
j
=1
(2.64)
Za izračunavanje varijanse treba primijeniti odgovarajuću formulu zavisno od raspoloživih podataka. U tabeli 2.10. ilustrovat ćemo faze konstrukcije i utvrđivanje srednjeg apsolutnog odstupanja i varijanse. Tabela 2.10. Primjer postupka konstrukcije srednjeg apsolutnog odstupanja i varijanse Modaliteti xi
Odstupanje modaliteta od aritmetičke sredine
di = ( xi − x ) 20 10 30 40 60 80 x =40
Apsolutna odstupanja
bi = xi − x
-20 -30 -10 0 20 40
20 30 10 0 20 40
d =0
b = 20
Kvadrat odstupanja modaliteta od aritmetičke sredine
ki = ( xi − x ) 2 400 900 100 0 400 1600
k = 566, 66
Na osnovu rezultata prezentovanih u tabeli 2.10. konstatujemo da je zbir odstupanja modaliteta od aritmetičke sredine jednak nuli. Srednje apsolutno odstupanje je jednako 20, a varijansa 566,66. Za primjenu je praktičnija razvijena formula varijanse. Dokazaćemo izvođenje razvijene formule prema prema Königu za negrupisanu seriju:
72
Poglavlje 2. – Analiza i sinteza podataka
σ X2 =
1 N
σ X2 =
1 N
σ X2 =
1 N
σ X2 =
1 N
σ x2 =
1 N
1 2 ∑ (xi − x ) = ∑ (xi2 − 2 xi x + x 2 ) N
N
N
i =1
N
∑ xi2 − i =1 N
∑x i =1 N
2 i
∑x i =1
N
∑x i =1
−
i =1
2x N 1 xi + ∑ N i =1 N
N
∑x
2
i =1
2x 1 Nx + Nx 2 N N
2 i
− 2x 2 + x 2
2 i
− x2
(2.65)
σ x2 = x 2 − x 2 Razvijene formule varijanse za statističku distribuciju frekvencija i relativnih frekvencija su jednake6:
σ x2 =
1 N
J
∑f j =1
j
x 2j − x 2
J
σ = ∑ p j x 2j − x 2 2 x
(2.66) (2.67)
j =1
2.5.1.5.1. Osobine varijanse Osobine varijanse možemo formalizirati na sljedeći način: • Ako svakoj opservaciji dodamo isti broj, varijansa se neće promijeniti: Var (X+b)=VarX •
Ako svaki podatak u posmatranoj seriji pomnožimo sa nekim brojem a, varijansa će biti pomnožena sa a2: Var (aX)=a2VarX
6
(2.68)
(2.69)
Ove dvije formule se mogu izvesti analogno dokazu za negrupisanu seriju.
73
Statistika u ekonomiji i menadžmentu
•
Dvije prethodne osobine možemo istovremeno posmatrati i izraziti sljedećom relacijom: Var (aX+b)=a2VarX
•
(2.70)
Osobine agregiranja varijanse:
Ako su za dvije statističke serije poznati sljedeći podaci N1 , x1 , σ 12 i N 2 , x2 , σ 22 , varijansu globalne serije utvrđujemo koristeći sljedeću relaciju:
(
)
(
2
N σ 2 + N 2σ 22 N1 x1 − x + N 2 x2 − x + σ = 1 1 N1 + N 2 N1 + N 2 2
)
2
(2.71)
Prvi član na desnoj strani date relacije predstavlja ponderisanu aritmetičku sredinu varijansi dvije serije i naziva se varijansa u serijama. Drugi član predstavlja varijansu aritmetičkih sredina i naziva se varijansa između serija. Ovo pravilo možemo generalizirati u slučajevima agregiranja (ili dekompozicije) više statističkih serija. 2.5.1.6. Standardna devijacija Varijansa je parametar disperzije čija se numerička vrijednost ne može korektno objasniti, ali koja posjeduje analizirane osobine računanja. Zbog toga definišemo standardnu devijaciju čija se numerička vrijednost može konkretno objasniti, ali ona nema osobine računanja koje smo pokazali za varijansu. Standardna devijacija je najznačajnija mjera disperzije opšteprihvaćena u statističkoj analizi i predstavlja prosječno odstupanje vrijednosti numeričke varijable od njene aritmetičke sredine. Standardna devijacija je definisana kao pozitivni kvadratni korijen iz varijanse:
σ X = Var ( X ) = σ X2 =
1 N
N
∑ (x i =1
i
− x)
2
(2.72)
Manje vrijednosti standardne devijacije ukazuju na manju disperziju vrijednosti varijable od aritmetičke sredine i na homogeniju seriju. Standardna devijacija se izražava u istoj jedinici mjere kao i posmatrana varijabla. 74
Poglavlje 2. – Analiza i sinteza podataka
U našem primjeru, u tabeli 2.10. varijansa iznosi 566,66. Standardna devijacija je jednaka 23,8. Ova vrijednost ima konkretno ekonomsko značenje i pokazuje da podaci u prosjeku odstupaju od aritmetičke sredine za 23,8. Ostale formule za izračunavanje standardne devijacije u zavisnosti od raspoloživih podataka su:
1 N
σ X = σ X2 = σ x = σ x2 = σ x = σ x2 =
1 N
N
∑ xi 2 − x 2 i =1
J
∑f j =1
J
∑p x j =1
(2.73)
j
2 j
x 2j − x 2
(2.74)
− x2
(2.75)
j
2.5.2. Relativne mjere disperzije 2.5.2.1. Interkvantilna relativna odstupanja Interkvantilna relativna odstupanja dobijamo tako što u odnos stavimo odgovarajuće kvantile. Najčešća interkvantilna relativna odstupanja su: •
interkvartilno odstupanje izraženo odnosom trećeg i prvog kvartila Q3 / Q1
•
interkvartilno odstupanje
•
interdecilno odstupanje izraženo odnosom devetog i prvog decila D9 / D1 intercentilno odstupanje C99 / C1
•
Q3 − Q1 Q1
Interkvantilna relativna odstupanja su parametri disperzije i veća vrijednost ovih parametara ukazuje na veću disperziju. Interkvantilni relativni pokazatelji su posebno korisni za poređenje disperzije serija koje su izražene u različitim jedinicama mjere, npr. plate u eurima i KM. 75
Statistika u ekonomiji i menadžmentu
2.5.2.2. Koeficijent kvartilne devijacije Koeficijent kvartilne devijacije je relativni pokazatelj disperzije i definišemo ga na sljedeći način:
k QD =
Q3 − Q1 , Q3 + Q1
0 ≤ k QD ≤ 1
(2.76)
Vrijednost ovog koeficijenta se kreće u intervalu od 0 do 1, ili od 0 do 100% ako ga izrazimo u procentima. Ako je vrijednost ovog koeficijenta jednaka nuli tada nema disperzije.Veća vrijednost ovog koeficijenta ukazuje na veću disperziju. 2.5.2.3. Koeficijent varijacije Standardna devijacija je mjera varijabilnosti izražena u istoj jedinici mjere kao i varijabla X. Zbog toga je ne možemo koristiti za poređenje varijabiliteta serija izraženih u različitim jedinicama mjere. Da bi se izbjegao taj nedostatak i mogle porediti različite serije konstruisana je relativna mjera disperzije kao odnos standardne devijacije i aritmetičke sredine. Tako konstruisan pokazatelj nazivamo koeficijent varijacije. Koeficijent varijacije je dakle relativna mjera disperzije definisana odnosom između standardne devijacije i aritmetičke sredine.
kV =
σ x
; odnosno kV =
σ x
⋅ 100
(2.77)
Koeficijent varijacije je neimenovani broj i uobičajeno je da ga izražavamo u procentima. Koeficijent varijacije pokazuje koliko jedinica standardne devijacije u prosjeku otpada na svaku jedinicu aritmetičke sredine. Izražen u procentima pokazuje koliko procentualno iznosi standardna devijacija od aritmetičke sredine. Koristimo ga za poređenje disperzije u slučajevima kada su varijable izražene u različitim jedinicama mjere i kada su aritmetičke sredine varijabli različite. 2.5.2.4. Standardizovane varijable Standardna devijacija je parametar koji opisuje disperziju statističke serije kao cjeline. Za utvrđivanje relativnog položaja modaliteta varijable u seriji
76
Poglavlje 2. – Analiza i sinteza podataka
primjenjuje se standardizovana vrijednost varijable koja je definisana sljedećim izrazom:
zi =
xi − x
σ
, i = 1, 2,..., N
(2.78)
Standardizovana varijabla je jednaka količniku između odstupanja vrijednosti varijable od aritmetičke sredine i standardne devijacije. Standardizovana varijabla je relativan pokazatelj pogodan za poređenje položaja podataka u različitim serijama. Standardizovana varijabla je linearna transformacija vrijednosti varijable X. Aritmetička sredina standardizovane varijable je jednaka nuli:
⎛ xi − x ⎞ ⎟ 1 σ ⎠ i =1 i =1 = z= = N N Nσ N
N
∑ z ∑ ⎜⎝ i
N
∑ (x − x ) = 0
(2.79)
i
i =1
Varijansa i standardna devijacija standardizovane varijable su jednake jedinici: N
1 σ = N
∑ (z − z )
2 z
=
1
σ
i
i =1
2
⋅
1 N
2
1 = N
N
∑(x − x ) i =1
i
2
N
∑ (z ) i =1
i
2
1 = N
N
∑ i =1
=1
2
⎛ xi − x ⎞ ⎜ σ ⎟ = ⎝ ⎠ (2.80)
σ z = σ z2 = 1 = 1 2.5.3. Čebiševa teorema Čebiševa teorema omogućava istovremeno tumačenje aritmetičke sredine i standardne devijacije. Prema teoremi Čebiševa, u nekoj distribuciji ima najmanje (1-1/k2) modaliteta koje odstupaju od aritmetičke sredine za k puta standardna devijacija:
P ( x − kσ < X < x + kσ ) > 1 −
1 , k >1 k2
(2.81)
Primjenu ove teoreme ilustrujemo na sljedećem primjeru. Pretpostavimo da je poznata prosječna mjesečna plata 460 eura, standardna devijacija 180 eura i k=2. Primjenom Čebiševe teoreme dobijamo: 77
Statistika u ekonomiji i menadžmentu
x ± kσ = 460 ± 2 ⋅ 80 = [300 ; 620] 1 1 1 − 2 = 1 − 2 = 75% k 2 Prema teoremi Čebiševa, najmanje 75% plata ove distribucije se nalaze u intervalu između 300 i 620 eura. Primjena ove teoreme omogućava procjenu moguće vrijednosti neke varijable i raspona varijacije u kojem se očekuje određena proporcija modaliteta. U pravilu, vrijednosti varijable rijetko odstupaju od aritmetičke sredine za više od tri standardne devijacije. Ova teorema se koristi za definisanje karakterističnih intervala u inferencijalnoj statistici. 2.5.4. Primjer grafičke sinteze parametara pozicije i disperzije Na osnovu podataka datih u tabeli 2.11. predstavit ćemo grafičku sintezu parametara pozicije i disperzije. Tabela 2.11. Distribucija neto plata u preduzećima u Francuskoj u 2000.g. grupisana prema decilima Decili
D1 D2 D3 D4 Medijana=D5 D6 D7 D8 D9
Godišnje plate u eurima xj 10 780 12 490 13 930 15 420 17 130 19 200 22 030 26 470 35 700
Kumulativne frekvencije Fj u % 10 20 30 40 50 60 70 80 90
Izvor: Tableau d’économie francaise (TEF) 2002-2003, INSEE, Paris, str. 91.
Na osnovu podataka iz tabele konstruisali smo kumulativnu krivu, grafički i analitički odredili kvartile i konstruisali box plot.
78
Poglavlje 2. – Analiza i sinteza podataka decili u % 100 95 90 85 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0
6
8
10
12
14
16
18
20
22
24
26
28
30
32
34
36
godišnje plate (u 000 €)
xmin
Grafikon 2.9.
Q1
Me
Q3
13, 210
17,130
24, 250
Kumulativna kriva godišnjih neto plata u eurima
Medijanska plata je 17130 €. To znači da je 50% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako 17130 €. Prvi kvartil Q1 je 13210 € što pokazuje da je 25% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 13210 € . Vrijednost trećeg kvartila nam daje informaciju da je 75% godišnjih neto plata u preduzećima u Francuskoj u 2000.g. bilo manje ili jednako od 24250 €. 2.5.5. Pregled mjera srednje vrijednosti i varijacije U šemi 2.1. dajemo pregled mjera srednje vrijednosti i varijacije koje smo analizirali za kvantitativnu statističku varijablu.
79
Statistika u ekonomiji i menadžmentu
Kvantitativna varijabla
Mjere srednje vrijednosti
Potpune
Mjere varijacije
Pozicione
Apsolutne
Relativne
Aritmeticka sredina
Medijana
Raspon varijacije
Koeficijent varijacije
Geometrijska sredina
Mod
Srednje apsolutno odstupanje
Koeficijent kvartilne devijacije
Harmonijska sredina
Kvantili
Varijansa
Interkvantilna relativna odstupanja
Kvadratna sredina
Standardna devijacija
Kubna sredina
Interkvantilna odstupanja
Šema 2.1.
Interkvartilno Interdecilno Intercentilno
Mjere srednje vrijednosti i varijacije
2.6. MJERE OBLIKA DISTRIBUCIJE 2.6.1. Momenti distribucije frekvencija Za konstrukciju parametara oblika distribucije frekvencije koristimo centralne momente distribucije frekvencija koji se definišu na bazi višestepenih odstupanja vrijednosti varijable od aritmetičke sredine. Centralni moment r-tog reda je dat sljedećim izrazima: •
za negrupisanu seriju:
μr =
80
1 N
N
∑ (x − x) i
i =1
r
, r ∈ [ 0,1,..., N ]
(2.82)
Poglavlje 2. – Analiza i sinteza podataka
•
za statističku distribuciju frekvencija:
μr =
1 N
J
∑ f (x j
j =1
− x ) , r ∈ [ 0,1,..., N ] r
j
(2.83)
2.6.2. Mjere asimetrije Razlikuju se tri tipa distribucije: simetrična, lijevo asimetrična i desno asimetrična. Često nam analiza dijagrama u stupcima ili histograma omogućava da uočimo da li je distribucija simetrična ili ne. Analiza boxplota nam omogućava također da konstatujemo simetriju ili asimetriju distribucije. Pored navedenih, konstruisani su i specifični pokazatelji za mjerenje asimetrije koji mjere asimetriju u odnosu na pravac: x = x . Polazna veličina za mjerenje asimetrije je treći momenat oko aritmetičke sredine koji je jednak aritmetičkoj sredini odstupanja vrijednosti varijable od aritmetičke sredine podignutih na treći stepen. Za negrupisane podatke moment trećeg reda je jednak: N
μ3 =
∑ (x − x ) i =1
3
i
(2.84)
N
Za grupisanu distribuciju frekvencija treći moment oko sredine je jednak: J
μ3 =
∑ f (x j =1
j
N
j
− x)
3 J
,
N = ∑ fj
(2.85)
j =1
Analiza osobina ovog parametra omogućava da konstatujemo da je u slučaju simetrične distribucije brojnik navedenih izraza jednak nuli i treći momenat oko sredine jednak nuli. U slučaju desne asimetrije moment trećeg reda je pozitivan. Za lijevo asimetričnu distribuciju moment trećeg reda je negativan:
μ3 = 0 simetrija μ3 > 0 desna asimetrija μ3 < 0 lijeva asimetrija
(2.86)
81
Statistika u ekonomiji i menadžmentu
Moment trećeg reda zavisi od jedinica mjere u kojima je izražena varijabla i zbog toga je njegova direktna primjena otežana. Da bi otklonio taj nedostatak. Ficher je predložio sljedeći koeficijent asimetrije:
α3 =
μ3 σ3
(2.87)
Ovaj koeficijent predstavlja relativnu mjeru smjera i veličine asimetrije:
α 3 = 0 simetrija α 3 > 0 desna asimetrija α 3 < 0 lijeva asimetrija
(2.88)
Vrijednost Ficherovog koeficijenta asimetrije se najčešće nalazi u intervalu [-2;+2]. Postoje i drugi koeficijenti asimetrije koji su brži za računanje, a čije osobine proizilaze iz empirijskih iskustava. To su: •
Pearsonov koeficijent:
Sk =
x − MO
σ
(2.89)
koji je predstavljen kao standardizirano odstupanje moda od aritmetičke sredine. Najčešća vrijednost ovog koeficijenta se nalazi u intervalu [-3;+3]. Pearsonov koeficijent je nepotpuna mjera asimetrije:
S k = 0 simetrija S k > 0 desna asimetrija
(2.90)
S k < 0 lijeva asimetrija •
Koeficijent Yule i Kendall je jednak sljedećem izrazu:
Yk =
Q1 + Q3 − 2M e , - 1 ≤ Yk ≤ 1 Q3 − Q1
Yk = 0 simetrija Yk > 0 desna asimetrija Yk < 0 lijeva asimetrija 82
(2.91)
Poglavlje 2. – Analiza i sinteza podataka
Na grafikonu 2.10. je predstavljena simetrična distribucija. Kod simetrične distribucije aritmetička sredina, mod i medijana su jednaki. M0 = Me = x
fj
μ 3 = 0 ⇒ a3 = 0; Sk = 0
xj
x Grafikon 2.10.
Odnos parametara kod simetrične distribucije
Za desno asimetričnu distribuciju aritmetička sredina je veća od medijane i moda. Relativna mjera asimetrije je pozitivna.
fj
Mo < Μe < x
μ 3 > 0, ⇒ a3 > 0; Sk > 0
Mo Grafikon 2.11.
Me
x
xj
Asimetrična distribucija – desna asimetrija
Za lijevo asimetričnu distribuciju aritmetička sredina je manja od medijane i moda. Relativna mjera asimetrije je negativna.
83
Statistika u ekonomiji i menadžmentu
x < Me < Mo
μ 3 < 0 ⇒ a3 < 0; Sk < 0
fj
x Grafikon 2.12.
Me
Mo
xj
Asimetrična distribucija – lijeva asimetrija
2.6.3. Parametri spljoštenosti Konstrukcija parametara spljoštenosti je bazirana na četvrtom momentu oko sredine:
1 N 1 μ4 = N
μ4 =
N
∑(x
i
i =1 J
∑f j =1
− x)
4
j
J
(x j − x ) , N = ∑ f j 4
(2.92)
j =1
Četvrti moment oko sredine je prosječno odstupanje vrijednosti varijable od njene aritmetičke sredine podignuto na četvrti stepen. Zaobljenost se upoređuje i mjeri prema zaobljenosti modalnog vrha normalne distribucije koristeći sljedeće koeficijente: Pearsonov koeficijent zaobljenosti:
α4 =
μ4 σ4
(2.93)
Ficherov koeficijent zaobljenosti je jednak:
ϕ4 =
84
μ4 −3 σ4
(2.94)
Poglavlje 2. – Analiza i sinteza podataka
Za normalnu distribuciju koeficijenata: α 4 = 3 ⇒ ϕ4 = 0
frekvencija
vrijede
sljedeće
vrijednosti
(2.95)
Spljoštenost ostalih distribucija mjerimo u odnosu na normalnu. Ako je α 4 > 3 ⇒ ϕ 4 > 0 distribucija je uža, šiljastija od normalne, a ako je α 4 < 3 ⇒ ϕ 4 < 0 distribucija je šira, spljoštenija od normalne. Ficherov koeficijent je jednostavniji za upotrebu. Ako je distribucija šiljastija, vrijednost koeficijenta je veća. Manja vrijednost koeficijenta ukazuje na spljoštenost distribucije. Na grafikonu 2.13. su prezentovana tri tipa spljoštenosti distribucije. fj
normalna distribucija
a4 = 3; ϕ4 = 0 a4 > 3; ϕ4 > 0 a4 < 3; ϕ4 < 0
x Grafikon 2.13.
xj
Mjere spljoštenosti distribucije
Excel nam pruža mogućnost dobijanja sumarnog pregleda ocjena parametara koje smo analizirali.
85
Statistika u ekonomiji i menadžmentu
Rezultati našeg primjera ocjena na ispitu iz Statistike dobijeni u Excelu su predstavljeni u tabeli 2.12. Tabela 2.12. Output Excela za analizu ocjena na ispitu iz Statistike Descriptive Statistics Mean 8,235294118 Standard Error 0,239051988 Median 8 Mode 10 Standard Deviation 1,393900643 Sample Variance 1,942959002 Kurtosis -1,291933142 Skewness -0,09156866 Range 4 Minimum 6 Maximum 10 Sum 280 Count 34
U tabeli u prilogu je dat prijevod tabele 2.12. 86
Poglavlje 2. – Analiza i sinteza podataka
Prosječna ocjena je 8,2, medijana je 8, a ocjena koja je bila najčešća je 10. Standardna devijacija je 1,39. To znači da su u prosjeku ocjene odstupale oko aritmetičke sredine za 1,39.
2.7. MJERE KONCENTRACIJE Mjere koncentracije analiziraju način raspodjele agregatnih veličina ili globalnih vrijednosti na modalitete statističkih varijabli. Mjere koncentracije se dijele na apsolutne i relativne. Najpoznatije apsolutne mjere koncentracije su koncentracijski omjer i Herfindahlov indeks. Relativne mjere koncentracije se nazivaju i mjere nejednakosti u raspodjeli agregatnih veličina. Među najpoznatije mjere koncentracije ubrajaju se Lorenzova kriva ili kriva koncentracije i Ginijev koeficijent. Mi ćemo prezentovati i analizirati relativne mjere koncentracije. 2.7.1. Lorenzova kriva Lorenzova kriva se konstruiše u pravougaonom koordinatnom sistemu na osnovu relativnih kumulativnih frekvencija i relativne kumulativne globalne vrijednosti. Globalna vrijednost predstavlja proizvod fj xcj u kojem je fj frekvencija intervala čiji je centar xcj. Na apscisu se nanose kumulativne relativne frekvencije F j a na ordinatu relativne kumulativne globalne vrijednosti Q j . Kategorije koje koristimo u analizi mjera koncentracije formaliziramo na sljedeći način: Fj =
∑p
x≤ x j
j
; Qj =
∑q
x≤ x j
j
;
pj =
fj N
;
qj =
xj fj N
∑x j =1
j
fj
N
;
∑p j =1
j
=
N
∑q j =1
j
=1
(2.96) Dvije kumulativne frekvencije Fj i Qj variraju u intervalu [0;1]. Da bismo nacrtali Lorezovu krivu prvo konstruišemo kvadrat čije su strane jednake jedinici kao na grafikonu 2.14. Ovaj kvadrat je poznat pod imenom Ginijev kvadrat. Dijagonala kvadrata odgovara liniji jednake raspodjele. Lorenzova kriva se nalazi u trouglu čija tjemena imaju koordinate (0,0), (1,1) i (0,1). Potpuna nejednakost u raspodjeli je određena katetama trougla (0,1) i (1,1). Kada se kriva više udaljava od dijagonale koncentracija je veća i raspodjela je neravnomjernija i obrnuto. 87
Statistika u ekonomiji i menadžmentu
1
potpuna jednakost
Lorenzova kriva
potpuna nejednakost
0
1
Grafikon 2.14.
Lorenzova kriva
Na grafikonu 2.15. je predstavljena Lorenzova kriva u slučaju kada kumulativne frekvencije Fj i Qj izrazimo u procentima. 100 90 80 70 60
Q (u %)
50 40 30 20 10 0
10
20
30
40
50
60
F (u %) Grafikon 2.15.
88
Lorenzova kriva
70
80
90
100
Poglavlje 2. – Analiza i sinteza podataka
Na sljedećem primjeru ćemo ilustrovati konstrukciju Lorenzove krive. Primjer 2.5. Tabela 2.13. Dio agregiranih prihoda u % koje je primila svaka četvrtina od ukupnog broja domaćinstava u državi X. Godina 2000 2005
Broj domaćinstava 650 000 690 000
1/4 4,5 3,5
2/4 15,5 12,5
3/4 22,5 19,5
4/4 57,5 64,5
100 100
U 2000, 25% domaćinstava čiji su prihodi bili najniži su primili 4,5% agregiranih prihoda, što znači 4,5 % od ukupne mase prihoda svih 650000 domaćinstava. 50% domaćinstava sa najnižim primanjima su dobijali 20% od ukupne mase primanja svih domaćinstava, a 25% domaćinstava čiji su prihodi bili najviši su dobijali 57,5% agregiranih prihoda. U ovom slučaju koncentracija prihoda je vrlo izražena zato što jedan mali procenat domaćinstava (25%) prima veliki procenat mase ukupnih prihoda svih domaćinstava. Pokazatelji koncentracije mjere u ovom slučaju nejednakost u raspodjeli mase ukupnih prihoda domaćinstava. Nejednakost u raspodjeli ukupne mase prihoda domaćinstava se povećala u 2005.g. 25% najbogatijih domaćinstava je raspolagalo sa 64,5% mase ukupnih prihoda, a preostalih 75% domaćinstava raspolažu sa 35,5% mase ukupnih prihoda. U ovom slučaju koncentracija je jaka zato što jedan mali procenat domaćinstava prima veliki procenat mase ukupnih prihoda svih domaćinstava. Da bismo konstruisali Lorenzovu krivu za gore navedene podatke potrebno je kompletirati radnu tabelu za 2000. i za 2005. godinu: Tabela 2.14. Radna tabela za 2000. godinu Frekvencija pj u % 25 25 25 25
Agregatna primanja qj u % 4,5 15,5 25,5 54,5
Kumulativna frekvencija Fj u % 25 50 75 100
Kumulativni agregat Qj u % 4,5 20 45,5 100
89
Statistika u ekonomiji i menadžmentu
Tabela 2.15. Radna tabela za 2005. godinu Frekvencija pj u % 25 25 25 25
Agregatna primanja qj u % 3,5 12,5 19,5 64,5
Kumulativna frekvencija Fj u % 25 50 75 100
Kumulativni agregat Qj u % 3,5 16 35,5 100
Na osnovu podataka o kumulativnim frekvencijama i kumulativnom agregatu iz radnih tabela konstruisali smo Lorenzovu krivu za 2000.g. i za 2005.g.
100 2005. godina 2000. godina
Q (u %)
0
Grafikon 2.16.
F (u %)
100
Lorenzova kriva
Na osnovu položaja Lorenzovih krivih u odnosu na liniju jednake raspodjele možemo konstatovati da je došlo do porasta nejednakosti u raspodjeli mase ukupnih prihoda između domaćinstava u 2005.g. u odnosu na 2000.g.
90
Poglavlje 2. – Analiza i sinteza podataka
2.7.2. Ginijev koeficijent Ginijev koeficijent je relativna mjera koncentracije i definisan je kao odnos površine između Lorenzove krive i pravca jednake raspodjele i površine trougla koji se nalazi ispod dijagonale koja predstavlja pravac jednake raspodjele. Površina između Lorenzove krive i pravca jednake raspodjele se naziva i površina koncentracije. Ginijev koeficijent G se izračunava korištenjem sljedeće relacije:
G=
Površina koncentracije S = = 2S Površina trougla 0,5
(2.97)
Površina trougla je jednaka 0,5. Ginijev koeficijent je jednak dva puta površina koncentracije i kreće se u intervalu [0;1]. Kada je ova površina veća, nejednakost u raspodjeli je značajnija. Dva granična slučaja su vrijednosti koeficijenta jednake nuli i jedinici. Kada je Ginijev koeficijent jednak nuli, koncentracija je jednaka nuli i postoji perfektna jednakost u raspodjeli mase primanja. Ako je Ginijev koeficijent jednak jedinici koncentracija je maksimalna i postoji maksimalna nejednakost u raspodjeli ukupne mase primanja. Npr. jedna osoba prima ukupnu masu, dok ostali ne primaju ništa. Dakle, veća vrijednost Ginijevog koeficijenta odgovara većoj koncentraciji i većoj nejednakosti u raspodjeli. Ginijev koeficijent se može izračunati primjenom metode trapeza koja je praktičnija i grafički se jednostavnije ilustruje i metodom trouglova.
91
Statistika u ekonomiji i menadžmentu
2.7.2.1. Određivanje Ginijevog koeficijenta metodom trapeza
100
Q (u %)
Qj
Q j −1
a
(a + c ) ⋅ h 2
F j −1
0
h
c Fj
100
F (u %) Lorenzova kriva
Grafikon 2.17.
Formula za računanje Ginijevog koeficijenta metodom trapeza: ⎡1 G = 2⋅⎢ − ⎣2 ⎡1 G = 2⋅⎢ − ⎢2 ⎣
∑ ∑
(a + c) ⋅ h ⎤ ⎥ 2 ⎦
(Q
j −1
)(
)
+ Q j ⋅ F j − F j −1 ⎤ ⎥ 2 ⎥ ⎦
G = 1 − ∑ p j ⋅ (Q j −1 + Q j )
(2.98)
Ako koristimo relativne frekvencije izražene u procentima, formula za izračunavanje Ginijevog koeficijenta je jednaka sljedećem izrazu:
92
Poglavlje 2. – Analiza i sinteza podataka
G = 1−
1 104
∑ p (Q j
j −1
+ Qj )
(2.99)
Na osnovu analiziranog primjera izračunat ćemo Ginijev koeficijent za 2000. godinu korištenjem metode trapeza. G = 1 − [ 0, 25 ⋅ (0 + 0, 045) + 0, 25 ⋅ (0, 045 + 0, 20) +
+0, 25 ⋅ (0, 20 + 0, 455) + 0, 25 ⋅ (0, 455 + 1)]
G 2000 =0,41 Ginijev koeficijent za 2000. godinu je jednak 0,41. Na isti način računamo Ginijev koeficijent za 2005. godinu:
G = 1 − [ 0, 25 ⋅ (0 + 0, 035) + 0, 25 ⋅ (0, 035 + 0,16) +
+ 0, 25 ⋅ (0,16 + 0,355) + 0, 25 ⋅ (0,355 + 1) ]
G 2005 =0,48 Ginijev koeficijent za 2005. godinu je jednak 0,48. Ginijev koeficijent u 2005.g. je veći od Ginijevog koeficijenta u 2000.g. Izračunate vrijednosti Ginijevog koeficijenta potvrđuju da je nejednakost u raspodjeli, odnosno koncentracija mase agregatnih prihoda bila veća u 2005. godini. Do istog zaključka smo došli analizirajući Lorenzovu krivu. 2.7.2.2. Određivanje Ginijevog koeficijenta metodom trouglova Za statističku kvantitativnu neprekidnu varijablu čiji su podaci grupisani u J intervala površina koncentracije može biti definisana kao skup J trouglova. Na tom osnovu je definisana metoda trouglova za izračunavanje Ginijevog koeficijenta prema sljedećoj formuli: J −1
G = ∑ (F j Q j +1 − F j +1Q j )
(2.100)
j =1
U konkretnim primjerima je dovoljno kompletirati radnu tabelu računajući za svaki interval vrijednosti F j Q j +1 − F j +1Q j . Zbir svih tako izračunatih
(
)
vrijednosti predstavlja Ginijev koeficijent koncentracije. 93
Statistika u ekonomiji i menadžmentu
U tabeli 2.16. su dati podaci o izračunatim indeksima nejednakosti u raspodjeli potrošnje stanovništva Bosne i Hercegovine i entiteta. Tabela 2.16. Indeksi nejednakosti za BiH i entitete u 2001.g. Indeks nejednakosti Decilni omjeri potrošnje po stanovniku (omjer potrošnje od bogatih do siromašnih) 90/10 postotni omjer Od srednjih ka siromašnim (50/10) Bogati ka srednjim (90/50) Kvantilni udjeli u ukupnoj nacionalnoj i entitetskoj potrošnji Najsiromašnijih 20% stanovništva Donja sredina 20% Sredina 20% Gornja sredina 20% Najbogatijih 20% stanovništva Ostali indeksi nejednakosti Gini indeks Devijacija srednjeg loga (Theil) Indeks entropije Gini indeks: koristeći OECD skalu
BiH
RS
FBiH
3,29 1,82 1,81
3,49 2,00 1,74
3,13 1,74 1,80
9,5 14,2 17,9 22,7 35,8
9,2 14,3 18,3 23,1 35,1
9,9 14,2 17,7 22,5 35,8
0,26 0,11 0,12 0,24
0,26 0,11 0,11 0,24
0,26 0,11 0,12 0,23
Izvor: Bosnia and Herzegovina: Poverty Assessment, Volume II: Data on Poverty, Report No.25343-BiH, Document of the World Bank, 2003. g., str. 35.
U prvom dijelu tabele su prezentirani decilni omjeri kao relativni pokazatelji potrošnje po stanovniku. Relativni interdecilni omjer D9/D1 izmedu 10% najbogatije i 10% najsiromašnije proporcije stanovništva prema potrošnji pokazuje da je potrošnja osobe koja se nalazi na početku desetog dijela bila za 3,29 puta veća od potrošnje osobe koja se nalazi u gornjem dijelu prvih 10% stanovništva. Ili, globalno, potrošnja 10% najbogatijih je bila za 3,29 puta veća od potrošnje 10% najsiromašnijih. Predstavljeni su i interdecilni omjeri: D5/D1 označen kao omjer od srednje bogatih ka siromašnim, kao i odnos D9/D5 kao omjer bogatih prema srednje bogatim. Relativni odnosi D9/D1 i D5/D1 ukazuju na veću nejednakost u entitetu RS u odnosu na FBiH, dok je u slučaju interdecilnog omjera D9/D5 nejednakost više izražena u FBiH.
94
Poglavlje 2. – Analiza i sinteza podataka
U drugom dijelu tabele su prezentovani kvantilni udjeli u ukupnoj nacionalnoj i entitetskoj potrošnji proporcija od po 20% stanovništva rangiranih od najsiromašnijih do najbogatijih. U BiH udio 20% najsiromašnijih u ukupnoj potrošnji je 9,5% a 20% najbogatijih čak 35,8% što ukazuje na značajnu nejednakost u raspodjeli ukupne potrošnje. Proporcije po entitetima su približno istog reda vrijednosti. Vrijednost Ginijevog indeksa je 0,26 što ukazuje na značajan nivo koncentracije potrošnje, odnosno na nejednakost u raspodjeli ukupne potrošnje u BiH i entitetima. Ginijev indeks prilagođen OECD skali je još niži i iznosi 0,24. % 100 90 80 70
Lorenzova kriva za BiH potpuna jednakost
60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100
Grafikon 2.18.
%
Lorenzova kriva potrošnje per capita u BiH za 2001. godinu
2.7.3. Medijala Medijala je vrijednost varijable pridružena relativnoj kumulativnoj rastućoj globalnoj vrijednosti od 50%. Postupak za određivanje medijale je sljedeći: •
izračunati globalne vrijednosti f j ⋅ x j
95
Statistika u ekonomiji i menadžmentu
•
izračunati relativne globalne vrijednosti q j = f j ⋅ x j / ∑ f j ⋅ x j
•
izračunati relativne kumulativne rastuće frekvencije globalne vrijednosti Qj odrediti medijalnu klasu izračunati vrijednost medijale korištenjem sljedećeg izraza
• •
Mle =
( xi − xi −1 ) ⋅[0,50 − Q( xi −1 )] Q( xi ) − Q( xi −1 )
+ xi −1
(2.101)
Odstupanje između medijale i medijane je pokazatelj koncentracije:
δM = Ml − Me e
(2.102)
Veća vrijednost ovog pokazatelja predstavlja veću koncentraciju i veću nejednakost u raspodjeli.
2.8. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
96
Definišite pojam statistike. Navedite etape statističkog istraživanja. Navedite sinonime za statistički skup i statističku varijablu. Definišite statističku varijablu. Definišite i analizirajte četiri osnovna tipa mjernih skala i njihove osobine. Definišite nominalnu mjernu skalu i njene karakteristike. Definišite statističku kvalitativnu varijablu i analizirajte njene tipove i karakteristike. Analizirajte vrste kvantitativnih statističkih varijabli i njihove osobine. Uporedite i komentirajte negrupisanu statističku seriju, uređenu statističku seriju i statističku distribuciju frekvencija. Koje vrste frekvencija poznajete? Definišite ih i napišite formule za njihovo izračunavanje. Definišite rastuću kumulativnu frekvenciju. Nabrojite parametre centralne tendencije. Definišite medijanu i analizirajte njene osobine. Definišite mod. Definišite aritmetičku sredinu i analizirajte njene osobine. Koja je proporcija elemenata date serije koji se nalaze između Q1 i medijane?
Poglavlje 2. – Analiza i sinteza podataka
16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36.
Koja je proporcija elemenata date serije koji se nalaze između Q1 i Q3? Koja je proporcija elemenata date serije koji se nalaze između D1 i D9? Koja je proporcija elemenata date serije koji se nalaze iznad C99? Definišite geometrijsku sredinu. Definišite harmonijsku sredinu. Nabrojite parametre disperzije. Definišite interkvartilno apsolutno odstupanje. Navedite karakteristike prosječnog apsolutnog odstupanja. Definišite i analizirajte detaljno osobine i ekonomsko značenje standardne devijacije i varijanse. Objasnite četiri etape u konstrukciji varijanse. Napišite formule za varijansu i standardnu devijaciju i objasnite njihove prednosti i nedostatke u odnosu na ostale parametre disperzije. U kojim jedinicama mjere je izražena standardna devijacija i da li je možemo koristiti za poređenje serija izraženih u različitim jedinicama mjere? Definišite koeficijent varijacije i njegove karakteristike. Navedite teoremu koja omogućuje istovremeno tumačenje aritmetičke sredine i standardne devijacije. Koje informacije pruža Box-plot? Koje tipove asimetrije poznajete i kako ih možete analizirati? Analizirajte mjere zaobljenosti. Definišite mjere koncentracije. Objasnite konstrukciju i značenje Lorenzove krive. Definišite Ginijev koeficijent. Ako su vrijednosti Ginijevog koeficijenta 0,2 i 0,8 objasnite njihovo značenje
97
Statistika u ekonomiji i menadžmentu
2.9. RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA Zadatak 1. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
Koje su vrste varijabli pomoću kojih možemo mjeriti: Godine jedne osobe: kvantitativna diskretna Cijenu hljeba: kvantitativna (diskretna ili kontinuirana) ili kvalitativna ordinalna Temperaturu u amfiteatru: kvantitativna (intervalna skala) Ljubaznost jedne osobe: kvalitativna ordinalna Boju očiju vaše djevojke: kvalitativna nominalna Jačinu tona: kvantitativna Inteligenciju jedne osobe: kvalitativna ordinalna ili kvantitativna ako je izražena preko koeficijenta inteligencije Stručnu spremu zaposlenih na zaposlenih na fakultetu: kvalitativna ordinalna Nivo razvijenosti jedne zemlje: kvalitativna ordinalna Težinu studenata: kvantitativna kontinuirana Visinu studentica: kvantitativna kontinuirana Razumijevanje ovog pitanja: kvalitativna ordinalna
Zadatak 2. Ispit iz predmeta Ekonometrija je bio sastavljen od 6 pitanja. Poslije ispravke 100 radova, nastavnik je evidentirao broj tačnih odgovora svakog studenta u sljedećoj tabeli: 3 5 2 1 4
6 1 3 3 3
5 1 4 2 1
2 2 1 5 4
3 5 1 2 6
3 4 4 4 1
3 6 2 6 2
4 0 3 3 3
5 4 1 1 1
4 1 5 2 6
2 4 2 4 1
3 6 3 5 4
2 2 1 2 5
2 4 3 4 2
2 5 3 6 2
4 1 5 1 6
5 3 2 2 1
5 3 2 3 3
6 3 2 1 3
2 1 1 1 2
1. Definišite populaciju, elemente populacije i posmatranu varijablu. Koji je tip posmatrane varijable? 2. Koja je veličina populacije? Koji su modaliteti posmatrane varijable? 3. Kompletirajte statističku distribuciju. 4. Predstavite grafički ovu distribuciju. 5. Komentarišite uspjeh studenata na ovom ispitu. Koji je prosječan broj tačnih odgovora? Odredite mod i medijanu. 98
Poglavlje 2. – Analiza i sinteza podataka
Elementi rješenja: 1. i 2. Populacija: radovi studenata, element populacije: rad studenta, varijabla: kvantitativna diskretna tačan broj odgovora ima 7 modaliteta, veličina populacije 100 radova studenata. 3. Modaliteti xj
Apsolutna frekvencija fj 1 20 23 20 15 12 9 100
0 1 2 3 4 5 6 -
Relativna frekvencija pj 0,01 0,20 0,23 0,20 0,15 0,12 0,09 1,00
Relativna rastuća kumulativna frekvencija Fj 0,01 0,21 0,44 0,64 0,79 0,91 1,00 -
4. 25
Broj studenata
20 15 10 5 0
0
Grafikon 2.19.
1
2 3 4 Broj tacnih odgovora
5
6
Ispitni rezultati
5. Prosječan broj tačnih odgovora je 3. Mod je jednak 2. Medijana je jednaka 3. 99
Statistika u ekonomiji i menadžmentu
Zadatak 3. Među osobama koje su se vjenčale u junu 2002 godine, 10 osoba je jedinac/jedinica, 16 osoba ima jednog brata ili sestru, 7 osoba ima 2 brata ili sestre, 3 osobe imaju 3 brata ili sestre, 3 osobe 4 brata ili sestre, nijedna osoba nema 5 braće ili sestara i jedna osoba ima 6 braće ili sestara. 1. Odredite posmatranu populaciju i njenu veličinu. 2. Koja je posmatrana varijabla, njen tip i modaliteti ? 3. Kompletirajte statističku distribuciju i grafički je predstavite. 4. Izračunajte mod, medijan i aritmetičku sredinu. Elementi rješenja: 3. Varijabla
Broj braće i sestara (xj) 0 1 2 3 4 5 6 Ukupno
100
Kumulativna Apsolutna apsolutna frekvencija frekvencija
Relativna frekvencija
Relativna rastuća kumulativna frekvencija
fj
Sj
pj
Fj
10 16 7 3 3 0 1 40
10 26 33 36 39 39 40
0,25 0,4 0,175 0,075 0,075 0 0,025 1
0,25 0,65 0,825 0,9 0,975 0,975 1
Poglavlje 2. – Analiza i sinteza podataka
Apsolutna frekvencija
20 16 15 10
10 7
5 0
3
3 0
0
1
2
3
4
5
1 6
Broj brace i sestara Grafikon 2.20.
Dijagram sa stupcima za varijablu broj brace i sestara
4. Parametri centralne tendencije • Mod: 1 brat ili sestra • Medijana: 1 brat ili sestra • Aritmetička sredina: 1,425
Zadatak 4. Za svaku od sljedećih distribucija kompletirajte intervale i izračunajte centre svakog intervala. Prečnik u mm:
Godine starosti:
Težina u kg:
140-145 145-150
0- 5 godina 6-10 godina
manje od 70 70 i manje od 75
150-155 155-160
11-15 godina 16-20 godina
75 i manje od 80 80 i manje od 85
160-165 165-170
21-25 godina 26-30 godina
85 i manje od 90 90 i manje od 100 više od 100
Komentirajte kompletirane distribucije. 101
Statistika u ekonomiji i menadžmentu
Elementi rješenja: Prečnik u mm: xj
[140-145[ [145-150[ [150-155[ [155-160[ [160-165[ [165-170]
Centar xc 142,5 147,5 152,5 157,5 162,5 167,5
Godine starosti: xj
Centar xc 2,75 8 13 18 23 28
[0-5,5[ [5,5-10,5[ [10,5-15,5[ [15,5-20,5[ [20,5-25,5[ [25,5-30,5]
Težina u kg: xj
[0-70[ [70-75[ [75-80[ [80-85[ [85-90[ [90-100[ [100;+∞]
Centar xc 35 72,5 77,5 82,5 87,5 95 -
U trećoj distribuciji zadnji interval nema centra i zbog toga trebate biti vrlo oprezni u tumačenju rezultata. Zadatak 5. Kompletirajte sljedeću tabelu: Klase xj
Centri xc
[10;20[ [20;30[ [30;40[ [40;60[ [60;80]
Rastuća kumulativna relativna frekvencija Fj
pj
Korigovana relativna frekvencija pj/aj
0,08 0,21 0,55 0,86
Elementi rješenja: Klase
Amplituda aj
Centri xc
pj
Fj
[10;20[ [20;30[ [30;40[ [40;60[ [60;80]
10 10 10 20 20
15 25 35 50 70
0,08 0,21 0,26 0,31 0,14
0,08 0,29 0,55 0,86 1,00
102
Korigovana relativna frekvencija pj/aj 0,008 0,021 0,026 0,015 0,007
Poglavlje 2. – Analiza i sinteza podataka
Zadatak 6. Na osnovu statističkog istraživanja jedne populacije izvršeno je grupisanje elemenata populacije u intervale čiji su centri sljedeći: 52, 60, 68, 76, 84, 92. 1. Koja je amplituda posmatranih intervala? 2. Izračunajte gornju i donju granicu svakog intervala i kompletirajte tako grupisanu distribuciju. Elementi rješenja: 1. Amplituda svake klase je 8. 2. [48;56[, ..........., [88;96[ Zadatak 7. 50 studenata je odgovaralo na test koji se sastojao od 20 pitanja. Sljedeća serija je kompletirana na osnovu broja tačnih odgovora: 10 11 7 11 11
8 11 11 7 19
3 8 10 8 9
12 5 10 10 4
13 13 2 13 10
9 14 15 9 8
12 14 12 13 9
9 6 10 9 6
12 12 1 7 7
11 16 14 13 14
1. Predstavite rezultate u obliku distribucije frekvencija grupisane u intervale tako da prvi i posljednji interval imaju amplitudu 5 a ostale klase amplitudu 2. 2. Izračunajte relativne frekvencije. 3. Izračunajte kumulativne relativne frekvencije. 4. Koja je proporcija studenata čiji je broj tačnih odgovora bio manji od 9? 5. Koja je proporcija studenata čiji je broj tačnih odgovora bio jednak ili veći od 13? 6. Koja je proporcija studenata čiji je broj tačnih odgovora bio između 5 i 20? 7. U kojem intervalu je gustoća najmanja, a u kojoj najveća? 8. Konstruišite odgovarajuću grafičku prezentaciju analizirane distribucije.
103
Statistika u ekonomiji i menadžmentu
Elementi rješenja: U tabeli odgovori 1.,2.,3. Intervali xj
fj
pj
Fj
[0;5[ [5;7[ [7;9[ [9;11[ [11;13[ [13;15[ [15;20] Ukupno
4 3 8 12 11 9 3 50
0,08 0,06 0,16 0,24 0,22 0,18 0,06 1,00
0,08 0,14 0,30 0,54 0,76 0,94 1,00 -
Korigovana frekvencija (gustoća) pj / aj 0,8 1,5 4,0 6,0 5,5 4,5 0,6 -
4. Proporcija studenata čiji je broj tačnih odgovora bio manji od 9 je 30%. 5. Proporcija studenata čiji je broj tačnih odgovora bio jednak ili veći od 13 je 24%. 6. Proporcija studenata čiji je broj tačnih odgovora bio između 5 i 20 je 92%. 7. Najmanja gustoća 0,6 je u intervalu [15;20[, a najveća u intervalu [9;11[ i iznosi 6,0. 8. Grafička prezentacija analizirane distribucije je histogram koji je potrebno konstruisati na osnovu podataka kolone korigovana frekvencija. Zadatak 8. U sljedećoj statističkoj seriji je predstavljen broj sati koje je 13 studenata posvetilo pripremi testa iz Statistike: 5
6
2
7
11
9
3
4
9
8
7
3
7
1. Odredite aritmetičku sredinu. 2. Odredite medijanu i njenu kumulativnu frekvenciju. Komentarišite dobijeni rezultat. 3. Odredite mod. 104
Poglavlje 2. – Analiza i sinteza podataka
Elementi rješenja: 1. Aritmetička sredina jednaka je 6,23. 2. Uređena serija po rastućem redu podataka: 2 3 3 4 5 6 7 7 7 8 9 9 11 Broj podataka je neparan i medijana je jednaka:
Me = x
(
n +1 ) 2
= x 13+1 = x ( 7 ) = 7 (
2
)
Kumulativna frekvencija je jednaka: F j =
xj fj Sj
2 1 1
3 2 3
4 1 4
5 1 5
6 1 6
7 3 9
Sj N
=
8 1 10
9 = 0,6923 ⇒ 69,23% 13 9 2 12
11 1 13
Ukupno 13
3. Mod je jednak 7. Zadatak 9. Dati su sljedeći podaci o distribuciji zaposlenih prema godišnjoj plati u eurima: Prosječna plata 12 090 eura Medijanska plata 11 175 eura Standardna devijacija 4 600 eura Ginijev koeficijent 0,20 Plate variraju u intervalu od 8 400 do 30 500 eura. Kako će se mijenjati navedeni parametri uz sljedeće pretpostavke: 1. Sve plate su povećane za 200 eura. 2. Za 150 eura su povećane samo plate manje od 9 050 eura. 3. Za 10% su smanjene plate veće od 22 870 eura. 4. Sve plate su povećane za 10%. 5. Za svaki odgovor dajte neophodna objašnjenja. Elementi rješenja: 1. Ako su sve plate povećane za 200 eura, ukupni platni fond (masa plata) se povećava. Prosječna plata i medijana se povećaju za 200 eura. 105
Statistika u ekonomiji i menadžmentu
Standardna devijacija ostaje nepromijenjena. Ginijev koeficijent se smanjuje. Plate variraju u intervalu (8600; 30700) eura. 2. Ako se za 150 eura povećaju samo plate manje od 9 050, eura ukupna masa plata i prosječna plata se povećavaju. Pošto nijedna povećana plata nije veća od medijane, medijana ostaje nepromijenjena. Disperzija se smanjuje jer se povećane plate približavaju prosječnoj plati. Ginijev indeks se smanjuje. Plate variraju u intervalu (8 550; 30 500) eura. 3. Ako su za 10% smanjene plate veće od 22 870, eura masa plata i prosječna plata se smanjuju. Medijana se ne mijenja jer je 22 870 veće od 11 175 eura. Disperzija se smanjuje jer se smanjene plate približavaju prosječnoj plati. Standardna devijacija se smanjuje. Nejednakost u raspodijeli mase plata se smanjuje i Ginijev koeficijent također se smanjuje. Plate variraju u intervalu (8 400; 27 450) eura. 4. Ako se sve plate povećaju za 10%, prosječna plata, medijana, i standardna devijacija se povećavaju za 10%. Ginijev koeficijent se ne mijenja. Raspon plata se povećava i plate variraju u intervalu (9 240; 33 550) eura. Zadatak 10. Poznata je sljedeća distribucija godišnjih plata u jednom preduzeću: Godišnje plate xi u KM
[5000;7000[ [7000;8000[ [8000;9000[ [9000;11000[ [11000;15000[ [15000;20000] Ukupno
Broj zaposlenih (fj) 60 80 105 110 35 10 400
Frekvencija (pj) u% 15,00 20,00 26,25 27,50 8,75 2,50 100,00
1. Nacrtajte kumulativnu krivu. 2. Pomoću kumulativne krive procijenite grafički, a zatim odredite analitički vrijednosti kvartila. 3. Nacrtajte box- plot i komentarišite karakteristike distribucije. 4. Odredite prosječnu platu, standardnu devijaciju i koeficijent varijacije. Objasnite dobijene rezultate. 5. Kompletirajte sljedeću tabelu: 106
Poglavlje 2. – Analiza i sinteza podataka Godišnje plate xi u KM
Broj zaposlenih
Frekvencija
(fj)
u%
(pj)
Kumulativna frekvencija
(Fj)
Centar intervala
Masa plata (agregat)
xcj
fj .xcj
qj u%
u% [5000;7000[ [7000;8000[ [8000;9000[ [9000;11000[ [11000;15000[ [15000;20000] Ukupno
60 80 105 110 35 10 400
15,00 20,00 26,25 27,50 8,75 2,50 100,00
15 35 61,25 88,75 97,5 100 -
Relativni Agregat
6 000 7 000 8 500 10 000 13 000 17 500
360 000 600 000 892 500 1 100 000 455 000 175 000 3 582 500
10,0 16,7 24,9 30,7 12,7 4,9 100,0
Relativni kumulativni agregat
Qj u% 10,0 26,8 51,7 82,4 95,1 100,0
6. Konstruišite Lorenzovu krivu. 7. Izračunajte Ginijev koeficijent. 8. Koji bi bio oblik Lorenzove krive ako bi svih 400 zaposlenih imali jednaku platu? 9. Koji bi bio oblik Lorenzove krive ako 399 zaposlenih ne bi primali platu, a 1 zaposleni (šef) primio 3 582 500 KM? 10. Koji je vaš zaključak o disperziji i koncentraciji analizirane distribucije plata? Elementi rješenja: 2. F(Q1)=0,25 interval kojem pripada prvi kvartil je 7000-8000 i primjenom formule na bazi kumulativnih frekvencija dobijamo: Q1=7500; Q2=Me=8571,42≈8571; Q3=10 000 4. Prosječna plata (aritmetička sredina) je jednaka približno 8956 KM; standardna devijacija 2312 KM i koeficijent varijacije 0,26%. 5. Tabela kompletirana na početku. 7. Ginijev koeficijent G = 1 − ∑ f j (Q j −1 + Q j ) G = 1−
1 104
∑f
j
(Q j −1 + Q j )
107
Statistika u ekonomiji i menadžmentu
⎡15(0 + 10, 05) + 20(10, 05 + 26,8) + 26, 25(26,8 + 51, 71) + ⎤ ⎢ +27,5(51, 71 + 82, 41) + 8, 75(82, 41 + 95,11) + 2,5(95,11 + 100) ⎥ ⎣ ⎦
G = 1−
1 104
G = 1−
1 ⋅ 8678 = 0,132 104
8. Lorenzova kriva bi se podudarala sa dijagonalom (linijom jednake raspodjele) i koncentracija bi bila jednaka nuli, dakle raspodjela bi bila savršeno ravnomjerna. 9. Lorenzova kriva bi se podudarala sa katetama trougla ispod dijagonale, koncentracija bi bila jednaka jedinici i postojala bi savršena nejednakost u raspodjeli. 10. Distribucija mase plata (globalne vrijednosti) je relativno ravnomjerno raspodijeljena. Disperzija plata nije previše izražena. Plate su uglavnom koncentrisane u sredini serije. Zadatak 11. U sljedećoj tabeli su predstavljeni podaci koji se odnose na koncentraciju prihoda domaćinstava u regionu X u 2005. godini. Broj grupe Grupa 1 Grupa 2 Grupa 3
Fj u % 25 50 75
Prihod u KM 45 046 267 274 628 832
Qj u % 0,82 6,04 25,64
1. Koji je statistički termin za podatke predstavljene u trećoj koloni? 2. Konstruišite kumulativnu krivu uz pretpostavku da je maksimalan prihod domaćinstva 1 milion KM. Nacrtajte box-plot i komentirajte dobijene rezultate. 3. Nacrtajte Lorenzovu krivu. Komentarišite. 4. Izračunajte Ginijev koeficijent i objasnite ga. Uporedite vaš odgovor sa komentarom datim pod tačkom 3.
108
Poglavlje 2. – Analiza i sinteza podataka
Elementi rješenja: 4.
1 ∑ f j (Q j −1 + Q j ) = 1 − 104 − [ 25(0 + 0,82) + 25(0,82 + 6, 04) + 25(6, 04 + 25, 64) + 25(25, 64 + 100) ]
G = 1−
= 1−
1 ⋅ 4276 = 1 − 0, 4276 = 0,5724 104
Postoji jaka koncentracija mase prihoda domaćinstava u regionu X u 2005.g. Zadatak 12. Data je sljedeća distribucija plata: Iznos u novčanim jedinicama xj 5 000-10 000 10 000-20 000 20 000-40 000 40 000-90 000 Ukupno
Frekvencija fj 410 637 785 724 2556
1. Kompletirati sljedeći tabelu: xj 5 000-10 000 10 000-20 000 20 000-40 000 40 000-90 000 Ukupno
2. 3. 4. 5. 6.
fj 410 637 785 724 2556
pj u %
Fj u %
16,04 24,92 30,71 28,33 100
16,04 40,96 71,67 100
xc
xc ⋅ fj
qj u % Qj u %
7 500 3 075 000 3,69 15 000 9 555 000 11,48 30 000 23 550 000 28,29 65 000 47 060 000 56,54 83 240 000 100,00
3,69 15,17 43,46 100,00
Odredite medijanu polazeći od kumulativnih frekvencija Izračunajte Ginijev koeficijent i komentarišite dobijeni rezultat. Konstruišite Lorenzovu krivu i dajte vaš komentar. Izračunajte medijalu. Izračunajte odstupanje medijala-medijana. 109
Statistika u ekonomiji i menadžmentu
Elementi rješenja: 1. 2. 3. 4.
Tabela kompletirana. Me=25 885,35 G=0,3606 Lorenzova kriva pokazuje veliku nejednakost u raspodjeli ukupne mase plata. 5. Medijala: 45 783,52 6. Odstupanje medijala-medijana: 45 783,52-25 885,35=19 898,17
110
POGLAVLJE 3.
REGRESIONA I KORELACIONA ANALIZA
U dosadašnjim poglavljima smo analizirali i istraživali populaciju u odnosu na samo jednu varijablu. Međutim, vrlo često se dešava da se statistička istraživanja jedne populacije baziraju simultano na dvije ili više kvantitativnih varijabli. Pitanje koje se postavlja u ovom slučaju je traženje i određivanje eventualne veze između ovih varijabli. U prvom dijelu ovog poglavlja ćemo analizirati modelizaciju veza između dvije ili više varijabli, a zatim metode kvantifikacije veza i njihovu primjenu. Drugi dio poglavlja obrađuje mjere reprezentativnosti i kvaliteta ocijenjenih modela.
3.1. MODELIZACIJA VEZA IZMEĐU VARIJABLI Da bismo pristupili modelizaciji veza između dvije ili više varijabli polazimo od sljedećih pretpostavki: 1. Modeliziranje možemo vršiti ukoliko postoji zavisnost između varijabli. 2. Mogu se modelizirati jedino kvantitativne varijable, jer je u tom slučaju moguće kompletirati oblak (dijagram) rasipanja, računati mjere centralne tendencije i disperzije. 111
Statistika u ekonomiji i menadžmentu
3.1.1. Etape konstrukcije modela Model je pojednostavljena slika realnosti i služi da bismo na pogodan način kvantificirali složene ekonomske fenomene. Etape konstrukcije i ocjene jednog modela su sljedeće: • Odabrati nezavisnu i zavisnu varijablu • Grafički predstaviti na dijagramu rasipanja posmatrane podatke da bi se potvrdila ili odbacila pretpostavka o zavisnosti 2 statističke varijable. • Na osnovu dijagrama procijeniti oblik veze između posmatranih varijabli i konstruisati odgovarajući model. Postoje različiti oblici veza kao npr. linearna, krivolinijska, eksponencijalna itd. • Ocijeniti primjenom odgovarajućih metoda odabrani model. • Izračunati rezidualna (neobjašnjena) odstupanja ocijenjenih od posmatranih podataka i analizirati ih. • Procijeniti kvalitet ocijenjenog modela. 3.1.1.1. Dijagram (oblak) rasipanja Postoje različiti oblici zavisnosti varijabli. Neke od njih smo predstavili na sljedećem grafikonu. Y
Y
a
112
X
Y
d Grafikon 3.1.
b
X
Y
Y
X
c
X
f
X
Y
e
X
Razliciti oblici veza izmedu dvije varijable – dijagram rasipanja
Poglavlje 3. – Regresiona i korelaciona analiza
U slučajevima a i b veze su linearne. U slučaju a, sa rastom nezavisne dolazi do rasta zavisne varijable. U slučaju b, rast nezavisne varijable uzrokuje opadanje zavisne varijable. U slučaju c ne bismo mogli utvrditi postojanje veze jer povećanje nezavisne varijable ne mijenja zavisnu varijablu. U slučajevima d, e i f postoje krivolinijske veze između nezavisne i zavisne varijable. Smjer njihovih promjena je isti u slučaju d, a suprotan u slučaju f. Dijagram rasipanja pruža polaznu informaciji o obliku zavisnosti između dvije varijable.
3.2. KOVARIJANSA Kovarijansa mjeri uzajamnu varijabilnost dvije varijable u odnosu na njihove respektivne aritmetičke sredine: Cov( X , Y ) =
1 n ∑ ( xi − x ) ⋅ ( yi − y ) . n i =1
(3.1)
Kovarijansa nam omogućava da utvrdimo da li postoji simultana varijacija između vrijednosti varijabli X i Y u odnosu na odabranu tačku čije su koordinate aritmetičke sredine varijabli X i Y.b Razvijena formula kovarijanse omogućava jednostavnije izražavanje varijanse: Cov( X , Y ) =
1 ∑ ( xi − x ) ⋅ ( yi − y ) n i
=
1 ∑ ( xi yi − xi y − xyi + x ⋅ y ) n i
=
1 1 1 xi yi − y ∑ xi − x ∑ yi + x ⋅ y ∑ n i n i n i
=
1 ∑ xi yi − y ⋅ x − x ⋅ y + x ⋅ y n i
Cov( X , Y ) =
1 n ∑ xi yi − x ⋅ y n i =1
(3.2)
Cov( X , Y ) = xy − x ⋅ y
113
Statistika u ekonomiji i menadžmentu
Na osnovu gornje relacije možemo zaključiti da je kovarijansa jednaka razlici između aritmetičke sredine proizvoda i proizvoda aritmetičkih sredina varijabli X i Y. Kovarijansa varijable X sa varijablom X (sa samom sobom) predstavlja generaliziranu formulu varijanse:lnih zavisnosti
Cov( X , X ) =
1 n 1 n 2 x − x x − x = ( )( ) ( xi − x ) = σ X2 ∑ ∑ i i n i =1 n i =1
(3.3)
Kovarijansa je pozitivna ako oblak rasipanja ima generalno rastuću tendenciju. Kovarijansa je negativna kada oblak rasipanja ima generalno opadajuću tendenciju. Kovarijansa je jednaka ili približno jednaka nuli ako oblak rasipanja nije ni rastući ni opadajući ili ukoliko je pola opadajući, a pola rastući. Kada X i Y variraju u istom smjeru, kovarijansa je pozitivna. Kada X i Y variraju u suprotnom smjeru, kovarijansa je negativna. Ako nema ni rastuće ni opadajuće generalne tendencije, kovarijansa je jednaka nuli. Na sljedećem primjeru ćemo ilustrovati kompletiranje oblaka rasipanja i izračunavanje kovarijanse. Primjer 3.1. Tabela 3.1. Prihod preduzeća izražen u hiljadama KM (Y) i proizvodnja izražena u kilogramima (X)k
xi
zyi
50 100 150 200 250 300 350
20 25 25 35 30 35 40
U ovom slučaju prihod preduzeća Y je zavisna varijabla, a proizvodnja izražena u kilogramima nezavisna varijabla. Mi ćemo posmatrati prihod u funkciji ostvarene proizvodnje i konstruisati dijagram rasipanja.
114
Poglavlje 3. – Regresiona i korelaciona analiza
Prihod u 000 KM
50 40 30 20 10 0
0
50
100
Grafikon 3.2.
150 200 250 Proizvodnja u kg
300
350
400
Dijagram rasipanja
Na osnovu dijagrama rasipanja konstatujemo da postoji linearna veza između dvije posmatrane varijable. Da bismo potvrdili ovu konstataciju, izračunat ćemo vrijednost kovarijanse. Tabela 3.2. Radna tabela za računanje kovarijanse
Σ
xi
yi
( xi − x )
( yi − y )
( xi − x )( yi − y )
( xi − x ) 2
50 100 150 200 250 300 350 1400
20 25 25 35 30 35 40 210
-150 -100 -50 0 50 100 150 0
-10 -5 -5 5 0 5 10 0
1500 500 250 0 0 500 1500 4250
22500 10000 2500 0 2500 10000 22500 70000
Aritmetička sredina varijabli X i Y je x = 200 ; y = 30 . Na osnovu podataka iz tabele izračunali smo kovarijansu: Cov( X , Y ) =
1 n
n
1
∑ ( x − x ) ( y − y ) = 7 ⋅ 4250 = 607,14 i
i
i =1
115
Statistika u ekonomiji i menadžmentu
Visoka vrijednost kovarijanse potvrđuje već konstatovanu činjenicu uzajamne varijabilnosti varijabli X i Y. •
Zbir i razlika statističkih varijabli
Koristeći kovarijansu možemo analizirati varijansu zbira i razlike statističkih varijabli i izraziti ih na sljedeći način:. Var(X+Y)=VarX + Var Y+ 2 Cov(X,Y)
(3.4)
Var(X-Y)=VarX + Var Y- 2 Cov(X,Y)
(3.5)
Ako su X i Y nezavisne, kovarijansa je jednala nuli (Cov(X, Y)=0). U tom slučaju zbir i razlika statističkih varijabli se mogu izraziti sljedećim relacijama: Var(X+Y)=VarX + Var Y
(3.6)
Var(X-Y)=VarX + Var Y
(3.7)
3.3. REGRESIONA ANALIZA Kada se pomoću statističkih metoda istražuje jedna pojava nezavisno od ostalih, radi se o jednodimenzionalnoj statističkoj analizi. Statističkim metodama možemo analizirati i međusobne odnose više pojava. U tom slučaju se radi o višedimenzionalnoj analizi. Ovim metodama ne analiziramo uzroke ni posljedice pojava, već zavisnost pojava i njihovih promjena. Veze među pojavama, kao što smo već istakli, mogu biti funkcionalne i stohastičke. Statistička analiza odnosa između dvije ili više pojava se vrši metodama deskriptivne i inferencijalne statistike. Stepen statističke povezanosti između pojava se istražuje metodama korelacione analize. Za određivanje analitičkog odnosa među pojavama primjenjuju se regresioni modeli. Veza među pojavama je funkcionalna ako su vrijednostima jedne pojave u potpunosti određene vrijednosti druge pojave. U tom slučaju za svaku vrijednost nezavisne varijable možemo precizno odrediti vrijednosti zavisne varijable. Funkcionalne veze najčešće susrećemo u prirodnim naukama i u manjoj mjeri u društvenim naukama. Kada jednoj vrijednosti nezavisno promjenljive X odgovara više vrijednosti zavisno promjenljive Y kažemo da je njihova veza stohastička. Npr. veza između potrošnje i dohotka domaćinstava. Opšti oblik regresionog modela je sljedeći: 116
Poglavlje 3. – Regresiona i korelaciona analiza
Y = f ( X 1 , X 2 ,...., X K ) + e
(3.8)
gdje je Y zavisna promjenljiva, X su nezavisne promjenljive i parametar e slučajno odstupanje. Model (3.8.) se naziva model višestruke regresije ili višedimenzionalni regresioni model. Model koji sadrži zavisnu i jednu nezavisnu promjenljivu naziva se model jednostavne regresije ili jednodimenzionalni regresioni model. Model jednostavne regresije ima sljedeći oblik:
Y = f (X ) + e
(3.9)
Zadatak regresione analize je istraživanje analitičkog oblika veze između pojava kojem se najviše približavaju promjene analiziranih pojava. Zadatak korelacione analize je utvrđivanje stepena i smjera povezanosti pojava. 3.3.1. Kriterij izbora regresione prave i metod najmanjih kvadrata Pretpostavimo da je veza zavisne varijable Y i nezavisne varijable X linearna. Y je varijabla koju treba objasniti pomoću varijable X. Polazni model linearne regresije za skup od n vrijednosti (xi, yi) varijabli X i Y se može napisati u sljedećem obliku:
y i = a + bxi + ei , i = 1,2,..., n.
(3.10)
Označimo sa
yˆ i = a + bxi
(3.11)
funkcionalni dio modela gdje su a i b parametri koje treba ocijeniti. Podaci su dati kao n posmatranih parova (xi, yi), a yˆi predstavlja ocijenjene vrijednosti Y na osnovu posmatranih vrijednosti xi od X. Na osnovu izraza (3.9.) i (3.10) možemo napisati relaciju
yi = yˆ i + ei
(3.12)
iz koje možemo izraziti slučajno ili rezidualno odstupanje ei kao razliku između posmatranih i ocijenjenih vrijednosti varijable Y:
e i = yi − yˆ i e i = yi − a − bxi
(3.13)
117
Statistika u ekonomiji i menadžmentu
Slučajno odstupanje smo predstavili na sljedećem grafikonu. y
yˆ i = a + bxi
yi ei = yi − yˆ i
yˆ i
xi Grafikon 3.3.
x
Rezidualna odstupanja
Cilj je primijeniti metod za ocjenu parametara regresionog modela koji će minimizirati rezidualna odstupanja. Pitanje koje se postavlja je izbor kriterija koji će obezbijediti minimizaciju slučajnih odstupanja. Jedan od kriterija bi mogao biti zbir rezidualnih odstupanja jednak nuli:
∑ ei = ∑ ( yi − yˆi ) = 0 i
i
Sve prave koje prolaze kroz tačku gravitacije G ( x , y ) zadovoljavaju ovaj kriterij jer se pozitivna i negativna rezidualna odstupanja anuliraju. Zbog toga ovaj kriterij ne može poslužiti za izbor najbolje regresione prave. Kriterij koji nam omogućava izbor najbolje regresione prave je minimiziranje zbira kvadrata rezidualnih odstupanja:
minimum
∑ ei2
(3.14)
i
Na ovom kriteriju je baziran metod najmanjih kvadrata. Minimiziranje zbira kvadrata rezidualnih odstupanja: n
n
n
i =1
i =1
i =1
∑ ei2 = ∑ ( y i −yˆ i ) 2 = ∑ ( y i −a − bxi ) 2 118
(3.15)
Poglavlje 3. – Regresiona i korelaciona analiza
je moguće uz potrebne uslove koji zahtijevaju da parcijalni izvodi ovog zbira po parametrima a i b budu jednaki nuli: n
∂ ∑ ei2 i =1
∂a
n
= 2∑ ( y i −a − bx i )(−1) = 0
(3.16)
i =1
n
∂ ∑ ei2 i =1
∂b
n
= 2∑ ( y i −a − bx i )(− x i ) = 0
(3.17)
i =1
Iz ovih uslova slijedi sistem normalnih jednačina n
n
i =1
i =1
∑ y i = na + b∑ xi
(3.18)
n
n
n
i =1
i =1
i =1
∑ xi yi = a∑ xi + b∑ xi2
(3.19)
Rješavanjem ovog sistema normalnih jednačina dobijamo izraze za ocjenu parametara a i b: n
a=
∑y i =1
n
i
−b
n
∑x i =1
i
(3.20)
n
a = y − bx
(3.21)
Zamjenom ovog izraza u drugu normalnu jednačinu 3.19. dobijamo izraz za izračunavanje parametra b:
∑ x y = ( y − bx )∑ x + b∑ x ∑ x y = y ∑ x − bx ∑ x + b∑ x ∑ x y − y ∑ x = b(∑ x − x ∑ x ) ∑ x y − y∑ x b= ∑ x − x∑ x 2 i
i
i
i
i
i
i
i
2 i
i
i
i
2 i
i
i
i
2 i
i
(3.22)
i
119
Statistika u ekonomiji i menadžmentu
Parametar b možemo izraziti i u sljedećem obliku: n
b=
∑ x y − n⋅ x ⋅ y i
i =1
i
n
∑x i =1
2 i
− nx
(3.23)
2
odnosno
1 n ∑ xi yi − x ⋅ y n i =1 b= 1 n 2 xi − x 2 ∑ n i =1
(3.24)
Izraz u brojniku predstavlja razvijenu formulu kovarijanse Cov(X,Y), a izraz u nazivniku razvijenu formulu varijanse varijable X. Dakle, izraz za izračunavanje parametra b možemo napisati u sljedećem obliku:
b=
Cov( X , Y )
(3.25)
σ X2
3.3.2. Pretpostavke o osobinama stohastičnosti modela Regresioni model izražen regresionom pravom:
yi = a + bxi + ei , i = 1, 2,..., n.
(3.26)
je sastavljen iz dva dijela. Prvi dio modela (a+bxi) predstavlja funkcionalnu vezu pri kojoj je Y linearno zavisna od X ako su drugi faktori konstantni. Drugi, stohastički dio modela (ei), predstavlja slučajne varijacije, kojima se uzima u obzir djelovanje promjena drugih varijabli koje nisu eksplicitno uključene u model. Pod uslovom da specifikacija modela odgovara ekonomskoj relaciji u stvarnosti, i da bismo probleme mjerenja ekonomskih relacija preveli u probleme statističkog ocjenjivanja parametara rasporeda vjerovatnoće, neophodno je navesti pretpostavke o osobinama stohastičnosti linearnog regresionog modela:
120
a. E(ei) = 0,
(očekivana vrijednost greške je jednaka nuli)
b. E(ei2 ) = σ 2 ,
(konstantna zajednička varijansa)
Poglavlje 3. – Regresiona i korelaciona analiza
c. E(ei ej)= 0, 2
za svako i, j; i≠j; (nezavisnost)
d. ei: N(0, σ ),
(normalnost)
e. E(eiXj) = 0,
za sve i, j; (nezavisnost od Xj).
3.3.3. Aplikacija analiziranih metoda Na osnovu radne tabele 3.2. kompletirane na osnovu tabele 3.1. primjera 3.1. izračunavamo vrijednost parametara a i b i kompletiramo regresionu jednačinu: n 1 n x − x y − y ( ) ( ) ( xi − x ) ( yi − y ) i ∑ i ∑ Cov( X , Y ) n i =1 i =1 b= = = n Var ( X ) 1 n 2 x − x ( ) ( xi − x )2 i ∑ ∑ n i =1 i =1 b=
4250 = 0,061 70000
a = y − b ⋅ x = 30 − 0,061 ⋅ 200 = 17,857
yˆ = 17,857 + 0,061 ⋅ xi
Za ocjenu parametara regresione prave možemo koristiti statističke funkcije Excel-a. Rezultate dobijene primjenom ovog programa prezentujemo sljedećim tabelama i grafikonom. Tabela 3.3. (a., b., c.) Output Excela za regresiono-korelacionu analizu na primjeru 3.1.
a. REGRESSION STATISTICS Multiple R 0,927426 R Square 0,860119 Adjusted R Square 0,832143 Standard Error 2,897043 Observations 7
121
Statistika u ekonomiji i menadžmentu
b. ANOVA SS MS 258,0357 258,0357 41,96429 8,392857 300
Regression Residual Total
df 1 5 6
Intercept X Variable 1
COEFFICIENTS 17,85714 0,060714
F 30,74468
Significance F 0,00262
STANDARD ERROR 2,448448 0,01095
T STAT 7,29325 5,544789
yˆ = 17,857 + 0,061x c. OBSERVATION 1 2 3 4 5 6 7
PREDICTED Y 20,89286 23,92857 26,96429 30 33,03571 36,07143 39,10714
RESIDUALS -0,89286 1,071429 -1,96429 5 -3,03571 -1,07143 0,892857
50
Prihod u 000 KM
40 30
yˆ = 0, 0607 x + 17, 857
20
R 2 = 0, 8601
10 0
0
Grafikon 3.4.
122
100
200 Proizvodnja u kg
300
Dijagram rasipanja i regresiona prava
400
Poglavlje 3. – Regresiona i korelaciona analiza
Koristeći navedeni program dobili smo ocjene vrijednosti parametara, jednačinu regresione prave, grafički prikaz i statističke parametre koji nam omogućuju analizu kvaliteta dobijene ocjene. Vrijednost parametra a je predstavljena kao odsječak na ordinatnoj osi. Vrijednost parametra b pokazuje za koliko jedinica se poveća prihod Y ako se proizvodnja X poveća za jedan kilogram. Primjenu navedenog programa ćemo ilustrovati i na sljedećem primjeru u kojem ćemo ocijeniti vezu između društvenog bruto proizvoda i prosječnog broja stanovnika. Posmatramo društveni bruto proizvod kao zavisnu i broj stanovnika kao nezavisnu ili eksplikativnu promjenljivu.
Primjer 3.2. Tabela 3.4. Društveni bruto proizvod (DBP) u milionima KM i prosječan broj stanovnika u 000 Godina
DBP u milionima KM
1996 1997 1998 1999 2000 2001
3049 6367 7244 8604 9611 10480
Prosječan broj stanovnika u hiljadama 3645 3756 3654 3752 3781 3798
DBP u milionima KM
12000 10000 8000 6000 4000 2000 0 3600
Grafikon 3.5.
3650
3700 3750 3800 prosječan broj stanovnika u 000
3850
Oblak rasipanja
123
Statistika u ekonomiji i menadžmentu
Dijagram rasipanja nam ukazuje na linearnu vezu između ove dvije promjenljive. Primjenom metode najmanjih kvadrata određujemo jednačinu regresione prave koja se najbolje prilagođava datim podacima. Ocijenjena regresiona prava zadovoljava uslov minimizacije kvadrata odstupanja ocijenjenih od posmatranih vrijednosti promjenljive Y. Tabela 3.5. (a., b., c.) Output Excela za regresiono-korelacionu analizu na primjeru 3.2.
a. Intercept X Variable 1
COEFFICIENTS -115045 32,86094
STANDARD ERROR 45307,76 12,14204
yˆ = −115045 + 32,86 x b. REGRESSION STATISTICS Multiple R 0,804228 R Square 0,646783 Adjusted R Square 0,558479 Standard Error 1775,397 Observations 6
c. OBSERVATION 1 2 3 4 5 6
124
PREDICTED Y 4733,125 8380,69 5028,874 8249,247 9202,214 9760,85
RESIDUALS -1684,13 -2013,69 2215,126 354,7535 408,7861 719,15
Poglavlje 3. – Regresiona i korelaciona analiza
DBP u milionima KM
12000
yˆ = 32, 861 x − 115045
10000
R 2 = 0, 6468
8000 6000 4000 2000 0 3600
3650
3700
3750
3800
3850
Prosjecan broj stanovnika u 000 Grafikon 3.6.
Oblak rasipanja i linearna regresija
Reziduali 3000 2000 1000 0
3600
3650
3700
3750
3800
-1000 -2000 -3000
Grafikon 3.7.
varijabla
x
Dijagram rezidualnih odstupanja
Dobijene su pouzdane ocjene parametara. Na osnovu parametra b ocijenjene regresione jednačine konstatujemo da ako se broj stanovnika poveća za 1 000 društveni bruto proizod će se povećati za 32,86 miliona KM. Prava regresije metode najmanjih kvadrata prolazi kroz srednju tačku dijagrama čije su koordinate aritmetičke sredine analiziranih varijabli X i Y. Zadovoljavanje kriterija minimizacije kvadrata odstupanja podrazumijeva i zadovoljenje prvog kriterija, a to je da zbir rezidualnih odstupanja mora biti jednak nuli. 125
Statistika u ekonomiji i menadžmentu
∑ e = 0 ⇔ ∑ ( y − yˆ ) = 0 ⇔ ∑ y =∑ yˆ i
i
i
⇔
i
i
i
i
i
i
1 1 yi = ∑ yˆi ⇔ y = yˆ ∑ n i n i
(3.27)
Zbir rezidualnih odstupanja jednak nuli formalno znači da je aritmetička sredina posmatranih originalnih podataka jednaka aritmetičkoj sredini ocijenjenih podataka. 3.4. MJERENJE REPREZENTATIVNOSTI REGRESIONOG MODELA Da bismo ocijenili reprezentativnost i pouzdanost ocijenjenog modela potrebno je analizirati pokazatelje koji nam to omogućuju. Kao pokazatelje reprezentativnosti analizirat ćemo koeficijent determinacije, koeficijent korelacije, standardnu grešku i koeficijent varijacije regresionog modela. 3.4.1. Koeficijent determinacije Da bismo konstruisali koeficijent determinacije i objasnili njegovo značenje prezentirat ćemo grafički i formalizovati dekompoziciju varijanse. Dekompozicija varijanse promjenljive Y:
yi - y
y yi
yˆ i y
( x, y )
x G rafikon 3.8.
126
yˆ i = a + bx i
xi
Dekom pozicija varijanse
x
Poglavlje 3. – Regresiona i korelaciona analiza
Na osnovu grafikona 3.8. možemo izvršiti sljedeću formalizaciju. Ukupno odstupanje je jednako zbiru objašnjenog i neobjašnjenog odstupanja: ( yi − y ) = ( yˆi − y ) + ( yi − yˆi )
(3.28)
Kako je y = yˆ slijedi: ( yi − y ) = ( yˆi − yˆ ) + ( yi − yˆi )
(3.29)
što omogućava da pokažemo da je ukupna varijansa varijable Y jednaka zbiru objašnjene i neobjašnjene (rezidualne) varijanse:
(
1 1 2 ( yi − y ) = ∑ yˆi − yˆ ∑ n i n i
)
2
+
1 2 ( yi − yˆi ) ∑ n i
(3.30)
Ovaj izraz možemo napisati u sljedećem obliku:
∑( y i − y ) 2 ∑( yˆ i − y ) 2 ∑( y i − yˆ i ) 2 = + n n n
(3.31)
u kojem izraz na lijevoj strani predstavlja ukupnu varijansu, prvi član zbira na desnoj strani objašnjenu a drugi neobjašnjenu varijansu. Gornji izraz možemo napisati u dekomponovanoj formi uvodeći simbole za označavanje objašnjene i neobjašnjene varijanse:
∑( yi − y ) 2 n ∑( yˆi − y ) 2 Objašnjena varijansa : σ 2y / x = n Ukupna varijansa = σ y2 =
Rezidualna (neobjašnjena) varijansa: σ 2yˆ =
(3.32) (3.33)
∑( yi − yˆi ) 2 n
Ukupna varijansa : σ 2y = σ 2y / x + σ 2yˆ
(3.34) (3.35)
Koeficijent determinacije definišemo kao odnos objašnjene i ukupne varijanse:
∑( yˆi − y ) 2 ∑( yˆi − y ) 2 Objašnjena varijansa n r2 = = = Ukupna varijansa ∑( yi − y ) 2 ∑( yi − y ) 2 n
(3.36)
127
Statistika u ekonomiji i menadžmentu
ili pomoću sljedećeg izraza: ∑( yi − yˆi ) 2 ∑( yi − yˆ i ) 2 Neobjašnjena varijansa n (3.37) 1 r2 = 1− = 1− = − Ukupna varijansa ∑( yi − y ) 2 ∑( yi − y ) 2 n
Vrijednost ovog koeficijenta se kreće između nule i jedinice. On pokazuje koja je proporcija ukupne varijacije varijable Y objašnjena ocijenjenom regresionom jednačinom i uobičajeno je da se izražava u procentima. Veća vrijednost ovog koeficijenta ukazuje da je veća proporcija objašnjene u ukupnoj varijaciji i da je odabrani model pouzdaniji i reprezentativniji. Vrijednost koeficijenta determinacije u primjeru 3.1. je bila r2=0,86 što znači da linearni model u kojem je nezavisna (eksplikativna) varijabla proizvodnja u kilogramima objašnjava 86 % varijacije ukupnih prihoda posmatranog preduzeća. 3.4.2. Koeficijent korelacije Koeficijent linearne korelacije mjeri jačinu i smjer povezanosti dvije pojave za koje poznajemo empirijske vrijednosti kvantitatinih varijabli i za koje pretpostavljamo da imaju linearnu vezu. Ovaj koeficijent ne zavisi od jedinica mjere. To je, dakle, neimenovan broj. Koeficijent linearne korelacije je definisan kao odnos kovarijanse varijabli X i Y i proizvoda standardnih devijacija varijable X i varijable Y.
r=
Cov( X , Y ) = σ X ⋅σY
∑ (x
i
∑ (x
i
− x )( yi − y )
− x) ⋅ 2
∑(y
i
− y)
2
(3.38)
Vrijednost koeficijenta linearne korelacije se nalazi između -1 i 1. Veća vrijednost koeficijenta ukazuje na postojanje veće linearne povezanosti između promjenjljivih X i Y. Potrebno je naglasiti da manja vrijednost ovog koeficijenta ne mora uvijek značiti da je slaba korelacija jer se može raditi o pogrešnoj primjeni koeficijenta linearne korelacije za mjerenje jačine veze pojava koje nisu u linearnom odnosu. • Za vrijednosti: -1 < r < 0 korelacija je negativna. • Za vrijednosti: 0 < r < 1 korelacija je pozitivna. 128
Poglavlje 3. – Regresiona i korelaciona analiza
•
Za vrijednosti –1 i 1, radi se o perfektnoj negativnoj, odnosno pozitivnoj korelaciji.
Koeficijent linearne korelacije možemo izraziti kao kvadratni korijen koeficijenta determinacije:
∑( yˆ i − y ) 2
r = r2 =
∑( y i − y ) 2
(3.39)
ili
r = 1−
∑( y i − yˆ i ) 2 ∑( y i − y ) 2
(3.40)
Koeficijent determinacije možemo izraziti koristeći definiciju koeficijenta linearne korelacije. U tom slučaju koeficijent determinacije izražavamo u sljedećem obliku:
r2 =
Cov 2 ( X , Y ) σ 2 X ⋅ σ 2Y
(3.41)
3.4.3. Standardna greška regresionog modela Pored koeficijenta linearne korelacije i koeficijenta determinacije, kvalitet ocjene se može mjeriti i pomoću standardne greške ocjene regresionog modela i koeficijenta varijacije ocijenjenog regresionog modela. Standardna greška ocijenjenog modela može se nazvati i rezidualnom standardnom greškom jer se definiše na osnovu rezidualnog zbira kvadrata odstupanja i jednaka je kvadratnom korijenu rezidualne (neobjašnjene) varijanse: n
σ yˆ =
∑( y i =1
i
− yˆ i ) 2
n
(3.42)
Standardna greška regresije mjeri kvalitet i reprezentativnost ocijenjenog regresionog modela i pokazuje prosječno odstupanje empirijskih vrijednosti zavisne varijable Y od vrijednosti ocijenjenih regresionim modelom. Standardna greška regresije je apsolutna mjera disperzije oko regresije jer se izražava u istim jedinicama mjere kao zavisna varijabla. 129
Statistika u ekonomiji i menadžmentu
3.4.4. Koeficijent varijacije regresionog modela Koefecijent varijacije ocijenjenog regresionog modela je relativni pokazatelj kvaliteta ocjene i jednak je odnosu standardne greške ocijenjenog regresionog modela i aritmetičke sredine zavisne varijable Y:
kVyˆ =
σ yˆ y
⋅100
(3.43)
Na osnovu vrijednosti ovog koeficijenta možemo procijeniti preciznost i kvalitet ocjene na sljedeći način:
•
Ako je 7%<
•
Ako je 4%<
•
Ako je 1%<
•
Ako je
σ yˆ y
σ yˆ y
σ yˆ y
σ yˆ y
≤1%
≤ 10% ocjena je dosta dobra ≤ 7%
ocjena je dobra
≤ 4%
ocjena je vrlo dobra ocjena je odlična.
Primjenu ovih parametara za procjenu kvaliteta ocjene ćemo ilustrovati na primjeru na kojem ćemo ocijeniti linearni i više različitih tipova nelinearnih regresionih modela da bismo odabrali model koji najbolje reprezentuje posmatrane podatke. 3.4.5. Aplikacija različitih oblika regresionog modela Na sljedećem primjeru ćemo aplicirati etape konstrukcije regresionog modela i izvršiti ocjenu različitih oblika modela.
130
Poglavlje 3. – Regresiona i korelaciona analiza
3.4.5.1. Linearni model
Primjer 3.3. Tabela 3.6. Godišnja stanarina u KM u 2003. prema veličini stana izraženoj brojem soba u stanu Stan (broj soba) X 1 2 3 4 5 7 Ukupno
Godišnja stanarina Y 1 870 2 480 3 470 4 980 6 900 11 560 31 260
Broj stanova fj 75 500 81 750 35 500 14 000 7 500 7 000 221 250
Statistička jedinica je stan. Podatke iz tabele možemo sintetizirati na sljedeći način: Tabela 3.7. Parametri za analizirane varijable
Aritmetička sredina Standardna devijacija Koeficijent varijacije
•
•
Stan (broj soba) 2,206 1,345 0,61
Godišnja stanarina 3 025,99 1 911,11 0,63
Prva etapa je izbor varijabli X i Y. Mi želimo objasniti godišnju stanarinu kao funkciju veličine stana. Varijabla X će predstavljati veličinu stana (broj soba) i to je nezavisna ili eksplikativna varijabla. Varijabla Y je godišnja stanarina i to je zavisna ili varijabla koju trebamo objasniti. Druga etapa je kompletiranje dijagrama rasipanja podataka.
131
Statistika u ekonomiji i menadžmentu 12000 11560
Godišnja stanarina
10000 8000 6900
6000 4980
4000 3470
2000 1870 0
0
1
2480 2
Grafikon 3.9.
•
3
4 Veličina stana
5
6
7
Dijagram rasipanja
Treća etapa je ocjena regresione prave. Posmatrajući dijagram rasipanja čini nam se, na prvi pogled, da bismo mogli ocijeniti linearnu regresionu jednačinu: yˆ i = a + bxi
Primjenom analiziranih postupaka ocjene dobijamo vrijednost parametara a i b: a = −755,14 i b = 1626,86 , i kompletiramo jednačinu ocijenjene regresione prave:
yˆi = −755,14 + 1626,86 xi Koeficijent linearne korelacije je r=0,9757 i koeficijent determinacije r2=0,9520. Značenje parametara a i b: parametar a predstavlja odsječak na ordinatnoj osi. Ovdje realno nema odsječka na Y osi jer ukoliko nema stanova za izdavanje, nema ni stanarine. Parametar b predstavlja nagib prave i značenje mu je sljedeće: ako se veličina stana poveća za jednu sobu, godišnja stanarina će u prosjeku rasti za 1626,86 KM. • Četvrta etapa je izračunavanje rezidualnih odstupanja. Uvrštavajući vrijednosti xi u gore ocijenjenu jednačinu, izračunat ćemo ocijenjene vrijednosti zavisne varijable. Rezultate računanja predstavljamo u sljedećoj tabeli.
132
Poglavlje 3. – Regresiona i korelaciona analiza
Tabela 3.8. Radna tabela za primjer 3.3.
xi
yi
yˆ i
y i − yˆ i
( y i − yˆ i )2
1 2 3 4 5 7 Ukupno
1 870 2 480 3 470 4 980 6 900 11 560 31 260
871,71 2 498,57 4 125,43 5 752,29 7 379,14 10 632,86 31 260
998,29 -18,57 -655,43 -772,29 -479,14 927,14 0
996 582,92 344,84 429 588,48 596 431,84 229 575,14 859 588,58 3 112 111,80
Pošto je
•
∑ yi = ∑ yˆi
treba izračunati
∑ ( yi − yˆi )2
Peta etapa: procjena kvaliteta ocijenjene linearne prave - rezidualna standardna devijacija
σ yˆ = -
( yi − yˆi ) 2 3112111,80 = = 720, 20 KM ∑ n 6 i =1 n
koeficijent varijacije regresije:
σ yˆ y
=
720,20 = 0,1382 ⇒ 13,82% 5210
Ova dva parametra imaju visoku vrijednost i ukazuju na vrlo loš kvalitet ocjene. Koeficijent linearne korelacije je r =0,9757 i koeficijent determinacije r2=0,9520. Vrijednost koeficijenta korelacije je blizu jedinici, a koeficijent determinacije znači da je 95,20 % varijabiliteta stanarine objašnjeno varijabilitetom veličina stana. Dakle, na osnovu vrijednosti ova dva koeficijenta mogli bismo zaključiti da je ocjena kvalitetna ali rezidualna standardna devijacija i koeficijent preciznosti ne potvrđuju ovaj rezultat.
133
Statistika u ekonomiji i menadžmentu
•
Šesta etapa: Analiza rezidualnih odstupanja
Tabela 3.9. Rezidualna odstupanja za primjer 3.3.
xi
Rezidualna odstupanja ( y i − yˆ i )
1 2 3 4 5 7 Ukupno
998,29 -18,57 -655,43 -772,29 -479,14 927,14 0
Kada je ocjena dobra i pouzdana, rezidualna odstupanja su slučajna i imaju malu vrijednost kao što smo već naveli analizirajući njihove osobine. Ako bismo predstavili dijagram rasipanja rezidualnih odstupanja vidjeli bismo da on ne zadovoljava gore navedene uslove i da ima paraboličan oblik. To znači da ocijenjeni linearni model ne možemo prihvatiti kao pouzdan i odbacujemo ga. Zbog toga ćemo ocijeniti nekoliko nelinearnih modela. 3.4.5.2. Eksponencijalni model Jednačina eksponencijalnog modela je:
yˆi = a ⋅ b xi
(3.44)
Ocijenjeni eksponencijalni model je dat sljedećim izrazom7:
yˆi = 1377,32 ⋅ 1,3648 xi Ako se broj soba uveća za jednu sobu, stanarina se prosječno uveća za 36,48%. Da bismo analizirali rezidualnu standardnu devijaciju i koeficijent preciznosti ocjene izračunali smo neophodne podatke na isti način kao u slučaju linearne ocjene i dobili rezidualnu standardnu devijaciju:
7
Ovaj i ostali modeli su ocijenjeni korištenjem programa RATS (Regression Analysis for Time Series). Analizirani modeli mogu biti ocijenjeni korištenjem programa Excel ili digitrona koji imaju odgovarajuće statističke funkcije.
134
Poglavlje 3. – Regresiona i korelaciona analiza
σ yˆ =
( yi − yˆi ) 2 539406,11 = = 299,83 KM ∑ 6 n i =1 n
i koeficijent varijacije:
σ yˆ y
=
299,83 = 0,0575 ⇒ 5,75% 5210
Ova ocjena je pouzdanija nego linearna. 3.4.5.3. Stepeni model Ocjenom jednačine stepenog modela: yˆ i = a ⋅ xib
(3.45)
dobili smo sljedeći rezultat:
yˆi = 1517,195 ⋅ xi0,9299 Kvalitet ocjene smo i u ovom slučaju procijenili standardnom devijacijom modela i koeficijentom varijacije:
σ yˆ = σ yˆ y
=
( y i − yˆ i ) 2 = ∑ n i =1 n
6398464,87 = 1032,67 KM 6
1032,67 = 19,82% 5210
Ova ocjena nije pouzdana zbog visoke standardne devijacije i koeficijenta varijacije. 3.4.5.4. Logaritamski model Jednačinu logaritamskog modela: yˆ i = a + b ⋅ ln xi
(3.46)
smo ocijenili i dobili sljedeći izraz:
yˆ i = 150,497 + 4508,4219 ln xi 135
Statistika u ekonomiji i menadžmentu
Dva parametra koja smo ocijenili i za ostale modele u ovom slučaju imaju sljedeće vrijednosti: n
σ yˆ =
σ yˆ y
=
∑( y i =1
i
− yˆ i )2
n
=
15483442,81 = 1606,42 KM 6
1606,42 = 30,83% 5210
Ni ova ocjena nije pouzdana zbog vrlo visoke vrijednosti standardne devijacije i koeficijenta varijacije. Rezultate dobijenih ocjena predstavljamo u tabeli 3.10. Tabela 3.10. Ocjene za različite regresione modele Model
σ yˆ
Linearni
Eksponencijalni
yˆ i = −755,14 + 1626,86 xi
yˆ i = 1377,32 ⋅ 1,3648 x
720,20 KM
299,83 KM
13,82%
5,75%
σ yˆ y
Model
Stepeni
yˆ i = 1517,195 ⋅ x
σ yˆ σ yˆ y
Logaritamski 0 , 9299 i
yˆ i = 150,497 + 4508,4219 ln xi
1032,67 KM
1606,42 KM
19,82%
30,83%
Na osnovu prezentovanih podataka zaključujemo da je ocjena eksponencijalnog modela najpouzdanija i najkvalitetnija jer ima najmanju standardnu devijaciju i najniži koeficijent varijacije. Eksponencijalni model se u analiziranom slučaju najbolje prilagođava datim podacima i reprezentuje vezu između visine stanarine i veličine stana. 136
Poglavlje 3. – Regresiona i korelaciona analiza
Primjer 3.4. Koeficijent linearne korelacije je mjera linearne korelacije između varijabli. Međutim, linearnu regresiju ne treba koristiti “automatski” uvijek kad dobijemo visok koeficijent linearne korelacije. Neophodno je, kao što smo već i naglasili, nacrtati dijagram rasipanja podataka koji nam može pomoći da vizuelno uočimo da li se radi o linearnoj vezi između dvije posmatrane varijable i da poslije izvršene ocjene provjerimo njen kvalitet izračunavanjem parametara koje smo već analizirali. Analizirat ćemo jedan poznati primjer koji je predložio Anscombe8 i na kojem je ilustrovana primjena linearne regresije na četiri distribucije podataka koje predstavljamo u tabeli 3.11. Tabela 3.11. Primjer četiri distribucije podataka Distribucija A
Distribucija B
Distribucija C
Distribucija D
xi
yi
xi
yi
xi
yi
xi
yi
10 8 13 9 11 14 6 4 12 7 5
8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 10,84 4,82 5,68
10 8 13 9 11 14 6 4 12 7 5
9,14 8,14 8,74 8,77 9,26 8,1 6,13 3,1 9,13 7,26 4,74
10 8 13 9 11 14 6 4 12 7 5
7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73
8 8 8 8 8 8 8 19 8 8 8
6,58 5,76 7,71 8,84 8,47 7,04 5,52 12,5 5,56 7,91 6,89
Za svaku od četiri navedene distribucije varijabli X i Y izračunali smo sljedeće statističke pokazatelje. n = 11;
x = 9;
y = 7,5; σ x2 = 10; σ y2 = 3,75; Cov ( X , Y ) = 5
Koeficijent korelacije r =0,816.
8
Anscombe, F.J.: Graph in Statistical Analysis, The American Statistican 27, str. 17-21, prema Droesbeke, J.J.: Eléments de Statistiques, Ellipses, Paris, 1977. g., str. 398-399.
137
Statistika u ekonomiji i menadžmentu
Šest izračunatih pokazatelja su jednaki za sve četiri distribucije. Ako bismo posmatrali samo ove parametre i koeficijent linearne korelacije te ocijenili linearnu regresiju za sva četiri slučaja, napravili bismo grešku. Zbog toga uvijek treba prije ocjene analizirati dijagram rasipanja (analiza a priori) i poslije izvršene ocjene analizirati rezidualna odstupanja (analiza a posteriori). Pošto ponekad ni na osnovu dijagrama rasipanja ne možemo precizno odrediti oblik veze, potrebno je izvršiti ocjene više različitih modela i izabrati najpouzdaniju ocjenu na osnovu analiziranih kriterija. Na sljedećim grafikonima predstavljamo dijagrame rasipanja i linearnu pravu koju smo dobili ocijenjujući linearnu regresiju metodom najmanjih kvadrata.
yˆ = 3 + 0,5 x Koeficijent determinacije je jednak r2=0,667.
y
12 10 8 6 4 2 0
0
2
Grafikon 3.10.
138
4
6
8
10
12
A: Dijagram rasipanja i regresiona prava
14
x
16
Poglavlje 3. – Regresiona i korelaciona analiza
y 12 10 8 6 4 2 0
0
2
4
Grafikon 3.11.
6
8
10
12
14
x
B: Dijagram rasipanja i regresiona prava
y 14 12 10 8 6 4 2 0
x 0
2
4
Grafikon 3.12.
6
8
10
12
14
16
C: Dijagram rasipanja i regresiona prava
y
14 12 10
8 6 4 2 0
0
2
Grafikon 3.13.
4
6
8
10
12
14
16
18
20
x
D: Dijagram rasipanja i regresiona prava
139
Statistika u ekonomiji i menadžmentu
Konstatujemo i naglašavamo da je samo u slučaju A moguće prihvatiti i ocijeniti regresionu pravu. Za ostale slučajeve regresiona prava ne prezentuje adekvatno oblak rasipanja. Analiza a posteriori rezidualnih odstupanja u slučajevima B, C i D pokazuje da se u ova tri slučaja ne može prihvatiti ocjena regresione prave i da je potrebno tražiti i ocijeniti neki drugi model. 3.4.6. Spearmanov koeficijent korelacije ranga Za utvrđivanje stepena povezanosti između pojava za koje su podaci dati u obliku modaliteta rang varijable koristi se Spearmanov koeficijent korelacije ranga. Ovaj koeficijent korelacije se označava simbolom rs i određuje korištenjem sljedećeg izraza:
rs = 1 −
6 n( n
2
n
∑d − 1) i =1
2 i
di = r(xi) – r(yi), i=1, 2,...,n.
(3.47) (3.48)
di predstavlja razlike rangova za odgovarajuće parove vrijednosti varijabli ranga. Kao i za koeficijent linearne korelacije, vrijednost koeficijenta korelacije ranga se uvijek kreće između –1 i +1. Zavisnost je potpuna ako je |rs| = 1.
3.5. MODEL VIŠESTRUKE REGRESIJE Model višestruke ili multiple regresije možemo napisati u sljedećem obliku:
Y = f ( X 1 , X 2 ,...., X K ) + e
(3.49)
Zavisna varijabla Y je izražena kao funkcija K nezavisnih varijabli i slučajnog odstupanja e. Ukoliko je funkcionalni dio modela definisan linearnom funkcijom možemo definisati standardni model višestruke linearne regresije sljedećim izrazom:
Y = a + b1 X 1 + b2 X 2 + ... + bK X K + e
(3.50)
odnosno za n vrijednosti:
y i = a + b1 xi1 + b2 xi 2 + ... + bK xiK + ei , i = 1,2,..., n . 140
(3.51)
Poglavlje 3. – Regresiona i korelaciona analiza
Koeficijenti u regresionom modelu imaju sljedeće značenje: parametar a je slobodni, konstantni član koji predstavlja očekivanu vrijednost zavisne varijable Y kada je vrijednost svih K nezavisnih varijabli (X1, X2,...,XK) jednaka nuli. Vrijednost ovog parametra nema uvijek logičko objašnjenje. Parametar bi (i=1,2,....,K) ili regresioni koeficijent pokazuje prosječnu promjenu zavisne varijable Y uslovljenu jediničnim povećanjem nezavisne varijable Xi, uz uslov da ostale nezavisne varijable ostanu nepromijenjene. Pozitivna vrijednost parametra bi ukazuje na proporcionalan odnos varijabli Y i Xi. To znači da rast nezavisne varijable Xi uslovljava rast zavisne varijable Y. Negativna vrijednost koeficijenta bi znači obrnuto proporcionalan odnos zavisne varijable Y i nezavisne varijable Xi. U ovom slučaju smjer promjene nezavisne i zavisne varijable je suprotan, odnosno rast Xi uzrokuje opadanje zavisne varijable Y, a opadanje Xi uzrokuje rast zavisne varijable Y. 3.5.1. Koeficijent multiple determinacije, multiple linearne korelacije, koeficijenti parcijalne korelacije i korelaciona matrica Koeficijent multiple determinacije je definisan sljedećim izrazom:
RY2;1, 2,.., K =
∑( yˆ i − y ) 2 , 0 ≤ RY2;1, 2 ,..,K ≤ 1 2 ∑ ( yi − y )
(3.52)
Koeficijent multiple linearne korelacije mjeri jačinu varijabiliteta između zavisne varijable i zbirnog varijabiliteta K nezavisnih varijabli. Određuje se kao kvadratni korijen koeficijenta multiple determinacije:
RY ;1, 2,.., K =
∑( yˆ i − y ) 2 , 0 ≤ RY ;1, 2,.., K ≤ 1 ∑ ( yi − y ) 2
(3.53)
ili pomoću izraza:
RY ;1, 2,.., K =
∑( yi − y )( yˆ i − y ) nσ yσ y
(3.54)
Koeficijentu se ne pridružuje predznak jer odnosi između zavisne i nezavisnih varijabli mogu biti raznosmjerni. Koeficijent parcijalne korelacije pokazuje jačinu i smjer veze zavisne varijable Y i j-te nezavisne 141
Statistika u ekonomiji i menadžmentu
varijable uz nepromijenjen uticaj preostalih (K-1) varijabli koje označavamo sa c. Vrijednost ovog koeficijenta se kreće u sljedećim granicama: − 1 ≤ ry ; j ,c ≤ 1 . Koeficijenti parcijalne korelacije prvog reda za K=2 definišu se pomoću koeficijenata jednostavne linearne korelacije na sljedeći način:
ry ;1,2 =
ry ;1 − ry ;2 r1,2 (1 − ry2;1 )(1 − r1,22 )
; ry ;2,1 =
ry ;2 − ry ;1 r1,2 (1 − ry2;2 )(1 − r1,22 )
(3.55)
Pored koeficijenata multiple i parcijalne korelacije, u višedimnzionalnoj regresionoj analizi se primjenjuju i koeficijenti jednostavne linearne korelacije. Ovi koeficijenti se predstavljaju u obliku korelacione matrice: ⎡1 ry1 .... ryK ⎤ ⎢ ⎥ ⎢ r1 y 1 .... r1K ⎥ R = ⎢ r2 y r21 .... r2 K ⎥ ⎢ ⎥ ⎢.......................... ⎥ ⎢ ⎥ ⎣⎢ rKy rK 1 .... 1 ⎦⎥
(3.56)
U prvom redu matrice R se nalaze koeficijenti jednostavne linearne korelacije između zavisne i svake nezavisne varijable. U prvoj koloni su koeficijenti jednostavne linearne korelacije između svake nezavisne i zavisne varijable. Za koeficijente jednostavne linearne korelacije vrijedi osobina simetričnosti. To znači da se vrijednost koeficijenta jednostavne linearne korelacije ne mijenja ako se zamijeni mjesto varijabli: ryj = rjy ,
j = 1,2,...., K .
rjk = rkj ,
j , k = 1,2,...., K .
Iz navedenog zaključujemo da je korelaciona matrica simetrična. Na glavnoj dijagonali se nalaze jedinice, jer je koeficijent jednostavne linearne korelacije jedne varijable sa tom varijablom jednak jedinici. 3.5.2. Analiza numeričkog primjera Na sljedećem primjeru ćemo ilustrovati ocjenu višestrukog regresionog modela i značenje ocijenjenih parametara.
142
Poglavlje 3. – Regresiona i korelaciona analiza
Primjer 3.5. Tabela 3.12. Prihod preduzeća izražen u hiljadama KM (Y), proizvodnja izražena u kilogramima (X1) i troškovi proizvodnje po kg (X2) izraženi u KM.
Y 20 25 25 35 30 35 40
X1 50 100 150 200 250 300 350
X2 280 260 260 248 196 178 160
Ocijenićemo regresioni model Y = a + b1 X 1 + b2 X 2 primjenom Excela. Izlazne tabele Excela nam daju sljedeće rezultate. Tabela 3.13. (a.,b.,c.) Output Excela za multiplu regresiono-korelacionu analizu na primjeru 3.5.
a. SUMMARY OUTPUT REGRESSION STATISTICS Multiple R 0,9528 R Square 0,9078 Adjusted R Square 0,8617 Standard Error 2,6292 Observations 7
b.
Regression Residual Total
df 2 4 6
ANOVA SS MS 272,3485 136,1742 27,6515 6,9129 300
F 19,6986
Significance F 0,0085
143
Statistika u ekonomiji i menadžmentu
c. COEFFICIENTS STANDARD ERROR T- STAT P-VALUE Intercept -20,7251 26,9055 -0,7703 0,4841 X1 0,1130 0,0377 3,0000 0,0399 X2 0,1245 0,0865 1,4389 0,2236
Ocijenjeni regresioni model je:
Y = −20,7251 + 0,1130 X 1 + 0,1245 X 2 Zavisna varijabla Y predstavlja prihod preduzeća izražen u hiljadama KM, varijabla X1 je proizvodnja izražena u kilogramima i varijabla X2 troškovi proizvodnje po kg izraženi u KM. Značenje dobijenih rezultata je sljedeće: konstantni član a = -20,7251. Ukoliko ne bi bilo proizvodnje, niti troškova proizvodnje, očekivani prihod bi bio negativan. Prihod se ne bi ostvarivao, a morale bi se plaćati već preuzete obaveze vezane za pokretanje proizvodnje. Značenje parametra uz varijablu X1 čija je vrijednost 0,1130 je sljedeće: ukoliko se proizvodnja poveća za jedan kg, prihod će se povećati za 1130 KM uz pretpostavku da troškovi po jedinici proizvoda ostaju nepromijenjeni. Koeficijent uz varijablu X2 je jednak 0,1245. Ukoliko bi se troškovi proizvodnje po jedinici proizvoda povećali za 1 KM, prihod bi se povećao za 1245 KM, uz pretpostavku da nivo proizvodnje ostaje nepromijenjen. Koeficijent multiple korelacije R koji predstavlja povezanost izmedu zavisne i dvije nezavisne varijable je jednak R = 0,95. To znači da postoji jaka povezanost između ukupnog prihoda Y i dvije posmatrane nezavisne varijable koje su proizvodanja izražena u kg i troškovi po jedinici proizvodnje. Koeficijent multiple determinacije R2 predstavlja dio varijacije zavisne varijable objašnjen ocijenjenim linearnim regresionim modelom. Njegova vrijednost je R2 = 0,91 što znači da je 91% varijacije prihoda objašnjeno proizvodnjom izraženom u kg i troškovima po jedinici proizvoda. Statistička značajnost regresijskog modela je određena empirijskim F omjerom i odgovarajućom p vrijednosti u tabeli ANOVA. U našem slučaju p = 0,0085 < 0,01 pa zaključujemo da barem jedna od nezavisnih varijabli statistički značajno utiče na vrijednost zavisne varijable uz nivo rizika od 1%. U izlaznoj tabeli Excela prezentovane su i statističke značajnosti 144
Poglavlje 3. – Regresiona i korelaciona analiza
regresionih koeficijanata koje se određuju pomoću t-statistike i pripadajućih p vrijednosti. Za varijablu X1 vrijednost p= 0,0399, a za X2 p=0,2236. Konstatujemo da u ocijenjenom regresionom modelu varijabla proizvodnja u kg statistički značajno utiče na zavisnu varijablu Y zbog toga što je odgovarajuća vrijednost p manja od 0,05. Za drugu varijablu p vrijednost je veća od 0,05 i to znači da uticaj troškova po jedinici proizvodnje u ovom modelu nije statistički značajan.
3.6. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6.
Na kojem kriteriju je bazirana metoda najmanjih kvadrata? Napišite formule za ocjenu parametara a i b regresione prave. Objasnite značenje parametara a i b regresione prave. Definišite i objasnite kovarijansu. Da li je kovarijansa pokazatelj nezavisnosti posmatranih pojava? Koji koeficijenti služe za mjerenje jačine i smjera povezanosti ekonomskih pojava? 7. Definišite i objasnite značenje koeficijenta determinacije. 8. U kojem intervalu se mogu kretati vrijednosti koeficijenta determinacije? 9. Definišite i objasnite koeficijent linearne korelacije? 10. Koje vrijednosti može imati koeficijent linearne korelacije? 11. Definišite varijansu zbira i razlike dvije nezavisne statističke varijable. 12. Definišite varijansu zbira i razlike dvije statističke varijable. 13. Napišite izraz za dekompoziciju ukupne varijanse. 14. Definišite rezidualnu (neobjašnjenu) varijansu. 15. Definišite objašnjenu varijansu.
145
Statistika u ekonomiji i menadžmentu
3.7. RIJEŠENI ZADACI
Zadatak 1. U sljedećoj tabeli su dati podaci o troškovima promocije i prihodu od prodaje proizvoda Z: Godine
1999 2000 2001 2002 2003 2004 2005
Troškovi promocije (u 000 eura) 50 20 10 30 80 100 120
Prihod od prodaje (u 000 eura) 280 220 180 220 320 330 350
Prvi dio: 1. Odredite zavisnu i nezavisu varijablu? 2. Predstavite dijagram rasipanja. Koji tip funkcije se najbolje prilagođava datom dijagramu? 3. Koji je, po vašem mišljenju, znak kovarijanse između dvije posmatrane varijable? 4. Izračunajte jednačinu regresione prave. 5. Predstavite grafički ovu pravu na dijagramu rasipanja. Komentarišite. 6. Izračunajte koeficijent linearne korelacije i koeficijent determinacije i objasnite njihova značenja. 7. Marketing servis predviđa za 2006 godinu budžet za promociju u iznosu od 125000 €. Procijenite prihod od prodaje za 2006 godinu. Komentarišite.
146
Poglavlje 3. – Regresiona i korelaciona analiza
Drugi dio: Godine
Posmatrana prodaja
yi 1999 2000 2001 2002 2003 2004 2005 Ukupno
280 220 180 220 320 330 350 1900
Prodaja procijenjena modelom
( yi − yˆi )2
( yˆi − y )2
yˆi 258,50 213,26 198,18 228,34 303,74 333,90 364,06 1900
462,14 45,40 330,58 69,59 264,28 15,24 197,80 1385,03
167,08 3383,35 5365,09 1856,43 1044,24 3903,15 8581,35 24300,69
1. Provjerite rezultat prve linije gornje tabele za 1999. godinu. 2. Uporedite aritmetičku sredinu posmatranih prodaja i aritmetičku sredinu procijenjenih prodaja. 3. Izračunati neobjašnjenu varijansu i varijansu objašnjenu regresijonom pravom. 4. Provjerite numerički jednakost: Ukupna varijansa = Objašnjena varijansa + Neobjašnjena (rezidualna) varijansa. 5. Provjerite vrijednosti dobijene za koeficijent determinacije u prvom dijelu. Elementi rješenja:
Prvi dio: 1. U ovom primjeru promjenljiva Y, prihod od prodaje proizvoda Z, je zavisna promijenljiva. Posmatramo je kao funkciju nezavisne promjenljive troškovi promocije X.
147
Statistika u ekonomiji i menadžmentu
Prihod
2.
400
yˆ = 1,508 x + 183,1 R 2 = 09461
300 200 100 0
0
20
40
60
80
100
120
140
Troškovi reklame Grafikon 3.14
Dijagram rasipanja i regresiona prava
3. Kovarijansa je pozitivna. 4. yˆ = 183,1 + 1,51x 5. Model linearne regresije se najbolje prilagođava datim podacima. 6. Koeficijent linearne korelacije r je jednak 0,97. To znači da postoji visok stepen linearne korelacije između dvije posmatrane varijable. Vrijednost koeficijenta determinacije je jednaka 0,946 i to znači da je 94,6% varijacije prihoda objašnjeno troškovima promocije.
r= r2 =
Cov( X , Y )
σ XσY Cov 2 ( X ,Y )
σ x2 σ y2
= 0,972 = 0,946
7. Y ocjenjeno za 2006. godinu:
yˆ = 183,1 + 1,51x
yˆ = 183,1 + 1,51 ⋅ 125 = 371,85 Ako bi budžet za promociju u 2006. godini iznosio 125 000 eura, prihod od prodaje u ovoj godini bi bio 371850 eura. 148
Poglavlje 3. – Regresiona i korelaciona analiza
Drugi dio: 1. Y procjenjeno za 1999
yˆ = 183,1 + 1,51 ⋅ 50 = 258,6 2. Aritmetička sredina posmatranih prodaja i aritmetička sredina procijenjenih prodaja su jednake 271,43. 3. Neobjašnjena varijansa:
σ y2 / x =
∑( y i − yˆ i ) 2 1385.03 = = 197.86 n 7
Objašnjena varijansa:
σ
2 y/x
∑( yˆ i − y ) 2 24300.69 = = = 3471.52 n 7
4. Ukupna varijansa: ∑( y − y ) 2 ∑( y i − yˆ i ) 2 ∑( yˆ i − y ) 2 = + = 197.86 + 3471.52 = 3669.38 n n n 5.
r2 =
objašnjena varijansa 3471.52 = = 0.946 ukupna varijansa 3669.38
r2 =1−
neobjašnjena varijansa 197.86 =1− = 1 − 0.0539 = 0.946 ukupna varijansa 3669.38
Zadatak 2. U sljedećoj tabeli posmatramo kretanje varijabli X i Y. Y je zavisna varijabla. Godine 1999 2000 2001 2002 Ukupno
X 0 3 5 8 16
Y 2 5 3 6 16
149
Statistika u ekonomiji i menadžmentu
Poznate su sljedeće vrijednosti: aritmetička sredina varijable X jednaka je 4, varijansa od X jednaka je 8,5, aritmetička sredina varijable Y jednaka je 4, varijansa od Y jednaka je 2,5 i Cov(X, Y)=4. 1. Odrediti jednačinu regresione prave. 2. Izračunati koeficijent determinacije i objasniti ga. Elementi rješenja:
b=
Cov( X , Y )
σ
2 X
=
4 = 0, 47 8,5
a = y − bx = 4 − 0, 47 ⋅ 4 = 2,12 yˆ = 2,12 + 0, 47 x r = 2
Cov 2 ( X , Y )
σ σ 2 X
2 Y
=
4 = 0,188 8,5 ⋅ 2,5
Zadatak 3. Za varijable X i Y poznato je 15 parova vrijednosti (xi, yi). Y je zavisna varijabla. Poznati su sljedeći parametri ove dvije distribucije:
x = 4,
σ X2 = 3.75
y = 4,
σ Y2 = 3
i koeficijent pravca regresione prave: b = - 0.8 1. Odredite jednačinu regresione prave. 2. Izračunajte koeficijent linearne korelacije. 3. Odredite varijansu objašnjenu regresionom pravom. Elementi rješenja:
a = y − bx = 4 + 0,8 ⋅ 4 = 7, 2 yˆ = 7, 2 − 0,8 x r=
150
Cov( X , Y )
σ XσY
Poglavlje 3. – Regresiona i korelaciona analiza
b=
Cov ( X , Y )
σ X2
⇒
Cov ( X , Y ) = b ⋅ σ X2 = −0,8 ⋅ 3,75 = −3 r=
Cov ( X , Y )
r2 =
σ XσY
=
−3 = −0,89 3,35
Objašnjena varijansa ⇒ Ukupna varijansa
Objašnjena varijansa = r 2 ⋅ Ukupna varijansa = 0, 79 ⋅ 3 = 2,37
151
POGLAVLJE 4.
DINAMIČKA ANALIZA I MJERENJE EVOLUCIJE
Za istraživanje i analizu promjena pojava u vremenu primjenjuju se metode dinamičke analize. Dinamička analiza omogućava praćenje promjena pojava u vremenu i predviđanje tendencije razvoja pojava.
4.1. APSOLUTNA I RELATIVNA PROMJENA Apsolutna promjena pojave V između datuma t i datuma 0 je jednaka:
ΔV = Vt − Vo
(4.1)
Apsolutna promjena je izražena u jedinicama mjere analizirane varijable. Apsolutna promjena može biti negativna. Relativna promjena veličine pojave V između perioda t i 0 je jednaka:
ΔV Vt − V0 = V V0
(4.2)
153
Statistika u ekonomiji i menadžmentu
Relativna promjena se naziva stopa promjene. Ukoliko je stopa promjene pozitivna naziva se stopa rasta. Stopu promjene možemo izraziti i sljedećom formulom:
ΔV Vt − V0 Vt = = −1 V V0 V0
(4.3)
Izračunavanje i objašnjenje apsolutne i relativne promjene ćemo ilustrovati na primjeru 4.1.
Primjer 4.1. Tabela 4.1. Broj studenata i nastavnog osoblja na fakultetima u Federaciji BiH
Kod za školsku godinu Redovni studenti Vanredni studenti Nastavnici Saradnici Broj fakulteta
1997/98 1998/99 1999/00 (1) (2) (3) 22 697 26 649 28 912 6 451 9 315 11 483 1 250 1 294 1 442 1 080 1 185 1 248 40 48 47
2000/01 (4) 31 861 11 360 860 913 48
2001/02 (5) 32 614 12 192 777 898 48
Izvor: Statistički godišnjak Federacije BiH, 2002, Sarajevo, str.309.
U koloni posmatramo strukturu studenata, nastavnog osoblja i broja fakulteta. U 2001/02 godini je bilo 32 614 redovnih i 12 192 vanredna studenta. Broj nastavnika je bio 777, a saradnika 898. Broj fakulteta je bio 48. Za svaku od posmatranih godina možemo analizirati datu strukturu. Analiza redova u datoj tabeli omogućava istraživanje evolucije analiziranih pokazatelja i struktura u vremenu. Na grafikonima 4.1. i 4.2. je prezentirana struktura posmatranih pokazatelja i njihova evolucija u vremenu.
154
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
35000 30000
redovni studenti
25000
vanredni studenti
20000
nastavnici saradnici
15000 10000 5000 0
1997/98
Grafikon 4.1.
1998/99
1999/00
2000/01
2001/02
Struktura studenata i nastavnog osoblja
35000 30000
1997/98
25000
1998/99
20000
1999/00
15000
2000/01 2001/02
10000 5000 0
redovni
Grafikon 4.2.
vanredni
nastavnici
saradnici
Evolucija broja studenata i nastavnog osoblja
U posmatranom periodu broj studenata, redovnih i vanrednih, je u stalnom porastu. Broj nastavnika i saradnika pokazuje tendenciju opadanja od 1999/00 godine. Koristeći prezentiranu i analiziranu definiciju i izraz za apsolutnu promjenu izračunali smo i prezentirali u narednoj tabeli apsolutne stope promjene broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine.
155
Statistika u ekonomiji i menadžmentu
Tabela 4.2. Apsolutne promjene broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine
Redovni studenti Vanredni studenti Nastavnici Saradnici
ΔV2-1 3 952 2 864 44 105
ΔV3-2 2 263 2 168 146 63
ΔV4-3 2 949 -123 -582 -335
ΔV5-4 753 832 -83 -15
ΔV5-1 9 917 5 741 -473 -182
Najveća apsolutna promjena broja redovnih studenata je bila između 1997/98 i 1998/99 akademske godine. Broj redovnih studenata se u periodu između ove dvije akademske godine povećao za 3952. Najmanja apsolutna promjena je bila između 2000/01 i 2001/02 akademske godine. Broj studenata se povećao za samo 753. Apsolutna promjena broja redovnih studenata između 2001/02 i 1998/99 je bila 9 917 studenata. Ovu apsolutnu promjenu smo izračunali na osnovu definicije apsolutne promjene. Apsolutnu promjenu u ovom periodu možemo izračunati i sabiranjem uzastopnih apsolutnih promjena u posmatranim godinama:
ΔV5-1= ΔV2-1+ΔV3-2+ΔV4-3+ΔV5-4 . Npr. za redovne studente: 9917=3952+2263+2949+753. Na isti način bismo mogli utvrditi apsolutne promjene i za ostale posmatrane kategorije. Apsolutne promjene broja vanrednih studenata su bile pozitivne, osim u periodu između 1999/00 i 2000/01 godine. Apsolutne promjene broja nastavnika i saradnika su bile pozitivne u prve dvije akademske godine, a u naredne dvije godine su bile negativne što ukazuje na to da se broj nastavnika i saradnika smanjio u tim godinama. Broj nastavnika se smanjio za 473 u 2001/02 u odnosu na 1997/98 godinu. U posmatranom periodu, za tri od pet akademskih godina utvrdili smo negativnu apsolutnu promjenu saradnika.
156
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.3. Relativna promjena broja studenata i nastavnog osoblja na fakultetima u Federaciji Bosne i Hercegovine
Redovni studenti Vanredni studenti Nastavnici Saradnici
V2 − V1 V1
V3 − V2 V2
V4 − V3 V3
V5 − V4 V4
V5 − V1 V1
17,41 44,39 3,52 9,72
8,49 23,27 11,28 5,32
10,20 -1,07 -40,36 -26,84
2,36 7,32 -9,65 -1,64
43,69 88,99 -37,84 -16,85
Relativne promjene redovnih studenata su u svim posmatranim godinama bile pozitivne. U periodu između 1997/98 i 2001/02 godine stopa promjene je dostigla nivo 43,69%. Relativne promjene, odnosno stope promjene se ne mogu sabirati. Stope promjene ne posjeduju osobine računanja. Stopa promjene u periodu između 1998/99 i 2001/02 godine nije jednaka zbiru stopa promjene za pojedine godine posmatranog perioda:
ΔV5 −1 ΔV2 −1 ΔV3− 2 ΔV4 − 3 ΔV5 − 4 ≠ + + + V1 V1 V2 V3 V4 Ovu osobinu stope promjene provjeravamo na primjeru redovnih studenata: 43,69≠17,41+8,49+10,20+2,36=38,48 Najveću stopu rasta konstatujemo kod vanrednih studenata između prve i posljednje posmatrane akademske godine. Stopa rasta je bila 88,99 %. Negativne stope promjene konstatujemo u dva perioda kod nastavnika i saradnika. U 2001/02 u odnosu na 1997/98 godinu broj nastavnika se smanjio za 37,84 %, a broj saradnika za 16,85 %. Da bi analiza bila kompletna, potrebno je istovremeno posmatrati i relativne i apsolutne promjene. U narednom primjeru ćemo grafički ilustrovati, izračunati i analizirati apsolutne i relativne promjene broja nezaposlenih u Federaciji Bosne i Hercegovine prema stručnoj spremi.
157
Statistika u ekonomiji i menadžmentu
Tabela 4.4. Broj nezaposlenih osoba u Federaciji BiH prema stručnoj spremi 1998 2 851 2 358 48 383 84 273 10 786 107 836 256 487
VSS VSS SSS VKV, KV PKV, NSS NKV Ukupno
1999 2 635 2 485 49 870 87 852 14 997 103 954 261 793
2000 2 853 2 827 51 684 90 330 15 226 98 853 261 773
2001 3 043 3 236 54 877 95 359 15 965 96 524 269 004
Izvor: Statistički godišnjak Federacije BiH, 2002, Sarajevo, 2002, str.270.
120,000 VSS
100,000
VŠS
80,000
SSS
60,000
VKV, KV
40,000
PKV, NSS
20,000
NKV
0
1998
Grafikon 4.3.
1999
2000
2001
Struktura nezaposlenih prema stručnoj spremi u Federaciji BiH
120,000 100,000 1998
80,000
1999
60,000
2000
40,000
2001
20,000 0
VSS
Grafikon 4.4.
158
VŠS
SSS
VKV, KV
PKV, NSS
NKV
Evolucija broja nezaposlenih u Federaciji BiH prema stručnoj spremi
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.5. Apsolutne promjene broja nezaposlenih osoba u Federaciji BiH prema stručnoj spremi 1999/98 -216 127 1 487 3 579 4 211 -3 882 5 306
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
2000/99 218 342 1814 2 478 229 -5101 -20
2001/00 190 409 3 193 5 029 739 -2 329 7 236
2001/98 192 878 6494 11 086 5 170 -11312 12 517
15000
Absolutna promjena
10000 5000 NKV 0 -5000
VSS
-10000
VŠS
1998/99
SSS
VKV, KV
1999/00
2000/01
PKV, NSS
1998/01
-15000
Grafikon 4.5.
Absolutne promjene broja nezaposlenih u Federaciji BiH
Tabela 4.6. Relativna promjena broja nezaposlenih osoba u Federaciji BiH prema stručnoj spremi u %
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
1999/98 -7,58 5,38 3,07 4,25 39,04 -3,60 2,07
2000/99 8,27 13,76 3,64 2,82 1,53 -4,91 -0,008
2001/00 6,66 14,47 6,18 5,57 4,85 -2,36 2,76
2001/98 6,73 37,23 13,42 13,15 47,93 -10,49 4,88
159
Relativna stopa promjene
Statistika u ekonomiji i menadžmentu % 60
1999/98
50
2000/99
2001/00
2001/98
40 30 20 10 0 -10
VSS
VŠS
SSS
VKV, KV
PKV, NSS NKV
-20 Grafikon 4.6.
Relativne stope promjene nezaposlenih u Federaciji BiH u %
Na osnovu izračunatih i prezentiranih parametara i njihovih grafičkih prikaza možemo dati kompletnu analizu evolucije nezaposlenih osoba prema stručnoj spremi. Grafički prikazi koje smo kompletirali su ilustrativniji od desetine rečenica jer nam omogućavaju vizuelno posmatranje promjena i u strukturi i u evoluciji nezaposlenih u posmatranom periodu. Zapažamo da je došlo do porasta broja nezaposlenih više i srednje stručne spreme, kao i svih kategorija kvalifikovanih radnika. Jedino smanjenje broja nezaposlenih bilježe nekvalifikovani radnici. Ove konstatacije potvrđuju i izračunate relativne promjene.
4.2. INDEKSI Statistička analiza razlikuje apsolutne i relativne promjene. Termin relativne promjene se razvio na više nivoa u slučajevima kada se porede različite veličine u prostoru i vremenu. Za opis i poređenje evolucije pojava i varijabli čiji je red veličina različit najčešće se koriste indeksi. Indeks je broj koji objašnjava relativnu promjenu jednostavne ili kompleksne veličine između dva perioda, od kojih se jedan odabire kao bazni period. Kako je indeks odnos između dvije veličine iste prirode, on ne posjeduje jedinicu mjere. Indeks je, dakle, neimenovan broj.
160
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Najpoznatija dihotomija ideksa je na individualne (elementarne, proste) i agregatne (sintetičke) indekse. • Individualni indeksi se primjenjuju u slučaju kada želimo analizirati homogene veličine. Individualni indeksi se konstruišu tako da fiksiramo bazni period i izračunavamo promjenu posmatrane veličine između posmatranog perioda, koji ćemo označiti sa t, i baznog perioda, koji označavamo sa 0. Individualni indeks je bazni elemenat statističke analize hronoloških serija. • Agregatni indeksi se baziraju na istim principima, ali se primjenjuju za analizu heterogenih veličina. Neki od njih služe kao referentni indeksi. Najpoznatiji su indeksi vrijednosti, indeksi cijena, indeksi fizičkog obima proizvodnje, indeksi troškova života, berzni indeksi (Dow Jones, CAC 40), itd. Njihova konstrukcija je tehnički i metodološki vrlo komplikovana što ponekad otežava njihovo tumačenje. Praktična korisnost indeksa dolazi posebno do izražaja ako se analiza vrši za duži period. Fiksira se bazna godina za koju je indeks jednak 1 (ili 100), zatim se računaju indeksi za svaku godinu. Ukoliko su indeksi veći od 100, posmatrana pojava je relativno rasla u odnosu na bazni ili prethodni period. Kada su indeksi manji od 100, analizirana pojava je opadala u odnosu na bazni ili prethodni period. Indeksi nam pružaju direktno sintetički pogled na evoluciju u odnosu na bazni ili prethodni period i omogućavaju praćenje promjena analiziranih veličina između svih posmatranih perioda. 4.2.1. Individualni indeksi Individualni indeks se primjenjuje za analizu promjena u vremenu posmatrane veličine, kao i za poređenje evolucije više različitih veličina. Indeksi se mogu izraziti u odnosu na bazu 1 ili 100. Za izračunavanja se, iz praktičnih razloga, koriste indeksi u bazi 1. Konačni rezultati se prezentiraju u formi indeksa čija je baza 100 ili u obliku stope promjene u procentima. Indeks nema jedinice mjere. Indeks je, kao što smo već naveli, neimenovan broj koji ima veliku praktičnu upotrebu. Individualni indeksi se mogu izračunavati na osnovu stalne i promjenljive baze.
161
Statistika u ekonomiji i menadžmentu
4.2.1.1. Indeksi sa stalnom bazom (bazni indeksi) Bazne indekse ili indekse sa stalnom bazom izračunavamo kao količnik između veličine analizirane pojave u posmatranom i odabranom baznom periodu. Da bismo izračunali indeks sa stalnom bazom potrebno je prvo odabrati baznu godinu za koju indeks ima vrijednost 1 (ili 100). Ako sa Vt označimo veličinu analizirane pojave u periodu t i sa V0 označimo veličinu analizirane pojave u baznom periodu, individualni indeks između ta dva perioda ćemo izračunati na sljedeći način:
it / 0 =
Vt V0
(4.4)
Individualni indeks veličine V za period t u odnosu na bazni period 0 ako je baza 100 u periodu 0 je dat sljedećim izrazom:
I t / 0 = it / 0 ⋅ 100 =
Vt ⋅ 100 9 V0
(4.5)
Bazni indeksi se definišu kao indeksi razvoja. Ovi indeksi su pokazatelj razvoja pojava u posmatranom periodu u odnosu na bazni period. Bazni indeksi se koriste i za poređenja razvoja više pojava. Indeksi sa stalnom bazom se koriste za analizu i poređenja na isti način kao i originalni podaci o vrijednostima posmatranih pojava. Razlika između dva bazna indeksa je pokazatelj indeksnih poena. Na bazi podataka iz tabele 4.4., izračunali smo bazne indekse nezaposlenih osoba prema stručnoj spremi. Za bazu smo odabrali 1998. godinu. Izračunate indekse prezentujemo u tabeli 4.7.
9
Sa malim i označavamo proste indekse ako su izraženi u bazi 1. Množenjem ovih indeksa sa 100 dobijamo indekse izražene u bazi 100 i označavamo ih sa velikim slovom I.
162
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.7. Bazni indeksi I t / 0
I1998 100 100 100 100 100 100 100
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
I99/98 92,42 105,39 103,7 104,25 139,04 96,40 102,07
I00/98 100,07 119,89 106,82 107,19 141,16 91,67 102,06
I01/98 106,73 137,23 113,42 113,15 148,02 89,51 104,88
Indeks nezaposlenosti za visoku stručnu spremu u 1999.g. baza 100 u 1998.g. je jednak 92,42. To znači da je nezaposlenost VSS u tom periodu opala za 7,58 %. Indeks nezaposlenosti VSS u 2001. baza 100 u 1998.g. je 106,73. Stopa rasta nezaposlenosti VSS u ovom periodu je bila 6,73%. Indeks ukupnog broja nezaposlenih u periodu 1998.-2001. godine je bio 104,88. U ovom periodu ukupan broj nezaposlenih je porastao za 4,88%. Po analogiji sa datim objašnjenjima mogli bismo analizirati i ostale podatke iz tabele 4.7. za sve kategorije nezaposlenih u posmatranim periodima. Na dva grafikona koji slijede smo predstavili bazične indekse nezaposlenih osoba visoke stručne spreme (VSS). 110
106,73
105 100
100
95
100,07
92,42
90 85
1998
Grafikon 4.7.
1999/98
2000/98
2001/98
Bazni indeksi broja nezaposlenih VSS baza 100 u 1998.g.
163
Statistika u ekonomiji i menadžmentu
110
106,73
105
100
100
100,07
95
92,42 90
1999/98
1998
Grafikon 4.8.
2000/98
2001/98
Bazni indeksi broja nezaposlenih VSS, baza 100 u 1998. godini
2.1.2. Indeksi sa promjenljivom bazom (lančani, verižni indeksi) Indeksi sa promjenljivom bazom predstavljaju odnose veličine pojave u posmatranom i prethodnom periodu. Da bismo konstruisali indekse sa promjenljivom bazom ili lančane indekse kao bazni period odabiremo svaki put prethodni period. Indekse sa promjenljivom bazom izračunavamo tako da za bazu uzimamo svaki put podatke iz prethodnog perioda. Lančani indeks veličine V u periodu t u odnosu na period (t-1) ako je baza 1 u periodu (t-1) je jednak:
it / t −1 =
Vt Vt −1
(4.6)
Lančani indeks veličine V za period t u odnosu na period (t-1) ako je baza 100 u periodu (t-1) je jednak:
I t / t −1 = it / t −1 ⋅ 100 =
Vt ⋅ 100 Vt −1
(4.7)
Ovi indeksi se nazivaju i koeficijenti dinamike, jer pokazuju dinamiku i tempo promjene posmatrane pojave u odnosu na prethodni period. Koristeći podatke iz tabele 4.4. izračunali smo lančane indekse nezaposlenih osoba prema stručnoj spremi. Izračunate indekse prezentujemo u tabeli 4.8.
164
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.8. Lančani indeksi I t/t-1
VSS VŠS SSS VKV, KV PKV, NSS NKV Ukupno
I99/98 92,42 105,39 103,7 104,25 139,04 96,40 102,07
I00/99 108,27 113,76 103,64 102,82 101,53 95,09 99,99
I01/00 106,66 114,47 106,18 105,57 104,85 97,64 102,76
Ukupan broj nezaposlenih se povećao u 1999. u odnosu na 1998. godinu za 2,07%. Između 1999. i 2000.g. broj nezaposlenih je ostao skoro nepromijenjen. U periodu 2000.-2001. godina ukupan broj nezaposlenih se povećao za 2,76%. Na sljedećem grafikonu su predstavljeni lančani indeksi nezaposlenih visoke stručne spreme (VSS). 110 108 106 104 102 100
1998
98
1999
2000
2001
96 94 92 90
Grafikon 4.9.
Lančani indeksi nezaposlenih VSS
Koristeći podatke o broju diplomiranih studenata na ekonomskim fakultetima i Fakultetu za poslovni menadžment u Sarajevu izračunali smo bazne i lančane indeksa koje zajedno sa podacima predstavljamo u sljedećoj tabeli.
165
Statistika u ekonomiji i menadžmentu
Tabela 4.9. Broj diplomiranih studenata na E.F., bazni i lančani indeksi Godine 1998 1999 2000 2001 2002 Ukupan broj studenata 581 484 532 665 462 Žene 345 273 310 373 275 Procenat žena po godinama 59,38% 56,40% 58,27% 56,09% 59,52% Bazni indeksi (1998) - Ukupno 100 83,30 91,57 114,46 79,52 83,30 109,92 125,00 69,47 Lančani indeksi -Ukupno 100 79,13 89,86 108,12 79,71 Bazni indeksi (1998) - Žene 79,13 113,55 120,32 73,73 Lančani indeksi - Žene Izvor: Statistički godišnjak Bosne i Hercegovine 2005., Federalni zavod za statistiku, Sarajevo, str. 295.
Na sljedećim grafikonima smo prezentirali bazne i lančane indekse za ukupan broj studenata, kao i bazne i lančane indekse za žene. 120 110 100 90
114.46 100 91.57
80
83.30
79.52
70 60
1998
Grafikon 4.10.
166
1999
2000
2001
2002
Bazni indeksi ukupnog broja studenata sa bazom u 1998. godini
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
130 120 110 100
1998
2001 1999
90
2000
80 70
2002
60 50 Grafikon 4.11.
Lančani indeksi ukupnog broja studenata u periodu od 1998. do 2002. g.
120 108,12
110 100
100
90 89,86
80 70 60
79,71
79,13
1998
Grafikon 4.12.
1999
2000
2001
2002
Bazni indeksi broja studentica sa bazom u 1998.g.
167
Statistika u ekonomiji i menadžmentu
130 120 110 100
1998 1999
90
2000
2001 2002
80 70 60 50 Grafikon 4.13.
Lančani indeksi broja studentica u periodu od 1998. do 2002. godine
Primjer 4.2. Na osnovu podataka datih u tabeli 4.10.a. izračunati i grafički predstaviti bazne indekse (baza 1997. godina), lančane indekse i prosječnu godišnju stopu promjene društvenog proizvoda Bosne i Hercegovine u periodu 19972001. Tabela 4.10.a. Društveni bruto proizvod BiH u milionima KM
DBP
1997.
1998.
1999.
2000.
2001.
6367
7244
8604
9611
10480
Izvor: Statistički bilten broj 1., Agencija za statistiku BiH, 2003., str. 20.
Bazni indeksi su predstavljeni u sljedećoj tabeli i grafikonima.
8604 ⋅100 = 135,13 . Stopa rasta DBP između 1997. i 6367 1999. je bila 35,13%. Naprimjer: I 99 / 97 =
168
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.10.b. Bazni indeksi za društveni bruto proizvod BiH u milionima KM
180 160 140 120 100 80 60 40 20 0
I 97
I 98/97
I 99/97
I 00/97
I 01/97
100
113,77
135,13
155,95
164,60
135,13 100,00
1997
150,95
164,60
113,77
1998
1999
2000
2001
Grafikon 4.14. Bazni indeksi DBP BiH baza 100 u 1997. godini
180 160 140 120 100 80 60 40 20 0
1997
Grafikon 4.15.
1998
1999
2000
2001
Bazni indeksi DBP BiH baza 100 u 1997. godini
Na osnovu podataka iz tabele 4.10.a. izračunali smo seriju lančanih indeksa društvenog proizvoda Bosne i Hercegovine baza 100 u periodu (t-1).
169
Statistika u ekonomiji i menadžmentu
I 99 / 98 =
8604 ⋅100 = 118,77 7244
Tabela 4.10.c. Lančani indeksi za društveni bruto proizvod BiH u milionima KM
I 97/96
I 98/97
I 99/98
I 00/99
I 01/00
-
113,77
118,77
111,70
109,04
120
115
118,77
113,77 111,7 109,04
110
105
1998/97
Grafikon 4.16.
1999/98
2000/99
2001/00
Lančani indeksi DBP BiH baza 100 (t-1)
Primjer 4.3. U narednoj tabeli i grafikonu predstavljamo podatke o indeksima cijena na malo i indeksima troškova života u Federaciji BiH. Tabela 4.11. Indeksi cijena na malo u Federaciji BiH 1999 1998
2000 1999
2001 2000
2002 2001
2003 2002
2004 2003
Indeksi cijena na malo
99,1
101,2
101,7
99,8
100,2
99,7
Indeksi troškova života
99,3
101,4
102,1
101,0
100,6
100,0
Izvor: Statistički godišnjak Federacije Bosne i Hercegovine 2005, str. 260. i 262.
170
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Indeksi cijena na malo Indeksi troškova života
103 102 101 100 99 98
1999/98
2000/99
Grafikon 4.17.
2001/00
2002/01
2003/02
2004/03
Indeksi cijena i troškova života
4.2.2. Osobine indeksa
•
Indeks ostaje nepromijenjen ako se posmatrana veličina ne mijenja. Ova osobina se naziva osobina identiteta. Ako je Vt=V0, odgovarajući indeksi ostaju nepromijenjeni tj. it/0= i0/0=1
•
(4.8)
Osobina tranzitivnosti je izražena sljedećom relacijom:
it / 0 = it / t ' ⋅ it ' / 0 =
Vt Vt ' Vt ⋅ = Vt ' V0 V0
(4.9)
Ovu osobinu zadovoljavaju indeksi čiji je proizvod jednak odnosu veličine pojave u posmatranom i baznom periodu. Ova osobina se može generalizirati na seriju sukscesivnih indeksa. Naprimjer, vrijednost indeksa u periodu t = 4 u odnosu na bazni period 0 (i4/0) je jednaka proizvodu uzastopnih indeksa u prethodnim periodima:
i4 / 0 = i4 / 3 ⋅ i3 / 2 ⋅ i2 / 1 ⋅ i1 / 0 =
V4 V3 V2 V1 V4 ⋅ ⋅ ⋅ = V3 V2 V1 V0 V0
171
Statistika u ekonomiji i menadžmentu
Koristeći izraz:
it / t ' =
it / 0 it ' / 0
(4.10)
možemo porediti posmatranu veličinu u periodima t i t’. • Osobina recipročnosti se može definisati u odnosu na vrijeme. Ova osobina kaže da je recipročan indeks neutralan u odnosu na vrijeme. To znači da se promjena baznog datuma predstavlja inverznom formulom:
it / 0 =
1 i0 / t
⇒ it / 0 ⋅ i 0 / t = 1
(4.11)
Za t =1 gornja formula ima sljedeći oblik:
i1 / 0 =
1 i0 / 1
⇒ i1 / 0 ⋅ i0 / 1 = 1
(4.12)
Inverzijom baznog i tekućeg perioda ostvaruje se recipročnost indeksa. Recipročnost indeksa ne znači da su procenti rasta i opadanja identični. Posmatrajmo indeks čija je vrijednost jednaka 1 u baznom i 1,5 u periodu 1:
i1 / 0 = i0 / 1 =
V1 1,5 = = 1,5 V0 1 1 i1 / 0
=
1 = 0,67 1,5
Rast između datuma 0 i 1 je 50%. Opadanje između 1 i 0 je 33%.
•
Osobina cirkularnosti. Kada su zadovoljene osobine tranzitivnosti i recipročnosti definisana je i osobina cirkularnosti:
it / t ' ⋅ it '/ 0 ⋅ i0 / t = it / 0 ⋅ i0 / t = 1, odnosno Vt Vt ' V0 Vt ⋅ ⋅ = =1 Vt ' V0 Vt Vt ili
172
(4.13)
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
i2 /1 ⋅ i1/ 0 ⋅ i0 / 2 = i2 / 0 ⋅ i0 / 2 = 1, odnosno (4.14)
V2 V1 V0 V2 ⋅ ⋅ = =1 V1 V0 V2 V2
Na osnovu tranzitivnosti, proizvod prva dva člana je jednak i2/0. Na osnovu recipročnosti i2/0 × i0/2=1.
Primjer 4. 4. Primjena osobina indeksa na primjeru iz tabele 4.7. za visoku stručnu spremu (VSS) i ukupan broj nezaposlenih:
VSS Ukupno
I 99/98
I 00/99
I 01/00
I 01/98
92,42
108,27
106,66
106,73
102,07
99,99
102,76
104,88
Da bismo izračunali indeks nezaposlenih VSS u periodu od 1998. do 2001. godine na osnovu lančanih indeksa za prethodne tri godine primijenićemo osobinu tranzitivnosti indeksa:
i01 / 98 = i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 =
V01 V00 V99 V01 ⋅ ⋅ = V00 V99 V98 V98
i01/ 98 = 1,0666 ⋅1,0827 ⋅ 0,9242 = 1,0673 I 01/ 98 = i01/ 98 ⋅100 = 106,73 Primjenom osobine tranzitivnosti smo izračunali i indeks ukupnog broja nezaposlenih u istom periodu i rezultat upisali u gornju tabelu.
•
Primjena indeksa u izračunavanju stope promjene
Stopu promjene smo definisali sljedećim izrazom:
ΔV Vt − V0 Vt = = −1 V V0 V0
173
Statistika u ekonomiji i menadžmentu
Pošto je indeks na bazi 1 jednak it / 0 =
Vt izraz za stopu promjene možemo V0
napisati na sljedeći način:
ΔV Vt − V0 Vt = = − 1 = it / 0 − 1 V V0 V0
(4.15)
Stopa promjene koju možemo označiti sa s je jednaka razlici između indeksa u bazi 1 jedinice:
s=
ΔV = it / 0 − 1 V
(4.16)
Indeks u bazi 1 je jednak zbiru stope promjene i jedinice. Pošto stope promjene ne posjeduju osobine računanja, u izračunavanju stopa potrebno je koristiti indekse u bazi 1, a konačni rezultat se može izraziti ili u bazi 100, ili kao stopa promjene u procentima. Na osnovu izračunatih relativnih promjena broja nezaposlenih osoba visoke stručne spreme (u %) u Federaciji BiH prezentovanih u tabeli 4.6. izračunat ćemo stopu promjene broja nezaposlenih u periodu 1998/2001. Dakle, na osnovu sljedećih podataka
VSS
1999/98
2000/99
2001/00
-7,58
8,27
6,66
2001/98
ćemo izračunati traženu stopu. Kako stope promjene nemaju nikakvu osobinu računanja potrebno je primijeniti indekse na bazi 1. Na osnovu podataka iz gornje tabele, računamo proste indekse za tri posmatrana perioda. Prvo stope promjene izrazimo u obliku decimalnih brojeva, a zatim primijenimo vezu prema kojoj je indeks u bazi 1 jednak stopi promjene uvećanoj za jedinicu. Ovim postupkom smo dobili sljedeće rezultate:
i99 / 98 = −0,0758 + 1 = 0,9242 i00 / 99 = 0,0827 + 1 = 1,0827 i01 / 00 = 0,0666 + 1 = 1,0666 174
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Primjenom osobine tranzitivnosti računamo indeks za traženi period:
i01/ 98 = i99 / 98 ⋅ i00 / 99 ⋅ i01/ 00 = 0,9242 ⋅1,0827 ⋅1, 0666 = 1, 06727 ≈ 1, 0673 Da bismo izračunali stopu promjene, broja nezaposelnih u periodu 19982001, koristiti ćemo vezu između indeksa i stope promjene. U ovom primjeru stopa promjene je jednaka indeksu u bazi jedan umanjenom za jedinicu: 1,0673-1=0,0673. Ako rezultat želimo izraziti u procentima pomnožićemo ga sa 100. U periodu između 1998. i 2001.g., broj nezaposelnih sa visokom stručnom spremom se povećao za 6,73%. Stope promjene se ne mogu sabirati. Zbir stopa promjene u uzastopnim periodima ne daje stopu promjene u periodu koji sadrži te uzastopne periode. Npr. stope promjene od –7,58 zatim 8,27 i 6,66 ne uvećavaju nezaposlenost za 7,35% = (–7,58 + 8,27 + 6,66) nego kao što smo izračunali za 6,73%.
•
Prosječna godišnja stopa promjene
Pretpostavimo da veličina V raste po godišnjoj stopi r. Označimo njenu vrijednost u periodu 1, dakle, u polaznoj godini, sa V1. Godinu poslije vrijednost veličine V će biti jednaka: V2 =V1 + V1 · r = V1 (1+r)
(4.17)
Ako se rast nastavi po istoj stopi, u periodu 3 ćemo imati: V3 =V2 + V2 ·r = V2 (1+r) = V1 (1+r)2
(4.18)
Poslije t godina veličina će biti jednaka: Vt = V1 (1+r)t-1
(4.19)
(1 + r )t −1 = (1 + r ) = t −1 r = t −1
Vt V1
Vt V1
(4.20)
Vt − 1 = t −1 it /1 − 1 V1 175
Statistika u ekonomiji i menadžmentu
Vt se naziva prosječan indeks promjene i predstavlja geometrijsku V1 sredinu lančanih indeksa. Prosječna godišnja stopa promjene je jednaka prosječnom godišnjem indeksu promjene umanjenom za jedinicu. Ukoliko stopu promjene želimo izraziti u procentima, izraz za stopu promjene ćemo pomnožiti sa 100: Izraz
t −1
⎛ V ⎞ r = ⎜⎜ t −1 t − 1⎟⎟ ⋅100 = ⎝ V1 ⎠
(
t −1
)
it /1 − 1 ⋅100
(4.21)
Prosječna godišnja stopa promjene je jednaka geometrijskoj sredini lančanih indeksa umanjenoj za jedinicu. Ova formula može biti korištena direktno ukoliko poznajemo prosječni godišnji indeks ili vrijednosti posmatrane varijable u posmatranim periodima10. Izraz za prosječnu godišnju stopu možemo napisati i u razvijenom obliku:
⎛ V ⎞ ⎛ V V ⎞ V r = ⎜⎜ t −1 t − 1⎟⎟ ⋅100 = ⎜⎜ t −1 t ⋅ t -1 ⋅⋅⋅ 2 − 1⎟⎟ ⋅100 ⎝ V1 ⎠ ⎝ Vt -1 Vt -2 V1 ⎠
( =( =
Izraz (1 + r )t −1 =
)
t −1
it / t -1 ⋅ it −1/ t − 2 ⋅⋅⋅ i2 /1 − 1 ⋅100
t −1
it /1 − 1 ⋅100
)
(4.22)
Vt možemo korištenjem logaritama izraziti u sljedećem V1
obliku:
(t − 1) ⋅ log (1 + r ) = log log (1 + r ) =
10
Vt V1
log Vt − log V1 t −1
Ovu vrijednost može biti izračunata direktno korištenjem digitrona ili primjenom logaritama.
176
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
⎛ log Vt − log V1 ⎞ (1 + r ) = anti log ⎜ ⎟ t −1 ⎝ ⎠ ⎛ log Vt − log V1 ⎞ r = anti log ⎜ ⎟ −1 t −1 ⎝ ⎠
(4.23)
i izračunati korištenjem logaritama. Period t za koji bi se dostigao planirani nivo veličine V se izračunava na sljedeći način:
r = t −1
Vt −1 V1
r + 1 = t −1
Vt V1
log(r + 1) = t=
1 (log Vt − log V1 ) t −1
(log Vt − log V1 ) log(r + 1)
+1
(4.24)
Primjer 4.5. Da bismo na osnovu podataka iz tabele 4.10. izračunali prosječnu godišnju stopu promjene društvenog proizvoda BiH u periodu 1997.-2001. potrebno je prvo izračunati indekse na bazi 1, a zatim izračunati prosječan godišnji indeks u periodu 1997.-2001. i na osnovu tog podatka, izračunati prosječnu godišnju stopu promjene. Godišnji indeks u periodu 1997.-2001. je jednak:
i01 / 97 = i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 i01/ 97 = 1,0904 ⋅1,1170 ⋅1,1877 ⋅1,1377 = 1,646 Prosječni godišnji indeks dobijamo na sljedeći način:
i = 4 1,6460 = 1,64601/ 4 = 1,1327
177
Statistika u ekonomiji i menadžmentu
Prosječni godišnji indeks je 1,1327. Prosječna godišnja stopa rasta je bila 13,27%. Dakle, prosječna godišnja stopa promjene je jednaka geometrijskoj sredini lančanih indeksa (baza 1) umanjenoj za jedinicu za posmatrani period: r01 / 97 = 4 i01 / 97 − 1 = 4 i01 / 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 − 1 = 4 1,0904 ⋅ 1,1170 ⋅ 1,1877 ⋅ 1,1377 − 1 = 4 1,6460 − 1 = 1,1327 − 1 = 0,1327
Prosječna godišnja stopa rasta društvenog proizvoda u periodu 1997.-2001. godina je bila 13,27%. Utvrđivanje prosječne godišnje stope promjene r možemo formalizirati i na sljedeći način:
r = 4 i01/ 00 ⋅ i00 / 99 ⋅ i99 / 98 ⋅ i98 / 97 − 1 =
4
V01 V00 V99 V98 ⋅ ⋅ ⋅ −1 V00 V99 V98 V97
=
4
V01 − 1 = 4 i01/ 97 − 1 V97
= 4 1, 646 − 1 = 1,1327 − 1 = 0,1327 Primjer 4.6. Odrediti prosječnu godišnju stopu promjene ako agregatni pokazatelj V raste 10% prve godine, 20% druge, 25% treće i 40% četvrte godine.
Vt = V1 (1 + r )
t −1
= V1 (1 + r )
4
Vt = V1 (1 + 0,1) ⋅ (1 + 0, 2 ) ⋅ (1 + 0, 25) ⋅ (1 + 0, 40 )
(1 + r )4 = (1,1) ⋅ (1,2) ⋅ (1,25) ⋅ (1,40) = 2,31 (1 + r ) = 4 2,31 = 2,311 / 4
(1 + r ) = 1,23 r = 0,23 178
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
ili
log(1 + r ) =
log 2,31 = 0,0909 4
(1 + r ) = anti log 0,0909 (1 + r ) = 1,23 r = 0,23 r = 23% Prosječna godišnja stopa rasta je bila 23%.
Primjer 4.7. Veličina V se uvećala u prvoj godini 20%, a u drugoj godini se smanjila za 20%. a) Koliko se veličina V promijenila u toku dvije godine? b) Kolika je prosječna godišnja stopa promjene? c) Ako se veličina V uvećala za 20% prve godine, koliko treba da se promijeni u drugoj godini da bi dostigla nivo iz prve godine? a) V2 = V1 ⋅ (1 + 0, 2 )
V3 = V2 ⋅ (1 − 0, 2 ) = ⎡⎣V1 ⋅ (1 + 0, 2 ) ⋅ (1 − 0, 2 ) ⎤⎦ V3 = V1 ⋅ (1, 2 ) ⋅ ( 0,8 ) = V1 ⋅ 0,96 Veličina V je opala za 4% u toku dvije godine. b) V3 = V1 (1 + r )
2
(1 + r )2 = 0,96 1 + r = 0,9798 r = -0,0202 r = -2,02% Prosječna godišnja stopa promjene je jednaka -2,2%. 179
Statistika u ekonomiji i menadžmentu
Ili r = i2 /1 ⋅ i1/ 0 − 1 = 0,8 ⋅ 1,2 − 1 = 0,96 − 1 = 0,9798 − 1 = −0,0202 r = −2,02%
c) V3 = V2 (1 + r )
V2 = V1 ⋅1, 20 Slijedi:
V3 = V1 ⋅1, 20 ⋅ (1 + r ) ⇒ 1, 20 ⋅ (1 + r ) = 1 ⇒ (1 + r ) =
1 20
1 −1 1,20 r = −0,1666 r=
Poslije povećanja od 20% V se mora smanjiti za 16,66% da bi dostigao svoj nivo iz baznog perioda.
Primjer 4.8. U periodu 1993.-2002. stopa poreza je rasla u apsolutnom iznosu 1% svake godine, a u 2003. i 2004. godini je rasla za 0,5% godišnje. U 2005.g. je opala za 1%. U 2002. stopa poreza je bila 44%. a) Izračunati prosječnu godišnju stopu poreza između 1993. i 2005. b) U kojoj godini bi ova stopa bila veća od 50%?
Rješenje: a) U 1993: 0, 44 − 0, 09 = 0,35 U 2004: 0,44 + 0,01 = 0,45 U 2005: 0,45 − 0,01 = 0,44
r = 12
0, 44 − 1 = 12 1, 2571 − 1 = 1, 0193 − 1 ⇒ r = 1,93% 0,35
b) U 2005.g. r = 44%. Ova stopa će biti veća od 50%, t godina poslije 2005.g. ako se uvećava po prosječnoj stopi od 1,93% godišnje.
180
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
0, 44 ⋅ (1, 0193)
(1, 0193) t −1 =
t −1
=
t −1
= 0,50
0,50 = 1,1364 0, 44
log1,1364 = 6, 68 ⇒ t = 7, 78 ≈ 8 godina log1, 0193
Stopa bi bila veća od 50% u 2013. godini.
Primjer 4.9. Veličina V je rasla po istoj stopi u toku 3 godine. U 2002. je bila 2000 €, a u 2005. 2662 €. Koja je bila prosječna godišnja stopa rasta?
r = t −1
Vt 2662 −1 = 3 −1 V1 2000
r = 3 1,331 − 1 = 1,1 − 1 = 0,10 r = 10% ili
log 2662 − log 2000 3 log(1 + r ) = 0,04139 (1 + r ) = anti log 0,04139 log(1 + r ) =
(1 + r ) = 1,10 ⇒ r = 0,10 ⇒ 10% 4.2.3. Relacije između baznih i lančanih indeksa 4.2.3.1. Pretvaranje lančanih indeksa u bazne Lančani indeksi se pretvaraju u bazne postupkom postepenog množenja indeksa prema sljedećem izrazu:
⎧100, t = b = 1 It /0 = ⎨ ⎩ I ( t −1) / 0 ⋅ it /( t −1) , t = 2,3,.., n.
(4.25)
181
Statistika u ekonomiji i menadžmentu
Lančani indeksi mogu se pretvarati u indekse na stalnoj bazi vezanoj za bilo koji period primjenom sljedeće relacije: ⎧100, t = b ⎪ ⎪ I (t +1) / 0 (4.26) It /0 = ⎨ ,t b U prethodnom izrazu b je bazni period i za t = b indeks je jednak 100. Bazne indekse za prethodne periode dobijamo dijeleći bazni indeks naredne sa lančanim indeksom te iste godine. Bazni indeksi za naredne periode dobiju se postupnim množenjem baznog indeksa iz prethodnog i lančanog indeksa iz posmatranog perioda. 4.2.3.2. Pretvaranje baznih u lančane indekse Pošto su indeksi na stalnoj bazi upravo proporcionalni orginalnim podacima, u postupku pretvaranja baznih u lančane indekse postupa se kao da se radi sa izvornim podacima. Indeksi na stalnoj bazi pretvaraju se u lančane tako da se indeks iz tekućeg perioda dijeli sa prethodnim indeksom i rezultat pomnoži sa 100.
I t /(t −1) =
It / 0 I (t −1) / 0
⋅ 100, t = 2,3,.., n.
(4.27)
Pri pretvaranju baznih u lančane indekse nije bitno koji period ćemo izabrati za bazno razdoblje. 4.2.3.3. Pretvaranje indeksa na stalnoj bazi u indekse na drugu stalnu bazu Indeksi na stalnoj bazi preračunavaju se na drugu bazu tako da se svaki indeks podijeli indeksom novog baznog razdoblja i dobijeni odnos pomnoži sa 100.
I t*/ 0 =
182
It / 0 ⋅ 100 I b* / 0
(4.28)
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Dva najčešća razloga promjene baze indeksa su potreba poređenja različitih varijabli (DBP, nezaposlenost, itd.) čiji objavljeni indeksi su rijetko izraženi na osnovu iste baze i periodično usklađivanje baza kada je potrebno reaktualizirati bazu ako se serija previše udaljava od orginalne vrijednosti. U ovom slučaju koristi se osobina tranzitivnosti it / 0 = it /1 ⋅ i1/ 0 ⇒ it /1 =
it / 0 . i1/ 0
Novi indeks je jednak količniku između polaznog baznog indeksa i indeksa nove bazne godine izraženog u staroj bazi 0.
Primjer 4.10. Lančani indeksi industrijske proizvodnje Federacije BiH su predstavljeni u sljedećoj tabeli: Tabela 4.12. Lančani indeksi industrijske proizvodnje Federacije BiH
I96/95
I97/96
I98/97
I99/98
I00/99
I01/00
187,6
135,7
123,8
110,6
108,8
112,2
Izvor: Statistički godišnjak Federacije BiH, 2002, str.113.
Na ovom primjeru ćemo ilustrovati pretvaranje lančanih u bazne indekse uz pretpostavku da je baza 100 u 1998. godini. Tabela 4.12.a. Pretvaranje lančanih u bazne indekse 1995.
1996.
1997.
1998. 1999.
2000.
2001.
Postupak 59,5/1,876 80,8/1,357 100/1,238 100
110,6 110,6⋅1,088 120,3⋅1,122⋅
Indeksi
110,6
31,7
59,5
80,8
100
120,3
134,97≈135
4.2.4. Agregatni indeksi Najznačajniji agregatni indeksi su: indeks vrijednosti, indeks cijena, indeks fizičkog obima proizvodnje, indeksi troškova života, itd. Konstrukciju agregatnih indeksa ćemo ilustrovati na primjeru potrošnje dva proizvoda. 183
Statistika u ekonomiji i menadžmentu
Tabela 4.13. Cijena proizvoda A i B
2004. 2005.
Proizvod A Cijena KM/kom 4 6
Proizvod B Cijena KM/kom 10 11
Na osnovu datih podataka možemo izračunati samo individualne indekse cijena svakog proizvoda gdje je 2004. bazna godina.
IpA =
6 ⋅ 100 = 150 4
IpB =
11 ⋅ 100 = 110 10
Konstatujemo da se cijena proizvoda A povećala za 50%, a cijena proizvoda B za 10% u posmatranom periodu. Ako gornju tabelu kompletiramo sa podacima o kupljenim količinama svakog proizvoda: Tabela 4.14. Cijena i kupljena količina proizvoda A i B Proizvod A
2004. 2005.
Cijena KM/kom 4 6
Komad 10 12
Proizvod B
Cijena KM/kom 10 11
Komad 8 10
Možemo izračunati za svaku godinu budžet utrošen za kupovinu tih proizvoda: Budžet u 2004.:
4 KM / kom ⋅ 10kom + 10 KM / kom ⋅ 8kom = 40 KM + 80 KM = 120 KM Budžet u 2005.:
6 KM / kom ⋅ 12kom + 11KM / kom ⋅ 10kom = 72 KM + 110 KM = 182 KM 184
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
i izračunati sljedeći indeks vrijednosti:
IW 05 / 04 =
W05 182 = ⋅ 100 = 151, 67 W04 120
na osnovu kojeg konstatujemo da se budžet potrošača utrošen na kupovinu dva posmatrana proizvoda povećao za 51,67% u 2005. u odnosu na 2004. godinu. 4.2.4.1. Konstrukcija agregatnih indeksa Laspeyres i Paasche metodom agregiranja Da bismo objasnili konstrukciju agregatnih indeksa cijena metodom agregiranja formalizaciju ćemo predstaviti na sljedeći način: Tabela 4.15. Konstrukcija agregatnih indeksa cijena
(i=0) (i=1)
Proizvod A (j)=1 Proizvod B (j)=2 Vrijednost potrošačke Cijena KM/kom Komad Cijena KM/kom Litar pi(1) pi(2) qi(2) korpe (W) qi(1) 2004. 4 10 10 8 120 2005. 6 12 11 10 182
U gornjoj tabeli smo uveli sljedeće simbole: p je cijena, q je količina, i je indeks datuma, a j indeks proizvoda, bazna godina je 2004. (i=0) i posmatrana godina 2005. (i=1). Potrošnja u 2004.: (i=0) 2
∑ p0 q0 = ∑ p0( j ) q0( j ) = p10 q10 + p02 q02 = 4 ⋅ 10 + 10 ⋅ 8 = 120 j =1
Potrošnja u 2005.: (i=1) 2
∑pq =∑p 1 1
j =1
( j) ( j) 1 1
q
= p11 q11 + p12 q12 = 6 ⋅ 12 + 11 ⋅ 10 = 182
Indeks vrijednosti ćemo označiti sa IW i izračunati na sljedeći način: 185
Statistika u ekonomiji i menadžmentu
IW 1/ 0 =
∑pq ∑p q
1 1
⋅ 100 =
0 0
182 ⋅ 100 = 151, 67 120
Indeks vrijednosti mjeri evoluciju cijena i kupljenih količina. Budžet utrošen za kupovinu ova dva proizvoda se povećao za 51,67%. Da bismo izračunali indeks cijena možemo fiksirati strukturu potrošnje u baznom ili u posmatranom periodu. •
Struktura potrošnje (količina) fiksirana u baznom periodu
Ako strukturu potrošnje fiksiramo u 2004. godini (bazni datum) dobijamo Laspeyres (Lasperov) indeks cijena:
L p1/ 0 =
∑pq ∑p q
1 0
⋅ 100 =
0 0
=
p11 q01 + p12 q02 ⋅ 100 = p10 q01 + p02 q02
6 ⋅ 10 + 11 ⋅ 8 148 ⋅ 100 = ⋅ 100 = 123,33 120 120
148 KM je fiktivna vrijednost koju bi imala potrošačka korpa u 2005. ako bi potrošnja ostala ista kao u 2004. Laspeyres indeks cijena u 2005. baza 100 u 2004. je jednak 123,33. Na osnovu ovog indeksa konstatujemo povećanje cijena od 23,33% u posmatranom periodu. •
Struktura potrošnje (količina) fiksirana u posmatranom periodu
Ako strukturu potrošnje fiksiramo u posmatranom periodu, tj. u 2005. godini, dobijamo Paasche (Pašev) indeks cijena:
Pp1/ 0 =
∑pq ∑p q
1 1 0 1
=
⋅ 100 =
p11 q11 + p12 q12 ⋅ 100 = p01 q11 + p02 q12
6 ⋅ 12 + 11 ⋅ 10 182 ⋅ 100 = ⋅ 100 = 122,97 4 ⋅ 12 + 10 ⋅ 10 148
148 KM je fiktivna vrijednost koju bi imala potrošačka korpa ako bi u 2004.g. potrošnja bila jednaka potrošnji u 2005.g. Paasche indeks cijena potrošnje u 2005.g. baza 100 u 2004.g. je jednak 122,97. Na osnovu ovog indeksa konstatujemo povećanje cijena od 22,97%. 186
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Indeks izračunat na bazi ponderacija iz posmatranog perioda je najčešće manji od indeksa utvrđenog na osnovu ponderacija iz baznog perioda. 4.2.4.2. Konstrukcija indeksa Laspeyres i Paasche pomoću ponderisanih sredina Laspeyres i Paasche indeks možemo formalizirati koristeći ponderisane sredine.
•
Laspeyres indeks možemo izraziti u obliku aritmetičke sredine na sljedeći način:
L p 1 / 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0 ( j)
gdje α 0( j ) predstavlja realni budžetski koeficijent (ponder) proizvoda (j) utvrđen u baznom periodu 0. Dobijamo ga kao odnos realne potrošnje za svaki proizvod u baznom periodu i realne vrijednosti potrošačke korpe u baznom periodu. Za proizvod A (j=1):
α 0(1) =
p 01 ⋅ q01 4 ⋅ 10 = = 0,33 1 1 2 2 120 p0 ⋅ q0 + p0 ⋅ q0
Za proizvod B (j=2):
α 0( 2) =
p 02 ⋅ q 02 80 = = 0,67 1 1 2 2 p 0 ⋅ q 0 + p 0 ⋅ q 0 120
α 0(1) + α 0( 2) = 0,33 + 0,67 = 1 L p 1 / 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0 = α 01 ⋅ I 1p1 / 0 + α 02 ⋅ I p21 / 0 ( j)
= 0,33 ⋅ I pA + 0,67 ⋅ I pB
= 0,33 ⋅ 150 + 0,67 ⋅ 110 = 123,2 Dobili smo isti rezultat kao sa agregatnim oblikom Laspeyres indeksa cijena. 187
Statistika u ekonomiji i menadžmentu
•
Paasche indeks u obliku aritmetičke sredine
j) Pp 05 / 04 = ∑ β 01( j ) ⋅ I p( 05 / 04 ( j)
β 01( j ) je fiktivni budžetski koeficijent proizvoda (j) računat na osnovu cijena iz baznog perioda i količina iz posmatranog perioda. Dobijamo ga kao odnos fiktivne potrošnje svakog proizvoda i fiktivne vrijednosti potrošačke korpe. Za proizvod A (j=1):
β
1 p = 0 , q =1
p01 ⋅ q11 48 = 1 1 = = 0,32 2 2 p 0 ⋅ q1 + p 0 ⋅ q1 148
β p2=0,q =1 =
p 02 ⋅ q12 100 = = 0,68 1 1 2 2 p 0 ⋅ q1 + p 0 ⋅ q1 148
Pp 05 / 04 = β 1p =0,q =1 ⋅ I 1p + β p2=0,q =1 ⋅ I p2 = 0,32 ⋅ 150 + 0,68 ⋅ 110 = 122,8 Dobili smo naravno isti rezultat kao sa agregatnim oblikom Paasche indeksa cijena. Na osnovu izračunatih indeksa možemo posmatrati evoluciju strukture potrošnje. Realne proporcije u 2004.g. su sljedeće: 33% budžeta je utrošeno za proizvod A (indeks cijena: 150) i 67% budžeta je utrošeno za proizvod B (indeks cijena: 110). Realne proporcije u 2005.g. su: 40% budžeta je utrošeno za proizvod A i 60% budžeta je utrošeno za proizvod B. 4.2.4.3. Formule za računanje i osobine agregatnih indeksa
•
Formule za agregatne indekse dobijene metodom agregiranja su sljedeće: -
Agregatni indeksi cijena
1. Laspeyres:
L p1/ 0 = 100 ⋅
∑pq ∑p q
1 0 0 0
količina je fiksirana u baznom periodu. 188
(4.29)
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
2. Paasche:
Pp1/ 0 = 100 ⋅
∑pq ∑pq
1 1
(4.30)
0 1
količina je fiksirana u posmatranom periodu.
-
Agregatni indeksi količina
1. Laspeyres:
Lq1/ 0 = 100 ⋅
∑p q ∑p q
0 1
(4.31)
0 0
cijene su fiksirane u baznom periodu. 2. Paasche:
Pq1/ 0 = 100 ⋅
∑pq ∑pq
1 1
(4.32)
1 0
cijene su fiksirane u posmatranom periodu.
•
Formule dobijene na osnovu ponderisanih sredina -
Agregatni indeks cijena
1. Laspeyres:
L p1/ 0 = ∑ α 0( j ) ⋅ I p( 1j )/ 0
(4.33)
( j)
Laspeyres indeks cijena je jednak aritmetičkoj sredini individualnih indeksa cijena proizvoda koji sačinjavaju potrošačku korpu ponderisanim sa realnim budžetskim koeficijentima na osnovu baznog perioda. 2. Paasche:
Pp1/ 0 =
1
∑α ( j)
( j) 1
⋅
1
(4.34)
I p( 1j )/ 0 189
Statistika u ekonomiji i menadžmentu
Paasche indeks cijena je jednak harmonijskoj sredini individualnih indeksa cijena proizvoda koji sačinjavaju potrošačku korpu ponderisanim sa realnim budžetskim koeficijentima na osnovu posmatranog perioda.
•
Agregatni indeksi količina
Agregatne indekse količina definišemo sljedećim izrazima: 1. Laspeyres: Lq1/ 0 = ∑ α 0( j ) ⋅ I q(1j/)0
(4.35)
( j)
2. Paasche:
Pq1/ 0 =
1
∑α
( j) 1
( j)
•
⋅
1
(4.36)
I q(1j/)0
Osobine agregatnih indeksa
Laspeyres indeksi koji se izračunavaju kao ponderisana aritmetička sredina imaju osobinu agregiranja. Teorijski ni indeksi Laspeyres, ni indeksi Paasche nemaju osobinu tranzitivnosti. U praksi se, zbog činjenice da je ova osobina numerički skoro zadovoljena, pretpostavlja da i ovi indeksi zadovoljavaju osobinu tranzitivnosti da bi se pojednostavila njihova primjena.
Primjer 4.11. Indeks troškova života 2000./1999. u Federaciji BiH je jednak:
itž 00/99 = 1,014 Indeks troškova života 2001./2000. u Federaciji BiH je jednak:
itž 01/00 = 1,021 Konstatujemo da je: itž 01/99 = 1,014 ⋅1,021 = 1,035 Dakle, stopa inflacije u periodu od dvije godine je jednaka 3,5% U statističkoj praksi se za određivanje indeksa cijena koristi najčešće Laspeyres indeks. Federalni zavod za statistiku BiH i Agencija za statistiku BiH koriste Laspeyres indeks za utvrđivanje cijena. 190
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
4.2.4.4. Fischerov indeks cijena Fischerov indeks cijena je jednak geometrijskoj sredini Laspeyres i Paasche indeksa cijena:
F p 1 / 0 = L p 1 / 0 ⋅ Pp 1 / 0
(4.37)
Ako uvrstimo Laspeyres i Paasche indeks cijena iz našeg primjera, dobijamo Ficherov indeks cijena.
F p 03 / 02 = 123,33 ⋅ 122,97 = 123,15 Na osnovu ovog indeksa konstatujemo povećanje cijena od 23,15% 4.2.4.5. Agregatni indeks vrijednosti i njegova dekompozicija Agregatni indeks vrijednosti je definisan sljedećim izrazom:
IW1 / 0 =
∑pq ∑p q
1 1
⋅ 100
(4.38)
0 0
Agregatni indeks vrijednosti možemo dekomponovati na sljedeći način:
iW1 / 0 =
∑pq ∑p q
1 1
=
0 0
∑pq
1 1
X
⋅
X = ∑ p0 q0
∑pq ⋅∑p q ∑p q ∑p q
Y = ∑ p0 q0
∑pq ⋅∑pq ∑pq ∑p q
1 1
0 1
0 1
0 0
iW1 / 0 = pp.lq(4.39) iW1 / 0 =
∑pq ∑p q
1 1
=
0 0
iW1 / 0 = pq .lp
∑pq
1 1
Y
⋅
1 1
1 0
1 0
0 0
(4.40)
Primjena na našem primjeru:
lq1/ 0 =
∑p q ∑p q
0 1
0
0
=
4 ⋅ 12 + 10 ⋅ 10 148 = = 1,233 120 120
191
Statistika u ekonomiji i menadžmentu
pq1/ 0 =
∑pq ∑pq
1 1
1 0
=
182 59 = = 1,230 6 ⋅ 10 + 11 ⋅ 8 50
iW = l p ⋅ pq = 1, 233 ⋅ 1, 230 = 1,52 Povećanje od 52 % vrijednosti potrošačke korpe je rezultat zajedničkog efekta povećanja cijena za 23,3% i povećanja kupljene količine za 23%.
iW = p p ⋅ lq = 1, 23 ⋅ 1, 233 = 1,52 Povećanje od 52% vrijednosti potrošačke korpe je rezultat zajedničkog efekta povećanja cijena za 23% i povećanja kupljene količine za 23,3%. 4.2.4.6. Inflacija i deflator Inflacija je ekonomska neravnoteža koja se manifestuje konstantnim povećanjem cijena. Porast cijena, koji je simptom inflacije, se mjeri pomoću indeksa troškova života koji računaju i objavljuju zvanične statističke institucije. Indeks troškova života za 2001./2000. u Federaciji BiH je bio jednak itž 01/00 = 1,021 . To znači da je stopa rasta troškova života u periodu 2000.-2001. bila 2,1%. Deflator je statistički indikator pomoću kojeg eliminišemo uticaj inflacije koja vještački povećava vrijednost proizvoda i usluga. Deflator nam omogućava da veličine izražene u tekućim cijenama izrazimo u stalnim cijenama. Na sljedećem primjeru ćemo ilustrovati primjenu deflatora. Tabela 4.16. Prosječne godišnje neto plate u Federaciji BiH
Prosječne godišnje neto plate u KM Indeksi troškova života
1997.
1998.
1999.
2000.
2001.
266,33
329,12
374,54
412,72
443,26
106,8
99,3
101,4
102,1
Izvor: Statistički godišnjak Federacije BiH 2001, str. 267., Statistički godišnjak Federacije BiH 2002, str. 271.
192
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Izračunaćemo nominalni i realni indeks plata za period 1997.-1998. i 2000.2001. godina. • U analizi plata kao deflator koristimo indeks troškova života. Prvo ćemo izračunati nominalni indeks plata za 98./97. In plata 98/97=329,12/266,33=123,6.
•
Prema ovom indeksu, plate su se u periodu 97.-98. povećale za 23,6%. Da bismo izračunali realni indeks plata, nominalne indekse plata smo deflacionirali indeksom troškova života. Realni indeks plata 98./97. je jednak: Ir plata 98/97= In / Itž =123,6/106,8=115,7. Prema ovom indeksu plata, za isti period, konstatujemo da su se plate povećale za 15,7%.
Kao deflator se može koristiti i indeks cijena na malo koji računaju i objavljuju zvanične statističke institucije. U opštem slučaju da bismo pokazatelje izražene u tekućim izrazili u stalnim cijenama koristimo odgovarajući deflator. Da bismo dobili stalne cijene, tekuće cijene je potrebno podijeliti sa deflatorom isc=itc /deflator. U slučaju plata u našem primjeru koristili smo kao deflator indeks troškova života isc=itc/itž. Da bismo izrazili realne indekse plata bilo je potrebno podijeliti nominalne indekse plata sa indeksima troškova života ir=in/itž.
4.3. VREMENSKE (HRONOLOŠKE) SERIJE Polaznu osnovu za analizu pojava u vremenu čini vremenska serija. Vremenska serija je skup hronološki utvrđenih vrijednosti neke pojave. Zadaci analize vremenskih serija su: • Opis razvoja pojave u vremenu • Objašnjenje varijacije pojave u vremenu • Predviđanje razvoja pojave.
193
Statistika u ekonomiji i menadžmentu
4.3.1. Konstitutivni elementi vremenske serije Konstitutivni elementi vremenske serije su: dugoročna tendencija ili trend, ciklične varijacije, sezonske promjene i slučajne ili rezidualne promjene.
•
Tendencija ili trend
Trend izražava dugoročnu evoluciju ili osnovni tok kretanja pojave i izražava se funkcijama vremena. Trend predstavlja dugoročnu generalnu tendenciju rasta ili opadanja pojave koja se istražuje. U ekonomiji dugoročna tendencija ima trajanje duže od 10 godina. Ova dugoročna tendencija potiče iz fenomena čiji se efekti manifestuju poslije dugo vremena (rađanje/struktura populacije prema godinama starosti, tehničke promjene/efikasnost osnovnih sredstava itd.). Primjer dugoročne tendencije rasta pokazuje cijene troškova života.
•
Ciklične varijacije
Ciklične varijacije mogu biti različitog intenziteta i trajanja. Njihova periodičnost je od 2 do 10 godina. Uzrok ovih varijacija su uglavnom fluktuacije u tokovima (potrošnja, investicije itd.). Cikličnu komponentu koja predstavlja dugoročne varijacije oko trenda je često teško identifikovati tako da se može smatrati kao dio trenda.
•
Sezonske varijacije
Sezonske varijacije pokazuju sezonski ili periodični uticaj na analiziranu pojavu. Sezonske promjene karakterišu oscilacije regularnog trajanja i intenziteta oko trenda. Periodičnost pojavljivanja sezonskih varijacija je manja ili jednaka godini. Sezonske varijacije se mogu lahko uočiti ukoliko kretanje pojave predstavimo grafički. Tipični primjeri ovog tipa varijacija su: potrošnja električne energije, proizvodnja poljoprivrednih proizvoda, broj noćenja u turizmu, dolazak novih osoba na tržište rada itd.
•
Slučajne ili rezidualne promjene
Slučajne promjene ne možemo objasniti sa tri prethodno analizirane grupe promjena. Slučajne promjene su nepredvidljive i neregularne. Primjer: ratovi, štrajkovi, poplave, požari i druge netipične promjene. 194
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Trend komponenta, ciklične i sezonske promjene se nazivaju sistematskim, determinističkim komponentama jer predstavljaju kovarijacije pojave koje se mogu izraziti funkcijom vremena. Slučajna komponenta je nesistematska. Ona ukazuje na postojanje neregularnih promjena. Vremenska serija ne mora uvijek sadržavati sve navedene komponente. Osnovni zadatak u analizi vremenskih serija je identificiranje, izolovanje i eliminisanje uticaja cikličnih, sezonskih i slučajnih promjena da bi se mogla odrediti dugoročna tendencija posmatrane pojave. Za određivanje dugoročnih tendencija (trenda) promjene pojava predstavljenih vremenskim serijama najčešće koristimo empirijski metod pokretnih sredina i analitički metod najmanjih kvadrata. 4.3.2. Metod pokretnih sredina za određivanje trenda Pokretne sredine reda p (p
PS p (t ) =
1 +m ∑ xt + k p k =− m
(4.41)
ili u razvijenom obliku:
PS p (t ) =
X t −m + ... + X t −1 + X t + X t +1 + ... + X t + m p
(4.42)
Broj izračunatih pokretnih sredina je manji od broja originalnih podataka u seriji. Kada je red pokretnih sredina p neparan broj može se izračunati (T-p+1) pokretnih sredina. Pokretne sredine neparnog reda su jednostavne i simetrične. Kada je red pokretnih sredina p paran broj, p=2m, pokretne sredine se računaju korištenjem sljedeće relacije:
195
Statistika u ekonomiji i menadžmentu
PS p (t ) = yt =
m −1 x ⎤ 1 ⎡ xt − m + xt + k + t + m ⎥ ∑ ⎢ 2 ⎦ p⎣ 2 k = − m +1
(4.43)
Pokretna sredina parnog reda je ponderisana sredina vrijednosti serije za datume (t-1) i (t+1) sa koeficijentima ponderacije jednakim 1/2p za dvije ekstremne vrijednosti xt-m i xt+m i jednakim 1/p za (p-2) intermedijarne vrijednosti xt-m+1 do xt+m-1 da bismo odredili datum t. Ova pokretna sredina sadrži (p+1) elemenata za njeno izračunavanje. Može se izračunati (T-p) pokretnih sredina parnog reda. Metod pokretnih sredina i njegovu primjenu ćemo ilustrovati na sljedećim primjerima. 4.3.2.1. Određivanje tendencije metodom pokretnih sredina neparnog reda Određivanje tendencije metodom pokretnih sredina neparnog reda ćemo ilustrovati na sljedećem primjeru: Tabela 4.17. Bruto podaci i izračunate pokretne sredine trećeg reda N° 1 2 3 4 5 6 7 8 9 10 11 12
Datum 2005-1 2005-2 2005-3 2005-4 2005-5 2005-6 2005-7 2005-8 2005-9 2005-10 2005-11 2005-12
Bruto podaci
PS3
80 100 120 84 105 136 90 110 158 92 115 140
100,00 101,33 103,00 108,33 110,33 112,00 119,33 120,00 121,67 115,67
Na osnovu podataka prezentiranih u tabeli 4.17. predstavili smo na sljedećem dijagramu promjenu posmatrane pojave u vremenu. Dijagram nam pomaže da uočimo da li su prisutne sezonske promjene i koji je red njihove periodičnosti. 196
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
160 140 Nivo pojave
120
100 80 60
145
136
120
110
105
100
92
90
84
80
140 115
40 20 0
1
2
Grafikon 4.18.
3
4
5
6
7
8
9
10
11
12
N0
Vremenska serija bruto podataka
Na osnovu grafičkog prikaza možemo konstatovati da su prisutne sezonske varijacije i da je red njihove periodičnosti 3. Na osnovu podataka datih u tabeli 4.17. računamo pokretne sredine trećeg reda.
PS 3(t = 2) =
x1 + x 2 + x3 3
PS 3(t = 3) =
x 2 + x3 + x 4 100 + 120 + 84 = = 101,3 3 3
PS 3(t = 4) =
x3 + x 4 + x5 120 + 84 + 105 = = 103 3 3
PS 3(t = 5) =
x 4 + x5 + x6 84 + 105 + 136 = = 108,33 3 3
=
80 + 100 + 120 = 100 3
Ostale izračunate vrijednosti pokretnih sredina trećeg reda predstavili smo u tabeli 4.17. Dobijene podatke o pokretnim sredinama ćemo prikazati na grafikonu 4.19. na kojem su već predstavljeni bruto podaci. Metoda pokretnih sredina nam je omogućila da odredimo dugoročnu tendenciju ove pojave, koju nije bilo moguće uočiti na osnovu bruto podataka. Metodom pokretnih sredina eliminisali smo sezonski karakter pojava i možemo konstatovati da je ova pojava imala rastući karakter. Pokretne sredine računate u ovom slučaju su bile neparnog reda pa se problem datuma nije postavljao. Npr. vrijednost na ordinati pokretne sredine reda 3 PS3 (t=2) je računata na osnovu bruto podataka u datumima 197
Statistika u ekonomiji i menadžmentu
1, 2 i 3 i prirodno je da joj dodijelimo datum medijane t=2. Nismo mogli izračunati pokretnu sredinu za prvi i posljednji mjesec zato što nismo imali za prvi prethodni, a za 12. podatak koji slijedi. 180 160 140 120 100 80 60 40
kretanje pojave
20 0
1
2
Grafikon 4.19.
3
4
5
6
7
pokretne sredine trećeg reda 8
9
10
11
12
Vremenska serija i pokretne serije trećeg reda
Na osnovu grafičke prezentacije krive, koju smo dobili spajajući izračunate pokretne sredine trećeg reda, možemo konstatovati da je ove pojava u posmatranom periodu imala dugoročnu tendenciju rasta. Izračunavanjem pokretnih sredina mi smo eliminisali uticaj sezonskih varijacija na posmatranu pojavu. 4.3.2.2. Određivanje tendencije metodom pokretnih sredina parnog reda Primjenu metoda pokretnih sredina četvrtog reda ćemo ilustrovati na primjeru pojave čiji su bruto podaci predstavljeni u tabeli 4.18. Tabela 4.18. Metoda pokretnih sredina četvrtog reda R.broj 1 2 3 4 5 6 7
198
Datum 2000-T1 T2 T3 T4 2001-T1 T2 T3
Bruto podaci 2350 2495 2159 4263 1995 2179 2229
PS4
2772,4 2688,5 2657,8 2689,0 2743,3
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Tabela 4.18. nastavak
8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
T4 2002-T1 T2 T3 T4 2003-T1 T2 T3 T4 2004-T1 T2 T3 T4 2005-T1 T2 T3 T4
4443 2249 2565 2342 4694 2341 2631 2218 4702 2135 2459 2534 4750 2190 2510 2689 4783
2823,3 2885,6 2931,1 2974,0 2993,8 2986,5 2972,0 2947,3 2900,0 2918,0 2963,5 2976,4 2989,6 3015,4 3038,9
Bruto podatke smo predstavili na sljedećem grafikonu. Nivo pojave 6000 5000 4000 3000 2000
Grafikon 4.20.
2001
2002
2003
2004
2005
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
2000
Trimestar
0
T1
1000
Vremenska serija bruto podataka
Na osnovu dijagrama možemo konstatovati prisustvo sezonskih varijacija čija je periodičnost ili sezonalitet četvrtog reda.
199
Statistika u ekonomiji i menadžmentu
Za izračunavanje pokretne sredine parnog reda, npr. reda četiri, logički bi trebalo toj sredini pridružiti datum medijane. Naprimjer, u slučaju da
x1 + x2 + x3 + x4 4 logički bi joj trebalo pridružiti datum medijane 2,5. Međutim, ovaj datum ne postoji u datoj seriji. računamo sredinu sa četiri sljedeće vrijednosti PS4(t = ?) =
Sljedećoj sredini računatoj na osnovu 4 vrijednosti x + x3 + x 4 + x5 bi trebalo logički pridružiti datum medijane PS 4(t = ?) = 2 4 koji je ovdje 3,5. Ali ni ovaj datum ne postoji u datoj seriji. Da bi se riješio problem datuma potrebno je izračunati aritmetičku sredinu na osnovu dvije već izračunate sredine i njoj dodijeliti datum 3 (datum medijane od 2,5 i 3,5).
PS 4(t = 3) =
1 ⎡ x1 + x 2 + x3 + x 4 x 2 + x3 + x 4 + x5 ⎤ + ⎥ 2 ⎢⎣ 4 4 ⎦
PS 4(t = 3) =
1 2 1 x1 + ( x 2 + x3 + x 4 ) + x5 8 8 8
Za izračunavanje pokretne sredine reda 4 se koristi pet vrijednosti koje imaju različite pondere. Svaka od 3 centralne vrijednosti ima ponder dva puta veći od pondera za dvije ekstremne vrijednosti. U svim slučajevima zbir pondera je jednak 1. Pokretne sredine parnog reda su simetrične ponderisane sredine. Izračunavanje pokretnih sredina parnog reda na osnovu bruto podataka iz tabele 4.18. Za prva tri perioda vršimo na sljedeći način:
PS 4(t = 3) =
1 2 1 x1 + ( x 2 + x3 + x 4 ) + x5 8 8 8
1 2 1 PS 4(t = 3) = 2350 + (2495 + 2159 + 4263) + 1995 = 2772,4 8 8 8 PS 4(t = 4) = 200
1 2 1 x 2 + ( x3 + x 4 + x5 ) + x6 8 8 8
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
1 2 1 PS 4(t = 4) = 2495 + (2159 + 4263 + 1995) + 2179 = 2688,5 8 8 8 PS 4(t = 5) =
1 2 1 x3 + ( x4 + x5 + x6 ) + x7 8 8 8
1 2 1 PS 4(t = 5) = 2159 + (4263 + 1995 + 2179) + 2229 = 2657,8 8 8 8
Izračunate vrijednosti za pokretne sredine četvrtog reda za ostale datume su predstavljene u tabeli 4.18. Nivo pojave 5000 4000 3000 2000
Grafikon 4.21.
2001
2002
2003
2004
2005
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
T4
T3
T2
T1
2000
Trimesta r
0
pokretne sredine četvrtog reda
bruto podaci
1000
Vremenska serija i pokretne sredine četvrtog reda
Kompletiranjem grafikona bruto podataka sa grafičkim prikazom koji smo dobili na osnovu podataka o izračunatim pokretnim sredinama četvrtog reda konstatujemo trend blagog porasta pojave u posmatranom periodu. Ovaj zaključak nismo mogli donijeti na osnovu bruto podataka. Serija izračunatih pokretnih sredina ne sadrži sezonske varijacije. Za jednostavnije razumijevanje pokretnih sredina parnog reda napisat ćemo u razvijenom obliku izraze za izračunavanje pokretne sredine šestog reda za period t = 4 i 12 reda za period t = 7.
1 ⎡ x1 + x 2 + x3 + x 4 + x5 + x6 x 2 + x3 + x 4 + x5 + x6 + x7 ⎤ + ⎥ 2 ⎢⎣ 6 6 ⎦ 1 2 1 PS 6(t = 4) = x1 + ( x 2 + x3 + x 4 + x5 + x6 ) + x7 12 12 12
PS 6(t = 4) =
201
Statistika u ekonomiji i menadžmentu
Pokretnu sredinu reda 6 ne možemo izračunati za tri prva i tri posljednja podatka u seriji. Pokretnu sredinu reda 12, računamo na sljedeći način za period t=7:
PS ∗ 12(t = 7) =
1 2 1 x1 + ( x 2 + x3 + ..... + x12 ) + x13 24 24 24
a za ostale periode po analogiji primjenjujući opštu formulu. Ne možemo računati pokretnu sredinu PS12 za 6 prvih i 6 posljednjih datuma. Primjenom metode pokretnih sredina moguće je korigovati bruto podatke eliminišući sezonske varijacije. Na taj način dobijamo podatke korigovane na osnovu sezonskih varijacija koji nam omogućuju da procijenimo tendenciju kretanja posmatrane pojave. 4.3.3. Aditivni model Označimo sa X bruto podatke u vremenskoj seriji, sa T trend, S periodične varijacije, C ciklične varijacije i E slučajne varijacije. Ukoliko je periodičnost konstanta u odnosu na trend, odabire se aditivni model koji možemo napisati u sljedećem obliku: X=T+C+S+E
(4.44)
U ovom modelu komponente djeluju nezavisno i zbog toga se uticaji pojedinih komponenti vremenske serije sabiraju. Primjer i podaci predstavljeni u tabeli 4.17. odgovaraju aditivnom modelu. Grafički prikaz ovog primjera u kojem smo analizirali dugoročnu tendenciju primjenom pokretnih sredina trećeg reda je predstavljen na grafikonu 4.19. Grafički prikaz tog slučaja je primjer aditivnog modela. 4.3.4. Multiplikativni model Multiplikativni model se predstavlja u sljedećem obliku:
X = T ⋅ S ⋅C ⋅ E
(4.45)
U ovom modelu uticaji se množe. Ovaj model se primjenjuje ukoliko su varijacije vremenske serije proporcionalne trendu, odnosno rastu ili opadaju sa trendom. 202
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
4.3.5. Metod najmanjih kvadrata za određivanje dugoročne tendencije (trenda) Pokazali smo da se vremenska serija može raščlaniti na nekoliko sastavnih komponenti koje karakterišu različite promjene. Pošto promjene mogu imati različit karakter i tendencija pojave može imati različite oblike. Da bismo donijeli odluku o obliku trenda, pojavu možemo prikazati pomoću dijagrama rasipanja podataka vremenske serije. Određivanje modela koji će izražavati razvojnu tendenciju kretanja date pojave podrazumijeva pronalaženje matematičke funkcije koja se najbolje prilagođava vrijednostima vremenske serije koju analiziramo. Zavisno od tendencija kretanja pojave određuje se oblik trenda čija se reprezentativnost mjeri pomoću standardne greške trenda. Najčešći oblici matematičkih funkcija koji se koriste su linearni, krivolinijski, eksponencijalni itd. Oblike trenda koje možemo odabrati u Excelu prikazujemo na sljedećoj slici:
203
Statistika u ekonomiji i menadžmentu
4.3.5.1. Linearni trend Ako se analizirana pojava mijenja za približno isti apsolutni iznos u vremenskim jedinicama opšti oblik funkcije kojim možemo predstaviti to kretanje ima sljedeći oblik: Y=a+bX
(4.46)
gdje X predstavlja nezavisno promjenljivu vrijeme, Y je zavisno promjenljiva koja predstavlja vrijednost trenda, a i b su parametri koje treba ocijeniti. Parametar a predstavlja konstantni član, dakle vrijednost trenda za razdoblje koje prethodi prvom. Parametar b pokazuje za koliko se promijeni vrijednost trenda y ako se varijabla vrijeme x poveća za jedinicu. Jednačinu yˆi = a + bxi ocjenjujemo metodom najmanjih kvadrata koju smo detaljno analizirali u poglavlju Regresiona analiza. Primjenom metode najmanjih kvadrata kompletiramo sistem normalnih jednačina: n
n
∑ yi = na + b∑ xi i =1
i =1
n
∑x y i =1
i
i
n
n
i =1
i =1
(4.47)
= a ∑ xi + b∑ x
2 i
Njihovim rješavanjem dobijamo izraze za ocjenu parametara a i b:
a = y − bx
b=
n
n
n
i =1
i =1 n
i =1
n∑ xi yi − ∑ xi ∑ yi n
n∑ x − (∑ xi ) i =1
2 i
i =1
2
n
=
∑x y i
i =1
n
i
∑x i =1
− n⋅ x ⋅ y
2 i
(4.48)
− nx
2
Postupak ocjene parametara možemo pojednostaviti centriranjem varijable X11. Varijabla se centrira tako da se izrazi odstupanjima od aritmetičke
11
Mi ćemo objasniti pojednostavljeni postupak, ali preporučujemo korištenje Excela, SPSS, RATS - Regression Analysis for Time Series) ili drugih statističkih programa za ocjenu navedenih parametara.
204
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
sredine. Pošto je zbir tih odstupanja jednak nuli izrazi za računanje parametara se pojednostavljuju. Varijabla se transformira na sljedeći način:
n ⎧ ⎪⎪ xi − x , 2 ≠ cijelog broja xi = ⎨ ⎪ 2(xi − x ), n = cijeli broj ⎪⎩ 2 b* =
∑x y ∑x i
i
2 i
⎧ * n b , ≠ cijelog broja ⎪⎪ 2 b=⎨ ⎪2b* , n = cijeli broj ⎪⎩ 2 ⎛ n +1⎞ a = y − b⎜ ⎟ ⎝ 2 ⎠
(4.49)
(4.50)
(4.51)
Pošto X predstavlja vremenske jedinice možemo ih zamijeniti rednim brojevima tako da njihov zbir bude jednak nuli. Središnja vremenska jedinica kod serije sa neparnim podacima se označi sa nulom (0). Prethodne vremenske jedinice se označe sa negativnim, a naredne sa pozitivnim rednim brojevima. Kod serija sa parnim brojem podataka dvije središnje vremenske jedinice se označe sa –0,5 i +0,5. Prethodne vremenske jedinice se označe za jedinicu manjim, a naredne za jedinicu većim brojem. Tako postižemo da je zbir rednih brojeva koji predstavljaju vremenske jedinice jednak nuli i njihova aritmetička sredina je jednaka nuli. Pojednostavljene formule za ocjenu parametara su jednake sljedećim izrazima:
b=
∑x y ∑x i
i
2 i
⎛ n +1⎞ a = y − b⎜ ⎟ ⎝ 2 ⎠
(4.52)
Za utvrđivanje reprezentativnosti trenda koristimo standardnu devijaciju trenda koja je jednaka sljedećem izrazu: 205
Statistika u ekonomiji i menadžmentu
σ yˆ =
∑ (y
− yˆ i )
2
i
(4.53)
n
Standardna greška trenda pokazuje prosječno odstupanje empirijskih vrijednosti serije od procijenjenih trend vrijednosti. Možemo definisati i relativnu grešku trenda koja je izražena koeficijentom varijacije trenda i koristi se za poređenje serija izraženih u različitim jedinicama mjere:
kV yˆ =
σ yˆ y
⋅100
(4.54)
Primjer 4.12. Na osnovu serije podataka iz tabele 4.16. za koju smo konstatovali prisustvo sezonskih varijacija trećeg reda, u Excelu smo ocijenili sljedeći linearni trend. 180
yˆ = 3,2797 x + 89,515
160
R 2 = 0,2395
vrijednost y
140 120 100 80 60 40 20 0
0
1
Grafikon 4.22.
2
3
4
5
6 7 mjeseci
8
9
10
11
12
13
Linearni trend
Primjer 4.13. Na primjeru podataka iz tabele 4.17., u kojoj smo konstatovali sezonske varijacije četvrtog reda, u Excelu smo dobili sljedeći grafički prikaz linearnog trenda.
206
Poglavlje 4. – Dinamička analiza i mjerenje evolucije 6000
yˆ = 31,787 x + 2515,4
vrijednost y
5000
R 2 = 0,0489
4000 3000 2000 1000 0
0
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
trimestri Grafikon 4.23.
Linearni trend
Vrijednost koeficijenta determinacije je vrlo niska i ova ocjena linearnog trenda nije prihvatljiva. 4.3.5.2. Parabolični trend Ako kretanje pojave u posmatranom periodu pokazuje tendenciju krivolinijskog rasporeda koristimo parabolični trend. Jednačina paraboličnog trenda je data sljedećim izrazom:
yˆi = a + bxi + cxi2
i=1,2,…..,n
(4.55)
Parametre a, b i c ocjenjujemo metodom najmanjih kvadrata na osnovu kojeg dobijamo sistem normalnih jednačina:
na + b∑ xi + c ∑ xi2 = ∑ yi
a ∑ xi + b∑ xi2 + c ∑ xi3 = ∑ xi yi
(4.56)
a ∑ xi2 + b∑ xi3 + c∑ xi4 = ∑ xi2 yi na osnovu kojeg izračunavamo vrijednost parametara a, b i c. Ako koristimo transformisane vrijednosti varijable X dobijamo:
na + c ∑ xi2 = ∑ yi b∑ xi2 = ∑ xi yi 207
Statistika u ekonomiji i menadžmentu
a ∑ xi2 + c∑ xi4 = ∑ xi2 yi c xi2 ∑ n ∑ xi yi
(4.57)
a= y− b=
∑x n∑ x y − ∑ y ∑ x c= n ∑ x − (∑ x ) 2 i
2 i
i 4 i
(4.58)
2 i
i
2 2 i
4.3.5.3. Eksponencijalni trend Eksponencijalni trend primjenjujemo u slučaju kada kretanje pojave u sukcesivnim vremenskim intervalima pokazuje istu relativnu promjenu odnosno kada se osnovna tendencija manifestuje kao eksponencijalna kovarijansa sa vremenom. Jednačina eksponencijalnog trenda je data sljedećim izrazom: yˆ i = ab xi (4.59) Model lineariziramo logaritamskom transformacijom: log yi = log a + xi log b Sistem normalnih jednačina ima sljedeći oblik: n log a + log b∑ xi = ∑ log yi
log a ∑ xi + log b∑ xi2 = ∑ xi log yi
(4.60)
(4.61)
na osnovu kojeg određujemo parametre a i b. Ako centriramo varijablu X, odnosno odredimo periode tako da Σxi bude jednako nula, kao što smo ilustrovali na primjeru linearnog trenda, možemo računati parametre a i b korištenjem sljedećih pojednostavljenih izraza: ∑ log yi log a = n (4.62) xi log yi ∑ log b = ∑ xi2 208
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
4.4. TEORIJSKA PITANJA 1. 2. 3. 4. 5.
U kojim slučajevima govorimo o mjerenju evolucije neke veličine? Definišite apsolutnu promjenu. Definišite relativnu promjenu. Da li apsolutna promjena može biti negativna? Koji su sinonimi za relativnu promjenu? Da li relativna promjena posjeduje osobine računanja? 6. Definišite stopu promjene. 7. Pomoću kojih parametara možete mjeriti evoluciju neke veličine? 8. Koju podjelu indeksa poznajete? 9. Definišite indeks na bazi 1 i indeks na bazi 100 i komentarišite vezu između ova dva indeksa. 10. Nabrojite osobine individualnih indeksa. 11. Definišite i ilustrujte na jednom primjeru osobinu tranzitivnosti. 12. Definišite i ilustrujte na jednom primjeru osobinu recipročnosti. 13. Definišite indekse sa stalnom bazom. 14. Definišite lančane indekse. 15. Koje indekse možemo nazvati indeksima razvoja? 16. Da li indekse možemo grafički predstavljati? 17. U kojim jedinicama mjere su izraženi indeksi? 18. Koja je veza između stope promjene i indeksa? 19. Napišite vezu između indeksa na bazi 1 i stope promjene. 20. Napišite vezu između indeksa na bazi 100 i stope promjene. 21. Kako izračunavamo prosječni godišnji indeks? 22. Kako izračunavamo prosječnu godišnju stopu rasta? 23. Koje su prednosti indeksa u odnosu na stopu promjene? 24. Koju sredinu koristimo za izračunavanju prosječne godišnje stope promjene? 25. Koji izraz i koju osobinu koristimo za promjenu baznog datuma ? 26. Koje metode koristimo za konstrukciju agregatnih indeksa? 27. Koje agregatne indekse poznajete? 28. Definišite indeks koji se konstruiše agregiranjem na osnovu baznog perioda. 209
Statistika u ekonomiji i menadžmentu
29. U odnosu na koji period vršite agregiranje da biste konstruisali Paasche indeks cijena? 30. Napišite formule za izračunavanje Laspeyres i Paasche indeksa cijena i količina. 31. Definišite Fischerov indeks. 32. Definišite indeks vrijednosti. 33. Kompletirajte i objasnite dekompoziciju indeksa vrijednosti. 34. Definišite realni budžetski koeficijent. 35. Definišite fiktivni budžetski koeficijent. 36. Definišite i napišite formule za sintetičke indekse cijena i količina konstruisane na osnovu ponderisanih sredina. 37. Definišite pokretnu sredinu neparnog reda. 38. Definišite pokretnu sredinu parnog reda. 39. Koje su osnovne komponente vremenske serije? 40. Zašto i kada primjenjujemo metod pokretnih sredina? 41. Pomoću kojih metoda možemo odrediti tendenciju ili trend?
4.5. RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
Zadatak 1 Evolucija poslovnih rezultata firme Nestle, prema aktivnostima u 2000./2001. godini:
Čokolada Piće Mliječni proizvodi Gotova jela Sladoled Ostali proizvodi Ukupno
2000. ? 340 613 893 ? 1479 3762
2001. 328 347 677 1045 145 1715 4257
Kompletirajte tabelu na osnovu sljedećih podataka i odgovorite na pitanja:
210
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
1. U 2000. godini apsolutno odstupanje između poslovnog rezultat Mliječnih proizvoda i Sladoleda je bilo 474 miliona eura. Koji je poslovni rezultat aktivnosti Sladoled u 2000. godini? 2. Poslovni rezultat aktivnosti Čokolada je manji za 12,4% od poslovnog rezultata Piće u 2000. godini. Koji je poslovni rezultat aktivnosti Čokolada za ovu godinu? Zaokružite na cijeli broj dobiveni rezultat. 3. a) Izračunajte proporciju aktivnosti Piće u 2000. i 2001. godini. b) Izračunajte stopu varijacije aktivnosti Piće između 2000. i 2001. godine. c) Komentarišite rezultate a) i b). 4. Izračunajte relativno odstupanje između Aktivnosti Gotova jela i Mliječni proizvodi u 2000. godini. Isto pitanje za 2001. godinu. Analizirajući tabelu uočavate da su se poslovni rezultati Gotova jela i Mliječni proizvodi uvećali između 2000. i 2001. Da li bez dodatnih računanja možete objasniti evoluciju poslovnih rezultata na osnovu relativnih odstupanja koje ste izračunali?
Elementi rješenja: 1. AO u 2000.: (PRMP-PRS)=474 miliona eura ⇒ (613- PRS)=474 ⇒ PRS =139 miliona eura. 2. PR Č2000=87.6% od PRPiće 2000 ⇒ PR Č2000=0.876•340=297.84 miliona eura. Zaokružujemo rezultat na 298 miliona eura. 3. a) Proporcija ⇒ 9.04%
Piće 2000=
PRPiće
2000
/PR Ukupno
2000=340/3762=0.0904
Proporcija Piće 2001= PRPiće 2001 /PR Ukupno 2001==347/4257=0.0815 ⇒ 8.15% b) Stopa promjene:
PR2001
2000
=
PR 2001 − PR2000 347 − 340 = = 0.0206 ⇒ 2.06% PR2000 340
211
Statistika u ekonomiji i menadžmentu
c. U 2001. godini, iako je poslovni rezultat (PR) aktivnosti Piće uvećan za 2.06% u odnosu na 2000. g., njegova proporcija u ukupnom PR se smanjila sa 9.04% u 2000. na 8,15% u 2001. Ove dvije informacije su komplementarne. 4. Relativno odstupanje između Gotova jela i Mliječni proizvodi u 2000: PRGJ 2000 − PRMP2000 893 − 613 = = 0.4568 ⇒ 45.68% RO2000 = 613 PRMP2000 Relativno odstupanje između Gotova jela i Mliječni proizvodi u 2001.: PRGJ2001 − PRMP2001 1045 − 677 RO2001 = = = 0.5436 ⇒ 54.36% 677 PRMP2001 Relativno odstupanje PR između aktivnosti Gotova jela i aktivnosti Mliječni proizvodi je veće u 2001. nego u 2000. U 2000. PR aktivnosti Gotova jela je bio za 45.68% veći od PR aktivnosti Mliječni proizvodi.U 2001. PR aktivnosti Gotova jela je za 54.36% veći od PR aktivnosti Mliječni proizvodi. Možemo konstatovati da je PR aktivnosti Gotova jela više uvećan od PR aktivnosti Mliječni proizvodi u 2001.
Zadatak 2 Diplomirani studenti u Federaciji BiH:
Ukupno Redovni studenti Vanredni studenti Ekonomski fakultet Redovni studenti Vanredni studenti
1996. 2046 1492 554 205 130 75
1997. 2700 1793 907 258 173 85
1998. 2461 1584 877 581 301 280
1999. 2364 1614 750 484 295 189
2000. 2820 1923 897 532 365 167
2001. 3442 2240 1202 665 466 199
Izvor: Statistički godišnjak Federacije BiH, 2002., Sarajevo, strane 326 i 329.
1. Analizirati datu tabelu (populacija, elementi populacije, period, kolona –analiza strukture, vrsta - analiza evolucije posmatranih struktura analizirane populacije).
212
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
2. Odrediti proporciju studenata Ekonomskog fakulteta u Sarajevu u ukupnom broju studenata. 3. Izrazite u procentima strukturu ukupnog broja studenata (redovni i vanredni). 4. Izrazite u procentima strukturu studenata Ekonomskog fakulteta u Sarajevu. 5. Odredite apsolutne promjene broja ukupnih studenata i broja studenata Ekonomskog fakulteta u Sarajevu i komentarišite dobijene rezultate. 6. Odredite relativne promjene broja ukupnih studenata i broja studenata Ekonomskog fakulteta i komentarišite dobijene rezultate. 7. Uporedite rezultate dobijene u pitanjima e) i f). 8. Izračunajte bazne indekse baza 100 u 1996. godini za ukupan broj studenata i za studente Ekonomskog fakulteta i objasnite dobijene rezultate. 9. Predstavite grafički izračunate bazne indekse. 10. Izračunajte lančane indekse za ukupan broj studenata i za studente Ekonomskog fakulteta i komentarišite dobijene rezultate. 11. Izračunajte stope promjene broja ukupnih i broja studenata Ekonomskog fakulteta. 12. Izračunajte prosječnu godišnju stopu promjene broja ukupnih studenata i broja studenata Ekonomskog fakulteta: 1) polazeći od izračunatih lančanih indeksa i 2) korištenjem podataka iz polazne tabele. 13. Koristeći podatke iz polazne tabele izračunajte prosječne godišnje stope rasta ukupnog broja redovnih i vanrednih studenata kao i prosječne godišnje stope rasta redovnih i vanrednih studenata Ekonomskog fakulteta. 14. Komentarišite dobijene rezultate. Elementi rješenja: 2. Proporcija studenata ekonomskih fakulteta Ekonomski fakultet Ukupno Ekonomski fak. %
1996. 205 2046 10,0%
1997. 258 2700 9,6%
1998. 581 2461 23,6%
1999. 484 2364 20,5%
2000. 532 2820 18,9%
2001. 665 3442 19,3%
213
Statistika u ekonomiji i menadžmentu
3. Struktura ukupnog broja diplomiranih studenata 1996. 1997. 1998. 1999. 2000. 2001. 72,9% 66,4% 64,4% 68,3% 68,2% 65,1% 27,1% 33,6% 35,6% 31,7% 31,8% 34,9% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Redovni studenti Vanredni studenti Ukupno
4. Struktura diplomiranih studenata Ekonomskog fakulteta: 1996. 1997. 1998. 1999. 2000. 2001. 63,4% 67,1% 51,8% 61,0% 68,6% 70,1% 36,6% 32,9% 48,2% 39,0% 31,4% 29,9% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Redovni studenti Vanredni studenti Ukupno Ekon.f.
5. Apsolutne promjene: 1997-96 654 53
Ukupno Ekonomski fakultet
1998-97 -239 323
1999-98 -97 -97
2000-99 456 48
2001-00 622 133
(00-99)/99
(01-00)/00
19,29 9,92
22,06 25,00
6. Relativne promjene (97-96)/96
Ukupno Ekonomski fak.
31,96 25,85
(98-97)/97
-8,85 125,19
(99-98)/98
-3,94 -16,70
Rješenje za pitanja 8, 9 i 10. 1996.
Ukupno Baza 96 Lančani
214
2046 100
1997.
2700 132,0 132,0
1998.
1999.
2000.
2001.
2461 120,3 91,1
2364 115,5 96,1
2820 137,8 119,3
3442 168,2 122,1
Poglavlje 4. – Dinamička analiza i mjerenje evolucije 350
236,1
250 200 150 100
324,4
283,4
300
259,5
125,9 100
50 0
1996
1997
1998
1999
2000
2001
Bazni indeksi broja diplomiranih studenata Ekonomskog fakulteta baza 100 u 1996. g.
Grafikon 4.24.
Ekonomski fakultet Baza 96 Lančani
1996.
1997.
1998.
1999.
2000.
2001.
205 100
258 125,9 125,9
581 283,4 225,2
484 236,1 83,3
532 259,5 109,9
665 324,4 125,0
180 160
132,0
140 120 100
137,8 120,3
115,5
1998
1999
168,2
100
80 60 40 20 0
1996
Grafik 4.25.
1997
2000
2001
Bazni indeksi ukupnog broja diplomiranih studenata baza 100 u 1996. godini
215
Statistika u ekonomiji i menadžmentu
Zadatak 3 Dati su sljedeći podaci: Godine 1996. 1997. 1998. 1999. 2000. Stopa rasta t/t-1 (u %) minimalnih plata 2.6 4.5 8.7 1.3 2.2 Indeks kupovne moći baza 100 u 100.6 103.3 107.9 100.8 100.5 periodu (t-1)
1. Koja je relativna promjena kupovne moći u periodu 1995.-2000. g.? 2. Izračunajte prosječnu godišnju stopu promjene kupovne moći između1995. i 2000. 3. Izračunajte prosječnu godišnju stopu rasta minimalnih plata u periodu 1995.-2000. Elementi rješenja: 1. Relativna promjena kupovne moći između 1995. i 2000. je bila 13.6%. i00/95 = i00/99·i99/98·i98/97·i97/96·i96/95=1.006·1.033·1.079·1.008·1.005=1.1359. 2. Prosječna godišnja stopa promjene kupovne moći između 1995. i 2000. g. je 2.6%. iprosječni godišnji 00/95= 5 1.1359 = 1.0258 ≈ 1.026 Veza indeksa i stope: Stopa = indeks –1=1,026-1=0,026·100=2,6%. 3. Prosječna godišnja stopa rasta minimalnih plata u periodu 1995.-2000. god.: i00/95 = i00/99·i99/98·i98/97·i97/96·i96/95=1.026·1.045·1.087·1.013·1.022=1.20657. iprosječni godišnji 00/95= 5 1.20657 = (1.20657) Prosječna godišnja stopa rasta r = 3,8%.
216
1
5
≈ 1.038
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Zadatak 4 U sljedećoj tabeli su prezentovani podaci o stopi promjene troškova (u %) namijenjenih za istraživanje i razvoj u Francuskoj:
Stopa promjene u %
1995/1990
1997/1995
1999/1997
15,31
1,60
5,15
Izvor: INSEE, TEF 2001-2002, strana 177.
1. Izračunajte stopu varijacije u periodu 1999./1995. 2. Izračunajte stopu varijacije u periodu 1999./1990. 3. Komentarišite dobijene rezultate. Elementi rješenja: 1. Potrebno je koristiti indekse na bazi 1 i pravilo tranzitivnosti: i99/95=i99/97•i97/95=1.0515•1.016=1.068324 Stopa rasta u periodu 1999./1995. je bila 6,83% 2. i99/90=i99/97•i97/95• i95/90=1.0515•1.016•1,1531=1.23188 Stopa rasta u periodu 1999./1990. je bila 23,19%
Zadatak 5 Tabela: Evolucija značaja sektora državnih preduzeća u Francuskoj:
Broj preduzeća
1994.
1995.
1996.
1997.
1998.
1999.
2 716
2 636
2 506
2 510
1 785
1 540
Izvor: INSEE, TEF2001-2002, strana 143.
1. Izračunajte indekse baza 100 u 1994. i odredite stope promjene. 2. Izračunajte i objasnite lančane indekse. 3. Izračunajte prosječnu godišnju stopu promjene broja državnih preduzeća u periodu 1999./1994. 217
Statistika u ekonomiji i menadžmentu
Elementi rješenja: 1. Indeksi
Stopa promjene (%)
I94/94 100 -
I95/94 97,1 -2,9
I96/94 92,3 -7,7
I97/94 92,4 -7,6
I98/94 65,7 -34,3
I99/94 56,7 -43,3
Broj državnih preduzeća se konstantno smanjuje. Osnovni razlog je privatizacija i zakon o privatizaciji iz jula 1993. od kada broj državnih preduzeća ne prestaje opadati. 2.
Lančani indeksi
Lančani indeksi baza 100 u (t-1) Stopa promjene (%) Lančani indeks baza 1 u (t-1)
I95/94
I96/95
I97/96
I98/97
I99/98
97,1 -2,9 0.971
95,1 -4,9 0.951
100,2 0,2 1.02
71,1 -28,9 0.711
86,3 -13,7 0.863
3. Prosječna godišnja stopa promjene u periodu 1999./1994. je –10,73. Možemo je računati na dva načina: Na osnovu polaznih podataka o broju preduzeća:
r99 / 94
⎛V V = 5 99 − 1 = ⎜⎜ 99 V94 ⎝ V94
⎞ ⎟⎟ ⎠
1
5
⎛ 1540 ⎞ −1 = ⎜ ⎟ ⎝ 2716 ⎠
1
5
−1
= (0.567 ) 5 − 1 = 0.8927 − 1 = −0.1073 ⇒ −10.73% 1
Ili koristeći lančane indekse: i99/94 = i99/98 · i98/97 · i97/96 · i96/95 · i95/94 = 0.5779. iprosječni godišnji 99/94 = 0.5779
1/5
=0.896.
Prosječna godišnja stopa promjene: r 99/94 = i99/94–1=0.896-1= -0.104→ -10.4% Razlika između stopa je rezultat zaokruživanja.
218
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
Zadatak 6 Posmatrajmo jednu veličinu čija je stopa rasta u toku tri uzastopne godine bila: 0,9% u prvoj, 0,9% u drugoj i 4% u trećoj godini. Prosječna godišnja stopa rasta za tri godine je jednaka: 1.
[(0,009 )
2.
1 (2 × 0,009 + 0,04) 3
3.
[(1,009 )
2
2
]
× (0,04 )
× 1,04
]
1
3
1
3
−1
4. aritmetička sredina. Elementi rješenja: Tačan odgovor je 3.
Zadatak 7 Poznati su individualni indeksi cijena jednog proizvoda: ip99/94=1,41 ip2001/94=1,62 Možete li odrediti evoluciju cijene ovog proizvoda između 1999. i 2001.? Elementi rješenja: Individualni indeksi su tranzitivni: ip2001/94= ip2001/99· ip99/94, odakle ip2001/99= ip2001/94/ ip99/94=1,62/1,41=1,15 Između 1999. i 2001. cijena se uvećala za 15%.
219
Statistika u ekonomiji i menadžmentu
Zadatak 8 Preduzeće je uvećalo svoj poslovni rezultat na osnovu proizvoda P za 5% između juna 2002. i juna 2001. Indeks cijena ovog proizvoda (juni 2002/juni 2001) je jednak 108. Da li su se u toku ovog perioda prodate količine ovog proizvoda uvećale ili smanjile i za koliko? Elementi rješenja: Poslovni rezultat je jednak (p·q) IPR·100 = Ip·Iq Iq = (IPR·100)/Ip≈97,2 Prodane količine su se smanjile za 2,8%.
Zadatak 9 1. Prodaja jednog proizvoda se uvećala za 15% između 2000. i 2001. godine i 10% između 2001. i 2002. godine. Koja je bila stopa povećanja prodaje između 2000. i 2002. godine? 2. Prodaje proizvoda su smanjene za 5% između 2000. i 2001. i zatim još 5% između 2001. i 2002. Koja je stopa opadanja prodaje između 2000. i 2002. godine? Elementi rješenja: Tranzitivnost: i2002/2000=i2002/2001⋅i2001/2000=1,10⋅1,15=1,265 Povećanje 26,5% i2002/2000=i2002/2001⋅i2001/2000=0,95⋅0,95=0,9025 Smanjenje 9,75%.
Zadatak 10 Lančani indeksi industrijske proizvodnje Federacije BiH su dati u sljedećoj tabeli:
Indeksi
96/95
97/96
98/97
99/98
2000/99
2001/2000
187,6
135,7
123,8
110,6
108,8
112,2
Izvor: Statistički godišnjak Federacije BiH,2002, str.113-115
220
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
1. Izračunajte bazne indekse uz pretpostavku da je baza 100 u 2000. godini. 2. Izračunajte bazne indekse uz pretpostavku da je baza 100 u 1998. godini 3. Uporedite i komentarišite rezultate 1. i 2. Elementi rješenja: 1. Indeksi
1995.
1996.
1997.
1998.
1999.
2000.
2001.
26,3
49,4
67,1
83,1
91,9
100
112,2
2. 1995.
Postupak
1996.
1997.
59,5/1,876 80,8/1,357 100/1,238
Indeksi
31,7
59,5
80,8
1998. 1999.
100 100
2000.
2001.
110,6 108,8·1,106 112,2⋅1,203 120,3 134,97≈135
110,6
Zadatak 11 U sljedećoj tabeli su date cijene, količine i individualni indeksi vrijednosti za dva proizvoda A i B za dva različita perioda: bazni period 0 i posmatrani period 1. Tabela 1. Proizvod
A B
Period 0 Cijena Količina 10 29 14
Period 1 Indeks vrijednosti baza 100=period 0 Cijena Količina 12 111.72 16 17 121.42
1. Odrediti individualne indekse cijena za A i B u baznom i posmatranom periodu. 2. Odrediti količinu proizvoda B u baznom i proizvoda A u posmatranom periodu. 3. Odrediti budžetske koeficijente za A i B u baznom periodu. 4. Izračunati Laspeyresov indeks cijena u periodu 1 ako je baza 100 u baznom periodu 0 (koristite formulu na osnovu ponderisane aritmetičke sredine) i Paasche-ov indeks količina (koristite agregiranu formulu)
221
Statistika u ekonomiji i menadžmentu
5. Izračunati indeks globalne vrijednosti. Raščlanite kvantitativno objašnjenje stope rasta globalne potrošnje.
ga
i
dajte
Elementi rješenja: 1.
Ip1/0(A)=100⋅ Ip1/0(B)= 100⋅
p1(A) =100⋅12 =120 ⇒ i(A) p1/0 =1.20 10 p0(A)
p1(B) =100⋅16 =114.28 ⇒ i(B) p1/0 =1.143 3 14 p0(B)
Između perioda 0 i perioda 1 cijena proizvoda A se uvećala za 20% i B za 14.3%. 2. Proizvod A:
IW( A1/) 0 = 100 ⋅ i (pA1/) 0 ⋅ iq(1/A)0 I q(1/A)0 =
I
( A) q1 / 0
IW( A1/) 0 111.72 = = 93.1 1.2 i p( A1/) 0
I q(1A/)0 ⋅ q0( A) 29 ⋅ 93.1 q1( A) ( A) q = = = 26.999 ≈ 27 = 100 ⋅ ( A) ⇒ 1 100 100 q0
Proizvod B:
I
(B) q1/ 0
IW( B1/) 0 121.42 = ( B) = = 106.25 i p1/ 0 1.1428
I q(1B/)0 = 100 ⋅
100 ⋅ q1( B ) 17 q1( B ) ( B) q ⇒ = = 100 ⋅ = 16 0 ( B) ( B) q0 I q1 / 0 106.25
3. Budžetski koeficijent u periodu 0: α 0j =
p0( j ) ⋅ q0( j ) ∑ p0( j ) ⋅ q0( j ) j
Ukupna vrijednost potrošačke korpe u periodu 0:
222
Poglavlje 4. – Dinamička analiza i mjerenje evolucije B
∑p j=A
α
( A) 0
( j) 0
⋅ q0( j ) = p0( A) ⋅ q0( A) + p0( B ) ⋅ q0( B ) = 10 ⋅ 29 + 14 ⋅ 16 = 514
p0( A) ⋅ q0( A) 10 ⋅ 29 = = = 0.5642 ( j) ( j) 514 ∑ p0 ⋅ q0 j
α
( B) 0
p0( B ) ⋅ q0( B ) 14 ⋅ 16 = = = 0.4358 ( j) ( j) ∑ p0 ⋅ q0 514 j
Konstatujemo da je: α 0( A) + α 0( B ) =1 4. L p1 / 0 = ∑α 0( j ) ⋅ I p( 1j )/ 0 = α 0( A) ⋅ I p( 1A/) 0 + α 0( B ) ⋅ I p( B1 /) 0 j
L p1 / 0 =0.5642 120+0.4358 114.3=117.51 dakle povećanje cijena od 17.5%.
Pq1/ 0
∑p =100⋅ ∑p
(j) 1
⋅q1(j)
(j) 1
(j) 0
j
=100⋅12⋅27+16⋅17 =100⋅0.9867=98.67 , dakle smanjenje 12⋅29+16⋅16 ⋅q
j
količine za 1.33%. 5. Indeks vrijednosti je jednak
∑p
⋅ q1( j )
∑p
⋅q
( j) 1
IW 1/ 0 = 100 ⋅
j
( j) 0
( j) 0
= 100 ⋅
12 ⋅ 27 + 16 ⋅ 17 = 115.95 ≈ 116 10 ⋅ 29 + 14 ⋅ 16
j
Dakle, povećanje vrijednosti za 16%. Dekompozicija indeksa vrijednosti: iw1/ 0 =lp· pq=1.175·0.9867=1.159~1.16
Povećanje vrijednosti globalne potrošnje (potrošačke korpe) od 16% je rezultat povećanja cijena od 17.5% i smanjenja količina od 1.33%.
223
Statistika u ekonomiji i menadžmentu
Zadatak 12 Data je sljedeća tabela: Proizvodi
2000. Cijene Količine 9,00 27 4,90 31 3,65 40 8,10 15
A B C D
2001. Cijene 9,25 5,20 5,00 7,70
Količine 37 40 28 30
1. Izračunati Laspeyresov i Paascheov indeks cijena i količina u 2001. u odnosu na 2000. za grupu od četiri posmatrana proizvoda. 2. Izračunati indeks vrijednosti, raščlaniti ga i objasniti. 3. Izračunati Fisherov indeks cijena i količina. Elementi rješenja: j 1 2 3 4 Ukupno
PJ,00QJ,00 243,00 151,90 146,00 121,50 662,40 4
L p 01 / 00 =
∑p
q00j
∑p
q00j
j 01
j =1 4
j 00
j =1
4
L q 01 / 00 =
∑
p 00j q 01j
∑
p 00j q 00j
j =1 4
j =1
∑p
q01j
∑p
q01j
j =1 4
j =1
224
j 01
j 00
⋅100 =
PJ,01QJ01 342,25 208,00 140,00 231,00 921,25
726,45 ⋅ 100 ≈ 110 662,40
⋅ 100 =
4
Pp 01 / 00 =
⋅ 100 =
PJ,00QJ,01 333,00 196,00 102,20 243,00 874,20
874 , 20 ⋅ 100 ≈ 132 662 , 40
921,25 ⋅100 ≈ 105 874,20
PJ,01QJ,00 249,75 161,20 200,00 115,50 726,45
Poglavlje 4. – Dinamička analiza i mjerenje evolucije 4
Pq 01 / 00 =
∑p
q01j
∑p
q00j
j 01
j =1 4
j 01
j =1
I w01 / 00 =
⋅100 =
∑p ∑p
j 01 j 00
⋅ q01j q00j
=
921,25 ⋅100 ≈ 127 726,45
921, 25 ⋅ 100 ≈ 139,08 662, 40
I w01 / 00 = pp · lq=1,05 ·1,32=1,386 I w01 / 00 = pq · lp=1,27 ·1,10=1,397
Fp 01 / 00 = L p 01 / 00 ⋅ Pp 01 / 00 = 110 ⋅ 105 ≈ 107,47 F p 01 / 00 = Lq 01 / 00 ⋅ Pq 01 / 00 = 132 ⋅ 127 ≈ 129,48 Zadatak 13 Na osnovu sljedećih podataka izračunajte pokretne sredine reda 2, 3, 4 i 5 koje nedostaju u donjoj tabeli. Rezultate zaokružite na jednu decimalu. t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Y 110 116 121 127 134 140 147 155 163 160 145 150 150 140 150 160
PS2
PS3
PS4
PS5
115,8 121,3 127,3 133,8 140,3 ? 155,0 160,3 157,0 150,0 148,8 ? 145,0 150,0
115,7 121,3 127,3 ? 140,3 147,3 155,0 159,3 ? 151,7 148,3 146,7 146,7 150,0
120,1 124,6 130,7 ? 144,2 150,4 153,5 154,3 154,1 ? 148,0 148,5
? 124,7 130,8 137,3 144,3 149,8 ? 153,3 153,8 151,3 149,2 149,2
225
Statistika u ekonomiji i menadžmentu
Elementi rješenja: PS 2(t=7)=147,3; PS 2(t=13)=147,5; PS 3(t=5)=133,7; PS 3(t=10)=156; PS 4(t=6)=137,2; PS 4(t=12)=151,3; PS 5(t=3)=121,6; PS 5(t=9)=151,7.
Zadatak 14 U sljedećoj tabeli dati su podaci o poslovnom rezultatima po trimestrima u hotelima A kategorije u poznatom turističkom ljetovalištu. Poslovni rezultati su izraženi u 000 eura. Date su i pokretne sredine četvrtog reda (PS4). Datum 2000-T1 2000-T2 2000-T3 2000-T4 2001-T1 2001-T2 2001-T3 2001-T4 2002-T1 2002-T2 2002-T3 2002-T4 2003-T1 2003-T2 2003-T3 2003-T4 2004-T1 2004-T2 2004-T3 2004-T4 2005-T1 2005-T2 2005-T3 2005-T4
226
PR u 000 54500 55400 55600 55050 54800 55700 55900 55450 55300 56170 56400 55920 55600 56380 56400 55600 55250 56000 56200 55650 55400 56280 56450 55910
PS4 55175,0 55250,0 55325,0 55412,5 55525,0 55646,3 55767,5 55888,8 55985,0 56048,8 56075,0 56035,0 55951,3 55860,0 55787,5 55768,8 55793,8 55847,5 55913,8 55977,5 -
Poglavlje 4. – Dinamička analiza i mjerenje evolucije
1. Predstavite grafički seriju poslovnih rezultata. Komentarišite dati grafički prikaz i odredite periodičnost sezonske komponente. 2. Koji su nepovoljni trimestri sa stanovišta poslovnih rezultata i zašto? 3. Izračunajte stopu varijacije između T2/T1 za 2001. na osnovu originalnih i desezoniranih podataka i komentarišite dobijene rezultate. 4. Izračunajte stopu varijacije između T4 2004. i T4 2000. na osnovu originalnih podataka i na osnovu podataka PS4. Uporedite i komentarišite dobijene rezultate. 5. Provjerite primjenom odgovarajućih formula rezultate računa za PS4 za T3 2003. i za T4 2004. godine. 6. Predstavite na grafikonu pod 1) seriju izračunatih PS4. Da li vam se procjena tendencije ovom metodom čini zadovoljavajuća? Elementi rješenja: 1. 56800
55800 55300
Grafikon 4.26.
2005-T4
2005-T3
2005-T2
2005-T1
2004-T4
2004-T3
2004-T2
2004-T1
2003-T4
2003-T3
2003-T2
2003-T1
2002-T4
2002-T3
2002-T2
2002-T1
2001-T4
2001-T3
2001-T2
2001-T1
2000-T4
2000-T3
54300
2000-T2
54800
2000-T1
poslovni rezultati
56300
Pokretne sredine četvrtog reda
2. T1 i T4 . 3. Na osnovu polaznih podataka: iT2/T1 2001=55700/54800=1,0164. Stopa je 1,64% Na osnovu korigovanih podataka: iT2/T1 2001=55412,5/55325=1,0016. Stopa 0,16% 4. Na osnovu polaznih podataka: iT42004/T4 2000=1,01899. Stopa je 1,9%. Na osnovu korigovanih podataka: iT42004/T4 2000 =1,0108. Stopa je 1,08%.
227
Statistika u ekonomiji i menadžmentu
5. PS 4(t = 15) =
PS 4(t = 15) =
1 ⎡ y13 + y14 + y15 + y16 y14 + y15 + y16 + y17 ⎤ + ⎢ ⎥ 2⎣ 4 4 ⎦
1 2 1 y13 + ( y14 + y15 + y16 ) + y17 8 8 8
1 2 PS 4(t = 15) = 55600 + ( 56380 + 56400 + 55600 ) + 8 8 1 + 55250 = 55951.25 ≈ 55951.3 8 PS 4(t = 20) =
228
1 ⎡ y18 + y19 + y20 + y21 y19 + y20 + y21 + y22 ⎤ + ⎢ ⎥ =….= 55847,5 2⎣ 4 4 ⎦
POGLAVLJE 5.
OSNOVI VJEROVATNOĆE I TEORIJSKE DISTRIBUCIJE VJEROVATNOĆE
5.1. Uloga i značaj eksperimenta u statistici Posmatranje cjelokupne pojave ili samo njenog dijela i eksperimenti su bitan faktor u naučnim istraživanjima. Posmatranja i eksperimente izvode stručnjaci i naučnici različitih struka i za tu svrhu upotrebljavaju odgovarajuću aparaturu. Statistička priroda tih ispitivanja je često kompleksna i to dovodi do sve veće potrebe za statističarima, kako pri planiranju istraživanja tako i pri obradi i analizi rezultata. Statistička teorija, koja je u osnovi deduktivna, doprinosi racionalizaciji i kvalitetu induktivnog procesa posmatranja. Posmatranje se najčešće sastoji u ispitivanju dijela jedinica osnovnog skupa koji se naziva uzorak da bi se donio sud o osnovnom skupu ili populaciji, bilo da su oni konačni ili beskonačni. Da li će neko posmatranje imati deduktivne atribute zavisi od toga da li se ispituje cjelokupna populacija ili samo jedan njen dio. Ako se posmatranje izvodi na osnovu samo jednog dijela populacije onda je ono induktivno. U 229
Statistika u ekonomiji i menadžmentu
tom slučaju se na osnovu osobina iz uzorka primjenom odgovarajućih metoda, koje se baziraju na teoriji vjerovatnoće, donose zaključci o osobinama osnovnog skupa uz odabrani nivo pouzdanosti. Statistička inferencija omogućuje izvođenje dvije vrste zaključaka o osnovnom skupu na osnovu uzorka. • Prvi su ocjene nepoznate vrijednosti ili intervala povjerenja za posmatrana obilježja osnovnog skupa uz odgovarajući nivo pouzdanosti, odnosno uz odgovarajuću grešku ili rizik procjene. Ocjenama se kvantificira, odnosno ocjenjuje vrijednost nepoznatog parametra ili češće interval u kojem se nepoznati parametar osnovnog skupa nalazi uz odabranu grešku ocjene. • Drugi pristup se primjenjuje u slučajevima kada na osnovu prethodnih eksperimenata ili iskustava mogu pretpostaviti vrijednosti obilježja osnovnog skupa. Da bi se provjerila ta pretpostavka, poredi se pretpostavljena vrijednost obilježja osnovnog skupa sa vrijednošću obilježja koja je izračunata na osnovu uzorka odabranog iz tog osnovnog skupa. Oba analizirana pristupa se baziraju na istim teorijskim pretpostavkama. Uz odgovarajući nivo pouzdanosti, testiraju se pretpostavljene vrijednosti i prihvataju ili odbacuju kao moguća obilježja osnovnog skupa. Osnovno pitanje inferencijalne kao i deskriptivne statistike je: «Kako analizirati podatke da bismo dobili korisnu informaciju?» Da bismo dobili informaciju o populaciji, inferencijalna statistika ima, u odnosu na deskriptivnu statistiku, jednu dodatnu etapu čiji je cilj da odredi, odnosno inferira, polazeći od posmatranih obilježja (karakteristika) na uzorku, vjerovatnu vrijednost tih obilježja za ukupnu istraživanu populaciju ili osnovni skup. 5.1.1. Slučajni eksperiment, skup mogućih rezultata eksperimenta i događaji Slučajni ili statistički eksperiment je potpuno određeni postupak ili proces prikupljanja podataka koji se može modelirati u okviru teorije vjerovatnoće ako: • može biti ponavljan u istim uslovima veliki broj puta, • rezultat eksperimenta nije unaprijed poznat, 230
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
•
se može definisati eksperimenta.
skup
mogućih
rezultata
(ishoda)
tog
Skup mogućih rezultata esperimenta označavamo velikim grčkim slovom omega Ω. Modelizacija skupa mogućih rezultata eksperimenta ε se sastoji u slučajnom izvlačenju samo jednog elementa iz skupa Ω. Svaki rezultat eksperimenta se naziva elementarnim događajem i označava malim grčkim slovom omega ω. Skup elementarnih događaja može biti konačan ili beskonačan. Skup mogućih rezultata jednog eksperimenta izražavamo sljedećom relacijom:
Ω = {ω1 , ω 2 ,..., ω n }
(5.1)
Skup mogućih rezultata bacanja homogene kocke je Ω = {1,2,3,4,5,6}. Svaki od šest mogućih rezultata eksperimenta predstavlja jedan elementarni događaj. U slučaju bacanja kocke postoji šest elementarnih događaja. Ukoliko bismo željeli modelizirati događaj «dobiti neparan broj» on bi predstavljao podskup skupa Ω. Modelizaciju skupa mogućih rezultata bacanja homogene kocke i događaja «dobiti neparan broj» predstavljamo na sljedećim grafikonima. a)
ω1 ω5
ω3
ω4 ω2 ω6
skup mogućih rezultata eksperimenta Grafikon 5.1.
Ω
b)
ω5 ω3
ω1
Ω
A
ω2 ω4
ω6
realizacija događaja A
Skup mogućih rezultata eksperimenta (a) i realizacija određenog događaja (b)
Događaje označavamo velikim slovima abecede. Događaj A definišemo kao podskup skupa Ω, tj. A ⊆ Ω . Događaj koji je sastavljen od dva ili više elementarnih događaja koji imaju zajedničku osobinu je složeni događaj. U ovom slučaju događaj «dobiti neparan broj» bi bio sastavljen od tri elementarna događaja A = {ω1 , ω 2 , ω 3 } = {1,3,5}.
231
Statistika u ekonomiji i menadžmentu
5.1.1.1. Vrste događaja Događaj može, kao što smo već definisali, biti elementaran i složen. Svaki rezultat eksperimenta se naziva elementarni događaj. Događaj sastavljen od više elementarnih događaja koji imaju zajedničku karakteristiku je složeni događaj. Pored navedenih, analiziraćemo i druge vrste događaja. •
Siguran događaj
Siguran događaj je događaj koji je realizovan prilikom svakog ponavljanja eksperimenta. Model sigurnog događaja treba ispuniti dva uslova. Siguran događaj treba predstavljati dio skupa mogućih rezultata i biti realizovan u svakom ponavljanju eksperimenta. •
Nemoguć događaj
Nemoguć događaj je događaj koji se nikada ne realizuje bez obzira na broj ponavljanja eksperimenta. Model nemogućeg događaja treba ispuniti dva uslova. Nemoguć događaj treba predstavljati dio skupa mogućih rezultata. Ovaj događaj se nikada ne realizuje bez obzira na broj ponavljanja eksperimenta. Model nemogućeg događaja je prazan skup. •
Unija i presjek događaja
Uniju događaja definišemo na sljedeći način: događaj (A ili B) je realizovan ako je realizovan događaj A ili događaj B, ili ako su realizovana oba događaja. Ukoliko su ispunjeni uslovi ove definicije, događaj C izražavamo kao uniju događaja A i B i formaliziramo sljedećim izrazom:
C = A∪ B
(5.2)
Presjek događaja A i B je označava sa A ∩ B . Događaj (A i B) je realizovan ako su A i B istovremeno realizovani. Događaj C će biti realizovan ako se istovremeno realizuju i događaj A i događaj B. Formalizaciju presjeka događaja izražavamo na sljedeći način:
C = A∩ B
232
(5.3)
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće a)
b)
ω2 ω3 ω4
A
ω8
ω5
ω7 B
ω6
•
ω2
ω5
ω3
ω1 ω11 B
ω7
ωn
A ∪ B = {ω3 , ω 4 , ω5 , ω7 , ω8 } Grafikon 5.2.
Ω
Ω
ω1
ω4
A
ω8
ω6
ω10
A ∩ B = {ω1 , ω11 }
Unija (a) i presjek (b) dva događaja
Komplementarni događaji
A i B su dva suprotna ili komplementarna događaja ako realizacija eksprimenta rezultira ili u realizaciji samo događaja A ili u realizaciji samo događaja B. U slučaju komplementarnih događaja koristimo notaciju Ā=B i sljedeći uslovi trebaju biti zadovoljeni:
A ∪ B = Ω i A ∩ B = Ø. odnosno
A∪ A = Ω i •
A∩ A = Ø
(5.4)
Nekompatibilni događaji
Dva događaja su nekompatibilna ako se ne mogu istovremeno, odnosno simultano realizovati. A i B su nekompatibilni ako je njihov presjek prazan skup: A ∩ B = Ø. Na grafikonu 5.3. su predstavljeni komplementarni i nekompatibilni događaji.
233
Statistika u ekonomiji i menadžmentu a)
A
A
ω1
ω8
ω9 ω2
ω7
ω4
B
ω2 ω6
ω5
ω7
ω3
ω1
ω11 ω8 ω4
Ω
A
ω3 ω6
ω10
komplementarni događaji A i A
nekompatibilni događaji A i B
A ∪ A = Ω, A ∩ A = ∅
A∩ B = ∅
Grafikon 5.3.
•
b)
Ω
ω5
Skup komplementarnih događaja (a) i nekompatibilnost događaja (b)
Kompletan sistem događaja
Skup događaja A1 , A2 ,... An predstavlja kompletan ili potpun sistem događaja ako svaka realizacija eksperimenta dovodi do realizacije jednog događaja Ai . Modelizacija kompletnog sistema događaja je:
A1 ∪ A2 ... ∪ An = Ω
(5.5)
uz uslov da je za svako i i j, i ≠ j zadovoljena slijedeća relacija: Ai ∩ A j = Ø
A2
A1
ω1 ω10 ω4
ω9 ω8 ω3
ω7 ω2 ω11
Ω
A3
A4
ω5 ω6 Ai ∩ A j = ∅ A1 ∪ A2 ∪ A3 ∪ A4 = Ω
Grafikon 5.4.
234
Kompletan sistem događaja
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
5.1.1.2. Osobine skupova Za operacije sa skupovima se primjenjuju De Morganovi zakoni. Prema De Morganovim zakonima, događaj suprotan presjeku događaja A i B je jednak uniji suprotnih događaja od A i B što se notira izrazom:
A∩ B = A∪ B
(5.6)
Komplementaran događaj unije A i B je jednak presjeku komplementarnih događaja A i B:
A∪ B = A∩ B
(5.7)
Za operacije sa skupovima vrijede i osobine distributivnosti presjeka prema uniji i distributivnosi unije prema presjeku:
A ∩ (B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C ) A ∪ (B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C )
(5.8)
Ako je događaj A dio skupa mogućih rezultata Ω tada vrijede uslovi:
A∩Ω = A
A∩Ø = Ø
A∪Ω = Ω
A∪Ø = A
(5.9)
Pojmove siguran događaj, nemoguć događaj i nekompatibilan događaj smo modelizirali i formalizirali bez korištenja termina vjerovatnoća. U slijedećem dijelu ćemo analizu proširiti definisanjem pojma vjerovatoća i modela slučajnog eksperimenta i slučajnog događaja.
5.2. DEFINISANJE VJEROVATNOĆE Razlikuju se dva osnovna tipa vjerovatnoće: vjerovatnoća a priori i vjerovatnoća a posteriori. Vjerovatnoća a priori je unaprijed poznata vjerovatnoća. Vjerovatnoća nekog događaja može biti poznata unaprijed ako znamo broj povoljnih i broj mogućih ishoda ili rezultata slučajnog eksperimenta. Ako znamo da se u posudi nalaze dvije kuglice različite boje (crvena i bijela), u tom slučaju vjerovatnoća izvlačenja svake od tih kuglica je poznata i iznosi 50%.
235
Statistika u ekonomiji i menadžmentu
U najvećem broju slučajeva nisu unaprijed poznati elementi za izračunavanje vjerovatnoće i potrebno je eksperimentisanjem, ili na neki drugi način, izračunati vjerovatnoću naknadno, poslije realizacije eksperimenta ili a posteriori. U definisanju vjerovatnoće prezentovaćemo dva pristupa eksperimentalni i teorijski. 5.2.1. Eksperimentalni pristup definisanju vjerovatnoće Eksperimentalni pristup definiše vjerovatnoću na bazi frekvencija. Ovako definisana vjerovatnoća se naziva još i empirijska, statistička ili vjerovatnoća a posteriori. Ovaj pristup se koristi u konkretnim slučajevima da bi se odredila numerička vrijednost vjerovatoće jednog događaja. Prema ovoj definiciji, vjerovatnoća je definisana kao granična vrijednost relativne frekvencije i određuje se poslije izvršenog eksperimenta na osnovu prikupljenih empirijskih podataka. Ako sa n označimo broj ponavljanja slučajnog eksperimenta, a sa n(A) broj realizacija događaja A u n ponavljanja, tada odnos n(A)/n predstavlja relativnu frekvenciju događaja A. Vjerovatnoća događaja A se utvrđuje kao granična vrijednost relativne frekvencije kada broj ponavljanja slučajnog eksperimenta teži beskonačnosti:
p ( A) = lim
n→∞
n( A) n
(5.10)
Ukoliko slučajni eksperiment bacanje novčića ponavljamo veliki broj puta vjerovatnoća dobijanja lica će dostići «granicu» kada broj bacanja novčića n teži beskonačnosti: vjerovatnoća (lice) = lim
n →∞
broj bacanja kada se pojavi lice broj bacanja
vjerovatnoća (lice) = lim ( relativna frekvencija pojavljivanja lice) n →∞
Ustvari, vjerovatno je da relativna frekvencija pojavljivanja “lice” teži prema nekoj granici i ta granica se naziva vjerovatnoća.
236
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
5.2.2. Teorijska definicija vjerovatnoće Teorijski pristup definisanju vjerovatnoće predstavlja definiciju vjerovatnoće ili vjerovatnoću a priori.
aksiomatsku
Pretpostavimo da su: ε slučajni eksperiment, Ω skup svih mogućih rezultata tog eksperimenta Ω = {ω1 , ω 2 ,..., ω n } , koji može biti konačan ili beskonačan i
P ( Ω ) = {Ø, ωi , A j ,Ω} skup svih događaja koji se mogu
realizovati kao rezultat slučajnog eksperimenta. Sastavni dio ovog skupa su pored elementarnih događaja ωi i događaja Aj, uvijek i nemoguć događaj Ø i siguran događaj Ω . U slučaju eksperimenta bacanje kocke čije su strane označene od 1 do 6 skup mogućih rezultata je Ω = {1,2,3,4,5,6}. U tom slučaju skup svih događaja (elementarnih i složenih) koji se mogu realizovati kao rezultat eksperimenta bacanje kocke je:
P (Ω) = {Ø,ωi , Aj , Ω} =
= {{Ø}, {1},., {2,6},.., {1,3,5},.., {2, 4,5,6},.., {1,3, 4,5,6,},.., {1, 2,3, 4,5,6}}
Vjerovatnoća se naziva aplikacija p koja svakom događaju iz skupa pridružuje jednu vrijednost iz intervala [0,1] , odnosno p:
P (Ω )
P ( Ω ) → [0,1] , i
zadovoljava dva sljedeća aksioma: 1. Zbir vjerovatnoća svih elementarnih događaja je jednak 1:
p (ω1 ) + p (ω2 ) + ... p (ωn ) = 1
(5.11)
gdje je: 0 ≤ p(ω i ) ≤ 1 . 2. Vjerovatnoća bilo kojeg događaja A je jednaka zbiru vjerovatnoća elementarnih događaja koji čine događaj A: p ( A) = ∑ p(ω i ) . ωi ∈ A
Da bi se odredila vjerovatnoća skupa mogućih rezultata eksperimenta potrebno je svakom elementarnom događaju ωi pridružiti vjerovatnoću
p(ωi ) . Primjena ove definicije vjerovatnoće se zasniva na pretpostavci da je za sve elementarne događaje poznata vjerovatnoća koja može uzimati vrijednosti iz intervala [0,1] . Vjerovatnoća događaja A se izračunava matematičkim putem prije realizacije eksperimenta, dakle a priori. Definisanom događaju A pridružujemo realan broj koji
237
Statistika u ekonomiji i menadžmentu
obilježavamo sa p(A) i nazivamo vjerovatnoćom događaja A ako zadovoljava sljedeće uslove:
0 ≤ p ( A) ≤ 1 ; p(Ω)=1
(5.12)
Posljedice aksiomatske definicije su sljedeće: • Vjerovatnoća skupa svih mogućih rezultata slučajnog eksperimenta je jednaka jedinici p(Ω)=1. Prema aksiomu 1: p (ω1 ) + p(ω 2 ) + ... p (ω n ) = 1 , dakle p (Ω ) = 1 .
•
Zbir vjerovatnoće događaja A i vjerovatnoće komplementarnog događaja A je jednak jedinici
()
p ( A) + p A = 1
njemu
(5.13)
Iz izraza (5.13) slijedi da je vjerovatnoća događaja A jednaka razlici između jedinice i vjerovatnoće komplementarnog događaja A :
()
p ( A) = 1 − p A •
Vjerovatnoća nemogućeg događaja koji predstavljamo kao prazan skup je jednaka nuli:
p (Ø ) = 0 •
(5.14)
Za svaki događaj vjerovatnoća se kreće između nule i jedinice:
∀A, 0 ≤ p( A) ≤ 1
(5.15)
Primjer 5.1. Ako je ε eksperiment izvlačenje loptica čiji je skup mogućih rezultata Ω = (plava, crvena, zelena, žuta ) i vjerovatnoća izvlačenja svake od loptica: p (plava) = 0,3, p (crvena) = 0,4 p (zelena) = 0,2 p (žuta) = 0,1 provjeriti aksiom 1 teorijske definicije i utvrditi vjerovatnoću događaja A koji se sastoji od elementarnih događaja izvući plavu ili zelenu kuglicu. Aksiom 1 je provjeren jer je zbir vjerovatnoća jednak jedinici. 238
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
p (Ω ) = 0,3 + 0,4 + 0,2 + 0,1 = 1 Prema aksiomu 2, vjerovatnoća događaja A = {plava, zelena} je jednaka: p(A)= p(plava)+ p(zelena)=0,3+0,2=0,5 Vjerovatnoća događaja A je jednaka p(A)=0,5. 5.2.3. Teoreme vjerovatnoće Prezentiraćemo nekoliko teorema vjerovatnoće koje se najčešće koriste i čije je poznavanje neophodno za analizu i istraživanje. 5.2.3.1. Teorema aditivnosti Primjenom teoreme aditivnosti definišemo vjerovatnoću nekompatibilnih i kompatibilnih događaja. •
Vjerovatnoća nekompatibilnih događaja
Vjerovatnoću da će se dogoditi ili događaj A ili događaj B, odnosno vjerovatnoću unije nekompatibilnih događaja, primjenom teoreme aditivnosti izražavamo sljedećom relacijom: Ako je A ∩ B = Ø tada je p ( A ∪ B ) = p ( A) + p (B ) •
(5.16)
Vjerovatnoća kompatibilnih događaja
Ako je A ∩ B ≠ Ø, tada vjerovatnoću unije kompatibilnih događaja A i B izražavamo sljedećom relacijom:
p ( A ∪ B ) = p ( A) + p (B ) − p ( A ∩ B )
(5.17)
U oba slučaja važi uslov da je vjerovatnoća realizacije skupa elementarnih događaja, dakle sigurnog događaja, jednaka jedinici, a vjerovatnoća nemogućeg događaja jednaka nuli: p(Ω ) = 1 , p(Ø) = 0 .
239
Statistika u ekonomiji i menadžmentu
5.2.3.2.Teorema multiplikativnosti Za nezavisne događaje A i B teorema multiplikativnosti izražava vjerovatnoću presjeka događaja A i B, kao proizvod vjerovatnoće događaja A i vjerovatnoće događaja B, sljedećom relacijom:
p ( A ∩ B ) = p ( A) ⋅ p (B )
(5.18)
5.2.3.3. Uslovna vjerovatnoća i nezavisnost slučajnih događaja
5.2.3.3.1. Uslovna vjerovatnoća Uslovna vjerovatnoća događaja B se definiše kao vjerovatnoća realizacije događaja B, znajući da je događaj A već realizovan i da je vjerovatnoća njegove realizacije različita od nule. Vjerovatnoća događaja B, uz uslov da se događaj A već realizovao, se označava p A (B ) ili p(B/A) i utvrđuje korištenjem sljedećeg izraza:
p( A ∩ B ) (5.19) p ( A) Na analogan način se definiše i uslovna vjerovatnoća događaja A: p(A/B) p (B / A) =
p( A / B ) =
p( A ∩ B ) p( B )
(5.20)
5.2.3.3.2. Vjerovatnoća presjeka događaja A i B Vjerovatnoća presjeka događaja A i B, p ( A ∩ B ) se definiše polazeći od uslovne vjerovatnoće:
p (B / A) =
p( A ∩ B ) p ( A)
p ( A ∩ B ) = p (B / A) ⋅ p ( A)
p( A / B ) =
p( A ∩ B ) p (B )
p ( A ∩ B ) = p ( A / B ) ⋅ p (B )
240
(5.21) (5.22) (5.23) (5.24)
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Vjerovatnoća presjeka događaja je jednaka proizvodu vjerovatnoće jednog od ta dva događaja i uslovne vjerovatnoće drugog događaja, pod uslovom da se prvi događaj realizovao:
p ( A ∩ B ) = p ( B / A ) ⋅ p ( A ) = p ( A / B ) ⋅ p (B )
(5.25)
5.2.3.3.3. Nezavisnost slučajnih događaja Nezavisnost događaja se može definisati na dva načina. • Događaj A je nezavisan od događaja B ako vjerovatnoća realizacije događaja A ne zavisi od vjerovatnoće realizacije događaja B:
p ( A / B ) = p ( A)
•
(5.26)
Vjerovatnoća realizacije događaja B ne utiče na vjerovatnoću realizacije događaja A. Druga definicija slijedi iz teoreme multiplikativnosti i prema ovoj definiciji dva događaja A i B su nezavisni u odnosu na vjerovatnoću p ako je zadovoljen sljedeći izraz:
p ( A ∩ B ) = p ( A) ⋅ p (B )
(5.27)
Dvije analizirane definicije su ekvivalentne. Druga ima praktičnu prednost jer je simetrična u odnosu na događaje A i B. 5.2.3.4. Bayesova teorema Bayesova teorema daje odgovor na pitanje: «Ako se realizovao neki događaj koji može biti rezultat (posljedica) dva ili više uzroka, kolika je vjerovatnoća da se on realizovao upravo kao posljedica jednog konkretnog uzroka?» U ovom slučaju se ispituje vjerovatnoća uzroka zbog toga što se traži uzrok dešavanja događaja. Za svaki događaj B čija je vjerovatnoća pozitivna i za kompletan sistem događaja Ai , i = 1, n čija je vjerovatnoća pozitivna dobijamo za svako i:
p ( Ai / B ) =
p (B / Ai ) ⋅ p ( Ai ) n
∑ p (B / A ) ⋅ p ( A ) k =1
k
(5.28)
k
241
Statistika u ekonomiji i menadžmentu
Dokaz:
p( Ai ∩ B ) p(B / Ai ) ⋅ p( Ai ) = p (B ) p (B ) n n ⎛ ⎞ B = B ∩ Ω = B ∩ ⎜⎜ ∪ Ak ⎟⎟ = ∪ (B ∩ Ak ) ⎝ k =1 ⎠ k =1 p( Ai / B ) =
Događaji B ∩ Ak su Zaključujemo da je:
nekompatibilni
jer
su
Ak
nekompatibilni.
n
p(B ) = ∑ p(B ∩ Ak ) k =1
p(B ) = p(B ∩ A1 ) + p(B ∩ A2 ) + .... + p(B ∩ Ak )
p ( B ) = p ( B / A1 ) ⋅ p ( A1 ) + p ( B / A2 ) ⋅ p ( A2 ) + ... n
... + p ( B / An ) ⋅ p ( An ) = ∑ p ( B / Ak ) ⋅ p ( Ak ) k =1
n
p(B ) = ∑ p(B / Ak ) ⋅ p( Ak )
(5.29)
k =1
Primjenu Bayesove teoreme ćemo ilustrovati na sljedećem primjeru.
Primjer 5.2. Tri fabrike A, B i C snabdijevaju respektivno sa 30%, 20% i 40% keramičkih pločica građevinsko preduzeće. U njihovim isporukama ima respektivno 6%, 5% i 3% neupotrebljivih pločica. Jedna pločica slučajno izabrana u stoku je neupotrebljiva. Koja je vjerovatnoća da ova pločica dolazi iz fabrike C? Da bismo izračunali traženu vjerovatnoću definisaćemo događaje i formalizirati poznate informacije. Događaj A: pločica potiče iz fabrike A, događaj B: pločica potiče iz fabrike B, događaj C: pločica potiče iz fabrike C i događaj D: pločica je neispravna. Poznate vjerovatnoće su:
242
p ( A) = 0,30
p(B ) = 0,20
p (C ) = 0,40
p (D / A) = 0,06
p (D / B ) = 0,05
p (D / C ) = 0,03
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Traženu vjerovatnoću da slučajno izabrana neispravna pločica dolazi iz fabrike C označavamo sa p (C / D ) i izražavamo sljedećom relacijom:
p(C / D ) =
p(C ∩ D ) p(D / C ) ⋅ p(C ) =p p (D ) p (D )
Da bi se izračunala vjerovatnoća p (D ) potrebno je definisati kompletan sistem događaja (KSD) «mogućih izvora» neispravne pločice.
KSD = {A, B, C } A∪ B ∪C = Ω Događaji A,B i C su nekompatibilni:
A ∩ B = Ø; A ∩ C = Ø; B ∩ C = Ø Određujemo skup događaja D:
D = D∩Ω D = D ∩ (A ∪ B ∪ C )
D = (D ∩ A) ∪ (D ∩ B ) ∪ (D ∩ C ) Ova tri događaja su međusobno nekompatibilna. To ćemo pokazati za dva od njih: (D ∩ A ) ∩ (D ∩ B ) = D ∩ A ∩ D ∩ B
= D ∩ D ∩ A∩ B = D ∩ (A ∩ B) = D ∩ (Ø) = Ø Vjerovatnoća događaja D je jednaka: p ( D ) = p ( D ∩ A) + p (D ∩ B ) + p ( D ∩ C )
p(D ) = p(D / A) ⋅ p( A) + p(D / B ) ⋅ p(B ) + p(D / C ) ⋅ p(C )
odakle slijedi:
p(C / D ) = p(C / D ) =
p (D / C ) ⋅ p(C ) p (D )
p(D / C ) ⋅ p(C ) p (D / A ) ⋅ p ( A ) + p ( D / B ) ⋅ p ( B ) + p (D / C ) ⋅ p ( D ) 243
Statistika u ekonomiji i menadžmentu
Kada zamijenimo numeričke podatke u gornju relaciju dobijamo traženu vjerovatnoću p(C / D ) = 30% . Zaključujemo da je vjerovatnoća da slučajno izabrana neispravna pločica potiče iz fabrike C jednaka 30%. Vjerovatnoće da slučajno izabrana neispravna pločica potiče iz fabrike A i iz fabrike B su 45% i 25% respektivno: p( A / D) = 45% i p( B / D) = 25% . 5.2.4. Kombinatorika Kombinatorika podrazumijeva skup mogućih rasporeda i grupacija određenog broja elemenata. Pošto definicije vjerovatnoće podrazumijevaju poznavanje broja mogućih i broja povoljnih ishoda realizacije slučajnog eksperimenta, za njihovo utvrđivanje koristimo metode kombinatorike. 5.2.4.1. Permutacije Izvršiti permutaciju n elemenata nekog skupa znači rasporediti elemente na sve moguće načine. Zavisno od toga da li se neki elementi ponavljaju ili ne, razlikujemo: • Permutacije bez ponavljanja:
•
P = n! Permutacije sa ponavljanjem:
Pn1 ,n2 ...nk (n ) = gdje je
k
∑n i =1
i
n! n1!⋅n2 !...nk !
(5.30)
(5.31)
=n
5.2.4.2. Kombinacije Kombinacija predstavlja svaki podskup od k elemenata skupa od n elemenata i može biti bez ponavljanja i sa ponavljanjem. • Kombinacije bez ponavljanja:
⎛n⎞ n! Ckn = ⎜⎜ ⎟⎟ = ⎝ k ⎠ k!(n − k )! 244
(5.32)
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
•
Kombinacije sa ponavljanjem:
⎛ n + k − 1⎞ (n + k − 1)! ⎟⎟ = C kn+ k −1 = ⎜⎜ ⎝ k ⎠ k!(n − 1)
(5.33)
5.2.4.3. Varijacije Varijacije predstavljaju permutacije podskupova od k elemenata uzetih istovremeno iz skupa od n elemenata. • Varijacije bez ponavljanja:
Vkn = •
n! (n − k )!
(5.34)
Varijacije sa ponavljanjem:
Vkn = n k
(5.35)
5.2.5. Slučajna ili stohastička varijabla Ako je ε stohastički eksperiment i Ω skup svih mogućih rezultata (ishoda) tog eksperimenta tada se svaka aplikacija (X) koja svakom elementarnom događaju ωi od Ω pridružuje jednu vrijednost naziva slučajna (stohastička, aleatorna) varijabla. Vrijednosti koje može uzeti ova stohastička varijabla nazivaju se realizacijama eksperimenta ( xi ). Skup svih tih vrijednosti naziva se skup realizacija eksperimenta i označava se sa X (Ω ). Slučajne varijable se mogu podijeliti na osnovu toga da li uzimaju samo izolovane vrijednosti u nekom intervalu ili sve moguće vrijednosti iz tog intervala. Prema ovom kriteriju, slučajne varijable se dijele na prekidne i neprekidne. Slučajna varijabla je prekidna ili diskretna ukoliko može uzeti prebrojivo mnogo vrijednosti, odnosno konačan broj izolovanih vrijednosti koje se mogu prebrojati skupom cijelih nenegativnih brojeva. Slučajna varijabla je neprekidna ili kontinuirana ako može uzeti bilo koju vrijednost iz posmatranog intervala. Vrijednosti ove varijable su rezultat mjerenja. Varijable čije vrijednosti se dobijaju mjerenjem su po svojoj prirodi kontinuirane. 245
Statistika u ekonomiji i menadžmentu
5.2.5.1. Prekidna slučajna varijabla Ako slučajna varijabla X uzima diskretne vrijednosti x1 , x2 ,..., xi ,..., xn iz skupa mogućih rezultata sa vjerovatnoćama p ( x1 ), p ( x2 ),..., p ( xi ),..., p( xn ), skup čiji su elementi uređeni parovi
{xi , p(xi )},
i = 1,2,..., n
(5.36)
predstavlja distribuciju (zakon, raspored) vjerovatnoće slučajne varijable X. Svaka distribucija vjerovatnoće prekidne slučajne varijable zadovoljava sljedeće uslove:
p( xi ) ≥ 0, i = 1,2,..., n (5.37)
n
∑ p(x ) = 1 i =1
i
Zakon vjerovatnoće prekidne slučajne varijable se može napisati i u sljedećim oblicima:
⎛ x1 D ( X ) : ⎜⎜ ⎝ p1
x2
.
.
xi .
.
p2 .
.
pi
.
.
xn ⎞ ⎟ pn ⎟⎠
(5.38)
ili
⎛ xi D ( X ) : ⎜⎜ ⎝ pi
⎞ ⎟⎟, i = 1,...., n ⎠
(5.39)
Distribucija prekidne varijable X je definisana skupom realizacija X(Ω) i vjerovatnoćom svake realizacije. Grafički prikaz slučajne prekidne varijable se predstavlja dijagramom sa stupcima.
•
Kumulativne vjerovatnoće i funkcija distribucije prekidne slučajne varijable X
Kumulativna distribucija vjerovatnoće slučajne prekidne varijable je jednaka:
F ( xi ) = P[X ≤ xi ] =
∑ p(x )
x ≤ xi
i
(5.40)
i pomoću nje se određuje funkcija distribucije (zakona, rasporeda) prekidne slučajne varijable X. Funkcija distribucije (zakona, rasporeda) prekidne slučajne varijable je definisana kao vjerovatnoća za koju X uzima 246
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
vrijednosti manje ili jednake od nekog realnog broja x. Ovu funkciju formalizujemo na sljedeći način: F ( x) = P ( X ≤ x) =
j
∑p, i
i =1
x j ≤ x < x j +1 , j = 1, n − 1
⎧0 ako je x < x1 ⎫ ⎪ ⎪ j ⎪ ⎪ F ( x ) = ⎨∑ pi , ako je x j ≤ x < x j +1 , j = 1, n − 1⎬ ⎪ ⎪ i =1 ⎪⎩1, ako je x ≥ x n ⎪⎭ F ( −∞ ) = 0, F ( ∞ ) = 1 . F (− ∞ ) = P ( x ≤ −∞ ) = 0
nemogućeg događaja, a F (+ ∞ ) = P( x ≤ +∞ ) = 1 događaja koja je uvijek jednaka jedinici.
(5.41)
se odnosi na vjerovatnoću je vjerovatnoća sigurnog
Vjerovatnoću da će se prekidna slučajna varijabla naći u intervalu (a,b) utvrđujemo sljedećim izrazom:
P (a ≤ X < b ) = F (b ) − F (a ) =
∑p
a ≤ xi
i
(5.42)
5.2.5.1.1. Očekivana vrijednost i varijansa Svaku prekidnu slučajnu varijablu karakterišu njeni parametri. To su očekivana vrijednost i varijansa prekidne slučajne varijable. Očekivana vrijednost (aritmetička sredina ili matematička nada) prekidne slučajne varijable X je jednaka:
E ( X ) = p1 x1 + p2 x2 + ... + pn xn = ∑ pi xi
(5.43)
i
•
Osobine očekivane vrijednosti su aditivnost i linearnost. Ove osobine izražavamo sljedećim relacijama:
E ( X + b) = E ( X ) + b E (aX ) = a ⋅ E ( X )
(5.44)
odnosno
E (aX + b ) = a ⋅ E ( X ) + b
(5.45) 247
Statistika u ekonomiji i menadžmentu
E ( X + Y ) = E ( X ) + E (Y ) •
(5.46)
Očekivana vrijednost odstupanja varijable X od njene očekivane vrijednosti je jednaka nuli:
E [x − E ( X )] = 0 , odnosno
∑ p (x i
i
− E ( X )) = 0
(5.47)
i
•
Varijansa prekidne slučajne varijable po definiciji je jednaka:
σ 2 = E [X − E ( X )]2
(5.48)
Iz izraza (5.48) izvodimo izraz za varijansu razvijena oblika.
{ } E (X ) − 2 E ( X ) ⋅ E ( X ) + [E ( X )] E (X ) − 2[E ( X )] + [E ( X )] = E (X ) − E ( X ) σ = E [X ] − [E ( X )] E X 2 − 2 XE ( X ) + [E ( X )]
2
2
2
2
2
2 x
2
2
2
2
(5.49)
U mnogim slučajevima varijansu je jednostavnije izračunati korištenjem razvijenog oblika, odnosno izraza (5.49).
Primjer 5.3. Za distribuciju vjerovatnoće prekidne slučajne varijable X date sljedećim izrazom:
⎛1 D( X ) : ⎜⎜ ⎝ 0,2
2 0,3
3 4 0,1 0,2
5 ⎞ ⎟ 0,2 ⎟⎠
utvrditi funkciju distribucije (kumulativnu distribuciju) i grafički predstaviti distribuciju prekidne slučajne varijable X i funkciju distribucije prekidne slučajne varijable X. Za posmatranu distribuciju kompletiramo i kumulativnu distribuciju: ⎧0, ako je x < 1 ⎫ ⎪ j ⎪ ⎪ ⎪ F ( x ) = ⎨∑ pi ako je 1 ≤ x < 5⎬ = {0 0,2 0,5 0,6 0,8 1,0} ⎪ i =1 ⎪ ⎪1, ako je x ≥ 5 ⎪ ⎩ ⎭ 248
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Distribucija (zakon, raspored) prekidne slučajne varijable i njoj odgovarajujuća funkcija distribucije su predstavljeni na sljedećim grafikonima. p( x ) 0,4
0,3
0,2
0,1
0
1
2
Grafikon 5.5.
3
4
5
x
Distribucija prekidne slučajne varijable
F ( x) 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0
1
2
3
4
5
6
x Grafikon 5.6.
Funkcija distribucije prekidne slučajne varijable
249
Statistika u ekonomiji i menadžmentu
5.2.5.2. Neprekidna slučajna varijabla Slučajna varijabla je neprekidna ili kontinuirana ako može uzeti bilo koju vrijednost iz posmatranog intervala. Vrijednosti ove varijable su rezultat mjerenja. Varijable čije vrijednosti se dobijaju mjerenjem po svojoj prirodi su kontinuirane. Da bi se odredila distribucija (zakon, raspored) vjerovatnoće neprekidne slučajne varijable potrebno je definisati: 1. Skup svih realizacija X (Ω ) slučajne neprekidne varijable. Slučajna varijabla je neprekidna ako može uzeti bilo koju vrijednost iz posmatranog skupa realizacija X (Ω ) .
2. Funkciju gustine vjerovatnoće f ( x ) koja treba biti nenegativna za svako x: f ( x ) ≥ 0 , ∀ x . Prema definiciji ukupna površina ispod krive gustine vjerovatnoće je jednaka jedinici. ∞
∫ f (x )dx = 1
(5.50)
−∞
3. Funkcija distribucije vjerovatnoće je definisana sljedećim izrazom:
F (x = a ) =
a
∫ f (x )dx
(5.51)
−∞
F (a ) = p[X ≤ a ] = p[− ∞ < X ≤ a ] i jednaka je površini ispod krive u intervalu [− ∞; a ]. Ukupna površina ispod krive f(x) je jednaka jedinici pošto se radi o vjerovatnoći sigurnog događaja:
p[− ∞ < X < +∞ ] = 1 Za slučajnu neprekidnu varijablu sve vjerovatnoće u tačci su jednake nuli:
P ( x = a ) = 0, ∀a Posljedice ove osobine su sljedeće:
P[a ≤ X ≤ b] = P[a < X < b] = P[a ≤ X < b] = P[a < X ≤ b] Na sljedećim grafikonima smo prezentovali nekoliko slučajeva izračunavanja vjerovatnoće. Ukupna površina ispod krive gustoće vjerovatnoće je jednaka 1. 250
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Na grafikonu 5.7. traženu vjerovatnoću izračunavamo na sljedeći način:
p[a ≤ x ≤ b] = p[x ≤ b] − p[x ≤ a ] = F (b) − F (a ) f (x)
a G rafikon 5.7.
x
b Vjerovatnoca u intervalu:
p [a ≤ x ≤ b ]
Vjerovatnoća predstavljena na grafikonu 5.8. je jednaka:
p[− ∞ < x ≤ b] = p[x ≤ b] = F (b) f ( x)
b Grafikon 5.8.
x
Vjerovatnoća u intervalu:
p [ −∞ ≤ x ≤ b ]
251
Statistika u ekonomiji i menadžmentu
Vjerovatnoća na grafikonu 5.9. je jednaka p ([x ≥ b ] = 1 − p[x ≤ b ]= 1 − F (b)
f ( x)
b Grafikon 5.9.
x
Vjerovatnoća
p[ x ≥ b]
5.2.5.2.1. Očekivana vrijednost i varijansa slučajne neprekidne varijable Očekivana vrijednost i varijansa slučajne neprekidne varijable su definisane sljedećim izrazima: +∞
E ( X ) = μ = ∫ f ( x ) ⋅ x ⋅ dx
(5.52)
−∞
+∞
2
(x − μ ) f (x ) −∞
σ2 =∫
dx,
μ = E(X )
(5.53)
5.2.6. Čebiševa teorema Za prekidnu i kontiniranu slučajnu varijablu X čija je očekivana vrijednost µ, standardna devijacija σ i k realan striktno pozitivan broj, vrijedi sljedeća relacija: 1 p[μ − kσ < X < μ + kσ ] ≥ 1 − 2 (5.54) k koja izražava vjerovatnoću da će se slučajna varijabla X udaljavati od svoje aritmetičke sredine za k puta standardna devijacija. Vjerovatnoća da će se 252
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
slučajna varijabla X nalaziti u intervalu
[μ ± kσ ]
će biti najmanje
1 ⎞ ⎛ ⎜1 − 2 ⎟% . ⎝ k ⎠ 5.2.7. Prekidne distribucije (zakoni, rasporedi) vjerovatnoće Od prekidnih distribucija vjerovatnoće mi ćemo analizirati: uniformnu, Bernoullijevu, binomnu, Poissonovu i hipergeometrijsku distribuciju vjerovatnoće. 5.2.7.1. Uniformni zakon vjerovatnoće Da bismo definisali uniformni zakon vjerovatnoće treba da budu ispunjeni sljedeći uslovi: • Populacija sastavljena od jedinica označenih brojevima od 1 do n od kojih svaka ima jednaku vjerovatnoću da bude izabrana. • Realizacijom slučajnog eksperimenta slučajno se odabire jedna jedinica iz posmatrane populacije. X je slučajna varijabla jednaka broju jedinice koja je izabrana. • Skup realizacija i vjerovatnoća svake realizacije su formalizirani sljedećim izrazima. Skup realizacija je X (Ω ) = {1,2,..., n} . 1 Vjerovatnoća svake realizacije p ( X = xi ) = i zbir vjerovatnoća: n ∑ p ( xi ) = 1 . Slučajna varijabla je raspoređena prema prekidnoj unifomnoj distribuciji ako sve realizacije x varijable X imaju jednaku vjerovatnoću u intervalu [1, n].
X ~U [1, n ]
{(x, px ),
x = 1,..., n}, gdje je px =
1 n
(5.55)
Očekivana vrijednost i varijansa prekidne uniformne distribucije je data sljedećim izrazima:
E(X ) =
n +1 n2 − 1 ; σ2 = 2 12
(5.56) 253
Statistika u ekonomiji i menadžmentu
Primjer 5.4.
⎛1 D( X ) : ⎜⎜ ⎝1 / 5
2 1/5
3 4 5 ⎞ ⎟ 1/5 1/5 1/5 ⎟⎠
X ~ U [1, 5] Izračunati očekivanu vrijednost i varijansu prekidne uniformne distribucije i grafički predstaviti prekidnu uniformnu distribuciju i funkciju prekidne uniformne distribucije. Očekivana vrijednost i varijansa prekidne uniformne distribucije su
n +1 =3 2 n 2 − 1 24 σ2 = = 12 12 E(X ) =
Funkcija kumulativne prekidne uniformne distribucije je
F ( x) = {0;0,20; 0,40; 0,60; 0,80; 1 } Na sljedećim grafikonima su predstavljene prekidna uniformna distribucija i kumulativna funkcija vjerovatnoće prekidne uniformne distribucije. p( x ) 0,25 0,20 0,15 0,10 0,05 0
Grafikon 5.10.
254
1
2
3 Uniformna distribucija
4
5
x
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
f ( x) 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0
1
2
Grafikon 5.11.
3
4
5
x
6
Funkcija uniformne distribucije vjerovatnoće
5.2.7.2. Bernoullijeva distribucija vjerovatnoće Posmatrajmo slučajni eksperiment koji može imati samo dva rezultata (ishoda) koji se mogu označiti kao «uspjeh» i «neuspjeh». To je alternativna situacija čiji ishodi su komplementarni i zbir njihovih vjerovatnoća je jednak jedinici. X je slučajna prekidna varijabla indikator događaja. X uzima vrijednost 1 ako je ishod «uspjeh» i vjerovatnoća ishoda «uspjeh» je jednaka p. X uzima vrijednost 0 ako je ishod neuspjeh i odgovarajuća vjerovatnoća je jednaka q = (1- p) . Distribucija (zakon, raspored) vjerovatnoće slučajne varijable X je jednak:
⎛0 D( X ) : ⎜ ⎝ 1- p
1⎞ ⎟ p⎠
(5.57)
U prvom redu su vrijednosti xi, a u drugom odgovarajuće vjerovatnoće. Kumulativna distribucija je jednaka:
F ( x = 0) = (1 − p)
F ( x ≤ 1) = (1 − p ) + p = 1
(5.58)
Ukoliko su zadovoljeni gore navedeni uslovi, slučajna varijabla X slijedi Bernoullijev zakon vjerovatnoće koji zavisi od parametra p, koji predstavlja vjerovatnoću realizacije ishoda «uspjeh».
X ~ Bernoulli (p ) 255
Statistika u ekonomiji i menadžmentu
Očekivana vrijednost i varijansa Bernoullijevog zakona vjerovatnoće
•
Očekivana vrijednost Bernoullijevog zakona vjerovatnoće je jednaka p: 2
E ( X ) = ∑ xi pi = 0 ⋅ (1 − p ) + 1 ⋅ p = p
(5.59)
i =1
Varijansa ovog zakona vjerovatnoće je jednaka:
σ x2 = p(1 − p ) = p ⋅ q
(5.60)
Varijansa se dobija na sljedeći način:
σ x2 = E (x 2 ) − [E ( x )]2
( )
2
E x 2 = ∑ xi2 pi = 0 ⋅ (1 − p) + 1⋅ p = p
[E (x )]
2
i =1
= p2
σ x2 = p − p 2 = p(1 − p ) Bernoullijeva distribucija vjerovatnoće i kumulativna vjerovatnoće su predstavljene na grafikonu 5.12.
distribucija
1
p
1-p
1-p
0
1
x
Bernoullijeva distribucija vjerovatnoće Grafikon 5.12.
256
0
1
x
Funkcija distribucije vjerovatnoće F ( x )
Bernoullijeva distribucija i funkcija distribucije
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Bernoullijev zakon vjerovatnoće je poseban slučaj gdje je zakon vjerovatnoće od X jednak zakonu vjerovatnoće od X 2 .
⎛ 0 X :⎜ ⎝1- p
1⎞ ⎟ i p⎠
⎛ 0 X 2 :⎜ ⎝ 1- p
1⎞ ⎟ p⎠
(5.61)
5.2.7.3. Binomna distribucija vjerovatnoće Ako ponavljamo n puta uzastopno (sukcesivno) slučajni eksperiment koji ima dva moguća ishoda (uspjeh i neuspjeh) pod uslovom da vjerovatnoća p ostaje nepromijenjena i da su ishodi eksperimenta nezavisni (izvlačenje se vrši sa ponavljanjem) dobijamo n Bernoullijevih varijabli. Tako dobijene Bernoullijeve varijable su međusobno nezavisne i raspoređene prema istoj distribuciji vjerovatnoće koja je funkcija vjerovatnoće p. X je prekidna slučajna varijabla jednaka broju ishoda koje smo označili kao uspjeh, a koje smo dobili ponavljanjem n identičnih i nezavisnih slučajnih eksperimenata. Slučajna prekidna varijabla X slijedi binomnu distribuciju vjerovatnoće i zavisi od parametra n i p što označavamo kao:
X ~ B(n, p )
(5.62)
Skup realizacija slučajne varijable X je:
X (Ω ) = {0,1,2,3,..., n} Vjerovatnoće realizacija predstavljaju članove razvijenog binoma:
⎛n⎞ n−k p ( X = k ) = ⎜⎜ ⎟⎟ ⋅ p k (1 − p ) , k = 0,..., n ⎝k ⎠ ⎛n⎞ n− x p ( x ) = ⎜⎜ ⎟⎟ ⋅ p x (1 − p ) , x = 0,1,..., n ⎝ x⎠ p ( X = k ) = Cnk ⋅ p k (1 − p ) p ( x ) = Cnx ⋅ p x (1 − p )
(5.63)
n−k
n− x
⎛n⎞ n! , Cnk = ⎜ ⎟ = ⎝ k ⎠ k !( n − k )!
k = 0,..., n
257
Statistika u ekonomiji i menadžmentu
Kumulativna distribucija vjerovatnoće je jednaka:
⎧0, ako je x < 0 ⎫ ⎪ j ⎪ ⎪ ⎪ k k n−k F ( x ) = ⎨∑ C n p q , ako je x j ≤ x < x j +1 , j = 1, n − 1⎬ ⎪ k =0 ⎪ ⎪⎩1, ako je x ≥ x n ⎪⎭
(5.64)
Osobine binomnog zakona možemo rezimirati na sljedeći način. Poznat je broj realizovanih eksperimenta (n). Svaki eksperiment je slučajan i nezavisan. U svakom eksperimentu su moguća dva ishoda: uspjeh ili neuspjeh. U svakom eksperimentu vjerovatnoća uspjeha i neuspjeha su konstantne. •
Očekivana vrijednost i varijansa binomne distribucije vjerovatnoće
Prekidna slučajna varijabla X koja se ponaša prema binomnoj distribuciji vjerovatnoće sa parametrima n i p je jednaka zbiru n slučajnih varijabli X i koje su nezavisne: n
X = ∑ Xi i =1
Ako sve nezavisne prekidne slučajne varijable Xi slijede Bernoullijevu distribuciju X i ~ Bernoulli ( p ) , očekivana vrijednost prekidne slučajne varijable X je jednaka
E( X ) = n ⋅ p
(5.65)
Ovu vrijednost dobijamo na sljedeći način:
⎛ n ⎞ n E ( X ) = E⎜ ∑ X i ⎟ = ∑ E ( X i ) ⎝ i =1 ⎠ i =1 Za svako i očekivana vrijednost je jednaka p: E ( X i ) = p . Slijedi n
E ( X ) = ∑ E ( X i ) = p + p + ... + p = n ⋅ p i =1
E( X ) = n ⋅ p
258
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Varijansa prekidne slučajne varijable X koja slijedi binomni zakon vjerovatnoće se definiše na sljedeći način:
⎛ n ⎞ σ = σ ⎜∑ Xi ⎟ ⎝ i =1 ⎠ 2 x
2
(5.66)
Pošto su n slučajnih varijabli X i nezavisne promjenom osobine aditivnosti varijanse dobijamo: n
σ x2 = ∑σ 2 ( X i ) i =1
Za svako Xi varijansa je jednaka σ 2 ( X i ) = p ⋅ (1 − p ) = p ⋅ q . Slijedi:
σ x2 = p(1 − p ) + p(1 − p ) + ... + p(1 − p ) = np(1 − p ) σ x2 = np(1 − p ) = n ⋅ p ⋅ q Očekivana vrijednost i varijansa prekidne slučajne varijable X koja slijedi binomni zakon vjerovatnoće sa parametrima n i p, X ~ B(n,p), su
E(X ) = n ⋅ p
σ x2 = np(1 − p )
(5.67)
U opštem slučaju binomna distribucija je asimetrična. Ako je p=q=0,5 binomna distribucija je simetrična. Ako je p<0,5 tada je distribucija pozitvno asimetrična, odnosno za p>0,5 negativno asimetrična. Izrazi za koeficijente asimetrije i spljoštenosti su: Koeficijent asimetrije je jednak
α3 =
q− p npq
(5.68)
Koeficijent spljoštenosti je
α4 = 3 +
1 − 6 pq npq
(5.69)
Koeficijent varijacije je jednak sljedećem izrazu:
259
Statistika u ekonomiji i menadžmentu
kv =
σ
E (x )
n⋅ p⋅q q ⋅100 = ⋅100 n⋅ p n⋅ p
⋅100 =
(5.70)
Binomnu distribuciju vjerovatnoće za n=6 i p=0,5 i funkciju vjerovatnoće predstavljamo na sljedećim grafikonima: p
F (x ) 1
0
1
2
3
4
5
6
0
x
1
2
3
4
5
6
x
Grafikon 5.13. Binomna distribucija vjerovatnoće B(6, 0,5) i funkcija distribucije vjerovatnoće
Grafički prikaz binomne distribucije za n=10 i p=0,10 je predstavljen na grafikonu 5.14. p(xi) 0,4
0,3
0,2
0,1
0
0
Grafikon 5.14.
260
1
2
3
4
5
Binomna distribucija za n =10 i p=0,1
10
xi
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Binomne distribucije za n=10 i p=0,5 je simetrična i predstavljena na grafikonu 5.15. p( xi ) 0,25 0,20 0,15 0,10 0,05 0
0
1
2
Grafikon 5.15.
3
4
5
6
7
8
9
10
xi
Binomna distribucija za n =10 i p=0,5
Binomna distribucija je tabelirana. Binomna distribucija vjerovatnoće je specijalan slučaj prekidnih distribucija vjerovatnoće koja ima vrlo široku primjenu. 5.2.7.4. Poissonova distribucija vjerovatnoće Kada slučajna prekidna varijabla X može uzimati kao vrijednosti nulu i sve pozitivne cijele brojeve X(Ω)=(0,1,2,…, + ∞) kojima odgovaraju vjerovatnoće date sljedećim izrazom:
p ( X = x ) = e −λ ⋅
λx x!
, e = 2,718, λ = n ⋅ p
(5.71)
tada je varijabla X raspoređena prema Poissonovom rasporedu koja je funkcija parametra λ = np > 0 , koji predstavlja prosječan broj javljanja događaja u vremenskoj ili prostornoj jedinici. X ~ P(λ )
(5.72)
Očekivana vrijednost i varijansa slučajne prekidne varijable koja se ponaša po ovoj distribuciji su jednake:
E ( X ) = μ = λ , σ x2 = λ
(5.73)
261
Statistika u ekonomiji i menadžmentu
Osobinu da je μ = σ x2 = λ ima samo Poissonov raspored, pa možemo reći da je svaki raspored u kome je izražena ta osobina Poissonov raspored. Koeficijent varijacije je:
kv =
σ
E (x )
⋅100 =
λ 1 ⋅100 = ⋅10 λ λ
(5.74)
Parametri simetričnosti i spljoštenosti su:
α3 =
1
λ
, α4 = 3 +
1
λ
(5.75)
Funkcija distribucije vjerovatnoće je jednaka:
⎧0, ako je x < 0 ⎪ F ( x ) = ⎨ j e −λ λk ⎪∑ k! , ako je j ≤ x < j + 1, za j cijeli prirodan broj ⎩ k =0
(5.76)
Poissonova distribucija je granični slučaj binomne distribucije. Ako je vjerovatnoća p vrlo mala i broj ponavljanja slučajnog eksperimenta n veliki tj.: p<0,1; n>50 binomna distrubicja se može aproksimirati Poissonovom distribucijom. Poissonova distribucija se naziva i distribucija malih vjerovatnoća ili distribucija rijetkih fenomena. Ova distribucija se najčešće primjenjuje u slučajevima kada je broj javljanja događaja nezavisan od vremenske ili prostorne jedinice, kada je vjerovatnoća javljanja događaja proporcionalna dužini vremena ili prostora i kada je vjerovatnoća istovremenog javljanja dva ili više događaja u maloj vremenskoj jedinici zanemarljiva. Ovaj model rasporeda ima veliku praktičnu primjenu, posebno u teoriji redova čekanja. Rekurzivna formula za jednostavnije izračunavanje vjerovatnoće je data sljedećim izrazom: p ( X = x) =
λ x
p( X = x − 1)
(5.77)
Pomoću ove formule se postepeno izračunavaju ostale vjerovatnoće ako se zna da je vjerovatnoća p(0) jednaka:
p( X = 0) = e − λ 262
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Ova distribucija je tabelirana. Poissonovu distribuciju vjerovatnoće smo predstavili na grafikonima 5.16. i 5.17. za razne vrijednosti parametara n i p, odnosno za razne vrijednosti parametra λ. p(xi) 0,4
0,3
0,2
0,1
0
0
1
2
3
4
5
10
xi
Poissonova distribucija za n =10 i p =0,1
Grafikon 5.16.
p(xi) 0,25 0,20 0,15 0,10 0,05 0
0
Grafikon 5.17.
1
2
3
4
5
6
7
8
9
10
30
xi
Poissonova distribucija za n =30 i p =0,1
Binomna distribucija se može aproksimirati Poissonovom ako su ispunjeni određeni uslovi. Na sljedećim grafikonima su za odabrane vrijednosti n i p predstavljene aproksimacije binomne Poissonovom distribucijom. Uslovi za aproksimaciju binomne distribucije Poissonovom su n ≥ 30 i p ≤ 0,10 . 263
Statistika u ekonomiji i menadžmentu
p(xi) 0,4 0,3
binomna distribucija
0,2
Poissonova distribucija
0,1 0
0
1
2
3
4
5
6
7
30
xi
Aproksimacija binomne Poissonovom distribucijom za vrijednosti n=30 i p=0,05
Grafikon 5.18.
p(xi) 0,30 0,25 binomna distribucija
0,20 0,15
Poissonova distribucija
0,10 0,05 0
0
Grafikon 5.19.
264
1
2
3
4
5
6
7
8
Aproksimacija binomne Poissonovom distribucijom za vrijednosti n=50 i p=0,05
50
xi
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
p(xi) 0,25 0,20
binomna distribucija
0,15 Poissonova distribucija
0,10 0,05 0
1
0
2
3
4
5
6
7
8
9
30
xi
Aproksimacija binomne Poissonovom distribucijom za vrijednosti n=30 i p=0,1
Grafikon 5.20.
p(xi) 0,4
0,3
binomna distribucija
0,2
Poissonova distribucija
0,1
0
0
1
Grafikon 5.21.
2
3
4
5
6
7
8
9
10
11
12
13
50
xi
Aproksimacija binomne Poissonovom distribucijom za vrijednosti n =50 i p=0,1
Na osnovu prezentiranih grafikona možemo konstatovati aproksimacija bolja ukoliko n raste, a vjerovatnoća p opada.
da
je
265
Statistika u ekonomiji i menadžmentu
5.2.7.5. Hipergeometrijska distribucija vjerovatnoće Hipergeometrijska distribucija vjerovatnoće H(N,n,p) je distribucija zbira n slučajnih Bernouillijevih zavisnih varijabli. Radi se dakle o izvlačenju bez ponavljanja. Broj povoljnih ishoda među n slučajnih sukcesivnih Bernouillijevih eksperimenata se kreće između max (0,n,N2) i min (n,N1). Ova slučajna varijabla ima istu očekivanu vrijednost kao binomna varijabla, ali je varijansa manja za odnos (N-n)/(N-1) koji se naziva faktor egzostivnosti. Označimo sa: N=N1+N2 broj elemenata skupa, N1 broj povoljnih ishoda ili broj elemenata skupa koji posjeduje traženo obilježje, N2=N-N1 broj nepovoljnih ishoda ili broj elemenata skupa koji ne posjeduju traženo obilježje i k broj povoljnih ishoda ili broj elemenata u uzorku koji posjeduju dato obilježje. Uz uslov da je n ≤ N , k ≤ N1 ≤ N , skup mogućih realizacija i vjerovatnoća svake od realizacija su dati sljedećim izrazima:
X (Ω ) = {max (0, n − N 2 ),..., min (n, N1 )}
⎛ N1 ⎞ ⎛ N 2 ⎞ ⎟ ⎜⎜ ⎟⎟ ⋅ ⎜⎜ k n −k k ⎠ ⎝ n − k ⎟⎠ C N1 ⋅ C N 2 ⎝ = p( X = k ) = C Nn ⎛N⎞ ⎜⎜ ⎟⎟ ⎝n ⎠
(5.78)
Očekivana vrijednost i varijansa su:
E(X ) = n ⋅
N1 ; N
σ2 = n
N1 N 2 N − n ⋅ ⋅ N N N −1
(5.79)
Ova distribucija se primjenjuje u rješavanju problema izbora uzoraka. Uzorak se može odabrati sa ponavljanjem i bez ponavljanja elemenata. Nezavisnost elemenata obezbjeđuju uzorci sa ponavljanjem. U slučajevima kada je populacija vrlo velika, ili kada je odnos (n/N<1/10), ova distribucija se može aproksimirati pomoću binomne distribucije. 5.2.7.6. Tabelarni pregled prekidnih distribucija U narednoj tabeli je prezentiran pregled analiziranih prekidnih distribucija i njima odgovarajućih očekivanih vrijednosti i varijansi.
266
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Tabela 5.1. Prekidne distribucije vjerovatnoće Prekidne distribucije Uniformna
X ~U [1, n ]
Bernoullijeva X~Bernoulli (p)
Distribucije vjerovatnoće
{(x, px ),
x = 1,...,n}, gdje je px =
⎛0 D( X ) : ⎜⎜ ⎝1 - p
E( X ) = p
p( x ) = Cnx ⋅ p x (1 − p )
Poissonova
p ( X = x ) = e−λ ⋅
(λ )
Hipergeometrijska H(N,n,p)
n− x
λx x!
Varijansa
n +1 1 n2 −1 2 E(X ) = = σ 2 n 12
1⎞ ⎟ p ⎟⎠
Binomna X ~ B(n,p) X~P
Očekivana vrijednost
, e = 2,718, λ = n ⋅ p
σ x2 = p(1 − p ) = p ⋅ q
E ( X ) = n ⋅ p σ x2 = np(1 − p ) E(X ) = μ = λ
σ x2 = λ
⎛ N1 ⎞ ⎛ N2 ⎞ ⎟ ⎜⎜ ⎟⎟ ⋅ ⎜⎜ N1 N 2 N − n N 2 k n−k k ⎠ ⎝ n − k ⎟⎠ CN1 ⋅ CN2 E ( X ) = n ⋅ 1 σ = n N ⋅ N ⋅ N − 1 ⎝ p( X = k ) = = N CNn ⎛N⎞ ⎜⎜ ⎟⎟ ⎝n ⎠
5.2.8. Neprekidne distribucije vjerovatnoće 5.2.8.1. Neprekidna uniformna distribucija Varijabla X ima neprekidnu uniformnu distribuciju u intervalu [a; b] ako je: 1.
X (Ω ) = [a; b ]
2. Funkcija gustoće vjerovatnoće f(x) definisana kao:
f (x ) = 0 ⎧ako x ∉ [a; b] ⎪ f (x ) = ⎨ 1 f (x ) = ⎪⎩ako x ∈ [a; b] b−a 3. Funkcija distribucije vjerovatnoće F ( x ) = P [ X ≤ x] = ∫
x
−∞
(5.80)
f ( x ) ⋅ dx
267
Statistika u ekonomiji i menadžmentu
⎧0, za x ≤ a ⎪x − a ⎪ za a ≤ x ≤ b F (x ) = ⎨ ⎪b − a ⎪⎩ 1, za x ≥ b
(5.81)
Ako slučajna prekidna varijabla slijedi uniformnu distribuciju X ~ U [a; b] tada su očekivana vrijednost i varijansa definisane sljedećim izrazima:
a+b E(X ) = 2
i
σ
2
2 ( b − a) =
(5.82)
12
Neprekidni uniformni zakon vjerovatnoće i njemu odgovarajuću funkciju zakona vjerovatnoće predstavljamo na sljedećim grafikonima: f (x) 1 b-a
a Grafikon 5.22.
b
x
Neprekidna uniformna distribucija vjerovatnoće
F(x) 1
a
Grafikon 5.23.
268
b
x
Funkcija neprekidne uniformne distribucije vjerovatnoće
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
5.2.8.2. Normalna distribucija vjerovatnoće ili Laplace-Gaussova distribucija Varijabla X ima Laplace-Gaussov zakon vjerovatnoće koji zavisi od parametra μ i σ 2 X ~ N μ , σ 2 ako su zadovoljeni sljedeći uslovi:
(
1.
)
X (Ω ) = R (skup realnih brojeva) tj. X ∈ (− ∞;+∞ )
2. Funkcija gustine vjerovatnoće f (x) je definisana za svako x: 1 ⎛ x−μ ⎞
2
− ⎜ ⎟ 1 f ( x) = e 2 ⎝ σ ⎠ , gdje je π = 3,14... i μ = E ( x ) σ 2π 3. Funkcija distribucije vjerovatnoće je jednaka:
1 F ( x) = σ 2π
x
∫e
1 ⎛ x−μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠
(5.83)
2
dx
(5.84)
−∞
(
)
Na grafikonu 5.24. je predstavljena kriva normalne distribucije N μ , σ 2 . f ( xi )
μ -3σ μ-2σ μ -σ Grafikon 5.24.
μ
μ +σ μ+2σ μ+3σ
xi
Normalna distribucija N ( μ ;σ 2 )
Normalna distribucija za n=10, aritmetičku sredinu μ=5, i varijansu σ2 =2,5 je prikazana na sljedećem grafikonu:
269
Statistika u ekonomiji i menadžmentu
f(xi) 0,30 0,25 0,20 0,15 0,10 0,05 0
0
1
2
3
4
5
6
7
8
9
10
xi
Normalna distribucija za n =10, μ = 5, σ = 2, 5 2
Grafikon 5.25.
Na grafikonu 5.26. su predstavljene dvije normalne distribucije sa različitim aritmetičkim sredinama i jednakom varijansom: N 1 = μ = 5, σ 2 = 4 i
(
(
)
)
N 2 = μ = 8, σ = 4 . Kriva normalne distribucije N2 sa većom aritmetičkom sredinom je pomjerena udesno u odnosu na krivu normalne distribucije N1. 2
f(xi)
0.25
N1
0.2
N2
(
N1 = μ = 5, σ 2 = 4
0.15
)
(
0.1
N 2 = μ = 8, σ 2 = 4
0.05
)
xi
0 -4
-2
0
2
4
6
8
10
12
14
16
18
Poređenje normalnih distribucija sa različitim aritmetičkim sredinama i jednakim varijansama
Grafikon 5.26.
Na grafikonu 5.27. su predstavljene dvije normalne distribucije sa jednakim aritmetičkim sredinama i različitim varijansama: N 1 = μ = 5, σ 2 = 4 i
(
)
(
)
N 2 = μ = 5, σ = 8 . Kriva normalne distribucije N1, čija je varijansa 270
2
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
manja, šiljastija je u odnosu na krivu N2 koja je spljoštenija jer je njena varijansa veća. Ukoliko su varijansa i standardna devijacija veće, kriva normalne distribucije je spljoštenija (šira) jer u tom slučaju podaci više odstupaju od aritmetičke sredine. f (xi)
0.25
N1
0.2
N2
(
N1 = μ = 5, σ 2 = 4
0.15
)
N 2 = (μ = 5, σ 2 = 8)
0.1 0.05 0
xi -4
-2
0
4
2
6
8
10
12
14
Poređenje normalnih distribucija sa jednakim aritmetičkim sredinama i različitim varijansama
Grafikon 5.27.
5.2.8.2.1. Standardizovana normalna distribucija Normalna distribucija se može svesti na standardizovanu normalnu distribuciju koja ima vrlo široku primjenu. Normalna distribucija se standardizuje ako se X linearno transformira X = μ + Zσ , tako da dobijemo standarizovanu varijablu Z sa parametrima μ = 0 i σ = 1.
(
Pretpostavimo da X~N μ ; σ 2 Z jednaka:
Z= Z=
1
σ
)
i da je slučajna standardizovana varijabla
X −μ
σ X−
μ σ
(5.85)
Z ima normalnu distribuciju čije parametre treba odrediti.
μ⎞ 1 μ μ μ ⎛1 E (Z ) = E ⎜ X − ⎟ = E ( X ) − = − = 0 σ⎠ σ σ σ σ ⎝σ
(5.86)
271
Statistika u ekonomiji i menadžmentu
Primjenjujući osobinu nelinearnosti varijanse dobijamo
μ⎞ 1 σ2 ⎛1 σ 2 (Z ) = σ 2 ⎜ X − ⎟ = 2 σ 2 ( X ) = 2 =1 σ⎠ σ σ ⎝σ
(
Ako je X ~ N μ ; σ 2
)
i Z=
X −μ
σ
(5.87)
, Z slijedi standardizovanu normalnu
distribuciju čija je aritmetička sredina jednaka nuli, a varijansa i standardna devijacija jedinici: Z~N(0,1) f(zi)
-3
-1
-2
0
1
2
3
zi
Standardizovana normalna distribucija N (0;1)
Grafikon 5.28.
Standardizovani oblik modela normalne distribucije je: 2
1 − z2 f (z) = e , 2π
+∞
∫ f ( z )dz = 1
(5.88)
−∞
Funkcija distribucije vjerovatnoće standardizovanog normalnog rasporeda je data sljedećim izrazom:
F ( z) =
z
∫
−∞
1 f ( z )dz = 2π
z
∫e
−
z2 2
dz
(5.89)
−∞
Aritmetička sredina standardizovane distribucije je jednaka nuli. Varijansa i standardna devijacija su jednake jedinici. Ova distribucija je simetrična u odnosu na nulu (tj. aritmetičku sredinu čija je vrijednost u ovom slučaju 272
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
jednaka nuli). Ova distribucija je tabelirana i odgovarajuće tablice se nalaze u prilogu. Na sljedećim grafikonima je ilustrovano određivanje površine ispod normalne krive, odnosno odgovarajuće gustine vjerovatnoće. Vjerovatnoća na grafikonu 5.29. je jednaka p ( z ≤ 1,25) = F (1,25) = 0,89435.
p [ z ≤ 1, 25]
-3
-1,25
Grafikon 5.29.
0
1,25
3
z
F (1,25)
Gustina vjerovatnoće koja je predstavljena na grafikonu 5.30. se određuje na sljedeći način:
F (−1, 25) = p ( z ≤ −1, 25) = p( z ≥ 1, 25) = 1 − p( z ≤ 1, 25) F (−1, 25) = 1 − F (1, 25)
F (−1,25) = 1 − 0,89435 = 0,10565
p [ z ≤ 1, 25]
-3 Grafikon 5.30.
-1,25
0
1,25
3
z
F (-1,25)
273
Statistika u ekonomiji i menadžmentu
5.2.8.2.2. Osobine normalne distribucije Najznačajnije osobine normalne distribucije su sljedeće: • Normalna distribucija je u potpunsti definisana očekivanom vrijednošću, odnosno aritmetičkom sredinom i varijansom X ~ N μ,σ 2 .
(
• • • •
•
• •
•
)
Kriva normalne distribucije ima zvonasti oblik, unimodalna je i simetrična je u odnosu na očekivanu vrijednost (aritmetičku sredinu). Aritmetička sredina, medijana i mod su jednaki. Relativna mjera asimetrije α3 je jednaka nuli. Vrijednost relativne mjere spljoštenosti α4 je jednaka tri. Spljoštenost normalne distribucije zavisi od veličine standardne devijacije. Normalna distribucija je spljoštenija ukoliko standardna devijacija ima veću vrijednost. Ukupna površina ispod krive je jednaka jedinici. Pošto je kriva normalne distribucije simetrična, 50% površine se nalazi lijevo i 50% površine desno od aritmetičke sredine. Površina ispod normalne krive je jednaka gustini vjerovatnoće. Vjerovatnoća da neprekidna varijabla X uzme vrijednost veću (ili manju) od aritmetičke sredine jednaka je 50%. Normalna distribucija posjeduje osobine linearnosti i aditivnosti. Linearnost normalne distribucije Ako je slučajna neprekidna varijabla X raspoređena prema normalnoj distribuciji, tada je i varijabla Y =aX+b raspoređena prema normalnoj distribuciji. Aditivnost normalne distribucije
Ako X~N i Y~N, i ako su X i Y nezavisne varijable, tada varijabla S=X+Y ima normalnu distribuciju sa parametrima E(S) i varijansu od S koji se izračunavaju koristeći analizirane osobine ova dva parametra.
(
)
(
X ~ N μ1 , σ 12 , Y ~ N μ2 , σ 22
[( )( S = ( X − Y ) ~ N [(μ − μ ); (σ
)
)] )]
S = ( X + Y ) ~ N μ1 + μ 2 ; σ 12 + σ 12 1
274
2
2 1
+ σ 12
(5.90)
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Primjer 5.5. X ~ N(12;3) i Y=4X+6 Treba odrediti očekivanu vrijednost i varijansu slučajne varijable Y: Y ~ N(E(Y);σy2). E(Y)=E(4X+6)=4E(X)+6= 4 ⋅ 12 + 6 = 54 . Koristeći nelinearnost varijanse dobijamo σy2= 48.
σ Y2 = σ 2 (4 X + 6) = 16 ⋅ σ X2 = 16 ⋅ 3 = 48 Y ~ N (54;48) 5.2.8.2.3. Karakteristični intervali normalne distribucije Pretpostavimo da X~N ( μ ; σ 2 ) i odredimo vjerovatnoću da se slučajna varijabla nalazi u intervalu p[μ − kσ ≤ X ≤ μ + kσ ] .
μ − 3⋅σ Grafikon 5.31.
μ − k ⋅σ
μ
μ + k ⋅σ
μ + 3⋅σ
x
Vjerovatnoća p [ μ − k ⋅ σ ≤ X ≤ μ + k ⋅ σ ]
Koristićemo standardizovanu varijablu Z =
X −μ
σ
. Slučajna varijabla Z se
ponaša po standardizovanom normalnom rasporedu Z ~ N (0;1) , pa slijedi:
⎡ μ − kσ − μ X − μ μ + kσ − μ ⎤ p⎢ ≤ ≤ ⎥⎦ σ σ σ ⎣ p[− k ≤ Z ≤ k ]
(5.91) 275
Statistika u ekonomiji i menadžmentu
Odredimo vjerovatnoću da će se slučajna varijabla Z nalaziti u intervalu (-k;k).
2F ( k ) − 1
-3
−k
Grafikon 5.32.
0 Vjerovatnoća
k
3
z
p [−k ≤ Z ≤ k ]
Vjerovatnoća da će se slučajna varijabla Z nalaziti u intervalu (-k;k) je jednaka:
p[− k ≤ Z ≤ k ] = F (k ) − F (− k ) = F (k ) − [1 − F (k )] p[− k ≤ Z ≤ k ] = 2 F (k ) − 1 p[μ − kσ ≤ X ≤ μ + kσ ] = 2 F (k ) − 1
(5.92)
Za različite vrijednosti od k dobijamo sljedeće intervale:
•
k =1
F (1) = 0,8413
p[μ − σ ≤ X ≤ μ + σ ] = 0,6826 •
k=2
F (2 ) = 0,9772
p[μ − 2σ ≤ X ≤ μ + 2σ ] = 0,9544 •
k =3
F (3) = 0,99865
p[μ − 3σ ≤ X ≤ μ + 3σ ] = 0,9973 Ukoliko zaokružimo dobijene vrijednosti možemo napisati tri karakteristična intervala standardizovane normalne distribucije. Vjerovatnoća da slučajna varijabla X odstupa od aritmetičke sredine za
276
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
jednu standardnu devijaciju je 68,3%, za dvije standardne devijacije je 95,4% i za tri 99,7%.
p[μ − σ ≤ X ≤ μ + σ ] = 68,3% p[μ − 2σ ≤ X ≤ μ + 2σ ] = 95,4% p[μ − 3σ ≤ X ≤ μ + 3σ ] = 99,7% Definisani intervali su predstavljeni na grafikonu 5.33. f (xi)
68,3% 95,4% 99,7%
μ -3σ μ -2σ μ-σ Grafikon 5.33.
μ
μ +σ μ +2σ μ +3σ
xi
Karakteristični intervali normalne distribucije
Za slučajnu varijablu raspoređenu po standardizovanoj normalnoj distribuciji vrijedi sljedeća relacija X ~N (0;1) . Aritmetička sredina ovog rasporeda je jednaka nuli, a varijansa i standardna devijacija jedinici. U tom slučaju karakteristični intervali su:
p[− 1 ≤ X ≤ 1] = 68,3% p[− 2 ≤ X ≤ 2] = 95,4% p[− 3 ≤ X ≤ 3] = 99,7% Prikaz karakterističnih intervala za standardizovanu normalnu distribuciju je predstavljen na grafikonu 5.34.
277
Statistika u ekonomiji i menadžmentu
f (zi)
68,3% 95,4% 99,7%
-3 Grafikon 5.34.
-2
-1
0
1
2
3
zi
Karakteristicni intervali standardizovane normalne distribucije
5.2.8.2.4. Vjerovatnoće normalne distribucije Za jednostavnije izračunavanje vjerovatnoće korištenjem tablica standardizovane normalne distribucije navodimo nekoliko najčešćih odnosa za svako i < j:
p (z i ≤ Z ≤ z j ) = p (Z ≤ z j ) − p (Z ≤ z j ) = F (z j ) − F ( z i ) p (Z ≥ z j ) = 1 − p (Z ≤ z j ) = 1 − F (z j )
(5.93)
p(Z ≤ − z j ) = p(Z ≥ z j ) = 1 − p(Z ≤ z j ) = 1 − F (z j ) p(Z ≥ − z j ) = p(Z ≤ z j ) = F (z j )
p(− z j ≤ Z ≤ z j ) = p(Z ≤ z j ) − p(Z ≤ − z j ) = F (z j ) − 1 + F ( z i ) = 2F (z j ) − 1
Normalna distribucija vjerovatnoće predstavlja najznačajniju distribuciju vjerovatnoće zbog toga što: • veliki broj pojava ima približno normalan raspored; • normalnim rasporedom se mogu aproksimirati prekidni rasporedi uz odgovarajuće uslove; • iz normalnog rasporeda se izvode drugi neprekidni rasporedi; • normalni raspored predstavlja osnovu za parametarsko zaključivanje.
278
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
5.2.8.3. Aproksimacije distribucija vjerovatnoće Aproksimaciju binomne distribucije Poissonovom distribucijom smo analizirali u dijelu 5.2.7.4. Binomna i Poissonova distribucija vjerovatnoće se mogu, uz određene uslove, aproksimirati normalnom distribucijom vjerovatnoće. •
Aproksimacija binomne distribucije normalnom distribucijom vjerovatnoće
Uslovi za aproksimaciju binomne distribucije normalnom distribucijom su sljedeći: n ≥ 20, np ≥ 10, n(1 − p ) ≥ 10 . U prva dva slučaja (grafikoni 5.35. i 5.36.) uslovi aproksimacije nisu zadovoljeni i aproksimacija, kao što se uočava na grafikonima, nije zadovoljavajuća.
0,6 0,5
binomna distribucija
0,4 normalna distribucija
f(xi) 0,3 p(xi) 0,2 0,1 0
Grafikon 5.35.
0
1
2
3
4
10
xi
Aproksimacija binomne normalnom distribucijom za vrijednosti n=10 i p=0,05
279
Statistika u ekonomiji i menadžmentu
0,45 0,40 0,35
binomna distribucija
0,30
f(xi) p(xi)
0,25 normalna distribucija
0,20 0,15 0,10 0,05 0
0
Grafikon 5.36.
1
2
3
4
5
10
xi
Aproksimacija binomne normalnom distribucijom za vrijednosti n=10 i p=0,1
U druga dva slučaja predstavljena na grafikonima 5.37. i 5.38. uslovi aproksimacije su zadovoljeni i aproksimacija je prihvatljiva.
0,16 0,14
f(xi) p(xi)
binomna distribucija
0,12 0,1 0,08
normalna distribucija
0,06 0,04 0,02 0
xi 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Grafikon 5.37.
280
Aproksimacija binomne normalnom distribucijom za vrijednosti n=30 i p=0,05
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
0,12
f(xi) p(xi)
0,1
binomna distribucija
0,08 0,06
normalna distribucija
0,04 0,02 0
xi 0
2
4
6
Aproksimacija binomne normalnom distribucijom za vrijednosti n=50 i p=0,05
Grafikon 5.38.
•
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
Aproksimacija Poissonove distribucije normalnom distribucijom vjerovatnoće
Uslov za aproksimaciju Poissonove distribucije normalnom distribucijom vjerovatnoće je λ = n ⋅ p ≥ 15 . Na grafikonu 5.39. uslov za aproksimaciju nije zadovoljen, a na grafikonima 5.40. i 5.41. uslov za aproksimaciju je zadovoljen. 0,3 0,25
Poissonova distribucija
f(xi) p(xi) 0,2
normalna distribucija
0,15 0,1 0,05 0
0
Grafikon 5.39.
1
2
3
4
5
6
7
Aproksimacija Poissonove normalnom distribucijom za
8
9
xi
10
λ = np = 5
281
Statistika u ekonomiji i menadžmentu 0,16 0,14 0,12
f(xi) p(xi)
Poissonova distribucija
0,1 0,08
normalna distribucija
0,06 0,04 0,02 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
xi
Grafikon 5.40.
Aproksimacija Poissonove normalnom distribucijom za
λ = np = 15
0,12
f(xi) p(xi)
0,1
Poissonova distribucija
0,08 0,06
normalna distribucija
0,04 0,02 0
0
2
4
6
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50
Grafikon 5.41. Aproksimacija Poissonove normalnom distribucijom za
xi
λ = np = 25
Uslovi za aproksimaciju12 distribucija vjerovatnoće su predstavljeni u sljedećoj šemi:
12
J.J. Droesbeke: Elements de statistiques, Ellipses Paris et Editions de l'Universite libre de Bruxelles, Bruxelles, 1977, str. 262.
282
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
n ≤ 10% N H ( N , n, p )
B ( n, p )
⎧ n ≥ 30 ⎨ ⎩ p ≤ 0,10
P (λ )
⎧ n ≥ 20 ⎪ ⎨ np ≥ 10 ⎪ n(1 − p) ≥ 10 ⎩
⎧n ⎪ ≤ 10% ⎨N ⎪⎩ n ≥ 30
λ ≥ 15 N (μ ,σ )
Šema 5.1.
Uslovi za aproksimacije
( )
5.2.8.4. Hi-kvadrat χ 2 distribucija Posmatramo n slučajnih varijabli: X 1 , X 2 ,..., X n koje su nezavisne i svaka ima normalnu standardizovanu distribuciju. Ako je varijabla X jednaka zbiru kvadrata varijabli X i : n
X = ∑ X 12 + X 22 + ... + X n2
(5.94)
i =1
kažemo da varijabla X ima hi-kvadrat distribuciju sa n stepeni slobode:
X ~ χ n2 stepeni
slobode
(5.95)
Ova distribucija se primjenjuje kada analiziramo značajnost razlika stvarnih i teorijskih frekvencija, vrijednosti varijabli itd. Definiše se kao zbir kvadrata razlika između stvarnih i očekivanih vrijednosti prema očekivanim vrijednostima: n
(mi − ei )2
i =1
ei
χ =∑ 2
(5.96)
283
Statistika u ekonomiji i menadžmentu
0 ≤ χ 2 < +∞ , gdje je mi stvarna, a ei očekivana frekvencija. Hi-kvadrat distribucija može uzeti vrijednosti od 0 do beskonačno, dakle ne može biti negativna jer je jednaka zbiru kvadrata i zavisi o broju stepeni slobode (degrees of freedom - df). Broj stepeni slobode se definiše kao broj nezavisnih vrijednosti podataka umanjen za broj ograničenja koja se nameću tim vrijednostima. Vrijednosti distribucije su tabelirane. U pretkoloni su brojevi stepeni slobode od 1 do 30. U zaglavlju su vjerovatnoće. U tabeli su date kritične vrijednosti koje će hi-kvadrat premašiti za datu vjerovatnoću i broj stepeni slobode. To pokriva skoro sve slučajeve u praksi, jer su slučajevi sa brojem stepeni slobode većim od 30 rijetki. Ova distribucija je asimetrična i sa porastom broja stepeni slobode približava se normalnoj distribuciji. Hi-kvadrat distribucija je data sljedećim izrazom:
( )=
f χ
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
( )
f χ 2 > 0,
( )
⋅ χ
2
n−2 2
⋅e
−
χ2 2
+∞
∫ f (χ )d (χ ) = 1 2
2
(5.97)
0
Hi-kvadrat distribucija je predstavljena na sljedećem grafikonu. f (χ 2)
0
Grafikon 5.42.
284
χ 2n,1−a / 2
χ 2n, a/ 2 χ 2 distribucija
χ2
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Gama funkcija koja se koristi u definisanju hi-kvadrat distribucije data je sljedećim izrazom: +∞
Γ(ρ ) = ∫ x ρ −1e − x dx, ρ > 0
(5.98)
0
Izrazi za očekivanu vrijednost, koja je jednaka broju stepeni slobode, i varijansu ove distribucije su:
E( X ) = μ = υ,
σ 2 = 2υ
(5.99)
Koeficijent varijacije je:
2 ⋅100 n
kv =
(5.100)
Koeficijenti asimetrije i spljoštenosti su:
α3 =
12 4 i α4 = 3 + n 2n
(5.101)
Funkcija distribucije vjerovatnoće je jednaka:
( )=
F χ
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
x 2j
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
(5.102)
χ 2 ∈ R0+ 5.2.8.5. Studentova t distribucija Pretpostavimo da je Z slučajna varijabla koja ima normalnu standardizovanu distribuciju i X slučajna varijabla koja ima hi-kvadrat distribuciju sa n stepeni slobode. Ako su Z i X nezavisne varijable, tada varijabla T
T=
Z X n
(5.103)
slijedi Studentovu distribuciju sa n stepeni slobode. 285
Statistika u ekonomiji i menadžmentu
Za slučajnu promjenljivu T kažemo da ima Studentovu distribuciju vjerovatnoće ako je njena funkcija vjerovatnoće za t jednaka:
⎛ n + 1⎞ n +1 Γ⎜ ⎟ 2 2 ⎛ ⎞ t 1 2 ⎠ ⋅ ⎜⎜1 + ⎟⎟ ⋅ ⎝ f (t ) = n⎠ ⎛n⎞ nπ Γ⎜ ⎟ ⎝ ⎝2⎠ f (t ) > 0 i f (t ) = f (− t )
(5.104)
Studentova distribucija je razvučena na obje strane normalne distribucije i to utoliko više što je broj stepeni slobode n manji. Ova distribucija je simetrična u odnosu na ordinatnu osu i promjenljiva t uzima vrijednosti od − ∞ do + ∞ . Kada t → + / − ∞, f (t ) → 0 i apscisa postaje asimptota ove funkcije. Studentova distribucija je unimodalna. Očekivana vrijednost i varijansa ove distribucije su:
μ = E (t ) = 0,
σ2 =
n , n>2 n−2
(5.105)
Relativne mjere asimetrije i spljoštenosti su:
α 3 = 0, α 4 = 3 +
6 n−4
(5.106)
Funkcija distribucije vjerovatnoće je jednaka:
⎛ n +1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ ⎜ ⎟ ⎝2⎠
⎞ ⎟⎟ ⎠
−
n +1 2
⋅ dt
(5.107
odnosno
S n (t j ) = P (− ∞ < t ≤ t j ) =
tj
∫ f (t )dt
(5.108)
−∞
( )
Osobine funkcije distribucije S n t j izračunavanjima su: 286
koje se često koriste u praktičnim
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
p(t > t j ) = 1 − p(t ≤ t j ) = 1 − S n (t j ) p (t ≤ −t j ) = S n (− t j ) = 1 − S n (t j ) p (t i < t ≤ t j ) = S n (t j ) − S n (t i ) p (− t j < t ≤ t j ) = 2S n (t j ) − 1
[
]
p ( t > t j ) = 2 1 − S n (t j )
(5.109)
Studentova distribucija se primjenjuje u slučaju malih uzoraka. Uzorak se smatra malim ukoliko ima manje od 30 elemenata (n<30). Oblik Studentove distribucije zavisi od veličine n. U izrazu za funkciju vjerovatnoće veličina n predstavlja broj stepeni slobode (degres of freedom). Broj stepeni slobode nekog pokazatelja predstavlja broj nezavisnih ponavljanja umanjen za broj parametara koji su potrebni da bi se izračunao dati pokazatelj. Na grafikonu 5.43. je predstavljena Studentova t distribucija.
f (t )
− tn Grafikon 5.43.
0
tn
t
Studentova distribucija
Na grafikonu 5.44. prezentirane su Studentova t distribucija i standardizovana normalna distribucija. Kao što smo već konstatovali, Studentova t distribucija je spljoštenija od normalne distribucije.
287
Statistika u ekonomiji i menadžmentu
standardizovana normalna t distribucija
f ( ti ) f ( xi )
( ti ) ( xi ) Grafikon 5.44.
Standardizovana normalna i t distribucija
5.2.8.6. Ficher-Snedecorova (F) distribucija
( )
Ukoliko je X slučajna varijabla koja ima hi-kvadrat distribuciju χ 2 sa m
( )
stepeni slobode i Y slučajna varijabla koja ima hi-kvadrat distribuciju χ 2 sa n stepeni slobode i ako su ove dvije varijable nezavisne, tada varijabla F
F=
X /m Y /n
(5.110)
⎛ m⎞ slijedi Ficher-Snedecorovu distribuciju sa ⎜⎜ ⎟⎟ stepeni slobode. Distribucija ⎝n ⎠ vjerovatnoće nije simetrična u odnosu na m i n. Slučajna varijabla uzima vrijednost iz intervala (0; − ∞ ) i distribucija ima sljedeći oblik:
⎛m+n⎞ m −1 Γ⎜ ⎟ 2 x 2 ⎝ ⎠ f m ,n ( x ) = ⋅ m ⎛ n ⎞ (1 + x ) m2+ n Γ Γ⎜ ⎟ s ⎝2⎠ m i n su broj stepeni slobode (df). Očekivana vrijednost i varijansa ove distribucije su:
288
(5.111)
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
μ=
m za n > 2 n−2
σ2 =
2m(n + m − 2) , za n > 4 (n − 2)2 (n − 4)
(5.112)
m F dobijamo Ficher-Snedecorovu distribuciju n sa ν1 i ν2 stepeni slobode. Distribucija vjerovatnoće je tada jednaka:
Ako uvedemo smjenu X = ν1
ν2
ν1
(ν −1 ν 2 ⋅ν 22 − f (F ) = 1 ⋅ F 2 (ν 2 + ν 1F ) B(ν 1 ,ν 2 )
1 +ν 2 )
2
(5.113)
Funkcija distribucije vjerovatnoće je jednaka: ν1
ν2
2
2 2
+∞
ν1
−1
F2 ν ⋅ν P( F ) = 1 ⋅∫ B(ν 1 ,ν 2 ) F (ν + ν F )− (ν 2 1 0
1 +ν 2 )
⋅ dF .
(5.114)
2
Ficherova (F) distribucija se koristi u slučajevima kada želimo analizirati varijabilnost dva osnovna skupa na osnovu uzorka. Pomoću F distribucije se provjerava hipoteza o jednakosti dvije varijanse uzoraka preko njihovog odnosa na bazi broja stepeni slobode za svaku od njih. Kada su posmatrani osnovni skupovi normalno distribuirani tada je količnik dvije nezavisne ocjene varijanse dat u obliku:
F=
σ 12 σ 22
(5.115)
Vrijednosti distribucije su tabelirane. U zaglavlju su navedeni stepeni slobode (df) za procjenu varijanse koja se nalazi u brojniku odnosa F, a u pretkoloni brojevi stepeni slobode za procjenu varijanse koja se nalazi u nazivniku odnosa F. Ova distribucija zavisi od dva parametra: stepena slobode prve varijable (prvog skupa) i stepena slobode druge varijable (drugog skupa).
289
Statistika u ekonomiji i menadžmentu
5.2.8.7. Tabelarni pregled neprekidnih distribucija vjerovatnoće U tabeli broj 5.2. su prezentirane neprekidne distribucije vjerovatnoće i njima odgovarajuće očekivane vrijednosti i varijanse. Tabela 5.2. Neprekidne distribucije vjerovatnoće Neprekidne distribucije
Distribucija vjerovatnoće
⎧ako x ∉[a; b] f ( x ) = 0 ⎪ f ( x) = ⎨ 1 ⎪ako x ∈[a; b] f ( x ) = b−a ⎩
Uniformna
X ~ U [a; b]
Normalna X ~ N μ,σ 2
(
)
f (x ) =
Standardizovana normalna Z~N(0,1) Hi kvadrat
X ~χ
Očekivana vrijednost
2 n df
Studentova
FicherSnedecorova
1
σ 2π
f (z ) =
( )
f χ =
1 2π
1
2
n 2
e
⎛ n⎞ 2 Γ⎜ ⎟ ⎝ 2⎠
1 ⎛ x−μ ⎞ − ⎜ ⎟ 2⎝ σ ⎠
e
n−2 2
a+b 2
σ
2
2 ( b − a) =
12
2
E( X ) = μ
σ2
E( X ) = μ = 0
σ 2 =1
E( X ) = μ = n
σ 2 = 2n
z2 2
−
( )
⋅χ
2
E(X ) =
Varijansa
−
⋅e
χ2 2
⎛ n + 1⎞ n+1 Γ⎜ ⎟ 1 2 ⎠ ⎛ t2 ⎞ 2 ⎝ f (t ) = ⋅ ⎜1 + ⎟ ⋅ ⎛ n ⎞ ⎜ n ⎟⎠ nπ Γ⎜ ⎟ ⎝ ⎝ 2⎠ f (t ) > 0 i f (t ) = f (− t )
⎛m+n⎞ m −1 Γ⎜ ⎟ x2 2 ⎠ ⎝ f m,n ( x ) = ⋅ m+n m ⎛n⎞ Γ Γ⎜ ⎟ (1 + x ) 2 s ⎝2⎠
E ( t ) = μ = 0,
m n−2 za n > 2
μ=
σ2 =
σ2 =
n , n>2 n−2
2m(n + m−2) , za n > 4 (n−2)2(n−4)
5.2.8.8. Centralna granična teorema Normalna distribucija je fundamentalna distribucija vjerovatnoće i ova distribucija se koristi u velikom broju slučajeva koji su vezani za primjenu centralne granične teoreme. Posmatrajmo seriju od n slučajnih varijabli (prekidnih ili neprekidnih) X 1 , X 2 ,..., X n . 290
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Ako su ove slučajne varijable X i međusobno nezavisne i ako sve imaju istu n
distribuciju (bilo koju, ali istu), tada njihov zbir
∑X i =1
(kada n postaje vrlo
i
velik) teži prema normalnoj distribuciji. Ova teorema ima vrlo široko područje primjene, posebno u oblasti teorije uzoraka. 5.2.8.9. Šematski prikaz prekidnih i neprekidnih distribucija vjerovatnoće U sljedećem šematskom prikazu su predstavljene prekidne i neprekidne distribucije vjerovatnoće koje smo analizirali u ovom poglavlju.
Prekidne distribucije vjerovatnoće
Neprekidne distribucije vjerovatnoće
Uniformni zakon vjerovatnoće
Neprekidna uniformna distribucija
Bernoullijeva distribucija vjerovatnoće
Normalna distribucija vjerovatnoće
Binomna distribucija vjerovatnoće
Hi-kvadrat distribucija
Poissonova distribucija vjerovatnoće
Studentova distribucija
Hipergeometrijska distribucija vjerovatnoće
Šema 5.2.
Ficher-Snedecerova distribucija
Distribucije vjerovatnoće
291
Statistika u ekonomiji i menadžmentu
5.3. TEORIJSKA PITANJA 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21.
22. 23. 24. 25. 292
Definišite eksperiment, skup mogućih rezultata eksperimenta i elementarni događaj. Definišite vjeovatnoću koristeći eksperimentalni i teorijski pristup. Analizirajte uslovnu vjerovatnoću. Definišite i analizirajte Bayesovu teoremu. Definišite i analizirajte slučajnu varijablu. Koje tipove slučajne varijable poznajete? Analizirajte prekidnu slučajnu varijablu i distribuciju vjerovatnoće ove varijable. Definišite Čebiševu teoremu. Koje korisne informacije nam pruža primjena Čebiševe teoreme? Nabrojite prekidne distribucije (rasporede) vjerovatnoće. Analizirajte binomnu distribuciju vjerovatnoće i njene osobine. Analizirajte Poissonovu distribuciju vjerovatnoće i njene osobine. Definišite i analizirajte osobine neprekidne slučajne varijable. Nabrojite neprekidne distribucije vjerovatnoće. Koja od njih se najčešće koristi? Analizirajte normalnu distribuciju vjerovatnoće. Koje su osobine normalne distribucije vjerovatrnoće? Analizirajte standardizovanu normalnu distribuciju. Koja je razlika između normalne i standardizovane normalne distribucije? Nabrojite nekoliko slučajeva praktične primjene normalnog rasporeda vjerovatnoće u određivanju intervala povjerenja i testiranju hipoteza. Koji se rasporedi i uz koje uslove mogu aproksimirati normalnim rasporedom vjerovatnoće? Koja je osnovna razlika između binomnog i normalnog rasporeda vjerovatnoće? Od kojih parametara zavise jedan i drugi raspored i koji su izrazi za njihove aritmetičke sredine i varijanse? Predstavite šemu i uslove za aproksimacije. Definišite i analizirajte hi-kvadrat distribuciju. Definišite i analizirajte Studentovu distribuciju. Definišite i analizirajte Ficher-Snedecorovu distribuciju.
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
26. Definišite stepene slobode. 27. Definišite i analizirajte, uz grafičku prezentaciju, normalnu distribuciju vjerovatnoće. Koja je njena prednost u odnosu na ostale distribucije i koje su oblasti u kojima se primjenjuje?
5.4. RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
Zadatak 1. X~B(10;0,4) odrediti: a) b) c) d) e)
Vjerovatnoću da je X veće ili jednako 4 Vjerovatnoću da je X manje ili jednako 4 Vjerovatnoću da je X jednako 9 Vjerovatnoću da je X veće od 10 Vjerovatnoću da se X nalazi između 4 i 10.
Elementi rješenja: X~B(10;0,4) a) p ( x ≥ 4 ) = 1 − p( x < 4 ) = 1 − p (x ≤ 3) = 1 − 0,3823 = 0,6177
b) p( x ≤ 4 ) = F (4 ) = 0,6331
c) p( x = 9) = p(x ≤ 9) − p(x ≤ 8) = F (9) − F (8) = 0,9999 − 0,9983 = 0,0006
d) p ( x > 10 ) = 1 − p( x ≤ 10) = 1 − F (10) = 1 − 1 = 0
e) p (4 < x < 10 ) = p ( x ≤ 9) − p ( x ≤ 4 ) = 0,9999 − 0,6331 = 0,3668
Zadatak 2. Za X~P(0,5) i X~P(4) odrediti: a) d)
p ( x = 0 ) ; b) p( x = 3) ; c) p( x = 10 ) ; p( x ≥ 5) ; e) p (x < 2 ) ; f) p( x > 3)
293
Statistika u ekonomiji i menadžmentu
Elementi rješenja: • X~P(0,5) a) p( x = 0 ) = 0,60653
b) p ( x = 3) = 0,07582 c) p ( x = 10 ) = 0
d) p ( x ≥ 5) = 1 − p( x < 5) = 1 − p ( x ≤ 4) = 1 − 0,9998 = 0,0002
e) p ( x < 2 ) = p (x ≤ 1) = 0,9098
f) p ( x > 3) = 1 − p( x ≤ 3) = 1 − F (3) = 1 − 0,98562 = 0,01438
• X~P(4) a) p( x = 0 ) = 0,0183
b) p ( x = 2 ) = 0,014653 c) p ( x = 20 ) = 0
d) p ( x ≥ 5) = 1 − p( x < 5) = 1 − p ( x ≤ 4) = 1 − 0,6288 = 0,3712
e) p (x < 2 ) = p (x ≤ 1) = 0,0916
f) p ( x > 3) = 1 − p( x ≤ 3) = 1 − F (3) = 1 − 0,4335 = 0,5665
Zadatak 3. Ako su godine grupe osoba distribuirane po normalnom rasporedu N(41;8) odrediti teorijski procenat osoba iz grupe koje imaju: a) manje od 53 godine b) između 25 i 49 godina c) najmanje 35 godina Elementi rješenja: X~N(41,64),
E(X)= μ = 41; σ = 8
a) Z~N(0,1)
x−μ ⎞ ⎛ p( x < 53) = p⎜ z < ⎟ = p( z < 1,5) = F (1,5) = 0,9332 σ ⎠ ⎝ 93,32% osoba imaju manje od 53 godine. 294
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
b)
p(25 < x < 49) = p(x < 49) − p(x < 25) = p( z < 1) − p(z < 2 ) = F (1) − F (− 2 ) = = 0,8413 − [1 − F (2 )] = 0,8413 − 1 + F (2) = = 0,8413 − 1 + 0,9772 = F (1) − [1 − F (2)] = F (1) + F (2 ) − 1 = = 0,8413 + 0,9772 - 1 = 0,8185
81,85% osoba imaju više od 25, a manje od 49 godina. c)
p( x ≥ 35) = 1 − p(x ≤ 35) = 1 − p( z ≤ −0,75) = 1 − [1 − F (0,75)] = F (0,75) = 0,7734 77,34% osoba imaju 35 ili više godina.
Zadatak 4. Mašina puni automatski kutije šećera tako da je težina šećera u kutiji slučajna varijabla koja slijedi normalnu distribuciju sa parametrima μ i σ izraženim u kg. Želi se regulisati mašina tako da težina šećera u kutiji prelazi 990 grama sa najmanje 95% vjerovatnoće. a) Ako je σ=0,02 kg, koja mora biti minimalna prosječna težina μ? b) Ako je prosječna težina μ=1 kg, koje može biti maksimalno odstupanje u težini (σ) uz vjerovatnoću od najmanje 95%? Elementi rješenja: a)
p ( x > 0,99 ) ≥ 0,95; x ~ N (μ , σ )
⎛ x − μ 0,99 − μ ⎞ > p⎜ ⎟ ≥ 0,95 σ ⎝ σ ⎠ z=
x−μ
σ
, z ~N ( 0,1) 295
Statistika u ekonomiji i menadžmentu
0,99 − μ ⎞ ⎛ p⎜ z > ⎟ ≥ 0,95 σ ⎝ ⎠ 0,99 − μ ⎞ ⎛ 1− p⎜ z < ⎟ ≥ 0,95 σ ⎝ ⎠ 0,99 − μ ⎞ ⎛ ≤ 0,05 p⎜ z < 0,02 ⎟⎠ ⎝ ⇒ k je negativan
0,99 − μ ≤ −1,6449 0,02 ⇒ μ ≥ 1,029kg
⇒
Potrebno je da prosječna težina kutije bude μ ≥ 1,029 kg da bi sa standardnom greškom od σ = 0,02 kg (20 gr) mogli imati kutije od najmanje 0,99 kg (990 gr) težine uz vjerovatnoću ≥ 95%. b) μ = 1 kg
σ =?
p ( x > 0,99 ) ≥ 0,95
0,99 − 1 ⎞ ⎛ p⎜ z > ⎟ ≥ 0,95 σ ⎠ ⎝ − 0,01 ⎞ ⎛ 1 − p⎜ z < ⎟ ≥ 0,95 σ ⎠ ⎝ − 0,01 ⎞ ⎛ p⎜ z < ⎟ ≤ 0,05 σ ⎠ ⎝ − 0,01
σ
≤ −1,6449
σ ≤ 0,00608 Potrebno je da standardna greška σ bude ± 6,08 gr da bi jedna kutija težila najmanje 0,99 kg uz vjerovatnoću p ≥ 0,95.
296
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Zadatak 5. Statističkom anketom je obuhvaćeno 5.000 vozača početnika. Utvrđeno je da su 5 od njih uzrokovali tešku saobraćajnu nesreću u prvoj godini vožnje, a 100 od njih su uzrokovali lakšu saobraćajnu nesreću u prvoj godini vožnje. Odrediti vjerovatnoću: p1 - uzrokovati tešku saobraćajnu nesreću i vjerovatnoću p2 - uzrokovati lakšu saobraćajnu nesreću u prvoj godini vožnje. Izaberemo slučajno 50 vozača početnika i sa X označimo broj vozača koji su izazvali tešku saobraćajnu nesreću. Pomoću kojih distribucija vjerovatnoće možemo analizirati X. Izračunati vjerovatnoću da je X=0 i X=2. Elementi rješenja: a)
p1 =
nA 5 = = 0,001 n 5000
p2 =
nB 100 = = 0,02 n 5000
b) Određivanje distribucije vjerovatnoće X Ako je Xi slučajna varijabla Xi = {1 ako je prouzrokovana teška saobraćajna nesreća {0 ako nije prouzrokovana teška saobraćajna nesreća i=1,..., 50. Vjerovatnoća p ( X i = 1) = 0,001 za ∀ i Slučajne varijable X i nisu nezavisne (izvlačenje bez ponavljanja) 50
X = ∑ Xi i =1
X ima hipergeometrijsku distribuciju vjerovatnoće X∼H (5000; 50; 0,001) i odgovarajuća vjerovatnoća je jednaka.
297
Statistika u ekonomiji i menadžmentu
p( X = k ) =
C Nk 1 ⋅ C Nn−2 k C Nn
50− k C5k ⋅ C4995 = 50 C5000
Ovu formulu zbog složenosti ne koristimo u računanju vjerovatnoće. Koristićemo aproksimaciju binomnim rasporedom jer je uslov za aproksimaciju zadovoljen:
n 50 1 1 = = << N 5000 100 10 To znači da možemo pretpostaviti da su X i nezavisne ⇒ X~B(50; 0,001)
p ( x = 0 ) = C n0 p 0 q 50 = q 50 = 0,999 50 = 0,95 ⎛ 50 ⎞ 50! p ( x = 2 ) = C n2 ⋅ p 2 ⋅ q n − 2 = ⎜⎜ ⎟⎟ p 2 ⋅ q 48 = ⋅ 0,0012 ⋅ 0,999 48 = 0,001168 2!48! ⎝2 ⎠ Binomnu distribuciju možemo aproksimirati Poissonovom distribucijom ako je zadovoljen uslov da je n > 50, p <0,1 (distribucija rijetkih događaja) n = 50 p=0,001 <<0,1 ⇒
X ~ P(n, p ) dakle X ~ P(λ ) ⇒ X P(0,05) , gdje je λ = n ⋅ p = 0.05 .
p( X = k ) =
e − λ λk k!
e −0, 05 ⋅ 0,10 p( X = 0) = = e −0,05 = 0,95 0! p(x = 2) =
e −0,05 ⋅ 0,12 = 0,0012 2!
Napomena: Ne može se izvršiti aproksimacija normalnom distribucijom jer svi uslovi aproksimacije u ovom slučaju nisu zadovoljeni (npr.: n⋅p>10 nije zadovoljen u našem slučaju jer je n⋅p=50·0,001=0,05<10).
298
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Zadatak 6.
U jednoj bolnici, vjerovatnoća da se rodi dječak je
2 . X predstavlja broj 3
rođenih dječaka u uzorku od 1800 beba. a) Nađite srednju vrijednost od X. b) Nađite standardnu devijaciju od X. Elementi rješenja: Znamo da je X ~ B(1800,
2 ). 3
E( X ) = n ⋅ p a) E ( X ) = 1800 ⋅
2 3
E ( X ) = 1200
σ ( X ) = n ⋅ p ⋅ (1 − p)
b)
⎛ ⎝
2⎞
σ ( X ) = 1200 ⋅ ⎜ 1 − ⎟ 3 σ ( X ) = 1200 ⋅
⎠
1 3
σ ( X ) = 400 = 20 Zadatak 7.
Vjerovatnoća da će padati kiša tokom ljeta u Sarajevu je 0,2. U Sarajevu, vjerovatnoća da će dnevna temperatura biti veća od 30°C tokom ljeta je 0,3 kada pada kiša, a 0,6 kada ne pada kiša. Znajući da je dnevna temperatura veća od 30°C tokom jednog ljetnog dana, pronađite vjerovatnoću da je tog dana padala kiša. Elementi rješenja:
p(temperatura ≥ 30°C ) = 0, 2 ⋅ 0,3 + 0,8 ⋅ 0, 6 p(temperatura ≥ 30°C ) = 0,54 299
Statistika u ekonomiji i menadžmentu
0, 2 ⋅ 0,3 0,54 0,06 1 p( pada kiša / temperatura ≥ 30°C ) = = 0,54 9
p (pada kiša / temperatura ≥ 30°C ) =
Zadatak 8.
Emir i Amir se spremaju za ispit iz statistike tako što se uzajamno ispituju. Emir odgovara na Amirova pitanja. Vjerovatnoća da će Emir tačno odgovoriti na pitanje je 0,4. Amir mu postavlja 6 pitanja. a) Nađite vjerovatnoću da će Emir tačno odgovoriti na 4 pitanja. b) Nađite vjerovatnoću da će Emir prvi tačan odgovor dati kada mu Amir postavi treće pitanje. Elementi rješenja: a) X ~ B(6, 0,4)
⎛6⎞ p( x = 4) = ⎜ ⎟ ⋅ 0, 44 ⋅ 0, 62 ⎝ 4⎠ p( x = 4) = 15 ⋅ 0, 0256 ⋅ 0,36
p ( x = 4) = 0,14 b) Ako je Emir prvi tačan odgovor dao na Amirovo treće pitanje, to znači da je netačno odgovorio na prvo i drugo pitanje, i tražena vjerovatnoća je:
p = 0,6 ⋅ 0,6 ⋅ 0,4 = 0,144 Zadatak 9.
Težine tek rođenih beba su normalno distrubuirane sa srednjom težinom od 3,5 kg i standardnom devijacijom od 0,2. Nađite vjerovatnoću da će težina jedne slučajno odabrane bebe biti između 3,1 kg i 3,8 kg. Elementi rješenja: Tražimo 3,1 < x < 3,8.
300
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
Znajući da je μ = 3,5 i σ = 0,2 koristićemo standardizovanu slučajnu x−μ varijablu z = .
σ
X −μ
3,1 − 3,5 = −2 0,2 σ X + μ 3,8 − 3,5 = = 1,5 σ 0,2 =
P(3,1 < x < 3,8) = P(−2 < z < 1,5) = P( z < 1,5) − P( z < −2) = P( z < 1,5) − P( z > 2) = P( z < 1,5) − (1 − P( z < 2)) = 0,9332 − (1 − 0,9772) = 0,9332 − 0,0228 = 0,9104 Vjerovatnoća da će težina jedne slučajno odabrane bebe biti između 3,1 kg i 3,8 kg je 91,04%. Zadatak 10.
Demonstrator predmeta Statistika koristi svakog jutra autobus da bi došao na fakultet. Vrijeme koje on čeka svakog jutra autobus je normalno distribuirano sa aritmetičkom sredinom jednakom 10 minuta i standardnom devijacijom jednakom 2 minute. 1. Koje je vjerovatnoća da će demonstrator jednog određenog jutra čekati autobus više od 8 minuta? 2. U toku određene sedmice (od ponedjeljka do petka) koje je vjerovatnoća da: a) ukupno vrijeme čekanja neće biti više od 45 minuta? b) čeka manje od 8 minuta najmanje tri dana u sedmici? c) njegovo prosječno dnevno vrijeme čekanja je veće od 9 minuta?
301
Statistika u ekonomiji i menadžmentu
Elementi rješenja:
X ~ N ( μ ;σ 2 ) 1. X ~ N (10;4) p ( x ≥ 8) ; z =
x−μ
σ
, z ~ N (0,1)
⎛ x − μ 8 − 10 ⎞ p ( x ≥ 8) = p⎜ ≥ ⎟ 2 ⎠ ⎝ σ p ( z ≥ −1) = p( z ≤ 1) p = 0,841 2. a) 5
∑X i =1
i
~N ( μ , σ 2 )
i
~N (50,20)
5
∑X i =1
p( ∑ x ≤ 45) = p( z ≤
45 − 50
) = p ( z ≤ −1,12) = 1 − p( z ≤ 1,12) = 20 = 1 − 0,8686 = 0,1314
b)
p( x > 8) = 0,841 p( x ≤ 8) = 1 − 0,841 = 0,159 Y je promjenljiva koja predstavlja broj dana u kojima demonstrator čeka autobus manje od 8 minuta.
Y ~ B( n, p ) , Y ~ B(5;0,159) p( y ≥ 3) = p( y = 3) + p( y = 4) + p( y = 5) ⎛ 5⎞ p( y = 3) = ⎜ ⎟ ⋅ 0,1593 ⋅ 0,8412 = 0,02843 ⎝ 3⎠
302
Poglavlje 5. – Osnovi vjerovatnoće i teorijske distribucije vjerovatnoće
⎛ 5⎞ p( y = 4) = ⎜ ⎟ ⋅ 0,1594 ⋅ 0,8411 = 0,00269 ⎝4⎠ ⎛ 5⎞ p( y = 5) = ⎜ ⎟ ⋅ 0,1595 ⋅ 0,8410 = 0,000101 ⎝ 5⎠
p( y ≥ 3) = 0,02843 + 0,00569 + 0,000101 = 0,0312 ili
p(y ≥ 3 ) = 1 − p(y ≤ 2 ) = 1 − 0,9687 = 0,0312 c)
X ~ N ( μ ;σ 2 ) , X ~ N (μ;
σ2 n
) ,
X ~ N (10;4) 4 X ~ N (10; ) 5
⎛ ⎞ ⎜ ⎟ 9 − 10 ⎟ ⎜ = p( z > −1,12) = p ( x > 9) = p z > ⎜ 2 ⎟ ⎜ ⎟ 5 ⎠ ⎝ = p( z < 1,12) = 0,8686 ili
p( x > 9) = p(∑ X > 45) = 1 − p(∑ X < 45) = = 1 − 0,1314 = 0,8686.
303
POGLAVLJE 6.
TEORIJA I METODA UZORAKA I STATISTIČKO ZAKLJUČIVANJE
Teorija i metoda uzoraka je oblast statistike koja se bavi praktičnim metodama za izbor uzoraka i analizu dijela populacije u cilju donošenja zaključaka o cijeloj populaciji. Postupak donošenja zaključaka o osnovnom skupu na osnovu podataka iz uzorka se naziva statističko zaključivanje. Ovaj postupak se sastoji iz statističkog ocjenjivanja i testiranja hipoteza. Proces primjene metode uzoraka i statističkog zaključivanja se može podjeliti u tri etape. Prva je izbor slučajnog (objektivnog, reprezentativnog) uzorka uz uslov da su vjerovatnoće izbora jedinica u uzorak poznate i pozitivne. Druga etapa je prikupljane podataka o jedinicama uzorka. Treća etapa podrazumijeva donošenje zaključaka o populaciji na temelju rezultata uzorka. U prvom dijelu poglavlja Teorija i metodi uzoraka i statističko zaključivanje ćemo analizirati i prezentirati osnove metode uzoraka, vrste uzoraka kao i značaj primjene metode uzoraka u ekonomskim istraživanjima. U drugom dijelu ćemo analizirati procjenu karakteristika osnovnog skupa na osnovu uzoraka i testiranje hipoteza.
305
Statistika u ekonomiji i menadžmentu
6.1. OSNOVE TEORIJE UZORAKA
Za analizu masovnih pojava koje su predmet statističkih istraživanja mi smo obrađivali statističke metode kojima se analizira statistički skup ili populacija. Za primjenu metoda potrebno je prikupiti podatke o osnovnom skupu. Kako statistički skupovi imaju vrlo veliki broj elemenata, potpuno prikupljanje podataka je veoma složen, dugotrajan i skup posao. Zbog toga se taj postupak pojednostavljuje ispitivanjem osnovnog skupa metodom uzorka. Pod uzorkom se podrazumijeva dio skupa na osnovu kojeg istražujemo i analiziramo osobine osnovnog skupa. Primjena metode uzorka se bazira na teoriji vjerovatnoće i omogućuje da se uz odgovarajući rizik utvrde granice povjerenja i preciznost ocjene parametara osnovnog skupa na osnovu ocijenjenih parametara iz uzorka. Razlozi za primjenu metode uzorka su: • smanjenje troškova realizacije statističkog istraživanja jer obuhvata manji broj jedinica, • smanjenje greške pri prikupljanju podataka jer istraživanje u ovom slučaju provodi manji broj stručnih lica, • manji utrošak vremena i efikasnije dobijanje rezultata, • racionalnost (kontrola kvalitete često uništava testirani proizvod), • pouzdanost dobijenih rezultata (kada je populacija suviše velika, rezultati dobijeni na osnovu uzorka mogu biti pouzdaniji od rezultata dobijenih na osnovu egzostivne analize). Da bismo dobili informaciju o ukupnoj populaciji, inferencijalna statistika ima jednu dodatnu etapu čiji je cilj da odredi (inferira), polazeći od posmatranih karakteristika na uzorku, vjerovatnu vrijednost tih karakteristika za ukupnu populaciju. Statistička teorija, koja je u osnovi deduktivna, doprinosi također racionalizaciji i kvalitetu induktivnog procesa posmatranja i zaključivanja. Induktivno posmatranje se sastoji u ispitivanju uzorka elemenata populacije kako bi se dobile informacije o cijeloj populaciji koja može biti konačna i beskonačna. Kada se ispituje cijela populacija, posmatranje i zaključivanje je deduktivno. Analiza, istraživanje i zaključivanje na osnovu uzorka je induktivno. 306
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Statističke metode omogućavaju donošenje induktivnih zaključaka. Generalizacija procjena sadrži određeni stepen nepouzdanosti, nepreciznosti, neizvjesnosti, rizika. Rizik je moguće statističkim metodama postaviti u odgovarajuće okvire, procijeniti, kontrolisati i utvrditi stepen neizvjesnosti procjene. Statistička inferencija ima veliku praktičnu primjenu i sa tog stanovišta je značajan faktor unapređenja naučnih istraživanja u različitim naučnim domenima. Primjenom statističkih metoda moguće je donositi zaključke o osnovnom skupu na osnovu samo jednog njegovog dijela, ali je zbog teorijskih problema vezanih za induktivno zaključivanje potrebno primijeniti odgovarajuću proceduru kako bi se zaključci postavili u određene okvire. Statistička inferencija omogućuje primjenu dvije vrste metoda za izvođenje zaključaka na osnovu podataka dobijenih iz uzorka ili eksperimentisanjem i to ocjene intervala povjerenja i testiranje hipoteza. Ocjenama se određuju nepoznati parametri uz odgovarajuću grešku ocjene, a testovima se provjeravaju postavljene hipoteze. Da bi zaključci o osnovnom skupu na osnovu uzorka bili što tačniji, uzorak mora biti reprezentativan. Uzorak će biti reprezentativan ako posjeduje karakteristike osnovnog skupa i ako njegova struktura odgovara strukturi osnovnog skupa. Da bi uzorak predstavljao umanjenu sliku osnovnog skupa, izbor elemenata se mora izvršiti na odgovarajući način. To se postiže pravilnim izborom elemenata osnovnog skupa koji će predstavljati uzorak. Cilj metode uzoraka je: • Da se na osnovu karakteristika uzorka dođe do procjene karakteristika osnovnog skupa • Da se statističkim metodama odredi pouzdanost i preciznost te procjene. Prvi zadatak ove metode je da na osnovu uzorka izabranog iz osnovnog skupa procijeni karakteristike osnovnog skupa. Drugi zadatak je da se na osnovu podataka dobivenih uzorkom donese odluka o prihvatanju ili odbacivanju određene hipoteze koja se odnosi na osnovni skup. Navedeni postupci čine metodu koja se naziva metoda uzorka ili reprezentativna metoda. Izbor elemenata osnovnog skupa u uzorak može biti: 307
Statistika u ekonomiji i menadžmentu
• •
bez ponavljanja (kada se odabrani elementi ne vraćaju ponovo u osnovni skup) i sa ponavljanjem (elementi se poslije izbora vraćaju u osnovni skup i tako sudjeluju u izboru sljedećeg elemenata u uzorak).
Izbor uzorka može biti namjeran i slučajan. Kada su elementi izabrani slučajno, tada se na rezultate tog uzorka može primijeniti teorija vjerovatnoće. U tom slučaju može se odrediti greška koja je nastala u procjeni karakteristika osnovnog skupa ili u postupku testiranja hipoteze. Slučajni izbor se može izvršiti na više načina koje ćemo detaljnije analizirati. Greške u statističkim istraživanjima mogu biti sistematske i slučajne. Ukupna greška procjene sadrži sistematsku i slučajnu grešku. Slučajna greška nastaje zbog slučajnog izbora elemenata u uzorak i utiče na preciznost ocjene. Slučajna greška predstavlja razliku između stvarne i ocijenjene vrijednosti parametra osnovnog skupa. Slučajna greška se smanjuje i preciznost ocjene se povećava sa porastom veličine uzorka. Sistematske greške nastaju zbog više razloga i teško ih je kontrolisati. Najčešći razlozi zbog kojih nastaju sistematske greške su: loše odabrana baza i okvir za izbor uzorka, nepravilna realizacija slučajnog izbora elemenata u uzorak, nepreciznosti upitnika, greške anketara, tehničke greške prilikom obrade podataka, itd. Veličina uzorka ne utiče na promjenu sistematske greške. Uzorak sa sistematskom greškom je pristrasan uzorak, a uzorak sa slučajnom greškom je nepristrasan. Da bi se smanjila pristrasnost ocjene (sistematska greška) neophodno je primijeniti objektivnu proceduru u izboru jedinica osnovnog skupa u uzorak. Ukoliko je pristrasnost manja od 1/10 standardne devijacije smatra se da njen uticaj na dobijene ocjene nije značajan. Da bi se metoda uzorka efikasno realizovala neophodno je precizno i jasno definisati: • cilj istraživanja • populaciju • jedinice populacije • plan uzorka • bazu uzorka • veličinu uzorka • nivo preciznosti. 308
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
•
Definisati cilj istraživanja
Prva etapa je što preciznije definisanje ciljeva istraživanja, podataka koje je potrebno prikupiti, kao i metode za prikupljanje podataka. Podaci se mogu prikupiti popisom, anketom, izvještajima. Ako odaberemo anketu pomoću uzoraka, u njenoj primjeni je potrebno realizovati sljedeće korake. Mora se odrediti terminologija i potrebne definicije koje se odnose na podatke kako bi se osigurala konzistentnost ankete. •
Definisati populaciju koja je predmet istraživanja
Populacija koja je predmet istraživanja je cijela populacija za koju su nam potrebne informacije. Ukoliko nije moguće prikupiti podatke o svim jedinicama populacije, potrebno je odabrati određeni broj jedinica populacije koji čine uzorak i na osnovu uzorka analizirati obilježja istraživane populacije. Naprimjer, ako želimo analizirati studentsku populaciju BiH evidentno je da ovu populaciju čine svi studenti u BiH. •
Definisati jedinice populacije
Potrebno je jasno opisati i definisati jedinice populacije i njihove karakteristike koje ih precizno identificiraju. Populacija koja je predmet istraživanja se može definisati pomoću sljedećih karakteristika: - Priroda podataka koji su potrebni: o osobama, o ustanovama, o regionima itd. - Geografsko područje: potrebno je odrediti geografske granice za posmatranu populaciju, kao i nivo geografske preciznosti koji je neophodan (opština, grad, region, država, itd.). - Period posmatranja je period određen anketom. - Ostale karakteristike, kao npr. sociodemografske karakteristike (npr. različite starosne grupe, itd.) •
Definisati plan izbora uzorka
Cilj plana uzorka je odabiranje reprezentativnog uzorka. Uzorak je reprezentativan ako njegova struktura odgovara strukturi osnovnog skupa, odnosno ako predstavlja umanjenu sliku osnovnog skupa. U planu je potrebno precizirati način izbora elemenata u uzorak. Pri definisanju plana izbora uzorka treba nastojati izabrati slučajni uzorak koji daje preciznije 309
Statistika u ekonomiji i menadžmentu
ocjene parametara u odnosu na uzorke koji nisu slučajno odabrani. Mogu se i kombinovati različiti tipovi izbora elemenata u uzorak koji će biti analizirani u daljim izlaganjima. •
Formulisati i odrediti bazu uzorka ili okvir za izbor
Najjednostavniji okvir izbora je popis elemenata osnovnog skupa. Dakle, baza uzorka ili okvir za izbor je lista na kojoj se mogu identifikovati sve jedinice populacije koje mogu biti izabrane u uzorak. •
Odrediti veličinu uzorka
Veličina uzorka zavisi od više faktora kao što su priroda istraživanja, veličina populacije, vrsta analize podataka, preciznost istraživanja, osobine koje se istražuju, raspoloživi resursi itd. Stepen preciznosti potreban za procjene koje vršimo na osnovu ankete utiče na veličinu uzorka. Generalno, realna veličina uzorka jedne ankete se nalazi između stepeni preciznosti koji je potrebno postići, budžeta kojim anketa raspolože i svih ostalih ograničenja. Među navedenim faktorima koji utiču na određivanje veličine uzorka naglašavamo značaj sljedećih: - Varijabilnost karakteristika koje se posmatraju. Ukoliko studenti imaju isti iznos stipendije, dovoljan je podatak o jednoj stipendiji da bismo procijenili prosječnu stipendiju. Ako su stipendije vrlo različite potreban je veći uzorak da bismo dobili pouzdanu procjenu prosječne stipendije. - Veličina populacije: što je veća populacija postoji potreba da se odabere veći uzorak. Međutim, kada se dostigne određeni nivo dalje uvećanje populacije nema uticaja na veličinu uzorka. Veličina uzorka neophodna da bi se postigao određen stepen preciznosti biće, naprimjer skoro jednaka za jednu populaciju od milion kao i za dva puta veću populaciju. •
Nivo preciznosti
Najčešće se ocjene parametara osnovnog skupa na osnovu ocjena dobivenih iz uzorka vrše uz rizik od 5% ili 1%, odnosno uz nivo pouzdanosti 95% ili 99%. Postoji uvijek odgovarajući nivo rizika, greške ili nepreciznosti koji se vezuje za procjene dobijene na osnovu uzorka. Ako npr. želimo procijeniti prosječnu ocjenu 100 studenata i odaberemo uzorak od 15 studenata, 310
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
procjena će zavisiti od toga kojih smo 15 studenata odabrali. Ako odaberemo 15 studenata sa najvišom ili 15 sa najnižom ocjenom, rezultat ne može sa sigurnošću predstavljati prosječnu ocjenu svih studenata. Varijacija u prosječnoj ocjeni između različitih uzoraka proizvodi grešku uzorka. Statističari mogu procijeniti grešku uzorka za svako posebno istraživanje i nastojati da je što više smanje. Kada se priprema anketa potrebno je odrediti prihvatljivi nivo nesigurnostinepouzdanosti procjena koji se dobijaju na osnovu ankete.
6.2. VRSTE UZORKA I METODE ZA IZBOR UZORKA
Postoji više metoda za izbor uzoraka. Najzanačajnija je podjela na slučajno i namjerno odabrane uzorke. Razlika između ove dvije metode je u tome da se za slučajno izabrane uzorke za svaku jedinicu može unaprijed odrediti mogućnost da bude odabrana i ova mogućnost se može kvantifikovati, odnosno izraziti vjerovatnoćom izbora svake jedinice u uzorak. U slučaju namjernih uzoraka to nije moguće uraditi jer se zbog namjernog izbora jedinica u uzorak ne može primijeniti teorija vjerovatnoće. Slučajan izbor se naziva i objektivan način izbora jer se bazira na proceduri koja podrazumijeva da svaka jedinica osnovnog skupa ima jednaku mogućnost da bude izabrana za ispitivanje, odnosno unaprijed se može odrediti vjerovatnoća izbora svakog elementa u uzorak. Ako je poznata vjerovatnoća izbora u uzorak različita od nule uzorak je slučajan. Namjeran izbor jedinica u uzorak je subjektivan jer se izbor jedinica vrši prema ličnoj odluci i uvjerenju. Primjena ovog načina izbora podrazumijeva izbor tipičnih ili reprezentativnih jedinica osnovnog skupa prema mišljenju organizatora realizacije ankete. Pošto se jedinice odabiru namjerno za njih nije moguće utvrditi vjerovatnoću izbora. 6.2.1. Slučajni uzorci
Slučajne uzorke karakteriše osobina da se jedinice populacije odabiru slučajno u uzorak. U ovom slučaju je moguće utvrditi vjerovatnoću izbora svake jedinice u uzorak. Izbor uzoraka se bazira na principu vjerovatnoće i ova vrsta uzoraka je relativno skuplja. Zahvaljujući ovom tipu uzoraka moguće je vršiti pouzdane procjene kao i procjene greške uzorka i 311
Statistika u ekonomiji i menadžmentu
procjenjivati karakteristike populacije. Postoji više različitih metoda koje se mogu korisiti za izbor uzorka na osnovu vjerovatnoće. Metoda koja se odabire zavisi od određenog broja faktora kao što su baza posmatranja kojom se raspolaže, način na koji je populacija raspoređena, troškovi anketiranja, jedinice populacije i način na koji će korisnici analizirati podatke. Ako se odabere uzorak na osnovu vjerovatnoće cilj treba da bude da se što je moguće više smanji greška procjene za analizirane osobine osnovnog skupa. Najčešće metode koje se koriste za izbor uzoraka na osnovu vjerovatnoće su: • Jednostavni slučajni uzorak • Sistematski uzorak • Uzorak sa vjerovatnoćom proporcionalnom veličini • Stratifikovani uzorak • Uzorak skupina • Višestepeni (višeetapni) uzorak • Višefazni uzorak • Panel uzorak 6.2.1.1. Jednostavni slučajni uzorak
Kada odabiremo jednostavni slučajni uzorak svaki elemenat populacije ima jednaku vjerovatnoću da bude odabran u uzorak. Svaka kombinacija elemanata populacije ima također jednaku vjerovatnoću da predstavlja uzorak. Ove dvije osobine definišu jednostavni slučajni uzorak. Potrebno je kompletirati listu svih jedinica koji čine posmatranu populaciju da bi se odabrao jednostavni slučajni uzorak. Jednostavni slučajni uzorak se može odabrati sa i bez ponavljanja. Uzorak sa ponavljanjem znači da svaka jedinica populacije može biti izabrana u uzorak više puta. Ovim načinom izbora je obezbjeđena međusobna nezavisnost uzastopnih izbora elemenata u uzorak. U primjeni su više koristi prosti slučajni uzorak bez ponavljanja. On je efikasniji zato što svaka nova jedinica nosi novu informaciju i daje preciznije rezultate. Osnovni skupovi koji se analiziraju su vrlo veliki pa se promjene nastale vraćanjem jednog elementa u osnovni skup s obzirom na vjerovatnoću mogu zanemariti.
312
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Jednostavni slučajni uzorak je najjednostavniji za primjenu i najčešće se koristi. Postoje tipske formule za određivanje veličine uzorka i za procjene i ove formule su jednostavne za primjenu. Izvlačenje lota je primjer jednostavnog slučajnog uzorka. Treba slučajno izabrati uzorak od šest brojeva polazeći od osnovnog skupa od 49 brojeva. Svaki broj ima jednaku vjerovatnoću da bude izabran. Izbor jednostavnog slučajnog uzorka može se vršiti korištenjem tablice slučajnih brojeva. Ako je osnovni skup beskonačan iz njega možemo odabrati beskonačan broj različitih uzoraka veličine n. Prost slučajan uzorak iz beskonačnog osnovnog skupa je uzorak u kome su sve opservacije međusobno nezavisne. Zato je ovaj tip uzorka ekvivalentan sa prostim slučajnim uzorkom sa ponavljanjem odabranim iz konačnog osnovnog skupa. U oba slučaja izbori elemenata u uzorak su međusobno nezavisni. •
•
Kada se izvlačenje vrši iz konačnog osnovnog skupa sa ponavljanjem, ili iz beskonačnog osnovnog skupa, vjerovatnoća da svaki elemenat skupa od N elemenata bude izabran je jednaka
1 (6.1) N Ako se za uzorak odabere n elemenata, vjerovatnoća izbora za cijeli uzorak je jednaka n⋅
1 n = N N
(6.2)
Vjerovatnoća da se izabere jedan elemenat: 1 . • U prvom izvlačenju je N 1 uz uslov da nije bio izabran u prvom • U drugom izvlačenju N −1 N −1 . N Vjerovatnoća izbora tog elementa u drugom izvlačenju je složena ⎛ N − 1 ⎞⎛ 1 ⎞ 1 vjerovatnoća ⎜ ⎟⎜ ⎟= . ⎝ N ⎠⎝ N − 1 ⎠ N
313
Statistika u ekonomiji i menadžmentu
Vjerovatnoća da će taj elemenat biti izabran u trećem izvlačenju je 1 jednaka proizvodu između i vjerovatnoća da nije bio izabran N −1 u prvom i drugom izvlačenju:
⎛ 1 ⎞⎛ N − 1 ⎞⎛ N − 2 ⎞ 1 ⎜ ⎟⎜ ⎟⎜ ⎟= ⎝ N − 2 ⎠⎝ N ⎠⎝ N − 1 ⎠ N Na isti način će se dobiti vjerovatnoća 1/N i za ostala izvlačenja. Vjerovatnoća za izbor čitavog uzorka od n elemenata je: 1 n n⋅ = . N N Jednostavni slučajni uzorak veličine n elemenata dobijamo iz skupa od N elemenata ako se izbor obavlja tako da svaki uzorak veličine n koji se može slučajno izabrati iz osnovnog skupa ima istu vjerovatnoću da bude izabran. Iz konačnog osnovnog skupa veličine N ako se izbor vrši bez ponavljanja može se odabrati: C=
⎛N⎞ N! =⎜ ⎟ n!( N − n ) ! ⎝ n ⎠
(6.3)
kao broj uzoraka koji je jednak broju mogućih kombinacija od n različitih elemenata iz ukupno N elemenata. Vjerovatnoća za svaku kombinaciju ili uzorak od n elemenata da bude 1 n 1 izabrana je jednaka . Izraz n ⋅ = predstavlja proporciju N N ⎛N⎞ ⎜⎜ ⎟⎟ ⎝n ⎠ elemenata osnovnog skupa koji su izabrani u uzorak i ta se proporcija naziva i stopa, kvota ili frakcija izbora i označava sa f=n/N. Recipročna vrijednost stope izbora 1/f=N/n=k se naziva interval ili korak izbora.
314
(6.4)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Broj mogućih uzoraka veličine 10 izabranih iz osnovnog skupa N=30 je 30! 26 ⋅ 27 ⋅ 28 ⋅ 29 ⋅ 30 142506. k = = = 142506 . Vjerovatnoća da 5!(30 − 5!) 120 jedan određeni uzorak bude izabran je jednaka 1/142506. Iz osnovnog skupa od N=8 elemenata možemo odabrati 28 uzoraka od n=2 8! 7 ⋅8 = = 28 . Za svaki od 28 uzoraka vjerovatnoća elementa: k = 2!(8 − 2)! 1 ⋅ 2 da bude izabran je 1/28. Osnovni nedostatak ovog tipa uzorka je nereprezentativnost. Postoje načini da se i ovaj problem riješi odabirom ili primjenom stratifikovanog uzorka koji ćemo također analizirati. 6.2.1.2. Sistematski uzorak
Sistematski uzorak je slučajan uzorak u kojem izbor elemenata u uzorak vršimo po nekom sistematskom redu odabirući slučajno početak. Jenostavnim sistematskim izborom se po redu broje elementi osnovnog skupa i za uzorak se odabere npr. svaki drugi, peti, k-ti elemenat. Redni broj od kojeg počinje brojanje se određuje slučajnim izborom iz tablice slučajnih brojeva. Npr. ako na osnovu skupa od N=60 elemenata želimo odabrati sistematski uzorak od n=20 elemenata tada ćemo izabrati svaki k-ti elemenat k=N/n gdje je k interval ili korak izbora (k=60/20=3). U sistematskom izboru postoji jedno odstupanje ili interval između svake jedinice izabrane u uzorak. Da bi se odabrao sistematski uzorak potrebno je slijediti sljedeće etape: • Označiti od 1 do N jedinice uključene u bazu (gdje je N veličina posmatrane populacije) • Odrediti interval uzorka k kao dijeleći broj jedinica uključenih u populaciju sa veličinom uzorka koja se želi dobiti k=N/n. Ako želimo odabrati uzorak od 100 jedinica iz populacije od 400 jedinica interval uzorka će biti 4. Znači da je potrebno odabrati jednu jedinicu od četiri da bi se dobio uzorak veličine 100. • Odabrati slučajno jedan broj između 1 i k. Ovaj broj se naziva slučajno odabran početak i bit će prvi broj uključen u uzorak. Izabire se jedan broj od 1 do 4 na osnovu tabele slučajnih brojeva. 315
Statistika u ekonomiji i menadžmentu
•
Ako se odabere 3, treća jedinica baze podataka će biti prva jedinica uzorka. Odabire se svaka k-ta jedinica poslije ovog prvog broja. Uzorak naprimjer može biti sljedeći: 3, 7, 11, 15, 19....395, 399.
U ovom primjeru možemo konstatovati da svaka jedinica ima jednu šansu na četiri da bude izabrana u uzorak, dakle postoje ukupno četiri uzorka. Njena vjerovatnoća da bude izabrana je ista kao da se odabire jednostavni slučajni uzorak od 100 jedinica. Osnovna razlika je što u slučaju jednostavnog slučajnog uzorka svaka kombinacija od 100 jedinica ima jednu šansu da predstavlja uzorak, a u slučaju sistematskog uzorka postoje samo četiri moguća uzorka. To nam potvrđuje preciznost sistematskog uzorka u odnosu na jednostavni slučajni uzorak. Red prema kojem su jedinice populacije uključene u posmatranje odredit će moguće uzorke u ovom slučaju. Ako su jedinice populacije raspoređene slučajno u bazi posmatranja, sistematski uzorak daje rezultate slične kao jednostavni slučajni uzorak. Ova metoda se može korisiti u industriji da bi se selekcionisale jedinice za kontrolu u jednom proizvodnom procesu. Naprimjer, za kontrolu kvaliteta može se odabrati svaki 20-ti proizvod na liniji montaže. Može se odabrati jedan slučajni početak između brojeva jedan i dvadeset. Tim se određuje prvi proizvod za kontrolu i svaki 20-ti koji slijedi će biti podložan kontroli. Za istraživanje tržišta pomoću ankete uzorka može se odabrati naprimjer svaka 10-ta osoba koja uđe u prodavnicu poslije slučajno odabrane prve osobe. Prednost sistematskog uzorka je jednostavnost izbora uzorka. Broj mogućih uzoraka je manji i do njih se jednostavnije dolazi, posebno kod velikog uzorka. Potrebno je odabrati slučajni početak i ostatak uzorka slijedi automatski tako da je uzorak raspoređen u jednakim proporcijama u populaciji. Najveći nedostatak ovog tipa uzorka je nereprezentativnost u slučajevima kada postoji određeni način prema kojem je populacija upisana u listu i ako se taj način poklapa sa intervalom uzorka. 6.2.1.3. Uzorak sa nejednakom vjerovatnoćom izbora jedinica
Za uzorak odabran na osnovu teorije vjerovatnoće je potrebno da svaka jedinica posmatrane populacije ima određenu vjerovatnoću da bude odabrana u uzorak, ali ta vjerovatnoća ne mora biti jednaka za sve jedinice. Ako u bazi posmatranja raspolažemo sa informacijom o veličini svake jedinice (kao naprimjer broj zaposlenih u svim preduzećima koja se 316
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
posmatraju) i ako veličina ovih jedinica varira, ova informacija se može koristiti da bi se povećala efikasnost izbora uzorka. Takav tip uzorka se naziva i uzorak sa vjerovatnoćom proporcionalnom veličini posmatranih jedinica populacije. U slučaju ove metode veća jedinica ima više šansi da bude odabrana u uzorak. Potrebno je da mjerenje veličina bude tačno da bi ova metoda povećala efikasnost. Ova metoda je vrlo kompleksna. 6.2.1.4. Stratifikovani uzorak
Kada je osnovni skup heterogen potrebno ga je podijeliti na karkteristične, jasno razgraničene homogene podskupove koji se nazivaju stratumima. Tako svaki stratum postaje jedan nezavisan podskup. Karakteristike jedinica unutar stratuma treba da budu što sličnije. Zatim se za svaki stratum određuje veličina uzorka i iz svakog stratuma bira po jedan slučajni uzorak. Na taj način se formira stratifikovani uzorak koji je sastavljen od prostih slučajnih nezavisnih uzoraka od kojih je svaki izabran iz jednog stratuma. Metoda izbora jedinica iz svakog stratuma može da bude različita. Ako se koristi jednostavni slučajni uzorak za izbor uzoraka iz svih stratuma takav uzorak se naziva jednostavni slučajni stratifikovani uzorak. Sve jedinice stratuma imaju jednaku vjerovatnoću da budu izabrane u uzorak. Pošto stratumi nisu jednake veličine, sve jedinice skupa imaju različite, ali poznate vjerovatnoće izbora. Najvažnije je odabrati kriterij za stratifikaciju prema kome formiramo relativno homogene i razgraničene stratume kojima obezbjeđujemo reprezentativnost i donošenje preciznijih zaključaka o osnovnom skupu. Prednosti ovog tipa uzorka su efikasnost i preciznost procjene karakteristika osnovnog skupa. 6.2.1.5. Uzorak skupina (klaster uzorak)
U slučajevima kada ne raspolažemo listom svih jedinica, odnosno odgovarajućom bazom uzorka, ili kada je osnovni skup velik i sastavljen od jedinica koje su npr. prostorno vrlo udaljene, tada troškovi ankete mogu biti vrlo veliki. Da bi se smanjili troškovi moguće je primijeniti metodu uzorka skupina. Populacija se dijeli na skupine. Selekcioniše se slučajno određeni broj skupina koje predstavljaju populaciju, a zatim se u uzorak uključuju sve jedinice koje se nalaze u selekcionisanim skupinama. Potrebno je da skupine po strukturi budu što sličnije strukturi osnovnog skupa. One 317
Statistika u ekonomiji i menadžmentu
predstavljaju cjeline unutar osnovnog skupa i razlikuju se po veličini. Zatim se izvrši popis svih elemenata u odabranim skupinama i takav uzorak nazivamo prostim uzorkom skupina. U uzorak se ne odabiru jedinice koje se ne nalaze u selekcionisanim skupinama. Pretpostavlja se da su one reprezentovane jedinicama iz selekcionisanih skupina. Razlika između ovog tipa uzorka i stratifikovanog uzorka je činjenica da se u slučaju stratifikovanog uzorka izbor jedinica u uzorak vrši iz svake grupe – stratuma. Selekcionisane skupine se koriste da bi prezentirale populaciju. Činjenica da se vrlo često ne raspolaže sa listama svih jedinica populacije (lista je neophodna za jednostavni slučajni uzorak, sistematski uzorak ili uzorak sa vjerovatnoćom proporcionalnom veličini) i da je jednostavnije kompletirati listu skupina, predstavlja jedan od razloga za primjenu uzorka skupina. Nedostatak ove metode je manja efikasnost nego u slučaju jednostavnog slučajnog uzorka. Korisnije je odabrati veliki broj manjih skupina nego mali broj velikih skupina zbog toga što se jedinice koje su bliže jedne drugima sličnije i tako odabran uzorak nije dovoljno reprezentativan za cijelu populaciju. Uzorci skupina ne omogućavaju da se kontroliše konačna veličina uzorka i to je jedna od nedostataka ove metode. Naprimjer, sve škole nemaju isti broj učenika četvrtih razreda i ako se želi anketirati svaki učenik odabran u uzorak, uzorak može biti veći ili manji nego što se očekuje. 6.2.1.6. Višestepeni uzorak
Ovaj tip uzorka je sličan uzorku skupina. U slučaju uzorka skupina potrebno je uključiti sve jedinice selekcionisanih skupina. Uzorak može da bude sastavljen od grupa ili skupina koje se sastoje od manjeg broja elementarnih jedinica. Kod višestepenog uzorka izbor se odvija u više etapa. Ovaj tip uzorka se naziva i višeetapni. U prvoj etapi se iz osnovnog skupa odabire uzorak (skupina), a zatim se iz tako odabranih uzoraka vrši dalji izbor jedinica. Višestepeni uzorak zahtijeva najmanje dva nivoa. Na prvom nivou se odaberu velike grupe ili skupine i one sadrže veći broj jedinica nego što je potrebno za finalni uzorak. Da bi se dobio finalni uzorak na drugom nivou se odabiru jedinice populacije iz selekcionisanih skupina primjenom jedne od prethodno 318
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
analiziranih metoda. Ako se koristi više od dva nivoa, proces selekcije jedinica populacije iz skupina se nastavlja do kompletiranja finalnog uzorka. Ovaj tip uzorka ima veličinu veću nego jednostavni slučajni uzorak. Nema potrebe za listom cijele populacije, ali traži više informacija nego uzorak skupina. (Naprimjer, prva faza bi bio izbor opština, a druga domaćinstva u odabranim opštinama). Na sljedećem primjeru ćemo uporediti uzorak skupina i višestepeni uzorak. Želimo analizirati sportske aktivnosti učenika 4-tih razreda srednjih škola u BiH. Odabere se uzorak od npr. 50 škola. Ove škole predstavljaju uzorak skupina. Zatim se ispituje svaki učenik 4-tog razreda ovih škola. Međutim, može se odabrati 50 škola, kompletirati lista svih učenika 4-tih razreda tih škola i odabrati uzorak učenika iz svakog razreda koji će se ispitivati. U ovom slučaju radi se o dvostepenom planu uzorka. Može se pri izboru postupiti i na sljedeći način: prvo selekcionisati škole, odabrati slučajnim uzorkom na osnovu liste 4-tih razreda uzorak razreda iz svake škole, a zatim na osnovu liste učenika odabranih razreda odabrati slučajan uzorak učenika koji će biti ispitani. Elementarne jedinice su skoncentrisane što smanjuje troškove ankete, ali je preciznost manja nego kod prostog slučajnog i stratifikovanog uzorka. 6.2.1.7. Višefazni uzorci
U prvoj fazi se odabire veliki uzorak i prikupljaju podaci o karakteristikama jedinica uzorka. Zatim se u drugoj fazi iz postojećeg odabire poduzorak za čije se jedinice vrši detaljnije prikupljanje podataka. Najčešće se koristi dvofazni uzorak, ali je, naravno, moguća upotreba uzorka u tri ili više faza. Višefazni uzorak se dosta razlikuje od višestepenog uzorka. Iako se i u ovom slučaju odabiru dva ili više uzoraka, baza za njihov izbor je uvijek ista i jedinice su iste u svakoj fazi. Plan uzorka i procjene na osnovu uzorka postaju kompleksniji ako se koristi više faza u odabiru uzorka. Ovaj tip uzorka je koristan kada u bazi uzorka nedostaju dodatne informacije koje omogućavaju primjenu stratifikovanog uzorka i u slučajevima kada se ne raspolaže sa dovoljno sredstava da bi se sakupili podaci na osnovu cijelog uzorka. 319
Statistika u ekonomiji i menadžmentu
6.2.1.8. Panel uzorak
Panel uzorak se najčešće koristi da bi se istražile promjene karakteristika populacije u vremenu. Zadatak je da se kontinuirano prate neke pojave. Česta upotreba panel uzorka je u istraživanju tržišta, praćenju troškova života, itd. Izabrani potrošači odgovaraju na povremene ankete. Međutim, promjena ispitivanih jedinica kao i promjena pojave su značajni nedostaci ovog tipa uzorka. Primjena panel uzorka je ograničena na prethodna istraživanja u primjeni ankete. 6.2.1.9. Namjerni uzorci
Namjerno izabrani uzorci su uzorci odabrani na osnovu subjektivnih kriterija ili uzorci koji se ne baziraju na teoriji vjerovatnoće. U ovom izboru se pretpostavlja da je distribucija karakteristika unutar populacije jednaka. U ovom slučaju, pošto se jedinice odabiru proizvoljno, ne postoji nikakva mogućnost da se procijeni vjerovatnoća uključivanja jedne jedinice u uzorak. Ne postoji ni mogućnost utvrđivanja pouzdanosti ovog plana uzorka i preciznosti dobijenih ocjena, dakle ne može se odrediti greška procjene karakteristika osnovnog skupa. Bez obzira na navedene nedostatke, plan uzorka koji se ne bazira na vjerovatnoći može biti koristan ako se žele dobiti deskriptivni komentari o pojavi koja se istražuije. Njihova primjena zahtijeva mali utrošak vremena i sredstava, pa su ekonomični i praktični. Ovaj tip uzorka se može kombinovati sa uzorkom na bazi vjerovatnoće. Vrlo često se koriste i kombinuju namjerni i slučajni uzorci. Npr. namjerni uzorci se koriste da bi se testirali upitnici ili u nekim preliminarnim fazama konstrukcije ankete, a zatim slučajni za realizaciju anketa. Upotreba namjernog uzorka je opravdana u nekim okolnostima. Prednost ovog tipa uzorka je što se u uzorak mogu odabrati jedinice do kojih je lakše doći ili za koje se pretpostavlja da mogu pružiti informacije o istraživanoj pojavi. Ovaj tip uzorka je pogodan za pilot istraživanja da bi se o osnovnom skupu dobile bitne polazne informacije. 6.2.1.9.1. Kvota uzorak
Među namjernim uzorcima je najčešći kvota uzorak. U tom planu izbora uzorka se, u skladu sa specifičnim kriterijem i ciljem istraživanja, odabiru potpopulacije iz koji se mora anektirati određeni broj jedinica. Svaki 320
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
anketar dobije uputu o broju ili proporciji jedinica iz svakog podskupa, odnosno grupe koje treba anketirati. Kvota uzorak zavisi od odluke i sklonosti anketara. Kvota uzorak se mnogo primjenjuje u ispitivanju javnog mišljenja. Može dati zadovoljavajuće rezultate ako se anketari pridržavaju datih uputa. Ovaj tip uzorka nije skup, jednostavno se realizuje i ima poželjnu osobinu da respektuje proporcije u populaciji. U ovom slučaju, kao i u slučaju ostalih namjernih uzoraka, pretpostavlja se da su odabrane jedinice slične onima koje nisu odabrane da bi se mogle donijeti sudovi o karakteristikama populacije. 6.2.1.9.2. Prigodan uzorak
Prigodan izbor uzorka se obavlja prema prigodi, a ne slučajno, niti prema nahođenju. Uzorak dobiven iz raspoloživih listi (telefonski imenik ili registar pretplatnika) prigodno je izabran, a nije slučajan iako je slučajno izabran iz spomenute liste. Ova vrsta uzorka se primjenjuje vrlo često u ispitivanju javnog mišljenja. Korisna primjena ovog tipa uzorka je u pilot ispitivanju, pri testiranju upitnika i za dobivanje potrebnih informacija za izbor definitivnog plana istraživanja. 6.2.1.9.3. Dobrovoljan uzorak
Dobrovoljan uzorak je uzorak koji se dobije ukoliko osobe same ponude svoje usluge za ispitivanje. Klasičan primjer ovog tipa uzorka je testiranje novih lijekova. Iz grupe dobrovoljaca se odabire uzorak osoba na kojima će se vršiti testiranje. Vrlo često se kombinuju različiti planovi izbora uzoraka da bi se postigao cilj - preciznost, pouzdanost i efikasnost procjene karakteristika osnovnog skupa na osnovu rezultata dobijenih u uzorku.
6.3. PROCJENE OBILJEŽJA OSNOVNOG SKUPA NA OSNOVU UZORKA
Promjenom metoda inferencijalne statistike zaključci o parametrima osnovnog skupa se donose procjenom na osnovu podataka iz uzoraka. Postupak kojim se na osnovu podataka iz uzorka vrši procjena parametara osnovnog skupa se naziva metoda procjene. Kada se iz osnovnog skupa 321
Statistika u ekonomiji i menadžmentu
(konačnog ili beskonačnog) izabere uzorak, parametri osnovnog skupa se procjenjuju na osnovu vrijednosti izračunatih iz uzorka. Formula, funkcija ili izraz koji se koristi za procjenu se naziva procjenitelj ili estimator. Procjenitelj je, dakle, funkcija vrijednosti iz uzorka. To je slučajna varijabla koja varira za različite uzorke. Sve procjene dobivene na osnovu slučajnih uzoraka veličine n iz istog osnovnog skupa koje su izračunate metodom procjena čine distribuciju vjerovatnoće procjenitelja. Distribucija vjerovatnoće procjenitelja je teorijska distribucija za koju se mogu izračunati očekivana vrijednost, standardna devijacija i koeficijent varijacije. Procjenitelj je predstavljen formulom koja omogućuje da se iz podataka uzorka dobije numerička vrijednost za osnovni skup koja se naziva procjena. Procjene mogu biti izražene jednim brojem ili intervalom procjene. Procjenom jednim brojem se dolazi do vrijednosti parametra osnovnog skupa. Pomoću intervalne procjene se utvrđuju granice ili raspon vrijednosti u kojima se, uz određeni nivo pouzdanosti, nalazi nepoznati parametar osnovnog skupa. Predmet naše analize će biti intervalne procjene. Drugi pristup procjeni karakteritika osnovnog skupa je ispitivanje pretpostavki o parametrima testiranjem hipoteza. Postupak procjene ćemo objasniti i generalizirati na sljedećem primjeru. Iz osnovnog skupa od N elemenata se izabire (N1 ) različitih uzoraka veličine n. Za svaki od tih uzoraka se izračuna parametar θˆ pomoću kojeg će se procijeniti taj parametar za osnovni skup. Ova parametar je različit od iste karakteristike posmatranog skupa i različit za svaki od uzoraka. Varijacija ovog parametra za različite uzorke se naziva varijacija izbora uzorka i formira distribuciju parametra procjenitelja. Ako su uzorci izabrani slučajno i vrijednosti ovog parametra su slučajne što znači da se radi o slučajnoj varijabli θˆ . Vrijednosti ove varijable su slučajno raspoređene prema nekoj distribuciji vjerovatnoće. Ako se može odrediti distribucija vjerovatnoće ove varijable tada se može odrediti i vjerovatnoća da će θˆ imati vrijednost manju ili jednaku od nekog realnog broja, ako se radi o prekidnoj varijabli, ili vjerovatnoća da će se θˆ nalaziti u intervalu realnih brojeva, ako se radi o kontinuiranoj varijabli. Za ovu distribuciju možemo odrediti očekivanu vrijednost (aritmetičku sredinu) i varijansu, odnosno standardnu devijaciju.
322
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Procjena parametra osnovnog skupa θ se vrši na osnovu izračunate vrijednosti θˆ iz uzorka. Da bi se dobila intervalna procjena potrebno je izračunati donju i gornju granica intervala u kojem se, sa određenom vjerovatnoćom, nalazi parametar osnovnog skupa θ . Intervalnu procjenu izražavamo na sljedeći način:
θˆ - greška procjene < θ < θˆ +greška procjene
(6.5)
Ocjena parametra osnovnog skupa pomoću parametra iz uzorka će biti nepristrasna ako je očekivana vrijednost (aritmetička sredina) parametra iz uzorka θˆ jednaka vrijednosti parametra iz osnovnog skupa:
E (θˆ) = θ
(6.6)
Ukoliko ovaj uslov nije zadovoljen, ocjena je pristrasna. Statistička pristrastnost je, dakle, razlika izmedu očekivane vrijednosti procjenitelja θˆ i prave vrijednosti osobine osnovnog skupa. Poželjne osobine ocjene su, pored nepristrasnosti, efikasnost i konzistentnost. Ocjena je efikasna ukoliko ima manji varijabilitet za istu veličinu uzorka. Ocjena parametara osnovnog skupa na osnovu uzorka je konzistentna ukoliko sa povećanjem uzorka teži stvarnoj vrijednosti parametra osnovnog skupa. U narednom dijelu ćemo analizirati osobine procjenitelja aritmetičke sredine u slučajevima uzorka sa ponavljanjem i uzorka bez ponavljanja. •
Slučajan uzorak sa ponavljanjem
Ako iz osnovnog skupa N izvučemo k uzoraka veličine n i za svaki od tih uzoraka izračunamo aritmetičku sredinu dobićemo onoliko artimetičkih sredina koliko imamo uzoraka. S obzirom da su uzorci izabrani slučajno, aritmetička sredina uzorka je slučajna varijabla za koju možemo izračunati aritmetičku sredinu. Za svaki uzorak možemo odrediti aritmetičku sredinu:
xi =
1 n ∑ xi n i =1
(6.7)
323
Statistika u ekonomiji i menadžmentu
Aritmetička sredina aritmetičkih sredina uzoraka je jednaka:
x=
1 k ∑ xi k i =1
(6.8)
Očekivanu vrijednost (aritmetičku sredinu) aritmetičkih sredina uzoraka možemo posmatrati kao očekivanu vrijednost aritmetičke sredine uzorka uz pretpostavku da su aritmetičke sredine uzoraka xi nezavisne
⎛1 n ⎞ 1 n 1 n 1 E ( x ) = E ( xi ) = E ⎜ ∑ xi ⎟ = ∑ E ( xi ) = ∑ μ = ⋅ nμ = μ n i =1 n ⎝ n i =1 ⎠ n i =1
(6.9)
čime dokazujemo da je aritmetička sredina aritmetičkih sredina uzoraka jednaka aritmetičkoj sredini osnovnog skupa. To znači da je procjena aritmetičke sredine osnovnog skupa na osnovu aritmetičke sredine uzorka nepristrasna procjena i parametar procjene ili procjenitelj je nepristrasan. Jedinice uzorka posmatramo kao nezavisne slučajne promjenljive čije su očekivane vrijednosti jednake međusobno i jednake očekivanoj vrijednosti osnovnog skupa koji je normalno raspoređen sa parametrima N(μ,σ2) E(x1)=E(x2)=...E(xn)= μ
(6.10)
Iz izraza (6.9.) i (6.10.) slijedi da je aritmetička sredina aritmetičkih sredina uzorka jednaka aritmetičkoj sredini osnovnog skupa. Pošto su varijable Xi nezavisne možemo odrediti i varijansu aritmetičke sredine uzoraka sa ponavljanjem:
⎛1 n ⎞ 1 ∑ xi ⎟ = 2 ⎝ n i =1 ⎠ n
σ 2 = σ 2 ( xi ) = σ 2 ⎜
n
∑σ 2 = i =1
1 σ2 2 n ⋅ ⋅ = σ n2 n
(6.11)
Ovaj parametar služi za mjerenje disperzije aritmetičkih sredina uzoraka oko aritmetičke sredine osnovnog skupa što omogućuje mjerenje greške uzoraka. Ako je ovaj parametar manji, greška ocjene je manja i ocjena preciznija. Drugi korijen iz varijanse distribucije sredina uzoraka daje standardnu devijaciju distribucije sredina uzoraka koja se zove „standard error“ ili standardna greška ocjene aritmetičke sredine osnovnog skupa. Pošto standardna devijacija predstavlja mjeru odstupanja artimetičke sredine 324
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
uzorka od aritmetičke sredine osnovnog skupa ona pokazuje i koju grešku u prosjeku činimo ovom ocjenom i zbog toga se naziva i standardna geška ocjene. •
Slučajni uzorak bez ponavljanja
U slučaju uzorka bez ponavljanja uzastopna izvlačenja nisu nezavisna pa slučajne promjenljive uzorka nisu nezavisne. Pokazuje se da je u ovom slučaju varijansa aritmetičke sredine uzorka jednaka:
N −n σ2 ⋅ σ = σ ( xi ) = n −1 n 2 x
2
(6.12)
Varijansu aritmetičkih sredina uzoraka od n elemenata možemo odrediti ako poznajemo varijansu i veličinu osnovnog skupa. Standardnu devijaciju aritmetičke sredine uzoraka nazivamo standardnom greškom i računamo pomoću sljedećeg izraza:
σx =
N −n σ ⋅ N −1 n
(6.13)
U ovom izrazu faktor
N −n N −1
(6.14)
predstavlja faktor korekcije za konačne osnovne skupove. Ako je n =1 tada je varijansa uzorka jednaka varijansi osnovnog skupa σ x2 = σ 2 . Za N=n uzorak se izjednačava sa osnovnim skupom pa je varijansa jednaka nuli σ x2 = 0 . Ako je osnovni skup veliki tada je faktor korekcije približno jednak jedinici, a varijansa aritmetičkih sredina uzoraka približno jednaka varijansi osnovnog skupa podijeljenoj sa n:
N −n σ2 ≈ 1 i σ x2 ≈ N −1 n
(6.15)
325
Statistika u ekonomiji i menadžmentu
Dakle, dobijamo isti rezultat kao i u primjeni nezavisnih uzoraka. Standardna devijacija je jednaka σ x =
σ
n
.
Ako varijansa osnovnog skupa nije poznata, njenu procjenu ne možemo vršiti na osnovu varijanse uzorka zbog toga što je varijabilitet u uzorcima manji od varijabiliteta u osnovnom skupu. U tom slučaju procjena varijanse bi bila pristrasna ako bismo koristili izraz:
σ i2 =
1 n (xi − x )2 ∑ n i =1
(6.16)
Zbog toga se za dobijanje nepristrasne ocjene varijanse koristi izraz:
σˆ 2 =
1 n (xi − x )2 ∑ n − 1 i =1
(6.17)
koji možemo napisati i u sljedećem obliku:
σˆ 2 =
n 1 n 1 n 2 n 2 ( ) x − x ⋅ = ⋅ ∑ ( xi − x ) ∑ i n − 1 i =1 n n − 1 n i =1
σˆ 2 =
n ⋅ σ i2 n −1
(6.18)
koji se naziva korigovana varijansa. Ovaj izraz predstavlja nepristrasnu ocjenu varijanse osnovnog skupa u kojoj je član n/(n-1) faktor korekcije pristrasnosti ocjene, a σ i2 predstavlja varijansu uzorka. Za velike uzorke (n≥30) faktor korekcije se približava jedinici pa se u praktičnim izračunavanjima može i zanemariti. U ovom slučaju standardnu devijaciju osnovnog skupa treba zamijeniti izrazom za korigovanu standardnu devijaciju. Tada će se standardna greška procjene aritmetičke sredine osnovnog skupa moći izračunati iz podataka o uzorku koristeći sljedeću relaciju:
σx =
326
σˆ n
⋅
N −n ⇒σ x = N −1
n ⋅σ i N −n n −1 ⋅ N −1 n
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
σx =
σi n −1
⋅
N −n N −1
(6.19)
n 3 , ili prema nekim < N 100 autorima od 0.05, faktor korekcije za konačne osnovne skupove je jednak jedinici pa gornju relaciju pišemo u sljedećem obliku: Ukoliko je frakcija izbora manja od 0,03 tj
σx =
σˆ n
=
n n −1 σ = σ i i n n −1
(6.20)
Varijansa se smanjuje ukoliko se poveća veličina uzorka. Ocjena je konzistentna ako teži stvarnoj vrijednosti parametra kada se uzorak povećava.
6.4. ODREĐIVANJE INTERVALA POVJERENJA
Mi ćemo analizirati i prezentirati određivanje intervala povjerenja, odnosno intervalne procjene za: aritmetičku sredinu, proporciju, varijansu i standardnu devijaciju, parametre modela linearne regresije, totala osnovnog skupa, medijane i koeficijenta korelacije. 6.4.1. Intervalna procjena aritmetičke sredine osnovnog skupa 6.4.1.1. Intervalna procjena aritmetičke sredine osnovnog skupa čija je varijansa poznata
Pretpostavimo da je osnovni skup normalno raspoređen. Tada varijabla X osnovnog skupa i varijable X1, X2, ..., Xn uzorka imaju normalnu distribuciju: X ~ N(μ,σ2). Tada aritmetička sredina uzorka ima normalnu distribuciju sa aritmetičkom sredinom μ i varijansom (σ 2 / n) :
⎛ σ2 ⎞ x ~N ⎜ μ , ⎟ n ⎠ ⎝
(6.21)
327
Statistika u ekonomiji i menadžmentu
Ilustraciju analiziranog slučaja smo predstavili na grafikonu 6.1.
f (x)
σ n
μ Grafikon 6.1.
x
Distribucija aritmetičke sredine uzorka – normalna distribucija
Ako standardiziramo slučajnu varijablu aritmetička sredina uzorka x dobijamo:
Z=
x−μ
σ/ n
~ N (0,1)
(6.22)
Ako Z ~ N(0,1) i z1−α / 2 je kvantil reda (1-α/2) od Z, tada možemo napisati izraz za vjerovatnoću da će se Z nalaziti u intervalu ± z1−α / 2 :
p(− z1−α / 2 ≤ Z ≤ z1−α / 2 ) = 1 − α
(6.23)
U praksi se najčešće koristi greška, odnosno rizik ocjene koji označavamo sa α od 5% ili 1%. U tim slučajevima nivo pouzdanosti ( 1 − α ) je 95% i 99% respektivno, a odgovarajuća vrijednost koeficijenta pouzdanosti z1−α / 2 je jednaka 1,96 i 2,58 respektivno. Za sve ostale nivoe greške koeficijenti z1−α / 2 su tabelirani i nalaze se u tablici standardizovane normalne distribucije. Tablice ove distribucije se nalaze u prilogu knjige.
328
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
f (z)
z ∼ N (0;1)
1− a
a/2 −3 Grafikon 6.2.
− z1−a / 2
a/2
z1−a / 2
0
z
3
Interval povjerenja (1 − a ) aritmetičke sredine osnovnog skupa čija je varijansa poznata
Ako u izrazu 6.23. zamijenimo Z sa Z =
x −μ σ/ n
dobijamo:
x−μ ⎞ ⎛ ≤ z1−α / 2 ⎟ = 1 − α p⎜ − z1−α / 2 ≤ σ/ n ⎠ ⎝
σ σ ⎞ ⎛ p⎜ − z1−α / 2 ⋅ ≤ x − μ ≤ z1−α / 2 ⋅ ⎟ = 1−α n n⎠ ⎝ σ σ ⎞ ⎛ p⎜ − x − z1−α / 2 ⋅ ≤ − μ ≤ − x + z1−α / 2 ⋅ ⎟ = 1−α n n⎠ ⎝ ⎛ σ σ ⎞ p⎜⎜ x − z1−α / 2 ⋅ ⎟⎟ = 1 − α ≤ μ ≤ x + z1−α / 2 ⋅ n n⎠ ⎝
(6.24)
Kada odaberemo kontrolisanu grešku ili rizik ocjene α, tada će interval povjerenja (1-α) za aritmetičku sredinu osnovnog skupa biti μ:
x ± z1−α / 2 ⋅
σ
n
, odnosno
329
Statistika u ekonomiji i menadžmentu
x − z1−α / 2 ⋅
σ n
≤ μ ≤ x + z1−α / 2 ⋅
σ
(6.25)
n
Grafička ilustracija ovog intervala povjerenja je prezentirana na grafikonu 6.3.
f ( x)
1− a
x - z1-a / 2 ·(σ / n ) Grafikon 6.3.
μ
Interval povjerenja
x + z1-a / 2 ·(σ / n )
1 − a za μ x ± z1−a / 2 ⋅ (σ / n )
Širina intervala povjerenja se smanjuje ako se α povećava, odnosno ako se (1-α) smanjuje ili ako se n povećava. Ako je potrebno izračunati veličinu uzorka n, uz uslov da polovina širine intervala povjerenja bude manja ili jednaka od neke vrijednosti, treba postupiti na sljedeći način:
z1−α / 2 ⋅
σ n
≤d
z1−α / 2 ⋅ σ ≤ d n n≥
z1−α / 2 ⋅ σ d
⋅σ ⎞ ⎛z n ≥ ⎜ 1−α / 2 ⎟ d ⎠ ⎝ 330
2
(6.26)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.4.1.2. Procjena intervala aritmetičke sredine osnovnog skupa čija je varijansa nepoznata
Za standardizovanu varijablu Z=
x−μ ~ N (0,1) , nepristrasna ocjena od σ/ n
σ / n je jednaka σ n
=
σˆ n
=
n n −1 σ = i n
σi n −1
(6.27)
Zamjenjujući izraz (6.27) u izraz za standardizovanu varijablu Z dobijamo x−μ promjenljivu koja ima Studentovu distribuciju t sa (n-1) stepeni σ i / n −1 slobode:
x−μ ~ t n −1 σ i / n −1
(6.28)
Interval povjerenja za aritmetičku sredinu osnovnog skupa μ za nivo pouzdanosti (1-α) je jednak:
⎛ ⎞ ⎜ − t n−1;1−α / 2 ≤ x − μ ≤ t n−1;1−α / 2 ⎟ = 1 − α ⎜ ⎟ σ i / n −1 ⎝ ⎠
(6.29)
gdje je t n−1;1−α / 2 kvantil reda (1-α/2) od t n−1 . Interval povjerenja za aritmetičku sredinu osnovnog skupa μ je jednak:
x ± t n−1;1−α / 2 ⋅
σi n −1
(6.30)
Na grafikonu 6.4. smo predstavili interval povjerenja za aritmetičku sredinu osnovnog skupa čija varijansa nije poznata.
331
Statistika u ekonomiji i menadžmentu
f (t )
1− a
a/2
a/2
− tn−1;1−a / 2
0
− tn−1;1− a / 2
t
Studentova distribucija za interval povjerenja aritmetičke sredine osnovnog skupa Grafikon 6.4. čija je varijansa nepoznata
6.4.1.3. Interval povjerenja za aritmetičku sredinu osnovnog skupa čija distribucija nije poznata
Interval povjerenja za aritmetičku sredinu osnovnog skupa čija distribucija nije poznata ćemo analizirati za uzorke sa ponavljanjem i za uzorke bez ponavljanja. 6.4.1.3.1. Uzorak sa ponavljanjem i poznatom varijansom osnovnog skupa
Kada je varijansa osnovnog skupa poznata dobijamo isti interval povjerenja kao u slučaju kada arimetička sredina ima normalnu distribuciju. Ovaj rezultat je “asimptotičan” jer primjenjujemo centralnu graničnu teoremu kada n → ∞ . Interval povjerenja (I.P) za aritmetičku sredinu osnovnog skupa je jednak:
I .P.(1 − α ) za μ : x ± z1−α / 2 ⋅
332
σ n
(6.31)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.4.1.3.2. Uzorak sa ponavljanjem i nepoznatom varijansom osnovnog skupa
Interval povjerenja ocjene aritmetičke sredine osnovnog skupa za uzorak sa ponavljanjem i nepoznatom varijansom osnovnog skupa je jednak:
I .P.(1 − α ) za μ : x ± t n−1;1−α / 2 ⋅
σi
(6.32)
n −1
Ako je n ≥30 možemo izvršiti aproksimaciju pomoću normalne distribucije i dobiti sljedeći interval povjerenja:
I .P.(1 − α ) za μ : x ± z1−α / 2 ⋅
σi
(6.33)
n −1
6.4.1.3.3. Uzorak bez ponavljanja ako je n dovoljno velik (n≥30) i poznata varijansa osnovnog skupa
U ovom slučaju aritmetička sredina uzorka slijedi normalnu distribuciju sa parametrima
⎛ σ N −n⎞ x ~ N⎜ μ , ⋅ ⎟ ⎝ n N −1 ⎠
(6.34)
Interval povjerenja za nivo povjerenja (1-α) je jednak:
I .P.(1 − α ) : x ± z1−α / 2 ⋅
σ n
N −n N −1
(6.35)
6.4.1.3.4. Uzorak bez ponavljanja ako je n dovoljno velik (n≥30) i varijansa osnovnog skupa nije poznata
Interval povjerenja u ovom slučaju jednak je:
I .P.(1 − α ) za μ : x ± z1−α / 2 ⋅
σi n −1
N −n N −1
(6.36)
U narednoj šemi smo prezentirali procjenu intervala arimetičke sredine osnovnog skupa za različite slučajeve koje smo prethodno analizirali.
333
Statistika u ekonomiji i menadžmentu
Procjena intervala povjerenja aritmetičke sredine osnovnog skupa μ
osnovni skup ima normalnu distribuciju
poznata varijansa osnovnog skupa
x±z
1−
α
⋅
2
σ
nepoznata varijansa osnovnog skupa
x±t
n
osnovni skup s nepoznatom distribucijom
n−1;1 −
α
σi
⋅
n −1
2
uzorci sa ponavljanjem
uzorci bez ponavljanja
n > 30 poznata varijansa
x±z
1−
α 2
⋅
σ n
nepoznata varijansa
x±t
⋅
n −1 ako je n > 30 n−1;1 −
2
poznata varijansa
x±z
1−
α 2
⋅
σ n
⋅
N −n N −1
nepoznata varijansa
x±z
1−
α 2
⋅
σ ii n −1
⋅
N −n N −1
aproksimiramo
x±z
1−
Šema 6.1.
α
σi
α 2
⋅
σi
n −1
Procjena intervala povjerenja aritmetičke sredine μ osnovnog skupa
6.4.2. Procjena intervala povjerenja za proporciju
Da bismo procijenili interval povjerenja za proporciju osnovnog skupa pored simbola označenih na sljedećem grafikonu primijenićemo sljedeće termine i simbole: • n veličina uzorka • pA proporcija događaja A u osnovnom skupu, • nA veličina uzorka koji sadrži događaj A n • proporcija događaja A u uzorku: pˆ A = A n
334
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Osnovni skup
1-pA
A(NA)
A(N-NA)
nA
n-nA
pA Uzorak Grafikon 6.5.
Procjena intervala povjerenja za proporciju
Osnovni skup je podijeljen na dva dijela. Pretpostavimo da se radi o jednostavnom slučajnom uzorku u kojem su izvlačenja elemenata u uzorak nezavisna, a vjerovatnoća pA je uniformna i konstantna. Analiziraćemo n osobine n A i A . n A je raspoređen prema binomnoj distribuciji n vjerovatnoće, a očekivana vrijednost i varijansa su date sljedećim izrazima:
n A ~ B(n, p A )
E (n A ) = np A , σ n2A = np A (1 − p A )
(6.37)
Iz dvije prethodne relacije izražavamo očekivanu vrijednost i varijansu za (nA /n):
⎛n ⎞ ⎛ n ⎞ p (1 − p A ) ⇒ E⎜ A ⎟ = p A , σ 2 ⎜ A ⎟ = A n ⎝ n ⎠ ⎝ n ⎠
(6.38)
U slučajevima kada je veličina uzorka dovoljno velika koristimo aproksimaciju ove distribucije normalnom standardizovanom distribucijom. Slučajna standardizovana varijabla je data sljedećim izrazom:
pˆ A − p A ∼ N (0,1) p A (1 − p A ) n 335
Statistika u ekonomiji i menadžmentu
pˆ A − p A
σp
∼ N (0,1)
(6.39)
A
Kako je p A nepoznato, za ocjenu standardne greške koristimo sljedeći izraz:
pˆ A (1 − pˆ A ) n
σ pˆ = A
(6.40)
Interval povjerenja određujemo na sljedeći način:
⎞ ⎛ pˆ − p A p⎜ − z1−α / 2 ≤ A ≤ z1−α / 2 ⎟ = 1 − α ⎟ ⎜ σ pˆ A ⎠ ⎝ …………..
(
)
p pˆ A − z a−α / 2σ pˆ A ≤ p A ≤ pˆ A + z1−α / 2σ pˆ A = 1 - α I .P. za p A : pˆ A ± z1−α / 2σ pˆ A
(6.41)
6.4.3. Intervalna procjena standardne devijacije i varijanse osnovnog skupa 6.4.3.1. Intervalna procjena standardne devijacije
Ako je osnovni skup normalno distribuiran i veličina uzorka dovoljno velika distribucija standardnih devijacija uzoraka se približava normalnoj distribuciji. U tom slučaju standardna greška procjene standardne devijacije osnovnog skupa pomoću uzorka je jednaka:
σ σˆ =
σˆ 2n
(6.42)
Interval povjerenja za standardnu devijaciju je:
p(σˆ − z1−α / 2σ σˆ ≤ σ ≤ σˆ + z1−α / 2σ σˆ ) = 1 − α I .P.(1 − α ) za σ : (σˆ ± z1−α / 2σ σˆ )
336
(6.43)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.4.3.2. Intervalna procjena varijanse osnovnog skupa pomoću hi-kvadrat distribucije na osnovu poznate varijanse malog uzorka
Ako definišemo pokazatelj:
χ2 =
nσˆ 2
(6.44)
σ2
gdje je σˆ 2 varijansa osnovnog skupa procijenjena pomoću varijanse uzorka i σ 2 varijansa osnovnog skupa tada će interval povjerenja za varijansu osnovnog skupa biti jednak:
⎛ ⎞ nσˆ 2 p⎜⎜ χ n2−1;α / 2 ≤ 2 ≤ χ n2−1;1−α / 2 ⎟⎟ = 1 − α σ ⎝ ⎠ ⎛ nσˆ 2 nσˆ 2 p⎜ 2 ≤σ2 ≤ 2 ⎜ χ n −1;1−α / 2 χ n −1, α / 2 ⎝
⎞ ⎟ =1−α ⎟ ⎠
(6.45)
Na sljedećem grafikonu smo prikazali interval povjerenja za varijansu. f (χ 2)
1− a
a/2 0
χ
Grafikon 6.6.
a/2 2
a/2
χ
2
χ2
1 − a/2
χ 2 distribucija za interval povjerenja varijanse osnovnog
skupa na bazi poznate varijanse malog uzorka
6.4.3.3. Interval povjerenja za varijansu velikog uzorka
(
)
Ako je je uzorak veliki (n≥30) izraz 2 χ 2 teži N 2n − 3;1 i interval povjerenja za varijansu osnovnog skupa je jednak sljedećem izrazu: 337
Statistika u ekonomiji i menadžmentu
)
(
p 2n − 3 − z ≤ 2 χ 2 ≤ 2n − 3 + z = 1 − α ⎞ ⎛ nσˆ 2 p⎜ 2n − 3 − z ≤ 2 2 ≤ 2n − 3 + z ⎟ = 1 − α ⎟ ⎜ σ ⎠ ⎝ ⎛ ⎞ 2nσˆ 2 2nσˆ 2 2 ⎟ = 1−α p⎜ σ ≤ ≤ 2 ⎜ 2n − 3 + z 2 2n − 3 − z ⎟⎠ ⎝
(
)
(
(6.46)
)
6.4.4. Interval povjerenja totala osnovnog skupa
Total je zbir vrijednosti numeričkog obilježja elemenata T = ∑ x . Total je jednak proizvodu aritmetičke sredine i broja elemenata. Kada se total procjenjuje pomoću uzorka, aritmetičku sredinu uzorka treba pomnožiti sa brojem elemenata u osnovnom skupu N: Tˆ = Nx . Standardna greška procjene totala osnovnog skupa je jednaka N puta standardna greška procjene aritmetičke sredine: σ Tˆ = Nσ x .
Tˆ − zσ Tˆ ≤ T ≤ Tˆ + zσ Tˆ Nx − zNσ x ≤ T ≤ Nx + zNσ x
(6.47)
Interval povjerenja za total osnovnog skupa T uz vjerovatnoću (1-α) je jednak:
Nx ± z1−α / 2 ⋅ Nσ x
(6.48)
Veličina uzorka za procjenu totala osnovnog skupa se izračunava po formuli:
⎡ zσ ⎤ n = ⎢N ⎣ d ⎥⎦
2
(6.49)
6.4.5. Interval povjerenja za medijanu
Distribucija medijane uzoraka asimptotski se približava normalnoj distribuciji sa porastom veličine uzorka.Varijansa ocjene medijane je jednaka: 338
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
σ M2ˆ e = σ Mˆ e =
σ 2π n⋅2
σ n
=
σ2
π 2
n
⋅ 1,570726
= σ x ⋅1.25331
(6.50)
Poslije odgovarajućih transformacija dobija se interval povjerenja za ocjenu medijane osnovnog skupa:
p (− z1−α / 2 ≤ z ≤ z1−α / 2 ) = 1 − α Mˆ e − Me z=
σ Mˆ e
p(− z1−α / 2 ≤
Mˆ e − Me
σ Mˆ e
≤ z1−α / 2 ) = 1 − α
..... p ( Mˆ e − z1−α / 2σ Mˆ e ≤ Me ≤ Mˆ e + z 1−α / 2 σ Mˆ e ) = 1 − α
(6.51)
Interval povjerenja za medijanu je dat sljedećim izrazom:
Mˆ e − zσ Mˆ e ≤ Me ≤ Mˆ e + zσ Mˆ e
(6.52)
6.4.6. Ocjena intervala za parametre modela linearne regresije
Model jednostavne linearne regresije za osnovni skup je:
yi = a + bxi + ei , i = 1,2, ,..., n
(6.53)
Vrijednosti zavisne varijable u ponovljenim realizacijama imaju različite vrijednosti za fiksne vrijednosti nezavisne varijable zbog prisustva slučajnih varijabli. Zbog toga se mogu tretirati kao uzorak vrijednosti iz osnovnog skupa. Za ocjenu parametara polazni oblik modela je: ˆ +e yi = aˆ + bx i i
(6.54)
Da bi se dobila intervalna procjena parametara potrebno je poznavati distribuciju ocjena uzoraka. Ako se pretpostavi da su slučajne veličine normalno distribuirane sa aritmetičkom sredinom jednakom nula za svako i, 339
Statistika u ekonomiji i menadžmentu
sa konstantnom varijansom i da nisu korelirane međusobno, distribucija uzoraka ocjena ima oblik Studentove distribucije sa (n-2) stepeni slobode. Standardna greška ocjene parametra bˆ je data sljedećim izrazom:
σ bˆ =
σˆ
,
n
(6.55)
∑x
2 i
i
n
σˆ =
∑(y
i
− yˆ i ) 2
i
n−2
Odgovarajući interval povjerenja je
p (bˆ − t n −1;1− / 2σ bˆ ≤ b ≤ bˆ + t n −1;1− / 2 σ bˆ ) = 1 − α
(6.56)
ili jednostavnije
bˆ − tσ bˆ ≤ b ≤ bˆ + tσ bˆ
(6.57)
6.4.7. Intervalna procjena koeficijenta korelacije
Iz osnovnog skupa se može odabrati u uzorak n parova vrijednosti dvije varijable (X,Y) i izračunati koeficijent korelacije uzorka pomoću kojeg procjenjujemo koeficijent korelacije osnovnog skupa. Ako je koeficijent korelacije osnovnog skupa jednak nuli (r = 0) distribucija koeficijenata korelacije uzoraka će imati oblik normalne distribucije sa očekivanom vrijednosti koeficijenta korelacije i standardnom greškom koeficijenta korelacije koja je data sljedećim izrazima za veliki i mali uzorak respektivno:
340
σr =
1 n −1
(6.58)
σr =
1− r2 n−2
(6.59)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Distribucija koeficijenata korelacije uzoraka je više asimetrična što se koeficijent korelacije osnovnog skupa više udaljava od nule i približava jedinici. Navedene formule se koriste za testiranje hipoteze da je koeficijent linearne korelacije jednak nuli r = 0. Za procjenu intervala povjerenja se primjenjuje postupak koji je predložio R.A.Fisher. Koeficijent korelacije se transformiše tako da se dobije koeficijent čija distribucija koeficijenata korelacije uzoraka ima oblik normalne distribucije. Tako transformisan koeficijent ćemo označiti sa Z. Funkcija Z od r je data sljedećim izrazom:
Z=
1 1+ r ln 2 1− r
Očekivana vrijednost i varijansa od Z su:
E (Z ) =
σ Z2 =
1 1+ ρ ln 2 1− ρ
1 n−3
(6.60) (6.61)
Za ocjenu koeficijenta korelacije osnovnog skupa se koristi koeficijent korelacije uzorka dat sljedećim izrazom:
r=
Cov X ,Y
σ Xσ Y
=
1 n ∑ ( xi − x )( yi − y ) n i =1 1 n 1 n 2 ( x − x ) ∑ i ∑ ( yi − y ) 2 n i =1 n i =1
(6.62)
Ocjena se vrši na sljedeći način: • izračuna se koeficijent korelacije r iz podataka o uzorku • iz odgovarajuće tablice (tablica u prilogu) se pronađe vrijednost Z koja odgovara koeficijentu korelacije i to je vrijednost Z uzorka (Zu) • izračuna se standardna greška procjene Z • izračunava se interval povjerenja uz odgovarajući nivo pouzdanosti:
p( Z u − z1−α / 2σ z ≤ Z ≤ Z u − z1−α / 2σ z ) = 1 − α
(6.63)
341
Statistika u ekonomiji i menadžmentu
•
u tablici se pronađe vrijednost r koja odgovara za broj dobiven za granice intervala i to su granice intervala povjerenja koeficijenta korelacije osnovnog skupa uz određeni nivo pouzdanosti.
Pored navedenih, mogu se procijenjivati intervali povjerenja za kvartile osnovnog skupa, mjere asimetrije osnovnog skupa, mjere zaobljenosti osnovnog skupa, itd.
6.5. TESTIRANJE HIPOTEZA
Informacije iz uzorka koristimo da bismo ispitali pretpostavke o obilježjima i parametrima osnovnog skupa. Pretpostavimo na osnovu prethodnih istraživanja i saznanja da neko obilježje osnovnog skupa ima određenu vrijednost. Na osnovu uzorka odabranog iz tog skupa izračunamo to obilježje. Izračunato obilježje poredimo sa pretpostavljenom vrijednošću i donosimo odluku o odbacivanju ili prihvatanju hipotetičke vrijednosti uz odgovarajuću grešku procjene. Statistička hipoteza je precizno formulisana tvrdnja ili pretpostavka o obilježjima osnovnog skupa. Naučni metod kojim provjeravamo prihvatljivost prethodno definisane tvrdnje ili pretpostavke se naziva testiranje statističke hipoteze. U postupku testiranja hipoteza mogu se definisati sljedeće etape: 1. Formulisanje nulte i alternativne hipoteze 2. Izbor kriterija za testiranje i distribucije vjerovatnoće 3. Izbor nivoa značajnosti testa 4. Formulisanje pravila za odbacivanje ili prihvatanje nulte hipoteze 5. Izbor uzorka, izračunavanje vrijednosti procjenitelja i koeficijenta testa 6. Donošenje odluke o odbacivanju ili prihvatanju nulte hipoteze 6.5.1. Formulisanje hipoteza
Nulta i alternativna hipoteza su dvije međusobno isključive tvrdnje o obilježjima osnovnog skupa koje su izražene vrijednostima parametara osnovnog skupa. 342
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Nulta hipoteza je tvrdnja o vrijednosti parametra osnovnog skupa koja se testiranjem nastoji osporiti. Ovom hipotezom se tvrdi da je parametar osnovnog skupa jednak nekoj pretpostavljenoj vrijednosti. Svakoj nultoj hipotezi se pridružuje alternativna ili istraživačka hipoteza. Pretpostavka, koja se smatra tačnom i koju tokom testiranja treba potvrditi, se izražava alternativnom hipotezom. Testira se samo nulta hipoteza polazeći od pretpostavke da je istinita i nastoji se odbaciti. Pretpostavimo da je hipotetička vrijednost neke karakteristike osnovnog skupa θ = θ 0 . Za testiranje hipoteza mogu se koristiti dvosmjerni i jednosmjerni testovi. Češće se koriste dvosmjerni testovi kojima se želi utvrditi da li postoji statistički značajna razlika između pretpostavljene i stvarne karakteristike osnovnog skupa bez obzira na smjer razlike. Oblast odbacivanja nulte hipoteze se nalazi simetrično na oba kraja distribucije. Kod jednosmjernih testova oblast odbacivanja se nalazi na jednom kraju distribucije. Analiziraćemo definisanje i postavku nulte hipoteze za slučajeve dvosmjernog i jednosmjernog testa na donju i gornju granicu. •
Dvosmjerni test
Hipoteza koju treba testirati je nulta hipoteza da je parametar osnovnog skupa jednak pretpostavljenoj vrijednosti:
H 0 :θ = θ0
(6.64)
Alternativna hipoteza je da je parametar osnovnog skupa različit od pretpostavljene vrijednosti:
H1 : θ ≠ θ 0 •
(6.65)
Jednosmjerni test na gornju granicu
Za jednosmjerni test na gornju granicu nulta i alternativna hipoteza su formulisane na sljedeći način:
H 0 : θ ≤ θ 0 ⇒ H1 : θ > θ 0
(6.66)
343
Statistika u ekonomiji i menadžmentu
Jednosmjerni test na donju granicu
•
U ovom slučaju nulta i alternativna hipoteza su definisane sljedećim izrazima:
H 0 : θ ≥ θ 0 ⇒ H1 : θ < θ 0
(6.67)
6.5.1.1. Donošenje odluke i greške tipa I i II
Prilikom donošenja odluke o odbacivanju ili prihvatanju nulte hipoteze mogu da nastanu greške tipa I i II. Različite odluke i tipovi grešaka su predstavljeni u sljedećoj tabeli: Tabela 6.1. Tipovi grešaka Odluke
Nulta hipoteza je prihvaćena
Nulta hipoteza je odbačena
Nulta hipoteza je istinita
Odluka je ispravna (1- α)
Napravljena je greška tipa I α
Nulta hipoteza nije istinita
Napravljena je greška tipa II β
Odluka je ispravna (1- β)
Na grafikonu 6.6. smo predstavili slučaj određivanja intervala povjerenja, testiranje hipoteza i greške prve i druge vrste. IP
β a/2
Grafikon 6.7.
344
a/2
Određivanje intervala povjerenja i greške druge vrste
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Vjerovatnoća greške prve vrste (ili tipa I) se označava sa α , a vjerovatnoća greške druge vrste (ili greška tipa II) sa β . Uobičajeno je da se odabire kontrola greške prve vrste α i da se definiše pravilo odbacivanja hipoteze koje će rezultirati da greška druge vrste β bude što je moguće manja. Vrijednost greške β je određena sljedećim faktorima: stvarnom vrijednošću testiranog parametra, nivoom značajnosti testa α, veličinom uzorka i oblikom testa. Često se koristi i izraz jačina testa (1- β) koji izražava vjerovatnoću odbacivanja netačne nulte hipoteze. Ovaj izraz predstavlja komplementarnu vrijednost greške β. Zbir ove dvije komplementarne vjerovatnoće je jednak jedinici: p(Ho odbaci/Ho netačna)+ p(Ho prihvati/Ho netačna)=1
(6.68)
6.5.1.2. Empirijski nivo značajnosti p-vrijednost
U statističkim programima se sve više umjesto teorijskog nivoa značajnosti, koji je sastavni dio svakog testa, izračunava p-vrijednost. Ova vrijednost predstavlja empirijski nivo značajnosti koji se izračunava na osnovu podataka iz uzorka pomoću empirijskih z ili t vrijednosti. p-vrijednost predstavlja najmanji nivo značajnosti uz koji se nulta hipoteza može odbaciti na osnovu podataka iz uzorka. Ova vrijednost se naziva i realizovani nivo značajnosti. Postupak donošenja odluke na osnovu p-vrijednosti se zasniva na poređenju ove vrijednosti sa teorijskim nivoom značajnosti. Ako je p-vrijednost manja od α, odbacuje se nulta hipoteza. Ako je p-vrijednost veća od α, prihvata se nulta hipoteza. Manja p-vrijednost znači manju empirijski utvrđenu vjerovatnoću odbacivanja istinite nulte hipoteze. U postupku testiranja hipoteza o aritmetičkoj sredini baza za izračunavanje p-vrijednosti je empirijska z ili t vrijednost u zavisnosti od toga da li se radi o velikom ili malom uzorku. Ukoliko je nulta hipoteza istinita Z varijabla se ponaša po standardizovanoj normalnoj distribuciji i u tom slučaju pvrijednost predstavlja vjerovatnoću da varijabla Z uzme vrijednost veću od vrijednosti izračunate na osnovu datog uzorka. Postupak izračunavanja empirijskog nivoa značajnosti je sljedeći: Za H 0 : θ = θ 0 ⇒ H 1 : θ ≠ θ 0
p-vrijednost = 2p (Z > z )
Za H 0 : θ ≤ θ 0 ⇒ H 1 : θ > θ 0
p-vrijednost= p(Z>z)
Za H 0 : θ ≥ θ 0 ⇒ H 1 : θ < θ 0
p-vrijednost= p (Z > z )
345
Statistika u ekonomiji i menadžmentu
6.5.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa
Ako pretpostavimo da je aritmetička sredina osnovnog skupa jednaka nekoj vrijednosti μ 0 tada hipotezu možemo formulisati u obliku dvosmjernog testa na sljedeći način:
H 0 : μ = μ0 ↔ H1 : μ ≠ μ0
(
(6.69)
)
Ako X ~ N μ ,σ 2 ili ako X ima bilo koju distribuciju ukoliko je n ≥ 30 x−μ vrijedi sljedeća relacija: Z= ~ N (0,1) i za analizu koristimo z test. σ/ n Analiziraćemo nekoliko karakterističnih slučajeva u zavisnosti od toga da li su poznate varijansa i oblik distribucije i da li je uzorak veliki ili mali. 6.5.2.1. Varijansa osnovnog skupa poznata
U slučaju kada je varijansa osnovnog skupa poznata analiziraćemo dvosmjerni test i jednostrane testove na gornju i donju granicu. 6.5.2.1.1. Dvosmjerni test za aritmetičku sredinu
Ako pretpostavimo da je nulta hipoteza
Z=
H 0 : μ = μ 0 istinita tada
x −μ ∼ N (0,1). σ/ n
Vrijednost izračunatog z poredimo sa teorijskim z iz tablica i uz odgovarajući nivo pouzdanosti donosimo odluku o odbacivanju ili prihvatanju nulte hipoteze. U praksi se najčešće koristi greška, odnosno rizik ocjene koji označavamo sa α od 5% ili 1%. U tim slučajevima nivo pouzdanosti ( 1 − α ) je 95% i 99% respektivno, a odgovarajuća teorijska vrijednost koeficijenta pouzdanosti z1−α / 2 je jednaka 1,96 i 2,58 respektivno. Za sve ostale nivoe greške koeficijenti z1−α / 2 su tabelirani i nalaze se u tablici standardizovane normalne distribucije. Na sljedećem grafikonu je data ilustracija dvosmjernog testa za aritmetičku sredinu.
346
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
f ( z)
1− a oblast prihvatanja nulte hipoteze
a/2
a/2 -3
− z1− a / 2
Grafikon 6.8.
0
z1− a / 2
3
z
Dvostrani test za aritmetičku sredinu poznata varijansa osnovnog skupa
Ako je nulta hipoteza istinita za:
x − μ0 ⎡ ⎤ ≤ z1−α / 2 ⎥ = 1 − α p ⎢− z1−α / 2 ≤ σ/ n ⎣ ⎦
⎡ x − μ0 ⎤ ∈ (− z1−α / 2 ; z1−α / 2 )⎥ = 1 − α ; p⎢ ⎣σ / n ⎦ z izrač ∈ [− z1−α / 2 ; z1−α / 2 ] ⇒ z izrač ≤ z1−α / 2
(6.70)
prihvatamo je. Dakle, nultu hipotezu prihvatamo ako aritmetička sredina pripada sljedećem intervalu:
σ ⎤ ⎡ x ∈ ⎢ μ 0 ± z1−α / 2 ⋅ ⎥ n⎦ ⎣
(6.71)
Nultu hipotezu H0 odbacujemo ako je ispunjen jedan od sljedećih uslova:
⎡ x − μ0 ⎤ p⎢ ∉ (− z1−α / 2; z1−α / 2 )⎥ = α ⎣σ n ⎦ z izrač ∉ [− z1−α / 2; z1−α / 2 ]
(6.72)
σ σ ⎤ ⎡ x ∉ ⎢ μ 0 − z1−α / 2 ⋅ ; μ 0 + z1−α / 2 ⋅ ⎥ n n⎦ ⎣ 347
Statistika u ekonomiji i menadžmentu
σ ⎤ ⎡ x ∉ ⎢ μ 0 ± z1−α / 2 ⋅ ⎥ n⎦ ⎣
(6.73)
Ostale ekvivalentne forme pomoću kojih izražavamo odluku o odbacivanju nulte hipoteze su:
x − μ0
σ/ n
> z1−α / 2 ili z > z1−α / 2
x − μ 0 > z1−α / 2 ⋅
(6.74)
σ
(6.75)
n
Oblast prihvatanja i odbacivanja nulte hipoteze su prikazane na grafikonu 6.9.
f ( x)
oblast odbacivanja
oblast odbacivanja oblast prihvatanja nulte hipoteze
μ0 − z1−a / 2 ⋅ (σ / n ) Grafikon 6.9.
μ0
μ0 + z1− a / 2 ⋅ (σ / n )
x
Oblast prihvatanja nulte hipoteze
6.5.2.1.2. Jednosmjerni test aritmetičke sredine na gornju granicu u slučaju poznate varijanse osnovnog skupa
Jednosmjerni test aritmetičke sredine na gornju granicu se definiše sljedećim izrazom:
H 0 : μ ≤ μ0 ⇒ H1 : μ > μ0
348
(6.76)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Ne odbacujemo, odnosno prihvatamo nultu hipotezu ako je ispunjen sljedeći uslov:
x − μ0
σ/ n
≤ z1−α
z izrač ≤ z1−α
(6.77)
Odbacujemo nultu hipotezu ako je:
x − μ0
σ/ n
> z1−α
zizrač > z1−α
(6.78)
Oblast prihvatanja i oblast odbacivanja nulte hipoteze su prikazane na grafikonu 6.10.
f ( z)
1− a oblast prihvatanja nulte hipoteze
oblast odbacivanja
a
0 Grafikon 6.10.
z
Z 1− a
Jednosmjerni test za aritmetičku sredinu na gornju granicu
6.5.2.1.3. Jednosmjerni test za aritmetičku sredinu na donju granicu ako je poznata varijansa
H 0 : μ ≥ μ0 ⇒ H1 : μ < μ0
(6.79)
Nulta hipoteza se ne odbacuje ako je:
349
Statistika u ekonomiji i menadžmentu
x − μ0
σ/ n
≥ z1−α
ili jednostavnije
z izrač ≥ z1−α
(6.80)
Odbacujemo nultu hipotezu ako je:
x − μ0 < − z1−α σ/ n zizrač < − z1−α
(6.81)
Na grafikonu 6.11. su predstavljene oblast prihvatanja i oblast odbacivanja nulte hipoteze. f (t )
1− a oblast prihvatanja nulte hipoteze
oblast odbacivanja
a
-z1− a Grafikon 6.11.
0
z
Jednosmjerni test za aritmetičku sredinu na donju granicu
6.5.2.2. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n ≥30 – dvosmjerni test
Za bilo koji osnovni skup čiji uzorak ima veličinu n ≥30 prihvatamo nultu hipotezu ako je:
350
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
x − μ0
σi / n −1
≤ z1−α / 2 ili z ≤ z1−α / 2
(6.82)
U izrazu (6.80) σ i je standardna devijacija uzorka. Nulta hipoteza se odbacuje ukoliko je zadovoljen sljedeći uslov: x − μ0
σi / n −1
> z1−α / 2 ili z > z1−α / 2
(6.83)
gdje je σ i standardna devijacija uzorka. 6.5.2.3. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa u slučaju kada varijansa osnovnog skupa nije poznata i n<30
Za testiranje u ovom slučaju se koristi Studentov t test. 6.5.2.3.1. Dvosmjerni test aritmetičke sredine
Hipoteze su definisane sljedećim izrazom:
H 0 : μ = μ0 ⇒ H1 : μ ≠ μ0 Za osnovni skup koji ima normalnu distribuciju, nepoznatu varijansu i veličinu uzorka manju od 30 (n < 30) ne odbacujemo nultu hipotezu ako je:
x − μ0
σ i / n −1
≤ t n −1;1−α / 2 ili t ≤ t n −1;1−α / 2
(6.84)
Za osnovni skup koji ima normalnu distribuciju odbacujemo nultu hipotezu ako je:
x − μ0
σ i / n −1
> t1−α / 2 ili t > t1−α / 2
(6.85)
Oblasti prihvatanja i odbacivanja nulte hipoteze su predstavljene na grafikonu 6.12.
351
Statistika u ekonomiji i menadžmentu
f (t )
oblast odbacivanja
oblast prihvatanja nulte hipoteze
− t1− a / 2, n-1 Grafikon 6.12.
0
oblast odbacivanja
t
t1− a / 2, n-1
Dvosmjerni test za aritmetičku sredinu kada varijansa osnovnog skupa nije poznata
6.5.2.3.2. Jednosmjerni test aritmetičke sredine na gornju granicu
Hipoteze su definisane izrazom:
H 0 : μ ≤ μ0 ⇒ H1 : μ > μ0
(6.86)
Nulta hipoteza se ne odbacuje ako je ispunjen sljedeći uslov: x − μ0
σi / n −1
≤ tn −1;1−α
t izrač ≤ t n −1;1−α
(6.87)
Nulta hipoteza se odbacuje ako je: x − μ0
σi / n −1
> tn −1;1−α
tizrač > tn −1;1−α
(6.88)
Na grafikonu 6.13. su date oblasti prihvatanja i odbacivanja nulte hipoteze ovog jednosmjernog testa.
352
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
f (t )
oblast prihvatanja nulte hipoteze
oblast odbacivanja
a 0 Grafikon 6.13.
tn−1;1− a
t
Jednosmjerni test za aritmetičku sredinu na gornju granicu kada varijansa osnovnog skupa nije poznata
6.5.2.3.3. Jednosmjerni test aritmetičke sredine na donju granicu
H 0 : μ ≥ μ0 ⇒ H1 : μ < μ0
(6.89)
Nulta hipoteza se ne odbacuje ako je x − μ0
σi / n −1
≥ −tn −1;1−α
t izrač ≥ −t n −1;1−α
(6.90)
Odbacujemo nultu hipotezu ako je: x − μ0
σi / n −1
< −tn −1;1−α / 2
tizrač < −tn −1;1−α / 2
(6.91)
Oblasti prihvatanja i odbacivanja nulte hipoteze jednosmjernog testa na donju granicu su predstavljene na sljedećem grafikonu.
353
Statistika u ekonomiji i menadžmentu
f (t)
oblast prihvatanja nulte hipoteze
oblast odbacivanja
a
− tn−1;1− a Grafikon 6.14.
t
0
Jednosmjerni test za aritmetičku sredinu na donju granicu kada varijansa osnovnog skupa nije poznata
U šemi 6.2. dajemo pregled različitih slučajeva testiranja hipoteze o aritmetičkoj sredini osnovnog skupa i kriterije za odbacivanje nulte hipoteze. Testiranje hipoteze o aritmetičkoj sredini μ osnovnog skupa i kriteriji za odbacivanje nulte hipoteze
osnovni skup ima normalnu distribuciju ili bilo koju distribuciju ukoliko je n > 30
poznata varijansa osnovnog skupa
Z izr . =
x − μ0
σx
x−μ
=
σ
n
n < 30
nepoznata varijansa osnovnog skupa
Z izr . =
x − μ0
x − μ0
=
σx
z izr . > z
σi
nepoznata varijansa osnovnog skupa
tizr . =
n −1
x − μ0
σx
t izr . > t
=
x − μ0
σi
n −1
H 0 : μ = μ0 H 1 : μ ≠ μ0
z izr . > z
H 0 : μ ≤ μ0 H 1 : μ > μ0
zizr . > z1 − α
zizr . > z1 − α
t izr . > tn−1; 1 − α
H 0 : μ ≥ μ0 H 1 : μ < μ0
zizr . < − z1 − α
zizr . < − z1 − α
t izr . < − tn−1; 1 − α
Šema 6.2.
354
osnovni skup ima normalnu distribuciju i
1−
α 2
1−
α 2
Testiranje hipoteze o aritmetičkoj sredini µ osnovnog skupa i kriteriji za odbacivanje nulte hipoteze
n−1; 1 −
α 2
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.5.3. Test hipoteze za proporciju
Da bismo analizirali test hipoteze za proporciju podsjetićemo se simbola i oznaka koje smo koristili za ocjenu intervala povjerenja, a koje su predstavljene na sljedećem grafikonu. Osnovni skup
1-pA
A(NA)
A(N-NA)
nA
n-nA
pA Uzorak Grafikon 6.15.
Test hipoteze za proporciju
6.5.3.1. Dvosmjerni test hipoteze za proporciju
Dvosmjerni test za proporciju se definiše sljedećim izrazom:
H 0 : p A = p0 ↔ H 1 : p A ≠ p0
(6.92)
Pokazali smo da ako je veličina uzorka n velika (n≥30) slijedi:
pˆ A − p A ~ N (0,1) p A (1 − p A ) n
(6.93)
Zamjenjujući uslove hipoteze ako je istinita dobijamo:
pˆ A − p0
p0 (1 − p0 ) n
~ N (0,1)
(6.94)
Ako uvedemo smjenu: 355
Statistika u ekonomiji i menadžmentu
σ 2p =
p0 q0 , q0 = 1 − p0 n
tada možemo izraziti z kao:
z=
pˆ A − p0
(6.95)
σp
Ne odbacujemo nultu hipotezu ako je ispunjen sljedeći uslov:
− z1−α / 2 ≤
pˆ A − p0
σp
≤ z1−α / 2
− z1−α / 2 ≤ z ≤ z1−α / 2
(6.96)
6.5.3.2. Jednosmjerni test za proporciju na gornju granicu
H 0 : p A ≤ p0 ↔ H 1 : p A > p0
(6.97)
Prihvatamo nultu hipotezu ako je
z izrač =
pˆ A − p 0
σp
≤ z1−α
(6.98)
a odbacujemo ako ovaj uslov nije zadovoljen, odnosno ukoliko je zizrač > z1−α . 6.5.3.3. Jednosmjerni test za proporciju na donju granicu
H 0 : p A ≥ p0 ↔ H 1 : p A < p0
(6.99)
Prihvatamo nultu hipotezu ako je
z izrač =
pˆ A − p 0
σp
≥ − z1−α
a odbacujemo ukoliko je zizrač < − z1−α .
356
(6.100)
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.5.4. Testiranje hipoteze o varijansi osnovnog skupa 6.5.4.1. Dvosmjerni test
Dvosmjerni test hipoteze o varijansi osnovnog skupa formulišemo sljedećom relacijom:
H 0 : σ 2 = σ 02 ↔ H1 : σ 2 ≠ σ 02 Za testiranje se koristi hi-kvadrat test χ 2 =
(6.101)
nσˆ 2
σ 02
Prihvatamo nultu hipotezu ako je:
χ n2−1;α / 2 ≤ χ 2 ≤ χ n2−1;1−α / 2
(6.102)
Ne prihvatamo nultu hipotezu ako je:
χ 2 ∉ [χ n2−1;α / 2 ; χ n2−1;1−α / 2 ]
(6.103)
Ilustracija oblasti prihvatanja i odbacivanja nulte hipoteze o varijansi osnovnog skupa je prezentirana na sljedećem grafikonu. f (χ 2)
oblast odbacivanja nulte hipoteze
oblast odbacivanja nulte hipoteze
1− a a/2
oblast prihvatanja nulte hipoteze
a/2
χ 2 n -1, a / 2 Grafikon 6.16.
χ 2 n -1,1-a / 2
χ2
Testiranje hipoteze o varijansi osnovnog skupa
357
Statistika u ekonomiji i menadžmentu
6.5.4.2. Test hipoteze za varijansu na gornju granicu
Test na gornju granicu je formulisan sljedećim izrazom:
H 0 : σ 2 ≤ σ 02 ↔ H 1 : σ 2 > σ 02
(6.104)
Prihvatamo nultu hipotezu ako je:
χ2 =
nσˆ 2
σ 02
≤ χ n2−1;1−α ;
(6.105)
Ukoliko gornji uslov nije zadovoljen, odbacujemo nultu hipotezu. 6.5.4.3. Test hipoteze za varijansu na donju granicu
Test na donju granicu je formulisan sljedećim izrazom: H 0 : σ 2 ≥ σ 02 ↔ H1 : σ 2 < σ 02
(6.106)
Prihvatamo nultu hipotezu ako je:
χ2 =
nσˆ 2
σ
2 0
≥ χ n2−1;α ;
(6.107)
U suprotnom slučaju nultu hipotezu odbacujemo. 6.5.5. Testiranje hipoteze o značajnosti parametara u regresionom modelu
Ako se pođe od pretpostavke da, za date vrijednosti nezavisnih varijabli, vrijednosti zavisne varijable predstavljaju uzorak, ocjene parametara mogu poslužiti za testiranje hipoteze o značajnosti parametara u modelu regresije. Postoji više testova o parametrima u regresionom modelu. Testovi mogu biti pojedinačni i skupni. Test je pojedinačan ako se testira značajnost jednog parametra u regresionom modelu. Skupnim testom se ispituje značajnost svih varijabli u modelu.
358
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.5.5.1. Pojedinačni test značajnosti parametra regresionog modela
Za primjenu pojedinačnog testa o značajnosti parametra odabrane varijable Xj hipoteze za dvosmjerni test se definišu na sljedeći način:
H0 : bj = 0
(6.108)
H1 : b j ≠ 0
Testiranje se vrši pomoću t-distribucije. Područje prihvatanja nulte hipoteze je: b j ∈ ⎡ 0 ± tα / 2 ⋅ σ bˆ ⎤ ⎥ j ⎦ ⎣⎢
(6.109)
gdje tα / 2 predstavlja vrijednost t distribucije koji zavisi o odabranom nivou pouzdanosti i broju stepeni slobode (n-K-1). K je broj parametara koje treba ocijeniti, a σ bˆ je standardna greška parametra: j
n
σˆ
σ bˆ =
n
j
∑x
2 i
, σˆ = − nx 2
∑ ( y − yˆ ) i
i =1
n−2
i
(6.110)
i =1
σˆ predstavlja ocjenu standardne devijacije regresije. Ako se vrijednost regresijskog parametra bˆ j nađe u navedenom intervalu prihvata se nulta hipoteza kao istinita. U suprotnom slučaju nulta hipoteza se odbacuje. Test se može realizovati i upoređivanjem empirijskog t-odnosa i teorijske vrijednosti za t. Empirijski t-odnos je dat sljedećom relacijom:
t=
bˆ j
σ bˆ
(6.111) j
Nulta hipoteza se prihvaća ako je empirijski t-odnos manji po apsolutnoj vrijednosti od teorijske vrijednosti t-distribucije. U suprotnom slučaju hipoteza se odbacuje.
359
Statistika u ekonomiji i menadžmentu
6.5.5.2. Testiranje značajnosti svih varijabli u modelu
Model višestruke linearne regresije čiji je funkcionalni dio modela definisan linearnom funkcijom smo definisali u sljedećem obliku: Y = a + b1 X 1 + b2 X 2 + ... + bK X K + e
(6.112)
Za istovremeno testiranje značajnosti svih parametara hipoteze definišemo na sljedeći način:
H 0 : b1 = b2 = ... = bK = 0 H 1 : b j ≠ 0, j = 1,2,..., K .
(6.113)
Ako su ispunjene određene pretpostavke o osobinama varijabli, u modelu za testiranje se primjenjuje empirijski F odnos između objašnjene i neobjašnjene varijanse i njima odgovarajućih stepeni slobode: n
F=
∑ ( yˆ i =1
− y)
2
i
( yi − yˆ )
2
⎡ n − K − 1⎤ ⎢⎣ K ⎥⎦
(6.114)
Odluka se donosi upoređivanjem empirijskog (izračunatog) F-odnosa i teorijske F-distribucije. Ako je empirijski F-odnos manji od teorijskog nulta hipoteza se ne odbacuje. Dakle, ukoliko je Fe ≤ Ft nulta hipoteza H 0 se prihvata. Ukoliko je Fe > Ft nulta hipoteza se odbacuje. Teorijska F-distribucija je određena nivoom značajnosti i brojem stepeni slobode brojnika i nazivnika. Broj stepeni slobode je (K, n-K-1). 6.5.5.3. Testiranje hipoteze o razlici (jednakosti) airtmetičkih sredina dva osnovna skupa
Potrebno je testirati hipotezu o razlici aritmetičkih sredina dva osnovna skupa ukoliko su poznati sljedeći podaci. Za osnovni skup 1: •
Aritmetička sredina μ1
•
Varijansa σ 12
•
Veliki uzorak od n1 elemenata sa aritmetičkom sredinom uzorka x1 i varijansom uzorka σˆ12 .
360
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Za osnovni skup 2: •
Aritmetička sredina μ 2
•
Varijansa σ 22
•
Veliki uzorak od n2 elemenata sa aritmetičkom sredinom uzorka
x 2 i varijansom uzorka σˆ 22 . Da bi se izvršilo testiranje potrebno je izračunati razlike između aritmetičkih sredina uzoraka izabranih iz prvog i drugog osnovnog skupa. Distribucija tih razlika će imati približno oblik normalne distribucije sa aritmetičkom sredinom jednakoj razlici aritmetičke sredine prvog i drugog osnovnog skupa ( μ1 − μ 2 ) i sa standardnom greškom:
σ x −x 2 = 1
σ 12 n1
+
σ 22 n2
(6.115)
Ova saznanja možemo primijeniti na testiranje nulte hipoteze da je aritmetička sredina jednog osnovnog skupa jednaka aritmetičkoj sredini drugog osnovnog skupa odnosno da je razlika između njih jednaka nuli:
H 0 : μ1 = μ 2 ⇒ H 1 : μ1 ≠ μ 2 H 0 : μ1 − μ 2 = 0 ⇒ H 1 : μ1 ≠ μ 2
(6.116)
Pošto odstupanje između aritmetičkih sredina može biti i posljedica različtih varijansi osnovnih skupova u testu se pretpostavlja da su varijanse osnovnih skupova međusobno jednake:
σ 12 = σ 22 = σ 2
(6.117)
Uz ovu pretpostavku, standardna greška razlike aritmetičkih sredina se može izraziti sljedećom relacijom:
σ x −x = σ 1
2
1 1 + n1 n2
(6.118)
Ukoliko je varijansa osnovnog skupa poznata, interval prihvatanja nulte hipoteze je:
0 ± z ⋅ σ x1 − x 2
(6.119) 361
Statistika u ekonomiji i menadžmentu
odnosno, z izračunato je jednako:
zizrač =
x1 − x2 1 1 σ + n2 n2
(6.120)
Uslovi za prihvatanje i odbacivanje nulte hipoteze su sljedeći:
zizrač ∈ zt ⇒ H 0 ; zizrač ∉ zt ⇒ H1 Kada standardna devijacija osnovnog skupa nije poznata, procjenjujemo je na osnovu podataka iz oba uzorka σˆ 12 ≠ σˆ 22 :
n1σˆ12 + n2σˆ 22 n1 + n2 − 2
σˆ =
(6.121)
Ako u izraz (6.115) uvrstimo za standardnu devijaciju osnovnog skupa procjenu (6.118) dobivamo standardnu grešku:
σˆ x − x = 1
2
n1σˆ12 + n2σˆ 22 ⎛ n2 + n2 ⎞ ⎜ ⎟ n1 + n2 − 2 ⎝ n1 ⋅ n2 ⎠
(6.122)
Za veliki uzorak može se koristiti jednostavniji izraz:
σˆ x − x = 1
σˆ 12
2
n1
+
σˆ 22 n2
(6.123)
Interval prihvatanja nulte hipoteze za veliki uzorak je jednak:
0 ± zσˆ x1 − x 2
(6.124)
Interval prihvatanja nulte hipoteze za mali uzorak je jednak:
0 ± tσˆ x1 − x2
(6.125)
Ako se razlika aritmetičkih sredina dva uzorka nalazi izvan područja prihvatanja nulte hipoteze to znači da su aritmetičke sredine dva osnovna skupa različite.
362
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Nulta hipoteza se prihvata ako se razlika sredina dva uzorka nalazi u području prihvatanja nulte hipoteze. 6.5.5.4. Testiranje hipoteze o jednakosti aritmetičkih sredina više osnovnih skupova – Analiza varijanse
Hipoteza da su aritmetičke sredine više osnovnih skupova međusobno jednake testira se metodom poznatom pod nazivom analiza varijanse. Tabela 6.2. Podaci za analizu varijanse Element
Uzorak
Total
1
2
1
x11
x12
2
x 21
x 22
x2 j
x2k
. i
. xi1
. xi2
. xij
. xik
. n
. xn1
. xn2
. xnj
. xnk
Sredine
x1
x2
x
xk
j x1 j
k
xlk
j
∑x ∑x
1j 2j
.
∑x
ij
.
∑x
nj
x
Značenja simbola u datoj tabeli su sljedeća: xij je vrijednost obilježja svakog elementa izabranog u uzorak, i označava kojem elementu u uzorku pripada vrijednost, j označava uzorak kome pripada element. Ukupan zbir kvadrata odstupanja je:
∑∑ (x k
2
n
j =1 i =1
ij
− x)
= n∑ (x
2
k
j =1
.j
− x ) + ∑∑ (x k
n
j =1 i =1
− x. j )
2
ij
(6.126)
Ukupan zbir kvadrata odstupanja je jednak zbiru kvadrata odstupanja između uzoraka i zbiru kvadrata odstupanja u uzorku. Analizu varijanse predstavljamo u tabeli 6.3.
363
Statistika u ekonomiji i menadžmentu
Tabela 6.3. Analiza varijanse Izvor varijacija
Broj stepeni slobode Uzorci Uzorci različite jednake veličine veličine
2
n∑ (x. j − x ) k
Između uzoraka
k-1
k-1
Varijansa
Zbir kvadrata
σˆ 22
j =1
Unutar uzorka (rezidual)
∑∑ (x k
n-k
k(n-1)
j =1 i =1
n-1
kn-1
2
ij
∑∑ (x k
Ukupno
− x. j )
n
2
n
j =1 i =1
σˆ 12
ij
− x)
Pretpostavljamo da su aritmetičke sredine osnovnih skupova međusobno jednake:
H 0 : μ1 = μ 2 = μ 3 = .... = μ k = μ
(6.127)
Pretpostavlja se da su i varijanse jednake:
σ 12 = σ 22 = .... = σ k2 = σ
(6.128)
Suština primjene metode analize varijanse u testiranju hipoteze je činjenica da se pomoću zbira kvadrata odstupanja na desnoj strani jednačine analize varijanse može procijeniti varijansa osnovnog skupa. Kada svaki zbir kvadrata odstupanja podijelimo sa odgovarjućim brojem stepeni slobode dobijamo procjenu varijanse osnovnog skupa. Odluku o tome da li je razlika između dvije procjene varijanse slučajna ili značajna donosimo na osnovu odnosa te dvije procjene primjenom F testa
σˆ 22 F= 2 σˆ 1
(6.129)
Odnos F se izračunava tako da se za brojnik uzima veća procjena varijanse. Ako je F izračunato manje od F tabelarnog za odgovarajući broj stepeni slobode i nivo pouzdanosti, to znači da su razlike između ove dvije procjene slučajne i da se nulta hipoteza može prihvatiti. 364
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
6.5.5.5. Testiranje hipoteze o jednakosti koeficijenta korelacije dva osnovna skupa
Hipoteze formulišemo sljedećim izrazom:
H 0 : r1 − r2 = 0 H1 : r1 − r2 ≠ 0
(6.130)
Iz svakog osnovnog skupa izabiremo po jedan uzorak i za svaki izračunavamo koeficijent korelacije rˆ1 i rˆ2 . Oba koeficijenta transformišemo u Fisherove koeficijente Zˆ1 , Zˆ 2 . Standardna greška razlike između dva Fisherova koeficijenta iznosi:
σ Zˆ − Zˆ = 1
2
1 1 + n1 − 3 n2 − 3
(6.131)
Oblast prihvatanja nulte hipoteze je:
0 ± z1−α / 2 σ Zˆ − Zˆ 1
1
(6.132)
Pored analiziranih, mogu se realizirati i testiranja hipoteza za sljedeće parametre: • Testiranje hipoteze o jednakosti proporcija dva ili više osnovnih skupova • Testiranje hipoteze da distribucija osnovnog skupa ima određeni oblik • Testiranje hipoteze o nezavisnosti dva obilježja elemenata osnovnog skupa • Testiranje hipoteze da je koeficijent korelacije osnovnog skupa jednak nuli • Testiranje hipoteze da je koeficijent detrminacije osnovnog skupa jednak nuli, itd.
365
Statistika u ekonomiji i menadžmentu
6.6. NEPARAMETARSKI TESTOVI
Parametarski statistički testovi koje smo analizirali su bazirani na određenim pretpostavkama vezanim za parametre ili distribucije osnovnog skupa iz kojih je posmatrani uzorak odabran. Neparametarski statistički testovi su bazirani na modelima koji ne uključuju nikakve preduslove u vezi parametara osnovnog skupa iz kojeg je uzorak odabran. Neparametarski testovi ne zahtijevaju precizna mjerenja kao parametarski testovi i zbog toga se oni mogu primijeniti na podatke date u ordinalnoj skali, a neki i na podatke iz nominale skale. Najpoznatiji neparametarski testovi su: • Binomni test • Hi-kvadrat test • Test podobnosti modela • Kolmogorov – Smirnov test. Neparametarski testovi će biti istraživani i analizirani u budućim izdanjima ove knjige.
6.7. TEORIJSKA PITANJA
1. Objasnite i analizirajte osnovne pojmove teorije uzoraka. 2. Koji su osnovni razlozi za primjenu teorije i metoda uzoraka u statistici? 3. Koji je osnovni cilj metode uzoraka? 4. Koje vrste uzoraka poznajete? 5. Definišite i analizirajte prosti slučajni uzorak. 6. Koje vrste slučajnih uzoraka poznajete? 7. Koje su prednosti slučajnog uzorka u odnosu na ostale vrste uzoraka? 8. Koje tipove namjernog uzorka poznajete? 9. Za koje parametre poznajete postupak analize intervalnih procjena? 10. Koje slučajeve intervalne procjene aritmetičke poznajete? 366
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
11. Analizirajte intervalnu procjenu aritmetičke sredine u slučaju kada je varijansa osnovnog skupa poznata. 12. Analizirajte intervalnu procjenu aritmetičke sredine u slučaju kada varijansa osnovnog skupa nije poznata. 13. Analizirajte interval povjerenja za aritmetičku sredinu osnovnog skupa čija distribucija nije poznata. 14. Analizirajte intervalnu procjenu standardne devijacije i varijanse osnovnog skupa. 15. Analizirajte procjenu intervala povjerenja za proporciju. 16. Analizirajte metodološki pristup testiranju hipoteza. 17. Definišite greške tipa I i II koje mogu nastati prilikom donošenja odluke o prihvatanju ili odbacivanju nulte hipoteze. 18. Nabrojite različite slučajeve testiranja hipoteze o aritmetičkoj sredini osnovnog skupa i analizirajte detaljno, po vašem izboru, jedan od nabrojanih slučajeva. 19. Analizirajte testiranje hipoteze o aritmetičkoj sredini osnovnog skupa kada je varijansa poznata (dvosmjerni test). 20. Analizirajte testiranje hipoteze o aritmetičkoj sredini osnovnog skupa kada varijansa nije poznata (dvosmjerni test). 21. Analizirajte testiranje hipoteze o aritmetičkoj sredini osnovnog skupa kada je varijansa poznata (jednosmjerni test na gornju granicu). 22. Analizirajte testiranje hipoteze o aritmetičkoj sredini osnovnog skupa kada varijansa nije poznata (jednosmjerni test na donju granicu). 23. Analizirajte testiranje hipoteze za proporciju (dvosmjerni i jednosmjerni testovi). 24. Analizirajte postupak testiranja hipoteze o značajnosti parametara u regresionom modelu. 25. Objasnite i analizirajte testiranje hipoteze o aritmetičkoj sredini osnovnog skupa kada varijansa osnovnog skupa nije poznata (dvosmjerni test). Postavite hipotezu, objasnite postupak njene primjene i kriterij za prihvatanje ili odbacivanje nulte hipoteze. Predstavite oblast prihvatanja hipoteze koju ste testirali na grafikonu. 26. Objasnite, po vašem izboru, jedan slučaj testiranja hipoteze koji se odnosi na aritmetičku sredinu. Postavite hipotezu, objasnite postupak njene primjene i kriterij za prihvatanje ili odbacivanje nulte hipoteze. Predstavite oblast prihvatanja hipoteze koju ste testirali na grafikonu.
367
Statistika u ekonomiji i menadžmentu
27. Objasnite i analizirajte dvosmjerni test hipoteze za proporciju. Postavite hipotezu, objasnite postupak njene primjene i kriterij za prihvatanje ili odbacivanje nulte hipoteze. 28. Koja je razlika između intervalnih procjena parametara i testiranja hipoteza?
6.7. RIJEŠENI ZADACI I ZADACI SA ELEMENTIMA RJEŠENJA
Zadatak 1.
Iz osnovnog skupa čija je aritmetička sredina nepoznata i standardna devijacija jednaka 4 odabran je slučajni uzorak veličine n = 64 i izračunata njegova aritmetička sredina x = 48. Za vrijednost α = 0,05 i α = 0,01 testirajte sljedeće hipoteze: a) H 0 : μ = 50 ⇒ H1 : μ ≠ 50 b) H 0 : μ ≥ 50 ⇒ H 1 : μ < 50 c) H 0 : μ ≤ 50 ⇒ H 1 : μ > 50 Elementi rješenja: a) Poznata je standardna devijacija i varijansa osnovnog skupa. Nije poznata distribucija, ali kako je n = 64 > 30 konstatujemo da:
⎛ σ2 ⎞ x ~ N⎜⎜ μ 0 , ⎟⎟ n ⎠ ⎝
Z=
x − μ0 ~ N(0,1) σ/ n
x − μ0 ⎛ ⎞ p ⎜ − z1−α / 2 ≤ ≤ z1−α / 2 ⎟ = 1 − α ⇒ prihvatamo H 0 σ n ⎝ ⎠ ⎡ x − μ0 ⎤ p⎢ ∉ ( − z1−α / 2 ; z1−α / 2 ) ⎥ = α ⇒ odbacujemo H 0 ⎣σ n ⎦
368
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
x − μ0 ⎛ ⎞ p ⎜ − z1−α / 2 ≤ ≤ z1−α / 2 ⎟ = 1 − α ⇒ prihvatamo H 0 σ/ n ⎝ ⎠ 48 − 50 ⎛ ⎞ p ⎜ − z1−0,05/ 2 ≤ ≤ z1−0,05/ 2 ⎟ = 1 − 0, 05 4 / 64 ⎝ ⎠ p ( − z0,975 ≤ −4 ≤ z0,975 ) = 0,95
−1,96 ≤ −4 ≤ 1,96 Ne prihvatamo nultu hipotezu. Za α = 0, 01 prihvatamo H 0 ako je x − μ0 ⎛ ⎞ p ⎜ − z1−α / 2 ≤ ≤ z1−α / 2 ⎟ = 1 − α σ/ n ⎝ ⎠ ⎛ ⎞ 48 − 50 p ⎜ − z1−0,01/ 2 ≤ ≤ z1−0,01/ 2 ⎟ = 1 − 0,01 4 / 64 ⎝ ⎠ p ( − z0,995 ≤ −4 ≤ z0,995 ) = 0,999 −2,5758 ≤ −4 ≤ 2,5758
Ne prihvatamo nultu hipotezu. Ili jednostavnije, nultu hipotezu ne prihvatamo ako je:
x − μ0
σ/ n
> z1−α / 2
α = 0,05 ⇒ z1−α / 2 = z 0,975 = 1,96 α = 0,01 ⇒ z1−α / 2 = z0,995 = 2,5758 ≈ 2,58
x − μ0
σ/ n x − μ0
σ/ n
= =
48 − 50 = 4 > 1,96 4 / 64 48 − 50 4 / 64
= 4 > 2,58
369
Statistika u ekonomiji i menadžmentu
Odbacuje se nulta hipoteza što znači da je aritmetička sredina uzorka uz nivoe pouzdanosti 95% i 99% udaljena od pretpostavljene vrijednosti aritmetičke sredine koja je jednaka 50. b) Test na donju granicu
x − μ0
σ/ n
> z1−α
z > − z1−α 4 > − z0,95 4 > −1,96 prihvatamo nultu hipotezu. Zadatak 2.
Proizvođač sokova želi provjeriti da li je prosječan sadržaj soka u falšama manji od sadržaja označenog na flašama koji je 75 cl. Slučajno je odabrano 10 flaša i mjerenje njihovog sadržaja je dalo sljedeće vrijednosti: 73,2 72,6 74,5 75,0 73,7 74,1 75,1 74,8 74,0 75,0 Ako pretpostavimo da je dobijena distribucija normalna, može li proizvođač zaključiti da je prosječan sadržaj flaša manji od 75 cl uz vjerovatnoću greške ocjene α=0,05? (Za vježbu odgovorite na isto pitanje uz vjerovatnoću greške ocjene α=0,01?) Elementi rješenja: Test na gornju granicu.
H 0 : μ ≤ μ0 ⇒ H1 : μ > μ0 H 0 : μ ≤ 75cl ⇒ H 1 : μ > 75cl x = 74,2cl , n = 10, σ 1 = 0,8 Prihvatamo nultu hipotezu ako je:
370
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
x − μ0
σ i / n −1
< t n−1;1−α
t izrač < t 9;0,95 74,2 − 75 = −3 0,2667 = 1,833 ⇒ −3 < 1,833 ⇒ prihvatamo H 0
t izrač = t 9;0,95
Prihvatamo nultu hipotezu da je sadržaj soka u flašama manji od 75 cl. Ili ako zadatak postavimo drugačije: Test na donju granicu je:
H 0 : μ ≥ μ0 ⇒ H1 : μ < μ0 H 0 : μ ≥ 75cl ⇒ H 1 : μ < 75cl x = 74,2cl , n = 10, σ 1 = 0,8 x − μ0
σi / n −1
> tn −1;1−α
tizrač > −t9;0,95 prihvatamo H 0 74, 2 − 75 = −3 0, 2667 = −1,833 ⇒ −3 < 1,833 ⇒ odbacujemo H 0
tizrač = t9;0,95
Odbacujemo nultu hipotezu da je sadržaj u flaši veći od 75 cl. Zadatak 3.
Uzorak od 145 osoba je odabran slučajno iz populacije stranih turista koji provode odmor u Bosni i Hercegovini. Prosječna sedmična potrošnja po osobi posmatranog uzorka je 830 KM i standardna devijacija 240 KM. a) Testirajte uz nivo rizika 5% hipotezu prema kojoj je prosječna sedmična potrošnja jednog turiste različita od 800 KM. b) Koji je minimalan nivo rizika uz koji možemo odbaciti hipotezu u testu realizovanom u a).
371
Statistika u ekonomiji i menadžmentu
Elementi rješenja: a) n = 145, x = 830,σ i = 240,α = 0,05
H 0 : μ = μ 0 = 800 ↔ H 1 : μ ≠ 800 n = 145 > 30 ⇒ x − μ0
σi / n −1 z=
x − μ0
σ i / n −1
~ N (0,1)
< z1−α / 2 ⇒ prihvatamo H 0
830 − 800 = 1,5 240 / 12
α = 0, 05 ⇒ z1−α / 2 = z1−0,05 / 2 = z0,975 = 1,96 z = 1,5 < z0,975 = 1,96 ⇒ prihvatamo H 0 b) Da bi se odbacila nulta hipoteza uz minimalan rizik:
x − μ0
σi / n −1
≥ z1−α / 2 ⇒ ne prihvatamo H 0
z1−α / 2 ≤ 1,5 ⇒ tablica 1 − α / 2 ≤ 0,93 −α / 2 ≤ 0,93 − 1
α ≥ 0,14 Zadatak 4.
Pretpostavimo da je stopa smrtnosti, računata na osnovu slučajno odabranog uzorka, od 100 osoba koji boluju od iste bolesti 13%. Testirajte sljedeće hipoteze: a) H 0 : p A ≥ p0 = 0, 20 ↔ H1 : p A < p0 = 0, 20, α = 0,05 b) H 0 : p A ≤ 0,10 ↔ H1 > 0,10, α = 0,01
372
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Elementi rješenja: a) H 0 : p A ≥ p0 = 0, 20 ↔ H1 : p A < p0 = 0, 20 Prihvatamo H 0 ako je z=
pˆ A − p0
=
pˆ A − p0
> − z1−α σp p0 (1 − p0 ) n 0,13 − 0, 20 z= = −1,75 0, 20 ⋅ 0,80 100 − z1−α = − z0,95 = −1,6449 ⇒ z = −1,75 < − z1−α = −1,6449
Dakle, odbacujemo postavljenu nultu hipotezu. Ili jednostavnije prihvatamo nultu hipotezu ako je:
z =
pˆ A − p0 p0 (1 − p0 )
< z1−α ⇒
n z = 1, 75 > z0,95 = 1, 6449 ⇒ odbacujemo H 0 b) H 0 : p0 = 0,10 ↔ H1 > 0,10, α = 0,01 Prihvatamo H 0 ako je
pˆ A − p 0 pˆ − p 0 = A < z 1− α σp p 0 (1 − p ) n 0 ,13 − 0 , 20 z = = − 1, 75 0 , 20 ⋅ 0 ,80 100
z =
373
Statistika u ekonomiji i menadžmentu
z1−α = z 0,99 = 2,3263 ⇒ z = 1 < z 0,99 = 2,3263 ⇒ prihvatamo H 0 Zadatak 5.
U posudi se nalaze bijele i crvene loptice. Želimo testirati hipotezu da ima jednak broj bijelih i crvenih kuglica. Odabrali smo slučajni uzorak od 144 kuglice. a) Testirajte hipotezu uz nivo rizika 0,05 i 0,01. b) Koji će biti vaš odgovor ako u uzorku dobijete 128 bijelih kuglica? Elementi rješenja: n = 144, pb =
1 , što bi značilp da prihvatamo hipotezu da je u kutiji jednak 2
broj bijelih i crvenih kuglica. H 0 : pb = 1/ 2 ↔ H1 : pb ≠ 1/ 2 Prihvatamo H 0 ako je z =
a)
pˆ b − p0 p0 (1 − p0 ) n
=< z1−α ⇒
pˆ b − 0,5 < z1−α / 2 ⋅
0,5 ⋅ 0,5 144
pˆ b − 0,5 < z1−α / 2 ⋅ 0,042
α = 0,05 ⇒ z1−α / 2 = z 0,975 = 1,96 pˆ b − 0,5 < 1,96 ⋅ 0,042 pˆ b − 0,5 < 0,08
α = 0,01 ⇒ z1−α / 2 = z 0,995 = 2,5758 pˆ b − 0,5 < 2,5758 ⋅ 0,042 pˆ b − 0,5 < 0,11 374
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
b)
nb 128 = = 0,89 n 144 pˆ b − 0,5 = 0,89 − 0,5 = 0,39
pˆ b =
α = 0,05 ⇒ pˆ b − 0,5 < 0,8 ⇒ 0,39 > 0,08 ⇒ odbacujemo H 0
α = 0,01 ⇒ pˆ b − 0,5 < 0,11 ⇒ 0,39 > 0,11 ⇒ odbacujemo H 0 Zadatak 6.
Aparat za kafu je konstruisan tako da puni čaše čiji je prosječan sadržaj kafe 15 cl. Kontrola aparata je pokazala da sadržaj kafe varira od čaše do čaše i da može biti posmatran kao sohastička varijabla koja ima normalnu distribuciju vjerovatnoće čija je standardna devijacija 1,5 cl bez obzira na prosječan sadržaj kafe u čaši. Odabran je slučajni uzorak od 100 čaša i mjerenje sadržaja je pokazalo da je prosječan sadržaj kafe u čaši 14,2 cl. a) Da li biste uz rizik od 5% mogli tvrditi da je prosječan sadržaj kafe u čaši 15 cl? b) Izračunajte grešku druge vrste ukoliko je prosječan sadržaj jednak 14,2 cl i ako je prosječan sadržaj jednak 14,6. Uporedite dobijene rezultate i komentarišite ih. Elementi rješenja:
σ = 1,5cl a) H 0 : μ = 15 ↔ H 1 : μ ≠ 15 n = 100, x = 14,2cl , α = 0,05 z =
x−μ
σ/ n
> z1−α / 2
375
Statistika u ekonomiji i menadžmentu
14,2 − 15 x−μ = = 5,3 1,5 / 10 σ/ n z1−α / 2 = z0,975 = 1,96 ⇒ z =
z > z1−α / 2 Dakle, odbacujemo nultu hipotezu kao neistinitu uz rizik 5%. U kojem intervalu bi se trebao kretati prosječan sadržaj da bi nulta hipoteza bila prihvaćena uz dati rizik? Prosječan sadržaj bi se trebao kretati u sljedećem intervalu:
σ ⎤ ⎡ x ∈ ⎢ μ 0 ± z1−α / 2 ⋅ ⎥ n⎦ ⎣ x ∈ [15 ± 1,96 ⋅ 0,15] x ∈ [14,71; 15, 29]
b) Ako je nulta hipoteza odbačena tada je prosječni sadržaj jednak nekoj vrijednosti različitoj od pretpostavljene 15. Ako je ta vrijednost 14,2 cl, možemo napisati:
β = p(prihvatiti H 0 ako H 0 ) x ∼ N (14, 2;0,15 )
β = p ⎡⎣ prihvatiti H 0 x ∼ N (14, 2;0,15 ) ⎤⎦ β = p [14,7 < x < 15, 29] x ∼ N (14, 2;0,15 ) 15, 29 − 14, 2 ⎤ ⎡14,71 − 14, 2
β = p⎢
gdje z =
x − 14, 2 ∼ N ( 0,1) 0,15
β = p [3,373 < z < 7, 293] = F ( 7, 293) − F ( 3,373) β = 1 − 0,9996 = 0,0004
376
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
β = p ( prihvatiti H 0 ako H 0 ) x ∼ N (14, 6;0,15 )
β = p ⎡⎣ prihvatiti H 0 x ∼ N (14, 6;0,15 ) ⎤⎦ β = p [14, 71 < x < 15, 29] x ∼ N (14, 6;0,15 ) ⎤⎦ 15, 29 − 14, 6 ⎤ ⎡14, 71 − 14, 6
β = p⎢
gdje z =
x − 14, 6 ∼ N ( 0,1) 0,15
β = p [ 0, 71 < z < 4, 63] = F ( 4, 63) − F ( 0, 71) β = 1 − 0, 7611 = 0, 2389 Greška drugog tipa je manja ukoliko je prava vrijednost prosječnog sadržaja više udaljena od pretpostavljene vrijednosti. Zadatak 7.
Na testu iz Statistike 50 studenata je dalo sljedeći broj tačnih odgovora: Broj tačnih xj 10 11 12 15 16 17 18 19 20 21 22 23 24 29 40 odgovara Broj f 1 1 1 3 4 6 10 7 7 3 2 2 1 1 1 studenata j
a) Konstruišite box-plot ove distribucije i komentarišite ga. b) Grupišete ovu distribuciju u sedam klasa i predstavite njen histogram. (Savjet: za donju granicu prve klase uzmite vrijednost 9,5 i koristite širinu klase jednaku 3 za 5 prvih klasa i jednaku 9 za dvije posljednje). c) Izračunajte aritmetičku sredinu i standardnu devijaciju tako grupisane distribucije. d) Pretpostavimo da grupisana distribucija predstavlja slučajni uzorak veličine n=50. 1) Utvrdite interval povjerenja za prosječan broj tačnih odgovora studentske populacije uz nivo povjerenja 0,95. 2) Ako je p proporcija studenata populacije koji su imali najmanje 20 tačnih odgovora, testirajte uz grešku 0,05 sljedeću hipotezu: 377
Statistika u ekonomiji i menadžmentu
H 0 : p ≥ 0,4 ↔ H 1 : p < 0,4 Elementi rješenja: a) Q1 = 17; Q2 = M e = 18; Q3 = 20 Distribucija ima desnu asimetriju. c) x ≈ 18,74; σ = 4, 25 d) 1) Interval povjerenja za aritmetičku sredinu u slučaju kada varijansa osnovnog skupa nije poznata i kada je uzorak veći od 30. I .P. (1 − α ) za μ : ⎛ ⎞ x −μ p ⎜ − z1−α / 2 < < z1−α / 2 ⎟ = 1 − α ⎜ ⎟ σi / n −1 ⎝ ⎠ σi ⎤ ⎡ I .P. (1 − α ) μ : ⎢ x + z1−α / 2 ⋅ ⎥ n −1 ⎦ ⎣ 4, 25 ⎤ ⎡ I .P. (1 − α ) μ : ⎢18,74 ± 1,96 ⋅ 7 ⎥⎦ ⎣ I .P. (1 − α ) μ : [18,74 ± 1,19] I .P.0,95 μ : [17,55;19,93]
d) 2) Uzorak ima 17 studenata koji su imali najmanje 20 tačnih odgovora.
n A 17 = = 0,34 n 50 H 0 : p0 ≥ 0,4 ↔ H 1 : p < 0,4
n = 50, n A = 17 ⇒ pˆ A =
Prihvatamo nultu hipotezu ako je:
z=
378
pˆ A − p0 > − z1−α p0 (1 − p0 ) n
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
z=
z1−α
pˆ A − p0
=
0,34 − 0, 4 = −0,87 0, 4 ⋅ 0, 6 50
p0 (1 − p0 ) n = z0,95 = 1, 6449 ⇒
−0,87 > −1, 6449 Nulta hipoteza se prihvata. Dakle, polazeći od uzorka možemo tvrditi sa pouzdanošću od 95% da je proporcija studenata čiji je broj tačnih odgovora najmanje 20 u ukupnoj populaciji veća ili jednaka 0,4 (40%). Zadatak 8.
Transportno preduzeće nabavlja auto gume marke A ili marke B. Odluku o nabavci guma donosi nakon testiranja nulte hipoteze da je prosječno trajanje guma A i guma B izraženo u pređenim kilometrima jednako:
H 0 : μ1 − μ 2 = 0 H 1 : μ1 − μ 2 ≠ 0 Testiranje se vrši uz rizik od 5%. Preduzeće je na svojim automobilima pratilo trajanje 50 guma marke A i 40 guma marke B. Prosječno trajanje 50 guma marke A iznosilo je 24.430 km, a prosječno trajanje 40 guma marke B 25.860 KM. Elementi rješenja: Razlika artimetičkih sredina ova dva uzorka je 24-430-25.860 = - 1.430 km. Procjena varijanse prvog osnovnog skupa pomoću uzorka je 6.250.000, a drugog osnovnog skupa 9.000.000. Standardna greška razlike sredina je:
σˆ x − x = 1
2
σˆ x − x = 1
2
σˆ 12 n1
+
σˆ 22 n2
6.250.000 9 ⋅ 10 6 + = 591,6 50 40 379
Statistika u ekonomiji i menadžmentu
Granice intervala prihvatanja nulte hipoteze su:
0 ± zσˆ x1 − x2 0 ± 1,96 ⋅ 591,6 0 ± 1.159 Zaključak: odbacujemo nultu, prihvatamo altenrativnu hipotezu. Aritmetička sredina za gume B je veća, to jeste prosječno trajanje je duže i preduzeće se odlučuje za nabavku guma B. Zadatak 9.
Studenti su na vježbama iz statistike podijeljeni u tri grupe i u svakoj grupi smo primjenili drugu nastavnu metodu vježbi. Da bismo utvrdili da li postoji razlika u efikasnosti tri primijenjene metode iz svake grupe smo odabrali uzorak od 10 studenata. Svi su dobili iste zadatke i mogli su dobiti maksimalno 100 bodova. Postignute rezultate u rješavanju zadataka smo predstavili u slijedećoj tabeli: Student 1 2 3 4 5 6 7 8 9 10
Uzorak 1 57 41 79 62 70 45 64 82 48 62
Uzorak 2 73 64 85 51 69 76 89 63 74 66
Uzorak 3 60 71 64 53 41 62 75 57 43 64
Ocijenite da li postoje razlike u efikasnosti tri primijenjene metode na rezultate testa. Elementi rješenja: Postavljamo nultu hipotezu da su prosječne ocjene studenata koji su učili po različitim metodama jednake: H 0 : μ1 = μ 2 = μ 3 . Kriterij za donošenje odluke zavisi od odnosa F testa. Ako je Fizračunato >F tablično nulta hipoteza se odbacuje. 380
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Pomoću Excela dobijamo sljedeću izlaznu tabelu: Anova: Single Factor SUMMARY Average Variance 61 188,6667 73 131,1111 59 120
Groups Count Sum Column 1 10 610 Column 2 10 730 Column 3 10 590 Source of SS df MS Variation Between 1146,667 2 573,3333 Groups Within 3958 27 146,5926 Groups Total 5104,667 29
F
P-value
F crit
3,91107
0,032238
3,35413
Poređenjm F izračunatog (F=3,91) i F tabličnog (F=3,35) konstatujemo da nultu hipotezu treba odbaciti jer je tablična vrijednost manja od izračunate. Nultu hipotezu odbacujemo na nivou pouzdanosti 97% (p-vrijednost je 0,03) što znači da se prosječno postignuti rezultati primjenom tri različite metode međusobno razlikuju i da tri metode vježbanja nisu jednako efikasne. Postoji rizik da smo samo u 3 % slučajeva pogrešno zaključili donošenjem ove odluke. Zadatak 10.
Ocjenom modela yˆ = a + bx na osnovu 7 podataka dobili smo vrijednost parametra b=1,51 i standardne greške ocjene parametra b σ bˆ = 0,16 . Testirajte hipotezu o značajnosti ovog parametra u regresionom modelu. Elementi rješenja:
H 0 : b = 0,
H1 : b ≠ 0
Testiranje nulte hipoteze ćemo izvršiti uz grešku 0,05. Tablična vrijednost t za dvosmjerni test i broj stepeni slobode n-K-1=7-2=5 iznosi t 5;0.025 = 2.571 . 381
Statistika u ekonomiji i menadžmentu
Područje prihvatanja nulte hipoteze je:
t ∈ ( 0 ± 2,571 ⋅ 0,16 ) t ∈ ( 0 ± 0, 41)
Pošto je ocijenjena vrijednost parametra b=1,51>0,41 nulta hipoteza se odbacuje. To znači da ne možemo prihvatiti pretpostavku da je parameter b jednak 0. Do istog rezultata dolazimo i pomoću empirijskog t-odnosa. Vrijednost te bˆ 1,51 =9,44, dok je teorijski t znatno manji 2,571. Pošto veličine je t i = = σ 0,16 je empirijski odnos veći od teorijskog, nulta hipoteza se ne prihvata. Zadatak 11.
Za ocijenjeni regresioni model Y = −20,7251 + 0,1130 X 1 + 0,1245 X 2 testirajte značajnost parametara uz varijable u modelu koristeći se sljedećom izlaznim tabelama Excela.
SUMMARY OUTPUT REGRESSION STATISTICS Multiple R 0,9528 R Square 0,9078 Adjusted R Square 0,8617 Standard Error 2,6292 Observations 7
Regression Residual Total
382
df
SS
2 4 6
272,3485 27,6515 300
ANOVA MS 136,1742 6,9129
F
Significance F
19,6986
0,0085
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Intercept X1 X2
Coefficients -20,7251 0,1130 0,1245
Standard Error 26,9055 0,0377 0,0865
t- Stat -0,7703 3,0000 1,4389
P-value 0,4841 0,0399 0,2236
Statistička značajnost regresijskog modela je određena empirijskim F omjerom i odgovarajućom p vrijednosti u tabeli ANOVA. U našem slučaju p = 0,0085 < 0,01 pa zaključujemo da barem jedna od nezavisnih varijabli statistički značajno utiče na vrijednost zavisne varijable uz nivo rizika od 1%. U izlaznoj tabeli Excela prezentirane su i statističke značajnosti regresionih koeficijanata koje se određuju pomoću t-statistike i pripadajućih p vrijednosti. Za varijablu X1 vrijednost p= 0,0399 a za X2 p=0,2236. Konstatujemo da u ocijenjenom regresionom modelu varijabla proizvodnja u kg statistički značajno utiče na zavisnu varijablu Y zbog toga što je odgovarajuća vrijednost p manja od 0,05. Za drugu varijablu p vrijednost je veća od 0,05 i to znači da uticaj troškova po jedinici proizvodnje u ovom modelu nije statistički značajan. Zadatak 12.
Air Bosna želi zabraniti pušenje na kratkim letovima, ali ne želi da izgubi putnike. Zbog toga su odlučili da uvedu probni period od 6 mjeseci bez pušenja. Slučajan uzorak od 200 letova je izabran tokom 6 mjeseci prije probnog perioda bez pušenja i tokom 6 mjeseci probnog perioda i registrovan je broj putnika na tim letovima. Podaci o broju putnika (n) su dati u sljedećoj tabeli: Broj 71≤n≤75 76≤n≤80 81≤n≤85 86≤n≤90 91≤n≤95 96≤n≤100 putnika (n) Broj letova Prije probe 0 15 47 52 64 22 (X1) Broj letova tokom probe 2 20 50 74 43 11 (X2)
Pretpostavlja se da je broj putnika po letu normalno distribuiran.
383
Statistika u ekonomiji i menadžmentu
1. Izračunati interval povjerenja 95% za prosječno smanjanje broja putnika u probnom periodu. 2. Da li je uvođenje zabrane pušenja dovelo da smanjenja prosječnog broja putnika po letu? Koristiti rizik od 5%. Elementi rješenja: Izračunavamo standardnu grešku razlike aritmetičkih sredina
σˆ x1 − x2 =
n1σˆ12 + n2σˆ 22 ⎛ 1 1 ⎞ ⎜ + ⎟ n1 + n2 − 2 ⎜⎝ n1 n2 ⎟⎠
σˆ x − x =
200 ⋅ 31,774 + 200 ⋅ 28,774 ⎛ 1 ⎞ ⋅⎜ ⎟ 398 ⎝ 100 ⎠
1
2
σˆ x − x = 0,304 1
2
1. 95% interval povjerenja razlike dvije aritmetičke sredine
⎛ n σˆ 2 + n2σˆ 2 2 ⎞⎛ 1 1 ⎞ ⎟⎜ + ⎟ ( x1 − x2 ) ± z ⋅ ⎜⎜ 1 1 ⎟⎜ n n ⎟ 2 + − n n 2 ⎠ ⎠⎝ 1 ⎝ 1 2 = (88,775 − 87,225) ± 1,96 ⋅ 0,304 95% interval povjerenja za prosječno smanjenje putnika je (0,95; 2,14). Dakle, možemo konstatovati da će u 95% letova prosječno smanjenje biti između jednog i dva putnika.
2.
H 0 : μ1 − μ 2 = 0 H1 : μ1 − μ 2 ≠ 0
zizr =
( x1 − x2 ) − ( μ1 − μ 2 ) 1,55 − 0 = = 5,098 0,304 σˆ x1 − x2
z1−α / 2 = 1,96 zizr > z1−α / 2
384
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
Odbacujemo nultu hipotezu i konstatujemo da postoji statistički značajna razlika u prosječnom broju putnika u dva posmatrana perioda. Zadatak 13.
Standardna devijacija vijeka trajanja jednog tipa aparata je 5000 h. Vijek trajanja aparata ima normalan raspored. U uzorku od 15 aparata, prosječan vijek trajanja je 89000 h. Sa greškom 5%, odrediti prosječan vijek trajanja aparata analiziranog tipa. Elementi rješenja:
n = 15 x = 89000
σ = 5000 α = 0, 05 μ =? Poznata standardna devijacija u populaciji
⇒ F ( zt ) = 1 −
σ
α
2
= 0,975 ⇒ zt = 1,96
5000 = 1291 n 15 x − zt ⋅ σ x ≤ μ ≤ x + zt ⋅ σ x
σx =
=
89000 − 1,96 ⋅1291 ≤ μ ≤ 89000 + 1,96 ⋅1291 ⇒ ⇒ 86469, 64 ≤ μ ≤ 91530,36 h (α = 0, 05) Zadatak 14.
U jednom gradu u državnim službama zaposleno je 2 500 radnika. Formiran je slučajni uzorak od 34 radnika, kako bi se procijenila starosna struktura zaposlenih u državnim službama. U tom uzorku prosječna starost zaposlenih iznosi 39,24 godine sa standardnom devijacijom 11,5 godina. Ocijeniti prosječnu starost zaposlenih u državnim službama sa pouzdanošću 99%.
385
Statistika u ekonomiji i menadžmentu
Elementi rješenja:
N = 2500 n = 34 x = 39, 24 σ i = 11,5
α = 0, 01 μ =? Kako je riječ o velikom uzorku (nepoznata varijansa osnovnog skupa) koristimo normalni raspored i za grešku procjene σˆ x =
F ( zt ) = 1 −
α 2
= 1−
σi
n −1
.
0, 01 = 0,995 ⇒ zt = 2,58 2
x − zt ⋅ σˆ x ≤ μ ≤ x + zt ⋅ σˆ x
σˆ x =
σˆ n −1
=
11,5 =2 33
39,24 − 2,58 ⋅ 2 ≤ μ ≤ 39,24 + 2,58 ⋅ 2 ⇒ μ ∈ [34,08 − 44,4] godina, (α = 1%) Zadatak 15.
Od 100 kupaca u prodavnici u toku jednog dana anketirano je 20 kupaca. Oni su u prosjeku potrošili 58 KM, sa standardnom devijacijom 7,6 KM. Sa pouzdanošću 95% ocijeniti prosječnu potrošnju kupaca u toj prodavnici. Elementi rješenja:
N = 100 n = 20 x = 58 σ i = 7, 6
α = 0, 05 μ =? 386
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
U slučaju malog uzorka i nepoznate varijanse osnovnog skupa koristimo Studentov raspored i za grešku procjene σˆ x =
F19 (tt ) = 1 −
α 2
σi
n −1
.
= 0,975 ⇒ tt = 2,1
x − tt ⋅ σˆ x ≤ μ ≤ x + tt ⋅ σˆ x
σi
σˆ X =
n −1
=
7, 6 = 1, 74 19
58 − 2,1⋅1, 74 ≤ μ ≤ 58 + 2,1⋅1, 74 ⇒ μ ∈ [54,346 − 61, 654] KM, (α =5%) Zadatak 16.
U uzorku od 280 studenata jednog univerziteta, 115 su studenti ekonomskog fakulteta. Sa greškom prve vrste 1% ocijeniti učešće studenata ekonomskih fakulteta na ovom univerzitetu. Elementi rješenja:
n = 280 na = 115 nb = 280 − 115 = 165
α = 0, 01 pA = ? Određujemo proporciju studenata ekonomskih fakulteta u analiziranom uzorku:
pˆ A =
na 115 = = 0, 41, qˆ A = 1 − pˆ A = 0,59 n 280
Na osnovu podataka iz uzorka ocjenjujemo proporciju studenata ekonomskih fakulteta na nivou univerziteta:
F ( zt ) = 1 −
α 2
= 1 − 0, 005 = 0,995 ⇒ zt = 2,58 387
Statistika u ekonomiji i menadžmentu
pˆ A − zt ⋅ σ pˆ ≤ p A ≤ pˆ A + zt ⋅ σ pˆ A
σ pˆ = A
pˆ A ⋅ qˆ A = n
A
0, 41 ⋅ 0,59 = 0, 0294 280
0, 41 − 2,58 ⋅ 0,0294 ≤ p A ≤ 0, 41 + 2,58 ⋅ 0,0294 ⇒ ⇒ 0,3341 ≤ p A ≤ 0, 4858 (α = 1%) Zadatak 17.
U jednom preduzeću je zaposleno 1500 radnika. Na uzorku od 40 radnika, je utvrđeno da je 10 radnika stiglo na posao sa zakašnjenjem dužim od 15 minuta. Potrebno je utvrditi sa pouzdanošću 95% udio i broj radnika koji kasne na posao više od 15 minuta. Elementi rješenja:
N = 150 n = 40 na = 10 nb = 40 − 10 = 30
α = 0, 05 pA = ? Izračunavamo proporciju radnika koji kasne na posao duže od 15 minuta u analiziranom uzorku:
pˆ A =
na 10 = = 0, 25, qˆ A = 1 − pˆ A = 0,5 n 40
Zatim ocjenjujemo proporciju radnika koji kasne na posao duže od 15 minuta u preduzeću:
F ( zt ) = 1 −
α 2
= 1 − 0, 025 = 0,975 ⇒ zt = 1,96
pˆ A − zt ⋅ σ pˆ ≤ p A ≤ pˆ A + zt ⋅ σ pˆ A
388
A
Poglavlje 6. – Teorija i metoda uzoraka i statističko zaključivanje
σ pˆ = A
pˆ A ⋅ qˆ A = n
0, 25 ⋅ 0, 75 = 0, 0685 40
0, 25 − 1,96 ⋅ 0,0685 ≤ p A ≤ 0, 25 + 1,96 ⋅ 0,0685 ⇒ ⇒ 0,11574 ≤ p A ≤ 0,38426 (α = 5%) Na osnovu predhodnog zaključujemo da će se broj koji kasne na posao više od 15 minuta kretati u intervalu:
1500 ⋅ 0,11574 ≤ N ⋅ p A ≤ 1500 ⋅ 0,38426 174 ≤ N ⋅ p A ≤ 576 (sa zaokruživanjem na cijele brojeve)
389
PRILOZI 1. STATISTIČKE TABLICE 2. PRIJEVODI TERMINA IZ EXCELA
BINOMNA DISTRIBUCIJA VJEROVATNOĆE
p( X = k ) = C nk ⋅ p k (1 − p )
n−k
n=5 k
p
0,05
0,06
0,07
0,08
0,09
0,1
0,2
0,3
0,4
0,5
0 1 2 3 4 5
773781 203627 021434 001128 000030 000000
733904 234225 029901 001909 000061 000001
695688 261818 039413 002967 000112 000002
659082 286557 049836 004334 000188 000003
624032 308587 061039 006037 000299 000006
590490 328050 072900 008100 000450 000010
327680 409600 204800 051200 006400 000320
168070 360150 308700 132300 028350 002430
077760 259200 345600 230400 076800 010240
031250 156250 312500 312500 156250 031250
n=10 k
p
0,05
0,06
0,07
0,08
0,09
0,1
0,2
0,3
0,4
0,5
0 1 2 3 4 5 6 7 8 9 10
598737 315125 074635 010475 000965 000061 000003 000000 000000 000000 000000
538615 343797 098750 016809 001878 000144 000008 000000 000000 000000 000000
483982 364288 123388 024766 003262 000295 000018 000001 000000 000000 000000
434388 377729 147807 034274 005216 000544 000039 000002 000000 000000 000000
389416 385137 171407 045206 007824 000929 000077 000004 000000 000000 000000
348678 387420 193710 057396 011160 001488 000138 000009 000000 000000 000000
107374 268435 301990 201327 088080 026424 005505 000786 000074 000004 000000
028248 121061 233474 266828 200121 102919 036757 009002 001447 000138 000006
006047 040311 120932 214991 250823 200658 111477 042467 010617 001573 000105
000977 009766 043945 117188 205078 246094 205078 117188 043945 009766 000977
n=15 k
p
0,05
0,06
0,07
0,08
0,09
0,1
0,2
0,3
0,4
0,5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
463291 365756 134752 030733 004853 000562 000049 000003 000000 000000 000000 000000 000000 000000 000000 000000
395292 378471 169104 046773 008957 001258 000134 000011 000001 000000 000000 000000 000000 000000 000000 000000
336701 380146 200292 065328 014752 002443 000306 000030 000002 000000 000000 000000 000000 000000 000000 000000
286297 373431 227306 085652 022344 004274 000619 000069 000006 000000 000000 000000 000000 000000 000000 000000
243008 360507 249582 106964 031736 006905 001138 000145 000014 000001 000000 000000 000000 000000 000000 000000
205891 343152 266896 128505 042835 010471 001939 000277 000031 000003 000000 000000 000000 000000 000000 000000
035184 131941 230897 250139 187604 103182 042993 013819 003455 000672 000101 000011 000001 000000 000000 000000
004748 030520 091560 170040 218623 206130 147236 081130 034770 011590 002980 000581 000083 000008 000001 000000
000470 004702 021942 063388 126776 185938 206598 177084 118056 061214 024486 007420 001649 000254 000024 000001
000031 000458 003204 013885 041656 091644 152740 196381 196381 152740 091644 041656 013885 003204 000458 000031
393
Statistika u ekonomiji i menadžmentu
BINOMNA DISTRIBUCIJA VJEROVATNOĆE
p( X = k ) = C nk ⋅ p k (1 − p )
n−k
n=20 p k
394
0,05
0,06
0,07
0,08
0,09
0,1
0,2
0,3
0,4
0,5
0
358486 290106 234239 188693 151645 121577 011529 000798 000037 000001
1
377354 370348 352618 328162 299957 270170 057646 006839 000487 000019
2
188677 224573 252141 271091 281828 285180 136909 027846 003087 000181
3
059582 086007 113870 141439 167238 190120 205364 071604 012350 001087
4
013328 023332 036426 052271 070295 089779 218199 130421 034991 004621
5
002245 004766 008774 014545 022247 031921 174560 178863 074647 014786
6
000295 000760 001651 003162 005501 008867 109100 191639 124412 036964
7
000031 000097 000249 000550 001088 001970 054550 164262 165882 073929
8
000003 000010 000030 000078 000175 000356 022161 114397 179706 120134
9
000000 000001 000003 000009 000023 000053 007387 065370 159738 160179
10
000000 000000 000000 000001 000003 000006 002031 030817 117142 176197
11
000000 000000 000000 000000 000000 000001 000462 012007 070995 160179
12
000000 000000 000000 000000 000000 000000 000087 003859 035497 120134
13
000000 000000 000000 000000 000000 000000 000013 001018 014563 073929
14
000000 000000 000000 000000 000000 000000 000002 000218 004854 036964
15
000000 000000 000000 000000 000000 000000 000000 000037 001294 014786
16
000000 000000 000000 000000 000000 000000 000000 000005 000270 004621
17
000000 000000 000000 000000 000000 000000 000000 000001 000042 001087
18
000000 000000 000000 000000 000000 000000 000000 000000 000005 000181
19
000000 000000 000000 000000 000000 000000 000000 000000 000000 000019
20
000000 000000 000000 000000 000000 000000 000000 000000 000000 000001
Prilog 1. – Statističke tablice
BINOMNA DISTRIBUCIJA VJEROVATNOĆE
p( X = k ) = C nk ⋅ p k (1 − p )
n−k
n=30 p k
0,05
0,06
0,07
0,08
0,09
0,1
0,2
0,3
0,4
0,5
0
214639 156256 113367 081966 059053 042391 001238 000023 000000 000000
1
338903 299213 255991 213825 175212 141304 009285 000290 000004 000000
2
258637 276931 279388 269605 251266 227656 033656 001801 000043 000000
3
127050 164980 196273 218810 231938 236088 078532 007203 000266 000004
4
045136 071082 099719 128432 154837 177066 132522 020838 001197 000026
5
012353 023593 039030 058074 079631 102305 172279 046440 004149 000133
6
002709 006275 012241 021041 032815 047363 179457 082928 011524 000553
7
000489 001373 003159 006273 011127 018043 153821 121854 026341 001896
8
000074 000252 000684 001568 003164 005764 110559 150141 050487 005451
9
000010 000039 000126 000333 000765 001565 067564 157291 082275 013325
10
000001 000005 000020 000061 000159 000365 035471 141562 115185 027982
11
000000 000001 000003 000010 000029 000074 016123 110308 139619 050876
12
000000 000000 000000 000001 000004 000013 006382 074852 147375 080553
13
000000 000000 000000 000000 000001 000002 002209 044418 136039 111535
14
000000 000000 000000 000000 000000 000000 000671 023115 110127 135435
15
000000 000000 000000 000000 000000 000000 000179 010567 078312 144464
16
000000 000000 000000 000000 000000 000000 000042 004246 048945 135435
17
000000 000000 000000 000000 000000 000000 000009 001498 026872 111535
18
000000 000000 000000 000000 000000 000000 000002 000464 012938 080553
19
000000 000000 000000 000000 000000 000000 000000 000126 005448 050876
20
000000 000000 000000 000000 000000 000000 000000 000030 001997 027982
21
000000 000000 000000 000000 000000 000000 000000 000006 000634 013325
22
000000 000000 000000 000000 000000 000000 000000 000001 000173 005451
23
000000 000000 000000 000000 000000 000000 000000 000000 000040 001896
24
000000 000000 000000 000000 000000 000000 000000 000000 000008 000553
25
000000 000000 000000 000000 000000 000000 000000 000000 000001 000133
26
000000 000000 000000 000000 000000 000000 000000 000000 000000 000026
27
000000 000000 000000 000000 000000 000000 000000 000000 000000 000004
28
000000 000000 000000 000000 000000 000000 000000 000000 000000 000000
29
000000 000000 000000 000000 000000 000000 000000 000000 000000 000000
30
000000 000000 000000 000000 000000 000000 000000 000000 000000 000000
395
Statistika u ekonomiji i menadžmentu
POISSONOVA DISTRIBUCIJA VJEROVATNOĆE
p ( X = x ) = e −λ ⋅
k
396
λx x!
, e = 2,718, λ = n ⋅ p
λ
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
904837 090484 004524 000151 000004 000000
818731 163746 016375 001092 000055 000002 000000
740818 222245 033337 003334 000250 000015 000001 000000
670320 268128 053626 007150 000715 000057 000004 000000
606531 303265 075816 012636 001580 000158 000013 000001 000000
548812 329287 098786 019757 002964 000356 000036 000003 000000
496585 347610 121663 028388 004968 000696 000081 000008 000001 000000
449329 359463 143785 038343 007669 001227 000164 000019 000002 000000
406570 365913 164661 049398 011115 002001 000300 000039 000004 000000
1 367879 367879 183940 061313 015328 003066 000511 000073 000009 000001 000000
Prilog 1. – Statističke tablice
POISSONOVA DISTRIBUCIJA VJEROVATNOĆE
p ( X = x ) = e −λ ⋅
λ k
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
2 135335 270671 270671 180447 090224 036089 012030 003437 000859 000191 000038 000007 000001 000000
3 049787 149361 224042 224042 168031 100819 050409 021604 008102 002701 000810 000221 000055 000013 000003 000001 000000
4 018316 073263 146525 195367 195367 156293 104196 059540 029770 013231 005292 001925 000642 000197 000056 000015 000004 000001 000000
λx x!
, e = 2,718, λ = n ⋅ p
5 006738 033690 084224 140374 175467 175467 146223 104445 065278 036266 018133 008242 003434 001321 000472 000157 000049 000014 000004 000001 000000
6 002479 014873 044618 089235 133853 160623 160623 137677 103258 068838 041303 022529 011264 005199 002228 000891 000334 000118 000039 000012 000004 000001 000000
7 000912 006383 022341 052129 091226 127717 149003 149003 130377 101405 070983 045171 026350 014188 007094 003311 001448 000596 000232 000085 000030 000010 000003 000001 000000
8 000335 002684 010735 028626 057252 091604 122138 139587 139587 124077 099262 072190 048127 029616 016924 009026 004513 002124 000944 000397 000159 000061 000022 000008 000003 000001 000000
9 000123 001111 004998 014994 033737 060727 091090 117116 131756 131756 118580 097020 072765 050376 032384 019431 010930 005786 002893 001370 000617 000264 000108 000042 000016 000006 000002 000001 000000
10 000045 000454 002270 007567 018917 037833 063055 090079 112599 125110 125110 113736 094780 072908 052077 034718 021699 012764 007091 003732 001866 000889 000404 000176 000073 000029 000011 000004 000001 000001 000000
397
Statistika u ekonomiji i menadžmentu
STANDARDIZOVANA NORMALNA DISTRIBUCIJA VJEROVATNOĆE - funkcija gustine vjerovatnoće f(z)
f ( z) =
z cijeli broj i prva decimala
398
1 2π
e
−
z2 2
+∞
,
∫ f ( z )dz = 1
−∞
druga decimala
0
1
2
3
4
5
6
7
8
9
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0
398942 396953 391043 381388 368270 352065 333225 312254 289692 266085 241971 217852 194186 171369 149727 129518 110921 094049 078950 065616 053991 043984 035475 028327 022395 017528 013583 010421 007915 005953 004432 003267 002384 001723 001232 000873 000612 000425 000292 000199 000134
398922 396536 390242 380226 366782 350292 331215 310060 287369 263688 239551 215458 191860 169147 147639 127583 109155 092459 077538 064378 052919 043067 034701 027682 021862 017095 013234 010143 007697 005782 004301 003167 002309 001667 001191 000843 000590 000409 000281 000191 000129
398862 396080 389404 379031 365263 348493 329184 307851 285036 261286 237132 213069 189543 166937 145564 125665 107406 090887 076143 063157 051864 042166 033941 027048 021341 016670 012892 009871 007483 005616 004173 003070 002236 001612 001151 000814 000569 000394 000271 000184 000124
398763 395585 388529 377801 363714 346668 327133 305627 282694 258881 234714 210686 187235 164740 143505 123763 105675 089333 074766 061952 050824 041280 033194 026426 020829 016254 012558 009606 007274 005454 004049 002975 002165 001560 001112 000785 000549 000380 000260 000177 000119
398623 395052 387617 376537 362135 344818 325062 303389 280344 256471 232297 208308 184937 162555 141460 121878 103961 087796 073407 060765 049800 040408 032460 025817 020328 015848 012232 009347 007071 005296 003928 002884 002096 001508 001075 000758 000529 000366 000251 000170 000114
398444 394479 386668 375240 360527 342944 322972 301137 277985 254059 229882 205936 182649 160383 139431 120009 102265 086277 072065 059595 048792 039550 031740 025218 019837 015449 011912 009094 006873 005143 003810 002794 002029 001459 001038 000732 000510 000353 000241 000163 000109
398225 393868 385683 373911 358890 341046 320864 298872 275618 251644 227470 203571 180371 158225 137417 118157 100586 084776 070740 058441 047800 038707 031032 024631 019356 015060 011600 008846 006679 004993 003695 002707 001964 001411 001003 000706 000492 000340 000232 000157 000105
397966 393219 384663 372548 357225 339124 318737 296595 273244 249228 225060 201214 178104 156080 135418 116323 098925 083293 069433 057304 046823 037878 030337 024056 018885 014678 011295 008605 006491 004847 003584 002623 001901 001364 000969 000681 000474 000327 000223 000151 000101
397668 392531 383606 371154 355533 337180 316593 294305 270864 246809 222653 198863 175847 153948 133435 114505 097282 081828 068144 056183 045861 037063 029655 023491 018423 014305 010997 008370 006307 004705 003475 002541 001840 001319 000936 000657 000457 000315 000215 000145 000097
397330 391806 382515 369728 353812 335213 314432 292004 268477 244390 220251 196520 173602 151831 131468 112704 095657 080380 066871 055079 044915 036262 028985 022937 017971 013940 010706 008140 006127 004567 003370 002461 001780 001275 000904 000634 000441 000303 000207 000139 000093
Prilog 1. – Statističke tablice
STANDARDIZOVANA NORMALNA DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F(z)
F ( z) =
z
1 2π
∫e
−
z2 2
dz
−∞
z
druga decimala
0
1
2
3
4
5
6
7
8
9
cijeli broj i prva decimala
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0
500000 539828 579260 617911 655422 691462 725747 758036 788145 815940 841345 864334 884930 903200 919243 933193 945201 955435 964070 971283 977250 982136 986097 989276 991802 993790 995339 996533 997445 998134 998650 999032 999313 999517 999663 999767 999841 999892 999928 999952 999968
503989 543795 583166 621720 659097 694974 729069 761148 791030 818589 843752 866500 886861 904902 920730 934478 946301 956367 964852 971933 977784 982571 986447 989556 992024 993963 995473 996636 997523 998193 998694 999065 999336 999534 999675 999776 999847 999896 999931 999954 999970
507978 547758 587064 625516 662757 698468 732371 764238 793892 821214 846136 868643 888768 906582 922196 935745 947384 957284 965620 972571 978308 982997 986791 989830 992240 994132 995604 996736 997599 998250 998736 999096 999359 999550 999687 999784 999853 999900 999933 999956 999971
511966 551717 590954 629300 666402 701944 735653 767305 796731 823814 848495 870762 890651 908241 923641 936992 948449 958185 966375 973197 978822 983414 987126 990097 992451 994297 995731 996833 997673 998305 998777 999126 999381 999566 999698 999792 999858 999904 999936 999958 999972
515953 555670 594835 633072 670031 705401 738914 770350 799546 826391 850830 872857 892512 909877 925066 938220 949497 959070 967116 973810 979325 983823 987455 990358 992656 994457 995855 996928 997744 998359 998817 999155 999402 999581 999709 999800 999864 999908 999938 999959 999973
519939 559618 598706 636831 673645 708840 742154 773373 802337 828944 853141 874928 894350 911492 926471 939429 950529 959941 967843 974412 979818 984222 987776 990613 992857 994614 995975 997020 997814 998411 998856 999184 999423 999596 999720 999807 999869 999912 999941 999961 999974
523922 563559 602568 640576 677242 712260 745373 776373 805105 831472 855428 876976 896165 913085 927855 940620 951543 960796 968557 975002 980301 984614 988089 990863 993053 994766 996093 997110 997882 998462 998893 999211 999443 999610 999730 999815 999874 999915 999943 999963 999975
527903 567495 606420 644309 680822 715661 748571 779350 807850 833977 857690 879000 897958 914657 929219 941792 952540 961636 969258 975581 980774 984997 988396 991106 993244 994915 996207 997197 997948 998511 998930 999238 999462 999624 999740 999822 999879 999918 999946 999964 999976
531881 571424 610261 648027 684386 719043 751748 782305 810570 836457 859929 881000 899727 916207 930563 942947 953521 962462 969946 976148 981237 985371 988696 991344 993431 995060 996319 997282 998012 998559 998965 999264 999481 999638 999749 999828 999883 999922 999948 999966 999977
535856 575345 614092 651732 687933 722405 754903 785236 813267 838913 862143 882977 901475 917736 931888 944083 954486 963273 970621 976705 981691 985738 988989 991576 993613 995201 996427 997365 998074 998605 998999 999289 999499 999651 999758 999835 999888 999925 999950 999967 999978
399
Statistika u ekonomiji i menadžmentu
STUDENTOVA t DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće S(t)
⎛ n + 1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ⎜ ⎟ ⎝2⎠ t
n 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0
400
1 0,50000 0,53173 0,56283 0,59277 0,62112 0,64758 0,67202 0,69440 0,71478 0,73326 0,75000 0,76515 0,77886 0,79129 0,80257 0,81283 0,82219 0,83075 0,83859 0,84579 0,85242 0,85854 0,86420 0,86945 0,87433 0,87888 0,88312 0,88709 0,89081 0,89430 0,89758
2 0,50000 0,53527 0,57001 0,60376 0,63608 0,66667 0,69528 0,72180 0,74618 0,76845 0,78868 0,80698 0,82350 0,83838 0,85176 0,86380 0,87463 0,88438 0,89317 0,90109 0,90825 0,91473 0,92060 0,92593 0,93077 0,93519 0,93923 0,94292 0,94630 0,94941 0,95227
3 0,50000 0,53667 0,57286 0,60812 0,64203 0,67428 0,70460 0,73284 0,75890 0,78277 0,80450 0,82416 0,84187 0,85777 0,87200 0,88471 0,89605 0,90615 0,91516 0,92318 0,93034 0,93672 0,94241 0,94751 0,95206 0,95615 0,95981 0,96311 0,96607 0,96875 0,97117
4 0,50000 0,53742 0,57438 0,61044 0,64520 0,67834 0,70958 0,73875 0,76574 0,79050 0,81305 0,83346 0,85182 0,86827 0,88295 0,89600 0,90758 0,91782 0,92688 0,93488 0,94194 0,94817 0,95367 0,95853 0,96282 0,96662 0,96998 0,97295 0,97559 0,97794 0,98003
5 0,50000 0,53788 0,57532 0,61188 0,64716 0,68085 0,71267 0,74243 0,76999 0,79531 0,81839 0,83927 0,85805 0,87485 0,88980 0,90305 0,91475 0,92506 0,93412 0,94207 0,94903 0,95512 0,96045 0,96511 0,96919 0,97275 0,97588 0,97861 0,98100 0,98310 0,98495
6 0,50000 0,53820 0,57596 0,61285 0,64850 0,68256 0,71477 0,74493 0,77289 0,79860 0,82204 0,84325 0,86232 0,87935 0,89448 0,90786 0,91964 0,92998 0,93902 0,94692 0,95379 0,95976 0,96495 0,96945 0,97335 0,97674 0,97967 0,98221 0,98442 0,98633 0,98800
⎞ ⎟⎟ ⎠
−
n +1 2
⋅ dt
7 0,50000 0,53843 0,57642 0,61355 0,64946 0,68380 0,71629 0,74674 0,77500 0,80099 0,82469 0,84614 0,86541 0,88262 0,89788 0,91135 0,92318 0,93354 0,94256 0,95040 0,95719 0,96306 0,96813 0,97250 0,97627 0,97950 0,98229 0,98468 0,98674 0,98851 0,99003
8 0,50000 0,53860 0,57676 0,61409 0,65019 0,68473 0,71744 0,74811 0,77659 0,80280 0,82670 0,84834 0,86777 0,88510 0,90046 0,91400 0,92587 0,93622 0,94522 0,95302 0,95974 0,96553 0,97050 0,97476 0,97841 0,98153 0,98419 0,98646 0,98840 0,99005 0,99146
9 0,50000 0,53873 0,57704 0,61450 0,65076 0,68546 0,71835 0,74919 0,77784 0,80422 0,82828 0,85006 0,86961 0,88705 0,90249 0,91607 0,92797 0,93833 0,94730 0,95506 0,96172 0,96744 0,97233 0,97650 0,98005 0,98307 0,98563 0,98780 0,98964 0,99120 0,99252
10 0,50000 0,53884 0,57726 0,61484 0,65122 0,68605 0,71907 0,75006 0,77885 0,80536 0,82955 0,85145 0,87110 0,88862 0,90412 0,91775 0,92966 0,94002 0,94897 0,95669 0,96331 0,96896 0,97378 0,97787 0,98134 0,98428 0,98675 0,98884 0,99060 0,99208 0,99333
Prilog 1. – Statističke tablice
STUDENTOVA t DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće S(t)
⎛ n + 1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ⎜ ⎟ ⎝2⎠ t
n 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0
1 0,90067 0,90359 0,90634 0,90895 0,91141 0,91375 0,91598 0,91809 0,92010 0,92202 0,92385 0,92560 0,92727 0,92887 0,93040 0,93186 0,93327 0,93462 0,93592 0,93717 0,93837 0,93952 0,94064 0,94171 0,94275 0,94375 0,94472 0,94565 0,94656 0,94743
2 0,95490 0,95733 0,95958 0,96166 0,96359 0,96538 0,96705 0,96860 0,97005 0,97140 0,97267 0,97386 0,97497 0,97602 0,97700 0,97792 0,97879 0,97962 0,98039 0,98113 0,98182 0,98248 0,98310 0,98369 0,98425 0,98478 0,98529 0,98577 0,98623 0,98666
3 0,97335 0,97533 0,97713 0,97877 0,98026 0,98162 0,98286 0,98400 0,98504 0,98600 0,98687 0,98768 0,98843 0,98912 0,98975 0,99034 0,99089 0,99140 0,99187 0,99230 0,99271 0,99309 0,99344 0,99378 0,99409 0,99437 0,99465 0,99490 0,99514 0,99536
4 0,98189 0,98355 0,98503 0,98636 0,98755 0,98862 0,98958 0,99045 0,99123 0,99193 0,99257 0,99315 0,99368 0,99415 0,99459 0,99498 0,99535 0,99568 0,99598 0,99625 0,99651 0,99674 0,99696 0,99715 0,99734 0,99750 0,99766 0,99780 0,99794 0,99806
5 0,98657 0,98800 0,98926 0,99037 0,99136 0,99223 0,99300 0,99369 0,99430 0,99484 0,99532 0,99576 0,99614 0,99649 0,99680 0,99708 0,99733 0,99756 0,99776 0,99795 0,99811 0,99827 0,99840 0,99853 0,99864 0,99875 0,99884 0,99893 0,99900 0,99908
⎞ ⎟⎟ ⎠
6 0,98944 0,99070 0,99180 0,99275 0,99359 0,99432 0,99496 0,99552 0,99601 0,99644 0,99682 0,99716 0,99745 0,99772 0,99795 0,99815 0,99834 0,99850 0,99864 0,99877 0,99889 0,99899 0,99909 0,99917 0,99924 0,99931 0,99937 0,99942 0,99947 0,99952
−
n +1 2
⋅ dt
7 0,99134 0,99247 0,99344 0,99428 0,99500 0,99563 0,99617 0,99664 0,99705 0,99741 0,99771 0,99798 0,99822 0,99842 0,99860 0,99876 0,99890 0,99902 0,99912 0,99922 0,99930 0,99937 0,99944 0,99950 0,99955 0,99959 0,99963 0,99967 0,99970 0,99973
8 0,99267 0,99369 0,99457 0,99532 0,99596 0,99651 0,99698 0,99738 0,99773 0,99803 0,99828 0,99850 0,99869 0,99886 0,99900 0,99912 0,99923 0,99932 0,99940 0,99947 0,99954 0,99959 0,99964 0,99968 0,99971 0,99974 0,99977 0,99980 0,99982 0,99984
9 0,99364 0,99458 0,99539 0,99606 0,99664 0,99713 0,99754 0,99789 0,99819 0,99844 0,99866 0,99885 0,99900 0,99914 0,99926 0,99935 0,99944 0,99951 0,99958 0,99963 0,99968 0,99972 0,99975 0,99978 0,99981 0,99983 0,99985 0,99987 0,99989 0,99990
10 0,99437 0,99525 0,99599 0,99661 0,99714 0,99758 0,99795 0,99826 0,99852 0,99874 0,99893 0,99909 0,99922 0,99933 0,99943 0,99951 0,99958 0,99964 0,99969 0,99973 0,99977 0,99980 0,99983 0,99985 0,99987 0,99989 0,99990 0,99991 0,99992 0,99993
401
Statistika u ekonomiji i menadžmentu
STUDENTOVA t DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće S(t)
⎛ n + 1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ⎜ ⎟ ⎝2⎠ t
402
n 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0
11 0,50000 0,53893 0,57743 0,61511 0,65159 0,68654 0,71967 0,75077 0,77968 0,80630 0,83060 0,85259 0,87233 0,88991 0,90546 0,91912 0,93105 0,94140 0,95034 0,95802 0,96460 0,97020 0,97496 0,97898 0,98238 0,98525 0,98765 0,98967 0,99136 0,99278 0,99396
12 0,50000 0,53900 0,57759 0,61534 0,65191 0,68694 0,72017 0,75136 0,78037 0,80709 0,83148 0,85355 0,87335 0,89099 0,90658 0,92027 0,93221 0,94256 0,95148 0,95914 0,96567 0,97123 0,97593 0,97990 0,98324 0,98604 0,98839 0,99035 0,99198 0,99334 0,99447
13 0,50000 0,53906 0,57771 0,61554 0,65217 0,68728 0,72059 0,75187 0,78096 0,80776 0,83222 0,85436 0,87422 0,89191 0,90754 0,92125 0,93320 0,94354 0,95245 0,96008 0,96658 0,97209 0,97675 0,98067 0,98396 0,98671 0,98900 0,99090 0,99249 0,99380 0,99488
14 0,50000 0,53912 0,57782 0,61571 0,65240 0,68758 0,72095 0,75230 0,78146 0,80833 0,83286 0,85506 0,87497 0,89270 0,90836 0,92209 0,93404 0,94439 0,95328 0,96089 0,96736 0,97283 0,97745 0,98132 0,98457 0,98727 0,98951 0,99137 0,99291 0,99418 0,99522
15 0,50000 0,53917 0,57792 0,61585 0,65260 0,68783 0,72127 0,75268 0,78190 0,80883 0,83341 0,85566 0,87563 0,89339 0,90907 0,92282 0,93478 0,94512 0,95400 0,96158 0,96803 0,97347 0,97805 0,98189 0,98509 0,98775 0,98995 0,99177 0,99327 0,99450 0,99551
⎞ ⎟⎟ ⎠
16 0,50000 0,53921 0,57800 0,61598 0,65278 0,68806 0,72155 0,75301 0,78229 0,80927 0,83390 0,85620 0,87620 0,89399 0,90970 0,92346 0,93542 0,94576 0,95463 0,96220 0,96861 0,97403 0,97858 0,98238 0,98554 0,98816 0,99033 0,99211 0,99358 0,99478 0,99576
−
n +1 2
⋅ dt
17 0,50000 0,53924 0,57807 0,61609 0,65293 0,68826 0,72179 0,75330 0,78263 0,80965 0,83433 0,85667 0,87670 0,89452 0,91025 0,92402 0,93599 0,94632 0,95518 0,96273 0,96913 0,97452 0,97904 0,98281 0,98594 0,98853 0,99066 0,99241 0,99385 0,99502 0,99597
18 0,50000 0,53928 0,57814 0,61619 0,65307 0,68843 0,72201 0,75356 0,78293 0,81000 0,83472 0,85709 0,87715 0,89500 0,91074 0,92452 0,93650 0,94683 0,95568 0,96321 0,96959 0,97495 0,97945 0,98319 0,98629 0,98885 0,99095 0,99267 0,99408 0,99523 0,99616
19 0,50000 0,53930 0,57820 0,61628 0,65319 0,68859 0,72220 0,75379 0,78320 0,81031 0,83506 0,85746 0,87756 0,89542 0,91118 0,92498 0,93695 0,94728 0,95612 0,96364 0,97000 0,97534 0,97981 0,98352 0,98660 0,98913 0,99121 0,99291 0,99429 0,99541 0,99632
20 0,50000 0,53933 0,57825 0,61636 0,65330 0,68873 0,72238 0,75400 0,78344 0,81059 0,83537 0,85780 0,87792 0,89581 0,91158 0,92538 0,93736 0,94768 0,95652 0,96403 0,97037 0,97569 0,98014 0,98383 0,98688 0,98938 0,99144 0,99311 0,99447 0,99557 0,99646
Prilog 1. – Statističke tablice
STUDENTOVA t DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće S(t)
⎛ n + 1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ⎜ ⎟ ⎝2⎠ t
n 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0
11 0,99495 0,99577 0,99646 0,99704 0,99751 0,99792 0,99825 0,99853 0,99876 0,99896 0,99912 0,99926 0,99937 0,99947 0,99955 0,99962 0,99967 0,99972 0,99976 0,99980 0,99983 0,99985 0,99987 0,99989 0,99991 0,99992 0,99993 0,99994 0,99995 0,99996
12 0,99541 0,99618 0,99683 0,99737 0,99781 0,99818 0,99848 0,99874 0,99894 0,99912 0,99926 0,99938 0,99948 0,99957 0,99964 0,99969 0,99974 0,99978 0,99982 0,99985 0,99987 0,99989 0,99991 0,99992 0,99993 0,99994 0,99995 0,99996 0,99996 0,99997
13 0,99578 0,99652 0,99713 0,99763 0,99804 0,99838 0,99866 0,99890 0,99909 0,99924 0,99937 0,99948 0,99957 0,99964 0,99970 0,99975 0,99979 0,99983 0,99985 0,99988 0,99990 0,99991 0,99993 0,99994 0,99995 0,99996 0,99996 0,99997 0,99997 0,99998
14 0,99608 0,99679 0,99737 0,99784 0,99823 0,99855 0,99881 0,99902 0,99920 0,99934 0,99946 0,99955 0,99963 0,99970 0,99975 0,99979 0,99983 0,99986 0,99988 0,99990 0,99992 0,99993 0,99994 0,99995 0,99996 0,99997 0,99997 0,99998 0,99998 0,99998
15 0,99634 0,99702 0,99757 0,99802 0,99839 0,99869 0,99893 0,99913 0,99929 0,99942 0,99953 0,99961 0,99968 0,99974 0,99979 0,99983 0,99986 0,99988 0,99990 0,99992 0,99993 0,99995 0,99996 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999
⎞ ⎟⎟ ⎠
16 0,99656 0,99721 0,99774 0,99817 0,99852 0,99880 0,99903 0,99921 0,99936 0,99948 0,99958 0,99966 0,99972 0,99978 0,99982 0,99985 0,99988 0,99990 0,99992 0,99993 0,99995 0,99996 0,99996 0,99997 0,99998 0,99998 0,99998 0,99999 0,99999 0,99999
−
n +1 2
⋅ dt
17 0,99675 0,99738 0,99788 0,99830 0,99863 0,99890 0,99911 0,99928 0,99942 0,99954 0,99963 0,99970 0,99976 0,99980 0,99984 0,99987 0,99990 0,99992 0,99993 0,99995 0,99996 0,99996 0,99997 0,99998 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999
18 0,99691 0,99752 0,99801 0,99840 0,99872 0,99898 0,99918 0,99934 0,99948 0,99958 0,99966 0,99973 0,99978 0,99983 0,99986 0,99989 0,99991 0,99993 0,99994 0,99995 0,99996 0,99997 0,99998 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999
19 0,99705 0,99764 0,99812 0,99850 0,99880 0,99905 0,99924 0,99940 0,99952 0,99962 0,99970 0,99976 0,99981 0,99985 0,99988 0,99990 0,99992 0,99994 0,99995 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999 1,00000
20 0,99718 0,99775 0,99821 0,99858 0,99887 0,99911 0,99929 0,99944 0,99956 0,99965 0,99972 0,99978 0,99983 0,99986 0,99989 0,99991 0,99993 0,99995 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000
403
Statistika u ekonomiji i menadžmentu
STUDENTOVA t DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće S(t)
⎛ n + 1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ⎜ ⎟ ⎝2⎠ t
404
n 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0
21 0,50000 0,53935 0,57830 0,61644 0,65340 0,68886 0,72254 0,75420 0,78367 0,81084 0,83565 0,85811 0,87825 0,89616 0,91194 0,92575 0,93773 0,94805 0,95688 0,96437 0,97070 0,97601 0,98043 0,98410 0,98713 0,98961 0,99164 0,99330 0,99464 0,99572 0,99659
22 0,50000 0,53937 0,57834 0,61650 0,65349 0,68898 0,72268 0,75437 0,78387 0,81107 0,83591 0,85839 0,87855 0,89647 0,91227 0,92609 0,93807 0,94839 0,95720 0,96469 0,97100 0,97629 0,98070 0,98435 0,98735 0,98982 0,99183 0,99346 0,99478 0,99585 0,99670
23 0,50000 0,53939 0,57838 0,61656 0,65358 0,68909 0,72281 0,75453 0,78405 0,81128 0,83614 0,85864 0,87882 0,89676 0,91257 0,92639 0,93838 0,94869 0,95750 0,96498 0,97128 0,97655 0,98094 0,98457 0,98756 0,99000 0,99200 0,99361 0,99491 0,99596 0,99680
24 0,50000 0,53941 0,57842 0,61662 0,65365 0,68919 0,72294 0,75467 0,78422 0,81147 0,83636 0,85888 0,87907 0,89703 0,91285 0,92667 0,93866 0,94897 0,95778 0,96524 0,97153 0,97679 0,98116 0,98478 0,98775 0,99017 0,99215 0,99375 0,99504 0,99607 0,99690
25 0,50000 0,53943 0,57845 0,61667 0,65372 0,68928 0,72305 0,75480 0,78438 0,81165 0,83655 0,85909 0,87931 0,89727 0,91310 0,92693 0,93892 0,94923 0,95803 0,96549 0,97176 0,97701 0,98137 0,98496 0,98792 0,99033 0,99229 0,99387 0,99515 0,99617 0,99698
⎞ ⎟⎟ ⎠
26 0,50000 0,53944 0,57848 0,61672 0,65379 0,68936 0,72315 0,75493 0,78452 0,81181 0,83674 0,85929 0,87952 0,89750 0,91333 0,92717 0,93916 0,94947 0,95826 0,96571 0,97198 0,97721 0,98155 0,98514 0,98807 0,99047 0,99242 0,99398 0,99525 0,99625 0,99706
−
n +1 2
⋅ dt
27 0,50000 0,53946 0,57851 0,61676 0,65385 0,68944 0,72325 0,75504 0,78465 0,81196 0,83691 0,85948 0,87972 0,89770 0,91355 0,92739 0,93938 0,94969 0,95848 0,96592 0,97217 0,97740 0,98173 0,98530 0,98822 0,99060 0,99253 0,99409 0,99534 0,99633 0,99713
28 0,50000 0,53947 0,57854 0,61680 0,65390 0,68951 0,72333 0,75515 0,78478 0,81210 0,83706 0,85965 0,87990 0,89790 0,91375 0,92760 0,93959 0,94989 0,95868 0,96611 0,97236 0,97757 0,98189 0,98544 0,98836 0,99072 0,99264 0,99419 0,99542 0,99641 0,99719
29 0,50000 0,53948 0,57856 0,61684 0,65396 0,68958 0,72342 0,75525 0,78489 0,81223 0,83721 0,85981 0,88007 0,89808 0,91394 0,92779 0,93978 0,95008 0,95886 0,96629 0,97253 0,97773 0,98204 0,98558 0,98848 0,99084 0,99274 0,99427 0,99550 0,99648 0,99725
30 0,50000 0,53950 0,57858 0,61688 0,65400 0,68964 0,72349 0,75534 0,78500 0,81236 0,83735 0,85996 0,88023 0,89825 0,91411 0,92797 0,93996 0,95026 0,95904 0,96646 0,97269 0,97788 0,98218 0,98571 0,98860 0,99094 0,99284 0,99436 0,99557 0,99654 0,99731
Prilog 1. – Statističke tablice
STUDENTOVA t DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće S(t)
⎛ n + 1⎞ Γ⎜ ⎟ t ⎛ t2 2 ⎠ ⎝ ⎜1 + S (t ) = n ⎛ n ⎞ −∫∞⎜⎝ nπ ⋅ Γ⎜ ⎟ ⎝2⎠ t
n 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0
21 0,99729 0,99785 0,99830 0,99865 0,99893 0,99916 0,99934 0,99948 0,99959 0,99968 0,99974 0,99980 0,99984 0,99988 0,99990 0,99992 0,99994 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000
22 0,99739 0,99793 0,99837 0,99871 0,99899 0,99920 0,99937 0,99951 0,99962 0,99970 0,99976 0,99981 0,99986 0,99989 0,99991 0,99993 0,99995 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000
23 0,99748 0,99801 0,99843 0,99877 0,99904 0,99924 0,99941 0,99954 0,99964 0,99972 0,99978 0,99983 0,99987 0,99990 0,99992 0,99994 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000
24 0,99756 0,99808 0,99849 0,99882 0,99908 0,99928 0,99944 0,99956 0,99966 0,99974 0,99980 0,99984 0,99988 0,99990 0,99993 0,99994 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000
25 0,99763 0,99814 0,99855 0,99887 0,99912 0,99931 0,99947 0,99959 0,99968 0,99975 0,99981 0,99985 0,99989 0,99991 0,99993 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000
⎞ ⎟⎟ ⎠
26 0,99769 0,99820 0,99860 0,99891 0,99915 0,99934 0,99949 0,99961 0,99970 0,99977 0,99982 0,99986 0,99989 0,99992 0,99994 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
−
n +1 2
⋅ dt
27 0,99775 0,99825 0,99864 0,99894 0,99918 0,99937 0,99951 0,99963 0,99971 0,99978 0,99983 0,99987 0,99990 0,99992 0,99994 0,99996 0,99997 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
28 0,99781 0,99830 0,99868 0,99898 0,99921 0,99939 0,99953 0,99964 0,99973 0,99979 0,99984 0,99988 0,99991 0,99993 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
29 0,99786 0,99834 0,99872 0,99901 0,99924 0,99941 0,99955 0,99966 0,99974 0,99980 0,99985 0,99988 0,99991 0,99993 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
30 0,99791 0,99838 0,99875 0,99904 0,99926 0,99943 0,99957 0,99967 0,99975 0,99981 0,99986 0,99989 0,99992 0,99994 0,99995 0,99996 0,99997 0,99998 0,99998 0,99999 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
405
Statistika u ekonomiji i menadžmentu
FISHER - SNEDECOROVA F DISTRIBUCIJA VJEROVATNOĆE ν1 2 1
ν2 2 2
ν1
−1
+∞ ⋅ν F2 ⋅∫ ⋅ dF P( F ) = B(ν 1 ,ν 2 ) F0 (ν + ν F )− (ν 1 +2ν 2 ) 2 1
ν
P(F)=0,1 n1 1 2 3 4 5 6 7 8 9 10 n2 1 39,8635 49,5000 53,5932 55,8330 57,2401 58,2044 58,9060 59,4390 59,8576 60,1950 2 8,5263 9,0000 9,1618 9,2434 9,2926 9,3255 9,3491 9,3668 9,3805 9,3916 3 5,5383 5,4624 5,3908 5,3426 5,3092 5,2847 5,2662 5,2517 5,2400 5,2304 4 4,5448 4,3246 4,1909 4,1072 4,0506 4,0097 3,9790 3,9549 3,9357 3,9199 5 4,0604 3,7797 3,6195 3,5202 3,4530 3,4045 3,3679 3,3393 3,3163 3,2974 6 3,7759 3,4633 3,2888 3,1808 3,1075 3,0546 3,0145 2,9830 2,9577 2,9369 7 3,5894 3,2574 3,0741 2,9605 2,8833 2,8274 2,7849 2,7516 2,7247 2,7025 8 3,4579 3,1131 2,9238 2,8064 2,7264 2,6683 2,6241 2,5893 2,5612 2,5380 9 3,3603 3,0065 2,8129 2,6927 2,6106 2,5509 2,5053 2,4694 2,4403 2,4163 10 3,2850 2,9245 2,7277 2,6053 2,5216 2,4606 2,4140 2,3772 2,3473 2,3226 12 3,1765 2,8068 2,6055 2,4801 2,3940 2,3310 2,2828 2,2446 2,2135 2,1878 15 3,0732 2,6952 2,4898 2,3614 2,2730 2,2081 2,1582 2,1185 2,0862 2,0593 20 2,9747 2,5893 2,3801 2,2489 2,1582 2,0913 2,0397 1,9985 1,9649 1,9367 24 2,9271 2,5383 2,3274 2,1949 2,1030 2,0351 1,9826 1,9407 1,9063 1,8775 30 2,8807 2,4887 2,2761 2,1422 2,0492 1,9803 1,9269 1,8841 1,8490 1,8195 40 2,8354 2,4404 2,2261 2,0909 1,9968 1,9269 1,8725 1,8289 1,7929 1,7627 60 2,7911 2,3933 2,1774 2,0410 1,9457 1,8747 1,8194 1,7748 1,7380 1,7070 120 2,7478 2,3473 2,1300 1,9923 1,8959 1,8238 1,7675 1,7220 1,6842 1,6524 ∞ 2,7055 2,3026 2,0838 1,9449 1,8473 1,7741 1,7167 1,6702 1,6315 1,5987
n2
n1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
406
12 60,7052 9,4081 5,2156 3,8955 3,2682 2,9047 2,6681 2,5020 2,3789 2,2841 2,1474 2,0171 1,8924 1,8319 1,7727 1,7146 1,6574 1,6012 1,5458
15 61,2203 9,4247 5,2003 3,8704 3,2380 2,8712 2,6322 2,4642 2,3396 2,2435 2,1049 1,9722 1,8449 1,7831 1,7223 1,6624 1,6034 1,5450 1,4871
20 61,7403 9,4413 5,1845 3,8443 3,2067 2,8363 2,5947 2,4246 2,2983 2,2007 2,0597 1,9243 1,7938 1,7302 1,6673 1,6052 1,5435 1,4821 1,4206
24 62,0020 9,4496 5,1764 3,8310 3,1905 2,8183 2,5753 2,4041 2,2768 2,1784 2,0360 1,8990 1,7667 1,7019 1,6377 1,5741 1,5107 1,4472 1,3832
30 62,2650 9,4579 5,1681 3,8174 3,1741 2,8000 2,5555 2,3830 2,2547 2,1554 2,0115 1,8728 1,7382 1,6721 1,6065 1,5411 1,4755 1,4094 1,3419
40 62,5291 9,4662 5,1597 3,8036 3,1573 2,7812 2,5351 2,3614 2,2320 2,1317 1,9861 1,8454 1,7083 1,6407 1,5732 1,5056 1,4373 1,3676 1,2951
60 62,7943 9,4746 5,1512 3,7896 3,1402 2,7620 2,5142 2,3391 2,2085 2,1072 1,9597 1,8168 1,6768 1,6073 1,5376 1,4672 1,3952 1,3203 1,2400
120 63,0606 9,4829 5,1425 3,7753 3,1228 2,7423 2,4928 2,3162 2,1843 2,0818 1,9323 1,7867 1,6433 1,5715 1,4989 1,4248 1,3476 1,2646 1,1686
∞ 63,3282 9,4912 5,1337 3,7607 3,1050 2,7222 2,4708 2,2926 2,1592 2,0554 1,9036 1,7551 1,6074 1,5327 1,4564 1,3769 1,2915 1,1926 1,0000
Prilog 1. – Statističke tablice
FISHER - SNEDECOROVA F DISTRIBUCIJA VJEROVATNOĆE ν1 2 1
ν2 2 2
ν1
−1
+∞ ⋅ν F2 ⋅∫ ⋅ dF P( F ) = B(ν 1 ,ν 2 ) F0 (ν + ν F )− (ν 1 +2ν 2 ) 2 1
ν
P(F)=0,05 n1 n2
2
3
4
5
6
7
8
9
10
1 161,4476 199,5000 215,7073 224,5832 230,1619 233,9860 236,7684 238,8827 240,5433 241,8817 2 18,5128 19,0000 19,1643 19,2468 19,2964 19,3295 19,3532 19,3710 19,3848 19,3959 3 10,1280 9,5521 9,2766 9,1172 9,0135 8,9406 8,8867 8,8452 8,8123 8,7855 4 7,7086 6,9443 6,5914 6,3882 6,2561 6,1631 6,0942 6,0410 5,9988 5,9644 5 6,6079 5,7861 5,4095 5,1922 5,0503 4,9503 4,8759 4,8183 4,7725 4,7351 6 5,9874 5,1433 4,7571 4,5337 4,3874 4,2839 4,2067 4,1468 4,0990 4,0600 7 5,5914 4,7374 4,3468 4,1203 3,9715 3,8660 3,7870 3,7257 3,6767 3,6365 8 5,3177 4,4590 4,0662 3,8379 3,6875 3,5806 3,5005 3,4381 3,3881 3,3472 9 5,1174 4,2565 3,8625 3,6331 3,4817 3,3738 3,2927 3,2296 3,1789 3,1373 10 4,9646 4,1028 3,7083 3,4780 3,3258 3,2172 3,1355 3,0717 3,0204 2,9782 12 4,7472 3,8853 3,4903 3,2592 3,1059 2,9961 2,9134 2,8486 2,7964 2,7534 15 4,5431 3,6823 3,2874 3,0556 2,9013 2,7905 2,7066 2,6408 2,5876 2,5437 20 4,3512 3,4928 3,0984 2,8661 2,7109 2,5990 2,5140 2,4471 2,3928 2,3479 24 4,2597 3,4028 3,0088 2,7763 2,6207 2,5082 2,4226 2,3551 2,3002 2,2547 30 4,1709 3,3158 2,9223 2,6896 2,5336 2,4205 2,3343 2,2662 2,2107 2,1646 40 4,0847 3,2317 2,8387 2,6060 2,4495 2,3359 2,2490 2,1802 2,1240 2,0772 60 4,0012 3,1504 2,7581 2,5252 2,3683 2,2541 2,1665 2,0970 2,0401 1,9926 120 3,9201 3,0718 2,6802 2,4472 2,2899 2,1750 2,0868 2,0164 1,9588 1,9105 ∞ 3,8415 2,9957 2,6049 2,3719 2,2141 2,0986 2,0096 1,9384 1,8799 1,8307 n1
n2
1
1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
12
15
20
24
30
40
60
120
∞
243,9060 245,9499 248,0131 249,0518 250,0951 251,1432 252,1957 253,2529 254,3148 19,4125 19,4291 19,4458 19,4541 19,4624 19,4707 19,4791 19,4874 19,4957 8,7446 8,7029 8,6602 8,6385 8,6166 8,5944 8,5720 8,5494 8,5264 5,9117 5,8578 5,8025 5,7744 5,7459 5,7170 5,6877 5,6581 5,6281 4,6777 4,6188 4,5581 4,5272 4,4957 4,4638 4,4314 4,3985 4,3650 3,9999 3,9381 3,8742 3,8415 3,8082 3,7743 3,7398 3,7047 3,6689 3,5747 3,5107 3,4445 3,4105 3,3758 3,3404 3,3043 3,2674 3,2297 3,2839 3,2184 3,1503 3,1152 3,0794 3,0428 3,0053 2,9669 2,9276 3,0729 3,0061 2,9365 2,9005 2,8637 2,8259 2,7872 2,7475 2,7067 2,9130 2,8450 2,7740 2,7372 2,6996 2,6609 2,6211 2,5801 2,5379 2,6866 2,6169 2,5436 2,5055 2,4663 2,4259 2,3842 2,3410 2,2962 2,4753 2,4034 2,3275 2,2878 2,2468 2,2043 2,1601 2,1141 2,0658 2,2776 2,2033 2,1242 2,0825 2,0391 1,9938 1,9464 1,8963 1,8432 2,1834 2,1077 2,0267 1,9838 1,9390 1,8920 1,8424 1,7896 1,7330 2,0921 2,0148 1,9317 1,8874 1,8409 1,7918 1,7396 1,6835 1,6223 2,0035 1,9245 1,8389 1,7929 1,7444 1,6928 1,6373 1,5766 1,5089 1,9174 1,8364 1,7480 1,7001 1,6491 1,5943 1,5343 1,4673 1,3893 1,8337 1,7505 1,6587 1,6084 1,5543 1,4952 1,4290 1,3519 1,2539 1,7522 1,6664 1,5705 1,5173 1,4591 1,3940 1,3180 1,2214 1,0000
407
Statistika u ekonomiji i menadžmentu
FISHER - SNEDECOROVA F DISTRIBUCIJA VJEROVATNOĆE ν1
ν2
ν1
−1
ν 2 ⋅ν 22 +∞ F2 ⋅∫ ⋅ dF P( F ) = 1 B(ν 1 ,ν 2 ) F (ν + ν F )− (ν +2ν ) 2 1 1
2
0
P(F)=0,01
n2
n2
n1 1 2 3 4 5 6 7 8 9 10 1 4052,1807 4999,5000 5403,3520 5624,5833 5763,6496 5858,9861 5928,3557 5981,0703 6022,4732 6055,8467 2 98,5025 99,0000 99,1662 99,2494 99,2993 99,3326 99,3564 99,3742 99,3881 99,3992 3 34,1162 30,8165 29,4567 28,7099 28,2371 27,9107 27,6717 27,4892 27,3452 27,2287 4 21,1977 18,0000 16,6944 15,9770 15,5219 15,2069 14,9758 14,7989 14,6591 14,5459 5 16,2582 13,2739 12,0600 11,3919 10,9670 10,6723 10,4555 10,2893 10,1578 10,0510 6 13,7450 10,9248 9,7795 9,1483 8,7459 8,4661 8,2600 8,1017 7,9761 7,8741 7 12,2464 9,5466 8,4513 7,8466 7,4604 7,1914 6,9928 6,8400 6,7188 6,6201 8 11,2586 8,6491 7,5910 7,0061 6,6318 6,3707 6,1776 6,0289 5,9106 5,8143 9 10,5614 8,0215 6,9919 6,4221 6,0569 5,8018 5,6129 5,4671 5,3511 5,2565 10 10,0443 7,5594 6,5523 5,9943 5,6363 5,3858 5,2001 5,0567 4,9424 4,8491 12 9,3302 6,9266 5,9525 5,4120 5,0643 4,8206 4,6395 4,4994 4,3875 4,2961 15 8,6831 6,3589 5,4170 4,8932 4,5556 4,3183 4,1415 4,0045 3,8948 3,8049 20 8,0960 5,8489 4,9382 4,4307 4,1027 3,8714 3,6987 3,5644 3,4567 3,3682 24 7,8229 5,6136 4,7181 4,2184 3,8951 3,6667 3,4959 3,3629 3,2560 3,1681 30 7,5625 5,3903 4,5097 4,0179 3,6990 3,4735 3,3045 3,1726 3,0665 2,9791 40 7,3141 5,1785 4,3126 3,8283 3,5138 3,2910 3,1238 2,9930 2,8876 2,8005 60 7,0771 4,9774 4,1259 3,6490 3,3389 3,1187 2,9530 2,8233 2,7185 2,6318 120 6,8509 4,7865 3,9491 3,4795 3,1735 2,9559 2,7918 2,6629 2,5586 2,4721 ∞ 6,6349 4,6052 3,7816 3,3192 3,0173 2,8020 2,6393 2,5113 2,4073 2,3209 n1 12 15 20 24 30 40 60 120 ∞ 1 6106,3207 6157,2846 6208,7302 6234,6309 6260,6486 6286,7821 6313,0301 6339,3913 6365,8685 99,4159 99,4325 99,4492 99,4575 99,4658 99,4742 99,4825 99,4908 99,4992 2 27,0518 26,8722 26,6898 26,5975 26,5045 26,4108 26,3164 26,2211 26,1251 3 14,3736 14,1982 14,0196 13,9291 13,8377 13,7454 13,6522 13,5581 13,4631 4 9,8883 9,7222 9,5526 9,4665 9,3793 9,2912 9,2020 9,1118 9,0204 5 7,7183 7,5590 7,3958 7,3127 7,2285 7,1432 7,0567 6,9690 6,8800 6 6,4691 6,3143 6,1554 6,0743 5,9920 5,9084 5,8236 5,7373 5,6495 7 5,6667 5,5151 5,3591 5,2793 5,1981 5,1156 5,0316 4,9461 4,8588 8 5,1114 4,9621 4,8080 4,7290 4,6486 4,5666 4,4831 4,3978 4,3105 9 4,7059 4,5581 4,4054 4,3269 4,2469 4,1653 4,0819 3,9965 3,9090 10 4,1553 4,0096 3,8584 3,7805 3,7008 3,6192 3,5355 3,4494 3,3608 12 3,6662 3,5222 3,3719 3,2940 3,2141 3,1319 3,0471 2,9595 2,8684 15 3,2311 3,0880 2,9377 2,8594 2,7785 2,6947 2,6077 2,5168 2,4212 20 3,0316 2,8887 2,7380 2,6591 2,5773 2,4923 2,4035 2,3100 2,2107 24 2,8431 2,7002 2,5487 2,4689 2,3860 2,2992 2,2079 2,1108 2,0062 30 2,6648 2,5216 2,3689 2,2880 2,2034 2,1142 2,0194 1,9172 1,8047 40 2,4961 2,3523 2,1978 2,1154 2,0285 1,9360 1,8363 1,7263 1,6006 60 2,3363 2,1915 2,0346 1,9500 1,8600 1,7628 1,6557 1,5330 1,3805 120 2,1847 2,0385 1,8783 1,7908 1,6964 1,5923 1,4730 1,3246 1,0000 ∞
408
Prilog 1. – Statističke tablice
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
hi
n
kvadrat 0,001 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
x 2j
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
1
2
3
4
5
6
7
8
0,025227 0,079656 0,176937 0,248170 0,345279 0,416118 0,472911 0,520500 0,561422 0,597216 0,628907 0,657218 0,682689 0,842701 0,916735 0,954500 0,974653 0,985694 0,991849 0,995322 0,997300 0,998435 0,999089 0,999468 0,999689 0,999817 0,999892 0,999937 0,999963 0,999978 0,999987 0,999992
0,000500 0,004988 0,024690 0,048771 0,095163 0,139292 0,181269 0,221199 0,259182 0,295312 0,329680 0,362372 0,393469 0,632121 0,776870 0,864665 0,917915 0,950213 0,969803 0,981684 0,988891 0,993262 0,995913 0,997521 0,998497 0,999088 0,999447 0,999665 0,999797 0,999877 0,999925 0,999955
0,000008 0,000265 0,002929 0,008163 0,022411 0,039972 0,059758 0,081109 0,103568 0,126796 0,150533 0,174572 0,198748 0,427593 0,608375 0,738536 0,828203 0,888390 0,928102 0,953988 0,970709 0,981434 0,988274 0,992617 0,995363 0,997095 0,998183 0,998866 0,999293 0,999560 0,999727 0,999830
0,000000 0,000012 0,000307 0,001209 0,004679 0,010186 0,017523 0,026499 0,036936 0,048671 0,061552 0,075439 0,090204 0,264241 0,442175 0,593994 0,712703 0,800852 0,864112 0,908422 0,938901 0,959572 0,973436 0,982649 0,988724 0,992705 0,995299 0,996981 0,998067 0,998766 0,999214 0,999501
0,000000 0,000001 0,000029 0,000162 0,000886 0,002357 0,004670 0,007877 0,011997 0,017031 0,022967 0,029778 0,037434 0,150855 0,300014 0,450584 0,584120 0,693781 0,779360 0,843764 0,890936 0,924765 0,948620 0,965212 0,976621 0,984391 0,989638 0,993156 0,995500 0,997054 0,998078 0,998750
0,000000 0,000000 0,000003 0,000020 0,000155 0,000503 0,001148 0,002161 0,003599 0,005509 0,007926 0,010879 0,014388 0,080301 0,191153 0,323324 0,456187 0,576810 0,679153 0,761897 0,826422 0,875348 0,911624 0,938031 0,956964 0,970364 0,979743 0,986246 0,990717 0,993768 0,995836 0,997231
0,000000 0,000000 0,000000 0,000002 0,000025 0,000100 0,000263 0,000554 0,001008 0,001664 0,002556 0,003715 0,005171 0,040160 0,114998 0,220223 0,340037 0,460251 0,571120 0,667406 0,747344 0,811427 0,861381 0,899441 0,927892 0,948819 0,964001 0,974884 0,982604 0,988030 0,991813 0,994430
0,000000 0,000000 0,000000 0,000000 0,000004 0,000019 0,000057 0,000133 0,000266 0,000473 0,000776 0,001195 0,001752 0,018988 0,065642 0,142877 0,242424 0,352768 0,463367 0,566530 0,657704 0,734974 0,798301 0,848796 0,888150 0,918235 0,940855 0,957620 0,969891 0,978774 0,985140 0,989664
409
Statistika u ekonomiji i menadžmentu
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
x 2j
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
hi
n
1
2
3
4
5
6
7
8
kvadrat
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
0,999995 0,999997 0,999998 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,999972 0,999983 0,999990 0,999994 0,999996 0,999998 0,999999 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,999895 0,999935 0,999960 0,999975 0,999985 0,999990 0,999994 0,999996 0,999998 0,999999 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,999683 0,999800 0,999873 0,999920 0,999950 0,999968 0,999980 0,999988 0,999992 0,999995 0,999997 0,999998 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,999190 0,999476 0,999662 0,999783 0,999861 0,999911 0,999943 0,999964 0,999977 0,999985 0,999991 0,999994 0,999996 0,999998 0,999998 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,998165 0,998789 0,999204 0,999478 0,999659 0,999777 0,999855 0,999906 0,999939 0,999961 0,999975 0,999984 0,999990 0,999993 0,999996 0,999997 0,999998 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,996230 0,997460 0,998295 0,998861 0,999241 0,999496 0,999667 0,999780 0,999855 0,999905 0,999938 0,999959 0,999974 0,999983 0,999989 0,999993 0,999995 0,999997 0,999998 0,999999 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
0,992853 0,995084 0,996636 0,997708 0,998445 0,998950 0,999293 0,999526 0,999683 0,999789 0,999859 0,999907 0,999938 0,999959 0,999973 0,999982 0,999988 0,999992 0,999995 0,999997 0,999998 0,999999 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000 1,000000 1,000000
410
Prilog 1. – Statističke tablice
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
hi
n
kvadrat 0,001 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
x 2j
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
9
10
11
0,000000 0,000000 0,000000 0,000000 0,000001 0,000003 0,000012 0,000030 0,000066 0,000128 0,000223 0,000365 0,000562 0,008532 0,035705 0,088587 0,165692 0,260082 0,362881 0,465854 0,562726 0,649515 0,724291 0,786691 0,837394 0,877675 0,909064 0,933118 0,951284 0,964826 0,974807 0,982088
0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000002 0,000007 0,000016 0,000033 0,000061 0,000106 0,000172 0,003660 0,018576 0,052653 0,108822 0,184737 0,274555 0,371163 0,467896 0,559507 0,642482 0,714943 0,776328 0,827008 0,867938 0,900368 0,925636 0,945036 0,959737 0,970747
0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000004 0,000008 0,000016 0,000029 0,000050 0,001504 0,009274 0,030083 0,068833 0,126636 0,200916 0,286696 0,378108 0,469613 0,556737 0,636357 0,706675 0,767007 0,817503 0,858869 0,892124 0,918419 0,938906 0,954659
12 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000002 0,000004 0,000008 0,000014 0,000594 0,004456 0,016564 0,042021 0,083918 0,142386 0,214870 0,297070 0,384039 0,471081 0,554320 0,630959 0,699292 0,758564 0,808764 0,850403 0,884309 0,911472 0,932914
13
14
0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000002 0,000004 0,000226 0,002066 0,008809 0,024807 0,053847 0,097848 0,156400 0,227056 0,306066 0,389182 0,472356 0,552188 0,626156 0,692647 0,750870 0,800696 0,842481 0,876896 0,904790
0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000001 0,000083 0,000926 0,004534 0,014187 0,033509 0,065288 0,110674 0,168949 0,237817 0,313964 0,393697 0,473476 0,550289 0,621845 0,686626 0,743822 0,793219 0,835051 0,869859
15 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000030 0,000402 0,002263 0,007874 0,020252 0,042350 0,076217 0,122483 0,180260 0,247406 0,320971 0,397702 0,474471 0,548583 0,617948 0,681136 0,737334 0,786266 0,828067
411
Statistika u ekonomiji i menadžmentu
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
x 2j
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
( )
⋅∫ χ
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
hi
n
9
10
11
kvadrat
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
0,987350 0,991121 0,993804 0,995699 0,997029 0,997957 0,998601 0,999046 0,999352 0,999561 0,999704 0,999801 0,999866 0,999911 0,999940 0,999960 0,999974 0,999983 0,999988 0,999992 0,999995 0,999997 0,999998 0,999999 0,999999 0,999999 1,000000 1,000000 1,000000 1,000000
0,978906 0,984895 0,989253 0,992400 0,994654 0,996260 0,997396 0,998195 0,998754 0,999143 0,999413 0,999600 0,999728 0,999815 0,999875 0,999916 0,999943 0,999962 0,999975 0,999983 0,999989 0,999993 0,999995 0,999997 0,999998 0,999999 0,999999 0,999999 1,000000 1,000000
0,966629 0,975627 0,982325 0,987267 0,990883 0,993510 0,995405 0,996763 0,997730 0,998415 0,998898 0,999237 0,999474 0,999638 0,999752 0,999831 0,999885 0,999922 0,999947 0,999964 0,999976 0,999984 0,999989 0,999993 0,999995 0,999997 0,999998 0,999999 0,999999 0,999999
412
2
12 0,949620 0,962480 0,972274 0,979659 0,985177 0,989266 0,992273 0,994468 0,996060 0,997208 0,998030 0,998616 0,999032 0,999325 0,999532 0,999676 0,999777 0,999846 0,999895 0,999928 0,999951 0,999967 0,999977 0,999985 0,999990 0,999993 0,999995 0,999997 0,999998 0,999999
13
14
0,927071 0,944638 0,958324 0,968870 0,976916 0,982999 0,987559 0,990950 0,993454 0,995290 0,996628 0,997598 0,998296 0,998796 0,999153 0,999407 0,999586 0,999712 0,999800 0,999862 0,999905 0,999935 0,999955 0,999969 0,999979 0,999986 0,999990 0,999993 0,999996 0,999997
0,898367 0,921386 0,939730 0,954178 0,965433 0,974113 0,980746 0,985772 0,989550 0,992368 0,994456 0,995994 0,997119 0,997938 0,998530 0,998957 0,999262 0,999480 0,999635 0,999745 0,999822 0,999876 0,999914 0,999941 0,999959 0,999972 0,999981 0,999987 0,999991 0,999994
15 0,863171 0,892196 0,915860 0,934907 0,950057 0,961977 0,971264 0,978431 0,983915 0,988079 0,991215 0,993562 0,995306 0,996595 0,997541 0,998232 0,998734 0,999098 0,999359 0,999547 0,999680 0,999775 0,999843 0,999890 0,999923 0,999947 0,999963 0,999975 0,999982 0,999988
Prilog 1. – Statističke tablice
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
hi n kvadrat 0,001 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
16 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000010 0,000170 0,001097 0,004247 0,011905 0,026739 0,051134 0,086586 0,133372 0,190515 0,256020 0,327242 0,401286 0,475361 0,547039 0,614403 0,676103 0,731337 0,779779
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
17 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000003 0,000070 0,000517 0,002229 0,006814 0,016451 0,033453 0,059738 0,096390 0,143436 0,199863 0,263814 0,332898 0,404518 0,476165 0,545634 0,611159 0,671468 0,725771
18 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000028 0,000237 0,001140 0,003803 0,009874 0,021363 0,040257 0,068094 0,105643 0,152763 0,208427 0,270909 0,338033 0,407453 0,476895 0,544347 0,608177 0,667180
x 2j
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
19 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000011 0,000106 0,000569 0,002072 0,005787 0,013329 0,026521 0,047054 0,076162 0,114375 0,161429 0,216309 0,277403 0,342722 0,410132 0,477562 0,543164 0,605422
20 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000004 0,000046 0,000277 0,001102 0,003315 0,008132 0,017093 0,031828 0,053777 0,083924 0,122616 0,169504 0,223592 0,283376 0,347026 0,412592 0,478174 0,542070
21 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000002 0,000020 0,000132 0,000574 0,001858 0,004856 0,010786 0,021088 0,037213 0,060382 0,091376 0,130401 0,177048 0,230349 0,288894 0,350996 0,414860 0,478739
22 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000008 0,000062 0,000292 0,001019 0,002840 0,006669 0,013695 0,025251 0,042621 0,066839 0,098521 0,137762 0,184114 0,236638 0,294012 0,354672 0,416960
23 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000003 0,000028 0,000146 0,000548 0,001628 0,004043 0,008723 0,016812 0,029529 0,048010 0,073129 0,105366 0,144731 0,190748 0,242511 0,298775 0,358088
413
Statistika u ekonomiji i menadžmentu
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
hi kvadrat
414
n 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
16 0,821489 0,856808 0,886265 0,910496 0,930175 0,945972 0,958517 0,968380 0,976064 0,981998 0,986544 0,990000 0,992610 0,994567 0,996026 0,997107 0,997903 0,998487 0,998912 0,999221 0,999445 0,999605 0,999721 0,999803 0,999861 0,999903 0,999932 0,999953 0,999967 0,999977
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
17 0,773710 0,815281 0,850749 0,880565 0,905290 0,925539 0,941932 0,955062 0,965474 0,973655 0,980028 0,984952 0,988728 0,991604 0,993779 0,995413 0,996635 0,997542 0,998213 0,998706 0,999067 0,999329 0,999520 0,999657 0,999756 0,999827 0,999878 0,999914 0,999940 0,999958
18 0,720587 0,768015 0,809410 0,844972 0,875084 0,900242 0,921005 0,937945 0,951621 0,962554 0,971213 0,978013 0,983310 0,987404 0,990548 0,992944 0,994759 0,996127 0,997150 0,997913 0,998478 0,998894 0,999200 0,999423 0,999586 0,999703 0,999788 0,999849 0,999893 0,999925
x 2j
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
19 0,663199 0,715744 0,762658 0,803848 0,839458 0,869811 0,895347 0,916571 0,934015 0,948202 0,959627 0,968745 0,975960 0,981622 0,986033 0,989444 0,992065 0,994065 0,995583 0,996728 0,997587 0,998228 0,998704 0,999056 0,999315 0,999504 0,999643 0,999743 0,999816 0,999869
20 0,602867 0,659489 0,711205 0,757608 0,798569 0,834188 0,864736 0,890601 0,912241 0,930146 0,944810 0,956702 0,966259 0,973875 0,979896 0,984619 0,988298 0,991144 0,993333 0,995005 0,996275 0,997234 0,997956 0,998495 0,998897 0,999194 0,999413 0,999575 0,999693 0,999779
21 0,541056 0,600490 0,656022 0,706941 0,752836 0,793551 0,829147 0,859849 0,885998 0,908012 0,926342 0,941450 0,953783 0,963761 0,971765 0,978135 0,983166 0,987111 0,990185 0,992563 0,994393 0,995792 0,996857 0,997662 0,998268 0,998722 0,999061 0,999312 0,999498 0,999635
22 0,479262 0,540111 0,598270 0,652771 0,702925 0,748318 0,788774 0,824319 0,855139 0,881536 0,903884 0,922604 0,938126 0,950876 0,961255 0,969634 0,976344 0,981678 0,985888 0,989188 0,991759 0,993749 0,995281 0,996453 0,997346 0,998022 0,998532 0,998915 0,999201 0,999414
23 0,418912 0,479748 0,539229 0,596192 0,649715 0,699134 0,744032 0,784218 0,819690 0,850598 0,877207 0,899857 0,918933 0,934842 0,947984 0,958747 0,967487 0,974528 0,980159 0,984631 0,988158 0,990922 0,993074 0,994741 0,996025 0,997009 0,997758 0,998327 0,998756 0,999079
Prilog 1. – Statističke tablice
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
hi kvadrat
n 0,001 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
24 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000013 0,000071 0,000289 0,000915 0,002404 0,005453 0,010988 0,020092 0,033880 0,053350 0,079241 0,111924 0,151338 0,196992 0,248010 0,303224
x 2j
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
25 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000006 0,000034 0,000150 0,000505 0,001404 0,003347 0,007054 0,013432 0,023499 0,038268 0,058617 0,085171 0,118206 0,157609 0,202879 0,253175
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
26 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000002 0,000016 0,000076 0,000274 0,000805 0,002019 0,004451 0,008827 0,016027 0,027000 0,042666 0,063797 0,090917 0,124227 0,163570 0,208443
27 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000007 0,000038 0,000146 0,000454 0,001197 0,002761 0,005706 0,010753 0,018745 0,030568 0,047053 0,068878 0,096480 0,129999 0,169244
28 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000003 0,000019 0,000076 0,000252 0,000698 0,001685 0,003628 0,007100 0,012811 0,021565 0,034181 0,051411 0,073851 0,101864 0,135536
29 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000002 0,000009 0,000039 0,000137 0,000401 0,001012 0,002271 0,004616 0,008623 0,014985 0,024464 0,037819 0,055728 0,078712 0,107073
30 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000000 0,000001 0,000004 0,000020 0,000074 0,000226 0,000599 0,001400 0,002956 0,005717 0,010260 0,017257 0,027425 0,041466 0,059992 0,083458
415
Statistika u ekonomiji i menadžmentu
HI-KVADRAT DISTRIBUCIJA VJEROVATNOĆE - funkcija distribucije vjerovatnoće F (hi kvadrat)
( )=
F χ
hi kvadrat
416
n 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
24 0,361275 0,420733 0,480202 0,538403 0,594239 0,646835 0,695547 0,739960 0,779869 0,815248 0,846217 0,873007 0,895927 0,915331 0,931599 0,945113 0,956240 0,965327 0,972691 0,978613 0,983343 0,987095 0,990053 0,992370 0,994175 0,995573 0,996650 0,997476 0,998106 0,998584
x 2j
1
2
n 2
⎛n⎞ 2 Γ⎜ ⎟ ⎝2⎠
25 0,307390 0,364256 0,422437 0,480626 0,537626 0,592401 0,644115 0,692147 0,736084 0,775711 0,810981 0,841988 0,868932 0,892092 0,911797 0,928400 0,942263 0,953739 0,963160 0,970836 0,977043 0,982027 0,986003 0,989155 0,991638 0,993582 0,995097 0,996270 0,997175 0,997869
( )
⋅∫ χ
2
n−2 2
⋅e
−
χ2 2
( )
d χ2
0
26 0,258036 0,311303 0,367053 0,424035 0,481025 0,536895 0,590667 0,641542 0,688918 0,732389 0,771731 0,806878 0,837902 0,864976 0,888351 0,908331 0,925246 0,939439 0,951245 0,960988 0,968966 0,975451 0,980686 0,984884 0,988229 0,990878 0,992964 0,994598 0,995870 0,996856
27 0,213712 0,262623 0,314988 0,369684 0,425538 0,481399 0,536205 0,589026 0,639101 0,685846 0,728861 0,767916 0,802930 0,833953 0,861134 0,884701 0,904933 0,922138 0,936641 0,948763 0,958814 0,967085 0,973841 0,979322 0,983739 0,987277 0,990093 0,992322 0,994076 0,995449
28 0,174651 0,218709 0,266960 0,318464 0,372165 0,426955 0,481753 0,535552 0,587472 0,636782 0,682919 0,725489 0,764256 0,799127 0,830133 0,857402 0,881139 0,901601 0,919077 0,933872 0,946294 0,956641 0,965195 0,972215 0,977938 0,982572 0,986301 0,989284 0,991656 0,993533
29 0,140851 0,179811 0,223457 0,271068 0,321752 0,374509 0,428295 0,482087 0,534934 0,585996 0,634576 0,680127 0,722261 0,760740 0,795460 0,826436 0,853776 0,877664 0,898336 0,916063 0,931134 0,943841 0,954471 0,963298 0,970576 0,976535 0,981383 0,985302 0,988452 0,990968
30 0,112112 0,145956 0,184740 0,227975 0,274968 0,324868 0,376729 0,429563 0,482403 0,534346 0,584593 0,632473 0,677458 0,719167 0,757360 0,791923 0,822856 0,850250 0,874271 0,895136 0,913096 0,928426 0,941404 0,952307 0,961398 0,968926 0,975116 0,980175 0,984282 0,987598
Prilog 1. – Statističke tablice
TABLICA ZA PRERAČUNAVANJE VRIJEDNOSTI r U Z
.00
.01
.02
.03
.04
.05
.06
.07
.08
.09
.0000 .0997 .1974 .2913 .3800
.0100 .1096 .2070 .3004 .3885
.0200 .1194 .2165 .3095 .3969
.0300 .1293 .2260 .3185 .4053
.0400 .1391 .2355 .3275 .4136
.0500 .1489 .2449 .3364 .4219
.0599 .1586 .2543 .3452 .4301
.0699 .1684 .2636 .3540 .4382
.0798 .1781 .2729 .3627 .4462
.0898 .1877 .2821 .3714 .4542
.4621 .5370 .6044 .6640 .7163
.4699 .5441 .6107 .6696 .7211
.4777 .5511 .6169 .6751 .7259
.4854 .5580 .6231 .6805 .7306
.4930 .5649 .6291 .6858 .7352
.5005 .5717 .6351 .6911 .7398
.5080 .5784 .6411 .6963 .7443
.5154 .5850 .6469 .7014 .7487
.5227 .5915 .6527 .7064 .7531
.5299 .5980 .6584 .7114 .7574
.7616 .8005 .8337 .8617 .8854
.7658 .8041 .8367 .8643 .8875
.7699 .8076 .8397 .8668 .8896
.7739 .8110 .8426 .8692 .8917
.7779 .8144 .8455 .8717 .8937
.7818 .8178 .8483 .8741 .8957
.7857 .8210 .8511 .8764 .8977
.7895 .8243 .8538 .8787 .8996
.7932 .8275 .8565 .8810 .9015
.7969 .8306 .8591 .8832 .9033
.9051 .9217 .9354 .94681 .95624
.9069 .9232 .9366 .94783 .95709
.9087 .9246 .9379 .94884 .95792
.9104 .9261 .9391 .94983 .95873
.9121 .9275 .9402 .95080 .95953
.9138 .9289 .9414 .95175 .96032
.9154 .9302 .9425 .95268 .96109
.9170 .9316 .9436 .95359 .96185
.9186 .9329 .9447 .95449 .96259
.9201 .9341 .9458 .95537 .96331
.96403 .97045 .97574 .98010 .98367
.96473 .97103 .97622 .98049 .98399
.96541 .97159 .97668 .98087 .98431
.96609 .97215 .97714 .98124 .98462
.96675 .97269 .97759 .98161 .98492
.96739 .97323 .97803 .98197 .98522
.96803 .97375 .97846 .98233 .98551
.96865 .97426 .97888 .98267 .98579
.96926 .97477 .97929 .98301 .98607
.96986 .97526 .97970 .98335 .98635
.98661 .98903 .99101 .99263 .99396
.98688 .98924 .99118 .99278 .99408
.98714 .98945 .99136 .99292 .99420
.98739 .98966 .99153 .99306 .99431
.98764 .98987 .99170 .99320 .99443
.98788 .99007 .99186 .99333 .99454
.98812 .99026 .99202 .99346 .99464
.98835 .99045 .99218 .99359 .99475
.98858 .99064 .99233 .99372 .99485
.98881 .99083 .99248 .99384 .99495
417
Statistika u ekonomiji i menadžmentu
KRITIČNE VRIJEDNOSTI KOEFICIJENTA KORELACIJE RANGA
N 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
418
α=.05 .900 .829 .714 .643 .600 .564 .523 .497 .475 .457 .441 .425 .412 .399 .388 .377 .368 .359 .351 .343 .336 .329 .323 .317 .311 .305
α=.025 .886 .786 .738 .683 .648 .623 .591 .566 .545 .525 .507 .490 .476 .462 .450 .438 .428 .418 .409 .400 .392 .385 .377 .370 .364
α=.01 .943 .893 .833 .783 .745 .736 .703 .673 .646 .623 .601 .582 .564 .549 .534 .521 .508 .496 .485 .475 .465 .456 .448 .440 .432
α=.005 .881 .833 .794 .818 .780 .745 .716 .689 .666 .645 .625 .608 .591 .576 .562 .549 .537 .526 .515 .505 .496 .487 .478
Prilog 1. – Statističke tablice
TABLICA SLUČAJNIH BROJEVA 3001 9473 6963 8342 4062 2402 9473 8516 3186 0525 3341 6895 3557 4297 6373 7700 5743 8926 4569 9173 6618 9697 0330 9070 3275 9343 1924 0746 1824 1575 3862 7421 7069 2775 3296 6025 9739 8466 9984 6450 7129 5947 2363 6006 8645 8407 7711 1694 4498
8355 6108 0432 5043 0666 3246 3504 3538 5133 2038 4952 9376 7165 4772 0834 0502 8741 4106 6656 2989 7541 9530 6386 9012 5586 8878 5834 1305 3057 2668 4565 9702 2988 1224 2225 7931 8374 4135 4358 2886 7702 5394 4935 0051 9767 2131 7166 3673 0656
9205 9117 0076 6786 2925 5764 2094 6007 5773 0637 1288 5241 7784 7275 1885 0711 1328 3650 9084 0417 3900 9910 6535 3515 4856 4763 7124 4116 3701 8053 3971 4687 3412 3894 9400 6902 1891 7597 4438 4699 7359 5316 7258 0381 6445 8437 1280 6621 7114
6697 5830 9115 3299 3774 0422 5064 4280 0729 4275 2877 3465 8468 0366 5376 1424 2931 4881 7463 9953 9669 7212 0213 4925 8061 7570 1885 2400 9689 0601 8026 8215 5481 1921 6555 1536 6476 8609 1478 6275 7449 2310 5973 8410 1830 8300 1465 6548 1336
4595 4537 9259 1119 5794 1550 0753 6181 5116 1088 4712 7251 3795 5448 0705 0122 4484 2049 8533 0048 0403 5063 2662 3091 3190 7150 5642 4162 5820 7581 4639 9527 7639 6871 2264 8015 4701 7431 3129 0042 1429 9293 9900 3488 0828 2525 1395 4627 4280
9697 4751 5016 4115 3128 7126 6549 5260 2619 5600 9840 7685 0164 4720 5847 2189 4482 6042 9657 7493 1117 8878 6846 6442 5099 1132 9466 0417 2852 1608 8889 7311 6567 1520 4956 8926 9780 8103 6433 0676 1000 5102 2282 7160 0852 8294 8429 0846 5321
0706 8580 4198 9673 5756 0805 5884 3026 6113 0995 6131 0514 2499 7674 1725 7183 4122 4718 2237 8738 7203 3280 0466 7293 6930 2250 7689 2941 3468 7541 8516 6509 6955 7049 9054 1975 2303 7666 9058 0230 2352 8909 8791 3956 4869 9195 3271 2294 2785
8227 5743 0376 6024 3060 7872 1195 4061 0051 3406 1133 9725 3570 3787 8179 2806 1049 7217 7650 6316 1635 6504 1707 5808 7409 5467 5680 8326 6868 2638 8660 8244 3739 7150 7422 5056 8626 1093 5363 0420 7894 9867 7126 8114 3396 4573 3126 7174 6329
1136 5007 7787 5855 9747 7955 5972 1580 5066 1411 1786 2578 4828 9281 0832 7421 1816 5771 3798 0702 9933 6292 5310 5851 1297 7467 7619 2647 2476 4400 5781 7749 8231 8738 4283 2718 4991 0476 9911 9552 7997 6287 9799 6494 6083 5434 6183 2324 2946
8246 6444 2046 0568 5394 7368 1095 2277 5739 2834 9245 1334 7572 9160 8071 3844 8188 3152 6540 9271 4803 8769 0519 1078 9780 2385 8310 3491 1156 6649 3907 0417 8727 4703 8790 9546 1300 7149 1529 4638 7663 0010 9784 9800 6329 3682 3966 5970 2553
419
Statistika u ekonomiji i menadžmentu
TABLICA SLUČAJNIH BROJEVA 9593 9405 0611 0365 7645 8537 0031 5105 0054 4265 2254 7926 7018 3016 0399 9632 3836 8054 3804 4674 6983 3623 6704 5960 7567 0752 5885 4661 2566 1376 5066 1835 7900 5712 2955 7226 0486 5354 1799 3757 0077 9154 2915 7418 3195 3585 2101 9373 8871 0057 4426
420
4691 6737 8322 9614 3735 4646 6216 4175 1282 5997 3732 7549 9554 8349 3924 3227 3932 2795 6166 0876 5798 2057 5016 7194 4035 2820 5911 7016 3305 0397 1465 2661 5300 2016 9350 3379 8859 3066 6956 1727 9554 1949 8461 6588 9252 2145 9550 3755 5282 9468 4094
3021 9593 6759 7147 1408 3700 8644 8308 1792 7600 3499 7530 2406 5560 1953 3356 3724 3061 8961 2555 7914 6091 2696 2176 0372 7537 1769 5555 5189 4173 3740 0667 5317 2165 5122 9962 3170 4225 5533 0774 1427 0912 0963 0682 3971 2823 7176 6695 7493 1408 8906
2941 4283 1493 5243 1408 7511 1732 9196 6102 0749 7731 0776 4296 2782 3874 9944 1156 0583 9608 6286 6952 4994 7332 8928 9202 0218 6374 7742 2872 7981 6924 9296 5057 2254 6033 5595 2588 7105 4558 0512 6201 3163 1893 8626 2797 0976 8235 3569 0426 5899 8895
0517 9588 9326 9323 0491 0400 7983 3723 5241 0866 4478 3331 7991 0353 6041 0304 9434 5893 0323 9480 4223 5158 9727 5177 0482 6297 2290 6502 2489 5332 9174 3504 0162 1856 9429 1212 2855 1333 2802 1048 8818 0047 9317 0508 1852 2612 0672 9841 1814 0881 5620
2597 0308 4990 1713 4285 3586 6856 9097 2882 3302 5292 2675 0598 5230 0253 3224 1164 9339 9147 1778 0333 5259 1227 8863 8199 3138 3808 9437 2744 5433 2121 9059 9678 5623 1586 4274 0557 4284 4679 3701 2842 9824 2205 7371 7120 7399 4057 2122 9650 5580 6568
5539 9328 8384 5540 2318 1437 4449 1303 3939 7012 0331 0421 4748 4748 1652 7683 1526 2379 8374 9613 3316 1902 0811 4669 1189 2669 5374 9880 4502 8995 7008 3036 6663 0391 6933 4085 4495 2346 8832 7755 3469 1921 5654 8215 9628 4840 6162 1886 7320 2046 2601
6264 2623 1533 1456 7591 5555 1560 9512 0721 7611 8461 5790 1054 4060 6293 4319 7176 3759 1843 4932 8150 8044 3065 0763 0536 9156 6513 6044 3585 7950 9692 8204 0127 8625 6451 1642 4491 0886 6145 2239 5126 1281 4004 7874 2785 4528 4508 3033 2793 7164 5847
6029 1427 4569 1150 9804 6768 8861 2733 5664 5782 4890 0149 9347 3034 7078 8252 1219 4495 3732 6650 9659 8054 1151 3989 3116 6286 6952 5684 0632 0142 7509 0257 9511 9976 7342 9955 1890 1507 1253 7625 6728 2139 8644 6496 5901 8926 2103 5217 2695 4491 8299
0811 4498 0469 8638 0463 2269 9046 4946 6563 8309 6318 4414 3533 7728 9084 7964 8915 0456 4796 9291 0530 2418 0625 2633 3620 3609 0006 0763 0895 7955 0113 9035 6747 6790 2414 5736 9738 6830 5423 4030 9413 4285 3471 8820 0441 2870 0382 3717 6989 8969 0403
Prilog 2. Prijevodi termina iz Excela
PRILOG 2 PRIJEVODI TERMINA IZ EXCELA
Descriptive Statistics Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum Count
Deskriptivna statistika Aritmetička sredina Standardna greška Medijana Mod Standardna devijacija Varijansa Zaobljenost Asimetričnost Raspon podataka Minimum Maksimum Zbir podataka Broj podataka
REGRESSION STATISTICS Multiple R
REGRESIONA STATISTIKA Koeficijent multiple korelacije Koeficijent determinacije Korigovani koeficijent determinacije Standardna greška Broj podataka
R Square Adjusted R Square Standard Error Observations
421
Statistika u ekonomiji i menadžmentu
df
ANOVA SS
MS
F
Significance F
F test
Nivo značajnosti F testa
Regression Residual Total
ANALIZA VARIJANSE Zbir Broj stepeni kvadrata slobode df odstupanja Varijansa Regresija Rezidual Ukupno
COEFFICIENTS
STANDARD ERROR
T STAT
OCJENA KOEFICIJENATA
STANDARDNA GREŠKA
T TEST
Intercept X Variable 1
Slobodni član Parametar uz varijabluX
OBSERVATION
PREDICTED Y
Podaci
Ocijeneno Y
422
RESIDUALS Reziduali ili slučajna odstupanja
LITERATURA Anderson D.R., Sweeney D.J., Willams T.A. : Statistiques pour l’économie et la gestion, De Boeck Université, Paris-Bruxelles, 2001.g. Berenson M.L., Levine D.M., Krehbiel T.C.: Basic business statistics, Pearson Education International, New Yersey, 2004.g. Bosnia and Herzegovina: Poverty Assessment, Volume II: Data on Poverty, Report No.25343-BiH, Document of the World Bank, 2003.g. Chauvat G., Reau J.P.: Statistiques descriptives, Armand Colin/HER, Paris, 2001.g. Comte M.; Gaden J.:Statistiques et probabilité, Presses Universitaires de France, Paris, 2000. g. Dacić R. : Osnovi statistike, Štamparija Fojnica, Fojnica, 2001.g. Droesbeke J.J.: Eléments de Statistiques, Editions de l’Universié de Bruxelles, Bruxelles; Ellipses, Paris, 1997. g. Giard V.: Statistique Descriptive pour les Gestionnaires, Economica, 1995. g. Goldfarb B., Pardoux C.: Introduction à la méthodes statistique, Dunod, Paris, 1993. g. Grais, B.: Statistique descriptive, Dunod, Paris, 1986. g. Lučić B. : Statistika, Ekonomski fakultet, Sarajevo, 1996. g. Py B.: Statistique descriptive: nouvelle méthode pour bien comprendre et réussir, Economica, Paris 1990. g. Roger P.:Statistique pour la gestion, EMS, Paris, 2000. g. Schlacther, D.: De l’analise à la prévision, Ellipses, Paris, 1986. Somun-Kapetanović R.: Deskriptivna statistika, Ekonomski fakultet, Sarajevo, 2003.g. Šošić I. :Primijenjena statistika, Školska knjiga, Zagreb, 2004.g. Šošić I., Serdar V. : Uvod u statistiku, Školska knjiga, Zagreb, 2002. g. 423
Statistički bilten br.1. 2003.g., Agencija za Statistiku Bosne i Hercegovine, Sarajevo, 2003.g. Statistički godišnjak/ljetopis Federacije Bosne i Hercegovine, 1999-2005. Federalni zavod za Statistiku, Sarajevo. Tableaux de l’économie française, 1995/1996 - 2003/2004. g., INSEE ; Paris. Tenenhaus M.:Methodes statistiques en gestion, Dunod, Paris, 1994.g. Tribout B.: Support de cours de Statistique, premiere partie, Université Robert Schuman, Strasbourg, 1998. g. Tribout B.: Support de cours de Statistique, Chapitres I,II,III,IV, Université Robert Schuman, Strasbourg, 1998. g. Žižić M., Lovrić M., Pavličić D.: Metodi statističke analize, Ekonomski fakultet, Beograd, 2001.g. Wonnacott T.H., Wonnacott R.J.: Statistique, Economica, Paris, 1995. g.
424