1. UVOD 1.0. Uvod Statistika – znanstvena metoda koja se bavi prikupljanjem, analiziranjem i tumačenjem podataka različite vrste. Podaci – promotrena kvalitativna i kvantitativna svojstva objekata, stvari, osoba, procesa... Svrha primjene statističkih metoda – donošenje suda o osobitosti promatranih pojava, ispitivanje različitih pretpostavki, predviđanje razine i stanja pojava. Metode deskriptivne statistike – sastoje se u primjeni postupaka uređivanja, grupiranja, tabeliranja, grafičkog prikazivanja statističkih podataka; podaci se ne poopćavaju. Metode inferencijalne statistike – polaze od uzorka iz realne i konačne populacije čije se realizacije mogu smatrati uzorkom procesa; njima se također donose vjerojatnosni sudovi o cjelini. 1.1. Statistički skup Statistički skup – sastoji se od jedinica kojima se ispituje jedno ili više svojstava koja od jedinice do jedinice očituju statističku promjenljivost Opseg skupa – broj jedinica ~ prema opsegu skupa statistički skupovi se dijele na konačne i beskonačne Konačan skup – ima konačan broj elemenata Beskonačan skup – ima beskonačno mnogo elemenata Skup podataka ili osnovni skup – podaci o danoj varijabli za svaki element statističkog skupa Populacija može biti: • realna • hipotetična • konačna • beskonačna Uzorak – podskup statističkog skupa ~ u svakom statističkom istraživanju realni statistički skupovi se definiraju pojmovno, prostorno i vremenski Pojmovno – određuje se pripadnost skupu Prostorno – određuje se kojem skupu pripadaju sve jedinice stat. skupa Vremenski – određuje se vremenski interval ili vremenska točka za koje su vezane sve jedinice skupa
1.2. Vrste i izvori statističkih podataka Statistički podaci – rezultati mjerenja svojstava jedinica statističkih skupov, njihovih podskupova ili eksperimentalnih jedinica Statistička varijabla ili obilježje – svojstvo koje oblikom ili stupnjem varira od jedinice do jedinice skupa; po njemu se elemensti skupa razlikuju ili jedni drugima nalikuju Skala – skup modaliteta varijable Razlikujemo: • nominalnu • ordinalnu • intervalnu • omjernu Nominalna skala – dana je u obliku nenumeričkog skupa, odnosno liste naziva; redoslijed odabran po volji; nisu dopuštene brojčane operacije (npr. po abecedi) Ordinalna skala – pridružuje slovne oznake, simbole ili brojeve elementima skupa prema intenzitetu mjerenog svojstva (npr. po rangu (ocjene)) Intervalna skala – pridružuju se jedinicama brojevi sukladno intenzitetu mjerenog svojstva; ima definiranu mjernu jedinicu i dogovorno utvrđenu nulu; moguće su osnovne računske operacije osim dijeljenja (npr. temperaturna skala) Omjerna skala – pridružuju se brojevi jedinicama statističkog skupa sukladno intenzitetu mjerenog svojstva; ima definiranu mjernu jedinicu i nulu koja označuje nepostojanje svojstva; moguće su osnovne računske operacije Numerička varijabla – varijabla mjerena na numeričkoj skali (intervalnoj i omjernoj) • diskretna num. varijabla – poprima konačan broj vrijednosti • kontinuirana num. varijabla – može poprimiti bilo koju vrijednost iz nekog intervala
2. UREĐIVANJE PODATAKA. STATISTIČKI NIZOVI 2.0. Uvod Svrha uređivanja stat. podataka – omogućiti donošenje osnovnih sudova o danoj pojavi; njihovim uređenjem nastaju statistički nizovi. Nominalni niz – nastaje uređenjem podataka o modalitetitma nominalne varijable Redoslijedni niz – nastaje uređenjem podataka o rang-varijabli Numerički niz – formira se sređivanjem podataka koji predočuju vrijednosti numeričke varijable Vremenski niz – kronološko nizanje podataka o nekoj pojavi Jednostavna tabela – prikazuje se jedan stat. niz Skupna tabela – prikazuje se više nizova nastalih sređivanjem podataka prema modalitetima iste varijable Tabela kontigence – prikazuju se podaci grupirani istodobno prema modalitetima dviju li više varijabli Relativni brojevi – pomoću njih se provodi elementarna analiza podataka u sklopu deskriptivne statistike (postoci, proporcije, rel. frekvencije, indeksi i relativni brojevi koordinacije) 2.1. Niz kvalitativnih podataka Kvalitativni podaci – oblici nominalne ili redoslijedne varijable Grupiranjem se skup podataka koji se odnose na jedinice stat. skupa rasčlanjuju u podskupove koji se međusobno ne preklapaju Frekvencija – broj podataka istog oblika varijable Relativna frekvencija pi – omjer je frekvencije i ukupnog broja podataka Postotna relativna frekvencija Pi – relativna frekvencija pomnožena sa 100 pi=fiN
Pi=fiN∙100
~ grupirani podaci se uobičajeno prikazuju tabelom kontigence, koja se sastoji od predstupca, zaglavlja, polja tabele, marginalnog retka i marginalnog stupca 2.2. Numerički nizovi Numerički nizovi – nastaju uređenjem kvantitativnih podataka Pojedinačni numerički podaci – predočavaju se dijagramom s točkama i dijagramom stablo list
~ako je riječ o velikom broju podataka, o numeričkoj kontinuiranoj varijabli ili ako diskretna numeriča varijabla poprima velik broj različitih vrijednosti, distribucija frekvencija formira se grupiranjem na temelju razreda; svaki razred ima svoju gronju i donju granicu Frekvencija razreda – broj istih i sličnih vrijednosti numeričke varijable ~formiranju distribucije prethodi određivanje broja razreka k i veličina razreda; broj razreda k za grupiranje N vrijednosti numeričke varijable aproksimira se izrazom k≈1+3.3logN – Sturgesovo pravilo ~ distribucija frekvencija prikazuje se histogramom i poligonom frekvencija Histogram – površinski grafikon Poligon frekvencija – linijski grafikon
3. SREDNJE VRIJEDNOSTI STATISTIČKOG NIZA 3.1. Aritmetička sredina Aritmetička sredina – najvažnija i najraširenija srednja vrijednost; određuje se tako da se zbroje vrijednosti numeričke varijable i podijele s njihovim brojem x=1Ni=1Nxi
Svojstva: • zbroj odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine jednak je nuli • zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine sredine minimalan je • aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunana Aritmetička sredina aritmetičkih sredina – izračunava se kao vagana sredina u kojoj se za pondere uzima broj podataka za koje su računane pojedine sredine x=1Ni=1kNix
Aritmetička sredina relativnih brojeva koordinacije i aritmetička sredina postotaka – izračunavaju se kao vagane sredine u kojima su ponderi osnovice tih brojeva Ri=viBi
Pi=DiCi∙100
3.2. Geometrijska sredina Geometrijska sredina N vrijednosti numeričke varijable X jest N-ti korijen iz produkta njezinih vrijednosti G=Nx1∙x2∙…xi…xN
Za grupirane podatke, geometrijska sredina dana je izrazom G=Nx1f1∙x2f2∙…xifi∙…xNfN
3.3. Harmonijska sredina Harmonijska sredina N vrijednosti numeričke varijable X recipročna je vrijednosti aritmetičke sredine njezinih recipročnih vrijednosti H=Ni=1N1xi
3.5. Mod Mod – položajna srednja vrijednost; najčešća vrijednost ili modalitet koji se pojavljuje u nizu; postoji ako su u nizu barem dva jednaka podatka Mod distribucije frekvencija s razredima aproksimira se pomoću izraza: Mo=L1+(b-a)b-a+(b-c)∙i
b-najveća (korigirana) frekvencija; modalni razred je onaj sa najvećom kor. frekvencijom 3.6. Medijan. Kvantili Medijan – položajna srednja vrijednost koja numaerički niz uređen po veličini dijeli na dva jednaka dijela; ako je broj podataka neparan, medijan je vrijednost središnjeg člana uređenog po veličini, a ako je broj podatak paran, medijan je jednak poluzbroju vrijednosti varijable središnjih dvaju članova uređenog niza Medijan u distribuciji frekvencija s razredima aproksimira se pomoću izraza: Me=L1+N2-f1fmed∙i
fmed-frekvencija medijalnog razreda (medijalni je onaj razred čija kumulativna frekvencija prvi put uključuje vrijednost N/2 Medijan se ubraja u kvantile. Kvantili – vrijednosti numeričke varijable ili modaliteti rang-varijable koji uređen numerički ili redoslijedni niz dijele na jednakobrojne dijelove; dijele li kvantili na četiri jednakobrojna dijela riječ je o kvartili, na 10 dijelova decili, na 100 dijelova percentili.
4. MJERE DISPERZIJE 4.0. Uvod ~ mjerama disperzije brojčano se opisuje stupanj varijabilnosti statističkih podataka; najjednostavnija mjera disperzije je raspon varijacije; među pokazatelje varijabilnosti ubrajaju se interkvartil i koeficijent kvartilne devijacije; najvažnija mjera disperzije je varijanca te iz nje izvedena standardna devijacija i koeficijent varijacije; rabi se i srednje apsolutno odstupanje (MAD) 4.1. Raspon varijacije. Interkvartil Raspon varijacije – najjednostavnija približna mjera disperzije; izražen je u mjernim jedinicama obilježja; Rx=xmax-xmin
Interkvartil – apsolutna mjera disperzije; raspon varijacije središnjih 50 % članova niza uređenih parova IQ=Q3-Q1
4.2. Varijanca. Standardna devijacija. Koeficijent varijacije Varijanca – artimetička sredina kvadrata odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine σ2=1Ni=1N(xi-x)
Standardna devijacija – pozitivni drugi korijen iz varijance σ=1Ni=1N(xi-x)2
Varijanca i standardna devijacija distribucije frekvencija: σ2=1Ni=1kfi(xi-x)2
σ=1Ni=1kfi(xi-x)2
Koeficijent devijacije – omjer standardne devijacije i aritmetičke sredine pomnožen sa 100 V=σx100
Srednje apsolutno odstupanje od aritmetičke sredine i medijana: MAD=1Ni=1Nxi-x MADMe=1Ni=1Nxi-Me
4.3. Standardizirana varijabla Standardizirana varijabla z – linearna transformacija numeričke varijable X; provodi se tako da se odstupanja vrijednosti numeričke varijable podijele sa standardnom devijacijom z=x-xσ
5. MJERE ASIMETRIJE. MJERE KONCENTRACIJE
MJERE
ZAOBLJENOSTI.
5.1. Mjere asimetrije Mjerama asimetrije mjeri se način rasporeda podataka prema aritmetičkoj sredini ili nekoj drugoj vrijednosti; najvažnije mjere su Pearsonova i Bowleyjeva mjera Koeficijent asimetrije α3- omjer trćeg momenta oko sredine i standardne devijacije podignute na treću potenciju α3=μ3σ3
Pearsonova mjera asimetrije – standardizirano odstupanje vrijednosti medijana ili moda od aritmetičke sredine; uglavnom prima vrijednosti iz intervala ±3 Sk=3x-Meσ Sk=x-Moσ
Bowlyjeva mjera asimetrije – temelji se na odnosima kvartila i medijana; poprima vrijednosti iz intervala ±1 SkQ=Q1+Q3-2MeQ3-Q1
5.2. Mjere zaobljenosti Zaobljenost modalnog vrha distribucije mjeri se koeficijentom zaobljenosti Koeficijent zaobljenosti μ4 – omjer četvrtog momenta oko sredine i standardne devijacije na četvrtu potenciju α4=μ4σ4 α4=3-normalna distribucija a4>3-šiljastija distribucija α4<3-plosnatija distribucija
5.3. Mjere koncentracije Mjerama koncentracije mjeri se način rasporeda totala ili druge prikladne agregatne veličine po jedinicama niza ili modalitetima statističkih varijabli Razlikujemo: a) apsolutne mjere koncentracije • koncentracijski omjer • Herfindahlov index b) relativne mjere koncentracije • Ginijev koeficijent
6. OSNOVNI POJMOVI VJEROJATNOSTI 6.1. Definicije vjerojatnosti
Pokus – djelatnost, postupak mjerenja, opažanja, iz kojeg izvire neki rezultat (ishod) Slučajni pokus: • onaj koji završava s barem dva ili više ishoda • ishodi se ne mogu predvidjeti sa sigurnošću • u definiranim uvjetima, pokus se može ponavljati beskonačno mnogo puta Prostor uzorka (elementarnih događaja) S – skup svih mogućih različitih ishoda slučajnog pokusa ~ događaj je elementaran ako se može rastaviti u jednostavnije događaje Slučajni događaj A – jednočlani ili višečlani podskup skupa S, tj. podskup skupa svih elementranih događaja Isključivi događaji – ne mogu se istodobno ostvariti A∩B=∅; radi se o nastupu A ili B događaja Definicija vjerojatnosti „a priori“ – polazi od pretpostavke da slučajni pokus ima konačan broj jednako mogućih ishoda; ako su ishodi slučajnog pokusa jednako mogući, tada je vjerojatnost nastupa događaja A jednaka omjeru broja za njega povoljnih ishoda m i ukupnog broja ishoda n. Definicija vjerojatnosti „a posteriori“ – granična vrijednost relativne frekvencije povoljnog ishoda događaja A ako se broj ponavljanja pokusa izvedenih u istim uvjetima povećava u beskonačnost Aksiomatska definicija vjerojatnosti – preslikavanje koje svakom događaju A∈S pridružuje broj P(A) i koji zadovoljava slijedeće uvjete: 1. 0≤PA≤1 nenegativnost 2. PS=1 normiranost 3. PA∪B=PA+PB aditivnost
6.2. Slučajna varijabla i distribucije vjerojatnosti Slučajna varijabla X – numerička funkcija koja svakom ishodu slučajnog pokusa pridružuje realan broj Diskretna slučajna varijabla – poprima konačan broj vrijednosti ili prebrojivo mnogo njih Kontinuirana slučajna varijabla – poprima bilo koju vrijednost iz nekog intervala Distribucija vjerojatnosti diskretne slučajne varijable – skup uređenih parova različitih vrijednosti te varijable i pripadajućih vrijednosti Kumulativna funkcija (f-ja distribucije F(xi)) – pokazuje kolika je vjerojatnost da diskretna slučajna varijabla poprimi vrijednost jednaku xi ili manju od te vrijednosti Distribucija vjerojatnosti kontinuirane slučajne varijable – opisuje razdiobu vjerojatnosti na intervalu vrijednosti varijable Funkcija distribucije kontinuirane slučajne varijable (F(x)) – ima svojstva analogna onima za f-ju distribucije diskretne slučajne varijable
6.4. Modeli distribucije vjerojatnosti 6.4.1. Modeli distribucije vjerojatnosti diskretne slučajne varijable Modeli distribucije vjerojatnosti diskretne slučajne varijable – funkcije vjerojatnosti poznatih oblika i svojstava Binomna distribucija – diskontinuirana distribucija vjerojatnosti koja se može koristiti pri donošenju poslovnih odluka u situacijama kada slučajni pokus ima obilježja Bernoullijevog procesa; pokus ima dva ishoda: uspjeh i neuspjeh Poissonova distribucija – u modeliranju situacija kada je broj povoljnih ishoda koji se mjeri u vremenskoj jedinici, jeiničnoj površini, udaljenosti ili volumenu vrlo malen; ishodi pokusa su neovisni 6.4.2. Modeli distribucije vjerojatnosti kontinuirane slučajne varijable Normalna (Gaussova) distribucija – kontinuirana distribucija vjerojatnosti koja je simetrična, savršeno zaobljena i zvonolika Studentova distribucija – simetrična, oblik ovisi o veličini uzorka n ℵ2 distribucija – kontinuirana i pozitivno asimetrična; definira se nad intervalom 0,∝ samo za pozitivne vrijednosti F-distribucija – kontinuirana, pozitivno asimetrična; definirana nad intervalom 0,∝, a ovisi o dva parametra: a) broj stupnjeva slobode za brojnik b) broj stupnjeva slobode za nazivnik
7. METODA UZORAKA. SAMPLING-DISTRIBUCIJE 7.1. Metoda uzoraka Dvije osnovne zadaće metode uzoraka: 1. da na osnovi uzoraka iz osnovnog skupa procijene karakteristike tog skupa 2. da se na osnovi podataka dobivenih uzorkom donese odluka da li da se prihvati ili odbaci određena pretpostavka Faktori koji određuju primjenu uzorka: 1. kod namjernog izbora istraživač izabire iz osnovnog skupa one elemente koje smatra tipičnima ili reprezentativnima 2. kod prigodnog izbora uzorak je prigodno izabran, a ne slučajno 3. kod slučajnog izbora za svaki element postoji mogućnost da bude izabran za uzorak 7.2. Sampling-distribucija aritmetičkih sredina, proporcija i varijanci Sampling-distribucija – teorijska distribucija vjerojatnosti procijenitelja parametra Sampling-varijabla – slučajna varijabla jer se uzorci izabiru tako da svaka jedinica tj. svaki uzorak ima određenu vjerojatnost izbora
8. PROCJENE PARAMETARA Procjenitelj – metoda procjenjivanja, formula Procjena – primjena procjenitelja na podacima iz uzorka Procjenitelj parametra jednim brojem – nije moguće donijeti sud o preciznosti procjene, niti zaključivati o razini povjerenja s kojom se ona može upotrijebiti Intervalni procjenitelj – oslanja se na oblik i svojstva normalne ili Studentove t sampling-distribucije sredina Razina pozdanosti 1-γ – vjerojatnost da će se između granica L1 i L2 naći parametar θ 8.1. Procjena aritmetičke sredine i totala osnovnog skupa Aritmetička sredina osnovnog skupa μ – parametar koji se procjenjuje brojem i intervalom x=1Ni=1nxi
~ ako je uzorak >30 = veliki uzorak (Normalna distribucija) Px-zγ2σx<μ
Total T – zbroj vrijednosti numeričke varijable konačnog osnovnog skupa T=Nx PT-zγ2σT
8.1.1. Određivanje veličine uzorka za procjenu aritmetičke sredine osnovnog skupa Ovisi o: 1. vrsti osnovnog skupa koji je konačan ili beskonačan 2. razini pouzdanosti procjene 3. željenoj preciznosti procjene 4. stupnju varijabilnosti obilježja Ako se pogreška i stupanj varijabilnosti izražavaju apsolutno, koristi se slijedeća formula: n=zγ2σd2
Ako se pogreška i stupanj varijabilnosti izažavaju relativno, koristi se slijedeća formaula: n=zγ2Vdr2
8.2. Procjena proporcije osnovnog skupa Proporcija konačnog osnovnog skupa – parametar koji predočuje omjer članova skupa s određenim oblikom obilježja M i opsega skupa N, p=MN Procjenitelj proporcije osnovnog skupa brojem – proporcija uzorka p=mn, gdje je m broj članova uzorka s određenim oblikom obilježja, a n veličina uzorka Pp-zγ2σp
9. TESTIRANJE HIPOTEZA O PARAMETRU 9.0. Testiranje hipoteza o parametru ~ svaki postupak testiranja polazi od nulet i alternativne hipoteze Pogreška tipa I. – učini se kad se odbaci istinita nulta hipoteza Pogreška tipa II. – učini se kada se prihvati nulta hipoteza premda je lažna 9.1. Testiranje hipoteze o aritmetičkoj sredini osnovnog skupa ~ ako je uzorak >30, riječ je o velikom uzorku (z-test) ~ ako je uzorak ≤30, riječ je o malom uzorku (t-test) ~nepoznata je aritmetička sredina osnovnog skupa μ, a njezina je pretpostavljena veličina μ0 z=x-μ0σx t=x-μ0σx
~odluke se mogu donositi i pomoću kritičnih granica: c1=μ0-zα2σx c2=μ0+zα2σx
~ pomoću p-vrijednosti 9.1. Testiranje hipoteze o proporciji osnovnog skupa pomoću velikog uzorka ~ nepoznata je proporcija osnovnog skupa p, a njezina pretpostavljena veličina je p0 z=p-p0σp
10. USPOREDBA SKUPOVA
PARAMETARA
OSNOVNIH
10.1. Procjena razlike aritmetičke sredine dvaju osnovnih skupova nezavisnim uzorcima D=μ1-μ2 σD=σ12n1+σ22n2 PD-zγ2σD
10.2. Test hipoteza o razlici aritmetičkih sredina dvaju osnovnih skupova nezavisnim uzorcima z=D-D0σD
10.4. Procjena razlike proporcija i test hipoteze o razlici proporcija na temelju velikih nezavisnih uzoraka ~ neka su n1 i n2 dovoljno veliki nezavisni uzorci izabrani iz osnovnih skupova s proporcijama p1 i p2 i neka su p1 i p2 proporcije uzoraka z=D-D0σD p=m1+m2n1+n2 D=p1-p2 σD=pq1n1+1n2 Pp-zγ2σp
11. ODABRANI NEPARAMETARSKI TESTOVI 11.6. ℵ2- test (hi-kvadrat test) ~hi-kvadrat testom ispituje se hipoteza o jednakosti proporcija triju ili više osnovnih skupova H0…p1=p2=p3=pk
H1…∃pi≠p ℵ2=i=1kfi-ei2ei ϑ=k-g-1
12. REGRESIJSKA ANALIZA 12.1. Regresijski model. Osnovni pojmovi Regresijska analiza – sastoji se u primjeni različitih metoda ispitivanja ovisnosti jedne varijable ili više drugih Zadaće: • ocjenjivanje nepoznatih parametara • izračunavanje mjere disperzije i drugih stat.-analitičkih pokazatelja Korelacijska analiza – sastoji se u primjeni postupaka kojima se utvrđuju pokazatelji jakosti veze među pojavama Status varijabli u modelu , to jest koja je varijabla zavisna, a koje su nezavisne, ovisi o danoj primjeni modela i izvire iz poznavanja područja primjene Regresijski model – jednadžba ili skup jednadžbi s konačnim brojem parametara i varijabli • zavisna varijabla je (y) • nezavisna varijabla je (x) 12.2. Model jednostavne linearne regresije Modelom jednostavne regresije izražava se statistički odnos među dvjema pojavama predočenima vrijednostima numeričkih varijabli; model sadrži zavisnu i jednu nezavisnu varijablu Model populacije: yi=α+βxi+ei
Model uzorka: yi=α+βxi+ei
Regresijska jednadžba: y=α+βx
Regresijski koeficijent β – pokazuje za koliko se u prosjeku linearno mijenja vrijednost zavisne varijable Y za jediničnu promjenu nezavisne varijable X Konstantni član α – vrijednost regresijske funkcije y ako je vrijednost nezavisne varijable X jednaka nuli Regresijske vrijednosti – vrijednosti regresijske funkcije s procijenjenim parametrima (npr. ako je cijena 60 €, regresijska vrijednost potrošnje je 81,7 kg.) yi=α+βxi
Rezidualna odstupanja – procjene vrijednosti slučajne varijable u modelu regresije (npr. stvarna vrijednost potrošnje je manja od procijenjene za...) Intervalni procjenitelji parametara: Pβ-fr2(ϑ)σβ<β<β+…=1-γ
~ ako se cijena poveća za 1 €, procjenjuje se da će se... Pα-fr2(ϑ)σα<α<α+…=1-γ
~ ako je cijena 0 € procjenjuje se da je potrošnja...
Koeficijent determinacije – omjer protumačenog dijela zbroja kvadrata i ukupnog zbroja kvadrata r2=SPST
ST – suma kvadrata odstupanja stvarne vrijednosti zavisne varijable od njene aritmetičke sredine SP – suma kvadrata odstupanja procijenjenih vrijednosti zavisne varijable od njene arit. sredine SR – suma kvadrata odstupanja empirijske vrijednsoti zavisne varijable od regresijske vrijednosti
13. MODEL VIŠESTRUKE LINEARNE REGRESIJE 13.0. Model višestruke linearne regresije Model višestruke regresije – njime se predočuje statistička kovarijacija jedne numeričke varijable pomoću dvije ili više drugim numeričkih varijabli 13.1. Analiza modela višestruke linearne regresije Koraci u analizi modela: 1. utvrđivanje oblika modela, te svojstva varijabli i parametara 2. procjena parametara, varijance, stardardne devijacije, prognostičkih vrijednosti 3. testiranje hipoteza Opći linearni regresijski model osnovnog skupa za n-vrijednosti: yi=α+β1xi1+β2xi2+…+βjxij+…+βKxiK+ei
Model uzorka: yi=α+β1xi1+β2xi2+…+βjxij+…+βKxiK+ei
Model s procijenjenim parametrima: y=α+β1x1+β2x2+…+βjxj+βKxK Procjena konstantnog člana α – vrijednost regresijske funkcije uzorka ako
su vrijednosti K nezavnisnih varijabli jednake nuli Procjena regresijskih koeficijenata βj – pokazuje koliko se linearno u prosjeku mijenja vrijednost zavisne varijable ako se varijabla Xj poveća za jedan, uz uvjet da se ne mijenjaju vrijednosti preostalih nezavisnih varijabli
13.2. Testiranje hipoteza o modelu višestruke linearne regresije Najčešće se rabe ovi testovi: 1. skupni test • • •
H0…β1=β2=βj=0 H1…∃βj≠0
• •
H0…β1≥0 H0…β1<0
izvodimo ga pomoću empirijskog F-omjera: F=SPKSRn-(k+1) 2. pojedinačni test (jednosmjerni)
13.5. Korelacijska matrica R=1ry1⋯ryKr1y1⋯r1Kr2yr21⋯r2K⋮⋮⋱⋮rKyrK1⋯1
~ elemente korelacijske matrice tvore vrijednosti varijable
kovarijance
standardiziranih
14. OSNOVNA ANALIZA VREMENSKIH NIZOVA 14.0. Osnovna analiza vremenskih nizova Vremenski niz – skup kronološki uređenih vrijednosti varijable koja predočuje neku pojavu ili statistički proces u vremenu Podjela vrem. nizova: • intervalni – nastaje zbrajanjem vrijednosti pojave po intervalima vremena (površinski i linijski grafikoni) • trenutačni – sastoji se od kronološki uređenih vrijednosti koje su u svezi s odabranim vremenskim točkama (linijski grafikoni) ~ vremenski niz je deterministički ako se na temelju njegovih članova mogu egzaktno predviđati razne pojave ~ vremenski niz je stohastički ako se pomoću njegovih članova buduća stanja mogu procijeniti 14.2. Pokazatelji dinamike Pokazatelji dinamike – brojčane veličine kojima se opisuju promjene razine pojava u vremenu Dijele se na: • one koji pokazuju pojedinačne promjene razina pojave u uzastopnim razdobljima • one koji pokazuju promjene razine pojave tekućeg vremena prema razini odabranog razdoblja Podjela prema mjernim jedinicama: • apsolutne mjere promjene • relativne mjere promjene (stopa promjene) Prve diferencije – izražavaju veličinu promjena razina pojava u uzastopnim razdobljima ∆yt=yt-yt-1
Prosječne prve diferencije – računaju se uporabom samo posljednje i prve vrijednosti niza ∆y=yn-y1n-1
Stope promjene – omjer prve diferencije i odgovarajuće serije pomnožena sa 100 st=yt-yt-1yt-1∙100
Prosječne stope – određuje se pomoću geometrijske sredine koeficijenta dinamike s=n-1yny1-1∙100
14.3. Individualni indeksi
Indeksi vremenskog niza – relativni brojevi koji izražavaju odnos stanja jedne pojave ili skupine pojava u različitim razdobljima ili vremenskim točkama Pojavljuju se u dva oblika: 1. verižni indeksi – relativni brojevi koji pokazuju promjene stanja pojave u uzastopnim razdobljima •
Vt=ytyt-1∙100
2. bazni indeksi – njima se mjeri promjena razine vremenske pojave u
relativnom iznosu prema članu niza jednog odabranog razdoblja ili vremenske točke •
It=ytyb∙100
Koeficijent dinamike: vt=ytyt-1
14.4. Skupni indeksi Skupni indeksi – relativni brojevi kojima se mjere relativne promjene skupine pojava u vremenu Dijele se na skupne indeke: • cijena • količina • vrijednosti U analizi dinamike skupine pojava izračunavaju se: • Laspeyresov indeks cijena i količina • Paascheov indeks cijena i količina • indeks vrijednosti Laspeyresov indeks cijena - skupni indeks koji pokazuje kolike su prosječne relativne promjene cijena skupine k pojava koje čine neku logičnu cjelinu P0tq0=i=1kpitqi0i=1kpi0qi0∙100
Laspeyresov indeks količina – skupni indeks koji pokazuje kolike su prosječne relativne promjene količina skupine k pojava koje čine neku logičnu cjelinu i to polazeći od baznog razdoblja Q0tp0=i=1kqitpi0i=1kqi0pi0∙100
Paascheov indeks cijena – vagana aritmetička sredina individualnih indeksa cijena u kojoj su za pondere uzete vrijednosti količina tekućeg razdoblja po cijenama baznog razdoblja P0tqt=i=1kpitqiti=1kpi0qit∙100
Paascheov indeks količina – vagana aritmetička sredina individualnih indeksa količina u kojoj su za pondere uzete vrijednosti obračunate po cijenama tekućeg razdoblja Q0tpt=i=1kqitpiti=1kqi0pit∙100
Indeks vrijednosti – omjer tekućeg i vrijednosti baznog razdoblja Vot=i=1kpitqiti=1kpi0qi0∙100
15. ODABRANI MODELI VREMENSKIH SERIJA
15.0. Odabrani modeli vremenski serija Komponente: • komponenta trenda – upućuje na osnovni tok pojave u vremenu • sezonska komponenta – posljedica je periodičnog utjecaja klimatskih faktora, ritma proizvodnje, potrošnje • ciklična komponenta – pokazuje se onda kada se vremenska pojava obnavlja na približno isti način, s periodom dvije ili više godina Model trenda – njime se opisuje dugoročna kovarijacija pojave s vremenom Aditivni model trenda – opći oblik modela temeljen na standradnoj dekompoziciji Y=T+e
Multiplikativni model trenda – komponente su mu faktori umnoška Y=T∙ε
Y=pojava predočena vremenskom serijom T=komponenta trenda predočena nepoznatom f-jom vremena e, ε=nepoznata slučajna odstupanja Model linearnog (jednostavnog) trenda: yt=α+βxt+et
Jednadžba linearnog trenda: y=α+βx β=i=1nxtyt-nxyi=1nxt2-nx2 α=y-βx i=1nxt2=16nn+1(2n+1) x=n+12 y=ytn
Prognostička vrijednost: Yn+τ=α+β(n+τ)
Jednadžba eksponencijalnog trenda: logy=logα+Xlogβ logβ=t=1nlogyt-xt=1nlogytt=1nxt2-nx2 logα=1nt=1nlogyt-xlogβ
Prognostička vrijednost: Yn+τ=α+β(n+τ)