MEDICINSKA MEDICINSKA STATISTIKA ZA STUDENTE MEDICINE MEDICINE 1. Statistika, definicija i označavanja označavanja Statistika je naučna disciplina koja se bavi sakupljanjem, klasifikacijom, deskripcijom, analizom,
interpretacijom i prezentacijom podataka. Statistika je nauka o prikupljanju, prikupljanju, analizi i interpretaciji interpretaciji podataka podataka koji su podložni slučajnom variranju. Statistička masa (osnovni skup) je skup pojedinačnih slučajeva slučajeva na kojima se istražuju masovne masovne pojave. Osnovni Osnovni skup skup se označava označava sa N. Uzorak je je deo statističke mase na kome se vrši istraživanje istraživanje sa ciljem da se dobiju podaci koji će reprezentovati osnovni skup. Broj jedinica uzorka se označava sa n.
Bilo koji kvalitet ili karakteristika jedinica statističke mase naziva se varijabla, promenljiva ili obeležje. Varijable se mogu klasifikovati kao kvantitativne i kvalitativne. Kvantitativne varijable se dobijaju merenjem ili brojanjem i njihova karakteristika je izražena brojevima. brojevima. One mogu biti diskontinuirane (kod kojih postoje prekidi) i kontinuirane (kod kojih ne postoje prekidi u vrednostima). vrednostima). Kvalitativne Kvalitativne varijable varijable se ne mogu mogu iskaz iskazat atii klas klasičn ičnim im pos postu tupc pcima ima mere merenja nja,, već već se mogu mogu kategorisati, odnosno grupisati po atributivnoj ili opisnoj karakteristici. One su uvek diskontinuirane . Opšti podaci kao rezultati nekog merenja ili posmatranja mogu odstupati od prave vrednosti zbog nepreciznosti ili netačnosti. Preciznost pokazuje koliko su ponovljena ponovljena merenja istog kvantiteta kvantiteta bliska jedno drugom, drugom, a tačnost odgovara tendenciji dobijenih vrednosti da se simetrično grupišu oko prave, stvarne vrednosi te varijable. Skale za merenje varijabli a. Nomi Nominal nalna na skala skala – korist koristii imena imena,, broje brojeve ve ili ili druge druge simb simbole ole da ozn označi ači svako svako mere merenje nje-opserviranje limitiranog broja kategorija koje se ne mogu ređati po veličini. b. Ordinalna skala – označava svako merenje limitiranog broja kategorija koje su rangirane po veličini. c. Interv Interval alna na skala skala – iskazuj iskazujee merenje merenje nelimi nelimitir tiranog anog broja broja kategor kategorija ija koje su sa jednaki jednakim m razmacima. d. Skala odnosa (Omerna skala) – merenje započinje iz nulte tačke i skala ima jednake intervale.
2. Planiranje istraživanja Istraživanje je kontinuirani kontinuirani saznajni saznajni proces proces zasnovan zasnovan na određenoj određenoj metodi metodi i proceduri proceduri..
Istraživanjem su obuhvaćeni sledeći koraci: istraživačkog problema (sa pretraživanjem i kritičkom evaluacijom a. Izbor istraživačkog evaluacijom odgovarajuće odgovarajuće literature literature u cilju potvrde i definisanja konteksta izabranog istraživačkog problema) Formulacija preciznih preciznih ciljeva istraživanja i hipoteza hipoteza (u svetlu: relevantnih varijabli koje su od b. Formulacija strane istraživača izabrane, odgovarajuće istraživačke strategije, etičkih ograničenja u cilju zaštite ispitanika i očekivanom cenom istraživanja) Istraživački plan (sa specifikacijom vrste i veličine uzorka/uzoraka, izborom relevantnih varijabli c. Istraživački i izborom ustraživačke strategije ili dizajna u cilju kontrolisanja opservacija) 1
Prikupljanje podataka (sa instrumentima merenja i njihovim kvalitetom, načinima i greškama d. Prikupljanje merenja, kao i različitim tipovima mernih skala dostupnim za istraživačku i kliničku procenu) Eksploracija podataka podataka (priprema podataka koja uključuje formiranje istraživačke baze podataka i e. Eksploracija njihovu proveru sa eventualnom modifikacijom) f. Analiza podataka (primena principa verovatnoće u oblasti statistike zaključivanja i statističkih modela sa ciljem donošenja odluka o tome da li podaci podržavaju eksperimentalnu hipotezu ili model) Interpretacija i zaključivanje zaključivanje (koji mogu da podrže postojeću teoriju i praksu; mogu ukazati da je g. Interpretacija nova tehnika efektivnija od stare ili mogu ukazati na nove teoretske koncepte koji bolje opisuju ispitivani fenomen) h. Saopštavanje rezultata istraživanja (da bi istraživanje naučno imalo smisla treba ga publikovati; publikovano publikovano istraživanje istraživanje izloženo je metodološkoj metodološkoj kritici, kritici, a može biti i ponovljeno ponovljeno od strane drugih istraživača; tek tada istraživanje može postati deo naučnog znanja)
Plan istraživanja: a. Cilj Ciljev evii istr istraž aživ ivan anja ja b. Predmet Predmet istraživanja istraživanja (domaćinstvo, (domaćinstvo, karakteristike karakteristike ispitanika ispitanika – socijalne, socijalne, ekonomske, ekonomske, demografske, oboljenja, korišćenje zdravstvene službe) c. Vremens Vremenski ki i terit teritorij orijalni alni okvir okvir istr istraživa aživanjađ njađ d. Vrsta Vrsta studije – deskriptivna deskriptivna (studij (studijaa preseka, preseka, longitudinalna longitudinalna analitička analitička i inteventna, inteventna, evaluaciona) evaluaciona) e. Populacija Populacija koja koja se posmatra; posmatra; Način Način odabira; odabira; Pitanje kontrolne kontrolne grupe grupe f. Tip Tip i ve veliči ličina na uzor uzorka ka g. Varijable Varijable koje se koriste koriste ( pol, starost, starost, učestalost učestalost i intenzitet intenzitet fizičke aktivnost aktivnosti,i, znanja o faktorima faktorima rizika ...) h. Načini sakupljanja sakupljanja podataka (retrospektiv (retrospektivno, no, prospektivno) prospektivno) i. Meto Metodd prikupl prikuplja janja nja podat podataka aka – instr instrum ument ent j. Statistička Statistička analiza k. Proc Proceena tr troško oškova va l. Etički Etički i drugi drugi aspekti aspekti istraži istraživanja vanja (očeki (očekivani vani proble problemi mi i ograničen ograničenja) ja)
3. Popis i registracija Popis je vid registracije registracije stanovništva stanovništva koji se obavlja pomoću Međunarodno Međunarodno preporučene preporučene liste
osnovnih obeležja na svakih deset godina i to uvek u godini koja se završava jedinicom (npr. 1991, 2001, 2011, ...). Kritični momenat je ponoć između 31-og marta i 1-og aprila. Međunarodno preporučena lista osnovnih obeležja:
1. Stanovan Stanovanje je za vreme vreme popisa popisa i mesto mesto stalnog stalnog stanov stanovanja anja 2. Odno Odnoss prema prema ˝glavi˝ ˝glavi˝ porod porodice ice (polož (položaj aj člana člana porodice porodice)) 3. Pol 4. Starost 5. Bračno čno sta stanje nje 6. Mest Mestoo rođe rođenj njaa 7. Držav ržavlljans janstv tvoo 8. Vrst Vrstaa ekonom ekonomsk skee aktiv aktivnos nosti ti 9. Zanimanje 10. Privre Privredna dna delatnos delatnostt 11. Položaj Položaj u zanimanj zanimanjuu 12. Matern Maternji ji jezik jezik 2
13. Narodnost 14. Pismenost 15. Stepen obrazovanja 16. Trajanje školovanja 17. Broj dece (ukupno, živorođena) Registracija je oblik neprekidnog evidentiranja podataka. Ima svoje prednosti i nedostatke.
Zakonska obaveza je postojanje registra: za rak, šećernu bolest, zavisnika od opojnih droga, bolesti bubrega, profesionalne bolesti, hemofiliju, HIV.
4. Anketa Anketa je instrument za sakupljanje novih podataka. Koristi se za ciljana istraživanja.
Faze: 1. Formulacija problema (ciljeva, sadržaja, ...) 2. Idealni nacrt (kvalitet i kvantitet varijabli, izbor tipa ankete, pretestiranje, ...) 3. Operativni nacrt (izrada upitnika, nacrta, uzorka, obuka anketara, sprovođenje ankete, šifriranje, tabeliranje, ...) 4. Naučni izveštaj (formulacija problema, opis istraživanja, opis metodologije, prikaz rezultata, zaključci, ...)
5. Uzorak Uzorak je deo osnovnog skupa, a pod osnovnim skupom se podrazumevaju svi članovi neke
skupine sa karakteristikom koju merimo. Osnovna funkcija uzorka je smanjenje obima naučno-istraživačkog rada i obezbeđenje što višeg nivoa pouzdanosti i preciznosti. Uzorak treba da bude reprezentativan tj. da liči na osnovni skup. Prednosti:
-
manji troškovi bolja organizacija i sprovođenje istraživanja mogućnost angažovanja kvalitetnog kadra informacije za kraće vreme veća tačnost uvid u greške kontrola kvaliteta
Nedostaci:
-
nepotpuni podaci kada je veliki varijabilitet ili je pojava retka nemogućnost obezbeđenja podataka za male teritorije obezbeđenje stručnog kadra detaljna prethodna istraživanja
Pristrasnost zbog:
-
neadekvatne tehnike izbora statističkih jedinica nekorektno izdvajanje jedinica za uzorak subjektivnog interpretiranja vrednosti statističkih mera uzorka
Vrste uzorka:
-
prema načinu izbora jedinica da li je formiran na računu verovatnoće ili ne 3
*Slučajni uzorak * Svaka individua ima jednaku šansu izbora u uzorak; izabrani uzorak mora biti reprezentativan što obezbeđuje slučajan uzorak. Najbolji način odabiranja uzorka je pomoću tablica slučajnih brojeva gde je verovatnoća pojavljivanja parnih i neparnih brojeva 50% (0,5), a verovatnoća pojavljivanja brojeva od 0 do 9 iznosi 10% (0,1). Pre početka odabiranja uzorka mora se poznavati obim osnovnog skupa ( N ), koji se naziva i okvir skupa, izvršiti njegovo numerisanje i poznavati veličinu uzorka ( n ). n = stopa _ odabira N *Višestepeni uzorak * Koristi se kada je u pitanju velika teritorija. Individue se biraju metodom slučajnog izbora i to izdvajanjem jedinica u više nivoa (stepena). *Sistematski uzorak * Vid je višestepenog uzorka. Kod ovog uzorka se prvo mora odrediti korak izbora. N K = n n – broj jedinica uzorka; N – broj jedinica osnovnog skupa. Kod ovod uzorka niži je nivo reprezentativnosti za heterogenu statističku masu. *Stratifikovani uzorak * Koristi se da bi smanjili veličinu standardne greške podelom heterogenog skupa na homogenije podskupove – stratume, eliminisanjem visokog varijabiliteta. *Višefazni uzorak * Koristi se ako se radi o istraživanju gde je nemoguće ili vrlo skupo neposredno ispitivanje čak i na uzorku. Obavlja se metodom slučajnog izbora, u više faza. *Uzorak skupina (grupa)* Koristi se kada se populacija sastoji iz sličnih i homogenih grupa (blokovi kuća, domaćinstva), slučajnim izborom – uzorak grupa, a ne statističkih jedinica.
6. Kontrola, grupisanje i šifriranje podataka Kontrola podataka ima za cilj da utvrdi kompletnost i kvalitet prikupljenih podataka, da ih
ispravi i dopuni ako je to moguće. Jednom, kada su podaci sakupljeni, vrši se kontrola: - logičkih grešaka, koje po prirodi stvari ne stoje - formalna, nedostatak nekog od odgovora na postavljeno pitanje - računska, greške nastale pri matematičkim manipulacijama Uzroci grešaka: - loše postavljena dijagnoza - neadekvatno definisanje pojmova - neodgovarajući i preopširni podaci - nedovoljna stručnost osoblja 4
-
nepreciznost instrumenata površan rad popisivača i anketara Grupisanje podataka vrši se sa ciljem dobijanja zbira istih obeležja. Najjednostavnije je to činiti
prema sličnosti – formiranjem jednorodnih grupa. Numeričke vrednosti grupišu se u razrede ili klase, ređaju se po veličini ili intenzitetu. Kontinuirane serije se grupišu u veće ili manje klase. Veličina klase naziva se klasni interval . Pri formiranju grupe mora se voditi računa da se tačno odredi kojoj grupi pripadaju granične vrednosti, i istu vrednost ne treba uzimati kao završetak jedne i početak druge grupe, jer se onda ne zna kojoj grupi pripada posmatrana vrednost. Grupisanje podataka vrši se ručno (kada je mali broj podataka) i mašinski (veliki broj podataka, sa velikim brojem posmatranih obeležja). Proces grupisanja se može ubrzati ako se svako obeležje označi jednim znakom (slovo, broj). Brojevi (oznake) za pojedine grupe nazivaju se Šifre, a lista grupa sa odgovarajućim šiframa za jedno obeležje je kodeks.
7. Tabele, vrste i primena Tabela je najjednostavniji format za prikazivanje rezultata grupisanja statističkih podataka.
Prema broju podataka tabele se dele na: - jednostavne - složene - kombinovane (nastaju kombinovanjem više jednostavnih ili više složenih tabela) Prema ulozi tabele se dela na: - obradne - publikacione - analitičke Znaci: - nema pojave ... ne raspolaže se podacima 0,0 manji od 0,5 Ø prosek // neproveren podatak
8. Grafičko prikazivanje, vrste grafikona i njihova primena Grafikoni služe za prikazivanje:
-
dinamike intenziteta strukture stepena povezanosti dveju pojava ili obeležja
Vrste grafikona (njihova primena):
- linijski (koristi se za praćenje kretanja pojave u vremenu) - polarni (koristi se za prikazivanje pojava sezonskog karaktera) - histogram, poligon frekvencija (za kontinuirana numerička obeležja) - štapićasti (za diskontinuirana numerička obeležja) - stubičasti (za prikazivanje atributivnih obeležja) - kružni dijagram (za prikazivanje strukture statističke mase) 5
- simbolički dijagram (za slikovito prikazivanje pojave) - statističke mape, kartogram (za geografsko teritorijalnu distribuciju pojave)
9. Relativni brojevi U statistici se često koriste relativni brojevi jer su apsolutni brojevi često nepodesni za vremenska, prostorna i druga poređenja istovrsnih pojava. Stope (koeficijenti)
Stope su pokazatelji nivoa i njihov pojam se obično povezuje sa izračunavanjima koja uključuju verovatnoću javljanja nekog događaja. a ⋅ k Brojilac stope je komponenta imenioca. ( a + b) a – frekvencija kojom se događaj javlja u određenom vremenskom periodu; a + b – broj osoba gde se događaj javlja za isti vremenski period k – konstanta Odnos
c je količnik oblika( ) ⋅ k Brojilac nije deo komponente imenioca. d c, d – frekvencija događaja. Proporcija
Proporcija je pokazatelj strukture, i govori o odnosu pojedinih događaja prema ukupnim događajima. Iskazuje se u procentima ili u vidu razlomka. Indeks dinamike
Pokazatelj je kretanja pojave u vremenu. Bazni indeks se računa tako što se jedna vrednost u nizu odredi za baznu (označava sa 100), a sve ostale vrednosti se porede sa njom. Lančani indeks – kod njega je bazna vrednost prethodna vrednost (iznosi 100) u odnosu na onu koja se posmatra.
10. Srednje vrednosti Jedan od važnijih pokazatelja numeričkih karakteristika je srednja vrednost , čija je uloga da zanemarujući individualne razlike između podataka serije istakne onu vrednost koja je za njih tipična. To je vrednost koja reprezentuje skup, ali isto tako omogućava i poređenje različitih skupova sa istim obeležjima. Uočeno je da postoji tendencija koncentrisanja vrednosti obeležja tako da se njihove frekvencije lociraju negde oko sredine, između najniže i najviše vrednosti u nizu. Ovakva centralna tendencija rasporeda frekvencija sugeriše da u skupu postoji vrednost ili broj koji reprezentuje taj skup, a ostale vrednosti manje ili više odstupaju od nje. Taj broj se naziva srednja vrednost . Srednja vrednost može biti poziciona (medijana, mod) ili izračunata, matematička vrednost (aritmetička, geometrijska i harmonijska sredina). Opšti uslovi koje mora da ispunjava srednja vrednost: - da se može uzračunati samo na jedan jedini način - da se vrednost nalazi između najmanje i najveće u nizu - kada su sve vrednosti obeležja iste, srednja vrednost je ista 6
-
srednje vrednosti imaju istu jedinicu mere koju ima i obeležje koje je mereno
Upotreba: - izražena jednim brojem, predstavlja sve statističke podatke u određenom uzorku; - pošto je reprezentativna omogućava poređenje dva ili više nizova podataka sa istim obeležjem; - na osnovu brojčanih vrednosti omogućava procenu brojčanih vrednosti cele statističke mase. Mod, modna vrednost
To je vrednost posmatranog obeležja koja ima najveću frekvenciju. Medijana
To je vrednost centralno postavljena u nizu sređenom po veličini, tako da polovina članova niza imaju manju, a polovina veću vrednost od medijane. Medijana je korisna deskriptivna mera, posebno u slučaju velike varijacije vrednosti analizirane varijable. Prvi korak u računanju medijane je da se članovi niza poređaju po veličini. n +1 Mesto na kome je medijana kod negrupisanih podataka traži se po formuli Me = , gde je n 2 broj članova niza. Σ f + 1 Kod grupisanih diskontinuiranih podataka mesto medijane se traži po formuli Me = 2 Aritmetička sredina
Ovo je najčešće korišćena srednja vrednost koja se dobija kada se zbir svih vrednosti podeli sa brojem članova niza. ∑ x x = n Aritmetička sredina je jedna od najčešće korišćenih srednjih vrednosti koja daje dobar uvid u seriju i lako se računa. Ako su podaci diskontinuirani i grupisani onda se aritmetička sredina računa po formuli: ∑ fx , f je frekvencija. x = f Σ Ukoliko su podaci kontinuirane prirode i grupisani, ondase srednja vrednost računa po formuli za grupisane podatke, a procedura rečunanja je sledeća: - prvo se nađu sredine klasnih intervala i ta sredina se označava sa x; - množi se svaka frekvencija sa svojom vrednosti x; - zbir proizvoda se deli sa zbirom frekvencije. Često postoji potreba da se radi na više uzoraka, te da se izračunava zajednička aritmetička ∑ ni x i , gde predstavlja sredina njihovih aritmetičkih sredina. Izračunavanje se vrši po formuli x = x ∑ ni zajedničku aritmetičku sredinu; ni predstavlja broj ispitanika; a xi aritmetičku sredinu uzorka.
7
11. Mere varijabiliteta Da bi se utvrdilo da li se i kom obimu podaci grupišu oko srednje vrednosti, odnosno reprezentativnost srednjih vrednosti, koriste se mere za ocenu homogenosti ili varijabiliteta. Opseg, polje ili interval varijacije
Predstavlja razliku između najveće i najmanje opservirane vrednosti. Koristi se za grubu i brzu procenu varijabiliteta nekog skupa. Ova mera se retko koristi u analitičkom smislu jer: - interval ne uključuje varijabilitet opserviranih podataka između dva ekstrema, - ekstremne vrednosti mogu biti nepouzdane, - interval teži da raste što se više opservacija dodaje, - ne govori ništa o grupisanosti podataka oko aritmetičke sredine. Srednje apsolutno odstupanje
Za preciznije određivanje odstupanja pojedinim članovima niza izračunava se odstupanje svakog člana niza od aritmetičke sredine (x- x ). Zbir svih odstupanja jednak je nuli. Prosečno kvadratno odstupanje (srednje kvadratno apsolutno odstupanje, varijansa)
Kvadriraju se razlike pojedinih odstupanja od aritmetičke sredine (x- x )2 i suma tih kvadrata se podeli sa brojem jedinica u uzorku - n. ( x − x) 2 ∑ 2 Računa se po formuli: δ = n −1 Standardna devijacija (SD)
Koristi se za merenje prosečne devijacije (odstupanja) od aritmetičke sredine. Mera je za ispitivanje reprezentativnosti aritmetičke sredine. Standardna devijacija opada sa porastom veličine uzorka. Kada je standardna devijacija uzorka mala, aritmetička sredina uzorka je bliska individualnim vrednostima uzorka. Ukoliko su odstupanja od aritmetičke sredine veća, veći je i varijabilitet , pa su i vrednosti standardne devijacije veće. Dobija se uzimanjem kvadratnog korena iz varijanse. ( x − x) 2 Ako su podaci negrupisani formula je: SD = ∑ . n −1 f ( x − x) Ukoliko su podaci grupisani formula za izračunavanje glasi: SD = ∑ . f 1 − ∑ ( fx 2 ) 2 ∑ − x Ako je aritmetička sredina decimalan broj, formula za izračunavanje je: SD = ∑ f − 1 2
Koeficijent varijacije (CV)
Koeficijent varijacije je mera varijabiliteta koja se izražava relativnim brojem i zato daje mogućnost: - zaključivanja da li je neki skup homogen ili ne, - poređenja homogenosti istog skupa po različitim varijablama, - poređenja homogenosti istog ili različitih skupova po različitim varijablama, 8
-
poređenja homogenosti različitih skupova po istoj varijabli čak i kada im je različita aritmetička sredina.
SD ⋅ 100 . x CV se izražava u procentima, a granična vrednost je 30%. Ako je CV iznad 30% grupa nije homogena, ako je CV ispod 30% grupa je homogena.
Računa se po formuli: CV =
12. Standardna greška Procena neke vrednosti (npr. aritmetičke sredine) biće utoliko tačnija što je uzorak veći i što je pojava koju merimo manje varijabilna. Kako se na varijabilitet ne može delovati, to je moguće povećanjem uzorka smanjiti grešku procene koja se vezuje uz naše merenje. pri tome, greška ne opada proporcionalno povećanju broja elemenata u uzorku, već proporcionalno n . Standardna greška je odnos standardne devijacije populacije i korena iz veličine uzorka SDosnovnog _ skupa SE = , a s' obzirom da je standardna devijacija populacije nepoznata, a približno iste n SD vrednosti kao i standardna devijacija uzorka umesto nje se uzima SD uzorka, pa je formula SE = uzorka n . Pomoću standardne greške ocenjujemo interval u kome leži x osnovnog _ skupa , ako znamo x uzorka .
x os . skupa
x u ± 1SE x u ± 2 SE x u ± 3SE
Pouzdanost 68% 95% 99%
13. Korelacije (linearna korelacija i rang korelacije ) Linearna korelacija
U medicinskim istraživanjima obično se prati i meri više od jedne varijable kod iste osobe. Proces kojim es determiniše povezanost jedne varijable sa drugom poznat je pod imenom korelacija. U korelacionoj analizi se polazi od pretpostavke da veza postoji, a njome se teži utvrditi jačina i pravac povezanosti. Kada je porast jedne varijable praćen porastom druge i obrnuto, govorimo o pozitivnoj koreleciji, a kada je porast jedne praćen opadanjem druge i obrnuto, onda je to negativna korelacija. Za merenje stepena linearne korelacije služi koeficijent linearne korelacije ili Pearsonov koeficijent , čiji je simbol r . Kod korišćenja korelacije mora se imati na umu da visina korelacije zavisi od više faktora: analiziranje ekstremnih grupa, a isključivanje ˝srednjih grupa˝, vrste podataka čiji odnos nije linearan već zakrivljen, broja klasnih intervala, broj podataka. SD ⋅ x ⋅ y xy Formula za izračunavanje Pearsonovog koeficijenta je r = ; SDxy = ∑ − x ⋅ y gde SDx ⋅ SDy n su X i Y vrednosti X i Y varijabli, a n je broj članova uzorka. x 2 y 2 2 2 ∑ ∑ SDx = − x ; SDy = − y . n n 9
Da bi se utvrdilo da li je dobijeni koeficijent korelacije značajan (da li se značajno razlikuje od n−2 nule) neophodno je izvršiti testiranje značajnosti preko formule: t = r ; v n 2 je stepen 1 − r 2 slobode, a n je broj parova podataka. =
−
Rang korelacije
Ako rezultati nisu merene vrednosti, tako da su aritmetička sredina i standardna devijacija nedostupne ili su varijable date u rangu, tada se koristi korelacija ranga. 6∑ d 2 Formula za korelaciju ranga ili Spermanov koeficijent je: ρ = 1 − , d je razlika u N ( N 2 − 1) rangu, a N je broj parova. Vrednosti se kreću od +1 do -1. N − 2 Testiranje značajnosti korelacije ranga vrši se preko formule t = ρ ili iz tablica za 1 − ρ 2 korelaciju ranga.
14. Linearni trend Trend je linija najbolje prilagođena datim podacima, koja pokazuje tendenciju kretanja neke
pojave. Na bazi trenda može se izvršiti interpolacija (predviđanje vrednosti koja nedostaje unutar posmatranog perioda) i ekstrapolacija (predviđanje vrednosti van perioda posmatranja ili ocenu vrednosti u prošlosti ili njenevrednosti u budućnosti). Oblik linije trenda zavisi od posmatrane pojave. Ona može biti prava, kriva, parabola. Formula za izračunavanje linearnog trnda predstavljena pravom linijom je: y ∑ xy yt = a + bx ; a = ∑ = y ; b = 2 , n ∑ x gde je: y – frekvencija, vrednost posmatranog obeležja; x – vreme; n – broj posmatranih godina (vreme). Vrednost za x su uzete kao zamena za godine po principu da ako je neparan broj članova niza, onda se u sredinu niza stavi 0, pa idući od nje nagore se upisuje -1, -2, -3...itd. a ispod nje sa +1, +2, +3...itd. Ako je broj članova niza paran onda se x izračunava tako da se dva centralna člana označavaju sa -1, i +1, a onda se ide sa po dve jedinice više: -1, -3, -5, i +1, +3, +5.
15. Statistički testovi Testovi nam omogućuju da dobijemo odgovor o statističkoj značajnosti ocena koje dobijamo putem uzorka i u kojoj meri se možemo osloniti na tu ocenu. Oni nam pomažu, da ako se procene iz dva ili više uzoraka međusobno razlikuju – kakvu značajnost treba pripisati utvrđenoj razlici. Testiranje hipoteze
Hipoteza je naučna pretpostavka zasnovana na poznatim činjenicama, radi izvođenja nekog zaključka. Postupak provere hipoteze naziva se testiranje hipoteze. Procedura testiranja hipoteze ima nekoliko faza: a. Postavljanje hipoteze – već na početku istraživanja postavljaju se nulta i radna hipoteza. Nulta hipoteza tvrdi da ne postoji razlika između ocena dobijenih u uzorku i podataka u osnovnom skupu, ili pak ocena uzoraka koji se upoređuju. Ako postoji razlika ona nije signifikantna i može se zanemariti. Radna hipoteza tvrdi da razlika postoji i da je signifikantna.
10
b. Odabiranje odgovarajućeg statističkog testa i odgovarajuće formule za testiranje hipoteze – T test ili χ 2 test. c. Određivanje nivoa signifikantnosti (p) – koji će se smatrati graničnim za prihvatanje ili odbacivanje hipoteze.Taj prag se naziva α nivo i on se uspostavlja na p=0,05. Ako je p≤ 0,05 prihvata se radna hipoteza, a ako je p> 0,05 prihvata se nulta hipoteza. d. Donošenje zaljučka – na osnovu dobijene vrednosti testa i vrednosti teoretski određene u tablicama donosimo zaključak o odbacivanju nulte hipoteze i prihvatanju radne ili pak obrnuto. *Stepen slobode* - je svojevrsna, vrlo značajna, ali veličina zavisna od broja statističkih jedinica uzorka ili broja tretitanih grupa, koja služi kao neka vrsta gradacije i kategorizacije statističke signifikantnosti razlike izvesnih veličina u okviru određenog nivoa verovatnoće. Testirajući značajnost razlike između aritmetičke sredine uzorka i statističke mase stepen slobode se određuje kao V = n -1. Testirajući aritmetičku sredinu dva uzorka stepen slobode je zbir stepena slobode dva uzorka V = (n1-1)+(n2 -1) = n1 + n2 – 2. Testiranje frekvencija grupa proučavanih modaliteta – stepen slobode se odnosi na broj grupa modaliteta čiji zbir odgovara ukupnoj frekvenciji statističke serije. V = n – 1, n je broj grupa frekvencija. Ako u istraživanju imamo više grupa frekvencija onda one formiraju redove i kolone pa formula za V glasi: V = (R-1)(K-1). T – test (Studentov)
Koristi se ako se želi utvrditi pripadnost uzorka osnovnom skupu ili pripadnost dva uzorka istoj ili različitim populacijama. Upotrebljava se za parametarske podatke i za određivanje statističke značajnosti razlike kod parametarskih podataka ( x , SD). T- test se koristi kod zadataka gde piše da li postoji razlika!!! 1. Kada se testira razlika pojedinačnih jedinica u uzorku, tj. da li jedinice pripadaju osnovnom skupu x u − x o t = T – test se računa kao: SE V = n − 1 t =
d d (∑ d ) 2 ∑ ; ; V d = ∑ d − n n n(n − 1) 2
2.
=
n
−
1
˝Pre i posle˝
3. U slučajevima kada je uzorak veliki (n1+n2>60) T – test se računa kao: 4. U t =
slučajevima kada x1 − x 2
je
uzorak
mali
(n1+n2<60)
T
–
t =
x1 − x 2
SD1 2 SD2 2 + n1 n2 test se računa
kao:
n1 SD1 2 + n2 SD2 2 n1 + n2 ⋅ n1 + n2 − 1 n1 ⋅ n2
11
χ 2 test (Pirsonov)
Koristi se najčešće kada se testiraju razlike očekivanih i posmatranih frekvencija ili ako su u pitanju atributivna obeležja, odnosno neparametrijski podaci. ( Po − Oč ) 2 2 Formula za izračunavanje je: χ = ∑ Oč
16. Metodologija proučavanja zdravstvenog stanja stanovništva Postoje dva pristupa merenja zdravlja pojedinca i stanovništva: patološki i generički. Prvi se zasniva na metodu isključivanja simptoma oboljenja i merenju nivoa rizičnih faktora, a drugi na oceni zdravstvenog stanja koji uključuje merila ˝potpunog fizičkog, psihičkog i socijalnog blagostanja˝. Za ocenu zdravstvenog stanja stanovništva koristi se veći broj indikatora od kojih su neki direktni (mortalitet i morbiditet), a drugi indirektni (indikatori o stanovništvu, socijalno – ekonomski i dr.)
17. Indikatori zdravstvenog stanja stanovništva Za ocenu zdravstvenog stanja stanovništva koriste se uglavnom indikatori koji se obezbeđuju putem redovne statistike. Za potrebe analize zdravstvenog stanja stanovništva koriste se sledeći indikatori: - brojno stanje i struktura stanovništva, - natalitet, - fertilitet, - opšti i specifični mortalitet, - prirodni priraštaj, - očekivano trajanje života, - reprodukcija stanovništva, - morbiditet, - mortalitet, - nutritivni status, - životni i radni uslovi stanovništva, - nivo obrazovanja i zdravstvene svesti stanovništva, - ekonomske mogućnosti, - uslovi za ostvarivanje zdravstvene zaštite i njeno korišćenje.
18. Broj i struktura stanovništva Brojno stanje
Broj stanovnika ne spada u direktne indikatore zdravstvenog stanja stanovništva, ali je važan kao osnova za sve vrste demografskih i zdravstvenih proučavanja. Polna struktura stanovništva
Polna struktura je indirektni indikator, značajan u izračunavanju drugih stopa i iskazivanju specifičnog morbiditeta i mortaliteta muškaraca i žena. Brojčani odnos muškaraca i žena iskazuje se stopom maskuliniteta koja predstavlja broj muškaraca na 1000 žena. Ako je maskulinitet pozitivan posledica je lošeg zdravstvenog stanja, a ako je negativan onda je posledica dobrog zdravstvenog stanja kada se isključe migracije. U nerazvijenim zemljma preovladava muško stanovništvo zbog veće stope smrtnosti žena(u toku trudnoće, položaja,...), dok u razvijenim zemljama zbog ekstremnijeg načina života više umire muško stanovništvo. Starosna struktura stanovništva
12
Starosna struktura stanovništva je jedna od najvažnijih demografskih struktura, zavisna od nataliteta, mortaliteta i migracionih kretanja. Povezanost je neposredna, ali i povratna jer i starosna struktura ima uticaj na sve ove komponente. Za proučavanje starenja stanovništva postoji više metoda: 1. Zrelost stanovništva, koji predstavlja broj osoba starijih od 65 godina u ukupnom stanovništvu. Prema udelu ove kategorije stanovništvo se deli na : - mlado sa < 4% osoba starijih od 65 godina; - zrelo, čiji udeo iznosi 4-7%; - staro, 7-10% - vrlo staro >10% 2. Indeks starosti, predstavlja brojni odnos osoba starih 60 i više godina i osoba 0-19 godina. Granična vrednost je 0,4. Vrednosti iznad indeksa govore u prilog starenja stanovništva. 3. Prosečna starost stanovništva, iskazana ponderisanom aritmetičkom sredinom ima stalan rast. Kao granična vrednost se uzima 30 godina. 4. Biološki tip stanovništva uključuje podelu stanovništva prema udelu pojedinih grupa stanovništva (0-14.god., 15-49.god., i 50 i više) na progresivni, stacionarni i regresivni. Biološki Starost
Progresivni
0-14 15-49 50+
40 50 10
tip stanovništva Stacionarni
33 50 17
Regresivni
20 50 30
19. Pozitivno prirodno kretanje stanovništva (natalitet, fertilitet i reprodukcija) Natalitet
Natalitet predstavlja broj živorođene dece na jednoj teritoriji u toku određenog vremenskog perioda. Stopa nataliteta je broj živorođene dece na 1000 stanovnika u jednoj godini. Ž N = ⋅ 1000 S Granične vrednosti: - nepovoljan ispod 12 ‰ - povoljan 13-20 ‰ - visok 21-25 ‰ - vrlo visok 26-30 ‰ - ekstremno visok preko 30 ‰ Fertilitet
Fertilitet predstavlja odnos između broja živorođene dece i žena fertilnog doba (15-49.god). Kada se govori o fertilitetu, potrebno je definisati i fekonditet koji predstavlja potencijalnu fiziološku sposobnost muškaraca i žena da stvaraju potomstvo. Ostvarivanje te fiziološke sposobnosti ili efektno rađanje je fertilitet.
Brojni faktori utiču na nivo fertiliteta. 13
1. Biološki činioci: - fekonditet - starosna struktura stanovništva - prosečna starost stupanja u brak - sterilitet, nasleđe i drugi biološki i medicinski faktori 2. Socijalno-ekonomske determinante: - nivo socijalnog ekonomskog razvoja - položaj žene u društvu - nivo opšteg obrazovanja, posebno žena - nivo mortaliteta, posebno dečijeg - kontrola rađanja. 3. Psihološki činioci: - sociopsihološki - psihološke karakteristike pojedinaca Fertilitet se iskazuje putem: a. Opšte stope fertiliteta, koja predstavlja broj živorođene dece na 1000 žena fertilnog perioda. Ž F= ⋅ 1000 f (15 - 49.god) U zemljama u razvoju ove stope iznose 100-150 ‰, a na visokofertilnom području idu i do 200 ‰; u stanovništvu sa niskim fertilitetom iznose ispod 100 ‰. Granična vrednost je 50 ‰. b. Specifične stope fertiliteta označavaju broj živorođene dece koje su rodile žene određene starosti iskazane na 1000 žena te starosti. Reprodukcija stanovništva
Pod reprodukcijom podrazumeva se proces obnavljanja stanovništva. Ona se izražava kao bruto i neto stopa reprodukcije. Bruto stopa označava broj živorođene dece ženskog pola na jednu ženu fertilnog doba, a neto stopa broj živorođene dece ženskog pola koja dožive fertilni period godina u odnosu na jednu ženu fertilnog doba. Ako je neto stopa reprodukcije 1, to znači da svaka žena obezbeđuje sebi zamenu rađanjem ženskog deteta.
20. Pokazatelji mortaliteta Mortalitet predstavlja negativnu komponentu u prirodnom kretanju stanovništva, čiji nivo je izraz kompleksnog delovanja bioloških, ekonomskih i socijalnih faktora (starost, nivo standarda, obrazovni nivo, obim i kvalitet pružene zdravstvene zaštite itd.) Mortalitet se izražava brojem umrlih osoba na određeni broj stanovnika i u određenom vremenskom periodu.
Opšta stopa mortaliteta
14
Predstavlja ukupan broj umrlih osoba u jednoj godini na 1000 stanovnika određene teritorije. Broj umrlih (u) M= ⋅ 1000 Broj stanovnika (s) Orijentacioni je pokazatelj jer ne uzima u obzir starosnu i polnu strukturu. Granične vrednosti: - vrlo visoka preko 15 ‰ - visoka 12-15 ‰ - srednja 10-11 ‰ - niska 8-9 ‰ - vrlo niska <8 ‰ Specifične stope mortaliteta
Ukupan broj smrtnih slučajeva samo u odnosu na stanovništvo u kome su se ti smrtni slučajevi desili. Specifične stope mortaliteta izražavaju smrtnost u odnosu na pol, starost i druge karakteristike stanovništva. Specifična stopa smrtnosti po polu Broj umrlih m/ž ⋅ 1000 Predstavlja broj umrlih muškaraca/žena u odnosu na ukupan broj m/ž. Broj m/ž Specifična stopa smrtnosti po starosti Predstavlja broj umrlih određene starosne dobi u odnosu na ukupan broj stanovnika te starosti. Specifična stopa smrtnosti po uzroku Predstavlja ukupan broj umrlih od specifične bolesti u odnosu na ukupan broj umrlih od svih uzroka smrti. Na ovaj način se dobija uvid u udeo pojedinih uzroka smrti u ukupnom mortalitetu. Izražava se u procentima.
21. Smrtnost odojčadi, dimenzije i značaj Smrtnost odojčadi spada među najznačajnije indikatore ne samo zdravstvenog stanja odojčadi već i zdravstvenog stanja stanovništva u celini. Ona je usko povezana sa nivoom socio-ekonomskog razvoja. Predstavlja smrtnost do navršenih 364 dana života. Smrtnost u dobnoj grupi "0". Vrlo je cenjen pokazatelj zdravstvenog stanja i jedan oblik specifične smrtnosti po starosti. Deo je ukupne smrtnosti i predstavlja broj umrle dece do 1 godine starosti u odnosu na ukupan broj živorođene dece izraženo u promilima. Granične vrednosti: - vrlo visoka stopa - visoka stopa - osrednja - niska - vrlo niska
preko 100‰ 60-100 ‰ 30-60 ‰ ispod 30 ‰ ispod 20 ‰
Cilj Evropskog regiona je do 20 ‰. Visoka stopa smrtnosti odojčadi je uvek udružena sa niskim stepenom opšte i zdravstvene kulture, lošim socioekonomskim uslovima, nerešenim problemima životne sredine, nedovoljno razvijenom zdravstvenom službom, niskim nivoom perinatalne i postnatalne zaštite, slabo korišćenom zdravstvenom službom i dr. 15
Podela u odnosu na životnu dob odojčeta 1. Neonatalna ( 0 - 27 dana ) - rana ( 0 - 6 dana ) - kasna ( 7 - 27 dana ) 2. Postneonatalna
-
mlađe odojčadi ( 28 dana - 5 meseci ) starije odojčadi ( 6 meseci - 11 meseci )
3. Perinatalna smrtnost
-
mortinatalitet + rana neonatalna smrtnost
Podeljeno je na periode jer se gledaju uzroci smrtnosti: genetski poremećaji, komplikacije i povrede pri porođaju, endogeni i egzogeni faktori. Mortinatalitet (mrtvorođenost)
Smrt fetusa je smrt ploda koja je nastupila pre potpunog odvajanja od majke. Kasna fetalna smrt je smrt posle navršene 28. nedelje trudnoće. Mrtvorođenost se izražava u promilima i predstavlja broj mrtvorođene dece u odnosu na broj živorođene.
22. Maternalni mortalitet. Specifične stope mortaliteta. Maternalni mortalitet
Maternalni mortalitet predstavlja smrtnost žena usled komplikacija trudnoće, porođaja i puerperijuma. Obično se izražava stopom na 100 000 živorođene dece. Cilj Svetske Zdravstvene Organizacije (SZO) je da stopa maternalnog mortaliteta u Evropskom regionu bude <15/100 000. Najrazvijenija područja: <10/100 000 Najnerazvijenija područja: do 700/100 000 Uzroci: - infekcije i sepsa - toksemije - hemoragija - abortusi - druge komplikacije. Specifične stope mortaliteta
Ukupan broj smrtnih slučajeva samo u odnosu na stanovništvo u kome su se ti smrtni slučajevi desili. Specifične stope mortaliteta izražavaju smrtnost u odnosu na pol, starost i druge karakteristike stanovništva. Specifična stopa smrtnosti po polu Broj umrlih m/ž ⋅ 1000 Predstavlja broj umrlih muškaraca/žena u odnosu na ukupan broj m/ž. Broj m/ž Specifična stopa smrtnosti po starosti Predstavlja broj umrlih određene starosne dobi u odnosu na ukupan broj stanovnika te starosti. Specifična stopa smrtnosti po uzroku
16
Predstavlja ukupan broj umrlih od specifične bolesti u odnosu na ukupan broj umrlih od svih uzroka smrti. Na ovaj način se dobija uvid u udeo pojedinih uzroka smrti u ukupnom mortalitetu. Izražava se u procentima.
23. Opšte i standardizovane stope mortaliteta Opšta stopa mortaliteta
Predstavlja ukupan broj umrlih osoba u jednoj godini na 1000 stanovnika određene teritorije. Broj umrlih (u) M= ⋅ 1000 Broj stanovnika (s) Orijentacioni je pokazatelj jer ne uzima u obzir starosnu i polnu strukturu. Granične vrednosti: - vrlo visoka preko 15 ‰ - visoka 12-15 ‰ - srednja 10-11 ‰ - niska 8-9 ‰ - vrlo niska <8 ‰ Standardizovane stope mortaliteta
Koriste se da bi se eliminisali različiti faktori koji utiču na visinu smrtnosti. Postoje dva metoda standardizacije: 1. Direktna – daje odgovor kolika bi bila smrtnost da su upoređivana stanovništva istog sastava po polu i starosti. Koristi se kada se raspolaže podacima o starosnoj strukturi umrlih i starosnoj strukturi stanovništva. 2. Indirektan – daje odgovor kolika bi bila smrtnost kada bi u upoređivanim stanovništvima vladale iste prilike smrtnosti po polu i starosti kao i u određenom standardnom stanovništvu. Koristi se kada se raspolaže podacima o starosnoj strukturi stanovništva, a nedostaju podaci o starosnoj strukturi umrlih.
24. Očekivano trajanje života, proporcionalni indeks smrtnosti i ekvivalentne stope smrtnosti Očekivano trajanje života
Spada među indikatore zdravstvenog stanja stanovništva koji se najčešće koriste u međunarodnim poređenjima. U praksi se najčešće koristi očekivano trajanje života od nulte godine, što predstavlja verovatnoću novorođenog deteta da će doživeti određeni broj godina života. Očekivano trajanje života je hipotetična vrednost zasnovana na realnim stopama mortaliteta. Proizilazi iz specifičnih stopa mortaliteta po starosti, i to izraženim za svaku godinu. Cilj SZO za evropski region je najmanje 75 godina. Proporcionalni indeks smrtnosti
Koristi se kao jedna od mera za poređenje opšteg zdravstvenog stanja različitih zajednica, a definiše se kao procenat umrlih iznad 50 godina života među svim umrlim u istoj kalendarskoj godini. SZO ga preporučuje posebno za primenu u zemljama sa slabo razvijenom statističkom službom. Granična vrednost je 85 %. Ekvivalentna stopa smrtnosti
17
Standardizovani je pokazatelj. Predstavlja srednju vrednost (aritmetičku sredinu) specifičnih stopa mortaliteta trinaest dobnih grupa (0-64 godine) po petogodištima. Lako se izračunava pa se preporučuje za praktični rad.
25. Prirodni priraštaj i vitalni indeks Prirodni priraštaj
Predstavlja razliku između broja živorođenih i umrlih na jednoj teritoriji u određenom vremenskom periodu. Izražava se stopom na 1000 stanovnika i za godinu dana. Ž-U P p = ⋅ 1000 S Granične vrednosti: - retko visok >15 - vrlo visok 13-15 - visok 9-12 - povoljan 6-8 - slab <5 Vitalni indeks
Određuje racionalnost prirodnog priraštaja. broj živor. (N) ⋅ 100 Prednost: potrebni su nam samo N i M, a ne i broj stanovništva S. Vi = broj umrlih (M)
26. Pokazatelji morbiditeta Morbiditet je svakako najvažniji pokazatelj zdravstvenog stanja stanovništva, jer daje uvid u razbolevanje i onesposobljenost stanovništva. U morbiditetnoj statistici kao jedinice posmatranja se uzimaju obolelo lice, oboljenje, epizode oboljenja, a u analizi je bitno istaći šta se posmatra i u kom vremenskom periodu. Morbiditetna statistika je deo zdravstvene statistike i ona treba da omogući da se sazna: - koliko ljudi boluje - od kojih se bolesti boluje - koliko često i koliko dugo se boluje - koja su oboljenja najakutnija, najvažnija - koliko su neka oboljenja fatalna - koji su finansijski troškovi u vezi sa oboljenjima - od kojih se bolesti zaštićuju - koje su varijacije iz godine u godinu i sezone u sezonu - kakav je efekat kontrole Morbiditetna statistika istražuje oboljevanje i to ne samo ukupno broj obolelih, već i strukturu oboljevanja i to za sve dobne grupe ukupno, za pojedine starosne kategorije i to prema vrsti osiguranja, zanimanja itd.
Opšta stopa morbiditeta
18
Predstavlja odnos broja oboljenja ili obolelih lica i broja stanovnika na jednoj teritoriji. O (OL) MB = ⋅ 1000 S Stope specifičnog morbiditeta
Predstavljaju odnos broja oboljenja ili obolelih lica posmatrane starosne grupe, pola ili oboljenja i broja stanovnika. O (OL) ž O (OL) m ⋅ 1000 ⋅ 1000 MB ž = MB m = Prema polu: Sž Sm O (OL) st MB st = ⋅ 1000 Prema starosnim kategorijama: Sst O (OL) sp ⋅ 100 000 Prema vrsti oboljenja (tada se izražava na 100 000 stanovnika): MB sp = Ssp Radi analize morbiditeta bolesti se grupišu po grupama međunarodne klasifikacije – nakon toga se izrađuje struktura morbiditeta u procentima. Intenzitet oboljenja Incidencija je broj novootkrivenih slučajeva oboljenja od jedne bolesti.
O (OL) - novootkriveno ⋅ 100 S Incidencom se meri učestalost novih slučajeva oboljenja, što ima veliki značaj u praćenju kretanja oboljenja i epidemiološkoj kontroli. Stopa incidencije =
je ukupan broj starih i novih oboljenja od te bolesti u jednom određenom vremenskom periodu i računa se obično za godinu dana. O (OL) - sva Stopa prevalenci je = ⋅ 100 S Prevalencija je indikator raširenosti jednog oboljenja u zajednici i služi za ocenu njegovog socijalnomedicinskog i epidemiološkog značaja. Prevalencija
dobija se iz odnosa broja slučajeva oboljenja ili obolelih osoba i broja stanovnika izloženih dotičnoj infekciji. O (OL) MB r = ⋅ 100 Seksponiran Pokazatelj rizika oboljevanja
Letalitet – računa se ako želimo da saznamo o fatalnosti oboljenja tj. koliko se oboljenja završava
smrću. L=
U (umrli) ⋅ 100 O (oboleli)
Prosečno trajanje bolesti izračunava se iz zbira ukupnih dana bolovanja i broja obolelih.
Prosečro trajanje bolesti =
zbir svih dana trajanja bolesti ⋅ 100 broj obolelih
Apsentizam –
predstavlja broj slučajeva privremene nezaposlenosti (sve bolesti i povrede) u odnosu na ukupan broj zaposlenih. 19
Invaliditet –
izražava broj trajno nesposobnih zbog bolesti/povrede u odnosu na ukupan broj
stanovnika.
27. Uticaj mehaničkog na prirodno kretanje stanovništva Migracije
Predstavljaju mehaničko kretanje stanovništva. broj iseljenih lica ⋅ 1000 broj stanovnika broj useljenih lica ⋅ 1000 Imigracije – stopa imigracije E i = broj stanovnika
I Emigracije – stopa emigracije E m =
II Spoljašnje (preko državnih granica) Unutrašnje (unutar državnih granica) III Privremene (do 1 godine boravka) Trajne (preko 1 godine boravka) Uticaj mehaničkog na prirodno kretanje stanovništva EMIGRACIONO
↓ ↑ ↓
20
Natalitet, fertilitet, reprodukcija Mortalitet Prirodni priraštaj
IMIGRACIONO
↑ ↓ ↑