Д
.Ч зТ
е
Х М '• У
^ у а м \п ^ \^ ^
~^_
ДЕО ДЕО II СТАТИСТИЧКО ЗАКЉ^ЧИВАЊЕ
ЛАВА 4 О сн о Ш ЈГ стати ст с ти ч к и п о јм јм о ви ви П отреба отреба за упоз уп ознава навањ њ ем са проц пр оцедурам едурам а ста статистич тистичког ког закљ учивањ чи вањ а од стран стране' е' они он и х чиј чи је је стру стручн чно о ин и н тересова ересовањ њ е вез везано за географ еограф и ју је при пр и личн ли чно о очи оч и гледно. Д руш ру ш твсн твсн а геог географ раф и ја је нера н ерас скиди кид и во везана везана са статист татисти и чким чки м ан ализа лизам а. Ш тавиш е, први евидентира видентирани ни ст статистички истички пост поступци познат познати и у ист и стори ориј ји били би ли су пописи попи си ста стан н овниш овни ш тва у ст старом Е ги пту. М еђутим ђутим , саврем саврем ена ф и зи чка чк а географ еограф и ја се такође не м ож е зам ислити ислити без прим при м ене стат стати и сти сти чких чки х пост п оступ упак ака а у свој својим и страж страж и вањ им а. Где би било м есто ст статистичком атистичком закљ учивањ у у оквиру оквиру ф и зи чке географ еограф ије? П очним очни м о од крет к ретањ ањ а небе небес ских тела. тела. С ве ш то је данас исказ исказано у ф орм и закона акон а о крета кретањ њ у неб н ебес еских ких тела тела нас н аста тало ло је на на основ основу у ст статистички истичких х посм п осм атрањ а и за закљ учивањ учивањ а. Д аљ е, рудна наналази лази ш та, та, квали тет тет руде и предви п редвиђањ ђањ а у вез вези са веком веком експлоатаксплоатације такође су прои пр оиз звод ста статист тисти и чког чко г посм по см атрањ атрањ а и закљ закљ учи вањ а. Зати Зати м , клим кли м а, сас саста тав в тла, квали тет тет вода, вода, сали салин н и тет тет м ора ор а и тако тако даљ е су предм п редм ет п роучавањ роу чавањ а ф и зи чке геог географ раф ије, ије, а м етодологиј етодологија и зучав уч авањ ањ а подраз под разум ум ева изм еђу оста осталог и ста статисти тисти чке поступке. поступке.
4 .1
оп ул ац
а,
ел еж
е, 1••
С тати сти к а је наука н аука која се се бави бави п роучавањ роучавањ ем скуцова куц ова са са ве велики ли ким м број бро јем елем ената, кој ко ји су једноЈз едноЈзодни одн и у одно од носу су на н а једн о или и ли виш е свој својстав става. а. О сновни новн и поја појам статистике тистике је п о п у л ац и ја. П опулаци ја је скуп елем ената ената чиј чи ја зај заједн и чка својства ства проу пр оучавам чавам о стат стати и стичким ич ким м етодам а. П опулаци оп улациј ју м огу огу чини чи нит ти св сви. становни становници ци С .рбиј .рбије, све реке реке одређеног одређеног слива, слива, сви ст студенти П рирод ри родн н о-м атем тем атичког тичко г ф а67
68
СТАТИСТИКА
култе кул тета та у Н иш у, календ календарс арске ке године године од од инт ин тереса реса за ан ан ализу, ализу, насе насељ а V С рбији итд. итд. П осм атран атрано о заједни едн и чко чк о свој својство ство елем ената п опулац оп улаци ије зове зове се се о б ележ ел еж је. Н а једној дн ој попула поп улациј цији, и, тј. на сваком ваком њ еном елем елем енту, м ож е се се п осм атрат атрати и једно едн о својство, ство, али се м огу огу посм п осм атрати атрати и виш е својстава става истоврем истоврем ено. У коли кол ико се се п осм атра атра сам само о једн о својство, ство, онда се каж каж е да је реч реч о једн ед н о д и м ен зи о н алн ал н о м обеле обележ ж ју. У слулучају да д а се се посм по см атрај атрају два д ва или и ли виш е свој својстава става истоврем стоврем ено, онда он да се се за обеле обележ ж је ка каж е да је виш еди м енз ен зи он алн о. Н еке популациј поп улације и обележ ја посм по см атрана атрана на њ и м а дата су су сле следе де-ћим примерима. П р и м ер 33. П опулациј опулацију у чини чини сви становници С рбије. М огу огу се посм по см атрат атрати и следећа обележ ја: пол, стру стручн чна а спрем а, брачни стат статус, ус, старо старост ст итд. □ П р и м ер 34. П опулациј опулацију у чине све реке реке црном орског орског слив слива а. П осм атрана атрана обележ ја м огу огу бити: бити: водост водостај, дуж ду ж и н а реке реке,, те тем перапература воде воде,, протиц п ротица ај, елект електроп ропроводљ роводљ ивост итд. □ П р и м ер 35. 3 5. П опулациј опулацију чине св сви турист туристички ички објекти кти у С рбији. М огу огу се се посм атрат атрати и следећа следећа обележ обележ ја: врста врста тури сти сти чког чк ог објекта екта,, бројтур број тури и ста који су посе п осет ти ли тури ур и сти сти чки објекат екат у одређ од ређеиом еиом вреврем енском нском периоду, капацит капаци тет туристичког туристичко г објекта кта, квали тет тет пруж ене услуг услу ге итд. □ П р и м ер 36. А ко популациј популацију чине насе насељ а у С рбији, тада тада се се м огу огу п осм атрат атрати и следећа ледећа обележ обележ ја: број број становни но вника, ка, тип тип насе насељ а, површ ина ин а подручј под ручја итд. итд. □ П р и м ер 37. П опула опулациј цију чине чине сви рудници рудници угљ угљ а у С рбији. О бележ ја од инт ин тереса реса за проучава пр оучавањ њ е би била: била: врста врста угљ угљ а, зали залихе хе угљ угљ а, тј. количи коли чин н а угљ угљ а на ге геолош ком локалите локали тету ту сва сваког ког пој по једина един ачног чн ог рудника рудни ка,, м иним ин им ална лн а дубин дуб ина а н а кој којој се н алаз алази угљ угљ ени слој, про- ■ цењ ен век експ експ лоат лоатаци ациј је и сличн ли чно. о. □ У зависности ависн ости од о д тога тога како како се реги реги стру струј ју вредности вредн ости обележ ја, обеле обележ ж ја м огу огу бити бити кван кв ан ти тати вн а и квал кв али и тати вн а. В реднос редност ти
П О П У Л А Ц И ЈЕ , О Е Е Л Е Ж ЈЕ , У ЗО Р А К
69
квантитативних обележ ја се региструју као бројеви, тако да се ова ■обележ ја називају још и н ум ери чки м об ележ ји м а. П рим ери квантитативних обележ ја су: водостај реке, старост становника, тем пература воде, број туриста итд. В редности квалитатитивних обележ ја се региструју као ненум ерички подади, те се ова обележ ја називају и н ену м ери чк и м об ележ ји м а или атриб утим а, односно атри бу тивн и м об ележ ји м а. П рим ери квалитативних обележ ја су: пол становника, брачно стаљ е, ш колска спрем а, врста туристичког објекта, врста угљ а итд. И ако су квали тативн а обележ ја по својој природи ненум еричка, она се м огу регистровати као бројеви и такав поступак се зове кодираи ве. Значи, кодирањ е би био поступак превођењ а вредности ненум еричког обележ ја у бројеве. К одирањ е се м ож е врш ити на разне начине, тј. придруж ивањ ем различитих бројева квалитативним својствим а. Н а прим ер, пол становника им а две м огуће вредности: м уш ки и ж енски. Један од начина кодирањ а би м огао да буде да се особи м уш ког пола додели број 1, а особи ж енског пола број 2. М еђутим , исти поступак би се м огао спровести и прим еном бројева 0 и 1 редом , или неких других. Д акле, кодирањ е ненум еричких обележ ја бројевим а, по правилу, нем а суш тинске везе са вредностим а обележ ја. П рем а броју различитих вредности које м огу им ати, обележ ја м огу бити такође различита. П роучаваћем о д и скретн а и апсолутн о н еп реки дн а обележ ја. Д искретна обележ ја узим ају кон ачн о м ного или п реб ро ји во бескон ачн о м ного вредности, док.апсолутно непрекидна обележ ја узим ају н еп реброји во бескон ачн о м ного вредности. Н енум еричка обележ ја су, по правилу, дискретна, док нум еричка обележ ја м огу једнако бити и дискретна и апсолутно непрекидна. Т ако на прим ер, обележ ја дискретног типа су пол испитаника, врста угљ а, стручна спрем а, број сунчаних дана у току посм атране године, док су обележ ја апсолутно непрекидног типа тем пература воде, водостај, количина падавина, висина снеж ног покривача итд. О сновни задатак статистике је: за дату п оп улац и ју н аћи расподелу посм атрано г обележ ја на њ ени м елем ентим а. М еђутим , ово најчеш ће није једноставно, а некад за проучавањ е популације прем а одређеном обележ ју и није неопходно знати тачну
70
СТА ТИ СТИ КА
•
расподелу обележ ја, већ је довољ но знати само нска њ ена својства. П о правилу не проучава се дела популација, тј. ке. посм атрају се сви елем енти популације да би се одредила расподела обележ ја. Н аим е, популација м ож е бити велика, тако да би проучш зањ е свих. њ ених елем ената захтевало доста врем ена и новца илИ непребројива па би то било нем огуће (на прим ер вода у реци, сливу, језеру итд) или би утврђивањ ем вредности обележ ја на свим елем ентим а популације дош ло до униш тењ а популације (нпр. ако би се посм атрао ж ивотни век произведених сијалица). Зато се из популацијо на случајан начин издваја један њ ен део који ее даљ е проучава и на основу њ ега се доноси закљ учак за целу популацију. И здпојепп део зове се узорак . У колико је узорак такав да се па основу њ ега м ож е донети закљ учак за целу популацију, онда је он: реп резен-. тати ван . И здвојени узорак увек им а коначан број елем ената п тај 'број елем ената се зове об им узорка. . 4.2
тр ат ег
е
б
а уз
Раније смо рекли да из популације издвајам о један њ еп део који см о назвали узорком . С ам узорак се можс. на виш е начипа издвојити из популације. Н ачин и здвајањ а узорка из популације се зовс стр атеги ја и збора узорка. П остоји виш е стратегија избора узорка. Н ајчеш ће прим ењ иване стратегијс су: случајн и , периоди чн и, страти ф и ковани , групн и и виш еетапн и узорак. 4.2.1
С луч ајн и узорак
С лучајни узорак се ф орм ира помоћу табли ц е случ ајн и х бројева. Т аблицу случајних бројева чине декадие циф рс порсђане у низ, које су добијене разним техникам а које гарантују случајпост, нпр. рулетом . Ц иф ре су у таблици груписане обично по дпс или пст заједно, ради лакш ег читањ а. Ч итањ е из таблице се м бж о врш нтп на виш е нанина, с лева на десно, с десна на лево, иаш мпс, иапиж с или слично, али унапред одређеним поступком . Једап Д ео таГхчпцс случајних бројева приказаи је у табели 4.1. Т аблица случајних бројева м ож е да се користи сам о ако се зиа
71
С Л У Ч А ЈН И У ЗО РА К
број елем ената популације, односно ако је популација коначна. У том случају се популација најпре уреди тако ш то се сваком елем енту популације додељ ује тачно један природан број. Једн а приме.на таблица случајних бројева дата је ирим ером 38. .51772 24033 45939 30586 03585 64937 15630 09448 21631 91097
74640 42331 23491 83587 60173 52078 02133 75797 79353 81938 03355 98683 64759 51135 56301 57683 91157 77331 17480 29414
29044 06568 25424 45406 82322 20790 98527 30277 60710 06829
46621 21960 11645 31041 96799 65304 62586 94023 52290 87843
Т абела 4.1: Д ео таблице случајиих бројева.
П ри м ер 38. П осм атра се популација од 100 елем ената н треба ф орм ирати случајни узорак од 5 елемсиата. За ф орм ирап.е с-лучајног узорка користићем о таблицу случајних бројева. Д овољ по јс да читам о по две циф ре и оне ће представљ ати редии број елсм спта популације. П ри том е, ако се јави 00, онда ћем о узети- 100-тн слсм ент популације у узорак, ако се јави 01, узећем о први елсм!!пт. ако се јави 10, узећем о десети елем ент итд. Рецим о да узим амо бројсмс из првог реда и то с лева на десно. Т ада добијам о слсдећс бројено 51, 77, 27, 46 и 40. П рем атом е, из популације узим ам о слом сптс са редним бројевим а 51, 77, 27, 46 и 40, и од њ их ф орм ирам о случајпп узорак обим а 5. □ П ри м ер 39. Број дом аћинстава (у хиљ .) 1971. године■за опш тппс са уж е територије С рбије (50 опш тина) био је: 5, 33, 9, 13, 13, 3(1. 15, 42, 16, 23, 5, 8, 2, 29, 5, 3, 10, 9, 5, 5, 5, 4, 8, 3, 5, 4, 4, 5, 17, 56, 8, 19, 9, 7, 29, 19, 8, 2, 13, 5, 6, 33, 44, 32, 45, 41, 7, 14, 12, (И звор С тат год Југ 1976., стр. 564). К ористећи бројсис ич
72
СТАТИСТИКА
таблице случајних бројева, почевш и од првог реда с лева на десио. ф орм ирати случајни узорак обим а 6. Р еш ењ е. П опулација им а укупно 50 елем ената. Д овољ но је да читам о по две циф ре, али при читањ у нећем о узим ати у обзир бројеве 00, 51, 52, ..., 99.. Ч итањ ем циф ара из таблице случајпих бројева добијам о следећи низ бројева: 51 (одбацује се), 77 (одбацује се), 27, 46, 40, 42, 33 и 12. Т ако из популације узим ам о елем енте са редним бројевим а 27, 46, 40, 42, 33 и 12 и од елем ената ф орм ирамо узорак. Д обијени случајни узорак обим а 6 је 4, 41, 5, 33, 9, 8. □ С лучајни узорак се м ож е остварити на два начина: 1. И звуче се један елем ент из популације, бележ и се вредност посм атраног обележ ја на њ ем у, а затим се враћа назад у скуп. О вако ф орм ирани случајни узорак се зове слу чајн и узорак са вр аћ ањ ем . К арактеристика оваквог у зо р кГ јГ тап тГ се Један исти елем ент популације м ож е виш е пута појавити као елем ент једн ог истог узорка. 2. И звуче се један елем ент из популације, бележ и се врсдност обележ ја на њ ем у, али се сада овај елем ент не враћа у основни скуп. О вако ф орм ирани узорак се зове слу чајн и у з о ,.вра1јан.а. П оступак ф орм ирањ а случајиог узорка без враћањ а обим а је еквивалентан истоврем еном извлачењ у свих елем ената популације у узорак. 4.2.2
П ериоди чни узорак
П ериодични узорак такође захтева уређеиост еле.м еиата популације и из низа се бирају елем енти на истом разм аку, ппр с-вакн пети, десети итд. И збор елем ената зависи од броја елем еиата поп\лације и обим а узорка. Н а прим ер, посм атра се популацнја од Ш елем ената и ф орм ира се узорак од 15 елем ената. С обзнром да је 114 : 15 = 7,6, то се м ож е бирати сваки осми елем еит поихлације лоче-ш и од првог или евентуално од другог да би се добило тачко 15 елем ената у узорку. П ериодични узорак им а одређепе предиостп у односу на случајни узорак. П рво, једноставно се ф орм ира и за њ огово ф орм ирањ е није потребна таблица случајних бројева. Д ј,У г о ,
С Т РА Т И Ф И К О В А Н И У ЗО Р А К
73
ом је равном ерно распоређен по популацији. М еђутим . он пеће бити репрезентативан уколико је уређењ е елем ената популацнје у вези са посм атраним обележ јем . П ри м ер 40. П осм атра се група студената треће године и бележ и се колико година им ају. Д обијене године старости су: 22, 21, 20, 23. 22, 24, 25, 21, 22, 23, 21, 22, 21, 23, 22, 22, 21, 25, 21, 26, 23, 21, 22, 21, 21. Ф орм ирати периодични узорак обим а 6 узим ајући сваки четврти елемент почевш и од: а) првог, б) трећег елем ента популације. Р еш ењ е. (а) П очињ ем о од првог елем ента и узим ам о свакп четврти елем ент [22], 21, 20, 23, [22], 24, 25, 21, [22], 23, 21, 22, [ГГ]. 23, 22, 22,1211, 25, 21, 26, 23 |, 21, 22, 21, 21. У том случа.ју добијепп учорак обим а 6 је 22, 22, 22, 21, 21, 23. (б) П очињ ем о од трећег елем ента и поново узим амо сваки четнрти елем ент 22, 21, ПГсП, 23, 22, 24, [25], 21, 22, 23, [Г П 22, 21, 23, 221, 22, 21, 25, 211, 26, 23, 21, 22 21, 21. У том случају добијенн узорак обим а 6 је 20, 25, 21, 22, 21, 22. □ 4.2.3
С тратиф и кован и (слојевит) узорак
К од стратиф икованог узорка популација се дели на дисјупктне делове по неком правилу које олакш ава испитивањ е. Тнчннје. тако да део популације унутар сваког слоја буде хом оген по поком својству. Н а прим ер, становници се могу поделити према томе дн ли ж иве у граду или у селу, путеви прем а значају, л>уди п|н>мн полу, рудници угљ а прем а врсти угљ а итд. О вако пасталп .целопп популације зову се стр атум и или слојеви. И з сваког стратум а се на с-лучајан начин бира унапред предвиђени број е.не.мспатп п тако се ф орм ира стратиф иковани узорак. У зависностп од тога колико се елем ената бира из сваког стратум а, разликују се два тппа стратиф икованог узорка: равн ом ерн и и проп орц ион алн и. К од равном ерног стратиф икованог узорка се из сваког стратум а бпрп исти број елем ената (уколико то није м огуће, онда се узим а прпближ но једнак број елем ената), док се код пропорционалног стратиф икованог узорка из сваког стратум а узим а бројелем епата стратум а који је пропорционалан величини стратум а.
74
СТАТИСТИКА
П ри м ер 41. М еђу становницим а једног града се врпги апкста о том е колико су задовољ ни условим а ж ивота. Грађани Су иодсл,еии У ТРИ гР7пе прем а дуж ини ж ивота у граду, и на основу псп.гтвањ а се зна да 15% грађана ж иви у граду до 5 година, 25% ж иви виш е од 5, а мањ е од 10 година, док 60% ж иви 10 или виш е година у граду. Т реба ф орм ирати узорак обим а 300. У колико ж елимојда"ф ормирам о равном ерни стратиф иковани узорак, тада ћем о из сваког стратум а узим а по исти број елем ената, тачније 100 елем ената (обим узорка делим о бројем стратум а). У колико ж елим о да ф ормирам о пропорционални стратиф иковани узорак, тада ћем о из првог стратум а узети 300 ■0,15 = 45 елем ената, из другог 300 •0,25 = 75, а из трећег стратум а узећемо 300 • 0,6 = 180 елем ената. □ 4 .2 .4
у ш
ш
у з
а к
Групни узорак такође захтева могућност поделе популације на дисјунктне делове, али не захтева да делови .буду хом огени по било ком својству. Д исјунктни делови популације се у овом случају зову груп е. За разлику од стратиф икованог узорка код кога је из сваког стратум а узим ан одређеи број елем ената, код групног узорка се не узим ају све групе, већ се бира сам о одређени број група и то на случајан начин, па се из изабраних група узим ају сви елем енти (видети слику 4.1). П редност групног узорка у односу на стратиф иковани узорак је та ш то се групни узорак дббија једноставније и брж е, док је предност стратиф икованог та ш то стратиф иковани узорак даје бољ у слику о.популацији.
Н
1*
4« ‘5
•3
• 6 7. •»
*9
•».14
«1»
, II
12•И * .17
• 15
П опулација
П рр ___ •6 7|01 __ ’_ Ј>__ •П •!« •» 1-И
р.1 п2*----*•33
С тратиф иковани узорак
Групви Групни узорак узорак
..
__ ______ •16.Ј7 •и.и*|(‘П •» М4 .1•.115 •1:!1_њ » ц ,
.
С лика 4.1: П рим ер стратиф икованог и групног узорка.
В И Ш Е Е Т А П Н И У ЗО Р А К
4.2.5
/ I
В иш еетапн и узорак
В иш еетапии узорак се креира у виш е етапа. П опулација се дели па отратум е. ови на нодделове и тако редом зависно од снтуације. Н а прим ер, град се дели на опш тине, опш тине на месне заједнице, месне заједнице на улице, улице на куће итд. П рим ер виш еетапног узорка је следећи двоетапни узорак. У првој етапи двоетапног узорка бира се одређени број група, а затим у другој етапи из одабраних група бира се само одређени број елем ената па елучајан пачин. В иш еетаини узорак се користи у ситуацијама када стратум и им ају велики број елемената. 4.3
б
р
тача
а
а тл а у уз
ак
К од анализе сливова, путне м реж е, неких геолош ких иетраж иваљ а и сличио, иотребан је избор тачака са тла. тј. са нског дела површ ине Зем љ е. То значи да је потребно пзврш ити избор узорка из дводим ензионалН ог простора. И збор тачака м ож е бити случајан, п ериод и чн и , страти ф и кован и и груп ни . У свим елучајсвнм а ее посматрана област са тла прекрије. м иним алннм правоугаоником , а затим се врш и избор тачака унутар тог правоугаоника. П о правилу посм атрана област није правоугаона. У том случају треба водити рачун а да се у узорак узим ају сам о оие случајно изабране тачке правоугаоника које припадају посм атрапој области. С лучајн и и збор тач ака м ож е да се сим улнра таблпцом с.пучајних бројева. То се постиж е натај начин ш то се парови изабраппх случајиих бројева користе као координате тачака са тла. П ри м ер 42. Ради испитивањ а наф тног богатства једне маљ е пуетињ ске регије планира се отварањ е буш отина за наф ту па 8 елучајно одабраних тачака неиспитаног зем љ иш та. С вака тачка се па карти представљ а својим координатам а (мереним од дољ ег леиог угла). П рецизност м ерењ а је до 10т, а област је облика квадрнтн педпчине ) х 1 00 . те је укунап бројтачака (обим попудацпје) у којим а би се м огле наћи буш отине 108. Заиста, доњ а ивнци је ж ине 100А"т,, а на сваких 10тп налази се један елемент популацпје
76
СТАТИСТИКА
координата, те је укупан број елемената популације координата 100 т
100 • 1000т 10000 10 10т Н а иети начин популација координата им а такође 10000 елемената. С ада из таблице случајних бројева ф орм ирам о групе од по 4 циф ре које ће представљ ати х-координате (ако се појави 0000, то ће т координата бита.О Л ш , ако се појави 1045, то ће координата бити 10,45А :т итд.) и добијамо следеће координате: 51,77; 27,46; 40,46; 33,12; 90,44; 46,62; 12,40 и 33,23. Н астављ амо узим ањ е случајних бројева, али-..с^.да..од њ их ф орм ирам о коордипате: 49,18; 35,87: 06,о6, 82,19, (бц,/|5;. 93,96; 01,73 и 52,07. Тако емо добили следећг там ке ( .јј): =
тачка 1 2 X ‘ 51,77 27,46 49,18 35,87 V
3 40,46 06,56
.
4 5 0 33,12 90,44 46,62 82,19 60,45. 93,96
7 8 12,40 33,23 01,73 52,07
Распоред тачака приказан је на слици 4.2. □
100
“6 .4
80
5
60 •
40
8 •2
20 ,7
0
3
•
20 40
60 80
100
*
С лика 4.2: С лучајно одабрапе тачке. П ри м ер 43. Н а случајан начин бирамо 5 тачака из облцетп иа слици 4.3. У потребим о двоциф рене бројеве редом нз 6. врсте таблпцс на стр. 71 за ф орм ирањ е координата, при чему Гш 24 ирсдсгпш ■љати број 2,4, 37 број 3,7 итд., и двоциф реме бројеш « пч 8. нрстс таолице за ф орм ирањ е координата. Д обијам о сш едеће тачке:
И ЗБ О Р Т А Ч А К А С А Т Л А У У ЗО Р А К
тачка
5 5,5 0,1
±
6,4 0,9
9,3 7,0 4,4 8,5
3,3 6,3
6 7 9,8 6,8 5,7 6,8
8 9 3,2 0,7 3,3 0,2
Тачко са редним бројевим а 1, 2, 3 и 5 се одбацују, јер не припадају ш раф ираној области. □ 10 8
6 4 2
0
2
4
С лика 4.3: С лучајно одабране тачке из области која инје квадратнд, С лучајни избор тачака м ож е се остварити и на следећи начнп. Н ајпре се врш и случајан избор тачака на страницам а квадрата плп правоугаоника. Затим се од сваке две случајно изнбране тачке са различитих ивица ф орм ирају линије унутар квадрата. Н а крају с<« о.ч нресечпих тачака линија ф орм ира узорак (слика 4.4).
С лика 4.4: С лучајни избор линија. П ери оди чн и и збор тач ака се успеш но примењ ује за пчбир тачака 'по квадратној м реж и. Т ачке се М 01’у бирати на чворш ш м а
78
СТАТИСТИКА
м реж е (слика 4.5а), или се координате једне тачке одређују преко таблице случајних бројева, а остале се узим ају иа истом разм аку (слика 4.56).
С лика 4.5: П ериодични избор тачака. С трати ф и ко ван и и збор тач ака остварује се иа следећи начин. П осм атрана област се дели на м ањ е целине хомогејне по неком својству (врста зем љ иш та, н адм орска висина и слично) из којих се на случајан начин бира одређени број тачака у узорак. С тратиф иковани избор тачака подразум ева избор одређеног броја тачака из сваког стратум а, те ом огућава равном ерну расподелу узорка по Ж ЈС .матрапом дслу тла (слика 4.0). ;
С лика 4.6: С тратиф иковани избор тачака. Г руп н и и збор тач ак а се остварује на следећи начин. П осм атрана област се дели на м ањ е целине, најчеш ће правилног облика. рецим о квадрата или правоугаоника истих дим ензија који им ају улогу група. У зорак се ф орм ира тако ш то се иа случајан начин изабере одређен број група, а затим се из сваке групе узим ају сви елем енти, тј. цео део тла обухваћен изабраном групом . .
П Р И К А ЗИ В А Њ Е П О Д А ТА К А
7,9
И код избора тачака са тла м ож е се прим ењ ивати виш еетапни узорак.
4,4
аз
ањ е
одатак
П риказивањ е података представљ а другу етапу статистичког проучавањ а. П рикуцљ ени подади се представљ ају на два основна начина: табл и чн о и граф и ч ки . К од табличног м етода прикупљ ени подаци се сређују и приказују у облику табела, док се код граф ичког м етода прикупљ ени подаци илуструју разним граф иконим а, дијаграм им а, картам а итд. П рилиК ом граф ичког приказивањ а узорка најчеш ће се полази од табела у које је узорак претходно сређен. 4.4.1 Т абли чни м етод п ри кази вањ а под атака К ао ш то см о рекли, код табличног м етода прикупљ ени. подаци се приказују у облику табела. П риказивањ е прикупљ ених података зависи од броја разли чи тих реализованих вредности обележ ја. У кблико је број различи тих реализованих вредности м али, поступак је следећи: 1. Н ајпре се добијени подаци поређају у вар и јац и он и н и з, тј. у низ у ком е је сваки следећи елем ент већи од претходног или м'у је једнак. : г
2. Затим се уоче све разли чи те реализоване вредности и од њ их се ф орм ира табела, при чем у се реализоване вредности наводе у растућем редоследу. 3. Н а крају се уочава колико се цута свака вредност јави ла и број појављ ивањ а сваке вредности се уноси у табелу. Н аведени поступак сређивањ а података се најчеш ће користи за сређивањ е података из узорака дискретних обележ ја. Број појављ ивањ а неке реализоване вредности је ап солутн а учестан ост или ф р ек вен ц и ја те вредности. А псолутна учестао с т и ,- о з н а ч а в се са / . :• ност в р
80
СТАТИСТИКА
П ретпоставим о да у узорку обим а им а различитих вредности Х/ < '2 < ' ■• < ' и нека СУ њ ихове апсолутне учестаности редом / 1, 2, ■• А - Н апом еним о да збир свих апсолутних учестаности м ора бити једн ак обим у узорка, тј. ако узорак им а елем ената и ако у узорку им а /с различитих вредности, тада м ора бити Д + / 2 + • ■• + Л = п Т абела којом се представљ ају подаци је облика: Реализоване вредности обележ ја А псолутне учестаности
л
%2 1
У купно /к
О сим апсолутних учестаности м огу се посм атрати и р елати вн е учестан ости . О не се означавају са /* и деф иниш у као количник •/? = - , * = 1 ,2 ,...,* . П рем а том е, релативне учестаности добијам о тако ш то сваку апсолутну учестаност поделим о обим ом узорка. Н апом еним о да збир свих релативних учестаности м ора бити 1. Релативна учестаност / показује колики део од укупног броја елем ената поседује вредност П остоје и зби рн е учестан ости. Зову се још и ку м улативн е ф реквен ц и је, а м огу бити ап сол утне и релати вн е, у зависности од тога к0Је се учестаности посм атрају. А псолутна збирна учестаност вредности означава се са Е Л и деф иниш е се као збир апсолутних учестаности Д , / 2, ... , /„ Н а прим ер, апсолутна збирна учестаност вредности т 3 једн ака је Л + / 2 + / 3. С лично се м ож е деф инисати и релативна збирна учестаност. Релативна збирна учестаност вредности гг4 се означава са Е Л * и деф иниш е као збир релативних учестаности /*, / 2‘, .. , /*. Н а прим ер, релативна збирна } ш станост вредности једнака је /* + /* + /* + /* П ри м ер 44. Д ат је број киш них дана у м есецу јулу у м есту А у току 20 година: 5, 6, 8, 10, 9, 8, 4, 7, 7, 3, 6, 4, 8, 7, 6, 6, 5, 3, 6, 6. Ф орм ирати табелу -апсолутних, релативних и збирних апсолутних 11 релативних учестћности броја киш них дана.
Т А В Л И Ч Н И М Е Т О Д П РИ К А ЗИ В А Њ А П О Д А Т А К А
81
Р еш ењ е. П осм атрано обележ је је број киш них даиа у мес.ецу ЈУЛУ. а посм атрано је у току 20 година, те је апсолутна учестаност број година са одређеним бројем киш них дана. У зорак им а 20 елем ената и у узорку им а 8 различитих вредности: 3, 4, 5, 6, 7, 8, 9 и 10. Њ ихове апсолутне учестаности су редом : 2, 2, 2, 6, 3, 3, 1 и 1. Рекли см о да се релативне учестаности добијају тако ш то се .апсолутне учестаности поделе обим ом узорка. У овом прим еру обим узорка је 20, те су релативне учестаности редом: 0,1; 0,1; 0,1; 0,3; 0,15; 0,15; 0,05 и 0,05. Збирне апсолутне учестаности су редом: ==
2,
Е /2
==
2 + 2 = 4,
Е /з
==
2 + 2 + 2 = 6,
Е /4
==
2 + 2 + 2 + 6 = 12,
Е /в
==
2 + 2 + 2 + 6 + 3 = 15,
Е /е
==
2 + 2 + 2 + 6 + 3 + 3 = 18,
Е
==
2 + 2 + 2 + 6 + 3 + 3 + 1 = 19,
==
2 + 2 + 2 + 6 + 3 - 4 - 3 4 - 1 -1 - 1 = 20
Е
/ 1
/?
Е /в
док су збирне релативне учестаности једнаке: Е /Г
= 0, 1,
Е Л
=
0,14-0,1 = 0,2,
Е /з
=
0,1 + 0,14-0,1 = 0,3,
=
0,14-0,1 + 0,1 + 0,3 = 0,6,
/4
Е
Е
/
=
0, 1
+
0, 1
+
0,1 4- 0 , 3 + 0,15
=
0 , 75 ,
Е /б
= 0,1 + 0, 1 + 0,1 + 0,3 + 0,15 + 0,15 = 0,9,
Е /Г
= 0,1 + 0,1 + 0,1 + 0,3 + 0,15 + 0,15 + 0,05 = 0,95,
Е /з
= 0.1 + 0,1 + 0,1 + 0,3 + 0,15 + 0,15 + 0,05 + 0.05 = 1
.
С ада м ож ем о ф орм ирати табелу учестаности броја киш них да-
82
СТАТИСТИКА
Бр. киш них дана
Л Л* л ЕЛ *
3 2 0,1 2 0Д
4 2 0,1 4 0,2
5 2 0,1 6 0,3
6 6 0,3 12; 0,6'
7 3 0,15 15 0,75
8 3 0,15 18 0,9
9 1 0,05 19 0,95
10 ; 1 0,05 20 1
, 20 1 / /
У колико у узорку постоји велики број различитих вредности, тада се подаци сређују по интервалим а. П оступак сређивањ а података по интервалим а се зове и н тервалн о сређи вањ е п одатака и састоји се у следећем. Н ајпре се одређује број интервала. С ам број интервала зависи од броја података и постоји виш е ф орм ула за одређивањ е броја ин тервала. Н а прим ер, за одређивањ е броја интервала м ож е се користити следеће правило: препоручује се најм ањ е 1 + 3,3221о§10 7г интервала и највиш е 51о§10п ин тервала, где је п обим узорка. Зн ачи, ако са означим о број интервала, тада задовољ ава неједначине 1 + 3,322 1о § 10 п < к < 5 1о§10 . И нтервално сређивањ е података се најчеш ће користи за сређивањ е података из узорака обележ ја апсолутно непрекидног типа. П ри м ер 45. П осм атрам о узорак обим а 40 и ж елим о да одредимо број ин тервала. О вде је узорак обим а = 40, тако да најм ањ е м ож ем о узети 1 + 3 ,3221о§10 40 = 6,322 интервала, односно најм ањ е 7 интервала, а највиш е 51о§1040 = 8,011 ин тервала, односно највиш е 8 интервала. □ Д аљ е се одређује дуж ин а интервала по ф орм ули % х
%
— *— ' где су •^ 'И ^т највећа и најм ањ а вредност у реализованом узорку. Н а крају се врш и пребројавањ е елем ената по ин тервалим а и ф орм ира се табела. П ри м ер 46. У једном граду је у току 40 година м ерена средњ а тем пература ваздуха у ° у месецу априлу. Д обијене су следеће вредности по годинам а:
I
Т А БЛ И Ч Н И М Е Т О Д П РИ К А ЗИ В А Њ А П О Д А ТА К А 12,07 12,06 12,00 , 12,09 [12,86 13,81 13,15 13,06
13,94 14,21 14,04 14,07 13,96 15,04 14,91 14,94
15,00 15,03 15,56 15,92 16,07 15,92 16,01 16,93
83
17,22 18,10 16,94 18,42 16,96 ■19,26 17,06 19,31 16,87 19,44 17,54 20,00 18,02 14,08 18,01 14,04
И нтервално средити дате податке. Р еш ењ е. У зорак им а 40 елем ената. Н а основу претходног прим ера, табела која се ф орм ира м ож е им ати 7 или 8 интервала. Н ека је рецим о број интервала 8 ( = 8). Н ајниж а средњ а тем пература била је 12°С , док је највиш а била 20°С . Т ада је дуж ина сваког интервала , 20 -1 2 . = — —
1-
П рем а том е, ф орм ирам о табелу са 8 интервала: [12; 13), [13; 14), [14; 15), [15; 16), [16; 17), [17; 18), [18;-19) и [19; 20]. И нтервал [о,6) садрж и све бројеве изм еђу и 6, укљ учујући о, док интервал [о, 6] садрж и све бројеве изм еђу и 6, укљ учујући и и 6. П ребројавањ ем колико се пута у узорку реализовала тем пература у сваком од деф инисаних интервала добијамо следећу табелу: [14; 15) ■ ш 7 0,175 17 0,425
[15; 16)
5 0,125 5 0,125
[13; 14) -ни5 0,125 10 0,25
[17; 18) III 3 0,075 32 0,8
[18; 19) 1111 4 0,1 36 0,9
[19; 20] 1111 4 од 40 1
Е
Т ем пература Број година /< /<* Е /< Е /*
[12; 13)
Т ем пература Број година /< /' ' Е /< Е/<*
\
6 . 0,15 • 23 0,575
40 1 / /
[16; 17) Ш Н 6 . 0,15 29 0,725
84
СТАТИСТИКА
_ 1>валитативна обележ ја се такође м огу табеларно сређивати.
За ређи вањ е се гтримењ ује поступак кориш ћен код сређивањ а узорака Ра м алим бројем различитих вредности. П ри м ер 47. За један водоток деф инисани су распони ниских (н) средњ их (с) и високих (в) водостаја. У току 24 м есеца осм атраљ а водостаја, просечни м есечни водостаји регистровани су као следећи низ: н, н, с, в, с, с, с, н, в, в, с, с, с, н, в, в, в, с, в, н, н, с, в, с. Ф ор,м ирати табелу апсолутних и релативни х учестаности водостаја. ^еш ењ е. \ узорку постоје три различите вредности н, с и в. П ребројавањ ем добијам о следећу табелу: В одостај н с 4-14- 1 1 § § В рој водостаја 4 Тпг 6 10 и 0,25 0,42 п
в Ш
г.
III
8 0,33
24 1
У колико се посм атрају два обележ ја X и У истоврем ено тј на елем ентим а истог узорка (која су м огуће зависна), тада табела м ож е бити облика Х \У XI
Х \У
л
/п
Лз
л
/и
/и
/т
1
/ г!
л
првом случају, вредности х,, .,., и у , ..., 3 су дискретне вредности обележ Ја X и V, а број /,, је апсолутна учестаност елем ента [ " з )- У другом случају, 1 и .... , Су интервали апсолутно непрекидних обележ ја X и У , а Д , је апсолутна учестаност производа интервала 1 х Ј,. Д обијена табела је у литератури позната под називом табела кон тин генц и је. С ам цоступак ф орм ирањ а табеле је једноставан. У колико другачије није наглаш ено, поступак је следећи. О дређују се интервали за свако обележ је посебно а затим се реализовани узорак групиш е по добијеним ин тервалим а. У табели контингенције се м огу налазити релативне ум есто апсолутних учестаности.
Т А Б Л И Ч Н И М Е Т О Д П Р И К А ЗИ В А Њ А П О Д А Т А К А
85
К од свих наведених поступака табличног сређивањ а података често се, уместо релативних учестаности, користе процентуалне. П роцентуалне учестаности се добијају на основу реализованих множ ењ ем са 100. Д акле, ум есто /* користи се 100/* и означава са /;%
јо/П ри м ер 48. П осм атрана територија (слика 4.7) је подељ ена на 71 Ч квадрат у којим а се одређује приеуство или одсуство две културе А и . Ф орм ирати табелу м еђусобног односа култура и . Д:,; •./ В" X ’ VV Г/ ' и : / в А АВ / В АВ АВ А М А А АВ А АВ АВ А АВ В А АВ в А АВ А А АВ АВ АВ В А .;' ч в АВ АВ А А В "уг ‘-}уЈ 4 С лика 4.7: П осм атрана територија. Р еш ењ е. П осм атрају се два обележ ја Д -присутна култура и У -присутна култура са вредностим а д а и не. Заним а нас међусобни утицај обележ ја X и У , тако да ћем о посм атрати дводим ензионално обележ је ( X , ). О во обелелсје им а четири вредности: (да,да)-обе културе су присутне, (да,не)-присутна је сам о култура Л , (не,да)-присутна је сам о култура и (не.не)-одсутне су обе културе. Н акон пребројавањ а култура по квадратим а добијам о следећу табелу: П рисЈ^тна култура да не
П рисутна култура да не 14 12 9 36
□
86
СТАТИСТИКА
П ри м ер 49. Н а узорку од тридесет случајно одабраних путник'а на приградским линијам а градског саобрачајног предузећа регистровани СУ дуж ина релације и оцена квалитета превоза. Д обијени су следећи подаци: ду>Јрдаа""оц&ид дуж ина оцена дуж ина бцена г оО ~ чЛ 39 77 ) ( 45 71 41 6 ~' ------ 95"' 67 ■ 78 68 34 19 ' 51 48 : 82 58 52 •• 38 70 64 '51 • 37 71 46 70 38 39 19 55 23 41 10 : 75 43 66 28 44 30 67 40 154 62 47 44 71 17 |89 14 91 53 32 /10 V 49 55 67 54 42 \ 70 , 28 ----- V ---------- -г—^ Ч Ф орм ирати табелу контингенције. ч ^С Р еш ењ е. Н ајпре се одређује број интервала, а затиМ ^дуж ина интервала, посебно за свако обележ је. У зорак је обим а 30, па број интервала м ож е бити број изм еђу 1 + 3,322 • 1одш 30 = 5,91 5 • 1о § 1030 = 7,39, односно мож е бити 6 или 7. У зм им о за број тервала = 6. С ада се одређује дуж ина интервала за прво обелеЦ је, дуж ина релације (X): 70 10 _п 1 = ------- ------- = ----- ----- = 10, 6 а затим ихза друго обележ је, оцена задовољ ства (У ): У т х 100 —28 ^
=
Т ако добијам о следећу таб /Г\У [28,40) [40, 52) [10,20) [20,30) [30.40) [40,50), [50, 60) [60,70]
[52,64)
[64,76)
12 .
[76,88)' [88,100]
—
•Г Р А Ф И Ч К И М Е Т О Д П Р И К А ЗИ В А Њ А П О Д А Т А К А
87
С ада се за први елем ент узорка траж е интервали у којим а се иалазе њ егова дуж ина релације и оцена квалитета. Д уж ииа релације 36 се налази у трећем интервалу [30,40), а оцена задовољ ства 77 у петом интервалу, [76,88), дакле у пресеку треће врсте и пете колоне бележ им о један елем ент. О вај поступак се понављ а за све елем енте узорка. Т ако други елем ент треба убележ ити у пресеку ш есте врсте и ш есте колоне, трећи у пресеку прве врсте и друге колоне итд. Н а крају се добија следећа табела контингенције: \
10,20) 20,30) 30,40) 40,50) 50,60) 60,70]"
4.4.2
(28,40) 1 1 1 1
(40,52) 2 2
1 2
[52,64)
(64,76) 2
(76,88)
1 1
2 3 2
1 1
1
1
2
1
(88,100] 1
Г раф и чки м етод п ри кази вањ а података
Г раф ички м етод ом огућава јасније приказивањ е података. За граф ичко приказивањ е података користе се хи стограм и , п оли гони , тракасти д и јагр ам и итд. Х истограм се користи за приказивањ е апсолутно непрекидних обележ ја. П риказује се у координатном систему и састоји се из правоугаоника, чије су основице интервали таблично сређеног узорка, а висине се одређују у зависности од обичних или збирних учестаности већ прем а том е које се учестаности посм атрају. П равоугаоници су слепљ ени и њ ихова површ ина је пропорционална учестаностим а вредности обележ ја из интервала над којим се правбугаоник црта. П о правилу интервали се преносе на т-осу, док се учестаноеги иреносе на - осу. П ри м ер 50. И зврш ено је испитивањ е услова боравка у 50 хотела једне туристичке области. У слови боравка у хотелу су оцењ ивани поеним а од 0 до 100. Д обијени су следећи резултати: 19, 75, 87, 45, 38, 23, 2, 37, 52, 34, 77, 23, 80, 43, 94, 72, 82, 86, 57, 44, 81, 47, 100, 64, 48, 47, 81, 4, 19, 21, 51, 44, 34, 8, 10, 41, 6, 30, 50, 88,.28, 62, 94, 17, 87, 28, 16, '71, 57, 96. С редити добијене податке и нацртати
88
СТАТИСТИКА
^ Р еш ењ е. Н ајпре треба интервално средити податке. К ако )е ооим узорка - 50, број интервала м ож е бити 7 или 8. Н ека број интервала буде к ~ 7 . Д уж ина интервала биће 3’ а х
ЗС т
------ —
.
100 —2 = - 7- =
14. ' ,
Тако се добија следећа табела апсолутних учестарасти: О ц ен а ор. хотеда
(2Д6) “716.30) 5 9
(30,44) 7.
[44,58) 11
[58,72) 772,86) 3 т ,
[86,100] 8
Н а основу табеле апсолутних учестаности добија се' хистограм прнказан на слици 4.8. □ 1
С лика 4.8: Х истограм апсолутних учестаности.
К од дискретних обележ ја ум есто хистограм а користи се тракасти дијаграм . Њ егови правоугаоници нису обавезно слепљ ени а реализована вредност обележ ја је на средини основице правоугао®Редноети обележ ја м огу бити на или оси, а површ ине правоугаоника су сразм ерне учестаностим а. К од тракастог дијарам а основица правоугаоника је величине јединичне дуж и координатне осе на ко јо ј се налази (слика’4.9). П ри м ер 51. Н а узорку од 1000 слуИ ајно изабраних страних тупод1ц„РеГИСТРОВаН° Ј6 И3 К°је Зем љ е долнзе- Д обијени су следећи
Г РА Ф И Ч К И М Е Т О Д П Р И К А ЗИ В А Њ А П О Д А ТА К А
Д рж ава Н ем ачка А устрија М ађарска Ш ведска Русија О стали
89
Б рој туриста 220 320 210 85 70 95
П риказати заступљ еност појединих нација у популацији свих страних туриста пом оћу тракастог дијаграм а процентуалних учестаности. Р еш ењ е. Т абела процентуалних учестаности је: Д рж ава Н ем ачка А уетрија М ађарска Ш ведска Русија О стали
Б рој туриста % 220 22% 320 32% -210 21% 85 8,5% 70 7% 95 9,5%
Т ракасти дијаграм је приказан на слици 4.9.
П олигон учестаности је отворена полигонална линија чија су ■емена деф инисана паром бројева ( &), од којих први број х.
СТАТИСТИКА
90
представљ а вредност обележ ја и чи та се на оси, а други број /* је учестаност те вредности обележ ја и чи та се на оси (слика 4.10). О писани полигон је п ол и гон ап солу тни х у честано сти . У колико се ум есто апсолутних учестаности /< користе релативне учестаности /*, тем ена полигоналне линије ће бити деф ин исана тачкам а (ж ј, /*), а полигон ће се звати п ол и гон р елати вн и х уч естан ости. К од узорка који је сређен интервално за вредност узим а се средина г-тог интервала. ^
П ри м ер 52. Н а случајном узорку од тридесет производа испитивано је колико једи нида м лечне м асти је присутно у 100д једног м лечног производа. Д обијени су следећи резултати: 325, 313, 322, 319, 296, 290, 311, 303, 331, 313, 330, 323, 308, 335, 299, 321, 308, 347, 311, 328, 327, 326, 311, 323, 314, 350, 333, 316, 305, 301. Н ацртати' полигон апсолутних учеста.ности. Р еш ењ е. Н а основу прикупљ ених података добија се следећа табела апсолутних учестаности: Б р . јед ин и ц а Бр. производа
(290,300) 4
[300,-310) 7
Б р . јед ин и ц а Б р. производа
[330,340) 2
[340,350] 2
(310,320) 6
[320,330) 9
Н а оси се налазе вредности обележ ја, у овом случају то је број једи ница м лечне м асти, а на оси се налазе одговарајуће апсолутне учестаности. И знад средине сваког интервала црта се тачка на висини која одговара учестаности тог интервала. За овај прим ер, поли гонална линија је одређена тачкам а (295,4), (305, 7), (315,6), (325,9), (335,2) и (345,2).
ГРА Ф И Ч К И М Е Т О Д П РИ К А ЗИ В А Њ А П О Д А Т А К А
91
За приказивањ е квалитативних обележ ја м огу се користити тракасти дијаграм и, али и дијаграм и у облику круга (слика 4.11) или правоугаоника.
т
С лика 4.11: П итасти дијаграм (
— а Н ).
С тати сти ч к о п р о у ч авањ е. О ц ењ и вањ е п ар ам етар а р асп о д ел е р б е л е ж ја С татистичко проучавањ е популације чине три етапе: 1. П рикупљ ањ е података. Н ајпре се деф иниш е популација која се проучава и обележ ја која ће се посм атрати. П ретпоставим о да се посм атра једно обележ је X . Затим се прелази на ф орм ирањ е узорка. Н ека се врш и посм атрањ а чији су резултати случајне пром енљ иве ^, 2, ..., Х . У ређена п-торка ( ^. 2, ... , Х ) се зове случајн и узорак обим а за обележ је X . У колико се посм атрају два обележ ја истоврем ено ( , ), резултат посм атрањ а је уређен пар случајних пром енљ ивих, тако да узорак чини низ парова рб1,У 1), ( Х 2, 2)\ ..., (Х п ,^ ). У зорак м ора бити репрезентативан, м ора бити одређен обим узорка и начин избора узорка. Затим се одређује тсхиичка нроцедура ирикунљ ањ а података. П одатке м ож ем о прикупити разним анкетам а, интервјуим а, попуњ авањ ем разних образаца, м ерењ им а итд. Н а крају се приступа сам ом прикупљ ањ у података. 2. С ређивањ е и граф ичко приказивањ е података. П рикупљ ени подаци се при казују табелам а и. граф ички. 3. С татистичка обрада података. С ређени подаци се обрађују унапред планираним . статистичким м етодам а и н а крају се доносе закљ учци за целу популацију. 93
СТАТИСТИКА
94
У зорак по својој деф инидији представљ а случајнју величину, тачније п-дим ензионални вектор {Х , Х 2, ■ ■ ■ , ). П осле обављ еног експерим ента или посм атрањ а на располагањ у је низ конкретних података (т ј, 2, . ■ ■ , ) који се зове реали зован и узорак. Реализовани узорак се означава м алим словим а да би се направила разлика између њ ега и случајног узорка. С татистичко закљ учивањ е се, по правилу, спроводи.ф ункдијом узорка познатом под називом статисти ка. С татистика је ф ункција узорка { Х , 2, ■ ■ ■ , Х ) чији апалитички израз пс зависи од непознатих парам етара расподеле обележ ја популације из које је узет. Н а прим ер, нека обележ је X им а норм алну расподелу са парам етрим а и сг2 и нека је из популације узет узорак { Х , Х 2, ■ ■ ■ , Х ). П осм атрајм о ф ункцију 2 . деф инисану као . __ „ — 6 — ---------- I < где је
__
•
ј
= ^ Е Х . У колико су парам етри и познати, тада *=1 ф ункц ија 2 представљ а једну статистику. У колико.је бар један парам етар непознат, тада ова ф ункција није статистика. П од појм ом парам етри расподеле обележ ја или краће парам етри обележ ја, подразум евају се нум еричке карактеристике обележ ја. П арам етри м огу бити истакнути у ознаци за расподелу као ш то је случај код норм алне расподеле случајне пром енљ иве X : /^{ , ст2), где се зна да је м атем атичко очекивањ е, тј. = { ), а 1 дисперзија обележ ја са наведеном расподелом , тј. сг2 = { ). М еђутим , код бином не расподеле { , ), тј. случајне пром енљ иве 8п која им а { , ) расподелу, п и р с е такође називају парам етрим а, а лако се м ож е показати да је, на прим ер, = 1 —-§||4. П арам етри расподеле обележ ја м огу бити познати или непознати. У колико су парам етри расподеле непознати, тада се они процењ ују на бснову реализованог узорка. К ада говорим о о оцењ ивањ у парам етара треба истаћи да се ради о оцењ ивањ у нум еричких карактеристика обележ ја као ш то су м атем атичко очекивањ е, мод, м едијана, ди сперзија и слично. П ри том е постоје о:пш те оцене које важ е за све расподеле, али такође постоје и оне које се м огу прим енити сам о код неких расподела. П роцењ ивањ е непознатих парам етара м ож е се врш ити конкретним бројем или ивтервалим а.
Т А Ч К А С Т Е О Ц ЕН Е
95
А ко је процена непознатог парам етра конкретан број, тада за такву процену каж ем о да је тачкаста о ц ена н епозн атог п арам етра. У колико је процена интервал, тада такву процену називам о и н тервалн ом оценом н епозн атог парам етра. 5.1
а ч к а ст е
е
у м
х
а р а к т е
т и
б е
К ао ш то см о већ рекли, тачкаста оцена парам етра расподеле обележ ја за реализовани узорак је конкретан број. П олази се од узорка ( , 2,. .., Х ) и ф орм ира се статистика 9 = ( \ , 2, ■. • , Х ). У случају реализованог узорка она постаје конкретан број. О д тачкастих оцена посм атраћем о оцене м ера центара груписањ а (узорачку средину, м од и м едијану), оцене м ера растурањ а (узорачку дисперЗију и стандардну девијацију) и оцену м ере повезаности два обележ ја (узорачки коеф ицијент корелације). 1
5.1.1
У зор ачка средин а
У зорачка средина је најчеш ће кориш ћена оцена. Д еф иниш е се на следећи начин. Н ека је (Х х, 2', ■ ■ -^^Х ) узорак обим а из популације са обележ јем X . С татистика деф инисана као Х
-
—(А -! +. 2 4------ 1- Х — п
) ——
п 1=1
иазива сс узор ачко м среди н ом или среди н ом узорка. Р еали зован а у зо р ач ка сред и н а означава се са и деф иниш е се као број “4“ ... — Ј“ Тп), ,, = — (Х \ -|где је ( , 2, ..., х„) реализовани узбрак. За разлику од узорачке средине. која представљ а случајну ■пром енљ иву, реализована узорачка средина је конкретан број. 1
П ри м ер 53. Бр.ојзем љ отресау С рбијиу периоду 1991-1999. године био је: 26, 10, 11, 6, 5, 10, 26, 103, 81 (И звор: С тат. год. С рб., 33,
96
СТАТИСТИКА
2000., стр. 24 (извод из табеле)). К олики је био очекивани годиш њ и број зем Јвотреса у С рбији у периоду 1991-1999. године? Р еш ењ е. О дговор на ово питањ е добићем о када израчунам о реализовану узорачку средину. Н ајпре одређујем о укупан број зем љ отреса у периоду 1991-1999. године, тако ш то саберем о све бројеве друге колоне дате табеле. Д обијам о да је укуп ан број зем љ отреса у периоду 1991-1999. године х > < = 26+ 10 + 11 + 6 + 5 + 10 + 264- 103 + 81 = 278. С ада м ож ем о да одредим о реализовану узорачку средину тако ш то ћем о укупан број зем љ отреса (278) поделити обим ом узорка (9). П рем а том е, узорачка средина једнака је 278/9 = 30,89, ш то значи да је у периоду 1991-1999. године просечно годиш њ е било 30,89 или приближ но 31 зем Јнотрес. □ • П ри м ер 54. М аксим ални водостај на Д унаву м ерен код Б ездана у току 1998. године у сантим етрим а за сваки м есец био је: 199, 88, 337, 230, 188, 335, 320, 187, 417, 300, 563 и 410 (И звор: С тат. год. Југ., 1999., стр. 19 (извод из табеле)). О дредити очекивани м есечни м аксим ални водостај на Д унаву м ерен код Б ездан а 1998. године. Р еш ењ е. О значим о са X обележ је које представљ а м аксм им ални м есечни водостај на Д унаву м ерен код Б ездана. Т ада је просечни м аксим ални водостај на Д унаву м ерен код Б ездана 1998. године т, 2 = +
^ (1 9 9 + 88 + 337 + 230+ 188 + 335 + 320 + 187 417 + 300 + 563 + 410) = 297, 83
.
□
У колико је узорак табеларно сређен, тј. облика је Реализоване вредности обележ ја X А псолутне учестаности / ,
*1 л
^2
Д Л
где су х , т2, ..., реализоване вредности обележ ја X , а Д , / 2, ..., /к су апсолутне учестаности такве да је њ ихов збир једн ак обим у
У ЗО Р Д Ч К А С Р Е Д И Н А узорка мули
, тада
_
97
се реали зован а узорач ка среди н а и зрачу н ава по ф ор-
1
• 1 = - ( / 1 * 1 + / 2т2 + • •• + ?к х к ) = - V / { {. . • П рем а том е, реализована узорачка средина се израчунава тако ш то се све реализбване вредности х,-. пом нож е одговарајућим апсолутним учестаностим а /,, а затим се збир ових производа подели обимом узорка п. Реализовану узорачку средину м ож ем о једноставно одредити следећом табелом /,: Е
Ј &
гг
тако ш то ћем о добијену сум у $2 /»ач поделити обим ом узорка . П ри м ер 55. За 1100 случајно одабраних ж ена расподела броја рођене деце је Број деце Број ж ена
0 232
1 313
2 360
3 130
4 52
5 10
6 2
7 1
О дредити очекивани број деце по свакој ж ени. Р еш ењ е. Н ека обележ је X представљ а бројдеце случајно изабране ж ене. П ом оћна табела је облика Ј
0 232 1 . 313 2 360 3 130 4 52 5 10 6 2 7 1 Е 1100
0 313 720 390 208 ■50 12 7 1700
98
С ТА ТИ С ТИ К А
Значи, просечан бројдеце је 1700/1100 = 1,55 или приближ но 2. □ У колико је узорак интервално сређен, тада је поступак сличан претходном . Једина разли ка је у том е ш то се сада за представнике интервала узим ају средине интервала ( () и пом оћна табела је тада облика И нтервали :
<
: Е'
Е <<
П ри м ер 56. Б рој опш тина у Југославији прем а % оствареног дохотка у друш твеном сектору у односу на укупно остварени доходак 1974. године (И звор: С тат. год. Југ., 1976., стр. 552 м одиф икована. табела) дат је следећом табелом % дохотка
Број опш тина
[0; 20) 7
[20; 40) 41
[40; 60) [60; 80) 95 ■ 195
[80; 100 170
О дредити очекивани проценат оствареног дохотка у друш твеном сектору у појединој опш тини. Р еш ењ е. У зорак је интервално сређен, тако да за представнике интервала узим ам о њ ихове средине. П ом оћна табела је И нтервали [0; 20) [20; 40) [40; 60) [60; 80) [80; 100]
<
10 7 70 30 41 1230 50 95 4750 70 195 13650 90 170 15300 Е 508 35000
П рем а том е, очекивани проценат оствареног дохотка у друш твеном сектору по опш тин ам а износи 35000/508 = 68,9%. □ М ож е се десити да су реализоване вредности велике. У том случају се м ож е изврш ити трансф орм ација узорка ради лакш ег израчунавањ а узорачке средине. П оступак је следећи. С вака реализована вредност се трансф орм иш е у реализовану вредност
У ЗО Р А Ч К И М О Д
99
см еном (/,: = при чем у су вредности и 5 изабране тако да олакш ају израчун авањ е узорачке средине. С ада се узорачка средина израчунава ф орм улом Х -п
=
_ 5 + - 2 / гУ г = а + 1>п , <-1
где је са означена средина реализованог узорка (у . т/2, •• •. :„)■ И зрачуиајм о сада очекивани проценат оствареног дохотка у друш твеном сектору за податке из претходног прим ера. М ож ем б изврш ити трансф орм аци ју узорка см еном - 50
'г
;
* ----- 20“ . и тада добијам о трансф орм исани узорак облика Ј г
/
-2 -1 . 0 1 2
7
41 95 195 170 /
-1 4 -4 1 0 195 340 480
О чекивани проценат оствареног дохотка у друш твеном сектору је тада 20
508 = 50 + —
5.1.2
5
20
ш
=
50 + — • 480
68 , 9 .
У зорачки м од
У зо рачки м од или м од у зо р ка је она вредност у узорку која им а највећу апсолутну (релативну) учестаност појављ ивањ а у својој околини. П ри м ер 57. П осм атрајм о узорак из прим ера 44 и одредим о узорачки м од. В идим о да се вредност 6 највиш е пута јављ а, тачније 6 пута, тако да је узорачки м од броја киш них дана вредност 6 и да других м одова нем а. □
100
СТАТИСТИКА
К од интервално сређеног узорка најпре се одређује м одалн и и н тервал . М одални интервал је интервал који им а већу апсолутну учестаност од оба своја суседа, тј. и од претходног и од наредног интервала. У колико виш е интервала им а то својство, онда су сви °ни м одални интервали и за узорак се каж е да им а виш е узорачких м одова. Н ека узорак им а један м одални интервал и означим о га са 1аеС ада одређујемо м од узоркд. по ф орм ули 0
—
.
N
2
+
■
N + У 2 ’ 1
где је ,, доњ а граница м одалног интервала је дуж ин а м одалног интервала и рачуна се по ф орм ули џ = 1 - а , N је апсолутна учестаност интервала испред модалног, а 2 је апсолутна учестаност интервала иза м одалног. 1
П ри м едба 1. М ож е се десити да је м одални интервал први или последњ и интервал код интервално сређеног узорка. У колико је м одални интервал први интервал, тада испред њ ега нем а интервала, те је = 0 и у том случају је м од узорка 0 = . У колико Је м одални интервал последњ и интервал, тада иза њ ега нем а интервала, те је М 2 = 0 и у том случају је м од узорка 0 = . 3) у С рбији и П рим ер 58 Годиш њ е кориш ћењ е ш ум а (у хиљ . Ц рно.ј Гори у периоду од 1959-1997. године представљ ено је следећом табелом:
И скориш ћеност ш ум а Број година И скориш ћеност ш ум а Број година И звор: С тат. гол.
[2500; 3000) 2
[3000; 3500) 7
[3500; 4000) 6
[4000; 4500) [4500; 5000) 15 5 Ту г. гнптл
[5000; 5500) 4
О дредити м од датог узорка. Р еш ењ е. У зорак је интервално сређен, тако да је потребно најпре одредити м одални интервал. Н ајвећу апсолутну учестаност им а интервал [4000; 4500), тако да је он м одални интервал. Д оњ а граница м одалног интервала је = 4000, дуж ина интервала је
У ЗО Р А Ч К А М Е Д И ЈА Н А
101
- 4500-4000 = 500, апсолутна учестаност интервала пре модалног износи N = 6, а апсолутна учестаност интервала иза модалног К
1
јр Лг2 = 5. П рем а том е. траж еии м од узорка износи 5
0 = 4000 + 500 • ------ = 4227, 27.
6+ 5
М еђутим , интервал [3000; 3500) им а већу апсолутну учестаност и од претходног интервала [2500; 3000) и од наредног [3500; 4000), па се и у њ ем у налази мод. Њ егова вредност је 0 = 3000 + 500 -------- = 3375. 2 + 6
П рем а том е, посм атрано обележ је је бим одално. □ 5.1.3
У зор ачка м еди јана
У зор ачка м еди јан а или м еди јан а узорк а је тачка која дели узорак на два дела, таква да се у сваком од делова налази једнак број елем ената узорка. У зорачка м едијана се одређује ма следећи начин. Н ајпре се од елем ената узорка ф орм ира вари јациони низ Т(1), т(2), ..., т(п), тј. низ вредности које су поређане у неопадајућем редоследу (свака наредна вредност је већа или једнака претходној вредности). Затим се посм атра обим узорка . А ко је обим узорка непаран број, узорачка м едијана је једнака елем енту варијационог низа ^ +1 2)- У колико је обим узорка паран број, онда је узорачка м едијана једн ака аритм етичкој средини елем ената ж(п/2) и Т((„/2)+1) вари јационог низа, тј. једнака је + Х(?+') 2
П ри м ер 59. О дредити м едијане следећих реализованих узорака: а) 7, 6, 6, 8, 9, 4, 3, 7, 8, 5, 3, 6, 8, 3, 4; б) 9, 9, 4, 5, 2, 2, 2, 8, 6, 7, 9, 4, 3, 5, 5, 7. Р еш ењ е. а) Н ајпре од датих података ф орм ирам о варијациони низ: 3, 3, .3, 4, 4, 5, 6, 6, 6, 7, 7, 8, 8, 8, 9. У куггио им а = 15 података. О бим узорка је непаран број, те је м едијана осми податак • варијационог низа, тј. м едијана датог узорка изноеи 6.
СТАТИСТИКА
102
б) В аријациони низ датог реализованог узорка је 2. 2, 2, 3, 4, 4, 5, 5, 5, 6, 7, 7, 8, 9, 9, 9. О бим узорка је паран број ( = 16), те је м едијана ари тм етичка средина осмог и деветог податка варијационог низа, тј. м едијана узорка износи е — (5 + 5)/2 = 5. □ П ри м ер 60. Б рој диплом ираних студената по календарској години у централној С рбији у периоду 1980-1997. године био је: 10304, 9881, 9984, 9860, 9213, 9019, 8894, 7971, 8004, 8008, 7003, 7825, 7845, 7097, 7433, 8005, 8658 и 7663 (И звор: С тат. год. Југ., 1999., стр. 375 (извод из табеле)). К олика је м едијана? Р еш ењ е. У зорак је обим а 18, тако да је м едијана аритм етичка средина деветог и десетог елем ента варијационог низа, тачније 8005 + 8008 2
8006,5. □
К од и нтервално сређеног узорка најпре се одређује м ед и јан ски и н тер вал коме, заправо, припада м едијана. М едијански интервал је први интервал чија је зби рна учестаност већа или једнака /2, при чем у.је обим узорка. Н ека је [ , &м) м едијански интервал. С ада одређујем о м едијану узорка по:ф орм ули = ам +
-Д Т , - " , %
"
(5.1)
где је доњ а граница м едијанског интервала [о.л/-А л/), је дуж ина м едијанског интервала и рачуна се као = м - ам , је апсолутна учестаност м едијанског интервала, а Је збирна учестаност интервала испред м едијанског интервала. П ри м ер 61. Расподела опш тина у С Ф Р Југославији прем а броју основних ш кола, стањ е 1974/75 ш колске године дата је следећом табелом (И звор: С тат. год. Југ., 1976., стр. 556); Број.ш кола Б рој опш тина
[п; 5) 13
Б рој ш кола Број опш тина
[25; 30) 57
[5; 10) 47
[10; 15) 75
[30; 40) 74
[15; 20) 85
[40; 50) 41
[20; 25) 63
[50; 70) 53
У З О Р А Ч К А Д И С П Е Р З И ЈА И С Т А Н Д А Р Д Н А Д Е В И ЈА Ц И ЈА
103
О дредити дредити м едија дијану број б роја ш кола. кола. Р еш ењ е. У купан купан број број опш тина је 508. У зорак орак је инте интерва рвално сређе ређен, н, тако да д а најп ре одре одр еђујемо ем о м едиј ди јански ански и н тервал. тервал. П отребн отребне е су нам збирн би рне е ап солутне учеста учестан н ости ости . Т абела са апсолутним апсолутни м и збирни би рним м апсолутни апсолутним м учеста учестан н ости ости м а је следе следећа ћа Бро Број ш кола Бро Број опш тина ина Збирне учестаности
[5; 10) 47 60
[0; 5) 13 13
10; 15) 75 135
[15; 20) 85 . 220
[20; 25) 63 283 283
Б рој ш кола [25; 30) [30; 40) [40; 50) [50; 70) Број Број опш тина ина 57 74 41 53 ' Збирне учестаности 414 414 340 340 455 508 Т раж и м о први и н тервал тервал чи ч и ја је зби збирн рна а учест учестан ост већа или једн ака 508/2 = 254. 254. И з табеле абеле видим види м о д а п рва збирн би рна а учест учестаност већа или једнака 254 је 283 и то је збирна апсолутна учестаност и н тервала тервала [2 [20; 25). П рем а том е, м едиј ди јански ин и н тервал тервал је инт ин тервал [20 [20; 25). 25). Д оњ а гра границаница- м едија едијан ског инте ин тервала рвала је ад/ ад/ = 20, 20, дуж д уж и н а м едиј еди јанског и н тервала тервал а је = 5, ап солутна олу тна учестаност учестаност ме м едиј ди јанског и н тервала тервала је Л д/ = 63, а зби збирн рн а ап ап солут олу тн а уче уч еста стан ост интеринтервала вал а испред и спред м едиј еди јанског анско г је Ј 2м 220. К ако су нам п озн озн ати св сви 2м — 220. подаци, подаци, то то м ож ем о израчун израчун ати ати м едиј ди јану узорка узорка 254 254 - 220 = 22, 22, 7. □ е — 20 + 5 • 63 П рим етим о да се се понуђеном понуђеном статисти исти ком (5.1 (5.1)) за оцену оцену м едијане ан е не доби до биј ја средин среди н а м едиј еди јанског анско г и н тервала. тервала. У разло разлог ге за овакав избор избор оцене за м едиј еди јан у неће н ећем м о да д а улаз улази м о у оквиру окви ру овог курса. курса. 5 .1 .4
з
р а ч
а
д и с п е р
а
и
ст а н д а р д н а
в ц
а ц
П осле осле узорачке узорачке средин редине е најчеш чеш ће кориш ћена ћена оцена'ј оцена'је у зор зо р ач к а д и с п е р
а и л и
с п е р
а у з
а .
н а п р ед с
в љ а
р у р а с
-
рањ а подата података око око центра центра групис рупи сањ а. Д еф иниш ин иш е се н а следе ледећи ћи начин. начин . Н ека је [ \ , 2, . . . , Х ) узор узорак ак обим а > 30 30 из попула поп улаци циј је —2 са обележ обележ јем X . С тат татисти исти ка 5 деф ин исана исана ка као (5.2)
104 104
СТАТИСТИКА
назива назива се узорачком узорачком дис ди сп ерзиј рзијом ом посм по см атраног атраног узорка. узорка. Ф орм ула (о.2) (о.2) м ож е се се представит представити и у једност едно став авн н ијем ијем обли обл и ку за израчун израчун авањ вањ е: 5! А ко се посм атра атра реализ реализова ован н и узорак, узорак, онда он да се м ож е деф ин исат исати реали зован а у зо р ачк а ди сп ерзи ерзи ја ка као 4 = ^ Е (** - хп)2 П 1—1 одн осно , као
'
•
>2 = |
и 1=1
В идим ид им о да је за за израчун израчу н авањ е узор узорачке ачке дисперз ди сперзи и је потребн потребно о нај н ајпре одредити узорачку средину. У колико коли ко је узорак обим оби м а < 30, 30, тада се ум есто есто узорачке дисперз перзиј ије изра израчунава чунава п о п р ављ ен а у зо р ач к а д и сп ер зи ја 5, 5,2г као као
О ва ф орм ор м ула ул а се се м ож е запи сати сати у облику об лику који је једноста едн оставн вни и ји за и зрачуна рачун авањ вањ е поп п опра рављ вљ ене узорачке узорачке диспе ди сперз рзиј ије е: 52 1=1
У м есто обим оби м а узорка узорка п, код ових ових стат стати и сти сти ка се се у индекс и ндексу у м ож е наћи им е обележ ја, дакле дакл е и 5% пог п огот отову ову када кад а се се п осм атра атра виш виш е обележ об ележ ја и стоврем стоврем ено. , • П ри м ер 62. М иним алне м есечне тем пера перат туре на Д унаву унаву код код ЗеЗем уна ун а 1998. 1998. године оди не су биле: би ле: 3, 2, 2, 6, 6, 7, 7, 13, 13, 19, 19, 19,5, 20,5, 20 ,5, 15 1 5 ,11 ,1 1 , 4 и 1 (И звор во р: С тат. год. Југ., уг., 199 1999., 9., стр. 19 (извод (извод из табеле)). табеле)). О д реди ред и ти узорачку узорачку ф еди н у и дисперзиј дисперзију. у.
У ЗО Р А Ч К А Д И С П Е Р З И ЈА И С Т А Н Д А Р Д Н А Д Е В И ЈА Ц И ЈА
105
Р еш ењ е. Н ека је обеле обележ ж је А м иним ин им ална м есечна тем перат пература на Д унав ун аву у код Зем Зем уна. ун а. Збир Зби р свих свих реали реализ зован ован их вредно вреднос сти је Х ^ = 3 + 2 + 6 + 7 + . . . + 4 + 1 = 12 121, док је је зби збир р квадр квад р ата свих свих реализован реализован и х вредности вредности 1791,, 5. * = З2 + 22 + 62 + 72 + . . . + 42 + I 2 = 1791 У том случају, у зо р ачка ачк а сред среди и н а је. = — = 10,08. С обзиром обзиром д а је обим узорка узорк а 12 12 < 30, 30, то то рачун рачунам ам о реализован реализован у попр по прав ављ љ ену уз у зорачк ор ачку у ди д и сперзи сперзи ју и она он а је једн ед н ака — 2
1791,5 12 , $12 = —^ ------ — - ( 1 0 ,08)2 = 52,02. □
/ П ри м ер 63. Годиш њ а произ произв водњ а пш енице нице (у хиљ . тона тона)) у С рбиЦ рној Г ори у периоду 1965-199 1965-1997. 7. године один е била би ла је: 2193, 2193, 275 2750 0 2945, 2521, 2901, 2213, 3521, 3008, 3040, 3957, 2987, 3765, 3681* 3653, 2729, 3222, 2793, 3205, 3377, 3375, 2911, 2919, 3168, 3939, 3406,’ 3869, 4109, 2101, 2101, 3049, 3249, 2949, 1507 и 2920 (И звор во р : С тат. год! Југ., уг., 1999 1999.,., стр. 225 (из (извод из табеле)). беле)). К оли ол и ка је п росечн ро сечна а годиш оди ш њ а произ прои зводњ а пш енице ни це у периоду периоду 1965 1965-1 -199 997. 7. године? одине? К оли ол и ка је узорачка дисперзија? Р еш ењ е. Н ека обе обележ леж је X предст представљ а годиш одиш њ у произв производњ у пш енице ни це у хиљ . тона. Зби р свих свих реали реализ зовани ованих х вредн вреднос ост ти износ износи и X) . = 101932 101932,, и како је узорак обим оби м а = 33, то је п росечна росечн а годиш њ а произ произво водњ дњ а пш енице једнака *зз =
101932 = 3088,85 3088,85 хиљ ада тона. она. 33
С Д РУ1 РУ 1е схране, хране, уз у зорак ор ак је обим об им а ве већег од 30, 30, тако тако да д а у овом овом прим при м еру рачунам о узорачку узорачку дисп д испе ерзиј рзију. у. Збир Зб ир квадрата свих реали реализ зован ован и х вредности вредн ости је 325507214 325507214,, тако да д а је сада сад а узорачка рач ка дисп ди сперзи ерзиј ја једн едн ака 325507214 - (3088,85)2 (3088 ,85)2 = 8678260, 8678260,6. 6. □ 5зз — 33
СТАТИСТИКА
106
У колико је узорак табеларно сређен, тада се реал и зов ан а узор ач ка д и сп ерзи ја израчунава по ф орм ули
П
1 =1
О Д Н О С Н О , 110 ф о р м у л и
^ = - Х > ? - ( * Ј 2. 1=1 где је, као ш то .је објаш њ ено код узорачке средине, /* апсолутнаучестаност реализоване вредности т*. У колико је узорак обим а м ањ ег од 30, тада се поправљ ена узорачка дисперзија израчунава као $п = —"ЦТ 71
^
1 1= 1
~ Хт ^ ’
односно, као 1 — 1 Е1=1/ ^ 1 А ко је узорак и интервално сређен, тада се за реализоване вредности узорка узим ају средине тих интервала и даљ и поступак је исти као ш то је управо објаш њ ено.. П ри м ер 64. И зрачунати узорачку дисперзију података из прим ера 61. Р еш ењ е. К ористим о следећу табелу Број опш тина [ о; 5) [ 5; 10) [10; 15) [15; 20) [20; 25) [25; 30) [30; 40) [40; 50) [50; 70)
С редине 0*) 2.5 7,5 12,5 17,5 22,5 27,5 35 45 60 Е
Ј
Ј
81,25 32,5 13 2643,75 352,5 47 937,5 11718,75 75 26031,25 1487,5 85 31893,75 63. 1417,5 43106,25 1567,5 57 90650 2590 74 83025 1845 41 190800 3180 53 479950 508 13410
У ЗО Р А Ч К И К О Е Ф И Ц И ЈЕ Н Т К О Р Е Л А Ц И ЈЕ
107
И з табеле добијамо д а је узорачка средина једн ака 13410/508 = 20,4, док је узорачка диснерзија једнака 479950/508 —(26,4)2 = 247,8. □ " П ом оћу узорачке дисперзије м ож е се деф инисати појам узорачке стандардн е деви јац и је. У зорачка стандардна девијација означава се са 8„ и деф иниш е ф ормулом 5„ — / ^- Т акође, м ож е се деф инисати и п оп рављ ена узорачка стан дар дн а деви јац и ја као 5 = /§%. За претходна три прим ера узорачке стандардне девијације еу: 7,21 (прим ер 62), 2945,9 (прим ер 63) и 15,7 (прим ер 64). А ко су реализоване вредности велике, тада се м ож е изврш ити трансф орм ација узорка да би се лакш е израчунала узорачка дисперзија. • К ористи се трансф орм ација т/» = и тада су реализоћана узорачка дигпорзија и узорачка стандардна де.вијација редом 'х — V2 • и = |6| • . О знаке 'у и представљ ају рсализовану узбрачку дисперзију ;и узорачку стандардну девијацију трансф орм исаног узорка { \,у , • ••, п )5.1.5
У зор ачки коеф и ц и јент корелац и је
За утврђивањ е новезаности два обележ ја X и V кори.сти се узорачки коеф ицијент корелације. За узорак ((А У .У ј), ( 2, У г), •••, ( „, У „)) обима п > 30, узорачки коеф ицијент корелације једнак је Ч
( х . - х . ) (у, - у . )
& ,
8 5
где су „ и „ узорачке средине обележ ја X и , а 8 и 5У су узорачке стандардне девијације обележ ја X и V. П ретходна ф орм ула се м ож е записати у облику који је једноставнији за израчунавањ е 4±
< {-
„7
■У колико је узорак м али, тада с.е ум есто узорачких стандардних девијација 8 и користе поправљ ене узорачке стандардне деви. јаЦ ије
108
СТАТИСТИКА
Nзорачкп корф пцијсит корелације им а исте особине као и линеарни коеф ицијент корелације, тј. узим а вредности из интервала [— !]■ једнак је 1 ако изм еђу обележ ја X и постоји линеарна веза = Х + при чему је а > 0, а једнак је - 1 ако изм еђу X и У поетоји линеарна веза V — + 6 при чему је а < 0. Т акође, вредпост узорачког коеф ицијента корелације се не мењ а ако се изврш и = \ + . тада трапсф орм ацц ја узорка, тј. ако је ; = + и , је К .ц/ = х .у , уколико су и с истог знака, и 2>\у = - К уколико су и с супротног знака. 2
С лика 5.1: К орелација два обележ ја. * пракси се вредност узорачког коеф ицијента корелације т~х м ож о тум ачити на виш е начина. Једно тум ачењ е би било: - А ко је \ .у \ < 0,25, тада см атрам о да изм еђу обележ ја X и не поетоји линеарна зависност. - А ко је 0, 25 < |гл-,г| < 0,5, онда изм еђу обележ ја X и V постоји сасвим незнатна линеарна повезаност. А ко је 0,5 < |гх,г1 < 0,7, тада постоји знанајна линеарна повезаност између обележ ја X и У'. - А ко је 0,7 < |гХ |У | < 0,9, онда постоји високо значајна повезаност изм еђу обележ ја X . -
А ко је 0, 9 < \ ,у \ < 1, онда је повезаност изм еђу обележ ја X и практично линеарног облика.
У ЗО Р А Ч К И К О Е Ф И Ц И ЈЕ Н Т К О Р Е Л А Ц И ЈЕ
109
П ри м ер 65. У табели су за период од 1955. до 1964. године дати подаци средњ их годиш њ их протицаја К олубаре код В аљ ева и Д раж евца: Година 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964
П роток код В аљ ева 8,8 5,3 5,0 4,8 4,1 3,5 2,4 4,2 2,4 2,8
П роток код Д раж евца 59,6 36,3 23,2 26,8 22,2 14,5 13,4 25,9 14,1 10,6
О дредити узорачки коеф ицијент корелације изм еђу средњ их годиш њ их протока код В аљ ева и Д раж евца. Р еш ењ е. Н ека је X протицај код В аљ ева, а протицај код Д раж евца. У зорачки коеф ицијент корелације обележ ја X и најлакш е одређујем о пом оћу следеће табеле <
1 2 3 4 5 6 7 8 9 10 Д
А
8,8 ; 5,3 5,0 4,8 4Д 3,5 2,4 4,2 ■ 2,4 2,8 = 43,3
<
<
59,6 36,3 23,2 26,8 22,2 14,5 13,4 25,9 14,1 10,6 = 246,6
77,44 28,09 25,00 23,04 16,81 12,25 5,76 17,64 5,76 7,84 = 219,63
У зорачке средине обележ ја X и
<
3552,16 1317,69 538,24 718,24 492,84 210,25 179,56 670,81 198,81 112,36 П = 7990,96
су једнаке
<<
524,48 192,39 116,00 128,64 91,02 50,75 32,16 108,78 33,84 29,68 1307,74
110
СТАТИСТИКА
док су одговарајуће узорачке дисперзије *х = §
- (4, ЗЗ)2 = 3, 21,
з2 = ^ - (24,66)2 1190, 98.
У зорачки коеф иц ијент корелације изм еђу X и V је ^^-4,33-24,66 10 - 0,97. = У 372Т •уТШ ГЗб В идим о да је узорачки коеф ицијент корелације изм еђу X и велики, ш то значи д а постоји ли неарна веза изм еђу об)ележ ја X и V, тј. да ће повећањ е протицаја К олубаре код В аљ ева довести до повећањ а протицаја и код Д раж евца. Закљ учак о постојањ у линеарне везе изм еђу ова два обележ ја следи и из граф ичког приказа парова вредности ( х Г , Г ) (слика 5.2). □ .
С лика 5.2: Г раф ички приказ протицаја К олубаре код В аљ ева и Д раж евца. П ри м ер 66. Расподела просечног прихода и броја деце 100 случајно изабраних породица дата је следећом табелом П риход у.хиљ . ди нара Б рој деце- [0; 10) [10; 20) [20; 30) [30; 40) 0 9 14 8 6 1 11 20 9 4 2 - 4 7 3 1 3 1 2 1 0
У ЗО Р А Ч К И К О Е Ф И Ц И ЈЕ Н Т К О Р Е Л А Ц И ЈЕ
111
О дредити узорачки коеф ицијент корелације изм еђу породичног прихода и броја деце. Р еш ењ е. Реализоване вредности обележ ја породични приход су интервално сређене, те је потребно узети средине интервала за представнике ин тервала. О значим о са У породични приход, X бројдеце, /„■ апсолутну учестаност пара { ^ ), /*. апсолутну учестаност податка а са /.у апсолутну учестаност податка ј. Тада су оцене очекиваних вредности и дисперзија обележ ја X и У редом 82 х
Уп = \
ј , Ј. ј У
—1
52
= ± Е Ји Х ?-(х п)2, = А
1= 1
/ .ј У? - (У ) 2 • 4
7
За израчунавањ е узорачког коеф ицијента корелације користим о следећу табелу \
0 1 2 3 .
Ј. .
1
5 9 11 4 1 25 125 625
15 14 20 7 2 43 645 9675
25
35
8 9 3 1 21 525 13125
6 4 1 0 11 385 13475
/<• 37 44 15 4 100 5 = 1680 15=36900 =
0 44 30 12 5=86
0 44 60 36 С = 14 0
®<Е н У 0 720 .470 180 5=1370
Бројеви у последњ ојколони горњ е табеле се рачунају на следећи начин: 0 • (9 • 5 + 14 • 15 + 8 ■ 25 + 6 - 35) = 0, 1 ■ (11 • 5 + 20 • 15 + 9 • 25 + 4 ■ 35) = 720,. 2 - (4 - 5 + 7-15 + 3- 25 + 1 - 35) = 470, 3 - ( 1 - 5 + 2-15 + 1-25 + 0.-35) = 180.
О знаке у табели им ају следећа значењ а: је обим узорка , је сум а Е /».2+ је сум а Е . , )е сум а Е . , је сум а Е . 2, а је сум а Е Е Ј г ј ^ . И з табеле добијам о да је реализована узорачка средина обележ ја X једнака
112
СТАТИСТИКА
реализована узорачка дисперзија за X је с = -д - (^10о)2 = 0,66,
реализована узорачка средина обележ ја V је 2/100 — ~д — 16,8,
а реализована узорачка дисперзија обележ ја је Зу = Ј ~
(У ш )2 = 86,76.
За ове вредности добијам о да је узорачки коеф ицијент корелације ) 6 Д Н З .К
=
ТИГ “ 0,86-16,8 - ________ !_____ _ П
- <-џо
1
В редност узорачког коеф ици јента корелације је м ала, ш то значи да Је линеарна веза изм еђу обележ ја X и У веом а слаба, тј. да породични приходи и број деце у породици нису у линеарној вези.
н т ер в а л н деле бе
це
ива
е пара
ра ра п -
Д° сада см 0 као оц-енУ парам етра расподеле обележ ја користили
конкретан број. који је п редстављ ао приближ ну вредност непознатог парам етра. М еђутим , у неким ситуацијам а потребна нам је опш тија инф орм ација о вредности непознатог парам етра, тј. инф орм ација у којим се границам а креће права вредност парам етра. отреба за таквом инф орм ацијом нас доводи до' интервалног оцењ ивањ а парам етара расподеле обележ ја, О пш ти поступак је следећн. П осм атра се обележ је X чи ја расподела зависи од непознатог ) обима парам етра . П отребно је за дати узорак ( 2 , . .. ,
И Н Т Е РВ А Л Н О О Ц Е Њ И В А Њ Е
наћи две статистике < { да је ,
2, . . . ,
п )<
2,...,
<
{
) и ч> (
г , ..
‘•71
>,.. ., ! „ ) } = 1 - а .
-КОК (5.3)
И нтервал <2] зове случајн и и н тервал п арам етра нивоа п оверењ а 100(1 - )% или скраћено, и н тервал п оверењ а. П риликом одређивањ а интервала поверењ а најчеш ће се узим а висок ииво поверењ а: 90%, 95%, 99%. А ко су обе границе интервала поверењ а случајне пром енљ иве, тада је реч о д востр ан ом интервалу поверењ а. А ко је сам о једна граница случајна, тада се ради о јед н остр ан ом интервалу поверењ а. Н апом еним о да израз (5.3) не значи да је вероватноћа да упадне у [џ> ,џ >2] једн ака 1 - , већ значи да од виш е интервала добијају, њ их 100(1 — )% к о ји се из виш е узорака истог обим а захвата праву вредност парам етра . ^ С ада ћем о посм атрати интервалне оцене парам етара норм алне расподеле. Н ека обележ је X им а норм алну расподелу /( , 2) и нека је ( г , 2, . . . , Х ) узорак обим а . П осм атрајм о најпре парам етар . У колико је парам етар сг2 познат, тада је интервал поверењ а за парам етар облика 1
= при чему је
узорачка средина, а
је број који се чита из
таблице норм алне расподеле и задовољ ава услов Ф Њ - Ј = П ш , Н еколико карактеристичних вредности за гњ а је дато следећом табелом 2 1 — X 1 -----2. —
0,9 1,64
0,95 1,96
0,99 2,57
П ри м ер 67. П осм атрано обележ је X, просечне годиш њ е падавине у -ф рици, им а норм алну расподелу са дисперзијом = 324 и . непознатим парам етром . И з датог узорка обим а 50 реализована 2
СТАТИСТИКА
114
узорачка средина износи 50 = 85. О дредити интервал поверењ а за парам етар за ниво поверењ а 0,95. Р еш ењ е. П ознате су нам све вредности: узорак је обима = 50, ниво поверењ а је 1 - = 0,95, стандардн а девијација је = л/324 = 18, реализована узорачка средина је Зс5ђ = 85, а за дати ниво поверењ а је = 1, 96. П рем а том е, траж ени интервал поверењ а за парам етар је /7 7 1
-- 85
18 18 1,96 1,96; 85 + л/50 л/50
[80,01; 89,99]. □
А ко је парам етар 2 непознат и узорак је м али (п < 30), тада је интервал поверењ а за облика Ап
•Ј
(5.4)
' ^п -1 ;^
где је 5 поправљ ена узорачка стандардна Д евијација,| а 4п_1;1=н је вредност која се чита из таблице С тудентове расподеле. Н еколико карактеристичних вредности за је дато следећом табелом
1;Ц а *п—
1 —а = 0, 9 15 5 10 2,132 1,833 1,761 1 — = 0,95 15 10 5 2,776 2,262 2,145 1 —а = 0,99 15 5 10 4,604 3,25 2,977
У колико је узорак обим а облика /ш — где је
5
> 30,
20 1,729 20 2,093 20 2,861
тада је интервал поверењ а за
;Хп +
узорачка стандардна девијација.
И Н Т Е РВ А Л Н О О Ц Е Њ И В А Њ Е
115
П ри м ер 68. У случајном узорку од 10 градова проденти становника старијих од 65 година су: 15,4; 19,7; 24,6; 18,9; 15,2; 19; 21,3; 17,9; 15,5 и 16. О дредити 95% интервал поверењ а очекиваног процента становника старијих од 65 година. Р еш ењ е. О значим о са X проц енат становника старијих од 65 година. За разли ку од претходног прим ера, овде не постоји никаква претпоставка о дисперзији, ш то значи д а је она непозната. У зорак је мали (10 < 30), тако да користим о ф орм улу (5.4). У зорачка среди на је ххо = — (15,4 + 19,7 + . .. + 15,5 + 16) = 18,35, а поправљ ена узорачка дисперзија је 5?0=Л [(15,4 - 18,35)2 + ... + (16 - 18,35)2] = 9,2 . К оначно, интервал поверењ а за је
18,35
у случају непознате дисперзије
2’262; 18. 35 + ^ ^ ' 2-262
16,06; 20,64]. □ О дредим о сада интервал поверењ а за парам етар сг2 у зависности од парам етра . П оново разликујем о два случаја: када је параметар познат и када је непознат. У случају да је парам етар познат, интервал поверењ а за с2 је облика Е (Х < -т)2 Г=1
Е №
1=1
-т)2
при чему су Х ; | и Х ;1 - | вредности које се читају из таблице 2 расподеле. Н еколико карактеристичних вредности за Хп;а и ;1 - § . када је 1 - а — 0,9, је дато следећом табелом
*п;1-*
5 . 10 1,15 3,94 18,3
15 7,26 25
20 10,9 31,4
116
А ко је парам етар м етар сг2 облика
СТАТИСТИКА
непознат, тада је интервал поверењ а за пара-
П оред овог интервала (двостраног), м огу се посм атрати и једнострани интервали поверењ а. Једнострани доњ и интервал поверењ а је облика
а Једнострани горњ и интервал поверењ а је
П ри м ер 69. П осм атрам о обележ је X , проценат чистог м етала у руди који им а норм алну расподелу. И з узорка обим а 30 добијена је узорачка дисперзија з|0 = 7, 27. За ниво поверењ а 0,9 одредити двострани и оба једнострана интервала поверењ а за парам етар сг2. Р еш ењ е. В идим о да не постоји никаква претпоставка о парам етру ?п, ш то значи да је он непознат. Д вострани интервал поверењ а за парам етар ст2 је
Једнострани доњ и интервал поверењ а је
док Је Једнострани горњ и интервал
И Н Т Е РВ А Л Н О
О Ц Е Њ И В А 1 -Б Е
117
* Н екада је потребно одредити интервале поверењ а за стандардну девијацију . О ни се једноставно одређују пом оћу интервала поверењ а за дисперзију 2. Д вострани интервал поверењ а за је Д =
п 31
N
Х
п 31
-1 ;1 -§
\
-1 ;|
Једнострани доњ и интервал је 2
1
N Х
\ оо
—1;
)
док је једнострани горњ и интервал / 1
\
п 1Ј ,■ л '
п 5,2 1
V2 Лп—1;1 —
Т ако за претходни прим ер, двострани интервал поверењ а нивоа гтоверењ а 0,9 за стандардну девијацију је 1 = [2,18 ; 3, 69], једнострани горњ и интервал је 1 = [2,26; оо), а једнострани доњ и интервал за стандардну девијацију је 1 = (0; 3,51].
I!
!' I I !I I
Т естирањ е статистичких хипотеза је вид статистичког закљ учивањ а који се прим ењ ује у ситуацијам а када се унапред претпостављ а постојањ е одређене везе међу изучаваним појавам а, и када се претпостављ а да посм атрано обележ је им а одређену расподелу. С вака претпоставка која се односи на расподелу обележ ја зове се татист а х и п т е з а . С татистичка хипотеза м ож е бити тачна или погреш на. О на се тестира на основу узорка и доноси се одлука о њ еном прихватањ у или одбацивањ у. С ам поступак вериф иковањ а статистичке хипотезе на основу узорка зове се с т а т и с т и ч к и е с т . С татистички тест најчеш ће користи неку статистику и таква статистика се зове т е с т с т а т и с т и а . С ваки статистички тест истоврем ено посм атра две хипотезе које су једна другој супростављ ене. Ради лакш ег рада једн а од две хипотезе се узим а за п олазн у или ” н улту” хи п отезу и означава се еа # 0. Д руга хипотеза се зове ал тер н ати вн а хи п отеза и озна. П о правилу за нулту хипотезу се узим а она или чава се са хипотеза која се лакш е вериф икује. С татистичка хипотеза м ож е бити пр оста или слож ен а. Х ипотеза је проста ако у потпуности одређује расподелу обележ ја, у супротном је слож ена. П рим ери простих хипотеза биле би хипотезе 0{ = 10) и #о(<х2 = 4), док би слож ене биле Н (т 10) и # 1 (сг2
4).
П ри тестирањ у статистичких хипотеза по правилу се деф иниш е скуп који служ и као критеријум за одбацивањ е, односно прихватањ е нулте хипотезе. Н аим е, хипотеза #о се одбацује ако реали) припада области , у супротном се зовани узорак ( х , 2, ..., 119
120
СТАТИСТИКА
прихвата. С куп се зове критична област. О длуком о прихватањ у или одбацивањ у нулте хипотезе м огуће је начинити две греш ке: греш ку прве и греш ку друге врсте. Г реш ка п рве врсте настаје у ситуацијам а када је хипотеза 0 одбачена, а била је ф актички тачна. В ероватноћа да се учини греш ка прве врсте означава се са а: =
^ # 0 { ( ■ ' ^ 1 > - ^ 2 > • • • >
п) 6
С} .
I реш ка д р у ге в рсте чини се када се нулта хипотеза прихвати, а заправо није тачна. В ероватноћа да се начини греш ка друге врсте означава се са /3: Р = РнЛ(Х1,Х*;--:,Хп) $С}.
В ероватноћа а се зове и праг знач ајн ости теста. За праг значајности се најчеш ће узим ају вредности 0, 1; 0, 01 и 0,05. У зависноети од тога да ли расподела тест статистике зависи од расподеле посм атраног обележ ја, статистички тестови м огу бити: 1.
парам етарски, код којих расподела тест статистике зависи од расподеле посм атраног обележ ја, и
2.
непарам етарски, код којих расподела тест статистике не зависи од расподеле посм атраног обележ ја.
6.1
т
ви
хи п
т е за
ар ам
тр
П осм атраћем о сада парам етарске тестове који се односе на тестирањ е парам етара норм алне расподеле. О ви тестови се користе У ситУаЦиЈам а кад им амо 'претходно знањ е о расподели обележ ја које испитујемо и то да је та расподела норм ална. Н ајчеш ће се после извесног врем ена или неких активности проведених на популацији постављ а питањ е да ли су се парам етри посм атране норм алне расподеле пром енили. У ту сврху се користе тестови за парам етре норм алне расподеле. О ни спадају у групу парам етарских тестова, јер расподела тест статистике зависи од норм алне расподеле обележ ја.
Т Е С Т И Р А Њ Е Х И П О Т Е ЗЕ 0 П А РА М Е Т РУ
121
Разм отрићем о следеће случајеве тестирањ а хипотеза које се односе на парам етре норм алне расподеле: 1.
тестирањ е хипотезе о парам етру нат,
када је парам етар ст2поз-
2.
тестирањ е хипотезе о парам етру познат,
када је п арам етар
2 не-
3. тестирањ е хипотезе о парам етру п 2када је парам етар нат, и
поз-
4. тест-ирањ е хипотезе о парам етру ст2 када је парам етар познат.
не-
6. 1.1
Т естир ањ е хи п отезе о п арам етру ?тг кад а је сг2 познато
Ж елим о да испитам о да ли је дош ло до промене вредности парам етра . У том см ислу, тестирам о нулту хипотезу 0( = ?тг0), где је т 0конкретан број, против једне од алтернативних Н (т ^ т 0), \(т > 0) или \(т < 0). П ретпостављ ам о да је парам етар <х2 познат. П осм атра се тест статистика 2 0 деф инисана као у *п 0 ,— 2 0 -------------- уп ,
-
сг
где је средина посм атраног узорка. П од условом да је нулта хипотеза 0 тачна, тест статистика 2 0 има стандардну нормалну расподелу. К ритичне области зависе од алтернативних хипотеза и приказане су у табели: 0 т т т
~ = —
0 0 0
У т т
> <
0 N > 20,5-| 0 20 > -го.Б-а 0 < — 0,5-с,
Број је реш ењ е једначине Ф (г„) - и одређује се из таблице норм алне расподеле. Н а прим ер, ако је = 0,475, тада је 0:475 број
122
'С Т А Т И С Т И К А
из таблице који задовољ ава једначину Ф (20,475) = 0,475, а то је број 1,96. ’ Н а крају доносим о закљ учак о одбацивањ у или неодбацивањ у нулте хипотезе. А ко реализована вредност 0 упада у критичну. област , тада одбацујемо нулту хипотезу 0 и прихва.там о алтернативну \ д а је дош ло до промене вредности парам етра . У супротном , прихватам о нулту'хипотезу 0, односно м ож ем о см атрати са прагом значајности да није дош ло до пром ене вредности парам етра . : П ри м ер 70. У табели су приказани износи на текућим рачуним а 30 случајно одабраних клијената банке: . р
ј
т ед а л и
ј
к л
[-2 00 0, -1 0 0 0 )
•1
4
а т а
т е д а р
[-3 0 0 0 , -2 0 0 0 )
е н а т а
[-1 0 0 0 , 6
[ 1 0 0 0 ,2 0 0 0 )
[ 2 0 0 0 ,3 0 0 0 )
[ 3 0 0 0 ,4 0 0 0 ]
6
4
2
))
[ 0 ,1 0 0 0 ) 7
при чему је дуг посм атран као негативна уш теда. П ретпостављ ајући да стањ е на текућем рачуну клијента им а нормалну расподелу А { \ 2500), тестирати хипотезу да је: а) очекивана уш теда 500 динара, против алтернативне да није 500 ди нара, б) већа од 500. динара, против алтернативне да. је м ањ а од или једн ака 500 динара. У зети да је п раг значајности а — 0,05. Р еш ењ е. Т естирам о хипотезу 0(т = 500) против једне од алтернативних. П ознат је обим узорка п = 30, дисперзија с 2 = 2500 и вредност 0 = 500. О дредим о узорачку средину следећом табелом : И нтервал [-3000, -2000) 2000, — 1000) [— [ - 1000, 0) [0, 1000) [1000, 2000) [2000,3000) [3000,4000)
/< -2500 1 -1500 4 -500 • 6 500 7 1500 6 2500 4' 3500 2 Е 30
-2500 -6000 -3000 3500 9000 10000 7000 18000
Т Е С Т И Р А Њ Е Х И П О Т Е ЗЕ 0 П А Р А М Е Т Р У
123.
П рем а том е, узорачка средина изоси 0 = 18000/30 = 600. П ознате су нам с.ве вредности, тако да м ож ем о одредити реализовану вредност тест статистике: . • 600 - 500 •^30 = 10,95. 50
20
К оначно, остаје да одредим о критичне области. Н ајпре тестирам о хипотезу да је уш теда 500 динара, тј. 0( = 500) против алтернативне 500). К ако је 20,475 = 1.96 и 10,95 > 1,96, то (т одбацујем о нулту хипотезу, тј. закљ учујем о да висина уш теде није 500 динара. Т естирајм о сада хип отезу да је висина уш теде већа од 500 динара, тј. 0(т = 500) против алтернативне \( > 500). У том случају је 20,45= 1,64 и 10,95 > 1,64, тако да одбацујем о нулту хипотезу и закљ учујем о да је висина уш теде већа од 500 динара. □ П ри м ер 71. И здвојени су подаци о броју становника (у хиљ адам а) 30 села једног региона. Д обијени су следећи подаци: 23, 17, 17, 12,.. 13, 10, 21, 17, 20, 9, 15, 4, 23, 8, 15, 3, 3, 4, 13, 22, 6, 27, 12, 7, 22, 10, 22, 6, 25, 18. Д а ли се са прагом значајности 0,05 м ож е рећи да је просечан број становника у селим а овог. региона 15, ако је дисперзија броја становника позната и износи 49? Р еш ењ е. Т естира се нулта хипотеза 0(т = 15) против алтернативне хипотезе \(т 15). Н ајпре треба средити податке интервално. Д обија се следећа табела: р
ј
т а н р
ј
с е
в н и к
13,7)
[ 7 ,1 1 )
1 1 1 ,1 5 )
[ 1 5 ,1 9 )
[ 1 9 ,2 3 )
[2 3 ,2 7 ]
8
4
5
5
6
2
П ом оћна табела је облика: И нтервал [3,7) [7,11) [11,15) [15,19) [19,23) [23,27]
и
5 8 9 4 13 5 17 5 21 6 25 2 Е 30
40 . 36 65 85 126 50 402
124
СТАТИСТИКА
П рема том е, узорачка средина једнака је т 30 = ^ зована вредност тест статистике је 13,4 - 15
= 13( 4, р еали-
-0,23.
л/49
За дати праг значајности је 20,475 = 1, 96 и како је | —0.23| < 1.96, т° нрихватам о хипотезу 0, тј. закљ учујем о да очекивани број становника заиста износи 15. □ 6. 1.2
Т ести рањ е хи п отезе о п арам етру непознато
када је '
О пет испитујем о да ли је дош ло до пром еие вредности парам етра , али сада нам није позната дисперзија. Т естирам о нулту хипотезу 0(т = 0), где је ш 0конкретан број, против једне од алтернативних 0(т ф 0), 0( > 0) или 0( < ш 0), у случају да дисперзија није позната. П осм атра се тест статистика 4п _ ј облика АГ„ - 0 -\ - ---- =у /п —1 , ‘О где је А п средина узорка, а 5„ .стандардна девијација узорка. П од условом да је хипотеза 0 тачна, тест статистика 4П_2им а С тудентову расподелу са - 1степени слободе. У колико је узорак м али, тада се користи тест статистика
где је 5„ поправљ ена узорачка дисперзија. И ова статистика при тачној нултој хипотези им а С тудентову расподелу са - 1 степени слободе. К ритичне области зависе од алтернативних хипотеза и приказане су у табели: #0 =
Ш
= I I
3
ш 0 ш 0 3 о
/= > <
0 ш 0
1^п —11 >
^ « -1 ;0 ,5 -§
1 -\ > ^ п —1:0.5—п ^ -1
^
~ ^ п - 1 ; 0 ,5 - а
Т Е С Т И Р А Њ Е Х И П О Т Е ЗЕ О П А Р А М Е Т РУ
125
Број 2п_ 1;а се одређује из таблице С тудентове расподеле. Н а прим ер, ако је узорак обим а 30 и = 0, 01, тада је г29;0|1 = 0, 256. Закљ учак је исти као и код претходног тестирањ а. Једина је разлика та ш то се посм атра реализована вредност тест статистике 1 -[, П ри м ер 72. И зврш ено је 30 м ерењ а процента чистог м етала у руди на једном геолош ком локалитету. Резултати м ерењ а су дати интервално, са одговарајућим учестаностим а: П роценат м етала [0,3; 0,8) [0,8; 1,3) [1,3; 1,8) У честаности 5 5 4 П роценат м етала [1,8; 2,3) [2,3; 2, 8) [2, 8; 3,3) У честаности 9 5 2 П од претпоставком да проценат м етала им а норм алну расподелу, тестирати хипотезу да је очекивани проценат 1,75 против алтернативне да је различит од 1,75, са прагом значајности 0,05. Р еш ењ е. Т естирам о нулту хипотезу 0( = 1,75) против алтернативне 1,75). Н е постоји никаква претпоставка о ( вредности парам етра ст2, тако да је реч о тестирањ у хипотезе о парам етру када је дисперзија ст2 непозната. Т ест статистика је облика ?710 ,----- — Ч»-1 = — ----- • - 1. За сада су нам познати обим узорка — 30 и вредност 0 = 1,75. П отребно је још да одредим о реализовану узорачку средину и реализовану узорачку стандардну девијацију з,г. С обзиром да је узорак интервално сређен, то за' представнике интервала узим ам о средине интервала. К ао и раније, тако ћем о и сада за израчунавањ е реализоване узорачке средине и дисперзије користити табелу И нтервали < ~ 4 ~ [0,3; 0,8) 0,55 5 2,75 25 13,75 [0,8; 1,3) 1,05 5 5,25 25 26,25 [1,3; 1,8) 1,55 4 6,2 16 24,8 [1,8; 2,3) 2,05 9 18,45 81 166,05 [2,3; 2,8) 2,55 5 12,75 25 63,75 [2,8; 3,3) 3,05 2 6,1 4 12,2 Е 51,50 Е ^ 306,8
СТАТИСТИКА
126
И з табеле добијамо да су реализована узорачка средина и дисперзија редом једнаки = 4,
=
— 51,50 = 1,72, • 306,8 —(1,72)2 = 7,268.
У том случају реализована узорачка стандардна девијација је једнака 530 = 2,696. И з свега овога добијамо да је реализована вредност тест статистике једнака
О стаје још да одредим о критичну област. Ч итајући из таблице С тудентове расподеле добијам о да је 229,0,475 = 2, 0451 М ож емо прим етити да је | - 0 ,06| < 2,045, тако да са прагом значајности 0,05 м ож ем о см атрати да је очекивани проценат руде једнак 1,75. □ П ри м ер 73. У једној пољ опривредној области је током 10 година м ерен укупан принос пш енице (у одговарајућим јединицам а). Д обијени су следећи подаци: 40, 34, 40, 29, 23, 32, 22, 24, 34 и 31. Д а ли се, ако је праг значајности 0,05, м ож е рећи да просечан принос прем аш ује 25 јединица? Р еш ењ е. Т естира се нулта хипотеза (т = 25) прбтив алтернативне хипотезе Д Д т > 25). П рво треба израчунати реализовану узорачку средину и реализовану узорачку дисперзију: х
= -1(40 + 34 + 40 + 29 + 23 + 32 + 22 + 24 + 34 + 31) = 30,9, III
5п = — (402 + 342 + 402 + 292 + 232 + 322 + 222 + 242 + 343 + 9 10' + 312) - у • (30, 9)2 = 42,1. Реализована вредност тест статистике једнака је: 30,9-25 9
~
••N/10 = 2,88.
Т Е С Т И Р А Њ Б Х И П О Т Е ЗЕ 0 П А Р А М Е Т Р У о-2
127
К ако је 2,88 > 1,833, то се при хвата алтернативна хипотеза Н , тј. закљ учујем о да просечан принос пш енице прем аш ује 25 јединица. □ • 6.1.3
Т ести рањ е хи п отезе о
2 к ад а је
непознато
С ада испитујемо да ли је дош ло до пром ене вредности парам етра 2 у случају када је непозната вредност парам етра . Тестирам о нулту хипотезу 0( 2 = 0), где је 2 конкретан број, против једне од алтернативних 0( 2 ^ 0), 0( 2 > 0) или 0( а 2 < 0). Т ест статистика за узорак обим а > 30 је облика
Х о
. -р2 г
д
т
и
е
с
Ј
т
5
е
и
к
д
и
р
з
Ј
а
у
з
р
к
а
.
0-0 За узорак обим а п < 30, тест ста-
је (п — 1 )52
— 2
>
где је 8 2 поправљ ена.узорачка дисперзија. У оба случаја, за тачну нулту хипотезу, тест статистика Хо им а X2 расподелу са —1 степени слободе. К ритичн е области С зависе од алтернативних хипотеза и приказане су у табели: Н 0 о е I
^ ^ ^ = 0
с
Н г
2
а 2
2> : > г А
0
Х о < Х п- 1;|
V Хо > Х п—1;1—®
Х о > Х п—1-,\—а Х о <
Број ;а се одређује из таблице 2 расподеле. Н а прим ер, ако је = 30 и = 0,01, тада је Х гддог = 14,3. Закљ учак тестирањ а је следећи. А ко реализована вредност тест статистике упада у критичн у област, тада са прагом значајности закљ учујем о да је дош ло до пром ене вредности парам етра 2. У супротном , м ож ем о . см атрати д а није дош ло до пром ене вредности парам етра 2. - 1
128
СТАТИСТИКА
П ри м ер 74. У случајно узетим узорцим а воде из једног језера, испитан је садрж ај Д 20з (бор триоксида) и добијени су, у 1 : 100000, резултати: 45, 43, 37, 41, 41, 60, 58, 61, 60, 58, 60, 60, 61 и 58. П ретпостављ ајући д а садрж ај бор триоксида им а норм алну расподелу, тестирати хипотезу д а је дисперзија једнака = 100 са прагом значајности = 0, 01. Р еш ењ е. У зорак је обим а — 14, тако да је потребно одредити поправљ ену узорачку дисперзију. М ож ем о прим етити да узорак им а м али број различитих вредности, тако да се он м ож е табеларно средити на следећи начин. П ом оћна табела је 2
37 41 43 45 58 60 61 Е
и
1 1 2 1 3 4 2 14
9 и^г и*{
1369 1681 1849 2025 3364 3600 3721 /
37 41 86 45 174 240 122 745
1369 1681 3698 2025 10092 14400 7442 40707
И з табеле добијам о д а је узорачка средина једнака т 14 — 745/14 = 53,21, а поправљ ена узорачка дисперзија је ,2 _ 40707 '14~ 13
14 Тз
(53,21)'2 = 82,21.
Реализована вредност тест статистике при овим вредностим а ИСо = 100 је 13 •82,21 10,69. Хо = 100
О стаје још да одредим о критичну област. С обзиром да тестирам о (а — - 100), нулту хипотезу 100) против алтернативне ^ т0 Је Х 13;о,оо5= 3,57, Х 13;о,995= 29,8 и 3, 57 < 10,69 < 29,8, тако да прихвИ там о хипотезу да је дисперзија једнака 100. □ 0
2
2
П ри м ер 75. Н а узорку од 30 парцела једне области, агроном и су посм атрали утицај адитива на принос индустријског биљ а. Д обијени су следећи приноси: 61, 86, 65, 68, 50, 74, 80, 63, 50, 86, 81,
Т Е С Т И Р А Њ Е Х И П О Т Е ЗЕ О П А РА М Е Т РУ а 2
129
69, 67, 61, 70, 58, 82, 54, 71, 85, 85, 60, 84, 86, 51, 64, 63, 64, 64 и 76. Д а ли се на основу ових података са прагом значајности 0,05 м ож е рећи да је дисперзија приноса м ањ а од 150? Р еш ењ е. Т естира се нулта хипотеза ( = 150) против алтернативне хипотезе Д Д сг2 < 150). Н акон интервалног сређивањ а добија се следећа табела: 0
П ринос Б р. парцела
[50,56) 4
[56,62) 6
[62,68) 7
2
[68,74) 3
[74,80) 3
[80.86] 7
П рво треба израчунати реализовану узорачку средину и реализовану узорачку дисперзију. П ом оћна табела је: И нтервали [50,56) [56,62) [62, 68) [68,74) [74, 80) [80,86]
<
53 59 65 71 77 83 Е
/г 4 2809 6 3481 7 4225 3 5041 3 5929 7 6889 30 /
212 354 455 213 231 581 2046
11236 20886 29575 15123 17787 48223 142830
Т ада су узорачка средина и дисперзија редом једнаке: 2046 = 68-, 2, 30 142830 ч2 - (68,2)2 = 109,76. *30 — 30
2зо =
С ада се рачун а реализована вредност тест статистике: 2 Хо
30 ■109.76 150*
21,95.
К ако је 21,95 > 17,71, то одбацујемо хипотезу да је дисперзија м аљ а од 150, а прихватам о нулту хипотезу. □
130
6.1.4
СТАТИСТИКА
Т ести рањ е хи п отезе о сг2 к ад а је
познато
Н а крају тестирам о хипотезу о пром ени вредности парам етра ст2 у случају када је вредност парам етра позната. Т естирам о нулту хипотезу 0 ( 2 = 0), где је \ конкретан број, п ротив једне од алтернативних 0 (а 2 ф $), 0( 2 > сг^) или 0 (а 2 < а %). За случај познатог , користи се тест статистика .,„2 —
Е ( А Г * -т)2
која им а 2 расподелу са степени слободе, па се у том см ислу и критичне области разли кују од горе наведених, тј. разли кују се само у броју степени слободе. К ритичне области зависе од алтернативних хипотеза и приказане су у табели: \
0
: о к I Л ч I <
сг2 =
: к ) I С I
2
\
2 2 2
.
> <
Хо <
20 2
V > Х ;1 Хо > Х ;1— Хо < -
:
Закљ учак тестирањ а је исти као за претходно тестирањ е. П р и м ер 76. К ористећи податке из претходног при м ера и претпостављ ајући да је = 50, тестирати са прагом значајности = 0,01, хи потезу д а је сг2 = 100. Р еш ењ е. О дредимо суму Е (^» — ) 2 пом оћу следеће табеле: 37 1 41 1 43 2 45 1 58 3 60 4 61 2
(т.ј. —50)2 169 81 49 25 64 100 121 Е
<~ 50)2
169 81 98 25 192 400 242 1207
П И РС О Н О В х 2 Т Е С Т
131
Значи, реализована вредност тест статистике је о = 1207/100 = 12,07. Т естирам о хипотезу о (а 2 — 100) против алтернативне # 1(сг2 100). Зад ати праг значајности је Хгадооб = 4 ,0Т, х?4.о,9д5 = 31.3 и 4,07 < 12,07 < 31,3, ш то значи да прихватам о нулту хипотезу да је сг2 = 100. □ П ри м ер 77. М ерен је проценат заступљ ености м ин ерала у једној руди. Н а основу узорка обим а 10 дош ло се до следећих процената заступљ ености м ин ерала : 57, 54, 72, 64, 39, 22, 58, 43, 46 и 39. Д а ли се на основу ових података са прагом значајности 0,01 м ож е рећи да стандардн а девијација процента заступљ ености износи 15, ако је очекивани проценат познат и износи 50? Р еш ењ е. Т естира се нулта хипотеза 0(< 2 = 152) против алтернативне хипотезе \( 152). П рво треба израчун ати реализовану вредност тест статистике. С ум а у бројиоцу тест статистике је 2
Е (х 4 - 50)2 = + +
(57 - 50)2 + (54 - 50)2 + (72 - 50)2 + (64 - 50)2 + (39 - 50)2 + (22 - 50)2 + (58 - 50)2 + (43 - 50)2 + (46 - 50)2 + (39 - 50)2 = 1900,
тако да је реализована вредност тест статистике једнака 2 _ 1900 _ 8,44. ~ 152 К ако је 3,325 < 8,44 < 16,919, то се прихвата хипотеза 0, тј. дисперзија се не разликује значајно од 225, тј. стандардна девијација износи 15. 6.2
х2 т е с т
со
П ирсонов испитивањ е:
2
тест је непарам етарски тест који се користи за
- С агласности узорка са претпостављ еном расподелом : дат је узорак обим а из популације са обележ јем X и тестира се хипотеза да обележ је X им а расподелу чија је ф ун кција расподеле 0.
132
СТАТИСТИКА
- Н езависности два обележ ја: на основу узорка обим а тестира се хипотеза да су два обележ ја посм атрана иа истој популацији м еђу собом независна. 6.2.1
И спи ти вањ е сагласно сти узор ка са претпос тављеном расподелом
Т естира се нулта хипотеза да посм атрано обележ је X им а одређену расподелу, чију ће.мо ф ункцију расподеле означнвати са 0, против алтернативне хипотезе да нем а ту расподелу. П оступак тестирањ а је следећи: 1. У зависности од тога да ли је обележ је дискретно или апсолутно непрекидно, црта се тракасти дијаграм или хистограм релативних учестаности и на. основу тога се постављ а нулта хилотеза 0. 2. А ко изабрана расподела им а непознате парам етре, тада се они оцењ ују на основу узорка. 3. Реална права се дели на дисјунктних интервала 5\, 52, ..., 5 к. чија је уни.ја тачно Д , при чему се води рачуна да сваки интервал у себи садрж и најм ањ е 5 елем ената реализованог узорка. А ко постоје интервали који садрж е м ањ е од 5 елемеиата реализованог узорка, тада се они придруж ују суседним интервалим а. 4. И зрачунавају се теоријске вероватноће (и =
{Х
6 5'.,},
г = 1,2 .......
уз претпоставку да је нулта хипотеза
тачна.
0
5. И зрачун авају се очекиване апсолутне учестаности /, узорка обима , у сваком интервалу 5 ) /
‘П ' V Ог•
ПИРСОНОВ 6.
' Т Е С Т
133
И зрачун ава се реализована вредност тест статистике А.0 V 2
2 —
=
V
'
~
=1
?
'
»
/
при чем у је /; остварена апсолутна учестаност у интервалу 5). С татистика коју см о управо навели се м ож е записати и у облику који је неш то једноставнији за рачунањ е: к
2
хо= Е т ~пГ=1
Тест статистика има X расподелу са — 1степени слободе. А ко расподела им а I непознатих парам етара које см о оценили на основу узорка, тада тест статистика им а расподелу са к —I — 1 степени слободе. 2
2
7. О дређује се критичн а област величине Хо >
Х к - 1 ; 1 -а >
при чем у се вредност Х к - 1 ; 1 -а ч и т из таблице х 2 расподеле. У случају I непознатих парам етара расподеле ( ), критична ббласт је ■ 1 1 1 1 X I
8.
>
-
-
;
-
Д оноси се закљ учак о прихватањ у или одбацивањ у нулте хипотезе на основу реализоване вредности тест статистике Хо и добијене критичне области.
П ри м ер 78. (Н ор м алн а расп одела) П росечне годиш њ е падавипс у за м есто у А ф рици за период 1905-74 дате су следећом табелом П адавине [40; 50) [50; 60) [60; 70) [70; 80) [80; 90) 4 Бр. година 3 7 16 14 . П адавине Бр. година
[90; 100) 11
[100; 110) 9
[110; 120) 5
[120; 130) 1
134
СТАТИСТИКА
И спитати сагласност података са норм алном расподелом са прагом значајности а — 0,05. Р еш ењ е. О значим о са X годиш њ у количину падавина. О во обележ је је апсолутно непрекидно, тако да је потребно нацртати хистограм релативних учестаности. И з нацртаног хистбграм а се закљ учује да се м ож е посм атрати норм ална расподела (оетављ ам о читаоцу да нацрта хистограм и провери наш у тврдњ у). Значи, тестирам о хипотезу да обележ је X им а норм алну расподелу« Н орм ална расподела им а два парам етра и ст2, и како не постоји никаква претпоставка о вредностим а тих парам етара, то см атрам о да су они непознати и треба их оценити. П арам етар се оцењ ује узорачком средином = , док се парам етар <т2оцењ ује узорачком дисперзијом <т2 = 5 П. За дати узорак добијам о оцене парам етара и сг2: = 84,14 о 2 = 336,41.
•
П рем а том е, наш а нулта хипотеза гласи 0( има N ( 8 4 , 14; 336,41) расподелу).
С ледећи корак је подела реалне праве на ди сјунктне интервале. П рви интервал [40; 50) им а учестаност м ањ у од 5, тако да ћем о га придруж ити наредном интервалу, и тада добијам о интервал 5 = (-оо; 60) учестаности 7. С ледећи интервали су 8 2 = [60; 70), 8 3 = [70; 80), 64 = [80; 90), 65 = [90; 100) и = [100; 110) ^честаности 7, 16, 14, 11 и 9, респективно. У честаност интервала [120; 130) је м ањ а од 5, тако да ћем о овај интервал при друж ити претходном интервалу и тако добијамо још један интервал 8 7 = [110; оо) учестаности' 6. Зн ачи, реална права је подељ ена на 7 дисјунктних интервала. О дредим о сада теоријске вероватноће догађаја { X Е . }, за € {1,2,3,4, 5,6,7}. О бележ је X и м а норм алиу расноделу //( 84,1 4; 336,41), тако да је: потребно у току израчунавањ а вероватноћа изврш ити стандардизацију . . . X ~ 84,14 / 3 3 6 , 41. '
■
ПИРСОНОВ
135
2 Т Е С Т
У хом случ лучаају об обеележ је X* им и м а стандардиу норм алну ра рас споделу. П рва вероватно вероватноћа ћа је једн ака
=
{Х е 5 } =
{
< 6 0}
84,,14 _ 6 0 -8 4 ,1 4 ] X —84 л/336,41 ^ /336,41 Ј
= УЈ{А'* < -1 ,3 2 } =0 =0,0 ,0УУ 34.
О ст стале але вероватно вероватноће ће су су јед еднн аке
|
60 - 84,14 /3 / 3 3 6 , 4 1 ~
^ 7 0 -8 4 ,1 4 } /336,41
= Р{70 < X < 80 80} = Р |
7 0 - 8 4, 4, 1 4 ^ /3 / 3 3 6 , 4 1 -
. 80 -84 ,14} /336,41
80-84,14
_90 -84,14 }
р'{60 < X < 70} = 02 = р'{60 = 0,1272
= 0,1884 04
= Р{80 < X < 90 90} = Р |
/3 / 3 3 6 , 4 1
“
^ /336,41
= 0,2165 Р05 =
Р{90 < X < 10 100} 0} = Р
90 ~ 84,14 { /33 /33 6 7 4Г -
1 0 0 -8 4 ,1 4 } /336,41
= 0,1796 Р об
=
110-84,14 /336,41 _
Р{100 Р{1 00 < X
= 0,1156 Р07 =
Р05 5+ Р 1 —( 01 + 02 + Р з + Р04 + Р0
) = 0,07 0,0793 93..
П осле оследњ дњ а веро вероват ватнн оћа је из и зрачу рачунн ат ата а тако да д а зби збир р свих верова вероват тн оћа буде 1. О чекиван чекиване е апсолутн апсолутне е уч учес еста тан н ост остии и реализ реали зован ована а вредно вредност ст ■тест статистике се добијају из следеће табеле
136
СТАТИСТИКА
5, [—ос: 60) Г[ 60: 70) [ 70: 80) [ 80; 90) [ 90; 90; 100) [100; 110) [110; оо)
1-1
‘
0
7 0,0934
7 16 14 11 9 6
0,1272 0,1884 0,2165 0,1796 0,1156 0,0793
/: 6,54 8,90 13,19 15,16 12,57 8,09 5,55
(/, - /,)2 0,212 3,610 7,900 1,350 2,460 0,830 0,200 Е
(А -/0-/07 0,032 0,406 0,599 0,089 0,196 0,103 0,036 1,461
Н л крају одреди одредим м о критичн критич н у обла облас ст. Б рој и н те тервала рвала је А- = 7. орој^оцењ ених п арам ет етара ара је 2, а праг значајноети је 0,05, тако да ■Је А 7- 2- 1;о,95 — 9,49 И ка како ко је 1,46 1,461 1 < 9,49, то пр прии хва хваттам о нулт нултуу хмпот хм потеезу да су су подаци саг саглас ласни ни са нор норм м алн лном ом ра расподелом споделом . □ П ри м ер 79. (П уасон уасонова ова распо расподела) дела) Д а ли се се са пра праггом зна знача чајјатрат рати и да д а ра расподела сподела де деце це из при примм ера 55 пости о = 0.05 м ож е см ат уассонову рас распод поде елу? има П уа Р еш ењ е. Н ека об обе ележ је X предст представ ављ љ а бро бројј де деце. це. Т естирам о хипо хи поттез езуу да д а обележ је X им и м а П уа уас сонову ра расподе споделу. лу. П уа уассонова ра рассподеела им а један п арам под арамет етар, ар, А , и у овом овом п ри римм еру он је непознат непознат.. П ара арамм ета тар р А се се оце оцењ њ ује уз узора орачком чком сре редин дином ом А = . С ре редина дина датог узорка је из и зрач рачун уната ата у при рим м еру и јед едн н ака је 1,55, тако да је оцсмм а пара.м оцс пара.м ет етра ра А = 1.55. У том случају, п отпу отпунн а нуд нудтта хи хипо поте тезза гласи о ( им а 1,55) ра рас сп оде оделу). лу). Н аре ареди диии кор корак ак је подела по дела реа реалн лне е праве н а ди дисј сјун унктн ктнее инте ин тервале рвале.. В оде одећи ћи рачун р ачуна а о ап солутним учес учеста тан н ост ости и м а и н те тервала, рвала, реалну реалну праву поделим о на ш ест ди дисј сјун унктни ктних х и н те тервала рвала = ((— —оо; 1), 52 = [!■-). ~ [-[--^) ^)|| 5.[ = [3; [3;4), 4), ,$5 = [4; [4; 5) и 5ц 5ц = [5;с» [5 ;с»)). А чест честаности аности нпте нп тервала рвала су ре редом дом 23 232, 2, 313, 313, 360 360,, 130, 130, 52 и 13. 13. О дреди дредимм о са сада да теоријске вероватноће догађаја { X € З Ј, за е {1, 2, 3,4, 5, 6}. П рва вероват вероватнн оћ оћа а је једн еднака ака Р01 =
0{ е 5 Ј =
{
< 1} =
{ = 0} =
1,55° 0!
-1,55
= 0,21.
П И Р С О Н О В X2 Т Е С Т
137 137
О стал стале е верова вероват тн оће су једнаке 1,551. . е-1.98 = Р02 = 0, 0, 326 = 1} = 1! 1,552 . е-1,55 = 0{ Х 6 У з} = { = 2 } = Р оз = = о, 252 2! 1, 553 . е~1,55 = 0 { Х е У 4} = { = 3 } = 04 = = о, 13 3! 1, 554 0{ Х 6 5б} = { = 4 } = ■е-1,55 == о, 051 05 = 4! —0, 031. = 1 - (Р 01 + Р 02 + V оз + .Р 0 4 + Р 0 5 ) —0, =
=
6
0{ Х
{
О чекиване апсолутне ап солутне учес уч ест тан ости ости и реализ реали зована вредност вредн ост тест тест статистике се добијају из следеће табеле и
$ [—о о ; 1) [1:2) [2; 3) [3; 4) [4; 5) [5; оо)
( л - и ?
232 232 313 360 360 130 130 52 13
<- ? п
0,210 231,0 0,326 358,6 0,252 277,2 0,130 143,0 0,051 56,1 0,031 34,1
1,00 0,004 2079,36 5,799 6855,84 24,732 169,00 1,182 16,81 0,300 445,21 13,056 Е 45,073 . О дредим дредим о још и кри крит ти чну чн у обла облас ст. Б рој инт ин тервала рвала је = 6, број број оцењ оц ењ ених ени х пар п арам ам етара етара је 1, а праг пр аг зн ачајн ости је 0,05, тако тако да д а је Х б-1- 1;о,95 = 9,49 9, 49 и како како је 45,073 45, 073 > 9,49, 9,4 9, то одбацујемо ем о нулту нулту хипо хи пот тезу езу д а су подаци саг сагласни ласни са П уас уасоновом распо расподелом делом . □ 6.2. 6.2.2 2
И сп и ти вањ вањ е неза независности висности два обележ ја
П ирс ир сонов он ов х2 х 2 тест тест се корист кор исти и и за и спит спи ти вањ вањ е н езав езави и сн ости ости два д ва обележ об ележ ја X и . Н улта ул та хип хи п отеза отеза је и
о{
су нез н езависн ависна а обележ ја),
а алтерн алтер н ативн ати внај аје \{
У зорак орак обим а
и
нису н ису нез н езав ави и сна обележ ја).
је задат задат табелом табелом контин кон тинг генци енц и је
СТАТИСТИКА
138 \
ј2
л Л ј Л« / 2в /г.
/12 /21 / 22 /и
1
/г2 /.2
/н /•1
1
/ .
/ .
/«
П
где с:у \, ..., 1 , и . . Ј в конкретни бројеви или интервали, /у је број појављ ивањ а пара (Д , ) у реализованом узорку, /,. = / + / г2+ ■• • + / и . = / у + / у + ... + / . Т ест статистика је облика САј - /»ј);
хо = Е Е
/
=1 ј= 1
где је / у очекивани бројпарова (Д , Јј) и израчун ава се по ф орм ули ;
■ /;• ■/«ј ~
п
;
С татистика Хо им а X2 расподелу са (г —1)(з —1) степени слободе. К ри тичн а облаС т је 2 ч
2
Хо —Х (г— 1)(«—Г);1 — о ' Н а крају доносим о -закљ учак о одбацивањ у или при хватањ у нулте 'хипотезе. Тест статистика о с м ож е записати у облику- који је једноставнији за рачунањ е: ( г 1
=
$
V1 2_/ Ј—1
(2 ~а с ; г
и=1 ј =1 Ј1»Ј ч
П р и м ер 80. У узорку од 1000 закљ учених бракова је било врем е закљ учењ а брака м есто пролеће,- лето јесен, зим а град 125 365 • село 175 335
П И РС О Н О В X2 Т Е С Т
139
Т естирати хипотезу о независности м еста и врем ена закљ учењ а брака за а = 0,05. Р еш ењ е. Т естирам о хипотезу да^су обележ ја м есто закљ учењ а брака и врем е закљ учељ а брака независна против алтернативне да су зависна. Т абела контингенције је облика врем е закљ учењ а брака пролеће, лето јесен, зим а Е 125 365 490 175 335 510 300 700 1000
м есто град село Е Суму
ЕЕ најлакш е м ож ем о и зрачунати пом оћу следеће табеле: /2
/?2
/
./.1
./.
/22
/ 21
/ ./ « 2
За наш прим ер, пом оћна табела је облика 1253
490-300 1752 510-300
3652 ’
490-700 3352
односно
510-700
0,106 0,200
0,388 0,314
Збир вредности свих ћелија даје траж ену суму 1,008. Реализована вредност тест статистике је тада Хо = 1000 -(1,008- 1) = 8. О стаје још да одредим о критичну област и н а основу њ е д а донесем о закљ учак о прихватањ у или одбацивањ у нулте хипотезе. К ако је 2, то из таблице расподеле читам о вредност Х 2;о,95Д обијам о да је тра^кена вредност 3,84 и како је 8 > 3,84, то прихватам о алтернативну хипотезу, односно закљ учујем о да су м есто и врем е закљ учењ а брака зависна обележ ја. □ т
— з
=
2
140
СТАТИСТИКА
П ри м ер 81. Ж елим о да тестирам о хипотезу да је м арка аутомобила иезависна од пола власника. У том циљ у случајно је изабрано 350 власника и добијена је следећа табела марка пол А Б Ц м уш ки 40 80 30 ■ж енски 30 120 50 Д а ли се са прагом значајности = 0,01 м ож е см атрати да је м арка аутом обила независна од пола власника? Р еш ењ е. Т естирам о хипотезу да су обележ ја м арка аутом обила и пол власника независна против алтернативне да су обележ ја зависна. П раг значајности износи 0,01, = 2 и 5 = 3. Т абела контингенције је пол муш ки ж енски Е
А 40 30 70
марка Б 80 120 200
Ц Е 30 150 50 200 80 350
а пом оћна табела је 40 2 150-70 ,103 200 70
80 2 150-200
1202 200-200
зо 2 150-80 50 2 200-80
односно
0,152 0,064
0,213 0,36
0,12 0,156
Збир вредности ћелија горњ е табеле је 1,065, тако д а је реализована вредност тест статистике једнака Хо = 350 -(1,065 - 1) = 22,75. К ако је 22,75 > 10,6, то одбацујемо хипотезу о независности м арке аутом обила од пола власника. □
I
ш
•.'I •1•
У великом броју експерим ената уочава се веза изм еђу две или виш е пром енљ ивих, као на прим ер, изм еђу.степена ерозије и количине падавина, изм еђу ш ирине реке и м аксим алног годиш њ ег протицаја, или изм еђу броја рођене деце по ж ени, нивоа образовањ а и врсте запослењ а. У таквим случајевим а, траж и се ф ункција која ће најбољ е представљ ати ту везу. П роблем се састоји у налаж ењ у везе изм еђу посматраних пром енљ ивих. Т ачније, ако посм атрамо обележ ја ^, - 2 , ■., и У , тада траж им о ф ункцију <р(х1:Х2, ....... ) за коју ће бити (7.1) 2 ....... р ). ^<р ( Ј. . ‘1
Ф ункција ср се бира тако да средњ еквадратно одступањ е у озиаци (У -џ > (
2 , . . . ,
р ) ) 2
•
_ /
буде најм ањ е. Д обијена ф ункција ц> се зове регр еси ја по .. : 1јЈ‘() , . . ., . Н ајједноставнија регресија је јед н острука р егреси ја, када се посм атрају две пром енљ иве и X прем а критеријум у (7.1). Т раж и се ф ункција џ> таква да је « >( ). С ам а ф ункција џ> се бира на следећи начин. И з популације се издваја реализовани узорак ((^пУ г), (^2, 2/2)1• • •, ( , )) и представљ а се у Д екартовој равни. Затим се на основу добијеног дијаграм а, који се зове ди јагр ам расту рањ а, бира ф ам илија ф ункција са којом ће се радити. И ’()'лм ери неких дијаграм а растурањ а представљ ени су на слициа'к<1“ П рем а ди јаграм у'са слике бирам о за случај а) линеарну ф ункцф ј'? = ае61', док је з1ачв'ј — х + 6, за б) експоН енцијалну ф ункцију дббро узети логаритам ску ф ункцију ' — 1о§(ж) + 6. П осле •' ’ ’ . ;• ' •'•ННО . ,Јвс;ч ■ • ' '141 " ' Н.БС10
142
СТАТИСТИКА
прим ењ ујем о критеријум (7.1) д а бисм о одредили вредности парам етара рргрроије и 6.
7.1
ЈТ
е
н
егр еси
К од н еких експерим ената се као зависност обележ ја X и јављ а линеарна ф ункди ја — + 6, тј. јављ а се зависност облика = + 6, где су а и 6 непознати парам етри који се одређују из услова да је средњ е-квадратно одсТупањ е ( — Х — најм ањ е. О дене посм атраних парам етара су: 2
- =
.
-$ .
I =
У п -
п . '
. <
тх?-1(т,х<)2 '
П осм атрана лин еарна зависност изм еђу обележ ја X и зове се ли н еарн а регресија пр ве врсте по X , односно регресцја случајн е пром енљ иве по случ ајн ој п ром енљ и вој X . В ред^ + 6 је пр од ен а в ред н ости нбст К добијена као ] = на основу вредности ±. П риликом одређивањ а линеарне регресије прве врсте (и уопш те било које регресије)- м ож е се рачун ати греш ка оц ењ и вањ а која садрж и инф орм ацију о том е колико изабрана ф ункција добро апроксим ира зависност обележ ја по X .
Е А Р Н А
О на се означава са $ _
Е Г
143
Е С И
и деф иниш е као
4-?
1=1
(« - * ) ’■
У колико је узорак м али, тада се рачуна поправљ ена греш ка оцењ ивањ а као 3
У -У =
^ (у*-
•
П ри м ер 82. Н а основу м ерењ а претпролећног м иним апног средњ ем есечног нивоа подзем них вода (X), и средњ ег годиш њ ег нивоа (У ) у годинам а 1952-1958. добијено је X
19,51 19,02 17,57' 17,66
19,04 18,74
15,80 14,48
17,52 15,44
15,96 13,92
16,31 15,22
О дредити праву лииеарне регресије по X и на основу њ е прогнозирати за и з а д е р е н вредност — 16,9.9 у 1959,. години. И зрачунати греш ку оцењ ивањ а. ' Р еш ењ е. П отребне сум е добијам о из следеће табеле: -
Е
'
Х
19,51 17,57 380,64 342,79 19,02 17,66 361,76 335,89 19,04 18,74 362,52 356,81 15,80 14,48 249,64 228,78 17,52 15,44 306,95 270,51 15,96 13,92 254,72 • 222,16 16,31 15,22 266,02 248,24 123,16 113,03. 2182,25 2005,18
К оеф ицијенти праве линеарне регресије су: 2005,18 - ± • 123,16 • 113,03 2182,25 - | - (123,16)2 - 1’076’ ' 6
7
7
144
СТАТИСТИКА
тако да је траж ена права линеарне регресије V = 1, 076 • X —2, 784. Н а основу праве линеарне регресије процењ ујем о да је 1959. године средњ и годиш њ и ниво био 1/(16. 99) = 1,076 • 16, 99 - 2,784 = 15,50. О дредим о још греш ку оцењ ивањ а следећом табелом X,
'Уг
19,51 19,02 19,04 15,80 17,52 15,96 16,31
17,57 17,66 18,74 14,48 15,44 13,92 15,22
Т = 1, 076 •
18,21 17,68 17,70 14,22 16,07 14,39 . 14,77
- 2, 784
(Уг ~ Уг)~
0,4096 0,0004 1,0816 0,0676 0,3969 0,2209 0,2025 2,3795
Греш ка оцењ ивањ а је \ _ 9 = 2»2р = 0,3966 и како је она м ала у односу на вредности обележ ја , то закљ учујем о да смо добро апроксим ирали зависност обележ ја У по X. О
С лика 7.2: Д ијаграм растурањ а из претходног прим ера и одговарајуће линеарне регресије. У неким случајевим а је потребно одредити линеарну регресиЈУ ^ п0 ^ 4 О на је облика X = У + <1, где су с и с1 непознати
Л И Н Е А РН А Р Е Г Р Е С И ЈА
145
параметри који се одређују из услова да средњ еквадратно одступањ е ( — — .)2 буде најм ањ е. О цене парам етара с и в. су тада: с = & =
Е У ' 2 - ± ( Е У ;)2 ' -с У
.
И у овом случају се м ож е рачунати греш ка оцењ ивањ а. О значава се са и деф иниш е као
4 - * - г ЕГ=1 Н аравно, ако је узорак м али тада се рачуна поправљ ена греш ка оцењ ивањ а: 5' -
±
^
- ц
.
1 1=1
П ри м ер 83. За претходни прим ер одредити праву линеарне регресије X по V и израчунати греш ку оцењ ивањ а. Р еш ењ е. П ознате су нам све суме, осим суме Е ?- С абирањ ем квадрата реализованих вредности обележ ја добијам о траж ену суму Е \2= 1845, 25. С ада м ож ем о одредити коеф ицијенте с и : 2005,18 - 1 • 123,16- 113,03 = 0,819, 1845.25 - 1 ■(113,03)2 123,16 113,03 - 0,845 4, 370., 7~
П рем а том е, траж ена права линеарне регресије X по V је облика X — 0, 819 ■V + 4,370. О дредим о још -греш ку оцењ ивањ а. П оново користим о пом оћну.табелу:'
146
СТАТИСТИКА
19,51 19,02 19,04 15,8 17,52 15,96 16,31
Тј = 0,819 • { + 4,37 17,57 18,76 17,66 18,83 18,74 19,72 14,48 16,23 15,44 17,02 13,92 15,77 15,22 16,84 . Е
Т раж ена. греш ка оцењ ивањ а је
(Т{ - ) 2 0,5625 0,0361 0,4624 0,1849 0,2500 0,0361 0,2809 1,8129
■■'■8ј2-9- = 0,3022. □ —
У неким ситуацијам а се посм атра обележ је V које зависи од контролисане, неслучајне, пром енљ иве . Н а прим ер, м ери се тем пература воде на одабраним дубинам а, прати се при раш тај становниш тва једне регије у зависности од календарске године итд. У таквим ситуацијам а, веза изм еђу обележ ја и контролисане, неслучајне, пром енљ иве се представљ а лин еарни м м оделом У = ах + 6 + е,
(7.2)
где је случајна пром енљ ива, која се најчеш ће идентиф икује као греш ка м ерењ а. За случајну пром енљ иву се претпостављ а да им а м атем атичко очекивањ е 0 ( ( ) = 0) и дисперзију ст2 0 {е ) = с 2). П арам етри и 6 су непознати и одређују се тако д а је средњ еквадратно одступањ е {У — - 6)2ш ајм ањ е:
I =
Е ® ? - * (Е * < ) а п —а х . I
’
Регресиони м одел (7.2) зваћем о л и н еар н а р егреси ја д руге врсте V по , односно регреси ја случ ајн е пр ом ен љ и ве по контролисаној пром енљ ивој . П р и м ер 84. У лов м орске рибе (у тонам а) у наш ојзем љ и у периоду 1994-1998. 'године представљ ен је следећом табелом :.
Л И Н Е А Р Н А Р Е Г Р Е С И ЈА
Година У лов { )
1994 264
1995 374
1996 383
147
1997 373
1998 416
И звор: С тат. год. Југ., 1999., стр. 219 (извод из табеле) О дредити линеарну регресију друге врсте улова м орске рибе по годинам а и израчунати греш ку оцењ ивањ а. П роценити колики ће бмти улов 2003-. године, Р еш ењ е. К ао и код линеарне регресије прве врсте, тако и овде користим о пом оћну табелу: Х
Е
1994 1995 1996 1997 1998 9980
264 374 383 373 416 1810
3976036 .526416 3980025 746130 3984016 764468 3988009 744881 3992004 831168 19920090 3613063
О цене парам етара о. и 6 су тада:
6
3613063 - ± 9980 ■1810 = 30,3 19920090 - ±(9980)2 1810 9980 -30,3 = -60116,8.
Т раж ена линеарна регресија друге врсте је = 30,3 ■ —60116,8 4- е. Греш ка оцењ ива?ва је 52 = 1011,275 и како је она велика у односу на вредности обележ ја У , то следи да за ове податке линеарна регресија није најбољ а прогноза. Н а основу добијене праве линеарне регресије процењ ујем о да ће 2003. године бити уловљ ено 2/(2003) = 30,3 ■2003 —60116,8 = 574,1 тона м орске рибе. □ У случају великих вредности пром енљ иве , као када је реч о годинам а, рачун се м ож е поједноставити увођењ ем см ене = - , . где је вредност изабрана тако да поједностави рачун. Т ада се
148
СТАТИСТИКА
оцоне парам етара а и Ј регресионог м одела = узорком ((^ 1, 2/1), . . . , (2 , )) и облика су: а
=
6
=
+
оцењ ују
^ уЈ-^гјТ.Уј п — (гп +
) .
Т ако за претходни прим ер, ако уведем о см ену ћем о следећу табелу: Х г
Уг
1994 1995 1996 1997 1998 Е-
264 374 383 373 416 1810
2, -2 4 -1 1 0 0 1 1 2 4 0 10
зоз 10
=
- 1996, доби-
+У г
-528 -374 0 373 832 303.
С ада једноставно м ож ем о оценити парам етре
I
+ I
и I:
= 30,3
1810
-30 ,3'19 96 = -60116,8.
Д обили см о исте оцене као у претходном прим еру, тако да је и линеарна регрееија друге врсте иста. М ож е се посм атрати и зависност једне пром енљ иве од виш е пром енљ ивих ^, 2, — Т аква зависност зове се ви ш еструка регреси ја. П рим ер виш еструке регресије била би лин еарна регреси.ја од две пром енљ иве, тј. линеарна регресија облика У =
Х + 62 + с .
Н епознати парам етри , 6 и м огу се оценити м иним изацијом средњ еквадратног одступањ а (
— Х —62 -
)2.
Л И Н Е А РН А Р Е Г Р Е С И ЈА
149
О цене посматраних парам етара се добијају реш авањ ем систем а норм алних једначина аЈ 2 Х г + 6 ^ 2 {+ сп =
аЕ ^ « + * Е ^ 2+ с Е ^
=
]ГУ*
Е
^
П ри м ер 85. Н а северозападу Н усије је испитиван предпролећни м иним ални средњ ем есечни ниво подзем них вода (У ) у испод И опрш иие зсм љ е, у зависности од средњ ем есечног нивоа за децсмбар претходне године (X) и средњ ем есечне тем пературе за период децем бар-ф ебруар (2). И з једне буш отине је током врем ена добијено год. 1958 1959 1960 1961 1962 1963
У' 1,17 1,52 1,94 1,68 1,93 1,42
X 0,89 1,39 1,63 1,54 1,86 1,05
-6 ,7 -6 ,3 -9 ,5 -2 ,3 -5 ,6 -10,7
У год. 1964 1,80 1965 2,02 1966 2,42 1967 1,88 1968 2,46 1969 2,34
' 2 X 1,49 - 7 , 2 1,86 -6 ,5 2,19 -1 2 ,0 1,74 -10,0 1,69 -1 2 ,0 1,45 -9 ,9
О дредити виш еструку регресију V = Х + 2 + с . Р еш ењ е. О дговарајуће суме су редом једнаке Е У = 18,7 8 , Е = ~ 98, 7, Е = 22, 58, Е 4 = 30, 7768, Е -,2 = 906, 07, Е х,т, = —156.531, Е^«*/; = 36,5449 и Е +У — —192,327. Т ада је систем норм алних једначина облика 18,78а —98,76 + 12с = 22,58 30,7768а - 156, 5316 + 18,78с = 36,5449 —156, 531а + 906, 076 —98,7с = -192,327 Реш ењ а систем а норм алних једначина су = 0,792, 6 = -0,053 и с = 0, 208, тако д а је виш еструка регресија облика V = 0. 792А ' 0.0532’+0,208. □
150 7.2
СТАТИСТИКА ар
и
м
де
и
ави
н
сти
О сим горе описаних најједноставнијих м одела регресије који су били линеарни не сам о по парам етрим а и 5, већ и по контролисаном ф актору (регресија друге врсте) или случајном ф актору X (регресија прве врсте), посм атраћем о још неке м оделе који се .једноставним трансф орм аци јам а могу да сведу на претходне. Т акви м одели се зову нели н еарн и м од ели зависности , О д нелинеарних м одела зависности посматраћем о оне који се пригодним трансф орм ацијам а могу свести на линеарне м оделе. Т акви су: - м одел линеаран по парам етрим а, - стегхени м одел, и - експоненцијални м одел. Н елинеарни м одели м огу бити прве и друге врсте. К од нелинеарних м одела прве врсте посматра се нелинеарна завиС ност изм еђу обележ ја и X , док се код м одела друге врсте посмјатра нелинеарна зависност изм еђу обележ ја и контролисане пром енљ иве | . 7.2.1
.М одел ли н еаран по парам етрим а
М одел линеаран по параметрим а прве врсте је облика =
( ) + 5,
где је 'д унапред позната ф ункција од случајне пром енљ иве X , а и 6 су непознати парам етри. М одел се см еном 2 = д ( ) своди на линеаран м одел прве врсте У =
2 +
Н епознати парам етри и 6 се оцењ ују на основу узорка ((2 , \), (22, К2), ..., (2 , )) који је добијен трансф орм ацијом 2\ = ( {),
М О Д Е Л Л И Н Е А Р А Н П О П А Р А М Е Т РИ М А
151
•/ = 1 ,2 ,... .п, почетног узорка ( № , У ^), ( Х 2, 2),..., ( О цене парам етара и 6 регресионог м одела V = 2 + 6 су: - ±
2 2
? -
2 1
(
,
)).
’
% )2
п —а ■ 2 п .
том случају, почетни регресиони м одел је облика V = а д ( ) +
М ож е се посм атрати и м одел регресије друге врсте. О н је облика =
(х ) + 6 + ,
где је унапред позната ф ункција од контролисане случајне пром енљ иве , и 6 су непознати парам етри, а је греш ка м ерењ а. И овде се користи см ена = ( ) и тада се модел своди на линеарни м одел друге врсте V = + 6 + . Регресиони м одел је тада V = ос + I) + г. при чем у су и I оцене парам етара и 6 одређене на следећи начин:
ЕгјУј-^Егј-ЕУј _ Е
? -±(
* ) 2
'
^ % 1 ■ П ри м ер 86. О дредити регресиону криву = а 1о§Х +6 везе изм еђу ш ирине реке и м аксим алног годиш њ ег протицаја X (у 3 /з ), на основу узорка од 10 река:макс. протицај ш ирина реке
5,7 63
17 260
22 92
31 230
50 720
61 890
85 2500
120 1150
12 93
19 210
Р еш ењ е. Д ати модел је линеаран по парам етрим а. С м еном 2 = 1о§ X своди се на линеаран м одел прве врсте = 2 + 6. П отребно је да одредим о оцене парам етара и 6. К ористим о суме Е + и 2%, које најлакш е одређујемо из следеће табеле: Е
,
152
СТАТИСТИКА
+ = 1ое х,~ 0,756 47,628 1,230 319,800 1,342 123,464 1,491 342,930 1,699 1223,280 1,785 1588,650 1,929 4822,500 2,079 2390,850 1,079 100,347 1,279 268,590 14,669 11228,039
5,7 63 17 260 22 92 31 230 50 720 61 890 85 2500 120 1150 12 93 19 210 6208 Е
.2
Л'
0,572 1,513 1,801 2,223 2,887 3,186 3,721 4,322 1,164 1,636 23,025
У зим ајући из табеле потребне суме, добијам о да су реализоване вредности оцена. и редом: 11228,039 - ^ •14,669 •6208 23,025 - ^ •(14, 669)2
6208 14,669 - 1407, 739 • "иГ” 10
= 1407,739, 1444,21,
тако да је регресиона права изм еђу обележ ја У и 2 облика У = 1407,739 • —1444,21. 2
К оиачно, регресиона кри ва којом се описује веза између ш ирине реке и м аксим алног годиш њ ег протицаја је У = 1407,739 ■1о§ X - 1444,21. □
7.2.2
С тепени м одел
С тепени регресиони м одел прве врсте је облика У
= дХ
,
где су и 5 константе које треба оценити на основу узорка. Л огаритм овањ ем леве и десне стране горњ е једначине, добија се једначина '
...
1пК = а.1пХ + 1пК
С ТЕП Е Н И М О Д ЕЛ
153
А ко уведем о см ене 2 — 1пАТ, — 1пИ и = 1п6, тада добијамо линеарни модел прве врсте облика IV =
2 + с,
којим се описује зависност изм еђу обележ ја V/ и . О цене парам етара а и с с е оД ређују на основу узорка ((2 , У /{),..., ( 2 ) \ )) који је добијен трансф орм ацијам а Д, = 1пХ ; и Ж,- = 1пУЈ, = 1,2 ....... . почетног узорка ( № , ) ,. .. , (Х п, К г)): 2
- =
Е
2 № -
I Е
2
Е 1
_ Е Д ^ ( Е Е - ) 2 с
=
’
н 7,, - а д п .
Н а основу оцене парам етра с м ож ем о оценити и парам етар 6 као 6 = ес. К оначно, траж ени регресиони м одел је облика
V = 1хћ . А налогно се м ож е посм атрати степени м одел регресије друге врсте. О н је облика V = + , где су и 6 константе које треба оценити на основу узорка. Н епознати парам етри степеног м одела друге врсте се оцењ ују на исти начин као и код м одела. прве врсте. П ри м ер 87. Н а обали залива се испитује влаж ност м уљ а (у грам им а воде на 100 грам а суве м атерије). И з једне буш отине је добијено дубина ( ) влаж ност ( )
1,5 84
3 50
4,5 32
6 28
7,5 24
9 23
10,5 20
О дредити регресиону криву = + . Р еш ењ е. М одел који се посм атра је степени м одел друге врсте. Реализоване вредности оцена непознатих парам етра добијам о из следеће табеле:
154
СТАТИСТИКА ■X,
У г
1,5 3 4,5 6 7,5 9 10,5
84 50 32 28 24 23 20 Е
, =
1п X, 0,405 1,099 1,504 1,792 2,015 2,197 2,351 11,363
~2 1п Уг 4,431 0,164 3,912 1,208 3,466 2,262 3,332 3,211 3,178 4,060 3,135 4,827 2,996 5,527 24,45 21,259
> =
ггш,1,795 4,299 5,213 5,971 6,404 6,888 7,044 37,614
У том случају, реализоване вредности оцена непознатих парам етара су 37,614 —| • 11, 363 • 24,450 = -0,738. 21,259- А (11,363)2 24,450 л 11,363 „ с = — — ' + 0,738 - - у — = 4,691, 6 =
е4,691 = 108,962,
тако да је степени м одел друге врсте облика V =
7.2.3
108,962 • аГ 0-738 +
.
□
Е кспо н ен ци јалн и м одел
Е кспонецијални м одел је облика У
—б е а Х ,
где су и 6 константе које треба оценити на основу узорка. Л огаритм овањ ем леве и десне стране горњ е једначине добија се једначина облика ■1п У = + 1п . А ко уведем о см ене IV = 1пУ и с = 1п6, добићем о линеарни м одел прве врсте облика + с, V/ =
Е К С П О Н Е Н Ц И ЈА Л Н И М О Д Е Л
којим се израж ава зависност изм еђу обележ ја IV и м етара линеарног м одела прве врсте V/ по X су:
155 X.
О цене пара-
О вим см о оценили непознати парам етар експоненцијалног модела, док се други непознати парам етар 6 оцењ ује пом оћу оцене парам етра с као 6 = е°. М ож е се посм атрати и експоненцијални м одел друге врсте. О н је облика У = деах + ,
где се парам етри и 6 м одела оцењ ују слично као ш то су се оцењ ивали парам етри експоненцијалног м одела прве врсте. П ри м ер 88. О дредити регресиону криву У = бе®* + за податке из прим ора 87. Р еш ењ е. Д ати м одел је експоненцијални м одел друге врсте и реализоване вредности оцена непознатих парам етара се добијају из следеће табеле: Ж јШ ј 6,647 2,25 1,5 84 4,431 11,736 3,912 9 3 50 20,25 15,597 3,466 4,5 32 19,992 3,332 36 6 .28 3,178 56,25 23,835 7,5 24. 28,215 3,135 81 9 23 2,996 110,25 31,458 10,5 20 24,45 315 137,48 Е '42 / Реализоване вреД ности су редом е
с 6
" ? н 5 5
137,48 —| • 42 *24,46 -0,146, 7 315 - | (42)^ 24,45 + 0,146 • — = 4,369, 7 е4,369 == 78,965, I
156
СТАТИСТИКА
тако да је траж ена регресиона крива облика V =
78,965 • е-0'1461 +
.
□
А н ал и за п р о с то р н о г.р асп о р ед а
тачака Е лем енте популација као ш то су градови, рудна налазиш та, објекти у оквиру градова, карактериш е и полож ај у посм атраној области. П олож аји посм атраних елем ената се представљ ају тачкам а (%, ), где представљ а прву, а другу координату. И нтересује нас просторни разм еш тај тачака и њ егове карактеристике. У ту сврху, посм атрамо дводим ензионално обележ је ( , ), где су X и координате елем ента у посм атраној области. П рво пгто нас интересује је растојањ е између два елем ента. П осм атраћем о М енх етн и Е ук ли дово растојањ е. М енхетн растојањ е се зове још и растојањ е ти п а градско г блока. О но представљ а дуж ину најкраћег пута изм еђу две тачке у граду чије се улице секу под правим углом . Н азив је добило прем а урбанистичком реш ењ у острва М енхетн као градске четврти Њ ујорка. За две тачке = ( х а ,У а ) и В = (хв ,Ув) М енхетн растојањ е се деф иниш е као број & ( ,
) = \х
— \ .+ \ ~ в \-
Е уклидово растојањ е представљ а најкраће растојањ е изм еђу две тачке у равни. За дате тачке А и В , Е уклидово растојањ е се деф иниш е као број ;
) -\
(
“
в)2 + ( А ~
вУ .
Е уклидово растојањ е заправо представљ а дуж ину ваздуш не линије изм еђу две географ ски одређене тачке и . 157
*
158
СТАТИСТИКА
С лика 8.1: М енхетн и Еуклидово растојањ е изм еђу тачака
и .
П омоћу М енхетн растојањ а м ож е се деф инисати п ро сечн о град ско растојањ е. Н ека су дате тачке = { х , у , 2 = (х 2, 2), п = ( „, п), и нека-је 0 — (х 0 , 0) произвољ на тачка у граду. П росечно градско растојањ е тачке 0 до осталих тачака у граду је број __ 1 « <% ( ) — — ( , 0). 71 1=1
0
растојањ е је ниш та друго до средина М енхетн растојањ а тачака и Г, %= 1, 2,... ,п .
П ри м ер 89. Н ека су дате тачке А = (3,7), 2 = (6,3), Л 3 = (4,0), = (2,7) и 5 = (6, 6). О дредити просечно градско; растојањ е тачке Л 0 = (5,4)' од датих тачака. Р еш ењ е. Н ајпре одређујем о М енхетн' растојањ а изм еђу тачака 0 и , {, = 1 , 2 , . . . , п : & ( \, ^м ( А
2, А
0) = 0)
|3 - 5 | + |7 - 4 | = ' 5 , = Јб. —5| + |3 —4| = 2,
Ф и(Л 3, Л 0) = • |4-5| + 0 —4| = 5, . • <^ ( А , 0) = |2 —5| + |7 —4| = 6, <^ м (А 5, 0) = |6 —5| + |6 —4| = 3.
М Е РЕ Ц Е Н Т РА Л Н Е Т Е Н Д Е Н Ц И ЈЕ
Т ако добијамо да је просечно градско растојањ е тачке тачака у граду ■ - (
8.1
е
159 0
до осталих
) — —(5 + 2 + 5 + 6 + 3) = 4,2. □
о
тр а
н е те
ден
П осм атра се дводим ензионално обележ је (X, V) које представљ а полож ај елем ента популације у посм атраној области. Н аш задатак је да нађем о тачку која ће бити карактеристична за читаво дводим ензионалио обележ је. П остоји виш е таквих тачака у зависности од захтева. Једна од тачака које се посм атрају је м ед и јан ски ц ен тар и разликујем о два м едијанска центра, у зависности од тога које растојањ е посм атрам о. Д еф и н и ц и ја 18. '
е ка е п а ч а к а н а н е с н о н а к а р у и н ек а х д и ја н а а п р в , а у м д и ја н а з а д р у е к о о р д и н а т е а ч а к а . ). д и ја н с к и ц е н т а р је т а ч к а М х ,у — ( ,
А ко посм атрам о тачке из претходног прим ера, тада је м едијана првих координата = 4, других координата је у = 6, тако да је м едијански центар тачка х , = (4,6). М ож е се успоставити веза изм еђу овако деф инисаног м едијанског центра и просечног градског растојањ а. Н аим е, м едијански центар ј'е тачка са најм ањ им просечним М енхетн растојањ ем до тачака , . . . , . А ко се посм атра Еуклидово растојањ е, тада се м едијански центар деф иниш е као тачка са најкраћим (ваздуш ним ) путем до скупа тачака А , 2, ..., , тј. као тачка за коју важ и: 2
1=1
(
)<
1=1
(
А ),
где је произвољ на тачка. С ам о одређивањ е тачке је иначе доста ком пликовано,. тако да нећем о дати прим ер за њ ено одређивањ е.
160
СТАТИСТИКА
С ледећа тачка која ее м ож е посм атрати је ц ен тар средњ и х. Ш начава се^са и деф иниш е као тачка са координ атам а ( х П ) узорачке средине првих и других координата 1Јп), где су х п и тачака. И а тачке из прим ера 89, центар средњ их је тачка = (4 . 2 : 4 , 6 ) .
А ко тачке , Л 2, ... , представљ ају градове, тада с-е м ож е одредити п ро стор н и или гравитац и он и ц ентар за стан овни ш тво. Н ека посм атрани градови им ају / х, / 2, ..., / , становника и нека Јв укупан број становника у свим градовим а. Т ада се просторни центар деф иниш е као тачка која се најчеш ће означава са , \ а координате су јој т'
,У
.
* 1 к \ 5 2 /& и ~ 12/ У ) • 1 -1
П ри м ер 90. Н ека тачке из прим ера 89 представљ ају градове кош редом им ају 60, 300, 30, 40 и 70 хиљ ада становника. О дредим о просторни центар. К оордин ате просторног центра су
т«
1 500 (60-3 -1- 300 • 6 + 30 •4 + 40 ■2 + 70 ■6) = 5 , 2 , 1 500 (60 ■7 + 300 : 3 + 30 ■0 + 40 • 7 + 70 • 6) = 4,04.
П рем а том е, просторни центар је тачка (5,2; 4, 04). □ За просторни центар је карактеристично то да се пом ера ка густо настањ еним подручјим а. Ј К ао м ера. концентрације тачака око центра средњ их узим а се средњ е-квадратно одстојањ е тачака до ц ентра средњ их у ознаци' деф ини сано на следећи начин о
1 п = -7 2 2( <г=1
1 п х ? + -
П ■.
-
у )2
1=1
и стандардно одстојањ е = ^ . За прим ер 89, средњ еквадратно одстојањ е износи 10, док је стандардно одстојањ е 3,6.
Т Е С Т И Р А Њ Е П Р О С Т О Р Н О Г РА С П О Р Е Д А Т А Ч А К А 8.2
ти
ањ е
остор
ог
ас
ор
да та
161
ак
П оново посм атрамо дводим ензионално. обележ је (X, V) које представљ а полож ај тачака у посматраној области и нека је тдт реализовани узорак ((х и 1), (х 2, 2) ,. .. , ( , п)) из популације са посм атраним обележ јем . И спитујем о да ли су посм атране тачке случајно распоређене по области. И спитивањ е случајности тачака спроводим о тестирањ ем хипотеза о случајности распореда тачака. Т естирам о нулту хипотезу Д 0(распоред тачака је случајан) против једне од алтернативних: #1(распоред
тачака није случајан), Д Д распоред тачака је правилан), Д Д тачке се групиш у). С лучајан распоред тачака и неслучајни распореди наведеии у алтернативним хипотезам а приказана су на следећој слици. • •, ®о
®е е ®о ©
р у п и с а н е л у ч а ј а п
р а с
о р е д
р а в и л
а н
р а с п о р е д
т а ч к е
С лика 8.2: Распоред тачака. Разликујем о два м етода тестирањ а случајности распореда тачака по области: м етод кв ад рата и м етод н ајбли ж ег суседа. К од м етода квадрата посм атрана област је подељ ена. на једнаких квадрата у коме је смеш тено / / 2, .... Д тачака редом . У купан броЈ тачака је . У колико је нулта хипотеза тачна, тада се очекује приближ но исти број тачака по квадратим а, тј. очекује се приближ но | тачака у сваком квадрату. Т ест статистика је
1
=
I , (Л - ?)’
СТАТИСТИКА
162
и ова статистика им а расподелу са А; —1 степени слободе. К ритична област зависи од алтернативне хипотезе и м огуће критичне ббЛ асти су: 2
Ш :
'
С
Н о
Н г
случајан распоред тачака
није. случајан правилан груписањ е
Х о —
Х к—1,а/ 2 V Х о >
1-
-
/2
Хо < Х к— 1 .а Х о > Х к- 1 .1 -
Н а крају се доноси закљ учак о при хватањ у или одбацивањ у хипотезе на основу реализоване вредности тест статистике и одго-' варајуће критичне области. О бласт при овом тестираљ у не м ора обавезно бити подељ ена на квадрате. У колико су делови поделе неједнаки, тада се очекивана адсолутна учестаност одређује сразм ерно површ ини посм атраног дела. А ко је Р површ ин а'целе области, а Р\ , Р%, . . . , Р к површ ине делова, тада је очекивани број тачака у г-том ..делу Р
.
Т ест статистика је тада Е
о =
(/ ј-9-п) р
и она им а х 2 расподелу са —1 степени слободе. Н адаљ е! поступак је исти као у случају поделе области на квадрате. П р и м ер 91. Н а једној кам еној плочи 80 х 100с77г2'посм атрани су полож аји кристала м агнетита којих :је избројано 47. У следећој табели су дате координате кристала, у од доњ ег левог угла плоче
■*х 1 2 4 4 8 9 7 8 10 12 14 22 (21 22 У 86 41 3 15 95 13 35 44 58 88 2 2 56 53 24 31
27 .27 28 12 34 76
37 14
37 61
27, .11 15 35 38 85 25 15 93 25
38 7
41 51
46 2
47 12
Т Е С Т И Р А Њ Е П Р О С Т О Р Н О Г РА С П О Р Е Д А Т А Ч А К А
45 82
50 83
50- 51 13 25
49 96
71 76 27 1
56 12
58 40
59 28
60 62 61' 70
66 0
66 65 15 75
163
69 38
69 83
77 4
П лоча јс иодслзопа на 8 једпаких правоугаоника и број тачака у сваком од њ их је. 11, 9, 5, 5, 4, 4, 6 и 4. Т естирати са прагом значајности = 0,05 хипотезу да је распоред кристала случајан против алтернативне да није случајан. Р еш ењ е. У сваком правоугаонику се очекује по 47/8 = 5,875 тачака. Реализована вредност тест статистике је 1= ±
[(Ц - 5 ,875)2Ч- •■■+ (4 - 5,875)2] = 8,191.
К ако је' 1,69 < 8,191 < 16, то прихватамо нулту хипотезу да је распоред кристала случајан. □ Д руги м етод, м етод најближ ег суседа, се заснива на м ерењ у Е уклидовог растојањ а м еђу тачкам а. У колико је распоред тачака случајан, тада је очекивано растојањ е изм еђу једне тачке и њ ојнај^ ближ ег суседа ^
= 2 Т ±о '
где је А0 = ђ број тачака узорка по јединици површ ине. Т ест статистика Је Д-1
До =
0,523
\/п,
гдр је ин декс н ајбли ж ег суседа и израчунава се као количник просечног растојањ а до најближ ег суседа & и очекиваног растојањ а а!о, тј. као _ Оо И ндекс најближ ег суседа узим а следеће вредности: = 1 за случајни распоред тачака,
164
СТАТИСТИКА
п<
< 1 за груписањ е тачака, и
1<
< 2,15 за правилан распоред тачака.
I!нам е, м аксим ална вредност индекса најближ ег суседа је управо 2,1о. ^ елучају да је нулта хипотеза тачна, тест статистика има стандардну норм алну расподелу. О дговарајуће критичне области су: 2 0
Н0
Нг
случајан распоред тачака
С Ј
није случајан правилан груписањ е
А 1
?
т
1
с ч
~0 > ~ 0 , 5 - п
^
-2-0,5—л
П ри м ер 92. О дредити индекс најближ ег суседа за кристале м агнртита из прим ера 91, а затим са прагом значајности тестирати нулту хипотезу да је распоред кристала случајан против алтернативне да распоред кристала м агнетита није случајаи. Р еш ењ е. К ристали м агнетита су нум ерисани и м ерењ ем расто) јањ а је добијено (у К ристал Н ајбли ж и сусед Р астојањ е
1 10 11,18
9 13 11,18
10 5 8,06
11 12 8,0
12 11 8,0
20 27 10,77
21 18 9,06
22 7 10,77
30 31 ј
,1 0
41 35 10,44
31 30 о.Ш 42 39 5,83
32 31 13,04 43 36 11,18
2 8 6,71 13 14 3,16
23 6 6,32 33 29 3,16 44 42 8,94
3 11 10,05 ■14 13 3,16
24 21 11,31 34 37 8,54 45 43 11,18
4 6 5,39 15 17 4,24
25 19 11,05 35 33 6,08 46 47 3,16
5 10 8,06 16 19 10,20
26 19 7,07
36 43 11,18
6 4 5,39
7 2 7,81
17 15 4,24 27 20 10,77
37 34 8,54
8 2 6,71
18 21 9,06 28 26 9,43
38 39 9,22
19 26 7,07 29 33 3,16
39 42 5,83
40 46 10,05
47 46 3,16
Т ада је просечно растојањ е до најближ ег суседа = 7,811. П овр\ а густина кристала ш ина области је = 80 т 100 = 8000 м агнетита по једини ци површ ине је А0 = 47/8000 = 0,005875. Н а
Т Е С Т И Р А Њ Е П Р О С Т О Р Н О Г РА С П О РЕ Д А Т А Ч А К А
165
основу тога је (0 = 1/ (2 • л/0, 005875) = 6,523, тако да је индекс суседства = 7,811/6,523 = 1,197. Реализована вредност тест статистике је 1.197-1 28 = " 0 ^ 2 3 -
г
-
^ = 2' Ж ' За дати праг значајности добијам о да је 2,582 > 1,96, ш то значи да одбацујем о нулту хипотезу да је распоред кристала м агнетита случајан. □
ГЛАВА9 Временски низови М нш ч; прсм сиске ситуације, као ш то су сунчано, облачно, киш овито, м огу се посм атрати као ф ункције врем ена I. С друге стране, ове и друге врем енске ситуације се могу посм атрати као случајне пром енљ иве, тј.. као ф ункције случајног исхода . Рецимо, уобичајено је говорити или чути: ”Јуче је у јутарњ им часовим а било претеж но сунчано,.око подне је настала потпуна облачност, а у вечерњ им часовим а је падала киш а”. С друге стране, у ф иксираном врем енском тренутку у току д ана временска ситуација се мож е посм атрати као случајни исход. Д а ли ће у 12/г бити сунчано, облачно и суво или облачно са падавина је ствар случајности. Д акле, ако сунчано означим о са 1, облачно и суво са 2 и, н ајзад, облачно са падавинам а са 3, деф ин исаћем о једну случајну пром енљ иву. П рем а том е, врем енске ситуације представљ ају ф ункције две пром енљ иве. Н а основу овога долазим о до појм а случајног процеса. Д е ф и н и ц и ја 19.
а е П п р о с о р с ви х е е м е н т а р н и х и о д а и н ек а е Т С Н и н т е р ва л . к уп € , I е Т }, г е реа лна ф унк ци , ове се случ и п ро цес а еп еки м временом. 1
У деф иницији се терм ин ”врем е" користи из традионални х разлога, јер је то најчеш ћи ф изички см исао елем ената скупа Т . М еђутим , та пром енљ ива м ож е представљ ати и надм орску висину, дубину м ора и слично. Реална ф ун кција реалне пром енљ иве која настаје када се случајпом процесу ф иксира елем еитарии исход зове се р еал и зац и ја 167
168
СТАТИСТИКА
случајн ог проц еса или трајектори ја. Н ајчеш ће се ум есто ознаке { , ) користи ознака Х ( ) или чак сам о . П осм атрани скуп зове се п арам етарски скуп . С куп м ож е бити и дискретан скуп тачака. У том случају, скуп {Х (, 1 6 Т} зове се сл учајн и н и з ш ти случајн и проц ес са ди скретн и м врем ен ом или врем ен ски низ. 1
П ри м ер 93. К ао прим ер случајног процеса м огли би да посм атрам о тем пературу ваздуха, рецим о на следећи начин. Н аим е, тем пература ваздуха је случајна пром енљ ива, на коју осим случајних ф актора утиче и надм орска висина места на ком е се тем пература ваздуха м ери. Д акле, посм атраћем о тем пературу ваздуха у ф иксираном врем енском тренутку на различитим надм орским висинам а. О вде је надм орска висина неслучајна пром енљ ива. Т ем пература ваздуха м ож е да буде случајни процес и као ф ункција заиста од времена. Заиста, ако бисмо на једном м есту м ерили тем пературу ваздуха у току неког врем енског периода, рецимо јсдпс године, деф ш ш сали бисм о другачији случајни процес од претходно описаног. □ } се у К ао ш то смо већ истакли, случајни процес { Х Г , 'I е спаком поједм ном тренутку врем ена посм атра као случајна пром енљ ива. О туда се м огу деф инисати нум еричке карактеристике ових случајних пром енљ ивих. М еђутим , како се ове карактеристике деф иниш у за сваки поједини тренутак врем ена, са пром еном врем ена, тј. вредности парам етарског скупа Т , и оне ће се м ењ ати. Д акле, и сам е су ф ункције од врем ена. Н а тај начин долазим о до ф ункција као ш то су средњ а вредн ост, к ов ари јан сн а ф ун кц и ја и ауток орелац и он а ф ун кц и ја случајног процеса које ћем о.нададеф инисати. .
Д еф ин иц ија 20. е
е
с
л
у
н
јн
у
н
к
р ед њ а в р ед н о т ( ) 1
д
е
и
н
и
с л у н а јн о с
н
к
п р о ц е с а { , I 6 {к ) (Х % ).
)
=
С лично појм у м атем атичког очекивањ а случајне пром енљ иве, ) случајног процеса {. % средњ а вредност , I 6 Т} била би нека средњ а ф ункц ија” око које би се груписале реализације случајног , процеса.
В РЕ М Е Н С К И Н И ЗО В И
169
Д еф ин и ци ја 21. о в а р и ја н с н а ф у н к ц и ја с л у ч а јн о '/■Е }, у о з н а ц и К ( , ), е ја
проце
{Д ,
1
(
) =
(
е ) = Е [(
-
( ))( . -
(з ) )].
У колико је 2 = 3, тада се ум есто терм ина коваријансна ф ункција користи терм ин д и сп ерзи ја случајн ог проц еса. П рем а томе, ф уикција П (Х () = ( , ) зове се дисперзија елучајног процеса {Х ј. € ). 1
1
Д еф ин и ци ја 22. у т о к о р е л а ц и о н а { и I 6 }, у о з н а ц и р ( , ), . е 1
у н к ц и ја
с л у ч а јн о
проие
ја
V зависности од вредности коваријансне ф ункције могу се деф инисати специјални типови случајних процеса. У колико је коваријансна ф ункција ( 1,з ) једнака 0 за свако I ^ з, тада за случајни процес { XI, 4 6 } каж ем о да је слу чајн и проц ес са некорели сан и м вредн остим а. А ко је случајни процес { X (, I 6 } такав да им а константну средњ у вредност ( за свако I, има коначан м ом ент другог реда за свако I и ако је коваријансна ф ункција ( , ) ф ункција разлике Г — з , за свако I, $, тада за такав случајни процес каж ем о да је стаци он аран. М ож е се посм атрати и ергод и чан проц ес. Н аим е, за неки процес каж ем о да је ергодичан, уколико се средњ а вредност процеса м ож е бценити средином реализованог узорка који је део једне. једине реализације: . т2, ..., . Н аведене деф иниције неслучајних ф ункција средњ е вредности, коваријансне ф ункције, дисперзије и аутокорелационе ф ункције случајних процеса, односе се и на случајне низове. Једина разлика је У том е ш то је неки подскуп скупа целих бројева, а не интервал. То ће, м еђутим , произвести последицу да ће граф ици ових случајних ф ункција за низове бити скуп дискретних тачака (а не линије). О ве тачке се по традицији користе као тем ена линијског дијаграм а којим се реализација врем енског низа представљ а. Н адаљ е ћем о се задрж ати на врем енским низовим а.
170
С ТА ТИ С ТИ К А
В идели см о раније да врем енски низ зависи од случајног и неслучајног аргум ента. О бли к ове зависности, м еђутим ,јје један од најваж нијих аспеката истраж ивањ а у овој области. П роучавањ е иде у правцу откривањ а тзв. неслучајних ком поненти. Н иж е ћем о навести један од начина на који се представљ ају елем енти врем енског низа са неслучајним ком понентам а. Н еслучајне ком поненте се сврставају у три групе: трен д , сезон ска ко м п он ен та и ц и кл и ч н а к ом п он ента. Т ренд се означава са Т* и представљ а систем атску ком поненту дугорочн ог развоја. Д руга неслучајна ком понента је сезонска ком понента. О на се означава са! 5) и резултат је дејства ф актора који се јављ ају периодично, п:о сезонам а једне године. П рим ер случајног низа са сезонском ком понентом била би тем пература ваздуха м ерена на једном м есту. IК од неких случајних низова, периодичност се м ож е јавити у перИ одим а краћим или д уж им од једне године. У том случају, реч је о цикличнО ј ком поненти. О на се означава са %. П рим ер случајногјпроц еса са ци кличн ом ком понентом био би низ океанских плим а. С лучајна ком понента се означава са и она се доби ја кад а се из временског низа одстране све неслучајне ком поненте. В рем енски низ {Х г, / € Т } се често м ож е д а представи у облику сум е неслучајних ком понената и случајне ком поненте као —
( +
+
+
Е{,
4 6
.
У неким случајевим а, сезонска и ци кличн а ком понента се представљ ају једни м сабирком , јер обе одраж авају периодично понаш ањ е низа. У колико је из врем енског низа узет реализовани узорак, тада је потребно испитати да ли врем енски низ им а неслучајни х компоненти. Т ај поступак се спроводи тестирањ ем нулте хипотезе 7/о(врем енски низ из кога је узет узорак је.случајан), прбтив алтернативне хипотезе (у врем енском низу из кога је узет реализовани узорак постоји неслучајна ком понента). У колико се .деси да треба прихватити алтернативну хипотезу , тада се накнадно проверава о којој неслучајној ком поненти је реч, тј. да ли је реч о тренду, сезонској или ци кличној компоненти.
В Р Е М Е Н С К И Н И ЗО В И
171
У крајњ ем , у анализи врем енских низова важ но је утврдити да ли иостоје или не неслучајне ком поненте, а затим се врш и њ ихово уклањ ањ е из података ради утврђивањ а расподеле и других статистичких својстава врем енског низа.
С тати сти чке табли це
С Т А Т И С Т И Ч К Е Т А БЛ И Ц Е
1.
т а
д а р д н а
н
р м а л н а
р а с п
д е
0 2 3 6 1 4 5 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0871 .0910 .0793 .0832 .0948 .0987 .1026 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1772 .1554 .1591 .1628 .1664 .1700 .1736 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2258 .2291 .2324 .2357 .2389 .2422 .2454 .2642 .2673 . 2704 .2734 .2764 .2580 .2612 .2881 .2910 .2939 .2967 .2996 .3023 .3051 .3212 .3238 .3264 .3289 .3315 .3159 .3186 .3554 .3438 .3461 .3485 .3508 .3531 1.0 .3413 1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 1.2 .3849 .3925 .3944 .3962 .3869 .3888 .3907 .4049 .4066 1.3 .4032 .4082 .4099 .4115 .4131' 1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4382 .4394 .4406 1.5. .4332 .4345 .4357 .4370 1.6 .4452 .4463 .4495 .4505 .4515 .4474 .4484 1.7 .4554 .4591 .4599 .4608 .4564 .4573 .4582 .4656 .4664 .4671 .4678 .4686 1.8 .4641 .4649 1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 2.0 .4772 .4778 .4783 .4788 . 4793 .4798 .4803 2.1 .4821 .4826 .4842 .4846 .4830 .4834 .4838 2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 2.4 .4918 .4929 .4931 .4920 .4922 .4925 . 4927 .4948 2.5 .4938 .4940 .4941 .4943 .4945 .4946 2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 2.8 .4974 .4975 .4976 . 4977 .4977 .4978 .4979 2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 3.1 .4990 .4991 .4991 .4991 .4992 .4992 .4992 3.2 .4993 .4993 .4994 .4994 .4994 .4994 .4994 3.3 .4995 .4995 .4995 .4996 .4996 .4996 .4996 3.4 .4997 .4997 .4997 .4997 .4997 .4997 .4997 3.5 .4998 .4998 .4998 .4998 .4998 .4998 .4998 3.6 .4998 ■ .4998 .4999 .4999 .4999 .4999 .4999 3.7 .4998 .4998 .4999 .4999 .4999 .4999 .4999 3.8 .4998 .4999 .4999 .4998 .4999 .4999 .4999 3.9 .5000 .5000 .5000 .5000 .5000 .5000 .5000 2 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
175
8 9 7 .0279 .0319 .0359 .0675 .0714 .0754 .1064 .1103 .1141 .1443 .1480 .1517 .1808 .1844 .1879 .2157 .2190 .2224 .2486 .2518 .2549 .2794 .2823 .2852 .3078 .3106 .3133 ! .3340 .3365 .3389 .3577 .3599 .3621 .3790 .3810 .3830 .3980 .3997 .4015 .4147 .4162 .4177 : .4292 .4306 .4319 .4418 .4429 .4441 .4525 .4535 .4545 .4616 .4625 .4633 .4693 .4699 .4706 .4756 .4761 .4767 .4808 .4812 .4817 .4850 .4854 .4857 .4884 .4887 .4890 .4911 .4913 •.4916 .4932 .4934 .4936 .4949 .4951 .4952 .4962 .4963: .4964 .4972 .4973 .4974 .4979 .4980 .4981 .4985 .4986 .4986 .4989 .4990 .4990 .4992 .4993 .4993 .4995 .4995 .4995 .4996 .4996 .4997 .4997 .4997 .4998 .4998 .4998 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .5000 .5000 .5000
176
СТАТИСТИКА
2.
С туден това расп од ела
\
0 .1 0 0
1
.3 2 5
2
3
.289
0 .2 0 0
0 .3 0 0
0 .4 0 0
0 . 45 0
0 . 47 5
0 . 49 0
0 . 49 5
.727
1 .37 6
3 . 07 8
6 . 31 4
1 2 .7 0 6
3 1 .8 2 1
6 3 .6 5 7
. 6 17
1 .0 6 1
1.886
2 .9 2 0
4 .3 0 3
6 .9 6 5
9 .9 2 5
.2 7 7
.584
.978
1.638
2 .3 5 3
3 .1 8 2
4 .5 4 1
5 .84 1
1.533
4
.271
.569
.941
2 .1 3 2
2 .77 6
3 .7 4 7
4 .6 0 4
5
.267
.559
.920
1 .47 6
2 .0 1 5
2 .57 1
3 .3 6 5
4 .0 3 2
6
.265
.553
.906
.1 . 4 4 0
1 .943
2 .4 4 7
3 .1 4 3
3 .7 0 7
7
.263
.549
.896
1.895
2 .3 6 5
2 . 99 8
3 . 49 9
8
.262
.546
.889
1 .3 9 7
1 .8 6 0
2 .3 0 6
2 .8 9 6
3 .3 5 5
9
.261
.543
.883
1 .38 3
1 .83 3
2 .2 6 2
2 .82 1
3 .2 5 0
.542
.879
1 .37 2
1 .81 2
2 .2 2 8
2 .7 6 4
3 .1 6 9
-.540
.876
1.363
1 .79 6
2 .20 1
2 .7 1 8
3 .1 0 6
.873
1.356
1 .7 8 2
2 .1 7 9
2 .6 8 1
3 .0 5 5
1.415
10
.260
11
.260
12
.259
.539
13
.259
.538
.8 7 0
‘
1 .3 5 0
1 .7 7 1
2 .1 6 0
2 .6 5 0
3 .0 1 2
14
.258
.537
.868
1.345
1 .76 1
2 .1 4 5
2 .6 2 4
2 .9 7 7
1.341
1 .75 3
2 .13 1
2 .6 0 2
2 .9 4 7
1.746
2 .1 2 0
2 .5 8 3
2 .921
15
.258
.536
.866
16
.258
.535
.865
17
.2 5 7
.534
.863
1.133
1 .7 4 0
2 .1 1 0
2 . 56 7
2 . 89 8
18
.2 5 7
.534
.8 6 2
1.330
1 .7 3 4
2 .1 0 1
2 .5 5 2
2 .8 7 8
19
.2 5 7
.533
.861
1 .3 2 8
1 .7 2 9
2 .0 9 3
2 .5 3 9
2 .8 6 1
20
.2 5 7
.533
.860
1.325
1 .725
2 .0 8 6
2 .5 2 8
2 .8 4 5
21
.2 5 7
.532
.859
1 .3 2 3
1 . 7 21
2 .0 8 0
2 .5 1 8
2 .8 3 1
1 .33 7
22
.256
.532
.858
1 .3 2 1
1 . 71 7
2 .0 7 4
2 .5 0 8
2 .8 1 9
23
.256
.532
.858
1 .3 1 9
1 .7 14
2 .0 6 9
2 .5 0 0
2 .8 0 7
24
1.711
2 . 06 4
2 .4 9 2
2 .7 9 7
1 .7 0 8
2 .0 6 0
2 .4 8 5
2 .7 8 7
1 . 70 6
2 .0 5 6
2 .4 7 9
2 .7 7 9
1.703
25
.256
.531
.857
.2 5 6
.531
.856
1.318
1 .3 1 6
26
.256
.531
27
.256
.531
.855
1.314
2 .0 5 2
2 .4 7 3
2 .7 7 1
.5 3 0
.855
1 .3 13
1 .7 01
2 .0 4 8
2 .4 6 7
2 .7 6 3
28
.2 5 6
.8 5 6
1 . 31 5
29
.256
.530
.854
1 .3 1 1
1 .6 99
2 .0 4 5
2 .0 4 5
2 .4 6 2
30
.256
.530
.854
1.310
1 .6 9 7
2 .0 4 2
2 .4 5 7
2 .7 5 0
40
.255
.529
.851
1.303
1 .68 4
2 .021
2 .4 2 3
2 .7 0 4
60
.254
.527
.848
1.296
1.671
2 .0 0 0
2 .3 9 0
2 .6 6 0
.254
.526
.845
1.289
1.658
1 .9 8 0
2 .3 5 8
2 .6 1 7
.253
.524
.842
1 .6 4 5
1 .96 0
2 .3 2 6
2 .5 7 6
120
оо
1 .2 82
•
С ТА ТИ С ТИ Ч К Е ТА ВЛ И Ц Е
177
. а:2 р асп о д е л а
0 . 0 0 5 0.010 0 .0 2 5 1 .0000 .0002 .0010 .0100 .0201 . 0 5 0 6
\
3
.0 7 1 7
4
.2 0 7
5
6
8
9
10 11 12 13
0.95
.0039
3,84
0.975
0.990
5 .0 2
6,63
5.99
7.38
9.21
7.81
9.35
11.3
9.49
.115
.216
.352
.2 9 7
.484
.711
.554
.831
1.15
.676
.872
1.24
1.64
.989
1.24
1.69
2 .1 7
14.1
16.0
1.34
1.65
2 .1 8
2 .7 3
15.5
17.5
.103
11.1 11.1 12.8 12.6 1 4 . 4
.412
7
0 .050
0 .9 9 5
10.6 12.8
13.3
14.9
15.1
16.7
16.8
18.5
18.5
2 0 .3
20.1 22.0
1.73
2 .0 9
2 .7 0
3.33
16.9
19.0
2 1 .7
2 .1 6
2 .5 6
3 .2 5
3.94
18.3
20.5
23.2
2 .6 0
3 .0 5
3 .8 2
4 .5 7
19.7
21.9
3 .0 7
24.7
3 .5 7
4.40
3 .5 7
4 .1 1
5.01
5.63
6 .5 7
6 .2 6
7 .2 6
25.0
5.23
21.0
5 .8 9
22.4
2 3 .3
2 6 .2
24.7
2 7 .7
4 .0 7
4 .6 6
4 .6 0
5 .2 3
16
5 .1 4
5.81
6.91
7.96
26.3
17
28.8
5 .7 0
6.41
7.56
8.67
27.6
30.2
6.26
7.01
8.23
9 .3 9
28.9
37.5
34.8
6.84
7.63
8.91
10.1
30.1
32.9
36.2
9.59
31.4
34.2
37.6
10.3
18 19
20 21 22
, 23 24 25
7.43
8 .2 6
8.03
8 .9 0
8.64
9.26
10.2
9 .8 9
10.5
15.0
28.0
60
35.5
70 80
100
32.0
34.3
33.4
3 5 .7 37.2 38.6 4 0 .0
38.9
4 2 .8 4 4 .2
41.4
1 1 .7
13.1
35.2
38.1
41.6
39.4
43.0
45.6
4 0 .6
44.3
46.9
37.7
13.8
40.3
32.8
14.6
30
30.6
35.5
13.1
31.3
36.8
13.1
27.5
1 1 .5
29.1
36.4
12.5
33.9
2 6. 1
13.8
29.8
12.3
29
50
32.7
12.4
28
2 0 .7
11.2 12.2 11.8 1 2 . 9
40
10.9
27
26
10.9
11.6
11.0
9.54
25.2
2 8 .3
14
23.6
2 6 .8
15
2 3 .7
7.88
13.8
15.4
38.9
41.9
45.6
48.3
14.6
16.2
40.1
43.2
47.0
13.6
49.6
15.3
16.9
41.3
14.3
16.0
17.7
42.6
16.8
18.5
43.8
24.4
2 6 .5
34.8
22.2
44.5
48.3
4 5 .7
49.6
47.0
50.9
55.8
59.3
63.7
67.5
71.4
76.2
7 9 .5
4 3 .2
79.1
83.3
88.4
9 2 .0
5 1 .7
90.5
95.0
5 1 .0
52.3 5 3 .7
66.8
2 9 .7
32.4
37.5
40.5
4 3 .3
4 5 .4
48.8
51.2
5 3 .5
57.2
60.4
102
6 5 .6
69.1
113
118
124
198
74.2
77.9
124
130
136
140
5 9 .2
61.8
67.3
70.1
107
100 112
104 116
С ТА ТИ С ТИ К А
178
4.
у ч а ј
и
б р
е в и
51772 24033 45933 30586 03585 64937 15630 09448 21631 91097 62898 21387 55870 86707 85659 55189 41889 85418 16835 28195
74640 23491 60173 02133 79353 '03355 64759 56301 91157 17480 93582 75105 56974 12973 36081 00745 25439 68829 48653 27279
42331 83587 52078 75797 81938 98683 51135 57683 77331 29414 04186 10863 37428 17169 50884 65253 88036: 06652 71590 47152:
29044 06568 25424 45406 82322 20790 98527 30277 60710 06829 19640 97453 93507 88116 14070 11822 24034 41982 16159 35683
46621 21960 11645 31041 96799 65304 62586 94623 52290 87843 87056 90581 94271 42187 74950 15804 67283 49159 14676 47280
Литература 1. Бањ евић Д .: М атем ати ч ка статисти ка, П М Ф У ниверзитета у Београду, Београд 1985. 2. И вковић 3.: М атем ати ч ка стати сти ка, Н аучна књ ига, Београд, 1975. 3. И вковић 3., Б ањ евић Д ., П еруничић, П ., Глиш ић, 3.: С тати сти ка за I V р азр ед у см ерено г обр азовањ а, Н аучна књ ига, Београд, 1980. 4. Југовић-С тојановић Д ., Јеврем овић В ., М арић-Д едијер М .: З б и рк а зад атака и з теори је вероватн оћ е и м атем ати ч ке стати стике, Н аучна књ ига, Б еоград, 1992. 5. П оповић Б ., Б лагојевић Б.: М атем ати ч ка стати сти ка са п ри м ен ам а у хи дротехн иц и, У ниверзитет у Н иш у, Н иш , 1997, 1999, 2003. 6. П оповић Б ., Ристић М .: С татистика у п сихо логији , М рљ еш , Београд, 2001. 7. С тати сти чки год и ш њ ак Југославије, 1976. 8. С тати сти чки год и ш њ ак Југославије, 1999. 9. С тати сти чки год и ш њ ак Југославц је, 2000.
179
И н декс п ојм ова дискретне расподеле 25 ди сперзија случајне пром енљ иве 53 ди сперзија случајног проц еса 169 догађај - апсолутна учестаност 8 - вероватноћа 8 - известан 5 - нем огућ 5 - реализаци ја 4 - сигуран 5 - случајан 4 - супротал 6 догађаји - дисјунктни 6 - зависни 10 - збир 7 - им пликација 5 - независни 10 - пресек 6 - разлика 7 - ун ија 7 - узајам но искљ учиви 6
аутокорелаци она ф ун кц и ја случајиог процеса 169
В ернули јева ш ем а 25
варијаци он и н из 79, 101 вероватвдђа 8 - класичн а деф ин иц ија 8 - сг-адитивност 9 - ненегативност 9 - норм ираност 9 - особине 9 - саврем ена деф ин иц ија 9 врем енски низ 168 врем енски низови 167
гравитациоии центар 160 граф ички м етод при казивањ а података 87 греш ка - друге врсте 120 - прве врсте 120 греш ка оцењ ивањ а 142 групе 74 густина расподеле 17
експерим ент - детерм инистички 3 - лаборатори јски 3 - случајан 3 експоненци јални м одел 154 ергодичан процес 169
ди јаграм растурањ а 141
закон расподеле 13
181
182
СТАТИСТИКА
И ин тервал поверењ а 113 - двострани 113 - једнострани 113 интервал поверењ а за парам етар сг2 115 ин тервал п оверењ а за парам етар 113, 114 интервална оцена 95 ин тервално оцењ ивањ е 112 ин тервално сређивањ е података 82 исход 4 - елем ентаран 4 - атрибутивни 11 - ненум ерички 11 - нум ерички 11 избор тачака - случајан 75 - периодични 77 - групни 78 - стратиф иковани 78
- расподела 22 м атем атичко очекивањ е 45 м еди јана 51 м едијански центар 159 м едијански интервал 102 м ере централне тенденци је 159 м етод квадр ата 161 м етод н ајближ ег суО еда 161 мод 50 м одални ин тервал 100 м одел ли неаран по парам етрим а 150 м ом енти 48
И нелинеарни м одели Зависности 150 независне случајне пром енљ иве 22 независност догађаја 10
оележ је 68 - једнодим ензионално 68 - квали тативн о 68 - квантитативно 68 - виш едим ензиО нално 68 - апсолутно непрекидн о 69 - атрибутивно 69 - дискретно 69 ј - ненум еричко 69 - нум еричко 69 оим узорка 70
Ј једнострука регресија 141 К коди рањ е 11, 69 коеф ицијент асим етри је 58 коеф ицијент ексцеса 59 коеф ицијент корелаци је 60 коеф иц ијент спљ ош тености 59 коеф ици јент варијаци је 57 ковари јансн а ф ун кц ија случајног процеса 169 критична област 120 М м аргин ална - расподела 21 - вероватно ћа 21 - густин а 22
П парам етарски скуп 168 парам етри обележ ја|94 П ирсонов х 2 тест 131 пи тасти дијаграм 91 полигон учестаности 89 - алсолутних 90 - релативних 90 поп рављ ена узорачк а ди сперзија 104
И Н Д Е К С П О ЈМ О В А поп улација 67 потпун систем до гађаја 7 п раг значајности теста 120 процена вредности 142 просечно градско растојањ е 158 просторни центар 160
расподела.
- X2 40 - бином на 25, 26 - ди скретне случајне пром енљ иве 25 - бином на 26 - П уасонова 27, 28 -- уни ф орм на ди скретна 30 - апсолутно н епрекидне случајне п ром енљ иве 31 - равном ерна 32 - у н иф о рм н а 32 - Г аусова 34 - норм ална 34 - станд ардна н орм алиа 35 - С тудентова 42 растојањ е - Е уклидово 157 - М енхетн 157 - тип а градског блока 157 . реализација случајног процеса 168 реали зован а узорач ка ди сперзија 104 • регресија 141 . - ли неарна 142 - случајне пром енљ иве по случајној пром енљ ивој 142 - случајне пром енљ иве по контролисаној пром енљ ивој 146 - виш еструка 148
сезонска ком понента 170 ’ скуп м огући х исхода 4
183
- бесконачно п ребројив 4 - коначан 4 - непребројив 4 слојеви 73 случајна пром енљ ива 11 - реализације 11 - скуп реали заци ја 11 - апсолутно н епрекидн а 12 - дискретна 12 - апсолутно непреки дн а 16 - дводим ензион ална 18 - једноди м ензион ална 17 - виш едим ензионална 18 - м атем атичко очекивањ е 45 - нум еричке карактери стик е 45 - м оменти 48 - м од 50 - м едијана 51 - ди сперзцја 53 - стандардн а девијација 53 - централни м ом енти 55 - стандардн а деви јаци ја 55 - станд ардн о одступањ е 55 случајни и нтервал 113 случајни низ 168 случајни проц ес са ди скретни м врем еном 168 случајни процес са некорелисани м вредностим а 169 случајни процес са непрекидн им врем еном 167 случајии узорак 93 средин а узорк а 95 средњ а вредност случ ајног процеса 168 стационаран процес 169 стандардизација 38 стандардна деви јаццја 53, 55 стандардн о одступањ е 55 статистичка хипотеза 119 статистички тест 119 статистика 67, 94 степени м одел 152 стратегија избора узорка 70
184
СТАТИСТИКА
стратум и 73
ф реквен ци ја 79 - кум улативи а 80 ф ун кц и ја распо деле 15
Т
- особи ие 15
табел а кои тин генције 19 табли ц а слу чајни х бр ојева 70 табли чн и м етод 79 тачкаста оцена 95
X хипотеза
тест статистика. 119
- алтернативн а 119
тести рањ е статисти чки х хи п отеза 119
- нул та 119 - полазиа 119
ТРСТОВИ
- иепарам етарски 120 - парам етарскн 120
- пр оста 119 - слож ена 119 хистограм 87
трајектори ја 168 тракастм ди јаграм 88 тренд 170
ц
центар средњ их 160 У
централни м ом енти 55
учестаност - апсолутна 79 - релативна 80 - зби рна 80 ” процентуална 85 узор ачк а ди сперзија 103 узор ачк а м еди јана 101 узорачка средина 95 - реализована 95 узор ачк а станд ард н а деви јаци ја 103 узорачки коеф ицијент корелаци је 107 узорачкн м од 99 узорак 70 - репрезентативан 70 - случ ајан 70 - периодичан 72 - слојевит 73 - стратиф икован 73 - групни 74 - виш еетапни 75 - двоетапни 75 - реализовани 94
ци кличн а ком пон ента 170