Matemàtiques per a Multimèdia - II
estadística i probabilitat
PRÀCTICA 2
Pràctica 2
1. Presentació.....................................................................
3
2. Conclusions....................................................................
5
3. Recursos......................................................................
19
-2-
índex
Matemàtiques per a Multimèdia - II
-3-
estudi estadísitc a partir d’una enquesta
presentació
Matemàtiques per a Multimèdia - II Pràctica 2
Matemàtiques per a Multimèdia - II
Pràctica 2
El nostre estudi estasdístic s’ha basat en els resultats obtinguts a partir d’una enquesta presentada als alumnes de la matèria de Matemàtiques per Multimèdia de la UOC per estudiar el seu perfil tecnològic. L’enquesta s’ha presentat en un format de resposta única en la totes les preguntes a excepció de la darrera, que permetia selecció múltiple. L’enquesta ha estat resposta per un total de 37 individus, 24 homes i 13 dones. Aquestes dades ens permeten extreure una primera conclusió: el nombre d’homes que cursen la carrera és sensiblement major que la de dones, ja que els primers representen un 64’86% de la mostra, mentre que les dones representen un 35’14% sobre el total.
L’enquesta s’ha centrat en els següents punts:
• quantitat d’ordinadors domèstics. • quantitat de comptes de correu útils. • tecnologia emprada al terminal mòbil. • hores d’us de l’ordinador per l’estudi a la setmana. • hores d’us de l’ordinador per l’oci a la setmana. • llibres en format tradicional llegits en un any. • nombre de cops que s’ha anat al cinema el darrer mes. • nombre de pel·lícules vistes en ordinador o tablet. • disponibilitat de dispositius tecnològics (múltiple)
-4-
presentació
-5-
anàlisi i interpretació dels resulats obtinguts
conclusions
Matemàtiques per a Multimèdia - II Pràctica 2
Matemàtiques per a Multimèdia - II
Pràctica 2
nombre d’ordinadors que tens a casa
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre 1, 2, 3 o més de 3 ordinadors domèstics.
rang
3
mitjana en dones
2’92
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones
desviació típica sobre N
2’33 2’54 0’81 0’95
0’90
La mediana se situa en el valor 2, el 1r quartil també en 2 i el 3r en 3, sent els valors mínim i màxim 1 i 4 respectivament. Mirant el diagrama de caixa podem observar que el centre de la distribució se situa just al mateix nivell que el 1r quartil, més a prop del nivell mínim que del nivell màxim. El rang interquartílic ens mostra la dispersió de la part central de la distribució. Per bé que la nostra distribució es mou dins d’un rang de 3, la dispersió de la part central queda molt centrada, malgrat que el valor central (mediana), tendeix a apropar-se més al valor mínim, fet que ens dóna una distribució un pèl asimètrica. La desviació típica ens donarà més informació sobre la dispersió de la distribució.
Diagrama de caixa sobre la distribució total.
D’entrada podem observar que la mitjana se situa en 2’54, amb una desviació de 0’9 i un coeficient de variació de 35’4%. Això denota un cert grau de dispersió de les dades de la distribució respecte de la mitjana. En aquest sentit podem observar que la desviació que experimenten les dades associades al grup de dones és més alt que el del grup d’homes. Les dones presenten una mitjana de 2’9 ordinadors a casa, per sobre dels 2’3 dels homes i per sobre de la mitjana total, situada en els 2’5. Per aquest motiu les dones també experimenten una major dispersió sobre la mitjana, situant la seva desviació 14 punts bàsics per sobre de la desviació dels homes, que amb els seus valors s’aproximen més a la mitjana i a la medianat.
La gràfica recull les observacions per grups d’homes i dones i el total. Com es pot observar, la gràfica dels valors absoluts té certa semblança a una distibució normal, estreta pels extrems i alta en la seva part central. Això en aproxima a certa simetria en la distribució. -6-
Matemàtiques per a Multimèdia - II
Pràctica 2
nombre de comptes de mail habituals
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre 1, 2, 3 o més de 3 comptes de correu.
rang
3
mitjana en dones
2’69
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones
desviació típica sobre N
2’41 2’51 0’77 0’94
0’83
La mediana se situa en 3, el 1r quartil en 2 i el 3r en 3, sent els valors mínim i màxim 1 i 4 respectivament. Es pot observar que el centre de la distribució se situa just al
Diagrama de caixa sobre la distribució d’homes.
mateix nivell que el 3r quartil, més a prop del nivell màxim que del nivell mínim. La comparació dels gràfics de caixa sobre la distribució d’homes i dones ens permet observar que la distribució de dades en els homes és perfectament simètrica, aproximant-se a la mitjana i generant una distribució normal. Per contra, el gràfic de caixa de les dones ens permet observar que la mediana queda per sobre de la mitjana i que el rang interquartílic és més ampli que en els homes i més ampli que en la distribució total, presentant així una dispersió més gran. Per altra banda, observem que la mitjana d’adreces de mail se situa en 2’51, amb una desviació de 0’83 i un coeficient de variació de 33’31, establint cert grau de dispersió sobre la mitjana. En aquesta ocasió, i tal com marca la tendència dels gràfics de caixa, la desviació
Diagrama de caixa sobre la distribució de dones.
de les dades de les dones (0’94) és més alta que el del grup d’homes (0’83). Les dones tenen una mitjana de 2’69 adreces actives, mentre que els homes en tenen 2’41.
Aquesta gràfica també presenta certes semblances amb una distribució normal, estreta pels extrems i alta en la seva part central. Ovbservem que les gràfiques relatives a homes i dones també reproduexien aquest patró.
-7-
Matemàtiques per a Multimèdia - II
Pràctica 2
tecnologia del mòbil personal Aquesta pregunta es basa en el recull de mostres a partir de dades qualitatives, podent escollir entre diferents sistemes operatius. Per tal de poder extreure les dades numèriques s’ha adjudicat a cada valor qualitatiu un valor quantitatiu de 1 a 6. Malgrat tot, amb dades quantitatives es fa difícil poder establir quina és la mitjana, ja que aquesta és tan sols vàlida per a dades quantitatives. Tot i així, la gràfica ens aporta informacions molt valuoses. Per una banda podem observar la clara tendència de la mostra a emprar Android per sobre de qualsevol algre sistema operatiu, quedant el sistema iOS d’Apple tot just per darrere d’aquest. També podem observar que l’ús de BlackBerry i Symbian s’allunyen de la resta de freqüències d’ús. Sí que és interessant observar quin és el grau de dispersió que ens ofereixen les dades. Tal i com es mostra a la taula del full de càlcul, la distribució mostra una desviació respecte de la mitjana de 2’0052, amb un coeficient de variació d’un 65’08%, fet que denota poca concentració de les dades al voltant de la mitjana. Podem concloure doncs que l’ús de sistemes operatius en dispositius mòbils està poc concentrat en una sol valor, fet que genera un alt grau de dispersió.
-8-
conclusions
Matemàtiques per a Multimèdia - II
Pràctica 2
hores de treball a l’ordinador en una setmana
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre els intervals 0-5, 6-11, 12-17 i més de 17. Per poder començar a treballar primer s’ha trobat la marca de classe de cada interval, resultant aquests 2’5, 8,5 i 14’5 pels tres primers intervals. Seguint la lògica d’aquesta progressió, al quart valor se li ha adjudicat una marca de classe de 20’5.
rang
18
mitjana en dones
16’80
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones
desviació típica sobre N
17’75 17’41 3’94 4’60
4’15
La mediana se situa en 20’5, el 1r quartil en 14’5 i el 3r en 20’5, sent els valors mínim i màxim 2’5 i 20’5 respectivament. Com es pot observar en el gràfic de caixa, la distribució de les dades és realment curiosa, ja que la tendència central i la mediana se situen sobre el valor màxim. Això implica que la tendència de les persones enquestades és la d’invertir moltes hores de treball al llarg de la setmana, enfront d’aquells que pràcticament no en fan ús. Aquesta tendència resulta fàcil de justificar si tenim en compte que l’enquesta ha estat contestada per alumnes de la UOC. Aquesta manca de simetria també es detecta observant el gràfic. S’hi pot observar una concentració de les dades en els valors més alts, quedant el valor mínim desprovist de dades. Això justifica que la mitjana d’hores que un alumne de la UOC treballa a la setmana sigui de 17’41, destacant en aquest sentit els homes sobre les dones. Per això la desviació que les dones experimenten respecte de la mitjana és més alta que la dels homes, que es queda en un 3’94.
Aquesta gràfica és un clar exemple de distribució asimètrica que no comparteix cap semblança amb una distribució normal.
-9-
Matemàtiques per a Multimèdia - II
Pràctica 2
hores d’oci a l’ordinador en una setmana
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre els intervals 0-5, 6-11, 12-17 i més de 17. Per poder començar a treballar primer s’ha trobat la marca de classe de cada interval, resultant aquests 2’5, 8,5 i 14’5 pels tres primers intervals. Seguint la lògica d’aquesta progressió, al quart valor se li ha adjudicat una marca de classe de 20’5.
rang
18
mitjana en dones
13’11
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones
desviació típica sobre N
11’25
11’90 7’07 6’07
6’71
La mediana se situa en 14’5, el 1r quartil en 8’5 i el 3r en 20’5, sent els valors mínim i màxim 2’5 i 20’5 respectivament. Els gràfics de caixa que trobem al costat ens indiquen clarament la diferència que hi ha entre la distribució de dades entre els homes i les dones. Tot i que les medianes no presenten massa distància entre elles, sí que destaca el desplaçament de les dades centrals marcades pel rang interquartílic. En el primer cas les dades de tendència central es troben dins d’un rang força ampli
Diagrama de caixa sobre la distribució d’homes.
tendint al nivell mínim, mentre que en la distribució de les dones passa exactament el contrari. La mitjana adopta un valor de 11’90 hores, molt per sota de les 17’41 hores que s’inverteixen en treballar. La desviació de les dades respecte de la mitjana és d’un 6’71, generant un CV del 56’39%. Aquestes dades, juntament amb les gràfiques de caixa ens permeten observar un nivell important de dispersió entre les dades recollides. Com es pot observar en la gràfica de sota, tots els intervals tenen un nombre important de dades adjudicades, fet que limita la concentració de dades en la part central per generar una distribució normal.
Diagrama de caixa sobre la distribució de dones.
- 10 -
Matemàtiques per a Multimèdia - II
Pràctica 2
llibres llegits en format tradicional en un any
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre els intervals 0-3, 4-7, 8-10 i més de 10. Per poder començar a treballar primer s’ha trobat la marca de classe de cada interval, resultant aquests 1’5, 5’5 i 9 pels tres primers intervals. Com que en aquest cas els intervals no tenen la mateixa amplitud, el darrer de tots l’hem establert en 10.
rang
8’5
mitjana en dones
4’84
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones
desviació típica sobre N
3’06 3’68 2’99 3’15
3’12
La mediana se situa en 1’5, el 1r quartil en 1’5 i el 3r en 5’5, sent els valors mínim i màxim 1’5 i 10 respectivament. Tal i com es pot observar en el gràfic de caixa, les dades de la distribució experimenten una clara tendència a concentrar-se al voltant del valor mínim. Tant la mediana com la distribució central marcada pel rang interquartílitc se situen sobre el mateix, fet que ja ens dóna una idea aproximada de la quantitat de llibres en format tradicional que s’han llegit aquest any. Pel que fa als indicadors de dispersió, la mitjana de llibres llegits durant aquest any ha estat de 3’62, destacant aquí la mitjana de 4’84 recollit en el grup de les dones. Això fa que la seva desviació respecte de la mitjana també sigui sensiblement superior. El CV se situa en un genys menyspreable 84’78%, fet que encara denota amb més claredat l’alt grau de dispersió que les dades experimenten respecte de la mitjana.
- 11 -
Diagrama de caixa sobre la distribució total.
Matemàtiques per a Multimèdia - II
Pràctica 2
visites al cinema durant el darrer mes
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre els intervals 0-3, 4-7, 8-10 i més de 10. Per poder començar a treballar primer s’ha trobat la marca de classe de cada interval, resultant aquests 1’5, 5’5 i 9 pels tres primers intervals. Com que en aquest cas els intervals no tenen la mateixa amplitud, el darrer de tots l’hem establert en 10.
rang
8’5
mitjana en dones
2’76
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones desviació típica sobre N
2’16 2’37 2’26 2’63
2,38
La mediana se situa en 1’5, el 1r quartil en 1’5 i el 3r en 1’5, sent els valors mínim i màxim 1’5 i 10 respectivament. Queda clar veient el gràfic de caixa que totes les dades centrals queden concentrades en la part baixa del gràfic. El rang interquartílic ha desaparegut i la mediana se situa en el valor més baix. Això ens indica que la majoria dels valors de la distribució s’aproximen al nivell mínim i que durant aquest mes les visites al cinema han estat més aviat escasses i esporàdiques. Si ens fixem en la mitjana, ens adonarem que aquesta queda fixada en una mica més de dues visites al cinema cada mes (2’37). La desviació típica és d’un 2’38 (les dones encara s’aparten de la mitjana una mica més) i el CV és superior al 100%. Malgrat tot, i tal i com es pot observar en el gràfic, gran part de la distribució s’aplega al voltant de la mitjana, fet que propicia que la dispersió no sigui massa alta.
- 12 -
Diagrama de caixa sobre la distribució total.
Matemàtiques per a Multimèdia - II
Pràctica 2
pel·lícules vistes a l’ordinador
conclusions
o tablet el darrer mes Aquesta pregunta es basa en el recull de mostres a partir de dades quantitatives, podent escollir entre els intervals 0-3, 4-7, 8-10 i més de 10. Per poder començar a treballar primer s’ha trobat la marca de classe de cada interval, resultant aquests 1’5, 5’5 i 9 pels tres primers intervals. Com que en aquest cas els intervals no tenen la mateixa amplitud, el darrer de tots l’hem establert en 10.
rang
8’5
mitjana en dones
4’84
mitjana en homes mitjana sobre N
desviació típica en homes desviació típica en dones
desviació típica sobre N
3’06 3’68 2’99 3’15
3’12
La mediana se situa en 1’5, el 1r quartil en 1’5 i el 3r en 7’25, sent els valors mínim i màxim 1’5 i 10 respectivament. A l’igual que passa en casos anteriors, la part central de la distribució de dades s’acumula al voltant del nivell mínim, fet que ens permet afirmar que durant aquest darrer mes els alumens han vist pocs productes audiovisuals als seus dispositius. Per altra banda, la mitjana d’esdeveniments vistos ha estat de 3’68, àmpliament superat per les dones, que amb una mitjana de 4’48 productes vistos en dispostius propis supera clarament als homes i s’allunya de la mitjana total. La desviació és de 3’12 i el CV és d’un 78’63%, dada que ens presenta, a l’igual que la gràfica, el grau de dispersió que experimenten les dades de la distribució.
- 13 -
Diagrama de caixa sobre la distribució total.
Matemàtiques per a Multimèdia - II
Pràctica 2
dispositius tecnològics propis
conclusions
Aquesta pregunta es basa en el recull de mostres a partir de dades qualitatives, podent escollir entre diferents opcions de manera múltiple. Per tal de poder extreure les dades numèriques s’ha adjudicat a cada valor qualitatiu un valor quantitatiu de 1 a 6. En aquest apartat serà difícil valorar quins dispositius s’allunyen més o menys de la mitjana, però sí que serà fàcil concloure quin és el dispositiu que més s’utilitza entre els alumnes de Multimèdia.
La gràfica en mostra un ús elevat de l’ordinador, tant en format portàtil com de sobretaula, així com del telèfon mòbil. Aquests tres dispositius són, doncs, els més extensos entre la població enquestada. Per darrere ja trobarem el reproductor de música i en menor percentatge l’ús de l’E-Book i les tablets. Per altra banda, l’histograma denota un ús tecnològic major dels homes per sobre de les dones, ja que en tots els casos la quantitat de dispositius emprats pels homes és superior al de les dones. També podem analitzar aquestes dades des del punt de vista del percentatge. En aquest cas podem observar que les dones fan un ús més intensiu dels ordinadors i el mòbil, mentre que en els homes els percentatges queden més dispersats dins de la distribució. En termes absoluts els homes empren més dispositius, però dispersen més els seus formats.
- 14 -
Diagrama de caixa sobre la distribució total.
Matemàtiques per a Multimèdia - II
Pràctica 2
Aquestes dades, però, donen peu a valorar-les des d’una tercera via: la mitjana de dispositus que empra de mitjana cada alumne enquestat. Les valoracions que hem fet fins ara es basen en dades qualitatives, però la mostra també ens permet fer-ho a partir de dades quantitatives. Per fer-ho hem comptat quants dispositius ha marcat cada enquestat. Ens movem, doncs, en un rang de 5. Tal i com es pot observar en el gràfic de caixa, la distribució central de les dades és força compacta. El valor central se situa en el 4 mentre que el rang interquartílic es mou entre el 4 i el 4’5, més proper al valor màxim que al valor mínim. La mitjana de dispositius emprats per cada individu és d’un 3’7 i la distribució experimenta una desviació de 1’14.
Si valorem les dades que ens ofereix l’historgrama, podem observar que la distribució de les dades s’aproxima a una distribució normal, ja que els valors tendeixen a reunir-se en la zona central de la distribució mentre que els valors extrems presenten menys rellevància dins de la mostra.
Gairebé la meitat de les dones enquestades disposen de fins a 4 dispositius, mentre que en els homes aquest percentatge es redueix fins al 33%. D’altra banda, els gràfics ens permeten observar que en el cas dels homes les dades es distribueixen en la seva majoria entre els 2, 3, i 4 dispositius, mentre que en el cas de les dones el percentatge d’ús de 2 o 3 dispositius és menor. - 15 -
Diagrama de caixa sobre la distribució total.
Matemàtiques per a Multimèdia - II
Pràctica 2
per acabar Els alumnes de Multimèdia de la UOC tenen de mitjana 2’54 ordinadors a casa, tot i que en aquest àmbit les dones destaquen per sobre dels homes, amb una mitjana de gairebé 3 ordinadors per cadascuna. D’aquestes, un 38’4% tenen més de tres ordinadors a casa seva. Malgrat tot, quan establim els valors en percentatges podem observar que la nostra distribució, tal i com indica la mitjana aritmètica, té una clara concentració de dades al voltant dels ordinadors.
Pel que fa al nombre correus que empren els alumnes de Multimèdia, la mitjana se situa en aproxidament 2’5 comptes. També en aquest àmbit les dones es mostren més actives que els homes. Aquests tenen de mitjana 2’4 comptes actius, mentre que les dones arriben gairebé als 2’7. La gràfica de percentatges ens mostra que si bé la majoria de les dones enquestades tenen dos comptes (38’46%), gairebé un 45% d’homes en tenen tres. El fet que la mitjana de comptes emprats per dones sobrepassi al dels homes és que un 23% d’aquestes empren normalment 4 o més comptes de correu, mentre que els homes tan sols ho fan en un 4% dels casos.
- 16 -
conclusions
Matemàtiques per a Multimèdia - II
Pràctica 2
L’ús de sistemes operatius ha mostrat una distribució amb poca concentració de dades, fet que ens porta a deduir que l’ús dels diferents OS en dispositius mòbils està força repartit. Android i iPhone segueixen sent els sistemes més emprats pels alumnes de Multimèdia, tot i que en aquest sentit destaca que la tercera opció més emprada és la d’altres sistemes operatius que no queden recollits en l’enquesta. Comparativament, les dues primeres opcions són les més escollides pels homes, que destaquen en el seu ús per sobre de les dones. Per contra, les dones destaquen en el seu ús de Windows Phone i BlackBerry per sobre els homes.
Les hores d’ús setmanal de l’ordinador també han estat objecte d’estudi. Tal i com es pot observar, quan es relaciona ordinador i treball hi ha una forta concentració dins de la distribució sobre el valor màxim. El 63% dels homes i el 54% de les dones treballen més de 17 hores a la setmana amb l’ordinador, mentre que el valor mínim ha quedat desprovist. A mida que es va incrementant el temps de dedicació el percentatge d’homes es va fent preponderant sobre el de les dones. No passa el mateix amb l’ús que es fa de l’ordinador en referència a l’oci. En aquesta mostra les dades han quedat molt més repartides, destacant lleugerament el percentatge de dones per sobre del dels homes.
treball oci
- 17 -
Que les dades de les hores dedicades a l’oci queden més disperses que les dades de les hores dedicades al treball es veu clarament a les gràfiques. La comparació dels seus coeficients de variació (CV) referma aquesta tendència. Mentre que les hores dedicades al treball presenten un CV d’un 23%, les hores dedicades a l’oci mostren un CV d’un 56%. Això confirma la tendència de la primera distribució a reunir totes les dades sobre el valor central, mentre que en el segon cas les dades tenen distribuïdes de manera més irregular.
Matemàtiques per a Multimèdia - II
Pràctica 2
Dins de l’estudi que s’ha fet sobre els usos tecnològics també s’ha valorat l’ús que els alumnes hanfet del llibre tradicional durant el darrer any. Tal i com es pot observar, tant en homes com en dones la tendència es decanta clarament cap als valors mínims. El 82% dels homes i el 76% de les dones llegeixen entre 0 i 7 llibres a l’any, fet que ve refermat per la distribució que presenten les dades centrals (el rang interquartílic es mou entre el primer i el segon valor de la distribució). Malgrat tot, hauria estat interessant poder creuar aquestes dades amb la quantitat de llibres que els alumnes han llegit en format digital o electrònic. La simple interpretació d’aquestes dades no ens confirma si els alumnes llegeixen només en format tradicional o si bé llegeixen més però ho fan en altres formats.
L’assiduïtat amb què es consumeixen productes audiovisuals també ha estat objecte d’estudi en aquesta enquesta. En aquest cas podem observar el consum al cinema o bé a nivell personal mitjançant dispositius mòbils. Tant en el primer com en el segon cas, el gruix de les dades es concentren en els valors mínims, fet que marca una clara tendència a la baixa en les visites al cinema. cinema tablets
El CV de la primera distribució és d’un 100’14%, fet que es produeix perquè la desviació tìpica (2’38) és més gran que la mateixa mitjana (2’37). Per la seva banda, el CV de la segona distribució és d’un 78’63%. - 18 -
Pràctica 2
• http://es.wikipedia.org/wiki/Rango_(estad%C3%ADstica) • UOC - material docent • enquesta sobre els usos tecnològics dels estudiants.
- 19 -
recursos
Matemàtiques per a Multimèdia - II
Matemàtiques per a Multimèdia - II
Pràctica 2
- 20 -