MATEMÀTIQUES-II per a Multimèdia - PAC2
Matemàtiques per a multimèdia II
ENUNCIAT 1. Els estudiants que es van presentar a l'examen final de Matemàtiques del quadrimestre passat van obtenir les següents qualificacions: 7
3
2
4
5
1
8
6
5
1
3
4
5
1
3
6
0
9
10
5
8
6
4
4
4
7
8
3
2
6
5
7
3
6
4
8
6
5
3
1
a) Quin tipus de variables són? Les variables que ens presenta aquesta taula són de tipus quantitatiu. A diferència de les variables qualitatives, que ofereixen dades en forma de qualitativa o descriptiva (com per exemple les comarques o municipis) les dades quantitatives ens ofereixen observacions en forma de quantitat.
b) Determinar la distribució de freqüències, la mitja, la desviació típica, la mediana, els quartils i la moda. MEDIANA La mediana es correspon amb el valor que divideix la distribució de les dades en dues parts iguals. Es calcula a partir de la fòrmula
m=
(n +1) . 2
El primer que cal fer és ordenar les dades de la nostra distribució en ordre ascendent.
0, 1, 1, 1, 1, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9, 10
Tot seguit calculem la posició de la mediana dins de la distribució. En el nostre cas
m=
( 40 +1) = 20'5 . 2
La mediana de la distribució es troba just entre el valor de la posició 20 i la posició 21.
0, 1, 1, 1, 1, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9, 10
El valor de la mediana és m= 5
MATEMÀTIQUES-II per a Multimèdia - PAC2
QUARTILS De manera anàloga, els quartils divideixen la distribució en quatre parts. En podem trobar tan sols tres, sent el segon coincident amb la mediana. El primer quartil dividirà els valors de primera meitat de l'observació i el tercer quartil dividirà la segona meitat de l'observació. En el nostre cas
Q1 =
(20 +1) = 10'5 i Q
3
2
=
(20 +1) = 10'5 . 2
Això significa que Q1 i Q3 estan situats en la posició 10'5 de les seves meitats respectivament.
0, 1, 1, 1, 1, 2, 2, 3, 3, 3 , 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9, 10
Els valors dels quartils són Q1=3 i Q3=6.
MODA La moda és el valor que presenta la freqüència més alta entre totes les observacions. En el nostre cas hi ha quatre valors que comparteixen el nivell màxim de freqüència: 3, 4, 5 i 6. DISTRIBUCIÓ DE FREQÜÈNCIES La distribució de freqüències ens indicarà en quina mesura es repeteixen els diferents valors dins de la nostra distribució.
x 0 1 2 3 4 5 6 7 8 9 10 SUMA
n 1 4 2 6 6 6 6 3 4 1 1 40
MATEMÀTIQUES-II per a Multimèdia - PAC2
MITJANA ARITMÈTICA Per calcular la mitjana aritmètica
(x) sumarem tots els valors de les dades i dividirem el sumatori pel
nombre d'observacions (n).
0 1 2 3 4 5 6 7 8 9 10 SUMA
n 1 4 2 6 6 6 6 3 4 1 1 40
x=
x*n 0 4 4 18 24 30 36 21 32 9 10 188
!(x ·n ) = 188 = 4' 7 i
i
N
40
VARIÀNCIA I DESVIACIÓ TÍPICA La mediana desviació típica ens indicarà quin és el grau de dispersió dels valors de la nostra distribució respecte de la mitjana. Per fer-ho, haurem de calcular primer la variància, que és el quocient resultant de dividir el sumatori de totes les desviacions respecte a la mitjana elevades al quadrat entre n-1.
s
2 x
"(x ! x) =
2
i
n !1
Un cop trobada la variància obtenim un valor que ha estat elevat al quadrat. Per poder tornar a treballar sobre els valors inicials en tindrem prou de fer l'arrel quadrada de la variància. D'aquesta manera obtenim la desviació típica.
sx = sx2
MATEMÀTIQUES-II per a Multimèdia - PAC2
x 0 1 2 3 4 5 6 7 8 9 10 SUMA
s
2
n 1 4 2 6 6 6 6 3 4 1 1 40
"(x ! x) =
2
i
n !1
desviació -‐4'7 -‐3'7 -‐2'7 -‐1'7 -‐0'7 0'3 1'3 2'3 3'3 4'3 5'3
x*n 0 4 4 18 24 30 36 21 32 9 10 188
=
228' 4 = 5'85 40 !1
desviació2*n 22,09 54,76 14,58 17,34 2,94 0,54 10,14 15,87 43,56 18,49 28,09 228,40
s = 5'85 = 2' 42
c) Dibuixar el diagrama de barres i raona el resultat.
QUALIFICACIONS FREQÜÈNCIES
6 5 4 3 2 1 0 0
QUALIFICACIONS
1
0 1
2
3
1 4
4
2 2
5
3 6
6
4 6
7
8
9
10
5 6
6 6
7 3
8 4
9 1
10 1
Tal i com es pot observar en el gràfic de barres, la màxima freqüència de les observacions s'ha concentrat en la part mitjana de la distribució, entre els valors 3 i 6. Això ens indica que el gruix més grans de valors s'ha concentrat al voltant de la mitjana, que pren un valor de 4'7.
MATEMÀTIQUES-II per a Multimèdia - PAC2
La desviació de la distribució també s'ajusta amb aquest interval de màxima freqüència. El primer i el tercer quartil es mouen entre el valor 3 i el valor 6, i la mediana es correspon amb el valor 5, molt proper al 4'7 de la mitjana.
2. Heu decidit usar els recursos de la UOC per fer una enquesta sobre que tipus de Tablets utilitzen els alumnes matriculats a la universitat de cara a dissenyar una aplicació interactiva per la més estesa entre l'alumnat. a) Investiga sobre diferents formes de mostreig: mostreig aleatori, sistemàtic, estratificat, per conglomerats, etc. Explica les diferents formes oposades, diferències i característiques d'ús. MOSTREIG ALEATORI SIMPLE És el procediment més simple de tots, ja que parteix de la base que tots els elements de la població tenen, a priori, la mateixa probabilitat de escollits o triats. Podem descriure el seu procediment de la següent manera: 1. s'assigna un nombre a cada individu de la població. 2. es procedeix a l'elecció de tants subjectes com siguin necessaris per completar la mostra requerida. Aquesta elecció es fa de manera aleatòria, a partir d'algun mitjà mecànic (boles, nombres aleatoris generats per ordinador,…). Tot i que pot semblar un procediment clarament atractiu per la simplicitat de la seva implementació, es desaconsella quan la població sobre la que s'ha de treballar és molt gran. MOSTREIG ALEATORI SISTEMÀTIC Aquest sistema es basa en el mostreig aleatori simple. Per aquest motiu exigeix numerar tots els individus de la població per poder començar a treballar però difereix en el sistema d'aleatorietat que se li aplica. Podem descriure el seu procediment de la següent manera: 1. es fixa el nombre d'elements que formaran la mostra. 2. s'extreu (k), una constant que resulta de dividir el nombre total de població (N) entre el nombre total d'elements de la mostra: k=N/n. 3. enlloc d'extreure tota una sèrie de nombres aleatoris se n'extreu tan sols un, que anomenarem (i). 4. (i) serà un nombre que estarà entre 1i k. 5. els elements que formaran la mostra seran els que ocupin les posicions i, i+k, i+2k,… i+(n-1). Aquest mostreig assegura una cobertura de totes les tipologies presents en la mostra sempre i quan no es produeixin peridiocitats constants en la població (que, per exemple, tots els homes quedin a la primera part de llista i les dones a continuació). MOSTREIG ALEATORI ESTRATIFICAT
MATEMÀTIQUES-II per a Multimèdia - PAC2
Aquest sistema de mostreig intenta obviar les dificultats dels dos mètodes anteriors. Consisteix a considerar diferents categories (estrats) que guarden homogeneïtat respecte a algun criteri de selecció. Podríem establir diferents estrats a partir de la professió, el lloc de residència o els estudis realitzats. El que es pretén a l'hora d'establir aquest mètode de mostreig és assegurar que tots els estrats d'interès estiguin representats dins de la mostra. Alhora cada estrat pot funcionar de manera autònoma i independent, doncs a cadascun d'ells se li podrà aplicar algun altre tipus de mostreig de manera particular. Per contra, pot generar moltes dificultats si no es té un coneixement detallat de la població i de les diferents característiques que permetrien establir estrats. MOSTREIG ALEATORI PER CONGLOMERATS El mostreig per conglomerats pren com a unitat mostral un grup d'elements de la població que forma una unitat diferenciada de la resta (conglomerat). Aquest conglomerat podria ser una zona geogràfica concreta, un departament universitari o un cicle determinat dins d'un claustre de mestres. El mostreig per conglomerats consistirà en escollir de manera aleatòria tants conglomerats com sigui necessari per completar la mostra establerta prèviament i llavors fer els estudis pertinents sobre aquests conglomerats escollits. MÈTODES OPOSATS Despres d'haver exposat les característiques d'aquests mètodes de mostreig podem concloure que el sistema basat en estrats es podria considerar oposat al sistema basat en conglomerats. MOSTREIG ESTRATIFICAT • Tendeix a assegurar que la mostra representi adequadament a la població en funció d'unes variables seleccionades. • S'obtenen estimacions més
MOSTREIG PER CONGOMERATS • És molt eficient quan la població és molt gran i dispersa. • No cal tenir un llistat de tota la població, només de les unitats primàries de mostreig.
precises. • El seu objectiu és aconseguir una mostra el més semblant possible a la població. Com es pot observar, el primer mètode funcionarà millor com més homogènia sigui la població respecte a l'estrat, malgrat que els estrats entre si siguin molt diferents. Per contra, el mostreig per conglomerats permet centrar-se en una població dispersa, tot i que aquests puguin ser molt semblants entre si.
b) Disposes de la llista dels 15.000 matriculats. Explica quin tipus de mostreig realitzaríeu i com faríeu per tenir una mostra de 1500 estudiants.
MATEMÀTIQUES-II per a Multimèdia - PAC2
Per aconseguir una mostra de 1500 estudiants entre els 15000 matriculats podríem optar per treballar sobre un mostreig sistemàtic. Basat en el mostreig aleatori simple, ens ajuda el fet que puguem numerar tots els individus pertanyents a la població, en el nostre cas els alumnes matriculats. Per dua a terme el nostre mostreig seguirem els següents passos: 1. Fixem el nombre d'elements que formaran la mostra, en el nostre cas n=1500. 2. Extreiem
(k) ! k =
N 15000 = = 10 n 1500
3. Extreiem (i), un nombre aleatori comprès entre 1 i 10. En el nostre cas i = 8 4. Els elements que formaran la mostra seran els que ocupin les posicions 8, 8+10, 8+2·10,… consecutivament fins arribar a 8+(n-1).
c) Suposeu ara que dels 15.000 matriculats, 3555 estudiants estan matriculats dels Estudis d'Informàtica, Multimèdia i Telecomunicació; 2825 estudiants dels Estudis d'Empresarials; i la resta estan matriculats de Ciències Socials. Que tipus de mostreig s'ha de realitzar per obtenir una mostra de 1500 estudiants de manera que es tingui en compte els estudis de què s'han matriculat. Per obtenir una mostra de 1500 alumnes tenint en compte els estudis en què estan matriculats podríem emprar un mostreig estratificat en percentatges. La clau d'aquesta elecció rau en el fet que disposem del nombre total de la població i el percentatge exacte en què aquesta està dividida. Això ens permetrà trobar la proporció en que aquests estrats es troben a la població total i aplicarlos diferents models de mostreig de manera independent. En el nostre cas podríem seguir el següent procediment: •
•
Calculem el percentatge que conté cada estrat: Estudis d'Informàtica, Multimèdia i Telecomunicació
23'70%
Estudis d'Empresarials
18,83%
Ciències Socials
57'46%
Amb aquestes dades calculem quin seria el percentatge sobre 1500 que correspondria a cada estrat. Un cop establert el percentatge podem aplicar un mostreig aleatori sistemàtic per extreure de cada estrat el nombre necessari d'individus, que sumats a la resta dindividus dels altres estrats en donarà una mostra de 1500 individus.
MATEMÀTIQUES-II per a Multimèdia - PAC2
3. L'histograma de freqüència relativa que es presenta a continuació mostra la distribució del nombre de persones que clica sobre un bàner publicitari que hi ha en una web, al llarg de 50 dies.
0,42 0,24 Y 0,14
0
2
5
8
10
x
a) Calculeu el valor Y (noteu que el dibuix no està a escala real). El valor de Y el trobarem sabent que tots els bloncs han de sumar 1 ja que estan presentats en tant per un. Per tant Y=1-0,42-0,24-0,14=0,2. En cas que volguéssim calcular el percentatge, els valors haurien de sumar 100. En el nostre cas Y=20%.
b) A partir de les dades de l'histograma obteniu la taula de freqüències relatives, relatives acumulades, absolutes i absolutes acumulades.
0-‐2 c lics 2-‐5 clics 5-‐8 clics 8-‐9 clics
fi 0'14 0'42 0'24 0'20
Fi 0'14 0'56 0'80 1
ni 0'14*50 = 07 0'42*50 = 21 0'24*50 = 12 0'20*50 = 10
Ni 7 28 40 50
c) Calculeu: la mitja, la mediana i la desviació típica dels accessos al bàner realitzats. Com que tenim les dades agrupades en intervals o classes no podem calcular la mitjana de forma directa perquè no tenim cap valor concret x per poder-la calcular. Per resoldre aquest problema es
MATEMÀTIQUES-II per a Multimèdia - PAC2
calcula el que s'anomena la marca de classe, que és el valor mig de l'extrem superior i inferior de l'interval. Així doncs, el primer que farem serà establir la marca de classe de cadascun dels intervals: •
0-2 clics: 1
•
2-5 clics: 3'5
•
5-8 clics: 6'5
•
8-9 clics: 8'5
interval 0-‐2 clics 2-‐5 clics 5-‐8 clics 8-‐9 clics
x 1 3'5 6'5 8'5 SUMA
x=
0-‐2 clics 2-‐5 clics 5-‐8 clics 8-‐9 clics
x 1 3'5 6'5 8'5 SUMA
s
x*n 7 73'5 78 85 243'5
!(x ·n ) = 243'5 = 4'87 i
i
N
n 7 21 12 10 50
2
n 7 21 12 10 50
50
x*n 7 73'5 78 85 243'5
"(x ! x) = i
n !1
2
=
desviació ( x ! x ) desviació2*n -‐3'87 104'8383 -‐1'37 39'4149 1'63 31'8828 3'63 131'7690 307'9050
307'905 # 6'28 50 !1
s = 6'28 = 2'5
MATEMÀTIQUES-II per a Multimèdia - PAC2
4. En una empresa de RRHH internacional han realitzat l'assignació de punts dels aspirants a un lloc de treball d'una multinacional usant una distribució normal de mitjana 110 punts i 15 punts de desviació típica. a) Quina probabilitat hi ha que un aspirant al lloc obtingui més de 125 punts? Sabem que estem treballant sobre una distribució normal, amb una mitjana de 110 i una desviació típica de 15 punts. Així doncs, per trobar Z haurem d'aplicar la següent fòrmula:
" X !µ% Z =$ i ' # ! & La taula de la llei Normal només dóna els valors P(Z
a) hem de fer el càlcul 1-P(Z
" 125!110 % P ( X > 125) = P $ Z > ' = P ( Z > 1) = 1! P ( Z < 1) = 1! 0,8413 = 0,1587 15 & # La probabilitat que un aspirant al lloc obtingui més de 125 punts és de 0'1587.
b) Per passar a la segona fase de selecció cal tenir 100 punts o més. Quin percentatge d'aspirants passarà? " 100 !110 % P ( X > 100) = P $ Z > ' = P ( Z > !0,67) = P ( Z < 0,67) = 0,7485 15 & # El percentatge d'aspirants serà d'un 74'85&%.
c) Quants punts com a mínim ha de tenir un aspirant al lloc per estar entre el 25% dels millors? Aquí hem de trobar un valor a tal que Mirant la taula obtenim que a=0,68.
P( Z > a) = 0, 25 .
O el que és el mateix,
P( Z < a) = 0, 75 .
X !110 = 0,68 = (0'68 x 15) +110 = 120'2 15 Un aspirant haurà de treure un mínim de 120'2 punts per estar entre el 25% dels millors.
* La taula que s'ah fet servir no tenia valors negatius de Z. Per això s'ha fet servir la propietat P(Z>-a)=P(Z