Homogeneidad, Independencia y Bondad de Ajuste 8.1.Ejercicios 8.1. Ejercicios Resueltos Resueltos EJERCICIO 1 Un ginecólogo analiza la posible relación entre la edad de la menarquıa y la aparición de cáncer de mama. Con el fn de estudiarlo clasifca a las mujeres que acuden a su consulta en dos grupos, aquellas que tuvieron la menarquia antes de los 1 a!os "a las que distingue con el valor cero#, y aquellas que la tuvieron despu$s de esta edad " a las que distingue con el valor 1#. %e presentan a continuación los resultados obtenidos&
(dad de 'enarquıa + 1
la
Cáncer de %)ı
'a ma *o
-0
/ 1/
2etermine si e3iste relación o no entre estas variables.
O!"CIO#$ 4ara medir si e3iste relación entre la edad de la menarquia y el cáncer de mama, realizamos un test de independencia. & *o e3iste independencia 4ara tal 5ipótesis, ocupamos el estad6stico χ .
(n donde los observados son los valores que aparecen en la tabla y los esperados esperados los calculamos calculamos mediante H+, por ejemplo, ejemplo, el esperado para la casilla
7uego para cada casilla, los esperados serıan los que se muestran a continuación& Cáncer %i *o +
(dad 1
-
/
-,9
0-,1-
-0 1/ 9,1- 110,9
8ot al 1 1 0 19
/+ 8otal 8otal 111 1 / 7uego el estad6stico nos queda de la siguiente manera&
: 1+,- ; ,+0 ; ,9 ; /,01 : ,9+1 <5ora, rec5azamos donde flas en este caso tenemos y columnas y el α lo escogemos como +.+. 4or lo tanto tene tenemo mos s Cuadrado.
9- busc buscad ado o en una una tabl tabla a de la dist distri ribu buci ción ón C5i= C5i=
7uego, 7uego, como como 9- se rec5a rec5aza za la 5ipótes 5ipótesis is de que ambas variables sean independientes con un > de confanza.
EJERCICIO % 2e un proceso de ?abricación, se seleccionan 1++ ampolletas de 0 @atts y se lleva a cabo una prueba para determinar la vida Atil de estas ampolletas. (l resultado de esta prueba, en miles de 5oras, se resume en la siguiente tabla& 8iempo de + = 2uración +. o N de
+. = +.+
+.- = +. 1
+. = +.9
+.9 = 1 1
1= 1.1 1
B%e puede concluir al nivel de signifcancia del >, que la vida u)til de todas las ampolletas se distribuye e3ponencial
O!"CIO#$ (n este caso debemos 5acer un test de Dondad de
4ara esto debemos sacar las ?recuencias esperadas para cada uno de los rangos, bajo la 5ipótesis de una distribución e3ponencial, luego primero debemos estimar el parámetro λ de la e3ponencial. %abemos que la E" X # : λ1 cuando X E Exp" λ#, luego ocupemos el estimador de la media&
7a media la calculamos as6 por tener los datos en una tabla de ?recuencias. 7uego, obtenemos que&
4osteriormente, calculamos las probabilidades de estar en cada uno de las clases de la tabla de ?recuencias, para despu$s calcular la ?recuencia esperada.
Como tenemos un total de 1++ observaciones, las ?recuencias esperadas las obtenemos multiplicando la probabilidad de estar en la clase por 1++, es decir& f esperadaF+ G + ,H : P "+ < X < +,# I 1++
: //,0 7uego 5aciendo el cálculo para cada celda, queda& 8iempo de 2uración No de
+= +. //.0
+. = +.+ ./-
+.- = +. 1 1-.91
+. = +.9 .9
+.9 = 1 1 .1
1= 1.1 1 ./0
Jinalmente para testear nuestra 5ipótesis H+ & 7os datos distribuyen (3ponencial vKs H1 & *o distribuyen e3ponencial
Lcupamos el estad6stico
: 0, 7uego rec5azamos -9 con k el nAmero de clases y p el nAmero de parámetros de la distribución. 4or lo tanto, como 0 , > ,-9 se rec5aza la postura de una distribución e3ponencial en los datos del tiempo de vida de las ampolletas.
EJERCICIO & Un mecánico analiza la posible relación entre la edad de la máquina y la aparición de una ?alla grave. Con el fn de estudiarlo clasifca a las maquinas en dos grupos, aquellas que tuvieron una ?alla grave antes de los 1 a!os "a las que distingue con el valor +#, y aquellas que la tuvieron despu$s de esta edad "a las que distingue con el valor 1#. %e presentan a continuación los resultados obtenidos& Jalla Mrave
(dad 'aquina
%i + -
*o /
1 -0
1/
"a# Calcule el 8est χ de 4earson. "b# 2etermine si e3iste relación o no entre la variables
O!"CIO#$ Completamos la tabla dada con los valores esperados
Jalla Mrave %i *o +
-
-,9 1 (dad 'aquina 1
8otal
/
8o tal 1 1 0
0-,1/
-0
1/
9,1 /
110,9 1
111
1
1 9
/ + /
"a# 2ada la tabla completa con los valores esperados calculamos el estad6stico como sigue&
: 1+,- ; ,+0 ; ,9 ; /,01 : ,9+1
"b# %e rec5aza N+ & O independencia entre la edad de la máquina y si la ?alla es grave si χ > χ "1GαP"f G1#I"cG1##
Como χ : ,9+1 > /,9-1- : χ +,P1 %e rec5aza la 5ipótesis de independencia entre las ?allas graves y la edad de las maquinas.
EJERCICIO ' %uponga que cierto artıculo puede presentar 5asta - de?ectos di?erentes. Una muestra aleatoria de de estos art6culos es clasifcado de acuerdo al nAmero de de?ectos, obteni$ndose lo siguiente& Q de de?ectos Q de casos
+
1
/
-
9
19
19
11 +
Un ingeniero afrma que el nAmero de de?ectos X es una variable aleatoria con distribución de probabilidad R
+
e.o.c
BSue podr6a concluir, en base a los datos de la muestra, con α : +,+, respecto de lo frmado por el ingeniero
O!"CIO#$ *ecesitamos calcular probabilidades.
la
?recuencia
esperada,
mediante
luego el nAmero de casos esperados será Ei : P" X : i# I : n o de de?ectos igual a i
las
una vez calculados estos valores tenemos lo siguiente Q de de?ectos " i# Q de casos observado "Oi# Q de casos esperados "Ei#
+ 9 9.
1 19 109.
19 109.
/ 11 + 11
.
4ara la 5ipótesis N+& los datos distribuyen con la ?unción de probabilidad dada. %e rec5aza N+ si
donde k & no de clases y p& no de parámetros. 7uego
4or lo tanto no e3iste evidencia sufciente bajo un > de confanza para rec5azar N+, es decir, los datos pueden ser modelados por la distribución dada.
EJERCICIO ( Una empresa empaca determinado producto de latas de tres tama!os distintos, cada uno en distinta l6nea de producción. 7a mayor parte de las latas se apegan a las especifcaciones, pero un ingeniero de control de calidad 5a identifcado los siguientes de?ectos& 'anc5a en la lata. Mrieta en la lata. Ubicación incorrecta del anillo de apertura. Jalta del anillo de apertura. Ltras. %e selecciona una muestra de unidades de?ectuosas de cada una de las tres l6neas, y cada unidad se clasifca segAn el de?ecto, la siguiente tabla de contingencia incluye esos datos& 2e?ecto 'anc5
Mriet
Ubicació
Jalt
Ltra
8ama!o
de
la
a 76nea de 4roducción
1 / 8otal
a // / 9
n
9 1-
a 1 1 1-
10 1 9
s 1/ 1+
muestra 1+ 1 1++ /0
B7os datos sugieren desigualdad en las proporciones que caen en las distintas categor6as de las tres l6neas
O!"CIO#$ 7os parámetros de inter$s son las diversas proporciones y las 5ipótesis relevantes son& N+& 7as l6neas de producción son 5omog$neas con respecto a las categor6as que no cumplen las especifcaciones. N1& 7as l6neas de producción no son 5omog$neas con respecto a las categor6as que no cumplen las especifcaciones. <5ora se presenta una tabla resumen con los valores esperados y el valor de "Obs. G Esp.# /Esp.
1
C1
C2
C3
C4
C5 Total
34
65
17
21
13
150
35,60 58,00 23,20 21,60 11,60 0,072 0,845 1,657 0,017 0,169 2
23
52
25
19
6
29,67 48,33 19,33 18,00 9,67 1,498 0,278 1,661 0,056 1,391 3
32
28
16
14
10
23,73 38,67 15,47 14,40 7,73
1 2 5 1 0 0
2,879 2,943 0,018 0,011 0,664 3 Tota l
7 89
145
58
54
29
5
luego, bajo un > de confanza lo que indica que no e3iste sufciente evidencia para rec5azar N +, es decir las l6neas de producción serıan 5omog$neas con respecto a las categor6as que no cumplen las especifcaciones. %i disminuimos la confanza a un +> tenemos que
luego, a5ora sı e3istir6a evidencia bajo este nivel de signifcancia para rec5azar N+.
EJERCICIO ) Un estudio de la relación entre las condiciones de las instalaciones en gasolineras y la agresividad en el precio de la gasolina reporta los siguientes datos basados en una muestra de n : 1-- gasolineras.
'odern a n.j
*eutr al 1
*o agresiva 10
0/
9+
9
9
/
1/-
10-
1//
ni.
+ 1 9 + 1
(n el nivel +.+1, Bla in?ormación sugiere que las condiciones de instalaciones y las pol6ticas de precios son independientes entre si
O!"CIO#$ 7a 5ipótesis a docimar es& N+& 7as condiciones de las instalaciones con la pol6tica de precios son independientes. vs N1& *o e3iste independencia. 7a siguiente tabla resume entrega la in?ormación necesaria para calcular el estad6stico χ .
1
C1 10,+ 1,9 ,90 +,++1 , 1,9/
C C/ 8otal 1 10 ,1+ ,09 0/ 9+ 9+,99 +
1,0++ +,0 ,/-/ /
8ot al
9 9 / 1 -, 01,+ 9 -, + +,++ /,1 ,1 1/- 10- 1// 1
luego, bajo un > de confanza
lo que indica que e3iste sufciente evidencia con este nivel de confanza para rec5azar N+, es decir el conocimiento de la pol6tica de precios de una gasolinera proporciona in?ormación acerca de la condición de las instalaciones de la gasolinera.
EJERCICIO * %e obtuvo una muestra aleatoria de individuos que viajan solos en automóvil al trabajo, en una gran zona metropolitana, y cada individuo ?ue clasifcado de acuerdo con el tama!o de su automóvil y la distancia de recorrido citadino. B7a siguiente in?ormación sugiere que dic5a distancia y el tama!o del automóvil están relacionados en la población a la cual se 5izo el muestreo (3prese las 5ipótesis pertinentes y utilice una prueba C5i=cuadrado con un nivel +.+. 2istancia de Tecorrido
8ama!o de
%ubcompa cto Compacto O!"CIO#$ 'ediano Mrande 7a 5ipótesis a docimar es&
F+,1 +# 9 1 1-
F1+, +# 0
F+,... # 1
/ - 19
10 //
N+& (3iste independencia entre la distancia de recorrido y el tama!o del automóvil. vs N1& *o e3iste independencia.
7a siguiente tabla resume entrega la in?ormación necesaria para calcular el estad6stico χ . C1 C C/ 8otal 1 0 1 1+,1 ,1 1,+ 1,0- +,++,0-1 9 / 10 11, /+,01 19,/+ 1,/+ +,9 +,+ / 1 - // 1,-+ -,+ ,0+ +,1/1 +,-9+ +,/0 1- 19 / 0,- 1,1 9 11,-+ ,0+,+ ,9 8ot al - 1 0 + luego, bajo un > de confanza
lo que indica que e3iste sufciente evidencia con este nivel de confanza para rec5azar N+, es decir, la distancia de recorrido proporciona in?ormación acerca el tama!o del automóvil.
EJERCICIO 8 Una empresa quiere contratar a cierta cantidad de personas y de los postulantes que se presentan se 5ace una preselección de - 5ombres y - mujeres de entre los cuales el je?e de personal decide quien será contratado y qui$n no. 2espu$s de que el je?e de personal 5izo la selección de los contratados los resultados ?ueron los siguientes,
Contratado *o contratado
Nombr e 1 /
'uj er 11+
mujeres tambi$n lo ?ueron. B(3istirá discriminación por parte del je?e de personal. 4lantee las 5ipótesis con palabras y param$tricamente, llegue a conclusiones utilizando un nivel de signifcancia de α : +,+.
O!"CIO#$ Nipótesis& H+ & *o e3iste discriminación "Nomogeneidad# vs H1 & (3iste discriminación "*o Nomogeneidad#
(quivalentemente H+ & p1 j : p j j : 1,
vs H1 & p1 j : p j para algAn j
4ara testear tales 5ipótesis, se ocupa el estad6stico
donde
, el cual rec5aza H+ cuando
.
7uego la tabla de valores esperados es&
&on$ra$ado No con$ra$ado #o$a% nI j
Hobr !"je e r 10, 10, , ,
-
-
#o$a% niI /
1/ -9
4or lo tanto el estad6stico de prueba queda
Como , se rec5aza H+, es decir, con un > de confanza e3iste discriminación 5acia la mujer por parte del je?e de personal.
EJERCICIO + 2e cada una de tres comunidades se sacó una muestra de jóvenes casados. < cada pareja se le pidió que especifcara la cantidad m6nima de educación que esperaba que sus 5ijos recibieran. 7a siguiente tabla muestra los resultados que se observaron en la muestra&
*ivel '6nimo Colegio (duc. comercial Universitari o 8otal
Comunidad < D C /+ /+ +
1+
9 1 09 1 / + 1 + +
8ot al 9 9 -0
BSue se puede concluir respecto a la 5omogeneidad de las aspiraciones en la educación de los 5ijos
O!"CIO#$ 7as 5ipótesis son& H+ & 7as / poblaciones son 5omog$neas respecto de las aspiraciones de educación para sus 5ijos. " p11 : p1 : p1/#. H1 & 7as / poblaciones no son 5omog$neas "4or lo menos proporciones de una misma fla no son iguales entre s6.#
4ara testear tales 5ipótesis, se ocupa el estad6stico
donde
, el cual rec5aza H+ cuando
7uego la tabla de valores esperados es&
.
*ivel '6nimo Colegio (duc. comercial Universitari o 8otal
Comunidad < D C .9 1.9 /-. / /+.++ .++ -+. ++ -.11 09.- 1 . 1+ 1 + +
8ot al 9 9 -0
4or lo tanto el estad6stico de prueba queda
: 9,-
Como , no e3iste evidencia en los datos para rec5azar H+, es decir, con un > de confanza e3iste 5omogeneidad entre las comunidades.
EJERCICIO 1 %e seleccionó una muestra al azar de 0 alumnos de ultimo ano de colegio de cada uno de los siguientes tres grupos de rendimiento atl$tico& alto, medio y bajo. 7os muc5ac5os se clasifcaron de acuerdo con la inteligencia tal como aparece en la tabla. BVndican estos datos una di?erencia en la distribución de la inteligencia entre los tres grupos
Vnteligen cia
Tendimiento
8otal
+
+
1
1+ +
O!"CIO#$ 7as 5ipótesis son& H+ & 7os / niveles de inteligencia son 5omog$neos respecto del rendimiento. " p1 j : p j : p/ j#. H1 & 7os / niveles de inteligencia no son 5omog$neos respecto del rendimiento "4or lo menos proporciones de una misma columna no son iguales entre si.# 4ara testear tales 5ipótesis, se ocupa el estad6stico
donde
, el cual rec5aza H+ cuando
.
7uego la tabla de valores esperados es&
Vnteligen cia
Tendimiento
4or lo tanto el estad6stico de prueba queda
: 1+,1
8ot al 10 / + 1+ +
Como , se rec5aza H+, es decir, con un > de confanza no e3iste 5omogeneidad entre los niveles intelectuales.
EJERCICIO 11 Un investigador desea saber si es posible concluir que 5ay relación entre el grado de liberalismo y la posición en la universidad en una población de estudiantes universitarios. 4ara estos e?ectos se seleccionó una muestra de ++ estudiantes. 7a tabla siguiente muestra la clasifcación de los datos segAn sus respuestas&
Clase 1er. a!o o. a!o /er. a!o -o. a!o 8otal
Mrado de 7iberalismo 7igero 'oderado
BSue se puede concluir respecto al
9/
8ot al 1 + 1 1 1+ + + +
/ 0 + - / /9 / + problema del investigador
O!"CIO#$ 7as 5ipótesis son& H+ & (3iste independencia entre el grado de liberalismo y el a!o
universitario. "
H1 & *o e3iste independencia entre el grado de
liberalismo y el a!o universitario."
4ara testear tales 5ipótesis,
se ocupa el estad6stico
donde
, el cual rec5aza H+ cuando
7uego la tabla de valores esperados es& Mrado de 7iberalismo
.
Clase
7igero 'oderado
1er. a!o o. a!o /er. a!o -o. a!o 8otal
.+
.+
19.0
.0
19.0
.0
1.++
--.+
0
/
+. + +. + +. + -+. -+ +
8ot al 1 + 1 1 1+ + + +
4or lo tanto el estad6stico de prueba queda
: ,01
Como , se rec5aza H+, es decir, con un > de confanza el grado de liberalismo en los estudiantes universitarios no es independiente del anWo que cursa el alumno.
EJERCICIO 1% Una muestra de ++ personas responde dos preguntas& fliación pol6tica y actitud 5acia una re?orma de impuestos, los resultados son los siguientes&
Jiliación 2emócrat a Tepublica no 8otal
9/
-
0
9-
1+
1-9
8ota l 9 1 + +
B(3iste relación entre la tendencia pol6tica y la actitud 5acia la re?orma de impuestos. 4lantee la 5ipótesis necesaria y concluya.
O!"CIO#$ 7as 5ipótesis son& H+ & (3iste independencia entre la tendencia pol6tica y la actitud 5acia la re?orma. "nij : ni n j H1 & (3iste asociación entre la tendencia pol6tica y la actitud 5acia la
re?orma." 4ara testear tales 5ipótesis, se ocupa el estad6stico
donde
, el cual rec5aza H+
cuando
.
II
7uego la tabla de valores esperados es&
Jiliación 2emócrat a Tepublica no 8otal
9.
9-./
9.9
-.
/.-
+
1+
1-9
8ota l 9 1 + +
4or lo tanto el estad6stico de prueba queda
: ,1
Como , se rec5aza H+, es decir, con un > de confanza la tendencia pol6tica inXuye en la actitud 5acia la re?orma.
EJERCICIO 1& (n una muestra aleatoria de 1++ universitarios se clasifco cada uno de ellos segAn si 5ab6a consumido alguna vez droga o no y el promedio de notas. < partir de los datos tabulados en la tabla, Bproporcionan estos datos evidencia sufciente como para concluir que 5ay una relacion entre las dos variables Use α : +,+. BNa consumido 2rogas 4romedio %i *o 8ot notas al Y -,+ 1+ / > -,+ + -1 1 8otal /+ 0+ 1+ +
O!"CIO#$ 7as 5ipótesis son& H+ & (3iste independencia entre el consumo de drogas y el promedio de
notas " H1 & (3iste asociación entre el consumo de drogas y el promedio de
notas."
donde
4ara testear tales 5ipótesis, se ocupa el estad6stico
, el cual rec5aza H+ cuando
.
7uego la tabla de valores esperados es& BNa consumido 2rogas %i *o
4romedio notas Y -,+
11,0
0,/
> -,+
19,/
-,0
8otal
/+
0+
4or lo tanto el estad6stico de prueba queda
8ot al / 1 1+ +
: +,09
Como , no se rec5aza H+, es decir, con un > de confanza el consumo de droga no inXuye en el promedio de notas de los estudiantes.