Estudios Profesionales para Ejecutivos - EPE
CURSO
:
Estadística para Ingeniería 2
ÁREA
:
Ciencias
TIPO DE MATERIAL
:
Separata del curso
AUTORES
:
Enit Huamán Cotrina Enver Tarazona
COORDINADOR DEL CURSO
:
Enit Huamán Cotrina
CICLO
:
2013-1
VERSIÓN
:
01
Copyright : Universidad Peruana de Ciencias Aplicadas - UPC
1
Capítulo 1 Muestreo y distribuciones muestrales 1.1 Introducción En este capítulo se indicara como usar el muestreo aleatorio simple para seleccionar una muestra a partir de una población y como se pueden emplear los datos obtenidos para calcular las estimaciones puntuales para una media, variancia y proporción poblacionales. poblacionales. Se describe el concepto de distribución muestral, el teorema del límite central y los diferentes métodos de muestreo probabilísticos y no probabilísticos.
1.2 Muestreo aleatorio simple Existen diferentes métodos para seleccionar una muestra a partir de una población; uno aleatorio simple. La definición de este método y el de los más comunes es el muestreo aleatorio simple proceso de selección de la muestra muestra dependen dependen de si la población población es finita o infinita.
Muestreo para poblaciones finitas Una muestra aleatoria simple de tamaño n de una población finita de tamaño N , es una muestra seleccionada de tal manera que cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada. seleccionada. Para seleccionar una muestra aleatoria simple de una población finita es necesario enumerar los elementos de la población. Los elementos se eligen usando números aleatorios generados a partir de una tabla o computadora hasta completar el tamaño de muestra requerido. Al elegir una muestra aleatoria simple es posible que se repitan algunos de los números aleatorios generados. Si se decide elegir solamente una vez cada elemento en la muestra, todos los números aleatorios ya utilizados no se vuelven a tomar en cuenta. La selección de la muestra en esta forma se conoce como muestreo sin reemplazo. Si se decide seleccionar los elementos de la muestra incluyéndolos más de una vez se realizaría un muestreo con reemplazo. El muestreo con reemplazo es una forma válida de identificar una muestra aleatoria simple. Sin embargo lo que se usa con mayor frecuencia es el muestreo sin reemplazo. Cuando se mencione muestreo aleatorio simple se asumirá que el muestreo se hizo sin reemplazo.
2
Muestreo para poblaciones infinitas Si la población es infinita no es posible usar un procedimiento de selección con números aleatorios por que es imposible hacer una lista de sus elementos. En este caso se debe determinar un procedimiento de selección para seleccionar los elementos en forma independiente y evitar que algunos elementos tengan mayores probabilidades de ser elegidos. Una muestra aleatoria simple de una población infinita es aquella que se selecciona de tal forma que se satisfacen las siguientes condiciones:
Cada elemento seleccionado proviene de la misma población. Cada elemento se selecciona en forma independiente.
1.3 Estimación puntual Para estimar el valor de un parámetro poblacional se utiliza una característica correspondiente correspondiente en la muestra que se denomina estadístico. Los ingenieros A y B desean evaluar cierta marca de dispositivos electrónicos por lo que seleccionaron, de forma separada, muestras aleatorias simples de 100 dispositivos electrónicos. La duración (en horas) de los dispositivos seleccionados se muestra en la hoja Dispositivos. Ejemplo 6.1:
Suponga que los ingenieros desean estimar la duración promedio de todos los dispositivos electrónicos de esta marca (media poblacional ), una medida de dispersión para la duración de estos dispositivos (por ejemplo la variancia poblacional 2 ) y la proporción de dispositivos electrónicos con una duración menor a las 25 horas (proporción poblacional p ). En este caso deben utilizar los estadísticos: x la media muestral, s 2 la variancia muestral y p la proporción muestral, respectivamente. Los resultados obtenidos por el ingeniero A son: ˆ
Duración A
Media Varianza de la muestra Proporción Tamaño de muestra
39.7 73.1941414 0.04 100
estimaciones puntuales Los valores numéricos obtenidos para x , s 2 y p se les llama estimaciones puntuales de los parámetros. Es de esperar que ninguna de las estimaciones puntuales sea exactamente igual al parámetro correspondiente. El valor absoluto de la diferencia entre una estimación puntual insesgada y el parámetro poblacional correspondiente se llama error de error de muestreo. ˆ
3
Para la media, varianza y proporción muestral los errores de muestreo son x , s 2 2 y p p , respectivamente. Ejemplo 6.2:
ˆ
1.4 Introducción a las distribuciones muestrales Ejemplo 6.3:
Las estimaciones puntuales obtenidas por el ingeniero B son: Duración B
Media Varianza de la muestra Proporción Tamaño de muestra
37.05 62.085443 0.075 100
Estos resultados indican que se han obtenido diferentes valores para las estimaciones puntuales utilizando los datos obtenidos por el ingeniero B. Suponga que se lleva a cabo el mismo proceso de selección de una nueva muestra aleatoria simple de 100 dispositivos electrónicos, una y otra vez, calculando en cada ocasión las estimaciones puntuales de la media, varianza y proporción. De este modo se puede empezar a identificar la variedad de valores que pueden tener estas estimaciones. En el curso anterior se definió una variable aleatoria como una descripción numérica del resultado de un experimento. Si se considera que un experimento es el proceso de elegir una muestra aleatoria simple, la media muestral x es la descripción numérica del resultado del experimento. En consecuencia x es una variable aleatoria y por lo tanto tiene valor esperado, variancia y una distribución de probabilidad. A la distribución de x se le conoce como distribución muestral de la media. El conocimiento de esta distribución muestral y de sus propiedades permitirá realizar afirmaciones probabilísticas acerca de lo cercano que se encuentre la media muestral de la media poblacional.
1.5 Distribución muestral de la media El objetivo de esta sección es describir las propiedades de la distribución muestral de la media incluyendo el valor esperado, desviación estándar y la forma de su distribución. Tal como se menciono, el conocimiento de la distribución muestral de x permitirá hacer afirmaciones probabilísticas acerca del error de muestreo incurrido cuando se utiliza x para estimar . Valor esperado: Desviación estándar: Población finita N n n N 1 El factor
N n N 1
Población infinita n
se conoce como factor de corrección para población finita.
4
Teorema central del límite Cuando se desconoce la distribución de la población se utiliza uno de los teoremas más importantes de la estadística: el teorema del límite central . La distribución muestral del a media se puede aproximar mediante una distribución de probabilidad normal siempre que el tamaño de muestra sea grande. Se puede suponer que la condición de muestra grande se cumple para muestras aleatorias simples de por lo menos 30 elementos. Sin embargo, si la población tiene distribución normal, la distribución muestral de x tiene una distribución de probabilidad normal para cualquier tamaño de muestra. En resumen, si se utiliza una muestra aleatoria simple grande, n 30 , el teorema del límite central permite considerar que la distribución muestral de x se puede aproximar con una distribución de probabilidad normal. Cuando la muestra aleatoria simple es pequeña, n 30 , solo se puede considerar que la distribución muestral de la media es normal si se supone que la población tiene una distribución de probabilidad normal.
1.6 Distribución muestral de la proporción Para determinar lo cercano que esta la proporción muestral p de la proporción poblacional p es necesario comprender las propiedades de la distribución muestral de la proporción p , se valor esperado, desviación estándar y la forma de su distribución. ˆ
ˆ
Valor esperado: p Desviación estándar: Población finita p 1 p N n n N 1
Población infinita p 1 p n
Como en el caso de x se observa que la diferencia entre las ecuaciones para poblaciones finitas e infinitas se hace despreciable si el tamaño de la población finita es grande con respecto al tamaño de muestra por lo que se sigue la misma regla general mencionada para la media muestral en la sección anterior. Para conocer la forma de la distribución muestral de la proporción se debe aplicar el teorema del límite central para aproximar la distribución muestral con una distribución de probabilidad normal, siempre que el tamaño de muestra sea grande. En el caso de p se puede considerar que el tamaño de la muestra es grande cuando n 50 . ˆ
1.7 Otros métodos de muestreo Se ha descrito el procedimiento para el muestreo aleatorio simple y las propiedades de las distribuciones muestrales de x y p cuando se usa ese muestreo. Sin embargo, el muestreo aleatorio simple no es el único método de muestreo con el que se cuenta. Existen otras alternativas que en algunos casos presentan ventajas sobre éste. ˆ
5
Muestreo aleatorio estratificado En este tipo de muestreo primero se divide a los elementos de la población en grupos llamados estratos, de tal manera que cada elemento de la población pertenece a uno y solo un estrato. La base de formación de los estratos, por ejemplo, género, nivel socio económico, grado de instrucción, etc., queda a discreción de quien diseña la muestra. Sin embargo los mejores resultados se obtienen cuando los elementos de cada estrato son tan semejantes como sea posible. Después de formar los estratos se toma una muestra aleatoria simple de cada uno de ellos.
Muestreo por conglomerados En este tipo de muestreo se divide primero a los elementos de la población en conjuntos separados llamados conglomerados. Cada elemento de la población pertenece a uno y solo a un grupo. A continuación se toma una muestra aleatoria simple de los conglomerados. Todos los elementos dentro de cada conglomerado muestreado forma la muestra. El muestreo por conglomerados tiende a proporcionar los mejores resultados cuando sus elementos son heterogéneos o diferentes. Una de las principales aplicaciones del muestreo por conglomerados es el muestre por áreas, en el que los conglomerados son las manzanas de un distrito u otras áreas bien definidas.
Muestreo sistemático En algunos casos, en especial cuando es hay grandes poblaciones, puede ser difícil la elección de una muestra aleatoria simple cuando se determina primero un número aleatorio y después se busca en la lista de elementos de la población hasta encontrar el elemento correspondiente. Una alternativa al muestreo aleatorio simple es el muestreo sistemático. Suponga que se desea elegir una muestra de tamaño 50 de una población con 5000 elementos, se podría muestrear un elemento de cada 5000 50 100 en la población. Una muestra sistemática en este caso implica seleccionar al azar uno de los primeros 100 elementos de la lista de la población. Se identifican los demás elementos de la muestra comenzando por el primero obtenido al azar y a continuación seleccionando cada 100º elemento. Como que el primer elemento se seleccionó de manera aleatoria, generalmente se asume que un muestreo sistemático tiene las propiedades de una muestra aleatoria simple.
Muestreo por conveniencia Los métodos de muestreo que se han descrito se llaman técnicas de muestreo probabilístico. Los elementos seleccionados de la población tienen una probabilidad conocida de ser incluidos en la muestra. La ventaja del muestreo probabilístico es que la distribución del estadístico se puede identificar. Se pueden usar fórmulas para determinar las propiedades de la distribución muestral que pueden ser usadas para
6
establecer afirmaciones probabilísticas acerca de posibles errores de muestreo asociados con los resultados de la muestra. El muestreo por conveniencia es una técnica de muestreo no probabilístico. Como su nombre lo indica, la muestra se identifica principalmente por conveniencia. Se incorporan elementos en la muestra sin probabilidades preestablecidas o conocidas de selección. Un profesor que lleva a cabo una investigación universitaria puede usar alumnos voluntarios para formar una muestra, tan solo porque dispone fácilmente de ellos y participan como elementos a un costo pequeño o nulo.
Muestreo por juicio Otra técnica de muestreo no probabilístico es el muestreo por juicio. En este método la persona más capaz en el tema del estudio selecciona a los elementos de la población que se siente son los más representativos de esa población. Con frecuencia, este método es una manera relativamente fácil de seleccionar una muestra. Un reportero puede muestrear a dos o tres congresistas si considera que ellos reflejan la opinión general de todos los demás congresistas. Sin embargo la calidad de los datos muestrales depende del juicio de la persona que eligió la muestra.
7
Capítulo 2 Estimación por intervalos 2.1 Introducción Una estimación por intervalo de un parámetro poblacional se construye al restar y sumar un valor, denominado margen de error, a una estimación puntual. Todas las estimaciones por intervalo que se desarrollan en este capítulo serán de la forma: Estimación puntual ± Margen de error La inclusión del margen de error proporciona la información de precisión acerca de la estimación. Las distribuciones muestrales de x y p que se presentaron en el capítulo anterior son importantes en la obtención de la estimación respectiva por intervalo para la media y proporción poblacionales. ˆ
2.2 Error muestral En general, la diferencia en valor absoluto de entre un estimador puntual insesgado y el parámetro al cual estima se conoce como error de muestreo. Para el caso de la media muestral x que estima a y la proporción muestral p que estima a p , los errores de muestreo se definen como: ˆ
Error de muestreo = x Error de muestreo = p p ˆ
En la práctica no se puede determinar el valor del error muestral por que no se conoce exactamente el valor del parámetro poblacional. Sin embargo, la distribución de muestreo del estadístico se puede usar para hacer declaraciones de probabilidad acerca de este error.
2.3 Nivel de confianza El nivel de confianza es la probabilidad a priori de que el intervalo a calcular contenga al verdadero valor del parámetro. Si un procedimiento de estimación por intervalos es tal que en el 95% de los intervalos construidos se encuentra el parámetro poblacional, se dice que la estimación por intervalo está determinada con un 95% de confianza. El nivel de confianza expresado como un valor decimal recibe el nombre de coeficiente de confianza.
8
2.4 Estimación por intervalo de una media poblacional Caso 1: Variancia poblacional conocida El procedimiento para estimar por intervalo una media poblacional suponiendo que la población tiene distribución normal y que se conoce la variancia poblacional 2 es: Población infinita x z1
2
n
x z 1 2
n
̅ √
x z1
2
Población finita N n N n x z 1 2 n N 1 n N 1
̅ √ donde x es la media muestral, 1 es el coeficiente de confianza, la desviación estándar poblacional, n el tamaño de muestra, N el tamaño de la población y z 1 2 es el valor de distribución normal estándar que deja una probabilidad acumulada de 1 2 . Un proceso de producción es implementado de tal forma que el tiempo de producción por artículo es una variable aleatoria con desviación estándar 1.41 minutos. Suponga que se decide hacer algunos cambios de modo que el tiempo medio de producción disminuya; la variancia sin embargo, se sabe que permanecerá constante. Hechos los cambios, se toma una muestra aleatoria de 20 artículos y se registran sus tiempos de producción con los cuales se obtiene un tiempo medio muestral de 9.45 minutos. Estime mediante un intervalo de confianza del 95% el tiempo medio de producción por artículo. Ejemplo 2.1:
Se tiene: 1.41 , n 40 , x 9.45 y 1 0.95 . x z0.975
9.45 1.96
n
1.41 20
x z 0.975
n
9.45 1.96
1.41 20
8.83 10.07
9
El intervalo anterior brinda un 95% de confianza de contener el tiempo medio de producción por artículo.
Caso 2: Variancia poblacional desconocida Si no existe base suficiente para suponer que se conoce la desviación estándar de la población , se utiliza la desviación estándar muestral s . En estas condiciones el procedimiento de estimación por intervalo se basa en una distribución de probabilidad conocida como distribución t . La distribución t es una familia de distribuciones de probabilidad que depende de un parámetro conocido como los grados de libertad . A medida que aumentan la cantidad de grados de libertad, la diferencia entre la distribución t y la distribución de probabilidad normal estándar se hace más y más pequeña. El procedimiento para estimar por intervalo una media poblacional suponiendo que la población tiene distribución normal y que se conoce la variancia poblacional 2 es: Población infinita x tn1,
s 2
n
x t n 1, 2
s n
̅ √
x tn 1,
2
Población finita s N n s N n x t n1, 2 n N 1 n N 1
̅ √ donde x es la media muestral, 1 es el coeficiente de confianza, s la desviación estándar muestral, n el tamaño de muestra, N el tamaño de la población y t n1, 2 es el valor de la distribución t con n 1 grados de libertad que deja una probabilidad de 2 hacia la derecha. Cuando funciona correctamente, un proceso produce frascos de champú cuyo contenido promedio es 200 gramos. Los datos en la hoja Champú corresponden al contenido, en gramos, de una muestra aleatoria de 9 frascos seleccionadas a partir de un lote. Asumiendo que la distribución del contenido de los frascos de champú tiene distribución normal calcule un intervalo de confianza del 98% para el contenido medio de champú por frasco. Ejemplo 2.2:
10
Se tiene: n 9 y 1 0.98 . Con los datos de la muestra: x 203.56 y s 6.1260 . x t8,0.01
203.56 2.896
s n
6.1260 9
x t 8, 0.01
s n
203.56 2.896
6.1260 9
197.64 209.47
El intervalo anterior brinda un 98% de confianza para el contenido medio de champú por frasco. El intervalo de confianza para una media poblacional también se puede obtener directamente con Excel y Minitab. Contenido
Media
203.555556
Nivel de confianza (98.0%) 5.91456245 Límite Inferior
197.640993
Límite Superior
209.470118
T de una muestra: Contenido
Variable Contenido
N 9
Media 203.56
Desv.Est. 6.13
Media del Error estándar 2.04
IC de 98% (197.64, 209.47)
Determinación del tamaño de la muestra Si se ha seleccionado un margen de error deseado antes de realizar el proceso de muestreo, se pueden aplicar los procedimientos de esta sección para determinar el tamaño de muestra necesario. Sea E el error máximo de muestreo, es decir E z 1 2
n
Despejando n se obtiene la siguiente fórmula para el tamaño de muestra: n
z 12 2 2 E2
En la ecuación anterior el valor de E es el margen de error que el usuario está dispuesto a aceptar y el valor de z 1 2 se obtiene del nivel de confianza usado para construir el intervalo. Aunque se debe tomar en cuenta la preferencia del usuario, lo que se elige con mayor frecuencia es un 95% de confianza. 11
Por último, para aplicar la fórmula del tamaño de muestra se requiere conocer el valor de la desviación estándar poblacional, lo que en la mayoría de casos no se cumple. Sin embargo, podemos aplicar dicha fórmula si contamos con un valor preliminar o valor de planeación de . En la práctica se puede optar por uno de los siguientes procedimientos:
Usar la desviación estándar calculada en una muestra elegida anteriormente de la misma población. Llevar a cabo un estudio piloto para seleccionar una muestra preliminar de elementos. La desviación estándar muestral de ella se puede usar como el valor de planeación de . Dividir el rango muestral entre cuatro y usar el resultado como una aproximación de la desviación estándar poblacional.
Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro de estos anillos tiene distribución aproximadamente normal con una desviación estándar igual a 0.01 mm. Suponga que se desea realizar una estimación del diámetro promedio de los anillos producidos al 98% de confianza y con un margen de error de 0.005 mm. ¿Qué tamaño de muestra se requiere para cumplir con las condiciones anteriores? Ejemplo 2.3:
n
2 2 z 0.99
E2
2.332 0.01 0.0052
2
21.7156 22 anillos
2.5 Estimación por intervalo de una proporción poblacional El empleo de la distribución normal como aproximación de la distribución muestral de p se basa en la condición de muestras grandes. Se usará la distribución muestral de p para hacer aseveraciones probabilísticas acerca del error muestral siempre que se use esta proporción muestral para estimar la proporción poblacional. El intervalo de confianza para una proporción poblacional es: ˆ
ˆ
p z1 ˆ
p 1 p ˆ
2
ˆ
p p z 1 2
p 1 p ˆ
ˆ
ˆ
n
n
̂ ̂ ̂ donde p es la proporción muestral, 1 es el coeficiente de confianza, n el tamaño de muestra y z 1 2 es el valor de distribución normal estándar que deja una probabilidad acumulada de 1 2 . ˆ
12
Las compañías de seguros automovilísticos están analizando la posibilidad de aumentar las tarifas para las personas de género masculino que usan teléfonos mientras conducen. Una compañía especializada asegura que los conductores de sexo masculino tienen esta actitud en mayor proporción que los conductores de sexo femenino. Una muestra aleatoria de 350 conductores hombres permitió observar que 70 hombres usaban teléfonos mientras conducían. Con un nivel de confianza del 99%, ¿Qué puede afirmarse sobre la proporción de hombres que usan teléfonos mientras conducen? Ejemplo 2.4:
Se tiene: n 350 , p
70
ˆ
350
0.2 y 1 0.99 .
p Z 0,99 5
p1 p ˆ
ˆ
ˆ
0.2 2.575
ˆ
n
0.2 1 0.2 350
p p Z 0,99 5
p 0.2 2.575
p1 p ˆ
ˆ
n 0.2 1 0.2 350
0.145 p 0.255
El intervalo anterior brinda un 99% de confianza de contener la proporción de hombres que usan teléfonos mientras conducen. El intervalo de confianza para una proporción poblacional también se puede obtener directamente con Minitab. Prueba e IC para una proporción Muestra 1
X 70
N 350
Muestra p 0.200000
IC de 99% (0.144926, 0.255074)
Uso de la aproximación normal.
Determinación del tamaño de la muestra Para determinar el tamaño de muestra necesario para obtener una estimación de una proporción poblacional con determinado margen de error o nivel de precisión. Los argumentos usados son muy parecidos a los utilizados en la determinación del tamaño de muestra con el cual se estima una media poblacional. Sea E el margen de error deseado, es decir E z 1 2
p 1 p n
Despejando n se obtiene la siguiente fórmula para el tamaño de muestra: n
z12 2 p 1 p E2
13
En esta ecuación el usuario debe especificar el margen de error deseado E y el nivel de confianza. Como se desconoce la proporción poblacional, la fórmula requiere de un valor de plantación para p . En la práctica este valor se puede elegir mediante uno de los siguientes procedimientos:
Usar la proporción calculada en una muestra elegida anteriormente de la misma población. Llevar a cabo un estudio piloto para seleccionar una muestra preliminar de elementos. La proporción muestral de ella se puede usar como el valor de planeación para p . Usar el juicio para elegir el mejor valor de p . Si no se aplica ninguna de las alternativas anteriores, usar p 0.5 .
Uno de los resultados de un sondeo de opinión indica que el 35% de limeños está de acuerdo con que se firme el TLC con Estados Unidos de Norteamérica. Suponga que se decide realizar un nuevo sondeo cuyos resultados tenga un margen de error máximo del 3% y que el nivel de confianza sea del 92%. ¿De qué tamaño deberá ser la muestra de la investigación para que cumpla con las condiciones planteadas? Ejemplo 2.5:
n
2 z0.96 p 1 p
E2
1.75072 0.35 0.65 0.032
774.75 775 limeños.
2.6 Estimación por intervalo de una variancia poblacional En muchas situaciones reales, como el control de calidad en procesos de producción, se necesita estimar el valor de la variancia o desviación estándar poblacional. El procedimiento para realizar la estimación por intervalo, suponiendo que la población tiene distribución normal, es: Variancia poblacional n 1 s 2 n 1 s 2 2 2 2 n1;
n 1;1 2
2
Desviación estándar poblacional
n 1 s 2 n21;
2
n 1 s 2 n21;1 2
donde n es el tamaño de muestra, s 2 la variancia poblacional, s la desviación estándar poblacional, 1 es el coeficiente de confianza, n21; 2 y n21;1 2 son los valores de la distribución Chi-cuadrado con n 1 grados de libertad que dejan una probabilidad hacia la derecha de 2 y 1 2 respectivamente. Suponga que en el Ejemplo 7.2 se desea obtener un intervalo para la desviación estándar del contenido de los frascos de champú al 98% de confianza. Entonces: Ejemplo 2.6:
14
n 1 s 2 2 8;0.01
9 1 6.12602 20.0902
n 1 s 2
2 8;0.99
9 1 6.12602
1.6465
3.8657 13.5033
El intervalo anterior brinda un 98% de confianza de contener para la desviación estándar del contenido de los frascos de champú. El intervalo de confianza para una desviación estándar poblacional también se puede obtener directamente con Minitab. Prueba e IC para una desviación estándar: Contenido Método El método estándar se utiliza sólo para la distribución normal. El método ajustado se utiliza para cualquier distribución continua. Estadísticas Variable Contenido
N 9
Desv.Est. 6.13
Varianza 37.5
Intervalos de confianza de 98%
Variable Contenido
Método Estándar Ajustado
IC para Desv.Est. (3.87, 13.50) (4.26, 10.52)
IC para varianza (14.9, 182.3) (18.2, 110.7)
2.7 Intervalo de confianza para el cociente de varianzas poblacionales / 2 1
2 2
Si S21 y S 22 son las varianzas de muestras independientes de tamaño n 1 y n 2 de poblaciones normales respectivamente, entonces un intervalo de confianza para 12 / 22 con un nivel de confianza del ( 1 ) 100%: S 12 2 2
.
1
S F ( n1 11 ,n2 1, / 2)
12 2 2
S 12 2 2
S
. F ( n2 1,n1 1, / 2 )
Ejemplo:
Una compañía tiene una política singular relativa a los bonos de fin de año destinados al personal gerencial de bajo rango (los bonos son expresados como un porcentaje del salario anual). El director de personal considera que el sexo del empleado influye en los bonos recibidos, para esto toma muestras de 16 mujeres y 25 hombres que desempeñan cargos gerenciales y registra los porcentajes del salario anual percibido obteniéndose los datos siguientes:
15
Mujeres
9,8 8,0 8,4 7,7
11,9 6,7 7,7 6,2
9,0 9,3 9,0 8,4
Hombres
6,9 8,7 7,6 9,2
10,4 9,7 8,7 9,3 8,9
9,6 10,4 11,2 8,8 10,2
12,0 7,9 9,7 9,0 8,7
8,9 12,0 9,4 10,0 9,2
9,8 10,1 9,4 9,2 9,0
Calcule un intervalo de confianza del 95% para la razón de varianzas de los porcentajes de salario anual de las mujeres y los hombres. Solución:
Calculamos los estadísticos: Mujeres Hombres
8,4063 9,660 F(15, 24, 0.025) = 2.4374 s 1,3718 0,9883 F (24, 15, 0.025) = 2.7007 n 16 25 Reemplazando los valores en la fórmula: 2 (1.3718) 2 1 1 (1.3718) 2 (2.7007) (0.9883) 2 2,4374 22 (0.9883) 2 x
0.7905
12 22
5.2033
Interpretación: Con 95% de confianza, de 0,7905 a 5,2033 se encontrará el cociente de las varianzas de los porcentajes de salario anual de las mujeres y los hombres.
2.8 Intervalo de confianza para diferencia de medias poblacionales (µ1-µ2) con muestras independientes Sean x1 y x 2 las medias de muestras aleatorias independientes de tamaños n 1 y n2 tomadas de poblaciones con varianzas poblacionales conocidas. Cuando las muestras son grandes ó las poblaciones son normales, un intervalo de confianza para la diferencia de medias poblacionales ( 1 - 2) puede ser calculado según cada uno de los siguientes casos:
Caso 1: Cuando las muestras provienen de poblaciones Normales y las varianzas poblacionales 12 y 22 son conocidas Si x 1 y x 2 son las medias de muestras aleatorias independientes de tamaño n 1 y n2 de poblaciones con varianzas conocidas 12 y 22 , respectivamente, un intervalo de confianza de ( 1 ). 100% para 1 2 está dado por:
16
x1 x 2 z 1 / 2
12 n1
22
12
1 2 x1 x 2 z 1 / 2
n2
n1
22 n2
Si el muestreo es sin reemplazo y las poblaciones finitas de tamaños N 1 y N 2, el intervalo de confianza será: IC ( 1 2 ) x1 x 2 z 1 / 2
12 N 1 n1
22 N 2
n2 n1 N 1 1 n2 N 2 1
Ejemplo:
Para comparar dos métodos de ventas, se aplicaron a 200 vendedores elegidos al azar el método tradicional y a otra muestra de 250 vendedores el método nuevo resultando las calificaciones promedio respectiva de 13 y 15 (cientos de soles). Suponga que las varianzas poblacionales respectivas son 9 y 16 (cientos de soles2). Halle un intervalo de confianza del 95% para la diferencia de las medias. Solución:
La estimación puntual de 1 2 es x1 x 2 13 15 2 . Con 0,05 se encuentra el valor z, que deja un área de 0,025 a la derecha y por lo tanto un área de 0,975 a la izquierda, es z 1,96 . De aquí que el intervalo de confianza del 96% es: 0 , 97 5
2 1,96
9 200
16 250
2 1,96 1
2
9 200
16 250
efectuando las operaciones indicadas se tiene: 2,6471 1 2 1,3529 Interpretación: “Con 95% de confianza entre -2,6 y -1,4 se encontrará la diferencia de niveles medios de ventas obtenidos con los métodos evaluados”.
Caso 2: Cuando las muestras provienen de poblaciones Normales, las varianzas poblacionales 12 y 22 son desconocidas Caso 2.1 Pero Iguales ( 12 = 22 ) Si x 1 y x 2 son las medias de muestras aleatorias independientes de tamaño n1 y n2 respectivamente, de poblaciones aproximadamente normales con varianzas iguales pero desconocidas, un intervalo de confianza de (1 – ).100% para 1 2 está dado por:
x1 x 2 t n n 2, / 2 1
2
1
S p2
n1
1
1 1 1 2 x1 x 2 t n n 2, / 2 S p2 n2 n1 n2 1
1
IC ( 1 2 ) x1 x 2 t n1 n2 2, / 2 S p2
n1
donde :
2 p
S
2
1
n2
(n 1 1)S12
(n 2 1)S 22 n1 n 2 2
donde t n n 2, / 2 con (n1 + n 2 – 2) grados de libertad, deja un área de /2 a la derecha. 1
2
17
Si el muestreo es sin reemplazo y las poblaciones finitas de tamaños N 1 y N 2, el intervalo de confianza será: 1 N n1 1 N 2 n2 IC ( 1 2 ) x1 x 2 t n n 2, / 2 S p2 1 n N 1 n N 1 1 1 2 2 1
2
Ejemplo:
Los siguientes datos, registrados en minutos, representan el tiempo de atención por ventanilla de dos terminalistas: Terminalista 1
Terminalista 2
14 x 1 17 s12 1,5
16 x 2 19 s 22 1,8
n1
n2
Encuentre un intervalo de confianza de 99% para la diferencia 1 2 del tiempo promedio de atención para los dos terminalistas, suponga poblaciones normales con varianzas iguales. Solución:
La estimación puntual de 1 2 es x1 x 2 17 19 2 . La estimación de la varianza común, S2 p, es S p2
(14 1)(1,5) (16 1)(1,8) 14 16 2
1,6607
Al tomar la raíz cuadrada obtenemos S p = 1,2887. Con el uso de 0,01 , encontramos que t(28,0.005) =2,763 para v = 14 + 16 - 2 = 28 grados de libertad, y por lo tanto el intervalo de confianza del 99% es:
2 2,763(1,2887)
1 1 14 16
2 1 2 2,763(1,2887)
1 1 14 16
efectuando las operaciones indicadas se tiene: 3,3031 2 1 0,6969 Interpretación: “Con 99% de confianza entre -3.3 y -0,7 minutos se encontrará la diferencia de tiempos promedios de atención para los dos terminalistas”.
Caso 2.2 Pero Diferentes ( 12 ≠ 22 ) Si x 1 y S12 , y x 2 y S 22 son las medias y varianzas de muestras pequeñas e independientes de distribuciones aproximadamente normales con varianzas desconocidas y diferentes, un intervalo de confianza de (1 – ).100% para 1 2 está dado por:
x
1
x 2 t v , / 2
S12 n1
S 22 n2
1 2 x1 x 2 t v , 2
S12 n1
S 22
n2
18
̅ ̅ S 12 S 22 n1 n2
Donde t ( v , / 2 ) es el valor t con v
S 12 2 n1
2
S 22 2 n2
grados de libertad, que
n1 1 n2 1 deja un área de / 2 a la derecha. v es un valor entero por redondeo simple. Si el muestreo es sin reemplazo y las poblaciones finitas de tamaños N 1 y N 2, el intervalo de confianza será: S 12 N 1 n1 S 22 N 2 n2 IC ( 1 2 ) x1 x 2 t v , / 2 n1 N 1 1 n2 N 2 1 Ejemplo:
El gerente de una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizaron hasta que se gastan. Los resultados son: Marca A Marca B
36 300 kilómetros s 12 5 000 kilométros
38 100 kilómetros s 22 6 100 kilométros
x1
x2
Calcule un intervalo de confianza de confianza de 90% para la diferencia de rendimiento promedio de ambas marcas de neumáticos. Suponga que la diferencia de kilómetros de rendimiento se distribuyen de forma aproximadamente normal con varianzas distintas. Solución:
Representamos con 1 y 2 las medias poblacionales, respectivamente, para los tiempos promedios de duración de los neumáticos que producen las compañía A y B. La estimación puntual de 1 2 es x 1 x 2 36 300 38 100 1 800 . Como las varianzas son desconocidas y diferentes, debemos encontrar un intervalo de confianza de 90% aproximado basado en la distribución t con v grados de libertad, donde 2
5000 6100 12 12 v 21.79 22 5000 2 6100 2 12
12
12 1 12 1 Con el uso de 0.10 , encontramos que t(22,0.05) = 1.717 para v = 22 grados de libertad, y por lo tanto el intervalo de confianza del 90% es:
19
1800 1.717
5000
6100
12
1 2 1800 1.717
5000
12
6100
12
12
efectuando las operaciones indicadas se tiene: 1852.2 1 2 1747.8 Interpretación: “Con 90% de confianza entre -1852 y -1748 días se encontrará la diferencia de rendimiento promedio de ambas marcas de neumáticos.”
2.9 Intervalo de confianza para la diferencia de proporciones poblacionales (p1-p2) Si p1 y p2 son las proporciones de éxitos en muestras aleatorias de tamaño n 1 y n2, respectivamente, un intervalo de confianza aproximado de ( 1 ) . 100% para la diferencia de proporciones poblacionales p 1 – p2, está dado por: ˆ
ˆ
p1 p 2 z1 ˆ
ˆ
p1 .(1 p1 ) p 2 .(1 p 2 ) ˆ
/2
ˆ
n1
ˆ
ˆ
p1 p 2 p1 p 2 z1 ˆ
n2
IC ( p1 p 2 ) p1 p 2 z1 ˆ
ˆ
ˆ
p1 .(1 p1 ) p 2 .(1 p 2 ) ˆ
/2
ˆ
n1
ˆ
ˆ
n2
p1 .(1 p1 ) p 2 .(1 p 2 ) ˆ
/2
ˆ
n1
ˆ
ˆ
n2
Si el muestreo es sin reemplazo y las poblaciones finitas de tamaños N 1 y N 2, el intervalo de confianza será: IC ( p1 p 2 ) p1 p 2 z1 ˆ
ˆ
p1 .(1 p1 ) N 1 n1 p 2 .(1 p 2 ) N 2 n 2 ˆ
/2
ˆ
n1
1 N 1
ˆ
ˆ
n2
1 N 2
Dado que la distribucion muestral de la diferencia de proporciones no es Normal para aproximarla a dicha distribucion se requiere tamaños de muestras grandes (n1>50 y n2>50) Ejemplo:
Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno de día es diferente al de los trabajadores en el turno nocturno. Se realiza una comparación de 100 trabajadores de cada turno. Los resultados muestran que 27 trabajadores diurnos han faltado por lo menos cinco veces durante el año anterior, mientras que 49 trabajadores nocturnos han faltado por lo menos cinco veces. Halle un intervalo del 98% de confianza, para la diferencia de proporciones de trabajadores de los turnos que faltaron cinco veces o más al año.
20
Solución:
p1: proporción de trabajadores diurnos que han faltado por lo menos cinco veces durante el año anterior p2: proporción de trabajadores nocturnos que han faltado por lo menos cinco veces durante el año anterior p1 0,27 ˆ
IC ( p1
p 2 ˆ
0,49
p2 ) 0.27 0.49 2.33
Z0.99 = 2,33 0.27(0.73) 100
0.49(0.51) 100
0.3758 p1 p2 0.0642 Interpretación: Con 95% de confianza, de -0.3758 a -0.0642 se encontrará la diferencia de proporción de trabajadores que faltaron por lo menos cinco veces durante el año anterior de ambos turnos de trabajo. En el turno nocturno faltaron más.
Ejercicios
1. Un ingeniero realiza el control de calidad del proceso de envasado de un producto, Por resultados obtenidos de estudios anteriores, se puede considerar que el contenido del volumen de llenado en el envase tiene aproximadamente una distribución normal Los contenidos de una muestra aleatoria de 10 envases del producto de 500 ml, se muestran en la hoja Proceso, a. Uno de los criterios para decidir si el proceso de envasado está bajo control indica el contenido promedio debe ser precisamente 500 ml, Con un nivel de confianza del 90%, ¿se podría decir que el proceso de envasado está bajo control? b. Un segundo criterio para indicar que el proceso se encuentra bajo control es verificar que la desviación estándar no sea mayor de 10 ml, Calcule el intervalo de confianza del 95% para la desviación estándar del contenido de los envases, Si el ingeniero a afirmado que la variabilidad del proceso está bajo control, ¿qué se podría concluir al contrastar la afirmación del ingeniero con el intervalo de confianza? 2. Una muestra de los sueldos de 61 profesionales en ejercicio que viven en Enigma City dio como promedio y desviación estándar 3465 y 124 nuevos soles respectivamente, Enigma City es un poblado pequeño y cuenta actualmente con 8740 profesionales en ejercicio, Con un nivel de confianza del 90%: a. Calcule e intérprete un intervalo de confianza para el sueldo promedio de los profesionales en ejercicio de Enigma City, b. Calcule e intérprete un intervalo de confianza para la desviación estándar de los sueldos de los profesionales en ejercicio de Enigma City,
21
3. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas para evaluar la función eléctrica de su producto, Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse, Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas, Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que fallan en una o más pruebas, 4. Una empresa investigadora de mercados desea determinar la preferencia del electorado hacia cierto candidato a la alcaldía durante el mes de septiembre, Para esto selecciona una muestra de 500 electores del distrito de los cuales 300 dijeron votar por el mencionado candidato, a. Según la empresa, la proporción de electores en el mes de septiembre a favor del candidato se encuentra en el intervalo [0,5571 , 0,6429], ¿Cuál es el nivel de confianza usado? b. ¿Cuál es el tamaño de muestra a utilizar si se desea estimar esta misma proporción durante el mes de octubre usando un nivel de confianza del 98% y un error de estimación no mayor del 5%? 5. Un ingeniero de control de calidad quiere estimar la proporción de elementos defectuosos en un lote de lámparas, ¿Cuál es el tamaño de la muestra si se quiere estimar la proporción real, con un margen de error del 1%, utilizando un nivel de confianza de 95%? 6. El departamento de control de calidad de una empresa informó a la gerencia que en un primer estudio realizado al proceso de fabricación de un componente para teléfonos celulares de 900 componentes inspeccionados, se había estimado que el porcentaje de productos no adecuados a la norma de calidad era de 11% 3,1%, Sin embargo, en el informe presentado no se precisó el nivel de confianza respectivo, a. Calcule el nivel de confianza utilizado en el primer estudio realizado por el departamento de control de calidad, b. Si se considera que el nivel de confianza utilizado en este primer estudio es adecuado pero que para realizar un segundo estudio el error no debe superar el 2,1%, ¿Cuántos productos deben ser inspeccionados?,
22
Capítulo 3 Prueba de hipótesis. 3.1 Introducción La prueba de hipótesis involucra una suposición elaborada sobre algún parámetro de la población. A partir de la información proporcionada por la muestra, se verificará la suposición sobre el parámetro estudiado. La hipótesis que se contrasta se llama hipótesis nula (Ho). Partiendo de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula a favor de la hipótesis alterna, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial del parámetro poblacional podría ser correcto. El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.
3.2 Conceptos generales La hipótesis que se contrasta es rechazada o no en función de la información muestral. La hipótesis alternativa se especifica como opción posible si se rechaza la nula.
Tipos de errores Información muestral Aceptar H0
Rechazar H0
H0 es cierta No hay error Error I La realidad H0 es falsa Error II No hay error Error Tipo I
Ocurre cuando se rechaza una hipótesis H 0 que es verdadera. La probabilidad de error tipo I viene a ser la probabilidad de rechazar H 0 cuando ésta es cierta. P(Error I)
El valor (nivel de significación) es fijado por la persona que realiza la investigación (por lo general varía entre 1% -10%)
23
Error Tipo II
Ocurre cuando se acepta una hipótesis H 0 que es falsa, la probabilidad de error tipo II es la probabilidad de aceptar H 0 cuando ésta es falsa. P(Error II)
Debido a que el valor real del parámetro es desconocido este error no puede ser fijado.
Potencia de prueba o Poder de Prueba Es la probabilidad de rechazar una hipótesis planteada cuando esta es falsa. Potencia de prueba 1
Pasos a seguir en una Prueba de Hipótesis
Paso 1: Planteo de hipótesis. Paso 2: Nivel de significación. Paso 3: Prueba estadística. Paso 4: Suposiciones. Paso 5: Regiones críticas. Criterios de decisión. Paso 6: Realización de la prueba. Paso 7: Resultados y conclusiones.
Procedimiento general en una Prueba de Hipótesis Sea el parámetro que representa: (, 2 , p, 1 2 , p1 p2 , 2 / 22 ) 1
1. Planteo de las hipótesis. H 0 : 0 H 0 : 0 H 1 : 0 H 1 : 0
H 0 : 0 H 1 : 0
2. Fijar el nivel de significación 3. Pruebas estadísticas E
Distribución simétrica (Z, t) Distribución asimétricapositiva(2 ,F)
4. Supuestos
24
b) Supuestos para: p, p1 p 2
a) Supuestos para: (, 2 , 1 2 , 2 / 22 ) 1
Población(es) normalmente distribuida(s). Muestra(s) tomada(s) al azar.
Muestra(s) tomada(s) al azar. Muestra(s) grande(s)
5. Regiones críticas
Unilateral
Unilateral
Bilateral 6. Estadístico de prueba. 7. Resultados y conclusiones.
3.3 Prueba de hipótesis para una media poblacional ( ) Caso 1: Cuando muestra proviene de una población Normal y la varianza poblacional ( 2) es conocida
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
Caso 3 Unilateral derecha
H 0 : 0
H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
Estadístico de prueba: Z
X 0 / n
Normal(0,1)
donde: X : Es la media muestral. 0 : Es el valor supuesto de la media poblacional en la hipótesis nula. : Es la desviación estándar de la población. n: Es el tamaño de la muestra. N(0,1): Es la distribución normal estándar. Si la población es finita (de tamaño N ) y la fracción de muestreo n/ N es mayor que 0.05, entonces se debe agregar el factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene:
25
Z c
X 0 N n n N 1
Regiones de rechazo de H 0: Caso 1 Unilateral izquierda
Normal(0,1)
Caso 2 Bilateral
Caso 3 Unilateral derecha
z ( ) z c z (1 ) z c z (1 / 2) donde es el nivel de significación de la prueba, y z (), z (1-/2) y z (1-) son los cuantiles de la distribución normal estándar. z c
Caso 2: Cuando la muestra proviene de una población Normal, la varianza poblacional ( 2) es desconocida
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
Caso 3 Unilateral derecha
H 0 : 0
H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
Estadístico de prueba: T
X 0 S / n
t (n-1)
donde: X : Es la media muestral. 0 : Es el valor supuesto de la media poblacional en la hipótesis nula. S : Es la desviación estándar de la muestra. n: Es el tamaño de la muestra. t (n-1): Es la distribución t de Student con n – 1 grados de libertad.
Si la población es finita (de tamaño N ) y la fracción de muestreo n/ N es mayor que 0.05, entonces se debe agregar el factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene: X 0 T c t (n-1) S N n n N 1 Regiones de rechazo de H 0: Caso 1 Caso 2 Caso 3 Unilateral izquierda Bilateral Unilateral derecha t c
t ( n1, )
t c
t ( n1, / 2)
t c
t ( n1, )
donde es el nivel de significación de la prueba, y y son los cuantiles de la distribución t de Student con n – 1 grados de libertad.
26
Ejemplo
Una empresa eléctrica fabrica focos cuya duración se distribuye de forma aproximadamente normal con media de 800 horas y desviación estándar de 40 horas. Pruebe la hipótesis de que 800 horas contra la alternativa 800 horas si una muestra aleatoria de 28 focos tiene una duración promedio de 784 horas. Utilice un nivel de significancia de 0.05. Solución.
Sea X: Duración de los focos (horas) X~ Normal(800 , 402) 1. Planteo de hipótesis. H 0 : 800 H 1 : 800 2. Nivel de significación.
0.05
3. Prueba estadística _
Z
x
/ n
~ N (0.1)
4. Supuestos. Población normal. Muestra tomada al azar. 5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas
Criterios
0.025
0.025 0.95
-1.96
Si -1.96 Zc 1.96 No se rechaza H0 Si Zc < -1.96 o Zc > 1.96 Se rechaza H0
1.96
6. Cálculos Zc
784 800 40 / 28
2.12
7. Conclusiones. Con 5% de nivel de significación y a partir de la información muestral, el tiempo promedio de duración de los focos es diferente de 800 horas.
27
3.4 Prueba de hipótesis para la varianza poblacional ( 2)
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
02 H1 : 2 02
02 H1 : 2 02
H 0 : 2
H 0 : 2
02 H1 : 2 02
H 0 : 2
Estadístico de prueba: 2
Caso 3 Unilateral derecha
(n 1) S 2 2 0
2
( n1)
donde: n : Es el tamaño de la muestra. 2 S : Es la variancia de la muestra. 2 0 : Es el valor supuesto de la variancia poblacional en la hipótesis nula. (2n 1) : Es la distribución Chi-cuadrado con n – 1 grados de libertad. Regiones de rechazo de H 0: Caso 1 Caso 2 Caso 3 Unilateral izquierda Bilateral Unilateral derecha 2 2 2 2 0 ( n 1,1 ) 0 ( n 1,1 / 2) ó 02 (2n 1, ) 02
(2n1, / 2)
donde es el nivel de significación de la prueba, y (2n1,1 ) , (2n1,1 / 2) , (2n1, / 2) y (2n 1, ) son los cuantiles de la distribución Chi-cuadrado con n –
1 grados de libertad. Ejemplo
Se reporta que la desviación estándar de la resistencia al rompimiento de ciertos cables producidos por una compañía es 240 lb. Después de que se introdujo un cambio en el proceso de producción de estos cables, la resistencia al rompimiento de una muestra de 8 cables mostró una desviación estándar de 300 lb. Investigue la significancia del aumento aparente en la variación usando un nivel de significancia de 0.05. Asuma normalidad. Solución.
Sea X: Resistencia al rompimiento de cierto tipo de cable X~ Normal( , 2402) 1. Planteo de hipótesis. H 0 : 2 240 2 H 1 : 2 240 2 28
2. Nivel de significación.
0.05
3. Prueba estadística (n 1) s 2 2 ~ (2n 1) 2
4. Supuestos. Población normal. Muestra tomada al azar. 5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas
Criterios Si c2 14.07 No se rechaza H0 Si c2 14.07 Se rechaza H 0
0.0 0.95
6. Cálculos (8 1)3002 2 c 10.938 2 240
7. Conclusiones. Con 5% de nivel de significación y la información muestral es insuficiente para afirmar que la variación de la resistencia al rompimiento ha aumentado.
3.5 Prueba de hipótesis poblacional (p)
Hipótesis: Caso 1 Unilateral izquierda
para
la
proporción
Caso 2 Bilateral
Caso 3 Unilateral derecha
H 0 : p p0
H 0 : p p0
H 0 : p p0
H1 : p p0
H1 : p p0
H1 : p p0
Estadístico de prueba: Z
P p 0 ˆ
p 0 (1 p 0 )
N(0,1)
n 29
donde: P : Es la proporción muestral. p0 : Es el valor supuesto de la proporción poblacional en la hipótesis nula. n: Es el tamaño de la muestra. N(0,1): Es la distribución normal estándar. ˆ
Si la población es finita (de tamaño N ) y la fracción de muestreo n/ N es mayor que 0.05, entonces se debe agregar el factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene: P p0 Normal(0,1) Z c p0 (1 p0 ) N n n N 1 ˆ
Regiones de rechazo de H 0: Caso 1 Unilateral izquierda z c
z ( )
Caso 2 Bilateral z c
z (1 / 2)
Caso 3 Unilateral derecha z c
z (1 )
donde es el nivel de significación de la prueba, y z (), z (1-/2) y z (1-) son los cuantiles de la distribución normal estándar. Ejemplo
RRS, el minorista de electrodomésticos, anunció que vende el 21% de todos los computadores caseros. ¿Esta afirmación se confirma si 120 de los 700 propietarios de computadores caseros se los compraron a RRS? Tome 0.05 . Solución.
Sea p: Proporción de propietarios de computadores caseros que compraron en RRS. 1 Planteo de hipótesis. H 0 : p 0.21 H 1 : p 0.21 2 Nivel de significación.
0.05
3 Prueba estadística Z
p p ˆ
p (1 p )
~ Normal (0.1)
n
4 Supuestos.
Muestra tomada al azar. Muestra grande.
30
5 Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas 0.025
0.025
Si -1.96 Zc 1.96 No se rechaza H 0 Si Zc < -1.96 o Zc > 1.96 Se rechaza H 0
0.95
-1.96
Criterios
1.96
6 Cálculos 120
Zc
0.21 700 0.21(1 0.21)
2.505
700
7 Conclusiones. Con 5% de nivel de significación y a partir de la información muestral, RRS no vende el 21% de todos los computadores caseros.
3.6 Pruebas de poblacionales
hipótesis y 2 1
para
dos
varianzas
2 2
Para esta prueba de hipótesis solo se desarrollará el caso bilateral debido a que esta prueba indicará si dos muestras independientes provienen de poblaciones con varianzas homogéneas o heterogéneas
Hipótesis: Caso Único Bilateral
22 H1 : 12 22
H 0 : 12
Estadístico de prueba: F c
S 12 S 22
F n1 1,n2 1
donde: n1 : Es el tamaño de la muestra proveniente de la población 1. n2 : Es el tamaño de la muestra proveniente de la población 2. S 12 : Es la varianza de la muestra de la población 1. S 22 : Es la varianza de la muestra de la población 2. F n 1,n 1 : Es la distribución F con n1 – 1 y n2 – 1 grados de libertad. 1
2
31
Regiones de rechazo de H 0:
Caso Único Bilateral
F n 1,n 1,1 / 2 ó F c F n 1,n 1, / 2 donde es el nivel de significación de la prueba, y F n 1,n 1,1 / 2 y F n 1,n 1, / 2 son los cuantiles de la distribución F con n1 – 1 y n2 – 1 grados de libertad. F c
1
2
1
2
1
1
2
2
Ejemplo
Diecisiete latas de CROC Aid presentan una media de 17.2 onzas, con una desviación estándar de 3.2 onzas, y 13 latas de Energy Pro producen una media de 18.1 onzas y s = 2.7 onzas. Asumiendo varianzas iguales y distribuciones normales en los pesos de la población, ¿Se puede afirmar con 5% de significación que las varianzas de los pesos son iguales? Solución.
Sean X1: Contenido de una lata de gaseosa CROC Aid (onzas) X 1 ~ Normal( 1 , 12 ) X2: Contenido de una lata de gaseosa Energy Pro (onzas) X 2 ~ Normal( 2 , 22 ) 1. Planteo de hipótesis. H 0 : 12 22 H 1 : 12 22 2. Nivel de significación.
0.05
3. Prueba estadística F c
S 12
S 22
1 12
~
F ( n1 1,n2 1)
22
Bajo H0, que las varianzas son iguales, se tiene, F c
S 12 S 22
~
F ( n1 1,n2 1)
4. Supuestos. Poblaciones normales. Muestras tomadas al azar.
5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo.
32
Áreas
Criterios
0.025
0.025 Si 0.346 Fc 3.152 No se rechaza H 0 Si Fc < 0.346 o Fc > 3.152 Se rechaza H 0
0.346
3.152
6. Cálculos F c
S 12 S 22
(3.2) 2 (2.7) 2
1.405
7. Conclusiones. Con 5% de nivel de significación la información muestral es insuficiente para rechazar que las varianzas de los pesos son iguales.
3.7 Pruebas de hipótesis poblacionales ( 1 y 2)
para
dos
medias
Caso 1: Cuando las muestras provienen de poblaciones Normales y las varianzas poblacionales 12 y 22 son conocidas
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
2 k H1 : 1 2 k
2 k H1 : 1 2 k
H 0 : 1
H 0 : 1
Caso 3 Unilateral derecha H 0 : 1 2
k H1 : 1 2 k
Estadístico de prueba: Z c
X 1
X 2 k 2 1
n1
2 2
Normal(0,1)
n2
donde: X 1 : Es la media muestral para la muestra 1. X 2 : Es la media muestral para la muestra 2. 12 : Es la varianza de la población 1. 22 : Es la varianza de la población 2. n1 : Es el tamaño de la muestra 1. n2 : Es el tamaño de la muestra 2. k : Es el valor valor supuesto para la diferencia diferencia entre las las medias poblacionales en en la hipótesis nula. Normal(0,1): Es la distribución distribución normal estándar. estándar. Si las poblaciones son finitas (de tamaños N 1 y N 2) y las fracciones de N 1 y n2/ N N 2 son mayores que 0.05, entonces se debe agregar el muestreo n1/ N 33
factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene: obtiene: Z c
X 1 X 2 k 12 N1 n1 n1 N1 1
22 N 2 n2 n2 N 2 1
Regiones de rechazo de H 0: Caso 1 Unilateral izquierda z c
Normal(0,1)
Caso 2 Bilateral
z ( )
z (1 / 2)
z c
Caso 3 Unilateral derecha z c
z (1 )
donde es el nivel de significación de la prueba, y z (), z (1(1-/2) y z (1(1-) son los cuantiles de la distribución normal estándar.
Caso 2: Muestras independientes, varianzas poblacionales desconocidas y homogéneas
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
2 k H1 : 1 2 k
2 k H1 : 1 2 k
H 0 : 1
H 0 : 1
Caso 3 Unilateral derecha H 0 : 1 2
k H1 : 1 2 k
Estadístico de prueba: T c
X 1
X 2 k 2 p
S
n1
2 p
S
t n1 n2 2
n2
con 2 p
S
n1 1S 12 n2 1S 22 n1 n2 2
donde: X 1 : Es la media de la muestra 1. X 2 : Es la media de la muestra 2. S 12 : Es la varianza de la muestra 1. S 22 : Es la varianza de la muestra 2. S p2 : Es la varianza muestral ponderada. ponderada. n1 : Es el tamaño de la muestra 1. 1. n2 : Es el tamaño de la muestra 2. 2. k : Es el valor supuesto para la diferencia diferencia entre entre las medias poblacionales poblacionales en la hipótesis nula. t n n 2 : Es la distribución t de de Student con n1 + n2 – 1 1 grados de libertad. 1
2
34
Si las poblaciones son finitas (de tamaños N 1 y N 2) y las fracciones de N 1 y n2/ N N 2 son mayores que 0.05, entonces se debe agregar el muestreo n1/ N factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene: T c
X 1 X 2 k
S p2 N1 n1 n1 N1 1
Regiones de rechazo de H 0: Caso 1 Unilateral izquierda
t c
t ( n n 2, ) 1
t n1 n2 2
n2 N1 1
Caso 2 Bilateral t c
2
S p2 N1 n1
Caso 3 Unilateral derecha
t ( n n 2, / 2) 1
t c
2
t ( n n 2, ) 1
2
donde es el nivel de significación de la prueba, y t ( n n 2, ) y t ( n n 2, / 2) son los cuantiles de la distribución t de Student con n1 + n2 – 1 grados de libertad. 1
2
1
2
Ejemplo
Diecisiete latas de CROC Aid presentan una media de 17.2 onzas, con una desviación estándar de 3.2 onzas, y 13 latas de Energy Pro producen una media de 18.1 onzas y s = 2.7 onzas. Asumiendo varianzas iguales y distribuciones dist ribuciones normales en los pesos de la la población, población, ¿Se puede puede afirmar afirmar con 5% de significació significaciónn que los pesos pesos promedio promedio son iguales? Solución.
Sean X1: Contenido de una una lata de gaseosa gaseosa CROC Aid (onzas) X 1 ~ Normal( 1 , 2 ) X2: Contenido de una una lata de gaseosa gaseosa Energy Pro (onzas) X 2 ~ Normal( 2 , 2 ) 1. Planteo de hipótesis. H 0 : 1 2 H 1 : 1 2 2. Nivel de significación. significación.
0.05
3. Prueba estadística _
_
2 ) ~ t ( n n 2 ) 1 1 S p2 n n 2 1 4. Supuestos. Poblaciones normales. Muestras tomadas al azar. t c
( x1 x 2 ) ( 1
1
2
2 2 donde: S p2 (n1 1)s1 (n 2 1)s 2 n1 n 2 2
35
5. Regiones críticas. Criterios de decisión. La hipótesis alternante define la(s) zona(s) de rechazo. Áreas
Criterios
0.025
Si -2.048 tc 2.048 No se rechaza H0 Si tc < -2.048 o tc > 2.048 Se rechaza H0
0.025 0.95
-2.048
t(28, 0.025) = 2.048
6. Cálculos tc
(17.2 18.1) (0)
1 1 17 13
0.815
8.976
7. Conclusiones. Con 5% de nivel de significación la información muestral es insuficiente para rechazar que los pesos promedios de los dos tipos ti pos de gaseosas son iguales.
Caso 2: Muestras independientes, varianzas poblacionales desconocidas y heterogéneas
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
2 k H1 : 1 2 k
2 k H1 : 1 2 k
H 0 : 1
H 0 : 1
Caso 3 Unilateral derecha H 0 : 1 2
k H1 : 1 2 k
Estadístico de prueba: T
X 1
X 2 k 2 1
S
n1
2 2
S
t v
n2
con 2
S 12 S 22 n1 n2 v 2 2 S 12 S 22 n1 n2 n1 1 n2 1 donde: X 1 : Es la media de la muestra 1.
36
X 2 : Es la media de la muestra 2.
S 12 : Es la varianza de la muestra 1. S 22 : Es la varianza de la muestra 2. n1 : Es el tamaño de la muestra 1. 1. n2 : Es el tamaño de la muestra 2. 2. k : Es el valor supuesto para la diferencia diferencia entre las medias poblacionales poblacionales en
la hipótesis nula. de Student con v grados de libertad. t v : Es la distribución t de Si las poblaciones son finitas (de tamaños N 1 y N 2) y las fracciones de N 1 y n2/ N N 2 son mayores que 0.05, entonces se debe agregar el muestreo n1/ N factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene: obtiene: T c
X 1 X 2 k S N1 n1 n1 N1 1 2 1
Regiones de rechazo de H 0: Caso 1 Unilateral izquierda t c
t (v, )
S N1 n1 n2 N1 1 2 2
Caso 2 Bilateral t c t (v , / 2)
t v
Caso 3 Unilateral derecha t c
t ( v, )
donde es el nivel de significación de la prueba, y t ( v, ) y t ( v , / 2 ) son los cuantiles de la distribución t de de Student con v grados de libertad. Ejemplo 8.6.- Diecisiete latas de CROC Aid presentan una media de 17.2 onzas, con una
desviación estándar de 3.2 onzas, y 13 latas de Energy Pro producen una media de 18.1 onzas y s = 1.1 onzas. Asumiendo varianzas diferentes y distribuciones normales en los pesos pesos de la població población, n, ¿Se puede puede afirmar afirmar con con 5% de signific significación ación que los pesos promedio promedio son iguales? Solución. Sean X1: Contenido de una una lata de gaseosa gaseosa CROC Aid (onzas) X 1 ~ Normal( 1 , 2 ) X2: Contenido de una una lata de gaseosa gaseosa Energy Pro (onzas) X 2 ~ Normal( 2 , 2 ) 1. Planteo de hipótesis. H 0 : 1 2 H 1 : 1 2 2. Nivel de significación. significación.
0.05
37
3. Prueba estadística _
t c
_
( x1 x 2 ) ( 1
2 ) ~ t ( v ) 2 2 S 1 S 2 n1 n 2
donde v
S12 S 22 n 1 n 2 S12 2 n1
2
S 22 2 n2
n 1 1 n 2 1
4. Supuestos. Poblaciones normales. Muestras tomadas al azar. 5. Regiones críticas. Criterios de decisión. Antes de hallar las regiones se debe determinar el valor de v: 2 3.2 2 1.12 13 17 20.66 21 v 2 2 3.2 2 17
1.12 13
17 1 13 1 La hipótesis alternante define la(s) zona(s) de rechazo. Áreas
Criterios
0.025
0.025 0.95
-2.088
Si -2.080 tc 2.048 No se rechaza H 0 Si tc < -2.080 o tc > 2.048 Se rechaza H 0
t(21, 0.025) = 2.080
6. Cálculos t c
(17.2 18.1) (0)
3.2 2 1.12 17 13
1.079
7. Conclusiones. Con 5% de nivel de significación la información muestral es insuficiente para rechazar que los pesos promedios de los dos tipos de gaseosas son iguales.
3.8 Prueba de hipótesis para la diferencia de dos proporciones poblacionales (p 1-p2).
Hipótesis: Caso 1 Unilateral izquierda
Caso 2 Bilateral
Caso 3 Unilateral derecha
H 0 : p1 p2
H 0 : p1 p2
H 0 : p1 p2
H1 : p1 p2
H1 : p1 p2
H1 : p1 p2 38
̂ ̂ ̅̅
Estadístico de prueba:
con P
n1P1 n2 P2 ˆ
ˆ
n1 n2
donde: P 1 : Es la proporción de la muestra 1. ˆ
P 2 : Es la proporción de la muestra 2. ˆ
n1: Es el n2: Es el
tamaño de la muestra 1. tamaño de la muestra 2. N(0,1): Es la distribución normal estándar. Si las poblaciones son finitas (de tamaños N 1 y N 2) y las fracciones de muestreo n1/ N 1 y n2/ N 2 son mayores que 0.05, entonces se debe agregar el factor de corrección para poblaciones finitas en el cálculo del estadístico de prueba con lo cual se obtiene:
̂ ̂ ̅̅
Regiones de rechazo de H 0: Caso 1 Unilateral izquierda z c
z ( )
Caso 2 Bilateral z c
z (1 / 2)
Caso 3 Unilateral derecha z c
z (1 )
donde es el nivel de significación de la prueba, y z (), z (1-/2) y z (1-) son los cuantiles de la distribución normal estándar. Ejemplo:
En una prueba de calidad de dos comerciales de televisión se pasó cada uno en un área de prueba seis veces, durante un período de una semana. La semana siguiente se llevó a cabo una encuesta telefónica para identificar a quiénes habían visto esos comerciales. A las personas que los vieron se les pidió definieran el principal mensaje en ellos. Se obtuvieron los siguientes resultados: Comercial Personas que lo Personas que recordaron el vieron mensaje principal A 150 63 B 200 60
39
Use = 0.05 para probar la hipótesis de que no hay diferencia en las proporciones que recuerdan los dos comerciales. Solución:
Sea p1: Proporción de personas que recordaron el mensaje principal del comercial A. Sea p2: Proporción de personas que recordaron el mensaje principal del comercial B. Hipótesis:
H 0 : p1 p2 H1 : p1 p2
Nivel de significación:
0.05
Estadístico de prueba:
̅ ̅
Supuestos:
Muestras tomada al azar. Muestras grandes.
Valores críticos y regiones de rechazo y no rechazo: Criterios Si -1.96 Zc 1.96 no se rechaza H0 Si Zc < -1.96 o Zc > 1.96 se rechaza H0 0.025
0.025
0.95
-1.96
1.96
63
Cálculos:
Conclusión:
Z c
150
60
200 1 1 (0.351)(0.649) 150 200
2.328
Existe suficiente evidencia estadística, con un nivel de significación del 5% de que las proporciones de recordación son diferentes.
40
Ejercicios
1. Debido al tiempo excesivo que demanda trasladarse hacia el sitio de trabajo, la oficina en donde usted trabaja en el centro de la ciudad está considerando espaciar las horas de trabajo para sus empleados. El gerente considera que los empleados demoran en promedio 50 minutos para llegar al trabajo. Para una muestra aleatoria de setenta empleados, resulta que en promedio demoran 47,2 minutos con una desviación estándar de 18.9 minutos. Fije en 5% y pruebe la hipótesis. 2. Una escuela de negocios local afirma que sus estudiantes graduados obtienen trabajos mejor remunerados que el promedio nacional. Los salarios pagados a todos los graduados de las escuelas de negocios en su primer trabajo mostraron una media de 20 soles la hora. Una muestra aleatoria de 10 alumnos graduados del último año de la mencionada escuela mostró los siguientes salarios por hora en su primer trabajo: 16,50 ; 19,00 ; 22,00 ; 21,50 ; 21,00 ; 16,50 ; 17,00 ; 21,00 ; 21,50 ; 22,00 Como usted no cree en la afirmación de dicha escuela, evalúe el salario de los graduados de esta escuela de comercio con un nivel de significación del 5%. 3. Una muestra aleatoria de 64 bolsas de palomitas de maíz con queso pesan, en promedio, 5,23 onzas con una desviación estándar de 0,24 onzas. Pruebe la hipótesis de que 5.5 onzas contra la hipótesis alternativa, 5.5 onzas en el nivel de significancia de 0.05 4. Usando una muestra de nueve días durante los últimos 9 meses, un dentista ha tenido las siguientes cantidades de pacientes: 22, 25, 20, 18, 15, 22, 24, 19 y 26. Si la cantidad de pacientes atendidos por día tiene una distribución normal, a. ¿con estos datos se rechazaría la hipótesis de que el promedio de pacientes atendido por día durante los últimos seis meses no es superior a 22? Use un nivel de significación del 5%. Interprete el resultado. b. ¿con estos datos se rechazaría la hipótesis de que la varianza en la cantidad de pacientes atendidos por día en los últimos seis meses es igual a 10? Use un nivel de significación del 10%. Interprete el resultado. 5. En cierta universidad se estima que el 25% de los estudiantes van en bicicleta a la universidad. ¿Esta parece ser una estimación válida si, en una muestra aleatoria de 90 estudiantes universitarios, se encuentra que 28 van en bicicleta a la universidad? Utilice un nivel de significancia de 0,05. 6. Un investigador desea verificar si existe evidencia de una diferencia en la resistencia media entre dos tipos de material para embalaje. La descripción de las lecturas en pie-libra de la resistencia al impacto de los dos tipos de embalaje se muestra a continuación. Características
Embalaje A
Embalaje B
Media Varianza Observaciones
1,2367 0,0042 9
0,9778 0,0024 9
41
a. ¿Cuál es la hipótesis planteada?, ¿Es una hipótesis unilateral o bilateral? b. A partir de los datos obtenidos compruebe la hipótesis y concluya con 2% de nivel de significación. Asuma poblaciones normales. 7. Dos encuestas independientes sobre salarios, realizados en dos áreas metropolitanas muy distintas entre si, revelaron la siguiente información con respecto a los sueldos promedios de los operadores de equipo pesado. Área Media Desviación Estándar Tamaño de la muestra
A
B
$6,50 / h. $4,50 /h. 15
$7,00 / h. $ 2,00 / h. 24
Suponga que los datos provienen de poblaciones normales. ¿Se puede concluir que los sueldos promedios son diferentes con un 5% 8. Una agencia de seguros local desea comparar los gastos medios ocasionados por daños en accidentes similares en dos modelos de automóviles. Nueve ejemplares del primer modelo y siete del segundo modelo son sometidos a una colisión controlada obteniendo los siguientes gastos, en dólares, por daños sufridos: Colisión Modelo 1 Modelo 2
1
2
3
4
5
6
7
8
9
345 340
310 325
305 345
345 310
355 315
375 280
320 290
310
305
Si se supone que los gastos por daños en ambos modelos de automóviles siguen una distribución normal, a un nivel de significación del 5%: a. ¿Se puede afirmar que la variabilidad de los gastos por daños para cada modelo de auto son iguales? b. ¿Parece haber alguna diferencia en el gasto medio ocasionado por las colisiones de cada modelo de auto? 9. Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor para los televidentes hombres que para las mujeres, pero el personal de producción del programa piensa que es igual el porcentaje de televidentes hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres estaban viendo el programa especial de televisión. Al nivel de significación del 5%, ¿se podría decir que el patrocinador tiene la razón? 10. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por correo influyen en la tasa de respuesta. El artículo “The Impact of Cover Design and First Questions on Response Rates for a Mail Survey of Skydivers” (Leisure Sciences,
1991, pp. 67-76) probó esta teoría al experimentar con diferentes diseños de portadas. Una portada era sencilla; la otra utilizó la figura de un paracaidista. Los investigadores especularon que la tasa de devolución sería menor para la portada sencilla.
42
Portada
Número enviado
Número devuelto
Sencilla
207
104
Paracaidista
213
109
¿Apoya esta información la hipótesis de los investigadores? Pruebe las hipótesis pertinentes usando un nivel de significación del 5%. 11. El empleo de equipo de cómputo en las empresas está creciendo con una rapidez vertiginosa. Un estudio reciente, en la que participaron 15 empresas del sector industrial, reveló que 184 de 616 adultos trabajan utilizando con regularidad una computadora personal, una microcomputadora, un terminal de computadora o un procesador de texto en su trabajo. Se seleccionó otra muestra de 450 adultos, de 10 empresas del sector salud, en la muestra se obtuvo que 105 adultos utilizan con regularidad una computadora persona, una microcomputadora, un terminal de computadora o un procesador de texto en su trabajo ¿Existe diferencias significativas entre los porcentajes de adultos, de las empresas del sector industria y de salud, que utilizan algún equipo de cómputo en su trabajo? Use un nivel de significación del 5%.
43
Capítulo 4 Prueba Chi Cuadrado Una de las mayores utilidades de la distribución Ji-Cuadrado está en que permite comparar frecuencias observadas (frecuencias obtenidas en un experimento o muestreo) con frecuencias esperadas según un modelo supuesto (hipótesis nula). Esta característica de la distribución Ji-cuadrado permite efectuar las siguientes pruebas: 1. Prueba de independencia. 2. Prueba de homogeneidad de subpoblaciones. 3. Pruebas de bondad de ajuste a una distribución de probabilidades. La metodología en cada uno de los tres casos es muy similar. La diferencia principal está en la forma en que se calculan las frecuencias esperadas, ya que estas dependerán de la hipótesis nula en cuestión.
Prueba de Independencia. Esta prueba permite evaluar si dos variables son independientes entre sí. Suponga que la primera variable permite clasificar a cada observación en una de r categorías y que la segunda variable permite clasificar a cada observación en una de c categorías. A la tabla que muestra ambas variables y las frecuencias observadas en cada una de las r ×c categorías resultantes se le conoce como tabla de contingencia . r ×c Columna 1 Variable 1
Variable 2 Columna ... 2
Columna c
Fila 1 Fila 2 . . . Fila r
Esta prueba es especialmente útil cuando se trata de analizar la independencia entre dos variables en escala nominal. Cuando las variables están en escala ordinal, intervalo o razón, existen otros procedimientos más adecuados, como por ejemplo mediante el cálculo de coeficientes de correlación (en un capítulo posterior se verá el caso del coeficiente de correlación de Pearson, útil para analizar asociación lineal entre dos variables cuantitativas).
44
Ejemplo.
Para determinar si existe una relación entre la calificación de un empleado en el programa de capacitación y su rendimiento real en el trabajo, se tomó una muestra de 400 casos de los archivos y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla de contingencia 3×3. Calificación en el programa de capacitación Debajo del Sobre el Promedio promedio promedio Rendimiento real en el trabajo (calificación del empleador) Total
Deficiente Promedio Muy bueno
Total
23 28
60 79
29 60
112 167
9
49
63
121
60
188
152
400
Con el nivel de significación 0,01, ¿La calificación del rendimiento del trabajador está asociada con la calificación en el programa de capacitación? Solución
Las variables que se muestran en la tabla son: Variable 1: Calificación del rendimiento real en el trabajo, con 3 categorías: Deficiente, promedio y muy bueno. Variable 2: Calificación en el programa de entrenamiento, con 3 categorías: Debajo del promedio, promedio o sobre el promedio. La prueba de independencia compara las frecuencias observadas frente a las frecuencias esperadas bajo el supuesto de que ambas variables sean independientes. Para calcular las frecuencias esperadas se utiliza la siguiente fórmula: Frecuencia esperada
(Total de la columna) x (Total de la fila) Total de la tablal
La siguiente tabla muestra tanto las frecuencias observadas como las esperadas (entre paréntesis) Calificación en el programa de capacitación Debajo del Sobre el Promedio promedio promedio Rendimiento real en el trabajo (calificación del empleador) Total
Deficiente Promedio Muy bueno
Total
23 (16,80) 28 (25,05)
60 (52,64) 79 (78,49)
29 (42,56) 60 (63,46)
112 167
9 (18,15)
49 (56,87)
63 (45,98)
121
60
188
152
400
45
Pasos para realizar la prueba de independencia 1)
Formulación de las hipótesis H0: La calificación del rendimiento real de un empleado en el trabajo de la calificación en el programa de capacitación. independiente H1: La calificación del rendimiento real de un empleado en el trabajo no de la calificación en el programa de capacitación. independiente
2)
Fijación del nivel de significación: 0,01.
3)
Estadístico de prueba k
2 c
(oi
~ 2
ei
i 1
4)
ei ) 2
es es
con v (r 1)(c 1) gl
Áreas y criterio de decisión. Los grados de libertad para el estadístico Ji-cuadrado son (3-1)(3-1) = 4. 0,01 2 0,01
= 13 277
Criterio: Si c2 > 13,277 se rechaza H 0 Si c2 ≤ 13,277 no se rechaza H 0. 5)
Cálculos previos 2 c
6)
(23 16,80) 2
16,80
(28 25,05) 2 25,05
...
(63 45,98) 2 45,98
20,18
Conclusión: Con nivel de significación 0,01 se rechaza la hipótesis nula. Por lo tanto hay evidencia estadística suficiente para aceptar que la calificación del rendimiento real de un empleado en el trabajo depende de la calificación en el programa de entrenamiento. Nota. (Corrección de Yates)
Cuando la muestra es menor de 50, cuando algunas frecuencias esperadas son menores que 5, o cuando el grado de libertad del estadístico de prueba es igual a 1, es recomendable aplicar la corrección de Yates; con esta corrección, el estadístico de prueba es el siguiente: c2
k
o e 0 ,5
i 1
ei
2
i
i
2 con v (r 1)(c 1) gl
46
Salida de MINITAB:
Chi-Square Test: Debajo del promedio, Promedio, Sobre el promedio Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Debajo del promedio 23 16.80 2.288
Promedio 60 52.64 1.029
Sobre el promedio 29 42.56 4.320
2
28 25.05 0.347
79 78.49 0.003
60 63.46 0.189
167
3
9 18.15 4.613
49 56.87 1.089
63 45.98 6.300
121
Total
60
188
152
400
1
Total 112
Chi-Sq = 20.179, DF = 4, P-Value = 0.000
Prueba de Homogeneidad de Proporciones Esta prueba permite analizar si la distribución de probabilidades de una variable categórica es la misma en r poblaciones. Ejemplo.
Muestras de tres tipos de materiales, sujetos a cambios extremos de temperatura, produjeron los resultados que se muestran en la siguiente tabla: Desintegrados Permanecieron intactos Total
Material A Material B Material C 41 27 22 79 53 78 120 80 100
Total 90 210 300
Use un nivel de significación de 0,05 para probar si, en las condiciones establecidas, la probabilidad de desintegración es la misma para los tres tipos de materiales. Pasos para realizar la prueba de homogeneidad de proporciones 1)
Formulación de las hipótesis H0: p1 = p2 = p3, donde pi corresponde a la probabilidad de desintegración con el material i. H1: No todas las proporciones son iguales.
2)
Fijación del nivel de significación: 0,05.
47
3)
Estadístico de prueba k
2 c
(oi
ei
i 1
4)
ei ) 2
con v (r 1)(c 1) gl
~ 2
Áreas y criterios de decisión. Los grados de libertad para el estadístico Ji-cuadrado son (2-1)(3-1) = 2.
0,05 2 0,05
= 5 991
Criterios: Si c2 > 5,991 se rechaza H 0 Si c2 ≤ 5,991 no se rechaza H0 5)
Cálculos previos
Desintegrados Permanecieron intactos Total 2 c
6)
Material A 41 (36) 79 (84) 120
(41 36) 2 36
Material B 27 (24) 53 (56) 80
(79 84) 2 84
...
Material C 22 (30) 78 (70) 100 (78 70) 2 70
Total 90 210 300
4,575
Con nivel de significación de 0,05 no se rechaza la hipótesis nula; los datos son insuficientes para rechazar que la probabilidad de desintegración es la misma para los tres tipos de materiales.
Salida de MINITAB:
Chi-Square Test: Material A, Material B, Material C Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Material A 41 36.00 0.694
Material B 27 24.00 0.375
Material C 22 30.00 2.133
Total 90
2
79 84.00 0.298
53 56.00 0.161
78 70.00 0.914
210
Total
120
80
100
300
1
Chi-Sq = 4.575, DF = 2, P-Value = 0.101
48
Ejercicios
1) Un criminalista realizó una investigación para determinar si la incidencia de ciertos tipos de crímenes varían de una parte a otra en una ciudad grande. Los crímenes particulares de interés son asalto, robo, hurto y homicidio. La siguiente tabla muestra el número de delitos cometidos en tres áreas de la ciudad durante el año pasado: Frecuencias observadas
Tipo de delito Asalto Robo Secuestro Homicidio
I 162 118 451 18
Distrito II 310 196 996 25
III 258 193 458 10
Frecuencias esperadas
Distrito Tipo de delito I II III Asalto 171,1 348,9 210,0 Robo 118,9 242,3 145,8 Secuestro 446,6 910,5 547,9 Homicidio 12,4 25,3 15,2
¿Se puede concluir a partir de estos datos con un nivel de significación de 0,01 que la ocurrencia de estos tipos de crimen no es independiente del distrito de la ciudad? 2) De acuerdo con un estudio de la Universidad Johns Hopkins publicado en el American Journal of Public Health, las viudas viven más que los viudos. Considere los siguientes datos de sobrevivencia de 100 viudas y 100 viudos después de la muerte del cónyuge: Años vividos Menos de 5 De 5 a 10 Más de 10
Viuda 25 42 33
Viudo 39 40 21
¿Se puede concluir con un nivel de significación de 0,05 que las proporciones de viudas y viudos son iguales con respecto a los diferentes períodos que un cónyuge sobrevive a la muerte de su compañero? 3) Un estudio de la relación entre las condiciones de las instalaciones en gasolineras y la agresividad en el precio de la gasolina, reporta los siguientes datos basados en una muestra de 441 gasolineras. Al nivel de significación del 1%, ¿sugiere la información que las condiciones de las instalaciones y la política de precios son independientes entre sí? Política de precios
Condición de la instalación
Agresiva
Neutral
No agresiva
Anticuada
24
15
17
Condición estándar
52
73
80
Moderna
58
86
36
49
Capítulo 5 Diseños Experimentales 5.1. Introducción
Un experimento diseñado es una prueba o serie de pruebas en las cuales se inducen cambios deliberados en las variables de entrada ( factores controlables ) de un proceso o sistema, de manera que sea posible observar e identificar las causas de los cambios en la variable de salida ( vari able r espuesta ). Suponga por ejemplo que un exportador desea evaluar el efecto de tres métodos de empaque y dos sustancias preservantes en el tiempo de duración de cierto alimento. El exportador podría entonces realizar una serie de experimentos para evaluar cuál de las 6 combinaciones entre método de empaque y sustancia preservante da mejores resultados; a cada una de estas 6 combinaciones se les denomina . Suponga que el exportador decide realizar 5 repeticiones del tratamientos experimento con cada tratamiento . Como las condiciones ambientales (humedad, temperatura, etc.) pueden influir en el tiempo de duración del producto, los 6 tratamientos deben ser sometidos a prueba en cada réplica en forma simultánea. Dado que el tiempo de duración promedio del producto es de aproximadamente 10 días, el exportador decide realizar una réplica quincenal (por ejemplo, empezar la primera réplica con los 6 tratamientos el día primero, la segunda el día 15, la tercera el día primero del siguiente mes y así sucesivamente). Este ejemplo ayuda a definir los siguientes términos: Factor: Es una variable independiente o de entrada que puede afectar los resultados
del experimento. Los factores se pueden clasificar en . controlables
controlables y no
Factor en estudio:
Un factor en estudio es aquel cuyos valores son controlados y cuyo efecto será evaluado en los resultados del experimento. El interés principal del experimentador es evaluar el efecto de estos factores. En el ejemplo anterior, el método de empaque y la sustancia preservante son dos factores en estudio. A los distintos valores de los factores en estudio que son evaluados se les llama niveles . En el ejemplo, el factor método de empaque tiene 3 niveles y el factor del factor sustancia preservante 2 niveles. Factor de bloqueo: Es
un factor cuyo efecto en la variable respuesta no es de interés para el experimentador, pero cuyo efecto debe ser controlado para disminuir la variabilidad en los resultados del experimento. En el ejemplo, cada repetición del experimento es llevada a cabo en una quincena diferente. Se puede anticipar que habrá diferencias de temperatura y humedad entre quincenas, diferencias que se sabe pueden afectar los resultados del experimento. Por lo tanto, en este ejemplo, las quincenas deben ser consideradas como bloques.
50
Tratamiento: Es un conjunto de procedimientos cuyo efecto se mide y compara con
los de otros tratamientos. Un tratamiento corresponde a una combinación de los niveles de los factores en estudio, pudiendo ser estos uno o más. Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual
se mide el efecto de un tratamiento. En el ejemplo, la unidad experimental podría ser un empaque de alimento. Variable respuesta:
Es la variable en la cual se evaluarán los efectos de los tratamientos. En el ejemplo, la variable respuesta puede ser el tiempo de duración observado de cada empaque. Error experimental:
Es la variabilidad existente entre los resultados de unidades experimentales tratadas en forma similar. Cualquier factor no controlable contribuye al error experimental. El error experimental proviene de dos fuentes principales: variabilidad inherente al material experimental (en el ejemplo, habrán diferencias entre las distintas muestras de alimentos sometidas a cada tratamiento y en cada réplica) y variabilidad resultante de cualquier falta de uniformidad en la realización física del experimento (en el ejemplo, si las muestras de alimento son colocadas en posiciones diferentes sobre un anaquel, estarán sometidas a diferencias de luz, calor, humedad, polvo, etc.). Cualquier problema experimental involucra dos aspectos:
El diseño del experimento El análisis estadístico de los datos.
Estos dos temas están estrechamente ligados, ya que el método de análisis depende del diseño empleado.
51
Es importante en este tipo de análisis estadísticos que el experimentador haya seguido de cerca todos los pasos del experimento, desde el diseño del mismo, hasta el análisis final de los datos. Analizar datos cuya recogida no fue planificada puede traer ciertos problemas: Datos inconsistentes: Por cambios debidos al tiempo,
envejecimiento, reparaciones, etc. Esto provoca que los datos recogidos no sean consistentes lo que obviamente traerá confusiones en la interpretación. Cuando dos variables del proceso están correlacionadas, se pueden producir dos tipos diferentes de situación engañosa al analizar datos recogidos durante las operaciones habituales. Variables altamente correlacionadas:
1. Confusión de los efectos. 2. Relación no causal. Variable oculta. Confusión Variable1 Variable3
Variable2
Relación no causal Variable1
Variable2 Variable3
En este capítulo se presentan tres casos de análisis:
El diseño completamente al azar (DCA): Este es un diseño en el que solo se contempla un factor de estudio. El diseño de bloques completos al azar (DBCA): Este es un diseño en el que se contempla un factor de estudio y un factor de bloqueo. El experimento factorial axb: Este es un diseño con dos factores en estudio, con a y b niveles respectivamente.
5.2. Diseño Completamente al Azar
Suponga que se cuenta con los resultados de k muestras aleatorias independientes, cada una de tamaño ni, obtenidas desde k diferentes poblaciones y se desea probar la hipótesis de que las medias de estas k poblaciones son todas iguales. Las poblaciones que se desea comparar suelen ser producto de la aplicación de distintos tratamientos a ciertas unidades de análisis. Considere por ejemplo el caso en el que se desea comparar el efecto de 5 programas de incentivos en la productividad de los 52
trabajadores; en este caso, los 5 programas de incentivos serían los 5 tratamientos aplicados (los cuales definen las 5 poblaciones que se van a comparar), y la unidad de análisis sería un trabajador (quien recibe el tratamiento). Los datos a analizar pueden arreglarse en una tabla como la que se muestra a continuación: Tratamiento Tratamiento 1 2
Tratamiento Muestra
...
Tratamiento k
1
y11
y21
...
yk 1
2 3
y12
y22
yk 2
y13
y23
... ...
.
.
.
...
.
. .
. .
. .
... ...
. .
ni
y1n1
y1n2
...
y1nk
y1.
y2.
...
yk .
Totales yi.
yk 3
En esta tabla ni
yi.
yij j 1
k
Defina al total de las n. ni observaciones por i 1
k
y..
k
ni
yi. yij i 1
i 1 j 1
Para probar la hipótesis de que las muestras se obtuvieron de k poblaciones con medias iguales se harán varias suposiciones. Con más precisión, se supondrá que las poblaciones son normales y que tienen variancias iguales. Si i denota la media de las i-ésima población y 2 denota la variancia común de las k poblaciones, se puede expresar cada observación yij como i más el valor de un componente aleatorio: yij
i ij para i 1, 2,..., k ; j 1, 2,..., ni
Para lograr uniformidad en las ecuaciones correspondientes a clases de diseño más complicados, se acostumbra reemplazar i por i , donde es la media general para todas las poblaciones y i es el efecto del i-ésimo tratamiento, con
k
i
i 1
0.
53
Con estos nuevos parámetros se puede escribir el modelo para este diseño de la siguiente manera: yij
i ij para i 1, 2, ..., k ; j 1, 2, ..., ni
donde: : : i : ij :
La j- ésima observación en la i-ésima muestra. Parámetro de la media poblacional. Efecto del i-ésimo tratamiento. Error aleatorio asociado a la observación yij, donde ij ~ N(0, 2 )
yij
Tabla del análisis de variancia Fuente de variación
Grados de libertad
Tratamientos Error
k – 1
n. – k
Suma de cuadrados
SC(Tr)
SCE
n. – 1
SCT
yi2
i 1
ni
y 2 n
SCT SC(Tr) k
Total
k
n
y 2 ij
i 1 j 1
Cuadrado medio
CM(Tr)
CME
SC(Tr) k 1
Fc
CM(Tr ) CME
SCE n
k
y 2 n
Asumiendo el cumplimiento de los supuestos antes mencionados, y que en realidad no hay diferencias entre los tratamientos, la cantidad Fc del cuadro de Análisis de Variancia seguiría una distribución F con los grados de libertad de tratamientos y del error. Entonces, se puede utilizar esta distribución para evaluar la hipótesis nula de que no hay diferencias entre las medias de los tratamientos. Ejemplo.
El vicepresidente de mercadeo de un banco importante planea poner en marcha cierto tipo de promociones para atraer nuevos clientes en cuatro sucursales del banco. Él está convencido de que diferentes tipos de promociones atraerán a personas de diferentes grupos de ingreso, por lo que, de haber diferencias entre los ingresos promedio de los clientes de cada sucursal, se optará por un programa de promociones distinto para cada una. Considere a los montos de los depósitos como una medida representativa de los ingresos de los clientes. En la siguiente tabla se presentan datos para una muestra aleatoria de 7 depósitos desde cada sucursal (en miles de soles) ¿Debe el vicepresidente optar por un programa de promociones distinto para cada sucursal? Evalúe esta posibilidad con un nivel de significación del 5%.
54
Depósito
Sucursal 1 Sucursal 2 Sucursal 3 Sucursal 4
1 2 3 4 5 6 7
5,3 2,6 3,6 3,8 2,7 5,1 4,2 27,3
Total Y . i
3,3 4,6 2,1 3,5 5,0 2,8 2,5 23,8
3,6 2,8 4,5 3,8 1,9 4,1 5,1 25,8
4,3 2,5 1,8 3,0 3,9 3,5 4,1 23,1
.. = 100 Y
Solución. H0:
1 =
2 =
3 =
4 =
H1: Al menos un
i
0
≠0
Los totales para las cuatro muestras son, respectivamente, 27,3, 23,8, 25,8 y 23,1, el gran total es 100, y los cálculos con que se obtienen las sumas de cuadrados necesarias son los siguientes: 2
4 7 yij 2 i1 j 1 (100) 357,1429 n.
28
(5,3) 2 (2,6) 2 . . . (4,1) 2 357,14 27,0171 (27,3) 2 (23,8) 2 (25,8) 2 (23,1) 2 357,1429 1,5686 SC(Tr) SCT
7
La tabla del análisis de variancia es: Fuente de variación
Grados de libertad
Suma de cuadrados
Cuadrado medio
Tratamientos
4 – 1 = 3
1,5686
0,5229
Error
28 – 4 = 24
25,4486
1,0604
Total
28 – 1 = 27
27,0171
Fc 0,4931
Ft 3,01
Puesto que el valor obtenido para Fc es menor que 3,01, que corresponde al valor F 0,05 con 3 y 24 grados de libertad, la hipótesis nula no puede ser rechazada con un nivel de significación de 0,05; se concluye entonces que no se puede rechazar la hipótesis de que las medias de los depósitos en las 4 sucursales son iguales y la recomendación sería no implementar programas de promociones diferentes para cada sucursal.
55
A continuación se presenta la salida del SPSS para el análisis de variancia para una vía de este ejemplo, junto con las pruebas para la verificación de los supuestos. Supuesto de Homogeneidad de Variancias:
H0: 12 22 32 42 (esto es, la variancia es la misma en las cuatro sucursales) H1: Al menos una variancia es diferente.
Test for Equal Variances for Depósitos Bartlett's T est Test Statistic
1
P- Value
0.19 0.980
Levene's Test Test Statistic P- Value l a s r u c u S
0.04 0.988
2
3
4
0.5
1.0
1.5
2.0
2.5
3.0
95% Bonferroni Confidence Intervals for StDevs
Con un valor de probabilidad de 0.98, el resultado de esta prueba indica que no hay suficiente evidencia estadística para rechazar el supuesto de homogeneidad de variancias. Supuesto de Normalidad:
H0: Los errores del modelo tienen distribución normal. H1: Los errores del modelo no tienen distribución normal.
56
Probability Plot of RESI1 Normal 99 Mean
5.551115E-17
StDev
0.9708
N
95
KS
90
P-V alue
28 0.081 >0.150
80 70 t n 60 e c 50 r e 40 P 30 20 10 5
1
-2
-1
0
1
2
RESI1
Con un valor de probabilidad de 0.150, el resultado de esta prueba indica que no hay suficiente evidencia estadística para rechazar el supuesto de normalidad. Análisis de Variancia:
General Linear Model: Depósitos versus Sucursal Factor Sucursal
Type fixed
Levels 4
Values 1, 2, 3, 4
Analysis of Variance for Depósitos, using Adjusted SS for Tests Source Sucursal Error Total
DF 3 24 27
S = 1.02974
Seq SS 1.569 25.449 27.017
Adj SS 1.569 25.449
R-Sq = 5.81%
Adj MS 0.523 1.060
F 0.49
P 0.690
R-Sq(adj) = 0.00%
5.3. Prueba para la diferencia de medias
Se supone que el experimentador tiene a su disposición mediciones relativas a varios tratamientos. El análisis de variancia indica si hay evidencias de que al menos una de las medias sea diferente o no. Cuando se rechaza la hipótesis nula, el análisis de variancia no revela cuál o cuáles de las medias son significativamente diferentes; en estos casos se deben utilizar otras pruebas estadísticas.
57
Método de Comparaciones Múltiples: Prueba de Tukey-Kramer:
Cuando el experimentador desea determinar todos los pares de medias que se puede concluir que difieren de otro (µ i vs µ j) se utilizan las pruebas de comparaciones múltiples, como la de Tukey-Kramer. Con esta prueba, con el fin de probar todas las hipótesis nulas simultaneas H0: µ i - µ j = 0, los estadísticos de prueba son:
( )
Donde CME es el cuadrado medio del error del Análisis de Varianza, Ji y Jj son los tamaños de muestra de los tratamientos i y j respectivamente. Ejemplo
Los siguientes datos corresponden a las mediciones de los pesos de recubrimiento de estaño de discos por cuatro laboratorios diferentes.
Total Media
Laboratorio A 0,25 0,33 0,22 0,30 0,27 0,28 0,32 0,24 0,31 0,26 0,20 0,28
Laboratorio B 0,18 0,28 0,21 0,23 0,25 0,20 0,27 0,19 0,24 0,22 0,29 0,16
Laboratorio C 0,19 0,25 0,27 0,24 0,18 0,26 0,28 0,24 0,25 0,20 0,21 0,19
Laboratorio D 0,23 0,30 0,28 0,28 0,24 0,34 0,20 0,18 0,24 0,28 0,22 0,21
Total
3,26 0,272
2,72 0,227
2,76 0,230
3,00 0,250
11,740
La tabla del análisis de variancia es: Fuente de variación Laboratorios Error Total
Grados de libertad 3 44 47
Suma de cuadrados 0,0156 0,0728 0,0884
Cuadrado medio 0,0052 0,0017
Fc
Ft
3,133
2,82
Determine qué medias difieren de las otras. Use un nivel de significación 0.05 .
58
Desarrollando el ejemplo utilizando el MINITAB se obtienen los siguientes resultados:
Probability Plot of RESI2 Normal 99 Mean
-8.67362E-18
S tDev
0.03937
N
95
48
KS
90
0.077
P-Value
>0.150
80
¿Cuáles son las hipótesis? Ho: ……………………………………………… H1: ………………………………………………
70 t n 60 e c 50 r e 40 P 30 20 10 5
1
-0.10
-0.05
0.00
0.05
0.10
RESI2
Test for Equal Variances for Pesos de Recubrimiento Bartlett's T est Test Statistic
A
P-Value
0.96 0.810
Levene's Test Test Statistic P-Value o i r o t a r o b a L
0.26 0.852
B
¿Cuáles son las hipótesis? Ho: ……………………………………………… H1: ………………………………………………
C
D
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
95% Bonferroni Confidence Intervals for StDevs
59
General Linear Model: Pesos de Recubrimiento versus Laboratorio Factor Laboratorio
Type fixed
Levels 4
Values A, B, C, D
Analysis of Variance for Pesos de Recubrimiento, using Adjusted SS for Tests Source Laboratorio Error Total
DF 3 44 47
S = 0.0406854
Seq SS 0.015558 0.072833 0.088392
Adj SS 0.015558 0.072833
R-Sq = 17.60%
Adj MS 0.005186 0.001655
F 3.13
P 0.035
R-Sq(adj) = 11.98%
Unusual Observations for Pesos de Recubrimiento
Obs 42
Pesos de Recubrimiento 0.340000
Fit 0.250000
SE Fit 0.011745
Residual 0.090000
St Resid 2.31 R
R denotes an observation with a large standardized residual.
Tukey 95.0% Simultaneous Confidence Intervals Response Variable Pesos de Recubrimiento All Pairwise Comparisons among Levels of Laboratorio Laboratorio = A subtracted from: Laboratorio B C D
Lower -0.08940 -0.08606 -0.06606
Laboratorio B C D
--------+---------+---------+-------(--------*--------) (--------*--------) (--------*--------) --------+---------+---------+--------0.050 0.000 0.050
Laboratorio = B Laboratorio C D
Center -0.04500 -0.04167 -0.02167
Upper -0.000604 0.002729 0.022729
subtracted from: Lower
Center
Upper
--------+---------+---------+-------
-0.04106 -0.02106
0.003333 0.023333
0.04773 0.06773
(--------*--------) (--------*--------) --------+---------+---------+-------
-0.050
Laboratorio = C Laboratorio D
0.000
0.050
subtracted from:
Lower -0.02440
Center 0.02000
Upper 0.06440
--------+---------+---------+-------(--------*--------) --------+---------+---------+--------0.050 0.000 0.050
60
Tukey Simultaneous Tests Response Variable Pesos de Recubrimiento All Pairwise Comparisons among Levels of Laboratorio Laboratorio = A subtracted from:
Laboratorio B C D
Difference of Means -0.04500 -0.04167 -0.02167
Laboratorio = B
Laboratorio C D
Laboratorio D
T-Value -2.709 -2.509 -1.304
Adjusted P-Value 0.0456 0.0724 0.5651
T-Value 0.2007 1.4048
Adjusted P-Value 0.9971 0.5032
T-Value 1.204
Adjusted P-Value 0.6276
subtracted from:
Difference of Means 0.003333 0.023333
Laboratorio = C
SE of Difference 0.01661 0.01661 0.01661
SE of Difference 0.01661 0.01661
subtracted from:
Difference of Means 0.02000
SE of Difference 0.01661
Estos resultados pueden resumirse en un diagrama de líneas como el que se muestra a continuación. La idea es que los tratamientos unidos por una línea no presentan diferencias significativas. B
C
D
A
0,227
0,230
0,250
0,272
5.4. Diseño con Bloques Completos al Azar
Se supone que el experimentador tiene a su disposición mediciones relativas a a tratamientos aplicados sobre b bloques. Los bloques son utilizados para controlar una fuente de variabilidad adicional a los tratamientos, que aunque no es el objetivo fundamental de la investigación, puede ser identificada de antemano. Esto puede ocurrir por ejemplo en experimentos en donde los datos se toman por días, y en donde se sabe que los resultados pueden diferir entre los distintos días, o cuando cada tratamiento es evaluado en un mismo individuo (una persona, una máquina, etc), de modo que se espera que existan diferencias en los resultados atribuibles a cada individuo. En términos más generales, la idea es que las observaciones sean lo más homogéneas dentro del bloque y heterogéneas entre bloques. Los bloques son completos porque todos los tratamientos aparecen en igual número, usualmente una vez, dentro de cada bloque, y son al azar por que los tratamientos son asignados aleatoriamente dentro de cada bloque.
61
Los datos a analizar pueden arreglarse en una tabla como la que se muestra a continuación: Tratamientos
Totales
Bloques
T1
T2
T3
...
Ti
...
B1
y11
y21
y31
...
yi1
...
ya1
y .1
B2
y12
y22
y32
...
yi2
...
ya2
y . 2
B3
y13
y23
y33
...
yi3
...
ya3
y . 3
.
.
.
.
...
.
...
.
.
.
.
.
.
.
.
.
.
... ...
B j
y1 j
y2 j
y3 j
.
.
.
Bb
y1b
Totales
y1.
.
... ...
...
yij
.
...
y2b
y3b
y 2.
y 3.
Ta
.
. .
...
yaj
y . j
.
...
.
...
yib
...
yab
y . b
...
y i.
...
y a.
y..
.
.
Cada observación puede ser expresada con el siguiente modelo lineal. y ij
i j ij
para i 1,2,..., a ; j 1,2,..., b
donde: yij
:
Es la observación relativa al i-ésimo tratamiento del j-ésimo bloque.
:
Es la gran media
i
:
Es el efecto del i-ésimo tratamiento.
j
:
Es el efecto del j-ésimo bloque.
ij
:
Es el error aleatorio correspondiente a la observación yij.
En este modelo se tiene que: a
i 0 i 1
b
j
0
j 1
62
Las sumas de cuadrados se pueden calcular con las siguientes fórmulas: a
SCT
b
y 2 ij
i 1 j 1
SC(Tr)
SCB
SCE
a
y i2.
i 1
b
b
y.2 j
j 1
a
y..2 ab y..2 ab y..2 ab
SCT SC(Tr) SCB
Tabla del análisis de variancia
Fuente de variación
Grados de libertad
Suma de cuadrados a
Tratamientos
a - 1
SC(Tr)
yi2.
i 1
Bloques Error
b - 1
SCB
b
y.2 j
j 1
a
ab
y..2
CM(Tr)
CMB
ab
(a - 1)(b - 1) SCE SCT SC(Tr) SCB CME a
Total
b
y..2
Cuadrado medio
ab - 1
SST
b
y 2 ij
i 1 j1
SC(Tr) a 1
F
FT
SCB b 1 SCE
(a 1)(b 1)
y..2 ab
Observe que en la tabla se puede obviar el valor de F para probar el efecto de los bloques, la razón es que el experimento se diseñó para probar un solo factor. La formación de bloques se hizo para eliminar tal variación del término CME. Pero, el estudio no se diseñó para detectar las diferencias individuales para los niveles del bloque.
Ejemplo
Se han tomado muestras de aguas subterráneas de cinco diferentes zonas de depósito de aguas tóxicas por cada una de las tres agencias siguientes: la EPA, la compañía propietaria de los lugares de depósito y un asesor independiente dedicados a asuntos de ingeniería. Cada muestra fue analizada buscando detectar la presencia de cierto contaminante por todos los métodos de laboratorio que la agencia que recolectó la muestra suele emplear. Se consideraron los siguientes resultados:
63
CM(Tr ) CME
Agencia 1 Agencia 2 Agencia 3 Suma
Lugar A
Lugar B
Lugar C Lugar D Lugar E
23,8 19,2 20,9
7,6 6,8 5,9
15,4 13,2 14
30,6 22,5 27,1
4,2 3,9 3
63,9
20,3
42,6
80,2
11,1
Suma 81,6 65,6 70,9 218,1
¿Existe alguna razón para creer que las agencias no son, en sus mediciones, consistentes entre sí? ¿Difiere una zona de depósito con respecto a cualquier otra en su nivel de contaminación? Utilice un nivel de significación de 0,05. Solución
1. Las hipótesis nula y alterna son.
H 0 : 1 2 3 H 1 : No todas las son iguales 2. El nivel de significación: 0,05 . 3. Criterio: Para tratamientos, se rechaza la hipótesis nula si F > 4,46, el valor de F 0,95 para 2 y 8 grados de libertad. Para bloques, se rechaza la hipótesis nula si F > 3,84, el valor de F 0,95 para 4 y 8 grados de libertad. 4. Cálculos. Sustituyendo a = 3, b. = 5, y1. = 81,6, y2. = 65,6, y3. = 70,9 y.. = 218,1, y a
b
y
2 ij
4336,97 en las expresiones para calcular la suma de cuadrados, se
i 1 j 1
obtiene: 2
3 5 y ij 2 i 1 j 1 (218,1) 3171,17
ab (15) SCT 4336,97 3171,17 1165,80 SC(Tr)
5
(63,9) 2
(65,5) 2
... 3 SCE SCT SC(Tr) SCB
(81,6) 2
5
(11,1) 2 3 SCB
(70,9) 2 5
3171,17 26,57
3171,17 1117,26 21,96
64
El cuadro de análisis de variancia es. Fuente de variación Tratamientos Bloques Error Total
Grados de libertad 3 – 1 = 2 5 – 1 = 4 (3-1)(5-1)=8 (3)(5) – 1 = 14
Suma de cuadrados 26,57 1117,26 21,96 1165,80
Cuadrado medio 13,29 279,32 2,75
F
Ft
4,84
4,46
5. Decisión. Para tratamientos, como F > 4,46, concluimos que existen diferencias significativas entre las agencias. A continuación se presentan los resultados obtenidos con MINITAB para el análisis de variancia. General Linear Model: Contaminante versus Agencias, Lugares Factor Agencias Lugares
Type fixed fixed
Levels 3 5
Values Agencia 1, Agencia 2, Agencia 3 A, B, C, D, E
Analysis of Variance for Contaminante, using Adjusted SS for Tests Source Agencias Lugares Error Total
DF 2 4 8 14
S = 1.65685
Seq SS 26.57 1117.26 21.96 1165.80
Adj SS 26.57 1117.26 21.96
R-Sq = 98.12%
Adj MS 13.29 279.32 2.75
F 4.84 101.75
P 0.042 0.000
R-Sq(adj) = 96.70%
Unusual Observations for Contaminante Obs 11
Contaminante 22.5000
Fit 25.3133
SE Fit 1.1318
Residual -2.8133
St Resid -2.33 R
R denotes an observation with a large standardized residual.
Tukey 95.0% Simultaneous Confidence Intervals Response Variable Contaminante All Pairwise Comparisons among Levels of Agencias Agencias = Agencia 1 subtracted from: Agencias Agencia 2 Agencia 3
Lower -6.194 -5.134
Center -3.200 -2.140
Agencias = Agencia 2 Agencias Agencia 3
Lower -1.934
Upper -0.2065 0.8535
-+---------+---------+---------+----(---------*---------) (---------*---------) -+---------+---------+---------+-----6.0 -3.0 0.0 3.0
subtracted from:
Center 1.060
Upper 4.054
-+---------+---------+---------+----(---------*---------) -+---------+---------+---------+-----6.0 -3.0 0.0 3.0
65
Tukey Simultaneous Tests Response Variable Contaminante All Pairwise Comparisons among Levels of Agencias Agencias = Agencia 1 subtracted from:
Agencias Agencia 2 Agencia 3
Difference of Means -3.200 -2.140
Agencias = Agencia 2
Agencias Agencia 3
Difference of Means 1.060
SE of Difference 1.048 1.048
T-Value -3.054 -2.042
Adjusted P-Value 0.0375 0.1642
subtracted from: SE of Difference 1.048
T-Value 1.012
Adjusted P-Value 0.5906
5.5. Experimento Factorial a xb .
Usualmente en los experimentos se desea estudiar el efecto de dos o más factores. Por diseño factorial se entiende que en cada ensayo o réplica completa del experimento se investigan todas las combinaciones posibles de los niveles de los factores. Por ejemplo. Factor A: con a niveles Factor B: con b niveles. Entonces cada réplica puede contener todas la ab combinaciones de los tratamientos.
5.5.1. Tipos de modelos Modelo de efectos fijos
Cuando el investigador sólo está interesado en estudiar ciertos niveles de los factores involucrados y por lo tanto la selección no es aleatoria. Los resultados sólo serán útiles para los niveles considerados en el estudio y las hipótesis están referidas a las medias de los niveles seleccionados. En esta sección solo se tratará el caso de un experimento factorial con dos factores fijos. Modelo de efectos aleatorios
Cuando el investigador está interesado en un gran número de posibles niveles, y no es posible estudiarlos todos, la mejor manera de estudiarlos es seleccionar aleatoriamente una cantidad de niveles de la población de niveles de cada factor en estudio. Los resultados podrán generalizarse para toda población de niveles. En este caso las hipótesis están referidas a la variancia de los factores.
66
Modelo de efectos mixtos
Cuando los niveles de algunos de los factores son elegidos aleatoriamente y los niveles de los otros factores, también considerados en el estudio, son fijados por el investigador.
5.5.2. Diseño factorial de dos factores En la práctica se suele trabajar con diseños de dos factores, A y B, donde cada factor tiene dos o más niveles. Ejemplo
Un ingeniero está diseñando una batería que se usará en un dispositivo que se someterá a variaciones de temperatura extrema. El único parámetro de diseño que puede seleccionar en este punto es el material de la placa o ánodo de la batería y tiene tres elecciones posibles. Cuando el dispositivo esté fabricado y se envíe al campo, el ingeniero no tendrá control sobre las temperaturas extremas en las que operará el dispositivo, pero sabe por experiencia que la temperatura probablemente afectará la vida efectiva de la batería. El ingeniero decide probar los tres materiales de la placa con tres niveles de temperatura, 15, 70 y 125°F, ya que estos niveles de temperatura son consistentes con el medio ambiente donde se usará finalmente el producto. Se prueban cuatro baterías con cada combinación del material de la placa y la temperatura, y las 36 pruebas se corren de manera aleatoria. La tabla siguiente muestra los resultados obtenidos. Tipo de material (A) M1 M2 M3
Vida en horas de las baterías Temperatura (B) 15°F 70°F 125°F 130 155 34 40 20 70 74 180 80 75 82 58 150 188 136 122 25 70 159 126 106 115 58 45 138 110 174 120 96 104 168 160 150 139 82 60
¿Qué efectos tienen el tipo de material y la temperatura sobre la vida de la batería? Las observaciones de un experimento factorial de este tipo pueden describirse con el siguiente modelo: yijk
i j ( )ij ijk
donde: i 1,2,..., a
1,2,..., b k 1,2,..., n j
67
En este modelo es el efecto de la media global, i es el efecto del nivel i-ésimo del factor A, j es el efecto del nivel j-ésimo del factor B, ( )ij es el efecto de la interacción entre i y j , y ijk es un componente de error aleatorio. Se supone que los errores tienen distribución normal con media cero y variancia constante.
5.5.3. Pruebas de hipótesis Asumiendo que ambos factores son fijos las hipótesis a probar están dadas por: Efecto principal del factor A:
2 ... a 0 H 1 : al menos un i 0 H 0 : 1
Efecto principal del factor B:
2 ... b 0 H 1 : al menos un j 0 H 0 : 1
Efecto de la interacción entre ambos factores: H 0 : ( )ij
0 i, j
H 1 : al menos un ( )ij
0
5.5.4. Descomposición de la suma de cuadrados En este diseño, el cuadro de análisis de variancia está dado por: Fuentes de Variación
Grados de Libertad (gl)
Sumas de Cuadrados (SC)
A
a – 1
SC( A)
B
b – 1
SC( B)
(a – 1)(b-1)
SC( AB)
ab( n – 1)
SC(Error)
abn – 1
SC(Total)
AB
Error Experimental Total
Cuadrados Medios (CM)
Fc
SC( A)
CM( A)
gl( A)
CM(Error)
SC( B)
CM( B)
gl( B )
CM(Error)
SC( AB)
CM( AB)
gl( AB)
CM(Error)
SC(Error) gl(Error)
68
A continuación se presenta el cuadro de análisis de variancia para el ejemplo tratado en esta sección: Fuentes de Variación
Grados de Libertad (gl)
Sumas de Cuadrados (SC)
Cuadrados Medios (CM)
Fc
p
A
2
10683,72
5341,86
7,911
0,0020
B
2
39118,72
19559,36
28,968
0,0000
AB
4
9613,78
2403,44
3,560
0,0186
Error Experimental
27
18230,75
675,21
Total
35
77646.97
Los resultados de este análisis indican lo siguiente: Para el factor A: Se rechaza H 0, por lo que se concluye que hay diferencias significativas en el tiempo medio de duración de las baterías dependiendo del tipo de material. Para el factor B: Se rechaza H 0, por lo que se concluye que hay diferencias significativas en el tiempo medio de duración de las baterías dependiendo de la temperatura. Para la interacción: Se rechaza H 0, por lo que se concluye que existe un efecto de interacción entre el tipo de material y la temperatura. Como la interacción es significativa, las comparaciones entre las medias de uno de los factores pueden ser empañadas por la interacción AB. En estos casos, es recomendable basar las conclusiones en un gráfico como el que se muestra a continuación: Gráfica tipo de material-temperatura o i d e m o r p a d i V
175.0 150.0 125.0 100.0 75.0 50.0 25.0 0.0
M1 M2 M3
15 °F
70 °F
125 °F
Temperatura
69
De este gráfico se pueden desprender las siguientes conclusiones:
Cuando la temperatura de operación es de 15°F, aparentemente los tres materiales resultan igualmente eficientes. Cuando la temperatura de operación es de 70°F, el material M3 parece ser la mejor opción seguido del material M2. Cuando la temperatura de operación es de 125°F, el material M3 parece ser la mejor opción. Con los materiales M1 y M2 se obtienen rendimientos más bajos e indistinguibles.
A continuación se muestra el análisis efectuado con MINITAB: General Linear Model: Vida (horas) versus Tipo De Material, Temperatura Factor Tipo De Material Temperatura
Type fixed fixed
Levels 3 3
Values M1, M2, M3 125°F, 15°F, 70°F
Analysis of Variance for Vida (horas), using Adjusted SS for Tests Source Tipo De Material Temperatura Tipo De Material*Temperatura Error Total
DF 2 2 4 27 35
S = 25.9849
R-Sq(adj) = 69.56%
R-Sq = 76.52%
Seq SS 10683.7 39118.7 9613.8 18230.8 77647.0
Adj SS 10683.7 39118.7 9613.8 18230.8
Adj MS 5341.9 19559.4 2403.4 675.2
F 7.91 28.97 3.56
P 0.002 0.000 0.019
Unusual Observations for Vida (horas)
Obs 2 8
Vida (horas) 74.000 180.000
Fit 134.750 134.750
SE Fit 12.992 12.992
Residual -60.750 45.250
St Resid -2.70 R 2.01 R
R denotes an observation with a large standardized residual.
Tukey 95.0% Simultaneous Confidence Intervals Response Variable Vida (horas) All Pairwise Comparisons among Levels of Tipo De Material Tipo De Material = M1 subtracted from: Tipo De Material M2 M3
Lower -1.162 15.588
Center 25.17 41.92
Tipo De Material = M2 Tipo De Material M3
Lower -9.579
Upper 51.50 68.25
----+---------+---------+---------+-(---------*----------) (----------*---------) ----+---------+---------+---------+-0 25 50 75
subtracted from:
Center 16.75
Upper 43.08
----+---------+---------+---------+-(----------*---------) ----+---------+---------+---------+-0 25 50 75
70
Tukey Simultaneous Tests Response Variable Vida (horas) All Pairwise Comparisons among Levels of Tipo De Material Tipo De Material = M1 subtracted from: Tipo De Material M2 M3
Difference of Means 25.17 41.92
SE of Difference 10.61 10.61
Tipo De Material = M2 Tipo De Material M3
Difference of Means 16.75
T-Value 2.372 3.951
Adjusted P-Value 0.0628 0.0014
subtracted from: SE of Difference 10.61
T-Value 1.579
Adjusted P-Value 0.2718
Tukey 95.0% Simultaneous Confidence Intervals Response Variable Vida (horas) All Pairwise Comparisons among Levels of Temperatura Temperatura = 125°F subtracted from: Temperatura 15°F 70°F
Lower 54.34 17.09
Temperatura = 15°F Temperatura 70°F
Lower -63.58
Center 80.67 43.42
Upper 107.00 69.75
---+---------+---------+---------+--(----*----) (-----*----) ---+---------+---------+---------+---50 0 50 100
subtracted from: Center -37.25
Upper -10.92
---+---------+---------+---------+--(-----*----) ---+---------+---------+---------+---50 0 50 100
Tukey Simultaneous Tests Response Variable Vida (horas) All Pairwise Comparisons among Levels of Temperatura Temperatura = 125°F subtracted from:
Temperatura 15°F 70°F
Difference of Means 80.67 43.42
Temperatura = 15°F
Temperatura 70°F
SE of Difference 10.61 10.61
T-Value 7.604 4.093
Adjusted P-Value 0.0000 0.0010
T-Value -3.511
Adjusted P-Value 0.0044
subtracted from:
Difference of Means -37.25
SE of Difference 10.61
71
Ejercicios
1) Para determinar la mejor disposición de los instrumentos sobre el tablero de control de un aeroplano, se prueban tres distintos arreglos simulando una situación de emergencia y se observa el tiempo de reacción requerido para corregir la avería. Los tiempos de reacción (en décimas de segundo) de 28 pilotos (aleatoriamente asignados a los diversos arreglos) son los siguientes: 14 10 11
Disposición 1 Disposición 2 Disposición 3
13 12 5
9 9 9
15 11 7 11 10 6
y
2 ij
13 8 8
14 12 8
10 9 7
12 10 6
13
Total 111 101 70 282
3030
a) Con un nivel de significación de 0.01 pruebe si se puede rechazar la hipótesis nula de que las diferencias entre las disposiciones no tienen efecto alguno. b) De rechazar la hipótesis nula en a), realice la prueba de Duncan. 2) En un estudio se investigó la importancia de los valores éticos corporativos entre personas que se especializan en mercadotecnia. Los datos siguientes muestran las puntuaciones sobre la evaluación realizada; las puntuaciones más altas indican valores éticos mayores. a) Indique el modelo lineal e intérprete sus componentes. b) Usando 0,05 pruebe si hay diferencias significativas en la importancia de los valores entre los tres grupos.
Total
Gerentes de mercadotecnia
Investigadores de mercadotecnia
Publicidad
5 5 4 5 4 4
2 3 2 4 3 4
8 9 6 9 6 8
27
18
46
y
2 ij
543
3) Un ingeniero industrial prueba cuatro diferentes disposiciones de los anaqueles de una tienda de departamentos que cuenta con seis cuadrillas de trabajadores para ensamblar. Cada cuadrilla monta los anaqueles en cada una de las cuatro diferentes disposiciones y se mide el tiempo que emplean (en minutos).
72
Arreglo 1
Cuadrilla A Cuadrilla B Cuadrilla C Cuadrilla D Cuadrilla E Cuadrilla F Total
Arreglo 2
Arreglo 3
Arreglo 4
48,2 49,5 50,7 48,6 47,1 52,4
53,1 52,9 56,8 50,6 51,8 57,2
51,2 50,0 49,9 47,5 49,1 53,5
58,6 60,1 62,4 57,5 55,3 61,7
296,5
322,4
301,2
355,6
Total
211,1 212,5 219,8 204,2 203,3 224,8 1275,7
Sabiendo que, yij2 68 281,53 , pruebe con un nivel de significación de 0,01 si las cuatro disposiciones producen distintos tiempos promedio de montaje. 4) En un estudio se asignan tres dietas por un período de tres días a cada uno de seis sujetos en un diseño de bloques completos al azar. A los sujetos, que juegan el papel de bloques, se les asignan las siguientes tres dietas en orden aleatorio. Dieta 1: Dieta 2: Dieta 3:
mezcla de grasa y carbohidratos alta en grasa alta en carbohidratos
Al final del período de tres días cada sujeto se coloca un aparato para caminata y se mide el tiempo de agotamiento en segundos. Se registraron los siguientes datos:
Dieta
I
II
1 2 3 Total
84 91 122
35 48 53
297
136
Sujeto III IV
91 71 110
57 45 71
272 173
V
VI
56 45 61 61 91 122 208
228
Total 368 377 569 1314
a) Defina el modelo en términos del problema. b) Utilice nivel de significación de 0,01 para determinar si hay diferencias significativas entre las dietas. 5) Una empresa de pedidos por correo diseñó un experimento factorial para investigar el efecto que tiene el tamaño de un anuncio en revistas y el diseño mismo del anuncio, sobre la cantidad de pedidos recibidos (en miles). Se consideraron tres diseños de anuncios y dos tamaños de anuncios. Los datos que se obtuvieron aparecen en la tabla siguiente. Aplique el procedimiento de análisis de variancia para experimentos factoriales e investigue si hay efectos apreciables debidos al tipo de diseño, tamaño del anuncio o interacción entre esos dos factores. Use 0,05 .
73
A Diseño
B C
Total
Tamaño del anuncio Pequeño Grande 8 12 12 8 14 16 22 26 14 30 20 30 10 18 18 14 15 17 84
133
Total 20 20 30 48 44 50 28 32 32
y
2 ijk
5882
171
6) Se diseñó un experimento factorial para determinar si hay diferencias significativas en el tiempo necesario para traducir del inglés a otra lengua con dos sistemas de traducción computarizado. Como se cree que un factor importante es el idioma al que se va a traducir, se hicieron traducciones con ambos sistemas para tres idiomas distintos; español, francés y alemán. Use los datos siguientes para el tiempo de traducción, en horas. Sistema Sistema 1 Sistema 2
Español 8 12 10 6 10 14
Idioma Francés 10 14 12 14 16 20
Alemán 12 16 14 16 22 24
a) Defina el modelo aditivo lineal e intérprete sus componentes. b) Determine si hay diferencias importantes debidas al programa de traducción, al idioma y a su interacción. Use α 0,05. 7) El Director de un supermercado Ubicación en la estantería Tamaño del está interesado en estudiar el Nivel de A nivel efecto llamado de estantería en las Supermerca A nivel las de la do alcance ventas de un producto. El producto manos vista se encuentra situado en A: a nivel 55 67 76 alcance, B: nivel de las manos, C: 60 83 83 Pequeño a nivel de la vista. Para realizar el 62 74 80 experimento, los supermercados 80 85 92 han sido clasificados según su 98 97 103 Grande tamaño. Analice los datos 84 90 98 considerando un nivel de significación del 5%. Identifique el modelo y sus componentes, los factores, los niveles del factor y la variable respuesta. Determine, si es posible, la mejor combinación de niveles de los factores.
74
Capítulo 6 Análisis de Correlación y Regresión 6.1 Introducción El análisis de regresión lineal y de correlación comprende el estudio de los datos muestrales para saber si dos o más variables de una población están relacionadas entre sí. El análisis de regresión lineal da como resultado una ecuación matemática que describe cierta relación determinada. La ecuación puede usarse para estimar o predecir los valores de una variable cuando se conocen o se suponen conocidos los valores de otra variable. El análisis de correlación da como resultado un número que resume el grado de relación lineal existente entre dos variables. Es útil en un trabajo exploratorio cuando el investigador desea encontrar el grado o la fuerza de esa relación.
6.2 El diagrama de dispersión El primer paso en el análisis de regresión, es construir una gráfica de los datos muestrales en un plano bidimensional. Esta gráfica se denomina diagrama de dispersión. El diagrama de dispersión indica frecuentemente el tipo de tendencia de y con respecto a x . Esta tendencia puede ser lineal o no lineal. En el primer caso se estimará una recta y en el segundo caso una curva. Ejemplo
Un comerciante al menudeo lleva a cabo un estudio para determinar la relación entre los gastos semanales de publicidad y las ventas. Se registran los siguientes datos: Costos de publicidad ($)
Ventas ($)
40 20 25 20 30 50 40 20 50 40 25 50
500 400 395 365 475 510 490 420 560 525 420 525
Elabore el diagrama de dispersión de los datos. 75
Solución:
El diagrama es el siguiente: Diagrama de dispersión del costo de publicidad y las ventas 600 500 ) 400 $ ( s a 300 t n e V 200
100 0 0
10
20
30
40
50
60
Costo de publicidad ($)
6.3 El método de los mínimos cuadrados El método más empleado para ajustar una línea recta a un conjunto de puntos es conocido mínimos cuadrados, cuya recta resultante tiene dos características importantes:
La suma de las desviaciones verticales de los puntos con relación a la recta es cero; y La suma de los cuadrados de las desviaciones es mínima (es decir, ninguna otra recta daría una menor suma de cuadrados de tales desviaciones)
Simbólicamente el valor que se minimiza es: n
(y
i
yi )2 ˆ
i 1
Los valores de 0 y 1 que minimizan la suma de los cuadrados de las desviaciones, son las soluciones de las llamadas ecuaciones normales de la recta de regresión:
n y i n 0 1 x i i 1 i 1 n n n 2 x i y i 0 x i 1 x i i 1 i 1 i 1 n
76
Resolviendo las ecuaciones simultáneas para 0 y 1 tenemos:
n n n n x i y i x i y i i 1 i 1 1 i 1 2 n 2 n n x i x i i 1 i 1
y
ˆ
0 y 1 x ˆ
ˆ
La línea recta estimada La línea recta tiene dos importantes componentes: La pendiente de la recta y La ordenada de la recta (el valor de y) en determinado punto (cuando x = 0) La ecuación lineal es la siguiente:
Punto de corte yi 0 1x i ˆ
Pendiente
ˆ
ˆ
Ejemplo 9.2.- Estime la ecuación de la recta del ejemplo anterior.
Nº
Costos de publicidad ($), x
Ventas ($), y
xy
x2
y2
1 2 3 4 5 6 7 8 9 10 11 12
40 20 25 20 30 50 40 20 50 40 25 50
500 400 395 365 475 510 490 420 560 525 420 525
20000 8000 9875 7300 14250 25500 19600 8400 28000 21000 10500 26250
1600 400 625 400 900 2500 1600 400 2500 1600 625 2500
250000 160000 156025 133225 225625 260100 240100 176400 313600 275625 176400 275625
Suma
410
5585
198675
15650
2642725
1 ˆ
12(198675) (410)(5585) 12(15650) (410)
2
4,7843
0 301,9543 ˆ
77
Descomposición de la varianza total. y i 0 1 x i
Y
ˆ
ˆ
ˆ
(xi, yi)
i
yi
yi ˆ
y i y
y i y ˆ
y
xi
x
X
La distancia ( yi y) se puede descomponer de la siguiente manera: ( yi y) ( yi y) ( yi yi ) ˆ
ˆ
Elevando al cuadrado ambos miembros y aplicando sumatorias se tiene: n
(y
n
y) ( y i y) ( y i y i )2 2
i
i 1
ˆ
ˆ
i 1
n
n
n
( y i y) ( y i y i ) 2 ( y i y)( y i y) 2
2
ˆ
ˆ
i 1
ˆ
i 1
ˆ
i 1
Operando algebraicamente se obtiene la siguiente relación: n
(y
n
n
y) ( y i y) ( y i y i ) 2 2
i
i 1
2
ˆ
ˆ
i 1
i 1
SST
SSR
SSE
Sumas de Cuadrados n
SST
n
( y i y) 2
i 1
n yi i 1 y2 i
i 1
2
n
2 n x i n n n i 1 SSR ( y i y) 2 2 ( x i x ) 2 2 x i2 n i 1 i 1 i 1 ˆ
ˆ
ˆ
1
1
n
SSE
( y i y i ) 2 SST SSR ˆ
i 1
78
Coeficiente de determinación y de no determinación El coeficiente de determinación (r 2) y de no determinación (1-r 2) se calcula de la siguiente manera: r 2
SSR SST
(1 r 2 ) 1
y SSR SST
El coeficiente de determinación (r 2) expresa el porcentaje de la variabilidad total que es explicada por la regresión.
Error estándar de la estimación. El error estándar de la estimación mide la variabilidad, o dispersión, de los valores muestrales y observados alrededor del plano de regresión. Se
SSE n p
SSE n2
CME
Donde p es el número de parámetros a estimar.
Coeficiente de correlación El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X e Y, donde el coeficiente de correlación poblacional se denota por varía dentro del intervalo de -1 y 1. Si 0 entonces indicará que no existe correlación o asociación entre las variables mientras que cuando se acerca a 1 o a -1 indicará que existe una asociación fuerte, y cuando es exactamente 1 ó -1 la asociación es perfecta. El est
es “r” y se calcula mediante la siguiente fórmula:
n n n n x i y i x i y i i 1 i 1 i 1 r n 2 n 2 n 2 n 2 n x i x i .n y i y i i 1 i 1 i1 i 1 79
6.4 Análisis de regresión no lineal Se ha visto que los modelos lineales son útiles en muchas situaciones y aunque la relación entre la variable respuesta y las variables regresoras no sea lineal, en muchos casos, la relación es “linealizable” en el sentido de que transformando (tomar logaritmos, calcular la inversa,...) la variable respuesta y/o algunas variables regresoras la relación es lineal. Sin embargo, existen situaciones en que la relación no es lineal y tampoco es linealizable, por ejemplo, si el modelo de regresión es el siguiente: yi e x x i . i
2 i
En esta sección veremos algunos modelos linealizables. La transformación de datos nos permite linealizar la relación entre dos variables, se realiza cuado se sospecha y luego se verifica que no existe dependencia lineal entre las variables en estudio. Las transformaciones que pueden mejorar el ajuste y la capacidad de predicción del modelo son muy numerosas. Aquí se presenta algunas de las trasformaciones. Forma funcional que relaciona y con x Transformación apropiada
Exponencial : y 0e x
y *
1
Potencia: y 0 x
1
y*
ln y;
ln y x* ln x
Forma de regresión lineal simple
Regresión de y * vs. x Regresión de y * vs. x * Regresión de y vs. x e x2
Polinomial: y 0 1 x 2 x2
Según que el diagrama de dispersión de los datos tienda a algunas de estas funciones es que se deberá escoger el modelo adecuado. Diagramas que describen las funciones de la tabla anterior.
a. Función exponencial
80
b. Función potencia
Procedimiento para la selección del mejor modelo
1. Hallar el coeficiente de determinación R 2 de los modelos lineal, cuadrático, exponencial y potencia. 2. Ordenarlos de mayor a menor según su R 2. 3. Realizar el análisis del modelo que tenga el mayor R 2, verificar si su coeficiente de regresión es significativamente diferente de cero. 4. Si no se demuestra que el coeficiente de regresión modelo que tiene mayor R 2 es significativamente diferente de cero, se debe pasar a evaluar el siguiente modelo con mayor R 2, hasta encontrar un modelo cuyo coeficiente sea significativamente diferente de cero. Ejemplo:
Los siguientes datos representan el porcentaje usable de cierto tipo de neumáticos radiales de alto rendimiento (y) después de haber sido empleados el número de millas (x): Millas conducidas (en miles) x
Porcentaje usable y
1 2 5 10 20 30 40
98,2 91,7 81,3 64,0 36,4 32,6 17,1
a. Estime la mejor ecuación para el conjunto de datos. b. Compruebe la existencia de modelo. Use nivel de significación 0.05. c. Pronostique con 95% de confianza el porcentaje usable de los neumáticos, luego se recorrer 25000 millas.
81
Diagrama de dispersión
120 100 y , e l b a s u %
y = -2.04x + 91.66 R² = 0.9332
80 60 40 20 0 0
10
20
30
40
50
Millas conducidas, x
Diagrama de dispersión
120 100 y , e l b a s u %
y = 99.496e-0.043x R² = 0.9787
80 60 40 20 0 0
10
20
30
40
50
Millas conducidas, x
Resumen
Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones
0.989301 0.9787165 0.9744598 0.1041876 7
82
ANÁLISIS DE VARIANZA Grados de Suma de libertad cuadrados Regresión 1 2.4958 Residuos 5 0.0543 Total 6 2.5501
Intercepción Millas conducidas (en miles) x
Promedio de los cuadrados F 2.4958 229.9241 0.0109
Valor crítico de F 0.0000
Superior Coeficientes Error típico Estadístico t Probabilidad Inferior 95% 95% 4.6001 0.0587 78.3686 0.0000 4.4492 4.7510 -0.0428
0.0028
-15.1632
0.0000
-0.0500
-0.0355
6.5 Regresión Múltiple El objetivo del Análisis de Regresión Lineal Múltiple es relacionar una variable respuesta y con un conjunto de variables predictoras x1, x2,…, xk , utilizando un modelo lineal. Lo que se desea es poder estimar el valor medio de y y/o predecir valores particulares de y a observar en el futuro cuando las variables predictoras toman valores específicos.
6.5.1
Elección de las variables de predicción
Se debe tomar en cuenta los siguientes pasos para la selección de variables de un modelo de regresión lineal múltiple: Identificar la variable dependiente y las variables de predicción o predictoras que se van a incluir en el modelo. Seleccionar una muestra aleatoria, y registrar todas las variables para cada elemento de la muestra. Identificar las relaciones entre las variables de predicción y la dependiente, y entre las propias variables de predicción (matriz de correlaciones).
6.5.2
El modelo de regresión lineal múltiple y 0 1 x1 2 x 2
k xk
donde: y : variable respuesta que se quiere predecir. 0, 1,…, k : coeficientes de regresión. x1, x2,…, xk : variables predictoras independientes. : error aleatorio.
6.5.3
Supuestos del modelo de regresión lineal múltiple
Los errores tienen distribución normal. Los errores tienen media igual a cero y varianza igual a 2.
83
Los errores aleatorios, digamos i, j, asociados a cualquier par de valores de la variable dependiente y, son independientes.
6.5.4
Ecuación de regresión muestral
A partir de los datos de la muestra, se encuentran las estimaciones de los parámetros: y 0 1 x1 2 x 2 ˆ
ˆ
ˆ
ˆ
... k xk ˆ
donde: : valor estimado de la variable dependiente.
y ˆ
0 , 1 , 2 ,..., k : estimaciones puntuales de los parámetros poblacionales. x1, x2,... , xk : son las variables predictoras . ˆ
ˆ
ˆ
ˆ
Estimación de los parámetros el modelo
Para estimar los parámetros del modelo de regresión lineal múltiple también se utiliza el método de mínimos cuadrados. Considere una muestra de n observaciones:
0 1 x11 2 x12 3 x13 ... k x1k 1 y 2 0 1 x21 2 x 22 3 x23 ... k x 2 k 2 y1
y n
0 1 x n1 2 x n 2 3 x n3 ... k xnk n
Esta muestra puede ser expresada en forma matricial de la siguiente manera:
y1 y 2 Y y n Donde
Y
1 x11 x12 ... x1k 1 x x22 ... x2 k 21 X 1 x x ... x n1 n2 nk
0 1 β 2 k
1 2 ε n
Xβ ε .
El estimador de mínimos cuadrados para el vector β es: β ( X ' X) 1 X' Y ˆ
Las propiedades estadísticas del estimador del vector de parámetros β son: E (β) β ˆ
Cov(β) 2 ( X ' X) 1 ˆ
84
6.5.5
Coeficiente de regresión
Los valores 0 , 1 , 2 ,..., k se conocen como coeficientes de regresión estimados. Un coeficiente de regresión estimado específico mide el cambio promedio en la variable dependiente debido a un incremento de una unidad en la variable predictora correspondiente, manteniendo constantes las otras variables de predicción. Los errores estándar y la covarianza de los estimadores 0 , 1 , 2 ,..., k se determinan mediante los elementos de la matriz ( X X) 1 de la siguiente manera: ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
'
X X ´
1
c00 c 10 c20 ck 0
c01
c02
...
c0 k
c11
c12
...
c1k
c 21
c 22
c k 1
c k 2
... c2 k ... c kk
Los errores estándar de los coeficientes estimados 0 , 1 , 2 ,..., k son: ˆ
c00
c11
c 22
ˆ
0
ˆ
1
ˆ
2
ˆ
ˆ
ˆ
ˆ
k
ckk
El estimador de 2 , la varianza de los errores es: S 2
SCE n p
Donde p es el número de parámetros a estimar.
6.5.6
El error estándar de la estimación
El error estándar de la estimación mide la variabilidad, o dispersión, de los valores muestrales y observados alrededor del plano de regresión. Se
6.5.7
SCE n p
CME
Coeficiente de determinación múltiple (r 2)
El coeficiente de determinación múltiple mide el porcentaje de la variabilidad de y que se puede explicar mediante las variables de predicción. Un valor de r 2 cercano a
85
1 significa que la ecuación es muy exacta porque explica una gran porción de la variabilidad de y. Se define como: r 2
SCR SCT
Por cada variable independiente adicional en el modelo, el coeficiente de determinación incrementará su valor. Por tal razón se suele calcular el coeficiente de determinación corregido, útil para comparar el poder predictivo de modelos alternativos con diferente número de variables independientes: 2 r corregido
6.5.8
1
n 1 n p
(1 r 2 )
Pruebas de hipótesis
Una vez que se ha recogido una muestra aleatoria, se han medido las variables, y se ha examinado la matriz de correlaciones para determinar aquellas combinaciones de variables que son de interés, se analizan los modelos con el mejor potencial. El objetivo es encontrar la mejor ecuación para predecir y después decidir si ésta ecuación satisface las necesidades de exactitud del analista.
6.5.8.1
Pruebas individuales
Las hipótesis nula y alternante para las pruebas individuales son:
0 H1 : i 0 H 0 : i
y el estadístico de prueba es: t c
i ˆ
~ t ( n p )
ˆ
I
Donde s cii ˆ
i
6.5.8.2
Prueba conjunta
Las hipótesis nula y alternante para la prueba conjunta son: H 0 : 1
2 ... k 0
H1 : Al menos un i es diferente de cero
y el estadístico de prueba es: F c
CMR CME
~ F ( p 1, n p )
86
6.5.9 Intervalos de confianza para los coeficientes de regresión Los intervalos de confianza para los coeficientes de regresión se construyen a partir de su estimación puntual y el error estándar como se muestra a continuación: LC( j ) j ˆ
t ( n p, / 2) s cii
6.5.10 Multicolinealidad Cuando existe multicolinealidad es difícil distinguir qué cantidad del efecto observado se debe a una variable de predicción individual. En otras palabras, si dos variables están altamente correlacionadas, proporcionan casi la misma información en el pronóstico. Cuando dos variables tienen una alta correlación, los coeficientes 0 , 1 ,..., k , ˆ
ˆ
ˆ
1 ,... k no son confiables. La estimación k de k puede no estimadores de 0 , ser siquiera cercana al valor de su correspondiente parámetro e inclusive podría ser negativo cuando debiera ser positivo. ˆ
Regla práctica para seleccionar las variables predictoras en regresión múltiple.
Una variable predictora debe tener una correlación fuerte con la variable dependiente. Una variable predictora no debe tener una correlación demasiado alta con ninguna otra variable predictora. (La correlación entre dos variables predictoras debe estar muy por debajo de la menor de las dos correlaciones entre las variables predictoras y la variable dependiente).
Cuando se produce la multicolinealidad, si el analista sólo quiere usar el modelo de regresión para hacer pronósticos, la multicolinealidad puede no causar ninguna dificultad seria. Las consecuencias adversas son: Las estimaciones de los coeficientes de regresión fluctúan de manera notoria de una muestra a otra (alta variabilidad). Una variable independiente que tiene una relación positiva con la variable dependiente puede producir un coeficiente de regresión negativo si la correlación con otra variable independiente es alta. Con frecuencia se usa la regresión múltiple como una herramienta interpretativa para evaluar la importancia relativa de las distintas variables independientes. Cuando las variables independientes se intercorrelacionan, explican la misma varianza en el pronóstico de la variable dependiente. Por esto, es difícil separar la influencia individual de cada variable independiente cuando la multicolinealidad está presente.
87
6.5.11SELECCIÓN DE VARIABLES EN REGRESIÓN La Selección de variables o también llamada selección de un subconjunto de predictoras es un procedimiento estadístico que es importante por diversas razones, entre estas están: a) No todas las variables predictoras tienen igual importancia, por lo tanto es más eficiente trabajar con un modelo donde las variables importantes estén presentes y las que tienen poca importancia no aparezcan. b) Algunas variables pueden perjudicar la confiabilidad del modelo, especialmente si están correlacionadas con otras, luego se hace necesario eliminarlas. c) Computacionalmente es más fácil trabajar con un conjunto de variables predictoras pequeño. d) Es más económico recolectar información para un modelo con pocas variables. e) Si se reduce el número de variables entonces el modelo se hace más parsimonioso. Se dice que un modelo es parsimonioso si consigue ajustar bien los datos pero usando la menor cantidad de variables predictoras posibles. Es más conveniente porque sus predicciones son más confiables y además es más robusto que el modelo original. Desde que empezó a trabajarse en esta área en los años 60 y gracias al desarrollo de las computadoras se han introducido muchos métodos de selección de variables. Aquí describiremos sólo algunos de ellos. A) Métodos “Stepwise”
La idea de este método (Efromyson, 1962) es elegir el mejor modelo pero incluyendo (o excluyendo) una sola variable predictora en cada paso de acuerdo a ciertos criterios. El proceso secuencial termina cuando una regla de parada se satisface. Hay tres algoritmos posibles: “Backward Elimination” (Eliminación hacia atrás)
En este caso se comienza con el modelo completo y en cada paso se va eliminando una variable. Si resultara que todas las variables predictoras son no significativas entonces no se hace nada. En caso contrario en cada paso la variable que se elimina del modelo es aquella que satisface cualquiera de estos requisitos equivalentes: a. Aquella variable que tiene el estadístico de F o de T (sin tomar en cuenta el signo) más pequeño entre las variables incluidas aún en el modelo. b. Aquella variable que produce la menor disminución en el R2 al ser eliminada del modelo. c. Aquella variable que tiene la correlación parcial más pequeña (en valor absoluto) con la variable de respuesta, tomando en cuenta las variables que quedarían en el modelo . Toda variable que es eliminada ya no vuelve a entrar. El proceso termina cuando se cumple una de las siguientes condiciones: 88
a. Se llega a un modelo con un número prefijado p* de variables predictoras. b. El valor de la prueba de F para todas las variables incluidas en el modelo son mayores que un número prefijado F-out (por lo general este valor es 4, o es el que corresponde a un nivel de significación dado, digamos del 10%). O en forma equivalente, se para cuando el valor absoluto del estadístico de T para cada variable es mayor que la raíz cuadrada de F-out (por lo general, |t|>2). “Forward Selection” (Selección hacia adelante)
Aquí se empieza con la regresión lineal simple que considera como variable predictora a aquella que está más altamente correlacionada (sin tomar en cuenta el signo) con la variable de respuesta. Si esta primera variable no es significativa entonces se para el proceso y se considera el modelo , de lo contrario en el siguiente paso se añade al modelo la variable que reúne cualquiera de estos requisitos equivalentes: a) Aquella variable que tiene el estadístico de F o de T (sin tomar en cuenta el signo) más grande entre las variables no incluidas aún en el modelo. b) Aquella variable que produce el mayor incremento en el R2 al ser añadida al modelo. c) Aquella variable que tiene la correlación parcial más alta (en valor absoluto) con la variable de respuesta, tomando en cuenta las variables ya incluidas en el modelo. Toda variable que es añadida al modelo ya no puede salir. El proceso termina cuando se cumple una de las siguientes condiciones: a) Se llega a un modelo con un número prefijado p* de variables predictoras. b) El valor de la prueba de F para cada una de las variables no incluidas aun en el modelo es menor que un número prefijado F-in (por lo general este valor es 4, o el F correspondiente a un nivel de significación prefijado, digamos 15%). O en forma equivalente se para cuando el valor absoluto del estadístico de t es menor que la raíz cuadrada de F-in (por lo general, |t|<2). “Stepwise Selección” (Selección Paso a Paso)
Se puede considerar como una mod ificación del método “Forward”. Es decir empezamos con un modelo de regresión simple y en cada paso se puede añadir una variable en forma similar al método forward, pero se coteja si alguna de las variables que ya están presentes en el modelo puede ser eliminada. Aqui se usan F-out y F-in con F-in ≤ F-out. El proceso termina cuando ninguna de las variables que no han entrado aún tiene importancia suficiente como para entrar al modelo.
89