UNIVERSIDAD DE LAMBAYEQUE s
ESCUELA DE ING. AMBIENTAL/ING. DE SISTEMAS
SEPARATA DE ESTADÍSTICA INFERENCIAL INFERENCIAL MUESTREO E INFERENCIA ESTADÍSTICA
AUTOR: MSc. CARLOS DANIEL GONZALES HIDALGO
1
1. MUESTREO Y DISTRIBUCIONES MUESTRALES Al iniciar el estudio de la Estadística, encontramos que tiene como objetivo dar a conocer un conjunto de métodos para recolectar y clasificar información, que luego debe ser analizada e interpretada adecuadamente, de modo que sea útil en la toma de decisiones. Esto nos permitió encontrar dos ramas bien diferenciadas de la Estadística llamadas: llamadas: Estadística Descriptiva y Estadística Inferencial. Inferencial.
La primera ya fue estudiada ampliamente en la ESTADISTICA GENERAL, la segunda es el propósito fundamental de nuestro nuestro estudio.
La ESTADISTICA INFERENCIAL O INFERENCIA ESTADÍSTICA, ESTADÍSTICA, es el aspecto más importante en la toma de decisiones, tanto en las ciencias naturales como en las ciencias sociales. La inferencia Estadística se refiere a la ESTIMACION y a la PRUEBA DE HIPOTESIS, siendo la estimación el proceso de utilizar ESTADISTICOS ESTADISTICOS (como (como la media de la muestra y desviación desviación estándar de la muestra) que se obtienen de los l os datos muestrales y sirven para p ara estimar su verdadero valor o PARAMETRO de la población. Como en las l as dos unidades anteriores examinamos las reglas básicas de probabilidad de un evento y las distribuciones de probabilidad como la binomial, de Poisson y la normal, en esta unidad utilizaremos estos conocimientos de probabilidad de modo que puedan utilizar ciertos estadísticos para hacer inferencias en cuanto a los parámetros de la población. En consecuencia, por provenir los estadísticos de la MUESTRA, es ésta el vehículo para llegar a conclusiones acerca de la población. Así tenemos que si queremos utilizar la media de la muestra para estimar la media de la población debemos determinar todas las muestras posibles y la media de cada una de ellas. A la distribución de probabilidad de estas medias se le denomina DISTRIBUCION DISTRIBUCION MUESTRAL DE LA MEDIA.
Por último, recordaremos que una población está representada por el conjunto de todos los valores (observaciones) posibles que puede tomar una variable, por lo cual diremos indistintamente que la distribución de la población es la distribución de la variable.
1.1. MUESTREO
Los datos necesarios para tomar decisiones se reúnen ya sea estudiando todas las posibles observaciones de la población (CENSO), ya seleccionado unas pocas de la observaciones para realizar el estudio (MUESTRA). El propósito fundamental de muestreo es ESTIMAR EL PARAMETRO de la población basado en el ESTUDIO ESTUDIO MUESTRAL MUESTRAL
Existen muchas razones para realizar muestreo en una población, entre las que mencionaremos:
1) El costo elevado al exarninar a toda la población. 2) La imposibilidad de estudiar toda la población, como por ejemplo, los peces de un lago.
2
3) Las limitaciones de tiempo. como las que recaen sobre los encuestadores políticos antes de una elección. 4) La índole destructiva de Ciertas investigaciones, como por ejemplo, al estudiar el tiempo de vida de focos de luz de cierta marca.
Todas las anteriores razones nos indican que el uso de muestras ofrece las siguientes si guientes ventajas:
1. Ahorra dinero, tiempo y trabajo.
2. Permite una mayor exactitud en el estudio, pues los errores debidos al observador, al objeto observado y al método de observación, pueden disminuir y controlarse más efectivamente.
La única desventaja del uso de muestras es el llamado ERROR DE MUESTREO, dado por la diferencia entre el valor que describe a la muestra y el verdadero valor de la población. Este error se debe a que las muestras seleccionadas de una población difieren unas de otras y como nosotros estudiamos una muestra para generalizar luego a toda la población. Entonces los resultados son algo diferentes. Como el error por muestreo puede medirse, en consecuencia puede disminuirse a voluntad, con solo aumentar el tamaño de la muestra. Una muestra es considerada como una BUENA muestra, si cumple con las siguientes condiciones:
a) BUENA EN CANTIDAD , si incluye un número óptimo de individuos, así por ejemplo, si una enfermedad se presenta tan solo en 1 % de la población, habrá la necesidad de estudiar por lo menos 100 casos, para tener la posibilidad de hallar una persona enferma, pero si la presencia es el 50%, basta estudiar dos personas
b) BUENA EN CALIDAD , si refleja fielmente las características de la población de la cual procede y difiere de ella, solo en el número de unidades incluidas.
1.2 ETAPAS DEL MUESTREO
Los pasos principales para la recolección de la información de una muestra son:
1) Definir explícitamente la unidad de análisis.
2) Definir en forma clara la población que va ser muestreada
3
3) Seleccionar bien las variables que deben ser observadas en cada unidad que se va analizar. 4) Especificar el grado de precisión deseada. 5) Seleccionar la unidad muestral. En algunos casos es obvia, como en el caso de una población de estudiantes de un centro educativo, en donde la unidad es un estudiante. En otras ocasiones debe escogerse la unidad muestral, como en el caso de muestreo de residentes de una ciudad, donde la unidad es una persona, una familia o las familias de una cuadra.
6) Seleccionar la muestra, después de haber decidido el tamaño respectivo.
1.3. TIPOS DE MUESTRAS. Como se muestra a continuación, existen dos tipos básicos de muestras: las muestras probabilísticas y las no probabilísticas. Estas últimas, son mucho más sencillas y baratas de obtener, entre estas tenemos las llamadas MUESTRAS DE JUICIO. MUESTRAS DE CUOTA y LAS MUESTRAS DE CONVENIENCIA
1.3.1. MUESTRAS NO PROBABILÍSTICAS
a) MUESTRAS POR JUCIO.
Como su nombre lo indica, es la muestra tomada de acuerdo con el juicio personal, los elementos que intervienen en una muestra por juicio son resultados del juicio experto del investigador sobre su "representatividad". En consecuencia, la probabilidad de que cada unidad elemental sea seleccionada de la muestra, es desconocida y la fidelidad de sus resultados no puede utilizarse para hacer inferencias de la población total, lo cual es el objetivo del muestreo. Así por ejemplo, un gerente de ventas que selecciona ciertas localidades del Perú como típicas para probar nuevo tipo de campaña de ventas en ellas y extrae conclusiones de todo el país a partir de los resultados de las comunidades muestreadas. Las localidades seleccionadas constituyen una muestra del Perú en base a un juicio, pues el gerente CREE que ciertas localidades proporcionan un cuadro representativo del país completo. En consecuencia, la muestra solo puede evaluarse en términos de la solidez del criterio del gerente de ventas y no sobre la base de la muestra en si misma.
b) MUESTRA A CUOTA.
Una muestra a cuota es una muestra basada en un juicio dado. En una muestra a cuota, se instruye al entrevistador para que interrogue a cierto número de personas. Así por ejemplo, puede indicársele que entreviste a 30 hombres que vivan a cierto números de cuadros que caen dentro de un cierto rango de edades o cuyos ingreso caen dentro de un intervalo dado.
4
En la práctica es el entrevistador el que hace la selección real de las personas, resultando errores sistemáticos serios en los resultados.
Por ejemplo, un entrevistador tiende a seleccionar a las personas más fácilmente accesibles; así, si las entrevistas son en el día, pasará por alto a las personas que están trabajando; si una persona se rehúsa a responder, el entrevistador simplemente seleccionará a otra persona.
El elemento común en cada uno de esto casos de muestras basadas en un juicio dado, es el papel considerable que juega el juicio. Si bien las muestras basadas en un juicio dado pueden proporcionamos resultados útiles y de hecho a menudo lo hacen, no es posible estimar el error del muestreo en dicha muestras. Por consiguiente, la precisión del resultado de una muestra basada en un juicio, depende de la solidez del juicio y no puede evaluarse de la muestra misma.
c) MUESTRA DE CONVENIENCIA O TROZO . Un trozo es una muestra que se conforma por un proceso de auto selección, es decir, un trozo es una simple "Muestra de conveniencia" un conjunto de sujetos fácilmente agrupados, como los miembros de una clase en particular, personas que responden a un anuncio. Personas que visitan una exhibición en un centro comercial, etc. También en este caso, la desventaja principal, es que no hay forma probabilística' de interpretar cuan representativa es la muestra, de la población total. Así por ejemplo. al ensayar una nueva droga, en lugar de escoger individuos al azar, pueden suministrarse a los casos graves, pues se presume que si la droga es efectiva en tales casos, con mayor razón lo será en los casos leves de la enfermedad.
1.3.2. MUESTRAS PROBABILÍSTICAS
Las muestras probabilísticas son aquellas en que cada individuo de las población tiene una probabilidad conocida (no necesariamente igual) de ser incluida en la muestra. La elección de una muestra probabilística requiere dos condiciones fundamentales:
i) Es esencial que la probabilidad de elegir cada individuo sea perfectamente conocida, pues si no lo es, no será posible calcular los errores que pueden cometerse al hacer su selección.
ii) Es indispensable que los individuos se elijan al azar, sin permitir la intervención de ningún factor que favorezca la elección de unos en perjuicio de los Otros. Puesto que el estudio sobre tipos de muestras probabilísticas es muy extenso, solo mencionaremos algunas de las más utilizadas, tales como la muestra aleatoria simple. la muestra sistemática, la muestra estratificada y la muestra agrupada.
5
a) MUESTREO ALEATORIO SIMPLE.
Al haber definido las poblaciones y las muestras, distingamos más detalladamente entre las poblaciones que son finitas y las que son infinitas. Se dice que una población es FINITA si consta de un número finito (fijo) de elementos,. por ejemplo, la población de escuelas de la provincia de LIMA. En contraste con las poblaciones finitas, se dicen que una población es INFINITA si no hay límite en el número de elementos que contiene. Diremos que una muestra de una población finita es aleatoria si cada elemento de la población tiene igual probabilidad de ser incluido en la muestra. Existen dos métodos de seleccionar muestras aleatorias en poblaciones finitas:
1. MÉTODO DEL SORTEO Consiste en colocar en un recipiente fichas con los nombres de todos los integrantes de la población en estudio, luego remover bien las fichas y extraer1as una a una con sustitución, hasta tener las integrantes que deben ir en las muestras.
2. METODO DE LOS NUMEROS ALEATORIOS.
Consiste en obtener los elementos de la muestra utilizando tablas especialmente elaboradas, llamadas TABLAS DE NUMEROS ALEATORIOS
Para ilustrar el uso de una tabla de números aleatorios, utilizamos el problema de seleccionar una muestra aleatoria simple, consistente de 15 boletas de notas elegidas de una población de 8 900 boletas.
En la tabla de números aleatorios adjunta, cada dígito o sucesión de ellos es aleatorio. por lo que se puede utilizar la tabla y leerla en sentido horizontal o ve/1ical, los márgenes de la tabla designa los números de fila (margen vertical) y los números de columna (margen horizontal). los dígitos están agrupados en sucesiones de cinco con el solo fin de facilitar la observación de la tabla.
Si se usa esta tabla en lugar de un recipiente para seleccionar la muestra, primero es necesario asignar números a los miembros individuales de la población, como la población es de N = 8900 boletas de notas, por ser un número de cuatro dígitos, cada número asignado también de ser de cuatro dígitos, a fin de que cada boleta tenga igual oportunidad de ser seleccionada. Por tanto, asignamos el. Número 0001 a la primera boleta, el número 0002 a la segunda boleta, y así sucesivamente hasta llegar al número 8900, para la 8900 ava boleta. Una vez que todas las boletas han sido numeradas, comenzamos a seleccionar la muestra leyendo las primeras cuatro cifras de la primera línea de la tabla de números aleatorios; digamos el número 6619. Luego pasamos a la segunda línea y leemos el número 7284 y así hasta el15 número.
6
b) MUESTREO SISTEMATICO.
En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo uniforme que es medido en tiempo orden o espacio. El intervalo en mención se determina por la fórmula:
I= N / n
El primer elemento de la muestra es elegido al azar entre los I primeros elementos de la población y luego, el resto de los elementos se elegirán cada lavo elemento de la lista. Así por ejemplo si N = 10000 Y n = 1000, entonces 1 = 10, esto quiere decir que de cada 10 se elige uno.
Para obtener una muestra sistemática es necesario tener la lista de los elementos en estudio (alumnos de una universidad. por ejemplo), luego se les numera del 1 al 10000. En seguida se escoge al azar un número entre 1 y 10, siendo este el primer elemento que se va ha estudiar y completaremos la muestra cada diez elementos. Si el número escogido fue 8, los otros serán 18, 28, 38, etc.
Este procedimiento de muestreo por la sencillez de su aplicación suele utilizarse en todos aquellos casos en los cuales existen listados con los nombres de cada uno de los elementos de la población que se estudia.
La ventaja del muestreo sistemático es que requiere' menos tiempo y es menos costoso que el método de muestreo aleatorio simple.
c) MUESTREO ESTRATIFICADO.
Para utilizar el muestreo estratificado, se divide la población en grupos relativamente homogéneos. Llamados estratos. Entonces, se toma una muestra aleatoria simple de cada estrato, tomando ésta el nombre de muestra estratificada.
Una muestra estratificada puede ser proporcional o desproporcionada. En la primera, el número de unidades extraídas de cada estrato es proporcional al tamaño de este. Así por ejemplo, si la población es dividida en cuatro estratos. Siendo sus tamaños respectivos 10%, 20%. 30% Y 40% de la población y deseamos extraer una muestra de 500 unidades, entonces la muestra estratificada proporcional se obtiene de la siguiente manera:
7
ESTRATO
Nº DE UNIDADES
1
500 (10%) = 50
2
500 (20%) = 100
3
500 (30%) = 150
4
500 (40%) = 200
TOTAL
500
Como se verá en el ejemplo. la estratificación proporcional arroja una muestra en la que cada estrato aporta una cantidad de unidades proporcional al número de unidades de la muestra. Este procedimiento es aún más eficiente cuando las desviaciones estándares de cada estrato no difieren substancial mente entre si. Por tanto, para que la muestra estratificada sea más eficiente se debe dar mayor representación a un estrato con una gran dispersión y menor representación a los estratos con menor dispersión (pequeña desviación estándar). Una muestra estratificada desproporcionada incluye los procedimientos de tomar un número igual de unidades de cada estrato sin tener en cuenta su tamaño, o de dar sólo una pequeña representación a uno o más estratos son demasiado costosos de investigar, pues aún cierta representación es valiosa.
La ventaja de las muestras estratificadas es que cuando ellas están adecuadamente diseñadas reflejan con mayor precisión que otras muestras, las características de la población a partir de las cuales ellas fueron escogidas.
Por ejemplo, todos sabemos que el nivel de ingresos tiene una relación importante con la opinión pública en cuanto a una elección. Si el 60% de los votantes tienen ingresos bajos, el 30% ingresos medianos y el1 0% ingresos altos, entonces para una muestra estratificada proporcional de 500 votantes, seleccionaríamos 300 votantes de ingresos bajos (60% de 500) 150 de ingresos medianos (30% de 500) y 50 de ingresos altos (10% de 500)
d) MUESTREO AGRUPADO O POR CONGLOMERADOS
En esta clase de muestreo, se divide a la población en grupos o conglomerados, y luego se selecciona una muestra aleatoria de estos. Cuando los grupos son seleccionados, se pueden incluir en la muestra todas sus unidades elementales o tomar una muestra de las unidades elementales de los grupos escogidos. En el primer caso se tiene lo que se conoce como muestreo en una sola etapa y cuando se procede como en el último caso, tenemos lo que se conoce como muestreo en dos etapas o submuestreo, escogiéndose en ambas etapas muestras aleatorias simples. Cuando el muestreo por agrupación supone más de dos etapas para escoger la muestra final, se le denomina muestreo multietápico.
Tanto en el muestreo estratificado como en el muestreo agrupado, la población se divide en grupos bien definidos. Se usa el muestreo estratificado cuando cada grupo tiene pequeñas variaciones entre sus
8
unidades elementales, pero hay una gran variación entre grupos. En tanto que el muestreo agrupado se usa cuando hay una variación considerable entre las unidades elementales de cada grupo, pero los grupos son esencialmente similares entre sI.
Así por ejemplo, supongamos que deseamos estudiar los gastos de las familias en el área del Cercado de Lima y que hemos decidido entrevistar a 1000 familias. Un modo económico de manejar esto puede ser dividiendo el área total del Cercado en áreas más pequeñas. Digamos, cuadras, y después entrevistar a todas las familias en un número de cuadras seleccionadas al azar.
1.2. DISTRIBUCIONES MUESTRALES
En la tercera unidad se vio que hay ciertos rasgos invariables dentro de una población que describen una de sus características, tales como la media y la desviación estándar , estas reciben el nombre de PARAMETROS de la población. Al extraerse una muestra, es posible tener un estimado de los parámetros, a partir de las observaciones de la muestra; estos estimados por estar en función de tales observaciones varían de muestra a muestra y reciben genéricamente el nombre de Estadísticos de la muestra. En consecuencia los estadísticos son variables y por tanto tienen su correspondiente distribución de probabilidad, la cual toma el nombre de DISTRIBUCION MUESTRAL DEL ESTADISTICO. En la práctica las distribuciones muestrales usuales son: la de una media, la de la diferencia de dos medias y la de una proporción.
1.2.1. DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Si tomamos repetidamente muestras aleatorias de una población con distribución de probabilidad cuyos parámetros son
y , entonces la variable aleatoria media X tiene la
misma distribución de probabilidad con parámetros
X
=
Y
Si la Población es infinita muestreo con o sin reposición X
=
Si la Población es finita y el muestreo es sin reposición
9
n
X
N n
n
=
N 1
Luego, la variable X bajo la transformación:
Z=
X -
/
n
Se distribuyen como sigue:
CASO 1. Aproximadamente como la normal estándar, si la población es normal o no con o no y el tamaño "n" de la muestra es igual o mayor de 30.
CASO 2. Exactamente como la normal estándar, si la población es normal con "n" de la muestra menor que 30.
conocida
conocida y el tamaño
Nota: Si no se conoce la desviación estándar poblacional estimarla mediante la desviación estándar de la muestra “S”
EJEMPLO 4.1 La media de los puntajes de los cocientes de inteligencia (CI) de los alumnos de una universidad es 110 Y la desviación estándar es 10. Si los puntajes de los CI están distribuidos normalmente:
a) ¿Cuál es la probabilidad de que el puntaje medio de una muestra de 36 alumnos sea mayor que 112? b) ¿Cuál es la probabilidad de que el puntaje medio de una muestra de 100 alumnos sea mayor que 112?
SOLUCION.
a) Por tener los puntajes de los C.I. variables que siguen una distribución normal, las medias de las muestras también se distribuyen normalmente con media y desviación estándar respectiva:
10
X
=
= 110
y
X
n
=
= 10
36
La puntuación de que el puntaje medio de una muestra de 36 alumnos sea mayor que 112 es:
P( X > 112) = P( X
-
/
n
>112-110 / (5/3))= P(Z > 1.2)
= 1- P(Z <= 1.2)= 0.1151
b) Para una muestra de 100 alumnos se tiene que:
X
=
= 110
y
X
n
=
= 10
100
Luego como en a:
P( X > 112) = P( X
-
/
n
>112-110 / 1)= P(Z > 2)
11
= 1- P(Z <= 2)= 0.0228
LABORATORIO Nº 03
1. En una muestra de 16 observaciones de una distribución normal con una media de 150 y una variancia de 256, encuentre: a) P ( X < 160)
b) P ( X > 142)
Si, en lugar de 16 observaciones, se hicieran 9 observaciones, encuentre: c) P ( X < 160)
d) P ( X > 142)
2. En una muestra de 25 observaciones de una distribución normal con una media de 98.6 y una desviación estándar de 17.2, encuentre: a) P (92 <
X
< 102)
b) La probabilidad correspondiente si tenemos una muestra de 36.
3. En una distribución normal con una media de 56 y una desviación estándar de 21, ¿de qué tamaño debe ser una muestra de modo que haya por lo menos 90% de probabilidades de que su media sea mayor que 52%
4. En una distribución normal con una media de 375 y una desviación están dar de 48, ¿de qué tamaño debe ser una muestra para que haya por lo menos .95 probabilidades de que la muestra se encuentre entre 370 y 380? Un astrónomo del observatorio de Mount Palomar observa que, durante una lluvia de meteoros, un promedio de 40 meteoros aparecen cada hora, con una variancia de 16 meteoros al cuadrado. La lluvia de meteoros ocurrirá la próxima semana. a) Si el astrónomo ve la lluvia de meteoros durante 4 horas, ¿cuál es la probabilidad de que aparezca un mínimo de 36 meteoros por hora? b) Si el astrónomo mira durante una hora más, ¿aumentará o disminuirá esta probabilidad? Explique su respuesta.
5. El costo promedio de un condominio con estudio en un desarrollo urbano es de $62,000 con una desviación estándar de $4,200. a) ¿Cuál es la probabilidad de que un condominio de este desarrollo cueste por lo menos $65,000? b) ¿Es la probabilidad de que el costo promedio de una muestra de dos condominios sea al menos $65,000 mayor o menor que la probabilidad de que un condominio cueste esa cantidad? ¿En qué cantidad?
12
6. Una agencia de empleos normalmente aplica pruebas de inteligencia y aptitudes a todos los que buscan trabajo a través de ella. La empresa ha reunido datos durante años, habiendo descubierto que la distribución de las puntuaciones no es normal, sino que está sesgada a la izquierda con una media de 86 y una desviación estándar de 16. ¿Cuál es la probabilidad de que, en una muestra de 75 candidatos, la puntuación promedio sea por lo menos 84 o mayor que 90? Una refinería de petróleo tiene monitores de reserva para llevar un control constante del flujo y prevenir que las fallas de la máquina desorganicen el proceso. Un monitor tiene un promedio de vida de 4,300 horas, con una desviación estándar de 730 horas. Además del monitor primario, la refinería ha instalado dos unidades de emergencia, que son un duplicado de la unidad primaria En caso de avería de uno de los monitores, el otro se activa en forma automática. La vida de operación de los dos es independiente de los otros. a) ¿Cuál es la probabilidad de que determinado conjunto de monitores dure por lo menos 13,000 horas? b) ¿Y un máximo de 12,630 horas?
7. María Barrios es auditora de una gran compañía de tarjetas de crédito y sabe que, en promedio, el saldo mensual de determinado cliente es de $112, con una desviación están dar de $65. Si María revisa 50 cuentas seleccionadas al azar, ¿cuál es la probabilidad de que el saldo mensual promedio esté: a) Por debajo de $1oo? b) Entre $100 y $130?
8. El presidente de una empresa telefónica está molesto con el número de teléfonos producidos por la empresa que tienen aparatos defectuosos. En promedio, 120 teléfonos son devueltos diariamente a causa de ese problema, con una desviación estándar de 81. El presidente ha decidido que, a menos que logre una seguridad promedio de 85% de que al día no serán devueltos más de 135 teléfonos en los próximos 40 días, ordenará revisar el producto. ¿Tomará esta medida?
9. Clara Díaz, cuyo trabajo consiste en predecir el futuro de su compañía de riesgo compartido, acaba de recibir las estadísticas que describen el desempeño de la empresa en 1,800 inversiones realizadas el último año. Clara sabe que, en promedio, las inversiones generan utilidades que tienen una distribución normal con una media de $7,500 y una desviación estándar de $3,300. Aun antes de examinar los resultados concretos de cada una de esas inversiones del último año, Clara pudo hacer algunas predicciones exactas usando su conocimiento de las distribuciones muestrales. Continúe el análisis de ella y calcule la probabilidad de que la media muestral de las inversiones del año anterior: a) Superen los $7,700. b) Sean menores que $7,400. c) Sean mayores que $7,275, pero no lleguen a $7,650.
10. Un agricultor, que vende trigo a Alemania Occidental, posee 60 acres de campos de trigo. Basándose en su experiencia, sabe que el rendimiento de cada acre tiene una distribución normal con una media de
13
120 bushels y una desviación estándar de 12 bushels. Ayúdele a planear la cosecha del próximo año, calculando: a) La media esperada de los rendimientos de 60 acres de campo, destinados al cultivo de trigo. b) La desviación estándar de la media muestral de los rendimientos de los 60 acres. c) La probabilidad de que el rendimiento medio por acre rebase los 123.8 bushels. d) La probabilidad de que el rendimiento medio por acre oscile entre 117 y 122 bushels.
11. Un transbordador transporta 25 pasajeros. El peso de cada pasajero tiene una distribuci6n normal con una media de 165 libras y una variancia de 441 libras al cuadrado. Las normas de seguridad establecen que, para este transbordador en particular, el peso total de sus pasajeros no de. be exceder de 4,375 libras más de 1 % de las veces. Supongamos que usted fuera el dueño del transbordador y tuviera que calcular:
a) La probabilidad de que el peso total de los pasajeros del transbordador exceda de 4,375 libras
b) El nonagésimo noveno percentil de la distribución del peso total de los pasajeros del transbordador. ¿Está cumpliendo el transbordador con las normas de seguridad?
12. Se espera que e! diámetro de las pelotas de pin-pon fabricadas en una planta grande tenga una distribución normal aproximada con media de 1.30 pulgadas y desviación están dar de 0.04 de pulgada. ¿Cuál es la probabilidad de que una pelota seleccionada al azar tenga un diámetro .. (a) Entre 1.28 y 1.30 pulgadas? (b) Entre 1.31 y 1.33 pulgadas? (e) ¿Entre qué dos valores (simétricos respecto a la media) estará el 60% de las pelotas de pin-pon (en términos del diámetro)? (d) Si se seleccionan muchas muestras de 16 pelotas,
(1) ¿cuáles son la media y la desviación estándar esperadas? (2) ¿qué distribución seguirán la medias muestrales'? (3) ¿qué proporción de las medias muestrales estará entre 1.28 y 1.30 pulgadas? (4) ¿qué proporción de las medias muestra les estará entre 1.31 y 1.33 pulgadas? (5) ¿entre qué dos valores estará el 60% de las medias muestrales?
(e) Compare las respuestas de la (a) y {d)(3) con las de (b) y (d)(4). Analice (f) Explique la diferencia en los resultados de (c) y (d)(5).
14
(g) ¿Qué es más probable que ocurra, una pelota individual arriba de 1.34 pulgadas, una media muestral arriba de 1.32 pulgadas en una media de tamaño 4, o una media muestral arriba de 1.31 pulgadas en una muestra de tamaño 16? Explique.
13. El tiempo que se usa el correo electrónico por sesión tiene una distribución normal con = 8 minutos y
(a) calcule
= 2 minutos. Si se seleccionan muestras aleatorias de 25 sesiones,
X
.
(b) ¿qué proporción de las medias muestrales estará entre 7.8 y 8.2 minutos? (c) ¿qué proporción de las medias muestrales estará entre 7.5 y 8 minutos? (d) Si se seleccionan muestras de 100 sesiones, ¿qué proporción; de las medias muestrales estará entre 7.8 y 8.2 minutos? (e) Explique la diferencia entre los resultado de (b) y (d).
.
(f) ¿Qué es 'más probable que ocurra, una sesión de correo electrónico de más de 11 minutos, una media muestral mayor que 9 minutos en una muestra de 25 sesiones, o una media mueso-al mayor que 8.6 minutos en una muestra de 100 sesiones? Explique.
14. El tiempo que un cajero tarda con cada cliente tiene una media poblacional = 3.10 minutos y una desviación estándar = 0.40 minutos. Si se selecciona una muestra aleatoria de 16 clientes.
(a) ¿cuál es la probabilidad de que el tiempo promedio que pasa con cada cliente sea de al menos 3 minutos? (b) existe una posibilidad de 85% de que la media muestra] sea menor que ¿cuántos minutos? (c) ¿Qué suposición de¡"; hacerse para resolver los incisos (a) y (b)? (d) Si se obtiene una muestra aleatoria de 64 clientes, existe una probabilidad dc 85% de que la media muestral sea menos de ¿cuántos minutos" (e) ¿Qué suposición debe hacerse para resolver el inciso (d)?
f) ¿Qué es más probable que ocurra, un servicio individual de menos de 2 minutos, una media muestral mayor que 3.4 minutos en una muestra de 16 clientes, o una media muestral menor que 2.9 minutos en una muestra de 64 clientes? Explique.
15. La compañía de transportes Toby determinó que, con base anual, la distancia recorrida por camión tiene una distribución normal con media de 50.0 miles de millas y desviación estándar de 12.0 miles de millas. Si se selecciona una muestra aleatoria de 16 camiones,
15
(a) ¿cuál es la probabilidad de que la distancia promedio recorrida sea menor que 45.0 miles de millas en el año?, (b) ¿Cuál es la probabilidad de que la distancia promedio recorrida esté entre 44.0 y 48.0 miles de millas en el año? (c) ¿Qué suposición debe hacerse para resolver los incisos (a) y (b) (d) Si se selecciona una muestra aleatoria de 64 camiones, existe una posibilidad de 95% de que la media muestral sea menor que ¿cuántas millas? (e) ¿Qué suposición debe hacerse para resolver el inciso (d)? (f) ¿Cuáles serían las respuestas de los incisos (a) a (d) si la desviación estándar fuera 10.0 miles de millas?
16. Se fabrican bolsa de plástico para empacar verduras de manera que la resistencia a roturas tenga una distribución normal con media de 5 libras por pulgada cuadrada y desviación estándar de 1.5 libras por pulgada cuadrada. Si se selecciona una muestra de 25 bolsas, (a) ¿cuál es la probabilidad de que la resistencia promedio (1) esté entre 5 y 5.5 libras por pulgada cuadrada' (2) Esté entre 4.2 y 4.5 libras por pulgada cuadrada? (3) sea menor que 4.6 libras por pulgada cuadrada' (b) ¿Entre qué dos valores simétricos respecto a la media estará el 95% de las resistencias promedio' (c) ¿Cuáles serían las respuestas a los incisos (a) y (b) si la desviación estándar fuera 1.0 libra por pulgada cuadrada'
Luego, la variable
X bajo
la transformación:
16
2. ESTIMACIÓN ESTADÍSTICA La inferencia estadística es el proceso que consiste en utilizar los resultados de una muestra para llegar a conclusiones acerca de las características de una población.
Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de intervalo. Una estimación puntual consiste en una sola estadística de muestra que se utiliza para estimar el valor verdadero de un parámetro de población. Puesto que la estadística de prueba varía de una muestra a otra necesitamos considerar este hecho con el fin de proporcionar una estimación más significativa y característica de la población. Para lograr esto, debemos desarrollar una estimación de intervalo de la media de población verdadera, tomando en consideración la distribución de muestreo de la media. El intervalo que construimos tendrá una confianza o probabilidad específica de estimar correctamente el valor verdadero del parámetro de población.
2.1. ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA MEDIA POBLACIONAL Estimación de intervalo de confianza de la media (desvío de la población conocido): En la inferencia estadística debemos tomar los resultados de una sola muestra y llegar a conclusiones acerca de la población. En la práctica, la media de la población es la cantidad desconocida que se va a determinar. Para algunas muestras la estimación de intervalo de la media de la población será correcta y para otras no. Tenemos que recordar que para el cálculo del intervalo trabajamos con una estimación de intervalo de confianza de 95, por ejemplo, esto puede interpretarse como si se tomaran todas las muestras posibles del mismo tamaño, n, 95% de ellas incluirían la media de población verdadera en alguna parte del intervalo alrededor de sus medias de muestra, y solamente 5% de ellas no estarían incluidas. En general el nivel de confianza se simboliza como (1- α ) * 100%, en donde α es la porci ón que se encuentra en los extremos de la distribución que está fuera del intervalo de confianza. Por consiguiente para obtener la estimación del intervalo tenemos:
Z es el valor correspondiente a un área de (1- α )/2 desde el centro de una distribución normal estandarizada. El valor Z elegido para construir tal intervalo de confianza se conoce como el valor crítico. Cualquier aumento en el nivel de confianza se logra ampliando simultáneamente el intervalo de confianza obtenido (haciéndolo menos preciso y menos útil). Estimación de intervalo de confianza de la media (desvío desconocido) Del mismo modo en que la media de la población se desconoce, es probable que la desviación estándar real de la población tampoco sea conocida. Por lo tanto, necesitamos obtener una estimación de intervalo de confianza utilizando las estadísticas de muestra " X " y "S". Para ello, utilizamos la distribución t-student. De este modo, el intervalo de confianza se establecerá a partir de la siguiente fórmula: Estimado del intervalo de confianza de la porción
17
2.2. ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA DIFERENCIA DE DOS MEDIAS POBLACIONALES 2
(
-
X
)
Y
Z 1- / 2
( 1
2
2 )
n1
n2
Es el intervalo de confianza de 100(1- ) % de la diferencia de medias para: 1) 2) 3)
Muestras grandes, varianzas conocidas y poblaciones normales o no. Muestras grandes, varianzas conocidas y poblaciones normales o no Muestras pequeñas, varianzas conocidas y poblaciones normales.
(
X
-
Y
)
t 1-
2
/ 2 ,
n1 n2 2
2
(n1 1) s1 (n2 1) s 2 1 1 ( ) 2 n1 n 2 n1 n2
Es el intervalo de confianza de 100(1- ) % de la diferencia de medias para: Muestras pequeñas, varianzas desconocidas y poblaciones normales
2.3. ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA PROPORCIÓN POBLACIONAL Podemos establecer la siguiente estimación de intervalo de confianza (1- α) para la p roporción de la población:
1
2
y
2
2
Tamaño de muestra para la media:
Por consiguiente para determinar el tamaño de la muestra, deben conocerse tres factores: 1. El nivel de confianza deseado. 2. EL error de muestreo permitido. 3. La desviación estándar.
18
Determinación del tamaño de muestra para una proporción:
Al determinar el tamaño de muestra para estimar una porción se deben definir tres incógnitas: 1. El nivel de confianza. 2. El error de muestreo permitido. 3. La porción verdadera de éxitos.
Estimación y determinación del tamaño de muestra para poblaciones finitas . Estimación de la media
Estimación de la proporción
Determinación del tamaño de muestra
3. PRUEBA DE HIPOTESIS
19
La prueba de hipótesis empieza con algo de teoría, afirmación o negación con respecto a un parámetro particular de una población. La hipótesis de que el parámetro de la población es igual a la especificación de la compañía se conoce como hipótesis nula. Una hipótesis nula es siempre una de status quo o de no diferencia. Se simboliza con el símbolo Ho. Siempre que especificamos una hipótesis nula, también debemos especificar una hipótesis alternativa, o una que debe ser verdadera si se encuentra que la hipótesis nula es falsa. La hipótesis alternativa se simboliza H1. La hipótesis alternativa representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir que es improbable que la hipótesis nula sea verdadera, y por tanto rechazarla. El hecho de no rechazar la hipótesis nula no es una prueba de que ésta sea verdadera. Nunca podemos probar que tal hipótesis sea correcta porque estamos basando nuestra decisión únicamente en la información de la muestra, no en la población entera. - La hipótesis nula se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. - El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. - El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.
Regiones de rechazo y de no rechazo La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo. Si la estadística de prueba cae dentro de la región de no rechazo, no se puede rechazar la hipótesis nula. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo. Riesgos en la toma de decisiones al utilizar la metodología de prueba de hipótesis. Se pueden presentar dos tipos diferentes de errores: - Un error tipo I se presenta si la hipótesis nula es rechazada cuando de hecho es verdadera y debía ser aceptada. - Un error tipo II se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada.
Nivel de Significación. La probabilidad de cometer un error tipo I denotada con la letra griega alfa, se conoce como nivel de significación de la prueba estadística. Está bajo el control directo del individuo que lleva a cabo la prueba. Ya que se ha especificado el valor de alfa, se conoce el tamaño de la región de rechazo, puesto que alfa es la probabilidad de un rechazo de la hipótesis nula. Coeficiente de confianza. EL complemento ( 1- ) de la probabilidad de cometer un error de tipo I se conoce como coeficiente de confianza. El coeficiente de confianza es la probabilidad de que la hipótesis nula no sea rechazada cuando de hecho es verdadera y debería ser aceptada.
20
Riesgo . La probabilidad de cometer un error de tipo II se conoce como nivel de riesgo del consumidor. Potencia de una prueba. El complemento (1- ) de la probabilidad de cometer un error del tipo II se conoce como potencia de una prueba estadística. La potencia de una prueba es la probabilidad de rechazar la hipótesis nula cuando de hecho esta es falsa y debería ser rechazada. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra, nos permitirán detectar diferencias incluso muy pequeñas entre las estadísticas de muestra y los parámetros de la población. Cuando se disminuye , aumentará de modo que una reducción en el riesgo de cometer un error de tipo I tendrá como resultado un aumento en el riesgo de cometer un error tipo II. Prueba de hipótesis Z para la media (desvío de la población conocido) El estadístico de prueba a utilizar es:
La Potencia de una prueba β representa la probabilidad de que la hipótesis nula no sea rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1- β representa la sensibilidad de la prueba estadística
para detectar cambios que se presentan al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser rechazada. La potencia de prueba estadística depende de qué tan diferente en realidad es la media verdadera de la población del valor supuesto. Una prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar siempre que sea adecuado especificar la dirección de la hipótesis alternativa. Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error tipo II tienen una relación inversa y esta última es el complemento de la potencia de prueba (1- β), entonces α y la potencia de la prueba varían en proporción directa. Un aumento en el valor del nivel de significación escogido, tendría como resultado un aumento en la potencia y una disminución en α
tendría como resultado una disminución en la potencia. Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría como resultado una disminución en la potencia.
21
Todos los procedimientos paramétricos tienen tres características distintivas: Los procedimientos de prueba paramétricos pueden definirse como aquellos. 1) que requieren que el nivel de medición obtenido con los datos recolectados esté en forma de una escala de intervalo o de una escala de cociente. 2) implican la prueba de hipótesis de valores de parámetros especificados. 3) y por último requieren un conjunto limitante de suposiciones. Los procedimientos no paramétricos pueden definirse como aquellos que no tienen que ver con los parámetros de una población. Prueba t de hipótesis para la media (δ 2 desconocida)
En ocasiones se desconoce la desviación estándar de la población. Sin embargo, se la puede estimar con el cálculo de S, la desviación estándar de la muestra. Recordemos de muestreo de la media seguirá una distribución t con n-1 grado de libertad.
Prueba de hipótesis χ2 para la varianza (o desviación estándar)
Al intentar llegar a conclusiones con respecto a la variabilidad de la población, primero debemos determinar que estadística de prueba puede utilizarse para representar la distribución de la variabilidad de los datos de la muestra. Si la variable se supone que está distribuida normalmente, entonces la estadística de prueba para probar si la varianza de la población es igual o no a un valor especificado es:
Una distribución chi-cuadrado es una distribución sesgada cuya forma depende exclusivamente del número de grados de libertad. Conforma este aumenta, la distribución se vuelve más simétrica.
Pruebas de dos muestras con datos numéricos
22
Prueba t de varianza conjunta para diferencias entre dos medias
Supongamos que consideramos dos poblaciones independientes, cada una con una media y una desviación estándar. La estadística de prueba utilizada para determinar la diferencia entre las medias de las poblaciones está basada en la diferencia entre las medias de las muestras (X1 – X2). Debido al teorema del límite central esta estadística seguirá la distribución normal. La estadística de prueba Z es: En donde X es la media de la muestra correspondiente a cada una de las dos muestras, n es el tamaño de la muestra y por último tenemos la varianza de la muestra. Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera aleatoria e independiente se puede utilizar una prueba t de varianza conjunta para determinar si existe alguna diferencia significativa entre las medias de las poblaciones. Si puede calcular la siguiente estadística de prueba t de varianza conjunta:
Donde: La estadística de prueba t de varianza conjunta sigue una distribución t con n 1+n2-2 grados de libertad. Prueba tde varianza separada para diferencias entre dos medias
Si suponemos que las varianzas no son iguales como en el caso anterior debemos replantear el estadístico a utilizar.
23
La estadística de prueba t puede ser aproximada con la fórmula de v, mostrada anteriormente. Prueba t para la diferencia de medias Con el propósito de determinar cualquier diferencia que exista entre dos grupos relacionados, deben obtenerse las diferencias en los valores individuales de cada grupo. Cuando la desviación estándar de la población de la diferencia es conocida y el tamaño de muestra es lo suficientemente grande. La estadística de prueba Z es:
Sin embargo, en la mayoría de los casos no conocemos la desviación estándar real de la población. La única información que se puede obtener son las estadísticas sumarias como la media y la desviación estándar de muestra. Si se supone que la muestra de resultados es tomada de manera aleatoria e independiente se puede realizar una prueba t para determinar si existe una diferencia media de población significativa. La estadística seguirá una distribución t con n-1 grados de libertad.
Ho= µd = 0
donde µd= µ1-µ2
H1= µd ≠ 0
Se puede calcular el siguiente estadístico de prueba:
Prueba de hipótesis con datos categóricos Prueba Z de una muestra para la proporción. Para evaluar la magnitud de la diferencia entre la proporción de la muestra y la porción de la población supuesta la estadística de prueba está dada por la ecuación siguiente:
24
La estadística de prueba Z está distribuida de manera aproximadamente normal. Prueba Z para diferencias entre dos porciones (muestras independientes). Cuando se evalúan diferencias entre dos porciones basándose en muestras independientes se puede emplear una prueba Z. La estadística de prueba es:
Se supone que las dos porciones de población son iguales.
Ho= p1=p2 H1= p1 ≠ p2
LABORATORIO Nº 04
25
1. Si X = 85, S = 8 y n = 64, establezca un estimador del intervalo de confianza de 95% para la media poblacional 2. Si X = 125, S = 24 Y n = 36, establezca un estimador del intervalo de confianza de poblacional .
99% para la media
3. Una investigadora de mercado establece que tiene una confianza de 95% de que el promedio verdadero de las ventas mensuales de un producto está entre 170,000 y 200,000 dólares. Explique el significado de esta afirmación.
4. Suponga que el administrador de una tienda de pinturas desea estimar la cantidad real de pintura contenida en las latas de 1 galón compradas a un fabricante con renombre en todo el país. Se sabe, de las especificaciones de fabricación que la desviación estándar de la cantidad de pinturas igual a 0.02 de galón. Se selecciona una muestra aleatoria de 50 latas y la cantidad promedio de pintura por galón es 0.995 de galón. (a) Establezca una estimación del intervalo de confianza de 99% para el promedio poblacional de la cantidad de pintura incluida en una lata del galón. (b) Según estos resultados, ¿piensa que el dueño de la tienda tiene derecho a quejarse con el fabricante ¿Por qué? (c) La población cantidad de pintura por galón, tiene una distribución normal Explique. (d) Explique por qué un valor observado de 0.98 de galón en una lata no es raro aun cuando esté fuera del intervalo de confianza que calculó. (e) Suponga que usó un estimador de intervalo de confianza de 95%. ¿Cuáles serían las respuestas de los incisos (a) y (b)? 5. El gerente de control de calidad de una fábrica de focos necesita estimar la vida promedio de un envío grande. Se sabe que la desviación estándar del proceso es 1 00 hora.Una muestra aleatoria de 64 focos indica una vida media de la muestra de 350 horas. (a) Establezca una estimación del intervalo de confianza de 95% para la vida promedio real de los focos de este envío. (b)¿Piensa que el fabricante tiene derecho a establecer que los focos duran un promedio de 400 horas? Explique. (c) La vida de los focos, ¿debe tener una distribución normal Explique. (d) Explique por qué un valor observado de 320 horas no es raro, aun cuando está fuera del intervalo de confianza. (e) Suponga que la desviación estándar del proceso cambió a 80 horas. ¿Cuáles serían las respuestas a los incisos(a) y (b)?
6. La división de inspección de Lee County Weiglns and Measures Department está interesada en la cantidad real de refresco que contienen las botellas de 2 litros en una embotelladora local de una compañía de refrescos conocida en todo el país. La embotelladora informa a la división de inspección que la desviación estándar en estas botellas es 0.05 litro. Una muestra aleatoria de 100 botellas de 2 litros obtenida en esta planta indica un promedio muestral, de 1.99 litros. a) Establezca un intervalo de confianza de 95% de la cantidad promedio verdadera de refresco en cada botella.
26
(b) La población de refrescos, ¿debe tener una distribución normal? Explique. (c) Explique por qué el valor observado de 2.02 litros no es raro, aun cuando está fuera del intervalo de confianza calculado. (d) Suponga que el promedio muestral es 1.97 litros. ¿Cuál sería la respuesta al inciso a)?
7. Determine el valor crítico de I en las siguientes circunstancias: (a) 1- = 0.95, n = 10. (b) 1- = 0.99, n = 10. (c) 1- = 0.95, n = 32. (d) 1- = 0.95, n = 65. (e) 1- = 0.90, n = 16.
8. Si X = 75, S = 24 y n= 36, suponga que la población tiene una distribución normal y establezca una estimación del intervalo de confianza de 95% de la media poblacional . 9. Si X =50 , S = 15 Y n = 16, suponga que la población tiene distribución normal y establezca una estimación del intervalo de confianza de 99% de la media poblacional.
10. Establezca una estimación del intervalo de confianza de 95% para la media poblacional, con base en los siguientes conjuntos de datos; suponga que la población tiene distribución normal:
Conjunto 1: 1, 1, 1, 1, 8, 8, 8, 8 Conjunto 2: 1, 2, 3, 4, 5 , 6, 7, 8 Explique por qué tienen intervalos de confianza distintos aun cuando tienen la misma media y el mismo rango.
11. Calcule un intervalo de confianza de 95% para la media poblacional, con base en los números 1,2, 3, 4, 5, 6, 20. Cambie el número 20 a 7 y calcule de nuevo el intervalo de confianza. Con estos resultados, describa el efecto del valor extremo en el intervalo de confianza.
12. El departamento de transportes del gobierno de Estados Unidos requiere que los fabricantes de neumáticos proporcionen información acerca de la cara de la llanta para que un cliente potencial esté mejor informado al tornar su decisión de compra. Una medida muy importante en el desempeño de la llanta es el índice de desgaste de las cuerdas, que indica la resistencia de la llanta al desgaste de las cuerdas comparada con el grado de la llanta de 100, Esto significa que una llanta con grado de 200 debe durar el doble, en promedio, que una llanta con gracia 100. Suponga que una organización para el consumidor desea estimar el índice de desgaste real de las cuerdas de una marca de llantas con grado 200 que produce cierto fabricante.
27
Una muestra aleatoria de 18 llantas indican índice de desgaste promedio muestral de 195.3 y una desviación estándar de 21.4. (a) Suponga que los índices de desgaste de cuerdas de lo población tiene distribución normal; establezca un intervalo de 95% de confianza estimado del índice de desgaste promedio de la población para las llantas que produce el fabricante de esta marca. (b) ¿Piensa que la organización para el consumidor debe denunciar al fabricante por producir llantas que no cumplen la información de desempeño proporcionada en la cara de la llanta? Explique. (e) Diga por qué un índice de desgaste observado de 210 para una llanta en particular no es raro, aunque esté fuera del intervalo de confianza desarrollado en (a).
13. Un auditor del departamento estatal de seguros desea determinar la proporción de reclamaciones pagadas por una compañía de seguros de salud dentro de los 2 meses siguientes a la recepción de la solicitud. Se selecciona una muestra aleatoria de 200 reclamaciones y se determina que 80 se pagaron en menos de 2 meses. (a) Establezca una estimación del intervalo de confianza de 99% de la proporción de la población de reclamaciones pagadas en menos de 2 meses. (b) Si se supone que 90% O más reclamaciones se pagan en menos de 2 meses, ¿qué de be informar el auditor al departamento estatal de seguros acerca del desempeño de los pagos de la compañía de seguros?
14.Un distribuidor de automóviles desea estimar la proporción de clientes que todavía tienen los autos comprados hace 5 años. Una muestra aleatoria de 200 clientes seleccionada de los registros del distribuidor indica que 82 clientes conservan el auto comprado 5 años antes. (a) Establezca un intervalo de confianza de 95% de la proporción de la población de todos los clientes que conservan los autos 5 años después de comprarlos. (b) ¿Cómo puede el distribuidor usar los resultados de (a) para estudiar la satisfacción del cliente con el auto que le compraron?
14. Una papelería recibe un cargamento de un fabricante de cierta marca de bolígrafos de bajo costo. Se prueba una muestra aleatoria de 300 bolígrafos y se encuentra que 30 están defectuosos. (a) Establezca un intervalo de confianza de 90% para estimar la proporción de bolígrafos defectuosos en el cargamento. (b) El cargamento se puede regresar si contiene más de 5% de bolígrafos defectuosos; según los resultados de la muestra, ¿puede la papelería regresarlo? (c) Suponga que se desea un intervalo estimado de 99% de confianza en (a). ¿Cuál sería el efecto de este cambio en sus repuestas de (a) y (b)?
15. La compañía de teléfonos quiere estimar la proporción de viviendas que comprarían una línea telefónica adicional si estuviera disponible a un costo de instalación reducido de manera sustancial. Se selecciona una muestra aleatoria de 500 viviendas. Los resultados indican que 135 de las viviendas comprarían la línea adicional a un costo de instalación reducido.
28
(a) Establezca un intervalo de confianza de 99% para la proporción de la población de viviendas que comprarían una línea de teléfono adicional. (b) ¿Cómo usaría estos resultados el gerente a cargo de programas promocionales para clientes residenciales?
16. Un grupo de consumidores desea estimar el monto de las facturas de energía eléctrica para el mes de julio para las viviendas unifamiliares en una ciudad grande. Con base en estudios realizados en otras ciudades, se supone que la desviación estándar es 25 dólares. El grupo desea estimar el monto promedio para julio dentro de 5 dólares del promedio verdadero con 99% de confianza. (a) ¿Qué tamaño de muestra necesita? (b) Si desea 95% de confianza, ¿qué tamaño de muestra requiere?
17. Una agencia de publicidad que da servicio a una estación de radio desea estimar. el tiempo promedio diario que la audiencia escucha la estación. De estudios anteriores, la desviación estándar se estima en 45 minutos. (a) ¿Qué tamaño de muestra se necesita si la, agencia desea una confianza de 90% con resultado correcto?
5 minutos
del
(b) Si se desea 99% de confianza, ¿qué tamaño de muestra necesita?
18. Suponga que un proveedor de gas desea estimar el tiempo de espera promedio para la instalación del servicio dentro de 5 días con 95% de confianza. Debido a que no tiene acceso a datos históricos, hace una estimación independiente de la desviación estándar, que piensa es de 20 días. ¿Qué tamaño de muestra necesita?
19. Un encuestador político desea estimar la proporción de electores que votarán por el candidato demócrata en una campaña presidencial. El encuestador desea 99% de confianza de que su predicción será correcta dentro de 0.04 de la proporción de la población. (a) ¿Cuál es el tamaño de muestra necesario? (b) Si desea 95% de confianza, ¿qué tamaño de muestra requiere? (c) Si desea 95% de confianza y un error muestral de
0.03,
¿qué tamaño de muestra necesita?
(d) Según las respuestas de (a) a (e), ¿qué conclusión general se deriva acerca del efecto del nivel de confianza deseado y el error muestral aceptable en el tamaño de la muestra requerido?
20. El gerente de un banco desea 90% de confianza de tener un resultado correcto dentro de 0.05 de la proporción de población real de ahorradores que tienen cuentas de ahorros y de cheques en el banco. ¿De cuántos ahorradores debe ser su muestra?
21. Para Ho:
100 ,
H 1: 100 y una muestra de tamaño n, será mayor si el valor
29
real de