UNIVERSIDAD DE LA GUAJIRA EXTENSION VILLANUEVA
FACULTAD DE CIENCIAS ECONOMICAS Y ADMINISTRATIVAS PROGRAMA DE ADMINISTRACION DE EMPRESAS ASIGNATURA ESTADISTICA INFERENCIAL
GUIA DE ESTUDIO
Mag.: ALEXI MONTERO SANTIAGO
[email protected] [email protected]
1.
PRESENTACIÓN En nuestra últimas décadas del siglo XXI, hemos observado, que nuestro país y demás países del mundo, la vida diaria de todo ser humano está rodeada de diversos grados de incertidumbre, que inciden en los problemas económicos, social, político, cultural, dejando como consecuencias, estados de violencia, desempleo, miseria, desarrollo no adecuado de las empresas, resultados no satisfactorio de la información, mal manejo de la información en algunos casos para la toma de decisiones. Es preciso decir que para la solución de los problemas anteriores contamos con una herramienta importante, que es la estadística II, Inferencial las cual utiliza las técnicas en casi todos los aspectos de la vida y mediante ella podemos utilizar métodos y modelos, mod elos, estimaciones, hipótesis para predecir el resultado de futuras repeticiones en las empresas. Se diseñan encuestas para obtener información previa por ejemplo el día de las l as elecciones y predecir pr edecir el resultado de las mismas. Se seleccionan al azar consumidores para obtener información, con el fin de predecir, la frecuencia con respecto a cierto
producto, el medico investiga para obtener el efecto de ciertos
medicamentos a través de expertos y condiciones ambientales controladas en los humanos y así determinan el método apropiado para curar la enfermedad. El ingeniero muestra las características de calidad de un producto junto con otras variables controlables del proceso, para facilitar la identificación de variables que están más relacionadas con nuestra calidad. En algunos casos se toman muestras de productos recientemente fabricados, antes de su envío al mercado, para decidir si se retira o se entrega ciertos lotes, dichos productos. El economista y el contador público consideran varios índices de la situación económica durante cierto periodo y utiliza la información para predecir la situación contable, económica y futura. Las Las técnicas estadísticas desempeñan una función importante en el logro de los objetivos objetivos de cada uno de los los problemas de nuestra región o país. El requisito para la explicación de la teoría es la estadística y la formulación de sus objetivos. Por eso podemos decir que la estadística es la rama del método científico que trata de los datos recopilados al contar o medir, propiedades de alguna población y a partir de los métodos y conclusiones de expertos y procesos. Entramos en la toma de decisiones.
CONTENDIO PROGRAMATICO I. UNIDAD 1-TEORÍA DE LA COMBINATORIA 1.1 Permutaciones y combinaciones 1.2 Formulas y ejemplos prácticos 1.3 Teoría de la probabilidad II.UNIDAD 2 DISTRIBUCIONES MUESTRALES 2.1 Muestras aleatorias con y sin reemplazo 2.2 Media muestral 2.3 Varianza muestral 2.4 Propiedades de Media muestral y Varianza muestral III. UNIDAD 3. ESTIMACIÓN DE PARÁMETROS 3.1 Estimación Puntual 3.1.1 Generalidades 3.1.2 Definición de estimación puntual 3.1.3 Propiedades de los estimadores: insesgado, eficiente, consistente y suficiente. 3.1.4 Método de máxima verosimilitud. 3.2 Estimación por Intervalos 3.2.1 Definición de estimación por intervalos. 3.2.2 Intervalo de confianza para estimar la media poblacional. 3.2.3 Intervalo de confianza para estimar la diferencia de medias Poblacionales. 3.2.4 Intervalo de confianza para estimar la proporción Poblacional 3.2.5 Intervalo de confianza para estimar la diferencia de proporciones poblacionales. Intervalo de confianza para estimar la varianza poblacional IV. UNIDAD 4. PRUEBAS DE HIPÓTESIS 4.1 Definición de pruebas de hipótesis. 4.2 Prueba de hipótesis para la media poblacional. 4.3 Prueba de hipótesis para la diferencia de medias poblacionales. 4.4 Prueba de hipótesis para la proporción poblacional 4.5 Prueba de hipótesis para la diferencia de proporciones poblacionales. 4.6 Prueba de hipótesis para la varianza poblacional. V. UNIDAD 5REGRESIÓN Y CORRELACIÓN 5.1 Generalidades 5.2 El método de mínimos cuadrados 5.3 Inferencias basadas en estimadores de mínimos cuadrados 5.4 Regresión simple y regresión múltiple 5.5 Correlación
1-TEORIA DE COMBINATORIA. 1.1 PROBABILIDAD: La probabilidad es una rama de la matemática. Actualmente se extiende, junto con la estadística, a campo de la investigación científica, los negocios, la predicción del clima y la política.
E xperimento aleatorio: es un ensayo en el cual no se conoce el resultado final hasta ejecutarlo. Sin embargo, es factible encontrar el conjunto de los posibles resultados que pueden presentarse antes de ejecutar el ensayo.
E spacio Muestral: El espacio muestral de un experimento aleatorio es el conjunto de todos los posibles resultados del experimento aleatorio.
E vento: es un conjunto formado por los elementos del espacio muestral con alguna característica similar. Como los eventos son conjuntos de le puede aplicar las operaciones y propiedades de la teoría de conjunto. Evento simple: Evento compuesto: Evento imposible: Evento seguro: Unión de Eventos: Intersección de Eventos: Eventos mutuamente excluyentes:
EJ EMPLO 0: En un campeonato de futbol se clasifican 4 equipos a las finales: Nacional, Junior, Millonarios, Cali. Se desea definir los tres primeros lugares. a) Determine el espacio Muestral. b) Determine dos eventos y clasifíquelos.
1.2 TÉCNICAS DE CONTEO: En muchos experimento aleatorios, el definir el espacio muestral resulta algo dispendioso y su proceso puede generar errores a la hora de identificar los eventos. Por esta razón, es necesario establecer ciertas técnicas que permitan establecer el número de elementos del
espacio muestral y de los eventos relacionados, a partir delas características de la muestra en el experimento. 1.2.1 PRINCI PIO DE MULTI PLICACI ÓN: Es una técnica de conteo que se aplica en experimentos aleatorios en los cuales:
Importa el orden en que se escriben los elementos y/o estos se pueden repetir.
Existen varias fases para realizar algún experimento y en cada fase hay diferentes
maneras de hacerlo.
#S= N1 x N2 x N3 x…xNn
Poblaciones distintas
E JE MPLO 1: Si hay 3 candidatos para la alcaldía y 5 para la gobernación, los dos cargos se pueden ocupar de 3x5=15 formas Si en un experimento aleatorio se tiene una población de N y se debe tomar una muestra de tamaño n y además, la muestra tiene orden y repetición entonces: #S=Nn
E JE MPLO 2: una persona quiere hacer una ri fa de tres cifras ¿cuantas boletas debe imprimir?: N=10 n=3 #S=103= 1000 boletas En este ejemplo también se puede aplicar el modelo #S=
N1 x N2 x N3 x…xNn
#S= 10x10x10=1000 donde N1= son las opciones que tiene el primer número de la boleta. Al igual ocurre con N2 y N3.
Ejercicios: 1-En Colombia las placas de los automóviles, tienen tres letras (de un alfabeto de 26) seguida de tres dígitos. La cantidad de placas sin letras ni números repetidos que comienzan por vocal y son impares es: 2-Un examen consta de 4 preguntas, hay que dar respuesta a solo 3 de las 4 preguntas, ¿cuantos exámenes de diferente contenido habrá que corregir como máximo?
1.2.2 PE RM UTACI ON Una permutación es una técnica de conteo en la cual es importante el orden en el que se escriben los elementos de cada punto muestral, pero no hay repetición.
NPn=
Cuando N=n entonces NPn =N!
Además también se establece el siguiente modelo matemático cuando de n objetos, de los que n1 son iguales, n2 son iguales,….es
NPn=
EJEMPLO 3: Hallar la cantidad de maneras en que pueden obtener las medallas de oro, plata y bronce 10 ciclista que participan en un campeonato.
:
NPn=
N=10 n=3
NPn=
() ()
EJEMPLO 4: El número de permutaciones que se pueden dar de las letras “statistics” es:
Tenemos que s=3 t=3 i=2 a=1 y c=1 NPn=
Ejercicios: 1- Con los dígitos primos se quiere formar números de 3 cifras. 2- De cuantas maneras se puede sentar 10 personas en un banco si hay cuatro sitios disponibles. 3- Hay que colocar a 5 hombres y a 4 mujeres en una fila de modo que las mujeres ocupen los lugares pares ¿de cuantas maneras pueden hacerse?
1.2.3 Combinatoria. Una combinación es una técnica de conteo en la cual no importa el orden y no hay repetición en los elementos de un punto muestral.
NCn=
La diferencia entre una permutación y una combinatoria es que en la primera el interés recae en contar las posibles selecciones y todos los arreglos de estas, mientras que en la segunda el interés se centra en contar el número de selecciones diferentes. EJEMPLO 5: Se va elegir una comisión de 5 estudiantes de administración de un grupo de 11 ¿de cuantas formas se les puede seleccionar?.
NCn=
EJEMPLO 6: De entre 5 estudiantes de administración y 7 de contaduría hay que construir una comisión de dos estudiantes de administración y 3 de contaduría. ¿ de cuantas formas podrá hacerse si: a) todos son elegibles, b) un estudiantes de contaduría en particular ha de estar en esa comisión y c) dos estudiantes de administración tienen prohibido pertenecer a la comisión. a)
NCn=
NCn=
# De comisión =10*35=350
b)
NCn=
NCn=
# De comisión =10*15=150
c)
NCn=
NCn=
# De comisión =3*35=105
Ejercicios: 1-Con 7 consonantes y 5 vocales, ¿cuantas palabras se pueden formar que tengan 4 consonantes distintas y 3 vocales distintas? Se admiten palabras sin significado. 2-cinco senadores de la republica serán enviados a una cumbre latinoamericana. El presidente del senado envía al presidente de la republica una lista que contiene los nombres de 10 hombres y 4 mujeres. Si el presidente de la republica decide que va a enviar 3 hombres y 2 mujeres. ¿De cuantas maneras puede seleccionar el grupo de senadores que asistirá a la cumbre? 1.3 PROBABILIDAD Y ANALISIS COMBINATORIO. Enfoque clásico: En un experimento aleatorio la probabilidad de que un evento ocurra es: P (E)= #E/#S Donde
#E es la cantidad de puntos muéstrales del evento E y #S es la
cantidad de puntos en el espacio muestral S. Propiedades de la probabilidad de Eventos: A partir de la definición de probabilidad se establece que:
La probabilidad de un evento está en el intervalo cerrado [0,1].
La probabilidad de un evento seguro es 1
La probabilidad de un evento imposible es 0.
Si los eventos A y b son mutuamente excluyentes, entonces, P(AUB)= P(A)+P(B).
Si los eventos de A y B no son mutuamente excluyentes, entonces, P(AUB)=
P(A)+P(B)- P(A B).
La probabilidad de que no suceda A es: P’(A)=1-P(A).
EJEMPLO 7: En una bolsa hay 5 balotas numeradas del 5 al 9. Se extraen dos balotas, una detrás de otra sin devolverlas a la bolsa. Se anotan los resultados formando números de dos cifras. ¿Cuál es la probabilidad de formar un número múltiplo de 4 o formar un número mayor que 87?.
El espacio muestral está dado por #S=5*4=20 (utilizando el principio de multiplicación) #S=56,57,58,59,65,67,68,69,75,76,78,79,85,86,87,89,95,96,97,98 Eventos: E=[x/x es múltiplo de 4] = [56, 68 ,76 96] F= [x/x mayor que 87] = [89,95, 96, 97, 98]
No son mutuamente excluyentes puesto que (E F)= 96
P (EUF)= P (E)+P (F)- P (E F). = 4/20 +5/20- 1/20= 8/20=2/5=0.4=40%
EJEMPLO 8: Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5 bolas negras. Si se saca una bola de cada bolsa hallar la probabilidad de que: a) Ambas sean blancas b) ambas sean negras y c) una sea blanca y la otra negra. a) (4/6)*(3/8)=1/4 =25% b) (2/6)*(5/8)=5/24 =21% c) (4/6)*(3/8)+(2/6)*(5/8)=13/24=54% Este último valor también se puede determinar aplicando “La probabilidad de que no suceda A es: P’(A)=1-P(A). = 1-1/4-5/24=13/14
Ejercicios: 1-se escogen al azar dos números de teléfono y se tiene en cuenta la última cifra de cada uno, determinar las siguientes probabilidades: a-que las dos cifras sean iguales b-que su suma sea 11 c-que su suma sea mayor que 4 menor que 8 2-En una universidad, el 30% de los alumnos hablan inglés, el 10%, francés y el 8% los dos idiomas. ¿Cuál es la probabilidad de encontrar alumnos que hablen alguna lengua extranjera?
3-hallar la probabilidad de obtener un total de 7 puntos al lanzar dos dados: a-un solo lanzamiento b-en dos lanzamientos. 1.3.1Probabilidad condicional La probabilidad de un evento A, cuando se sabe que ha ocurrido un evento B, se denomina Probabilidad condicional. Se simboliza P(A/B) y se lee la probabilidad de A dado B. Para calcular la probabilidad de un evento dado que ha ocurrido otro, se tiene una restricción en el espacio muestral. El nuevo espacio muestral será formado por el número de elementos del evento que sucedió primero:
P(A/B)
II. DISTRIBUCIONES MUESTRALES Uno de los propósitos de la estadística inferencial es estimar las características poblacionales desconocidas, examinando la información obtenida de una muestra, de una población. El punto de interés es la muestra, la cual debe ser representativa de la población objeto de estudio. Se seguirán ciertos procedimientos de selección para asegurar de que las muestras reflejen observaciones a la población de la que proceden, ya que solo se pueden hacer observaciones probabilísticas sobre una población cuando se usan muestras representativas de la misma. Distribuciones Muéstrales DISTRIBUCIONES MUESTRALES Medidas
Población
M aritmética
µ
Muestra
̅
Varianza Desviación típica Tamaño
s
N
n
2.1 Muestras aleatorias con y sin reemplazo µx= media de todos las medias muéstrales
= Desviación típica de todas las medias muéstrales
M= Número posible de muestras.
NCn=
∑ ∑ √ √
sin reposición
µx= µ=
NPn=
NPn =N!
con reposición.
con reemplazo
Sin reemplazo
EJEMPLO 9:
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 7,3 y 5. Encuentre: a) µ, la media poblacional. b) , la desviación estándar poblacional. c) µx, la media de la distribución muestral de medias d) =, la desviación estándar de la distribución muestral de medias.
a) µ= (7+3+5)/3= 5 media poblacional b)
c) A continuación se listan los elementos de la distribución muestral de la media y la correspondiente distribución de frecuencias. (3,3) (3,5) (3,7) 3 4 5 3 1 4
(5,3) (5, 5) (5, 7) (7, 3) (7, 5) (7, 7) 4 5 6 5 6 7
→ → → → →
µx=( 3*1+4*2+5*3+6*2+7*1)/9= 45/9=5
√ √ d)
=1.15
EJEMPLO 10:
Se eligen muestras ordenadas de tamaño 2, sin reemplazo, de la población de valores 7,3 y 5. Encuentre: a) µ, la media poblacional. b) , la desviación estándar poblacional. c) µx, la media de la distribución muestral de medias =, la desviación estándar de la distribución muestral de medias. d)
“Hoy, la estadística está considerada como la teoría de la información, no sólo como
función descriptiva, sino con el objeto básico de hacer estimaciones acerca de los valores estadísticos de la población o en la comprobación de hipótesis de aquellas características que han sido investigadas”.1
1
Ciro Martínez Bercandino
EJEMPLO 10: Tartus Industries cuenta con siete empleados de producción (a quienes se les considera la población). En la tabla 8-2 se incluyen los ingresos por hora de cada uno de ellos. Empleado Joe Sam Sue Bob
Ingreso por hora $7 7 8 8
Empleado Jan Art ted
Ingreso por hora $7 8 9
1. ¿Cuál es la media de la población? 2. ¿Cuál es la distribución muestral de la media de muestras de tamaño 2? 3. ¿Cuál es la media de la distribución muestral de la media? 4. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la media?. 12-
µ=($7+7+8+8+7+8+9)/7 =$7.71 NCn=
=21.
Las 21 medias muestrales que se pueden tomar de la población:
Por lo tanto la distribución muestral de la media con n=2 es:
3- ¿Cuál es la media de la distribución muestral de la media?
µx=
4. ¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la media?
a-La media de las medias de las muestras es exactamente igual a la media de la población. b-La dispersión de la distribución muestral de la media es más estrecha que la distribución poblacional. c-La distribución muestral de la media suele tener forma de campana y se aproxima a la distribución de probabilidad normal.
EJEMPLO 11: Las alturas de 3000 estudiantes de la universidad de la Guajira están normalmente distribuidas con media de 1.72 mts y desviación típica de 0.076 mts. Si se toman 80 muestras de 25 estudiantes cada una. ¿Cuáles serán la media y la desviación típica esperadas de la resultante distribución de muestreo de medias, si el muestreo se hizo (a) con b) sin reposición.
µ= µx =1.72mts
∑ √ √
Con reemplazo
Sin reemplazo
√ √
√ √
Teoría del límite central. Se cumple, cuando independientemente de la población origen, la distribución de las medias aleatorias se aproximan a una distribución normal a medida que el tamaño de la muestra crece. Se podrá decir también, que si las muestras provienen de una población que no es normal, es de importancia tener en cuenta el tamaño de la muestra, si el tamaño muestral es pequeño, la distribución obtenida con sus medias muéstrales tendrán un comportamiento similar al de la población de donde se extrajeron. Por el contrario, si el tamaño muestral es grande, el comportamiento de estas medias muéstrales será igual al de una distribución normal, independientemente de la población de donde fueron extraídas. En su forma más simple, el teorema indica que si n variables aleatorias independientes tienen varianza infinitas, su suma, cuando, se le expresa en medida estándar, tiende a estar normalmente distribuida cuando n tiende a infinito. Se debe observar que ninguna de las varianzas sea mayor comparada con el total.
2.2 Distribución Muestral de Medias. De acuerdo con el teorema anterior, la variante estadística Z para distribuciones de medias muestrales será:
̅ ⁄√
En aquellos casos de poblaciones finitas, es decir, cuando se da información sobre el tamaño poblacional, y cuando el tamaño de la muestra es mayor del 5% de la población, se puede aplicar el factor de corrección, representado de diferentes maneras. (con reemplazo)
EJEMPLO 11:
̅ √
La altura media de 400 alumnos de un plantel de secundaria es de 1,50 mts, y su desviación típica es de 0,25 mts. Determinar la probabilidad de que en una muestra de 36 alumnos, la media sea superior a 1,60 mts.
̅ ⁄√ ⁄√ Z(2.40)
0.4918 p =0.50-0.4918 =0.0082= 0.82%
EJEMPLO 13. Un fabricante de cierto champú para el cabello, distribuye el tamaño profesional de su producto en 100 salones de belleza de Valledupar, se ha determinado que el consumo promedio de su producto es de 2.800 cojines mensuales, con desviación estándar de 280cojines. Si se toma una muestra probabilística de 36 salones. ¿Cuál es la probabilidad de que el consumo promedio en un mes sea inferior a 2.700?
̅ ̅ ⁄√ ⁄√ µ=2.800
=280 n=36
Z(-2.14)
=2.700
p(x<2.700) =?
0.4838 p =0.50-0.4838 =0.0162= 1.62%%
EJEMPLO 14. Una siderúrgica está produciendo actualmente cables para suspensión de puentes. La característica más importante de este producto es su resistencia, el peso que puede soportar antes de que se reviente. Por experiencias pasadas se sabe que el promedio de la resistencia
es de 6 toneladas con desviación típica de 3/4 de toneladas. Para efectos de control, se selecciona una muestra de 9 cables y se adopta la siguiente regla de decisión. Si la resistencia promedio está por encima de 6.5 toneladas o por debajo de 5.5, se suspende el proceso. Si esta entre entre 5.5 y 6.5 se deja tal y como está. a) ¿Cuál es la probabilidad de tener el proceso, si la media de la producción es aun 6 toneladas? b) ¿Cuál es la probabilidad de tener el proceso, si la media de la producción no es 6 tonelada sino 6.18 toneladas? c) ¿Cuál es la probabilidad de continuar el proceso, si el promedio es en realidad de 6.4 toneladas d) ¿si es de 5.8 toneladas? Solución:
6
3 4
n
0,75
9
Si 6,5
x
5,5
Se suspende el proceso
Si 5,5
x
6,5
Se deja tal y como está
a) Siendo
Z
Z
Z
6,5 6 0,75 3 5,5 6 0,75 3
=6
¿Cuál es la probabilidad de detener el proceso?
0,5 3 0,75 0,5
3
0,75
1,5 0,75
1,5
0,75
2 A 0,4772 ; Z
2
ó
0,4772 A
0,4773
P 6,5
x 5,5
4,56%
0,9544 0,0456 4,56%
b) Siendo Z
2
2 A
0,4772 0,4772 0,9544; P 1
6,5 6,18 0,75 3
6,18
¿Cuál es la probabilidad de detener el proceso?
0,32 3 0,75
0,96 0,75
1,28
Z
5,5 6,18 0,75 3
0,68
3
0,75
2,04
0,75
2,72
Z 1,28 A
P
6,5 6,4 0,75 3 5,5 6,4 0,75 3
0,13 0,75
0,9
3
0,75
0,3 0,75
2,7
0,75
0,1554 0,4998 0,6552 65,52%
6,5 5,8 0,75 3 5,5 5,8 0,75 3
10,36%
3,60
P
d) Siendo
x 5,5
0,40
0,40 A 0,1554 ; Z
Z
P 6,5
6,4 ¿Cuál es la probabilidad de continuar el proceso?
Z
Z
0,4967
0,8964 0,1036 10,36%
c) Siendo
Z
Z 2,72 A
0,3997 0,4967 0,8964
P 1
Z
0,3997 ;
0,4998
P 5,5
x 6,5
65,52%
¿Cuál es la probabilidad de continuar el proceso?
5,8
0,7 3 0,75
0,3
3,60 A
3
0,75
2,1 0,75
0,9
0,75
2,80
1,20
Z
2,80 A 0,4974 ; Z
P
0,4974 0,3849 0,8823 88,23%
1,20 A
0,3849
P 5,5
x 6,5
88,23%
EJERCICIOS: 1-En una prueba de aptitud la puntuación media de los estudiantes es de 72 puntos y la desviación estándar es de 8 puntos. ¿Cuál es la probabilidad de que dos grupos de estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuación media en: a) 3 o más puntos b) 6 o más puntos c) Entre 2 y 5 puntos
2-Ciertos tubos fabricados por una compañía tienen una duración media de 900 horas y una desviación típica de 70 horas. Hallar la probabilidad, al seleccionar al azar 36 tubos, que tengan una duración media entre 870 y 925 horas. 3-Se sabe que en cierta ciudad, los clientes de los restaurantes gastan en promedio $32.900
en comida, con una desviación estándar de $1.500. Si se pide cada uno de los 50 restaurantes que seleccionen al azar las cuentas de 100 personas y que informen sobre el consumo medio de esas 100 personas. ¿De cuántos restaurantes debe esperarse que informen sobre cuentas promedios, superiores $33.259,30?
2.3 Distribución muestral de proporciones p. En el análisis de una característica cualitativa o atributo, se emplea la proporción de éxitos y no el número de éxitos como en la distribución binomial. Una población binomial está estrechamente relacionada con la distribución muestral de proporciones; una población binomial es una colección de éxitos y fracasos, mientras que una distribución muestral de proporciones contiene las posibilidades o proporciones de todos los números posibles de éxitos en un experimento binomial, y como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse usando la aproximación normal a la binomial, siempre que np >5 y n(1-p) >5. Cualquier evento se puede convertir en una proporción si se divide el número obtenido entre el número de intentos.
Simbología:
Sin reemplazo
P=P-0.5/n factor de corrección Q=P-1
EJEMPLO 15: Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 55%.
Datos: n=800 P=0.60 p=0.55
=2.89
Z=0.4981 P=0.5-0.4981=0.0019=0.19%
La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por lo que diríamos que la probabilidad de que al extraer una muestra de 800 estudiantes de esa
universidad, la proporción de estudiantes que fuman cigarrillos sea menor al 55% es del 0.19%.
EJEMPLO 16: Se tiene que el 4% de las piezas producidas por ciertas maquinas es defectuosa, ¿cuál es la probabilidad de que en un grupo de 200 piezas, el 3% más sea defectuosa.
=-0.71
Z ( 0,2611)
p=0,2611+0,5=0,7611 =76,11%
EJEMPLO 17. Por cada 50 sindicatos del país 23 no están de acuerdo con el comercio con la china continental; ¿cuál es la probabilidad de que en una encuesta a 100 sindicatos muestre que más del 52% tenga la misma posición?
=1.20
Z (0.3849) p=0,50-0,3849=0,1151 =11,51% EJERCICIOS: 1) se ha determinado que el 65% de los estudiantes universitarios de Bucaramanga prefieren los cuadernos marca profesional. ¿ cuál es la probabilidad de que en una muestra de 100 universitarios de dicha ciudad, encontremos que: a) como máximo el 68% sea usuarios de este tipo de cuadernos b) exactamente 66% sean usuarios 2) se sabe que el 25% de los estudiantes de un colegio usan anteojos. ¿cuál es la probabilidad de que 8 o menos usen anteojos en una muestra de 36 estudiantes? 3) Un nuevo tratamiento con rayo láser asegura su eficacia en el 90% de los casos. Si se selecciona una muestra de 40 enfermos, ¿qué probabilidad hay que se presente una diferencia mayor del 8% en cuanto a su eficacia?
2.4 Distribución de diferencia entre dos medias Muestrales. Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación estándar 1, y la segunda con media µ2 y desviación estándar 2. Más aún, se elige una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la distribución muestral del estadístico .
σ
σ
̅̅
Se puede demostrar que la media de las diferencias de todos los pares de medias muestrales posibles, es igual a la diferencia entre las medias poblacionales. .
̅ ̅
La desviación típica de las diferencias entre los pares de medias muestrales se simboliza por:
∑ ( [ )] ̅
̅
̅ ̅ ̅̅
EJEMPLO 18 En un restaurante, el consumo medio por desayuno es de $4.980, con una desviación estándar de $950. En un segundo restaurante las correspondientes cifras son $4.238 y $820. Si se eligen al azar 80 boletas de pago del primer restaurante y una muestra aleatoria de 60 del segundo, ¿Cuál es la probabilidad de que la diferencia entre los consumos medios de ambas muestras sea mayor que $1.000 en valor absoluto? µ1=4.980 µ2=4.238 σ1=950 σ2=820 n1=80 n2=60
→
→ A=0.4572+0.500=0.9572
P=1-0.9272=0.0428=4.28% EJEMPLO 18 Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una desviación estándar de 1.23km/L para la primera gasolina y una desviación estándar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. a) ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b) ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?. En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que se supondrán que son iguales 1 =
a)
1.23 Km/L
2 =
1.37 Km/L n 1 = 35 autos
→
=1.52 0.4357
P=0.5-0.4357=0.0643=6.43% b)
0.65 x1x2 0.83
→ → P=0.4974-0.4857=0.0117=1.17%
n2 = 42 autos
EJERCICIOS: 1- Dos marcas, A y B de tabletas antiácidas efervescentes registran el mismo promedio de disolución en agua, con desviación estándar de 12 segundos para la marca A y 24 segundos para B. Suponiendo que el tiempo de disolución esté normalmente distribuido, ¿cuál es la probabilidad de que, con una muestra de 36 tabletas de cada marca, las tabletas B registren un promedio de tiempo de disolución, cuando menos 5 segundos más rápido que A? 2- Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las
mujeres de cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen ese leve desorden sanguíneo sea de: a) Menos de 0.035 a favor de los hombres. b) Entre 0.01 y 0.04 a favor de los hombres. 3- El sueldo mensual de los licenciados en educación en Bogotá es de $920.000 como promedio, con una desviación estándar de $31.500. En la misma ciudad, el salario mensual de los economistas en la administración pública es de $925.000, con una desviación estándar de $52.500. Se toma una muestra aleatoria de 100 de cada población. ¿Cuál es la probabilidad de que la diferencia en las asignaciones B sea superior a las de A en $12.510?
2.5 Distribución de diferencia entre dos proporciones Muestrales P 1-P 2. Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. La media de las diferencia entre dos medias proporcionales, se simboliza; indistintamente por: µp1-µp2=P1-P2. La variante estadística, estará dad en la misma forma que fue presentada para diferencias entre medias muestrales:
EJEMPLO 19:
Los hombres y mujeres adultos radicados en la ciudad de Bogotá difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato de niños. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte para asesinos de niños, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Datos: P1 = 0.12 P2 = 0.10 n1 = 100 n2 = 100 p1-p2=0.03
→
P=0.5-0.0910=0.409=40.9%
EJEMPLO 20:
Consideremos dos máquinas que producen un determinado artículo; la primera produce por término medio un 14% de artículos defectuosos, en tanto que otra, produce el 20% de artículos defectuoso; si se obtienen muestras de 200 unidades en la primera y 100 unidades en la segunda, ¿cuál es la probabilidad de que difiera A de B en 8% o más? Datos: P1 = 0.14 P2 = 0.20 n1 = 200 n2 = 100 p1-p2=0.08
√ → P=0.5-0.4986=0.0014=0.14%
EJEMPLO 21: Ciertas encuestas a televidentes, revelan que el 25% de los hombres y 33% de las mujeres de clase media ven la telenovela de las 11 y ½ de la mañana. ¿Cuál es la probabilidad de que en dos muestras aleatorias de 150 hombres y 100 mujeres respectivamente, pertenecientes a dicho estrato social, se encuentre que la proporción de hombres que han visto el programa sea igual o mayor que la proporción de mujeres? P1 = 0.25 P2 = 0.33 n1 = 150 n2 = 100 p1-p2=0
→ P=0.50-0.4131=0.0869=8.69% EJERCICIOS: 1) Un especialista en genética ha detectado que el 26% de los hombres y el 24% de las mujeres de cierta región del país tiene un leve desorden sanguíneo; si se toman muestras de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen ese leve desorden sanguíneo sea de: a) Menos de 0.035 a favor de los hombres. b) Entre 0.01 y 0.04 a favor de los hombres. 2) Es sabido que los porcentajes de familias con ingreso superior a $570.000 en las ciudades A y B es de 25% y 20%, respectivamente. Se seleccionan al azar dos muestras de 100 familias en cada una de las dos ciudades y se comparan las proporciones muestrales de las familias con ingreso superior a $570.000. ¿Cuál es la probabilidad de que la proporción muestral correspondiente a la ciudad B sea: a) Mayor que la de A en 3% o más? b) Menor que la de A en 3% o más? 3) En una agencia de empleo se sabe que por cada 100 personas que lo solicitan, 50, además de ser bachilleres, tienen alguna experiencia sobre el trabajo a desarrollar. Se extraen 2 muestras de la misma población, en forma independiente de tamaño 36 cada una. ¿Cuál es la probabilidad de que las dos muestras difieran en 8 o más personas que tengan alguna experiencia sobre el trabajo?
III ESTIMACION DE PARAMETROS. El objetivo principal de la estadística inferencial es la estimación, esto es que mediante el estudio de una muestra de una población se quiere generalizar las conclusiones al total de la misma. Como vimos en la sección anterior, los estadísticos varían mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estándar de un estadístico, más cercanos serán unos de otros sus valores. Existen dos tipos de estimaciones para parámetros; puntuales y por intervalo. Una estimación puntual es un único valor estadístico y se usa para estimar un parámetro. El estadístico usado se denomina estimador. Una estimación por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el parámetro. Una estimación puntual de un parámetro q es un sólo número que se puede considerar como el valor más razonable de q. La estimación puntual se obtiene al seleccionar una estadística apropiada y calcular su valor a partir de datos de la muestra dada. La estadística seleccionada se llama estimador puntual de q. Estimación por Intervalos
Un estimado puntual, por ser un sólo número, no proporciona por sí mismo información alguna sobre la precisión y confiabilidad de la estimación. Por ejemplo, imagine que se usa el estadístico x para calcular un estimado puntual de la resistencia real a la ruptura de toallas de papel de cierta marca, y suponga que x = 9322.7. Debido a la variabilidad de la muestra, nunca se tendrá el caso de que x = u. El estimado puntual nada dice sobre lo cercano que esta de u. Una alternativa para reportar un solo valor del parámetro que se esté estimando es calcular e informar todo un intervalo de valores factibles, un estimado de intervalo o intervalo de confianza (IC).
3.1 Encontrar z a partir de un nivel de confianza Existen varias tablas en las cuales podemos encontrar el valor de z, según sea el área proporcionada por la misma Ejemplo 1: Encuentre el valor de z para un nivel de confianza del 95%.→0.95→0.475→1.96 (valor encontrado en la tabla) Para los valores de 96%, 97%... se utilizara el proceso de interpolación la cual consiste en fijar tres puntos en la tabla con los valores correspondientes. Así. x1 0.4798 fx1 2.05
x 0.48 fx ¿?
x2 0.4803 fx2 2.06
→Nivel de confianza del 96%
Estos valores se consiguen fácilmente pero es importante conocer la herramienta de cómo llegar a ellos. N.S Z
90% 1.645
91%
92%
93%
94%
3.2 Estimación para la media. Sabemos que la distribución muestral de media
95% 1.96
96% 2.054
⁄̅√
,
97%
98% 99%
ahora desconocemos el
parámetro y se quiere estimar por medio de la media muestral, por lo tanto al despejar a del modelo anterior nos queda:
√
Ejemplo 2 : La cooperativa Asotranba (con recorrido Villanueva – Riohacha- Villanueva) planea comprar una flota de nuevos vehículos para sus operaciones. La decisión depende de si el rendimiento del auto es en consideración es por lo menos 27.5 millas por galón de gasolina. Los 36 carros que prueba la cooperativa reportan una media de 25.6 millas por galón. Con una desviación estándar de 3.5 MPG. A un nivel de confianza de 99%, ¿qué aconsejaría a la cooperativa que hiciera?
̅ √ n=36;
→
Respuesta: la cooperativa no debe comprar esa flota ya que el valor de la media no oscila entre el margen que la cooperativa espera:
Ejemplo 3: Se encuentra que la concentración promedio de zinc que se saca del gua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3.
̅
3.3 Estimación de Proporciones: Sabemos que
al despejar p nos queda
En este despeje podemos observar que se necesita el valor del parámetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
Ejemplo 4: En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales .
⁄
→ Como se puede observar en este problema solo se solicitó un intervalo, pero es posible que la pregunta sea más que eso, donde ustedes deban tomar una decisión miremos el siguiente ejemplo.
Ejemplo 5: las empresas de búsqueda de ejecutivos se especializan en ayudar a las empresas a ubicar y asegurar talento para las altas gerencias. Tales firmas denominadas “cazadoras de Genios” son responsables de la ubicación de muchos de los mejores directores ejecutivos del país. La revista dinero reporto recientemente que “uno de cada
cuatro directores es una persona de fuera. Si en una muestra de 350 compañías de los Estados Unidos, 77 tienen directivos ejecutivos de afuera,¿ un intervalo de 99% de confianza apoyaría la afirmación? Z=2.575
⁄
→ Respuesta: se apoya la afirmación ya que la revista dinero está hablando que un 25% de los directores son personas de afuera. (Uno de cada cuatro-….1/4=0,25=25%) y este valor está dentro del rango calculado.
3.4 Estimación de diferencia de medias: Recordemos que:
̅ ̅ ̅̅ ̅ ̅ ̅ ̅ ̅ ̅
En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra sean mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual. Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor menos la media menor
Ejemplo 6: Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el promedio para el motor B es 24 millas por galón. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estándar poblacionales son 6 y 8 para los motores A y B respectivamente. ¿Qué motor recomienda?
̅ ̅ ̅ ̅ ;
;
;
;
;
La interpretación de este ejemplo sería que con un nivel de confianza del 96% la diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galón a favor del motor B. Esto quiere decir que el motor B da más rendimiento promedio que el motor A, ya que los dos valores del intervalo son positivos.
Ejemplo 7: Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como resultado promedio para la marca A 36,300 kilómetros y para la marca B 38,100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviación estándar de 5000 kilómetros para la marca A y 6100 kilómetros para la marca B. ¿Qué marca recomienda?
;
;
;
;
̅ ̅
̅ ̅
→ -2662,68
Como el intervalo contiene el valor “cero”, no hay razón para creer que el promedio de
duración del neumático de la marca B es mayor al de la marca A, pues el cero nos está indicando que pueden tener la misma duración promedio.
3.5 Estimación de diferencia de proporciones: Recordemos que:
Ejemplo 8: La empresa MOSTER S.A utiliza dos máquinas diferentes para cortar los disfraces para la temporada que se avecina “31 de octubre”. Se han presentado problemas
en cuanto al ajuste apropiado, debido al funcionamiento de las maquinas. Como director de control de calidad su trabajo es estimar la diferencia en la proporción de defectos producidos por cada máquina. Se tomaron muestras de tamaño n1= 170 y n2=150: la primera máquina produjo 38% de defectos y la segunda, 53% de defectos. Fijar un nivel de significancia de 96%. Si la evidencia sugiere que la diferencia en la proporción de defectos excede del 5%, todos los disfraces se producirán en la máquina que parezca tener una tasa de defectos menor. ¿Qué decisión tomará usted?
;
;
;
;
Se puede estar 96% seguro que la proporción de defectos producidos por las máquinas esta entre 3.7% y 26.3% a favor de la maquina 2 además el valor de 5% está dentro del rango determinado, el coordinador de calidad debe inclinarse por la maquina 2.
Ejemplo 9: Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.
;
;
;
;
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento producirá una disminución significativa en la proporción de artículos defectuosos comparado con el método existente. EJERCICIOS: 1- Se probó una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40 defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a la verdadera fracción de elementos defectuosos. 2- El decano registró debidamente el porcentaje de calificaciones I (insuficiente) y A (aceptable) otorgadas a los estudiantes por dos profesores universitarios de matemáticas. El profesor I alcanzó un 32%, contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente. Estime la diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos profesores. Utilice un nivel de confianza del 95% e interprete los resultados. 3- Suponga que se quiere estimar la producción media por hora, en un proceso que produce antibiótico. Se observa el proceso durante 100 períodos de una hora, seleccionados al azar y se obtiene una media de 34 onzas por hora con una desviación estándar de 3 onzas por hora. Estime la producción media por hora para el proceso, utilizando un nivel de confianza del 95%. 4-Se seleccionaron dos muestras de 400 tubos electrónicos, de cada una de dos líneas de producción, A y B. De la línea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la diferencia real en las fracciones de defectuosos para las dos líneas, con un coeficiente de confianza de 0.90 e interprete los resultados.
IV ESTIMACION DE TAMAÑO DE LA MUESTRA. Al iniciar cualquier investigación, la primera pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.
La varianza corresponde al grado de variabilidad que presentan las unidades de la población, mientras más grande sea mayor será el tamaño de la muestra. El valor de supuestamente conocido, de lo contrario se debe estimar a través de una investigación preliminar, en el caso de la proporción sucede algo similar pero se tiene la costumbre de tomar P=0,5con lo cual se tiene el máximo valor de n. Nivel de confianza. Tiene relación directa con el tamaño de la muestra, por lo tanto se dirá que a mayor nivel de confianza más grande debe ser el tamaño de la muestra.
Los recursos financieros y tiempo, no entran dentro de la determinación técnica del tamaño de la muestra. 4.1 Cálculo del Tamaño de la Muestra para Estimar una Media. Sin reemplazo
4.2 Cálculo del Tamaño de la Muestra para Estimar una Proporción. Sin reemplazo 4.3 Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias. =kn2
→n1
Tamaños de muestras iguales
los tamaños de muestras son diferentes.
4.4 Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Proporciones. =kn2
→n1
Tamaños de muestras iguales
los tamaños de muestras son diferentes
Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados fraccionarios. Ejemplos1: Una empresa eléctrica fabrica focos que tienen una duración aproximadamente
normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?
Ejemplo 2: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02?
Ejemplo3: Un director de personal quiere comparar la efectividad de dos métodos de entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje. Se divide un número de operarios en dos grupos iguales: el primero recibe el método de entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de entrenamiento? Como n1=n2 entonces
Cada grupo debe contener mínimo 31 empleados Ejemplo4: Una compañía de productos alimenticios contrató a una empresa de investigación de mercadotecnia, para muestrear dos mercados, I y II, a fin de comparar las proporciones de consumidores que prefieren la comida congelada de la compañía con los productos de sus competidores. No hay información previa acerca de la magnitud de las proporciones P1 y P 2. Si la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con una probabilidad de 0.95, ¿cuántos consumidores habrá que muestrear en cada mercado?
Se tendrá que realizar encuestas a 1201 consumidores de cada mercado para tener una estimación con una confianza del 95% y un error máximo de 0.04.