UNIVERSIDAD TECNOLÓGICA DEL PERÚ Vicerrectorado de Investigación
"ESTADÍSTICA APLICADA" TINS Básicos ADMINISTRACIÓN DE EMPRESAS, ADMINISTRACIÓN DE NEGOCIOS INTERNACIONALES, MARKETING EMPRESARIAL TEXTOS DE INSTRUCCIÓN BÁSICOS (TINS) / UTP Lima - Perú
ESTADÍSTICA APLICADA 2
© ESTADÍSTICA II Desarrollo y Edición:
Vicerrectorado de Investigación
Elaboración del TINS: Ing. Estadístico Nilton Horacio Machicao Bejar Diseño y Diagramación: Julia Saldaña Balandra Soporte académico: Instituto de Investigación Producción: Imprenta Grupo IDAT Queda prohibida cualquier forma de reproducción, venta, comunicación pública y transfo rmación de esta obra. ESTADÍSTICA APLICADA 3
ªEl presente material contiene una compilación de contenidos de obras de Estadística publicadas lícitamente, resúmenes de los temas a cargo del profesor, constituye un material auxiliar de enseñanza para ser empleado en el desarrollo de las clases de nuestra institución. Este material es de uso exclusivo de los alumnos y docentes de la Universidad Tecnológica del Perú, preparados para fines didácticos en aplicación del artículo inc. C y el Art.43 inc. A; del Decreto Legislativo 822; Ley sobre Derechos de Autorº
ESTADÍSTICA APLICADA 4
ESTADÍSTICA APLICADA 5 PRESENTACIÓN La Matemática, ciencia de la más alta jerarquía, en Ciencias, desde los albores de la civilización sigue desarrollo científico,
el concierto de las siendo la base del
tecnológico y humanístico de nuestro mundo.
La Estadística como conjunto de conocimientos de la Matemática, se erige en el espacio del pensamiento probabilístico, permite la sistematización
análisis de datos y la síntesis de resultados en el tratamiento de datos ; conduce a la validación de resultados y facilita la producción de informe s paramétricos, obtenidos en diferentes sucesos ocurridos en el acontecer de los actos del hombre. De allí que, en la formación académica de profesionales, se debe demandar el estudio de la Estadística en la convicción de dotar a sus estudiantes con un instrumento matemático analítico pertinente a la necesidad que plantea un determinado ejercicio, problema o proyecto en el campo de la política, la economía, la antropología de una sociedad, envueltos en la dinámica de la naturaleza y la cultura. En este marco, se ha desarrollado el presente texto de instrucción, dirigido a estudiantes de Administración; para la Asignatura de Estadística Aplicada, basado en una selección de temas, contenidos en diferentes fuentes bibliográficas, apropiados para la formación de profesionales en tecnología blanda. El texto en mención plasma la preocupación institucional de innovación de la enseñanza-aprendizaje en educación universitaria, que en acelerada continuidad promueve la producción de materiales educativos, actualizados en concordancia a las exigencias de estos tiempos. Comprende 6 unidades de instrucción de carácter aplicativo, matizado por ejercicios y problemas: La unidad I comienza con una exposición sobre las técnicas de conteo análisis combinatorio que es la base para entender a las probabilidades y sus propiedades y luego se expone acerca de la independencia de eventos y los teoremas de probabilidad total y de Bayes.
o
En la unidad II trata de las variables aleatorias discretas y continu as, función de probabilidad, esperanza matemática, variancia y sus propiedades. ESTADÍSTICA APLICADA 6 La unidad III trata de las principales distribuciones de probabilidades tanto discretas y continuas, como Bernoulli, Binomial, Hipergeométrica, Poisson, Normal y Normal Estándar. La unidad IV trata de las distribuciones muestrales, el teorema ite central, distribución Chi-cuadrado, ªtº de Student y ªFº de Snedecor.
del
lím
La
para
la
toma
unidad de
V
trata
de
la
inferencia
decisiones
en
medio
de
estadística,
incertidumbre,
se
tema
importante
divide
en
dos
partes
como son la estimación de parámetros y las pruebas de hipótesis. La
unidad
variancia
VI y
trata el
del
análisis
coeficiente
de
de
regresión
determinación
que
lineal nos
múltiple, permitirá
el
análisis
saber
nuestros un datos se adecuan o no a nuestrotablas modelo. Además al yfinal presenta apéndice con las principales estadísticas la bibliografía. Al
finalizar
estas
líneas,
el
reconocimiento
institucional
al
si se
profesor
de
Nilton Machicao Bejar, que habiendo trabajado con denuedo ha hecho posible éste texto de instrucción, como expresión de su destacada labor profesional y académica. VICERRECTORADO DE INVESTIGACIÓN ESTADÍSTICA APLICADA 7 ÍNDICE GENERAL Unidad I TEORÍA DE PROBABILIDADES...................................................... 1
1
Unidad II VARIABLES ALEATORIAS ........................................................... .. 37 Unidad III DISTRIBUCIÓN DE PROBABILIDADES ......................................... Unidad IV DISTRIBUCIONES MUESTRALES..................................................
61
79
Unidad V INFERENCIA ESTADÍSTICA ........................................................... 107 Unidad VI ANÁLISIS DE REGRESIÓN MÚLTIPLE .......................................... TABLAS ESTADÍSTICAS¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼¼.
135
163
BIBLIOGRAFÍA ..................................................................... ........... 183 ESTADÍSTICA APLICADA 8 ESTADÍSTICA APLICADA 9 DISTRIBUCIÓN TEMÁTICA CLASE N° TEMA SEMANA 1 Técnicas de conteo, Principio de Multiplicación y
Adición, Variaciones, Permutaciones y Combinaciones 1 2 Probabilidades: Definiciones básicas . Experimento, Experimento Aleatorio, Espacio Muestral, Evento o Suceso Aleatorio, Definición de probabilidad de un evento. Propiedades. 2 3 Reglas de Probabilidades de la Unión , suceso complementario. Probabilidad Condicional, Multiplicación de probabilidades, Independencia de eventos. 3 4 Partición de eventos, Probabilidad Total y Teorema de Bayes. 4 5 Probabilidad Total ± Teorema de Bayes. PRÁCTICA CALIFICADA N 1 5 6 Variable aleatoria. Función de Probabilidad. Función de Distribución. Distribución de variable Discreta . Distribución de Variable Continua. 6 7 Esperanza Matemática o valor esperado, Propiedades . Varianza, Propiedades. 7 8 Distribución de probabilidades. Distribuciones Discretas: Distribución Bernoulli, Distribución Binomial. PRÁCTICA CALIFICADA N 2 8 9 Distribución de Poisson y Distribución Hipergeométrica. 9 10 EXAMEN PARCIAL 10 11 Distribuciones Continuas: Distribución Normal. Distribución Normal Estandar. Manejo de la Tabla Z . PD: Distribución Muestral: T. Límite Central. 11 12 Distribuciones Muestrales: Distribución de Promedios Muestrales, Teorema del Limite Central PRÁCTICA CALIFICADA N 3 12 13 Distribución de Proporciones Muestrales. Distribución Chi-Cuadrado, Manejo de la Tabla c
2
13 ESTADÍSTICA APLICADA 10 CLASE N° TEMA SEMANA 14 Distribu ión ªtº de Student, Distribu ión ªFº de Snede or. Manejo de las tablas ªtº y ªFº. PRÁCTICA CALIFICADA N 4 14 15 Inferen ia Estadísti a. Estima ión de Parámetros y Estima ión por Intervalos para la Media y la Varian ia Pobla ional. 15 16 Prueba de Hipótesis. Tipos de Errores. Error Tipo I y Error Tipo II. Prueba de Hipótesis para la Media y Varian ia Pobla ional PRÁCTICA CALIFICADA N 5 16 17 Análisis de Regresión Lineal Múltiple. Coefi iente de Determina ión Múltiple. 17 18 Análisis de varianza (ANVA). Repaso 18 19 EXAMEN FINAL 19
ESTADÍSTICA APLICADA 11 UNIDAD I TEORÍA DE PROBABILIDADES
En la asignatura anterior se ha definido a la ESTADÍSTICA omo la ien ia del ono imiento humano, que se o upa de la ole ión, representa ión,
análisis y extra ión de on lusiones para toda una pobla ión, en base a datos propor ionados por muestras aleatorias. La ESTADÍSTICA es una matemáti a apli ada, que na e de la preo upa ión de los gobernantes y es base de toma de de isiones en medio de in ertidumbre. La Estadísti a, omo un método de toma de de isiones, debe evaluar la onfiabilidad y riesgos existentes en todo pro eso de estima ión. Esto e s posible gra ias a la teoría de probabilidades, base de la teoría Estadísti a, que permite generar indi adores de onfiabilidad o riesgo. El término probabilidad fre uentemente es rela ionado on azar, es de ir, probabilidad es la posibilidad de que o r ejemplo, si la probabilidad que un estudiante elegido al Estadísti a es 0.02, esto signifi aría que es bien remota o po o apruebe.
posibilidad y urra algo, po azar apruebe posible que
Para entender bien a la teoría de probabilidades o ál ulo de probabilidades es importante tener un buen dominio de las té ni as de onteo o análisis ombinatorio, es por ello que omenzare exponiendo este tema. TÉCNICAS DE CONTEO O ANÁLISIS COMBINATORIO PRINCIPIO DE MULTIPLICACIÓN Si un experimento puede o urrir de ªnº maneras diferentes y otro experimento puede o urrir de ªmº maneras diferentes, el número total de maneras diferentes en que pueden o urrir ambas simultáneamente es:
ªnxmº ESTADÍSTICA APLICADA 12 EJEMPLOS 1. Se hay? lanzan 2 monedas simultáneamente. ¿Cuántos resultados posibles SOLUCIÓN: La primera moneda tiene 2 posibilidades de aer: ara( ) o sello(s) La segunda moneda tiene 2 posibilidades de aer
o s
Enton es por el prin ipio de multipli a ión hay, 2x2 = 4, resultados posibles, es de ir: , s, s y ss. 2. Al lanzar simultáneamente un dado y una moneda. ¿Cuántos resultados posibles hay? SOLUCIÓN: El dado tiene 6 posibilidades: 1,2,3,4,5 ó 6 La moneda tiene 2 posibilidades: ó s Enton es por el prin ipio de multipli a ión hay, 6x2 = 12, resultados
posibles. COROLARIO Si se eje utan ªnº experimentos on m 1 , m 2 , m 3 , . . . , m n resultados posibles respe tivamente, enton es, el número total de resultados posibles es:
EJEMPLO ¿De uántas maneras diferentes pueden aer si lanzamos 3 monedas? SOLUCIÓN: Como ada moneda puede aer de 2 maneras diferentes, enton es las tres pueden aer de 2x2x2 = 2 3 = 8 maneras diferentes. Es de ir:
,
s, s , ss, s , s s, ss
y sss
m 1 x m 2 x m 3 x ¼ x m n ESTADÍSTICA APLICADA 13 PRINCIPIO DE ADICIÓN Si un experimento puede o urrir de ªnº ó ªmº maneras diferentes, enton es di ho experimento puede o urrir de: ªn + mº maneras diferentes. EJEMPLO Un estudiante para ir a la UTP puede ha erlo en la ombi A, B, ombi C o a pie. ¿De uántas maneras diferentes puede asistir a la UTP?
ombi
SOLUCIÓN: Como puede ualquiera de las 3 ombis, puede ir a tomar pie, tiene una posibilidad, enton estiene por 3elposibilidades prin ipio deo adi ión, tiene 3 + 1 = 4 maneras diferentes de ir a la UTP.
VARIACIÓN Dado ªnº objetos una varia ión de estos ªnº objetos tomados de ªrº en ªrº, es un arreglo de ªrº de estos objetos, en el ual el orden tiene importan ia. El número total de varia iones esta dado por:
Donde ªnº y ªrº son enteros y positivos; r £ n Re ordar: 1) n! = nx(n-1)!x(n-2)!x(n-3)!x · · · X3x2x1 , ∀ n entero y positivo 2) 0! = 1 EJEMPLO Hallar el número de formas que se puede onfe ionar una bandera de franjas de 3 olores, si se tiene tela de 5 olores distintos. SOLUCIÓN: Si onsideramos franjas verti ales, tenemos: n = 5 y r = 3, omo el orden importa, enton es, nos piden: 60 1 2 1 2 3 4 5 )! 3 5 ( ! 5 5 3 = = = x x x x x V ESTADÍSTICA APLICADA 14 PERMUTACIÓN (P n) Cuando n=r la variación recibe el nombre de permutación de ªnº elementos, es decir: ! ! 0 ! )! ( ! n n n n n V P n n = = = = , puesto que 0! = 1, entonces:
EJEMPLO ¿De cuántas maneras diferentes pueden sentarse 5 personas en una banca? SOLUCIÓN: Siempre que en un arreglo se use la totalidad de elementos a la vez se trata de una permutación, como en este caso. P 5
= 5! = 120
PERMUTACIONES CIRCULARES (P C ) En este tipo de agrupaciones no hay primero, ni último elemento, por encontrarse todos en una línea cerrada. El número de permutaciones de ªnº elementos tomados alrededor del círculo es:
EJEMPLO ¿De cuántas maneras diferentes se pueden sentar 5 personas en una meza redonda? SOLUCIÓN: P c = (5 ± 1)! = 4! = 24 PERMUTACIONES CON REPETICIÓN El número total de permutaciones de ªnº elementos repetidos n 1 2, n , n 3 , . . . ,n k veces es: ESTADÍSTICA APLICADA 15 Donde: n 1+ n 2 + n 3
k
+ . . . + n = n
EJEMPLO ¿Cuántas palabras diferentes pueden formarse con las letras de la palabra MISSISSIPPI? SOLUCIÓN: Como M=1, I=4, S=4, P=2 y n = 11, entonces: 34650 ! 2 !· 4 !· 4 !· 1 ! 11 11 2 , 4 , 4 , 1 = = P COMBINACIÓN Dados ªnº objetos, una ombina ión de los ªnº objetos tomados de ªrº en ªrº es un arreglo de ªrº de estos objetos, en el ual el orden no es importante. El número total de ombina iones esta dado por:
Donde ªnº y ªrº son enteros y positivos; r £ n EJEMPLO ¿Cuántos omités de 3 personas pueden formarse de un grupo de 9 personas? ESTADÍSTICA APLICADA 16 SOLUCIÓN: Como n = 9 y r = 3 y el orden no importa, enton es: 64 !1 26 73 8! 96 ! 3 )! 3 9 ( ! 9 9 3 = = = x x x x x x x C El número total de comités de 3 personas que pueden formarse con 9 personas es 64. EJERCICIOS RESUELTOS 1. De entre 5 ejemplares de un texto de Matemática, 3 de
Administración y 2 de Contabilidad; hay que escoger un ejemplar de cada texto. Calcular el número de formas diferentes para hacerlo. SOLUCIÓN: El texto de Matemática puede escogerse de 5 maneras diferentes. El texto de Administración puede escogerse de 3 maneras diferentes. El texto de Contabilidad puede escogerse de 2 maneras diferentes. Entonces, por el principio de multiplicación hay, 5x3x2 = 30 formas diferentes de escoger un ejemplar de cada texto. 2. ¿De cuántas maneras diferentes pueden caer si lanzamos 2 dados y una moneda? SOLUCIÓN: Por el principio de multiplicación: Cada dado puede caer de 6 formas diferentes y la moneda de 2 formas diferentes; entonces: 6x6x2 = 72. 3. En el último campeonato mundial de fútbol participaron 32 países donde los premios fueron medallas de oro, plata y bronce. ¿De cuántas formas pueden distribuirse las medallas? SOLUCIÓN: Número de países = n = 32 Número de medallas = r= 3 Como el orden es importante, se trata de una variación, entonces existen ESTADÍSTICA APLICADA 17 29760 30 31 32 " 29 ! 29 30 31 32 ! 29 ! 32 32 3 = = = = x x x x x V formas diferentes de distribuirse las 3 medallas entre los 32 países. Observe que también puede usarse el principio de multiplicación. 4. ¿Cuántos collares diferentes se pueden formar con 7 perlas diferentes? SOLUCIÓN: Como los collares tienen forma circular, es decir no hay ni primer ni Púltima perla, se trata de una permutación circular, entonces: c = 360 2
720 2 ! 6 2 )! 1 7 ( = = = Observe que: A, B, C, D, E, F, G es igual a:
G, F, E, D, C, B, A
Por este motivo se ha dividido entre 2. 5. Una sociedad científica está formada por 25 personas y es necesario elegir al presidente, al vicepresidente, al secretario y al tesorero. ¿De cuántas formas se puede efectuar esta elección si cada miembro de la sociedad puede ocupar sólo un cargo? SOLUCIÓN: Número de científicos = 25 El presidente puede ser cualquiera de los 25 científicos, el vicepresidente cualquiera de los 24 restantes, el secretario cualquiera de los 23 restantes y el tesorero cualquiera de los 22 científicos que quedan, entonces por el principio de multiplicación, hay 25x24x23x22 = 303600 formas diferentes de realizar esta elección. 6. Kattia, Dajana y 10 amigos se encuentran reunidos. ¿De cuántas maneras diferentes pueden sentarse en una banca si las 2 amigas siempre deberán permanecer juntas?
1 2 A 3 4
SOLUCIÓN: Una primera forma seria: Katty Dajana A A
A
5 A A 6 A 7 A 8 A 9 A 10 11
, esto es: P
= 11!, se comotiene lasquedosmultiplicar amigas pueden intercambiar posiciones por 2, es decir el resultado seria: 2!x 11! = 79833600. ESTADÍSTICA APLICADA 18
7. Se encuentran reunidos 16 cachimbos en la UTP de los cuales 10 son varones. Se desea formar un comité de 9 cachimbos. ¿De cuántas maneras se puede formar el comité, si debe haber necesariamente 4 damas en el comité? SOLUCIÓN: Como hay 6 damas, entonces pueden integrar el comité 4, 5 y hasta 6 damas. 1 Cuando integran 4 damas habrá 5 varones en el comité: 3780 10 5 6 4 = xC C 2 Cuando integran 5 damas habrá 4 varones en el comité: 1260 10 4 6 5 = xC C 3 Cuando integran 6 damas habrá 3 varones en el comité: 120 10 3 6 6 = xC C El número total de maneras será: 3780 + 1260 + 120 = 5160. Observación: Se trata de combinación puesto que el orden no importa. 8. Los ingleses suelen dar varios nombres a sus hijos. ¿De cuántas formas es se 300 puede un más nombre a un niño si el número total de nombres y ledar dan no de 3 nombres? SOLUCIÓN: En este caso el orden importa, entonces se tratará de variaciones, como le dan no mas de 3 nombres, esto significa que el nombre puede estar compuesto de uno, dos ó tres nombres, esto es: 26820600 300 3 300 2 300 1 = + + V V V
ESTADÍSTICA APLICADA 19 EJERCICIOS PROPUESTOS 1. De entre 10 ejemplares de un texto de Matemática, 8 de Administración y 5 de Contabilidad; hay que escoger un ejemplar de cada texto. Calcular el número de formas diferentes para hacerlo. 2. ¿De cuántas maneras diferentes pueden caer si lanzamos 2 dados y 3 monedas? 3. En el último campeonato mundial de fútbol que participó Perú fue el año 1982, en el cual participaron 24 países donde los premios fueron medallas de oro, plata y bronce. ¿De cuántas formas pueden distribuirse las medallas? 4. ¿Cuántos collares diferentes se pueden formar con 10 perlas diferentes? 5. Una sociedad científica está formada por 20 personas y es necesario elegir al presidente, al vicepresidente y al secretario. ¿De cuántas formas se puede efectuar esta elección si cada miembro de la sociedad puede ocupar sólo un cargo? 6. Lizbeth, Rocío, Zaida y 9 amigos se encuentran reunidos. ¿De cuántas maneras diferentes pueden sentarse en una banca si las 3 amigas siempre deberán permanecer juntas? 7. Se encuentra reunidos 20 cachimbos en la UTP de los cuales 15 son varones. Se desea formar un comité de 8 cachimbos. ¿De cuantas maneras se puede formar el comité, si debe haber necesariamente 4 damas en el comité? 8. Los ingleses suelen dar varios nombres a sus hijos. ¿De cuántas formas es se 50puede dar nounmásnombre a un niño si el número total de nombres y le dan de 4 nombres? 9. Vanesa, Juanita y 8 amigos se encuentran reunidos. ¿De cuántas maneras diferentes pueden sentarse en una banca si las 2 amigas nunca deberán permanecer juntas? 10. Yovana, Pamela, Lizeth y 12 amigos se encuentran reunidos. ¿De cuántas maneras diferentes pueden sentarse en una banca si las 3 amigas nunca deberán permanecer juntas? ESTADÍSTICA APLICADA 20 11. ¿De cuántas maneras diferentes pueden sentarse los 2 primeros estudiantes que llegan a un aula de 20 carpetas? 12. Un estudiante posee 10 monedas de distintos valores. ¿Cuántas sumas diferentes de dinero puede formar con las 10 monedas?
13. Sarita tiene seis amigos. ¿De cuántas maneras puede invitar a por lo menos uno de ellos a cenar? 14. Los números de las placas de los automóviles, están formados por 2 letras y 4 cifras. Hallar el número total de placas que se puedes confeccionar. 15. Un comité estudiantil de 12 personas debe ser formado, entre 100 cachimbos(60 hombres y 40 mujeres), 80 estudiantes intermedios(50 hombres y 30 mujeres), 70 estudiantes avanzados(46 hombres y 24 mujeres) y 40 graduados(28 hombres y 12 mujeres). Encuentre el número total de diferentes comités que se pueden formar bajo cada una de los siguientes requerimientos: a) No se imponen restricciones a la formación del comité. b) Siete estudiantes deben ser hombres y 5 mujeres. c) El comité debe contener el mismo número de estudiantes de cada clase. d) El comité debe contener 2 hombres y una mujer de cada clase. e) El presidente del comité debe ser graduado y hombre. 16. En la siguiente figura se representa el plano de una ciudad :
Un caminante desea trasladarse del punto A hasta el punto B por el camino más corto, es decir, desplazarse todo el tiempo o bien de izquierda a derecha, o bien de abajo hacia arriba . ¿Por cuántos caminos puede llegar desde A hasta B?. B
A
ESTADÍSTICA APLICADA
21 17. Una contraseña para acceder a una computadora consiste de 6 caracteres que pueden ser letras (26) o números (10). a) ¿Cuántas contraseñas distintas se pueden formar? b) ¿Cuántas contraseñas distintas se pueden formar conteniendo sólo números? c) ¿Cuántas contraseñas distintas se pueden formar si deben tener por lo menos una letra?. 18. Ocho Asumiendo atletas compiten en cruzan la finalla olímpica los 110instantes. metros con vallas. que ellos meta en dedistintos ¿Cuántas maneras distintas hay para entregar las medallas de oro, de plata y de bronce?.
19. Una señora tiene 8 amigas y desea invitar a 5 de ellas a una fiesta. ¿De cuántas maneras puede hacerlo si dos de ellas están enojadas entre sí y no pueden ser invitadas juntas?. 20. Suponga que un artículo es comercializado por dos empresas A y B. La empresa A tiene 5 tiendas y la empresa B tiene 8 tiendas, a través de las cuales se vende dicho artículo. ¿De cuántas maneras diferentes puede un cliente comprar un artículo?. 21. Un grupo de 7 personas deben participar en una serie de charlas a llevarse a cabo en dos días sucesivos. En el primer día deben participar 3 personas, y en el segundo día las 4 personas restantes. ¿ De cuántas maneras diferentes se puede organizar las charlas del primer día?. 22. En el siguiente diagrama A, B, C, D, E y F denotan islas y las líneas de unión son puentes. Un hombre empieza en A y camina de isla en isla, se detiene para almorzar cuando no puede continuar caminando sin tener que cruzar el mismo puente dos veces. Hallar el número de maneras de cómo puede hacer su recorrido antes de ir a almorzar. ESTADÍSTICA APLICADA 22 PROBABILIDADES EXPERIMENTO Un experimento es cualquier proceso de ensayo y observación. EXPERIMENTO ALEATORIO Es cualquier experimento real o hipotético que pueda dar lugar a varios resultados sin que sea posible anunciar con certeza cuál de estos resultados va a ser observado. A estos experimentos también se les conoce como no determinísticos. EJEMPLOS 1. Lanzamiento de una moneda balanceada. En este caso los resultados posibles serán: cara ( c ) o sello ( s ). 2. Lanzamiento de un dado no cargado (insesgado). En este caso los resultados posibles serán: 1, 2, 3, 4, 5 ó 6. CARACTERÍSTICAS DEL EXPERIMENTO ALEATORIO (O ESTOCÁSTICO) 1. Se tiene varios resultados posibles. 2. Estos resultados tienen cierta incertidumbre de aparecer, es decir, no podemos afirmar con certeza cual de los resultados va a ser observado. ESPACIO MUESTRAL ( S ) Es el conjunto de todos los resultados posibles de un experimento aleatorio. Para anteriores, S =los ⎨c ,ejemplos s ⎬ ⇒ n(S) = 2 ytenemos: S = ⎨1, 2, 3, 4, 5, 6 ⎬ ⇒ n(S) = 6 EVENTO ( E )
Es un subconjunto del espacio muestral. EJEMPLO Si se lanza un dado, un evento seria que salgan números pares, es decir: E = ⎨2, 4, 6 ⎬ ⇒ n(E) = 3
ESTADÍSTICA APLICADA 23 PROBABILIDAD La probabilidad de un evento es la razón entre el número de casos favorables y el número total de casos posibles; es decir: número de elementos del evento entre número de elementos del espacio muestral. Es decir:
EJEMPLOS 1. ¿Cuál es la probabilidad de que salga cara al lanzar una moneda? P 2 1 ) ) = S E
=
SOLUCIÓN:
( ( n n
2. ¿Cuál es la probabilidad de que salga el 2 al lanzar un dado? P = 6 1
SOLUCIÓN:
)) (( = S n E n PROPIEDADES Sean los eventos A , B Y C , entonces: 1. 0 £ P(A) £ 1 2. P(S) = 1 3. P(Æ) = 0 4. P(AUB) = P(A) + P(B) Si: A Ç B = Æ 5. P(AUB) = P(A) + P(B) ± P(A Ç B) Si: A Ç B ¹ Æ 6. P(AUBUC) = P(A) + P(B) + P(C) ± P(A Ç B) ± P(A Ç C) ± P(B Ç C) + P(AP(A¢)= Ç B Ç1C)± P(A) 7.
ESTADÍSTICA APLICADA 24 EJERCICIOS RESUELTOS 1. Se lanzan dos monedas. ¿Cuál es la probabilidad de que ambas salgan cara? SOLUCIÓN: Como S = {(C,C), (C,S), (S,C), (S,S) } favorable: ( C,C), entonces: P = 4 1
y hay un solo caso
2. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que la suma de los puntos obtenidos sea igual a 10. SOLUCIÓN: Por el principio de multiplicación: n(S) = 6x6 = 6 2 = 36 y sea el evento, suma de puntos igual a 10, es decir, (4,6), (6,4) y (5,5) entonces: n(E) = 3 Luego: p = 12 1 36 3 = 3. Se tiene una baraja de 52 cartas. ¿Cuál es la probabilidad de que la primera que se saque sea de espadas? SOLUCIÓN: Como n(s) = 52 y hay 13 espadas, es decir: n(E) = 13, entonces: P = 52 13 4. El vicerrector académico informa que de 200 desaprobados, 30 son de Matemática, 50 de Estadística y 10 de Métodos Cuantitativos. ¿Cuál es la probabilidad de que un estudiante elegido azar desapruebe Estadística? SOLUCIÓN: PEn=este caso: n(S) = 200 4 1 200
y hay 50 casos favorables, entonces:
50 = ESTADÍSTICA APLICADA 25 5. Una urna contiene bolillas numeradas del 1 al 5. Se sacan sucesivamente al azar las 5 bolillas (sin reposición). Hallar la probabilidad de que juntando los números de cada bolilla según el orden de extracción resulte el número 53412. SOLUCIÓN: El espacio muestral es: n(S) = 5! = 120 y hay un solo caso favorable, entonces: P = 120 1 ! 5 1 = 6. Una urna contiene 8 bolillas rojas y 10 bolillas verdes. Se sacan al azar y de una vez 6 bolillas, ¿cuál es la probabilidad de que todas ellas sean verdes? SOLUCIÓN: Como el orden no importa se trata de combinaciones, entonces: P = 011312217 , 0 442 5 18 6 10 6 = = C C 7. Se tiene 5 pares de zapatos mezclados y cada par es distinto de los demás. Si se eligen 2 zapatos al azar, hallar la probabilidad de que correspondan a un mismo par. SOLUCIÓN: Como el orden no importa, se trata de una combinación, es decir: n(S) = 45
10 2 = C p = 9 145 5 =
y hay 5 casos favorables, entonces:
8. Los eventos A y B son mutuamente excluyentes, si P(A) = 0.25 y P(B) = 0.15. ¿Cuál es la probabilidad de que ocurra A o B? SOLUCIÓN: Sabemos que P(AUB) = P(A) + P(B) P(AUB) = 0.25 + 0.15 = 0.40.
Si: A Ç B = Æ , entonces:
ESTADÍSTICA APLICADA 26 EJERCICIOS PROPUESTOS 1. Se lanzan tres monedas. ¿Cuál es la probabilidad de que todas salgan sello? 2. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que la suma de los puntos obtenidos sea igual a 8. 3. Se tiene una baraja de 52 cartas. ¿Cuál es la probabilidad de que la primera que se saque sea el as de corazones? 4. El vice rector académico informa que de 500 desaprobados, 80 son de Matemática, 125 de Estadística y 30 de Métodos Cuantitativos. ¿Cuál es la probabilidad de que un estudiante elegido azar desapruebe Matemática? 5. Una urna contiene 10 bolillas numeradas del 0 al 9. Se sacan sucesivamente al azar 5 bolillas (sin reposición). Hallar la probabilidad de que juntando los números de cada bolilla según el orden de extracción resulte el número 20957. 6. Una urna contiene 10 bolillas negras y 12 bolillas rojas. Se sacan al azar y de una vez 5 bolillas, ¿cuál es la probabilidad de que todas ellas sean negras? 7. Se tiene 8 pares de zapatos mezclados y cada par es distinto de los demás. Si se eligen 2 zapatos al azar, hallar la probabilidad de que correspondan a un mismo par. 8. Los eventos son mutuamente P(B) = 0.35. ¿CuálAesy laBprobabilidad de queexcluyentes, no ocurra ni si A niP(A) B? = 0.40 y 9. Se desea entrevistar a un grupo de empleados de la UTP con respecto a un plan de pensiones, se efectuaran entrevistas detalladas a cada uno de los empleados seleccionados en una nuestra aleatoria. Estos se clasificaron como sigue: CLASIFICACIÓN N DE EMPLEADOS Vigilantes 16 Mantenimiento 14 Docentes 50 Secretarias 20
ESTADÍSTICA APLICADA 27 ¿Cuál es la probabilidad de que la primera persona seleccionada:
a) sea docente o secretaria? b) sea vigilante o de mantenimiento? c) no sea vigilante? 10. El directorio de la empresa MACHI SAC está formado por seis hombres y tres mujeres. Se desea seleccionar un comité de tres miembros, en forma aleatoria, para que recomienden a un nuevo presidente de la empresa. a) ¿Cuál es la probabilidad de que sean mujeres los tres miembros del comité? b) ¿Cuál es la probabilidad de que sean hombres los tres miembros del comité? 11. Se lanzan cuatro monedas. ¿Cuál es la probabilidad de que todas salgan cara? 12. Se lanzan cuatro monedas. ¿Cuál es la probabilidad de que salgan dos sellos? 13. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que la suma de los puntos obtenidos sea a lo más 10. 14. Se lanzan 2 dados al azar y se quiere hallar la probabilidad de que la suma de los puntos obtenidos sea por lo menos 4. 15. Una urna contiene 8 bolillas numeradas del 1 al 8. Se sacan sucesivamente al azar 4 bolillas. Hallar la probabilidad de que juntando los números, de cada una, en el orden de extracción resulte el número 7656. 16. Una urna contiene 6 bolillas blancas y 10 bolillas rojas. Se sacan al azar 7 bolillas de una vez, hallar la probabilidad de que todas sean rojas. 17. En una carrera de autos participan los competidores A, B, C y D. Se sabe que uno de ellos necesariamente debe de ganar. Si la probabilidad de que gane A es el doble de la de B, la de B es la mitad de C y la de D es el triple de A, ¿Cuál es la probabilidad que gane D?.
ESTADÍSTICA APLICADA 28 18. De 100 estudiantes, 48 llevan Matemática, 32 Estadística y 40 Administración; 16 Matemática y Estadística ,13 Administración y Estadística , 20 Matemática y Administración, y 22 ninguno de los 3 cursos . Si se elige un estudiante al azar, ¿Cuál es la probabilidad de que lleve?: a) Solo Estadística. b) Solamente Matemática o Administración. c) Solamente Estadística y Administración. 19. Se tienen 6 libros, de los cuales uno es de economía y otro es de estadística. Si los libros se ordenan aleatoriamente de izquierda a derecha, hallar la probabilidad que: a) Los libros de economía y estadística estén juntos. b) Uno de los libros (economía y estadística) esté al inicio
(primera posición desde la izquierda) o que los libros de economía y estadística no estén juntos. 20. En una reunión de 30 personas, ¿cuál es la probabilidad de que, por lo menos dos de ellas, cumplan años el mismo día? 21. Suponga que en una clase de 50 estudiantes, 30 alumnos opinan que el profesor es claro, 8 alumnos opinan que el material bibliográfico es deficiente, 35 alumnos opinan que el sistema de evaluación es exigente, 5 alumnos opinan que el profesor es claro y que el material bibliográfico es deficiente, 22 alumnos opinan que el profesor es claro y que el sistema de evaluación es exigente, 3 alumnos opinan que el material bibliográfico es deficiente y que el sistema de evaluación es exigente, y 5 alumnos opinan que el profesor no es claro, que el material bibliográfico no es deficiente y que el sistema de evaluación no es exigente. Si se elige al azar un alumno, hallar la probabilidad que: a) El alumno opine que el sistema de evaluación es exigente o que el material bibliográfico es deficiente. b) El alumno opine que el sistema de evaluación es exigente o que: el profesor es claro y el material bibliográfico es deficiente. 22. Una empresa tiene dos maneras A y B de presentar un nuevo producto al mercado. Si presenta el producto de la manera A la probabilidad de que el producto sea exitoso es 0.44 y si lo presenta de la manera B la probabilidad de éxito se reduce a 0.29. La probabilidad de que el producto fracase con ambas maneras de presentación es 0.37. ¿Cuál es la probabilidad de que el producto sea exitoso con ambas formas de presentación? ESTADÍSTICA APLICADA 29 23. Se desea hallar la probabilidad de sacar por lo menos una vez el 6 al lanzar un dado 4 veces. 24. Se desea hallar la probabilidad de sacar dos seis por lo menos una vez al lanzar dos dados 24 veces. 25. Se tiene una baraja de 40 cartas, donde hay 4 ases. Se reparten éstas entre 4 personas, ¿qué probabilidad hay de que a cada una le toque un as? 26. En una reunión de 30 personas,¿Cuál es la probabilidad de que, por lo menos dos de ellas, cumplan años el mismo día? PROBABILIDAD CONDICIONAL Si A y B son dos eventos de un espacio muestral S; entonces, la probabilidad condicional de que ocurra el evento A dado que el evento B ya ocurrió esta dado por:
∀ P(B) ¹ 0
También se umple que:
∀ P(A) ¹ 0 MULTIPLICACIÓN DE PROBABILIDADES Si A, B y C son tres eventos de un espa io muestral S; enton es, s e umple que: 1. P(AÇB) = P(A) P(B/A) P(AÇB) = P(B) P(A/B) ESTADÍSTICA APLICADA 30 2. P(AÇBÇC) = P(A)P(B/A)P(C/AÇB) P(AÇBÇC) = P(B)P(A/B)P(C/AÇB) P(AÇBÇC) = P(C)P(A/C)P(B/AÇC) P(AÇBÇC) = P(A)P(C/A)P(B/AÇC) P(AÇBÇC) = P(B)P(C/B)P(A/BÇC) P(AÇBÇC) = P(C)P(B/C)P(A/BÇC) P(AÇBÇC) = P(AÇB)P(C/AÇB) P(AÇBÇC) = P(AÇC)P(B/AÇC) P(AÇBÇC) = P(BÇC)P(A/BÇC) INDEPENDENCIA DE EVENTOS INDEPENDENCIA DE DOS EVENTOS Dos eventos A y B son independientes si:
Dos eventos son independientes si la o urren ia de uno de ellos no afe ta la o urren ia del otro evento. Es de ir, también se umplen que: P(A/B) = P(A)
y P(B/A) = P(B)
INDEPENDENCIA DE TRES EVENTOS Tres eventos A, B y C de un espa io muestral S son mutuamente independientes si umplen las siguientes ondi iones: 1. P(A Ç B) = P(A)P(B) 2. P(A Ç C) = P(A)P(C) 3. P(B Ç C) = P(B)P(C) 4. P(AÇBÇC) = P(A)P(B)P(C) PARTICIÓN DE EVENTOS Los eventos A 1 , A 2 , A 3 , · K
·
· , A
forman una parti ión del espa io muestral S, si umplen las siguientes ondi iones: 1. A i ¹ Æ ∀ i = 1, 2, 3, · · · , k 2. A i Ç A j = Æ ∀ i ¹ j , i , j = 1, 2, 3, · · · , k 3. A 1 È A 2 È A 3 È · · · È A K = S ESTADÍSTICA APLICADA 31 TEOREMA DE PROBABILIDAD TOTAL Sean los eventos A 1 , A 2 , A 3 , · · · , A K , los uales forman una parti ión del espa io muestral S, y sea B otro evento ualquiera de S; enton es, se umple que: TEOREMA DE BAYES 1Sean los eventos A , A 2 , A 3 , · · · , A K , los uales forman una parti ión del espa io muestral S, y sea B otro evento ualquiera de S; enton es, se umple que:
EJERCICIOS 1. SupongaRESUELTOS que P(A) = 0.35 y P(B/A) = 0.25 . Hallar P(A Ç B). SOLUCIÓN: Sabemos que P(AÇB) = P(A) P(B/A) enton es,
P(AÇB) = (0.35)(0.25) = 0.0875 2. En un lote de 15 artí ulos se tiene 4 defe tuosos. Si se eligen a l azar y sin reemplazo tres artí ulos, hallar la probabilidad que los 3 artí ulos elegidos sean defe tuosos.
i
SOLUCIÓN: Sea D = {el i-ésimo artí ulo es defe tuoso}, enton es:
P(D 1 Ç D 2 ÇD 3 ) = P(D 1 )P(D 2 )P(D 3 ) P(D 1 Ç D 2 ÇD 3 ) = 00879121 . 0 455 4 ) 13 2 )( 14 3 )( 15 4 ( = = ESTADÍSTICA APLICADA 32 3. Una urna ontiene 10 bolillas rojas, 8 negras y 12 azules. Si se eligen al azar y sin reemplazo 3 bolillas, hallar la probabilidad que las 3 bolillas sean negras. SOLUCIÓN: Sea N i= {la i-ésimo bolilla es negra}, enton es: P(N 1 Ç N
2 ÇN 3 ) = P(N 1 )P(N 2 )P(N 3 ) P(N 1 Ç N 2 ÇN 3 ) = 013793103 . 0 145 2 ) 28 6 )( 29 7 )( 30 8 ( = = 4. En una urna hay 15 bolillas numeradas del 1 al 15. Si se van sa ando una a una al azar sin reposi ión, ¿ uál es la probabilidad de que la bolilla número 5 salga pre isamente en la quinta extra ión? SOLUCIÓN: La probabilidad de que la bolilla N 5 no salga en la 14/15; la probabilidad de que tampo o salga la 13/14; tampo o la ter era vez es 12/13; tampo o 11/12 y la probabilidad de que si salga en la Luego la probabilidad bus ada es: P = 066666666 . 0 15 1 11 1 · 12 11 · 13 12 · 14 13 · 15 14 = =
primera vez es segunda vez es la uarta vez es quinta vez es 1/11.
5. Se lanza una moneda 3 ve es. Sea el evento A de que aiga ara en ada uno de los dos primeros lanzamientos, B es el evento de que aiga sello en el ter er lanzamiento y C de que aigan exa tamente dos sellos en los tres lanzamientos, ompruebe que los eventos A y B son independientes mientras que B y C son dependientes. SOLUCIÓN: El espa io muestral para este experimento seria: S = { , s, s , ss, s , s s, ss , sss} De a uerdo al enun iado los eventos serian: A = { , s } B = { s, ss, s s, sss} C = { ss, s s, ss } ESTADÍSTICA APLICADA 33
Para que A y B sean independientes debe umplirse: P(AÇB) = P(A)P(B)
Como AÇB = { s}, enton es: P(AÇB) = 1/8 P(B) = 4/8 = ½
;
P(A) = 2/8 =
Luego: P(AÇB) = P(A)P(B) 2 1 · 4 1 8 1 = 8 1
⇒
81 = es decir A y B son independientes. Para que B y C sean dependientes debe cumplirse: P(BÇC) ¹ P(B)P(C) Como BÇC = {css, scs}, entonces: P(BÇC) = 1/4 ; P(B) = 1/4 P(C) = 3/8 Luego; como: P(BÇC) ¹ P(B)P(C) 8 3 · 21 4 1 ¹
⇒
y
y
16 3 4 1 ¹ es decir B y C son dependientes. 6. El equipo de la UTP juega el 70% de sus partidos en la noche, y el 30% durante el día. El equipo gana el 50% de sus partidos nocturnos y el 90% de los diurnos. De acuerdo con un diario de hoy día, la UTP ganó ayer. ¿Cuál es la probabilidad de que el partido se haya jugado en la noche?. SOLUCIÓN: De acuerdo a los datos se tiene que: P(juegue de noche) = 0.70 P(juegue de día) = 0.30 P(gane/juegue de noche) = 0.50 P(gane/juegue de día) = 0.90 Entonces por el teorema de Bayes: P(juegue de noche/gane) = ) / ( )· ( )· / ( )· ( ) / ( )· ( a jueguededi gane P a jueguededi P he jueguedeno gane P he jueguedeno P he jueguedeno gane P he jueguedeno P
ESTADÍSTICA APLICADA 34 Reemplazando: P(juegue de no he/gane) = 564516129 . 0 62 . 0 35 . 0 90 . 0 · 30 . 0 50 . 0 · 70 . 0 50 . 0 · 70 . 0 += =
EJERCICIOS PROPUESTOS 1. Suponga que P(A) = 0.50 y P(B/A) = 0.40 . Hallar P(A Ç B). 2. En un lote de 18 artí ulos se tiene 5 defe tuosos. Si se eligen a l azar y sin reemplazo tres artí ulos, hallar la probabilidad que los 3 artí ulos elegidos no sean defe tuosos. 3. Una urna ontiene 6 bolillas rojas, 8 negras y 10 azules. Si se eligen al azar y sin reemplazo 3 bolillas, hallar la probabilidad que las 3 bolillas sean azules.
4. En una urna hay 25 bolillas numeradas del 1 al 25. Si se van sa ando una a una al azar sin reposi ión, ¿ uál es la probabilidad de que la bolilla número 10 salga pre isamente en la dé ima extra ión? 5. Se lanza una moneda 3 ve es. Sea el evento A de que aiga sello en ada uno de los dos primeros lanzamientos, B es el evento de que aiga ara en el ter er lanzamiento y C de que aigan exa tamente dos aras en los tres lanzamientos, anali e si los eventos A y B y B y C son independientes y/o dependientes. 6. El equipo de la ªUº juega l 80% durante el día. El equipo no turnos y el 90% de los diurnos. día, la ªUº ganó ayer. ¿Cuál es la haya jugado de día?.
el 20% de sus partidos en la no he, y e gana el 60% de sus partidos De a uerdo on un diario de hoy probabilidad de que el partido se
ESTADÍSTICA APLICADA 35 7. El profesor MACHI esta enseñando Estadísti a en la UTP durante varios años. Se sabe que el 80% de los estudiantes terminaron los ejer i ios propuestos por el profesor. Determino que de los estudiantes que umplen on sus trabajos , 90% aprueban el urso. De aquellos estudiantes que no lo ha en así, 60% será aprobado. Juanita tomó Estadísti a durante el último semestre on el profesor MACHI y aprobó el urso. ¿Cuál es la probabilidad de que si haya he ho sus trabajos? 8. El vi e-re tor de investiga ión de la UTP ne esita rentar automóviles en tres agen ias: el 60% de la agen ia A, el 30% de la agen ia B y el 10% de la agen ia C. Si el 9% de los vehí ulos de la ia A netambién esitan afina afina ión ión,yelel20% de los las autos unidades de agen la agen Bagen ne esitan 6% de de la ia Cia ne esitan asimismo afina ión. ¿Cuál es la probabilidad de que un automóvil rentado al vi e-re tor de investiga ión de la UTP ne esitará afina ión? 9. Suponga que en un lote de 20 artí ulos se tiene 5 defe tuosos. Si se eligen al azar y sin reemplazo 3 artí ulos, hallar la probabilidad que: a) Los 3 artí ulos elegidos no sean defe tuosos. b) El segundo arti ulo elegido sea defe tuoso y que el ter ero no sea defe tuoso. ) El ter er artí ulo elegido sea defe tuoso, si el primero no fue defe tuoso. 10. Suponga que del 3 máquinas 50%, 30% y 20% número empresa, y que los por entajes por estas máquinas son: 3%, 4% un artí ulo al azar y es
A, B de y Cartí produ respeidos tivamente, total ulosen produ por unael de unidades defe tuosas produ idas y 5% respe tivamente. Si se elige no defe tuoso, hallar la probabilidad que
haya sido produ ido por la máquina A. ESTADÍSTICA APLICADA 37 UNIDAD II VARIABLES ALEATORIAS En el análisis estadísti o de una variable asi siempre se desea ono er el valor que tomaría en el futuro, este valor no siempre se puede prede ir on erteza; por ejemplo al re tor de la UTP le interesa saber el número de estudiantes que abandonan la universidad por i lo o semestre, en estos asos, el análisis resulta mas sen illo si se estable e ual es el omportamiento probabilísti o de di ha variable para así poder estable er una metodología para estimar su omportamiento futuro. VARIABLE ALEATORIA Una variable aleatoria es una fun ión que tiene omo dominio a un espa io muestral y omo rango a un sub onjunto de los números reales. Una variable aleatoria es una fun ión ªXº que le asigna un número real a ada uno de los elementos del espa io muestral. VARIABLE ALEATORIA DISCRETA Cuando el número de posibles valores de la variable es un número finito o infinito numerable. FUNCIÓN DE PROBABILIDAD Sea ªXº una variable aleatoria dis reta, la fun ión f(x) es llamada fun ión de probabilidad si umple las siguientes ondi iones: 1. i ) = i ) ³ 2.
f(x P(X= x 0 0 £ f(x
i) £ 1 3. å =1 ) ( i x f EJEMPLO Sea el experimento aleatorio que onsiste en lanzar una moneda 2 ve es. Anali e si la variable aleatoria número de aras onstituye una fun ión de probabilidad. SOLUCIÓN: Sea el espa io muestral del experimento: S = { , s, s , ss} ESTADÍSTICA APLICADA 38
Sea la variable aleatoria: Enton es x = 0, 1 y 2 X 1 = 0, x 2 = 1 y x 3 = 2 f(x 1 ) = 1 ) = f(x 2 ) = 2 ) = f(x 3 ) = 3 ) =
x = número de aras
P(X=x P(X=0) = P(ss) = P(X=x P(X=1) = P( s) + P(s ) = 1/4 +1/4 = 2/4 = ½ P(X=x P(X=2) = P( ) = 1/4
Como los f(x i ) están omprendidos entre 0 y 1; y además: å = = = + + = + + = + + = 3 1 3 2 1 1 4 4 4 1 2 1 4 1 4 2 4 1 ) ( ) ( ) ( ) ( i i x f x f x f x f Enton es f(x i ) si es una fun ión de probabilidad; esto es: F(x) ⎩ ⎨
⎧ = = 1 ; 2 2 / 1 0 ; 4 / 1 x y x Gráfica de f(x):
FUNCIÓN DE PROBABILIDAD ACUMULATIVA Sea ªxº una variable aleatoria discreta con función de probabilidad f(x); luego, la función de probabilidad acumulativa o función de distribución de la variable aleatoria ªxº es:
F(x) = P(X £ x i ) = å ) ( i x f ESTADÍSTICA APLICADA 39 PROPIEDADES 1. F(X) = 0 ∀ x < m, donde m es el menor valor de los x i 2. F(X) = 1 i
∀ x ³ M, donde M es el mayor valor de los x
3. F(X) 0 £ F(X) £ 1fun ión re iente 4. es una Del ejemplo anterior: F(x)= ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ³ < £ < < £ 2 ; 1 2 1 ; 4 / 3 1 0 ; 4 / 1
x x x
0 ; 0 x
Gráfica de F(x):
ESPERANZA MATEMÁTICA Sea ªxº una variable aleatoria discreta con función de probabilidad f(x); entonces, la Esperanza Matemática o valor esperado o media de la variable aleatoria ªxº es:
PROPIEDADES 1. E(c) = 0 ; ∀ = onstante 2. E( x) = E(x) ; ∀ = onstante 3. E( x + m ) = E(x) + m ; ∀ y m = onstantes 4. E(ax + by) = aE(x) + bE(y) ; ∀ a y b = onstantes E(x) = å ) ( i i x f x ESTADÍSTICA APLICADA 40 Del ejemplo anterior: E(X) = 1 4 4 4 2 2 0 4 1· 2 4 2 · 1 4 1 · 0 ) ( ) ( ) ( ) ( 3 3 2 2 1 1 3 1 = = + + = + + = + + = å = x f x x f x x f x x f x i i i
VARIANCIA O VARIANZA Sea ªxº una variable aleatoria dis reta on fun ión de probabilidad f(x); enton es, la Varian ia o Varianza de la variable aleatoria ªxº es:
Es de ir:
También:
PROPIEDADES 1. V( ) = 0 ; ∀ = onstante 2. V( x) = 2 V(x) ; ∀ = onstante 3. V(ax + b) = a 2 V(x) ; ∀ a y b = onstantes 4. Si ªxº e ªyº son variables aleatorias independientes V(ax + by) = a 2 V(x) + b 2 V(y) ∀ a y b = onstantes Del ejemplo anterior: V(X) = å - ) ( )) ( ( 2 i xi f x E x ; se sabe que E(X) = 1 V(X) = (x 1 ± E(X)) 2 f(x 1 ) + (x 2 ± E(X)) 2 f(x 2 3) + (x ± E(X)) 2 f(x
3 ) V(X) = (0 ± 1) 2 · 4 1 + ( 1 ± 1 ) 2 · 4 2 + ( 2 ± 1 ) 2 · 4 1 = 2 1
Var(X) = V(X) = 2 x s
= E[x i ±E(X)] 2 V(X) = å ) ( )) ( ( 2 i i x f x E x V(X)= E(x 2 ) ± [E(x)] 2 ESTADÍSTICA APLICADA 41 También: V(X) = E(x 2 ) ± [E(x)] 2 E(X 2 ) = 2 3 4
6 4 1
· 2 4 2 · 1 4 1 · 0 ) 2 2 3 2 3 2 2 2 1 2 1 3 1 2 = = + å = x f i i i
( ) ( ) ( ) ( 2
+ = + + = x x f x x f x x f x
Enton es: V(X) = 2 1 1 2 3 1 2 3 2 = - = EJERCICIOS RESUELTOS 1. Se lanzan 3 moneda y número de ello . Obtenga grafica.
e u
de ea analizar la variable aleatoria función de probabilidad y u
SOLUCIÓN: El e pacio mue tral S para e te ca o e : S = {ccc, cc , c c, c , cc, c , c, } La variable aleatoria: x = número de ello X = 0, 1, 2, 3 1 x = 0 ; 2 = 1 ;
x x
3 = 2 ; x 4 = 3 f(x 1 ) = P(X = x 1 ) = P(X = 0) = P(ccc) = 8 1 f(x 2 ) = P(X = x 2 ) = P(X = 1) = P(cc ) + P(c c) + P( cc) = 8 3 f(x 3 ) = P(X = x 3 ) = P(X = 2) = P(c 8 3 f(x 4 ) = P(X = x 4 ) = P(X = 3) = P( 8 1 Se ob erva probabilidad.
que
) + P( c ) + P(
c) =
) =
cumple
la
condicione
de
una
función
de
f(x) = ⎩
⎨ ⎧ = = 2 , 1 ; 8 / 3 3 , 0 ; 8 / 1 x x ESTADÍSTICA APLICADA 42 Gráfica de f(x): 2. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Encuentre su función de probabilidad.
SOLUCIÓN: Sea la variable aleatoria: obtenido.
x = número de divisores del número
El espacio muestral S consta de cualquiera de las 12 bolillas, es decir: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} Como la bolilla 1 tiene 1 divisor, la bolilla 2 tiene 2 divisores, la bolilla 3 tiene 2 divisores, la bolilla 4 tiene 3 divisores, la boli lla 5 tiene 2 divisores, la bolilla 6 tiene 4 divisores, la bolilla 7 tien e 2 divisores, la bolilla 8 tiene 4 divisores, la bolilla 9 tiene 3 divisores, la bolilla 10 tiene 4 divisores, la bolilla 11 tiene 2 divisores y la bolilla 12 tiene 6 divisores; entonces: X = 1, 2, 3, 4, 6 f(1) = 1/12 , f(2) = 5/12 , f(3) = 2/12 , f(4) = 3/12 , ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = = = = = 4 ; 3 2 6
4 ; ; ,
f(6) = 1/12
/ 1 6 / 1 12 / 5 1 ; 12 / 1
x) ( x x x x f 43
ESTADÍSTICA APLICADA
3. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Encuentre su función de probabilidad acumulativa y su gráfica. SOLUCIÓN: Del ejercicio anterior ya conocemos su función de probabilidad, entonces: ⎪
⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎪ ⎨ ⎧ ³
< £ < £ < £ < £
< = 6 ; 6 4 3 2 1 ) ( x x x x x x x F
1 4 3 2 1 ;
; ; ; ; 0
12 12 12 12
/ / / /
11 8 6 1
Gráfica de F(x):
4. Se lanza una moneda 3 veces y se desea analizar la variable aleatoria número de sellos. Calcule e interprete su esperanza matemática y varianza.
ESTADÍSTICA APLICADA 44 SOLUCIÓN: Del ejercicio 1 su función de probabilidad es: ⎩ ⎨ ⎧ = = = 2 3, ,1 0; ;8 8/ /3 1 ) ( x x
x f å
Entonces: E(x) =
) ( i i x f E(x)= 2 3 8 12 8 3 6 8 1 · 3 8 3 · 2 8 3 · 1 8 1 · 0 ) 4 4 4 1 = = + + + = + + å = x f i i i
x
3 0
( ) ( ) ( ) ( ) ( 3 3 2 2 1 1
+ = + + + = x x f x x f x x f x x f x
Si este experimento lo repetimos varias ve es, esperamos que en promedio el número de sellos sea 3/2. Cál ulo de la varianza: V(X) = E(x 2 ) ± [E(x)] 2 E(X 2 )= 3 8 24 8 1 8· 3 3 · 2 8
3 · 1 8 1 · 0 ) 2 2 4 2 4 3 2 3 2 2 2 1 2 1 4 1 2 = = + å = x f i i i
( ) ( ) ( ) ( ) ( 2 2
+ + = + + + = x x f x x f x x f x x f x
Enton es: V(x) = 3 ± ( 3/2 ) 2 = 3 4 9 = 4 3 Este valor nos indi a que hay po a dispersión el número de sellos al lanzar una moneda 3 ve es.
uando se analiza
5. Sea ªxº una variable aleatoria dis reta on fun ión de probabilidad: f(x) = (x + 2) ; x = 1, 2, 3, 4, 5 Hallar el valor de ª º. SOLUCIÓN: Como f(x) es una fun ión de probabilidad, enton es se umple que: å
=1 ) ( i x f f(1) + f(2) + f(3) + f(4) + f(5) = 1 (3) + (4) + (5) + (6) + (7) = 1 25 = 1 ⇒ c = 25 1
ESTADÍSTICA APLICADA
45 EJERCICIOS PROPUESTOS 1. Se lanzan 4 monedas y se desea analizar la variable aleatoria número de caras. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza. 2. Una urna contiene 15 bolillas numeradas del 1 al 15. Se saca una bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza. 3. Se lanzan 3 monedas y se desea analizar la variable aleatoria número de sellos. Obtenga su función de probabilidad acumulativa y su gráfica. Además halle a su coeficiente de variabilidad. 4. Una urna contiene 12 bolillas numeradas del 1 al 12. Se saca una bolilla al azar y se quiere analizar la variable aleatoria número de divisores del número obtenido. Calcule e interprete su esperanza matemática, varianza y coeficiente de variabilidad. 5. Se lanzan dos dados y se desea estudiar la variable aleatoria suma de resultados. Calcule y grafique f(x) y F(x), además halle e interprete a su esperanza matemática y varianza. 6. Sea ªxº una variable aleatoria discreta con función de probabilidad: f(x) = cx ; x = 1, 2, 3, 4, 5 Hallar el valor de ªcº. 7. Sea ªxº una variable aleatoria discreta con función de probabilidad: f(x) = cx 2 ; x = 1, 2, 3, 4, 5 Hallar el valor de ªcº. 8. Sea ªxº una variable aleatoria discreta con función de probabilidad: f(x) = c · 2 x ; x = 1, 2, 3, 4 Hallar el valor de ª º. 9. Se lanzan dos dados y se desea estudiar la variable aleatoria ªxº suma de resultados. Si además se umple que: z = 2x + 5. Cal ule E(z) y V(z). ESTADÍSTICA APLICADA 46 10. Dado que la variable aleatoria dis reta ªxº tiene por fun ión de probabilidad a umulativa: F(x)= ⎪ ⎪ ⎪ ⎪ ⎩
⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎧ ³ < £ < £ < £ < 10 ; 1 10 6 ; 6 5 6 4 ; 2 1 4 1 ; 3 1 1 ; 0 x x x x x Hallar: a) P(2< x £ 6); b) P(x = 4); c) Su función de probabilidad. 11. Dado que la variable aleatoria discreta ªxº tiene por función de probabilidad acumulativa: F(x)= ⎪⎪ ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎧ ³ < £ < 5 5
£ < ; 1 3 ;
4 3 3 1 ; 2 1 1 1 ; 4 1 1 ; 0 x x x x x Hallar: a) P(x £ 3);
b) P(x = 3);
d) P(x ³ 1);
e) P( 0.4< x < 4);
c) P(x < 3); f) P(x = 5).
12. Una urna contiene cuatro bolillas con los números
1, 2, 3 y 4,
respectivamente. Si se toma dos bolas de la urna sin sustitución y se define la variable aleatoria ªxº como la suma de los números de las dos bolillas extraídas, determine: a) La función de probabilidad de ªxº y su gráfica. b) La función de distribución de ªxº y su gráfica. ESTADÍSTICA APLICADA 47 13. Una moneda está cargada y de este modo hay tres veces mayor probabilidad de que caigan caras que sellos. En tres lanzamientos independientes de la moneda determine: a) La distribución de probabilidad de x, el número total de caras; b) La probabilidad de que cuanto mucho caigan dos caras. 14. Una caja contiene 10 artículos, de los cuales 2 son defectuosos. Si se eligen al azar y sin reemplazo 3 artículos y se define la variable aleatoria número de artículos buenos elegidos, hallar f(x) y F(x) y susy varianza. gráficas, además calcule e interprete a su esperanza matemática 15. Suponga que se han recibido 3 cajas (A, B y C) con 4 artículos cada una. La caja A contiene un artículo defectuoso, la caja B contiene 2 artículos defectuosos y en la caja C no hay artículos defectuosos. Si se elige al azar un artículo de cada caja y se define la variable aleatoria ªxº como el número de artículos buenos elegidos. Hallar f(x) y F(x) y sus gráficas, además calcule e interprete a su esperanza matemática y varianza.
VARIABLE ALEATORIA CONTINUA Si el número de valores posibles de la variable en estudio es un conjunto no numerable. Es decir, la variable toma infinitos valores. FUNCIÓN DE PROBABILIDAD Sea ªXº una variable aleatoria continua, la función f(x) es llamada función de probabilidad o de densidad si cumple las siguientes condiciones:
1. 0 £ f(x) £ 1 ; ∀ x Î 2. 1 ) ( ò ¥ ¥ -
=
dx x f
Nota:
Sea el evento:
A = {x / a £ x £ b} ; entonce :
P(A) = P(a £ x £ b) = ò b a dx x f
) (
ESTADÍSTICA APLICADA 48 EJEMPLO Suponga que el tiempo de producción de un artículo variable aleatoria ªxº que tiene como función de den idad: 18 x ;
(minuto )
e
una
0 £ x £ 6 f(x) = 0
;
de otro modo (d.o.m.)
Verificar i f(x) e una función de den idad y hallar la probabilidad de que el tiempo de producción de un artículo elegido al azar ea menor de 4 minuto . SOLUCIÓN: Debe de cumplir e que: ò ¥ ¥ dx x f 6 0 2 6 0 6 0 2 18 1 18 1 18 x dx xdx x = = ò ò
1 ) (
=
= 1 ) 18 ( 18 1 ) 2 0 2 6 ( 18 1 2 2 = = Lo cual verifica que f(x)
i con tituye una función de den idad.
La probabilidad pedida equivale a: P( x < 4 ) = P( 0 < x < 4) = 4 0 2 4 0 2 18 1 18 x dx x = ò = 44444444 . 0 9 4 36 16 2 4 18 1 2 = = = Gráfica de f(x): ESTADÍSTICA APLICADA 49 FUNCIÓN DE PROBABILIDAD ACUMULATIVA Sea ªxº una variable aleatoria continúa con función de luego, la función de probabilidad acumulativa o función de la variable aleatoria ªxº e define como:
PROPIEDADES 1. F( µ) = 0
den idad f(x); de di tribución
2. 3.
F(+µ) = 1 0 £ F(X) £ 1 ;
∀ x Î 4. F(X) es una fun ión re iente 5. f(X) = dx x dF ) ( 6. P(a £ x £ b) = F(b) ± F(a) Del ejemplo anterior: F(x) = P(X £ x) = ò ¥ x dx x f
) (
F(x) = x x x dx x 0 2 0 2 18 1 18 = ò = 36 2 18 1 2 2 x x =
⎪ ⎪ ⎩ ⎪⎪ ⎨ ⎧ > £ £ < = 6 ; 1 6 0 ; 36 0 ; 0 ) ( 2 x x
x x F Gráfica de F(x):
F(x) = P(X £ x) = ò ¥ x dx x f ) ( ESTADÍSTICA APLICADA 50 ESPERANZA MATEMÁTICA Sea ªxº una variable aleatoria continua con función de densidad f(x); entonces, la Esperanza Matemática o valor esperado o media de la variable aleatoria ªxº es:
PROPIEDADES 1. E(c) = 0 ; ∀ = onstante 2. E( x) = E(x) ; ∀ = onstante 3.- E( x + m ) = E(x) + m ; ∀ y m = onstantes 4. E(ax + by) = aE(x) + bE(y) ; ∀ a y b = onstantes Del ejemplo anterior: E(x) = ò ¥ ¥ dx x xf E(x) = 6 0 3 6 0 2 6 0 3 18 1 18 1 18
·
x dx x dx x x = = ò ò = 4 54 216 3 6 18 1 3 = =
) (
VARIANCIA O VARIANZA Sea ªxº una variable aleatoria ontinua on fun ión de probabilidad f(x); enton es, la Varian ia o Varianza de la variable aleatoria ªxº es:
Es de ir:
También:
E(x) = ò ¥ ¥ -
dx x xf ) ( Var(X) = V(X) = 2 x s = E[x ± E(X)] 2 V(X) = ò ¥ ¥ dx x f x E x 2
) ( )] ( [
V(X)= E(x 2 ) ± [E(x)] 2 ESTADÍSTICA APLICADA 51 PROPIEDADES 1. V(c) = 0 ; ∀
= onstante 2. V( x) = 2 V(x) ; ∀ = onstante 3. V(ax + b) = a 2 V(x) ; ∀ a y b = onstantes 4. Si ªxº e ªyº son variables aleatorias independientes V(ax + by) = a 2 V(x) + b 2V(y)
∀ a y b = onstantes
Del ejemplo anterior: V(x) = E(x
2 ) ± [E(x)] 2 Como E(x) = 4 Enton es: E(x 2 ) = 6 0 4 6 0 3 6 0 2 4 18 1 18 1 18 x dx x dx x x = = ò ò = 18 72 1296 4 18 6 4 = = x Luego: V(x) = 18 ± ( 4 ) 2 = 18 ± 16 = 2 EJERCICIOS RESUELTOS 1. Suponga que el tiempo de produ ión de un artí ulo (minutos) es una variable aleatoria ªxº que tiene omo fun ión de densidad: ⎪ ⎩ ⎪ ⎨ ⎧
£ £
-= . . . ; 0 4 2 ; 4
5 ) ( m o d x x x f Hallar la probabilidad de que el tiempo de producción de un artículo elegido al azar sea menor de 3 minutos. SOLUCIÓN: Sea la variable aleatoria: x = tiempo de producción de un artículo
3 2 2 3 2 3 2 2 5 4 1 ) 4 1 4 5 x x ò 8
Nos piden: P(x < 3) = P( 2 £ x < 3) =
) ( 5 (
x dx x dx = - = ò P(x < 3 ) = 625 . 0
5) 2 5 ( 4 1 ) 2 5 5 ( 4 1 ) 2 42 9 ( 10 15 [ 4
1 = = = - = - - -
ESTADÍSTICA APLICADA 52 2. Sea ªxº una variable aleatoria continua con función de densidad: ⎩ ⎨ ⎧ = . . 6 ) ( m o x x f
£ £ . ; 0 0 ; d cx
Si además se cumple que: y = 20 + 4x Hallar: a) El valor de ªcº. b) La mediana de ªxº. c) E(y) y V(y) SOLUCIÓN: a) Debe de cumplirse que: 1 ) (
ò ¥ ¥ dx x f 2 · 02 6 0 ò
=
1 ) 0 18 ( 6
= - = =
c x c cxdx
⇒ 18c = 1 ⇒ c =
18 1
b) 2 1 ) ( ò
Para calcular al valor de la mediana debe de cumplirse:
=
¥ me dx x f
en nuestro caso:
2 1 2 18 1 2 18 1 18 2 0 2 0 = = = ò me x dx x me me ⇒ me 2 = 18 ⇒ me = 18 = 3 2 c)
2
Del ejemplo sabemos que: E(x) = 4 y V(x) = 2 Entonces, por propiedades: E(y) = E(20+4x) = E(20)+E(4x) = 20+4E(x) = 20 + 4(4) = 36 V(y) = V(20+4x) = V(20)+V(4x) = 0+ 4
V(x) = 16(2) = 32
3. Si la función de distribución del ejercicio 1 es: F(x) = 810 16 2 x x - + (compruébalo) 53
ESTADÍSTICA APLICADA
Determine: P( x < 3 ) SOLUCIÓN: Por la propiedad 6 de F(X): P( x < 3 ) = P( 2 < x < 3 ) = F(3) ± F(2) = 85 8 5
0 =
8 5 8
* F(3) =
9 30 16 = - + y F(2) = 0 8 4 20 16 = - + -
EJERCICIOS PROPUESTOS 1. Suponga que el tiempo de producción de un artículo (minutos) es una variable aleatoria ªxº que tiene como función de densidad: ⎪ ⎩ ⎪ ⎨ ⎧ = . 4 4 5 ) m x x x
£ £ . . ; 0 2 ; ( o d f
Verificar si f(x) es una función de densidad y hallar la probabilidad de que el tiempo de producción de un artículo elegido al azar sea por lo menos de 3 minutos. 2. Sea ªxº una variable aleatoria continua con función de densidad: ⎩ ⎨ ⎧ = . . 4 ) ( m o
< < + . ; 0 2 ); 1 ( d
x fx x c Si además se cumple que: y = 10 + 5x Hallar:
a) El valor de ªcº. b) E(x) y V(x) c) E(y) y V(y)
ESTADÍSTICA APLICADA 54 3. Si la función de distribución del ejercicio 1 es: F(x) = 8 10 16 2 x x - + Determine: P( x > 3 ) 4. La función de densidad de la variable aleatoria continua ªxº está dada por: ⎪ ⎩ ⎪ ⎨ ⎧ < < = . . . ; 0 7 2 ; 5 1 ) ( m o d x x f a) Demuestre que el área situada debajo de la curva (sobre el eje x) es igual a 1. b) Determine P(3< x < 5). 5, Si la función de densidad de la variable aleatoria continua ªxº está dada por: ⎪ ⎩ ⎪ ⎨ ⎧ < < + = . . . ; 0 4 2 ); 1 ( 8 1 ) ( xm xo d x f Hallar: a) P(x < 3.2);
b) P(2.9 < x < 3.2). 6. Si la función de densidad de la variable aleatoria x está dada por: ⎩ ⎨ ⎧ < < = . . . ; 0 1 0 ); 1 ( 6 ) ( m o d x x x x f Hallar: a) P(x > ½); b) La función de distribución de esta variable aleatoria; c) El valor de la mediana de la variable x. 7. Si la función de densidad de la variable aleatoria ªxº está dada por: ⎩ ⎨ ⎧ = . . 1 ) ( 2 m o x x f 55
< < + . ; 0 0 ; d x cx
ESTADÍSTICA APLICADA
Hallar: a) El valor de ªcº. b) La función de distribución de esta variable aleatoria ªxº y trace su gráfica; c) P(0 £ x £ ½). 8. Si la función de densidad de la variable aleatoria ªxº está dada por: ⎪ ⎩ ⎪ ⎨ ⎧ < £ < < - = . . . ; 0 1 0 ; ) 0( 1 ; . m o d x kx x kx
x f
Hallar: a) El valor de ªkº. b) La función de distribución de esta variable aleatoria ªxº y trace su gráfica; c) P( ½ < x < ½). 9. Si la función de densidad de la variable aleatoria ªxº está dada por ⎪ ⎩ ⎪ ⎨ ⎧ < £ < < = . . . ; 0 1 ; 2 1 0 ; ) ( m o d c x x x x x f Hallar: a) El valor de ªcº b) La función de distribución de ªxº. c) P(0.8 < x < 0.6c). 10. Obtenga la función de distribución de la variable aleatoria ªxº cuya función de densidad está dada por: ⎪ ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎪⎨ ⎧ < £ £ = . 3 2 3 2 2 1
< < < . . ; 0 2 ; 1 ;
21 0 ; ) ( m o d x
x x x x x f Trace asimismo las gráficas de las funciones de densidad y de distribución. ESTADÍSTICA APLICADA 56 11. Si la función de distribución de la variable aleatoria ªxº está dada por: ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ³ < £ + - < = 1 ; 1 1 1 ; 2 1 1 : 0 ) ( x x x x x F Hallar: a) P( ½ < x < ½); b) P(2 < x < 3), c) La densidad de probabilidad de la estaprobabilidad variable aleatoria ªxºa). y utilícela para volver a determinar del inciso 12. Si la función de distribución de la variable aleatoria ªxº está dada por: ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧³ < £ < £ <
= 5 5 2 1 1 2 0 ) x x x x
. 1 ; 1 . 1 1 ; 0 ; ; 0 ( x
x x F Hallar: a) P(0.4 < x £ 1.3) b) P( x > 0.5) c) La función de densidad de la variable ªxº. 13. Si la función de distribución de la variable aleatoria ªxº está dada por: ⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ ³ < £ + - < = 2 ; 1 2 2 ; 8 4 2 ; 0 x) ( x x x x F a) b) c) d) 57
Hallar: P(x = 2); P( x = 2); P( 2 < x <1); P(0 £ x £ 2). ESTADÍSTICA APLICADA
14.
La cantidad real de café (en gramos) en un recipiente de 230
gramos de llenado por cierta máquina función densidad está dada por:es una variable aleatoria cuya ⎪ ⎪
⎩ ⎪ ⎪ ⎨ ⎧ ³ < < £ = 5 . 232 ; 0 5 . 232 5 . 227 ; 5 1 5 . 227 ; 0 ) ( x x x x f Determine la probabilidad de que un recipiente de 230 gramos llenado por esta máquina contendrá: a) Cuanto mucho 228.65 gramos de café. b) Entre 229.34 y 231.66 gramos de café. c) Cuanto menos 229.85 gramos de café. 15. El retraso o adelanto (en minutos) de un vuelo de Lima a Juliaca es una variable aleatoria ªxº cuya función de densidad está dada por: ⎪ ⎩ ⎪ ⎨ ⎧
< < - = . . . ; 0 6 6 ); 36 ( 288 1) ( 2 m o d x x x f donde los valores negativos son indicativos de que el vuelo llega adelantado y los valores positivos señalan que el vuelo llega retrasado. Determine las probabilidades de que uno de estos vuelos llegará a) Cuando menos dos minutos antes. b) Cuando menos un minuto retrasado. c) Entre uno y tres minutos antes. d) Exactamente cinco minutos tarde.
ESTADÍSTICA APLICADA 58 16. Suponga que las ventas diarias de un establecimiento (decenas de miles de soles) es una variable aleatoria ªxº con función de densidad: f(x)= ⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ < £ < £ om d x x x x . ; 0 6 4 ; 6 6 4 2 ; 3 2 Si se elige aleatoriamente un día: a) Hallar la probabilidad de que las ventas del establecimiento sea mayor de 22,000 soles pero no mayor de 45,000 soles b) Hallar la media, variancia y el coeficiente de variabilidad de las Si ventasladiarias. c) utilidad neta diaria es definida por la función Y=0.2X±0.5, hallar la media y la variancia de la utilidad neta diaria. d) Hallar la función de probabilidad acumulativa de ªxº. 17. Suponga que el tiempo de vida (en miles de horas) de los tubos fluorescentes de 30 w. de cierta marca, es una variable aleatoria ªxº que se distribuye según la siguiente función de densidad: ⎪ ⎩ ⎪ ⎨ ⎧£ £ < £ = . . . ; 0
6 3 ) ( m o x x x f
3 ); 2 10 ( 1 ); 2 2 ( d x k x k
a) Determine el valor de ªkº y la función de probabilidad acumulativa . b) Utilizando la función de distribución acumulativa hallada en (a), halla la probabilidad que un fluorescente que haya durado dos mil horas, dure no más de 2500 horas adicionales. c) Determine el tiempo de vida esperado y el coeficiente de variabilidad de la distribución del tiempo de vida. ¿Qué nos indican? d) Halle el valor del percentil 70. Interprete. ESTADÍSTICA APLICADA 59 18. El tiempo total, medido en unidades de 100 horas, que un adolescente escucha un estéreo durante un año, es una variable aleatoria ªxº cuya función de densidad de probabilidad es: ⎪ ⎩ ⎪ ⎨ ⎧ < £ < = . . 2 1 ) ( m o x
< . ; 0 1 ; 2 0 ; d x
xxfx a) Halla la función de probabilidad acumulativa. b) Para un año en particular, ¿cuál es la probabilidad que un adolescente utilice entre 50 a 125 horas?. Utilizar lo determinado en la pregunta anterior. c) Si se eligen aleatoriamente 4 adolescentes, ¿cuál es la probabilidad que por lo menos 2 escuchen su estéreo menos de 25 o más de 175 horas anuales? d) Halla el coeficiente de variabilidad. ¿Qué nos indica? e) Si y = 60x + 40, halle la variancia de y. 61
ESTADÍSTICA APLICADA
UNIDAD III DISTRIBUCIONES DE PROBABILIDADES
En esta unidad estudiaremos algunas de las distribuciones de probabilidades que son usadas con mayor frecuencia en estudios estadísticos. DISTRIBUCIONES DISCRETAS PRUEBA DE BERNOULLI Una prueba o ensayo de Bernoulli es aquella en la que su espacio muestral consta sólo de 2 resultados posibles; éxito (E) y fracaso (F), donde a la probabilidad de éxito denotaremos ªpº y a la probabilidad de fracaso ªqº o ª1 ± pº, ya que p + q = 1. Si esta prueba la repetimos varias veces, la probabilidad de éxito se mantiene constante y las pruebas son independientes. EJEMPLO: Lanzamiento de una moneda balanceada. Observe que su espacio muestral consta de solo dos resultados posibles: cara(c) o sello(s). Si nos interesa el número de caras, su probabilidad de éxito será 1/2, es decir p = 1/2 y q = 1 ± p = 1/2. DISTRIBUCIÓN DE BERNOULLI Una variable aleatoria discreta ªxº sigue una distribución de Bernoulli si su función de probabilidad está dada por:
Donde ªxº es el número de éxitos. Además su media y variancia están dadas por:
f(x) = p x q 1 ;x x = 0 , 1 E(x) = μ x = p V(x) = 2 x
s = pq y ESTADÍSTICA APLICADA 62 Note que e ta di tribución e
u ada para una
ola prueba de Bernoulli o
cuando elegimodealBernoulli azar un olo elemento unatra población. Paracon do reemplazo o ma prueba o para unademue al azar u amo : DISTRIBUCIÓN BINOMIAL
Una variable aleatoria di creta ªxº función de probabilidad e tá dada por:
tiene
Donde ªxº e el número de éxito en ªnº prueba de una mue tra aleatoria con reemplazo. Ademá
u media y variancia e tán dada
una
di tribución
binomial
i
de bernoulli o el tamaño
por:
EJEMPLO Se lanza una moneda 10 vece obtener exactamente 4 cara .
y
e
de ea
hallar
la
probabilidad
SOLUCIÓN: Sea la variable aleatoria: x = número de cara Para un olo lanzamiento la probabilidad de éxito e 1/2, e ta probabilidad e mantiene con tante en lo otro lanzamiento , como ªnº e 10, entonce : f(x) = x n x n x q p C ; x = 0, 1, 2, 3, · · · , n
f(x) = 10 10 10 10 ) 5 . 0 ( ) 5 . 0 ( ) 5 . 0 ( x x x x C C ;
=
x = 0, 1, 2, 3, · · · , 10
Nos piden: P(x = 4) = f(4) = 205078125 . 0 ) 5 . 0 ( 10 10 4 = C
f(x) = x n x n x ;
q p C x = 0, 1, 2, 3, · · · , n
E(x) = μ x
de
u
= np V(x) = 2 x
s = npq y ESTADÍSTICA APLICADA 63 DISTRIBUCIÓN HIPERGEOMÉTRICA Una variable aleatoria di creta ªxº tiene una di tribución hipergeométrica i u función de probabilidad e tá dada por:
Donde ªxº e el número de éxito de una mue tra aleatoria de tamaño ªnº in reemplazo, tomado de una población de tamaño N. A e el número de elemento que tienen una determinada caracterí tica, definida como éxito, y B lo elemento que no tienen dicha caracterí tica, definida como fraca o, donde A + B = N. Ademá
u media y variancia e tán dada
por:
IMPORTANTE Si el tamaño de la población(N) e grande y 05 . 0 < N n , entonce e puede aproximar a la di tribución binomial, en donde p = N A EJEMPLO Como parte de un e tudio de la contaminación del aire, un in pector decide examinar la emi ión de ga e de ei de lo 24 camione de carga de una compañía. Si cuatro de lo camione de la compañía emiten cantidade exce iva de contaminante , ¿cuál e la probabilidad de que ninguno de ello ea incluido en la mue tra del in pector? SOLUCIÓN: Sea x = número de camione N = 24, A = 4, B = 20 N n B x n
y
que contaminan n = 6
A x C C C x f =
· ) ( ; x= 0, 1, 2, 3, · · · , n E(x) = μ x = N nA y V(x) = 2 x s
= ) 1 ( 2 N n N N nAB ESTADÍSTICA APLICADA 64 Entonce : f(x) = 24 6 20 6 4 · ·
C C C C C C x x N n B x n A x - =
No · piden: 24 6 20
f(0) =
288 . 0
6 4 0 = C C C
DISTRIBUCIÓN DE POISSON Una variable aleatoria dis reta ªxº tiene una distribu ión de Poisson si su fun ión de probabilidad está dada por:
Donde: x = número de éxitos obtenidos en un periodo de tiempo o unidad de evalua ión.
l =
razón
media
de
ocurrencia
por
periodo
de
tiempo
o
unidad
de
eva uación. t = periodo de tiempo o unidad de eva uación. Además su media y variancia están dadas por:
IMPORTANTE La probabi idad de éxito es pequeña y constante, os números de éxitos son independientes. Se puede aproximar a distribución binomia
a
Poisson cuando tamaño de grandecuando y a probabi de éxito ªpº epequeña ( pa muestra < 0.1);ªnº esesdecir np < idad 5; para considere: !
· ) ( x e x f x μ μ = μ;=xlt= 0,1, 2, 3, E(x) = μ x = μ
a esto
μ = np (t = n y l = p) V(x) = 2 x s = μ
y
ESTADÍSTICA APLICADA 65 EJEMPLO Se sabe que durante ciertas horas las llamadas telefónicas a la UTP están distribuidas al azar según un proceso de Poisson, con un promedio de 3 llamadas por minuto. Se desea hallar la probabilidad de que transcurran 4 minutos sin llamadas. SOLUCIÓN: Sea x = número de llamadas l = 3 t = 4
μ = 3·4 = 12 Enton es: f(x) = ! 12 · ! · 12 x e x e x x - =
μ μ Nos piden: f(0) = 000006144 . 0 ! 0 12 · 12 0 12 = = -
e e
EJERCICIOS PROPUESTOS 1.
Demuestre
que
a
media
y
a
varianza
Bernou i son ªpº y ªpqº respectivamente. 2. Se anza una moneda 15 veces y se de obtener: a) Exactamente 7 caras.
de
a
desea
ha
distribución ar
a
de
probabi idad
b) Por o menos 2 caras. c) A o mas 14 caras. 3. Como parte de un estudio de a contaminación de aire, inspector decide examinar a emisión de gases de cinco de os 20 camiones de carga de una compañía. Si tres de os camiones de a compañía emiten cantidades excesivas de contaminantes, ¿cuá es a probabi idad de que dos camiones estén contaminando?
un
ESTADÍSTICA APLICADA 66 4. Se sabe que durante ciertas horas as amadas te efónicas UTP están distribuidas a azar según un proceso de Poisson, con un promedio de 5 amadas por minuto. Se desea ha ar a probabi idad de que en 2 minutos haya exactamente 3 amadas y de que en 2 minutos haya 8 amadas.
a
5. Suponga que e 30% de os créditos otorgados por un banco tienen cuotas vencidas. Si se e igen a azar y con reemp azo créditos, determinar: a) La probabi idad que por o menos dos créditos tengan cuotas vencidas. b) La media y e coeficiente de variabi idad. 6. Una urna contiene 9 bo i as verdes y 11 azu es. azar 5 bo i as sin reemp azo, ha ar: a) La probabi idad de que una sea de co or verde. b) La probabi idad de que a menos 2 sean de co or verde. c) La probabi idad de que a o mas 4 sean de co or verde. 7. Una urna contiene 8 bo i as b ancas, 10 negras sacan a azar y sin reemp azo 7 bo i as, determinar: a) La probabi idad que a o mas 6 sean rojas. b) La probabi idad que por o menos 2 sean negras. 8.
y
Si
12
se
a
10
sacan
rojas.
a
Se
Suponga que ªxº tiene una distribución de Poisson si Ca cuP(x ar = P(3) x = > 2/3 1). P(x = 1).
9. En una pob ación grande e 16 % de os miembros son zurdos. En una muestra a eatoria de tamaño 10, encontrar a probabi idad de que exactamente dos o más sean zurdos. 10. En un estudio sobre a efectividad de un insecticida contra ciert o insecto, se roció en un área grande de tierra. Posteriormente, se examinó e área en re ación con os insectos vivos, se eccionando otes cuadrados a azar y contando e número de insectos vivos por ote cuadrado. Experiencias anteriores han demostrado que e número promedio de insectos vivos por ote cuadrado después de haber rociado e insecticida es de 0.5. Si e número de insectos vivos por
ote se distribuye según Poisson, ha
ESTADÍSTICA APLICADA 67
ar:
a) ¿Cuá es a probabi idad de que un ote cuadrado contenga uno o más insectos vivos?. b) Si a eva uación se hizo en unos 10000 otes, ¿cuántos otes tendrían un insecto vivo?. c) ¿Cuá es a probabi idad de encontrar tres insectos en dos otes?. 11. Los resu tados de una encuesta a un au a o siguiente : 10 a umnos aceptaron dar e examen e día sábado. 5 a umnos aceptaron dar e examen e día domingo. 7 a umnos aceptaron dar e examen en Navidad. A resto e era indiferente cuando dar e examen.
de
30
a umnos
indica
Si se e ige una muestra de 10 a umnos, ¿Cuá es a probabi idad de e egir más de 6 a umnos que e sean indiferente a fecha de examen?. 12. En una estación te efónica se recepcionan amadas a una razón promedio de 4 amadas cada 5 minutos. Si se e ige a azar un periodo de 2 minutos, ha ar a probabi idad que se recepcionen por o menos 3 amadas. 13. E gerente de crédito de un banco recibe 12 so icitudes de crédito, de as cua es 3 tienen documentación incomp eta, por o que serán devue tas a os c ientes. Si se e igen 5 so icitudes a azar y sin reemp azo, ha ar: a) La probabi idad de devo ver por o menos 3 so icitudes de crédito. b) La media, varianza y coeficiente de variabi idad. 14. E gerente de crédito de un banco recibe 10 so icitudes de crédito, de as cua es 4 tienen documentación incomp eta, por o que serán devue tas a os c ientes. Si se e igen 5 so icitudes a azar y con reemp azo, ha ar: a) La probabi idad de devo ver por o menos 3 so icitudes crédito. b) La media, varianza y coeficiente de variabi idad.
ESTADÍSTICA APLICADA 68 15. Un fabricante de piezas de automóvi es garantiza que una caja de sus piezas contendrá como máximo 2 defectuosos. Si a caja contiene 20 piezas y a experiencia ha demostrado que ese proceso de fabricación produce 5% de piezas defectuosas. ¿Cuá es a probabi idad de que una caja satisfaga a garantía?. 16. Un estudiante no se ha preparado abso utamente nada para un examen (cosa muy corriente en a gunos estudiantes) e cua contiene 20 preguntas de verdadero, fa so. Decide anzar a aire una moneda para responder, anota verdadero si a moneda sa e cara y fa contestar b) La preguntas
so si a monedaidad sa ede seque o.apruebe Ha ar:e examen, si para e o debe a) La probabi correctamente e 70% de as preguntas. probabi idad de que conteste por o menos a mitad de as correctamente.
de
17. Una empresa fabrica mesas de bi ar y sospecha que e 2% de su producción está defectuosa en a guna firma. Si ésta sospecha es correcta. Encuentre a probabi idad de que en una muestra de mesas: a) Haya por o menos una defectuosa. b) A o mas 2 mesas sean defectuosas. 18. Si e 3% de os focos fabricados por una empresa son defectuosas. Ha ar a probabi idad de que en una muestra de focos: a) No resu te ningún defectuoso. b) Resu te 5 defectuosos. c) Resu te a o más 2 defectuosos. d) Resu te por o menos 3 defectuosos. 19. A una construcción egan camiones de carga a de 2.8 camiones/hora. Ha ar a probabi idad de tener por 3 camiones que egan en: a) Un apso de 30 minutos. b) Un apso de 45 minutos. c) Un apso de una hora. d) Un apso de dos horas. e) Un apso de tres horas.
una razón o menos
9
50
media
ESTADÍSTICA APLICADA 69 20. Una compañía de seguros contra accidentes de tránsito sabe que e 0.005% de a pob ación fa ece por accidente de tránsito. ¿Cuá es a probabi idad de que a compañía tenga que pagar a sus 10000 asegurados que tiene este año? a) A mas de 3 asegurados. b) A o mas a 3 asegurados. c) Exactamente a 3. d) A por o menos 2 asegurados. ESTADÍSTICA APLICADA 70 DISTRIBUCIONES CONTINUAS DISTRIBUCIÓN NORMAL Una variab e a eatoria continua ªxº media μ y varianza s 2 , i u función de probabilidad e :
tiene
una
GRÁFICA: CARACTERÍSTICAS: 1. Tiene una forma acampanada. 2. E a intótica con re pecto al eje horizontal.
distribución
norma
con
3.
E
imétrica con re pecto a
u media μ.
DISTRIBUCIÓN NORMAL ESTÁNDAR Sea ªxº una variable aleatoria continua que tiene una distribución normal con media μ y varianza s 2 , s
entonce la
variable
aleatoria
Z
=
μ - x
tiene una distribución normal con media cero ( 0 ) y varianza uno ( 1 ) y su función de probabilidad está dada por:
f(x) = 2 ) ( 2 1 2 1 μ
s
s p x e ; f(z) = 2 2 2 1 z e
µ < x < µ
p ;
µ < z < µ ESTADÍSTICA APLICADA
71 GRÁFICA: CARACTERÍSTICAS: 1. Tiene una forma acam anada. 2. Es asintótica con res ecto al eje horizontal. 3. Es simétrica con res ecto a su media 0. USO DE LA TABLA
Z
Haciendo uso de la tabla ªzº com ruebe las siguientes 1. P(z < 2.37) = 0.9911
robabilidades:
2.
P(z > 3.24) = 1 ± 0.9994 =
0.0006
ESTADÍSTICA APLICADA 72 3.
P(z <
1.53) = 0.0630
4.
P(z >
2.08) = 1 ± 0.0188 = 0.9812
5.
P(1.66 < z < 2.69) = 0.9964 ± 0.9515 = 0.0449
73 6.
ESTADÍSTICA APLICADA P( 0.45 < z < 3.25) = 0.9994 ± 0.3264 = 0.6730
7.
P( 1.23 < z < 0) = 0.5 ± 0.1093 = 0.3907
8.
P( 2.76 < z <
1.94) = 0.0262 ± 0.0029 = 0.0233
ESTADÍSTICA APLICADA 74 EJERCICIOS RESUELTOS 1. El costo de roducción de un determinado artículo tiene distribución normal con una media de 20 soles y una varianza de 4 soles 2 . Si se elige al azar un artículo, ¿cuál es la robabilidad de que su costo de roducción sea a lo más de 18 soles? SOLUCIÓN: Sea x = costo de Donde:
roducción
x ∼ N( μ = 20 ; s
2= 4 ) por lo cual s = 2 No
piden:
una
P( x £ 18 ) como z = s
μ - x
∼ N(0,1) P( x £ 18 ) = ) 18 ( s
μ
s
μ £ - x P , reemplazando: P( x £ 18 ) = 1587 . 0 ) 1 ( ) 2 20 18 ( = - £ = £ z P z P 2. Las llamadas que se registran en la UTP tienen una distribución normal con una media de 2 minutos y una variancia de 1 minuto. Hallar la probabilidad de que una llamada tenga una duración comprendida entre 3 y 4 minutos. SOLUCIÓN: Sea x = número de llamadas Donde: x ∼ N( μ = 2 ; s
2
= 1 ) por lo cual s = 1 No 1 2 4 1 2 ( 3 ) 4 3 ( < < = < < z P x P s s
μ μ
poden: P(3 < x < 4) =
)
s
μ P(3 < x < 4) = P(1< z < 2) = 0.9772 ± 0.8413 = 0.1359
ESTADÍSTICA APLICADA 75 3. El tiempo que le dedican los estudiantes para aprender Estadística es una variable aleatoria que tiene una distribución normal con una media de 20 horas y una varianza de 9 horas 2 . Si se elige al azar a un estudiante, ¿cuál es la probabilidad de que haya estudiado a lo más 14 horas?. SOLUCIÓN: Sea x = tiempo de estudio o número de horas. Donde: x ∼ N( μ = 20 ; s 2
= 9 ) por lo cual s = 3 No piden: P(x £ 14 ) = 3 20 14 ( = - £ = £ z P x P s
0228 . 0 ) 2 ( )
μ
4. Suponga que el costo de producción de una calculadora tiene una distribución normal con una media de 50 soles y una varianza de 16 soles 2 . Si se elige una calculadora al azar, hallar la probabilidad que su costo de producción sea por lo menos de 45 soles. SOLUCIÓN: Sea x = costo de producción de una calculadora Donde: x ∼ N( μ = 50 ; s 2
= 16 ) por lo cual s = 4 No 4
piden: P(x ³ 45) =
8944 . 0 1056 . 0 1 ) 25 . 1 ( )
50 45 ( = - = - ³ = ³ z P x P s
μ
5. El tiempo de incapacidad por enfermedad de las secretarias de la UTP en un mes, tiene una distribución normal con una media de 120 horas y una desviación estándar de 25 horas. Si Rosita se enferma, hallar la probabilidad de que el tiempo de ausencia a la UTP esté comprendida entre 60 y 90 horas. SOLUCIÓN: Sea x = tiempo de incapacidad Donde: x ∼ N( μ = 120 ; s = 25 ) ESTADÍSTICA APLICADA 76 No
piden: P(60 < x < 90) = ) 20 . 1 40 . 2 ( ) 25 120 90 25 120 60 ( - < < - = < < x z P P s
μ
P(60 < x < 90) = 0.1151 ± 0.0082 = 0.1069 EJERCICIOS PROPUESTOS 1. Use la tabla Z para calcular las siguientes probabilidades: a) P(z < 3.96) b) P(z < 1.77) c) P(z > 3.04) d) e) f) g)
P(z > <2.88) P(1.43 z < 3.69) P( 2.34 < z < 1.71) P( 3.07 < z < 1.68)
2. Use la tabla Z para hallar el valor de ªmº en: a) P(z < m) = 0.9 b) P(z > m) = 0.1 c) P( 1.24 < z < m) = 0.8 d) P( m < z < m) = 0.99 e) P( m < z < m) = 0.68 3. Si ªxº se distribuye en forma normal con una media de 12 y una desviación estándar de 3, calcule las siguientes probabilidades: a) P(x < 15) b) P(x > 10) c) P( 9 < x < 13) d) P(2 < x < 5) e) P( 3 < x < 10) 4. Si ªxº se distribuye en forma normal con una media de 10 y una desviación estándar de 2, calcule el valor de ªmº si: a) P(x > m) = 0.95 b) P(m < x < 10) = 0.2 c) P( m < x ± 10 < m) = 0.99 5. El costo de producción de un determinado artículo tiene una distribución normal con una media de 30 soles y una varianza de 9 soles 2 . Si se elige al azar un artículo, ¿cuál es la probabilidad de que su costo de producción sea por lo menos de 27 soles? ESTADÍSTICA APLICADA 77 6. Las llamadas que se registran en la UTP tienen una distribución normal con una media de 4 minutos y una variancia de 2 minutos. Hallar la probabilidad de que una llamada tenga una duración comprendida entre 2 y 5 minutos. 7. El tiempo que le dedican los estudiantes para aprender Estadística es una variable aleatoria que tiene una distribución normal con una media de 25 horas y una varianza de 4 horas 2 . Si se elige al por azarloamenos un 20 estudiante, haya estudiado horas?. ¿cuál es la probabilidad de que 8. Suponga que el costo de producción de una calculadora tiene una distribución normal con una media de 40 soles y una varianza de 9 soles 2 . Si se elige una calculadora al azar, hallar: a) La probabilidad que su costo de producción sea por lo menos de 42 soles. b) La probabilidad que su costo de producción sea a lo más de 36 soles. c) La probabilidad que su costo de producción difiera de la media poblacional en menos de 5 soles. 9. Elen tiempo de incapacidad enfermedad denormal las secretarias de la de UTP un mes, tiene unapordistribución con una media 100 horas y una desviación estándar de 16 horas. Si Yuli se enferma, hallar la probabilidad de que el tiempo de ausencia a la UTP esté comprendida entre 80 y 95 horas.
10. Si el largo de una varilla se distribuye en forma normal con un a media de 10 y una varianza de 2. Y una varilla se considera aceptable si tiene una longitud mayor de 11 pulgadas. a) Hallar el porcentaje de varillas aceptables. b) ¿Cuál es la probabilidad de que si se seleccionan al azar 4 varillas, 3 de ellas presenten una longitud aceptable? 11. El número de horas que un estudiante necesita para aprender un tema de estadística es una variable aleatoria que tiene una distribución normal. Si el 84.13% de los estudiantes emplean mas de 3 horas y sólo el 2.28% mas de 9 horas. Calcule usted la media y la varianza.
ESTADÍSTICA APLICADA 78 12. Una fábrica se dedica al llenado de botellas de un agua de mesa. La capacidad de las botellas se distribuyen en forma normal con una media de un litro y una desviación estándar de 1.1litros. Se rechazan las botellas con capacidad inferior a 0.99litros o superior a 1.1litros. La fábrica realiza una inspección consistente en elegir 20 botellas al azar y si encuentra más de 2 botellas rechazables, despiden al jefe de producción. ¿Qué probabilidad tiene el jefe de producción de perder su puesto de trabajo? ESTADÍSTICA APLICADA 79 UNIDAD IV DISTRIBUCIONES MUESTRALES La estadística trabaja con datos que fueron obtenidas de muestras aleatorias y de éstas obtenemos valores estadísticos o estimadores de las cuales necesitamos saber cuál es su comportamiento probabilístico para poderlosrealizar un confiabilidad análisis estadístico y a su vez nos permitirá establecer niveles de y de riesgo. DISTRIBUCIÓN MUESTRAL Es una función de probabilidad asociada a un estimador, que se genera con todas las muestras aleatorias de tamaño ªnº que se puedan obtener de una población. Por ejemplo x , 2 1 xx - y S 2 son estimadores o valores estadísticos, mas cada una de ellas tiene una determinada distribución de probabilidad particular. DISTRIBUCIÓN DE PROMEDIOS MUESTRALES Es una función de probabilidad que se forma con los promedios
muestrales que se obtienen a partir de todas las muestras aleatorias de tamaño ªnº que se puedan extraer de una población. TEOREMA Si de una población de tamaño ªNº que tiene una media μ x y varianza s 2 x
e extraen mue tra aleatoria de calculamo u promedio n x x n i i å = = 1 , entonce la media y varianza variable x on: a)
Si la
mue tra
x x
n x x 2 2
μ μ =
y
=
ESTADÍSTICA APLICADA 80 b) Si la mue tra on x x
1 ( 2 2 = N n x x
μ μ =
n N
s s OBSERVACIÓN:
y
de
ªnº
y
)
in reemplazo:
en
cada
mue tra
la
on con reemplazo o la población e
s
s
tamaño
infinita:
Si N n < 0.05 entonce n x x 2 2 s s = con o in reemplazo.
DISTRIBUCIÓN DE PROMEDIOS MUESTRAES SI LA VARIABLE EN ESTUDIO SE DISTRIBUYE EN FORMA NORMAL Sea ªxº una variable aleatoria que tiene una di tribución media μ
normal
con
x
y varianza s 2 x . Si de e ta di tribución e extraen mue tra aleatoria de tamaño ªnº y en cada mue tra calculamo u n x x n i i å = = 1 , entonce la variable x e di tribuye en forma normal con una media x
promedio
μ y varianza 2 x s .
Entonce :
TEOREMA DEL LÍMITE CENTRAL Sea ªxº una variable aleatoria
x
que tiene una di tribución con media
y varianza s 2 x
. Si de ta en di cada tribución extraen tamaño ªnºe y mue tra ecalculamo n x x
mueu tra aleatoria promedio
de
μ
n i i å = = 1 , entonce aleatoria media x
i x
el e
tamaño de mue tra e di tribuye en forma
grande ( n ³ 30 ), la aproximadamente normal con
μ y varianza 2 x s . Z = x x x s
μ -
∼ N(0,1). ESTADÍSTICA APLICADA 81 Entonces:
DISTRIBUCIÓN DE DIFERENCIAS DE PROMEDIOS MUESTRALES TEOREMA Si de 2 oblaciones de tamaños N 1 y N 2 normales e inde endientes que se 1
2 2 1
distribuyen
con
medias
μ
y μ , y varianzas s y
s
2 2 , e mue tra 1 y n 2
extraen aleatoria
de
tamaño
n
, re pectivamente; entonce , la variable aleatoria 2 1 x x - tiene una di tribución normal con media 2 1
variable una
x x -
μ y varianza 2 2 1 x x s . a)
Si la
mue tra
on con reemplazo:
mue tra
on
2 1 x x -
μ = μ 1 μ 2 y 2 2 1 x x s = 2 2 2 1 2 1 n n s s + b)
Si la
2 1 x x -
μ = μ 1 μ 2
y
2 2 1 x x s = 1 ( ) 1 ( 2 2 2 2 2 2 1 1 1 2 1 -
)
in reemplazo:
+ N n N n N n N n s s Entonce :
OBSERVACIÓN: Si la poblacione
no
tienen
di tribucione
u ar el teorema del límite central 1 y n 2 ean mayore o iguale que 30.
normale ,
entonce
e
puede
de
éxito
iempre y cuando n
Z = x x x s ∼ 2 2 2 x
μ -
a roximadamente N(0,1) 1 1 1 x
x x x x Z - = s
μ
∼ N(0,1) ESTADÍSTICA APLICADA 82 DISTRIBUCIÓN DE PROPORCIONES MUESTRALES Si de una oblación distribuida Binomialmente se r que
con
robabilidad
,
extrae una muestra aleatoria de tamaño n, entonces se uede mostra la media de X: número de éxitos en la muestra, es μ = np y que
su varianza es s
2 = p, n pq . e
npq. En con ecuencia la proporción mue tral tiene media y varianza Entonce : por el Teorema del Limite Central, cuando n grande e tiene:
Fórmula de aproximación Normal a la Binomial. Si X e una Binomial con parámetro n y p, entonce : i)
ii)
iii)
EJERCICIOS RESUELTOS 1. Suponga que una empre a produce un determinado artículo de acuerdo a un proce o con una media de 950 gramo y una varianza de 1600 gramo 2 . Si e eligen al azar y con reemplazo 36 artículo , hallar la probabilidad que el promedio mue tral por lo meno 965 gramo . SOLUCIÓN: Sea la variable aleatoria: x = pe o de lo
x
x ∼ ?(μ
= 950 , s 2 x = 1600) y ( ) ) 5 . 5 . ( ) 5 . 5 . ( npq np k Z npq np k P k X k P k X P - + < <
n = 36
artículo
(gramo )
ea
- = + < ( ) 5 . 5 ( ) 5 npq np b Z npq np a P b X - < < - + = - < ( ) 5 . 5 ( ) 5 npq np b Z npq np a P b X - + < < - = + < n pq p p npq np X z = = Ã
< - ≅ = ) . . 5 . (
a P b X a P
< + = < < ) . . 5 . (
a P b X a P
< - = £ £
83ESTADÍSTICA APLICADA Entonce , como el mue treo e x x
n x x 2 2
μ μ = = 950
s s = 36 1600
6 ⇒ 40 36 1600
=
y
con reemplazo:
= = x s
No piden: ) 965 ( ³ x P Como n ³ 30 , aplicamo el Teorema del Límite Central. E to e : ) 965 ( ³ x P = 965 ( x x x x x P s s
)
μ
μ ³ , reemplazando: ) 965 ( ³ x P = ) 25 . 2 ( ) 6 40 950 965 ( ³ = ³ z P z P , haciendo uso de la tabla ªzº: ) 965 ( ³ x P = 1 P(z £ 2.25) = 1 ± 0.9878 = 0.0122 2. Las estaturas de 1000 estudiantes tienen una media de 170 centímetros y una varianza de 16 centímetros 2 . Si se eligen al azar y sin reemplazo una muestra de tamaño 32, hallar la probabilidad centímetros.
que el promedio muestral sea a lo mas 172
SOLUCIÓN: Sea la variable aleatoria: x = estatura de los estudiantes (centímetros) x ∼ ?(μ x = 170 , s 2 x = 16)
y
n = 32
Entonce , como el mue treo e x x μ μ =
1 1000 32 1000 (
= 170
y
in reemplazo:
484484484 . 0 )
32 16 ) 1 ( 2 2 = = = N n x x
n N
s
s
⇒
x
696049196 . 0 =
s
No piden: ) 172 ( £ x P Como n ³ 30 aplicamo el Teorema del Límite Central. ESTADÍSTICA APLICADA 84 E to e : ) 172 ( £ x P = ) 172 ( x x x x x P s s
£ -
μ μ
-
reemplazando:
) 172 ( £ x P = 9979 . 0 ) 87 . 2 ( ) 696049196 . 0 170 172 ( = £ = £ z P z P (ver tabla z) 3. El tiempo de duración de un foco se distribuye en forma normal con una media de 10000 horas y una varianza de 100 horas 2
. Si se selecciona una muestra al azar con reemplazo de tamaño 16, hallar la probabilidad que su promedio esté comprendido entre 9980 y 10010 horas. SOLUCIÓN: Sea la variable aleatoria: x = tiempo de duración de los focos (horas) x ∼ N(μ x = 10000, s 2 x = 100)
y
n = 16
Entonce , como el mue treo e x x
n x x 2 2
μ μ = = 10000
con reemplazo:
y
s s = = 16 10000 , entonce : 25 4 100 16 10000 = = = x s No piden: P(9980 < x P(9980 < x 25 10000 10010 25 10000 9980 ( < < x x P s
< 1010) < 1010) =
e tandarizando: )
μ P(9980 < x < 1010) = P( 0.80 < z < 0.40) = 0.6554 ± 0.2119 = 0.4435 ESTADÍSTICA APLICADA 85 4. Suponga que dos máquinas A y B producen bolsas de azúcar de iguales características. La máquina A produce bolsas con una media de 970 gramos y una varianza de 256 gramos 2 , y la máquina B produce bolsas con una media 980 gramos y una varianza 144 gramos 2 . Si se eligen al azar y con reemplazo 36 bolsas producidas por A y 64 bolsas producidas por B, hallar la probabilidad que la diferencia de los promedios muestrales sea a lo más 8 gramos. SOLUCIÓN: Sean las variables aleatorias: x A = peso de las bolsas producidas por la máquina A (gr.) x B = peso de las bolsas producidas por la máquina B (gramos) A A
x ∼ ?(μ
= 970 , s
2 A = 256)
y
n
A= 36 x B
B
∼ ?(μ
= 980 , s
2 B = 144) B = 64
y
n
Entonce , como el mue treo e B A x x -
μ = μ A μ
con reemplazo:
B 2 1
= 970 ± 980 = 10
y
B A x x -
s = 361111 . 9 64 144 36 256 2 2 = + = + B B A A n n s s , entonce : 059593 . 3 = B A x x s No piden: P = B A B A x x P x x P
) 8 8 ( ) 8 (
£ - £ - = £ -
Como n A ³ 30 y n B ³ 30, aplicamo
el Teorema del Límite Central.
E to e : P =
)
059593 ) 10 (. 83 / ) ( 059593 . 3 ) 10 ( 8 ( - £ - - £ - - - B A B A x x x x B A x x P s μ
P = P(0.65 £ z £ 5.88) = 1 ± 0.7422 = 0.2578 5. Según reportes del centro nacional para estadísticas de salud, alrededor del 20 % de la población masculina adulta de los Estados Unidos es obesa.
Se elige al azar una muestra de 150 hombres adultos en los Estados Unidos. ¿Cuál es la probabilidad de que: ESTADÍSTICA APLICADA 86 a) Haya a lo más 25 personas obesas? b) Haya más de 22 pero menos de 35 obesos? c) Haya por lo menos un 25% de obesos en la muestra? SOLUCIÓN: Sea X el número de personas obesas en la muestra. Usando aproximación normal a la Binomial se tiene que: a) b)
c) P( = P(Z>1.53) = 1 P(Z<1.53) = 1
0.9730 = 0.0630.
EJERCICIOS PROPUESTOS 1. Suponga que una empresa produce un determinado artículo de acuerdo a un proceso con una media de 500 gramos y una varianza de 49 gramos 2 . Si se eligen al azar y con reemplazo 50 artículos, hallar la probabilidad que el promedio muestral sea a lo mas 505 gramos. 2. Las estaturas de 1200 estudiantes tienen una media de 168 centímetros y una varianza de 20 centímetros 2. Si se eligen al azar y sin reemplazo una muestra de tamaño 40, hallar la probabilidad que el promedio muestral esté comprendido entre 166 y 175 centímetros. 3. El tiempo de duración de un foco con una media de 100000 horas y una 2 . Si se selecciona una muestra al azar con hallar la probabilidad que su promedio 99985 y 100025 horas. (
)
(
24 30 5 . 25 5 . 25 25 ⎟ ⎠
)
(
= - < =
)
1814 . 0 91 . 0
se distribuye en forma normal varianza de 80 horas reemplazo de tamaño 25, esté comprendido entre
⎞ ⎜ ⎝ ⎛ < = < ≅ £ (
)
(
⎟ ⎠ ⎞ ⎜ ⎝ ⎛ < < = < < ≅ < <
Z P Z P X P X P ) =
24 30 5 . 34 24 30 5 . 22 5 . 34 5 . 22 35 22 Z P x P X P ( ) 8123 . 0 0063 . 0 8186 . 0 91 . 0 53 . 1 = - = < < Z P ) 24 30 5 . 37 ( ) 5 . 37 ( ) 25 . Ã > = ³ = ³ Z P X P p ESTADÍSTICA APLICADA 87 4. Suponga que do máquina A y B producen bol a de azúcar de iguale caracterí tica . La máquina A produce bol a con una media de 980 gramo y una varianza de 200 gramo 2 , y la máquina B produce bol a con una media 990 gramo y una varianza 100 gramo 2 . Si e eligen al azar y con reemplazo 40 bol a producida por A y 50 bol a producida por B, hallar probabilidad que la diferencia de lo promedio mue trale ea
la
por lo meno 6 gramo . 5. Suponga que una máquina ha ido programada para producir artículo cuyo pe o tienen una di tribución con una media de 250 gramo y una varianza de 625 gramo 2 . Si e eligen al azar 49 artículo , hallar la probabilidad que u promedio ea por lo meno 255 gramo y la probabilidad que u promedio e té comprendido entre 243 y 256 gramo , con iderando: a) Una mue tra con reemplazo. b) Una mue tra in reemplazo tomada de un lote de 400 artículo . 6.
En
un
e tudio
para
comparar
lo
pe o
promedio
de
niña de una cuela primaria, tomó mue tra de 40 niño y 45eniña . Se abe queelo peuna o tanto dealeatoria niño como de niña tienen una di tribución normal con media de 50 kilo , y con varianza de 70 y 75 kilo 2
niño
y
y
46
re pectivamente, hallar la probabilidad de que el promedio de lo pe o de lo meno 5 kilo má grande que el pe o de la niña .
niño
ea al
7. De do máquina que embol an café automáticamente, e han extraído 64 bol a al azar de cada máquina. Amba máquina embol an con idéntica media y varianza de 6 y 10 re pectivamente, hallar la probabilidad que ambo promedio mue trale difieran en por lo meno 2. 8. Suponga que la UTP tiene 200 profe ore , 50 de lo cuale tienen el grado de doctor. Do mue tra con reemplazo de tamaño 32 on elegida al azar y en forma independiente, y e regi tran a lo que tienen doctorado, hallar la probabilidad que la do mue tra difieran en por lo meno 6 doctorado . 9. Suponga que en un di trito de Lima hay aproximadamente 8000 adulto , donde el 20% compra u ualmente una revi ta A. Si e elige una mue tra aleatoria de tamaño 225, hallar la probabilidad ESTADÍSTICA APLICADA 88 que la proporción mue tral de per ona que compran la revi ta A, ea mayor de 0.17. 10. Suponga que en un e tablecimiento la proporción de cliente que opinan que la atención ofrecida e buena e p. Determinar el mínimo tamaño de la muestra requerida, si se desea que: a) La ro orción muestral difiera de la ro orción oblacional en no mas de una cantidad ªdº, con una robabilidad ª1 a ª. b) L desvi ción estánd r de l proporción muestr l se m yor ªdº. c) El coeficiente de v ri bilid d de ªpº se no m yor ªdº. DISTRIBUCIÓN CHI ± CUADRADO 2 ) (m
[
]
c Una variable aleatoria ªxº tiene una distribu ión Chi ± Cuadrado on ªmº grados de libertad, si su fun ión de probabilidad o de densidad es:
Donde: G(x) es la fun ión gamma, definida por: ò ¥
- = G 0 1 ) ( y x dy e y x , x > 0
no
RÁFICA:
f(x)
c 2 (m)
CARACTERÍSTICAS: 1. Su variable toma sólo valores positivos. 2. Presenta un sesgo o asimetría a la dere ha. 3. Es asintóti a on respe to al eje horizontal en su parte positiva. f(x) = 2 1 2 2 2 ) ( 2 1 ) ( x m m m e x x f -
G =
, x > 0 ESTADÍSTICA APLICADA 89 4. A medid que los gr dos de distribución present menor sesgo. 5. P r ªmº gr dos de libert d respectiv mente. TEOREMA Se ªxº medi μ
x 2 x s
un
v ri ble
le tori
y varianza , entonce
2 ) 1 ( 2 2 ~ ) 1 ( n
e cumple que:
libert d
ument n
su
medi
y
que
tiene
un
(m>30),
v ri nz
son
distribución
l ªmº
y
norm l
ª2mº
con
x S n
c s
TABLA CHI ± CUADRADO Compruebe la iguiente
probabilidade :
1.
975 . 0 ) 023 . 19 ( 2 ) 9 ( = < c P
2. 70 . 0 30 . 0 1 ) 267 . 7 ( 2 ) 10 ( = - = > c P ESTADÍSTICA APLICADA 90 3. 7 . 0 2 . 0 9 . 0 ) 412 . 28 578 . 14 ( 2 ) 20 ( = - = < < c P
4. 6 . 0 1 . 0 7 . 0 ) 656 . 10 168 . 4 ( 2 ) 9 ( = - = < < c P
5.2 4 . 0 5 . 0 9 . 0 ) 256 . 40 336 . 29 ( ) 30 ( = - = < < c P
ESTADÍSTICA APLICADA 91 DISTRIBUCIÓN ªtº DE STUDENT [ ] ) (m t Una variable aleatoria ªxº tiene una distribu ión ªtº de Student grados de libertad, si su fun ión de probabilidad es:
RÁFICA:
on ªmº
CARACTERÍSTICAS: 1. Tiene una forma ligeramente a ampanada. 2. Es simétri a on respe to a su media ero. 3. Es asintóti a on respe to al eje ªxº. 4. Se aproxima ada vez mas a la distribu ión normal estándar, a medida que los grados de libertad sean mayores de 30. 5. Para ªmº grados de libertad su media y varianza son ª0º y ª 2 - m m º respectiv mente. TEOREMA Se ªxº un v ri ble medi μ
le tori
que
tiene
un
distribución
norm l
con
x
y varianza s 2 x . Si de la di tribución de ªxº e mue tra aleatoria de tamaño ªnº; entonce x x S x t
extrae una la variable aleatoria
μ = tiene una distribución ªtº de Student con (n ± 1) grados de libertad, donde: a) n S
Si la muestra es con reemplazo:
S x x 2 2 = b) 1 ( 2 2 = N n N n S S
Si la muestra es sin reemplazo:
)
x
x
2
1 2 ) 1 ( 1 ) 2 ( ) 2 1 ( ) ( + + G + G =
m m x m m m x f p ; µ < x < µ ESTADÍSTICA APLICADA 92 TEOREMA Sean ªx 1 º y ªx 2 º dos variables aleatorias inde endientes distribuciones normales de medias μ
con
1 y μ 2 y varianza común s 2 . Si de e ta di tribucione 1 º y ªn 2 º , re pectivamente; 2 1 ) ( ) ( 2 1 2 x 1 x S x x t
e
extraen
entonce
mue tra
la
variable
aleatoria
aleatoria
de
tamaño
ªn
- - =
μ μ tiene una distribución ªtº de Student con (n grados de libertad, donde: a)
Si el muestreo es con reemplazo:
⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ + = 2 1 2 2 1 1 2 1 n n S S p x x b) Si el muestreo es sin reemplazo: ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟⎠ ⎞ ⎜ ⎜ ⎝ ⎛ + ⎟ ⎟ ⎠ ⎞ ⎜ ⎜⎝ ⎛ -
2)
= 1 1 1 1 2 2 2 1 1 2 2 N
2 1 1 2 1
n N n N n N n S S p x x 2 2 2 2 2 1 -
y
) 1 ( ) 1 ( 1 2 1 2 + - + -
= n n S n S n S p es la varianza ponderada, que es el estimador común s 2 . TABLA ªtº DE STUDENT Compruebe la iguiente
probabilidade :
1. P( t (8) < 2.306) = 0.975
93ESTADÍSTICA APLICADA 2. P( t (20) > 1.325) = 1 ± 0.1 = 0.9
de la varianza
3. P( 1.310 < t (30) < 2.457 ) = 0.99 ± 0.10 = 0.89
4. P( 0.527 < t (75) < 0.846) = 0.8 ± 0.3 = 0.5
ESTADÍSTICA APLICADA 94 5. P(0.849 < t (50) < 1.299) = 0.9 ± 0.8 = 0.1
DISTRIBUCIÓN F DE SNEDECOR [ ] ) , ( m n F Una variable aleatoria ªxº tiene una di tribución ªFº con ªnº y ªmº grado de libertad, i u función de probabilidad e :
GRÁFICA:
CARACTERÍSTICAS: 1. Su variable e tá definida ólo para valore po itivo . 2. Pre enta un e go o a imetría po itiva o a la derecha. 3. E a intótica en u parte po itiva con re pecto al eje po itivo. 4. A medida que lo grado de libertad aumentan ( n > 30 , 30 ) la di tribución pre enta menor e go, e decir la di tribución e hace ma imétrica. f(x) F(n,m) 2 2 2 ) 1 )( ( ) (
m
>
) )( ( ) ( 2 2 1 2 m n n n m nx m n m n m n x x f + + G G G = + ; si: x > 0 ESTADÍSTICA APLICADA 95 5. P r ªn y mº gr dos de libert d su medi 2 m p ) 4 ) 2 2 - m m m
y v ri nz
son:
m r m > 2 ( ) 2 ( 2 ( 2
y
+ n n m p r m > 4
PROPIEDAD RECÍPROCA Si v ri le tori que tiene un distribución ªFº gr ªxº dos es de un libert d,ble se cumple que:
con ª n y mº
TEOREMA Se n ªx 1 º y ªx 2 º dos v rimedi bless: le norm l con μ tori s
1 y 2
μ
independientes
distribuid s
en
form
2 1
y varianzas:
s y 2 2 s re pectivamente. Si de amba poblacione ªx 1 º y ªx 2 º e extraen mue tra aleatoria 1 º y ªn 2 º ; entonce , la variable: 2 1 2 2 2 2 2 1 s s S S F = tiene una di tribución 1 ± 1º y ªn 2 ± 1º grado de libertad TABLA ªFº DE SNEDECOR Compruebe la iguiente 1. P[F (6 , 13) < 2.92] = 0.95 ) , 1 ) , n m m n a a
, ( , 1 ( F F = -
ESTADÍSTICA APLICADA 96
F con
de
ªn
probabilidade :
tamaño
ªn
2. P[F (14, 10) > 4.60 ] = 1 ± 0.99= 0.01
3. P[F (27, 4) <13.88 ] = 0.99
4. P[F (9, 5) > 4.77 ] = 1 ± 0.95 = 0.05
ESTADÍSTICA APLICADA 97 5. P[F (32, 15) < 3.19 ] = 0.99
EJERCICIOS RESUELTOS 1. Supong que el tiempo de tención por cliente en un tiend tiene un distribución norm l con un desvi ción estánd r de 4 minutos. Si se elige un muestr le tori de 25 clientes: ) H ll r l prob bilid d que su v ri nci se menor de 12 minutos 2 . b) H ll r l prob bilid d que su v ri nci se m yor de 10 minutos 2 . c) H ll r el v lor de ªmº t l que P( S 2 < m ) = 0.7 SOLUCIÓN: Se x = tiempo de
x
x ∼ N(μ
= ?, s
x = 4)
y
n = 25
12a) ) 1)( ) 1 ( ( ) 12 ( 2 2 2
tención por cliente(minutos)
2 s s x n S n P S P < = < , reemplazando: = 16 12 24 ( 2 ) 24 ( 2 ) 24 ( = < = <
x P
c c
1970 . 0 ) 18 ( )
P
b) ) 10 ) 1 ( ) 1 ( ( ) 10 ( 2 2 2 2 s s x n S n P S P > = >
= 16 10 24 ( ) 2 24 ( 2 ) 24 ( = > = >
c c P x P ESTADÍSTICA APLICADA 98 2
) P(S < m) = 0.7 7 . 0 )
() 1 ( ) 1 ( 2 2 2 =
9208 . 0 ) 15 ( )
< s s m n S n P 7 . 0 ) 16 24 (
2 ) 24 ( = < m P c
7 . 0 ) 5 . 1 ( 2 ) 24 ( = < m P c de la tabla: 1.5m = 27.096, enton es: m = 18.064 2. Suponga que los pesos de las al uladoras produ idas por una empresa tienen una distribu ión normal on una varian ia de 16 gramos 2 . Si se elige una muestra aleatoria de 20 al uladoras, hallar: a) La probabilidad que su desvia ión estándar sea por lo menos de 3 gramos. b) La probabilidad que la desvia ión estándar sea a lo mas de 5 gramos. ) El valor de m tal que P ( S 2 < m ) = 0.8 SOLUCIÓN: Sea x = peso de una al uladora(gramos) x
x ∼ N(μ = ?, s
2 x = 16)
y
a) ) 9 ) 1 ( ) 1 ( ( ) 9 ( ) 3 ( 2 2 2 2 s s P xS nP SS nP ³ -
n = 20
= ³ = ³ , reemplazando: = 16 9 19 ( 2 ) 19 ( 2 ) 19 ( = ³ = ³ c c P
9339 . 0 ) 6875 . 10 ( )
x P b) ) 25 ) 1 ( ) 1 ( ( ) 25 ( ) 5 ( 2 2 2 2 s s x n S n P S P S P £ = £ = £
= 16 25 19 ( 2 ) 19 ( 2 ) 19 ( = £ = £
x P
99 2
c c
P
ESTADÍSTICA APLICADA )
P(S
< m) = 0.8
8 . 0 ) ) 1 ( ) 1 ( ( 2 2 2 = <
s s m n S n P
9441 . 0 ) 6875 . 29 ( )
8 . 0 ) 16 19 ( 2 ) 19 ( = < m P c
8 . 0 ) 1875 . 1 ( 2 ) 19 ( = < m P c de la tabla: 1.1875m = 23.9, enton es: m = 20.1263 3. Suponga que los pesos de los alumnos de la UTP tienen una distribu ión normal on una media de 70 kg. y una varian ia de 10 kg 2 . Si se eligen al azar 50 alumnos, hallar: a) 12 2 . b) 2 >
la probabilidad que su varian ia esté omprendida entre 8 y kg el valor de ªmº tal que: P( s m) = 0.3
SOLUCIÓN: Sea x = peso de un alumno de la UTP(kilogramos) x ∼ N(μ x = 70, s 2 x = 10)
y
n = 50
12a) ) 1)( ) 1 ( 8 ) 1 ( ( ) 12 8 ( 2 2 2 2 2 s s s x n S n x n P S P < < = < < reemplazando: = 681 . 0 1596 . 0 8406 . 0 ) 8 . 58 2 . 39 ( ) 10
12 49 10 8 49 ( 2 ) 49 ( 2 ) 49 ( = - = < < = < <
x x P 2
b)
c c
P
P(S
> m) = 0.3 3 . 0 ) ) 1 ( ) 1 ( ( 2 2 2 = > s s m n S n P 3 . 0 ) 10 49 ( 2 ) 49 ( = > m P c
3 . 0 ) 9 . 4 ( 2 ) 49 ( = > m P c de la tabla: 4.9m = 53.67, enton es: m = 10.9531 ESTADÍSTICA APLICADA 100 4. Suponga que para analizar el tiempo de aten ión por liente en un estable imiento on 1000 lientes, se tomó una muestra aleatoria sin reemplazo de 24 aten iones on la ual se obtiene un tiempo promedio de 10 minutos y una varian ia de 2 minutos 2 . Si se toma otra muestra sin reemplazo de tamaño 24 hallar la probabilidad que el promedio muestral difiera de su media pobla ional en menos de un minuto.
2
SOLUCIÓN: Sea x = tiempo de aten ión (minutos) N = 1000, n = 24, 10 = x y S = 2
< - μ x P = ) 1 1 ( = )
) 1 ( 1 1 ( x x x S S x S P < < - μ
< - < -
Como el muestreo es sin reemplazo, entonces: ) 1 ( 2 2 = N n N n S S x x , reemplazando: 081414748 . 0 ) 1 1000 24 1000 ( 24 2 2= = x S , entonces: 285333 . 0 = x S , luego: ) 285333 . 0 1 285333 . 0 1 ( )) 23 1 (( < < = < - t P x P
μ
μ x P
) 23 ( = - = < < - =
9981 . 0 00095 . 0 99905 . 0 ) 5047 . 3 5047 . 3 ( t P
5. Suponga que una maquina produce diariamente 5000 artículos, y que para analizar los pesos de tales artículos se eligieron al azar y sin reemplazo 25 unidades producidas en un día, obteniéndose un peso promedio de 450 grs y una variancia de 20 grs 2 . Si se toma otra muestra sin reemplazo de tamaño 25, hallar la probabilidad que el promedio muestral difiera de su media poblacional en mas de 6 grs. SOLUCIÓN: Sea x = peso de los artículos (gramos) N = 5000, n = 25, 450 = x y S 2 = 20 ESTADÍSTICA APLICADA 101 ) 6 ( > - μ x P = ) 6 ( 1 = 6 6 ( 1 x x x S S x S P £ £ μ
) 6 6 ( 1 = )
£ - -
£ - £ - -
Como el muestreo es sin reemplazo, entonces: ) 1 ( 2 2 = N nS S x
n N
x
μ x P μ x P
, reemplazando: 796159231 . 0 ) 1 5000 25 5000 ( 25 20 2 = = x S , entonces: 89228 . 0 = x S , luego: ) 89228 . 0 6 89228 . 0 6 ( 1 ) 6 ( ) 24 ( < < - = > - t P x P ) 24 ( = < < - - =
μ 00000059 . 0 ) 7243 . 6 7243 . 6 ( 1
t P
6. Suponga que dos máquinas A y B producen un mismo artículo y que los tiempos de producción (minutos) tienen distribuciones normales con medias: μ A = 1430, μ B =1410 y variancias 625 2 = A
s , 900 2 = B s , re pectivamente. Si e eligen al azar 31 artículo producido por la máquina A y 25 artículo producido por la máquina B, hallar la probabilidad que la variancia de B ea a lo ma 2.7216 vece la variancia de A. SOLUCIÓN: Sean x A = tiempo de producción de la máquina A X B
= tiempo de producción de la máquina B X A
x
∼ N(μ
= 1430, s
2 x = 625) A = 31
y
n X
B
x
∼ N(μ
= 1410, s
2 x = 900) B = 25
y
n
Entonce : ) 7216 . 2 ( ) 7216 . 2 ( 2
2 2 2 < = < A B A B S S P S S P ESTADÍSTICA APLICADA 102 Como 2 1 2 2 2 2 2 1 s s S S F = , entonce : 2 2 2 2 2 625
900 B A A B B A S S S S F = = s s ~F (30,24) y 2 2 2 2 2 2 900 625 A B B A A B S S S S F = = s s ~F (24,30) ) 900 7216 . 2 625 900 625 ( ) 7216 . 2 ( ) 7216 . 2 ( 2 2 2 2 2 2 x S S P S S P S S P
A B A B A B < = < = < =
95 . 0 ) 89 . 1 (
) 30 , 24 ( = < F P EJERCICIOS PROPUESTOS 1. a)
2
Hallar la P ( c
iguiente
probabilidade , para 30 grado
de libertad:
> 18.493 ) b) P ( 20.599 < c 2 < 43.773 ) 2. a) 2 > b) 2 <
Hallar las siguientes probabilidades, para 12 grados de libertad: P ( c 9.034 ) P ( 7.807 < c 18.549 )
3. Cal ular: a) P( c 2 (10) < 7.267 ) b) P( c 2 (29) > 42.557 ) ) P( 36.755 < c 2(42) < 54.090 ) 4. a) 2 > b) 2 < ) 2 <
Hallar las siguientes probabilidades, para 11 grados de libertad : P ( c 19.675 ) P ( 3.816 < c 21.92 ) m si P ( m < c 12.899 ) = 0.25
25. Hallar ªmº tal que : P( ) 29 ( c > m ) = 0.8
6. Suponga que el tiempo de aten ión por liente en una tienda tiene una distribu ión normal on una desvia ión estándar de 2 minutos. Si se elige una muestra aleatoria de 21 lientes: a) Hallar la probabilidad que su varian ia sea menor de 5 minutos 2 . ESTADÍSTICA APLICADA 103 b) Hallar la probabilidad que su varian ia sea mayor de 2 minutos 2 . d) Hallar el valor de m tal que P( S 2 < m ) = 0.6 7. Suponga que los pesos de los alumnos de la UTP tienen una distribu ión normal on una media de 70 kg. Y una varian ia de 16 kg 2 . Si se eligen al azar 25 alumnos, hallar: a) la probabilidad que su varian ia este omprendida entre 12 y 20 kg 2 . b) el valor de ªkº tal que : P( s 2 > k) = 0.4 8. Suponga que el tiempo de dura ión de los tubos fluores entes tienen una distribu ión normal on una media de veinte mil horas y una varian ia de 5.76 horas 2 . Si se elige al azar una muestra de 36 fluores entes, hallar: a) La probabilidad que su varian ia sea por lo menos de 3.69 horas 2 . La probabilidad que su varian ia esté omprendida entre 3 yb)7 horas 2 . ) La probabilidad que su desvia ión estándar sea a lo mas 4.53 horas. d) El valor de ªkº tal que : P( s 2 < k ) = 0.4 9. Si t es una variable aleatoria que tiene una distribu ión ªtº de Student on 29 g. l. , hallar : a) P ( t > -1.699 ) b) P ( -2.045 < t < 1.311 ) 10. Hallar las
a)
Hallar P( -2.145 < t < 2)
b) Hallar k si P( k < t < 1.761 ) = 0.875 12. Si: n = 15
a)
Hallar P( -2.145 < t < 2) b) Hallar k si P( k < t < 1.761 ) = 0.875
13. Si: n = 49, al ular ªmº tal que : P(t > m ) = 0.8 ESTADÍSTICA APLICADA 104 14. Si ªtº es una variable aleatoria que tiene una distribu ión ªtº de Student on 29 g.l. , hallar : a) P ( t > -1.699 ) b) P ( -2.045 < t < 1.311 ) ) m si P ( m < t < 2.045 ) = 0.875 15. Suponga que una máquina produ e diariamente 200 artí ulos, y que para analizar los pesos de tales artí ulos se eligieron al azar 36 unidades produ idas en un día, obteniéndose un peso promedio de 120 gramos y una desvia ión estándar de 5 gr. Si se toma otra muestra de tamaño 36, hallar la probabilidad que el promedio muestral supere a su media pobla ional en menos de 3 gramos. 16. Suponga que una máquina produ e diariamente 500 artí ulos, y que para analizar los pesos de tales artí ulos se eligieron al azar y sin reemplazo 16 unidades produ idas en un día , obteniéndose un peso promedio de 250 gr. y una varian ia de 12 gr 2 . Si se toma otra muestra, sin reemplazo, de tamaño 16 , hallar la probabilidad que el promedio muestral supere a su media pobla ional en menos de 3 gramos. 17. Suponga que una máquina produ e diariamente 1000 artí ulos, y que para analizar los pesos de tales artí ulos se eligieron al azar y sin reemplazo 25 unidades produ idas en un día, obteniéndose un peso promedio de 450 grs y una varian ia de 200 grs 2. Si se toma otra muestra, sin reemplazo, de tamaño 25, hallar la probabilidad que el promedio muestral supere a su media pobla ional en menos de 6 grs. 18. Cal ular: a) P(F (31,4) < 13.83) b) P(F (28,14) < 2.32) ) P(F (52,8) 5.06) d)< P(F (26,20) < 2.07) e) P(F
(35,25) < 1.89) 19. Suponga que dos máquinas A y B produ en un mismo artí ulo y que los tiempos de produ ión (minutos) tienen distribu iones normales on medias μ A = 1430, μ B =1410 y variancias 625 2 = A s , 900 2 = B s , re pectivamente. Si producido por la máquina máquina B, hallar: ESTADÍSTICA APLICADA 105 a) ) 7216 . 2 ( 2 2 A B S S P < b)
e A
eligen al azar y 25 artículo
31 artículo producido por
la
) 5568 . 3 7216 . 2 ( 2
2 < < A B S S P c) ªmº tal que: 98 . 0 ) 5568 . 3 ( 2 2 = < < A B S S m P 20. Suponga que do máquina A y B producen un mi mo artículo que lo pe o por artículo (gramo ) tienen di tribucione normale con media : μ
A = 550, μ B = 565 y variancias 2= A
s , 256
144
y
2 = B s , re pectivamente. Si e eligen al azar 21 artículo producido por la máquina A y 31 artículo producido máquina B, hallar: a) ) 6267 . 3 ( 2 2 A B S S P < b) ) 4344 . 1 08563 . 1 ( 2 2 < < B A S S P c) ªmº tal que: 94 . 0 ) 9245 . 4 ( 2 2 = < < A B S S m P
por
la
ESTADÍSTICA APLICADA 107 UNIDAD V INFERENCIA ESTADÍSTICA La
inferencia
análi i ,
e tadí tica
interpretación
e de
la
parte
re ultado
de y
la de
e tadí tica la
que
e
generalización
de
ocupa lo
re para toda unadepoblación en ba a dato etomado de euna mueultado tra aleatoria extraída e a población. Laeinferencia tadí tica divide en do parte , la e timación de parámetro y la prueba de hipóte i . ESTIMACIÓN DE PARAMETROS Son la aproximacione de lo parámetro a partir de dato captado en mue tra aleatoria y de acuerdo a cierto procedimiento e tablecido por indicadore que on llamado ªe timadore , valore e tadí tico o e tadígrafo º ESTIMADOR O VALOR ESTADÍSTICO O ESTADIGRAFO Un e timador e cualquier función de la ob ervacione de una mue tra aleatoria, cuya finalidad e obtener una e timación o aproximación valor de un parámetro. Por ejemplo el promedio mue tral
x
μ y la variancia muestral S 2 estima a su parámetro poblacional s
e tima a
u parámetro poblacional
del
del
2 . E decir
2
x
∼ μ
y S
∼ s
2 . PROPIEDADES DE LOS ESTIMADORES Para que lo e timadore ean bueno , e cumplir la iguiente propiedade : ESTIMADORES INSESGADOS Un e timador e in e gado parámetro. Si el e timador no e peranza matemática e timador. Por ejemplo
x
e
e y
i
u
decir confiable ,
e peranza
matemática
in e gado, entonce el parámetro e le
un e timador in e gado
también S 2 es un estimador insesgado ya que E(S 2 ) = s
ya
e deben de
a la llama
e
igual
a
u
diferencia entre la e go o error del ) = μ
que E( x
2 . ESTADÍSTICA APLICADA 108 ESTIMADORES CONSISTENTES Un e timador e con i tente i al tomar un tamaño de mue tra aleatoria cada vez má grande , u valor e aproxima cada vez má a u parámetro. ESTIMADORES EFICIENTES Un e timador in e gado e in e gado i u variancia e
eficiente con má pequeña.
ESTIMADORES SUFICIENTES Un e timador e uficiente i e de la mue tra aleatoria, la cual
re pecto
una función de toda la e capto para e timar a
a
otro
e timadore
ob ervacione u parámetro.
TIPOS DE ESTIMACIÓN ESTIMACIÓN PUNTUAL La e timación e puntual cuando el parámetro e valor.
e timado por un único
ESTIMACIÓN POR INTERVALOS La e timación e por intervalo cuando el parámetro no e e timado por un único valor, ino por un conjunto de valore contenido en un intervalo. La técnica de la e timación por intervalo con i te en a ociar a cada mue tra aleatoria que e o de pecha que debe contener al parámetro, a e te eun leintervalo denomina intervalo confianza. INTERVALOS DE CONFIANZA
PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL A) Si la variancia poblacional s 2 e conocida:
Donde: Z tab = ) 2 1 ( a Z B) Si l v ri nci 2 no e conocida:
pobl cion l s
Donde: t tab = ) 1 , 2 1 ( - n t a a s μ s - = + < < 1 ) ( x tab x tab Z x Z x P a μ - = + < < - 1 ) (
x tab x tab S t x S t x P ESTADÍSTICA APLICADA
109 PARA LA VARIANCIA DE UNA DISTRIBUCIÓN NORMAL A)
Si la media poblacional μ es conocida:
B)
Si la media poblacional μ no es conocida:
Donde:
a = nivel de signific ción 1 a = nivel de confi nz
PARA LA NORMALES A) 2 1 s 2 2 s
DIFERENCIA
DE
MEDIAS
DE
Si l s v ri nci s pobl cion les y on conocida :
Donde: Z tab = ) 2 1 ( a Z B) Si l s v ri nci s pobl cion les 2 1 s y 2 2 s no on conocida pero homogénea :
Donde: t tab = ) 2 , 2 1 ( 2 1 - + t a
a
c ss
c
s a a
n n
DISTRIBUCIONES
- = < < 1 ) ( 2 ) , 2 ( 2 2 2 ) , 2 1 ( 2 N N N N P a
c s
c < 1 ) (
a a - = < - ) 1 ( ) 1 (
2 ) 1 , 2 ( 2 2 2 ) 1 , 2 1 ( 2 n n S n S n P a s μ μ s - = + - < - < - - 1 ) ) ( ) (( 2 1 2 1 2 1 2 1 2 1 x x tab x x tab Z x x Z x x P a μ μ - = + - < - < - -
- -
21 1) 2) 1( ) (( 2 1 2 1 2 1
x x tab x x tab S t x x S t x x P ESTADÍSTICA APLICADA 110 PRUEBAS DE HIPÓTESIS En muchos trabajos de investigación es necesario decidir si se acepta o se rechaza un enunciado o supuesto acerca de un parámetro; al enunciado o supuesto se le llama hipótesis y al procedimiento para tomar decisiones se le llama prueba de hipótesis. PRUEBA DE HIPÓTESIS Es un procedimiento de decisión estadística que establece la metodología a seguir para la aceptación o rechazo de una hipótesis, sobre la base de las evidencias contenidas en un conjunto de observaciones de una muestra aleatoria. Se plantean dos tipos de hipótesis, la hipótesis planteada (H p ) o hipótesis nula (H 0 ) y la hipótesis alternante (H a ), ambas hipótesis no deben de tener nada en común, es decir son mutuamente excluyentes. Los investigadores generalmente enuncian como sus hipótesis nulas lo contrario de lo que creen que es verdad, con la esperanza de que lo s procedimientos de demostración los conduzcan a rechazarlas. Por ejemplo, si deseamos probar que el rendimiento académico promedio de los estudiantes de la UTP es mejor que el de otra universidad u o tras universidades, podríamos formular en la hipótesis nula de que no hay diferencias en los rendimientos académicos. TIPOS DE ERRORES Como para realizar una prueba de hipótesis, nos basamos en muestras aleatorias, al tomar nuestras decisiones incorrectas. podríamos cometer algunos errores, es decir podríamos tomar decisiones Error Tipo I Este error lo cometemos cuando rechazamos una hipótesis nula siendo esta verdadera. A la probabilidad de cometer el error tipo I se le denomina nivel de significación (a), es decir:
Al complemento de a se le denomin 1 a = nivel de confi nz .
P(Error Tipo I) = a ESTADÍSTICA APLICADA 111 Error Tipo II
nivel de confi nz , es decir:
Este error lo est f ls . A l b, es decir:
cometemos cu ndo cept mos un hipótesis nul siendo prob bilid d de cometer el error tipo II se le simboliz por
El valor de b se determina en ase a la distri ución real o verdadera de la varia le en estudio. Al complemento de b se le denomina potencia de la prue a, es decir: 1-b = potencia de la prue a. SUPUESTOS PARA REALIZAR UNA PRUEBA DE HIPÓTESIS 1. Las o servaciones son extraídas de po laciones que tienen distri uciones normales 2. Las muestras aleatorias pertenecen a po laciones independientes. 3. Los tamaños de las muestras son grandes. PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS Prue a de hipótesis para la media po lacional μ
A)
I)
Plantear las hipótesis Puede haber tres posibilidades:
H 0 : μ = μ 1 ; μ ³ μ 1 ; μ £ μ 1 H a : μ ¹ μ 1 1; 1
μ; < μ μ > μ
II)
Establecer el nivel de significación (a) y t m ño de l
III)
Elección de l prueb est dístic Existen dos posibilid des: v ri nci pobl cion l s
muestr (n)
Si l 2 e conocida, x Z s
μ -
e u a:
= Si la variancia poblacional s 2
no e
conocida,
e u a:
x S x t
μ = P(Error Tipo II) = b
ESTADÍSTICA APLICADA 112 IV) Esta lecimiento nula.
de
las
zonas
de
Estas zonas o regiones de aceptación 0 dependen de la hipótesis alternante, es decir: · 2
de
H
Si la variancia po lacional s e
conocida Ca o I :
a
1
aceptación
:
Prueba de 2 cola cuando H
o bilateral.
μ ¹ μ
Caso II : a : μ < μ
Prueba de 1 cola o unilateral izquierda. cuando H
1
ESTADÍSTICA APLICADA 113 Caso III : a : μ > μ 1
Prueba de 1 cola o unilateral derecha. cuando H
de
la
hipótesis
· Si la variancia poblacional s 2
no e conocida, entonce de Z tab e obtiene t tab V)
en lugar
Calculo de la prueba e tadí tica
VI) Deci ión e tadí tica y conclu ione El valor de la prueba e tadí tica calculada la ubicamo grafica del cuarto pa o y dependiendo donde e ubique aceptaremo o rechazaremo a la hipóte i nula. B) 2
Prueba de hipóte i
para la variancia poblacional s
I) Plantear la hipóte i Puede haber tre po ibilidade : H 0 2
:
s
= 2 1 s 2
;
s
³ 2 1 s 2
;
s
£ 2 1 s H a :
s
2 ¹ 2 1 s 2
;
s
< 2 1 s 2 > 2 1 s
;
s
en
la
II)
E tablecer el nivel de
III)
ignificación (a) y t m ño de l
muestr (n)
Elección de l prueb est dístic Existe solo un posibilid d:
2 2 2 ) 1 ( s
c
S n -
=
ESTADÍSTICA APLICADA 114 IV) Est blecimiento de l s zon s de cept ción de l Est s zon s o regiones de cept ción de H 0 dependen de l hipótesis ltern nte, es decir: C so I : cu ndo :
Prueb H
hipótesis nul
de 2 col s o bil ter l.
s
2 ¹ 2 1 s
Ca o II: Prueba de 1 cola o unilateral izquierda. cuando H a :
s
2 2 < 1 s
ESTADÍSTICA APLICADA 115
Ca o III: Prueba de 1 cola o unilateral derecha. cuando H a : s 2 > 2 1 s
V)
Calculo de la prueba e tadí tica
VI)
Deci ión e tadí tica y conclu ione El valor de la prueba e tadí tica calculada la grafica del cuarto pa o y dependiendo donde e ubique aceptaremo o rechazaremo a la hipóte i nula. C) Prueba de poblacionale
hipóte i
Lo el
pa o a eguir on lo e tadí tico a u ar e
D)
Prueba de hipóte i
Lo el ·
2 1 2 2 2 2 2 1 s s S S F = 2 1 2 1 2 x 1 x x x x x Z
para
la
homogeneidad
mi mo que lo la prueba:
variancia
poblacionale
ca o
on conocida
variancia
anteriore , donde
para la diferencia de media
pa o a eguir on lo mi mo que lo e tadí tico a u ar e la prueba: Si la
ca o
de
ubicamo
poblacionale
anteriore , donde
en
la
- = s
μ ESTADÍSTICA APLICADA 116 · Si las variancias poblacionales no son conocidas pero homogéneas:
· Si las variancias poblacionales no son conocidas pero heterogéneas:
Donde: 2 2 2 1 2 1 2 2 1 n S n S S -
⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟⎠ ⎞ ⎜ ⎜
+x =x ; si el muestreo es con reemplazo
⎝ ⎛ + ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = 1 1 2 2 2 2 2 2 1 1 1 1 2 1 2 2 1 N n n S N n n S S x ;
N
N
x
si el muestreo es sin
reemplazo 2 1 ) ( ) ( 2 1 2 1 x x S x x t - - = μ μ 2 1 ) ( ) ( 2 1
2 * x S x t =
1 x x - μ μ ESTADÍSTICA APLICADA
117 EJERCICIOS RESUELTOS 1. Con la finalidad de estudiar el tiempo que para atender a los clientes de una tienda de tomó una muestra de 16 clientes, encontrándose promedio de servicios de 4.2 minutos, con una estándar de 1.2 minutos.
necesita una cajera auto servicios, se un tiempo desviación
a) Calcular e interpretar un intervalo del 95% de confianza para el tiempo medio de servicios a los clientes. b) Calcular e interpretar un intervalo del 90% de confianza para la variancia de los tiempos de servicios de caja. SOLUCIÓN: Sea x = tiempo de atención a los clientes (minutos) Tenemos que: n = 16, a)
2 . 4 = x , S = 1.2
Se tiene que: 1
Como l
v ri nci
a = 0.95, entonces: a = 0.05 pobl cion l s
2 no e
conocida, u aremo :
a μ
- = + < < x tab x tab S t x S t x P
tab = ) 1 , 2 1 ( - t
Donde: t
a = t (0.975,15) = 2.131 09 . 0 16 ) 2 2 . 1 ( 2 = = = n
n
1 ) (
S S x , entonces: x S
3 . 0 =
Reempl z ndo: 95 . 0 ) 3 . 0 131 . 2 2 . 4 3 . 0 131 . 2 2 . 4 (
= + < < -
P(3.5607 < μ < 4.8393) = 0.95 Tenemos un 95% de confianza de que la verdadera media poblacional del tiempo de atención al cliente esta comprendido entre 3.5607 y 4.8393 minutos.
ESTADÍSTICA APLICADA 118 b) En este caso: 1 Como l
medi
a = 0.90, entonces: a = 0.10 pobl cion l μ no es conocida:
Para a = 0.10 los chi cu dr dos t bul res p r 15 g.l. son: 996 . 24 2 ) 15 , 95 . 0 ( = c y
2 ) 15 , 05 . 0 ( = c
261 . 7
Reemplazando: 90 . 0 ) 261 . 7 44 . 1 15 996 . 24 44 . 1 15 ( 2 = < < x x P s P(0.8641< s 2 < 2.9748) = 0.90 Tenemo un 90% de confianza de que la verdadera variancia poblacional de lo tiempo de atención al cliente e ta comprendido entre 0.8641 y 2.9748 minuto
x x P
μ
2 . 2. Una compañía produce foco pequeño de 1.5 voltio y de ea analizar la variabilidad del proce o de producción. Se tomo una mue tra aleatoria de 16 foco , y e obtuvo una media de la duración igual a 120 hora y un coeficiente de variabilidad igual al 25%. Halle el intervalo de confianza del 98% para la variancia poblacional. SOLUCIÓN: Sea x = duración de lo foco de 1.5 voltio Tenemo que: n = 16, 120 = x , c.v. = 25% Como 1 Como l
medi
a
c s
c < 1 ) (
a a - = < - ) 1 ( ) 1 (
2 ) 1 , 2 ( 2 2 2 ) 1 , 2 1 2 ( n n S n S n P a
c s
c
a a - =
< < - 1 ) ) 1 ( ) 1 ( ( 2
(hora )
a = 0.98, entonces: a = 0.02
pobl cion l μ no es conocida:
) 2 ( 2 2 2 ) 2 1 2 n S P
1 ,
1 , ( n n S n ESTADÍSTICA APLICADA
119 P r
a = 0.02
los chi cu dr dos t bul res p r
S bemos que: c.v. = 100 x x S = 25% = 0.25 ⇒ S = 30 y
2
15 g.l. son:
S
= 900 Reemplazando: 98 . 0 ) 229 . 5 900 15 578 . 30 900 15 ( 2 = < < x x P s P(441.4939< s 2 < 2581.7556) = 0.98 Tenemo un 98% de confianza de que la poblacional de la duración de lo foco comprendido entre 441.4939 y 2581.7556 hora 2 .
verdadera variancia de 1.5 voltio e ta
3. Suponga que la nota de lo alumno de Admini tración di tribuyen en forma normal con una de viación e tándar de 3; e eleccionaron al azar 20 alumno , regi trándo e una nota promedio de 14 y una variancia de 4. Calcule e interprete: a) Un intervalo deldel 98%1%, de confianza para u que verdadera b) ¿Con un rie go e puede concluir la notamedia. media de lo alumno e uperior de 12? SOLUCIÓN:
e
Sea x = nota de lo alumno Tenemo que: s = 3, n = 20, 2 = 4 ⇒ S = 2
a)
Como l
14 = x ,
S
Se tiene que: 1 v ri nci
a = 0.98, entonces: a = 0.02 pobl cion l s
2 e
conocida, u aremo :
a s μ s - = + < < x tab x tab Z x Z x P
1 ) (
Donde: Z tab = ) 2 1 ( a Z = Z (0.99) = 2.325 45 . 0 20 ) 3 ( 2 2 2 = = = n x s s , entonce : x s
6708 . 0 =
229 . 5 2 ) 15 , 01 . 0 ( = c 578 . 30
2 ) 15 , 99 . 0 ( = c y ESTADÍSTICA APLICADA 120 Reemplazando: 98 . 0 ) 6708 . 0 325 . 2 14 6708 . 0 325 . 2 14 (
= + < < -
x x P
P(12.44 < μ < 15.56) = 0.98 Tenemos un de 98% delasconfianza de que la verdadera media poblacional notas de los alumnos de Administración esta comprendido entre 12.44 y 15.56. b)
Nos piden que realicemos una prueba de hipótesis para la
μ
verdadera media de las notas con un nivel de significación de 0.01. I) H 0 : μ £ 12 H a : μ > 12 II)
a = 0.01
y
III)
Como se conoce
IV)
Como
n = 20 l
v ri nci
pobl cion l, se us r :
H
μ > 12 Se trata de una prueba de 1 cola o unilateral derecha. :
ESTADÍSTICA APLICADA 121 V) Calculo del estadístico Z x cal x Z s
μ = = 9815 . 2 6708 . 0 12 14 = -
VI) Como Z calculado esta en la zona de rechazo de la H 0 , entonces no se acepta hipótesis nula. En conclusión, existe evidencia estadística de que la verdadera nota media de los alumnos de Administración es mayor de 12, con un nivel de significación de 0.01. 4. La Dirección General de Transito del Perú usa decenas de focos para semáforos cada año. La marca que ha sido usada hasta ahora tiene una vida media de 1000 horas y una desviación estándar dea un90precio horas.muyEsinferior ofrecida unahanueva Dirección al que estadomarca pagando.a Sela decide que se debe comprar la nueva marca, a menos que su vida media sea menor de 1000 horas. Posteriormente, son probadas 100 focos de esta nueva marca, dando un promedio de
990, suponiendo que la variancia de la nueva marca es la misma que la antigua: a) de b) un
Encuentre e interprete según enunciado un intervalo del 95% confianza para la vida media de la nueva marca. ¿Qué recomendaría a la Dirección General de Transito para nivel de significación del 5%?.
SOLUCIÓN: Sea x = duración de los focos (horas) Para la marca antigua tenemos: μ = 1000 y s = 90 Para la nueva marca tenemo : N = 100 , x = 990 y a)
Se tiene que: Como l v ri nci
s = 90
1 a = 0.95, entonces: a = 0.05 pobl cion l s
2 e
conocida, u aremo :
a s μ s - = + < < 1 ) ( x tab x tab Z x Z x P ESTADÍSTICA APLICADA 122 Donde: Z tab = ) 2 1 ( a Z = Z (0.975) = 1.96 81 100 ) 90 2 2( 2 = = = n x s s , entonce : x s
9 =
Reemplazando: 95 . 0 ) 9 96 . 1 990 9 96 . 1 990 (
= + < < -
x x P
μ
P(972.36 < μ < 1007.64) = 0.95 Tenemos un 95% de confianza de que la verdadera media poblacional del tiempo de duración de los focos para semáforo esta comprendido entre 972.36 y 1007.64 horas.
b) Nos piden que realicemos una prueba de hipótesis para la media de la duración de los focos con un nivel de significación de 0.05. I) H 0 : μ ³ 1000 H a : μ < 1000 II) III) x x Z s
=
a = 0.05
y
n = 100
Como se conoce
l
v ri nci
pobl cion l, se us r :
μ -
IV) Como H a : μ < 1000 Se trata de una prueba de 1 cola o unilateral izquierda. ESTADÍSTICA APLICADA 123 V) Calculo del estadístico Z x cal x Z s
μ -
9= = 11111 . 1 1000 990 - = VI)
Como Z calculado esta en la zona de aceptación de la H
0 , entonces se acepta hipótesis nula.
En conclusión, existe evidencia estadística suficiente de que los focos tienen una duración media verdadera de por lo menos de 1000 horas, por lo tanto se recomendaría a la Dirección General Transito que compren de significación del 5%.a la nueva marca de focos, con un nivel 5. Se diseña la dimensión de una determinada pieza de 5 cm. para que dicha pieza encaje con otra. Por experiencia se sabe que la
variancia del proceso es de 0.0064 cm 2 . Si una muestra aleatoria de 49 piezas presenta una media de 5.05 cm: a) ¿Cuál es el intervalo de confianza del 99% para la verdadera media de la longitud de las piezas? b) ¿Se debe aceptar que la media de la longitud de la pieza es igual a 5 cm.? Use 1% de error. SOLUCIÓN: Sea x = longitud de las piezas (centímetros) 2
Tenemos que: s = 0.0064 ⇒ s = 0.08,
n = 49,
05 . 5 = x
⇒ Se tiene que: 1 a = 0.99 Como l v ri nci pobl cion l s
a)
a
=
0.01
2 e
conocida, u aremo :
a s μ s x tab x tab Z x Z x P
- = + < < -
1 ) (
Donde: Z tab = ) 2 1 ( a Z = Z (0.995) = 2.575 ESTADÍSTICA APLICADA 124 0001306 . 0 49 0064 . 0 2 2 = = = n x s s , entonce : 01143 . 0 = x s Reemplazando: 99 . 0 ) 01143 . 0 575 . 2 05 . 5 01143 . 0 575 . 2 05 . 5 (
= + < < -
μ
x x P
P(5.0206 < μ < 5.0794) = 0.99 Tenemos un 99% de confianza de que la verdadera media poblacional de la longitud de las piezas esta comprendido entre 5.0206 y 5.0794 cm. b) Nos piden que realicemos una prueba de hipótesis para la verdadera media de la longitud de las piezas con un nivel de significación de 0.01. I) H 0 : μ = 5 H a : μ ¹ 5 II)
a = 0.01
y
III)
Como se conoce
IV)
Como
n = 49 l
v ri nci
pobl cion l, se us r :
H
μ ¹ 5 Se trata de una prueba de 2 colas o bilateral.
:
ESTADÍSTICA APLICADA 125 V)
Calculo del estadístico Z
x cal x Zs
μ = = 37445 . 4 01143 . 0 5 05 . 5 = VI) Como Z calculado esta en la zona de rechazo de la H 0 , entonces no se acepta hipótesis nula. En conclusión, evidencia estadística suficiente afirmar que la existe verdadera media de la longitud de laspara piezas no es de 5 cm., con un nivel de significación del 1%.
EJERCICIOS PROPUESTOS 1. Con la finalidad de estudiar el tiempo que necesita una cajera para atender a los clientes de una tienda de auto servicios, se tomó una muestra de 25 clientes, encontrándose un tiempo promedio de servicios de 3.5 minutos, con una desviación estándar de 1.2 minutos. a) Calcular e interpretar un intervalo del 90% de confianza para el tiempo medio de servicios a los clientes. b) Calcular e interpretar un intervalo del 95% de confianza para la variancia de los tiempos de servicios de caja. 2. Una compañía produce analizar la variabilidad muestra aleatoria de 20 duración igual a 100 horas 15%. Halle el intervalo estándar poblacional.
focos pequeños de 1,5 voltios y desea del proceso de producción. Se tomo una focos, y se obtuvo una media de la y un coeficiente de variabilidad igual al de confianza del 95% para la desviación
ESTADÍSTICA APLICADA 126 3. Suponga que las notas de los alumnos de Administración se distribuyen en forma normal con una desviación estándar de 5; se seleccionaron al azar 16 alumnos, registrándose una nota promedio de 15 y una variancia de 4. Calcule e interprete: a) Un intervalo del 99% de confianza para su verdadera media. b) Un intervalo del 98% de confianza para su verdadera variancia. c) ¿Con un riesgo del 5%, se puede concluir que la nota media de los alumnos es superior de 14? 4. La Dirección General de Transito del Perú usa decenas de focos para semáforos cada año. La marca que ha sido usada hasta ahora tiene una vida media de 1000 horas y una desviación estándar de 90 horas. Es ofrecida una nueva marca a la Dirección a un precio muy inferior al que ha estado pagando. Se decide que se debe comprar la nueva marca, a menos que su vida media sea menor de 1000 horas. Posteriormente, son probadas 120 focos de esta nueva marca, dando un promedio de 990, suponiendo que la variancia de la nueva marca es la misma que laEncuentre antigua:e interprete según enunciado un intervalo del 98% a) de confianza para la vida media de la nueva marca. b) ¿Qué recomendaría a la Dirección General de Transito para un nivel de significación del 1%?. c) Si la verdadera vida media de la nueva marca es de 950 horas. ¿Se estaría cometiendo algún error en la prueba realizada en b)?. ¿De que tipo? Justifique su respuesta. 5. Se diseña la dimensión de una determinada pieza de 5 cm. para que dicha pieza encaje con otra. Por experiencia se sabe que la variancia del proceso es de 0.0081 cm 2 . Si una muestra aleatoria de 49 piezas presenta una media de 4.95 cm.: a) de¿Cuál es el intervalo de confianza del 98% para la verdadera media la longitud de las piezas? b) ¿Se debe aceptar que la media de la longitud de la pieza sea por lo menos de 3 cm.? Use 5% de error. c) Si se selecciona una muestra de 36 piezas. ¿Qué valores
debe tomar el estimador para aceptar la hipótesis b)? ESTADÍSTICA APLICADA
nula en
127 6. Una fábrica que produce barras de acero está interesada en saber el contenido de carbono que existen en las barras. Se tomo una muestra al azar de 10 barras obteniéndose una variancia de 1296 y una media de 188. a) Halle un intervalo con un 95% de confianza para el contenido promedio de carbono de las barras de acero de la fábrica. b) Halle un intervalo con un riesgo del 1% para la verdadera variancia de carbono en las barras de acero de la fábrica. c) Con un riesgo del 10% se puede afirmar que la variancia del contenido de carbono es diferente de 1290. 7. Un proceso de ensamblaje está planeado como una actividad que demora 20 minutos. Estudios anteriores revelan una desviación estándar de 6 minutos para la ejecución del ensamble. Una muestra aleatoria de la realización de 9 ensambles dio como resultado un tiempo medio de 24.3 minutos por ensamble. Calcule e interprete: a) Un intervalo del 90% de confianza para la verdadera media del tiempo de ejecución del ensamble. b) Un intervalo del 95% de confianza para la verdadera media del tiempo de ejecución del ensamble. 8. Un saco de patatas fue muestreado para analizar su calidad y se seleccionaron 11 patatas, registrándose el peso de cada una, con los siguientes resultados: 17, 15, 10, 11, 12, 15, 9, 19, 13, 11, 14. Calcule e interprete un intervalo del 98% de confianza para la media poblacional. 9. Puede mostrarse que las observaciones tomadas de cargamentos de un cierto producto químico se distribuye normalmente alrededor de la densidad media verdadera y con una desviación estándar de 0.005 g/cm 3 . ¿Qué tamaño de muestra es necesario para estimar la verdadera densidad media, si se desea tener un 3error de estimación que no exceda a 0.002 g/cm para un intervalo de confianza del 95%? 10. En una muestra de 14 pernos la estimación de la desviación estándar poblacional de la longitud del perno fue de 0.021 pulgadas. ¿Cuales son los límites del intervalo del 98% de confianza para la verdadera variancia poblacional? ¿Qué suposiciones deben hacerse para hallar el intervalo de confianza? ESTADÍSTICA APLICADA 128 11. Una fabrica que produce piezas de alta precisión y periódicamente chequea la longitud de las piezas producidas para analizar su variabilidad. Conobtuvo tal finlossesiguientes seleccionoresultados una muestramaestrales: aleatoria simple de 9 piezas y se å X 1
= 13, 05 2 = 24, 92
y
å X
Sabiendo que la longitud se distribuye normalmente, halle e interprete un intervalo de 90% para la verdadera variancia del proceso. 12. Un fabricante de pilas para linterna afirma que la vida media de su producto excederá de 30 horas. Una compañía desea comprar una cantidad muy grande de pilas siempre y cuando la afirmación sea cierta. Se prueba una muestra al azar de 36 pilas, y se encuentra que la vida media de la muestra es de 31 horas. Si la población de pilas tiene una desviación estándar de 5 horas: a) Encuentre el intervalo del 99% de confianza para la verdadera vida media de ese producto. Interprete según el enunciado. b) A un nivel a = 0,10. ¿Qué recomendaría al Gerente de la compañía? c) ¿Para que valores de a la compañía no adquirirá las pilas? 13. Un Agrónomo tiene semillas de una nueva variedad de maíz, las cuales son sembradas en 6 parcelas de características homogéneas. Los rendimientos en toneladas por hectáreas fueron los siguientes: 36 1 = å X 32 ) ( 2 1 = å X X a) Hallar los límites de confianza para el verdadero rendimiento promedio de la variedad de maíz con el 95% de confianza. Interprete sus resultados. b) Si el Agrónomo sostiene que la variedad de maíz sometida a experimentación un rendimiento mediose diferente de 4 lo ton/Ha.. y con tiene la información obtenida puede aceptar que afirma el Agrónomo? ( Use a = 0.05) c) ¿Se puede firm r que l v ri bilid d del v ried d de m íz en mención es lo más 2 (Ton/H )?. Use a = 0.01
rendimiento
de
l
ESTADÍSTICA APLICADA 129 14. En un muestr de 25 p quetes distribuidos por un comp ñí se encontró un promedio de 350 Kg. y un v ri nci de 2500 Kg. ¿Existen b ses p r firm r que el lote de 25 p quetes excederán l c p cid d de los c miones de tr nsporte que se s be que es de 8000 Kg? Use 15. vid
a = 0.05
Un empres de tr nsportes desconfí de l firm ción de que l útil promedio de ciertos neumáticos es l menos de 28000.
P r verific r l firm ción, se coloc n 28 neumáticos en sus c miones y se obtiene un vid útil promedio de 27 250 mill con un desvi ción estánd r de 1 348 mill s. ¿Qué puedes concluir con esos d tos? un nivel de signific ción de 0.01?.
s,
16. Un f bric nte de pernos h tenido últim mente quej s de sus clientes sobre l s dimensiones de los pernos , y que present b n un excesiv v ri bilid d. El productor firm que l desvi ción estánd r es lo más 0.3 y dese comprob r lo nterior medi nte un muestr . Se seleccion un muestr le tori simple de 20 pernos y obtiene los siguientes result dos: å = 36 2 i x å x
10 = i
) ¿ Es correcto lo que firm el productor? . (Use a = 0.01). b) ¿P r qué v lores del estim dor se cept rá l hipótesis pl nte d en l pregunt ? 17. Un máquin que produce tuerc s es detenid periódic mente de modo que el diámetro de l s turc s producid s puede ser n liz do . En este c so interes l v ri bilid d de los diámetros de l s tuerc s. Supong que un muestr le tori simple de 30 tuerc s proporcion un v ri nci muestr l del diámetro igu l 3.4 milímetros. Si l v ri nci del diámetro debe ser de 8 milímetros o menos p r cept r l producción de l máquin . ) ¿Existe evidenci signific tiv p r rech z r dich producción?. (Use a = 0.02). b) Si l v ri nci verd der es de 9 milímetros 2 . ¿Qué tipo de error se cometió?. Justifique su respuest . 18. Se humed d
de
propuesto dos métodos p r l semill del fríjol
determin r el contenido de y en mbos se h n emple do
muestr de t Elelmétodo p rece más v m riño ble21. que II . I es más fácil de ESTADÍSTICA APLICADA 130 B sándose en los siguientes result dos : ( 2 21 1
)
340
1 1 = å = j j
x x 21 1 2
(
)
240
plic r , pero
2 2 = å = j j x x ) Encuentre un interv lo de 90% de confi nz p r l verd der r zón de v ri nci s del modo : entre el método II. Interprete según el enunci do. b) ¿A que conclusión lleg rí Ud. un nivel de signific ción a=0.05? 19. Se requiere determin r si existe menos v ri bilid d en el pl te do re liz do por l comp ñí 1 que el efectu do por l comp ñí 2. Con t l motivo se tom ron un muestr de t m ño 12 de los tr b jos efectu dos por l comp ñí 1 y otr de t m ño 15 de los tr b jos desempeñ dos de l comp ñí 2, los cu les produjeron l s siguientes desvi ciones estánd res : S 1 =0.035 mil. y S 2 =0.062 mil. ) Encuentre un interv lo de confi nz de 90% p r l verd der r zón de v ri nci 2 2 2 1 s s . Interprete egún enunciado. b) ¿A qué conclu ión llegaría Ud. a un nivel de ignificación a=0.05? 20. P r eléctrico
prob r l firm ción de que l resistenci puede reducirse en más de 0.005 ohmios ,
de un medi nte
l mbre
le ciones, v lores produjeron un promedio32de 0.136obtenidos ohmios de , yl mbre 32 vordin loresrio obtenidos con el l mbre f bric do b se de le ciones produjeron un promedio de 0.083 ohmios . Suponiendo que l desvi ción estánd r de l resistenci p r mbos tipos de l mbre son igu les 0.005 ohmios. ) H lle un interv lo de confi nz del 95% p r l verd der diferenci de medi s μ
1 μ 2 . Interprete según enunciado. b) ¿Apoyaría Ud. la afirmación a un nivel de significación a=0.05?.
21. Se deben utiliz ron dos un máquin s Aneto y B, r llen r botell s que se supone contener volumen de p5.65 litros. El proceso de llen do de máquin A tiene un desvi ción estánd r de 0.015 litros y el proceso de llen do de l máquin B tien e
ESTADÍSTICA APLICADA 131 un desvi ción estánd r de 0.016 litros . H surgido l preocup ción de si l s dos máquin s están re liz ndo el mismo tr b jo. El ingeniero de control firm que debido l estrecho cuerdo entre l s desvi ciones estánd r y en r zón otr s mediciones l s máquin s se están llen ndo con l mism c ntid d. Se tom un muestr le tori de c d máquin obteniéndose los siguientes result dos: A
Máquin
Máquin
B
n A = 20
n B = 25 6345 . 5 = A X ) Encuentre de medid s μ
un
interv lo
634 . 5 = B X de
98%
p r
l
verd der
diferenci
x μ y . Interprete según enunciado. b) ¿Está Ud. de acuerdo con el ingeniero de control a un nivel a=0.05?.
22. Un empres g n dor dese compr r dos m rc s de limento: A y B, y decide experiment r con ellos ntes de re liz r l compr definitiv . El limento A fue proporcion do 10 nim les seleccion dos le tori mente, mientr s que el limento B 6 nim les obteniéndose los siguientes result dos de incremento de pesos: 4 = A x x 60 ) (
! 1 10 1 = å = A A i A x x x 2 6 1 2 = - å = B
32
5 = B
B i x n x ) Prob r si existe diferenci s signific tiv s entre incrementos medios de pesos producidos por los limentos un nivel a=0.02. Sugerenci : pruebe si existe homogeneid d de v ri nci s. b) Si re lmente μ
A μ g =2. ¿ está Ud. cometiendo algún error según la conclusión errores sería? c) Encuentra un intervalo verdadera diferencia de media A μ g.
los
tipo de establecida en (a)?. ¿Cuál de los del 98% de confianza para la μ
ESTADÍSTICA APLICADA 132 23. Un centro de investigación condujo un experimento para determinar los efectos de la marihuana sobre la sexualidad. Se seleccionaron 11 hombres jóvenes en buen estado de salud que habían fumado marihuana por lo menos 4 días a la semana un mínimo de 6 semanas, sin usar otra droga en ese período. Se usó un grupo de control de otros 10 jóvenes que jamás habían fumado marihuana, para hacer la comparación. La medida de la sexualidad fue el nivel de hormona masculina testosterona en la sangre (en unidades de hormona testosterona)
420 1 = x
10
7283
1 2 = å = i i x 1 = 12.22 2 2 10 1 å =
2= x x
S 1 . 1822 ) (
i
i
a)
¿Son homogéneas las varianzas? Use a=0.10
b) El uso de l sexu l? Use a=0.10.
m rihu n desminuye en promedio, (Considere el result do de ).
el
impulso
24. Se s be que l máquin de emp c r de un firm de cere les de sec dos verte el cere l seco en c j s de t m ño económico con un desvi ción estánd r de 0.6 onz s. Se llev c bo verific ciones const ntes de los pesos netos de l s c j s p r m ntener el juste de l m quin rí que control el peso neto. Dos muestr s tom d s en dos dí s present n l siguiente inform ción: n 1 =30 2 =35
n
onz s x
87 . 18 1 =
onz s x
9 . 21
2 = Utilice a= del 5% en todos los siguientes c sos: ) ¿Se puede firm r que en el primer dí , l just d p r llen r 20 onz s o más?. b) ¿Se puede firm r que en el segundo dí l máquin just d p r llen r más de 20 onz s?. rupo que h fum do m rihu n (1) rupo que j más h fum do m rihu n (2) ESTADÍSTICA APLICADA 133 c) Se puede verific r que no existe de l máquin en el primer y segundo dí .
ningún
máquin
est b
est b
c mbio
en
el
juste
25. Undistribuyen f bric nteende dese determin r si los combustibles que se el motores merc do cumplen con los requerimientos. P r ello se tom ron muestr s de mbos combustibles los siguientes result dos p r el impulso específico (en libr s/seg) Combustibles n A B 21 340.5 25 348.5
Promedio
Uno de los requerimientos p r combustible es que l v ri nci más de 11 ( lib/seg) 2 ) ¿Cumplirá f bric nte? Use b) ¿P r que rech z r l Hp.
V ri nci 19.2 7.7 que el f bric nte cepte un del impulso específico se
el combustible A con a=0.05 v lores del estim dor en ( )?
el requerimiento no
existirá
del
evidenci
p r
lo
c) ¿Con que nivel de signific ción se cept rí d) ¿Se puede concluir, p r a= 10% que el impulso medio del combustible B es superior en 10 lib/seg o más que el impulso específico del combustible A? e) Si l verd der s medi s del impulso específico combustibles A y B son μ
l Hp. en ( )? específico de
los
A = 350 lib/seg y μ B = 360 lib/seg. ¿se cometió algún error en (d)?
26. Al analizar muestras de tejido hepático de 16 ratas se obtuvo que tenia en promedio un contenido de 5.2 mgrs de glucógeno/100 mgrs de tejido) 2 . Si se asume que el contenido de carbohidratos (glicógeno) se distribuye normalmente. a) Calcule e interprete un intervalo del 90% de confianza para la media del contenido de carbohidrato. b) ¿Se puede afirmar que la media del contenido de carbohidrato es igual a 4.6 mgrs de glicógeno/100 mgrs de tejido? Use a = 0.10 27. Dos tipos de botell s de vidrio son decu dos p r su utiliz ción en un embotell dor de bebid s g seos s. L resistenci l presión intern de un env se es un c r cterístic de c lid d import nte. Se s be que l s desvi ciones estánd r de l s resistenci s p r c d tipo de botell de vidrio es igu l 3.0 psi. ESTADÍSTICA APLICADA 134 Se tom ron muestr s de c d tipo y se obtuvieron los siguientes result dos: Tipo 1
Tipo
2 n 1 = 2 16 = 16
n psi x
si x
8 . 175 1 =
p
3 . 181 2 =
L comp ñí no utiliz rá el tipo de botell 2 no ser que su resistenci l presión en promedio exced l de tipo 1 en, por lo menos 5 psi . ¿Utiliz rá el tipo 2, con b se en los d tos muestr les? Use a = 0.05. 28. Un tiend tiene dos pl nes de crédito disponibles p r clientes con cuent corriente. L dministr ción de l tiend dese recopil r inform ción cerc de c d pl n y estudi r l s
sus
diferenci s entre los dosy de pl 50 nes.clientes Se seleccionó de 25 clientes del pl n A del pl un n B,muestr con los siguientes result dos en miles de unid des monet ri s cerc del s ldo mensu l.
) H lle e interprete un interv lo del 98% de confi nz desvi ción estánd r del pl n B. b) ¿H y evidenci s muestr les p r firm r que existen diferenci s entre los s ldos mensu les promedio de los pl nes? Use a = 0.05.
p r
l
Pl n n Promedio Desvi ción estánd r A B 25 50 202.5 297.0 40.500 38.178 ESTADÍSTICA APLICADA 135 UNIDAD VI ANÁLISIS DE RE RESIÓN MÚLTIPLE El nálisis de regresión consiste en emple r métodos que nos permit n determin r l rel ción funcion l entre l s v ri bles en estudio; de form t l que nos permit predecir el v lor de un que correspond n l s otr s v ri bles. Por el
ejemplo
l
rector
desempeño profesion que los egres dos de le interes s ber quieren re liz r,
de
l
universid d
v ri ble utiliz ndo los v lores le
interes
conocer
cu l
es
l dos,l vice es rector decir,dede que depende l de UTP sus teng egres n éxito, investig ción que tem s o tr b jos son los que los estudi ntes l dec no de l f cult d de Administr ción le interes
s ber de que depende, que sus lumnos teng n un buen rendimiento c démico, los profesores nos interes s ber por que motivos des prueb n los estudi ntes, etc. Podemos observ r que en estos ejemplos están involucr d s v ri s v ri bles, l s cu les son estudi d s medi nte el nálisis de regresión, dejo los profesores p r que discut n con sus lumnos cu les seri n l s v ri bles dependientes y cu les l s independientes. RE RESIÓN LINEAL MÚLTIPLE El nálisis de un regresión se funcion l entre v ri ble v ri ble dependiente, y un independientes o explic tiv s 1
us, ll porm d explic r o , model r l reloción Y respuest rendimiento o más v ri bles predictor s, o
, , k X X K . Cu ndo 1 k = , se tiene el c so de regresión line l simple, si 1 k > , se tiene el c so de regresión múltiple. L respuest debe ser un v ri ble continu pero l s v ri bles explic tiv s pueden ser continu s, discret s o c tegóric s unque dej el m nejo de v ri bles explic tiv s c tegóric s p r otro curso. Los nálisis incluyen:
de
l
regresión
tienen
v rios
posibles
objetivos
los
1. L predicción de observ ciones futur s. 2. L v lor ción del efecto de, o rel ción entre, v ri bles explic tiv s y l respuest . 3. Un descripción gener l de estructur de los d tos. ESTADÍSTICA APLICADA 136 Es import nte entender cómo los d tos fueron recogidos. ¿Son los d tos de observ ción o experiment les? ¿H y f lt de respuest ? ¿H y v lores perdidos? ¿Qué represent los d tos en cifr s?, represent d s cu lit tiv s. ¿Cuáles son l s unid des de medid ? Cuid do con errores en l entr d de d tos.
l s
v ri bles
Modelo de Regresión Line l Múltiple El modelo de regresión line l múltiple con k v ri bles predoctor s x 1 , x 2 , ¼ x k , es de l siguiente form :
Donde: x 1 , x 2 , ¼ x k , son v ri bles independientes, fij d s y medid s sin error. b 0 ,b 1 2,b , . . . b k son parámetros desconocidos. A b
se cu les
0 se le conoce con el nom re de intercepto, y a los b 1 ,b 2 , . . . b k se les llaman coeficientes de regresión po lacional. e
s una variabl
E(e) = 0 2 · 0
y
al atoria no corr lacionada y no obs rvabl
tal qu :
V(e) = s
b es la media de ªyº cuando x
1 = x 2 = . . . = x k = 0 · b j , para j = 1, 2, . . . , k indica el cam io promedio en la varia le dependiente ªyº por unidad de cam io de ªx j º , cuando las demás varia les independientes permanecen constantes. ESTIMACIÓN DE LOS PARÁMETROS b J Para encontrar los estimadores de los coeficientes de regresión se aplica el método de los mínimos cuadrados a partir de una muestra aleatoria de tamaño n. ECUACIÓN DE LA LINEA DE REGRESIÓN MÚLTIPLE MUESTRAL
y = b 0 + b 1 x 1 +b 2 x 2 k+ . . . x k +e
+b
ESTADÍSTICA APLICADA 137 Dond : A b 0 s l conoc con l nombr d int rc pto mu stral, y a los b 1 ,b 2 , b 3 , . . . b k s l s llaman co fici nt s d r gr sión mu stral y s l término d l rror o p rturbación al atoria. TEOREMA Las stimacion s d mínimos cuadrados d múltipl stán dadas por:
Dond X T s la transpu sta d X y T X) -1 s la inv rsa d X T X
(X
Ad más:
1
x
11 12 x ¼x 1k X= 21 x 22 ¼x 2k
1
x
. 1 n1 x n2 ¼x nk
. x
.
.
.
.
los co fici nt s d
r gr sión
⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = n y y y Y M 2 1
y
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝ ⎛ = Ù Ù Ù k B b b b M 1 0
n 1
åx
åx 2 ¼
åx
k åx 1 å 2 1 x 1 x 2
åx
... åx 1 x k X T X= 2 å x 2 x 1
åx
å 2 2 x
...
åx 2 x k . åx
k å x k x 1 åx k x 2 ... å 2 k x B = (X T X)
. . . . . . . . . . . . . . . . . . . . . . . .
-1 X T Y ESTADÍSTICA APLICADA 138
⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝ ⎛ = å å å å y y y y Y k T L
x x x X
21
COEFICIENTE DE DETERMINACION: R 2 Mide la proporción de la variación total que es explicada por un modelo de regresión. El coeficiente de determinación se usa como un indicador del grado de bondad de ajuste, de un modelo de regresión, es decir si el modelo estimado proporciona una buena explicación del comportamiento de la variable en estudio o variable dependiente. Este coeficiente es calculado del siguiente modo:
Donde:
SCR = suma de cuadrados de regresión SCT = suma de cuadrados total
Donde:
SCE = suma de cuadrados del error
SCE = Y T Y Y X T T b Ã
SCR = 2 Ã Y n Y X T T - b ESTIMACION DE
s
POR MAXIMA VEROSIMILITUD
R 2 = SCT SCR SCT = SCR + SCE n Y X B Y Y T - T T = sà ESTADÍSTICA APLICADA 139 Se debe de tener en cuenta que lo i b Ã
re ultado
de la :
∀ i = 0, 1, 2, . . . , k son ombina iones lineales de las n variables aleatorias independientes y i , tales que las ib à tienen distri uciones normales.
Además se cumple que: i i E b b = ) Ã ( ∀ i = 0, 1, 2, . . . , k
2 ) Ã (
s b
ii i c V
=
∀ i = 0, 1, 2, . . . , k
Donde: ij
es el elemento del i-ésimo renglón y la j-ésima 1 ) (
olumna de la matriz
X X T
donde i y j tom n los v lores 0, 1, 2, . . . , k T mbién: 2 ) 1 ( 2 2 ~ Ã - -k n n
c s s
; 2 2 à s s n y i b à son independientes Al com inar todos estos resultados, tenemos distri ución ªtº de Student nos conduce a:
que
la
definición
TEOREMA Con las suposiciones del análisis de regresión lineal múltiple:
de
la
Son valores de varia les aleatorias que Student con n - k -1 grados de li ertad.
tienen
la
distri ución
ªtº
PRUEBAS DE HIPÓTESIS Estas prue as acerca de parámetros se realizan para medir la adecuación del modelo. Tal como se vio anteriormente, una prue a hipótesis requiere que los términos del error e i d l mod lo d r gr sión t ngan una distribución normal ind p ndi nt con m dia c ro y variancia s 2 . 1 Ã Ã - = k n c n t ii i i s b b
de
de
∀ i = 0, 1, 2, . . . , k ESTADÍSTICA APLICADA 140
PRUEBA PARA LA SI NIFICACION DE UNA RE RESION La prueba de la signifi a ión de una regresión
sirve para determinar si
existe una rela ión lineal entre la variable dependiente ªyº y un onjunto de variables independientes x 1 , x 2, x 3 , . . . , x k . H 0 1
: b
= b 2 = . . . k
= b
H= 0 a : Al memos una de las b j
es diferente de cero Rechazar H 0 implica que al menos una de las varia les independientes contri uye de manera significativa al modelo. El estadístico para pro ar esta hipótesis es el ª Fº definido por:
Donde: p = número de parámetros Se rechazara H 0 si el valor calculado de F es mayor que el F ta ular = F (a, k, n p)
CUADRO DE ANALISIS DE VARIANCIA (ANVA) Fuente de v ri ción Sum de cu dr dos r dos de libert d Cu dr do medio F c Regresión SCR k CMR CMR/CME Error o residu l SCE n p CME Tot l · 0
Cu ndo
SCT se
n
1 rech z
H
se tiene que re liz r prueb s individu les p r los b j , estas prue as se realizan con el estadístico Student.
p n SCE
ªtº
de
k SCR F C = ESTADÍSTICA APLICADA 141 EJERCICIOS RESUELTOS 1. Los siguientes d tos muestr n el número de h bit ciones, número de b ños y los precios los que se vendieron h ce poco 8 c s s de un muestr le tori de un distrito de Lim : N (x 1 ) N 2 ) 3 2 4 2 3 2 5 4 2 1 3 1 2 2 3 2 78 74 83
de H bit ciones
74 79 74 88 82
200 700 900 400 900
el
de B ños (x Precio (y) (en dól res)
800 300 800
) Estime l ecu ción de regresión line l múltiple y de vent de un c s de tres h bit ciones con dos b ños. b) Pruebe l hipótesis nul b 1 igual a $ 3500 contra la hipótesis alternante b 1 mayor de $ 3500 para un nivel de significación de 0.05. SOLUCIÓN: a) Sustituyendo å å å å å
predig
el
precio
= = = = = 36 , 55 , 87 , 16 , 25 2 2 2 1 2 1 2 1 x x x x x x y n=8 en la matriz X T X, se o tiene: 8
25
16
X T X
=
25
87
55 16
55
36
Después, la inversa de esta matriz puede o tenerse a través cualquiera de las diferentes técnicas; aplicando una asada en el método de la adjunta, tenemos que: 107
-20
-17
(X T X) -1 = 84 1 . -20
32
-40 -17
-40
ESTADÍSTICA APLICADA 142 donde 84 es el valor de T , el determinante de X T X. Al sustituir å å å = = = 1297700 2031100 , 637000 2 1 y x y y x y en X T Y, se o tiene:
⎟ ⎟ ⎟ ⎠ ⎞⎜ ⎜ ⎜ ⎝
X X
71
de
⎛ = 1297700 2031100 637000 Y X T y por último, reemplazando en: B = (X
T X) 1 X T Y
107
B =
84 1
20
32
20
40 17
40
17
2031100 71
637000
1297700
5476100 84 1 =
347200
63700
=
65191.7 4133.3 758.3
Entonces la ecuación de regresión lineal múltiple estimada es: yà = b 0 + b 1 x 1 + b 2 x 2 Reemplazando: yà = 65191.7 + 4133.3x 1
2
+ 758.3x
ESTADÍSTICA APLICADA 143 Esta ecuación nos permite predecir el precio de venta de una casa de tres habitaciones(x 1 ) con dos baños(x 2 ). Esto es: yà = 65191.7 + 4133.3(3) + 758.3(2) = 79108.2 Es decir una casa con 3 habitaciones y dos baños tienen un precio de 79 100 dólares aproximadamente. b)
Para probar la hipótesis pedida procedemos del siguiente modo:
I) H 0 : b 1 a
= 3500 H : b
1 > 3500 II) III)
a = 0.05
y
n = 8
El est dístico de prueb
es el ªtº de Student
1 Ã Ã 11 1 1 = k c t s b
n n b
Donde: n Y X B Y Y T T T = sà Y T Y = 0 5090708000 82900 ... 74300 78800 2 2 2
8 1 2 = + + + = å = i i y B T X T Y = 50906394166 8 . 292 8 6 5090639416 0 5090708000 Ã = = s Entonce : 77 . 2 1 2 8 8 8 . 292 3500 3 . 4133 1 Ã Ã 84 32 11 1 1 = - = - = k n c n t s b b Como este valor es mayor al estadístico ta ular(2.015), entonces de e de rechazarse hipótesis nula, por lo que concluimos que en promedio cada ha itación adicional suma más de 3500 dólares al precio de venta de una casa de ese tipo, con un nivel de significación del 5%. ESTADÍSTICA APLICADA 144 2. Una em otelladora de e idas gaseosas analiza las rutas servicio de las máquinas expendedoras en su sistema de distri ución. Le interesa predecir el tiempo necesario para representante de ruta atienda las máquinas expendedoras en una
de que
el
tienda. Esta actividad de servicio consiste en a astecer la máquina con productos em otellados y algo de mantenimiento o limpieza. El ingeniero industrial responsa le del estudio ha sugerido que las dos varia les mas importantes que afectan el tiempo de entrega ªyº son la cantidad de cajas de producto a astecido ªx 1 º y la distancia caminada por el representante ªx 2 º. El ingeniero ha reunido 25 o servaciones de tiempo de entrega, que se presentan a continuación: N de O servación Tiempo de entrega(min) y Cantidad de cajas x 1 Distancia (pies) x 2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50
40.33 21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32 18.75 19.83 10.75 7 3 3 4 6 7 2 7 30 5 16 10 4 6 9 10 6 7 3 17 10 26 9 8 4 560 220 340 80 150 330 110 210 1460 605 688 215 255 462 448 776 200 132 36 770
140 810 450 635 150 a) ) 2 .
Estime la ecuación de regresión lineal múltiple Construya el cuadro de ANVA y calcule R
ESTADÍSTICA APLICADA 145 SOLUCIÓN: a) Sustituyendo å å å å å = = = = = 6725688 , 133899 , 3055 , 10232 , 219 2 2 2 1 2 1 2 1 x x x x x x y n=25 en la matriz X T X, se o tiene 25
219
10232
X T X
=
219
3055
133899 10232
133899
6725688
la inversa de esta matriz la o tenemos a través del método de la adjunta; esto es: 0.11321518
-0.00444859
-0.00008367
-0.00004786
0.00000123
(X T X) -1 =
-0.00444859
0.00274378
-0.00004786 -0.00008367
Al sustituir å å å = = = 00 . 337072 44 . 7375 , 60 . 559 2 1 y x y y x y en
X
T Y, se o tiene:
⎟
⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ = 00 . 337072 44 . 7375 60 . 559 Y X T y por último, reemplazando en: B = (X T X) 1 X T Y = ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ 01438483 . 0 61590712 . 1 34123115 . 2 Entonces la ecuación de regresión lineal múltiple estimada es: yà = b 0 + b 1 x 1 + b 2 x 2 ESTADÍSTICA APLICADA 146 Reemplazando:
yà = 2.34123115 + 1.61590712x 1 + 0.01438483x 2
b) CUADRO DE ANALISIS DE VARIANCIA (ANVA) Fuente de variación Suma de cuadrados Grados de libertad Cuadrado medio F c Regresión 5550.8166 2 2775.4083 261.24 Error o residual 233.7260 22 10.6239 Total 5784.5426 24 Donde: R 2
= 0.9596
· Efectúe las pruebas de hipótesis correspondientes. EJERCICIOS PROPUESTOS 1. Los siguientes datos muestran el número de habitaciones, el número de baños y los precios a los que se vendieron hace poco 10 casas de una muestra aleatoria de un distrito de Lima: N de Habitaciones (x 1 )N de Baños (x 2 ) Precio (y) (en dólares) 3 2 4 2 3 2 5 4 5 32 1 3 1
2 2 3 2 2 3 78 74 83 74 79 74 88 82 84 80
800 300 800 200 700 900 400 900 600 200
Estime la ecuación de regresión lineal múltiple y prediga el precio de venta de una casa de cuatro habitaciones con tres baños. ESTADÍSTICA APLICADA 147 2. Los siguientes datos constan del nivel de ventas que obtuvo la empresa ªMACHI SACº durante cuatro meses del presente año; los gastos de publicidad por televisión; y los gastos por publicidad en periódicos (todo en miles de dólares): GASTOS PUBL. TV 4 7 7 12 9 17 12 20
GASTOS PUBL. RADIO
VENTAS
1 2 5 8
Determine la ecuación de regresión lineal múltiple estimada y prediga niveldólares de ventasendepublicidad un mes en eldecual se piensayinvertir 15 y 10el mil televisión radio respectivamente. 3. Los datos siguientes se refieren a las utilidades semanales (en miles de soles) de 5 restaurantes, sus aforos (en decenas) y el tránsito diario en promedio (en miles de automóviles) que pasan por sus ubicaciones: AFORO
TRANSITO DIARIO 2 3 3 4 2 5
UTILIDAD NETA SEMANAL 1 2
1 4
1 3
4
2
2 Analice la información y calcule la línea de regresión múltiple estimada.
ESTADÍSTICA APLICADA 148 4. Los siguientes datos muestrales los proporciona una compañía de mudanzas sobre los pesos de seis envíos, las distancias que se desplazaron y el daño que se provocó: Peso (1000 libras) x 1 Distancia (1000 millas) X 2 Daño (dólares) y 4.0 3.0 1.6 1.2 3.4 4.8 1.5 2.2 1.0 2.0 0.8 1.6 160 112 69 90 123 186 a) Suponiendo que la regresión es lineal, estime b 0 , b 1 y
b
2 . ) Utilice los resultados del inciso a) para estimar el daño cuando un cargamento que pesa 2400 li ras es desplazado una distancia de 1200 millas. 5. Los datos siguientes se refieren a las utilidades semanales promedio (en miles de dólares) de cinco restaurantes, sus aforos y el tránsito diario en promedio (en miles de automóviles) que pasan por sus u icaciones: Aforo x 1 Tránsito diario x 2 Utilidad neta Semanal y 120 200 150 180 240 19 8 12 15 16 23.8 24.2 22.0 26.2 33.5 a) 0 , b 1 y 2 .
Suponiendo que la regresión es lineal, estime b
b
) Utilice los resultados del inciso a) para predecir la utilidad semanal neta en promedio de un restaurante son una capacidad de asientos de 210 en un sitio donde el tránsito diario promedio es de 14000 automóviles.
ESTADÍSTICA APLICADA 149 6. Los siguientes datos constan de las calificaciones que o tuvieron 10 estudiantes en un examen, su coeficiente intelectual y el número de horas que estudiaron para el examen:
en
a) 0 , b 1 y 2 .
Suponiendo que la regresión es lineal, determine b
b
) Prediga intelectual examen.
la de
calificación de un estudiante con un coeficiente 108 que estudió seis horas para presentar el
7. Los datos siguientes se recolectaron para determinar la relación existente entre dos varia les de proceso y la dureza de cierto tipo de acero: Dureza (Rockwell 30-T) y Contenido de co re (porcentual) x 1 Temperatura de 0 recocido( F) x 2 78.9 55.2 80.9 57.4 85.3 60.7 0.02 0.02 0.10 0.10 0.18 1000 1200 1000
1200 1000 1200 Ajuste una línea recta por el método de mínimos cuadros y utilícela para determinar la dureza promedio de este tipo de acero cuando el contenido de co re es del 0.14% y la temperatura recocido es 1100 0 F. Coeficiente Intelectual x 1 Número de horas de estudio x 2 Calificaciones y 112 126 100 114 112 121 110 103 111 124 5 13 3 7 11 9 8 4 6 2 79 97 51 65 82 93 81 38 60 86 ESTADÍSTICA APLICADA 150 8. Los que siguen son datos a cerca de la efectividad porcentual de un analgésico y las cantidades de tres medicamentos distintos (en miligramos) presentes en cada cápsula:
de
Suponiendo que de regresión.
la
regresión
es
lineal,
determine
los
coeficientes
9. Supóngase que el gerente de ventas de una gran compañía distri uidora de partes para automóviles, desea calcular desde a ril las ventas anuales totales de una región. Según las ventas regionales, tam ién pueden estimarse las ventas totales las ventas totales de la compañía. Si, con ase en la experiencia, se encuentra que los estimados de a ril de las ventas anuales son razona lemente exactos, entonces en los años futuros podría utilizarse el pronóstico de a ril para revisar los planes de producción y mantener el inventario correcto en las tiendas al menudeo. Varios factores parecen estar relacionados con las ventas, incluyendo en número de tiendas al menudeo en la región que almacena las partes comercializadas por la compañía, el número de automóviles registrados en la zona hasta a ril 1, y el ingreso personal total para el primer trimestre del año. Finalmente se seleccionaron cinco varia les independientes como las más importantes (de acuerdo con el gerente de ventas). Después se recopilaron datos para un año reciente. Tam ién se registraron las Medicamento A x 1 Medicamento B x 2 Medicamento C x 3 Efectividad porcentual y 15 15 15 15 30 30 30 30 45 45 45 45 20 20 30 30 20 20 30 30 20 20 30 30 10 20
10 20 10 20 10 20 10 20 10 20 47 54 58 66 59 67 71 83 72 82 85 94 ESTADÍSTICA APLICADA 151 ventas anuales totales en ese año según cada región. O sérvese en la ta la anexa que para la región 1 se tuvieron 1739 tiendas al menudeo que almacenan las partes de auto de la empresa, que hu o 9270000 automóviles registrados en la región hasta el 1 a ril, y que las ventas para ese año fueron por $ 37702000(dólares). Ventas anuales (mdd) y Número de tiendas de menudeos x 1 Número de automóviles registrados (millones) x 2 Ingreso personal (mmdd) x 3 Antigüedad promedio de los automóviles (años) x
de
4 Número de supervisores x 5 37.702 24.196 32.055 3.611 17.625 45.919 29.600 8.114 20.116 12.994 1739 1221 1846 120 1096 2290 1687 241 649 1427 9.27 5.86 8.81 3.81 10.31 11.62 8.96 6.28 7.77 10.92 85.4 60.7 68.1 20.2 33.8 95.1 69.3 16.3 34.9 15.1 3.5 5.0 4.4 4.0 3.5 4.1 4.1 5.9 5.5 4.1 9.0 5.0 7.0
5.0 7.0 13.0 15.0 11.0 16.0 10.0 Nota: mdd indica de dólares.
millones
de
dólares,
y
mmdd,
miles
de
a) Estime la ecuación de regresión lineal múltiple. ) Realice la prue a de hipótesis para los coeficientes regresión con un nivel de significación de 0.05. c) Calcule e interprete al coeficiente de determinación.
millones
de
10. El administrador de un nuevo programa paralegal en Seagate Techinical Collage desea estimar el promedio de calificaciones en dicho programa. Consideró que el promedio de calificaciones en achillerato (GPA, de grade Point Average), la puntuación en expresión oral en el examen de Aptitud Académica Superior (SAT, de Scholastic Aptitude Test), y las calificaciones de matemática en el SAT, serían uenos preeditores (o elementos de predicción) del GPA paralegal. Los datos para nueve estudiantes son: ESTADÍSTICA APLICADA 152 a) Estime la ecuación de regresión lineal múltiple. ) Realice la prue a de hipótesis para los coeficientes regresión con un nivel de significación de 0.05. c) Calcule e interprete al coeficiente de determinación.
de
11. El señor Mike Wilde es presidente de sindicato de profesores Distrito escolar de Otsego. Al prepararse para futuras negociaciones, a Mike le gustaría investigar la estructura de los sueldos de personal docente en el distrito. Considera que existen tres factores que afectan el pago la oral de un profesor, años de experiencia, en la (asignada poruna el calificación director) y de si la el efectividad profesor tiene o enseñanza no grado maestría. Una muestra aleatoria de 20 profesores dio como resultado los siguientes datos:
Estudiante GPA
de
del
Bachillerato Expresión oral SAT Matemáticas SAT GPA Paralegal 1 2 3 4 5 6 7 8 9 3.25 1.80 2.89 3.81 3.13 2.81 2.20 2.14 2.63 480 290 420 500 500 430 320 530 469 410 270 410 600 490 460 490 480 440 3.21 1.68 3.58 3.92 3.00 2.82 1.65 2.30 2.33 ESTADÍSTICA APLICADA 153 Sueldos (mdd), y Años de Experiencia
x 1 Calificación del director x 2 Maestría * x 3 21.1 23.6 19.3 33.0 28.6 35.0 32.0 26.8 38.6 21.7 15.7 20.6 41.8 36.7 28.4 23.6 31.8 20.7 22.8 32.8 * 1= si,0=no 8 5 2 15 11 14 9 7 223 1 5 23 17 12 14 8 4 2 8 35 43 51 60 73 80 76
54 55 90 30 44 84 76 68 25 90 62 80 72 0 0 1 1 0 1 0 1 1 1 0 0 1 0 1 0 1 0 1 0 Nota: mdd indica miles de dólares. a) Determine la ecuación de regresión. ¿Qué sueldo estimaría usted para un profesor con cinco años de experiencia, una calificación de 60 dada por el director, y sin maestría? ) Realice una coeficientes prue a glo al hipótesis paradifieren determinar algunos de los de de regresión netos de si cero. Utilice el nivel de significación de 0.05. c) Realice una prue a de hipótesis para los coeficientes de regresión. ¿Consideraría eliminar cualesquiera de las varia les independientes? Use el nivel de significancia 0.05 d) Si su conclusión para la parte (c) fue suprimir una o más varia les independientes, efectué de nuevo el análisis sin esas varia les. ESTADÍSTICA APLICADA 154 12.
El
gerente
de
ventas
distrital
de
un
importante
fa ricante
automóviles está estudiando las ventas. le gustaría determinar qué factores afectan Específicamente el número de autos vendidos en una distri uidora. Para investigar, selecciona al azar 12 distri uidores. De ellos o tiene el número de vehículos vendidos el último mes, los minutos de pu licidad radiofónica
de
comprados en dicho periodo, el número de vendedores de tiempo completo empleados en la distri uidora, y si ésta se localiza en la ciudad o no. La información es la siguiente: Automóviles vendidos el último mes y Pu licidad x 1 Fuerza de ventas x 2 Ciudad x 3 Automóviles vendidos el último mes y Pu licidad x 1 Fuerza de ventas x 2 Ciudad x 3 127 138 159 144 139 128 18 15 22 23 17 16 10 15 14 12 12 12 Si No Si Si No
Si 161 180 102 163 106 149 25 26 15 24 18 25 14 17 7 16 10 11 Si Si No Si No Si a) Determine la ecuación de regresión. ¿Cuántos autos esperaría que se vendieran en una distri uidora con 20 vendedores, que paga 15 minutos de pu licidad y se localiza en una ciudad? ) Realice una prue a glo al de hipótesis para determinar si alguno de los coeficientes de regresión neta es diferente de cero. Sea a = 0.05. c) Efectúe un prueb de hipótesis p r los coeficientes de regresión individu les. ¿Consider rí elimin r lgun de l s v ri bles independientes? Se a = 0.05. d) Si su conclusión en l p rte (c) fue suprimir un o más de l s v ri bles independientes, efectúe de nuevo el nálisis sin es s v ri bles
ESTADÍSTICA APLICADA 155 13. L s tiend s de Fr n's Convenience M rts están loc liz d s en el áre metropolit n de Erie, Pennsylv ni . A Fr n, l dueñ , le gr d rí l extensión otr s comunid des del noroeste de Pennsylv ni y el suroeste de Nuev York, t les como J mestown, Corry, Me dville y W rren. Como p rte de su present ción l b nco loc l, le gust rí entender mejor los f ctores que h cen que un tiend en p rticul r se lucr tiv . L propiet ri debe h cer todo el tr b jo sol , sí que no podrá n liz r todos sus est blecimientos. Seleccion l s z di r un 15 tiend sde y piso registr el promedio de l s vent ri smuestr (Y), ldesuperficie (áre ), el número de lug res de est cion miento, y el ingreso económico medio de f mili s en es región p r c d est blecimiento. L inform ción de l muestr se present
enseguid . Tiend s en muestr Vent s di ri s Áre de tiend s Lug res de est cion miento Ingreso (mdd) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 $1840 1746 1812 1806 1792 1825 1811 1803 1830 1827 1764 1825 1763 1846 1815 532 478 530 508 514 556 541 513 532 537 499 510 490 516 482 6 4 7
7 5 6 4 6 5 5 3 8 4 8 7 44 51 45 46 44 46 49 52 46 46 48 47 48 45 43 Not
: mdd indic
miles de dól res.
) Determine l ecu ción de regresión. b) ¿Cuál es el v lor de R 2 ? Comente cerc de t l v lor. c) Re lice un prueb glob l de hipótesis p r determin r lgun de l s v ri bles independientes es diferente de cero. ESTADÍSTICA APLICADA 156 d)
Re lice
prueb s
individu les
de
hipótesis
se suprimir independientes. e) pueden Si se eliminvnrivbles ri bles, vuelv regresión y R 2 .
p r
c lcul r
l
si
determin r
si
ecu ción
de
14. El señor Steve Dougl s fue contr t do como gerente en entren miento por un import nte empres fin ncier . Como primer proyecto, se le pidió que estudi r l utilid d brut en l industri químic .¿Qué f ctores fect n l s utilid des en es industri ? Steve seleccion l z r un muestr de 16 comp ñí s y obtiene d tos respecto l c ntid d de emple dos, el número de dividendos consecutivos p g dos de cciones comunes, el v lor tot l del invent rio l inicio del presente ño y l g n nci brut de c d empres . Sus descubrimientos son:
Comp ñí n nci
brut (mdd) y Número de emple dos x 1 Dividendos consecutivos x 2 Invent rio Inici l (mdd) x 3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 2800 1300 1230 1600 4500 5700 3150 640 3400 6700 3700 6440 1280 4160 3870 980 140 65 130 115 390 670 205 40 480 810 120 590
440 280 650 150 12 21 42 80 120 64 43 14 88 98 44 110 38 24 60 24 1800 320 820 76 3600 8400 508 870 5500 9875 6500 9130 1200 890 1200 1300 Not
: mdd indic
miles de dól res.
ESTADÍSTICA APLICADA 157 ) Determine l ecu ción de regresión. L M ster Chemic l Comp ny emple 220 person s, h p g do 64 dividendos consecutivos de cciones comunes y tiene un invent rio v lu do en $1 500000 (dól res) l principio del ño. ¿Cuál es l g n nci brut c lcul d ? b) Re lice un prueb glob l de hipótesis p r determin r si lguno de los coeficientes de regresión net es diferente de cero. c) Efectúe un prueb de hipótesis p r los coeficientes de regresión individu les. ¿consider rí elimin r lgun de l s v ri bles independientes? d)ri bles Si suindependientes, conclusión p rh gl v consider r es s v ri bles. 15.
El
Times
Observer
es
un
p rte (c)elfuenálisis elimin sin r un de nuevo di rio
en
Metro
City.
Como
o
más
muchos
periódicos de l ciud d, dich public ción está p s ndo por difíciles tiempos fin ncieros. L gerente de circul ción está estudi ndo otros periódicos en ciud des semej ntes de Est dos Unidos y C n dá. Está p rticul rmente interes d en s ber qué v ri bles se rel cion n con el número de suscripciones l di rio. H podido obtener l siguiente inform ción de muestr cerc de 25 periódicos de ciud des simil res. Se utilizó l siguiente not ción: Suscr = Número de subscripciones (en miles). Pobl = Pobl ción metropolit n (en miles). Public = Presupuesto de publicid d del periódico (en cientos de dól res). Ingr = Ingreso f mili r medio en el áre metropolit n (en miles de dól res) Di rio 1 2 3 4 5 6 7 8 9 10 11 12 13 37.95 37.66 37.55 38.78 37.67 38.23 36.90 38.28 38.95 39.27 38.30 38.84 38.14 588.9 585.3 566.3 642.9 624.2 603.9 571.9 584.3 605.0 676.3 587.4 576.4 570.8 13.2 13.2 19.8 17.6
Suscr
Pobl
Public
Ingr
Di rio
Suscr
Pobl
Public
Ingr
17.6 15.4 11.0 28.6 28.6 17.6 17.6 22.0 17.6 35.1 34.7 34.8 35.1 34.6 34.8 34.7 35.3 35.1 35.6 34.9 35.4 35.0 14 15 16 17 18 19 20 21 22 23 24 25 38.39 37.29 39.15 38.29 38.09 37.83 39.37 37.81 37.42 38.83 38.33 40.24 586.5 544.0 611.1 643.3 635.6 598.9 657.0 595.2 520.0 629.6 680.0 651.2
15.4 11.0 24.2 17.6 19.8 15.4 22.0 15.4 19.8 22.0 24.2 33.0 35.5 34.9 35.0 35.3 34.8 35.1 35.3 35.1 35.1 35.3 34.7 35.8 ESTADÍSTICA APLICADA 158 ) Determine l ecu ción de regresión. b) Re lice un prueb glob l de hipótesis p r determin r si lgunos coeficientes de regresión net no son igu les cero. c) Efectúe un prueb p r los coeficientes individu les. ¿Consider rí elimin r lgunos de ellos? 16. El Toledo Bl de (Ohio) hizo recientemente un c mp ñ indic ndo que tení v c ntes p r mens jeros. "Despierte nte l s oportunid des", decí el nuncio. "Con un rut Bl de, usted tr b j rá cerc de sólo un hor l dí en l m ñ n , cu ndo teng tiempo". El nuncio continu b con un list de l s siguientes rut s de mens jerí . L g n nci sem n l promedio (en dól res) dependiente, y el son número clientes di rios, sí es comol elv ri de ble clientes de domingo, l s dev ri bles independientes. Rut n nci sem n l promedio Número de clientes di rios Número de clientes de domingo reenwood Osw ld Neved Forsythe Id ho
V lleywood O k Hill Burb nk Burke len Penelope $47.00 70.00 24.00 30.00 25.00 44.00 26.00 19.50 33.20 35.00 66 98 32 42 34 60 40 30 46 48 78 117 45 51 44 76 40 30 57 61 ) Determine c lcul rí p r domingo?
l un
ecu ción de regresión. ¿Cuánt g n nci rut que tiene 50 clientes di rios y 100 de
b) concluir que l s v ri ¿Se ción puede en l utilid d sem n l?
dos
v ri bles
explic n
tod
l
ESTADÍSTICA APLICADA 159 17. Un dep rt mento de hipotec s en un gr n b nco está estudi ndo sus prést mos recientes. De p rticul r interés es conocer cómo f ctores t les como el v lor de l c s (en miles de dól res), el nivel de educ ción y l ed d de quien enc bez l f mili , el p go ctu l de hipotec l mes (en dól res) y el sexo de t l person (m sculino = 1, femenino =0), se rel cion n con el ingreso f mili r. ¿Son est s v ri bles mec nismos efectivos de predicción del ingreso p r el prést mos recientes:
hog r?
Se
obtiene
un
muestr
l
z r
de
25
Ingreso (millones de dól res) V lor (millones de dól res) Años de educ ción Ed d P go de hipotec Sexo $40.3 39.6 40.8 40.3 40.0 38.1 40.4 40.7 40.8 37.1 39.9 40.4 38.0 39.0 39.5 40.6 40.3 40.1 41.7 40.1 40.6 40.4 40.9 40.1 38.5 $190 121 161 161 179 99 114 202 184 90 181 143 132 127 153 145 174 177 188
153 150 173 163 150 139 14 15 14 14 14 14 15 14 13 14 14 15 14 14 14 14 15 15 15 15 16 13 14 15 14 53 49 44 39 53 46 42 49 37 43 48 54 44 37 50 50 52 47 49 53 58 42 46 50 45 $230 370 397
181 378 304 285 551 370 135 332 217 490 220 270 279 329 274 433 333 148 390 142 343 373 1 1 1 1 0 0 1 0 0 0 1 1 0 0 1 1 1 0 1 1 0 1 1 0 0 ESTADÍSTICA APLICADA 160 ) Determine l ecu ción de regresión. b) ¿Cuál es el v lor de R 2 ? Comente cerc del mismo. c) l de hipótesis p r determin lgunRe s lice de lun s vprueb ri blesglob independientes son diferentes de r si cero. d) Efectúe prueb s individu les de hipótesis p r est blecer si se pueden elimin r lgun s de l s v ri bles independientes.
e) Si se suprimen regresión y R 2 .
v ri bles,
vuelv
formul r
l
ecu ción
de
18. El señor Fred . Hire es el gerente de recursos hum nos del Centro Médico St. Luke. Como p rte de su reporte nu l l presidente de dich institución se le pidió present r un nálisis de los emple dos sueldo. Debido que h y más de 1000 tr b j dores, no tiene e! person l p r reunir inform ción respecto c d uno de los l bor ntes en cuestión, sí que seleccion un muestr le tori de 30. Por c d tr b j dor registr el p go l bor l mensu l, los meses de servicio en St. Luke, el sexo (1= m sculino, 0= femenino), y si el emple do tiene un puesto técnico ó de oficin . Los que h cen tr b jos técnicos se codific n como 1, y los que re liz n ctivid des de escritorio, como 0.
ESTADÍSTICA APLICADA 161 Emple do en l muestr S l rio mensu l (en dól res) Tiempo de servicio Ed d Sexo Tr b jo 1 2 3
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 $1769 1740 1941 2367 2467 1640 1756 1706 1767 1200 1706 1985 1555 1749 2056 1729 2186 1858 1819 1350 2030 2550 1544 1766 1937 1691 1623 1791 2001 1874 93 104 104
126 98 99 94 96 124 73 110 90 104 81 106 113 129 97 101 91 100 123 88 117 107 105 86 131 95 98 42 33 42 57 30 49 35 46 56 23 67 36 53 29 45 55 46 39 43 35 40 59 30 60 45 32 33 56 30 47 1 1 1
1 1 1 1 0 0 0 0 0 0 0 1 0 1 0 1 1 1 1 0 1 1 0 0 0 1 1 0 0 1 1 1 1 0 1 0 1 1 1 0 0 0 1 1 1 1 1 0 0 0 1 1 1 0 1 1 0 )
Determine
l
ecu ción
de
regresión
us ndo
el
sueldo
como
l v ri ble dependiente, y l s v ri bles independientes. b) ¿Cuál es el v lor de R 2 ? Comente respecto este v lor. ESTADÍSTICA APLICADA
otr s
cu tro
v ri bles
como
162 c) Re lice un prueb glob l de hipótesis p r determin r si lgun s de l s v ri bles independientes son diferentes de cero. d) Re lice un prueb individu l p r determin r si se puede elimin r lgun de l s v ri bles independientes. e) Vuelv est blecer l ecu ción de regresión utiliz ndo sólo l s v ri bles independientes que son signific tiv s. ¿Cuánto más g n l mes un hombre que un mujer? ¿H y lgun diferenci si el emple do tiene un puesto técnico o uno de oficin ? ESTADÍSTICA APLICADA 163 TABLAS ESTADÍSTICAS
TABLA 1: DISTRIBUCIÓN NORMAL TABLA 2: DISTRIBUCIÓN t DE STUDENT TABLA 3: DISTRIBUCIÓN c
2
TABLA 4: DISTRIBUCIÓN F TABLA 5: PROBABILIDADES BINOMIALES TABLA 6: PROBABILIDADES DE POISSON TABLA 7: TABLA DE NÚMEROS AL AZAR
ªTus padres y tus profesores son tus fieles y desinteresados amigos: ¡Aprové halos! por que no podrán a ompañarte por mu ho tiempoº.
ESTADÍSTICA APLICADA 164 ESTADÍSTICA APLICADA 165 ESTADÍSTICA APLICADA 166 ESTADÍSTICA APLICADA 167 ESTADÍSTICA APLICADA 168 Z
ESTADÍSTICA APLICADA 169 ESTADÍSTICA APLICADA 170
ESTADÍSTICA APLICADA 171 ESTADÍSTICA APLICADA 172 ESTADÍSTICA APLICADA 173 ESTADÍSTICA APLICADA 174 ESTADÍSTICA APLICADA 175 ESTADÍSTICA APLICADA 176 ESTADÍSTICA APLICADA 177 ESTADÍSTICA APLICADA 178 ESTADÍSTICA APLICADA 179 ESTADÍSTICA APLICADA
180 ESTADÍSTICA APLICADA 181 ESTADÍSTICA APLICADA 182 ESTADÍSTICA APLICADA 183 BIBLIO RAFÍA
Devore, Jay (1999). Probabilidad para Ingeniería y Cien ias. Méxi o, D.F. Reprotló. S.A. de C.V. 697p. Freund, John; Walpole, Ronald (1990). Estadísti a Matemáti a Apli a iones. Prenti e-Hall Hispanoameri ana. S.A. EDITORIAL. 617p. Mason, Robert ² ; Lind, Douglas; Mar hal, William (2001). Estadísti a para Administra ión y E onomía. Méxi o, D.F. ALFAOME A EDITOR, S.A. de C.V. 785p.
on
RUPO
Montgomery, Douglas; Runger, eorge (2002). Probabilidad y Estadísti a. Méxi o, D.F. EDITORIAL LIMUSA, S.A. de C.V. 819p. Montgomery, Douglas; Pe k, Elizabeth; Vining eoffrey (2002). Regresión Lineal. Méxi o, D.F. RUPO PATRIA CULTURAL, S.A. de C.V. 567p. Miller, Irwin; Freund, John; Johnson, Ri hard (1992). Probabilidad y Estadísti a para Ingenieros. Méxi o, D.F. Prenti e-Hall Hispanoameri ana. S.A. 624p. Rubio Donet, Jorge. Estadísti a Apli ada. Perú. 179p. Dr. Edgar A una http://math.uprm.edu/~edgar UNIVERSIDAD DE PUERTO RICO RECINTO UNIVERSITARIO DE MAYA UEZ
ªEstudia que la meta que te has trazado se logra estudiandoº