Esta Dis Tical i Bro

Estad´ıstica y probabilidad. Una introducci´ on. Notas de Clase. Dr. David Sierra Porta. Laboratorio de Campos y Part´ ıculas. Departamento de F´ısica. Facultad Experimental del Ciencias. Universidad del Zulia. Maracaibo, Venezuela.

Este libro ha sido creado usando el sistema de edición de textos de LATEX en un procesador Atom Intel a 1.6GHz en una laptop hp-mini 1100. Est´ a editado especialmente para el uso de los estudiantes de la Licenciatura de F´ısica de la Facultad Experimen tal del Ciencias de la Universidad del Zulia, sin embargo, su contenido es totalmente general y pudiera ser usado por cualquier estudiante de ciencias o afines ya que su contenido se adapta a muchos de los programas modernos de M´ etodos Matem´ aticos. El programa que comprende estas notas ha sido formateado a partir de los programas oficiales de la Facultad para ésta Licenciatura, de tal manera que se pueden encontrar en http://www.fec.luz.edu.ve y est´ a a disposición para todos. Todo el contenido ha sido compilado y creado por David Sierra Porta. Diseño de la cubierta por David Sierra Porta. Imagen de la portada: www. morguefile.com (2013). Escrito e ideado por David Sierra Porta. Notas de Clase - Libro de Texto. F´ısica-Matem´ atica.

Estad´ ıstica y probabilidad. Una introducci´ on. Notas de Clase.

F´ ısica-Matem´ atica

Estad´ıstica y Probabilidad David Sierra Porta 19 de mayo de 2015

David Sierra Porta Es graduado en la Licenciatura de Matemáticas y F´ısica en la Facultad de Humanidades y Educación de la Universidad del Zulia, LUZ, en el a˜ no 2001. Es Magister Scientiarum en la Maestr´ıa de F´ısica Fundamental del Postgrado en F´ısica Fundamental de la Facultad de Ciencias de la Universidad de los Andes, ULA, en 2004. Tambi´ en Doctor en F´ısica Fundamental en la ULA (2015). Se desempe˜ na actualmente como profesor-investigador Asociado a dedicación exclusiva de la Facultad Experimental de Ciencias de la Universidad del Zulia desde el año 2005, en el Departamento de F´ısica. Miembro fundador del Laboratorio de Astronom´ıa y F´ısica Te´ orica, LAFT, y del Laboratorio de Campos y Part´ıculas, LCP, de la Facultad Experimental de Ciencias de la Universidad del Zulia. Autor de varios libros y publicaciones en el ´ area de las Ciencias F´ısicas. Sus intereses personales en investigación versan sobre gravitación y cosmolog´ıa, teor´ıas cu´ anticas de campo, Relatividad General, modificación de la gravedad y teor´ıas de calibre.

A Mai, Santi y Sami.

Índice general Presentaci´ on Pr´ ologo

13 15

1. Introduc ci´ on a la Estad´ıstica 1.1. Pequeña definición y algunos conceptos básicos . . . . . . . . . . . . . . . . 17 1.2. Población y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.3. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.4. Métodos de recolección de datos . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.1. La entrevista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.4.2. La encuesta . . . . . . . . . . . . . ............ ....... 23 1.4.3. Cuestionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.4.4. La observación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

17

2. La estad´ ıstica descriptiva 2.1. Distribuciones de frecuencia . . . . . . . . . . . . . . ............. 2.1.1. Terminolog´ıa adicional . . . . . . . . . . . . . . . . . . . .......

25 27 28

2.1.2. Creando tabla de frecuencias 2.1.3. Notaci´ on una Matem´ atica . . . . . . . . .. . . .. .. .. . . .. .. .. . . .. .. .. . . .. .. .. .. . .31 28 2.1.4. Frecuencia acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.1.5. La frecuencia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.1.6. Los histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2. Medidas de Tendencia Central (MTC) . . . . . . . . . . . . . . . . . . . . . 36 2.2.1. La Media Aritmética . . . . . . . . . . . . . . . . ........... 37 2.2.2. La Mediana . . . . . . . . . . ............. ......... 40 2.2.3. La moda . . . . . . . . . . . . . ............ ......... 41 2.2.4. Relación emp´ırica entre la media, mediana y moda . . . . . . . . . . 41 2.2.5. Propiedades de la medi a, mediana y moda . . . . . . . . . . . . . . . 42 2.2.6. El promedio ponderado . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2.7. Otros tipos de medias . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.2.8. Formas de las distribuciones de datos . . . . . . . . . . . . . . . . . 46 2.3. Medidas de variación . . . . . . . . . . . . . . . . . . . . ........... 49 2.3.1. Rango . . . . . . . . . . . . . . . . . . ............ ..... 50 2.3.2. La Varianza . . . . . . . . . . . . . . . . . ............ . . . 50 2.3.3. La Desviación Estándar . . . . . . . . . . . . . . . . . . . . . . . . . 51

7

Índice general

2.4. 2.5.

2.6.

2.7.

2.3.4. La Desviación Media . . . . . . . . . . . . . . . . . .......... 52 2.3.5. Dispersión absoluta y relativa: coeficiente de variación . . . . . . . . 52 2.3.6. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 2.3.7. Coeficiente de Correlación de Pearson . . . . . . . . . . . . . . . . . 53 Medidas de simetr´ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.4.1. Coeficientes de asimetr´ıa y curtosis . . . . . . . . . . . . . . . . . . . 55 Teorema que envuelven cuestiones sobre la Desviación Estándar . . . . . . . 57 2.5.1. La regla emp´ırica . . . . . . . . . . . . . . . . . ............ 58 2.5.2. Teorema de Chebychev . . . . . . . . . . . . . . . . . . . . . . . . . 58 Medidas de Posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.6.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.6.2. Deciles . . . . . . . . . . . . ............. .......... 60 2.6.3. Centiles o percentiles . . . . . . . . . . . . . ............ . . 61 Problemas de final de cap´ıtulo . . . . . . . . . . . . ............ . . 63

3. M´ eto dos cuantitativos de a n´ alisis predictivo, r egresi´ on 3.1. Correlación y regresión . . . . . . . . . . . ............. ...... 69 3.2. Distribuciones bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.3. La idea de la c orrelación . . . . . . . . . . ............. ...... 70 3.4. Encontrando la relación. Regresión . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.1. El coeficiente de correlación . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.2. Regresión lineal. El Método de los M´ınimos Cuadrados. . . . . . . . 3.5. Problemas de final de cap´ıtulo . . . . . . . . . . . . ............ . . 77

69

73

4. An´ alisis Combinatorio 4.1. Introducción . . . . . . . . . . . . . ............. .......... 81 4.2. Principio Fundamental de Conteo . . . . . . . . . . . . . . .......... 81 4.3. Arreglos . . . . . . . . . . . . . . . . . . . ............. ...... 82 4.4. Variaciones (o arreglos) con repetición . . . . . . . . . . . . . . . . . . . . . 83 4.5. Permutaciones (u ordenaciones) sin repetición . . . . . . . . . . . . . . . . . 84 4.6. Permutaciones (u ordenaciones) con repetición . . . . . . . . . . . . . . . . 84 4.7. Combinaciones . . . . . . . . . . . ............. .......... 85 4.8. Combinaciones con repetición . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.9. Análisis y Metodolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de conteo . . . . . . . . . . . . ............. ............ 86 4.10. Problemas de final de cap´ıtulo . . . . . . . . . . . . ............ . . 86

81

5. Probabilidad 5.1. Introducción: La probabilidad . . . . . . . . . ............. . . . . 89 5.2. La probabilidad . . . . . . . . . . . . . . . ............. ...... 91 5.3. Experimentos de Probabilidad . . . . . . . . . . . . ............ . . 91

89

8

Índice general 5.4. Calculando la probabilidad de un evento . . . . . . . . . . . . . . . . . . . . 93 5.4.1. Probabilidad Emp´ırica . . . . . . . . . . . . . . . . . . . ....... 93 5.4.2. Probabilidad clásica . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.5. Axiomas de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.6. Posibilidades y probabilidades . . . . . . . . . . . . . ............. 96 5.7. Propiedades de la probab ilidad de eventos no elementales . . . . . . . . . . 97 5.8. Probabilidad condicionada . . . . . . . . . . . . . . . ............. 98 5.9. Probabilidad total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 5.9.1. Teorema de la probabilidad total . . . . . . . . . . . . . . . . . . . . 99 5.10. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 5.11. Problemas de final de cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . 100

6. Variable aleatoria y función de distribución 6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.2. Variable aleatoria unidimensional . . . . . . . . . . . . . . . . . . . . . . . . 106 6.3. Variables discretas . . . . . . . . . . ............ .......... 107 6.4. Variables continuas . . . . . . . . . . . . . . . . ............ . . . . 107 6.5. Caracter´ısticas de una v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 6.5.1. Definición. (Esperanza Matemática) . . . . . . . . . . . . . . . . . . 108 6.5.2. Definición. (Varianza) . . . . . . . . . . ........... . . . . . 109 6.6. Inecuación de Chevyshev . . . . . . . . . . ............ . . . . . . 109 6.7. Problemas de final de cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . 110

105

7. Distribuciones de Probabilidad Binomial y Normal

113

7.1. on o. n . . binomial . . . . . .o. .de . Bernoulli . . . . . . . . .. .. .. .. . ......... . .. . . . .. .. .. .. . . 113 7.2. Introducci´ La distribuci´ .. 113 7.2.1. Definición de distribución binomial . . . . . . . . . . . . . . . . . . . 114 7.2.2. El uso de las tab las de la di stribución binomial . . . . . . . . . . . . 115 7.2.3. Probabilidades acumuladas . . . . . . . . . . . ........... . 116 7.2.4. Media y desviación t´ıpica en una distribuci´ on binomial . . . . . . . . 117 7.3. La distribución Normal . . . . . . . . . . . ............ . . . . . . 117 7.3.1. Uso de las tab las de la di stribución normal N (0;1) . . . . . . . . . . 120 7.3.2. Cálculo de otras probabilid ades . . . . . . . . . . . . . . . . . . . . . 121 7.3.3. Cálculo de probabilidades en normales N (¯ x; σ) . . . . . . . . . . . . 123 7.3.4. Otro uso de las tablas . . . . . . . . . . ........... . . . . . 124 7.4. Relación entre la distribución binomial y la distribución normal . . . . . . . 125 7.4.1. Teorema del L´ımite Central . . . . . . . . . . . . . . . . . . . . . . . 125

8. Estimaci´ on puntual e intervalos de confianza. Inferencia estad´ıstica. 8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8.2. Estimación puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 8.2.1. Intervalo de Estimación . . . . . . . . . . . ............ . . 128

127

9

Índice general 8.3. Intervalos de confianza . . . . . . . . . . . . . . ........... . . . . . 129 8.3.1. Intervalo de confianza para la media poblac ional . . . . . . . . . . . 129 8.3.2. Intervalo de confianza para la media poblac ional usando la desviación estándar de la muestra. Distribución t de Student . . . . . . . . . . 130 8.3.3. Intervalo de confianza para la proporción poblacional . . . . . . . . . 132 8.3.4. Estimador puntual para la desviación estándar de la población . . . 133 8.3.5. Intervalo de confianza para la varianza y desviación estándar de la población . . . . . . . . . . . ........... ........... 133

9. Pruebas d e hipótesis de una población 137 9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 9.2. Procedimientos de comprobación de hipótesis y el método cient´ıfico . . . . . 137 9.3. Diseño de hipótesis de investigación y la experimentación . . . . . . . . . . 138 9.3.1. Las hipótesis y prueba de hipótesis . . . . . . . . . . . . . . . . . . . 138 9.3.2. Modelo estad´ ıstico y estad´ıstico de prueba . . . . . . . . . . . . . . . 139 9.3.3. Los errores en la Toma de Decisiones . . . . . . . . . . . . . . . . . . 140 9.3.4. Valor Cr´ıtico y Región de Rechazo . . . . . . . . . . . . . . . . . . . 141 9.3.5. Pruebas de una y dos colas . . . . . . . . . . ............ . 141 9.3.6. Recopilar y analizar los datos experimentales . . . . . . . . . . . . . 142 A. La redacción de informes y presentación de resultados 147 A.1. Definición de Informe cient´ıfico . . . . . . . . . . ............ . . . 147 A.2. Tipos y clasificaciones del Informe cient´ıfico . . . . . . . . . . . . . . . . . . 147 A.3. Caracter´ısticas, particularidades y modalidades del Informe cient´ıfico . . . . 148 A.3.1. Caracter´ısticas . . . . . . . . . . . . ........... . . . . . . . 148 A.3.2. Particularidades . . . . . . . . . . . ........... . . . . . . . 149 A.3.3. Modalidades . . . . . . . . . . . ........... ......... 149 A.4. Forma de presentación y estilos del Informe cient´ıfico . . . . . . . . . . . . . 150 A.5. Diferencias con el resto de los trabajos cient´ıficos . . . . . . . . . . . . . . . 151 B. C´ alculos de incertidumbre y de peque˜ nas variaciones 153 B.1. Tipos de errores . . . . . . . . . . . ........... ........... 153 B.1.1. Errores sistemáticos . . . . . . . . . . ............ . . . . . 154 B.1.2. Errores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 B.2. Precisión y exactitud . . . . . . . . . . . . . . . . ............ . . . 154 B.3. Incertidumbre absoluta y relativa . . . . . . . . . . . . . . . . . . . . . . . . 155 B.4. Propagación de los errores . . . . . . . . . . . . . ............ . . . 159 B.4.1. El método de las derivadas parciales . . . . . . . . . . . . . . . . . . 159 B.4.2. El método del Neperiano . . . . . . . . . . . ............ . 162

10

Índice de figuras 2.1. Histograma de frecuencias. . . . . . . . . . . . . . ............. . . 35 2.2. Construyendo un histograma simple. . . . . . . . . . . . . . . . . . . . . . . 35 2.3. Histograma de frecuencias acumuladas y histograma de frecuencias para dos datos. . . . . . . . . . . . ............. ............. . . 36 2.4. Histograma de datos apilad os y diagrama circu lar de proporciones. . . . . . 36 2.5. Pol´ıgono de frecuencias y histograma 3D. . . . . . . . . . . . . . . . . . . . 36 2.6. Distribución simétrica. . . . . . . . . . . . . . ............ ..... 47 2.7. Distribución sesgada a la derecha. . . . . . . . . . . . . . . . . . . . . . . . 48 2.8. istribución sesgada a la izquierda. . . . . . . . . . . . . . ........... 48 2.9. Distribución uniforme. . . . . . . . . . . . . . . . . . . . . . ......... 49 2.10. El coeficiente de correlación de Pearson. . . . . . . . . . . . . . . . . . . . . 54 2.11. Coeficiente de Fisher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 2.12. Coeficiente de curtosis. . . . . . . . . . . . . . . . ............. . . 58 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7.

Diagrama de dispersión o nube de puntos. . . . . . . . . . . . . . . . . . . . 71 Regresión lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Regresión lineal (Error). . . . . . . . . . . . . . . . . . . ........... 72 Ejemplo de regresión lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Regresión no lineal. . . . . . . . . . . . . . ............ ....... 74 La curva de regresión lineal en términos de los cambios de la funci´ on. . . . . 74 Representación para un cuerpo que se mueve con movimiento uniformemente acelerado. . . . . . . . . . . . ............. ............. 78

4.1. Metodolog´ıa sencilla para la resolución de problemas de conteo. . . . . . . .

86

7.1. Distribución de estaturas de 1400 mujeres. . . . . . . . . . . . . . . . . . . . 118 7.2. Distribución normal N (¯x; σ). El máximo está en (¯x, √ 1 2 ). . . . . . . . . . 119 2πσ

7.3. 7.4. 7.5. 7.6. 7.7. 7.8.

Distribución normal N (0; 1). El máximo está en (0 , √12π ). . . . . . . . . . . 11 9 Area encerrada por la curva normal desde hasta k . . . . . . . . . . . . 120 p(Z > k). Basta pasar al complementario. . . . . . . . . . . . ........ 121 p(Z k). Las probabilidades de valores negativos no est´ an tabuladas. . . 121 p(Z k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior. . . 122 p(Z > k). . . . . . . . . . . . ........... ........... . . . 122

−∞

≤− ≤−

11

Índice de figuras

−

≤

7.9. p(Z > k) = p(Z k). La simetr´ıa permite reducir este caso al que ya est´ a tabulado. . . . . . . . . . . . . . . . . . . . ........... . . . . . 122 7.10. p(k1 Z k 2 ). Probabilidad comprendida entre dos valores. . . . . . . . . 122 7.11. p(Z k2 ) en la primera imagen. p(Z k1 ) en la segunda. Al restar obtenemos el área p edida. . . . . . . . . . . . . ........... . . . . . . . 123

≤ ≤ ≤

≤

8.1. Nivel de confianza para la media poblacional. . . . . . . . . . . . . . . . . . 129 8.2. Distribución t de Student. . . . . . . . . ........... ......... 131 8.3. Distribución Chi-cuadrado. . . . . . . . . . . . 9.1. Prueba de hipótesis de una y dos colas.

12

........... ...........

..... .........

134 141

Presentaci´ on (...) Conseguimos obtener as´ı la f´ ormula estad´ ıstica para conocer aproximadamente la posici´ on de un electr´ on en un instante determinado. Pero, personalmente, no creo que dios juegue a los dados. - Albert Einstein

Se presentan a continuación unas notas de Estad´ıstica Elemental y Fundamental y probabilidad, principalmente enfocado al curso de Estad´ıstica y Métodos Num´ ericos de la Facultad Experimental de Ciencias de la Universidad del Zulia, LUZ, para la carrera de F´ısica. Las mismas contienen los elementos fundamentales para aprender a usar la estad´ıstica y la teor´ıa de la probabilidad para resolver problemas generales y espec´ıficos de las ciencias. Este curso pudiera tambi´ en entenderse como una introducci´ on en dos campos diferentes que tambi´ en tendr´ an incidencia en el pensum de la licenciatura de f´ısica. Por un lado provee un acercamiento a las técnicas usadas para la descripción y manipulación de datos experimentales a la vez que son la base matem´ atica fundamental para definir luego nuevos métodos (num´ ericos) para el an´ alisis de problemas. Por otro lado, son la base de la descripción de fenómenos más complejos en la oportunidad de examinar procesos fundamentales de part´ıculas en el a´rea de f´ısica estad´ıstica. De tal manera que estas notas se enfocan en ese sentido. Por ´ ultimo, enseñarán a los lectores las herramientas b´ asicas con las que an explorar de manerasus estad´ ıstica a sus cuando estépodr´ n estudiando y haciendos tesis. Unasoluciones buena parte deproblemas la tesis departiculares esta facultad ameritan de técnicas de procesamiento de datos y manipulación de los mismos para concluir y hacer inferencias de problemas particulare s. De este modo en resumen. El objetivo del curso es que el alumno se familiarice con las herramientas anal´ıticas esenciales necesarias para comprender el funcionamiento y las consecuencias de la aplicación de la teor´ıa estad´ıstica a la resoluci´ on de problemas en f´ısica. El contenido del libro se divide en nueve cap´ıtulos bien diferenciados. Los tres primeros cap´ıtulos est´ an motivados justamente a la manipulación estad´ıstica de los datos experimentales para resolver problemas. En estos apartados se estudian las estad´ısticas descriptivas y un poco de inferencia estad´ıstica con la determinaci´ on de curvas de regresión. El cap´ıtulo cuatro, está destinado a una pequeña introducción al análisis combinatorio. Está aqu´ ı, porque en la resolución de problemas de probabilidad es algunas veces muy ´ util la cuantificación de eventos en espacios muestrales, lo cual dtermina m´ as sencillamente el cálculo de ciertas probabilidades. En el cap´ıtulo cinco se hace una introducci´ on a la probabilidad y sus axiomas fundamentales, haciéndo énfasis en la resoluci´ on de problemas sencillos. En el cap´ıtulo seis, se estudia ahora la formaliazaición matemática de la probabilidad. Esto es muy conveniente, ya que el estudiante entenderá que en adelante, no es necesario realizar

13

Índice de figuras experimentos sino que bastará con la definición matemáticamente abstracta del mismo para el cálculo de probabilidades, es decir, se plantea de manera idealizada el experimento, considerando las caracter´ısticas del mismo y sus consecuencias, los resultados posibles del experimento y as´ı lograr una idealización matemática del mismo. Se encontrará esto muy provechoso ya que no siempre se cuenta con el tiempo, los medios, la infraestructura f´ısica, humana y computacional para llevar a cabo los experimentos. En el cap´ıtulo siete se estudian las distribuciones de probabilidad como una generalización de experimentos aleatorios haciéndo énfasis en las m´ as usadas, la normal y la binomial y se resuelven problemas usando estas técnicas. En los cap´ıtulos ocho y nueve, se presenta una introducci´ on al estudio de pruebas de hipótesis como paso al estudio de estad´ıstica inferencial. Por u ´ ltimo, se presenta dos apéndices, el primero, con una nota sobre la redacci´ on y presentación de informes y resultados, y el segundo, sobre cálculo de errores y variaciones, muy importante en la consideración de medidas experimentales. Buen provecho..!

14

Pr´ ologo The same set of statistics can produce opposite conclusions at different levels of aggregation. - Thomas Sowell. ’Penetrating the Rhetoric’, The Vision of the Anointed (1996), 102.

A cargo de la Profesora M. Jeanette Stock...!

15

1. Introducci´ on a la Estad´ıstica The Charms of Statistics.—It is difficult to understand why statisticians commonly limit their inquiries to Averages, and do not revel in more comprehensive views. Their souls seem as dull to the charm of variety as that of the native of one of our flat English counties, whose retrospect of Switzerland was that, if its mountains could be thrown into its lakes, two nuisances would be got rid of at once. An Average is but a solitary fact, whereas if a single other fact be added to it, an entire Normal Scheme, which nearly corresponds to the observed one, starts potentially into existence. Some people hate the very name of statistics, but I find them full of beauty and interest. Whenever they are not brutalised, but delicately handled by the higher methods, and are warily interpreted, their power of dealing with complicated phenomena is extraordinary. They are the only tools by which an opening can be cut through the formidable thicket of difficulties that bars the path of those who pursue the Science of man. - Sir Francis Galton . Natural Inheritance (1889), 62-3.

1.1.

Pequeña definición y algunos conceptos b´ asicos

Las Estad´ıstica es un área de la matemática muy importante con aplicaciones en un gran número de campos diferentes. En general uno puede decir que la Estad´ıstica es una ciencia cuya metodolog´ıa es la de recolectar, analizar e interpretar conclusiones a partir de información inicial. Dicho en otras palabras, la Estad´ıstica es la metodolog´ıa con la cual los cient´ıficos y matem´ aticos desarrollan e interpretan conclusiones a partir de datos recolectados. As´ı el dominio de la Estad´ ıstica es muy amplio y recoge muchas técnicas de muchas a´reas y aplicables a otras tantas para resolver problemas en los cuales la información que se tiene son básicamente conjunto de datos. Definici´ on 1.1 (Estad´ıstica) La Estad´ıstica es la ciencia de recoger o colectar, organizar, analizar e interpretar datos, en principio cualesquiera. Los métodos estad´ ısticos pueden ser usados para responder preguntas como: De qu´ e tipo y cu´ antos datos se necesitan recoger para estimar algo? Cómo se organizan y resumen los datos recogidos? Cómo sacamos conclusiones a partir de estos y c´ omo evaluamos sus incertidumbres? O sea, que la estad´ıstica provee métodos para

17

1. Introducción a la Estad´ ıstica 1. Diseño: Planear e implementar estudios de investigaci´ on. 2. Descripción: Resumir y explorar datos. 3. Inferir: Hacer predic ciones y generaliz ar fenómenos a partir de una data inicial. Ejemplo 1.1 (Estad´ıstica en la pr´ actica) Algunos problemas en los que la estad´ ıstica es muy útil. Considere los siguientes problemas. En agricultura: ¿Es m´ as productivo sembrar nueva semilla o usar fertilizante? En medicina: ¿Cu´ al es la cantidad correcta de la dosis del medicamento para un tratamiento? En ciencias pol´ ıticas: ¿Qu´ e tan exactas son los sondeos de opinión? En econom´ ıa: ¿Cu´ al será la tasa de desempleo el a˜ no que viene? Un problema t´ ecnico: ¿C´ omo mejorar la calidad de un producto? En f´ısica: ¿Es m´ as efectiva una bombilla LED o una convencional?, en las estrellas de la vecindad solar, ¿cu´ al elemento qu´ımico se encuentra con mayor abundancia?, ¿Cu´ anta energ´ıa almacena un capacitor luego de 20 segundos? Existen dos tipos de estad´ısticas: Descriptiva: tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones, y la Inferencial: infiere propiedades de gran número de datos recogidos de una muestra tomada de la población. La muestra se diferencia de la poblaci´ on en el hecho de que la primera es un subconjunto de la segunda, además, la muestra debe estar contenida necesariamente dentro de la población. La estad´ıstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.

1.2.

Poblaci´ on y muestra

Cuando se recogen datos ya sea de las caracter´ısticas que sea, suele a menudo ser imposible observar todo el conjunto de resultados, sobretodo si el conjunto es muy grande, tabularlo es además un proceso más tedioso y complicado, ordenarlos significa poner a prueba nuestra paciencia e ingenio. Es por ello que suele trabajarse con una parte de ese grupo de resultados. Cuando hablamos del conjunto completo de los datos de un estudio nos referimos a ellos en términos de la poblaci´ no, on, mientras que al subconjunto más peque˜ a la parte de la primera, nos referimos como los resultados de la muestra. Definici´ on 1.2 (Población) Una población (estad´ıstica) es un conjunto de medidas o datos correspondientes con el connjunto completo de las unidades de investigaci´ on sobre los cuales se quiere obtener algunas conclusi´ on o estudio. Definici´ on 1.3 (Muestra) Una muestra es un conjunto más peque˜ no de medidas tomados a partir de la población.

18

1.3. Variables Ejemplo 1.2 (Población y muestra) En muchos casos la población bajo consideración puede ser f´ısicamente escrita. Por ejemplo: los estudiantes de la Universidad Nacional, los libros de una biblioteca, o la cantidad de ´ atomos de hierro en una muestra cuadrada de 2cm de lado. Algunas veces la población puede no ser finita o casi infinita (al menos en t´ erminos pr´ acticos), en estos casos la muestra es el siguiente paso para describir y analizar un problema espec´ıfico. Por ejemplo: los decimales del n´ umero irracional π (poblaci´ on), los primeros cincuenta decimales del n´ umero π (muestra); la masa de los planetas del universo (poblaci´ on), la masa de los planetas del sistema solar (muestra); los ni˜ nos en edad escolar en el mundo (población), los niños en edad escolar en Venezuela (muestra 1), los ni˜ nos en edad escolar en Maracaibo (muestra 2). Ejemplo 1.3 Por ejemplo, si estamos interesados en medir los salarios de todos los cient´ıficos de las universidades del pa´ıs, el conjunto de datos que representan la poblaci´ on ser´ ıa en este caso la lista de todos los salarios de cualquier universidad en Venezuela. Una muestra podr´ıa ser obtenida seleccionando 10 universidades de una lista unos cuantos estados seleccionados al azar con sus respectivos salarios, por su puesto.

1.3.

Variables

Al conjunto de resultados posibles de una caracter´ıstica que desea estuadiars e en un cierto problema particular, suele llamarsele variable. En términos más formales, la variable es básicamente la caracter´ıstica que desea medirse o estudiarse, mientras que al conjunto de resultados posibles se le llama dominio de la variable. Si la variable s´ olo toma un valor se le llama variable constante. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir num´ ericamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor num´ erico (edad, precio de un producto, ingresos anuales). Las variables también se pueden clasificar en: Variables unidimensionales: sólo recogen información sobre una caracter´ıstica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen información sobre dos caracter´ısticas de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen información sobre tres o más caracter´ısticas (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

19

1. Introducción a la Estad´ ıstica Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: n´ umero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr´ a ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un veh´ıculo puede ser 80,3 km/h, 94,57 km/h...etc. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: 1. Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. As´ı, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. 2. Poblaci´ on: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblaci´ on será el total de las viviendas de dicha ciudad. 3. Muestra: subconjunto que seleccionamos de la población. As´ı, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (ser´ıa una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. A su vez, digamos que por ejemplo estuviéramos interesados en conocer la opinión de la gente en Venezuela acerca de la posibilidad o necesidad de incrementar la cantidad de puestos en los cuales de distribuye periódico a nivel nacional. Por su puesto, que la poblaci´ on estar´ a integrada por todas las respuestas de todos los ciudadanos del territorio nacional. Una muestra estar´ıa asegurada por ejemplo si tomásemos 1000 encuestas repartidas en todos los estados de acuerdo con la densidad poblacional de cada uno, respondiendo a la pregunta en cuestión. Para medir en estad´ıstica es obvio que necesitaremos adem´ as una definición para la cuantificación de las cosas o fenómenos, de la misma manera como se hace una clasificaci´ on en la f´ısica para n´ umeros ordinarios y vectores. Es decir, es importante, clasificar, qu´ e podemos medir y cómo, toda vez, que existe una clasificación para el comportamiento de una variable. As´ı entonces tendremos que definir los tipos de medida: Par´ ametro - una medida numérica (generalmente desconocida) hecha usando el conjunto de datos de la población en general, estad´ıstico - un valor numérico (conocida) soportado en el conjunto de datos del espacio muestral. Ejemplo 1.4 Usando el conjunto de datos que describen los salarios de los cient´ıficos, nosotros pudi´ eramos calcular el salario promedio de los cient´ıficos que laboran en las universidades Venezolanas. éste promedio calculado debe tomarse por un par´ ametro. Mientras

20

1.4. Métodos de recolecci´ on de datos

que si tomamos en cuenta la data proveniente de la escogencia al azar de las 10 universidades, entonces, éste valor debe nombrarse como un estad´ ıstico. Es por su puesto, muy sencillo darse cuenta que la poblaci´ on es un conjunto mucho más grande que la muestra. Note que la poblaci´ on pudiera ser finita o infinita. En este u ´ ltimo caso es donde la elección de una muestra es realmente indispensable. Adem´ as, debe advertirse que si la población tomada y seleccionada es muy grande, entonces probablemente será imposible poder calcular parámetros de algún inter´ es particular. A menos que la población sea bastante pequeña calcular ser´ıa muy dif´ıcil. Sin embargo, seleccionar poblaciones muy pequeñas es problemático, además de peligroso, y miente en el sentido cient´ıfico. En esencia, la idea general es poder seleccionar siempre muestras, más pequeñas, por su puesto, que la población y encontrar o calcular estad´ısticos muestrales que pudieran dar explicaciones preliminares de lo que pasa en la data total o poblaci´ on. La idea fundamental es usar éstos estad´ısticos para inferir o estimar los par´ ametros poblacionales, que es lo que en realidad importa. La pericia de los cient´ıficos se encuentra en tratar de construir buenas muestras a partir de poblaciones muy grandes, tales que los estad´ısticos calculados a partir de éstas muestras, sean buenas para estimar los parámetros necesarios. Desafortunadamente, estimar estad´ısticos nunca es 100 % seguro, pero si que podr´ıa ser en alguna medida cercana. Existen varios según los valores que toman los datos. 1. Datos nominales: pueden ser del tipo cualitativos solamente. Los valores para los datos sirven para etiquetar, pero las etiquetas no tienen atributo de orden. Por ejemplo: el tipo de sangre, el grado de estudio, el tipo de raza, el tipo de bacteria en el intestino de una cierta especie de pescado. 2. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. Los valores atribuidos a los datos son etiquetas, pero a diferencia de los anteriores, para éstos si est´ a prescrito un orden en particular. Por ejemplo: las posiciones del torneo de f´ utbol profesional Venezolano, el nivel de censura de una pel´ıcula. 3. Datos intervalos: sólo son cuan titativos. Los valores que toman los datos son numéricos, tienen un orden natural y la diferencia entre los valores que toman los datos son significativas. Por ejemplo: la temperatura, el a˜ no de nacimiento. 4. Datos razón: son siempre cuantitativos. Los valores son num´ ericos, tienen orden, y la tanto la diferencia como la razón entre los valores son significativas. Por ejemplo, el peso de una persona, el volumen.

1.4.

M´ etodos de recolecci´ on de datos

La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de informaci´ on, los

21

1. Introducción a la Estad´ ıstica cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observaci´ on, el diagrama de flujo y el diccionario de datos. Todas estos instrumentos se aplicar´ a en un momento en particular, con la finalidad de buscar informaci´ on que será u ´ til a una investigación en común. En la presente investigación trata con detalle los pasos que se debe seguir en el proceso de recolección de datos, con las técnicas ya antes nombradas. Los analistas utilizan una variedad de métodos a fin de recopilar los datos sobre una situación existente, como entrevistas, cuestionarios, inspección de registros (revisión en el sitio) y observación. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigaci´ on completa.

1.4.1.

La entrevista

Las entrevistas se utilizan para recabar informaci´ on en forma verbal, a trav´ es de preguntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos que proporcionarán datos o serán afectados por la aplicación propuesta. El analista puede entrevistar al personal en forma individual o en grupos algunos analistas prefieren este método a las otras técnicas que se estudiar´ an más adelante. Sin embargo, las entrevistas no siempre son la mejor fuente de datos de aplicaci´ on. Dentro de una organización, la entrevistas es la técnica más significativa y productiva de que dispone el analista para datos. otras es un de informaci´ que serecabar efectúa cara En a cara. Espalabras, un canalla deentrevistas comunicaci´ on intercambio entre el analista y la organiza-on ción; sirve para obtener información acerca de las necesidades y la manera de satisfacerlas, as´ı como concejo y comprensi´ on por parte del usuario para toda idea o método nuevos. Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer una corriente de simpat´ıa con el personal usuario, lo cual es fundamental en transcurso del estudio. Realizar entrevistas toma tiempo; por lo tanto no es posible utilizar este método para recopilar toda la información que se necesite en la investigación; incluso el analista debe verificar los datos recopilados utilizando unos de los otros métodos de recolección de datos. La entrevista se aplican en todos los niveles gerencial y de empleados y dependa de quien pueda proporcionar la mayor parte de la informaci´ on u ´ til para el estudio los analistas que estudian la administración de inventarios pueden entrevistar a los trabajadores del embarque y de recepción, al personal de almacén y a los supervisores de los diferentes turnos, es decir. Aquellas personas que realmente traba jan en el almacén, tambi´ en entrevistar´ an a los gerentes más importante. La habilidad del entrevistador es vital para el éxito en la búsqueda de hecho por medio de la entrevista. Las buenas entrevista depende del conocimiento del analista tanto de la preparaci´ on del objetivo de una entrevista espec´ıfica como de las preguntas por realizar a una persona determinada.

22

1.4. Métodos de recolecci´ on de datos

1.4.2.

La encuesta

Hoy en d´ıa la palabra “encuesta” se usa m´ as frecuentemente para describir un método de obtener información de una muestra de individuos. Esta “muestra” es usualmente sólo una fracci´ on de la población bajo estudio. Por ejemplo, antes de una elecci´ on, una muestra de electores es interrogada para determinar cómo los candidatos y los asuntos son percibidos por el público - un fabricante hace una encuesta al mercado potencial antes de introducir un nuevo producto - una entidad del gobierno comisiona una encuesta para obtener información para evaluar legislación existente o para preparar y proponer nueva legislación. No tan sólo las encuestas tienen una gran variedad de prop´ ositos, sino que tambi´ en pueden conducirse de muchas maneras, incluyendo por teléfono, por correo o en persona. A´ un as´ ı, todas las encuestas tienen algunas caracter´ısticas en común. A diferencia de un censo, donde todos los miembros de la población son estudiados, las encuestas recogen informaci´ on de una porción de la población de inter´ es, dependiendo el tamaño de la muestra en el prop´ osito del estudio. En una encuesta, la muestra no es seleccionada caprichosamente o s´ olo de personas que se ofrecen como voluntarios para participar. La muestra es seleccionada cient´ıficamente de manera que cada persona en la población tenga una oportunidad medible de ser seleccionada. De esta manera los resultados pueden ser proyectados con seguridad de la muestra a la población mayor. La información es recogida usando procedimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos la misma manera. La intención de la encuesta no es describir los individuos particulares quienes, por azar, son parte de la muestra sino obtener un perfil compuesto de la población. El tamaño de muestra requerido en una encuesta depende en parte de la calidad estad´ıstica necesaria para los establecer los hallazgos; esto a su vez, está relacionado en cómo esos hallazgos serán usados. Aún as´ı, no hay una regla simple para el tama˜ no de muestra que pueda ser usada en todas las encuestas. Mucho de esto depende de los recursos profesionales y fiscales disponibles. Los analistas frecuentemente encuentran que una muestra de tamaño moderado es suficiente estad´ıstica y operacionalmente. Por ejemplo, las muy conocidas encuestas nacionales frecuentemente usan cerca de 1,000 personas para obtener información razonable sobre actitudes y opiniones nacionales.

1.4.3.

Cuestionario

Los cuestionarios proporcionan una alternativa muy ´ util para la entrevista; si embargo, existen ciertas caracter´ısticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que la entrevistas, deben dise˜ narse cuidadosamente para una máxima efectividad. Recabaci´ on de datos mediante cuestiona rios. Para los analistas los cuestionarios pueden ser la u ´ nica forma posible de relacionarse con un gran n´ umero de personas para conocer varios aspectos del sistema. Cuando se llevan a cabo largos estudios en varios departamento, se puede distribuir los cuestionarios a todas las personas apropiadas para recabar hechos en relación al sistema. En mayor parte de los casos, el analista no ver´ a a los que responde; no obstante, también esto es una ventaja porque aplican muchas entre-

23

1. Introducción a la Estad´ ıstica vista ayuda a asegurar que el interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas o estereotipadas). También las preguntas estandarizadas pueden proporcionar datos m´ as confiable. Selecci´ on de formas para cuestionarios. El desarrollo y distribución de los cuestionarios; por lo tanto, el tiempo invertido en esto debe utilizarse en una forma inteligente. Tambi´ en es importante el formato y contenido de las preguntas en la recopilaci´ on de hechos significativos. Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas de las preguntas y pueden incluirlas. Con frecuencia se utilizan ambas formas en los estudios de sistemas. Cuestionario Abierto. Al igual que las entrevistas, los cuestionarios pueden ser abiertos y se aplican cuando se quieren conocer los sentimientos, opiniones y experiencias generales; tambi´ en son u´tiles al explorar el problema básico, por ejemplo, un analista que utiliza cuestionarios para estudiar los métodos de verificación de cr´ edito, es un medio.El formato abierto proporciona una amplia oportunid ad para quienes respond an escriba las razones de sus ideas. Algunas personas sin embargo, encuentran m´ as fácil escoger una de un conjunto de respuestas preparadas que pensar por s´ı mismas. Cuestionario Cerrado. El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio de un cuidadoso estilo en la pregunta, el analista puede controlar el marco de referencia. Este formato es el método para obtener información sobre los hechos. Tambi´ en fuerza a los individuos para que tomen una posición y forma su opinión sobre los aspectos importantes.

1.4.4.

La observación

Otra técnica u´til para el analista en su progreso de investigaci´ on, consiste en observar a las personas cuando efectúan su trabajo. Como técnica de investigación, la observación tiene amplia aceptación cient´ ıfica. Los soci´ ologos, sicólogos e ingenieros industriales utilizan extensamente ésta técnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organización. El propósito de la organización es múltiple: permite al analista determinar que se está haciendo, como se está haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo toma, d´ onde se hace y por que se hace. El analista de sistemas puede observar de tres maneras básicas. Primero, puede observar a una persona o actitud sin que el observado se dé cuenta y su interacci´ on por aparte del propio analista. Quiz´ a esta alternativa tenga poca importancia para el an´ alisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias. Segundo, el analista puede observar una operación sin intervenir para nada, pero estando la persona observada enteramente consciente de la observación. Por último, puede observar y a la vez estar en contacto con las personas observas. La interacción puede consistir simplemente en preguntar respecto a una tarea espec´ıfica, pedir una explicación, etc.

24

2. La estad´ıstica descriptiva If we betake ourselves to the statistical method, we do so confessing that we are unable to follow the details of each individual case, and expecting that the effects of widespread causes, though very different in each individual, will produce an average result on the whole nation, from a study of which we may estimate the character and propensities of an imaginary being called the Mean Man. - James Clerk Maxwell . ’Does the Progress of Physical Science tend to give any advantage to the opinion of necessity (or determinism) over that of the continuency of Events and the Freedom of the Will?’ In P. M. Hannan (ed.), The Scientific Letters and Papers of James Clerk Maxwell (1995), Vol. 2, 1862-1873, 818.

La estad´ıstica descriptiva es la disciplina de la estad´ıstica que intenta describir cuantitativamente las caracter´ısticas principales de un conjunto de datos. Una estad´ıstica un poco más completa es la estad´ıstica inferencial. La estad´ıstica descriptiva se distingue de la estad´ıstica inferencial (o estad´ıstica inductiva), en el hecho de que ésta primera tiene como principal objetivo resumir una muestra, en lugar de utilizar todos los datos de la población para aprender y concluir algo acerca de lo que significa o representan los datos de una situación en particular. Otra cosa que las distingue es que en la estad´ıstica descriptiva s´ olo se los datos cuantitativamente y anal´ obtenerpuede conclusiones, pero sómanipulan lo con los datos disponibles. Por otro lado la ıticamente estad´ıstica para inferencial deducir, o como su nombre lo indica, inferir, otras conclusiones que pudieran dar respuestas m´ as allá de los datos que se tienen en la muestra. En general, esto significa que la estad´ıstica descriptiva, a diferencia de la estad´ıstica inferenci al, no se desarrollan sobre la base de la teor´ıa de la probabilidad. El principal sustento de la estad´ısitica inferencial es la teor´ıa de la probabilidad. Si la muestra es representativa de la poblaci´ on, es posible inferir importantes conclusiones sobre la población a partir del análisis de la muestra. La fase de la estad´ıstica que trata con las condiciones ba jo las cuales tales diferencias son válidas es la estad´ıstiva inductiva. Ya que dicha inducci´ on no es del todo exacta, el lenguaje de las probabilidades aparecerá al establecer conclusiones. Sin embargo, aun cuando hagamos un análisis de los datos usando estad´ıstica inferencial para sacar conclusiones principales, las estad´ısticas descriptivas generalmente son una base y tambi´ en se presentan. Por ejemplo, en un reporte que informa sobre un estudio en seres humanos, suele aparecer un cuadro en el que el tamaño total de la muestra, el tamaño de la muestra en subgrupos importantes (por ejemplo, para cada grupo de tratamiento o de exposici´ on), y las caracter´ısticas demogr´ aficas o cl´ınicas como la edad media , el p orcentaje de sujetos de cada sexo, y la proporción de sujetos son relacionadas todas.

25

2. La estad´ıstica descriptiva Estad´ıstica descriptiva proporciona resultados simples sobre la muestra y sobre las observaciones que se han hecho. Estos resultados pueden ser tanto las estad´ısticas cuantitativas, es decir, promedios, o gráficos visuales, para entender más fácilmente la situación. Estos resultados o bien puede formar la base de la descripci´ on inicial de los datos como parte de un análisis estad´ ıstico m´ as extenso, o pueden ser suficientes en s´ı mismas para una investigaci´ on concreta. Por ejemplo, el porcentaje de bateo en beisbol es una estad´ıstica descriptiva que resume el rendimiento de un jugador o un equipo. Este n´ umero es el número de hits realizados dividido por el número de total de veces que se ha presentado ante el pitcher. Por ejemplo, un jugador que tiene average de 0.33, indica que de tres veces que va al bate, conecta un hit. El porcentaje resume o describe varios eventos discretos. Otro ejemplo también es el promedio de notas de un estudiante. Este número único describe el comportamiento general de un estudiante en toda la gama de experiencias de un curso. El uso de la estad´ıstica descripti va tiene una historia extensa y, de hecho, la simple tabulación de las poblaciones y de los datos econ´ omicos fue la primera forma en que el tema de las estad´ısticas apareci´ o. Más recientemente, una colección de técnicas se han formulado bajo el ep´ıgrafe de an´ alisis exploratorio de datos: un ejemplo de esta técnica es el gráfico de caja. Los análisis que provienen de la estad´ıstica pueden ser de situaciones de una variable o de dos o más variables.

El an´ alisis univariante El análisis univariante implica describir la distribución de una sola variable, incluyendo su tendencia central (incluyendo la media, mediana y moda) y de dispersi´ on (incluyendo la gama de percentiles del conjunto de datos, y las mediciones de propagaci´ on de errores, tales como la varianza y la desviación estándar, etc.). La forma de la distribución también puede ser descrita a trav´ es de ´ındices tales como la asimetr´ıa y curtosis. Las caracter´ısticas de distribución de una variable también se pueden representar en forma gr´ afica o tabular, incluyendo histogramas y diagramas de tallo y hojas.

El an´ alisis bivariado Cuando una muestra se compone de m´ as de una variable, la estad´ıstica descriptiva se puede usar para describir la relaci´ on entre los pares de variables. En este caso, las estad´ısticas descriptivas incluyen: las tabulaciones cruzadas y las tablas de contingencia, representaci´ on gráfica mediante diagramas de dispersión, las medidas cuantitativas de la dependencia, y descripciones de distribuciones condicionales. Las medidas cuantitativas de la dependencia incluyen la correlación (como el coeficiente r de Pearson cuando ambas variables son continuas, o ρ-de Spearman si uno o los dos no lo son) y covarianza (que refleja la escala de relación en la que las variables se miden). La estad´ıstica descriptiva es limitada en tanto que s´ olo permite hacer resultados sobre las personas u objetos que se

26

2.1. Distribuciones de frecuencia han medido. Usted no puede utilizar los datos que ha recogido para generalizar a otras personas u objetos (es decir, utilizando datos de una muestra para inferir las propiedades / parámetros de una población). Por ejemplo, si se prueba un medicamento para combatir el cáncer y trabajó en sus pacientes, no se puede afirmar que funcionar´ıa en otros pacientes de cáncer, sin embargo, la estad´ ıstica inferencial si dar´ıa esta oportunidad. Para empezar nuestra discusión de la metodolog´ıa que usa la estad´ıstica descriptiva para resolver problemas, vamos a ir, paso a paso, determinando las cosas que pueden irse haciendo. As´ı, una vez que se tienen los datos que describen una cierta muestra de una cierta situación de la que quiera averiguarse algo, lo primero es reducir los datos para presentarlos en una forma conveniente para trabajar y empezar la discusi´ on.

2.1.

Distribuciones de frecuencia

Una distribución de frecuencias es una tabla usada para describir un conjunto de datos. Una tabla de frecuencias muestra datos particulares o intervalos o rangos de datos llamados clases de datos. En el caso de mostrar intervalos de datos, se define un valor, que consistir´ a en el valor que representa a dicha clase, usualmente es llamado marca de clase. Adem´ as la tabla de frecuencias muestra un n´ umero a continuación del dato o marca de clase, que representa el número de veces que éste valor se repite en la data, a éste n´ umero se le llama frecuencia, o frecuencia de la clase. Ejemplo 2.1 Sup´ ongase que 20 estudiantes de estad´ıstica poseen las siguientes notas a continuaci´ on en una escala de 0 a 100 puntos: 97, 92, 88, 75, 83, 67, 89, 55, 72, 78,

81, 57, 63, 84, 98, 46. Puede construirse tabla de frecuencias para cada91, nota, as´ı 67, en 74, ésta87, tabla tendr´ ıamos unas 100 filasuna aproximadamente. Para resumir espacio pudiera organizarse todo en clases tales como 90-99, 80-89, 70-79 etc. y contando el número de datos pertenecientes a cada intervalo. As´ı obtendr´ ıamos algo como sigue: Intervalo 90-99 80-89 70-79 60-69 50-59 40-49

Marca de Clase 94.5 84.5 74.5 64.5 54.5 44.5

Frecuencia 4 6 4 3 2 1

Cuadro 2.1.: Una t´ıpica tabla de distribución de frecuencias.

Note que la suma de la columnas de frecuencias es igual a 20, el n´ datos existentes.

umero de todos los

27

2. La estad´ıstica descriptiva

2.1.1.

Terminolog´ıa adicional

1. Los datos: el conjunto total de datos de la muestra se denota por x i , de tal manera que el ´ındice i = 1, 2,...,N denota la posición relativa de un dato respecto de los dem´ as. 2. N´ umero total de datos no agrupados: se denota por N . 3. N´ umero total de datos agrupados: se denota por n. 4. L´ımite real inferior de la data: es el menor valor en la data. Lo denotaremos como L i . 5. L´ımite real superior de la data: es el mayor valor en la data. Lo denotaremos como L s . 6. L´ımite inferior de clase: es el menor valor en el intervalo de clase. Lo denotaremos como l i . 7. L´ımite superior de clase: es el mayor valor en el intervalo de clase. Lo denotaremos como l s . 8. Ancho de clase: es la diferencia entre dos l´ımites de clases superiores (o inferiores) consecutivos. Todos las clases deber´ıan tener el mismo ancho, aunque esto no es una regla. 9. Marca de clase: es por lo general el valor medio de los datos de cada intervalo. Pudiera escogerse otro criterio para definir la marca de clase, no tiene mucha importancia, sin embargo, cualquiera sea la escogencia que se haga, lo importante es que éste dato represente todo el intervalo de clase. Lo denotaremos por x M i . xM i =

li + ls . 2

(2.1)

Ejemplo 2.2 Para la tabla de frecuencias anterior de las notas de los ex´ amenes de estad´ıstica, se tiene que: los l´ımites superiores de clase son: 99, 89, 79, 69, 59, y 49; los l´ımites inferiores de clase son: 90, 80, 70, 60, 50, y 40. Las marcas de clase son: 94.5, 84.5, 74.5, 64.5, 54.5, y 44.5. El ancho de cada clase es 10.

2.1.2.

Creando una t abla de fr ecuencias

Para crear tabla de frecuencias es necesario seguir los pasos a continuaci´ on. 1. Lo más importantes es contar o disponer de alguna data que sea de utilidad y con la cual se quisiera estimar algunos valores y/o caracter´ısticas importantes de inter´ es.

28

2.1. Distribuciones de frecuencia 2. Decidir de acuerdo al número de datos y las caracter´ısticas de los mismos las clases ( ) necesarias para optimizar los resultados y agilizar los c´ alculos seguidos.

N

3. Dividir el rango de la data por el n´ ancho de las clases.

umero de clases para obtener un estimado del

Rango del intervalo =

Rango de la data R = , N´ umero de clases

N

recordando que el rango de la data esta dado por Rango de la data := R = Mayor valor

(2.2)

− Menor valor = Ls − Li.

(2.3)

4. Decidir los l´ımites de las clases. 5. Construir la tabla de frecuencia contando el número de datos en cada uno de los intervalos de clase.

El número de tramos en los que se agrupa la informaci´ on es una decisión que debe tomar el analista: la regla es que mientras m´ as tramos se utilicen menos información se pierde, pero puede que menos representativa e informativa sea la tabla. Sin embargo no todo es tan libre de desición. Existen algunas reglas que son reconocidas por todos y en las que estamos de acuerdo para que todos usen una misma metodolog´ıa.

La fórmula de Sturges Una manera de decidir el número total de clases es usar lo que se conoce como la f´ ormula de Sturges. La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla pr´ actica acerca del número de clases que deben considerar al elaborarse un histograma. Este número viene dado por la siguiente expresión:

N = 1 + log 2 N,

(2.4)

donde N es el tamaño de la muestra. Que puede pasarse a logar´ıtmo base 10 de la siguiente forma:

N = 1 + 3 ,322 ∗ log N,

(2.5)

N

donde es el número de clases a escribir y N es el número total de datos de la muestra. As´ı para una data de 100 datos tendremos que hacer una tablña de distribución de frecuencias de := 1 + (3 ,3) log(100) = 7 ,6 7 intervalos de clase.

N

≈

29


La tabla de Ryan Es recomendable que no sean pocos los intervalos ´ o clases debido a que al condensar la pérdida de informaci´ on ser´ıa importante con relaci´ on a los datos srcinales. Por otra parte, el númeron excesivo de clases, si bien produce poca pérdida de la informaci´ on no simplifica el trabajo. Otro criterio para determinar el n´ umero de clases es el propuesto por Ryan en 1982 presentado en la siguiente tabla: N´ umero de datos 16 a8 17 32 a 33 64 a 65a128 129a256 257a512 mayora513

Número de Clases 4 5 6 7 8 9 10

Cuadro 2.2.: Tabla de Ryan para la determinaci´ on del número de intervalos de clase.

Ejemplo 2.3 Construiremos a continuación una tabla de frecuencias con 6 marcas de clases o intervalos de clase para la data siguiente. Los datos se corresponden con los montos

pagados por 28 conductores diferentes en una estaci´ on de gasolina, por el consumo de la misma. Los montos son en Bol´ıvares Fuertes (Bs.F): 7, 4, 18, 4, 9, 8, 8, 7, 6, 2, 9, 5, 9, 12, 4, 14, 15, 7, 10, 2, 3, 11, 4, 4, 9, 12, 5, 3. En este caso se tendr´ a como dato que se quiere hacer una tabla que tenga ni más ni menos 6 intervalos de clase, por tanto, observando la data nos daremos cuenta que el menor monto pagado es 2 mientras que el mayor es 18, por tanto, el rango de la clase será aproximadamente 18 2 = 16 , y por tanto para estimar el ancho de cada clase dividimos el n´ umero calculado anteriormente entre el número de clases dispuesto, as´ı cada clase tendr´ a un ancho de 16 6 = 2,66. Tendremos en definitiva algo como lo que sigue:

−

Clase Intervalo ClaseI 1 -3 ClaseII 4-6 ClaseIII 7-9 ClaseIV 10-12 ClaseV 13-15

ClaseVI

30

16-18

Marca de Clase Frecuencia 2 4 5 8 8 9 11 4 14 2

17

1

2.1. Distribuciones de frecuencia

2.1.3.

Notaci´ on Matem´ atica

En lo que sigue se usará la siguiente simbolog´ıa y las siguientes variables que usaremos para referirnos a objetos o valores que definiremos en adelante, a menos que se indique otra cosa. Representaremos los valores que toma una cierta variable en una cierta data como xi , n representará el número de valores en el conjunto de datos muestrales agrupados, N el n´ umero de valores en el conjunto poblacional o no agrupados, y fi la frecuencia de cada datos o cada marca de clase, también es llamada la frecuencia absoluta. Como siempre usaremos la simbolog´ıa para indicar la suma de todos los valores de una variable o expresi´ on. Usando ésta notaci´ on, y de manera obvia, pudiera escribirse la sentencia de que la suma de todas las frecuencias en la tabla de frecuencias es igual al n´ umero de valores en el conjunto de los datos,



N



fi = f 1 + f2 + ... + fN = N.

(2.6)

i=1

2.1.4.

Frecuencia acumulada

La frecuencia acumulada de una clase de datos es el n´ umero de elementos que existe en esa clase y todos los de las clases previas. En otras palabras, la frecuencia acumulada de una clase es la frecuencia de la clase m´ as todas las frecuencias de las clases anteriores a ésta. Puede ser tanto decreciente como creciente, si se acumulan las frecuencias desde la u ´ ltima clase o la primera clase respectivamente. Ejemplo 2.4 En la data presentada acerca de las notas de los ex´ amenes de estad´ ıstica pudiera construirse la siguiente tabla de frecuencias acumuladas: Clase I II III IV V VI

Intervalo 90-99 80-89 70-79 60-69 50-59 40-49

↑

Marca de Clase Frec. Frec. Acum. Frec. Acum. 94.5 4 4 20 84.5 6 10 16 74.5 4 14 10 64.5 3 17 6 54.5 2 19 3 44.5 1 20 1

↓

N´ otese que la última entrada en la columna de la frecuencia acumulada creciente es justamente N = 20, lo mismo sucede para la frecuencia acumulada decreciente. Ejemplo 2.5 A˜ nadiremos a la tabla de frecuencias para el caso de los consumos de gasolina, dos nuevas columnas para la frecuencia acumulada creciente y decreciente respectivamente. Tendremos en definitiva algo como lo que sigue:

31


Clase Clase I Clase II ClaseIII ClaseIV ClaseV ClaseVI

2.1.5.

Intervalo 1-3 4-6 7-9 10-12 13-15 16-18

Marca de Clase 2 4 5 8 8 9 11 4 14 2 17 1

↑

Frec. Frec. Acum. Frec. Acum. 4 28 12 24 21 16 25 7 27 3 28 1

↓

La frecuencia relativa

La frecuencia relativa de un dato o marca de clase se define como el porcentaje de elementos en esa clase en relación con el total de datos de la muestra. Se denota por fri . Es sencillo calcular la frecuencia relativa como: fri =

fi . N

(2.7)

En vista que el n´ umero fi es siempre menor que N , por razones más que obvias, es entonces inmediato que f ri es un número que puede oscilar entre los valores 0 y 1, es decir, 0 f ri 1. Adicionalmente pudiera definirse la frecuencia relativa porcentual como:

≤ ≤

fri % = f ri

× 100% .

(2.8)

Las frecuencias relativas porcentuales son usadas a menudo para hacer descripciones en términos de proporciones de ocurrencias de ciertas caracter´ısticas de la data. Ejemplo 2.6 Para la tabla anterior tendremos: Clase ClaseI ClaseII ClaseIII ClaseIV ClaseV ClaseVI

Intervalo 1-3 4-6 7-9 10-12 13-15 16-18

↑

Marca de Clase Frec. Frec. Acum. Frec. Relat. 2 4 4 .142 5 8 12 .285 8 9 21 .321 11 4 25 .142 14 2 27 .071 17 1 28 .035

Note que la suma de todas las frecuencias relativas en la columna, suma aproximadamente 1, coincidente con el hecho de que existe una posibilidad de 100% de que pudiera ocurrir “cualquiera” de las cosas que describen la data, si pasa alguna de ellas, por su puesto.

32


2.1.6.

Los histogramas

Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente se˜ nalando las marcas de clase, es decir, la mitad del intervalo en el que est´ an agrupados los datos. Un histograma es un resumen gr´ afico de la variación de un conjunto de datos. La naturaleza gráfica del histograma nos permite ver pautas que son dif´ıciles de observar en ouna numérica. Esta herramienta se utiliza especialmente en la Comprobaci´ n desimple teor´ıastabla y Pruebas de validez. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores contiguos. En los casos en los que los datos son cualitativos (no-numéricos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Sabemos que los valores var´ıan en todo conjunto de datos. Esta variaci´ on sigue cierta pauta. El prop´ osito del análisis de un histograma es, por un lado, identificar y clasificar la pauta de variaci´ on, y por otro desarrollar una explicación razonable y relevante de la pauta. La explicaci´ on debe basarse en los conocimientos generales y en la observaci´ on de las situaciones espec´ıficas y debe ser confirmada mediante un análisis adicional. Las pautas habituales de variación más comunes son la distribución en campana, con dos picos, plana, en peine, sesgada, truncada, con un pico aislado, o con un pico en el extremo. Los histogramas son m´ as frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparaci´ on de los resultados de un proceso.

Construcci´ on de un histograma 1. Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor. 2. Paso 2: Obtener el número de clases, existen varios criterios para determinar el n´ umero de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo est´ en los datos y cu´ antos sean. Un criterio usado frecuentemente es que el n´ umero de clases debe ser aproximadamente a la ra´ız cuadrada del número de datos. Por ejemplo, la ra´ız cuadrada de 30 ( número de art´ıculos) es mayor que cinco, por lo que se seleccionan seis clases. 3. Paso 3: Establecer la longitud de clase: es igual al rango entre el n´ umero de clases. 4. Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos iguales. 5. Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras, las bases de las barras son los intervalos de

33

2. La estad´ıstica descriptiva clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el pol´ıgono de frecuencias. Ejemplo 2.7 A una fabrica de envases de vidrio, un cliente le est´ a exigiendo que la capacidad de cierto tipo de botella sea de 13 ml, con una tolerancia de m´ as menos 1 ml. La f´ abrica establece un programa de mejora de calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente. Al realizar el muestreo se obtienen los siguientes datos de las capacidades de botellas al azar: 11, 12, 13, 12, 13, 14, 14, 15, 11, 12, 13, 12,

14, 15, 11, 12, explicitados 16, 16, 14, y13, 14, 14, 13, 15, 15. En éste caso puede seg uirse los pasos anteriormente entonces:

− Menor valor = 16 − 11 = 5 . √25 = 5 .

Rango = Mayor valor # de clases =

Longitud de la clase = Se tiene entonces: Clase Intervalo ClaseI 11-12 ClaseII 12-13 ClaseIII 13-14 ClaseIV 14-15 ClaseV 15-16

5 5

= 1.

Marca de Clase Frec. 11.5 3 12.5 5 13.5 5 14.5 6 15.5 6

↑

Frec. Acum. Frec. Relat. 3 .12 8 .20 13 .20 19 .24 25 .24

El histograma de frecuencias se muestra a continuación: Ejemplos de otros tipos de representaciones gr´ aficas Hay histogramas donde se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, por ejemplo, sexo con dos clases: mujer, var´ on o grupo sangu´ıneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas expl´ıcitamente (intervalos de clase). Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical). Un pol´ıgono de frecuencias es un gr´ afico de linea que representa la información de la tabla de frecuencias. Justo como los histogramas , el eje vertical representa las frecuencias, que pueden ser tambi´ en las relativas, mientras que el eje horizontal representa la medici´ on de la variable en el conjunto de datos. Para construir el gr´ afico, un punto es dibujado por cada marca de clase, en el caso del histograma es el punto en la parte m´ as alta de la barra y en la mitad de la misma, éste punto represe nta, por su puesto, la frecuencia de la clase. Para terminar se conectan todos los puntos con lineas rectas. Los pol´ıgonos de frecuencias ser´ a de mucha utilidad luego para estimar la curva de predicci´ on y para estimar el tipo de distribuci´ on particular que sigue el fenómeno.

34


Figura 2.1.: As´ı luce un histograma de frecuencias.

Figura 2.2.: Ejemplo de como debe construirse un histograma simple.

35


Figura 2.3.: (a) Ojiva, histograma de frecuencias acumuladas y (b) Histograma de frecuencias para dos datos.

Figura 2.4.: (a) Histograma de datos apilados y (b) Diagrama circular de proporciones.

Figura 2.5.: (a) Pol´ıgono de frecuencias y (b) Histograma 3D.

2.2.

Medidas de Tendencia Central (MTC)

Una Medida de Tendencia Central es un valor usado para representar el “promedio” t´ıpico en el conjunto de los datos. En realidad una medida de tendencia central es cual36

2.2. Medidas de Tendencia Central (MTC) quier medida que estime el centro o medida centarl de un conjunto de datos orenados por magnitud. Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo número. Para tal fin, desde luego, no se usará el valor mas elevado ni el valor mas pequeño como único representante, ya que solo representan los extremos. Mas bien que valores t´ıpicos. Entonces ser´ıa mas adecuado buscar un valor central. Las medidas que describen un valor t´ıpico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a individuos. un promedio es una caracter´ıstica de grupo, no individual. Entre las medidas de tendencia se encuentran las siguientes.

2.2.1.

La Media Aritm´ etica

La medida de tendencia central mas obvia que se puede elegir, es el simple promedio de las observaciones del grupo, es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el número de observaciones que hay en el grupo. La media resume en un valor las caracter´ısticas de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. La suma de todos los valores de el conjunto de datos dividido por el número de valores en la data es lo que se conoce como la media. La media para el espacio muestral es denotada por ¯x mientras que para la población es denotada por la letra griega µ. x ¯=



µ=

n i=1

xi , para los valores de la muestra , n N i=1 xi , para los valores de la población. N

(2.9) (2.10)



Ejemplo 2.8 El promedio o la media de los resultados en un examen de f´ısica cuyas notas han sido: 10, 15, 17, 7, 16, 8, 10, 19, 15, 10, 8; es: x ¯=



n i=1 xi

n

=

135 = 12,27. 11

(2.11)

Ejemplo 2.9 Calcular la media de cada uno de los ejemplos explicitados en las secciones anteriores.

Propiedades de la media aritm´ etica La media aritmética tiene cinco propiedades importantes, las cuales son: 1. La suma algebráica de las desviaciones de un conjunto de datos o n´ umeros respecto de su media aritmética es cero. En notación matemática puede escribirse que: N

N

desvi =

 i=1

(xi

 i=1

x ¯ ) = 0.

(2.12)

− 37

2. La estad´ıstica descriptiva 2. La suma de los cuadrados de las desviacio nes de un conjunto de números x i rrspecto de un cierto número a es m´ınima, si y sólo si a = x ¯. 3. Si n1 n´ umeros tienen media m 1 y n2 n´ umeros tienen media m 2 , y as´ı sucesivamente nk números tienen media m k , entonces la media de todos los números es

···

+ n k mk ¯ = n1 m1 + n2 m2 + n3 m3 + X , n1 + n2 + n3 + + nk

···

(2.13)

es decir, una media ponderada de todas las medias (m´ as adelante verá esto). 4. Si a cada uno de los resultados de un conjunto de datos x i se les suma una cantidad b, produciendo un nuevo conjunto de datos y i , entonces, y i = b + xi

→  y¯ = b + x¯.

(2.14)

As´ı mismo, si cada uno de los resultados de un conjunto de datos x i se les multiplica por una cantidad c, produciendo un nuevo conjunto de datos zi , entonces, zi = cx i

→  z¯ = cx¯.

(2.15)

La propiedad 4 es muy útil para calcular el promedio de un conjunto de datos agrupados por clases, mas adelante se usa esta propiedad para obtener una f´ ormula para este caso. Ejemplo 2.10 Veamos de manera sencilla como las propiedades anteriores son ciertas en general. La primera de las propiedades es se demuestra haciendo que: N

 i=1

N

−

(xi x ¯) =

N

N

N

xi N

N

xi x ¯ N

N

 −  −  −  xi

i=1

x ¯=

i=1

N

i=1

x ¯=N

i=1

i=1

−

1 = Nx ¯ Nx ¯ = 0. (2.16)

i=1

La segunda propiedad es tambi´ en f´ acil de demostrar ya que: N



(xi

i=1

− a)2 = f (xi),

(2.17)

por tanto la primera de las condiciones para m´ aximos y m´ınimos de una función y el teorema fundamental del cálculo, se tiene que d dxi f (xi ) = 0

38

N

  → 2

i=1

(xi

− a) = 0 → xi = a.

(2.18)

2.2. Medidas de Tendencia Central (MTC)

Para la tercera tenemos que si tenemos conjuntos de datos xi est´ an divididos en varias partes de tamaños n1 , n 2 ,..., nk , entonces el total de datos es N = n 1 + n2 + n3 + + nk , por tanto,

···

N

¯ = X

= =

N

xi n1 + n2 + n3 +

· · · + nk (x1,1 + · · · + x1,n ) + (x2,1 + · · · + x2,n ) + · · · + (xk,1 + · · · + xk,n ) 2 ++nx 3 + ·+· · + n2,1 · · n+k x2,n + · · · + xk,1 + xk,2 + · · · + xk,n x1,1 + x1,2 + · · · + x1,nn1 + x 2,2 + n1 + n2 + n3 + · · · + nk n1 + n2 + n3 + · · · + nk n1 + n2 + n3 + · · · + nk n1 x1,1 + x1,2 + · · · + x1,n n 2 x2,1 + x2,2 + · · · + x2,n + +··· N n1 N n2 nk xk,1 + xk,2 + · · · + xk,n +···+ i=1

=

xi = N

  i=1

1

2

k

1

2

k

1

2

k

N

=

nk

···

n1 m1 + n2 m2 + n3 m3 + + n k mk = n1 + n2 + n3 + + nk

···

 

N j=1 nj mj , N k=1 nk

(2.19)

en la penúltima l´ınea se ha multiplicado y dividido cada t´ ermino por n1 , n2 ,....., nk respectivamente y en la última linea se ha definido mi =

 j=1

ni

xi,1 + xi,2 + ni

· · · + xi,n , i

(2.20)

lo cual es la media de cada subconjunto de datos. La cuarta propiedad es tambi´ en sencilla, v´ ease que dado un conjunto de datos x a los cuales se les suma o resta una cierta cantidad a, dando yi := a xi , se tiene que i

±

N

y¯ =

yi = N

N

  i=1

i=1

a

± xi = N

N

a N

 ± i=1

Por último si dado un conjunto de datos cantidad c, dando zi := cx i , se tiene que N

z¯ =

zi = N

N

  i=1

N

i=1

i=1

xi N =a N N

± x¯ = a ± x¯.

(2.21)

xi a los cuales se les multiplica una cierta czi =c N

N

 i=1

zi = z¯. N

(2.22)

Esta propiedades son muy útiles en algunos casos. Veamos algunos ejemplos. Ejemplo 2.11 De los 80 empleados de una empresa, 60 cobran mil 30 bol´ıvares la hora y el resto 15 bol´ıvares la hora. En este caso n1 = 60, n2 = 20, m1 = 30 y m2 = 15, luego la media de todos es n1 m1 + n2 m2 60 30 + 20 15 2100 ¯ X= n1 + n2 = 60 + 20 80 = 26, 25. (2.23)

·

·

39

2. La estad´ıstica descriptiva Ejemplo 2.12 Para hallar el promedio de los siguientes datos de un experimento

x :=

{3 × 10−3; 4 × 10−3; 3,3 × 10−3; 5 × 10−3; 4,2 × 10−3} se puede usar la cuarta propiedad para observar que los datos xi = cz i = {3;4;3 ,3;5;4 ,2} × 10−3 , por tanto 3 + 4 + 3 ,3 + 5 + 4 ,2 × 10−3 = 3,9 × 10−3. x ¯= (2.24) 5 Cuando los datos han sido agrupados por frecuencias la forma de calcular la media es ligeramente distinta ya que hay que considerar las frecuencias de cada uno de los datos, en este caso se tendr´ıa que la media de los datos xi correspondientes a sus frecuencias respectivas fi es N xi fi x ¯= . (2.25) N

 i=1

V´ ease que si tomamos todos los datos como distintos y por tanto sus frecuencias son iguales a 1 todas, entonces la fótmula anterior se reduce a la primera. Si por otro lado, los datos han sido agrupados por clases, entonces, todos los valores que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o al punto medio, del intervalo. Entonces en este caso la propiedad tercera de la media se considera válida si interpretamos a yi como la marca de clase, fi como la correspondiente marca de clase, b como cualquier marca de clase o número dentro del intervalo de clase y yi = x i b, en este caso se tendrá que

−

N

x ¯=b+ i=1

donde c es el ancho de la clase.

2.2.2.

La Mediana

yi fi c, N

(2.26)



La mediana es un valor el cual separa el 50% de los valores mayores de la data del 50 % restante menor. Para calcu lar la mediana, lo más sencillos es localizar todos los datos en orden, y entonces buscar el punto medio de los mismos. Si n es impar, el valor medio ser´ a justamente la mediana; por el contrario si n es par, entonces la mediana será el valor medio de los dos valores centrales. Utilizaremos como notación la siguiente para referirnos a éste valor, x0,5 . Ejemplo 2.13 La mediana para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando as´ı: 7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19

(2.27)

vemos el n = 11, por tanto la mediana es el dato del centro de esta distribuci´ on ordenada, el cual es el dato con el orden 6to, es decir x0,5 = 10.

40

2.2. Medidas de Tendencia Central (MTC) Ejemplo 2.14 Calcular la mediana de cada uno de los ejemplos explicitados en las secciones anteriores. En realidad la mediana corresponde al valor de una medida de posici´ on llamada cuartil 2, Q 2 , que veremos más adelante. Por eso esperaremos hasta entonces para dar una mejor aproximaci´ on a su cálculo y significado verdadero.

2.2.3.

La moda

De todos los valores de la data, la moda resulta ser el valor que aparece repetida el mayor n´ umero de veces en el conjunto, o lo que es lo mismo, el dato con mayor frecuencia. Pudiera pasar que dos o varios datos se repitieran con la misma frecuencia, en este caso, se considera llamar a la distribución con un nombre parti cular en virtud de cuantos valores moda existan, as´ı, si s´ olo un valor es que el tiene mayor frecuencia, entonces, a esta distribuci´ on se le llamará unimodal; si tiene dos modas, entonces, se le llamar´ a bimodal y si tiene más se le llamará polimodal. Ejemplo 2.15 La moda para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando as´ı: 7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19. Vemos el dato con mayor frecuencia es el 10, por tanto la moda es el 10. Ejemplo 2.16 Calcular la moda de cada uno de los ejemplos explicitados en las secciones anteriores. En el los caso de datos agrupados construido curva de frecuencia para(o ajustar datos, la moda ser´ a donde el valorse(ohaya valores) de x una correspondiente al máximo máximos) de la curva, Ese valor se denota por ˆ x. La moda tambi´ en puede deducirse de una distribución de frecuencias o de un histograma de frecuencias a partir de la f´ ormula m = L1 +



∆1 ∆1 + ∆ 2



c,

(2.28)

donde L1 es la frontera inferior de la clase modal (clase que contiene la moda), ∆ 1 es el exceso de la frecuencia modal sobre la clase inferior inmediata, ∆2 es el exceso de frecuencia modal sobre la clase superior inmediata y c es el ancho del intervalo de la clase modal.

2.2.4.

Relaci´ on emp´ırica entre la media, mediana y moda

Para curvas de frecuencias unimodales que sean poco asimétricas tenemos la siguiente relación emp´ırica x ¯ m = 3(¯x x0,5 ), (2.29)

−

−

donde ¯x es la media, m es la moda y x 0,5 es la mediana.

41


2.2.5.

Propiedades de la med ia, medi ana y moda

Propiedades de la media, ampliado 1. La media es la más común de todas las medidas de tendencia central usadas para el análisis de los datos. 2. Todo conjunto de datos de nivel de intervalo y de nivel de raz´ on tiene un valor medio. 3. Al evaluar la media se incluyen todos los valores. 4. Un conjunto de datos s´ olo tiene una media. Esta es un valor único. 5. La media es una medida muy ´ util para comparar dos o más poblaciones. 6. Se interpreta como punto de equilibrio o centro de masas del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor. La media es la única medida de ubicación donde la suma de las desviaciones de cada valor con respecto a la media, siempre ser´ a cero. n

 i=1

(xi

− x¯ )fi = N

n

 i=1

xi f i N

n

− x¯

 i=1

fi =x ¯ N

− x¯ = 0.

(2.30)

7. La media podr´ıa no ser un promedio adecuado para representar datos no regulares. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeños. 8. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor). 9. Minimiza las desviaciones aticas de los datos respecto de cualquier valor prefijan cuadr´ (x −k)2 do, esto es, el valor de i=1 N i es m´ınimo cuando k = x ¯. Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los par´ ametros de dispersión más importantes: la varianza. 10. Si uno pudiera asumir que el pol´ıgono de frecuencia tiene una curva suave que lo representa, digamos f (x), entonces ahora los datos dejan de ser discretos y se convierten en continuos, de este modo se demuestra que



x ¯

f (x)dx =

−∞



+

∞

f (x)dx.

(2.31)

x ¯

11. Si se suma (o se resta ) una constante α a cada una de las observaciones, el promedio aritmético se ver´ a aumentado (o disminuido) en esa constante α, es decir, yi := x i

42

± α −→ y¯ = x¯ ± α.

(2.32)

2.2. Medidas de Tendencia Central (MTC) 12. Si se multiplica (o se divide) cada una de las observaciones por una constante β , el promedio aritmético se ver´ a multiplicado (o dividido) por esa constante β , es decir

− → y¯ = β x¯, −→ y¯ = βx¯ .

yi := βxi xi yi := β

(2.33) (2.34)

13. En general si los datos sufren una trans formación af´ın (cambios de srcen y escala), esto es, si yi = β xi + α entonces ¯y = β x ¯ + α, donde ¯y es la media aritmética de los yi , para i = 1,...,N y α y β n´ umeros reales.

Propiedades de la mediana 1. Es única, sólo existe una mediana para un conjunto de datos. 2. No se ve afectada por valor es muy grandes o muy pequeños. 3. Puede calcularse para una distribu ción de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo. 4. Puede obtenerse para datos de nivel de razón, de intervalo y ordinal (excepto para el nominal). 5. Es menos sensible que la media a oscilacione s de los valores de la variable. Un error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el ´ ultimo n´ umero, deja a la mediana inalterada. 6. No se ve afectada por la disper sión. De hecho, es más representativa que la media aritmética cuando la poblaci´ on es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información sobre los salarios de un pa´ıs o una empresa. Hay unos p ocos salarios muy altos que elevan la media aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo, alguien con el salario mediano sabr´ıa que hay tanta gente que gana más dinero que él, como que gana menos.

Propiedades de la moda 1. Puede determinarse para to dos los niveles de datos: nominal, ordinal, de interv alo y de razón. 2. No se ve afectada por valores muy altos o muy bajos. 3. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.

43

2. La estad´ıstica descriptiva 4. Para muchos conjuntos de datos no hay valor modal porque ning´ más de una vez.

un valor aparece

5. Para algunos conjuntos de datos hay m´ as de una moda (bimodal = que tiene dos modas). 6. La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos partes de la forma p y c p, siendo c la amplitud del intervalo, que verifiquen que: p fi fi−1 = , (2.35) c p fi fi+1

−

− −

−

siendo fi la frecuencia absoluta del intervalo modal y fi−1 y fi+1 las frecuencias absolutas de los intervalos anterior y posterior, respectivamente.

2.2.6.

El promedio ponderado

Es una generalización de la media aritmética. Se denomina media ponderada de un conjunto de números al resultado de multiplicar cada uno de los n´ umeros por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuaci´ on la suma de estos productos, y dividiendo el resultado de esta suma de productos entre la suma de los pesos según la caracter´ ıstica de cada n´ umero inicial. Este “peso” depende de la importancia o significancia de cada uno de los valores. Para una serie de datos, xi = x1 , x2 ,...,x n , a la que corresponden los pesos W = w1 , w2 ,...,w n , la media ponderada se calcula como: x¯W = o: x¯W =

n i=1 n xi w i , i=1 wi



x1 w1 + x2 w2 + x3 w3 + ... + xn wn . w1 + w2 + w3 + ... + wn

(2.36)

(2.37)

Un ejemplo es la obtenci´ on de la media ponderada de las notas de una oposici´ on en la que se asigna distinta importancia (peso) a cada una de las pruebas de que consta el examen. Ejemplo 2.17 Promedio de puntos del grado. Asignamos a los grados las letra con los valores: A = 4, B = 3, C = 2, D = 1, F = 0, y entonces cada valor del grado se cuenta seg´ un el número de los créditos ganados con ese grado. Calcular el grado de un estudiante que ha ganado 12 cr´ editos de las A, 21 cr´ editos de los B , 5 cr´ editos de las C y 3 cr´ editos de D ’s. Ejemplo 2.18 Grado del curso. El nota final en este curso se calcula seg´ un la escala siguiente: La preparaci´ on cuenta con el 15 %, el 20 % por cada examen de tres que hay, y el examen final vale el 25 %. Podemos sacar la cuenta para cada componente del grado final

44


con su porcentaje para calcular el grado final. Calcular la cuenta final para un estudiante que ha anotado 95 en la preparación, tiene notas de los ex´ amenes de 83, 94, y 77, y una nota en el examen final es de 88.

2.2.7.

Otros tipos de medias

Media cuadr´ atica La media cuadrática es igual a la ra´ız cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos: x ¯=

 2

n i=1

a2i

n

=

 2

a21 + a22 + n

· · · + a2n .

(2.38)

Esta media como medida de asociaci´ on tiene aplicaciones tanto en ciencias biológicas como en medicina. A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadr´ atica. Consiste en elevar al cuadrado todas las observaciones (as´ı los signos negativos desaparecen), en obtener despu´ es su media aritmética y en extraer, finalmente, la ra´ız cuadrada de dicha media para volver a la unidad de medida srcinal.

Media geom´ etrica La media geométrica de una cantidad finita de números (digamos n n´ umeros) es la ra´ız n-ésima del producto de todos los números.

  n

x ¯=

n

i=1

xi =

√ x1 · x2 · · · xn . n

(2.39)

Por ejemplo, la media geométrica de 2 y 18 es

√2 · 18 = √36 = 6 . 2

2

(2.40)

Otro ejemplo, la media de 1, 3 y 9 seria

√1 · 3 · 9 = √27 = 3 . 3

3

(2.41)

Sólo es relevante la media geométrica si todos los n´ umeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos) entonces la media geométrica es, o bien negativa o bien inexistente en los números reales. En muchas ocasiones se utiliza su trasformación en el manejo estad´ıstico de variables con distribuci´ on no normal. La media geométrica es relevante cuando varias cantidades son sumadas para producir un total.

45


Media arm´ onica La media armónica, representada por H , de una cantidad finita de n´ umeros es igual al rec´ıproco, o inverso, de la media aritmética de los rec´ıprocos de dichos n´ umeros. As´ı, dados los números a 1 , a2 ,...,a n , la media armónica será igual a: n

H=

n 1 i=1 ai

=

n

( a11 +

· · · + a1 ) .

(2.42)

n



La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho m´ as pequeños que el conjunto. La media armónica no está definida en el caso de la existencia en el conjunto de valores nulos.

Media generalizada La media generalizada es una abstracción de los diversos tipos de media (geométrica, aritmética, arm´ onica, etc). Se define como:

  m

x ¯(m) =

n

1 n

n i=1 n i=1 xi

xm m=0 i



m= 0

,

(2.43)

en donde el parámetro m indica si la media es: aritmética, con m = 1, geométrica, con m = 0, armónica, con m =

−1,

cuadr´ atica, con m = 2. Obs´ ervese que para valores de m

≤ 0 la expresión sólo tiene sentido si todos los

xi

≥ 0.

Ejemplo 2.19 Calcule los valores de las medias anteriormente definidas para todas las situaciones y conjunto de datos anteriores.

2.2.8.

Formas de las dist ribuciones de dato s

Podemos clasificar varias formas de las distribuciones de datos de-acuerdo al lugar que ocupan las medidas de tendencia central más usuales anteriormente definidas.

46


Figura 2.6.: Una distribución simétrica. Ve´ ase la igual proporción de barras con alturas aproximadas a ambos lados de la media.

Sim´ etrica La distribución de datos es aproximadamente de la misma forma a ambos lados de la linea central, en donde se encuentra aproximadamente la media. La media y la mediada (y la moda, si es modalidad) son prácticamente iguales en una distribución simétrica.

Sesgada a la derecha Unos cuantos valores se encuentran la izquierda de la media, pero la mayor´ıa de todos los datos se encuentran muy agrupados y acumulados a la derecha de la misma. Generalmente la mediana es más pequeña que la media. Por lo tanto, en éste caso, la media se encuentra a la derecha de la mediana.

Sesgada a la izquierda Unos cuantos valores se encuentran la derecha de la media, pero la mayor´ıa de todos los datos se encuentran muy agrupados y acumulados a la izquierda de la misma. Generalmente la mediana es más grande que la media. Por lo tanto, en éste caso, la media se encuentra a la izquierda de la mediana.

Uniforme Todos los datos están igualmente representados.

47


Figura 2.7.: Una distribución sesgada a la derecha. Veáse la desigual proporción de barras con alturas mayores a la derecha de la media.

Figura 2.8.: Una distribución sesgada a la izquierda. Veáse la igual proporción de barras con alturas mayores a la izquierda de la media.

48

2.3. Medidas de variación

Figura 2.9.: Una distribución uniforme. Las barras tienen aproximadamente la misma altura a ambos lados de la media.

2.3.

Medidas de variación

Para conseguir una visión completa y comprensiva de los datos hay que complementar las medidas de tendencia central con las de otras propiedades de los mismos. La dispersi´ on o variaci´ on de los datos intenta dar una idea de cu´ an esparcidos se encuentran los datos de una cierta distribución de datos. Por ejemplo, el grado en que los datos se parecen o diferencian entre s´ı. A esta propiedad se la denomina variabilidad o variaci´ on. Entre los indicadores de variación más utilizados están la varianza y la desviación t´ıpica. Las medidas de dispersión, como tambi´ en se les conoce, muestran la variabilidad de una distribuci´ on, indicando por medio de un número o estad´ıstico si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor mayor ser´ a la variabilidad, cuanto menor sea, mas homogéneo ser´ a a la media. As´ı se sabe si to dos los casos son parecidos o var´ıan mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, as´ı que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviaci´ on media) y otra es tomando las desviaciones al cuadrado (Varianza).

49


2.3.1.

Rango

El rango estad´ıstico es la diferencia entre el valor m´ ınimo y el valor m´ aximo en un grupo de números. Para averiguar el rango de un grupo de n´ umeros: ordenamos los números según su tamaño, y luego restamos el valor m´ınimo del valor máximo.

2.3.2.

La Varianza

Es el promedio de las distancias al cuadrado desde los valores en una muestra de n sujetos. Se denota usualmente por s2x s2x = s2x =





x i hasta la media ¯x en

− x¯)2 − 1 , varianza muestral, − µ)2 , varianza poblacional.

i=1 (xi

n i=1 (xi N

(2.44) (2.45)

La varianza es una variable estad´ıstica que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas de n puntuaciones respecto a su media aritmética. Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene como valor m´ınimo 0. Hay que tener en cuenta que la varianza puede verse muy influida por los valores at´ıpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersi´ on más robustas.

Propiedades 2 La varianza es siempre positiva o 0: SX

≥ 0.

Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica. Sea Yi = X i + k, entonces SY2

= =

 



¯ + k)]2 (Yi Y¯ )2 [(Xi + k) (X = = n n ¯ )2 (Xi X 2 = SX n

− −

−



¯ (Xi + k X n

− − k)2 (2.46)

Si a los datos de la distribuci´ on les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante. Si Yi = X i k, entonces SY2

= =

50

 



¯ k)2 (Yi Y¯ )2 (Xi k X = = n n ¯ )2 ] [k2 (Xi X 2 2 = k SX n

−

·

−

· − · ·

·

·

[k (Xi n

− X¯ )]2 (2.47)

2.3. Medidas de variación 2 2 2 Propiedad distributiva: S (X +Y ) = S X + SY .

Si tenemos k grupos con tamaños n1 ,...,n k , y con medias y varianzas conocidas (¯x1 , x ¯2 ,..., x ¯k ) y (S12 , S22 ,...,S k2 ), entonces se puede definir la varianza total como: s2T = donde



2 i ni Si i ni

x ¯T =

2.3.3.

La Desviación Est´ andar

 −  j

+

n j (xj

j nj

i

x ¯ T )2

,

ni x ¯i . i ni

(2.48)

(2.49)

La varianza a veces no se interpreta claramente ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersi´ on, que es la desviación t´ıpica, que se halla como la ra´ız cuadrada positiva de la varianza. La desviación t´ıpica nos informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos.

 

Sx = σx =

n i=1 (xi

− x¯)2 − 1 , Desviación t´ıpica muestral n 2 i=1 (Xi − µ) , Desviaci´ on t´ıpica poblacional n

(2.50)

(2.51) N La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviaci´ on estándar de un grupo repetido de medidas nos da la precisi´ on de éstas. Cuando se va a determinar si un grupo de medidas est´ a de acuerdo con el modelo te´ orico, la desviaci´ on estándar de esas medidas es de vital importancia: si la media de las medidas est´ a demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teor´ıa. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual ser´ıa razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicaci´ on central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio).

Correcci´ on de Sheppard para la varianza El cálculo de la desviación t´ıpica es algo err´ oneo como resultado del agrupamiento de datos en clases (error de agrupamiento). Para correguirlo, se usa la f´ ormula s2correguida = s 2calculada

2

c − 12 .

(2.52)

donde c es la anchura del intervalo de clase. La correcci´ on c2 /12 (que se resta) se llama correcci´ on de Sheppard.

51


2.3.4.

La Desviación Media

Es la otra posibilidad para conocer la variabilidad de los datos en la distribuci´ on de frecuencias sin tener que elevar al cuadrado la diferencia de datos respecto de la media: dM =



i (xi

n

− x¯ ) .

(2.53)

Ejemplo 2.20 Calcule todas la medidas de variabilidad definidas para todas las situaciones

y conjunto de datos anteriores.

2.3.5.

Dispersi´ on absoluta y relativa: coeficiente de variación

La variación o dispersión real, tal como se determina de la desviación t´ıpica u otra medida de dispersión, se llama dispersión absoluta. Sin embargo, una dispersión (o variación) de 10 pulgadas en la medida de 1000 pies es muy diferente de esa misma dispersi´ on al medir una distancia de 20 pies. Una medida de ese efecto la da la dispersi´ on relativa, a saber dispersión relativa :=

dispersión absoluta . promedio

(2.54)

Si la dispersión absoluta es la desviaci´ on estándar σ = s y el promedio es la media ¯ x, entonces la dispersión relativa se llama coeficiente de variación o coeficiente de dispersión o tambi´ en coeficiente de variabilidad de Pearson, en este caso se tendr´ a que coeficiente de variación = p =

σ . x ¯

(2.55)

Una regla los estad´ sticos dice que elpara coeficiente de variabilidad, debido a que ampliamente debe ser un núsada umeropor menor que ı1, puede usarse expresarse en términos de porcentajes. De hecho se establece que si p < 0,20, entonces se dice que la media es representativa d elos datos, lo que quiere decir, que la media es buen estimador ya que el error es considerablemente peque˜ no en comparación con la media. Sin embargo, si p > 0,20, se dice que la media no es representativa, lo que equivale a decir que el error es muy grande en comparación del promedio. En este último caso es necesario descartar a la media o el promedio como estimador global y hacer uso de otros estimadores para sacar conclusiones.

2.3.6.

Covarianza

La covarianza entre dos variables es un estad´ıstico resumen indicador de si las puntuaciones están relacionadas entre s´ı. La formulaci´ on clásica, se simboliza por la letra griega sigma (σxy ) cuando ha sido calculada en la población. Si se obtiene sobre una muestra, se designa por la letra “ sxy ”. La formula suele aparecer expresada como: Sˆxy =

52

n

n

i i n x1 y =

i=1 (Xi

−  i=1

¯ i n X1)(Y

−−

¯

− Y ).

(2.56)

2.3. Medidas de variación Este tipo de estad´ıstico puede utilizarse para medir el grado de relación de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razón (variables cuantitativas). La expresión se resuelve promediando el producto de las puntuaciones diferenciales por su tamaño muestral (n pares de puntuaciones, n 1 en su forma insesgada). Este estad´ıstico, refleja la relación lineal que existe entre dos variables. El resultado numérico fluct´ ua entre los rangos de +infinito a -infinito. Al no tener unos l´ımites establec idos no puede determinarse el grado de relación lineal que existe entre las dos variables, solo es posible ver la tendencia.

−

Propiedades

−∞ ≤ Sxy ≤ +∞. Se tiene que Sxy =

2.3.7.

 

> 0, Correlación directa. Recta de regresión creciente. = 0, No hay correlación. , < 0. Correlación inversa. Recta de regresión decreciente.

(2.57)

Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones t´ıpicas (ra´ız cuadrada de las varianzas). Vxy = V V

r=



Sxy



x y

2 2 Sx Sy

Sxy . Sx Sy

=

(2.58)

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes: 



x2

x−2

i

n

r=

xi y i n

 − − −    − −  −   r=

n

n

x2i

xi yi

(

xi

2

xi )

n

x ¯ y¯



yi2 n

yi

yi2

(

,

(2.59)

.

(2.60)

y −2

yi )2

Propiedades El coeficiente de correlación, r, presenta valores entre -1 y +1. Cuando r es próximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresión.

53

2. La estad´ıstica descriptiva Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables según un modelo lineal y la recta de regresi´ on que se determine tendrá pendiente positiva, será creciente. Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables según un modelo lineal y la recta de regresi´ on que se determine tendrá pendiente negativa: es decreciente.

Figura 2.10.: El coeficiente de correlación de Pearson establece la posibilidad de un ajuste de los puntos en la muestra. En la primera gráfica de arriba no existe relación entre las variables y en la segunda hay relaci´ on pero no puede ser ajustada con una linea recta. En las siguientes la correlaci´ on es positiva y negativa, con pendientes positiva y negativa, respectivamente.

2.4.

Medidas de simetr´ıa

Si x i son los N valores de la variable x, podemos definir la cantidad N (r)

x ¯

54

:=

 i=1

xr N,

(2.61)

2.4. Medidas de simetr´ıa a la cual podemos llamar el r-ésimo momento. El primer momento, con r = 1, e sla media aritmética x¯. De esta manera puede definirse el r-ésimo momento respecto de la media como N (xi x ¯ )r mr := := (x ¯ x ¯ )r . (2.62) N

−



−

i=1

V´ ease que si r = 1, entonces m1 = 0, ya que hemos demostrado que las desviaciones respecto de la media es cero. Mientras que si r = 2, entonces m2 = s2 , es decirl es el segundo momento es la varianza. Para evitar unidades particulares podemos definir momentos adimensionales respecto de la media como: mr mr ar := r = (2.63) r, s m2

√ 

√

donde s = m2 es la desviación estándar, ya que m 1 = 0 y m 2 = s2 , entonces se tiene que a1 = 0 y a2 = 1. Las correciones de Sheppard para los momentos son como siguen: 2

c − 12 ,

(2.64)

− 2 m2 + 240 ,

(2.65)

m2 (corregido) = m 2 m4 (corregido) = m 4

c2

7c4

los momentos m 1 y m3 no requieren ninguna corrección.

2.4.1.

Coeficientes de asimetr´ıa y curtosis

Asimetr´ıa Hemos comentado que el concepto de asimetr´ıa se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central. Se conoce como sesgo el grado de asimetr´ıa de una distribución , es decir, cu´ anto se aparta de la simetr´ıa. Si la curva de frecuencias d euna distribución tiene a la derecha una cola más larga que a la izquierda, se dice que es sesgada a la derecha, o de sesgo positivo, mientras que en el caso contrario sesgada a la izquierda o de sesgo negativo. Para distribuciones sesgadas, la media tiende a estar del mismo lado de la moda que la cola larga. Luego una medida de la asimetr´ıa viene dada por la diferencia: media-moda, que puede hacerse adimensional dividiéndola por la medida de dispersión, tal como la desviaci´ on estándar, lo que lleva a la definición

−

−

media moda x ¯ m = . (2.66) desviacion σ Para evitar el uso de la moda podemos recurrir a la f´ ormula emp´ırica anteriormente estudiada para obtener Sesgo =

−

−

Sesgo = 3(media mediana) = 3(¯ x x0,5 ) . desviacion σ

(2.67)

55

2. La estad´ıstica descriptiva Para medir el nivel de asimetr´ıa se utiliza mejor el llamado Coeficiente de Asimetr´ıa de Fisher, que viene definido:  i (xi

g=





Los resultados pueden ser los siguientes:

−x¯)3

n

i (xi

−x¯)2

n



3/2

.

(2.68)

g = 0 (distribución simétrica; existe la misma concentraci´ on de valores a la derecha y a la izquierda de la media). g > 0 (distribución asimétrica positiva; existe mayor concentraci´ on de valores a la izquierda de la media que a su derecha). g < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la derecha de la media que a su izquierda).

Figura 2.11.: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coeficiente de Fisher.

Curtosis El Coeficiente de Curtosis analiza el grado de concentraci´ on que presentan los valores alrededor de la zona central de la distribución. Esto se traduce en cu´ an puntiaguda es la

56

2.5. Teorema que envuelven cuestiones sobre la Desviación Estándar distribuci´ on, en general por referencia a la normal. Se definen 3 tipos de distribuciones según su grado de curtosis: 1. Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribuci´ on normal). 2. Distribución leptocúrtica : presenta un elevado grado de concentraci´ on alrededor de los valores centrales de la variable. 3. Distribución platicúrtica: presenta un reducido grado de concentraci´ on alrededor de los valores centrales de la variable. El coeficiente de curtosis puede ser calculado usando el cuarto momento de la media en forma adimensional, el cual está dado por coeficiente de momento de curtosis = a 4 =

m4 m4 = 2. σ4 m2

(2.69)

Para una distrubición normal el coeficiente anterior es 3. De all´ı que es usual encontrarse que el Coeficiente de Curtosis viene definido por la siguiente f´ ormula: 

i (xi

k=





Los resultados pueden ser los siguientes:

−x¯)4

n

i (xi

−x¯)2

n

− 2

3

(2.70)

k = 0 (distribución mesocúrtica). k > 0 (distribución leptocúrtica ). k < 0 (distribución platicúrtica). Ejemplo 2.21 Calcule los valores de los coeficientes de simetr´ıa de Fisher y de Curtosis para todas las situaciones y conjunto de datos anteriores. Identifique los tipos de gr´ aficas que sean.

2.5.

Teorema que envuelven cuestiones sobre la Desviación Est´ andar

La desviación estándar de una data es una cantidad importante debido a que limita el número de valores que pueden ser encontrados en alguna determinada región de la distribuci´ on respecto del promedio.

57


Figura 2.12.: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coeficiente de curtosis.

2.5.1.

La regla emp´ırica

Aplica sólo cuando la distribución de datos es del tipo campana, y establece que: Aproximadamente el 68 % de los datos se encuentran a una desviación estándar de la media, es decir en el intervalo [¯x σ, x ¯ + σ],

−

aproximadamente el 95 % de los datos se encuentran a dos desviación estándar de la media, es decir en el intervalo [¯x 2σ, x ¯ + 2σ],

−

aproximadamente el 99 % de los datos se encuentran a tres desviación estándar de la media, es decir en el intervalo [¯x 3σ, x ¯ + 3σ].

−

2.5.2.

Teorema de Chebychev

Aplica a cualquier tipo de data. Establece que la porci´ on de valores que deben estar a k-desviaciones de la media está como m´ınimo a 1 k12 .

−

Nota: el teorema de Chebychev establece sólo los l´ımites inferiores para en los cuales se encuentra una determinada cantidad de datos, mientras que la regla emp´ırica si que da

58

2.6. Medidas de Posición buenas aproximaciones. Ejemplo 2.22 Haga uso de los teoremas anteriores sobre la desviaci´ on estándar para hacer un análisis de las distribuciones de las situaciones y conjunto de datos anteriores.

2.6.

Medidas de Posición

Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. La descripción de un conjunto de datos, incluye como un elemento de importancia la ubicación de éstos dentro de un contexto de valores posible. Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribución de frecuencias mediante algunos valores numéricos, eligiendo como resumen de los datos un valor alrededor del cual se encuentran distribuidos los valores de la variable. Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que sean verdaderamente representativas de la variable a la que resumen. Toda s´ıntesis de una distribuci´ on se considerara como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo u ´ nica para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación se describen las medidas de posición más comunes utilizadas en estad´ıstica, como lo son: Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tercer cuartil. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).

2.6.1.

Cuartiles

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q 1 , Q 2 , Q 3 . El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25 %) de todos los valor es de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas part es (75 %) de los datos. Como los cuartiles adquieren su mayor importancia cuando contamos un n´ umero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos

59

2. La estad´ıstica descriptiva en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: Qk = L k +

k

 − N 4

Fk

fk

c,

para k = 1, 2, 3

(2.71)

donde: Lk = L´ımite real inferior de la clase del cuartil k, N = N´ umero de datos, Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil

k,

fk = Frecuencia de la clase del cuartil k , c = Longitud del intervalo de la clase del cuartil

2.6.2.

k.

Deciles

Los deciles son ciertos n´ umeros que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1 , D2 ,..., D9 , que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados. Para datos agrupados los deciles se calculan mediante la fórmula. Dk = L k +

k

 − N 10

Fk

fk

c,

para k = 1, 2,..., 9

(2.72)

donde: Lk = L´ımite real inferior de la clase del decil k, N = N´ umero de datos, Fk = Frecuencia acumulada de la clase que antecede a la clase del decil fk = Frecuencia de la clase del decil k , c = Longitud del intervalo de la clase del decil k .

60

k,

2.6. Medidas de Posición

2.6.3.

Centiles o percentiles

Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden caracter´ısticas tales como peso, estatura, etc. Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles ( P1 , P 2 ,..., P 99 ), le´ıdos primer percentil,..., percentil 99. Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula: Pk = L k +

k

 − N 100

Fk

fk

c,

para k = 1, 2,..., 99

(2.73)

donde: Lk = L´ımite real inferior de la clase del decil k , N = N´ umero de datos, Fk = Frecuencia acumulada de la clase que antecede a la clase del decil

k,

fk = Frecuencia de la clase del decil k, c = Longitud del intervalo de la clase del decil k. Ejemplo 2.23 Calcule los valores de los tres cuartiles, los diez deciles y algunos de los centiles para todas las situaciones y conjunto de datos anteriores. Ejemplo 2.24 La tabla siguiente muestra una distribuci´ on de frecuencias de 400 válvulas de radio probadas en la empresa L&M. Vamos a hacer un estuido completo descriptivo de la misma.

×

Vida media (horas 100) 3-3.99 4-4.99 5-5.99 6-6.99 7-7.99 8-8.99 9-9.99 10-10.99 11-11.99

Número de tubos 14 46 58 76 68 62 48 22 6

V´ ease que aqu´ı se presenta la tabla de los datos ya agrupados en clases, de hecho se han dispuesto nueve clases. Esto est´ a aproximadamente de acuerdo con la regla de Sturges dado que = 1 + 3 ,3log(400) = 9 ,58. Los autores de la tabla han elegido un intervalo de

N

61


clase menos, sin embargo, la tabla anterior est´ a bastante bien construida. Para resolver el problema de calcular todos los estad´ ısticos para esta situaci´ on se tiene que podemos ampliar la tabla anterior como sigue: li 3 4 5 6 7 8 9

ls 3.99 4.99 5.99 6.99 7.99 8.99 9.99

xM 3.49 4.49 5.49 6.49 7.49 8.49 9.49

10 11

1 0.99 1 1.99

1 0.49 1 1.49

fi 14 46 58 76 68 62 48

fr 0.035 0.115 0.145 0.19 0.17 0.155 0.12

22 0.055 6 0.015 400 1

fr Fa xi f i x) x|fi x)2 fi x)3 fi x)4 fi % (xi − ¯ |xi − ¯ (xi − ¯ (xi − ¯ (xi − ¯ 3.5 14 48,93 -3.65 51.17 187.02 -683.58 2498.48 11.5 60 206.77 -2.65 122.13 324.25 -860.89 2285.68 14.5 118 3 18.71 -1.65 95.99 158.86 -262.91 435.13 19 194 493.62 -0.65 49.78 32.60 -21.35 13.98 17 262 509.66 0.34 23.46 8.09 2.79 0.96 15.5 324 5 26.69 1.34 83.39 112.15 150.85 202.89 12 372 4 55.76 2.34 112.56 263.95 618.97 1451.48 5.5 1.5 100

394 400

2 30.89 68.97 2860

3.34 4.34

73.59 26.07 638.14

246.15 113.27 1446.39

823.40 492.17 259.43

2754.27 2138.50 11781.41

A partir de la tabla anterior podemos ver que la media est´ a dada por x¯ =



xi fi 2860 = = 7,15. N 400

(2.74)

Para el cálculo de la mediana, veamos que basta con calcular el cuartil 2, en este caso se tendr´ a que N/2 = 200 , por lo que la mediana se encuentra en la clase (7;7.99), el l´ımite inferior de esta clase es 7, la frecuencia acumulada de la clase que antecede a ésta es 194, mientras que la frecuencia absoluta de la clase que lo contiene es 68, el ancho de la clase es 1.99, por tanto, 200 194 x0,5 = Q 2 = 7 + 1,99 = 7 ,17. (2.75) 68 La moda es cláramente m = 7,49, aunque usando la corrección dada para la moda dada en la fórmula ( 2.28), se tiene que Delta 1 = 68 62 = 6 , Delta 2 = 76 68 = 8 , luego

−

−

−

∆1

8

m = L 1 + ∆1 + ∆ 2 c = 7,49 + 14 1,99 = 8 ,62. (2.76) Por otro lado viendo ahora las medidas de dispersi´ on tendremos que el rango es 7.99, mientras que la desviación media dará



| − |  −

dM :=

La varianza dará



xi

x ¯ fi

N

=

638,14 = 1,59. 400

(2.77)

x ¯ )2 fi 1446,39 = = 3,61, (2.78) N 400 y por tanto la desviación estándar será de σ = (s2 ) = 1,90. N´ otese que ambas desviaciones dan como resultado un valor cercano. El coeficiente de dispersi´ on de Pearso o de x = 0,26, lo que es obviamente mayor variabilidad para esta situaci´ on es entonces p := σ/¯ que 0.20 y por tanto la media no es muy representativa. Por ´ ultimo las medidas de simetr´ ıa dar´ an como resultado s2 :=

Coef. Fisher

(xi

g :=



(xi x ¯)3 fi N

−

3/2 (xi x ¯)2 fi N

  −

62

=

0,64 6,87

= 0,09,

2.7. Problemas de final de cap´ıtulo

Coef. curtosis

k :=

 

(xi x ¯)4 fi N

−

(xi x ¯)2 fi N

−

− 2

3=

29,45 13,07

− 3 = −0,74.

Como conclusi´ on general puede verse que la media de los tubos es de 715 horas, por lo que se espera que la mayor´ıa de los tubos duren este tiempo. Adem´ as se conoce que 200 tubos tienen tiempos menores o iguales a 717 horas, mientras que otros 200 tubos tienen tiempos mayores a 717 horas. Tambi´ en 68 tubos, lo cual representa el 17 % de todos los tubos tienen un tiempo de 749 horas. El error cometido al tratar de estimar la duraci´ on de los tubos es 190 horas, lo cual representa mucho en virtud del coeficiente de variabilidad p = 0,26, que es mayor que 0.20 y por tanto la media deja de ser representativa de los datos. Esto quiere decir que no pueden establecerse conclusiones fiables a partir de la media, lo que obliga a estimar con otras medidas como la mediana y algunos percentiles. La distribución de los datos es además sim´ etrica pero ligeramente platic´ urtica, lo cual está de acuerdo con el hecho de que el error sea un poco grande para esta media.

2.7.

Problemas de final de cap´ıtulo

A continuación una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible.



1. Probar que N j=1 (axj + byj + czj ) = a y c son constantes.



N j=1

xj + b



N j=1 yj

+c



N j=1 zj ,

donde a, b

2. Las medidas del diámetro de un cilindro en un laboratorio fueron medidas por un cient´ıfico dando como resultado 15cm, 16cm, 16.5cm, 40cm. Calcule la media y diga si ese promedio es t´ıpico o representativo de dichas medidas. 3. Probar que la suma de las desviaciones de x1 , x2 ,...,xN respecto de la media ¯x es cero. 4. Tome los primeros 100 decimales del número irracional π y calcule la media, mediana y moda, haciendo para tal fin una tabla de distribución de frecuencias o otra agrupada por clases. 5. Pruebe usando argumentos geométricos la ecuación para la moda ( 2.28). Use esta para encontrar la moda para los datos del problema anterior. 6. Use la regla emp´ırica expresada en (2.29) para obtener el valor de la moda en el problema 2. Compare con el valor obtenido en el problema anterior. 7. Un avión vuela d1 , d2 y d3 millas a velocidades v1 , v2 y v3 millas/horas respectivamente. Probar que su velocidad media es V , dada por 2 3 d1 + dV2 + d3 = dv1 + d v2 + dv3 , 1

(2.79)

63

2. La estad´ıstica descriptiva es una media armónica ponderada. 8. Hallar los tres cuartiles Q1 , Q2 y Q3 para el problema de los decimales de π . 9. Hallar el segundo decil , el cuarto decil, el percentil noventa y el percentil 68 para los datos de los decimales de π. 10. Dado un conkunto de datos cuyos cuartiles son conocidos, pudiera estable cerse otro coeficiente de variación sabiendo que dado los cuartiles Q1 y Q3 determinan que:

−

1 2 (Q1 + Q3 ) es una medida de tendencia cent ral o promedio, mientras que 1 2 (Q3 Q1 ) es el rango intercuartil, es una medid a de dispersión, entonces un coeficiente de variaci´ on pudiera estar dado por

VQ :=

1 2 (Q3 1 2 (Q3

−

−

Q1 ) (Q3 Q1 ) = , (Q3 + Q1 ) + Q1 )

(2.80)

a este coeficiente pudieramos llamarlo el coeficiente de variación cuartil. Use los datos del problema de los decimales de π para hallar el coeficiente de variación de Pearson (el estándar) y compare con el conseguido con la fórmula anterior. 11. Considere ahora los prim eros 100 decimales del número irracional e, el usado como la base del logaritmo neperiano , para calcular el porcentaje de datos entre ¯x σ, x ¯ 2σ yx ¯ 3σ y compare con la regla emp´ırica para la desviación estándar.

±

±

±

12. Use los datos de los problemas de los decimales de π y de los decimales de e para hallar la desviación corregida de Sheppard y comparar con los nuevos coeficientes de variabilidad. 13. Una compañ´ıa de farmacos en La Coru˜ na, España, está probando un nuevo medicamento experimental para los espasmos musculares, al cual se le ha dado el nombre de ESPASMIN. Se les suministra dicho medicamento a un grupo de pacientes de control durante 5 d´ıas, todos ellos padecen de espasmos musculares (todos los d´ıas tienen los musculos contraidos). Se realiza un estudio sobre el n´ umero de d´ıas que un paciente sufre mejor´ıa con el anterior medicamento obteniendo la tabla: Datos (xi ) (d´ıas) 0 1 2 3 4 5

Frecuencias 100 250 300 500 450 2000

(a) Realizando el gráfico adecuado y hallando los promedios (Media aritmética, Media armónica, Media geométrica, Moda, y Mediana), indicar cu´ al ser´ıa el que mejor

64

2.7. Problemas de final de cap´ıtulo representar´ıa los datos, (Contesta razonadamente y con el mayor detalle posible). (b) Calcula tambi´ en el porcentaje de pacientes que sienten mejor´ıa con el medicamento en todos los d´ıas del tratamiento. (c) ¿Por qué no calculamos el coeficiente de variación para ver la representatividad de la media? (d) ¿Habr´ıa que hallarlo?. (e) Calcula el D3 , Q 3 , P65 . ¿Qué significados tienen? A aquellos pacientes que sienten mejor´ıa todos los d´ıas del tratamiento se les realiza un estudio sobre el tiempo de reacción del medicamento (en minutos), encontrándose recogido los datos en la siguiente tabla: Tiempo de reacción 0-10 10-20 20-30 30-40 40-50

Número de pacientes 300 500 400 500 300

Se pide: (a) Escribir las fórmulas de las diferentes medias e indicar cuál de las tres te parece más adecuada para aplicar en este ejercicio (Razonadamente). (b) A to dos los pacientes que tardan en reaccionar más de 35’ se le aplica el medicamento complementario MUSCULING para acelerar los efectos de ESPASMIN. Hallar el número de pacientes a los que se le aplica este segundo medicamento. (c) Estudiar la representatividad del tiempo medio de reacción. ¿Es representativo? ¿Por qu´ e? (d) El Gobierno est´ a pensando en introducir un medicamento con las caracter´ısticas de ESPASMIN. Existen en elde mercado con este dos25productos más. con El tiempo medio de de cada uno ellos es junto respectivamente y 30 minutos, una varianza dereacci´ 200 on y 300 minutos 2 . Explica detalladamente que criterio de selecci´ on estad´ıstico podr´ ıa aplicar el Gobierno. Según el criterio anterior que medicamento ser´ıa el que pasar´ ıa a engrosar la lista de medicamentos de la Seguridad Social. 14. Se ha realizado una encu esta a 30 personas en la que se les pregunta el número de personas que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. (a) Calcule la distribuci´ on de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) ¿Qu´ e proporción de hogares está compuesta por tres o menos personas? ¿Qué proporción de individuos vive en hogares con tres o menos miembros? (c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera. (d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribuci´ on de frecuencias y represente el histograma correspondiente. 15. Tenemos la siguiente información sobre el gasto semanal en ocio de un grupo de estudiantes universitarios.

65

2. La estad´ıstica descriptiva Nivel de gastos 0-5 5-10 10-15 15-20 20-25 25-30

# de Jóvenes 4 11 16 22 8 6

(a) Calcule la distribución de frecuencias de la variable y las densidades de frecuencias. (b) Dibuje el histograma de frecuencias. (c) Dibuje el pol´ıgono de frecuencias acumuladas. 16. En un estudio sob re consumo de gasolina en una gran ciudad se elig ió una muestra de 100 veh´ıculos y se observ´ o el número de litros que consum´ıan en un d´ıa, obteniéndose la siguiente distribución de frecuencias. # de Litros 1-7 7-10 10-12 12-14 14-18 18-25

# de Automóviles 4 8 35 30 20 3

(a) Calcule la distribución de frecuencias, obteniendo, además, la amplitud de cada intervalo as´ıgr´ como sus respectivas marcas clase y lasmediante densidades frecuencia. (b) Represente aficamente la distribuci´ on dede frecuencias un de histograma. 17. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el número de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12. (a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) ¿Qu´ e proporci´ on de sucursales tiene más de 15 empleados? (c) Dibuje el diagrama de barras y el diagrama en escalera correspondientes. (d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribuci´ on de frecuencias y represente su histograma y su pol´ıgono de frecuencias acumuladas. (e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable, calcule las densidades de frecuencia de cada intervalo y represente el histograma correspondiente. 18. La siguiente distribución expresa el número de coches vendidos durante una semana por cada uno de los 50 concesionarios que una determinada firma tiene en Espa˜ na:

66

2.7. Problemas de final de cap´ıtulo # de aut os vendidos 1 3 4 6 10

# de Con cesionarios 5 12 20 8 5

Se pide: (a) Media aritmética, mediana y moda. (b) Desviación t´ıpica, coeficiente de correlación, coeficiente de variación de Pearson. (c) Coeficientes de asimetr´ıa de Fisher y de Curtosis, compruebe con la forma del pol´ıgono de frecuencias. Para todo haga siempre un análisis de los datos y los estimadores calculados. 19. Sea la distribución referida a beneficios anuales de 38 empresas madrile˜ nas: Beneficio (Miles de Euros) 230-280 280-330 330-580 580-630 630-780

# de Em presas 5 7 14 9 3

Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrile˜ nas. (b) ¿Cuál es el beneficio mayor de la mitad de las empresas m´ as modestas? (c) Determinar el beneficio más frecuente. (d) Estudiar la dispersión de esta distribución a partir del recorrido intercuart´ılico, desviaci´ on t´ıpica y coeficiente de variación de Pearson. (e) Estudiar la forma de esta distribución. 20. La distribución del importe de las facturas por reparación de carrocer´ıa de una muestra de 80 veh´ıculos en un taller, viene dada por la tabla siguiente: Importe (Euros) 0-60 60-80 80-120 120-240

# de Veh´ıculos 10 20 40 10

Se pide: (a) Calcular el importe medio. Estudiar la representatividad de esta media. (b) Calcular el importe mediano y el importe m´ as frecuente. (c) ¿Qu´ e interpretaci´ on tienen en este caso los deciles? Calcular el tercer decil. (d) ¿Cuál es el importe máximo pagado por las 60 reparaciones más baratas? (e) Estudiar la asimetr´ıa a partir del coeficiente de asimetr´ıa de Fisher. (f ) Estudiar la curtosis.

67

2. La estad´ıstica descriptiva 21. Una empresa ten´ıa a finales de 2003 mil seiscientos cincuenta accionistas distribuidos de la siguiente forma: # de acciones 0-20 20-60 60-100 100-500 500-1000

# de accionistas 1030 380 180 50 10

Se pide: (a) Hallar el número medio de acciones por accionista y su desviaci´ on t´ıpica. (b) Hallar la mediana. (c) Decida, con base estad´ıstica, el grado de concentración de las acciones. (d) ¿Qué porcentaje del total de acciones poseen los accionistas mayoritarios? (e) ¿Qué porcentaje de los accionistas minoritari os posee el 20 % del total de acciones? 22. Suponga que usted es el estad´ıstico oficial de l´ıneas aéreas KLM y que el presidente del consejo de administración le ha pedido que recoja y organice datos relativos a las operaciones de vuelo. Su inter´ es principal a partir de los valores diarios se centra en la variable de número de pasajeros. Ha obtenido estos datos de los diarios de vuelo de los últimos 50 d´ıas y ha reflejado esta información: 68, 71, 77, 83, 79, 72, 74, 57, 67, 69, 50, 60, 70, 66, 76, 70, 84, 59, 75, 94, 65, 72, 85, 79, 71, 83, 84, 74, 82, 97, 77, 73, 78, 93, 95, 78, 81, 79, 90, 83, 80, 84, 91, 101, 86, 93, 92, 102, 80, 69. Ustedgr´ debe analizar la las situaci´ on completa. Calcule los estad´ısiticos descriptivos, haga aficos, calcule medidas de posición quetodos crea convenientes e interesantes. De una conclusión general de la situación. 23. Mr. Bissey, el vicepresidente del Bank One de Indianápolis, lleva tambi´ en un registro de las cuentas de ahorro personal. Los saldos de las 40 nuevas cuentas que se abrieron el u ´ ltimo mes fueron: 179.8, 1200, 293, 602.02, 1482, 579, 312.52, 100, 695.15, 287, 1175.00, 952.51, 1112.52, 783.00, 1212.43, 510.52, 1394.05, 1390.00, 783, 1101, 666.66, 780, 793.1, 501.01, 1555.10, 352, 112.17, 470.53, 415.00, 1009.1, 712.1, 1150, 890, 937.01, 711.11, 1422.03, 1595.1, 217, 1202, 1273.01. Haga el mismo análisis que para el problema anterior.

68

3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´ on One of the main purposes of scientific inference is to justify beliefs which we entertain already; but as a rule they are justified with a difference. Our pre-scientific general beliefs are hardly ever without exceptions; in science, a law with exceptions can only be tolerated as a makeshift. Scientific laws, when we have reason to think them accurate, are different in form from the common-sense rules which have exceptions: they are always, at least in physics, either differential equations, or statistical averages. It might be thought that a statistical average is not very different from a rule with exceptions, but this would be a mistake. Statistics, ideally, are accurate laws about large groups; they differ from other laws only in being about groups, not about individuals. Statistical laws are inferred by induction from particular statistics, just as other laws are inferred from particular single occurrences. - Bertrand Russell . The Analysis of Matter (1927), 191.

3.1.

Correlaci´ on y regresión

ısicasecomo en otras ´ una es importante a veces, tener una on entre muchos datos deEn los f´ que estudian paraareas situación dada. Por ejemplo, enrelaci´ un caso sencillo, digamos que alguien está interesado un peque˜ no problema para estudiar una cierta caracter´ıstica en unos moluscos muy raros con caparazón. Para dicho estudio digamos que el investigador, como primer paso, toma datos de los pesos y las dimensiones del caparaz´ on de dichos moluscos. Como usted podr´ a inferir, es muy posible, que para la poblaci´ on de estudio, una dimensión grande en la muestra de los caparazones pudiera corresponder a caracoles o moluscos más pesados. As´ı, uno estar´ıa tentado a decir que el tamaño del caparazón est´ a relacionado con el peso del molusco. Esto, por su puesto, es una suposici´ on ya que podr´ıa haber resultados para los cuales esto no sea cierto. As´ı que desde luego, como siempre todo debe tomarse supuesto, en el sentido estricto estad´ıstico. Como veremos más adelante, algunas veces es posible emparentar, o en otras palabras más técnicas, relacionar ambas caracter´ısticas de alguna manera funcional, o mejor dicho, a trav´ es de una funci´ on. Si éste fuera el caso entonces uno pudiera inferir, a partir de la función que relaciona dichas variables, una descripci´ on de la población de estudio y/o catalogar especies en términos de sus caracter´ısticas. Hay que advertir, que pudiéramos tener tambi´ en una relaci´ on entre ambas variables o caracter´ısticas que no sea funcional, es posible, sin embargo, no nos interesaremos por ese tipo de relaciones. Estamos interesado

69

3. M´ etodos cuantitativos de an´ alisis predictivo, regresión en las relaciones que se pueden hacer cuándo una o más variables están emparentadas a trav´ es de alguna(s) funci´ on(es) matemáticas. El presente cap´ıtulo está dedicado a estas cuestiones. Esto será, como veremos útil para resolver muchos problemas.

3.2.

Distribuciones bidimensionales

Cuando sobre una población estudiamos simultáneamente los valores de dos variables estad´ısticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional. Ejemplo 3.1 Las notas de 10 alumnos en Matem´ aticas y en F´ısica vienen dadas en la siguiente tabla: F´ ısica 4 10 10 12 12 14 14 16 18 16 Matem´ aticas 4 4 10 12 10 14 10 16 14 20

Los pares de valores (4,4),(10,4),(10,10),...;(18,14),(16,20), forman la distribuci´ on bidimensional.

3.3.

La idea de la correlación

Es frecuente que estudiemos sobre una misma poblaci´ on los valores de dos variables estad´ısticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas. En elmejor ejemplo parece que hay cierta tendencia a que cuanto mejor es la nota en F´ısica, es anterior la de Matem´ atica. La primera forma de describir una distribución bidimensional (y por tanto, saber si lo es) es representar los pares de valores en el plano cartesiano. El gr´ afico obtenido recibe el nombre de nube de puntos o diagrama de dispersi´ on. Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aqu´ı nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as´ı ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión. Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más d´ ebil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta. En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube. Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.

70

3.3. La idea de la corre lación

Figura 3.1.: Ejemplo de de un diagrama de dispersi´ on o nube de puntos.

Figura 3.2.: Regresión lineal: Los puntos tienden a describirse a partir de una recta que los representa aproximadamente a todos.

Ejemplo 3.2 Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gr´ afica se describen el número de errores que corresponden a los intentos realizados. Observa que hay una correlaci´ on muy fuerte (los puntos están casi alineados) y negativa (la recta es decreciente). Ejemplo 3.3 A 12 alumnos de un centro se les pregunt´ o a qu´ e distancia estaba su residencia de la Universidad, con fin de estudiar si esta variable estab a relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla: Distancia (en Km) Nota media

0.05 0.1 0.12 0.4 0.5 0.7 1 1.2 2.1 2.5 3 3 8.4 4 5.7 9.1 6.3 6.7 4.3 5.4 7.8 4.5 7.2 8.1

71

3. M´ etodos cuantitativos de an´ alisis predictivo, regresión

Figura 3.3.: Regresión lineal: la cantidad de intentos a medida que aumenta hace que el número de error disminuya.

Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlaci´ on es prácticamente inexistente, es decir, no tiene nada que ver con el rendimiento académico la distancia del domicilio a la Universidad.

Figura 3.4.: Regresión lineal: Al parecer existe relación entre la distancia a la que se vive de la Universidad y la calificación que se obtiene.

3.4.

Encontrando la relación. Regresión

3.4.1.

El coeficiente de correlación

Sólo para recordar, tenga en cuenta la lección aprendida en la sección (2.3.7). Ten´ ıamos que el coeficiente de correlación de Pearson, r, nos permite saber si el ajuste de la nube de

72

3.4. Encontrando la relación. Regresión puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones t´ıpicas (ra´ız cuadrada de las varianzas). r=

Vxy = Vx Vy

Sxy





Sx2 Sy2

Sxy . Sx Sy

=

(3.1)

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes: 



x2

n

r=

xi y i n

 − − −    − −  −   r=

n

n

x2i

x−2

i

xi yi

(

xi

2

xi )

n

x ¯ y¯



yi2 n

yi

yi2

(

,

(3.2)

.

(3.3)

y −2

yi )2

El coeficiente de correlación ten´ıa las siguientes propiedades muy interesantes: El coeficiente de correlación, r, presenta valores entre -1 y +1. Cuando r es próximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos está muy dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresión. Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´ un un modelo lineal y la recta de regresi´ on que se determine tendrá pendiente positiva, será creciente. Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´ un un modelo lineal y la recta de regresi´ on que se determine tendrá pendiente negativa: es decreciente.

3.4.2.

Regresi´ on lineal. El M´ etodo de los M´ınimos Cuadrados

Hemos enfatizado sobre la importancia de las representaciones gráficas y hemos visto la utilidad de las versiones linealizadas de los gráficos (X,Y). A menudo nos confrontamos con situaciones en las que existe o suponemos que existe una relaci´ on lineal entre las variables X e Y. Surge de modo natural la pregunta: ¿cu´ al es la relación anal´ıtica que mejor se ajusta a nuestros datos? El método de cuadrados m´ınimos es un procedimiento general que nos permite responder esta pregunta. Cuando la relaci´ on entre las variables X e Y es lineal, el método de ajuste por cuadrados m´ınimos se denomina tambi´ en método de regresi´ on lineal. En este cap´ıtulo discutiremos este u ´ltimo caso. El lector puede consultar a continuaci´ on

73


Figura 3.5.: Regresión no lineal.

una discusión del caso general de cuadrados m´ınimos cuando el modelo es no lineal y los datos están afectados de errores. La dispersión de los valores está asociada a la fluctuación de los valores de cada variable. Observamos o suponemos una tendencia lineal entre las variables y nos preguntamos sobre cu´ al es la mejor recta: y(x) = ax + b,

(3.4)

que representa el caso de inter´ es.

Figura 3.6.: La curva de regresión lineal en términos de los cambios de la funci´ on.

74

3.4. Encontrando la relación. Regresión Es u ´til definir la función χ 2 (Chi-cuadrado): χ2 =

 i

[yi

− (axi + b)]2 ,

(3.5)

que es una medida de la desviaci´ on total de los valores observados yi respecto de los predichos por el modelo lineal ax + b. Los mejores valores de la pendiente a y la ordenada al srcen b son aquellos que minimizan esta desviación total, o sea, son los valores que remplazados en la ecuación (3.4) minimizan la función χ2 , ecuación (3.5). Los parámetros a y b pueden obtenerse usando técnicas matemáticas que hacen uso del cálculo diferencial. Aplicando estas técnicas, el problema de minimización se reduce al de resolver el par de ecuaciones: d 2 d 2 χ = 0, χ = 0, (3.6) da db de donde resulta despu´ es de algunos cálculos

 −     −−  −

a= b=

N

N

N

x2i N

xi yi xi y i , x2i ( xi )2 yi xi xi yi . x2i ( xi )2

(3.7) (3.8)

Actualmente, la mayor´ıa de los programas de análisis de datos y plantillas de c´ alculo, realizan el proceso de minimización en forma automática y dan los resultados de los mejores valores de a y b, o sea los valores indicado por la ecuaciones anteriores. El criterio de m´ınimos cuadrados reemplaza el juicio personal de quien mire los gr´ aficos y defina cuál es la mejor recta. En los programas como Excel, Origin, etc., este c´ alculo se realiza usando la herramienta regresi´ on lineal o ajuste lineal. Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable independiente se considera despreciable. Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de correlaci´ on de Pearson entre las variables X e Y, escrito ahora equivalentemente como: r2 = Cov(x, y) = V ar(x) = V ar(y) =

Cov (x, y)2 , V ar(x) V ar(y) N xi yi xi y i , N2 2 2 xi xi =< x 2 >< x > 2 , N N

 · −   −    −   yi2 N

yi N

(3.9) (3.10) (3.11)

2

=< y 2 >< y > 2 .

(3.12)

El valor de r var´ıa entre -1 y 1 como siempre. Si r es 1 o próximo a estos valores, decimos que el modelo lineal es adecuado para describir los datos experimentales. Cuando

±

75

3. M´ etodos cuantitativos de an´ alisis predictivo, regresión r se aparta de estos extremos decimos que una expresión lineal no es una buena descripción de los datos. En este caso, conviene analizar el gr´ afico y buscar una relación no-lineal que aproxime mejor la dependencia. Dado que r mide el grado de correlación lineal entre los datos, si, por ejemplo, los pares de puntos (X,Y) tienen una relaci´ on tal que caen sobre un c´ırculo, aunque ellos est´ an correlacionados, tendr´ ıamos r 0. Desde luego, si los pares (X,Y) no tienen correlación alguna entre ellos, también tendr´ıamos r 0. Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno de los parámetros de la ecuación (3.4). Por ejemplo, si deseamos determinar la constante elástica k de un resorte a partir de mediciones de fuerzas aplicadas Fi y estiramientos xi que le producen al resorte, k será precisamente la pendiente de la recta que mejor se ajusta a los datos. Otro ejemplo es la obtención de la resistencia eléctrica R de un conductor, que deseamos determinar a partir de mediciones de tensi´ on Vi y la corriente que lo atraviesa Ii . Por consiguiente, es útil disponer de un modo de estimar las incertidumbres asociadas a la determinación de los parámetros a y b de la ecuación (3.4). La importancia del método de cuadrados m´ınimos reside en el hecho que nos permite obtener valores de la desviación estándar o sea los errores asociados a los par´ ametros a y b, que denotaremos con los s´ımbolos σa y σb . En esta sección sólo presentamos los resultados de utilidad más frecuente en el laboratorio; el lector interesado podr´ a encontrar un tratamiento más exhaustivo en las referencias. Las incertidumbres de los par´ ametros del ajuste vienen dadas por las expresiones:

∼

σa =

σb

=



χ2N , N V ar(x)

·

χ2N x2i N V ar(x) ,

 · ·

∼

(3.13)

(3.14)

donde χ 2N , conocido como el valor de Chi-cuadrado por grado de libertad, viene dada por: 1 χ2 . (3.15) N 2 Las incertidumbres de los parámetros a y b tambi´ en pueden escribirse en términos del coeficiente de correlación r del siguiente modo: χ2N =

σa =



− ·

a2

− · √N 22

 −

σb = σa < x >, donde



1 r2

1 ,

(3.16) (3.17)

x2i . (3.18) N Estas expresiones son de mucha utilidad para estimar σa y σb , ya que la mayor´ıa de las plantillas de cálculo y programas de ajuste, por los regular indican los valores de los par´ ametros a y b que mejor ajustan los datos y el valor de r. < x2 >=

76

3.5. Problemas de final de cap´ıtulo

Precauciones en el an´ alisis No siempre es suficiente admitir que dos variables siguen una relaci´ on lineal guiándonos por lo que muestra un gráfico de los datos en escalas lineales. Menos aun si s´ olo evaluamos el coeficiente de correlación del ajuste lineal que propondr´ıamos a partir de este gráfico. Un gráfico de Y = X 1,1 (variables sin correlación lineal) puede ajustarse por una recta y obtenerse a la vez un coeficiente de correlación lineal (inexistente) de, por ejemplo, 0 ,998. Un gráfico de datos experimentales de Y = X con algo de dispersión fortuita de los puntos, podr´ ıa devenir coeficiente de, por menor queafico el anterior. los coeficientes hay en unaun diferencia, apenas, delejemplo, 3 por mil.0,995, Pero en un gr´ log-log, Entre la diferencia de pendientes será la que hay entre 1.1 y 1.0, lo que represen ta un 10 % de discrepancia entre los exponentes de la variable X . Estos métodos de an´ alisis nos enseñan que los efectos de correlación pueden estar enmascarados por el efecto del ruido de los datos. En ocasiones lo dif´ıcil es establecer si existe correlación entre las variables, aun cuando los datos provengan de fuentes limpias que hayan producido datos con relativamente poca dispersi´ on. Muchas veces la decisión entre dos alternativas debe hacerse usando otros criterios. Por ejemplo, la consistencia con otros conjuntos de datos o sobre la base de consideraciones de simetr´ ıa o concordancia con teor´ıas bien establecidas. Ejemplo 3.4 Imaginemos un experimento donde se mide la distancia que recorre un móvil sobre una l´ınea recta mientras una fuerza constante act´ ua sobre él. Esperamos que el movimiento sea uniformemente acelerado. Supongamos que el cuerpo parte del reposo, que

medimos x(t) a tiempos largos. En la figura se ven los resultados. Si los datos experimentales se analizan sobre el gr´ afico de escalas lineales, el ajuste por un modelo lineal es más que tentador. Hecho esto, se obtiene la ecuaci´ on de la mejor recta y un coeficiente de correlaci´ on muy alto, r = 0,99959. Sin embargo, un modelo basado en las ecuaciones de la dinámica dice que x=

1 2 at , 2

(3.19)

donde a es la aceleración. En la Figura están los logaritmos de los mismos datos, de donde se ve claramente la proporcionalidad x t 2 que predice el modelo, dif´ıcilmente demostrable a partir del gráfico de la Figura. Evidentemente, el uso de una aproximaci´ on lineal no es buena en este problema y el mero juicio del valor del coeficiente de correlaci´ on no es suficiente.

∼

3.5.


A continuación una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas,

77


Figura 3.7.: Representación de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. (a) A tiempos largos no se aprecia bien la curvatura de la curva podr´ y, dado que el coeficiente de correlación lineal muy en cercano a lade unidad, ıa suponerse que la correlaci´ on es lineal. (b) es log(x) función log(t), de donde se deduce que la relación no es lineal sino cuadrática.

as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. La siguiente data representa las puntuaciones de 10 estudiantes que han tomado cursos de matemáticas y de f´ısica en la Universidad de Zaragoza para el programa de nivelación de la carrera en F´ısica Aplicada de esta universidad. Estudiante 123456789 10 Matem´ aticas (< 30) 20 23 8 29 14 11 11 20 17 17 F´ ısica (< 40) 30 35 21 33 33 26 22 31 33 36 Haga un gráfico de dispersión de estos datos y marque en dicho diagrama la media de cada una de las variables y calcule el coeficiente de correlaci´ on para estos datos. Determine si existe o no relación. El profesor a cargo tiene la impresión de que quien sabe mucha f´ısica tambi´ en sabe mucha matem´ atica. ¿Es esto cierto?

78

3.5. Problemas de final de cap´ıtulo 2. Un grupo de doc e niños participaron en un estudio psicológico diseñado para evaluar la relación, si la hay, entre la edad, x (años), y el tiempo promedio total de sue˜ no (ATST), en minutos y. Para obtener una medida de ATST, las grabaciones fueron tomadas en cada niño en cinco noches consecutivas y un promedio de entonces. Los resultados obtenidos se muestran en la tabla.

x y

1 2 3 4 5 6 7 8 9 10 11 12 4.4 6.7 10.5 9.6 12.4 5.5 11.1 8.6 14.0 10.1 7.2 7.9 586 565 515 532 478 560 493 533 575 490 530 515

Calcular el valor del coeficiente de correlaci´ on del momento del producto entre x e y. Evaluar la significación estad´ıstica de su valor e interpretar sus resultados. 3. El diámetro de las plantas tipo l´ıquenes m´ as largas que crecen en lápidas se midieron y se presentan los resultados en la siguiente tabla Edad de la l´ apida (a˜ nos) 9 18 20 31 44 52 53 61 63 63 64 64 114 141

Diámetro del l´ıquen (mm) 2 3 4 20 22 41 35 22 28 32 35 41 51 52

Haga un diagrama de sipersi´ on de los puntos. Calcule las media de cada variable as´ı como sus varianzas y tambi´ en el coeficiente de correlaci´ on entre ambas variables. Concluya. 4. Calcule el coeficiente de correlación de la siguiente data con variables aleatorias X e 2 Y , R XY X 11 17 26 Y 23 18 19

79

3. M´ etodos cuantitativos de an´ alisis predictivo, regresión Ahora suponga que la variable aleatoria Y es convertida a otra variable aleatoria Z por medio de la aplicación de la fórmula Z=

Y + 3, 10

entonces se tiene una nueva tabla para variables aleatorias X y Z que debe construir X 11 17 26 Z Complete la tabla anterior y evalue el coeficiente de correlación ahora entre las varia2 . Establezca adem´ bles X y Z , R XZ as el resultado del coeficiente de correlación entre 2 Y y Z , R Y Z Trate de hacer relaciones entre estos tres coeficientes de correlaci´ on. 5. En un experimento de biolog´ıa una serie de bacterias fueron cultivadas en el laboratorio. Los números de las bacterias, en millones, y sus edades, en d´ıas, son a continuaci´ on. Edad 1 2 3 4 5 6 7 8 No. de bacterias 34 106 135 181 192 231 268 300 Grafique estos en un diagrama de dispersión con el x-eje con una escala de hasta 15 d´ıas, y el eje-y de hasta 410 millones. Calcular el valor de R2 y comentar sobre sus resultados. Algunas lecturas finales se tomaron y se les da a continuaci´ on. Edad 13 1 4 1 5 No. de bacterias 400 403 405 Agrega estos puntos a tu gráfica y describir lo que que muestran. Calcule de nuevo el coeficiente de correlación con estas nuevas medidas. 6. Una varilla de metal se calent´ o gradualmente y su longitud, L, se midió a diversas temperaturas, T. Temperatura (o C) 15 20 25 30 35 40 Longitud (cm) 100 103.8 106.1 112 116.1 119.9 Dibujar un diagrama de dispersión para mostrar los datos y evaluar R2 . (L vs. T.) ¿Sospecha una inexactitud importan te en cualquiera de los valores registrados? Si es as´ı, deseche cualquiera que usted considere indigno de confianza y encontrar el nuevo valor de R 2 .

80

4. An´ alisis Combinatorio Whenever you can, count. - Sir Francis Galton . Quoted in James R. Newman, Commentary on Sir Francis Galton (1956), 1169.

4.1.

Introducci´ on

Hay muchas situaciones en las que ser´ıa demasiado dif´ıcil y / o demasiado tedioso enumerar todos los resultados posibles de un espacio muestral. En esta lecci´ on, vamos a aprender diferentes maneras de contar el número de elementos en un espacio de muestra sin tener que identificar los resultados espec´ıficos. Las técnicas espec´ıficas de recuento que exploraremos incluyen la regla de la multiplicación, permutaciones y combinaciones. El análisis combinatorio, o cálculo combinatorio, permite enumerar tales casos o sucesos y as´ı obtener la probabilidad de eventos más complejos. La Teor´ıa Combinatoria estudia las agrupaciones que pueden ser formadas cuando se toman todos, o algunos, de los elementos de un conjunto ...nito. Los elementos del conjunto pueden ser de cualquier naturaleza: n´ umeros, personas, empresas, art´ıculos producidos por una fábrica, etc. La Teor´ıa Combinatoria estudia especialmente el número de agrupaciones que pueden ser obtenidas bajo alg´ un modo de composición de los elementos. Para ello, distingue básicamente tres conceptos: arreglos, permutaciones y combinaciones. Para calcular probabilidades, muchas veces es necesario determinar la cantidad de elementos de un conjunto dado (cardinal del conjunto), o la cantidad de elementos del conjunto integrado por las agrupaciones que podemos realizar tomando algunos de los elementos. A menudo, la tarea de contarlos uno a uno resulta tediosa. En cambio, para poder contar resulta de mucha utilidad el llamado Principio Fundamental de Conteo y los aportes realizados por la Teor´ıa Combinatoria.

4.2.

Principio Fundamental de Conteo

En el caso de que existan más de un suceso a observar, habr´ıa que contar el n´ umero de veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo:

81

4. Análisis Combinatorio

Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el número de formas en que ambos sucesos pueden presentarse en ese orden es de n1 n2 . En otras palabras, basta multiplicar el número de formas en que se pueden presentar cada uno de los sucesos a observar. Este principio nos remite automáticamente al factorial de un n´ umero natural, que se puede pensar como una función con dominio los n´ umeros naturales junto con el cero y codominio los números naturales. El factorial de un n´ umero n, denotado n!, se define como: n! = n.(n

− 1).(n − 2)..,2,1,

si n > 0,

(4.1)

= 1, si n = 0.

Ahora, n es muy grande el proceso de cálculo se vuelve tedioso y muy cargado, incluso para una computadora, por lo que se utiliza la aproximaci´ on de Stirling a n!: n!

∼ √2πn

2n+1 2

e−n .

∼

donde e 2,71828..., que es la base de los logaritmos neperianos. En el análisis combinatorio se definen las permutaciones, con o sin repetici´ combinaciones.

(4.2)

on, y las

Ejemplo 4.1 Una familia desea adquirir una vivienda en un balneario y se le presentan las siguientes posibilidades: casa o apartamento. A su vez, cada una puede ser de 1, 2 o 3 dormitorios. ¿ Cuántos tipos posibles de vivienda tiene a disposici´ on? Como existen dos niveles, y se tienen 2 opciones para el primer nivel (casa o apartamento) y 3 opciones para el segundo (número de dormitorios), se puede aplicar el principio fundamental de conteo para obtener la respuesta: 2 3 = 6 tipos de vivienda. Este resultado puede ser visualizado claramente con la ayuda de un diagrama de árbol.

4.3.

Arreglos

Dado un conjunto de n elementos, se define como arreglo de n de orden k (k < n) a cada k-upla ordenada que puede formarse tomando k elementos diferentes entre los n dados. Como una k-upla está constituida por k elementos dispuestos en determinado orden, dos arreglos serán diferentes, aún conteniendo los mismos elementos, si los mismos se encuentran en distinto orden. Al n´ umero de arreglos de n de orden k lo notaremos como Ank . Para calcular dicho número, es posible utilizar el principio fundamental de conteo. El primer lugar de la k-upla puede estar ocupado por uno cualquiera de los n elementos, mientras el segundo lugar puede estar ocupado por cualquiera de los elementos que no están en el primer lugar, es decir por uno de los ( n 1) elementos restantes, ya que los k

−

82

4.4. Variaciones (o arreglos) con repetición elementos deben ser diferentes. El tercer lugar puede estar ocupado por cualquiera de los elementos que no están ni en el primer lugar ni en el segundo, es decir por uno cualquiera de los ( n 2) elementos restantes. Si se continúa el razonamiento, para ocupar el k-ésimo lugar se tendrán (n k + 1) elementos posibles. Entonces, el número de arreglos de n de orden k es: Ank = n(n 1)(n 2)...(n + k 1), (4.3)

−

−

−

−

−

recordando la definición de factorial de un número natural puede obtenerse otra fórmula para el cálculo del número de arreglos: Ank = n(n

− k)(n − k − 1)..,1 = n! , − 1)(n − 2)...(n + k − 1) (n (n − k)(n − k − 1)..,1 (n − k)!

(4.4)

Los arreglos reciben tambi´ en el nombre de Variaciones. Ejemplo 4.2 De una caja que contiene cuatro bolillas numeradas del 1 al 4 se extraen sucesivamente 2 sin reposici´ on. ¿Cuántas extracciones diferentes pueden resultar si se supone que interesa el orden de extracción? Las diferentes posibilidades son todos los arreglos de 4 de orden 2, es decir todos los pares ordenados posibles: (1,2), (1,3), (1,4), (2,1), (2,3), (2,4), (3,1), (3,2), (3,4), (4,1), (4,2), (4,3). Entonces, pueden resultar A42 = 4 (4-1) = 12 extracciones posibles.

{

}

Ejemplo 4.3 Sea el mismo conjunto A = a,b,c,d , ¿cuántas ordenaciones sin repetici´ on se pueden obtener? Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.

4.4.

Variaciones (o arreglos) con r epetición

En la definición anterior se ha supuesto que los elementos con los cuales se trabaja son diferentes: se trataba de arreglos sin repetición o de arreglos simples. Ahora se considerará el caso de que en un mismo grupo, algún elemento pueda figurar varias veces. Al número de arreglos con repetición de n de orden k lo notaremos como RPkn , que obviamente ser´ a mayor que P kn . Para calcular dicho número es posible utilizar nuevamente el principio fundamental de conteo. El primer lugar de la k-upla puede estar ocupado por uno cualquiera de los n elementos. Como los elementos pueden repetirse, el segundo lugar tambi´ en puede estar ocupado por uno cualquiera de los n elementos y as´ı sucesivamente con los k lugares, por lo cual el n´ umero de arreglos con repetición de n de orden k será: (RA)rn = (RV )rn = n r .

{

(4.5)

}

Ejemplo 4.4 Sea A = a,b,c,d , ¿cuántas palabras de dos letras se pueden obtener?. Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r = 2 y n = 4. Las palabras formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16.

83

4. Análisis Combinatorio Ejemplo 4.5 Se lanza un dado tres veces. ¿Cu´ antos resultados diferentes pueden obtenerse? Obviamente, es posible que el mismo n´ umero salga dos o incluso tres veces. Los resultados ser´ an todos los arreglos con repetición de 6 (cantidad de caras numeradas del dado) de orden 3 (cantidad de veces que se lanza el dado). Entonces la cantidad de resultados posibles ser´ a: (AP )63 = 63 = 216 . Ejemplo 4.6 De una bolsa que contiene tres fichas numeradas del 1 al 3 se extraen sucesivamente 4 con reposición. ¿Cuántas extracciones diferentes pueden resultar? Las diferentes posibilidades son todos los arreglos con repetición de 3 de orden 4, es decir todas las cuaternas posibles, donde los elementos no son necesariamente distintos. Uno de el los ser´ıa, por ejemplo: (3,2,3,1). Entonces, la cantidad de extracciones posibles será: (AR)34 = 34 = 81.

4.5.

Permutaciones (u ordenaciones) sin repetición

Dado un conjunto de n elementos, llamaremos permutación de n a cada forma de ordenar los n elementos dados. Se observa que las permutaciones constituyen un caso particular de los arreglos ( k = n). Por consiguiente el número de permutaciones de n (Pkn ) es igual al número de arreglos de n de orden n. O sea, Pnn = P n =

n!

(n

n!

− n)! = 0! = n!.

(4.6)

Ejemplo 4.7 ¿De cuántas maneras podemos colocar cuatro bolas de distintos colores en fila? La primera puede ser cualquiera de las cuatro. La segunda, cualquiera de las tres restantes, etc. La respuesta es 4 3 2 1 = 4! = 24 .

× × ×

Ejemplo 4.8 ¿Cu´ antas palabras, con o sin sentido, pueden obtenerse usando todas las letras de la palabra PRENSA? Como la palabra no tiene letras repetidas, la respuesta es 6! = 720 . M´ as adelante nos encontraremos la situaci´ on de palabras con letras repetidas.

4.6.

Permutaciones (u ordenaciones) con repetición

A diferencia del caso anterior, podemos suponer que todos los elementos no son distintos, es es, que algunos elementos pudieran estar repetidos. Permutaciones con repetici´ on de n elementos donde el primer elemento se repite a veces , el segundo b veces , el tercero c veces, es decir, n = a + b + c + ..., son los distintos grupos que pueden formarse con esos n elementos de forma que Pn a,b,c,... (RP )n = a! b! c! ... . (4.7)

× × ×

84

4.7. Combinaciones

4.7.

Combinaciones

Dado un conjunto de n elementos, llamaremos combinación de n de orden k (k < n) a cada subconjunto que puede formarse tomando k elementos diferentes entre los n dados. Como en los conjuntos no interesa el orden de los elementos, dos combinaciones ser´ an diferentes si contienen por lo menos algún elemento diferente. Considérese, por ejemplo, un conjunto de n elementos diferentes del cual se extraen k sucesivamente y sin reposición, sin que interese el orden de extracción, o del cual se extraen k elementos simultáneamente. En cualquiera de estos dos casos las extracciones posibles son todas las combinaciones de n de orden k. El número de combinaciones de n de orden k se denota Ckn (tambi´ en llamado número combinatorio). Para calcular este número buscaremos la relación existente entre éste y los n´ umeros A nk y Pk .

{

}

Ejemplo 4.9 Si tomamos el mismo conjunto A = a,b,c,d , ¿cuántos subconjuntos de 2 elementos cada uno se pueden obtener? Haciéndolos se obtienen: a,b, a,c, a,d, b,c, b,d, c,d. Son seis los subconjuntos. En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el n´ umero de combinaciones obtenidas están relacionadas por medio de A nk = C kn Pk , as´ı:

×

Cnr =

Ank = Pk

 n r

=

n.(n

− 1).(n − 1)...(n − r + 1) = r!

n! , r!(n r)!

−

(4.8)

o, que es lo mismo, Cnr =

4.8.

 n r

=

Pnr . r!

(4.9)

Combinaciones con repetición

A diferencia del caso anterior cuando podemos imponer la condición de que los elementos puedan repetirse, entonces lo que tenemos es combinaciones con repetici´ on. Al número de arreglos (combinaciones) con repetición de n de orden k lo notaremos como RCkn , RCkn =



n+k n

−1



=

− −

(n + k 1)! . n!(k 1)!

(4.10)

Ejemplo 4.10 En una bodega hay cinco tipos diferentes de botellas. ¿De cu´ antas formas se pueden elegir cuatro botellas? Exactamente de 4+5

4

RC5 =



4

1

−



(4 + 5 = 4!(5

1)!

−−1)!

8! = (4!)2 = 70.

(4.11)

85

4. Análisis Combinatorio

4.9.

An´ alisis y Meto dolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de conteo

Para resolver problemas básicos y sencillos de teor´ıa de conteo basta con seguir el siguiente diagrama.

Figura 4.1.: Metodolog´ıa sencilla para la resoluci´ on de problemas de conteo.

4.10.


A continuación una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. Cuántos resultados distintos pueden producirse al lanzar una moneda cuatro veces al aire. 2. Cuántos números de cuatro cifras distintos pueden formarse con los elementos del conjunto 1, 2, 3, 4, 5, 6, 7.

86

4.10. Problemas de final de cap´ıtulo 3. ¿De cuántas formas diferentes se pueden repartir tres juguetes diferentes entre cuatro niños, de manera que ningún niño tenga más de un juguete? 4. ¿De cuántas formas diferentes se pueden distribuir cinco bolas distintas en tres cajas diferentes? 5. En un examen se proponen diez preguntas; cada pregunta tiene tres respues tas posibles (a,b,c). Si se contestan al azar, ¿cuántos exámenes distintos pueden producirse? 6. Se extraen sucesivamente dos bolas de una bolsa que contiene seis de diferentes colores. ¿Cuántos resultados distintos pueden producirse ? a) Con devolución. b) Sin devoluci´ on. 7. El viaje de la ciudad A a la ciudad B se puede realizar por cinco carre teras distintas. ¿De cuántas formas puede realizarse el viaje de ida y vuelta? 8. De A a B puede irse en coche, avión, moto, tren o barco. ¿De cuántas formas posibles se puede hacer el viaje de ida y vuelta? 9. Resuelve: V m2 + Vm2 −2 + Vm2 −4 = 98. 10. Una matr´ ıcula de coche de un pa´ ıs europeo esta formada por 3 letras elegidas entre 27 y 4 números escogidos entre los números comprendidos entre 0 y 9. ¿Cuántos coches se pueden matricular en cada pa´ıs con este sistema? 11. Tiras dos dados dife rentas al aire. ¿Cuántos resultados distintos pueden producirse? 12. De Cuántas formas distintas pueden sentarse cuatro personas alrededor de una mesa. 13. De Cuántas formas pueden alinearse dos chicas y tres chicos. 14. De Cuántas formas pueden actuar en T.V. cuatro cantantes y tres humoristas. 15. De Cuántas formas distintas puede obtenerse la suma 8 al lanzar tres dados distintos y sumar los números aparecidos. 16. De cuántas formas pueden ordenarse siete personas, entre las que figuran Juan y Mar´ıa de manera que Juan y Mar´ıa estén colocados uno al lado de otro. 17. Se lanza una moneda o cho veces seguidas y se anotan sucesivamente los resultados obtenidos en cada uno de los lanzamientos. Los ocho lanzamientos constituyen una experiencia. ¿En cuántas experiencias se pueden obtener cinco caras y tres cruces? 18. ¿Cuántas de las permutaciones formadas por los números 3, 4, 5, 6, 7, 8 empezar´ an por 3? ¿Cuántas por 64? ¿Cuántas terminarán por 875? 19. Cuántos números de cinco cifras distintas se pueden formar con los n´ umeros 0, 1, 2, 3, 4.

87

4. Análisis Combinatorio 20. ¿De cuántas maneras pueden permutarse las letras de la palabra ESCAPARATE dejando fija la P y de modo que los lugares ocupados por vocales no puedan ser ocupados por consonantes y viceversa? 21. ¿Cuántas comisiones de tres alumnos pueden formarse con los 35 alumnos de una clase? 22. ¿Cuántos equipos de 5 atletas se podr´ıan formar para participar en una competición con los doce atletas mejor preparados? 23. En una carrera en la que toman parte 8 caballos se juega una apuesta que consis te en acertar los dos primeros sin tener en cuenta el orden. ¿Cu´ antas apuestas diferentes pueden jugarse en esa carrera? 24. De los 48 trabajadores de una empresa se presen tan 6 como candidatos a ocupar dos puestos de representante de los trabajadores. ¿Cu´ antas elecciones son posibles? 25. En un salón hay 6 matrimonios. Se eligen al azar dos de esas personas: (a) ¿Cu´ antas elecciones distintas son posibles? (b) ¿En cuántas de las elecciones posibles habrá dos hombres? (c) ¿En cuántas habrá una mujer y un hombre? (d) ¿En cu´ antas de las posibles elecciones habrá un matrimonio? 26. En una l´ ınea férrea hay 18 estaciones. Si el tren para en todas las estaciones, ¿cu´ antos viajes distintos pueden realizarse entre ellas? 27. Un alumno puede elegir 3 entre sus 15 compa˜ neros de clase para realizar un viaje, ¿cu´ antas elecciones distintas pueden hacerse? 28. Con 5 clase de vino, ¿cu´ antas mezclas se pueden formar de tres vinos? 29. De cuántas formas posibles pueden elegirse dos botellas entre 18 existentes. 30. Con seis pesas de 1, 2, 5, 10, 20 y 50 gr, ¿cu´ antas pesadas posibles pueden realizarse?

88

5. Probabilidad What the use of P [the significance level] implies, therefore, is that a hypothesis that may be true may be rejected because it has not predicted observable results that have not occurred. - Sir Harold Jeffreys . Theory of Probability (1939), 316.

5.1.

Introducci´ on: La probabilidad

La palabra probabilidad no tiene una definición consistente. De hecho, hay dos amplias categor´ıas de interpretaciones de la probabilidad: los frecuencistas hablan de probabilidades sólo cuando se trata de experimentos aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan las probabilidades a cualquier declaración, incluso cuando no implica un proceso aleatorio, como una manera de representar su verosimilitud subjetiva. El estudio cient´ıfico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un interés en cuantificar las ideas de la probabilidad durante milenios, pero las despu´ descripciones matemáticas exactas de utilidad en estos problemas s´ olo surgieron mucho es. Según Richard Jeffrey, “Antes de la mitad del siglo XVII, el término ’probable’ (en lat´ın probable) significaba aprobable, y se aplicaba en ese sentido, un´ıvocamente, a la opinión y a la acción. Una acción u opinión probable era una que las personas sensatas emprender´ıan o mantendr´ıan, en las circunstancias.” [Veáse: Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7]. Dos aplicaciones principales de la teor´ıa de la probabilidad en el d´ıa a d´ıa son en el an´ alisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente aplican métodos probabil´ısticos en regulaci´ on ambiental donde se les llama “an´ alisis de v´ıas de dispersi´ on”, y a menudo miden el bienestar usando métodos que son estocásticos por naturaleza, y escogen qu´ e proyectos emprender bas´ andose en análisis estad´ısticos de su probable efecto en la población como un conjunto. No es correcto decir que la estad´ıstica est´ a incluida en el propio modelado, ya que t´ıpicamente los análisis de riesgo son para una u ´ nica vez y por lo tanto requieren m´ as modelos de probabilidad fundamentales, por ej. “la probabilidad de otro 11-S”. Una ley de n´ umeros pequeños tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabil´ısticas un tema pol´ıtico.

89

5. Probabilidad Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petróleo en Oriente Medio - que producen un efecto domin´ o en la econom´ıa en conjunto. Un c´ alculo por un mercado de materias primas en que la guerra es más probable en contra de menos probable probablemente env´ıa los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opini´ on. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teor´ıa de las finanzas conductuales surgi´ o para describir el efecto de este pensamiento de grupo en el precio, en la p ol´ıtica, y en la paz y en los conflictos. Se puede decir razonablemente que el descubrimiento de métodos rigurosos para calcular y combinar los cálculos de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna importancia para la mayor´ıa de los ciudadanos entender cómo se calculan los pron´ osticos y las probabilidades, y cómo contribuyen a la reputaci´ on y a las decisiones, especialmente en una democracia. Otra aplicación significativa de la teor´ıa de la probabilidad en el d´ıa a d´ıa es en la fiabilidad. Muchos bienes de consumo, como los autom´ oviles y la electrónica de consumo, utilizan la teor´ıa de la fiabilidad en el dise˜ no del producto para reducir la probabilidad de aver´ıa. La probabilidad de aver´ıa también est´ a estrechamente relacionada con la garant´ıa del producto. Se puede decir que no existe una cosa llamada probabilid ad. También se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situación. Por consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100 % o 0 %, y la el ección correcta puede ser hecha con precisión por el que ve la carta. La f´ısica moderna proporciona ejemplos importantes de situaciones determin´ısticas donde s´ olo la descripción probabil´ıstica es factible debido a informaci´ on incompleta y la complejidad de un sistema as´ı como ejemplos de fen´ omenos realmente aleatorios. En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el número donde la bola parará será seguro. Naturalmente, esto tambi´ en supone el conocimiento de la inercia y la fricci´ on de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y as´ı sucesivamente. Una descripci´ on probabil´ıstica puede entonces ser m´ as pr´ actica que la mecánica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los f´ısicos se encuentran con la misma situación en la teor´ıa cinética de los gases, donde el sistema determin´ıstico en principio, es tan complejo (con el n´ umero de moléculas t´ıpicamente del orden de magnitud de la constante de Avogadro 6 10 23 ) que sólo la descripción estad´ıstica de sus propiedades es viable. La mecánica cuántica, debido al principio de indeterminación de Heisenberg, sólo puede ser descrita actualmente a trav´ es de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabil´ısticas. Albert Einstein coment´ o estupendamente

×

90

5.2. La probabilidad en una carta a Max Born: Jedenfalls bin ich überzeugt, daβ der Alte nicht würfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en d´ıa no existe un medio mejor para describir la f´ısica cuántica si no es a trav´ es de la teor´ıa de la probabilidad. Mucha gente hoy en d´ıa confunde el hecho de que la mecánica cuántica se describe a trav´ es de distribuciones de probabilidad con la suposición de que es por ello un proceso aleatorio, cuando la mecánica cuántica es probabil´ıstica no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisi´ on sus parámetros fundamentales, lo que imposibilita la creaci´ on de un sistema de ecuaciones determinista. (Tomado de wikipedia, busque “probabilidad”).

5.2.

La probabilidad

La probabilidad es una medida de la posibilidad de que un “evento ocurra. En vista de la caracter´ıstica de ésta medida, la cantidad que la describe es siempre un n´ umero que se encuentra en un intervalo [0 , 1], donde o equivale a una posibilidad nula de que el evento ocurra mientras que 1 representa el hecho de que evento va a ocurrir con toda seguridad. En otras palabras, la medida de la probabilidad es siempre una fracci´ on o decimal indicando la porción o porcentaje de la veces que un evento ocurre. Ejemplo 5.1 40 % de chance de que l lueva, average de bateo de .313, la probabilidad de obtener un royal flush en poker es 1:649740. La interpretaci´ on: Un 40% de chance de que llueva significa que si nosotros miramos todos los d´ıas con caracter´ısticas similares, entonces de cada 100 d´ıas con estas condiciones, 40 de ellos serán d´ıas con lluvia; un porcentaje de bateo de .313 significa que el jugado llegar´ a a una base o har´ a un hit en el 31.3 % (.313) de todos los intentos al bateo, es decir, de cada 100 veces que batea, sólo 31 veces aproximadamente hace un hit; dramáticamente se tendrá que si uno quiere obtener un royal flush en una partida de poker, entonces quiz´ as tenga que esperar hasta 649740 manos para obtener uno.

5.3.

Experimentos de Probabilidad

Un experimento probabil´ıstico es cualquier proceso que produce un resultado o una observaci´ on y tiene por finalidad de determinar posibilidades. Ejemplo 5.2 Lanzar un dado o una moneda, escoger un nombre de varios revueltos en un vaso, sacar una carta de un mazo. Cuando se realiza un experimento, se obtienen un conjunto de valores. A este conjunto de valores que puede tomar una variable se le denomina espacio muestral. Ejemplo 5.3 El universo de el experimento de lanzar una moneda tiene dos resultados: cara y sello, as´ı podemos escribir:

{

S = cara, sello

}

(5.1)

91

5. Probabilidad

En el experimento de lanzar un dado, se tienen 6 posibles resultados, as´ı:

{

S = 1, 2, 3, 4, 5, 6

}

(5.2) 

Desde ahora definiremos evento como cualquier colección de resultados de un espacio de eventos o universo, es decir, pudiera confeccionarse subconjuntos del universo de un evento y crear nuevos eventos. Si existen más de una variable, el espacio muestral está formado por las combinaciones de valores de cada una de las variables. Ejemplo 5.4 En el caso de el experimento de lanzar un dado, uno podr´ıa definir dos nuevos eventos del universo tomando algunos que tienen una caracter´ıstica com´ un, as´ ı

{

} { } {

} }

P = Resultados pares = 2, 4, 6 , I = Resultados impares = 1, 3, 5 ,

{

As´ı mismo podr´ıan confeccionarse eventos en el experimento de sacar una carta de un mazo, uno podr´ıa inventar nuevos eventos, por ejemplo, los resultados posibles de sacar un rey, tiene cuatro resultados correspondientes con los cuatro reyes de los cuatro distintos tipos de dibujo que tienen las cartas, o bien, el rey de corazones, el rey de picas, el rey de espadas y el rey de tr´ eboles. Un evento E para un experimento se dice que ocurre si y s´

olo si el resultado de el

experimento es uno de los que pertenecen a E . Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si éste consta de un solo elemento entonces es un evento elemental. Ejemplo 5.5 Si P es el evento descrito anteriormente de obtener los n´ umeros pares en el lanzamiento de un dado, entonces si al lanzar el dado el n´ umero mostrado es un 4, entonces uno podr´ıa decir que el evento P ocurre, si el número mostrado es 1, entonces uno debe decir que el evento P no ocurre. Como se puede uno imaginar, existen eventos que siempre, no importa el n´ umero de experimentos o su situación, ocurren, y en cambio existen otros que nunca ocurren. Los que siempre ocurren son los eventos seguros, y los que nunca son los eventos imposibles. Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta raz´ on, se define como experimento aleatorio al proceso en el que se pueden predecir con certeza la ocurrencia de sus eventos, con excepción del seguro o del imposible. Hay que hacer la observaci´ on que esta definición habla en términos generales y no espec´ıficamente sobre algún experimento en particular.

92

5.4. Calculando la probabilid ad de un evento A aquella variable que está asociada a un experimento de este tipo se le denomina variable aleatoria. En cambio, a un experimento no aleatorio se le denomina experimento determin´ ıstico. Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. Si dos o más eventos no pueden ocurrir simultáneamente, se llaman eventos mutuamente excluyentes, es decir, que la intersección de ambos eventos es vac´ıa. Por otro lado, en ocasiones un evento o más eventos dependen de otro evento previo, es decir, un evento A ocurre dado que ocurrió un evento B. Si existe este tipo de relación entre eventos se dice que son eventos dependientes o condicionados (el evento A depende del evento B, o el resultado del evento A está condicionado al resultado del evento B). Por otro lado, si no existe tal relación entre eventos se dice que son eventos independientes. Los criterios de dependencia o de independencia se definir´ an más adelante, en términos de probabilidad condicional.

5.4.

Calculando la probabilidad de u n evento

Para calcular la probabilidad de eventos es necesario que éstos se comporten de una manera más o menos estable. Precisamente, se echa mano de la regularidad estad´ıstica, que es la propiedad de los fen´ omenos aleatorios, y que consiste en que al aumentar el n´ umero de repeticiones de un experimento en condiciones pr´ acticamente constantes, la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo. La probabilidad de un evento E es denotada por P (E ) y siempre representa la fracción o porcentaje de o currencia de que E ocurra. Algunas caracter´ ısticas exhibe esta formulación: Para un evento E , se tiene que 0

≤ P (E ) ≤ 1.

Un evento E es llamado evento imposible si ocurre que P (E ) = 0. Un evento E es llamado evento cierto si ocurre que P (E ) = 1. La probabilidad P (E ) puede ser calculada de dos modos distintos.

5.4.1.

Probabilidad Emp´ırica

Tambi´ en llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estad´ıstica. Esta definición ser´ ıa la m´ as real, pero proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales. Además, los resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo. Por ejemplo, uno podr´ıa calcular la probabilidad de obtener una suma de 7 cuando dos dados son lanzados muchas veces, digamos 100 veces, y calculando que porcentaje de las veces sale 7. As´ı mismo tambi´ en se podr´ıa calcular la probabilidad de que un jugador de

93

5. Probabilidad basketball anote una cesta libre de tablero calculando el porcentaje de las veces que lo ha hecho en el pasado con estad´ısticas anteriores. Para calcular la probabilidad de esta manera podr´ıa usarse la siguiente fórmula: P (E ) =

número de intentos en los que ocurre E . número de intentos totales

(5.3)

Ejemplo 5.6 Digamos que la siguiente tabla representa las notas que obtienen en un ex´ amenes en base a 100 puntos un grupo de estudiantes: Notas 90-99 80-90 70-79 60-69 50-59 40-49

Número de estudiantes 4 6 4 3 2 1

Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos, la probabilidad de sacar un examen al azar y que sea una nota entre 90 y 99 puntos ser´ a: P (A) =

5.4.2.

cantidad de estudiantes que obtienen notas entre 90 y 99 puntos cantidad total de estudiantes

=

4 = 0,20. 20 (5.4)

Probabilidad cl´ asica

La probabilidad clásica de un evento E , que denotaremos por P (E ), se define como el número de eventos elementales que componen al evento E , entre el número de eventos elementales que componen el espacio muestral: P (E ) =

n´ umero de eventos elementales que componen al evento E . número de eventos elementales que componen el espacio muestral

(5.5)

Es la definición más utilizada porque supone de antemano, y se necesita como requisito indispensable, que todos los eventos elementales tienen la misma probabilidad de ocurrir. Ejemplo 5.7 Cuando se lanza una moneda, se obtienen dos resultados posibles: cara o sello. Digamos que el evento que salga cara lo denotamos por A y a la de sello B . La probabilidad de que salga una cara al lanzar la moneda ser´ a 1 P (A) = P (B) = P (cara) = P (sello) = . 2

(5.6)

En el caso del ejemplo en el que uno lanza un dado, entonces se tendr´ a 1 P (sale 1 ) = P (sale 5 ) = 6 .

94

(5.7)

5.5. Axiomas de la probabilidad Note que para el cálculo de la probabilidad desde e´sta perspectiva cl´ asica no es necesario de ninguna manera que se tenga que confeccionar y realizar el experimento. Vasta, como se ve, que uno tenga pleno conocimiento de el espacio muestral y sus respectivos resultados, por su puesto.

5.5.

Axiomas de la probabilidad

Recordemos primero que las frecuencias relativas de una distribución ten´ıan las siguientes propiedades: Las frecuencias relativas son mayores o iguales que cero. La frecuencia relativa del espacio muestral es igual a la unidad. Si dos eventos son mutuamente excluyentes, es decir que no ocurren simultáneamente, entonces la frecuencia relativa de su unión es la suma de las frecuencias relativas de cada uno. Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definici´ on ya expuesta, es la frecuencia relativa cuando se aumenta el tama˜ no de la muestra, se tienen lo siguiente. Si E es un evento de un espacio muestral S y P (E ) es la probabilidad de E , entonces se satisfacen los axiomas de la probabilidad: 1. La probabilidad de un evento E , es un número siempre entre 0 y 1, es decir, 0 P (E ) 1.

≤

≤

2. Se le llama a E evento seguro a un evento cuando P (E ) = 1. Por otro lado, se le llama evento imposible si P (E ) = 0. 3. La probabilidad del universo es la máxima, P (S ) = 1. 4. Si E1 , E2 ,..., En , son eventos mutuamente excluyentes, entonces

   n

P (E1

∪ E2 ∪ ... ∪ En) = P

n

Ei

i=1

=

P (Ei ).

(5.8)

i=1

Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de eventos.

95

5. Probabilidad

5.6.

Posibilidades y probabilidades

En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las palabras posibilidad y probabilidad. La principal motivación de esta sección es hacer una diferenciaci´ on de estas dos cosas. En principio pareciera l´ ogico que uno pudiera definir la probabilidad en término de las posibilidades de que un evento ocurra, sin embargo, hablando en términos generales, la palabra posibilidad proviene de referirse a ciertos juegos de apuestas en las que se utiliza la frase: “la posibilidad de ganar es de x a y” , por ejemplo,

“la posibilidad de que gane es de 3 a 1” . Cuando uno habla de ésa manera es inevitable pensar en que tal frase está ligada de alguna manera a razones, en el sentido matemático de la palabra. Efectivamente, la posibilidad de que ocurra un evento se determina mediante la raz´ on de la probabilidad de que ocurra a la probabilidad de que no ocurra. Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las posibilidades de que ocurra son x a y , si x p = , y 1 p

−

(5.9)

de tal manera que x y y son números enteros. Ejemplo 5.8 Si se tiran dos monedas normales (no trucadas), la probabilidad de que las dos monedas caigan cara es de 14 . Esto quiere decir si alguien apuesta a que las dos monedas no caen simultáneamente en cara, la posibilidad de ganar la apuesta es de 3 4

1

= 3, 0,25 1 − 34 = 0,75

(5.10)

es decir, la posibilidad de ganar la apuesta es de 3 a 1. Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento, entonces se acostumbra mencionar las posibilidades en contra del evento. Ejemplo 5.9 Si se tira un dado no trucado, sabemos que la probabilidad de obtener un cuatro es 16 , es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se acostumbra decir que las posibilidades en contra, esto es, de no obtener un cuatro es de 6 a 1. Inversamente, en el caso de tener las posibilidades de un evento, entonces es fácil obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces la probabilidad p de que ocurra tal evento es x p= . (5.11) x+y

96

5.7. Propiedades de la probabilidad de eventos no elementales Ejemplo 5.10 En la Copa Mundial de F´ utbol Francia 1998 se dec´ıa que el equipo mexicano ten´ıa una posibilidad de 1 a 75 de l legar a ser el campe´ on del torneo. Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser campe´ on, entonces se tiene que p=

x 1 1 = = = 0,01311, x+y 1 + 75 76

(5.12)

es la probabilidad de que ocurriese el evento.



Esto tiene la ventaja de que permite, en combinaci´ on con el tercer axioma de la probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre las posibilidades que le asignan a algunos eventos. Esto quiere decir que el c´ alculo de las probabilidades de dos eventos mutuamente excluyentes a partir de las posibilidades otorgadas de manera subjetiva resulta como un criterio de consistencia. Ejemplo 5.11 Un criminólogo piensa que las posibilidades de que en la pr´ oxima semana la cantidad de delitos en una ciudad aumente con respecto a la anterior es de 5 a 2, de que sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la cantidad o sea la misma es de 7 a 4. Si se desea saber si son consistentes las probabilidades correspondientes habr´ ıa que hacer los c´ alculos. Las probabilidades de que aumente la cantidad de delitos, que sea igual la cantidad de delitos, y de que aumente o sea igual la cantidad de delitos es, respectivamente, de paumente = 5

1

5 5 = , 5+2 7

pigual =

1 1 = , 1+3 4

paumente =

7 7 = , 7+4 11

(5.13)

27

4 = 28 (como son eventos mutuamente excluyentes) no es lo mismo que + criterios y7 dado que 7los , entonces del criminólogo pueden ser cuestionados. 11

5.7.

Propiedades de la probabilidad de event os no elem entales

Cuando se tienen eventos elementales no existe mucho problema en el sentido del cálculo de las probabilidades, pues basta con una contabilizaci´ on o el uso directo del cálculo combinatorio. Pero en el caso de eventos no elementales, que son los compuestos por más de un evento elemental, el proceder de manera análoga resulta muy complejo y las operaciones pueden sobrepasar la capacidad de cálculo existente. Sin embargo, utilizando los axiomas de la probabilidad y las siguientes propiedades, se podr´ an expresar las probabilidades de estos eventos en términos de los eventos elementales que lo componen, siempre y cuando se conozcan las probabilidades de éstos. Veamos la probabilidad de una uni´ on de eventos, la cual la podremos calcular de la siguiente manera: 1. Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B, menos la probabilidad

97

5. Probabilidad de que ocurran A y B simultáneamente. Es decir, P (A

∪ B) = P (A) + P (B) − P (A ∩ B)

(5.14)

Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene: 2. Propiedad 2. Si dos eventos, A y B , son mutuamente excluyentes entonces la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. Es decir

∪

P (A B) = P (A) + P (B). (5.15) Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del complemento de un evento E , que denotaremos como E¯ : ¯ su complemento, entonces 3. Propiedad 3. Si E es un evento y E ¯) = 1 P (E

5.8.

− P (E ).

(5.16)

Probabilidad condicionada

En el cálculo de las probabilidades de algunos sucesos, el valor de dicha probabilidad dar´ a en función del conocimiento de determinadas informaciones relativas a estos sucesos. Ejemplo 5.12 Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4, extraemos una bola y seguidamente la volvemos a introducir para realizar una segunda extracci´ on, la probabilidad de extraer, por ejemplo, la bola n´ umero 3 en la segunda extracci´ on es la misma que en la primera. Si realizamos el mismo proceso sin reemplazar la bola

extra´ ıda la probabilidad deıda extraer, por ejemplo, depender´ a de la bola extra´ en primer lugar. la bola número 3 en la segunda extracción



Definici´ on. Sean A y B dos sucesos tal que P (A) = 0, se llama probabilidad de B condicionada a A, P (B A), a la probabilidad de B tomando como espacio muestral A, es decir, la probabilidad de que ocurra B dado que ha sucedido A. La probabilidad de que ocurra un evento A dado que ocurrió el evento B (el evento A depende del evento B ) es:

|

|

P (A B) =

∩

P (A B) . P (B)

(5.17)

Hay que notar que esta propiedad no es conmutativa, situaci´ on que s´ı ocurre con la probabilidad de unión o la intersección de eventos, por lo que no hay que confundir P (A B) y P (B A).

|

|

Ejemplo 5.13 Consideremos el experimento de “lanzar un dado al aire”. Calculemos, por ejemplo, la probabilidad de obtener un 3 sabiendo que ha salido un n´ umero impar. Definimos los sucesos A = sacar 3 y B = 1, 3, 5 ; entonces, P (A B) = 1/3, puesto que si sabemos que ha salido un n´ umero impar, los casos posibles ahora son 3 y los casos favorables al suceso A s´ olo 1.

{

98

}

{

}

|

5.9. Probabilidad total El conocimiento de que ha ocurrido el suceso A modifica, en algunas ocasiones, la probabilidad del suceso B, pero en otras no. Los sucesos en los que, conociendo que uno ha ocurrido, no se modifica la probabilidad del otro, decimos que son independientes y, si se modifica, decimos que son dependientes entre s´ı. Finalmente, el criterio para la independencia de eventos queda como sigue: Definici´ on. Dos eventos A y B son independientes si y sólo si P (A B) = P (A),

P (B A) = P (B),

|

o, lo que es lo mismo,

(5.18)

| |

P (A B) = P (A)P (B).

5.9.

(5.19)

Probabilidad total

Llamamos sistema completo de sucesos a una familia de sucesos A 1 , A2 ,...,A plen: Son incompatibles dos a dos, Ai

Teorema de la probabilidad total

Sea A 1 , A2 ,...,A

n

que cum-

∩ Aj = φ.

La unión de todos ellos es el suceso seguro,

5.9.1.

n



n i=1 Ai

= S.

un sistema completo de sucesos tales que la probabilidad de cada uno

de ellos es distinta y sea Blaun suceso cualquier del que conocen condicionales P (Bde Aicero, ), entonces probabilidad del suceso B se viene dadalas porprobabilidades la expresión:

|

|

|

|

P (B) = P (A1 )P (B A1 ) + P (A2 )P (B A2 ) + ... + P (An )P (B An ).

5.10.

(5.20)

Teorema de Bayes

En el año 1763, dos años después de la muerte de Thomas Bayes (1702-1761), se publicó una memoria en la que aparece, por vez primera, la determinaci´ on de la probabilidad de las causas a partir de los efectos que han podido ser observados. El c´ alculo de dichas probabilidades recibe el nombre de teorema de Bayes. Sea A 1 , A2 ,...,A n un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P (B Ai ). entonces la probabilidad P (Ai B) viene dada por la expresión:

|

|

P (Ai B) =

|

|

|

P (Ai )P (B Ai ) P (Ai )P (B Ai ) = . P (B) P (A )P (B A ) + P (A )P (B A ) + ... + P (A )P (B A ) 1 1 2 2 n n (5.21)

|

|

|

99

5. Probabilidad

5.11.


A continuación una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. Con los jugadores de un club de f´ utbol se forman dos equipos para jugar un partido de entrenamiento; entre los dos equipos se reúnen 6 defensas, 8 medios, 6 delanteros y 2 porteros. El entrenador sabe que en estos partidos, la probabilidad de que se lesione un jugador es 0.22 si es delantero, 0.11 si es medio, 0.055 si es defensa y 0 si es portero. (a) Calcular la probabilidad de que se lesione uno cualquiera de los jugadores en este partido. (b) Si se sabe que un jugador se ha lesionado, determinar la probabilidad de que haya sido un defensa. 2. Tras un estudio estad´ıstico en una ciudad se observa que el 70 % de los motoristas son varones y, de estos, el 60 % llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con casco es del 40 %. Se pide: (a) Calcular la probabil idad de que un motorista elegido al azar lleve casco. (b) Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de que sea varón? 3. En una ciu dad, el 35 % vota al part ido A, el 45 % vota al part ido B y el resto se abstiene. Se sabe además que el 20% de los votantes de A, el 30% de los de B y el 15 % de los que se abstienen, son may ores de 60 años. Se pide: (a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 a˜ nos. (b) Hallar la probabilidad de que un ciudadano mayor de 60 a˜ nos se haya abstenido. 4. Los alumnos de Primero de Biolog´ıa tienen que realizar dos pruebas, una teórica y otra práctica. La probabilidad de que un estudiante apruebe la parte te´ orica es de 0.6, la probabilidad de que apruebe la parte pr´ actica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. (a) ¿Son independientes los sucesos aprobar la parte teórica y la parte práctica? (b) ¿Cuál es la probabilidad de que un alumno no apruebe ninguno de los dos exámenes? (c) ¿Cuál es la probabilidad de que un alumno apruebe solamente uno de los dos exámenes? (d) Se sabe que un alumno aprobó la teor´ıa. ¿Cu´ al es la probabilidad de que apruebe tambi´ en la pr´ actica? 5. En una baraja de 40 cartas. (a) Se toman dos cartas sin reemplazamiento. ¿Cuál es la probabilidad de que las dos sean de distinto n´ umero? (b) Y si se toman tres cartas, ¿Cuál es la probabilidad de que los tres números sean distintos? 6. Tenemos un dado con tres “1”, dos “2” y un “3”. Lo tiramos dos vec es consecutivas y anotamos la suma de los resultados. (a) ¿Cu´ al es el Espacio Muestral? (b) ¿Cuál es la probabilidad de que la suma sea 4? (c) ¿Cu´ al es la suma más probable? ¿Cuánto vale su probabilidad?

100

5.11. Problemas de final de cap´ıtulo 7. Tenemos dos dado s A y B, ambos trucados. En el dado A hay tres “1” y tres “2” y en el dado B hay dos “1” y cuatro “2”. Se elige un dado al azar y se tira. (a) ¿Cu´ al es la probabilidad de obtener un “1”? (b) Sabiendo que se ha obtenido un “2”, ¿Cu´ al es la probabilidad de que se haya elegido el dado B? 8. En una caja hay x bolas blan cas y 1 bola roja. Al extraer de la caja dos bolas al azar sin reemplazamiento, la probabilidad de que sean blancas es 1/2. Calcula el n´ umero de bolas blancas que debe tener la caja. 9. El 35 % de los créditos de un banco es para vivienda, el 50 % para industrias y el 15 % para consumo diverso. Resultan fallidos el 20 % de los cr´ editos para vivienda, el 15 % de los créditos para industrias y el 70 % de los créditos para consumo. Calcula la probabilidad de que se pague un crédito elegido al azar. 10. El volumen de producción en tres plantas diferentes de una fábrica es de 500 unidades en la primera, 1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades defe ctuosas producidas en cada planta es del 1 %, 0.8 % y 2 %, respectivamente, calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa. 11. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas. El 75 % de los ingeni eros o cupan un puesto directivo y el 50 % de los econom istas tambi´ en, mientras que de los no ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea ingeniero? 12. Se toman dos barajas españolas de 40 cartas. Se extrae al azar una carta de la primera baraja y se introduce en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se extrae una carta, que resulta ser el dos de oros. ¿Cu´ al es la probabilidad de que la primera carta extra´ıda fuese una espada? 13. En un conjunto de estudiantes el 15 % estudia alemán, el 30 % estudia francés y el 10 % ambas materias. (a) ¿Son independientes los sucesos estudiar alemán y estudiar franc´ es?. (b) Si se elige un estudiante al azar, calcule la probabilidad de que no estudie franc´ es ni alem´ an. 14. Un ladrón, al huir de un polic´ıa, puede hacerlo p or las calles A, B o C, con probabilidades p(A) = 0, 25, p(B) = 0, 6 y p(C ) = 0, 15 respectivamente. La probabilidad de ser alcanzado por la calle es 0,4 si huye por la calle B es 0,5 y si huye por la calle C es 0,6. (a) Calcule la probabilidad de que la polic´ıa alcance al ladrón. (b) Si el ladrón ha sido alcanzado, ¿cuál es la probabilidad de que haya sido en la calle A? 15. De una urna con 4 bolas blan cas y 2 negras se extraen al azar, suces ivamente y sin reemplazamiento, dos bolas, (a) ¿Cuál es la probabilidad de que las bolas extra´ıdas

101

5. Probabilidad sean blancas? (b) Si la segunda bola ha resultado ser negra, ¿cu´ al es la probabilidad de que la primera tambi´ en lo haya sido? 16. Sean A y B dos sucesos de un experimen to aleatorio tales que : P (A) = 0, 6, P (B) = 0, 5 y P (Ac B c ) = 0, 7. (a) Calcúlese P (A B) y razónese si los sucesos A y B son independientes. (b) Calc´ ulese P (A B).

∪

∩

∪

17. En un estudio realizado en cierta Universidad se ha determinado que un 20 % de sus estudiantes no utilizan los transportes públicos para acudir a sus clases y que un 65 % de los estudiantes que utilizan los trans portes públicos tambi´ en hacen uso del comedor universitario. Calcular la probabilidad de que seleccionado al azar un estudiante en esa Universidad resulte ser usuario de los transportes p´ ublicos y del comedor universitario. Justificar la respuesta. 18. Una urna contiene dos monedas de plata y tres de cobre. Otra contiene cuatro monedas de plata y tres de cobre. Si se elige una urna al azar y se extrae una moneda al azar. ¿Cuál es la probabilidad de que la moneda extra´ıda sea de plata?. 19. Un dado está trucado de manera que son iguales las probabilidades de obtener 2, 4 o 6, también son iguales las probabilidades de obtener 1, 3 o 5 y la probabilidad de obtener 2 es doble que la probabilidad de sacar 1. Deducir razonadamente cu´ al es la probabilidad de que al lanzar el dado dos veces se obtenga una suma igual a 7. 20. Una experiencia aleatoria consiste en preguntar a tres personas distint as, elegidas al azar, si son partidarias o no de consumir un determinado producto. (a) Escribe el espacio muestral asociado a dicho experimento, utilizando la letra s para las respuestas afirmativas y n para las negativas. (b) ¿Qu´ e elementos del espacio muestral anterior constituyen el suceso A:= al menos dos de las personas son partidarias de ¯ consumir el producto ? (c) Describe el suceso contrario de A:= más de dos personas son partidarias de consumir el producto .

}

{

}

{

21. En un supermercado el 70 % de las compras las realizan las mu jeres; de las compras realizadas por estas, el 80 % supera las 600 BsF, mientras que de las compras realizadas por hombres sólo el 30 % supera esa cantidad . (a) Elegido un ticket de compra al azar, ¿cuál es la probabilidad de que supere las 600 BsF? (b) Si se sabe que el ticket de compra no supera las 600 BsF ¿cu´ al es la probabilidad de que la compra haya sido hecha por una mujer? 22. Se extrae una carta de una baraja española de 40 cartas. Si la carta extra´ ıda es un rey, nos dirigimos a la urna I; en caso contrario a la urna II. A continuaci´ on, extraemos una bola. El contenido de la urna I es de 7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. Halla: (a) La probabilidad de que la b ola extra´ıda sea blanca y de la urna II. (b) La probabilidad de que la bola extra´ıda sea negra.

102

5.11. Problemas de final de cap´ıtulo 23. En una ciudad el 55 % de los habitantes consume pan integral, el 30 % consume pan de multicereales y el 20 % consume ambos. Se pide: (I) Sabien do que un habitante consume pan integral, ¿cuál es la probabilidad de que coma pan de multicereales? (II) Sabiendo que un habitante consume pan de multicereales, ¿cu´ al es la probabilidad de que no consume pan integral? (III) ¿Cuál es la probabilidad de que una persona de esa ciudad no consuma ninguno de los dos tipos de pan? 24. Si A y B son dos suce sos tales que: P (A) = 38 , P (B) = P (Ac

∩ Bc).

1 2

B) = 14 . Calcula

y P (A

∩

25. Tengo dos urnas, dos bolas blan cas y dos bolas negra s. Se desea saber como debo distribuir las bolas en las urnas para que, al elegir una urna al azar, sea m´ axima la probabilidad de obtener una bola blanca. La única condición exigida es que cada una tenga al menos una bola. 26. Se estima que sólo un 20 % de los que compran acciones en Bolsa tiene n conocimientos burs´ atiles. De ellos el 80 % obtienen benefic ios. De los que comp ran acciones sin conocimientos bursátiles, sólo un 10% obtienen beneficios. Se desea saber: (a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios. (b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido beneficios, ¿cuál es la probabilidad de que tenga conocimientos burs´ atiles? 27. El equipo directivo de cierta empresa del sector de hosteler´ıa está constituido por 25 personas de las que un 60 % son mujeres. El gerente tiene que seleccio nar a una persona de dicho equipo para que represente a la empresa en un certamen internacional. Decide lanzar una moneda: si sale cara, selecciona a una mujer y si sale cruz, a un hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan inglés, determina, justificando la respuesta, la probabilidad de que la persona seleccionada hable inglés. 28. Dos personas piensan cada una de ellas un número del 0 al 9. Calcula la probabilidad de que las dos personas no piensen el mismo n´ umero. 29. Dos sucesos tienen probabilidades 0,4 y 0,5. Sabiendo que son independientes, calcula la probabilidad de que no suceda ninguno de los dos. 30. En una Universidad exis ten tres facu ltades: A, B y C. En A hay matriculadas 150 chicas y 50 chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos. (a) Calcula la probabilidad de que un estudiante, elegido al azar, sea chico. (b) Si un estudiante elegido al azar resultara ser chico, ¿cu´ al es su facultad más probable? 31. Se escuchan tres discos y se vuelven a guardar al azar. ¿Cu´ al es la probabilidad de que al menos uno de los discos haya sido guardado en el envoltorio que le correspond´ıa?

103

5. Probabilidad 32. Se considera una c´ elula en el instante t=0. En el instante t=1 la célula puede: bien reproducirse, dividiéndose en dos, con probabilidad 3/4, o bien morir con probabilidad 1/4. Si la célula se divide, entonces en el tiempo t=2 cada uno de sus dos descendientes puede también subdividirse o morir, con las mismas probabilidades que antes, independientemente uno de otro. (a) ¿Cuántas células es posible que haya en el tiempo t=2? (b) ¿Con qu´ e probabilidad? 33. Una caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas consecutivamente de la caja. Calcula la probabilidad de que las dos sean blancas si: (a) Antes de extraer la segunda bola se vuelve a meter la primera en la caja. (b) La segunda bola se extrae sin haber metido la primera en la caja. 34. Un monedero contiene 2 monedas de plata y 3 de cobre, y otro contiene 4 de plata y 3 de cobre. Si se elige un monedero al azar y se extrae una moneda ¿Cu´ al es la probabilidad de que sea de plata? 35. En una oficina el 70% de los empleados son asturianos. De entre los asturianos, el 50 % son hombres, mientras que de los no asturianos, sólo son hom bres el 20 %. ¿Qu´ e porcentaje de empleados no asturianos son mujeres? (a) Calcula la probabilidad de que un empleado de la oficina sea mujer. (b) Fernando trabaja en dicha oficina. ¿Cuál es la probabilidad de que sea asturiano? 36. El 12 % de los habitantes de un pa´ıs padece cierta enfermedad. Para el diagnóstico de esta, se dispone de un procedimiento que no es completamente fiable ya que da positivo en el 90 % de los casos de personas realmente enfermas, pero también da positivo en el 5 % de person as sanas. ¿Cuál es la probabilidad de que esté sana una persona a la que el procedimiento le ha dado positivo? 37. En un ayuntamiento hay 5 concejales del partido A, 4 del B y 1 del C. Si se eligen al azar y sucesivamente tres concejales, ¿cuál es la probabilidad de que los tres sean del partido A? ¿y la de que pertenezcan a partidos distintos? 38. Un dado ha sido trucad o de manera que la probabil idad de sacar un número par es el doble que la de sacar un número impar. Se lanza el dado y se pide: La probabilidad de obtener un número par (a) Si, a la vez, se lanza un dado no trucado, la probabilidad de obtener un número par y un número impar. (b) Si, a la vez, se lanza un dado no trucado, la probabilidad de obtener, al menos, un n´ umero impar.

104

6. Variable aleat oria y función de distribuci´ on Whether statistics be an art or a science... or a scientific art, we concern ourselves little. It is the basis of social and political dynamics, and affords the only secure ground on which the truth or falsehood of the theories and hypotheses of that complicated science can be brought to the test. - Lambert-Adolphe-Jacques Quetelet. Letters on the Theory of Probabilities (1846), trans. O. G. Downes (1849).

6.1.

Introducci´ on

En este tema se tratará de formalizar numéricamente los resultados de un fenómeno aleatorio. Por tanto, una variable aleatoria es un valor numérico que corresponde a un resultado de un experimento aleatorio. Algunos ejemplos son: n´ umero de caras obtenidas al lanzar seis veces una moneda, número de llamadas que recibe un teléfono durante una hora, tiempo de fallo de una componente eléctrica, etc. El estudio que se hará en este tema será análogo al que se hace con las variables estad´ısticas en descriptiva. As´ ı retomaremos el concepto de distribuci´ on y las caracter´ısticas numéricas, como la media y varianza. El papel que all´ı jugaba la frecuencia relativa lo juega ahora la probabilidad. Esto va a proporcionar aspectos y propiedades referentes a fen´ omenos aleatorios que permitirán modelos muy estudiados en la actualidad. En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleatorias a un nivel muy general, lo que nos permitir´ a manejar los modelos estad´ısticos para describir los posibles resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen. Tanto en la vida cotidiana como en el campo cient´ıfico estamos habituados a observar fen´ omenos aleatorios cuyos resultados se expresan mediante n´ umeros; por ejemplo el voltaje de salida en una fuente de alimentación, el número de personas en la cola del cine, la velocidad de conexión a la red, etc. Incluso en problemas de naturaleza puramente cualitativa es muy frecuente recurrir a la codificación num´ erica; en situaciones tales como: el diagnóstico de un paciente sano o enfermo, preguntas del tipo ¿estudias o trabajas?, etc., las respuestas son usualmente codificadas con 0 y 1, aunque en realidad podr´ıa emplearse cualquier pareja de s´ımbolos con igual precisi´ on.

105

6. Variable aleatoria y función de distribución

6.2.

Variable aleatoria unidimensional

Este proceso de cuantificación nos lleva de manera natural a considerar la siguiente definici´ on: Dado un experimento aleatorio y asociado al mismo, un espacio probabil´ıstico (E,A,P ), una variable aleatoria (V.A.) es una aplicaci´ on X : E R, a cada valor de X , del espacio muestral le hace corresponder un número real. Se dice que X es una variable aleatoria si para cualquier x perteneciente a R, el conjunto de los sucesos elementales le hace corresponder un valor que verifica:

→

∀X ∈

R,

X (S )

≤X

(6.1)

Ejemplo 6.1 Consideramos un experimento aleatorio de lanzar una moneda al aire tres veces y anotamos el resultado. Se define la variable aleatoria X como número de caras aparecidas en los tres lanzamientos. Calcular el espacio muestral y comprobar que es una variable aleatoria. La soluci´ on es la siguiente, el espacio muestral está dado por E = (C,X,X ), (X,C,X ), (X,X,C ), (C,C, en donde Eventos φ (X,X,X ) (C,C,C )(X,C,X )(X,X,C ) (C,C,X )(C,X,C )(X,C,C ) (C,C,C )

Valor de la v.a. X 0 0 X 1 1 X 2 2 X 3 X >3

≤ ≤ ≤ ≤ ≤ ≤ ≤

En general emplearemos las siglas v.a. para referirnos a una variable aleatoria. Para caracterizar la distribución de probabilidad inducida por una v.a. X definiremos una nueva función más sencilla de manejar: Definici´ on. (Funci´ on de distribución). Dada la v.a. X se denomina función de distribución asociada a X , a la función F : R R definida por:

→

F (t) = P r[X

≤ t] = P r(X ∈ (−∞, t]), ∀t ∈

R.

(6.2)

Las propiedades más importantes de las funciones de distribución son:

−∞) = l´ımn→−∞ P r[X ≤ t] = 0. ∞ ≤ t] = 0.

1. F (

2. F ( ) = l´ımn→  ∞ P r[X

3. La función es continua por la derecha, es decir, l´ımh→0+ F (t + h) = F (t) 4. F es no decreciente, es decir, si t 1 < t2 entonces F (t1 ) Teorema. Una función F : R cuatro propiedades anteriores.

106

R

→

≤ F (t2).

se dice que es de distribución si y sólo si verifica las

6.3. Variables discretas

6.3.

Variables discretas

Definici´ on. (Variable discreta) . Una variable aleatoria discreta es aquella que s´ olo puede tomar valores dentro de un conjunto finito o infinito numerable. Definici´ on. (Funci´ on de probabilidad) . Sea X una v.a. discreta que toma los valores xi con probabilidades pi = P r(X = xi ), con i pi = 1. Se denomina funci´ on de probabilidad de la variable X a la función que asigna a cada x i su probabilidad p i . En las variables aleatorias discretas la función de distribución viene dada por la siguiente expresi´ on: F (t) = P r[X t] = P r(xi ). (6.3)



≤



xi t

≤

Esta función es escalonada, no decreciente, con saltos de discontinuidad en los puntos xi . El valor del salto en xi coincide con la probabilidad, pi , de dicho valor.

6.4.

Variables continuas

Definici´ on. (Variable continua). Una variable aleatoria continua es aquella que toma valores en uno o varios intervalos de la recta real. En las v.a. continuas la función de distribución no se puede calcular como la suma de las probabilidades de ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. Para abordar esta nueva situaci´ on necesitamos la noción de función de densidad. Definici´ on. (Funci´ on de densidad) . Dada una v.a. continua X , su función de densidad es la función real de variable real f (x) = l´ım h

P r(x

− h ≤ X ≤ x + h) . 2h

→0+

(6.4)

De este modo, surge el concepto de función de densidad como la función l´ımite a la cual se aproxima el histograma. As´ı, la probabilidad de un intervalo (a, b) será el área limitada por esta función de densidad, las rectas x = a, x = b y el eje de abscisas. Aunque, de acuerdo con la anterior, la probabilidad de que la variable aleatoria tome un valor concreto es igual a cero, tiene sentido analizar lo denso que est´ a repartida la probabilidad en torno a ese valor. De la definición anterior, se deduce que la funci´ on de densidad verifica las siguientes propiedades: f (x) > 0,



∀x ∈

R,

(6.5)

−∞ f (x)dx = 1.

(6.6)

∞

107

6. Variable aleatoria y función de distribución En general, cualquier función real que verifica las propiedades anteriores es la funci´ on de densidad de alguna v.a. continua X . La función de distribución de una v.a. continua X se expresa a partir de la funci´ on de densidad como: F (t) =



t

f (x)dx,

−∞

∀x ∈

R

(6.7)

Esta función es continua. Por lo tanto, la función de densidad de una v.a. continua es la derivada de su funci´ on de distribuci´ on, f (x) = F  (x).

6.5.

Caracter´ısticas de una v.a.

Las medidas resumen definidas para v.e. pueden generalizarse al caso de variables aleatorias, sin más que equiparar las frecuencias relativas de variables estad´ısticas con las probabilidades de las variables aleatorias. Entre los descriptores más habituales de las variables aleatorias se encuentran los siguientes.

6.5.1.

Definici´ on. (Esperanza Matem´ atica)

Cuando se realiza un experimento determinista el resultado del experimento es ´ unico en contraposición con un experimento aleatorio en el cual existen un intervalo de valores, según la variable aleatoria definida, donde es posible que ocurra cualquier resultado. En ocasiones, por simplicidad, se aproxima la forma de explicar un experimento aleatorio en términos de un experimento determinista pero con la dificultad de no tener argumentos suficientes para escoger el resultado único que se asociar´ıa al experimento determinista. El conocimiento del concepto de valor esperado ayuda a eliminar la dificultad planteada. Dada una v. a. X definida sobre (E,A,Pr), se denomina esperanza o valor medio de X a la siguiente expresión µ = E (X ) =

 

xi P (xi ),

si X es discreta,

(6.8)

xi S X

µ = E (X ) =

∈ ∞

xf (x)dx,

si X es continua

(6.9)

−∞

La esperanza de una v.a. verifica las siguientes propiedades: E (aX + b) = aE (X ) + b. E (X

± Y ) = E (X ) ± E (Y ).

Si X e Y son independientes, entonces E (XY ) = E (X )E (Y ).

(6.10) (6.11) (6.12)

La estructura de la Ecuación 4.1 se presenta en otros contextos, como por ejemplo en Mec´ anica, donde la función de densidad de probabilidades tiene el sentido de la distribución de la masa a lo largo de un eje y el valor esperado se corresponde con el centro de esa masa.

108

6.6. Inecuación de Chevyshev En el contexto de la teor´ıa de probabilidades una variable aleatoria estará definida en un cierto intervalo cuyo centro es su valor esperado. En este sentido, se podr´ıa decir que el experimento aleatorio está definido alrededor del valor esperado y la ponderaci´ on de cada uno de los posibles resultados viene dada en términos del valor de la funci´ on de densidad correspondiente en cada punto. El concepto del valor esperado permite aglutinar en un n´ umero los aportes ponderados de cada uno de los posibles resultados del experimento. Ejemplo 6.2 Una v.a. Y cuya función de densidad de probabilidad está dada por la ex-

−

≥

presi´ on: f (y) = exp( λy), cuando y 0 y cero para cualquier otro valor. Hallar el valor esperado de dicha función de densidad de probabilidad.

6.5.2.

Definici´ on. (Varianza)

En la sección anterior se analizó la definición de valor esperado tanto desde el punto de vista matemático como desde el punto de vista del fen´ omeno aleatorio involucrado. Este valor permite ubicar rápidamente la región donde está definida la variable como aquella regi´ on que se encuentra alrededor del valor esperado. Pero no proporciona informaci´ on acerca del tamaño de esa región. Una medida de la dispersión o de la concentración de la variable alrededor de su valor esperado lo proporciona la varianza. La varianza de una v.a. X viene dada por la expresión



σ 2 = V ar(X ) = E (X σ 2 = V ar(X ) = E (X

− µ)2

  =

− µ)2



=

 

∈ ∞

− µ)2P (xi),

si X es discreta, (6.13)

− µ)2f (x)dx,

si X es continua (6.14)

(xi

x i SX

(x

−∞

La varianza de una v.a. verifica las siguientes propiedades: V ar(X )  0. V ar(aX + b) = a 2 V ar(X ). V ar(X ) = E (X 2 )

(6.15) (6.16)

− E(X )2.

(6.17)

Si X e Y son independientes, V ar(X + Y ) = V ar(X

− Y ) = V ar(X ) + V ar(Y(6.18) ).

Ejemplo 6.3 Una v.a. Y cuya función de densidad de probabilidad est´ a dada por la expresi´ on: f (y) = exp( λy), cuando y 0 y cero para cualquier otro valor. Hallar la varianza de dicha función de densidad de probabilidad.

−

6.6.

≥

Inecuaci´ on de Chevyshev

La definición de variable aleatoria y de las funciones de distribución y de densidad refleja el comportamiento del experimento aleatorio que se est´ a analizando. Se ha verificado en diversas oportunidades que la forma de las funciones de distribuci´ on y de densidad debe

109

6. Variable aleatoria y función de distribución seguir un cierto patrón que obliga a que no todo tipo de funci´ on puede ser considerada para este tipo de representación. En este orden de ideas, el conocimiento del valor esperado y la varianza proporciona información adicional acerca de la forma de estas funciones y, en consecuencia, de las probabilidades asignadas a diversos tipos de eventos. Este tipo de información llega hasta el extremo de indicar topes en el valor de la probabilidad de ocurrencia de ciertos eventos para cualquier tipo de variable aleatoria. La inecuación de Chevyschev permite conocer un l´ımite al valor que puede tener la probabilidad de un cierto tipo de evento independientemente de la forma de su funci´ on de densidad de probabilidades. Definici´ on: Sea una variable aleatoria X de la cual sólo conocemos su valor esperado E (X ) y su varianza V (X ). Sea un evento del tipo X E (X ) kσX , entonces la probabilidad de ocurrencia de este evento tiene un valor m´ınimo que es una funci´ on del valor real positivo k y no depende de la forma de la funci´ on de densidad de probabilidades de X. 1 P X E (X ) kσX  1 (6.19) k2 Notas:

 −

 −

≤

≤

−

El valor m´ınimo de la probabilidad del evento mencionado se calcula utilizando el lado derecho de la Ecuación anterior. La expresión anterior se conoce como la inecuación de Chevyschev.

6.7.


A continuación una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. Se lanza al aire una moneda tres ve ces. Calcula la función de masa y la de distribución de X : No de cruces obtenido. 2. Se ha comprobado experimentalmente que la vida útil de una bater´ıa es una variable aleatoria cuya función de densidad es: f (x) = be −ax ,

si x

≥ 0, con a, b ≥ 0.

(6.20)

Determina la relación entre a y b. Obt´ en la funci´ on de distribución de la variable y calcula la probabilidad de que una bater´ ıa dure un tiempo mayor a 1/a. Sol. P=0,3678 3. Un PEQ consta de 10 pregunt as tipo test, cada una de ellas con 4 posibles respuestas. Cada pregunta contestada correctamente es un punto. Cada fallo descuenta 0,5 puntos. Como será la calificación del alumno si éste contesta a todas al azar.

110

6.7. Problemas de final de cap´ıtulo 4. Por experiencia se sabe que la probabilidad de que llames al ambulator io y no comunique es de 0,25. Demuestra matemáticamente que el número esperado de llamadas que debes hacer para que te cojan es de 4. 5. Una variable aleatoria tiene por función de densidad: f (x) =

1 2 (x + 1), 12

si 0

≤ x ≤ 3.

(6.21)

Calcular la media de X y su varianza. Sol. µ = 2,0625, σ 2 = 0,5461. 6. Los retrasos en las entregas de los pedidos en una fábrica respecto de la planificación establecida siguen una variable aleatoria cuya función de densidad es: f (x) =

2 1 , π 1 + x2

si

−1 ≤ x ≤ 1.

(6.22)

Cu´ al es el retraso medio de un pedido y la desviaci´ on t´ıpica. Propone un intervalo de tiempos de retraso, cen trado en el retraso medio , para el 90 % de los casos. Sol. µ = 0, σ 2 = 2,28, (-0,84; 0,84) 7. Una fábrica de coches vende de media, al año, 50 unidades de su modelo m´ as caro, con una desviación t´ıpica de 10. Cu´ antos coches de este modelo debe de tener disponibles si se quiere garantizar la demanda al momento de estos veh´ıculos, con una probabilidad del 95 %? Sol. 95 coches

111

7. Distribuciones de Probabilidad Binom ial y Normal If we betake ourselves to the statistical method, we do so confessing that we are unable to follow the details of each individual case, and expecting that the effects of widespread causes, though very different in each individual, will produce an average result on the whole nation, from a study of which we may estimate the character and propensities of an imaginary being called the Mean Man. - James Clerk Maxwell . ’Does the Progress of Physical Science tend to give any advantage to the opinion of necessity (or determinism) over that of the continuency of Events and the Freedom of the Will?’ In P. M. Hannan (ed.), The Scientific Letters and Papers of James Clerk Maxwell (1995), Vol. 2, 1862-1873, 818.

7.1.

Introducci´ on

Estudiaremos en este tema dos de las distribuciones de probabilidad m´ as importantes y que son imprescindibles a la hora de adentrarnos en el estudio de la inferencia estad´ıstica. La distribución binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que sólo pueden tomar un número finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705), qui´ en escribi´ o el primer tratado importante sobre probabilidad, Ars conjectandi (El arte de pronosticar). Los Bernoulli formar on una de las sagas de matem´ aticos más importantes de la historia. La distribución normal es un ejemplo de las distribuciones continuas, y aparece en multitud de fenómenos sociales y cient´ıficos. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los más famosos matemáticos de la historia. La gráfica de la distribución normal en forma de campana se denomina Campana de Gauss.

7.2.

La distribución binomial o de Bernoulli

La distribución binomial está asociada a experimentos del siguiente tipo: Realizamos n veces cierto experimento en el que consideramos s´ olo la posibilidad de éxito o fracaso. La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o fracaso en las dem´ as ocasiones.

113

7. Distribuciones de Probabilida d Binomial y Normal La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión. Veámoslo con un ejemplo. Tiramos un dado 7 veces y contamos el n´ umero de cincos que obtenemos. ¿Cuál es la probabilidad de obtener tres cincos?. Este es un t´ıpico ejemplo de distribuci´ on binomial, pues estamos repitiendo 7 veces el experimento de lanzar un dado. ¿Cuál es nuestro éxito?. Evidentemente, sacar un 5, que es en lo que nos fijamos. fracaso, será 5, sino sacar cualquier otro número. éxito 1 = El E= sacarpor untanto, 5 p(E ) no = sacar p(F )Por = 56tanto, . 6 , Fracaso = F = no sacar un 5

{

}→ 

{

}→ 

Para calcular la probabilidad que nos piden, fijémonos en que nos dicen que sacamos 3 cincos y por lo tanto tenemos 3 éxitos y 4 fracasos, ¿de cuántas maneras pueden darse estas posibilidade s?. Podr´ıamos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF. Pero tambi´ en podr´ıamos sacar EFEFFFE, es decir que en realidad estamos calculando de cu´ antas maneras se pueden ordenar 4 fracasos y 3 éxitos. Recordando las técnicas combinatorias, este problema se reduce a calcular las permutaciones con elementos repetidos: P73,4 = Y por tanto, como p(E ) =

1 6

· · · ·

7! 7 6 5 = =35formas 3!4! 3 2 1

y tengo 3 éxitos y p(F ) =

p(tener 3 éxitos y 4 fracasos) = 35

(7.1) 5 6

y tengo 4 fracasos:

· 16 · 16 · 16 · 56 · 56 · 56 · 56 = 0,0781

(7.2)

Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de éxito 16 , la probabilidad de obtener 3 éxitos es 0.0781, y lo expresar´ıamos:

 

Bin 7;

1 , entonces p(x = 3) = 0 ,0781 6

(7.3)

Como repetir este proceso ser´ıa bastante penoso en la mayor´ıa de los casos, lo mejor es recurrir a la siguiente fórmula que expresa la probabilidad de obtener cierto n´ umero de éxitos en una distribuci´ on binomial.

7.2.1.

Definici´ on de distribución binomial

Si realizamos n veces un experimento en el que p odemos obtener éxito, E, con probabilidad p y fracaso, F, con probabilidad q (q = 1 p), diremos que estamos ante una distribuci´ on binomial de parámetros n y p, y lo representaremos por Bin(n; p). En este caso la probabilidad de obtener k e´xitos viene dada por:

−

p(x = k) =

114

n − k pk q(n k) =



n k pk (1



− p)(n−k)

(7.4)

7.2. La distribución binomial o de Bernoulli

−

Observar que las probabilidades de éxito y fracaso son complementarias, es decir, q = 1 p y p = 1 q , por lo que basta saber una de ellas para calcular la otra.

−

   ·

Ejemplo 7.1 Antes ten´ ıamos Bin 7; 16 , y quer´ ıamos calcular p(X = 3) (obtener 3 éxitos). Aplicando la fórmula: 7 3

p(x = 3) =

13 5 4 = 0,0781. 6 6

·

(7.5) 

Ejemplo 7.2 Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. En este caso Exito = E = tener hijo y p(E ) = 0,5. Fracaso = F = tener hija y p(F ) = 0,5. Estamos por tanto ante una binomial Bin(6;0 ,5) y nos piden p(X = 2). Si aplicamos la f´ ormula es: 6 p(x = 2) = 0,52 0,54 = 0,2344. (7.6) 2

 ·

·

La elección de éxito o fracaso es subjetiva y queda a elección de la persona que resuelve el problema, pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo anterior, si: Exito = tener hija , como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos, si el éxito es tener hija hemos de plantearnos cu´ al es la probabilidad de tener 4 éxitos (4 hijas), es decir: p(x = 4) =

6

0,54 0,52 = 0,2344.

(7.7) 4 Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el éxito y el fracaso y la pregunta que nos hagan.

 ·

7.2.2.

·

El uso de la s tablas de la di stribución binomial

La distribución binomial se encuentra tabulada por lo que es fácil calcular probabilidades sin necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribución binomial es necesario conocer: El número de veces que se realiza el experimento (n). La probabilidad de éxito (p). El número de éxitos (k). La probabilidad p se busca en la primera fila (valores desde 0.01 hasta 0.5). El número de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y el número de éxitos a su lado.

115

7. Distribuciones de Probabilida d Binomial y Normal Ejemplo 7.3 Por ejemplo en el caso anterior, Bin(6;0 ,5) , p(X = 2), la columna p = 0,5 es la última, y cuando n = 6 y k = 2 encontramos 0.2344, el valor que hab´ıamos calculado. El caso en que p > 0,5, no se encuentra tabulado. La razón es bien sencilla. Si p > 0,5, entonces q < 0,5 y basta intercambiar los papeles de éxito y fracaso para que podamos utilizar la tabla. Ejemplo 7.4 La probabilidad de que un alumno de 2do de Bachillerato apruebe las Ma-

tem´ aticas es de 0.7. Si consideramos un grupo de 8 alumnos, ¿cu´ al es la probabilidad de que cinco de ellos aprueben las Matemáticas?. Si éxito = aprobar y fracaso = suspender, entonces p = 0,7 y q = 0,3. Tenemos, por tanto, una Bin(8;0 ,7). Nos piden calcular p(X = 5), que no se puede calcular mediante las tablas porque p = 0,7 y s´ olo tenemos hasta p = 0,5. Por tanto si intercambiamos éxito = suspender y fracaso = aprobar entonces p = 0,3, q = 0,7, es decir la nueva binomial es Bin(8;0 ,3) y nos piden que aprueben 5 de 8, es decir que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 éxitos, p(X = 3), y buscando en la tabla es p(X = 3) = 0 ,2541. Tambi´ en, desde luego podr´ıamos haber utilizado la fórmula desde el principio, utilizar la Bin(8;0 ,7) y olvidarnos de tablas para hacer: p(x = 5) =

7.2.3.

 · 8 5

0,75 0,33 = 0,254.

·

(7.8)

Probabilidades acumuladas

Es posible que nos pidan no s´ olo la probabilidad de que ocurran un cierto n´ umero de éxitos en concreto, sino que ocurran como mucho k e´xitos o preguntas similares. En el ejemplo anterior, por ejemplo, podr´ıan pedirnos: a) ¿Cuál es la probabilidad de que aprueben como mucho 2 alumnos?. Si éxito = aprobar y fracaso = suspender, p = 0,7 y q = 0,3, entonces nos piden p(X 2). En este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o ninguno, es decir:

≤

p(X

≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0 ,0001 + 0,0012 + 0,01 = 0 ,1013

(7.9)

(haz las cuentas). b) ¿Cuál es la probabilidad de que aprueben entr e 3 y 6 alumnos (inclusive)?. Del mismo modo: p(3

≤ X ≤ 6)

= p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) = 0,0467 + 0,1361 + 0,2541 + 0,2965 = 0,7334

Hemos de tener en cuenta que para la distribuci´ on binomial, en las tablas s´ olo se admiten valores hasta n = 10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de utilizar la fórmula.

116

7.3. La distribución Normal Ejemplo 7.5 Los alumnos de cierta clase se encuentran en una proporci´ on del 67% que estudian ingl´ es y el resto franc´ es. Tomamos una muestra de 15 alumnos de la clase, calcular: a) Probabilidad de que al menos encontremos tres alumnos de ingl´ es. b) Probabilidad de que los 15 alumnos estudien ingl´ es. c) Probabilidad de que estudien ingl´ es entre 7 y 10 alumnos. Si éxito = estudiar ingl´ es, p = 0,67 y fracaso = estudiar franc´ es, q = 1 0,67 = 0 ,33. Manejamos por tanto una Bin(15;0 ,67). Para la parte a), se tendrá

−

p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + ... + p(X = 15).

(7.10)

Una opci´ on es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la fórmula para calcular cada una, la tarea se puede hacer bastante larga. Otra opci´ on, más sencilla, es pasar al complementario. El complementario de encontrar al menos 3 alumnos de ingl´ es es encontrar como mucho 2 alumnos de ingl´ es, p(X 2) . Es decir,

≤

− p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0 ) + p(X = 1 ) + p(X = 2)) (7.11) y s´ olo tenemos que calcular 3 probabilidades: p(X = 0) ∼ 0 , p(X = 1) = 0 ,000001, p(X > 3) = 1

p(X = 2) = 0 ,000026 (compru´ ebalo!). Por lo cual, p(X > 3) = 1

− (0 + 0,000001 + 0,000026) = 1 − 0,000027 = 0 ,999973

(7.12)

Para la parte b), se tendrá p(X = 15) = 0 ,0025

(7.13)

(aplica la fórmula). Para la parte c), se tendrá p(7

7.2.4.

≤ X ≤ 10)

=

p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10) =

= 0,0549 + 0,1114 + 0,1759 + 0,2142 = 0,5564.

Media y desviación t´ıpica en una distribuci´ on binomial

Aunque no se demostrará, en una distribución binomial Bin(n; p), el número esperado de éxitos o media, viene dado por ¯x = np. (Recordemos que la media es una medida de centralizaci´ on). La desviación t´ıpica, σ , que es una medida de dispersi´ on y mide lo alejados que est´ an los datos de la media, viene dada por σ = npq.

√

7.3.

La distribución Normal

Al estudiar aspectos tan cotidianos como: Caracteres morfológicos de individuos ( personas, animales, plantas) de una misma raza. como tallas, pesos, envergaduras, etc.

117

7. Distribuciones de Probabilida d Binomial y Normal Caracteres fisiológicos, como el efecto de una misma dosis de un f´ armaco, o de una misma cantidad de abono. Caracteres sociológicos, como el consumo de ciertos productos por individuos de un mismo grupo humano. Caracteres psicológicos, como el cociente intelectual, grado de adaptación a un medio. Caracteres f´ısicos, como la resistencia a la rotura de ciertas piezas. todos ellos tienen en común que se distribuyen normalmente. ¿Qu´ e quiere decir esta expresión?. Pues, por ejemplo, si hacemos una estad´ıstica para conocer la altura de 1400 mujeres y representamos los resultados en un diagrama de barras, obtenemos:

Figura 7.1.: Distribución de estaturas de 1400 mujeres.

Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino hasta llegar a la parte central del recorrido, donde est´ a la mayor´ ıa de ellos. Definici´ on: Diremos que una distribución de probabilidad sigue una distribución normal de media ¯x y desviación t´ıpica σ, y lo representaremos por N (¯x; σ) cuando la representación gráfica de su función de densidad es una curva positiva continua, simétrica respecto a la media, de máximo en la media, y que tiene 2 puntos de inflexi´ on , situados a ambos lados de la media (¯x σ y x¯ + σ respectivamente) y a distancia de σ ella, es decir de la forma: Dependiendo de los valores que tomen ¯x y σ, la gráfica de esta función puede ser más o menos alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetr´ıa, continuidad, etc, rese˜ nadas anteriormente. El concepto de función de densidad introducido anteriormente no se estudiar´ a con profundidad. Baste decir que la función de densidad determina la forma de cada distribuci´ on de probabilidad. En el caso de la distribución normal de parámetros ¯x y σ, dicha función viene dada por: x)2 (x−¯ 1 f (x) = 2πσ 2 e− 2σ 2 (7.14)

−

√

118

7.3. La distribución Normal

1

Figura 7.2.: Distribución normal N (¯x; σ). El máximo está en (¯x, √2πσ 2 ).

Propiedad: El área encerrada bajo la curva normal N (¯x; σ) siempre es 1. La demostración de este resultado no es nada sencilla e implica el uso de resultados matemáticos que exceden el nivel de este curso. De entre todas las curvas normales N (¯x; σ), la más sencilla, usada y conocida es aquella que tiene por media 0 y por desviación t´ıpica 1, N (0, 1). Esta normal estándar se suele representar por Z . La gráfica de esta curva se denomina campana de Gauss y se puede observar en la figura:

Figura 7.3.: Distribución normal N (0; 1). El máximo está en (0 , √12π ). Su función de densidad será: f (x) =

√12π e−

x2

(7.15)

2

Puesto que el área bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente manera: Para un valor cualquiera k, definimos la probabilidad de que la distribución Z , N (0; 1), sea meno r o igual que k como: p(Z

≤ k) = Area encerrada bajo la curva normal

N (0, 1) desde

−∞ hasta k

(7.16)

(es decir la parte rayada de la figura siguiente). Ahora bien, ¿cómo calcular dicha área?. Fácil: Dichas áreas o probabilidades se encuentran tabuladas.

119

7. Distribuciones de Probabilida d Binomial y Normal

Figura 7.4.: Area encerrada por la curva normal desde

7.3.1.

Uso de las t ablas de l a distribución normal

−∞ hasta k.

N (0;1)

La normal N (0; 1) se encuentra tabulada, para valores a partir de 0 y hasta 3.99. Si p or ejemplo queremos calcular p(Z 2,78), hemos de realizar los pasos:

≤

Buscar la parte entera y las décimas en la primera columna (en este caso 2.7). Buscar las cent´ esimas en la primera fila (en este caso 8). En el punto común a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada, en este caso 0.9973. Por tanto p(Z 2,78) = 0,9973.

≤

Si queremos calcular una probabilidad de un valor mayor que 3.99, basta fijarse en que las probabilidades correspondientes a valores tales como 3.62 y mayores ya valen 0.9999 (pr´ acticamente 1). Por eso, para estos valores mayores que 3.99, diremos que la probabilidad es aproximadamente 1. As´ı: p(Z 5,62) 1 aunque no aparezca en la tabla. Por otra parte, fijémonos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del tipo p(Z = k), ya que siempre valen 0, al no encerrar ning´ un área. Por tanto, si nos pidiesen p(Z = 3,2), basta decir que p(Z = 3,2) = 0. Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se denominan distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por ejemplo la binomial, que es una distribuci´ on discreta. As´ı, al pasar al complementario, si tenemos Z > k, su complementario será Z < k, pero como incluir k no influye en la probabilidad, al calcular probabilidades podemos escribir:

≤

p(Z > k) = 1

∼

− p(Z < k) = 1 − p(Z ≤ k)

(7.17)

Sólo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer y hay que ser cuidadosos con el paso al complementario. Ejemplo 7.6 Buscar en la tabla de la normal estándar N (0;1) las probabilidades: a) p(Z 1,15), b) p(Z 0,5), c) p(Z 0,82), d) p(Z 1,05), e) p(Z 4,27), f ) p(Z 18,09).

≤≤

120

≤

≤

≤

≤


7.3.2.

C´ alculo de otras probabilidades

Si k es positivo y queremos calcular p(Z > k), es decir el área rayada: basta pasar

Figura 7.5.: p(Z > k). Basta pasar al complementario.

al complementario, es decir: p(Z > k) = 1 encuentra tabulada.

− p(Z ≤ k) y esta última probabilidad ya se

Ejemplo 7.7 Calcular p(Z > 0,3) y p(Z > 2,07).

≤−

Si k es positivo y queremos calcular p(Z k), es decir el área: por simetr´ ıa, p(Z k) = p(Z > k) y ésta se calcula como en el caso anterior. Se puede observar la

≤−

Figura 7.6.: p(Z

≤ −k). Las probabilidades de valores negativos no est´ an tabuladas.

igualdad de áreas en la figura:

≤ −0,78) y p(Z ≤ −3,2). Si k es positivo y queremos calcular p(Z > −k), es decir el área rayada: entonces, por simetr´ıa p(Z > −k) = p(Z ≤ k): Ejemplo 7.8 Calcular p(Z

Ejemplo 7.9 Calcular p(Z >

−0,96) y p(Z > −1,01). 121


Figura 7.7.: p(Z

≤ −k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior.

Figura 7.8.: p(Z >

−

Figura 7.9.: p(Z > k) = p(Z está tabulado.

Figura 7.10.: p(k1

−k).

≤ k). La simetr´ıa permite reducir

≤ Z ≤ k2). Probabilidad comprendida entre dos valores.

Probabilidades comprendidas entre dos valores, p(k1 rayada: se calcula restando las áreas:

122

este caso al que ya

Z

≤ ≤

k 2 ) ,es decir el área


≤

Figura 7.11.: p(Z k 2 ) en la primera imagen. p(Z mos el área pedida.

≤ k1) en la segunda. Al restar obtene-

−

≤ Z ≤ 1,49) y p(−1,32 ≤ Z ≤ −0,57). Ejemplo 7.11 Calcular p(Z = 2), p(Z ≤ 2) , p(Z > 2) , p(Z ≤ −2), p(Z > −2), p(−2 ≤ Z ≤ 2) , p(0,81 ≤ Z ≤ 1,33). Ejemplo 7.10 Calcular p( 0,96

7.3.3.

C´ alculo de probabilidades en normales

N (¯ x; σ )

Si no tenemos una distribución N (0;1), sino una N (¯x; σ) cualquiera, ¿¿cómo calcular probabilidades, si no tenemos tabla salvo para N (0; 1)?. El siguiente resultado nos da la respuesta. Propiedad: Si X sigue una distribución N (¯x; σ), entonces la variable Z = Xσ−x¯ sigue unapaso distribuci´ n N (0, 1).X (El de la ovariable variable X ).

→ N (¯x; σ) a la

Z

→ N (0; 1) se denomina tipificación de la

Ejemplo 7.12 Las estaturas de 600 soldados se distribuyen de acuerdo a una distribución normal de media 168 y desviación t´ıpica 8 cm. ¿Cu´ antos soldados miden entre 166 y 170 cm?. Sea X la distribución de los soldados , X es una N (168, 8). Nos piden p(166 X 170). Utilizando el resultado anterior, primero restamos x = 168 en la desigualdad: p(166 X 170) = p(166 168 X 168 170 168) = p( 2 X 168 2). Y ahora dividimos entre σ = 8, con lo que acabamos de tipificar: p(166 X 170) = 2 X −168 2 X −168 p( 2 X 168 2) = p = Z , ésta ya es normal 8 8 8 . Llamando a 8 N (0, 1) y se encuentra en las tablas: p(166 X 170) = p( 0,25 Z 0,25) = p(Z 0,25) p(Z 0,25) = ( tablas) = 0,5987 0,4013 = 0,1974, (pues p(Z 0,25) = p(Z > 0,25) = 1 p(Z 0,25) = 1 0,5987 = 0,4013).

≤

≤

≤ ≤ − ≤ − ≤ − ≤− − ≤

−

− ≤ −

≤ − ≤ ≤ ≤ ≤ −

−



Ejemplo 7.13 En una distribución N (22, 5), calcula: p(X p(15 X 20) , p(17 X 30) .

≤ ≤

≤ ≤

−

− ≤ − ≤ ≤ ≤ ≤ ≤ ≤ ≤−

27) , p(X > 27) , p(X > 125),

≤ 123

7. Distribuciones de Probabilida d Binomial y Normal Ejemplo 7.14 Los pesos de 60 soldados siguen una distribuci´ on N (67, 5). Calcula la probabilidad de que el peso sea: a) mayor de 80 kg, b) 50 kg. o menos, c) menos de 60 kg, d) 70 kg, e) entre 60 y 70 kg inclusive.

7.3.4.

Otro uso de la s ta blas

≤

Hasta ahora nos han dado la distribución normal N (0; 1) y nos ped´ıan p(Z k) siendo k un cierto número, y nos ped´ıan calcular dicha probabilidad. Ahora bien, otra pregunta puede ser: Dado que en una normal N (0; 1) sabemos que p(Z k) = 0,9573, ¿qui´ en es k?. La resolución es bien sencilla. Basta buscar 0.9573 dentro de la tabla de la distribuci´ on normal, y lo encontramos en el cruce de la fila 1.7 con la columna 2, y por lo tanto k debe ser 1.72.

≤

Ejemplo 7.15 Calcular k si: a) p(Z

≤ k) = 0,8078. b) p(Z ≤ k) = 0,0028.

En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´ on normal, pueden ocurrir dos posibilidades: Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada uno de ellos, por ejemplo: p(Z k ) = 0,7982. En este caso el valor buscado será la media entre los valores extremos. Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores 0.7967 (que corresponde a 0.83) y 0.7996 (que corresponde a 0.84). Por tanto el valor de k será:

≤

0,83+0,84

2 k= = 0,835. Si el valor está entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor, por ejemplo: p(Z k) = 0,7970. El valor más cercano es 0.9767 (que corresponde a 0.83) y como el valor buscado est´ a muy cerca de él, entonces directamente k = 0,83.

≤

Si la distribución no es normal N (0; 1), sino N (¯ x; σ), tendremos que tipificar previamente.

≤

Ejemplo 7.16 si X sigue una normal N (6;3) y p(X k) = 0,9082, calcula k . Tik −6 k−6 = 0,9082 p Z = 0,9082 pificando: p X3−6 , y buscando en la tabla, 3 3 k−6 k 6 = 3,99 k = 9,99. 3 = 1,33



→ −

≤



→

→



≤



≤ k) = 0,6141 y X sigue una N (15, 4). Ejemplo 7.18 De una variable normal N (¯x; σ) se sabe que p(X ≤ 7) = 0 ,9772 y p(X ≤ 6,5) = 0 ,8413. Calcular: a) x ¯ y σ . b) p(5,65 X 6,25). c) El número k tal que p(X > k) = 0,3. ≤ ≤ Ejemplo 7.17 Calcular k si p(X

124

7.4. Relación entre la distribución binomial y la distribución normal

7.4.

Relación entre la distribución binomial y la distribución normal

Es un hecho comprobado que cuando tenemos una distribución Bin(n; p), a medida que n crece, es dif´ıcil hacer uso de las fórmulas y/o tablas. Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cincos (inclusive). 1 Si éxitouna = obtener cinco entonces p = 1/6 y fracaso = no y las q tablas = 5/6. Tenemos Bin 100; X 33). Esobtener inviablecinco aplicar 6 , y nos piden p(20 (pues repetimos el experimento 100 veces) y tampoco la f´ ormula pues es inviable calcular, por ejemplo, 100 1 3 5 6 p(X = 32) = 2 8 (7.18) 32 6 6

 

≤

≤

 ·  · 

¿Cómo resolver el problema?. Del siguiente modo.

7.4.1.

Teorema del L´ımite Central

La distribución binomial Bin(n; p) se aproxima a una curva normal de media ¯x = np y desviaci´ on t´ıpica σ = npq, cuando n tiende a , es decir, cuando n se hace muy grande. La aproximación se puede aplicar (es una buena aproximaci´ on) sólo si n es grande, en concreto n > 30 y además np > 5 y nq > 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una distribuci´ on normal. En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El precio que hay que pagar por pasar de una a otra se denomina correcci´ on por continuidad y consiste en hacer determinados ajustes para que la aproximaci´ on realizada sea lo más precisa posible. As´ı, si nos piden p(X = k) en una distribución binomial X , y aproximamos X por una distribuci´ on normal, y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en una distribución continua todas estas probabilidades valen 0. La corrección por continuidad consiste en tomar un peque˜ no intervalo de longitud 1 alrededor del punto k. De otro modo, si nos piden p(X = k) con X binomial, con la aproximación normal Y deberemos calcular p(k 0,5 Y k + 0,5). Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos ejemplos. Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y k 0,5). La explicación de que haya que restar 0.5 y no sumarlo es que queremos que X sea menor estrictamente que k, con lo cuál, si sumase 0.5 , el propio k aparecer´ıa en la probabilidad a calcular y NO debe aparecer.

√

∞

−

−

≤ ≤

≤

125


≤

Por contra, si debi´ esemos calcular p(X k), con X binomial, fij´ emonos que ahora k SI está incluido en la probabilidad y por tanto al aproximar por la normal Y deber´ ıamos calcular p(Y k + 0,5). Comprender estos dos hechos es fundamental para realizar bien la correcci´ on por continuidad al aproximar una distribución binomial por una normal.

≤



√

Ejemplo 7.19 En el caso anterior, x ¯ = np = 100 npq = 500 6 = 16,67 y σ = 36 = 3,73. De modo que, como n > 30, np = 16,67 > 5 y nq = 83,33 > 5, se pude aproximar la binomial por la normal, es decir: X

→ Bin

 ∼ 100;

1 6

Y

→ N (16,67;3 ,73)



(7.19)



−16,67 Y −16,67 33,5−16,67 = 33+0,5) = p 19,53,73 Entonces: p(20 X 33) ∗ p(20 0,5 Y 3,73 3,73 p(0,89 Z 4,51) = p(Z 4,51) p(Z 0,89) 1 0,8133 = 0 ,1867. Notemos que en el paso señalado por (*) hemos cambiado X (binomial) por Y (normal) y se ha realizado la correcci´ on por continuidad.

≤ ≤

126

≤ ≤

≤

∼

− ≤ ≤ − ≤ ∼ −

≤

≤

8. Estimaci´ on puntual e intervalos de confianza. Inferencia estad´ıstica. To call in the statistician after the experiment is done may be no more than asking him to perform a postmortem examination: he may be able to say what the experiment died of. - Sir Ronald Aylmer Fisher . Indian Statistical congress, Sankhya, c.1938.

8.1.

Introducci´ on

La razón por la que llevamos a cabo una investigaci´ on estad´ıstica es para obtener una comprensi´ on de los fenómenos en una población de estudio. Por ejemplo, si uno quisiera tratar de averiguar si un cierto tratamiento basado en una cierta medicina es eficaz en el tratamiento de una cierta enfermedad, uno deber´ıa levar a cabo un experimento para saber esto. Sn embargo, dos cosas pasan. En primer lugar no es ético distribuir a una población el medicamento sin tener conclusiones acerca de su funcionamiento y consecuencias. Esto no es parte de la estad´ıstica, aqu´ı no nos preocupamos p or eso. En segundo lugar no es factible distribuir un fármaco experimental para toda la poblaci´ on, la cual pudiera ser mucha cantidad. En lugar de ésto, uno pudiera estudiar un pequeño subconjunto de la población la cual sabemos se llama muestra. A continuaci´ on, se analiza la muestra y se tratan de hacer inferencias acerca de la poblaci´ on basándose en la muestra. Usando la teor´ıa de la probabilidad y el l´ımite central Teorema, se puede entonces medir la fiabilidad de la inferencia. Esto puede no ser siempre una tarea fácil. A menudo se encuentra bastante complicado. Sin embargo, tenemos métodos que nos aseguran buenas inferencias. Ve´ amos como se hace esto. Ejemplo 8.1 Lupe está tratando de vender su casa y tiene que determinar el valor de mercado de la vivienda. la población en este ejemplo ser´ıa todos los hogares que son similares a la suya en el barrio.El agente de bienes ra´ıces de Lupe elige para la muestra las ultimas ´ nueve casas en ese barrio que se venden en los ´ ultimos seis meses. El agente de bienes ra´ıces a continuaci´ on, ajusta algunos de los precios de venta para dar cuenta de las diferencias entre la casa de Lupe y las casas otras vendidas. Imagine que la muestra de las ´ ultimas 9 casas vendidas determinan los precios en miles de Bs.F, Muestra=420, 430, 430, 440, 450, 460, 470, 470, 480. A continuaci´ on, el agente de bienes ra´ıces toma la media de la muestra ajustada y recomienda a Lupe un valor de mercado de su casa de Bs.F. 450.000. La inmobiliaria ha hecho una inferencia sobre el

127

8. Estimación puntual e intervalos de confianza. Inferencia estad´ıstica.

valor de la media de la poblaci´ on. Para medir la fiabilidad de la inferencia, el agente de bienes ra´ıces debe tener en cuenta factores como: el tama˜ no de la muestra pudiera ser muy peque˜ no, las casas puede haber cambiado su valor en los ´ ultimos seis meses, o que la casa de Lupe no es exactamente igual la muestra hogares. En lo que sigue vamos a empezar a definir y establecer la metodolog´ıa para probar fiabilidades de este tipo.

8.2.

Estimaci´ on puntual

El ejemplo anterior es un ejemplo de estimación, una rama de la estad´ıstica inferencial donde las estad´ısticas de la muestra se utilizan para estimar los valores de un parámetro de la población. El agente de bienes ra´ıces de Lupe estaba tratando de estimar la media de la población (µ), basado en la media de la muestra (¯ x). De ahora en adelante es necesario hacer una distinci´ on entre estimadores y parámetros. LLamaremos estimadores a las medidas que corresponden a la descripci´ on de la muestra, miestras que llamaremos parámetros de la descripción de la población.

Media Varianza Desv. estándar Proporción

Estad´ısticos (Muestra) ¯x s2 s pˆ

Par´ ametros (Poblaci´ on) µ σ2 σ p

Cuadro 8.1.: Definición de estadisticos y parámetros. En el ejemplo anterior, el agente inmobiliario de Lupe calcula la media poblacional de las casas similares en el barrio de Lupe mediante el uso de la media muestral de Bs.F. 450.000 el precio ajustado de los hogares incluidos en la muestra.

8.2.1.

Intervalo de Estimación

Una estimación puntual es nuestra mejor estimación de un parámetro de la población, sin embargo, probablemente no es exactamente igual al par´ ametro. En su lugar, podemos elegir un rango de valores que se denomina, intervalo de estimaci´ on, que es probable que incluya el valor del parámetro de la población. Si el intervalo de estimación es simétrico, la distancia entre el estimador puntual a los puntos finales del intervalo de estimación, se llama el margen de error. Ejemplo 8.2 En el ejemplo anterior, el agente inmobiliar io de Lupe podr´ıa decir que la media de la poblaci´ on real esta entre Bs.F. 425.000 y Bs.F. 475.000, lo que permite

128

8.3. Intervalos de confianza

un margen de Bs.F. 25.000 de error de la estimaci´ on srcinal de Bs. F. 450.000. Este intervalo de estimación tambi´ en puede ser escrito tambi´ en como Bs.F. 450.000 25.000.

±

8.3.

Intervalos de confianza

Con probabilidad y el teorema del l´ımite central, podemos diseñar un intervalo de estimación que podemos llamar intervalo de confianza que tiene una probabilidad conocida (nivel de confianza) de capturar el parámetro real de la población.

8.3.1.

Intervalo de confianza para la media poblacional

Para encontrar un intervalo de confianza para la media poblacional ( µ) cuando la desviación estándar de la población (σ) es conocida, y n es suficientemente grande, podemos usar la función de distribución de probabilidad normal estándar para calcular los valores cr´ıticos para el Nivel de Confianza:

Figura 8.1.: Nivel de confianza para la media poblacional.

Intervalo de confianza = ¯x

± Zc · √σn ,

(8.1)

donde ¯x es la media de la muestra y Zc es el valor cr´ıtico en la distribución normal. Se tendr´ a revisando una tabla de la distribución normal que: Ejemplo 8.3 El Decano de la Facultad quiere estimar el número medio de horas trabajadas por semana por los estudiantes. La muestra de 49 estudiantes mostró una media de 24 horas con una desviación estándar de 4 horas. El punto estimación es de 24 horas (media de la

129

8. Estimación puntual e intervalos de confianza. Inferencia estad´ıstica. c: nivel de confianza 0.90 0.95 0.99

Zc : valor cr´ ıtico 1.645 1.960 2.578

Cuadro 8.2.: Valores cr´ıticos para distintos niveles de confianza.

muestra). ¿Cu´ al es el intervalo de confianza del 95% para el n´ umero promedio de horas trabajadas a la semana por los estudiantes? 24

√49· 4 = 24 ± 1,12 = [22,88;25 ,12]horas por semana. ± (1,96)

(8.2)

El margen de error para el intervalo de confianza es de 1.12 horas. Podemos decir con confianza del 95 % que el número de horas trabajadas por los estudiantes es de entre 22.88 y 25.12 horas a la semana. Si el nivel de confianza es mayor, entonces el margen de error también se incrementar´ a. Por ejemplo, si se aument ar el nivel de confianza de 99 % para el ejemplo anteri or, entonces: (2,578) 4 24 = 24 1,47 = [22,53;25 ,47]horas por semana. (8.3) 49

± √ ·

±

Algunos puntos importantes acerca de los intervalos de confianza El intervalo de confianza se construye con variables aleatorias calculado a partir de datos de la muestra y los intentos de predecir un par´ ametro desconocido de la población fija con un determinado nivel de confianza. Aumentar el nivel de confianza siempre aumentará el margen de error. Es imposible constr uir un intervalo de confianza del 100 % sin hacer un censo de toda la población. Piense en la media de la poblaci´ on como un dardo que siempre va al mismo lugar, y el intervalo de confianza como un blanco en movimiento que trata de atrapar el dardo. Un intervalo de confianza del 95 % ser´ıa como un ob jetivo que tiene un 95 % de posibilidades de agarrar el dardo.

8.3.2.

Intervalo de con fianza para la media pobl acional usando la desvia ción est´ andar de la muestra. Distribuci´ on t de Student

La fórmula para el intervalo de confianza para la media requiere el conocimiento de la desviaci´ on estándar de la población (σ). En la mayor´ıa de los problemas de la vida real,

130

8.3. Intervalos de confianza no conoce este valor por las mismas razones por las que no se conoce la media poblacional. Este problema fue resuelto por el estad´ıstico irlandés William Sealy Gosset, un empleado de elaboración de la cerveza Guiness. Gosset, sin embargo, fue castigado por Guiness por ´ publicó bajo el el uso de su propio nombre en la publicaci´ on de art´ıculos cient´ ıficos. El nombre de A Student , y por lo tanto la distribución que descubrió fue llamada distribuci´ on t de Student .

Caracter´ısticas de la distribuci´ on t de Student Es continua, con forma de campana, y simétrica alrededor de cero como la distribuci´ on normal. Existe una familia de t-distribuciones que comparten una media de cero pero con diferentes niveles desviaciones estándares basadas en grados de libertad. La distribuci´ on t de Student está más dispersa y más plana en el centro que la distribución normal, pero se aproxima a la distribución normal cuando el tamaño de la muestra se hace más grande. Su intervalo de confianza para µ es

Figura 8.2.: Distribución t de Student.

Intervalo de confianza = ¯x

± tc · √sn ,

(8.4)

donde ¯x es la media de la muestra y t c es el valor cr´ ıtico en la distribución t de Student y tiene n 1 grados de libertad.

−

131

8. Estimación puntual e intervalos de confianza. Inferencia estad´ıstica. Ejemplo 8.4 El año pasado, un estudiante trabajaba en una Organizaci´ on de No Gubernamental (ONG) que ten´ıa una calificaci´ on de 62 (en una escala de 0-100) en un rating internacional que evalua el desempe˜ no de organizaciones; esto se basó en los registros acumulados sobre la ONG durante un largo per´ıodo de tiempo. Este a˜ no el estudiante cambió a una nueva ONG. Para evaluar la calificación de la nueva ONG, 20 miembros de la ONG se sondearon y se consiguió una nueva calificación promedio de 65 con una desviaci´ on est´ andar de 10. Encontrar e interpretar un intervalo de confianza del 95 % para el promedio de la calificación de la nueva ONG. Para este caso, la distribución t de Student tendrá 20-1 = 19 grados de libertad. Usando una tabla para esta distribución o una calculadora, el valor cr´ıtico para el intervalo de confianza del 95 % será tc = 2, 093, as´ ı 65

√20· 10 = 65 ± 4,68 = [60 ,32;69 ,68]calificación de la ONG . ± (2,093)

(8.5)

Con un 95 % de confianza, podemos decir que la calificación de la nueva ONG es de entre 60,32 y 69,68. As´ı la calificaci´ on de 62 de la anterior ONG est´ a en el intervalo de confianza, por lo cual, no podemos decir con una certeza del 95 % que la nueva ONG sea mejor o peor que la anterior ONG.

8.3.3.

Intervalo de confianza para la proporción poblacional

Recordemos de los cap´ıtulos anteriores sobre variables aleatorias de la distribución binomial, donde se representaba a la proporción de éxitos en una poblaci´ on dada. El modelo binomial era análogo a la situación de lanzar una moneda con resultados de cara o sello, es decir, una dicotom´ıa en los resultados del muestreo. En la pr´ actica, algunas veces, queremos utilizar las estad´ısticas de la muestra para estimar la proporción de la población. La proporción de la muestra (ˆp) es la proporción de éxitos en una muestra de tama˜ no n, y es un estimador puntual de p, es decir, la proporción poblacional. Según el teorema del l´ımite central, si np > 5 y n(1 p) = nq > 5, la distribución de la proporción de la muestra

−



tendr´ a una distribución aproximadamente normal. En este caso µpˆ = p y σpˆ = p(1n−p) . Us´ ando esta información podemos construir un intervalo de confianza para p, la proporción de la población tiene un intervalo de confianza Intervalo de confianza = ˆp

±Z



p(1

− p) ≈ pˆ ± Z

n



p(1 ˆ

− p)ˆ .

n

(8.6)

Ejemplo 8.5 A 200 conductores de Maracaibo se les muetreó mientras manejaban por la cuidad al azar y se descubrió que 25 de estos conductores estuvieron ilegalmente hablando por tel´ efono celular sin el uso de un dispositivo de manos libres. Encuentre el estimador puntual para la proporción de conductores que están utilizando sus tel´ efonos celulares ilegalmente y construir un intervalo de confianza del 99 %. 25 = 0,125 o 12.5%. El estimador puntual para p es pˆ = 200

132


Un intervalo de confian za del 99 % para p es: Intervalo de confianza = 0,125



± 2,576

−

0,125(1 0,125) = 0,125 200

± 0,060.

(8.7)

El margen de error para esta encuesta es del 6 % y se puede decir con un 99 % de confianza que el porcentaje real de los conductores que usan sus tel´ efonos celulares ilegalmente oscila entre 6,5 % y 18,5 %.

8.3.4.

Estimador puntual para la desviación est´ andar de la poblaci´ on

A menudo queremos estudiar la variabilidad, la volatilidad o la consistencia de una población. Por ejemplo, digamos que hacemos dos inversiones en la bolsa de valores tal que ambas tiene n ingresos esper ados de 6 % por año, pero una inversión es mucho más arriesgada que la otra, teniendo mayores altibajos. Para estimar la variación o la volatilidad de un conjunto de datos, vamos a utilizar la desviaci´ on estándar de la muestra como un estimador puntual de la desviación estándar de la población. Por ejemplo, las inversiones A y B son ambas conocidas por tener una tasa de rendimiento de 6 % al año. En los últimos 24 meses, la inversión A tiene desviación estándar muestral del 3 % por mes, mientras que para la inve rsión B, la desviación estándar muestral es del 5 % mensual. Dir´ıamos que la inversi´ on B es más volátil y riesgosa que la inversión A debido a la mayor estimación de la desviación estándar. Para crear un intervalo de confianza para la estimaci´ on de la desviación estándar, tenemos que introducir una nueva distribución, llamada la distribución Chi-cuadrado ( χ2 ).

La distribuci´ on Chi-cuadrado La distribución Chi-cuadrado es una familia de distribuciones relacionadas con la distribuci´ on normal, ya que representa una suma de cuadrados de las variables aleatorias normales independientes. Al igual que la distribuci´ on t de Student, ésta tiene grados de libertad iguales a n 1 y determinan la forma de la distribución. Además, como el Chicuadrado representa datos al cuadrado, la inferencia será aproximadamente la varianza en lugar de la desviación estándar. La distribución Chi-cuadrado ( χ2 ) es asimétrica positiva y adem´ as es no negativa. Se basa en grados de libertad ( n 1) igual como la t de Student.

−

−

8.3.5.

Intervalo de confianza para la varianza y desviación est´ andar de la poblaci´ on

Dado que la distribución Chi-cuadrado representa datos al cuadrado, podemos construir intervalos de confianza para la población y sacar la ra´ız cuadrada de la varianza de los extremos para obtener un intervalo de confianza para la desviación estándar de la población. Debido a la asimetr´ıa de la distribuci´ on Chi-cuadrado el intervalo de confianza resultante

133

8. Estimación puntual e intervalos de confianza. Inferencia estad´ıstica.

Figura 8.3.: Distribución Chi-cuadrado.

no estará centrada en el estimador puntual, por lo que el margen de error no se entiende como en los casos anteriores.

Intervalo de confianza para la varianza de la poblaci´ on La confianza no es simétrica ya que la distribuci´ on Chi-cuadrado no es simétrica. Tome la ra´ız cuadrada de ambos extremos para obtene el intervalo de confianza de la desviaci´ on estándar de la población. As´ı se tendra que Intervalo de confianza =



(n

− 1)s2 , (n − 1)s2 χ2R

χ2L



.

(8.8)

Ejemplo 8.6 En la medición del rendimiento de las inversiones, la desviaci´ on estándar es una medida de la volatilidad o el riesgo. Veinte meses de rentabilidades de un fondo de inversión muestran un rendimiento medio mensual del 1 % y muestra una desviación est´ andar de 5 %. Encuentre un intervalo de confianza del 95 % para la desviación estándar mensual de los fondos de inversión.

La distribuci´ on Chi-cuadrado tendr´ a 20 1 = 19 grados de libertad. Usando una calculadora, los dos valores cr´ıticos para la Chi-cuadrado son: χ2L = 9,90655 y χ2R = 32,8523,

−

134


con lo cual se tendrá que Intervalo de confianza =





19 52 19 52 , = [3,8; 7,3]. 32,8523 8,90655

·

·

(8.9)

Se puede decir con un 95 % de confianza de que la desvi ación estándar para este fondo de inversión es de entr e 3,8 % y 7,3 % por me s.

135

9. Pruebas de hip ótesis de una población What the use of P [the significance level] implies, therefore, is that a hypothesis that may be true may be rejected because it has not predicted observable results that have not occurred. - Sir Harold Jeffreys . Theory of Probability (1939), 316.

9.1.

Introducci´ on

En la sección anterior hemos utilizado la inferencia estad´ıstica para hacer una estimación de un parámetro de la población y medir la fiabilidad de la estimaci´ on a trav´ es de un intervalo de confianza. En esta sección, vamos a explorar en detalle el uso de la inferencia estad´ıstica en la prueba de una afirmación sobre un parámetro de la población, que es el coraz´ on del método cient´ıfico utilizado en la investigaci´ on.

9.2.

Procedimientos de comprobación de hipótesis y el m´ etodo cient´ıfico

La realización real de una prueba de hip´ otesis es sólo una pequeña parte del método cient´ıfico. Despu´ es de formular una pregunta general, el método cient´ıfico consiste en: el dise˜ no de un experimento, la recogida de datos a través de la observación y la experimentaci´ on, la comprobación de hipótesis y elaboración de informes de la de conclusiones generales. Las conclusiones se llevan a otras ideas de investigación haciendo de este proceso de un flujo continuo de incorpora al acervo de conocimientos sobre los fen´ omenos que se estudian. Otros pueden elegir un conjunto m´ as formal y detallado de los procedimientos, pero los conceptos generales de la inspiraci´ on, diseño, experimentación y conclusión permiten ver todo el proceso. Las preguntas más generales comenzar con una inspiración o una idea sobre un tema o fen´ omeno de inter´ es. Algunos ejemplos de preguntas generales: (Cuidado de la Salud) ¿Un sistema de servicio público de salud será más eficaz que un sistema de seguro privado en términos de atención? (Mano de obra) ¿Cuál es el efecto de la inmigración indocumentada y la externalización de puestos de trabajo en la tasa de desempleo.

137

9. Pruebas de hipótesis de una población (Econom´ıa) ¿es el paquete de medidas del gobierno un est´ımulo econ´ omico eficaz para disminuir el impacto de la recesión? (Educaci´ on) ¿son demasiado caros los colegios para los estudiantes de hoy? Es importante no ser tan espec´ıfico en la elección de estas cuestiones generales. Sobre la base de datos potencialmente disponibles, podemos decidir más tarde qué hip´ otesis espec´ıficas de la investigaci´ on se formulará y se probarán para abordar la cuestión general. Durante recopilaci´ n de datos algunas otras ideas de pruebas puede n resultar y p odemos optar porlaredefinir la opregunta general.

9.3.

Diseño de hipótesis de investigación y la experimentación

Despu´ es de desarrollar un problema general y que tengan alg´ un sentido a los datos que están disponibles o para ser recogidos, es tiempo de dise˜ nar un experimento y un conjunto de hipótesis.

9.3.1.

Las hipótesis y prueba de hipótesis

Para propósitos de prueba, es necesario diseñar hipótesis que son declaraciones sobre los par´ ametros de la población. Algunos ejemplos de hipótesis son: Al menos el 20 % de los delincuentes juveniles son capturados y condenad os a prisión. El ingreso promedio mensual de los graduados universitarios es de Bs.F. 1500. Las tasas de cáncer de pulmón en Maracaibo son más bajas que las tasas de Caracas. La desviación estándar de la Bolsa de Caracas hoy es mayor 10 puntos porcentuales que la de años anteriores. Estas mismas hipótesis podr´ıa escribirse en notación simbólica: pdelincuentes > 0,20, µingresos > 1500, pM ar < p Car y σ bolsa > 10, respectivamente. La prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teor´ıa de probabilidades, que se utiliza para determinar si la hipótesis es una afirmación razonable y no debe ser rechazada, o no es razonable y por tanto debe ser rechazada. La hip´ otesis que se prueba se llama la hipótesis nula designado por el s´ımbolo H0 . Si la hipótesis nula no es razonable y debe ser rechazada, entonces la investigaci´ on estar´ ıa apoyada por una hipótesis alternativa designada por el s´ımbolo Ha . As´ı entonces, la hipótesis nula ( H0 ): es una declaración sobre el valor del par´ ametro de una población que se supone que es cierto para el propósito de la prueba. Por el contrario, la hip´ otesis alternativa (Ha ): es una declaraci´ on sobre el valor del parámetro de una población que se supone que es verdadera si la hipótesis nula es rechazada durante la prueba.

138

9.3. Diseño de hipótesis de investigación y la experimentación A partir de estas definiciones, es claro que la hip´ otesis alternativa debe contradecir la hip´ otesis nula, ambas no pueden ser verdad al mismo tiempo. Otros puntos importantes acerca de hipótesis: Las hipótesis deben ser enunciados acerca de los par´ ametros de población, nunca acerca de las estad´ısticas de la muestra.

≤≥

En la mayor´ıa de las pruebas de hipótesis, la igualdad (= , , ) se asocia con la hip´ otesis nula, mientra s la desigualdad ( =,<,> ) se asociará con la hipótesis alternativa.



La hipótesis nula es la que siempre se prueba en un intento de refutarla y apoyar por tanto apoyar la hipótesis alternativa. Este proceso es análogo al concepto de un prueba por contradicción, o reducción al absurdo, en matemáticas o en lógica, pero apoyar una hip´ otesis con un nivel de confianza no es lo mismo que una prueba matem´ atica absoluta. Algunos ejemplos de hipótesis nulas y alternativas, son los siguientes: Hip´ otesis nula Hipótesis alternativa H0 : p delincuentes 0,20 Ha : p delincuentes > 0,20 H0 : µ ingresos 1500 Ha : µ ingresos > 1500 H0 : p M ar p Car Ha : p M ar < pCar H0 : p M ar = p Car Ha : p M ar = p Car H0 : σ bolsa > 10 Ha : σ bolsa 10

≤ ≤ ≥

9.3.2.

 ≤

Modelo estad´ıstico y estad´ıstico de prueba

Para probar la hipótesis tenemos que utilizar un modelo estad´ıstico que describe el comportamiento de los datos y el tipo de parámetro de la población que se está probando. Debido al teorema del l´ımite central, muchos modelos estad´ ısticos son de la familia normal, los más importantes, las distribuciones Z , t de Student, χ 2 , y F . Otros modelos en los que no es apropiado usar el teorema del l´ımite central se llaman modelos no param´ etricos y no ser´ an discutidos aqu´ı. Cada modelo elegido tiene requisitos para los datos, llamados supuestos del modelo, que deben revisarse para su adecuación. Por ejemplo, muchos modelos requieren la media de la muestra, estos tienen aproximadamente una distribución normal. Una vez que se elije el modelo, podemos determinar un estad´ıstico de prueba, un valor derivado de los datos que se utilizará para decidir si rechazar o no rechazar la hip´ otesis nula. Algunos ejemplos de modelos estad´ıstico y estad´ısticos de prueba, son los siguientes: Modelo estad´ıstico Media vs. valor hipotético Proporción vs. valor hipotético

Estad´ıstico de prueba t := x¯−sµ0 n Z := pˆ−p0 n

√

√p (1−p ) √ 0

Varianza vs. valor hipotético

χ2 :=

0

2

2 (n σ1)s

−

139

9. Pruebas de hipótesis de una población

9.3.3.

Los er rores en la Toma de Deci siones

Cada vez que tomamos una decisión o apoyamos una posición, siempre hay una posibilidad de que se haga mal la elecci´ on. El proceso de comprobación de hipótesis requiere que sea para rechazar la hipótesis nula y apoyar la hipótesis alternativa o no rechazar la hipótesis nula. Esto crea la posibilidad de dos tipos de error: Error de tipo I: Rechazar la hipótesis nula cuando en verdad es ésta verdadera. Error de tipo II: No rechazar la hipótesis nula cuando en realidad es falsa.

H0 es verdadera H0es falsa

No se rechaza H0 Se rechaza H0 Desición correcta Error de tipo I Error de tipo II Desici´ on correcta

En el diseño de las pruebas de hip´ otesis, tenemos que considerar cuidadosamente la probabilidad de cometer cualquiera de estos errores. Ejemplo 9.1 Imagine que una compañ´ ıa farmac´ eutica intent´ o comercializar una droga que más adelante se determinó ser ineficaz (y quizás peligrosa) en el tratamiento de una enfermedad. Antes de la comercializaci´ on del fármaco, la compa˜ n´ ıa determin´ o que el fármaco era eficaz en el tratamiento, lo que significa que la empresa rechaz´ o la hipótesis nula de que la droga no tuvo efecto sobre la enfermedad. Este es un ejemplo de error del tipo I.

Ejemplo Imagine que la misma compa˜ n´ıineficaz a en su en investigaci´ on decidieron abandonar las pruebas9.2 cuando mostraron que la droga fue el tratamiento de la enfermedad. La empresa, en este caso no pudo rechazar la hip´ otesis nula de que la droga era ineficaz. ¿Qu´ e sucede si el medicamento realmente era eficaz? ¿La empresa tiene un error de Tipo II? Es posible, pero ya que el fármaco nunca se comercializ´ o, no tenemos forma de saber la verdad. Estos ejemplos nos acercan al problema de la investigación estad´ ıstica: los errores pueden ser analizados utilizando los modelos de probabilidad, pero a menudo no hay manera de identificar errores espec´ıficos. Por ejemplo, existen personas inocentes en prisión en este momento debido a que un jurado cometió un error de tipo I en condenar injustamente a los demandados. En el dise˜ no de un experimento, hemos creado una probabilidad máxima de toma de error de tipo I. Esta probabilidad es llamada el nivel de significación o nivel de significancia de la prueba y designada por la letra griega α. El análisis del error de tipo II es más problemático, ya que hay muchos valores posibles que satisfacen la hip´ otesis alternativa. Para un valor espec´ıfico de la hip´ otesis alternativa, la probabilidad de diseño toma de error de tipo II se llama Beta ( β ), que se analizará en detalle más adelante en esta sección.

140

9.3. Diseño de hipótesis de investigación y la experimentación

9.3.4.

Valor Cr´ıtico y Regi´ on de Rechazo

Una vez que el nivel de significación de la prueba se elija, es entonces posible encontrar la región (o las regiones) de la funci´ on de distribución de probabilidad del estad´ıstico de prueba que permita que la hip´ otesis nula sea rechazada. Esta es llamada la regi´ on de rechazo y la frontera entre la regi´ on de rechazo y la de no rechazo es llamada el valor cr´ıtico. No puede haber m´ as de un valor cr´ ıtico y una regi´ on de rechazo. Lo que importa es que el área total de la región de rechazo sea igual al nivel de significaci´ on α. En la figura siguiente se clarifica este punto.

Figura 9.1.: Prueba de hipótesis de una y dos colas.

9.3.5.

Pruebas de un a y dos c olas

Una prueba es de una cola cuando la hipótesis alternativa, H a , se encuentra en una sóla direcci´ on, como por ejemplo: H0 : el ingreso medio de las mujeres es menor o igual a la renta media de los hombres. Ha : El ingreso medio de las mujeres es mayor que la de los hombres. Dado que la igualdad es generalmente parte de la hip´ otesis nula, entonces la hipótesis alternativa queda determinada por cola. Por el contrario una prueba es de dos colas cuando no se especifica la dirección en la hipótesis alternativa H a , tales como: H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. Ha : El ingreso medio de las mujeres no es igual a la renta media de los varones. En una prueba de dos colas, el nivel de significaci´ on se divide en dos partes ya que hay dos regiones de rechazo. en una prueba de hipótesis el modelo estad´ıstico es simétrico, (por ejemplo, la distribución normal Z o la t de Student), y por lo tanto, estas dos regiones ser´ıan iguales. Existe una relación entre un intervalo de confianza y una prueba de dos colas: Si el nivel de confianza para un intervalo de confianza es igual a 1α, donde α es

141

9. Pruebas de hipótesis de una población el nivel de significación de la prueba de dos colas, entonces los valores cr´ıticos ser´ıan los mismos. Estos son algunos ejemplos de las pruebas de media µ contra un valor hipotético µ0 : Ha : µ > µ0 significa probar la cola superior y tambi´ en se llama una prueba de extremo derecho. Ha : µ < µ0 significa probar la cola inferior y también se llama una prueba de extremo izquierdo. Ha : µ = = µ 0 significa probar las dos colas.



Decidir cuándo llevar a cabo una prueba de una o dos colas es a menudo controvertido y muchas autoridades van más lejos como para decir que sólo las pruebas de dos colas deben llevarse a cabo. En última instancia, la decisión depende de la formulación del problema. Si queremos demostrar que una nueva dieta es efectiva para reducir el peso, se llevar´ıa a cabo una prueba de una cola, ya que no importa si la dieta causa aumento de peso. Si por el contrario, hemos querido determinar si la tasa de criminalidad en Maracaibo es diferente de la tasa de criminalidad media en Venezuela, ser´ıa una conveniente más bien una prueba de dos colas, ya que no hemos preguntado espec´ıficamente si es mayor o igual.

9.3.6.

Recopilar y analizar los datos experimentales

Despu´ es de dise˜ nar el experimento, el siguiente procedimiento ser´ıa recoger los datos de la situación y verificar los datos. A efectos de la estad´ıstica y el análisis, supondremos que todas las muestras sean al azar, o utilizando alguna otra alternativa, simular´ an una muestra aleatoria.

Verificaci´ on de Datos Despu´ es de recoger los datos, pero antes de ejecutar la prueba, tenemos que verificar los datos. En primer lugar, obtener una gráfica (histograma , punto, gráfico de caja, etc) ser´ıa conveniente. Es importantes compruebe la asimetr´ıa, forma y cualquiera posibles valores at´ıpicos en los datos.

Ope raciones con valores at´ıpicos Un valor at´ıpico es punto de los datos que está muy alejado de los otros en el conjunto de datos. Los valores extremos pueden ser causados por: Errores cometidos en el registro de datos. Datos que no pertenecen a la población. Los verdaderos eventos raros.

142

9.3. Diseño de hipótesis de investigación y la experimentación Los dos primeros casos son fáciles de tratar y por tanto se pueden corregir los errores o eliminar los datos que no pertenecen a la poblaci´ on. El tercer caso es m´ as problemático, ya que los valores extremos aumentarán la desviación estándar dramáticamente y sesgarán fuertemente los datos.

La lógica de la prueba de hip´ otesis Despu´ es que los datos se verifican, queremos llevar a cabo la prueba de hipótesis y llegar a una decisión, ya sea o no rechazar la hip´ otesis nula. El proceso de decisión es similar a una prueba por la contradicción que se utiliza en las matemáticas, como ya lo hemos dicho: Suponemos H0 es cierta antes de observar los datos y complemento de H 0 .

Ha se diseña tal que sea el

Observe los datos (evidencia). ¿Cuán inusuales son estos datos respecto de H 0 ? Si los datos son demasiado inusuales, hemos probado que H 0 es falsa: Se rechaza H 0 y se apoya H a (declaración fuerte). Si los datos no son demasiado inusuales, no rechazamos H0 . Esta no prueba nada y nos dicen que los datos son inconcluyentes. (Declaraci´ on débil). Nunca se puede probar H 0 , sólo refutar la misma.

−

Demostrar en las estad´ısticas se refiere al soporte con (1 α) 100 % de cer teza. (Ejemplo: si α = 0,05, entonces estamos en al 95 % de confianza en nuestra decis ión de rechazar H0 .

Regla de Decisión - Dos m´ etodos, la misma decisi´ on Anteriormente hemos introducido la idea de una prueba estad´ıstica que es un valor calculado a partir de los datos en virtud del modelo estad´ıstico apropiado de los datos que se pueden comparar con el valor cr´ıtico de la prueba de hipótesis. Si el estad´ıstico de prueba cae en la regi´ on de rechazo del modelo estad´ıstico, rechazamos la hipótesis nula nula. Recordemos que el valor cr´ıtico se determina por el diseño basado en el nivel deseado de significación α. El método m´ as preferido de la toma de decisiones es calcular la probabilidad de obtener un resultado tan extremo como el valor del estad´ıstico de prueba. Esta probabilidad se llama el valor-p, y se puede comparar directamente a el nivel de significación. valor-p: es la probabilidad, en el supuesto de que la hipótesis nula es cierta, de obtener un valor del estad´ıstico de prueba por lo menos tan extremo como el valor calculado para la prueba. Si el valor-p es menor que el nivel de significaci´ on α, se rechaza H0 .

143

9. Pruebas de hipótesis de una población Si el valor-p es mayor que el nivel de significaci´ on α, H 0 no se rechaza. Tanto el valor-p y α son las probabilidades de obtener resultados tan extremos como los datos asumiendo H 0 es cierta. El valor-p se determina por los datos y est´ a relacionado con la probabilidad real de tomar error de Tipo I (Rechazar una hip´ otesis nula cuando es verdadera). Cuanto menor sea el valor-p, menor ser´ a la posibilidad de tener error de tipo I y, por tanto, más posibilidades tendremos de rechazar la hipótesis nula. El nivel de significación α se determina por diseño y es la probabilidad máxima que estamos dispuestos a aceptar de rechazar una verdadera H0 . Dos reglas de decisión conducen a la misma decisión. 1. Si el estad´ıstico de prueba se encuentra en la región de rechazo, se rechaza (método del valor cr´ ıtico)

H0 .

2. Si el valor-p < α, se rechaza H 0 . (método del valor-p) Este método valor-p de comparaci´ on se prefiere del método del valor cr´ıtico, porque la regla es la mismo para todos los modelos estad´ısticos: Rechazar H 0 si el valor-p si es menor a α. Ejemplo 9.3 (Prueba de media vs. valor hipot´ etico. Un ejemplo completo) Suponga que una empresa de alimentación tiene una pol´ıtica que el contenidos vertido de un producto en su envase coincide perfectamente con lo que dice la etiqueta. Una pregunta general podr´ıa ser: ¿El peso expresado neto del producto alimenticio est´ a de acuerdo con el peso real? El departamento de control de calidad decide poner a prueba la botella de 16 onzas de salsa de soja y ahora debe diseñar el experimento. El estad´ıstico de control de calidad ha tomado muestras de 36 botellas de salsa de soja y sabe a partir de unas pruebas anteriores que la desviaci´ on estándar de la población es de 0,5 onzas. El modelo ser´ a una prueba de media poblacional vs. al valor hipot´ etico de 16 oz. Una prueba de dos colas se selecciona debido a que es preocupante el llenado insuficiente ya que no cumple con las normas, as´ı como tambi´ en el llenado excesivo ya que produce p´ erdidas en la empresa. Recuerdese que la pol´ıtica de la empresa es llenar las botellas con el peso real del producto. As´ ı podemos estableces la hip´ otesis de investigaci´ on. H0 : µ = 16 (La máquina de llenado está funcionando correctamente) Ha : µ = 16 (La máquina de llenado no está funcionando correctamente).



Dado que la desviación estándar d ela población se conoce de pruebas pasadas el estad´ıstico de µ prueba ser´ a Z = x¯− n. Este modelo es apropiado, ya que el tama˜ no de la muestra asegura que σ la distribuci´ on de la media muestral es aproximadamente normal, tomando base en el Teorema del L´ ımite Central. Recordemos que error de tipo I ser´ıa rechazar la hip´ otesis nula y decimos que la m´ aquina no funciona correctamente cuando en realidad est´ a funcionando adecuadamente. Dado que la compa˜ n´ ıa no quiere dejar innecesariamente la producción y recalibrar la máquina, el estad´ ıstico elige limitar la probabilidad de error de tipo I mediante el establecimiento del nivel de significación (α) a 5%. El estad´ıstico ahora lleva a cabo el experimento con las muestras de las 36 botellas y determina a partir de un diagrama de caja que existe un dato inuasual de 17.56 oz. El valor es revisado de nuevo y se mantiene en el conjunto de datos.

√

144

9.3. Diseño de hipótesis de investigación y la experimentación A continuaci´ on, la media de la muestra y el estad´ıstico de prueba se calculan. x¯ = 16,12oz.,

Z =

− √

16,12 16 36 = 1 ,44. 0,5

(9.1)

La regla de decisión bajo el m´ etodo del valor cr´ıtico ser´ ıa rechazar la hip´ otesis nula cuando el valor de estad´ ıstico de prueba est´ a en la región de rechazo. En otras palabras, rechazar H0 cuando Z > 1, 96 o Z < 1, 96. En base a este resultado, la decisión es no rechazar H 0 ya que el estad´ıstico de prueba no cae en la región de rechazo.

−

Alternativamente preferiblemente) el estad´ ıstico utiliza el m´ etodo del valor-p de regla de decisi´ on. El valor-p para(y una prueba de dos colas debe incluir todos los valores (positivos y negativos) m´ as extremos del estad´ıstico de prueba, por lo que en este ejemplo, hallar la probabilidad de que Z < 1,44 o Z > 1, 44. Usando una calculadora, o software informático o una tabla normal est´ andar, el valor-p = 0,1498. Puesto que el valor-p es mayor que α, la decisión es de nuevo no rechazar H0 . Por último, el estad´ıstico debe reportar las conclusiones y hacer una recomendaci´ on a la compa˜ n´ıa: No hay pruebas suficientes para concluir que la m´ aquina que llena botellas de salsa de soja de 16 oz está funcionando correctamente. Esta conclusi´ on está basada en 36 mediciones tomada durante una hora corrida de producci´ on. Recomiendo el seguimiento continuado de la m´ aquina con empleados diferentes para una potencial posibilidad de error humano. El estad´ ıstico hace la declaraci´ on d´ ebil y no indica que la m´ aquina est´ a funcionando correctamente, sólo que no hay pruebas suficientes para determinar si est´ a funcionando correctamente. El estad´ ıstico tambi´ en informa preocupaciones sobre el muestreo de un solo turno de empleados (restringiendo la inferencia a la muestra poblacional) y recomienda repetir el experimento en varios turnos.

−

145

A. La redacción de informes y presentación de resultados A.1.

Definici´ on de Informe cient´ıfico

Los informes cient´ıficos aparecen en la d´ ecada del cuarenta como una modalidad de literatura gris. Es un documento confecc ionado de forma ordenada para describir los aspectos de una investigación especialmente las relacionadas con los resultados obtenidos. Su objetivo no es la publicación en una revista, sino que va dirigido, o bien, act´ ua como instrumento para comunicar los resultados a la comunidad cient´ıfica o quien haya encargado el traba jo. En ningún traba jo cient´ıfico se aceptan los hallazgos con independencia del procedimiento mediante el cual se obtuvieron, y dicho procedimiento debe poder reproducirse en otros lugares y oportunidades. Los objetivos del Informe cient´ıfico son: Su contenido está destinado a contribuir al acopio de conocimientos. Exponer y declarar los procedimientos y técnicas utilizados en la investigaci´ on para que pueda ser producida, constatada y verificada por otros cient´ıficos, al fin de juzgar la validez y fiabilidad de las nuevas aportaciones cient´ıficas que se proponen. Constituyen fuentes de información para una nueva investigación.

A.2.

Tipos y clasificaciones del Informe cient´ıfico

Existen cuatro tipos de investigaciones: investigaciones emp´ıricas, revisiones, replicaciones de investigaciones anteriores y art´ıculos teóricos. Las clases de informes son: El informe cient´ıfico: aquel basado en la observación directa, se trabaja con la realidad inmediata. Por ejemplo, el trabajo de laboratorio, fundamental en las ciencias naturales. Consiste en la descripción de los fenómenos observados y en una interpretación de ellos en términos de conocimiento teórico. Se ciñe a los pasos del método experimental: observación de un fenómeno, formulación de una hipótesis, realización experimental, conclusión del hecho, en el cual se comprueba o refuta la hip´ otesis planteada. El informe de investigación: que consiste en reproducir en forma objetiva el pensamiento vertido en una obra, ensayo, art´ ıculo, etc. Constar´ a de una breve introducción,

147

A. La redacción de informes y presentación de resultados en la cual se indica el tema y el objetivo que tiene el trabajo, de un cuerpo donde se expone la materia y una conclusión, s´ıntesis de los elementos rescatados; son primordiales la objetividad y la claridad. El informe de suceso: el mismo de los anteriores, var´ıa solamente en la materia. Es el quehacer que se realiza cuando se asiste a exposiciones, encuentros literarios, etc. y luego se vuelca la información en tipo informe.

A.3.

Caracter´ısticas, particularidades y modalidades del Informe cient´ıfico

A.3.1.

Caracter´ısticas

Al tener un objetivo concreto, responde a la exigencia o a la necesidad de dar cuenta de algo determinado. Por eso, su tema no es de libre elecci´ on del autor. Los informes pueden contener diagramas, estad´ısticas, cuadros num´ ericos y pueden y acompañados de anexos que prueban o ilustran lo informado en el texto. Deben reunir las siguientes cualidades: Claridad y sencillez. Exigen dos explicaciones, de dos formas, la más elemental, de dos palabras, la más breve. La claridad del escrito deriva de su correcci´ on morfológica y sint´ actica. Un texto no será sencillo ni claro si no sigue un ordenamien to y se emplean palabras artificiosas y vac´ıas, términos no conocidos o definidos. Precisi´ on. Estrechamente vinculado con la claridad y sencillez. La precisi´ on debe emplearse en cada momento se utilicen las palabras justas y las expresiones que correspondan exactame nte a la idea que se quiere expresar. No debe haber ambigüedad en los términos. Es necesaria en la redacci´ on cient´ıfica porque ésta exige la mayor exactitud terminológica posible y porque su fin es exponer de modo concreto y sin rodeos, los resultados de la investigación. Sinceridad y srcinalidad. Escribir conforme a nuestra propia manera y según nuestro estilo y en ningún caso se pretenda con las palabras disfrazar la verdad ni enga˜ nar. Viveza. Debe proporcionar un m´ınimo inter´ es. Se debe evitar el estilo mon´ otono, plano, amorfo, inerte y pesado. Que se sepa destacar la importancia de lo que se escribe, su actualidad, vigencia y utilidad y explicaciones, que se de un cierto relieve a las ideas expresadas. Rigor y sistema. El rigor consiste en la propiedad y exactitud del contenido. Aqu´ı se puede distinguir tres dimensiones: extensión, profundidad y seriedad cient´ıfica. Un informe será riguroso en la extensión si abarca todos los aspectos del tema. Ser´ a riguroso en la profundidad si se buscan los fundamentos ´ ultimos de las cuestiones y se llega, respecto a ellas, hasta el l´ımite intelectual posible. Y seriedad cient´ıfica en cuanto al cuidado en demostrar las tomas de posici´ on, en demostrar las pruebas que

148

A.3. Caracter´ısticas, particularidades y modalidades del Informe cient´ıfico justifiquen las aportaciones y descubrimientos, en sus referencias y citas y en el cumplimiento de todas las prescripciones metodol´ ogicas y expositivas que garantizan la solidez y la seriedad de la exposición de una investigación cient´ıfica. En cuanto a la cualidad de sistematización, la redacción debe ser sistemática de modo que presente integrados en su totalidad los aspectos del tema desarrollados en el.

A.3.2.

Particularidades

El informe debe contener una ordenada secuencia l´ ogica, haciendo que los hechos se encadenen entre s´ı y tratando de organizarlos de un modo coherente, sin fracturas. Debe tener una estructura de modo tal que permita su comprensi´ on sin mayores dificultades.

Orden al hacer el informe cient´ıfico: Generalmente se necesita: materiales y m´ etodos, resultados, discusi´ on y conclusión, introducci´ on y resumen. Materiales y métodos se suele al escribir primero, ya que los materiales deben estar listos antes de comenzar la investigaci´ on, los métodos deben estar claros y descriptos detalladamente antes de comenzar a obtener los datos. Luego, se organizan los datos y se escriben los resultados, seguidos de la discusi´ on y de la conclusión. La introducci´ on es lo último en escribir. Puede ir redactándose en cualquier momento, pero no es hasta el final del informe que verdaderamente se organiza para ser presentado.

Orden al presentar el informe cient´ıfico: Se da cuando a trav´ es de la lectura contestamos las siguientes preguntas: ¿qu´ e se hizo?, ¿para qu´ e? (introducci´ on), ¿cómo se hizo?, ¿qui´ en?, ¿cu´ ando?, ¿dónde? (métodos y materiales), ¿qu´ e se encontr´ o? (resultados), ¿por qu´ e?, ¿qu´ e significa? (discusi´ on y conclusión).

A.3.3.

Modalidades

El informe cient´ıfico posee la siguiente estructura formal: Portada. Incluye el t´ıtulo de la investigaci´ on, el cual debe expresar el contenido del trabajo de forma breve, concisa y clara (longitud m´ axima recomendada es de 12 palabras), el nombre del autor o autores y su afiliaci´ on institucional o el nombre de la organización que patrocina el estudio y la fecha en que se presenta el reporte. Índice. Con apartados y subapartados. Resumen. Constituye el contenido esencial del reporte de investigaci´ on, usualmente incluye el planteamiento del problema, la metodolog´ıa, los resultados m´ as importantes y las principales conclusiones. Se presenta en una hoja aparte sin superar 120 palabras aproximadamente.

149

A. La redacción de informes y presentación de resultados Introducci´ on. Incluye el planteamiento del problema (objetivos y preguntas de investigación, as´ı como la justificaci´ on del estudio), el contexto general de la investigaci´ on (cómo y dónde se realizó), las variables y términos de la investigaci´ on y sus definiciones, as´ı como las limitaciones de ésta. Marco teórico. (marco de referencia o revisión de la literatura) En el que se desarrollan los estudios e investigaciones antecedentes y las teor´ıas a manejar. Método. Esta parte del reporte describe cómo fue llevada a cabo la investigación: Hip´ otesis y especificación de las variables. Material, si es standard solo es necesario dar el nombre, pero si es espec´ıfico, es relevante describirlo con detalle. Dise˜ no utilizado (experimento o no experimento) Sujetos, universo y muestra (procedencia, edades, sexo y/o aquellas caracter´ısticas que sean relevantes de los sujetos; descripción del universo y muestra; y procedimiento de selecci´ on de la muestra). Instrumentos de medición aplicados (descripción precisa, confiabilidad, validez y variables medidas). Procedimiento (un resumen de cada paso en el desarrollo de la investigación. Se incluyen en este paso los problemas enfrentados y la manera de c´ omo se resolvieron. Por ejemplo, en una encuesta se describe cómo se contactó a los sujetos y se realizaron las entrevistas, en un experimento se describen la manera de asignar a los sujetos, las instrucciones, los materiales, etc. Resultado. Aqu´ı el investigador se limita a describir los resultados, obtenidos del producto del análisis de los datos. Una manera de hacerlo es mediante tablas, dibujos, gráficas y figuras. Cada uno de estos elementos debe ir numerado (en ar´ abigo o romanos y con el t´ıtulo que lo identifica. Conclusiones, recomendaciones e implicaciones (o discusión). En este apartado se derivan conclusiones, se hacen recomendaciones para otras investigaciones, se analizan las implicaciones de la investigación y se establece cómo se respondieron las preguntas de investigación y si se cumplieron o no los objetivos. Debe redactarse de tal manera que se facilite la toma de decisiones respecto a una teor´ıa, un curso de acción o una problem´ atica. Bibliograf´ıa. Que son las referencias utilizadas por el investigador para elaborar el marco teórico. Se incluyen al final de los informes ordenados alfabéticamente. Ap´ endices. Son u´tiles para describir con mayor profundidad ciertos materiales sin distraer la lectura del texto principal del informe. Por ejemplo, el cuestionario utilizado, el desarrollo de una fórmula, fotograf´ıas, etc.

A.4.

Forma de presentación y estilos del Informe cient´ıfico

Puede presentarse de las siguientes maneras. Algunas veces solamente se entrega el reporte publicado y se explica verbalmente. Otras veces la entrega del informe acompa˜ nado

150

A.5. Diferencias con el resto de los traba jos cient´ıficos con diversos apoyos como son gráficas, audiovisuales, videos y sistemas computarizados. Hoy en d´ıa los informes se elaboran utilizando distintos procesador es de textos y programas: Word, Works (textos y dibujos); PageMaker, PowrPoint, Harvard Graphics, Publisher (textos y gráficos); SPSS (análisis estad´ıstico y gr´ aficos), Excel (hoja de cálculo y gráficos)

A.5.

Diferencias con el resto de los trabajo s cient´ıficos

Suele confundirse informe cient´ıfico con art´ıculo cient´ıfico, sin embargo entre ellos hay una marcada diferencia. Mientras que el informe cient´ıfico es un documento que reporta los resultados de una investigación, no tiene como finalidad la publicación en una revista (aunque en agencias gubernamentales normalmente se agrupan en vol´ umenes que representan una publicación interna de la agencia), el art´ıculo cient´ıfico presenta informaci´ on acumulativa que provee para el conocimiento cient´ıfico, presenta análisis y conclusiones que pueden ser preliminares o finales acerca de los hallazgos que el investigador ha logrado a trav´ es del trabajo cient´ıfico. Su meta es que sea revisado por expertos y que se publique en una revista cient´ıfica.

151

B. C´ alculos de incertidumbre y de peque˜ nas variaciones En el laboratorio a la hora de realizar experimentos y hacer mediciones para comprobar diversos procesos de la naturaleza, se cometen inevitablemente errores. Algunos errores en el laboratorio son m´ as evidentes que otros, sin embargo, como quiera que sea o por muy pequeño que sea, existe siempre un error asociado a cada una de las medidas que se toman en la experiencia. Lo curioso de la ciencia es que no existe una manera para encontrar el valor real de todas las cosas. Por muy exacto que sea el instrumento, por muy preciso y cuidadoso que sea el investigador, siempre encontrar´ a un valor aproximado de la medida en estudio. El valor verdadero de una medida depende de tantas cosas, que es imposible sellar todas las incertidumbres para lograr exactitud perfecta. Inclusive la misma tecnolog´ıa tiene un l´ımite, cuando ese l´ımite es sobrepasado, el instrumento ya deja de ser exacto para dar lugar a errores esperados. La mayor´ıa de las veces la repetición muchas veces del experimento logra minimizar estos errores, pero el investigador, sabe que existen. Lo más interesante de todo es que el conocimiento de éstos errores son la base de la confiabilidad de la medida estudiada. Si en la repetici´ on simultanea, inclusive por distintos métodos, al medir una cierta cantidad, se encuentra que todos los resultados están cuidadosamente cercanos, entonces uno pudiera pensar que se tendrá una medida cercana al valor real. Sup´ ongase que se ha medido la masa y e volumen de un cierto objeto en el laboratorio. Digamos, por ejemplo, que la masa está dada por m = 4,635 0,002g y el volumen V = 1,13 0,05mL. Más adelante explicaremos que significan estas expresiones, por ahora bastar´ a con decir que el primer de los n´ umeros de la medida es el valor cercano al real, mientras que el segundo número es la incertidumbre o el error cometido, cualquiera que fuera la fuente de su procedencia. La cuesti´ on es: si sabemos que estas son las medidas, ¿cu´ al será la medida de la densidad y cuál será su incertidumbre asociada? Más aún, ¿cómo procedemos al cálculo de la densidad?, ¿en qué afectan los errores individuales de la masa y el volumen a la densidad?, ¿es posible que el c´ alculo de la densidad no conlleve errores? Estas son algunas de las dudas que podemos respondernos en este cap´ıtulo.

±

B.1.

±

Tipos de errores

Cada medida tiene asociada un incertidumbre, la cual de ahora en adelante usaremos como sinónimo y/o definición de error experimental. Cada vez que sacamos conclusiones de una experiencia de laboratorio, estas pueden estar escritas en términos de un muy

153

B. Cálculos de incertidumbre y de pequeñas variaciones alto grado o un nivel m´ınimo de confidencialidad, es decir, con mucho error o con po co error, pero jamás con seguridad absoluta. Los errores experimentales son clasificados en sistem´ aticos o aleatorios.

B.1.1.

Errores sistem´ aticos

El error sistemático, tambi´ en llamado error determinado , se debe a una falla en el equipo o el diseño de un experimento. Esto quiere decir, que si la medida se hace varias veces repitiendo el experimento para reproducir el valor de la medida, entonces se conseguirá el mismo resultado. El error no depende, en otras palabras, del investigador, sino del instrumento usado o del dise˜ no. Seguramente este error pudiera ser salvado pero la mayor´ ıa de las veces resulta dif´ıcil. Los errores sistemáticos pueden detectarse mediante tres acciones, a saber, al menos. Pudiera analizarse con el diseño o con el aparato en cuesti´ on alguna medida de la cual se sepa cuánto es su valor, de tal manera que conviene escoger una que sea referencia estándar de calibración, por ejemplo, con la metodolog´ıa usada deber´ıa obtenerse el mismo valor, sino, entonces existen errores sistemáticos. Otra manera de darse cuenta cuando se tiene un error sistemático, es usar un método diferente para medir la misma cantidad, si con éste método nuevo se reproduce la medida estándar, entonces estará en presencia tambi´ en de este tipo de error. Por u´ltimo, otra manera de darse cuenta es hacer que varias personas midan exactamente la misma cantidad en distintos laboratorios, de no tener errores sistemáticos, entonces las medidas deber´ıan coincidir.

B.1.2.

Errores aleatorios

El error aleatorio, tambi´ en llamado error indeterminado , se debe a los efectos de que las variables no están controladas en la medición. El error aleatorio tiene la misma probabilidad de ser positivos o negativos. Siempre est´ a presente y no puede corregirse. El error aleatorio está la mayor´ıa de las veces asociado con la lectura de una escala en los aparatos de medición. Diferentes personas leyendo la escala reportar´ an una serie de valores que representan sus interpolaciones subjetivas entre las marcas. Una persona que lee el mismo instrumento varias veces podr´ıa informar de varias lecturas diferentes.

B.2.

Precisi´ on y exactitud

La precisi´ on de una medida está normalmente asociada a la capacidad de que el resultado pueda ser reproducible todas las veces. Una medida precisa es una medida que se puede volver a obtener por cualquiera otro método o por cualquier otro investigador, salvando, por su puesto, que se haya hecho una elecci´ on cuidadosa de aparatos y métodos de medición. En otras palabras, si medimos una cierta cantidad muchas veces y los valores están cercanamente iguales entre si, entonces uno pudiera decir que la medida es precisa. Si los valores difieren significativamente entonces la medida no es precisa.

154

B.3. Incertidumbre absoluta y relativa Por otro lado la exactitud está usualmente relacionada con el hecho de cuán cercano es el valor de la medida con el valor real de dicha medida. En otras palabras, para darse cuenta de si una medida es exacta, entonces lo que hay que hacer es buscar una medida de referencia para esa cantidad y determinar si es significativamente cercana o no. De serlo, entonces nuestra medida ser´ıa exacta. Aun cuando una medida pudiera ser reproducibles, hay que tener en cuenta, que esto no quiere decir que dicha medida sea verdadera. Es decir, aunque midamos algo muchas veces, no podemos estar seguro de que ese valor sea verdaderamente bueno. Por ejemplo, imag´ınese que se quisiera medir la densidad de un l´ıquido en el laboratorio, pero por un descuido inesperado del que no se dio cuenta, se mezcl´ o un poco de ese l´ıquido con otro. Entonces, usted pudiera hacer el procedimiento y conseguir un conjunto de medidas para la densidad del l´ıquido, en el reporte, usted pudiera conseguir medidas muy cercanas entre si en la sucesiva repetición del experimento. En este caso usted tendr´ıa mucha precisión pero su exactitud ser´ıa bastante pobre. Por el contrario, usted pudiera haber hecho muchas mediciones y no coincidir mucho entre todas, sin embargo, en términos promedios el valor de la medida es bastante cercano a su valor real. En este caso se tendr´ıa muy poca precisión pero bastante exactitud. Un proceso ideal ser´ıa tener tanto buena precisión como buena exactitud. Otro término merece tambi´ en ser aunque sea definido. Estrechamente ligado a la presentaci´ on precisa y exacta de los datos est´ a tambi´ en el asunto de la sensibilidad. Que el aparato sea sensible está estrechamente ligado al aumento de precisión y exactitud. La sensibilidad de un aparato es el valor m´ınimo de la magnitud que es capaz de medir. As´ı, si la sensibilidad de una balanza es de 5 mg significa que para masas inferiores a la citada, la balanza no podrá medir significativamente. Normalmente, se admite que la sensibilidad de un aparato viene indicada por el valor de la divisi´ on más pequeña de la escala de medida. En general, se puede decir que es más fácil conocer la precisión de un aparato que su exactitud.

B.3.

Incertidumbre absoluta y relativa

Las incertidumbre relativas y absolutas se refieren a los errores relativos y absolutos respectivamente. Un error absoluto determina el margen de error asociado con una medida particularmente. El error absoluto en una medida x de determinada magnitud es la diferencia entre dicho valor y el valor verdadero de la medida; se notar´ a por ∆ x y, por tanto, su expresión es: ∆x := x x0 , (B.1)

| − |

donde x 0 representa el valor verdadero de la medida. El error absoluto cuantifica la desviación en términos absolutos respecto al valor verdadero. No obstante, en ocasiones es más interesante resaltar la importancia relativa de esa desviaci´ on. Por ello, se define el error relativo como el cociente entre el error absoluto y el valor verdadero; not´ andolo por  su

155

B. Cálculos de incertidumbre y de pequeñas variaciones expresi´ on es:  :=

| − |

∆x x x0 = , x0 x0

(B.2)

y suele expresarse porcentualmente sin más que multiplicar por 100, a lo que llamamos comúnmente error relativo porcentual . En F´ısica, presentar una medida experimental significa dar el valor de dicha cantidad y expresar cual es su error; no tiene sentido establecer un determinado valor si no se acota debidamente el mismo. As´ı, la expresi´ on correcta de una medida debe ser: x

± |∆x|

−→

x+ probable = x + ∆x ,

x− probable = x

| |

− |∆x|,

(B.3)

y por lo tanto el intervalo [ x(−) , x(+) ] es el rango en el que las medidas de la cantidad x es válido en relación con el error cometido. Dado el significado de cota de imprecisión que tiene el error absoluto, éste siempre se expresa con una única cifra significativa, es decir, con el primer d´ıgito comenzando por la izquierda distinto de cero; este número debe ser redondeado por exceso en una unidad si la segunda cifra significativa es 5 o mayor de 5. Este convenio de expresión del error encuentra dos excepciones: que la primera cifra significativa sea un 1 o que siendo la primera un 2, la segunda no llega 5; en estos casos, el error vendr´ a dado por las dos primeras cifras significativas, procediéndose al redondeo de la segunda en el mismo sentido que ya se ha explicado. Hay que resaltar que el valor de una magnitud debe tener el mismo orden decimal que el error absoluto. Esto es razonable dado que no tendr´ıa sentido encontrar el valor de una magnitud con un grado de precisión superior al del error de la medida. As´ı, no podemos medir d´ ecimas de mil´ımetro con una regla cuya sensibilidad es del mil´ımetro. Finalmente, se acepta como criterio que si el valor de una medida es le´ıdo de una tabla u otro lugar, sin indicación de su error, se tomará como error una unidad del orden de la ´ ultima cifra con que se expresa; por ejemplo, si en una tabla aparece que el valor de una medida es de 0.056 sin ninguna indicación de error, se conviene en que el mismo es de 0,001. En la siguiente tabla se dan distintos ejemplos.

±

Expresi´ on incorrecta 3,418 0,123 6,3 0,09 46288 1551 428,351 0,27 0,01683 0,0058

± ± ± ± ±

Expresión 3 ,42 6,30 46300 428 ,4 0 ,017

correcta

± 0,12 ± 0,09 ± 1600 ± 0,3 ± 0,006

Cuadro B.1.: Ejemplos de expresiones correctas e incorrectas en la descripción de incertidumbres.

156

B.3. Incertidumbre absoluta y relativa Como ya se ha explicado, cuando se realice la medida de cualquier magnitud hay que indicar el error asociado a la misma. Dado que no conocemos el valor verdadero de la magnitud que deseamos medir, se siguen ciertos procedimientos para hacer una estimación del mismo y de su cota de error. Con el fin de alcanzar cierta validez estad´ıstica en los resultados de las medidas es muy conveniente repetir varias veces su determinación; por convenio, se ha establecido en 3 este n´ umero m´ınimo. No obstante, es posible que en alguna o casión no tenga sentido llevar a cabo estas repeticiones, en cuyo caso se considera que el error absoluto coincide con el valor de la sensibilidad del aparato utilizado para realizar la medida. En el caso habitual, cuando son 3 las medidas tomadas, pueden presentarse poco o muy dispersas y en funci´ on de esta dispersión ser conveniente aumentar o no el número de determinaciones del valor de la magnitud. Para decidir el número determinaciones del valor de una magnitud f´ısica que se desea medir se sigue el siguiente procedimiento: se realizan las 3 mediciones xi de la magnitud en cuestión y se calcula su valor medio: n=3

x ¯ :=

 i=1

xi , N

con N = 3 en este caso .

A continuación se determina su dispersi´ on o lo que es llamado Rango diferencia entre los valores extremos de las medidas: D := x max

(B.4) D, esto es, la

− xmin,

(B.5)

finalmente, se obtiene el tanto por ciento de dispersi´ on, T , que viene dado por: T := 100 D . x ¯

(B.6)

Con estos parámetros se pasa al siguiente cuadro que establece la casu´ıstica que puede darse; S representa la sensibilidad del aparato de medida, D6 es la dispersión para seis medidas y N el número de medidas necesarias en cada caso. As´ı, por ejemplo, si se ha obtenido que la dispersión es mayor que la sensibilidad y el tanto por ciento de dispersión está comprendido entre el 2 % y el 8 %, son nece sarias 6 medidas; el valor verdadero queda establecido en la media aritmética de las 6 medidas y su error corresponde al máximo de entre la dispersión de las seis medidas dividido por 4 o la sensibilidad. Si se han realizado 15 o m´ as medidas, en realidad se está buscando que el conjunto de las mismas sea una distribución gaussiana o normal, en cuyo caso, el error que se considera corresponde con el error cuadrático medio (ECM) 1 o desviación standard; el significado 1

La varianza representa la media aritm´ etica de las desviaciones con respecto a la media que son elevadas al cuadrado. Si atendemos a la colecci´ on completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atenci´ on sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a

157

B. Cálculos de incertidumbre y de pequeñas variaciones D D
D>S

TN

x

0

3 3 6 15 > 50

≤ ≤ ≤ ≤ ≤ ≤

T 2% 2% T 8% 8 % T 15% 15 % T

x ¯N :=



N xi i=1 N

∆x S S max D6/4, S ∆x =

{

n

}

−x¯N )2 N (N −1)

i=1 (x

Cuadro B.2.: Modelo sencillo para la determinación de incertidumbres.

de este parámetro puede encontrarse en cualquier volumen de estad´ıstica básica aunque podemos sintetizarlo de forma cuantitativa como sigue. En el intervalo: x ¯

− ∆x ≤ x ≤ x¯ + ∆x,

(B.7)

se encuentra el 68,3 % de las medidas realizadas en una gran serie de las mismas. De igual forma, es posible demostrar que en el intervalo: x ¯

− 2∆x ≤ x ≤ x¯ + 2∆x,

(B.8)

se encuentra el 95,4 % de las medidas reali zadas. Por último, en el intervalo: x ¯

− 3∆x ≤ x ≤ x¯ + 3∆x,

(B.9)

continuaci´ on. n

2

 X

i=1

i

−X



2

SX = n , una segunda manera de expresarla es:

Expresi´ on de la varianza muestral , n

2 SX =

X

2

i

i=1

n

− X2

Por otro lado, la expresión de la cuasivarianza muestral (estimador insesgado de la varianza poblacional): n

2

SX =

 X

i=1

i

−X



2

n−1

Mientras que Expresi´ on de la desviación estándar poblacional:

      (X = N

√

σ2

i

i=1

N

− µ)2

.

El t´ ermino desviaci´ on est´ andar fue incorporado a la estad´ıstica por Karl Pearson en 1894. Por la formulaci´ on de la varianza podemos pasar a obtener la desviación est´ andar, tomando la ra´ız cuadrada positiva de la varianza. As´ı, si efectuamos la ra´ız de la varianza muestral, obtenemos la desviaci´ on t´ıpica muestral; y si p or el contrario, efectuamos la ra´ız sobre la varianza poblacional, obtendremos la desviaci´ on t´ıpica poblacional.

158

B.4. Propagación de los errores se encuentra el 99,7 % de las medidas reali zadas en una gran serie de las mismas.

B.4.

Propagaci´ on de los errores

Recordemos la pregunta principal al iniciar el cap´ıtulo. La idea es poder describir de que manera puede ser calculado el error de una expresi´ on que es la composición de dos magnitudes distintas, cada una con su respectivo error. Esta secci´ on intenta responder a esa pregunta fundamental. Existen varias metodolog´ıas para poder ver esto.

B.4.1.

El m´ etodo de las derivadas parciales

Empecemos por decir, que una cierta medida pudiera escribirse como la composici´ on de varias otras medidas. En este caso estamos en la presencia de una medida indirecta . Digamos que a ésta medida puede asociarse un funcional que se componga de varias medidas directas, es decir, y = f (xi , aj ), (B.10) donde f es una función, en principio de cualquier dependencia, que relaciona las medidas directas xi (i = 1, 2,...,n ) con la medida indirecta y, mientras que aj (j = 1, 2,...,m ) representan constantes de la f´ısica (las cuales por cierto, dado que han sido medidas tambi´ en tienen su incertidumbre asociada). Luego, dado que el error absoluto es en esencia la diferencia entre el valor real y el valor medido, entonces el error es ∆ x, de esta manera, y sabiendo que la funci´ on en principio es continua, se tendrá que el error absoluto se convierte en la diferencial total de dicha funci´ on, por tanto, error absoluto := dy =

+





  i=1

· · · ∂x∂yn dxn

medidas

∂y ∂y da1 + da2 + ∂a 1 ∂a 2

n

=

∂y ∂y dx1 + dx2 + ∂x 1 ∂x 2

∂y dxi + ∂x i



· · · ∂a∂ym dam

constantes m

 j=1

∂y daj . ∂a j



 (B.11)

Recu´ erdese que en este caso hemos cambiado los incrementos ∆x a diferenciales dx por el carácter continuo de la función f (xi , aj ). De esta manera la expresión anterior pudiera ser escrita equivalentemente como n

∆y =

m

∂y

i i=1 ∂x i ∆x

+

∂y ∂a j ∆aj .

    j=1

(B.12)

159

B. Cálculos de incertidumbre y de pequeñas variaciones As´ı con el valor absoluto aseguramos que no importe si la desviación a sido superior al valor real o inferior, lo que interesa en fin últimas es reconocer la diferencia entre ambos valores. As´ı pues, la ecuaci´ on anterior representa el caso más favorable. Para hacer esto menos dependiente de las constantes universales, uno pudiera escoger una cantidad de cifras significativas convenientemente de tal manera que el ´ ultimo término de la ecuaci´ on no influya de manera importante. As´ı uno pudiera, hacer n

∆y =

∂y ∂x i ∆xi +

m

∂y ∂a j ∆aj = E 1 + E2 = (1 + α)E1 ,

       i=1

j=1

  ≈ 

  

(B.13)

∂y ∂y donde hemos hecho que E1 := ni=1 ∂x ∆xi y E2 := m j=1 ∂a j ∆aj y luego escoger el i nivel de cifras significativas tal que E 2 := αE 1 , de tal manera que si α = 0,1, por ejemplo,

∆y = (1 + α)E1 = 1,1E1

n

≈ E1

i=1

∂y ∆xi . ∂x i

Veamos como se aplica esto con algunos casos particulares.

(B.14)

Caso: la función es una suma algebr´ aica de medidas Digamos que y = f (x1 , x2 ) = x 1 + x2 , entonces, ∂y

∆y =

∂y

∆x1 +

∆y

∆x2 = ∆x1 + ∆x2

=

∆x1 + ∆x2

, (B.15) y x1 + x2 de ésta manera, el error absoluto de una medida indirecta que es la suma de dos medidas directas, resulta ser la suma de los valores absolutos de cada una de las medidas directas. ∂x 1

→ 

∂x 2

   

Caso: la función es una multiplicación de medidas Digamos que y = f (x1 , x2 ) = x 1 x2 , entonces, ∆y =









∂y ∂y ∆x1 + ∆x2 = x 2 ∆x1 + x1 ∆x2 ∂x 1 ∂x 2

∆x2 1 →  ∆yy = ∆x + . x1 x2

(B.16)

Caso: la función es un cociente de medidas Digamos que y = f (x1 , x2 ) = ∂y

x1 x2 ,

entonces,

∂y

∆y = ∂x 1 ∆x1 + ∂x 2 ∆x2 =

   

160

x2 ∆x1

x1 ∆x2

−

x22

∆y

→

∆x1

y = x1

∆x2

−

x2 .

(B.17)

B.4. Propagación de los errores

Caso: la función es una medida potencial cuyo exponente es otra medida Digamos que y = f (x1 , x2 ) = x x1 2 , entonces, ∆y =









∂y ∂y ∆x1 + ∆x2 = x 2 xx1 2 −1 ∆x1 + xx1 2 ln x1 ∆x2 ∂x 1 ∂x 2

1 →  ∆yy = x2x∆x + ln x1 ∆x2 . 1

(B.18)

Caso: la función es exponencial Digamos que y = f (x1 , x2 ) = exp(x1 ), entonces, ∆y =





∂y ∆x1 = e x1 ∆x1 ∂x 1

Caso: la función es logar´ıtmica

→  ∆yy = ∆x1.

(B.19)

Digamos que y = f (x1 , x2 ) = ln( x1 ), entonces, ∆y =





∂y ∆x1 ∆x1 = ∂x 1 x1

1 → ∆yy = x1∆x . ln(x1 )

(B.20)

Caso: la función es una composición de funciones trigonom´ etricas Digamos que y = f (x1 , x2 ) = x δ1 sin(x2 ), entonces, ∆y =

∂y ∂y ∆x1 + ∆x2 = δxγ1 −1 sin(x2 )∆x1 + xγ1 cos(x2 )∆x2 ∂x 1 ∂x 2 ∆y γ ∆x1 = + ∆x2 cotg(x2 ). y x1

   

→

(B.21)

Cuando se trata de la teor´ıa de an´ alisis de errores puede ser obtenida una fórmula general para la incertidumbre de una colección de las mediciones. La f´ ormula se basa en la idea de un desarrollo en serie de Taylor de primer orden de funciones de muchas variables. Es v´ alida cuando las diversas incertidumbres ∆i de las variables son pequeñas en comparación con los valores de las cantidades y con la exigencia de que las incertidumbres no est´ an correlacionadas entre s´ı. En concreto, si se tiene el comportamiento de f (x,y,z,... ) de las variables f´ısicas x, y, z,. . . que tienen incertidumbres ∆ x , ∆y , ∆z . . ., entonces la incertidumbre en el valor del resultado de ∆ f viene dada por la fórmula 2f =  2x

      ∂f ∂x

2

+ 2y

∂f ∂y

2

+ 2z

∂f ∂z

2

+

· · ·,

(B.22)

donde  f ,  x ,  y ,  z , son los errores de la función f y de x, y, z , respectivamente, los cuales denotaremos por a := σ a = ∆a , a

(B.23)

161

B. Cálculos de incertidumbre y de pequeñas variaciones de acuerdo con la ecuación (B.2). Por ejemplo, en Relatividad General para un universo plano, la definición del parámetro de desaceleración gravitacional, permite calcular la densidad cr´ıtica del universo, de tal manera que es posible calcular 3H 2 ρc = , (B.24) 8πG ˙

donde H := R es la constante de Hubble, la cual mide la velocidad con la cual las galaxias R se mueven alej´ andose unas de las otras, las ´ ultimas mediciones estiman su valor en H (75 25)Km s −1 M pc−1 . De tal manera que el error cometido al tratar de medir la densidad del universo puede ser conseguida tal que,

±

·

·

∆ρc =

3H ∆H 4πG

2

≈

2

3H − 8π3H2G ∆π − 8πG ∆G, 2

(B.25)

con lo cual

∆ρ ∆H ∆π ∆G =2 (B.26) , ρ H π G por tanto, sabiendo la incertidumbre de H , recordemos que el valor m´ as preciso de la constante de Gravitación Universal está dado por G := (6 ,67428 0,00067) 10−11 m3 Kg −1 s−2 , luego, se tendrá que

−

−

±

·

∆ρ = 0,66651 ρ

×

·

2

3H Kg Kg → ρ = 8πG = 1,0616879 × 10−38 3 → ∆ρ = 7,07634 × 10−39 3 , m m

(B.27)

lo cual quiere decir entonces que la densidad cr´ıtica pudiera estar medida en ρ = (1,0616879

± 0,707634) × 10−38 Kg , m3

(B.28)

por último 2ρ = ρ =

B.4.2.

         × ∆ρ ρ

2

=  2H

∂f ∂H

2

+ 2π

22H + 2π + 2G = 7,07634

∂f ∂π

2

+ 2G

10−39 .

∂f ∂G

2

= 0,44424 (B.29)

El m´ etodo del Neperiano

La regla de las derivadas parciales es válida siempre. Sin embargo, cuando la función f sólo tiene productos, divisiones o potencias (o es una combinaci´ on de estas operaciones), una forma alternativa de calcular el error de y es proceder de la siguiente forma: Se determina el logaritmo neperiano de los dos miembros de la ecuación y = f (xi , aj ) ln y = ln f (x1 , x2 ,...,x n )

162

(B.30)

B.4. Propagación de los errores Se toman diferenciales de ambos miembros de la ecuaci´ on anterior.

→

Se identifican los elementos diferenciales con los errores de las variables ( dy ∆y, dxi ∆x), y se sustituyen los valores correspondientes de y y xi en la expresión final:

→

Por ejemplo, imag´ınese que para un cierto experimento se tiene una dependencia de la forma xy α w = f (x,y,z ) = z , (B.31) por tanto se sabe que cada una de las medidas directas x, y y z, tienen errores absolutos asociados ∆ x, ∆y y ∆z. Por tanto tomando logaritmos neperianos a ambos lados de la expresi´ on se obtiene que ln(w) = ln

  xy α z

= ln(x) + α ln(y)

− ln(z),

(B.32)

luego ahora derivamos a ambos lados y tendremos que dw dx dy = +α w x y

∆x ∆y ∆z − dzz −→ ∆w − z. = +α w x y

(B.33)

V´ ease que éste resultado es exactamente el mismo que se conseguir´ıa con el método de las derivadas parciales. Por ejemplo, la frecuencia emitida o absorbida en el transcurso de una transmisión entre los niveles p y n del hidrógeno está dada por la relación ν=

me4 820 h3



1 n2

− p12



,

(B.34)

donde n y p son números enteros y m es la masa del electrón de carga e, siendo 4

R = 8me 2 h3 c ,

(B.35)

0

es la constante de Rydberg. Lo primero es verificar las unidades de dicha constante, digamos

 

me4 (M )(I 4 T 4 ) = −6 −2 8 4 6 3 −3 = T −1 (L M T I )(L M T ) 820 h3

 

me4 1 = T −1 T L−1 = L −1 . 820 h3 c (B.36) Ahora imaginemos que conocemos la relación de la constante de Rydberg y quisieramos saber la incertidumbre en su medida en términos de las cantidades anteriores, en este caso, podemos escribir, tomando logaritmos en ambos lados

R

ln( ) = 1 (ln(m) + 4 ln(e) 8

→ [R] =

− 2ln( 0) − 3ln( h) − ln(c)) ,

(B.37)

163

B. Cálculos de incertidumbre y de pequeñas variaciones luego derivando a ambos lados de la igualdad, se tiene que

R R

ln( )

=

1 8



ln(m) ln(e) +4 m e

− 2 ln(00) − 3 ln(h) − ln(c) h c



(B.38)

,

y conociendo las incertidumbres en cada una de las medidas se tiene que c = (2,997925 0,000003) 10 8 )m/s, h = (6,6260693 0,000000011) 10 −34 )J s, e = (1,602176487 0,00000000040) 10−19 C , m = (9,10938215 0,0000000045) 10−31 kg, o sea,

×

±

×

×

±

×

·

± ±

ln( ) 12 R := = 6,66 10− . (B.39) Un ejemplo más. Piense en el péndulo de torsión. La constante de Torsión C de un alambre, determinada por el método de oscilaciones de un péndulo est´ a dada por la relación

RR

×

C = 8π2 m

a 22 T22

− a21 − T12 ,

(B.40)

donde m es la masa de cada uno de los disco fijados sobre una barra horizontal a la distancia a del eje de rotación. T1 y T2 son los periodos del péndulo correspondientes a dos valores de a1 y a2 de a. Imag´ınese que se hizo la experiencia sobre un alambre de acero de masa (m = 354,0 0,5)g y las otras medidas fueron a 1 = (17,3 0,2)cm y a 2 = (37,3 0,2)cm, además de T1 = (14,3 0,1)seg y T 2 = (17,6 0,1)seg. Luego

±

±

dC C

±

±

±

∆π ∆m a2 ∆a2 + a1 ∆a1 T2 ∆T2 + T1 ∆T1 + +2 +2 π m a22 a21 T22 T12 ∆π ∆m ∆a ∆T = + +2 +2 π m a2 a1 T2 T1 − 3 = (1,5 + 20 + 60) 10 10 %, = 2

−

−

×− ≈

−

(B.41)

ya que ∆a1 = ∆a2 := ∆a = 0,2cm y ∆T1 = ∆T2 := ∆T = 0,1seg. Por otro lado, la incertidumbre relativa más pequeña es ∆m/m = 1,5 10−3 (mucho menor que la incertidumbre resultante). El error de π, para que sea despreciable, deberá ser, por consiguiente, inferior a ese valor, esto se logra, tomando π = 3,14, lo que conduce a

×

× 10−3,

∆π =5 π

× 10−4,

∆π π

≈ 10−3.

(B.42)

× 9,86 × 0,354 × 1092 × 10−4 N w · m = 2,89 ×−2 N w · m ,

(B.43)

∆π = 15

y

2

Con lo cual C=

8

105,3

por consiguiente ∆C =

rad

C = 0,3 10

w·m × 10−2 N rad ,

y por último C = (2,9

164

±

0,3)

rad

×

10

−

2Nw

m

·

rad

.

(B.44) (B.45)

Bibliograf´ıa [1] Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55 . ISBN 0-521-39459-7. [2] Olav Kallenberg, Probabilistic Symmetrie s and Invariance Principles. Springer Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4. [3] Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp. ISBN 0-387-95313-2. [4] P. Bevington and D. K. Robinson, Data reducti on and error analysis for the physic al sciences, 2nd ed. (McGraw Hill, New York, 1993). [5] Stuardt L. Meyer, Data analysis for scientists and engineers (John Willey & Sons, Inc., New York, 1975). [6] D. C. Baird, Experimentación, 2a ed. (Prentice-Hall Hispanoamericana S.A., México, 1991). [7] J. Higbie, Uncertainty in the linear regress ion slope. Am. J. Phys. 59, 184 (1991) [8] J. Orear, Least squares when both variables have uncertainties, Am. J. Phys. ibid., 50, 912 (1982). [9] Simple method for fitting data when both variables have uncertainties. D. Barker and L.M. Diana Am. J. Phys. 42, 224 (1974). [10] Linear least-squares fits with errors in both coordinates . II: Comments on paramete r variances - B. Cameron Reed - Am. J. Phys., Vol. 60, No. 1, 1992. [11] Estad´ıstica - M. Spiegel - McGraw Hill 2da. Ed. Bogotá 1997 [12] S. Gil y E.Rodr´ıguez, F´ısica re-Creativa, Prentice Hall, Buenos Aires 2001. [13] Agresti, A. and Finlay, B., Statistical Methods for the Social Sciences, 3th Edition. Prentice Hall, 1997. [14] Anderson, T. W. and Sclove, S. L., Introductory Statistical Analys is. Houghton Mifflin Company, 1974. [15] Clarke, G.M. and Cooke, D., A Basic course in Statistic s.

165

Bibliograf´ ıa [16] Arnold, 1998. Electronic Statistics Textbook, http://www.statsoftinc.com/textbook/stathome.html. [17] Freund, J.E., Modern elementary statistics. Prentice-Hall, 2001. [18] Johnson, R.A. and Bhattacharyya, G.K., Statistics: Principles and Methods, 2nd Edition. Wiley, 1992. [19] Leppälä, R., Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla, Tampereen yliopisto, Matematiikan, tilastotieteen ja filosofian laitos, B53, 2000. [20] Moore, D., The Basic Practice of Statistics. Freeman, 1997. [21] Moore, D. and McCabe G., Introduction to the Practice of Statistics, 3th Edition. Freeman, 1998. [22] Newbold, P., Statistics for Business and Econometrics. Prentice Hall, 1995. [23] Weiss, N.A., Introductory Statistics. Addison Wesley, 1999.

166

Esta Dis Tical i Bro

Recommend Documents