Estad´ıstica y probabilidad. Una introducci´ on. Notas de Clase. Dr. David Sierra Porta. Laboratorio de Campos y Part´ ıculas. Departamento de F´ısica. Facultad Experimental del Ciencias. Universidad del Zulia. Maracaibo, Venezuela.
Este libro ha sido creado usando el sistema de edici´on de textos de LATEX en un procesador Atom Intel a 1.6GHz en una laptop hp-mini 1100. Est´ a editado especialmente para el uso de los estudiantes de la Licenciatura de F´ısica de la Facultad Experimen tal del Ciencias de la Universidad del Zulia, sin embargo, su contenido es totalmente general y pudiera ser usado por cualquier estudiante de ciencias o afines ya que su contenido se adapta a muchos de los programas modernos de M´ etodos Matem´ aticos. El programa que comprende estas notas ha sido formateado a partir de los programas oficiales de la Facultad para ´esta Licenciatura, de tal manera que se pueden encontrar en http://www.fec.luz.edu.ve y est´ a a disposici´on para todos. Todo el contenido ha sido compilado y creado por David Sierra Porta. Dise˜no de la cubierta por David Sierra Porta. Imagen de la portada: www. morguefile.com (2013). Escrito e ideado por David Sierra Porta. Notas de Clase - Libro de Texto. F´ısica-Matem´ atica.
Estad´ ıstica y probabilidad. Una introducci´ on. Notas de Clase.
F´ ısica-Matem´ atica
Estad´ıstica y Probabilidad David Sierra Porta 19 de mayo de 2015
David Sierra Porta Es graduado en la Licenciatura de Matem´aticas y F´ısica en la Facultad de Humanidades y Educaci´on de la Universidad del Zulia, LUZ, en el a˜ no 2001. Es Magister Scientiarum en la Maestr´ıa de F´ısica Fundamental del Postgrado en F´ısica Fundamental de la Facultad de Ciencias de la Universidad de los Andes, ULA, en 2004. Tambi´ en Doctor en F´ısica Fundamental en la ULA (2015). Se desempe˜ na actualmente como profesor-investigador Asociado a dedicaci´on exclusiva de la Facultad Experimental de Ciencias de la Universidad del Zulia desde el a˜no 2005, en el Departamento de F´ısica. Miembro fundador del Laboratorio de Astronom´ıa y F´ısica Te´ orica, LAFT, y del Laboratorio de Campos y Part´ıculas, LCP, de la Facultad Experimental de Ciencias de la Universidad del Zulia. Autor de varios libros y publicaciones en el ´ area de las Ciencias F´ısicas. Sus intereses personales en investigaci´on versan sobre gravitaci´on y cosmolog´ıa, teor´ıas cu´ anticas de campo, Relatividad General, modificaci´on de la gravedad y teor´ıas de calibre.
A Mai, Santi y Sami.
´Indice general Presentaci´ on Pr´ ologo
13 15
1. Introduc ci´ on a la Estad´ıstica 1.1. Peque˜na definici´on y algunos conceptos b´asicos . . . . . . . . . . . . . . . . 17 1.2. Poblaci´on y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.3. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.4. M´etodos de recolecci´on de datos . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.1. La entrevista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.4.2. La encuesta . . . . . . . . . . . . . ............ ....... 23 1.4.3. Cuestionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.4.4. La observaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
17
2. La estad´ ıstica descriptiva 2.1. Distribuciones de frecuencia . . . . . . . . . . . . . . ............. 2.1.1. Terminolog´ıa adicional . . . . . . . . . . . . . . . . . . . .......
25 27 28
2.1.2. Creando tabla de frecuencias 2.1.3. Notaci´ on una Matem´ atica . . . . . . . . .. . . .. .. .. . . .. .. .. . . .. .. .. . . .. .. .. .. . .31 28 2.1.4. Frecuencia acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.1.5. La frecuencia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.1.6. Los histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2. Medidas de Tendencia Central (MTC) . . . . . . . . . . . . . . . . . . . . . 36 2.2.1. La Media Aritm´etica . . . . . . . . . . . . . . . . ........... 37 2.2.2. La Mediana . . . . . . . . . . ............. ......... 40 2.2.3. La moda . . . . . . . . . . . . . ............ ......... 41 2.2.4. Relaci´on emp´ırica entre la media, mediana y moda . . . . . . . . . . 41 2.2.5. Propiedades de la medi a, mediana y moda . . . . . . . . . . . . . . . 42 2.2.6. El promedio ponderado . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2.7. Otros tipos de medias . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.2.8. Formas de las distribuciones de datos . . . . . . . . . . . . . . . . . 46 2.3. Medidas de variaci´on . . . . . . . . . . . . . . . . . . . . ........... 49 2.3.1. Rango . . . . . . . . . . . . . . . . . . ............ ..... 50 2.3.2. La Varianza . . . . . . . . . . . . . . . . . ............ . . . 50 2.3.3. La Desviaci´on Est´andar . . . . . . . . . . . . . . . . . . . . . . . . . 51
7
´Indice general
2.4. 2.5.
2.6.
2.7.
2.3.4. La Desviaci´on Media . . . . . . . . . . . . . . . . . .......... 52 2.3.5. Dispersi´on absoluta y relativa: coeficiente de variaci´on . . . . . . . . 52 2.3.6. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 2.3.7. Coeficiente de Correlaci´on de Pearson . . . . . . . . . . . . . . . . . 53 Medidas de simetr´ıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.4.1. Coeficientes de asimetr´ıa y curtosis . . . . . . . . . . . . . . . . . . . 55 Teorema que envuelven cuestiones sobre la Desviaci´on Est´andar . . . . . . . 57 2.5.1. La regla emp´ırica . . . . . . . . . . . . . . . . . ............ 58 2.5.2. Teorema de Chebychev . . . . . . . . . . . . . . . . . . . . . . . . . 58 Medidas de Posici´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.6.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.6.2. Deciles . . . . . . . . . . . . ............. .......... 60 2.6.3. Centiles o percentiles . . . . . . . . . . . . . ............ . . 61 Problemas de final de cap´ıtulo . . . . . . . . . . . . ............ . . 63
3. M´ eto dos cuantitativos de a n´ alisis predictivo, r egresi´ on 3.1. Correlaci´on y regresi´on . . . . . . . . . . . ............. ...... 69 3.2. Distribuciones bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.3. La idea de la c orrelaci´on . . . . . . . . . . ............. ...... 70 3.4. Encontrando la relaci´on. Regresi´on . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.1. El coeficiente de correlaci´on . . . . . . . . . . . . . . . . . . . . . . . 72 3.4.2. Regresi´on lineal. El M´etodo de los M´ınimos Cuadrados. . . . . . . . 3.5. Problemas de final de cap´ıtulo . . . . . . . . . . . . ............ . . 77
69
73
4. An´ alisis Combinatorio 4.1. Introducci´on . . . . . . . . . . . . . ............. .......... 81 4.2. Principio Fundamental de Conteo . . . . . . . . . . . . . . .......... 81 4.3. Arreglos . . . . . . . . . . . . . . . . . . . ............. ...... 82 4.4. Variaciones (o arreglos) con repetici´on . . . . . . . . . . . . . . . . . . . . . 83 4.5. Permutaciones (u ordenaciones) sin repetici´on . . . . . . . . . . . . . . . . . 84 4.6. Permutaciones (u ordenaciones) con repetici´on . . . . . . . . . . . . . . . . 84 4.7. Combinaciones . . . . . . . . . . . ............. .......... 85 4.8. Combinaciones con repetici´on . . . . . . . . . . . . . . . . . . . . . . . . . . 85 4.9. An´alisis y Metodolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de conteo . . . . . . . . . . . . ............. ............ 86 4.10. Problemas de final de cap´ıtulo . . . . . . . . . . . . ............ . . 86
81
5. Probabilidad 5.1. Introducci´on: La probabilidad . . . . . . . . . ............. . . . . 89 5.2. La probabilidad . . . . . . . . . . . . . . . ............. ...... 91 5.3. Experimentos de Probabilidad . . . . . . . . . . . . ............ . . 91
89
8
´Indice general 5.4. Calculando la probabilidad de un evento . . . . . . . . . . . . . . . . . . . . 93 5.4.1. Probabilidad Emp´ırica . . . . . . . . . . . . . . . . . . . ....... 93 5.4.2. Probabilidad cl´asica . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 5.5. Axiomas de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.6. Posibilidades y probabilidades . . . . . . . . . . . . . ............. 96 5.7. Propiedades de la probab ilidad de eventos no elementales . . . . . . . . . . 97 5.8. Probabilidad condicionada . . . . . . . . . . . . . . . ............. 98 5.9. Probabilidad total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 5.9.1. Teorema de la probabilidad total . . . . . . . . . . . . . . . . . . . . 99 5.10. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 5.11. Problemas de final de cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6. Variable aleatoria y funci´on de distribuci´on 6.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 6.2. Variable aleatoria unidimensional . . . . . . . . . . . . . . . . . . . . . . . . 106 6.3. Variables discretas . . . . . . . . . . ............ .......... 107 6.4. Variables continuas . . . . . . . . . . . . . . . . ............ . . . . 107 6.5. Caracter´ısticas de una v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 6.5.1. Definici´on. (Esperanza Matem´atica) . . . . . . . . . . . . . . . . . . 108 6.5.2. Definici´on. (Varianza) . . . . . . . . . . ........... . . . . . 109 6.6. Inecuaci´on de Chevyshev . . . . . . . . . . ............ . . . . . . 109 6.7. Problemas de final de cap´ıtulo . . . . . . . . . . . . . . . . . . . . . . . . . . 110
105
7. Distribuciones de Probabilidad Binomial y Normal
113
7.1. on o. n . . binomial . . . . . .o. .de . Bernoulli . . . . . . . . .. .. .. .. . ......... . .. . . . .. .. .. .. . . 113 7.2. Introducci´ La distribuci´ .. 113 7.2.1. Definici´on de distribuci´on binomial . . . . . . . . . . . . . . . . . . . 114 7.2.2. El uso de las tab las de la di stribuci´on binomial . . . . . . . . . . . . 115 7.2.3. Probabilidades acumuladas . . . . . . . . . . . ........... . 116 7.2.4. Media y desviaci´on t´ıpica en una distribuci´ on binomial . . . . . . . . 117 7.3. La distribuci´on Normal . . . . . . . . . . . ............ . . . . . . 117 7.3.1. Uso de las tab las de la di stribuci´on normal N (0;1) . . . . . . . . . . 120 7.3.2. C´alculo de otras probabilid ades . . . . . . . . . . . . . . . . . . . . . 121 7.3.3. C´alculo de probabilidades en normales N (¯ x; σ) . . . . . . . . . . . . 123 7.3.4. Otro uso de las tablas . . . . . . . . . . ........... . . . . . 124 7.4. Relaci´on entre la distribuci´on binomial y la distribuci´on normal . . . . . . . 125 7.4.1. Teorema del L´ımite Central . . . . . . . . . . . . . . . . . . . . . . . 125
8. Estimaci´ on puntual e intervalos de confianza. Inferencia estad´ıstica. 8.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 8.2. Estimaci´on puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 8.2.1. Intervalo de Estimaci´on . . . . . . . . . . . ............ . . 128
127
9
´Indice general 8.3. Intervalos de confianza . . . . . . . . . . . . . . ........... . . . . . 129 8.3.1. Intervalo de confianza para la media poblac ional . . . . . . . . . . . 129 8.3.2. Intervalo de confianza para la media poblac ional usando la desviaci´on est´andar de la muestra. Distribuci´on t de Student . . . . . . . . . . 130 8.3.3. Intervalo de confianza para la proporci´on poblacional . . . . . . . . . 132 8.3.4. Estimador puntual para la desviaci´on est´andar de la poblaci´on . . . 133 8.3.5. Intervalo de confianza para la varianza y desviaci´on est´andar de la poblaci´on . . . . . . . . . . . ........... ........... 133
9. Pruebas d e hip´otesis de una poblaci´on 137 9.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 9.2. Procedimientos de comprobaci´on de hip´otesis y el m´etodo cient´ıfico . . . . . 137 9.3. Dise˜no de hip´otesis de investigaci´on y la experimentaci´on . . . . . . . . . . 138 9.3.1. Las hip´otesis y prueba de hip´otesis . . . . . . . . . . . . . . . . . . . 138 9.3.2. Modelo estad´ ıstico y estad´ıstico de prueba . . . . . . . . . . . . . . . 139 9.3.3. Los errores en la Toma de Decisiones . . . . . . . . . . . . . . . . . . 140 9.3.4. Valor Cr´ıtico y Regi´on de Rechazo . . . . . . . . . . . . . . . . . . . 141 9.3.5. Pruebas de una y dos colas . . . . . . . . . . ............ . 141 9.3.6. Recopilar y analizar los datos experimentales . . . . . . . . . . . . . 142 A. La redacci´on de informes y presentaci´on de resultados 147 A.1. Definici´on de Informe cient´ıfico . . . . . . . . . . ............ . . . 147 A.2. Tipos y clasificaciones del Informe cient´ıfico . . . . . . . . . . . . . . . . . . 147 A.3. Caracter´ısticas, particularidades y modalidades del Informe cient´ıfico . . . . 148 A.3.1. Caracter´ısticas . . . . . . . . . . . . ........... . . . . . . . 148 A.3.2. Particularidades . . . . . . . . . . . ........... . . . . . . . 149 A.3.3. Modalidades . . . . . . . . . . . ........... ......... 149 A.4. Forma de presentaci´on y estilos del Informe cient´ıfico . . . . . . . . . . . . . 150 A.5. Diferencias con el resto de los trabajos cient´ıficos . . . . . . . . . . . . . . . 151 B. C´ alculos de incertidumbre y de peque˜ nas variaciones 153 B.1. Tipos de errores . . . . . . . . . . . ........... ........... 153 B.1.1. Errores sistem´aticos . . . . . . . . . . ............ . . . . . 154 B.1.2. Errores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154 B.2. Precisi´on y exactitud . . . . . . . . . . . . . . . . ............ . . . 154 B.3. Incertidumbre absoluta y relativa . . . . . . . . . . . . . . . . . . . . . . . . 155 B.4. Propagaci´on de los errores . . . . . . . . . . . . . ............ . . . 159 B.4.1. El m´etodo de las derivadas parciales . . . . . . . . . . . . . . . . . . 159 B.4.2. El m´etodo del Neperiano . . . . . . . . . . . ............ . 162
10
´Indice de figuras 2.1. Histograma de frecuencias. . . . . . . . . . . . . . ............. . . 35 2.2. Construyendo un histograma simple. . . . . . . . . . . . . . . . . . . . . . . 35 2.3. Histograma de frecuencias acumuladas y histograma de frecuencias para dos datos. . . . . . . . . . . . ............. ............. . . 36 2.4. Histograma de datos apilad os y diagrama circu lar de proporciones. . . . . . 36 2.5. Pol´ıgono de frecuencias y histograma 3D. . . . . . . . . . . . . . . . . . . . 36 2.6. Distribuci´on sim´etrica. . . . . . . . . . . . . . ............ ..... 47 2.7. Distribuci´on sesgada a la derecha. . . . . . . . . . . . . . . . . . . . . . . . 48 2.8. istribuci´on sesgada a la izquierda. . . . . . . . . . . . . . ........... 48 2.9. Distribuci´on uniforme. . . . . . . . . . . . . . . . . . . . . . ......... 49 2.10. El coeficiente de correlaci´on de Pearson. . . . . . . . . . . . . . . . . . . . . 54 2.11. Coeficiente de Fisher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 2.12. Coeficiente de curtosis. . . . . . . . . . . . . . . . ............. . . 58 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7.
Diagrama de dispersi´on o nube de puntos. . . . . . . . . . . . . . . . . . . . 71 Regresi´on lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 Regresi´on lineal (Error). . . . . . . . . . . . . . . . . . . ........... 72 Ejemplo de regresi´on lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 Regresi´on no lineal. . . . . . . . . . . . . . ............ ....... 74 La curva de regresi´on lineal en t´erminos de los cambios de la funci´ on. . . . . 74 Representaci´on para un cuerpo que se mueve con movimiento uniformemente acelerado. . . . . . . . . . . . ............. ............. 78
4.1. Metodolog´ıa sencilla para la resoluci´on de problemas de conteo. . . . . . . .
86
7.1. Distribuci´on de estaturas de 1400 mujeres. . . . . . . . . . . . . . . . . . . . 118 7.2. Distribuci´on normal N (¯x; σ). El m´aximo est´a en (¯x, √ 1 2 ). . . . . . . . . . 119 2πσ
7.3. 7.4. 7.5. 7.6. 7.7. 7.8.
Distribuci´on normal N (0; 1). El m´aximo est´a en (0 , √12π ). . . . . . . . . . . 11 9 Area encerrada por la curva normal desde hasta k . . . . . . . . . . . . 120 p(Z > k). Basta pasar al complementario. . . . . . . . . . . . ........ 121 p(Z k). Las probabilidades de valores negativos no est´ an tabuladas. . . 121 p(Z k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior. . . 122 p(Z > k). . . . . . . . . . . . ........... ........... . . . 122
−∞
≤− ≤−
11
´Indice de figuras
−
≤
7.9. p(Z > k) = p(Z k). La simetr´ıa permite reducir este caso al que ya est´ a tabulado. . . . . . . . . . . . . . . . . . . . ........... . . . . . 122 7.10. p(k1 Z k 2 ). Probabilidad comprendida entre dos valores. . . . . . . . . 122 7.11. p(Z k2 ) en la primera imagen. p(Z k1 ) en la segunda. Al restar obtenemos el ´area p edida. . . . . . . . . . . . . ........... . . . . . . . 123
≤ ≤ ≤
≤
8.1. Nivel de confianza para la media poblacional. . . . . . . . . . . . . . . . . . 129 8.2. Distribuci´on t de Student. . . . . . . . . ........... ......... 131 8.3. Distribuci´on Chi-cuadrado. . . . . . . . . . . . 9.1. Prueba de hip´otesis de una y dos colas.
12
........... ...........
..... .........
134 141
Presentaci´ on (...) Conseguimos obtener as´ı la f´ ormula estad´ ıstica para conocer aproximadamente la posici´ on de un electr´ on en un instante determinado. Pero, personalmente, no creo que dios juegue a los dados. - Albert Einstein
Se presentan a continuaci´on unas notas de Estad´ıstica Elemental y Fundamental y probabilidad, principalmente enfocado al curso de Estad´ıstica y M´etodos Num´ ericos de la Facultad Experimental de Ciencias de la Universidad del Zulia, LUZ, para la carrera de F´ısica. Las mismas contienen los elementos fundamentales para aprender a usar la estad´ıstica y la teor´ıa de la probabilidad para resolver problemas generales y espec´ıficos de las ciencias. Este curso pudiera tambi´ en entenderse como una introducci´ on en dos campos diferentes que tambi´ en tendr´ an incidencia en el pensum de la licenciatura de f´ısica. Por un lado provee un acercamiento a las t´ecnicas usadas para la descripci´on y manipulaci´on de datos experimentales a la vez que son la base matem´ atica fundamental para definir luego nuevos m´etodos (num´ ericos) para el an´ alisis de problemas. Por otro lado, son la base de la descripci´on de fen´omenos m´as complejos en la oportunidad de examinar procesos fundamentales de part´ıculas en el a´rea de f´ısica estad´ıstica. De tal manera que estas notas se enfocan en ese sentido. Por ´ ultimo, ense˜nar´an a los lectores las herramientas b´ asicas con las que an explorar de manerasus estad´ ıstica a sus cuando est´epodr´ n estudiando y haciendos tesis. Unasoluciones buena parte deproblemas la tesis departiculares esta facultad ameritan de t´ecnicas de procesamiento de datos y manipulaci´on de los mismos para concluir y hacer inferencias de problemas particulare s. De este modo en resumen. El objetivo del curso es que el alumno se familiarice con las herramientas anal´ıticas esenciales necesarias para comprender el funcionamiento y las consecuencias de la aplicaci´on de la teor´ıa estad´ıstica a la resoluci´ on de problemas en f´ısica. El contenido del libro se divide en nueve cap´ıtulos bien diferenciados. Los tres primeros cap´ıtulos est´ an motivados justamente a la manipulaci´on estad´ıstica de los datos experimentales para resolver problemas. En estos apartados se estudian las estad´ısticas descriptivas y un poco de inferencia estad´ıstica con la determinaci´ on de curvas de regresi´on. El cap´ıtulo cuatro, est´a destinado a una peque˜na introducci´on al an´alisis combinatorio. Est´a aqu´ ı, porque en la resoluci´on de problemas de probabilidad es algunas veces muy ´ util la cuantificaci´on de eventos en espacios muestrales, lo cual dtermina m´ as sencillamente el c´alculo de ciertas probabilidades. En el cap´ıtulo cinco se hace una introducci´ on a la probabilidad y sus axiomas fundamentales, haci´endo ´enfasis en la resoluci´ on de problemas sencillos. En el cap´ıtulo seis, se estudia ahora la formaliazaici´on matem´atica de la probabilidad. Esto es muy conveniente, ya que el estudiante entender´a que en adelante, no es necesario realizar
13
´Indice de figuras experimentos sino que bastar´a con la definici´on matem´aticamente abstracta del mismo para el c´alculo de probabilidades, es decir, se plantea de manera idealizada el experimento, considerando las caracter´ısticas del mismo y sus consecuencias, los resultados posibles del experimento y as´ı lograr una idealizaci´on matem´atica del mismo. Se encontrar´a esto muy provechoso ya que no siempre se cuenta con el tiempo, los medios, la infraestructura f´ısica, humana y computacional para llevar a cabo los experimentos. En el cap´ıtulo siete se estudian las distribuciones de probabilidad como una generalizaci´on de experimentos aleatorios haci´endo ´enfasis en las m´ as usadas, la normal y la binomial y se resuelven problemas usando estas t´ecnicas. En los cap´ıtulos ocho y nueve, se presenta una introducci´ on al estudio de pruebas de hip´otesis como paso al estudio de estad´ıstica inferencial. Por u ´ ltimo, se presenta dos ap´endices, el primero, con una nota sobre la redacci´ on y presentaci´on de informes y resultados, y el segundo, sobre c´alculo de errores y variaciones, muy importante en la consideraci´on de medidas experimentales. Buen provecho..!
14
Pr´ ologo The same set of statistics can produce opposite conclusions at different levels of aggregation. - Thomas Sowell. ’Penetrating the Rhetoric’, The Vision of the Anointed (1996), 102.
A cargo de la Profesora M. Jeanette Stock...!
15
1. Introducci´ on a la Estad´ıstica The Charms of Statistics.—It is difficult to understand why statisticians commonly limit their inquiries to Averages, and do not revel in more comprehensive views. Their souls seem as dull to the charm of variety as that of the native of one of our flat English counties, whose retrospect of Switzerland was that, if its mountains could be thrown into its lakes, two nuisances would be got rid of at once. An Average is but a solitary fact, whereas if a single other fact be added to it, an entire Normal Scheme, which nearly corresponds to the observed one, starts potentially into existence. Some people hate the very name of statistics, but I find them full of beauty and interest. Whenever they are not brutalised, but delicately handled by the higher methods, and are warily interpreted, their power of dealing with complicated phenomena is extraordinary. They are the only tools by which an opening can be cut through the formidable thicket of difficulties that bars the path of those who pursue the Science of man. - Sir Francis Galton . Natural Inheritance (1889), 62-3.
1.1.
Peque˜na definici´on y algunos conceptos b´ asicos
Las Estad´ıstica es un ´area de la matem´atica muy importante con aplicaciones en un gran n´umero de campos diferentes. En general uno puede decir que la Estad´ıstica es una ciencia cuya metodolog´ıa es la de recolectar, analizar e interpretar conclusiones a partir de informaci´on inicial. Dicho en otras palabras, la Estad´ıstica es la metodolog´ıa con la cual los cient´ıficos y matem´ aticos desarrollan e interpretan conclusiones a partir de datos recolectados. As´ı el dominio de la Estad´ ıstica es muy amplio y recoge muchas t´ecnicas de muchas a´reas y aplicables a otras tantas para resolver problemas en los cuales la informaci´on que se tiene son b´asicamente conjunto de datos. Definici´ on 1.1 (Estad´ıstica) La Estad´ıstica es la ciencia de recoger o colectar, organizar, analizar e interpretar datos, en principio cualesquiera. Los m´etodos estad´ ısticos pueden ser usados para responder preguntas como: De qu´ e tipo y cu´ antos datos se necesitan recoger para estimar algo? C´omo se organizan y resumen los datos recogidos? C´omo sacamos conclusiones a partir de estos y c´ omo evaluamos sus incertidumbres? O sea, que la estad´ıstica provee m´etodos para
17
1. Introducci´on a la Estad´ ıstica 1. Dise˜no: Planear e implementar estudios de investigaci´ on. 2. Descripci´on: Resumir y explorar datos. 3. Inferir: Hacer predic ciones y generaliz ar fen´omenos a partir de una data inicial. Ejemplo 1.1 (Estad´ıstica en la pr´ actica) Algunos problemas en los que la estad´ ıstica es muy ´util. Considere los siguientes problemas. En agricultura: ¿Es m´ as productivo sembrar nueva semilla o usar fertilizante? En medicina: ¿Cu´ al es la cantidad correcta de la dosis del medicamento para un tratamiento? En ciencias pol´ ıticas: ¿Qu´ e tan exactas son los sondeos de opini´on? En econom´ ıa: ¿Cu´ al ser´a la tasa de desempleo el a˜ no que viene? Un problema t´ ecnico: ¿C´ omo mejorar la calidad de un producto? En f´ısica: ¿Es m´ as efectiva una bombilla LED o una convencional?, en las estrellas de la vecindad solar, ¿cu´ al elemento qu´ımico se encuentra con mayor abundancia?, ¿Cu´ anta energ´ıa almacena un capacitor luego de 20 segundos? Existen dos tipos de estad´ısticas: Descriptiva: tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones, y la Inferencial: infiere propiedades de gran n´umero de datos recogidos de una muestra tomada de la poblaci´on. La muestra se diferencia de la poblaci´ on en el hecho de que la primera es un subconjunto de la segunda, adem´as, la muestra debe estar contenida necesariamente dentro de la poblaci´on. La estad´ıstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblaci´on, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
1.2.
Poblaci´ on y muestra
Cuando se recogen datos ya sea de las caracter´ısticas que sea, suele a menudo ser imposible observar todo el conjunto de resultados, sobretodo si el conjunto es muy grande, tabularlo es adem´as un proceso m´as tedioso y complicado, ordenarlos significa poner a prueba nuestra paciencia e ingenio. Es por ello que suele trabajarse con una parte de ese grupo de resultados. Cuando hablamos del conjunto completo de los datos de un estudio nos referimos a ellos en t´erminos de la poblaci´ no, on, mientras que al subconjunto m´as peque˜ a la parte de la primera, nos referimos como los resultados de la muestra. Definici´ on 1.2 (Poblaci´on) Una poblaci´on (estad´ıstica) es un conjunto de medidas o datos correspondientes con el connjunto completo de las unidades de investigaci´ on sobre los cuales se quiere obtener algunas conclusi´ on o estudio. Definici´ on 1.3 (Muestra) Una muestra es un conjunto m´as peque˜ no de medidas tomados a partir de la poblaci´on.
18
1.3. Variables Ejemplo 1.2 (Poblaci´on y muestra) En muchos casos la poblaci´on bajo consideraci´on puede ser f´ısicamente escrita. Por ejemplo: los estudiantes de la Universidad Nacional, los libros de una biblioteca, o la cantidad de ´ atomos de hierro en una muestra cuadrada de 2cm de lado. Algunas veces la poblaci´on puede no ser finita o casi infinita (al menos en t´ erminos pr´ acticos), en estos casos la muestra es el siguiente paso para describir y analizar un problema espec´ıfico. Por ejemplo: los decimales del n´ umero irracional π (poblaci´ on), los primeros cincuenta decimales del n´ umero π (muestra); la masa de los planetas del universo (poblaci´ on), la masa de los planetas del sistema solar (muestra); los ni˜ nos en edad escolar en el mundo (poblaci´on), los ni˜nos en edad escolar en Venezuela (muestra 1), los ni˜ nos en edad escolar en Maracaibo (muestra 2). Ejemplo 1.3 Por ejemplo, si estamos interesados en medir los salarios de todos los cient´ıficos de las universidades del pa´ıs, el conjunto de datos que representan la poblaci´ on ser´ ıa en este caso la lista de todos los salarios de cualquier universidad en Venezuela. Una muestra podr´ıa ser obtenida seleccionando 10 universidades de una lista unos cuantos estados seleccionados al azar con sus respectivos salarios, por su puesto.
1.3.
Variables
Al conjunto de resultados posibles de una caracter´ıstica que desea estuadiars e en un cierto problema particular, suele llamarsele variable. En t´erminos m´as formales, la variable es b´asicamente la caracter´ıstica que desea medirse o estudiarse, mientras que al conjunto de resultados posibles se le llama dominio de la variable. Si la variable s´ olo toma un valor se le llama variable constante. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir num´ ericamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor num´ erico (edad, precio de un producto, ingresos anuales). Las variables tambi´en se pueden clasificar en: Variables unidimensionales: s´olo recogen informaci´on sobre una caracter´ıstica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales: recogen informaci´on sobre dos caracter´ısticas de la poblaci´on (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen informaci´on sobre tres o m´as caracter´ısticas (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
19
1. Introducci´on a la Estad´ ıstica Discretas: s´olo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: n´ umero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr´ a ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un veh´ıculo puede ser 80,3 km/h, 94,57 km/h...etc. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: 1. Individuo: cualquier elemento que porte informaci´on sobre el fen´omeno que se estudia. As´ı, si estudiamos la altura de los ni˜nos de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. 2. Poblaci´ on: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informaci´on sobre el fen´omeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblaci´ on ser´a el total de las viviendas de dicha ciudad. 3. Muestra: subconjunto que seleccionamos de la poblaci´on. As´ı, si se estudia el precio de la vivienda de una ciudad, lo normal ser´a no recoger informaci´on sobre todas las viviendas de la ciudad (ser´ıa una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. A su vez, digamos que por ejemplo estuvi´eramos interesados en conocer la opini´on de la gente en Venezuela acerca de la posibilidad o necesidad de incrementar la cantidad de puestos en los cuales de distribuye peri´odico a nivel nacional. Por su puesto, que la poblaci´ on estar´ a integrada por todas las respuestas de todos los ciudadanos del territorio nacional. Una muestra estar´ıa asegurada por ejemplo si tom´asemos 1000 encuestas repartidas en todos los estados de acuerdo con la densidad poblacional de cada uno, respondiendo a la pregunta en cuesti´on. Para medir en estad´ıstica es obvio que necesitaremos adem´ as una definici´on para la cuantificaci´on de las cosas o fen´omenos, de la misma manera como se hace una clasificaci´ on en la f´ısica para n´ umeros ordinarios y vectores. Es decir, es importante, clasificar, qu´ e podemos medir y c´omo, toda vez, que existe una clasificaci´on para el comportamiento de una variable. As´ı entonces tendremos que definir los tipos de medida: Par´ ametro - una medida num´erica (generalmente desconocida) hecha usando el conjunto de datos de la poblaci´on en general, estad´ıstico - un valor num´erico (conocida) soportado en el conjunto de datos del espacio muestral. Ejemplo 1.4 Usando el conjunto de datos que describen los salarios de los cient´ıficos, nosotros pudi´ eramos calcular el salario promedio de los cient´ıficos que laboran en las universidades Venezolanas. ´este promedio calculado debe tomarse por un par´ ametro. Mientras
20
1.4. M´etodos de recolecci´ on de datos
que si tomamos en cuenta la data proveniente de la escogencia al azar de las 10 universidades, entonces, ´este valor debe nombrarse como un estad´ ıstico. Es por su puesto, muy sencillo darse cuenta que la poblaci´ on es un conjunto mucho m´as grande que la muestra. Note que la poblaci´ on pudiera ser finita o infinita. En este u ´ ltimo caso es donde la elecci´on de una muestra es realmente indispensable. Adem´ as, debe advertirse que si la poblaci´on tomada y seleccionada es muy grande, entonces probablemente ser´a imposible poder calcular par´ametros de alg´un inter´ es particular. A menos que la poblaci´on sea bastante peque˜na calcular ser´ıa muy dif´ıcil. Sin embargo, seleccionar poblaciones muy peque˜nas es problem´atico, adem´as de peligroso, y miente en el sentido cient´ıfico. En esencia, la idea general es poder seleccionar siempre muestras, m´as peque˜nas, por su puesto, que la poblaci´on y encontrar o calcular estad´ısticos muestrales que pudieran dar explicaciones preliminares de lo que pasa en la data total o poblaci´ on. La idea fundamental es usar ´estos estad´ısticos para inferir o estimar los par´ ametros poblacionales, que es lo que en realidad importa. La pericia de los cient´ıficos se encuentra en tratar de construir buenas muestras a partir de poblaciones muy grandes, tales que los estad´ısticos calculados a partir de ´estas muestras, sean buenas para estimar los par´ametros necesarios. Desafortunadamente, estimar estad´ısticos nunca es 100 % seguro, pero si que podr´ıa ser en alguna medida cercana. Existen varios seg´un los valores que toman los datos. 1. Datos nominales: pueden ser del tipo cualitativos solamente. Los valores para los datos sirven para etiquetar, pero las etiquetas no tienen atributo de orden. Por ejemplo: el tipo de sangre, el grado de estudio, el tipo de raza, el tipo de bacteria en el intestino de una cierta especie de pescado. 2. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. Los valores atribuidos a los datos son etiquetas, pero a diferencia de los anteriores, para ´estos si est´ a prescrito un orden en particular. Por ejemplo: las posiciones del torneo de f´ utbol profesional Venezolano, el nivel de censura de una pel´ıcula. 3. Datos intervalos: s´olo son cuan titativos. Los valores que toman los datos son num´ericos, tienen un orden natural y la diferencia entre los valores que toman los datos son significativas. Por ejemplo: la temperatura, el a˜ no de nacimiento. 4. Datos raz´on: son siempre cuantitativos. Los valores son num´ ericos, tienen orden, y la tanto la diferencia como la raz´on entre los valores son significativas. Por ejemplo, el peso de una persona, el volumen.
1.4.
M´ etodos de recolecci´ on de datos
La recolecci´on de datos se refiere al uso de una gran diversidad de t´ecnicas y herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de informaci´ on, los
21
1. Introducci´on a la Estad´ ıstica cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observaci´ on, el diagrama de flujo y el diccionario de datos. Todas estos instrumentos se aplicar´ a en un momento en particular, con la finalidad de buscar informaci´ on que ser´a u ´ til a una investigaci´on en com´un. En la presente investigaci´on trata con detalle los pasos que se debe seguir en el proceso de recolecci´on de datos, con las t´ecnicas ya antes nombradas. Los analistas utilizan una variedad de m´etodos a fin de recopilar los datos sobre una situaci´on existente, como entrevistas, cuestionarios, inspecci´on de registros (revisi´on en el sitio) y observaci´on. Cada uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar el trabajo de cada una y ayudar a asegurar una investigaci´ on completa.
1.4.1.
La entrevista
Las entrevistas se utilizan para recabar informaci´ on en forma verbal, a trav´ es de preguntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema propuesto o aquellos que proporcionar´an datos o ser´an afectados por la aplicaci´on propuesta. El analista puede entrevistar al personal en forma individual o en grupos algunos analistas prefieren este m´etodo a las otras t´ecnicas que se estudiar´ an m´as adelante. Sin embargo, las entrevistas no siempre son la mejor fuente de datos de aplicaci´ on. Dentro de una organizaci´on, la entrevistas es la t´ecnica m´as significativa y productiva de que dispone el analista para datos. otras es un de informaci´ que serecabar efect´ua cara En a cara. Espalabras, un canalla deentrevistas comunicaci´ on intercambio entre el analista y la organiza-on ci´on; sirve para obtener informaci´on acerca de las necesidades y la manera de satisfacerlas, as´ı como concejo y comprensi´ on por parte del usuario para toda idea o m´etodo nuevos. Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer una corriente de simpat´ıa con el personal usuario, lo cual es fundamental en transcurso del estudio. Realizar entrevistas toma tiempo; por lo tanto no es posible utilizar este m´etodo para recopilar toda la informaci´on que se necesite en la investigaci´on; incluso el analista debe verificar los datos recopilados utilizando unos de los otros m´etodos de recolecci´on de datos. La entrevista se aplican en todos los niveles gerencial y de empleados y dependa de quien pueda proporcionar la mayor parte de la informaci´ on u ´ til para el estudio los analistas que estudian la administraci´on de inventarios pueden entrevistar a los trabajadores del embarque y de recepci´on, al personal de almac´en y a los supervisores de los diferentes turnos, es decir. Aquellas personas que realmente traba jan en el almac´en, tambi´ en entrevistar´ an a los gerentes m´as importante. La habilidad del entrevistador es vital para el ´exito en la b´usqueda de hecho por medio de la entrevista. Las buenas entrevista depende del conocimiento del analista tanto de la preparaci´ on del objetivo de una entrevista espec´ıfica como de las preguntas por realizar a una persona determinada.
22
1.4. M´etodos de recolecci´ on de datos
1.4.2.
La encuesta
Hoy en d´ıa la palabra “encuesta” se usa m´ as frecuentemente para describir un m´etodo de obtener informaci´on de una muestra de individuos. Esta “muestra” es usualmente s´olo una fracci´ on de la poblaci´on bajo estudio. Por ejemplo, antes de una elecci´ on, una muestra de electores es interrogada para determinar c´omo los candidatos y los asuntos son percibidos por el p´ublico - un fabricante hace una encuesta al mercado potencial antes de introducir un nuevo producto - una entidad del gobierno comisiona una encuesta para obtener informaci´on para evaluar legislaci´on existente o para preparar y proponer nueva legislaci´on. No tan s´olo las encuestas tienen una gran variedad de prop´ ositos, sino que tambi´ en pueden conducirse de muchas maneras, incluyendo por tel´efono, por correo o en persona. A´ un as´ ı, todas las encuestas tienen algunas caracter´ısticas en com´un. A diferencia de un censo, donde todos los miembros de la poblaci´on son estudiados, las encuestas recogen informaci´ on de una porci´on de la poblaci´on de inter´ es, dependiendo el tama˜no de la muestra en el prop´ osito del estudio. En una encuesta, la muestra no es seleccionada caprichosamente o s´ olo de personas que se ofrecen como voluntarios para participar. La muestra es seleccionada cient´ıficamente de manera que cada persona en la poblaci´on tenga una oportunidad medible de ser seleccionada. De esta manera los resultados pueden ser proyectados con seguridad de la muestra a la poblaci´on mayor. La informaci´on es recogida usando procedimientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas en mas o menos la misma manera. La intenci´on de la encuesta no es describir los individuos particulares quienes, por azar, son parte de la muestra sino obtener un perfil compuesto de la poblaci´on. El tama˜no de muestra requerido en una encuesta depende en parte de la calidad estad´ıstica necesaria para los establecer los hallazgos; esto a su vez, est´a relacionado en c´omo esos hallazgos ser´an usados. A´un as´ı, no hay una regla simple para el tama˜ no de muestra que pueda ser usada en todas las encuestas. Mucho de esto depende de los recursos profesionales y fiscales disponibles. Los analistas frecuentemente encuentran que una muestra de tama˜no moderado es suficiente estad´ıstica y operacionalmente. Por ejemplo, las muy conocidas encuestas nacionales frecuentemente usan cerca de 1,000 personas para obtener informaci´on razonable sobre actitudes y opiniones nacionales.
1.4.3.
Cuestionario
Los cuestionarios proporcionan una alternativa muy ´ util para la entrevista; si embargo, existen ciertas caracter´ısticas que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al igual que la entrevistas, deben dise˜ narse cuidadosamente para una m´axima efectividad. Recabaci´ on de datos mediante cuestiona rios. Para los analistas los cuestionarios pueden ser la u ´ nica forma posible de relacionarse con un gran n´ umero de personas para conocer varios aspectos del sistema. Cuando se llevan a cabo largos estudios en varios departamento, se puede distribuir los cuestionarios a todas las personas apropiadas para recabar hechos en relaci´on al sistema. En mayor parte de los casos, el analista no ver´ a a los que responde; no obstante, tambi´en esto es una ventaja porque aplican muchas entre-
23
1. Introducci´on a la Estad´ ıstica vista ayuda a asegurar que el interpelado cuenta con mayor anonimato y puedan darse respuestas mas honesta ( y menos respuestas prehechas o estereotipadas). Tambi´en las preguntas estandarizadas pueden proporcionar datos m´ as confiable. Selecci´ on de formas para cuestionarios. El desarrollo y distribuci´on de los cuestionarios; por lo tanto, el tiempo invertido en esto debe utilizarse en una forma inteligente. Tambi´ en es importante el formato y contenido de las preguntas en la recopilaci´ on de hechos significativos. Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas de las preguntas y pueden incluirlas. Con frecuencia se utilizan ambas formas en los estudios de sistemas. Cuestionario Abierto. Al igual que las entrevistas, los cuestionarios pueden ser abiertos y se aplican cuando se quieren conocer los sentimientos, opiniones y experiencias generales; tambi´ en son u´tiles al explorar el problema b´asico, por ejemplo, un analista que utiliza cuestionarios para estudiar los m´etodos de verificaci´on de cr´ edito, es un medio.El formato abierto proporciona una amplia oportunid ad para quienes respond an escriba las razones de sus ideas. Algunas personas sin embargo, encuentran m´ as f´acil escoger una de un conjunto de respuestas preparadas que pensar por s´ı mismas. Cuestionario Cerrado. El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio de un cuidadoso estilo en la pregunta, el analista puede controlar el marco de referencia. Este formato es el m´etodo para obtener informaci´on sobre los hechos. Tambi´ en fuerza a los individuos para que tomen una posici´on y forma su opini´on sobre los aspectos importantes.
1.4.4.
La observaci´on
Otra t´ecnica u´til para el analista en su progreso de investigaci´ on, consiste en observar a las personas cuando efect´uan su trabajo. Como t´ecnica de investigaci´on, la observaci´on tiene amplia aceptaci´on cient´ ıfica. Los soci´ ologos, sic´ologos e ingenieros industriales utilizan extensamente ´esta t´ecnica con el fin de estudiar a las personas en sus actividades de grupo y como miembros de la organizaci´on. El prop´osito de la organizaci´on es m´ultiple: permite al analista determinar que se est´a haciendo, como se est´a haciendo, quien lo hace, cuando se lleva a cabo, cuanto tiempo toma, d´ onde se hace y por que se hace. El analista de sistemas puede observar de tres maneras b´asicas. Primero, puede observar a una persona o actitud sin que el observado se d´e cuenta y su interacci´ on por aparte del propio analista. Quiz´ a esta alternativa tenga poca importancia para el an´ alisis de sistemas, puesto que resulta casi imposible reunir las condiciones necesarias. Segundo, el analista puede observar una operaci´on sin intervenir para nada, pero estando la persona observada enteramente consciente de la observaci´on. Por ´ultimo, puede observar y a la vez estar en contacto con las personas observas. La interacci´on puede consistir simplemente en preguntar respecto a una tarea espec´ıfica, pedir una explicaci´on, etc.
24
2. La estad´ıstica descriptiva If we betake ourselves to the statistical method, we do so confessing that we are unable to follow the details of each individual case, and expecting that the effects of widespread causes, though very different in each individual, will produce an average result on the whole nation, from a study of which we may estimate the character and propensities of an imaginary being called the Mean Man. - James Clerk Maxwell . ’Does the Progress of Physical Science tend to give any advantage to the opinion of necessity (or determinism) over that of the continuency of Events and the Freedom of the Will?’ In P. M. Hannan (ed.), The Scientific Letters and Papers of James Clerk Maxwell (1995), Vol. 2, 1862-1873, 818.
La estad´ıstica descriptiva es la disciplina de la estad´ıstica que intenta describir cuantitativamente las caracter´ısticas principales de un conjunto de datos. Una estad´ıstica un poco m´as completa es la estad´ıstica inferencial. La estad´ıstica descriptiva se distingue de la estad´ıstica inferencial (o estad´ıstica inductiva), en el hecho de que ´esta primera tiene como principal objetivo resumir una muestra, en lugar de utilizar todos los datos de la poblaci´on para aprender y concluir algo acerca de lo que significa o representan los datos de una situaci´on en particular. Otra cosa que las distingue es que en la estad´ıstica descriptiva s´ olo se los datos cuantitativamente y anal´ obtenerpuede conclusiones, pero s´omanipulan lo con los datos disponibles. Por otro lado la ıticamente estad´ıstica para inferencial deducir, o como su nombre lo indica, inferir, otras conclusiones que pudieran dar respuestas m´ as all´a de los datos que se tienen en la muestra. En general, esto significa que la estad´ıstica descriptiva, a diferencia de la estad´ıstica inferenci al, no se desarrollan sobre la base de la teor´ıa de la probabilidad. El principal sustento de la estad´ısitica inferencial es la teor´ıa de la probabilidad. Si la muestra es representativa de la poblaci´ on, es posible inferir importantes conclusiones sobre la poblaci´on a partir del an´alisis de la muestra. La fase de la estad´ıstica que trata con las condiciones ba jo las cuales tales diferencias son v´alidas es la estad´ıstiva inductiva. Ya que dicha inducci´ on no es del todo exacta, el lenguaje de las probabilidades aparecer´a al establecer conclusiones. Sin embargo, aun cuando hagamos un an´alisis de los datos usando estad´ıstica inferencial para sacar conclusiones principales, las estad´ısticas descriptivas generalmente son una base y tambi´ en se presentan. Por ejemplo, en un reporte que informa sobre un estudio en seres humanos, suele aparecer un cuadro en el que el tama˜no total de la muestra, el tama˜no de la muestra en subgrupos importantes (por ejemplo, para cada grupo de tratamiento o de exposici´ on), y las caracter´ısticas demogr´ aficas o cl´ınicas como la edad media , el p orcentaje de sujetos de cada sexo, y la proporci´on de sujetos son relacionadas todas.
25
2. La estad´ıstica descriptiva Estad´ıstica descriptiva proporciona resultados simples sobre la muestra y sobre las observaciones que se han hecho. Estos resultados pueden ser tanto las estad´ısticas cuantitativas, es decir, promedios, o gr´aficos visuales, para entender m´as f´acilmente la situaci´on. Estos resultados o bien puede formar la base de la descripci´ on inicial de los datos como parte de un an´alisis estad´ ıstico m´ as extenso, o pueden ser suficientes en s´ı mismas para una investigaci´ on concreta. Por ejemplo, el porcentaje de bateo en beisbol es una estad´ıstica descriptiva que resume el rendimiento de un jugador o un equipo. Este n´ umero es el n´umero de hits realizados dividido por el n´umero de total de veces que se ha presentado ante el pitcher. Por ejemplo, un jugador que tiene average de 0.33, indica que de tres veces que va al bate, conecta un hit. El porcentaje resume o describe varios eventos discretos. Otro ejemplo tambi´en es el promedio de notas de un estudiante. Este n´umero ´unico describe el comportamiento general de un estudiante en toda la gama de experiencias de un curso. El uso de la estad´ıstica descripti va tiene una historia extensa y, de hecho, la simple tabulaci´on de las poblaciones y de los datos econ´ omicos fue la primera forma en que el tema de las estad´ısticas apareci´ o. M´as recientemente, una colecci´on de t´ecnicas se han formulado bajo el ep´ıgrafe de an´ alisis exploratorio de datos: un ejemplo de esta t´ecnica es el gr´afico de caja. Los an´alisis que provienen de la estad´ıstica pueden ser de situaciones de una variable o de dos o m´as variables.
El an´ alisis univariante El an´alisis univariante implica describir la distribuci´on de una sola variable, incluyendo su tendencia central (incluyendo la media, mediana y moda) y de dispersi´ on (incluyendo la gama de percentiles del conjunto de datos, y las mediciones de propagaci´ on de errores, tales como la varianza y la desviaci´on est´andar, etc.). La forma de la distribuci´on tambi´en puede ser descrita a trav´ es de ´ındices tales como la asimetr´ıa y curtosis. Las caracter´ısticas de distribuci´on de una variable tambi´en se pueden representar en forma gr´ afica o tabular, incluyendo histogramas y diagramas de tallo y hojas.
El an´ alisis bivariado Cuando una muestra se compone de m´ as de una variable, la estad´ıstica descriptiva se puede usar para describir la relaci´ on entre los pares de variables. En este caso, las estad´ısticas descriptivas incluyen: las tabulaciones cruzadas y las tablas de contingencia, representaci´ on gr´afica mediante diagramas de dispersi´on, las medidas cuantitativas de la dependencia, y descripciones de distribuciones condicionales. Las medidas cuantitativas de la dependencia incluyen la correlaci´on (como el coeficiente r de Pearson cuando ambas variables son continuas, o ρ-de Spearman si uno o los dos no lo son) y covarianza (que refleja la escala de relaci´on en la que las variables se miden). La estad´ıstica descriptiva es limitada en tanto que s´ olo permite hacer resultados sobre las personas u objetos que se
26
2.1. Distribuciones de frecuencia han medido. Usted no puede utilizar los datos que ha recogido para generalizar a otras personas u objetos (es decir, utilizando datos de una muestra para inferir las propiedades / par´ametros de una poblaci´on). Por ejemplo, si se prueba un medicamento para combatir el c´ancer y trabaj´o en sus pacientes, no se puede afirmar que funcionar´ıa en otros pacientes de c´ancer, sin embargo, la estad´ ıstica inferencial si dar´ıa esta oportunidad. Para empezar nuestra discusi´on de la metodolog´ıa que usa la estad´ıstica descriptiva para resolver problemas, vamos a ir, paso a paso, determinando las cosas que pueden irse haciendo. As´ı, una vez que se tienen los datos que describen una cierta muestra de una cierta situaci´on de la que quiera averiguarse algo, lo primero es reducir los datos para presentarlos en una forma conveniente para trabajar y empezar la discusi´ on.
2.1.
Distribuciones de frecuencia
Una distribuci´on de frecuencias es una tabla usada para describir un conjunto de datos. Una tabla de frecuencias muestra datos particulares o intervalos o rangos de datos llamados clases de datos. En el caso de mostrar intervalos de datos, se define un valor, que consistir´ a en el valor que representa a dicha clase, usualmente es llamado marca de clase. Adem´ as la tabla de frecuencias muestra un n´ umero a continuaci´on del dato o marca de clase, que representa el n´umero de veces que ´este valor se repite en la data, a ´este n´ umero se le llama frecuencia, o frecuencia de la clase. Ejemplo 2.1 Sup´ ongase que 20 estudiantes de estad´ıstica poseen las siguientes notas a continuaci´ on en una escala de 0 a 100 puntos: 97, 92, 88, 75, 83, 67, 89, 55, 72, 78,
81, 57, 63, 84, 98, 46. Puede construirse tabla de frecuencias para cada91, nota, as´ı 67, en 74, ´esta87, tabla tendr´ ıamos unas 100 filasuna aproximadamente. Para resumir espacio pudiera organizarse todo en clases tales como 90-99, 80-89, 70-79 etc. y contando el n´umero de datos pertenecientes a cada intervalo. As´ı obtendr´ ıamos algo como sigue: Intervalo 90-99 80-89 70-79 60-69 50-59 40-49
Marca de Clase 94.5 84.5 74.5 64.5 54.5 44.5
Frecuencia 4 6 4 3 2 1
Cuadro 2.1.: Una t´ıpica tabla de distribuci´on de frecuencias.
Note que la suma de la columnas de frecuencias es igual a 20, el n´ datos existentes.
umero de todos los
27
2. La estad´ıstica descriptiva
2.1.1.
Terminolog´ıa adicional
1. Los datos: el conjunto total de datos de la muestra se denota por x i , de tal manera que el ´ındice i = 1, 2,...,N denota la posici´on relativa de un dato respecto de los dem´ as. 2. N´ umero total de datos no agrupados: se denota por N . 3. N´ umero total de datos agrupados: se denota por n. 4. L´ımite real inferior de la data: es el menor valor en la data. Lo denotaremos como L i . 5. L´ımite real superior de la data: es el mayor valor en la data. Lo denotaremos como L s . 6. L´ımite inferior de clase: es el menor valor en el intervalo de clase. Lo denotaremos como l i . 7. L´ımite superior de clase: es el mayor valor en el intervalo de clase. Lo denotaremos como l s . 8. Ancho de clase: es la diferencia entre dos l´ımites de clases superiores (o inferiores) consecutivos. Todos las clases deber´ıan tener el mismo ancho, aunque esto no es una regla. 9. Marca de clase: es por lo general el valor medio de los datos de cada intervalo. Pudiera escogerse otro criterio para definir la marca de clase, no tiene mucha importancia, sin embargo, cualquiera sea la escogencia que se haga, lo importante es que ´este dato represente todo el intervalo de clase. Lo denotaremos por x M i . xM i =
li + ls . 2
(2.1)
Ejemplo 2.2 Para la tabla de frecuencias anterior de las notas de los ex´ amenes de estad´ıstica, se tiene que: los l´ımites superiores de clase son: 99, 89, 79, 69, 59, y 49; los l´ımites inferiores de clase son: 90, 80, 70, 60, 50, y 40. Las marcas de clase son: 94.5, 84.5, 74.5, 64.5, 54.5, y 44.5. El ancho de cada clase es 10.
2.1.2.
Creando una t abla de fr ecuencias
Para crear tabla de frecuencias es necesario seguir los pasos a continuaci´ on. 1. Lo m´as importantes es contar o disponer de alguna data que sea de utilidad y con la cual se quisiera estimar algunos valores y/o caracter´ısticas importantes de inter´ es.
28
2.1. Distribuciones de frecuencia 2. Decidir de acuerdo al n´umero de datos y las caracter´ısticas de los mismos las clases ( ) necesarias para optimizar los resultados y agilizar los c´ alculos seguidos.
N
3. Dividir el rango de la data por el n´ ancho de las clases.
umero de clases para obtener un estimado del
Rango del intervalo =
Rango de la data R = , N´ umero de clases
N
recordando que el rango de la data esta dado por Rango de la data := R = Mayor valor
(2.2)
− Menor valor = Ls − Li.
(2.3)
4. Decidir los l´ımites de las clases. 5. Construir la tabla de frecuencia contando el n´umero de datos en cada uno de los intervalos de clase.
El n´umero de tramos en los que se agrupa la informaci´ on es una decisi´on que debe tomar el analista: la regla es que mientras m´ as tramos se utilicen menos informaci´on se pierde, pero puede que menos representativa e informativa sea la tabla. Sin embargo no todo es tan libre de desici´on. Existen algunas reglas que son reconocidas por todos y en las que estamos de acuerdo para que todos usen una misma metodolog´ıa.
La f´ormula de Sturges Una manera de decidir el n´umero total de clases es usar lo que se conoce como la f´ ormula de Sturges. La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla pr´ actica acerca del n´umero de clases que deben considerar al elaborarse un histograma. Este n´umero viene dado por la siguiente expresi´on:
N = 1 + log 2 N,
(2.4)
donde N es el tama˜no de la muestra. Que puede pasarse a logar´ıtmo base 10 de la siguiente forma:
N = 1 + 3 ,322 ∗ log N,
(2.5)
N
donde es el n´umero de clases a escribir y N es el n´umero total de datos de la muestra. As´ı para una data de 100 datos tendremos que hacer una tabl˜na de distribuci´on de frecuencias de := 1 + (3 ,3) log(100) = 7 ,6 7 intervalos de clase.
N
≈
29
2. La estad´ıstica descriptiva
La tabla de Ryan Es recomendable que no sean pocos los intervalos ´ o clases debido a que al condensar la p´erdida de informaci´ on ser´ıa importante con relaci´ on a los datos srcinales. Por otra parte, el n´umeron excesivo de clases, si bien produce poca p´erdida de la informaci´ on no simplifica el trabajo. Otro criterio para determinar el n´ umero de clases es el propuesto por Ryan en 1982 presentado en la siguiente tabla: N´ umero de datos 16 a8 17 32 a 33 64 a 65a128 129a256 257a512 mayora513
N´umero de Clases 4 5 6 7 8 9 10
Cuadro 2.2.: Tabla de Ryan para la determinaci´ on del n´umero de intervalos de clase.
Ejemplo 2.3 Construiremos a continuaci´on una tabla de frecuencias con 6 marcas de clases o intervalos de clase para la data siguiente. Los datos se corresponden con los montos
pagados por 28 conductores diferentes en una estaci´ on de gasolina, por el consumo de la misma. Los montos son en Bol´ıvares Fuertes (Bs.F): 7, 4, 18, 4, 9, 8, 8, 7, 6, 2, 9, 5, 9, 12, 4, 14, 15, 7, 10, 2, 3, 11, 4, 4, 9, 12, 5, 3. En este caso se tendr´ a como dato que se quiere hacer una tabla que tenga ni m´as ni menos 6 intervalos de clase, por tanto, observando la data nos daremos cuenta que el menor monto pagado es 2 mientras que el mayor es 18, por tanto, el rango de la clase ser´a aproximadamente 18 2 = 16 , y por tanto para estimar el ancho de cada clase dividimos el n´ umero calculado anteriormente entre el n´umero de clases dispuesto, as´ı cada clase tendr´ a un ancho de 16 6 = 2,66. Tendremos en definitiva algo como lo que sigue:
−
Clase Intervalo ClaseI 1 -3 ClaseII 4-6 ClaseIII 7-9 ClaseIV 10-12 ClaseV 13-15
ClaseVI
30
16-18
Marca de Clase Frecuencia 2 4 5 8 8 9 11 4 14 2
17
1
2.1. Distribuciones de frecuencia
2.1.3.
Notaci´ on Matem´ atica
En lo que sigue se usar´a la siguiente simbolog´ıa y las siguientes variables que usaremos para referirnos a objetos o valores que definiremos en adelante, a menos que se indique otra cosa. Representaremos los valores que toma una cierta variable en una cierta data como xi , n representar´a el n´umero de valores en el conjunto de datos muestrales agrupados, N el n´ umero de valores en el conjunto poblacional o no agrupados, y fi la frecuencia de cada datos o cada marca de clase, tambi´en es llamada la frecuencia absoluta. Como siempre usaremos la simbolog´ıa para indicar la suma de todos los valores de una variable o expresi´ on. Usando ´esta notaci´ on, y de manera obvia, pudiera escribirse la sentencia de que la suma de todas las frecuencias en la tabla de frecuencias es igual al n´ umero de valores en el conjunto de los datos,
N
fi = f 1 + f2 + ... + fN = N.
(2.6)
i=1
2.1.4.
Frecuencia acumulada
La frecuencia acumulada de una clase de datos es el n´ umero de elementos que existe en esa clase y todos los de las clases previas. En otras palabras, la frecuencia acumulada de una clase es la frecuencia de la clase m´ as todas las frecuencias de las clases anteriores a ´esta. Puede ser tanto decreciente como creciente, si se acumulan las frecuencias desde la u ´ ltima clase o la primera clase respectivamente. Ejemplo 2.4 En la data presentada acerca de las notas de los ex´ amenes de estad´ ıstica pudiera construirse la siguiente tabla de frecuencias acumuladas: Clase I II III IV V VI
Intervalo 90-99 80-89 70-79 60-69 50-59 40-49
↑
Marca de Clase Frec. Frec. Acum. Frec. Acum. 94.5 4 4 20 84.5 6 10 16 74.5 4 14 10 64.5 3 17 6 54.5 2 19 3 44.5 1 20 1
↓
N´ otese que la ´ultima entrada en la columna de la frecuencia acumulada creciente es justamente N = 20, lo mismo sucede para la frecuencia acumulada decreciente. Ejemplo 2.5 A˜ nadiremos a la tabla de frecuencias para el caso de los consumos de gasolina, dos nuevas columnas para la frecuencia acumulada creciente y decreciente respectivamente. Tendremos en definitiva algo como lo que sigue:
31
2. La estad´ıstica descriptiva
Clase Clase I Clase II ClaseIII ClaseIV ClaseV ClaseVI
2.1.5.
Intervalo 1-3 4-6 7-9 10-12 13-15 16-18
Marca de Clase 2 4 5 8 8 9 11 4 14 2 17 1
↑
Frec. Frec. Acum. Frec. Acum. 4 28 12 24 21 16 25 7 27 3 28 1
↓
La frecuencia relativa
La frecuencia relativa de un dato o marca de clase se define como el porcentaje de elementos en esa clase en relaci´on con el total de datos de la muestra. Se denota por fri . Es sencillo calcular la frecuencia relativa como: fri =
fi . N
(2.7)
En vista que el n´ umero fi es siempre menor que N , por razones m´as que obvias, es entonces inmediato que f ri es un n´umero que puede oscilar entre los valores 0 y 1, es decir, 0 f ri 1. Adicionalmente pudiera definirse la frecuencia relativa porcentual como:
≤ ≤
fri % = f ri
× 100% .
(2.8)
Las frecuencias relativas porcentuales son usadas a menudo para hacer descripciones en t´erminos de proporciones de ocurrencias de ciertas caracter´ısticas de la data. Ejemplo 2.6 Para la tabla anterior tendremos: Clase ClaseI ClaseII ClaseIII ClaseIV ClaseV ClaseVI
Intervalo 1-3 4-6 7-9 10-12 13-15 16-18
↑
Marca de Clase Frec. Frec. Acum. Frec. Relat. 2 4 4 .142 5 8 12 .285 8 9 21 .321 11 4 25 .142 14 2 27 .071 17 1 28 .035
Note que la suma de todas las frecuencias relativas en la columna, suma aproximadamente 1, coincidente con el hecho de que existe una posibilidad de 100% de que pudiera ocurrir “cualquiera” de las cosas que describen la data, si pasa alguna de ellas, por su puesto.
32
2.1. Distribuciones de frecuencia
2.1.6.
Los histogramas
Un histograma es una representaci´on gr´afica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente se˜ nalando las marcas de clase, es decir, la mitad del intervalo en el que est´ an agrupados los datos. Un histograma es un resumen gr´ afico de la variaci´on de un conjunto de datos. La naturaleza gr´afica del histograma nos permite ver pautas que son dif´ıciles de observar en ouna num´erica. Esta herramienta se utiliza especialmente en la Comprobaci´ n desimple teor´ıastabla y Pruebas de validez. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores contiguos. En los casos en los que los datos son cualitativos (no-num´ericos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Sabemos que los valores var´ıan en todo conjunto de datos. Esta variaci´ on sigue cierta pauta. El prop´ osito del an´alisis de un histograma es, por un lado, identificar y clasificar la pauta de variaci´ on, y por otro desarrollar una explicaci´on razonable y relevante de la pauta. La explicaci´ on debe basarse en los conocimientos generales y en la observaci´ on de las situaciones espec´ıficas y debe ser confirmada mediante un an´alisis adicional. Las pautas habituales de variaci´on m´as comunes son la distribuci´on en campana, con dos picos, plana, en peine, sesgada, truncada, con un pico aislado, o con un pico en el extremo. Los histogramas son m´ as frecuentes en ciencias sociales, humanas y econ´omicas que en ciencias naturales y exactas. Y permite la comparaci´ on de los resultados de un proceso.
Construcci´ on de un histograma 1. Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor. 2. Paso 2: Obtener el n´umero de clases, existen varios criterios para determinar el n´ umero de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de c´omo est´ en los datos y cu´ antos sean. Un criterio usado frecuentemente es que el n´ umero de clases debe ser aproximadamente a la ra´ız cuadrada del n´umero de datos. Por ejemplo, la ra´ız cuadrada de 30 ( n´umero de art´ıculos) es mayor que cinco, por lo que se seleccionan seis clases. 3. Paso 3: Establecer la longitud de clase: es igual al rango entre el n´ umero de clases. 4. Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relaci´on al resultado del PASO 2 en intervalos iguales. 5. Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un gr´afico de barras, las bases de las barras son los intervalos de
33
2. La estad´ıstica descriptiva clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rect´angulos se obtiene el pol´ıgono de frecuencias. Ejemplo 2.7 A una fabrica de envases de vidrio, un cliente le est´ a exigiendo que la capacidad de cierto tipo de botella sea de 13 ml, con una tolerancia de m´ as menos 1 ml. La f´ abrica establece un programa de mejora de calidad para que las botellas que se fabriquen cumplan con los requisitos del cliente. Al realizar el muestreo se obtienen los siguientes datos de las capacidades de botellas al azar: 11, 12, 13, 12, 13, 14, 14, 15, 11, 12, 13, 12,
14, 15, 11, 12, explicitados 16, 16, 14, y13, 14, 14, 13, 15, 15. En ´este caso puede seg uirse los pasos anteriormente entonces:
− Menor valor = 16 − 11 = 5 . √25 = 5 .
Rango = Mayor valor # de clases =
Longitud de la clase = Se tiene entonces: Clase Intervalo ClaseI 11-12 ClaseII 12-13 ClaseIII 13-14 ClaseIV 14-15 ClaseV 15-16
5 5
= 1.
Marca de Clase Frec. 11.5 3 12.5 5 13.5 5 14.5 6 15.5 6
↑
Frec. Acum. Frec. Relat. 3 .12 8 .20 13 .20 19 .24 25 .24
El histograma de frecuencias se muestra a continuaci´on: Ejemplos de otros tipos de representaciones gr´ aficas Hay histogramas donde se agrupan los datos en clases, y se cuenta cu´antas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases est´an definidas de modo natural, por ejemplo, sexo con dos clases: mujer, var´ on o grupo sangu´ıneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas expl´ıcitamente (intervalos de clase). Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical). Un pol´ıgono de frecuencias es un gr´ afico de linea que representa la informaci´on de la tabla de frecuencias. Justo como los histogramas , el eje vertical representa las frecuencias, que pueden ser tambi´ en las relativas, mientras que el eje horizontal representa la medici´ on de la variable en el conjunto de datos. Para construir el gr´ afico, un punto es dibujado por cada marca de clase, en el caso del histograma es el punto en la parte m´ as alta de la barra y en la mitad de la misma, ´este punto represe nta, por su puesto, la frecuencia de la clase. Para terminar se conectan todos los puntos con lineas rectas. Los pol´ıgonos de frecuencias ser´ a de mucha utilidad luego para estimar la curva de predicci´ on y para estimar el tipo de distribuci´ on particular que sigue el fen´omeno.
34
2.1. Distribuciones de frecuencia
Figura 2.1.: As´ı luce un histograma de frecuencias.
Figura 2.2.: Ejemplo de como debe construirse un histograma simple.
35
2. La estad´ıstica descriptiva
Figura 2.3.: (a) Ojiva, histograma de frecuencias acumuladas y (b) Histograma de frecuencias para dos datos.
Figura 2.4.: (a) Histograma de datos apilados y (b) Diagrama circular de proporciones.
Figura 2.5.: (a) Pol´ıgono de frecuencias y (b) Histograma 3D.
2.2.
Medidas de Tendencia Central (MTC)
Una Medida de Tendencia Central es un valor usado para representar el “promedio” t´ıpico en el conjunto de los datos. En realidad una medida de tendencia central es cual36
2.2. Medidas de Tendencia Central (MTC) quier medida que estime el centro o medida centarl de un conjunto de datos orenados por magnitud. Al describir grupos de observaciones, con frecuencia se desea describir el grupo con un solo n´umero. Para tal fin, desde luego, no se usar´a el valor mas elevado ni el valor mas peque˜no como ´unico representante, ya que solo representan los extremos. Mas bien que valores t´ıpicos. Entonces ser´ıa mas adecuado buscar un valor central. Las medidas que describen un valor t´ıpico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos mas bien que a individuos. un promedio es una caracter´ıstica de grupo, no individual. Entre las medidas de tendencia se encuentran las siguientes.
2.2.1.
La Media Aritm´ etica
La medida de tendencia central mas obvia que se puede elegir, es el simple promedio de las observaciones del grupo, es decir el valor obtenido sumando las observaciones y dividiendo esta suma por el n´umero de observaciones que hay en el grupo. La media resume en un valor las caracter´ısticas de una variable teniendo en cuenta a todos los casos. Solamente puede utilizarse con variables cuantitativas. La suma de todos los valores de el conjunto de datos dividido por el n´umero de valores en la data es lo que se conoce como la media. La media para el espacio muestral es denotada por ¯x mientras que para la poblaci´on es denotada por la letra griega µ. x ¯=
µ=
n i=1
xi , para los valores de la muestra , n N i=1 xi , para los valores de la poblaci´on. N
(2.9) (2.10)
Ejemplo 2.8 El promedio o la media de los resultados en un examen de f´ısica cuyas notas han sido: 10, 15, 17, 7, 16, 8, 10, 19, 15, 10, 8; es: x ¯=
n i=1 xi
n
=
135 = 12,27. 11
(2.11)
Ejemplo 2.9 Calcular la media de cada uno de los ejemplos explicitados en las secciones anteriores.
Propiedades de la media aritm´ etica La media aritm´etica tiene cinco propiedades importantes, las cuales son: 1. La suma algebr´aica de las desviaciones de un conjunto de datos o n´ umeros respecto de su media aritm´etica es cero. En notaci´on matem´atica puede escribirse que: N
N
desvi =
i=1
(xi
i=1
x ¯ ) = 0.
(2.12)
− 37
2. La estad´ıstica descriptiva 2. La suma de los cuadrados de las desviacio nes de un conjunto de n´umeros x i rrspecto de un cierto n´umero a es m´ınima, si y s´olo si a = x ¯. 3. Si n1 n´ umeros tienen media m 1 y n2 n´ umeros tienen media m 2 , y as´ı sucesivamente nk n´umeros tienen media m k , entonces la media de todos los n´umeros es
···
+ n k mk ¯ = n1 m1 + n2 m2 + n3 m3 + X , n1 + n2 + n3 + + nk
···
(2.13)
es decir, una media ponderada de todas las medias (m´ as adelante ver´a esto). 4. Si a cada uno de los resultados de un conjunto de datos x i se les suma una cantidad b, produciendo un nuevo conjunto de datos y i , entonces, y i = b + xi
→ y¯ = b + x¯.
(2.14)
As´ı mismo, si cada uno de los resultados de un conjunto de datos x i se les multiplica por una cantidad c, produciendo un nuevo conjunto de datos zi , entonces, zi = cx i
→ z¯ = cx¯.
(2.15)
La propiedad 4 es muy ´util para calcular el promedio de un conjunto de datos agrupados por clases, mas adelante se usa esta propiedad para obtener una f´ ormula para este caso. Ejemplo 2.10 Veamos de manera sencilla como las propiedades anteriores son ciertas en general. La primera de las propiedades es se demuestra haciendo que: N
i=1
N
−
(xi x ¯) =
N
N
N
xi N
N
xi x ¯ N
N
− − − xi
i=1
x ¯=
i=1
N
i=1
x ¯=N
i=1
i=1
−
1 = Nx ¯ Nx ¯ = 0. (2.16)
i=1
La segunda propiedad es tambi´ en f´ acil de demostrar ya que: N
(xi
i=1
− a)2 = f (xi),
(2.17)
por tanto la primera de las condiciones para m´ aximos y m´ınimos de una funci´on y el teorema fundamental del c´alculo, se tiene que d dxi f (xi ) = 0
38
N
→ 2
i=1
(xi
− a) = 0 → xi = a.
(2.18)
2.2. Medidas de Tendencia Central (MTC)
Para la tercera tenemos que si tenemos conjuntos de datos xi est´ an divididos en varias partes de tama˜nos n1 , n 2 ,..., nk , entonces el total de datos es N = n 1 + n2 + n3 + + nk , por tanto,
···
N
¯ = X
= =
N
xi n1 + n2 + n3 +
· · · + nk (x1,1 + · · · + x1,n ) + (x2,1 + · · · + x2,n ) + · · · + (xk,1 + · · · + xk,n ) 2 ++nx 3 + ·+· · + n2,1 · · n+k x2,n + · · · + xk,1 + xk,2 + · · · + xk,n x1,1 + x1,2 + · · · + x1,nn1 + x 2,2 + n1 + n2 + n3 + · · · + nk n1 + n2 + n3 + · · · + nk n1 + n2 + n3 + · · · + nk n1 x1,1 + x1,2 + · · · + x1,n n 2 x2,1 + x2,2 + · · · + x2,n + +··· N n1 N n2 nk xk,1 + xk,2 + · · · + xk,n +···+ i=1
=
xi = N
i=1
1
2
k
1
2
k
1
2
k
N
=
nk
···
n1 m1 + n2 m2 + n3 m3 + + n k mk = n1 + n2 + n3 + + nk
···
N j=1 nj mj , N k=1 nk
(2.19)
en la pen´ultima l´ınea se ha multiplicado y dividido cada t´ ermino por n1 , n2 ,....., nk respectivamente y en la ´ultima linea se ha definido mi =
j=1
ni
xi,1 + xi,2 + ni
· · · + xi,n , i
(2.20)
lo cual es la media de cada subconjunto de datos. La cuarta propiedad es tambi´ en sencilla, v´ ease que dado un conjunto de datos x a los cuales se les suma o resta una cierta cantidad a, dando yi := a xi , se tiene que i
±
N
y¯ =
yi = N
N
i=1
i=1
a
± xi = N
N
a N
± i=1
Por ´ultimo si dado un conjunto de datos cantidad c, dando zi := cx i , se tiene que N
z¯ =
zi = N
N
i=1
N
i=1
i=1
xi N =a N N
± x¯ = a ± x¯.
(2.21)
xi a los cuales se les multiplica una cierta czi =c N
N
i=1
zi = z¯. N
(2.22)
Esta propiedades son muy ´utiles en algunos casos. Veamos algunos ejemplos. Ejemplo 2.11 De los 80 empleados de una empresa, 60 cobran mil 30 bol´ıvares la hora y el resto 15 bol´ıvares la hora. En este caso n1 = 60, n2 = 20, m1 = 30 y m2 = 15, luego la media de todos es n1 m1 + n2 m2 60 30 + 20 15 2100 ¯ X= n1 + n2 = 60 + 20 80 = 26, 25. (2.23)
·
·
39
2. La estad´ıstica descriptiva Ejemplo 2.12 Para hallar el promedio de los siguientes datos de un experimento
x :=
{3 × 10−3; 4 × 10−3; 3,3 × 10−3; 5 × 10−3; 4,2 × 10−3} se puede usar la cuarta propiedad para observar que los datos xi = cz i = {3;4;3 ,3;5;4 ,2} × 10−3 , por tanto 3 + 4 + 3 ,3 + 5 + 4 ,2 × 10−3 = 3,9 × 10−3. x ¯= (2.24) 5 Cuando los datos han sido agrupados por frecuencias la forma de calcular la media es ligeramente distinta ya que hay que considerar las frecuencias de cada uno de los datos, en este caso se tendr´ıa que la media de los datos xi correspondientes a sus frecuencias respectivas fi es N xi fi x ¯= . (2.25) N
i=1
V´ ease que si tomamos todos los datos como distintos y por tanto sus frecuencias son iguales a 1 todas, entonces la f´otmula anterior se reduce a la primera. Si por otro lado, los datos han sido agrupados por clases, entonces, todos los valores que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase, o al punto medio, del intervalo. Entonces en este caso la propiedad tercera de la media se considera v´alida si interpretamos a yi como la marca de clase, fi como la correspondiente marca de clase, b como cualquier marca de clase o n´umero dentro del intervalo de clase y yi = x i b, en este caso se tendr´a que
−
N
x ¯=b+ i=1
donde c es el ancho de la clase.
2.2.2.
La Mediana
yi fi c, N
(2.26)
La mediana es un valor el cual separa el 50% de los valores mayores de la data del 50 % restante menor. Para calcu lar la mediana, lo m´as sencillos es localizar todos los datos en orden, y entonces buscar el punto medio de los mismos. Si n es impar, el valor medio ser´ a justamente la mediana; por el contrario si n es par, entonces la mediana ser´a el valor medio de los dos valores centrales. Utilizaremos como notaci´on la siguiente para referirnos a ´este valor, x0,5 . Ejemplo 2.13 La mediana para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando as´ı: 7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19
(2.27)
vemos el n = 11, por tanto la mediana es el dato del centro de esta distribuci´ on ordenada, el cual es el dato con el orden 6to, es decir x0,5 = 10.
40
2.2. Medidas de Tendencia Central (MTC) Ejemplo 2.14 Calcular la mediana de cada uno de los ejemplos explicitados en las secciones anteriores. En realidad la mediana corresponde al valor de una medida de posici´ on llamada cuartil 2, Q 2 , que veremos m´as adelante. Por eso esperaremos hasta entonces para dar una mejor aproximaci´ on a su c´alculo y significado verdadero.
2.2.3.
La moda
De todos los valores de la data, la moda resulta ser el valor que aparece repetida el mayor n´ umero de veces en el conjunto, o lo que es lo mismo, el dato con mayor frecuencia. Pudiera pasar que dos o varios datos se repitieran con la misma frecuencia, en este caso, se considera llamar a la distribuci´on con un nombre parti cular en virtud de cuantos valores moda existan, as´ı, si s´ olo un valor es que el tiene mayor frecuencia, entonces, a esta distribuci´ on se le llamar´a unimodal; si tiene dos modas, entonces, se le llamar´ a bimodal y si tiene m´as se le llamar´a polimodal. Ejemplo 2.15 La moda para el conjunto de datos de las notas del examen de f´ısica puede calcularse ordenando as´ı: 7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19. Vemos el dato con mayor frecuencia es el 10, por tanto la moda es el 10. Ejemplo 2.16 Calcular la moda de cada uno de los ejemplos explicitados en las secciones anteriores. En el los caso de datos agrupados construido curva de frecuencia para(o ajustar datos, la moda ser´ a donde el valorse(ohaya valores) de x una correspondiente al m´aximo m´aximos) de la curva, Ese valor se denota por ˆ x. La moda tambi´ en puede deducirse de una distribuci´on de frecuencias o de un histograma de frecuencias a partir de la f´ ormula m = L1 +
∆1 ∆1 + ∆ 2
c,
(2.28)
donde L1 es la frontera inferior de la clase modal (clase que contiene la moda), ∆ 1 es el exceso de la frecuencia modal sobre la clase inferior inmediata, ∆2 es el exceso de frecuencia modal sobre la clase superior inmediata y c es el ancho del intervalo de la clase modal.
2.2.4.
Relaci´ on emp´ırica entre la media, mediana y moda
Para curvas de frecuencias unimodales que sean poco asim´etricas tenemos la siguiente relaci´on emp´ırica x ¯ m = 3(¯x x0,5 ), (2.29)
−
−
donde ¯x es la media, m es la moda y x 0,5 es la mediana.
41
2. La estad´ıstica descriptiva
2.2.5.
Propiedades de la med ia, medi ana y moda
Propiedades de la media, ampliado 1. La media es la m´as com´un de todas las medidas de tendencia central usadas para el an´alisis de los datos. 2. Todo conjunto de datos de nivel de intervalo y de nivel de raz´ on tiene un valor medio. 3. Al evaluar la media se incluyen todos los valores. 4. Un conjunto de datos s´ olo tiene una media. Esta es un valor ´unico. 5. La media es una medida muy ´ util para comparar dos o m´as poblaciones. 6. Se interpreta como punto de equilibrio o centro de masas del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor. La media es la ´unica medida de ubicaci´on donde la suma de las desviaciones de cada valor con respecto a la media, siempre ser´ a cero. n
i=1
(xi
− x¯ )fi = N
n
i=1
xi f i N
n
− x¯
i=1
fi =x ¯ N
− x¯ = 0.
(2.30)
7. La media podr´ıa no ser un promedio adecuado para representar datos no regulares. La media se ve afectada de modo notable por valores extraordinariamente grandes o peque˜nos. 8. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor). 9. Minimiza las desviaciones aticas de los datos respecto de cualquier valor prefijan cuadr´ (x −k)2 do, esto es, el valor de i=1 N i es m´ınimo cuando k = x ¯. Este resultado se conoce como Teorema de K¨onig. Esta propiedad permite interpretar uno de los par´ ametros de dispersi´on m´as importantes: la varianza. 10. Si uno pudiera asumir que el pol´ıgono de frecuencia tiene una curva suave que lo representa, digamos f (x), entonces ahora los datos dejan de ser discretos y se convierten en continuos, de este modo se demuestra que
x ¯
f (x)dx =
−∞
+
∞
f (x)dx.
(2.31)
x ¯
11. Si se suma (o se resta ) una constante α a cada una de las observaciones, el promedio aritm´etico se ver´ a aumentado (o disminuido) en esa constante α, es decir, yi := x i
42
± α −→ y¯ = x¯ ± α.
(2.32)
2.2. Medidas de Tendencia Central (MTC) 12. Si se multiplica (o se divide) cada una de las observaciones por una constante β , el promedio aritm´etico se ver´ a multiplicado (o dividido) por esa constante β , es decir
− → y¯ = β x¯, −→ y¯ = βx¯ .
yi := βxi xi yi := β
(2.33) (2.34)
13. En general si los datos sufren una trans formaci´on af´ın (cambios de srcen y escala), esto es, si yi = β xi + α entonces ¯y = β x ¯ + α, donde ¯y es la media aritm´etica de los yi , para i = 1,...,N y α y β n´ umeros reales.
Propiedades de la mediana 1. Es ´unica, s´olo existe una mediana para un conjunto de datos. 2. No se ve afectada por valor es muy grandes o muy peque˜nos. 3. Puede calcularse para una distribu ci´on de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo. 4. Puede obtenerse para datos de nivel de raz´on, de intervalo y ordinal (excepto para el nominal). 5. Es menos sensible que la media a oscilacione s de los valores de la variable. Un error de transcripci´on en la serie del ejemplo anterior en, pongamos por caso, el ´ ultimo n´ umero, deja a la mediana inalterada. 6. No se ve afectada por la disper si´on. De hecho, es m´as representativa que la media aritm´etica cuando la poblaci´ on es bastante heterog´enea. Suele darse esta circunstancia cuando se resume la informaci´on sobre los salarios de un pa´ıs o una empresa. Hay unos p ocos salarios muy altos que elevan la media aritm´etica haciendo que pierda representatividad respecto al grueso de la poblaci´on. Sin embargo, alguien con el salario mediano sabr´ıa que hay tanta gente que gana m´as dinero que ´el, como que gana menos.
Propiedades de la moda 1. Puede determinarse para to dos los niveles de datos: nominal, ordinal, de interv alo y de raz´on. 2. No se ve afectada por valores muy altos o muy bajos. 3. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.
43
2. La estad´ıstica descriptiva 4. Para muchos conjuntos de datos no hay valor modal porque ning´ m´as de una vez.
un valor aparece
5. Para algunos conjuntos de datos hay m´ as de una moda (bimodal = que tiene dos modas). 6. La moda, cuando los datos est´an agrupados, es un punto que divide el intervalo modal en dos partes de la forma p y c p, siendo c la amplitud del intervalo, que verifiquen que: p fi fi−1 = , (2.35) c p fi fi+1
−
− −
−
siendo fi la frecuencia absoluta del intervalo modal y fi−1 y fi+1 las frecuencias absolutas de los intervalos anterior y posterior, respectivamente.
2.2.6.
El promedio ponderado
Es una generalizaci´on de la media aritm´etica. Se denomina media ponderada de un conjunto de n´umeros al resultado de multiplicar cada uno de los n´ umeros por un valor particular para cada uno de ellos, llamado su peso, obteniendo a continuaci´ on la suma de estos productos, y dividiendo el resultado de esta suma de productos entre la suma de los pesos seg´un la caracter´ ıstica de cada n´ umero inicial. Este “peso” depende de la importancia o significancia de cada uno de los valores. Para una serie de datos, xi = x1 , x2 ,...,x n , a la que corresponden los pesos W = w1 , w2 ,...,w n , la media ponderada se calcula como: x¯W = o: x¯W =
n i=1 n xi w i , i=1 wi
x1 w1 + x2 w2 + x3 w3 + ... + xn wn . w1 + w2 + w3 + ... + wn
(2.36)
(2.37)
Un ejemplo es la obtenci´ on de la media ponderada de las notas de una oposici´ on en la que se asigna distinta importancia (peso) a cada una de las pruebas de que consta el examen. Ejemplo 2.17 Promedio de puntos del grado. Asignamos a los grados las letra con los valores: A = 4, B = 3, C = 2, D = 1, F = 0, y entonces cada valor del grado se cuenta seg´ un el n´umero de los cr´editos ganados con ese grado. Calcular el grado de un estudiante que ha ganado 12 cr´ editos de las A, 21 cr´ editos de los B , 5 cr´ editos de las C y 3 cr´ editos de D ’s. Ejemplo 2.18 Grado del curso. El nota final en este curso se calcula seg´ un la escala siguiente: La preparaci´ on cuenta con el 15 %, el 20 % por cada examen de tres que hay, y el examen final vale el 25 %. Podemos sacar la cuenta para cada componente del grado final
44
2.2. Medidas de Tendencia Central (MTC)
con su porcentaje para calcular el grado final. Calcular la cuenta final para un estudiante que ha anotado 95 en la preparaci´on, tiene notas de los ex´ amenes de 83, 94, y 77, y una nota en el examen final es de 88.
2.2.7.
Otros tipos de medias
Media cuadr´ atica La media cuadr´atica es igual a la ra´ız cuadrada de la suma de los cuadrados de los valores dividida entre el n´umero de datos: x ¯=
2
n i=1
a2i
n
=
2
a21 + a22 + n
· · · + a2n .
(2.38)
Esta media como medida de asociaci´ on tiene aplicaciones tanto en ciencias biol´ogicas como en medicina. A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadr´ atica. Consiste en elevar al cuadrado todas las observaciones (as´ı los signos negativos desaparecen), en obtener despu´ es su media aritm´etica y en extraer, finalmente, la ra´ız cuadrada de dicha media para volver a la unidad de medida srcinal.
Media geom´ etrica La media geom´etrica de una cantidad finita de n´umeros (digamos n n´ umeros) es la ra´ız n-´esima del producto de todos los n´umeros.
n
x ¯=
n
i=1
xi =
√ x1 · x2 · · · xn . n
(2.39)
Por ejemplo, la media geom´etrica de 2 y 18 es
√2 · 18 = √36 = 6 . 2
2
(2.40)
Otro ejemplo, la media de 1, 3 y 9 seria
√1 · 3 · 9 = √27 = 3 . 3
3
(2.41)
S´olo es relevante la media geom´etrica si todos los n´ umeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un n´umero negativo (o una cantidad impar de ellos) entonces la media geom´etrica es, o bien negativa o bien inexistente en los n´umeros reales. En muchas ocasiones se utiliza su trasformaci´on en el manejo estad´ıstico de variables con distribuci´ on no normal. La media geom´etrica es relevante cuando varias cantidades son sumadas para producir un total.
45
2. La estad´ıstica descriptiva
Media arm´ onica La media arm´onica, representada por H , de una cantidad finita de n´ umeros es igual al rec´ıproco, o inverso, de la media aritm´etica de los rec´ıprocos de dichos n´ umeros. As´ı, dados los n´umeros a 1 , a2 ,...,a n , la media arm´onica ser´a igual a: n
H=
n 1 i=1 ai
=
n
( a11 +
· · · + a1 ) .
(2.42)
n
La media arm´onica resulta poco influida por la existencia de determinados valores mucho m´as grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho m´ as peque˜nos que el conjunto. La media arm´onica no est´a definida en el caso de la existencia en el conjunto de valores nulos.
Media generalizada La media generalizada es una abstracci´on de los diversos tipos de media (geom´etrica, aritm´etica, arm´ onica, etc). Se define como:
m
x ¯(m) =
n
1 n
n i=1 n i=1 xi
xm m=0 i
m= 0
,
(2.43)
en donde el par´ametro m indica si la media es: aritm´etica, con m = 1, geom´etrica, con m = 0, arm´onica, con m =
−1,
cuadr´ atica, con m = 2. Obs´ ervese que para valores de m
≤ 0 la expresi´on s´olo tiene sentido si todos los
xi
≥ 0.
Ejemplo 2.19 Calcule los valores de las medias anteriormente definidas para todas las situaciones y conjunto de datos anteriores.
2.2.8.
Formas de las dist ribuciones de dato s
Podemos clasificar varias formas de las distribuciones de datos de-acuerdo al lugar que ocupan las medidas de tendencia central m´as usuales anteriormente definidas.
46
2.2. Medidas de Tendencia Central (MTC)
Figura 2.6.: Una distribuci´on sim´etrica. Ve´ ase la igual proporci´on de barras con alturas aproximadas a ambos lados de la media.
Sim´ etrica La distribuci´on de datos es aproximadamente de la misma forma a ambos lados de la linea central, en donde se encuentra aproximadamente la media. La media y la mediada (y la moda, si es modalidad) son pr´acticamente iguales en una distribuci´on sim´etrica.
Sesgada a la derecha Unos cuantos valores se encuentran la izquierda de la media, pero la mayor´ıa de todos los datos se encuentran muy agrupados y acumulados a la derecha de la misma. Generalmente la mediana es m´as peque˜na que la media. Por lo tanto, en ´este caso, la media se encuentra a la derecha de la mediana.
Sesgada a la izquierda Unos cuantos valores se encuentran la derecha de la media, pero la mayor´ıa de todos los datos se encuentran muy agrupados y acumulados a la izquierda de la misma. Generalmente la mediana es m´as grande que la media. Por lo tanto, en ´este caso, la media se encuentra a la izquierda de la mediana.
Uniforme Todos los datos est´an igualmente representados.
47
2. La estad´ıstica descriptiva
Figura 2.7.: Una distribuci´on sesgada a la derecha. Ve´ase la desigual proporci´on de barras con alturas mayores a la derecha de la media.
Figura 2.8.: Una distribuci´on sesgada a la izquierda. Ve´ase la igual proporci´on de barras con alturas mayores a la izquierda de la media.
48
2.3. Medidas de variaci´on
Figura 2.9.: Una distribuci´on uniforme. Las barras tienen aproximadamente la misma altura a ambos lados de la media.
2.3.
Medidas de variaci´on
Para conseguir una visi´on completa y comprensiva de los datos hay que complementar las medidas de tendencia central con las de otras propiedades de los mismos. La dispersi´ on o variaci´ on de los datos intenta dar una idea de cu´ an esparcidos se encuentran los datos de una cierta distribuci´on de datos. Por ejemplo, el grado en que los datos se parecen o diferencian entre s´ı. A esta propiedad se la denomina variabilidad o variaci´ on. Entre los indicadores de variaci´on m´as utilizados est´an la varianza y la desviaci´on t´ıpica. Las medidas de dispersi´on, como tambi´ en se les conoce, muestran la variabilidad de una distribuci´ on, indicando por medio de un n´umero o estad´ıstico si las diferentes puntuaciones de una variable est´an muy alejadas de la media. Cuanto mayor sea ese valor mayor ser´ a la variabilidad, cuanto menor sea, mas homog´eneo ser´ a a la media. As´ı se sabe si to dos los casos son parecidos o var´ıan mucho entre ellos. Para calcular la variabilidad que una distribuci´on tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritm´etica. Pero la suma de las desviaciones es siempre cero, as´ı que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviaci´ on media) y otra es tomando las desviaciones al cuadrado (Varianza).
49
2. La estad´ıstica descriptiva
2.3.1.
Rango
El rango estad´ıstico es la diferencia entre el valor m´ ınimo y el valor m´ aximo en un grupo de n´umeros. Para averiguar el rango de un grupo de n´ umeros: ordenamos los n´umeros seg´un su tama˜no, y luego restamos el valor m´ınimo del valor m´aximo.
2.3.2.
La Varianza
Es el promedio de las distancias al cuadrado desde los valores en una muestra de n sujetos. Se denota usualmente por s2x s2x = s2x =
x i hasta la media ¯x en
− x¯)2 − 1 , varianza muestral, − µ)2 , varianza poblacional.
i=1 (xi
n i=1 (xi N
(2.44) (2.45)
La varianza es una variable estad´ıstica que mide la dispersi´on de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadr´aticas de n puntuaciones respecto a su media aritm´etica. Est´a medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La varianza tiene como valor m´ınimo 0. Hay que tener en cuenta que la varianza puede verse muy influida por los valores at´ıpicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersi´ on m´as robustas.
Propiedades 2 La varianza es siempre positiva o 0: SX
≥ 0.
Si a los datos de la distribuci´on les sumamos una cantidad constante la varianza no se modifica. Sea Yi = X i + k, entonces SY2
= =
¯ + k)]2 (Yi Y¯ )2 [(Xi + k) (X = = n n ¯ )2 (Xi X 2 = SX n
− −
−
¯ (Xi + k X n
− − k)2 (2.46)
Si a los datos de la distribuci´ on les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante. Si Yi = X i k, entonces SY2
= =
50
¯ k)2 (Yi Y¯ )2 (Xi k X = = n n ¯ )2 ] [k2 (Xi X 2 2 = k SX n
−
·
−
· − · ·
·
·
[k (Xi n
− X¯ )]2 (2.47)
2.3. Medidas de variaci´on 2 2 2 Propiedad distributiva: S (X +Y ) = S X + SY .
Si tenemos k grupos con tama˜nos n1 ,...,n k , y con medias y varianzas conocidas (¯x1 , x ¯2 ,..., x ¯k ) y (S12 , S22 ,...,S k2 ), entonces se puede definir la varianza total como: s2T = donde
2 i ni Si i ni
x ¯T =
2.3.3.
La Desviaci´on Est´ andar
− j
+
n j (xj
j nj
i
x ¯ T )2
,
ni x ¯i . i ni
(2.48)
(2.49)
La varianza a veces no se interpreta claramente ya que se mide en unidades cuadr´aticas. Para evitar ese problema se define otra medida de dispersi´ on, que es la desviaci´on t´ıpica, que se halla como la ra´ız cuadrada positiva de la varianza. La desviaci´on t´ıpica nos informa sobre la dispersi´on de los datos respecto al valor de la media; cuanto mayor sea su valor, m´as dispersos estar´an los datos.
Sx = σx =
n i=1 (xi
− x¯)2 − 1 , Desviaci´on t´ıpica muestral n 2 i=1 (Xi − µ) , Desviaci´ on t´ıpica poblacional n
(2.50)
(2.51) N La desviaci´on est´andar puede ser interpretada como una medida de incertidumbre. La desviaci´ on est´andar de un grupo repetido de medidas nos da la precisi´ on de ´estas. Cuando se va a determinar si un grupo de medidas est´ a de acuerdo con el modelo te´ orico, la desviaci´ on est´andar de esas medidas es de vital importancia: si la media de las medidas est´ a demasiado alejada de la predicci´on (con la distancia medida en desviaciones est´andar), entonces consideramos que las medidas contradicen la teor´ıa. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual ser´ıa razonable esperar que ocurrieran si el modelo te´orico fuera correcto. La desviaci´on est´andar es uno de tres par´ametros de ubicaci´ on central; muestra la agrupaci´on de los datos alrededor de un valor central (la media o promedio).
Correcci´ on de Sheppard para la varianza El c´alculo de la desviaci´on t´ıpica es algo err´ oneo como resultado del agrupamiento de datos en clases (error de agrupamiento). Para correguirlo, se usa la f´ ormula s2correguida = s 2calculada
2
c − 12 .
(2.52)
donde c es la anchura del intervalo de clase. La correcci´ on c2 /12 (que se resta) se llama correcci´ on de Sheppard.
51
2. La estad´ıstica descriptiva
2.3.4.
La Desviaci´on Media
Es la otra posibilidad para conocer la variabilidad de los datos en la distribuci´ on de frecuencias sin tener que elevar al cuadrado la diferencia de datos respecto de la media: dM =
i (xi
n
− x¯ ) .
(2.53)
Ejemplo 2.20 Calcule todas la medidas de variabilidad definidas para todas las situaciones
y conjunto de datos anteriores.
2.3.5.
Dispersi´ on absoluta y relativa: coeficiente de variaci´on
La variaci´on o dispersi´on real, tal como se determina de la desviaci´on t´ıpica u otra medida de dispersi´on, se llama dispersi´on absoluta. Sin embargo, una dispersi´on (o variaci´on) de 10 pulgadas en la medida de 1000 pies es muy diferente de esa misma dispersi´ on al medir una distancia de 20 pies. Una medida de ese efecto la da la dispersi´ on relativa, a saber dispersi´on relativa :=
dispersi´on absoluta . promedio
(2.54)
Si la dispersi´on absoluta es la desviaci´ on est´andar σ = s y el promedio es la media ¯ x, entonces la dispersi´on relativa se llama coeficiente de variaci´on o coeficiente de dispersi´on o tambi´ en coeficiente de variabilidad de Pearson, en este caso se tendr´ a que coeficiente de variaci´on = p =
σ . x ¯
(2.55)
Una regla los estad´ sticos dice que elpara coeficiente de variabilidad, debido a que ampliamente debe ser un n´usada umeropor menor que ı1, puede usarse expresarse en t´erminos de porcentajes. De hecho se establece que si p < 0,20, entonces se dice que la media es representativa d elos datos, lo que quiere decir, que la media es buen estimador ya que el error es considerablemente peque˜ no en comparaci´on con la media. Sin embargo, si p > 0,20, se dice que la media no es representativa, lo que equivale a decir que el error es muy grande en comparaci´on del promedio. En este ´ultimo caso es necesario descartar a la media o el promedio como estimador global y hacer uso de otros estimadores para sacar conclusiones.
2.3.6.
Covarianza
La covarianza entre dos variables es un estad´ıstico resumen indicador de si las puntuaciones est´an relacionadas entre s´ı. La formulaci´ on cl´asica, se simboliza por la letra griega sigma (σxy ) cuando ha sido calculada en la poblaci´on. Si se obtiene sobre una muestra, se designa por la letra “ sxy ”. La formula suele aparecer expresada como: Sˆxy =
52
n
n
i i n x1 y =
i=1 (Xi
− i=1
¯ i n X1)(Y
−−
¯
− Y ).
(2.56)
2.3. Medidas de variaci´on Este tipo de estad´ıstico puede utilizarse para medir el grado de relaci´on de dos variables si ambas utilizan una escala de medida a nivel de intervalo/raz´on (variables cuantitativas). La expresi´on se resuelve promediando el producto de las puntuaciones diferenciales por su tama˜no muestral (n pares de puntuaciones, n 1 en su forma insesgada). Este estad´ıstico, refleja la relaci´on lineal que existe entre dos variables. El resultado num´erico fluct´ ua entre los rangos de +infinito a -infinito. Al no tener unos l´ımites establec idos no puede determinarse el grado de relaci´on lineal que existe entre las dos variables, solo es posible ver la tendencia.
−
Propiedades
−∞ ≤ Sxy ≤ +∞. Se tiene que Sxy =
2.3.7.
> 0, Correlaci´on directa. Recta de regresi´on creciente. = 0, No hay correlaci´on. , < 0. Correlaci´on inversa. Recta de regresi´on decreciente.
(2.57)
Coeficiente de Correlaci´on de Pearson
El coeficiente de correlaci´on de Pearson, r, nos permite saber si el ajuste de la nube de puntos a la recta de regresi´on obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones t´ıpicas (ra´ız cuadrada de las varianzas). Vxy = V V
r=
Sxy
x y
2 2 Sx Sy
Sxy . Sx Sy
=
(2.58)
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:
x2
x−2
i
n
r=
xi y i n
− − − − − − r=
n
n
x2i
xi yi
(
xi
2
xi )
n
x ¯ y¯
yi2 n
yi
yi2
(
,
(2.59)
.
(2.60)
y −2
yi )2
Propiedades El coeficiente de correlaci´on, r, presenta valores entre -1 y +1. Cuando r es pr´oximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos est´a muy dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresi´on.
53
2. La estad´ıstica descriptiva Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´un un modelo lineal y la recta de regresi´ on que se determine tendr´a pendiente positiva, ser´a creciente. Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´un un modelo lineal y la recta de regresi´ on que se determine tendr´a pendiente negativa: es decreciente.
Figura 2.10.: El coeficiente de correlaci´on de Pearson establece la posibilidad de un ajuste de los puntos en la muestra. En la primera gr´afica de arriba no existe relaci´on entre las variables y en la segunda hay relaci´ on pero no puede ser ajustada con una linea recta. En las siguientes la correlaci´ on es positiva y negativa, con pendientes positiva y negativa, respectivamente.
2.4.
Medidas de simetr´ıa
Si x i son los N valores de la variable x, podemos definir la cantidad N (r)
x ¯
54
:=
i=1
xr N,
(2.61)
2.4. Medidas de simetr´ıa a la cual podemos llamar el r-´esimo momento. El primer momento, con r = 1, e sla media aritm´etica x¯. De esta manera puede definirse el r-´esimo momento respecto de la media como N (xi x ¯ )r mr := := (x ¯ x ¯ )r . (2.62) N
−
−
i=1
V´ ease que si r = 1, entonces m1 = 0, ya que hemos demostrado que las desviaciones respecto de la media es cero. Mientras que si r = 2, entonces m2 = s2 , es decirl es el segundo momento es la varianza. Para evitar unidades particulares podemos definir momentos adimensionales respecto de la media como: mr mr ar := r = (2.63) r, s m2
√
√
donde s = m2 es la desviaci´on est´andar, ya que m 1 = 0 y m 2 = s2 , entonces se tiene que a1 = 0 y a2 = 1. Las correciones de Sheppard para los momentos son como siguen: 2
c − 12 ,
(2.64)
− 2 m2 + 240 ,
(2.65)
m2 (corregido) = m 2 m4 (corregido) = m 4
c2
7c4
los momentos m 1 y m3 no requieren ninguna correcci´on.
2.4.1.
Coeficientes de asimetr´ıa y curtosis
Asimetr´ıa Hemos comentado que el concepto de asimetr´ıa se refiere a si la curva que forman los valores de la serie presenta la misma forma a izquierda y derecha de un valor central. Se conoce como sesgo el grado de asimetr´ıa de una distribuci´on , es decir, cu´ anto se aparta de la simetr´ıa. Si la curva de frecuencias d euna distribuci´on tiene a la derecha una cola m´as larga que a la izquierda, se dice que es sesgada a la derecha, o de sesgo positivo, mientras que en el caso contrario sesgada a la izquierda o de sesgo negativo. Para distribuciones sesgadas, la media tiende a estar del mismo lado de la moda que la cola larga. Luego una medida de la asimetr´ıa viene dada por la diferencia: media-moda, que puede hacerse adimensional dividi´endola por la medida de dispersi´on, tal como la desviaci´ on est´andar, lo que lleva a la definici´on
−
−
media moda x ¯ m = . (2.66) desviacion σ Para evitar el uso de la moda podemos recurrir a la f´ ormula emp´ırica anteriormente estudiada para obtener Sesgo =
−
−
Sesgo = 3(media mediana) = 3(¯ x x0,5 ) . desviacion σ
(2.67)
55
2. La estad´ıstica descriptiva Para medir el nivel de asimetr´ıa se utiliza mejor el llamado Coeficiente de Asimetr´ıa de Fisher, que viene definido: i (xi
g=
Los resultados pueden ser los siguientes:
−x¯)3
n
i (xi
−x¯)2
n
3/2
.
(2.68)
g = 0 (distribuci´on sim´etrica; existe la misma concentraci´ on de valores a la derecha y a la izquierda de la media). g > 0 (distribuci´on asim´etrica positiva; existe mayor concentraci´ on de valores a la izquierda de la media que a su derecha). g < 0 (distribuci´on asim´etrica negativa; existe mayor concentraci´on de valores a la derecha de la media que a su izquierda).
Figura 2.11.: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coeficiente de Fisher.
Curtosis El Coeficiente de Curtosis analiza el grado de concentraci´ on que presentan los valores alrededor de la zona central de la distribuci´on. Esto se traduce en cu´ an puntiaguda es la
56
2.5. Teorema que envuelven cuestiones sobre la Desviaci´on Est´andar distribuci´ on, en general por referencia a la normal. Se definen 3 tipos de distribuciones seg´un su grado de curtosis: 1. Distribuci´on mesoc´urtica: presenta un grado de concentraci´on medio alrededor de los valores centrales de la variable (el mismo que presenta una distribuci´ on normal). 2. Distribuci´on leptoc´urtica : presenta un elevado grado de concentraci´ on alrededor de los valores centrales de la variable. 3. Distribuci´on platic´urtica: presenta un reducido grado de concentraci´ on alrededor de los valores centrales de la variable. El coeficiente de curtosis puede ser calculado usando el cuarto momento de la media en forma adimensional, el cual est´a dado por coeficiente de momento de curtosis = a 4 =
m4 m4 = 2. σ4 m2
(2.69)
Para una distrubici´on normal el coeficiente anterior es 3. De all´ı que es usual encontrarse que el Coeficiente de Curtosis viene definido por la siguiente f´ ormula:
i (xi
k=
Los resultados pueden ser los siguientes:
−x¯)4
n
i (xi
−x¯)2
n
− 2
3
(2.70)
k = 0 (distribuci´on mesoc´urtica). k > 0 (distribuci´on leptoc´urtica ). k < 0 (distribuci´on platic´urtica). Ejemplo 2.21 Calcule los valores de los coeficientes de simetr´ıa de Fisher y de Curtosis para todas las situaciones y conjunto de datos anteriores. Identifique los tipos de gr´ aficas que sean.
2.5.
Teorema que envuelven cuestiones sobre la Desviaci´on Est´ andar
La desviaci´on est´andar de una data es una cantidad importante debido a que limita el n´umero de valores que pueden ser encontrados en alguna determinada regi´on de la distribuci´ on respecto del promedio.
57
2. La estad´ıstica descriptiva
Figura 2.12.: Distintas posibilidades de la forma del histograma en relaci´ on con el valor num´ erico de el coeficiente de curtosis.
2.5.1.
La regla emp´ırica
Aplica s´olo cuando la distribuci´on de datos es del tipo campana, y establece que: Aproximadamente el 68 % de los datos se encuentran a una desviaci´on est´andar de la media, es decir en el intervalo [¯x σ, x ¯ + σ],
−
aproximadamente el 95 % de los datos se encuentran a dos desviaci´on est´andar de la media, es decir en el intervalo [¯x 2σ, x ¯ + 2σ],
−
aproximadamente el 99 % de los datos se encuentran a tres desviaci´on est´andar de la media, es decir en el intervalo [¯x 3σ, x ¯ + 3σ].
−
2.5.2.
Teorema de Chebychev
Aplica a cualquier tipo de data. Establece que la porci´ on de valores que deben estar a k-desviaciones de la media est´a como m´ınimo a 1 k12 .
−
Nota: el teorema de Chebychev establece s´olo los l´ımites inferiores para en los cuales se encuentra una determinada cantidad de datos, mientras que la regla emp´ırica si que da
58
2.6. Medidas de Posici´on buenas aproximaciones. Ejemplo 2.22 Haga uso de los teoremas anteriores sobre la desviaci´ on est´andar para hacer un an´alisis de las distribuciones de las situaciones y conjunto de datos anteriores.
2.6.
Medidas de Posici´on
Las medidas de posici´on nos facilitan informaci´on sobre la serie de datos que estamos analizando. La descripci´on de un conjunto de datos, incluye como un elemento de importancia la ubicaci´on de ´estos dentro de un contexto de valores posible. Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribuci´on de frecuencias mediante algunos valores num´ericos, eligiendo como resumen de los datos un valor alrededor del cual se encuentran distribuidos los valores de la variable. Pero estas medidas de posici´on de una distribuci´on de frecuencias han de cumplir determinadas condiciones para que sean verdaderamente representativas de la variable a la que resumen. Toda s´ıntesis de una distribuci´ on se considerara como operativa si intervienen en su determinaci´on todos y cada uno de los valores de la distribuci´on, siendo u ´ nica para cada distribuci´on de frecuencias y siendo siempre calculable y de f´acil obtenci´on. A continuaci´on se describen las medidas de posici´on m´as comunes utilizadas en estad´ıstica, como lo son: Cuartiles: Hay 3 cuartiles que dividen a una distribuci´on en 4 partes iguales: primero, segundo y tercer cuartil. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil). Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).
2.6.1.
Cuartiles
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q 1 , Q 2 , Q 3 . El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25 %) de todos los valor es de la sucesi´on (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas part es (75 %) de los datos. Como los cuartiles adquieren su mayor importancia cuando contamos un n´ umero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos
59
2. La estad´ıstica descriptiva en una tabla de frecuencia. La f´ormula para el c´alculo de los cuartiles cuando se trata de datos agrupados es la siguiente: Qk = L k +
k
− N 4
Fk
fk
c,
para k = 1, 2, 3
(2.71)
donde: Lk = L´ımite real inferior de la clase del cuartil k, N = N´ umero de datos, Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil
k,
fk = Frecuencia de la clase del cuartil k , c = Longitud del intervalo de la clase del cuartil
2.6.2.
k.
Deciles
Los deciles son ciertos n´ umeros que dividen la sucesi´on de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambi´en un caso particular de los percentiles. Los deciles se denotan D1 , D2 ,..., D9 , que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados. Para datos agrupados los deciles se calculan mediante la f´ormula. Dk = L k +
k
− N 10
Fk
fk
c,
para k = 1, 2,..., 9
(2.72)
donde: Lk = L´ımite real inferior de la clase del decil k, N = N´ umero de datos, Fk = Frecuencia acumulada de la clase que antecede a la clase del decil fk = Frecuencia de la clase del decil k , c = Longitud del intervalo de la clase del decil k .
60
k,
2.6. Medidas de Posici´on
2.6.3.
Centiles o percentiles
Los percentiles son, tal vez, las medidas m´as utilizadas para prop´ositos de ubicaci´on o clasificaci´on de las personas cuando atienden caracter´ısticas tales como peso, estatura, etc. Los percentiles son ciertos n´umeros que dividen la sucesi´on de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles ( P1 , P 2 ,..., P 99 ), le´ıdos primer percentil,..., percentil 99. Cuando los datos est´an agrupados en una tabla de frecuencias, se calculan mediante la f´ormula: Pk = L k +
k
− N 100
Fk
fk
c,
para k = 1, 2,..., 99
(2.73)
donde: Lk = L´ımite real inferior de la clase del decil k , N = N´ umero de datos, Fk = Frecuencia acumulada de la clase que antecede a la clase del decil
k,
fk = Frecuencia de la clase del decil k, c = Longitud del intervalo de la clase del decil k. Ejemplo 2.23 Calcule los valores de los tres cuartiles, los diez deciles y algunos de los centiles para todas las situaciones y conjunto de datos anteriores. Ejemplo 2.24 La tabla siguiente muestra una distribuci´ on de frecuencias de 400 v´alvulas de radio probadas en la empresa L&M. Vamos a hacer un estuido completo descriptivo de la misma.
×
Vida media (horas 100) 3-3.99 4-4.99 5-5.99 6-6.99 7-7.99 8-8.99 9-9.99 10-10.99 11-11.99
N´umero de tubos 14 46 58 76 68 62 48 22 6
V´ ease que aqu´ı se presenta la tabla de los datos ya agrupados en clases, de hecho se han dispuesto nueve clases. Esto est´ a aproximadamente de acuerdo con la regla de Sturges dado que = 1 + 3 ,3log(400) = 9 ,58. Los autores de la tabla han elegido un intervalo de
N
61
2. La estad´ıstica descriptiva
clase menos, sin embargo, la tabla anterior est´ a bastante bien construida. Para resolver el problema de calcular todos los estad´ ısticos para esta situaci´ on se tiene que podemos ampliar la tabla anterior como sigue: li 3 4 5 6 7 8 9
ls 3.99 4.99 5.99 6.99 7.99 8.99 9.99
xM 3.49 4.49 5.49 6.49 7.49 8.49 9.49
10 11
1 0.99 1 1.99
1 0.49 1 1.49
fi 14 46 58 76 68 62 48
fr 0.035 0.115 0.145 0.19 0.17 0.155 0.12
22 0.055 6 0.015 400 1
fr Fa xi f i x) x|fi x)2 fi x)3 fi x)4 fi % (xi − ¯ |xi − ¯ (xi − ¯ (xi − ¯ (xi − ¯ 3.5 14 48,93 -3.65 51.17 187.02 -683.58 2498.48 11.5 60 206.77 -2.65 122.13 324.25 -860.89 2285.68 14.5 118 3 18.71 -1.65 95.99 158.86 -262.91 435.13 19 194 493.62 -0.65 49.78 32.60 -21.35 13.98 17 262 509.66 0.34 23.46 8.09 2.79 0.96 15.5 324 5 26.69 1.34 83.39 112.15 150.85 202.89 12 372 4 55.76 2.34 112.56 263.95 618.97 1451.48 5.5 1.5 100
394 400
2 30.89 68.97 2860
3.34 4.34
73.59 26.07 638.14
246.15 113.27 1446.39
823.40 492.17 259.43
2754.27 2138.50 11781.41
A partir de la tabla anterior podemos ver que la media est´ a dada por x¯ =
xi fi 2860 = = 7,15. N 400
(2.74)
Para el c´alculo de la mediana, veamos que basta con calcular el cuartil 2, en este caso se tendr´ a que N/2 = 200 , por lo que la mediana se encuentra en la clase (7;7.99), el l´ımite inferior de esta clase es 7, la frecuencia acumulada de la clase que antecede a ´esta es 194, mientras que la frecuencia absoluta de la clase que lo contiene es 68, el ancho de la clase es 1.99, por tanto, 200 194 x0,5 = Q 2 = 7 + 1,99 = 7 ,17. (2.75) 68 La moda es cl´aramente m = 7,49, aunque usando la correcci´on dada para la moda dada en la f´ormula ( 2.28), se tiene que Delta 1 = 68 62 = 6 , Delta 2 = 76 68 = 8 , luego
−
−
−
∆1
8
m = L 1 + ∆1 + ∆ 2 c = 7,49 + 14 1,99 = 8 ,62. (2.76) Por otro lado viendo ahora las medidas de dispersi´ on tendremos que el rango es 7.99, mientras que la desviaci´on media dar´a
| − | −
dM :=
La varianza dar´a
xi
x ¯ fi
N
=
638,14 = 1,59. 400
(2.77)
x ¯ )2 fi 1446,39 = = 3,61, (2.78) N 400 y por tanto la desviaci´on est´andar ser´a de σ = (s2 ) = 1,90. N´ otese que ambas desviaciones dan como resultado un valor cercano. El coeficiente de dispersi´ on de Pearso o de x = 0,26, lo que es obviamente mayor variabilidad para esta situaci´ on es entonces p := σ/¯ que 0.20 y por tanto la media no es muy representativa. Por ´ ultimo las medidas de simetr´ ıa dar´ an como resultado s2 :=
Coef. Fisher
(xi
g :=
(xi x ¯)3 fi N
−
3/2 (xi x ¯)2 fi N
−
62
=
0,64 6,87
= 0,09,
2.7. Problemas de final de cap´ıtulo
Coef. curtosis
k :=
(xi x ¯)4 fi N
−
(xi x ¯)2 fi N
−
− 2
3=
29,45 13,07
− 3 = −0,74.
Como conclusi´ on general puede verse que la media de los tubos es de 715 horas, por lo que se espera que la mayor´ıa de los tubos duren este tiempo. Adem´ as se conoce que 200 tubos tienen tiempos menores o iguales a 717 horas, mientras que otros 200 tubos tienen tiempos mayores a 717 horas. Tambi´ en 68 tubos, lo cual representa el 17 % de todos los tubos tienen un tiempo de 749 horas. El error cometido al tratar de estimar la duraci´ on de los tubos es 190 horas, lo cual representa mucho en virtud del coeficiente de variabilidad p = 0,26, que es mayor que 0.20 y por tanto la media deja de ser representativa de los datos. Esto quiere decir que no pueden establecerse conclusiones fiables a partir de la media, lo que obliga a estimar con otras medidas como la mediana y algunos percentiles. La distribuci´on de los datos es adem´as sim´ etrica pero ligeramente platic´ urtica, lo cual est´a de acuerdo con el hecho de que el error sea un poco grande para esta media.
2.7.
Problemas de final de cap´ıtulo
A continuaci´on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible.
1. Probar que N j=1 (axj + byj + czj ) = a y c son constantes.
N j=1
xj + b
N j=1 yj
+c
N j=1 zj ,
donde a, b
2. Las medidas del di´ametro de un cilindro en un laboratorio fueron medidas por un cient´ıfico dando como resultado 15cm, 16cm, 16.5cm, 40cm. Calcule la media y diga si ese promedio es t´ıpico o representativo de dichas medidas. 3. Probar que la suma de las desviaciones de x1 , x2 ,...,xN respecto de la media ¯x es cero. 4. Tome los primeros 100 decimales del n´umero irracional π y calcule la media, mediana y moda, haciendo para tal fin una tabla de distribuci´on de frecuencias o otra agrupada por clases. 5. Pruebe usando argumentos geom´etricos la ecuaci´on para la moda ( 2.28). Use esta para encontrar la moda para los datos del problema anterior. 6. Use la regla emp´ırica expresada en (2.29) para obtener el valor de la moda en el problema 2. Compare con el valor obtenido en el problema anterior. 7. Un avi´on vuela d1 , d2 y d3 millas a velocidades v1 , v2 y v3 millas/horas respectivamente. Probar que su velocidad media es V , dada por 2 3 d1 + dV2 + d3 = dv1 + d v2 + dv3 , 1
(2.79)
63
2. La estad´ıstica descriptiva es una media arm´onica ponderada. 8. Hallar los tres cuartiles Q1 , Q2 y Q3 para el problema de los decimales de π . 9. Hallar el segundo decil , el cuarto decil, el percentil noventa y el percentil 68 para los datos de los decimales de π. 10. Dado un conkunto de datos cuyos cuartiles son conocidos, pudiera estable cerse otro coeficiente de variaci´on sabiendo que dado los cuartiles Q1 y Q3 determinan que:
−
1 2 (Q1 + Q3 ) es una medida de tendencia cent ral o promedio, mientras que 1 2 (Q3 Q1 ) es el rango intercuartil, es una medid a de dispersi´on, entonces un coeficiente de variaci´ on pudiera estar dado por
VQ :=
1 2 (Q3 1 2 (Q3
−
−
Q1 ) (Q3 Q1 ) = , (Q3 + Q1 ) + Q1 )
(2.80)
a este coeficiente pudieramos llamarlo el coeficiente de variaci´on cuartil. Use los datos del problema de los decimales de π para hallar el coeficiente de variaci´on de Pearson (el est´andar) y compare con el conseguido con la f´ormula anterior. 11. Considere ahora los prim eros 100 decimales del n´umero irracional e, el usado como la base del logaritmo neperiano , para calcular el porcentaje de datos entre ¯x σ, x ¯ 2σ yx ¯ 3σ y compare con la regla emp´ırica para la desviaci´on est´andar.
±
±
±
12. Use los datos de los problemas de los decimales de π y de los decimales de e para hallar la desviaci´on corregida de Sheppard y comparar con los nuevos coeficientes de variabilidad. 13. Una compa˜n´ıa de farmacos en La Coru˜ na, Espa˜na, est´a probando un nuevo medicamento experimental para los espasmos musculares, al cual se le ha dado el nombre de ESPASMIN. Se les suministra dicho medicamento a un grupo de pacientes de control durante 5 d´ıas, todos ellos padecen de espasmos musculares (todos los d´ıas tienen los musculos contraidos). Se realiza un estudio sobre el n´ umero de d´ıas que un paciente sufre mejor´ıa con el anterior medicamento obteniendo la tabla: Datos (xi ) (d´ıas) 0 1 2 3 4 5
Frecuencias 100 250 300 500 450 2000
(a) Realizando el gr´afico adecuado y hallando los promedios (Media aritm´etica, Media arm´onica, Media geom´etrica, Moda, y Mediana), indicar cu´ al ser´ıa el que mejor
64
2.7. Problemas de final de cap´ıtulo representar´ıa los datos, (Contesta razonadamente y con el mayor detalle posible). (b) Calcula tambi´ en el porcentaje de pacientes que sienten mejor´ıa con el medicamento en todos los d´ıas del tratamiento. (c) ¿Por qu´e no calculamos el coeficiente de variaci´on para ver la representatividad de la media? (d) ¿Habr´ıa que hallarlo?. (e) Calcula el D3 , Q 3 , P65 . ¿Qu´e significados tienen? A aquellos pacientes que sienten mejor´ıa todos los d´ıas del tratamiento se les realiza un estudio sobre el tiempo de reacci´on del medicamento (en minutos), encontr´andose recogido los datos en la siguiente tabla: Tiempo de reacci´on 0-10 10-20 20-30 30-40 40-50
N´umero de pacientes 300 500 400 500 300
Se pide: (a) Escribir las f´ormulas de las diferentes medias e indicar cu´al de las tres te parece m´as adecuada para aplicar en este ejercicio (Razonadamente). (b) A to dos los pacientes que tardan en reaccionar m´as de 35’ se le aplica el medicamento complementario MUSCULING para acelerar los efectos de ESPASMIN. Hallar el n´umero de pacientes a los que se le aplica este segundo medicamento. (c) Estudiar la representatividad del tiempo medio de reacci´on. ¿Es representativo? ¿Por qu´ e? (d) El Gobierno est´ a pensando en introducir un medicamento con las caracter´ısticas de ESPASMIN. Existen en elde mercado con este dos25productos m´as. con El tiempo medio de de cada uno ellos es junto respectivamente y 30 minutos, una varianza dereacci´ 200 on y 300 minutos 2 . Explica detalladamente que criterio de selecci´ on estad´ıstico podr´ ıa aplicar el Gobierno. Seg´un el criterio anterior que medicamento ser´ıa el que pasar´ ıa a engrosar la lista de medicamentos de la Seguridad Social. 14. Se ha realizado una encu esta a 30 personas en la que se les pregunta el n´umero de personas que conviven en el domicilio habitualmente. Las respuestas obtenidas han sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3, 5, 3, 4, 7, 2, 3. (a) Calcule la distribuci´ on de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) ¿Qu´ e proporci´on de hogares est´a compuesta por tres o menos personas? ¿Qu´e proporci´on de individuos vive en hogares con tres o menos miembros? (c) Dibuje el diagrama de barras de frecuencias y el diagrama en escalera. (d) Agrupe por intervalos de amplitud 2 los valores de la variable, calcule su distribuci´ on de frecuencias y represente el histograma correspondiente. 15. Tenemos la siguiente informaci´on sobre el gasto semanal en ocio de un grupo de estudiantes universitarios.
65
2. La estad´ıstica descriptiva Nivel de gastos 0-5 5-10 10-15 15-20 20-25 25-30
# de J´ovenes 4 11 16 22 8 6
(a) Calcule la distribuci´on de frecuencias de la variable y las densidades de frecuencias. (b) Dibuje el histograma de frecuencias. (c) Dibuje el pol´ıgono de frecuencias acumuladas. 16. En un estudio sob re consumo de gasolina en una gran ciudad se elig i´o una muestra de 100 veh´ıculos y se observ´ o el n´umero de litros que consum´ıan en un d´ıa, obteni´endose la siguiente distribuci´on de frecuencias. # de Litros 1-7 7-10 10-12 12-14 14-18 18-25
# de Autom´oviles 4 8 35 30 20 3
(a) Calcule la distribuci´on de frecuencias, obteniendo, adem´as, la amplitud de cada intervalo as´ıgr´ como sus respectivas marcas clase y lasmediante densidades frecuencia. (b) Represente aficamente la distribuci´ on dede frecuencias un de histograma. 17. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el n´umero de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14, 16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12. (a) Calcule la distribuci´on de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) ¿Qu´ e proporci´ on de sucursales tiene m´as de 15 empleados? (c) Dibuje el diagrama de barras y el diagrama en escalera correspondientes. (d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su distribuci´ on de frecuencias y represente su histograma y su pol´ıgono de frecuencias acumuladas. (e) Agrupe la variable en los intervalos que considere conveniente de amplitud variable, calcule las densidades de frecuencia de cada intervalo y represente el histograma correspondiente. 18. La siguiente distribuci´on expresa el n´umero de coches vendidos durante una semana por cada uno de los 50 concesionarios que una determinada firma tiene en Espa˜ na:
66
2.7. Problemas de final de cap´ıtulo # de aut os vendidos 1 3 4 6 10
# de Con cesionarios 5 12 20 8 5
Se pide: (a) Media aritm´etica, mediana y moda. (b) Desviaci´on t´ıpica, coeficiente de correlaci´on, coeficiente de variaci´on de Pearson. (c) Coeficientes de asimetr´ıa de Fisher y de Curtosis, compruebe con la forma del pol´ıgono de frecuencias. Para todo haga siempre un an´alisis de los datos y los estimadores calculados. 19. Sea la distribuci´on referida a beneficios anuales de 38 empresas madrile˜ nas: Beneficio (Miles de Euros) 230-280 280-330 330-580 580-630 630-780
# de Em presas 5 7 14 9 3
Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrile˜ nas. (b) ¿Cu´al es el beneficio mayor de la mitad de las empresas m´ as modestas? (c) Determinar el beneficio m´as frecuente. (d) Estudiar la dispersi´on de esta distribuci´on a partir del recorrido intercuart´ılico, desviaci´ on t´ıpica y coeficiente de variaci´on de Pearson. (e) Estudiar la forma de esta distribuci´on. 20. La distribuci´on del importe de las facturas por reparaci´on de carrocer´ıa de una muestra de 80 veh´ıculos en un taller, viene dada por la tabla siguiente: Importe (Euros) 0-60 60-80 80-120 120-240
# de Veh´ıculos 10 20 40 10
Se pide: (a) Calcular el importe medio. Estudiar la representatividad de esta media. (b) Calcular el importe mediano y el importe m´ as frecuente. (c) ¿Qu´ e interpretaci´ on tienen en este caso los deciles? Calcular el tercer decil. (d) ¿Cu´al es el importe m´aximo pagado por las 60 reparaciones m´as baratas? (e) Estudiar la asimetr´ıa a partir del coeficiente de asimetr´ıa de Fisher. (f ) Estudiar la curtosis.
67
2. La estad´ıstica descriptiva 21. Una empresa ten´ıa a finales de 2003 mil seiscientos cincuenta accionistas distribuidos de la siguiente forma: # de acciones 0-20 20-60 60-100 100-500 500-1000
# de accionistas 1030 380 180 50 10
Se pide: (a) Hallar el n´umero medio de acciones por accionista y su desviaci´ on t´ıpica. (b) Hallar la mediana. (c) Decida, con base estad´ıstica, el grado de concentraci´on de las acciones. (d) ¿Qu´e porcentaje del total de acciones poseen los accionistas mayoritarios? (e) ¿Qu´e porcentaje de los accionistas minoritari os posee el 20 % del total de acciones? 22. Suponga que usted es el estad´ıstico oficial de l´ıneas a´ereas KLM y que el presidente del consejo de administraci´on le ha pedido que recoja y organice datos relativos a las operaciones de vuelo. Su inter´ es principal a partir de los valores diarios se centra en la variable de n´umero de pasajeros. Ha obtenido estos datos de los diarios de vuelo de los ´ultimos 50 d´ıas y ha reflejado esta informaci´on: 68, 71, 77, 83, 79, 72, 74, 57, 67, 69, 50, 60, 70, 66, 76, 70, 84, 59, 75, 94, 65, 72, 85, 79, 71, 83, 84, 74, 82, 97, 77, 73, 78, 93, 95, 78, 81, 79, 90, 83, 80, 84, 91, 101, 86, 93, 92, 102, 80, 69. Ustedgr´ debe analizar la las situaci´ on completa. Calcule los estad´ısiticos descriptivos, haga aficos, calcule medidas de posici´on quetodos crea convenientes e interesantes. De una conclusi´on general de la situaci´on. 23. Mr. Bissey, el vicepresidente del Bank One de Indian´apolis, lleva tambi´ en un registro de las cuentas de ahorro personal. Los saldos de las 40 nuevas cuentas que se abrieron el u ´ ltimo mes fueron: 179.8, 1200, 293, 602.02, 1482, 579, 312.52, 100, 695.15, 287, 1175.00, 952.51, 1112.52, 783.00, 1212.43, 510.52, 1394.05, 1390.00, 783, 1101, 666.66, 780, 793.1, 501.01, 1555.10, 352, 112.17, 470.53, 415.00, 1009.1, 712.1, 1150, 890, 937.01, 711.11, 1422.03, 1595.1, 217, 1202, 1273.01. Haga el mismo an´alisis que para el problema anterior.
68
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´ on One of the main purposes of scientific inference is to justify beliefs which we entertain already; but as a rule they are justified with a difference. Our pre-scientific general beliefs are hardly ever without exceptions; in science, a law with exceptions can only be tolerated as a makeshift. Scientific laws, when we have reason to think them accurate, are different in form from the common-sense rules which have exceptions: they are always, at least in physics, either differential equations, or statistical averages. It might be thought that a statistical average is not very different from a rule with exceptions, but this would be a mistake. Statistics, ideally, are accurate laws about large groups; they differ from other laws only in being about groups, not about individuals. Statistical laws are inferred by induction from particular statistics, just as other laws are inferred from particular single occurrences. - Bertrand Russell . The Analysis of Matter (1927), 191.
3.1.
Correlaci´ on y regresi´on
ısicasecomo en otras ´ una es importante a veces, tener una on entre muchos datos deEn los f´ que estudian paraareas situaci´on dada. Por ejemplo, enrelaci´ un caso sencillo, digamos que alguien est´a interesado un peque˜ no problema para estudiar una cierta caracter´ıstica en unos moluscos muy raros con caparaz´on. Para dicho estudio digamos que el investigador, como primer paso, toma datos de los pesos y las dimensiones del caparaz´ on de dichos moluscos. Como usted podr´ a inferir, es muy posible, que para la poblaci´ on de estudio, una dimensi´on grande en la muestra de los caparazones pudiera corresponder a caracoles o moluscos m´as pesados. As´ı, uno estar´ıa tentado a decir que el tama˜no del caparaz´on est´ a relacionado con el peso del molusco. Esto, por su puesto, es una suposici´ on ya que podr´ıa haber resultados para los cuales esto no sea cierto. As´ı que desde luego, como siempre todo debe tomarse supuesto, en el sentido estricto estad´ıstico. Como veremos m´as adelante, algunas veces es posible emparentar, o en otras palabras m´as t´ecnicas, relacionar ambas caracter´ısticas de alguna manera funcional, o mejor dicho, a trav´ es de una funci´ on. Si ´este fuera el caso entonces uno pudiera inferir, a partir de la funci´on que relaciona dichas variables, una descripci´ on de la poblaci´on de estudio y/o catalogar especies en t´erminos de sus caracter´ısticas. Hay que advertir, que pudi´eramos tener tambi´ en una relaci´ on entre ambas variables o caracter´ısticas que no sea funcional, es posible, sin embargo, no nos interesaremos por ese tipo de relaciones. Estamos interesado
69
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´on en las relaciones que se pueden hacer cu´ando una o m´as variables est´an emparentadas a trav´ es de alguna(s) funci´ on(es) matem´aticas. El presente cap´ıtulo est´a dedicado a estas cuestiones. Esto ser´a, como veremos ´util para resolver muchos problemas.
3.2.
Distribuciones bidimensionales
Cuando sobre una poblaci´on estudiamos simult´aneamente los valores de dos variables estad´ısticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribuci´on bidimensional. Ejemplo 3.1 Las notas de 10 alumnos en Matem´ aticas y en F´ısica vienen dadas en la siguiente tabla: F´ ısica 4 10 10 12 12 14 14 16 18 16 Matem´ aticas 4 4 10 12 10 14 10 16 14 20
Los pares de valores (4,4),(10,4),(10,10),...;(18,14),(16,20), forman la distribuci´ on bidimensional.
3.3.
La idea de la correlaci´on
Es frecuente que estudiemos sobre una misma poblaci´ on los valores de dos variables estad´ısticas distintas, con el fin de ver si existe alguna relaci´on entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables est´an correlacionadas o bien que hay correlaci´on entre ellas. En elmejor ejemplo parece que hay cierta tendencia a que cuanto mejor es la nota en F´ısica, es anterior la de Matem´ atica. La primera forma de describir una distribuci´on bidimensional (y por tanto, saber si lo es) es representar los pares de valores en el plano cartesiano. El gr´ afico obtenido recibe el nombre de nube de puntos o diagrama de dispersi´ on. Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aqu´ı nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si as´ı ocurre diremos que hay correlaci´on lineal. La recta se denomina recta de regresi´on. Hablaremos de correlaci´on lineal fuerte cuando la nube se parezca mucho a una recta y ser´a cada vez m´as d´ ebil (o menos fuerte) cuando la nube vaya desparram´andose con respecto a la recta. En el gr´afico observamos que en nuestro ejemplo la correlaci´on es bastante fuerte, ya que la recta que hemos dibujado est´a pr´oxima a los puntos de la nube. Cuando la recta es creciente la correlaci´on es positiva o directa: al aumentar una variable, la otra tiene tambi´en tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlaci´on es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir.
70
3.3. La idea de la corre laci´on
Figura 3.1.: Ejemplo de de un diagrama de dispersi´ on o nube de puntos.
Figura 3.2.: Regresi´on lineal: Los puntos tienden a describirse a partir de una recta que los representa aproximadamente a todos.
Ejemplo 3.2 Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gr´ afica se describen el n´umero de errores que corresponden a los intentos realizados. Observa que hay una correlaci´ on muy fuerte (los puntos est´an casi alineados) y negativa (la recta es decreciente). Ejemplo 3.3 A 12 alumnos de un centro se les pregunt´ o a qu´ e distancia estaba su residencia de la Universidad, con fin de estudiar si esta variable estab a relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla: Distancia (en Km) Nota media
0.05 0.1 0.12 0.4 0.5 0.7 1 1.2 2.1 2.5 3 3 8.4 4 5.7 9.1 6.3 6.7 4.3 5.4 7.8 4.5 7.2 8.1
71
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´on
Figura 3.3.: Regresi´on lineal: la cantidad de intentos a medida que aumenta hace que el n´umero de error disminuya.
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlaci´ on es pr´acticamente inexistente, es decir, no tiene nada que ver con el rendimiento acad´emico la distancia del domicilio a la Universidad.
Figura 3.4.: Regresi´on lineal: Al parecer existe relaci´on entre la distancia a la que se vive de la Universidad y la calificaci´on que se obtiene.
3.4.
Encontrando la relaci´on. Regresi´on
3.4.1.
El coeficiente de correlaci´on
S´olo para recordar, tenga en cuenta la lecci´on aprendida en la secci´on (2.3.7). Ten´ ıamos que el coeficiente de correlaci´on de Pearson, r, nos permite saber si el ajuste de la nube de
72
3.4. Encontrando la relaci´on. Regresi´on puntos a la recta de regresi´on obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de las desviaciones t´ıpicas (ra´ız cuadrada de las varianzas). r=
Vxy = Vx Vy
Sxy
Sx2 Sy2
Sxy . Sx Sy
=
(3.1)
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:
x2
n
r=
xi y i n
− − − − − − r=
n
n
x2i
x−2
i
xi yi
(
xi
2
xi )
n
x ¯ y¯
yi2 n
yi
yi2
(
,
(3.2)
.
(3.3)
y −2
yi )2
El coeficiente de correlaci´on ten´ıa las siguientes propiedades muy interesantes: El coeficiente de correlaci´on, r, presenta valores entre -1 y +1. Cuando r es pr´oximo a 0, no hay correlaci´ on lineal entre las variables. La nube de puntos est´a muy dispersa o bien no forma una l´ınea recta. No se puede trazar una recta de regresi´on. Cuando r es cercano a +1, hay una buena correlaci´ on positiva entre las variables seg´ un un modelo lineal y la recta de regresi´ on que se determine tendr´a pendiente positiva, ser´a creciente. Cuando r es cercano a -1, hay una buena correlaci´ on negativa entre las variables seg´ un un modelo lineal y la recta de regresi´ on que se determine tendr´a pendiente negativa: es decreciente.
3.4.2.
Regresi´ on lineal. El M´ etodo de los M´ınimos Cuadrados
Hemos enfatizado sobre la importancia de las representaciones gr´aficas y hemos visto la utilidad de las versiones linealizadas de los gr´aficos (X,Y). A menudo nos confrontamos con situaciones en las que existe o suponemos que existe una relaci´ on lineal entre las variables X e Y. Surge de modo natural la pregunta: ¿cu´ al es la relaci´on anal´ıtica que mejor se ajusta a nuestros datos? El m´etodo de cuadrados m´ınimos es un procedimiento general que nos permite responder esta pregunta. Cuando la relaci´ on entre las variables X e Y es lineal, el m´etodo de ajuste por cuadrados m´ınimos se denomina tambi´ en m´etodo de regresi´ on lineal. En este cap´ıtulo discutiremos este u ´ltimo caso. El lector puede consultar a continuaci´ on
73
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´on
Figura 3.5.: Regresi´on no lineal.
una discusi´on del caso general de cuadrados m´ınimos cuando el modelo es no lineal y los datos est´an afectados de errores. La dispersi´on de los valores est´a asociada a la fluctuaci´on de los valores de cada variable. Observamos o suponemos una tendencia lineal entre las variables y nos preguntamos sobre cu´ al es la mejor recta: y(x) = ax + b,
(3.4)
que representa el caso de inter´ es.
Figura 3.6.: La curva de regresi´on lineal en t´erminos de los cambios de la funci´ on.
74
3.4. Encontrando la relaci´on. Regresi´on Es u ´til definir la funci´on χ 2 (Chi-cuadrado): χ2 =
i
[yi
− (axi + b)]2 ,
(3.5)
que es una medida de la desviaci´ on total de los valores observados yi respecto de los predichos por el modelo lineal ax + b. Los mejores valores de la pendiente a y la ordenada al srcen b son aquellos que minimizan esta desviaci´on total, o sea, son los valores que remplazados en la ecuaci´on (3.4) minimizan la funci´on χ2 , ecuaci´on (3.5). Los par´ametros a y b pueden obtenerse usando t´ecnicas matem´aticas que hacen uso del c´alculo diferencial. Aplicando estas t´ecnicas, el problema de minimizaci´on se reduce al de resolver el par de ecuaciones: d 2 d 2 χ = 0, χ = 0, (3.6) da db de donde resulta despu´ es de algunos c´alculos
− −− −
a= b=
N
N
N
x2i N
xi yi xi y i , x2i ( xi )2 yi xi xi yi . x2i ( xi )2
(3.7) (3.8)
Actualmente, la mayor´ıa de los programas de an´alisis de datos y plantillas de c´ alculo, realizan el proceso de minimizaci´on en forma autom´atica y dan los resultados de los mejores valores de a y b, o sea los valores indicado por la ecuaciones anteriores. El criterio de m´ınimos cuadrados reemplaza el juicio personal de quien mire los gr´ aficos y defina cu´al es la mejor recta. En los programas como Excel, Origin, etc., este c´ alculo se realiza usando la herramienta regresi´ on lineal o ajuste lineal. Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos los datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre de la variable independiente se considera despreciable. Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de correlaci´ on de Pearson entre las variables X e Y, escrito ahora equivalentemente como: r2 = Cov(x, y) = V ar(x) = V ar(y) =
Cov (x, y)2 , V ar(x) V ar(y) N xi yi xi y i , N2 2 2 xi xi =< x 2 >< x > 2 , N N
· − − − yi2 N
yi N
(3.9) (3.10) (3.11)
2
=< y 2 >< y > 2 .
(3.12)
El valor de r var´ıa entre -1 y 1 como siempre. Si r es 1 o pr´oximo a estos valores, decimos que el modelo lineal es adecuado para describir los datos experimentales. Cuando
±
75
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´on r se aparta de estos extremos decimos que una expresi´on lineal no es una buena descripci´on de los datos. En este caso, conviene analizar el gr´ afico y buscar una relaci´on no-lineal que aproxime mejor la dependencia. Dado que r mide el grado de correlaci´on lineal entre los datos, si, por ejemplo, los pares de puntos (X,Y) tienen una relaci´ on tal que caen sobre un c´ırculo, aunque ellos est´ an correlacionados, tendr´ ıamos r 0. Desde luego, si los pares (X,Y) no tienen correlaci´on alguna entre ellos, tambi´en tendr´ıamos r 0. Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno de los par´ametros de la ecuaci´on (3.4). Por ejemplo, si deseamos determinar la constante el´astica k de un resorte a partir de mediciones de fuerzas aplicadas Fi y estiramientos xi que le producen al resorte, k ser´a precisamente la pendiente de la recta que mejor se ajusta a los datos. Otro ejemplo es la obtenci´on de la resistencia el´ectrica R de un conductor, que deseamos determinar a partir de mediciones de tensi´ on Vi y la corriente que lo atraviesa Ii . Por consiguiente, es ´util disponer de un modo de estimar las incertidumbres asociadas a la determinaci´on de los par´ametros a y b de la ecuaci´on (3.4). La importancia del m´etodo de cuadrados m´ınimos reside en el hecho que nos permite obtener valores de la desviaci´on est´andar o sea los errores asociados a los par´ ametros a y b, que denotaremos con los s´ımbolos σa y σb . En esta secci´on s´olo presentamos los resultados de utilidad m´as frecuente en el laboratorio; el lector interesado podr´ a encontrar un tratamiento m´as exhaustivo en las referencias. Las incertidumbres de los par´ ametros del ajuste vienen dadas por las expresiones:
∼
σa =
σb
=
χ2N , N V ar(x)
·
χ2N x2i N V ar(x) ,
· ·
∼
(3.13)
(3.14)
donde χ 2N , conocido como el valor de Chi-cuadrado por grado de libertad, viene dada por: 1 χ2 . (3.15) N 2 Las incertidumbres de los par´ametros a y b tambi´ en pueden escribirse en t´erminos del coeficiente de correlaci´on r del siguiente modo: χ2N =
σa =
− ·
a2
− · √N 22
−
σb = σa < x >, donde
1 r2
1 ,
(3.16) (3.17)
x2i . (3.18) N Estas expresiones son de mucha utilidad para estimar σa y σb , ya que la mayor´ıa de las plantillas de c´alculo y programas de ajuste, por los regular indican los valores de los par´ ametros a y b que mejor ajustan los datos y el valor de r. < x2 >=
76
3.5. Problemas de final de cap´ıtulo
Precauciones en el an´ alisis No siempre es suficiente admitir que dos variables siguen una relaci´ on lineal gui´andonos por lo que muestra un gr´afico de los datos en escalas lineales. Menos aun si s´ olo evaluamos el coeficiente de correlaci´on del ajuste lineal que propondr´ıamos a partir de este gr´afico. Un gr´afico de Y = X 1,1 (variables sin correlaci´on lineal) puede ajustarse por una recta y obtenerse a la vez un coeficiente de correlaci´on lineal (inexistente) de, por ejemplo, 0 ,998. Un gr´afico de datos experimentales de Y = X con algo de dispersi´on fortuita de los puntos, podr´ ıa devenir coeficiente de, por menor queafico el anterior. los coeficientes hay en unaun diferencia, apenas, delejemplo, 3 por mil.0,995, Pero en un gr´ log-log, Entre la diferencia de pendientes ser´a la que hay entre 1.1 y 1.0, lo que represen ta un 10 % de discrepancia entre los exponentes de la variable X . Estos m´etodos de an´ alisis nos ense˜nan que los efectos de correlaci´on pueden estar enmascarados por el efecto del ruido de los datos. En ocasiones lo dif´ıcil es establecer si existe correlaci´on entre las variables, aun cuando los datos provengan de fuentes limpias que hayan producido datos con relativamente poca dispersi´ on. Muchas veces la decisi´on entre dos alternativas debe hacerse usando otros criterios. Por ejemplo, la consistencia con otros conjuntos de datos o sobre la base de consideraciones de simetr´ ıa o concordancia con teor´ıas bien establecidas. Ejemplo 3.4 Imaginemos un experimento donde se mide la distancia que recorre un m´ovil sobre una l´ınea recta mientras una fuerza constante act´ ua sobre ´el. Esperamos que el movimiento sea uniformemente acelerado. Supongamos que el cuerpo parte del reposo, que
medimos x(t) a tiempos largos. En la figura se ven los resultados. Si los datos experimentales se analizan sobre el gr´ afico de escalas lineales, el ajuste por un modelo lineal es m´as que tentador. Hecho esto, se obtiene la ecuaci´ on de la mejor recta y un coeficiente de correlaci´ on muy alto, r = 0,99959. Sin embargo, un modelo basado en las ecuaciones de la din´amica dice que x=
1 2 at , 2
(3.19)
donde a es la aceleraci´on. En la Figura est´an los logaritmos de los mismos datos, de donde se ve claramente la proporcionalidad x t 2 que predice el modelo, dif´ıcilmente demostrable a partir del gr´afico de la Figura. Evidentemente, el uso de una aproximaci´ on lineal no es buena en este problema y el mero juicio del valor del coeficiente de correlaci´ on no es suficiente.
∼
3.5.
Problemas de final de cap´ıtulo
A continuaci´on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas,
77
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´on
Figura 3.7.: Representaci´on de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. (a) A tiempos largos no se aprecia bien la curvatura de la curva podr´ y, dado que el coeficiente de correlaci´on lineal muy en cercano a lade unidad, ıa suponerse que la correlaci´ on es lineal. (b) es log(x) funci´on log(t), de donde se deduce que la relaci´on no es lineal sino cuadr´atica.
as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. La siguiente data representa las puntuaciones de 10 estudiantes que han tomado cursos de matem´aticas y de f´ısica en la Universidad de Zaragoza para el programa de nivelaci´on de la carrera en F´ısica Aplicada de esta universidad. Estudiante 123456789 10 Matem´ aticas (< 30) 20 23 8 29 14 11 11 20 17 17 F´ ısica (< 40) 30 35 21 33 33 26 22 31 33 36 Haga un gr´afico de dispersi´on de estos datos y marque en dicho diagrama la media de cada una de las variables y calcule el coeficiente de correlaci´ on para estos datos. Determine si existe o no relaci´on. El profesor a cargo tiene la impresi´on de que quien sabe mucha f´ısica tambi´ en sabe mucha matem´ atica. ¿Es esto cierto?
78
3.5. Problemas de final de cap´ıtulo 2. Un grupo de doc e ni˜nos participaron en un estudio psicol´ogico dise˜nado para evaluar la relaci´on, si la hay, entre la edad, x (a˜nos), y el tiempo promedio total de sue˜ no (ATST), en minutos y. Para obtener una medida de ATST, las grabaciones fueron tomadas en cada ni˜no en cinco noches consecutivas y un promedio de entonces. Los resultados obtenidos se muestran en la tabla.
x y
1 2 3 4 5 6 7 8 9 10 11 12 4.4 6.7 10.5 9.6 12.4 5.5 11.1 8.6 14.0 10.1 7.2 7.9 586 565 515 532 478 560 493 533 575 490 530 515
Calcular el valor del coeficiente de correlaci´ on del momento del producto entre x e y. Evaluar la significaci´on estad´ıstica de su valor e interpretar sus resultados. 3. El di´ametro de las plantas tipo l´ıquenes m´ as largas que crecen en l´apidas se midieron y se presentan los resultados en la siguiente tabla Edad de la l´ apida (a˜ nos) 9 18 20 31 44 52 53 61 63 63 64 64 114 141
Di´ametro del l´ıquen (mm) 2 3 4 20 22 41 35 22 28 32 35 41 51 52
Haga un diagrama de sipersi´ on de los puntos. Calcule las media de cada variable as´ı como sus varianzas y tambi´ en el coeficiente de correlaci´ on entre ambas variables. Concluya. 4. Calcule el coeficiente de correlaci´on de la siguiente data con variables aleatorias X e 2 Y , R XY X 11 17 26 Y 23 18 19
79
3. M´ etodos cuantitativos de an´ alisis predictivo, regresi´on Ahora suponga que la variable aleatoria Y es convertida a otra variable aleatoria Z por medio de la aplicaci´on de la f´ormula Z=
Y + 3, 10
entonces se tiene una nueva tabla para variables aleatorias X y Z que debe construir X 11 17 26 Z Complete la tabla anterior y evalue el coeficiente de correlaci´on ahora entre las varia2 . Establezca adem´ bles X y Z , R XZ as el resultado del coeficiente de correlaci´on entre 2 Y y Z , R Y Z Trate de hacer relaciones entre estos tres coeficientes de correlaci´ on. 5. En un experimento de biolog´ıa una serie de bacterias fueron cultivadas en el laboratorio. Los n´umeros de las bacterias, en millones, y sus edades, en d´ıas, son a continuaci´ on. Edad 1 2 3 4 5 6 7 8 No. de bacterias 34 106 135 181 192 231 268 300 Grafique estos en un diagrama de dispersi´on con el x-eje con una escala de hasta 15 d´ıas, y el eje-y de hasta 410 millones. Calcular el valor de R2 y comentar sobre sus resultados. Algunas lecturas finales se tomaron y se les da a continuaci´ on. Edad 13 1 4 1 5 No. de bacterias 400 403 405 Agrega estos puntos a tu gr´afica y describir lo que que muestran. Calcule de nuevo el coeficiente de correlaci´on con estas nuevas medidas. 6. Una varilla de metal se calent´ o gradualmente y su longitud, L, se midi´o a diversas temperaturas, T. Temperatura (o C) 15 20 25 30 35 40 Longitud (cm) 100 103.8 106.1 112 116.1 119.9 Dibujar un diagrama de dispersi´on para mostrar los datos y evaluar R2 . (L vs. T.) ¿Sospecha una inexactitud importan te en cualquiera de los valores registrados? Si es as´ı, deseche cualquiera que usted considere indigno de confianza y encontrar el nuevo valor de R 2 .
80
4. An´ alisis Combinatorio Whenever you can, count. - Sir Francis Galton . Quoted in James R. Newman, Commentary on Sir Francis Galton (1956), 1169.
4.1.
Introducci´ on
Hay muchas situaciones en las que ser´ıa demasiado dif´ıcil y / o demasiado tedioso enumerar todos los resultados posibles de un espacio muestral. En esta lecci´ on, vamos a aprender diferentes maneras de contar el n´umero de elementos en un espacio de muestra sin tener que identificar los resultados espec´ıficos. Las t´ecnicas espec´ıficas de recuento que exploraremos incluyen la regla de la multiplicaci´on, permutaciones y combinaciones. El an´alisis combinatorio, o c´alculo combinatorio, permite enumerar tales casos o sucesos y as´ı obtener la probabilidad de eventos m´as complejos. La Teor´ıa Combinatoria estudia las agrupaciones que pueden ser formadas cuando se toman todos, o algunos, de los elementos de un conjunto ...nito. Los elementos del conjunto pueden ser de cualquier naturaleza: n´ umeros, personas, empresas, art´ıculos producidos por una f´abrica, etc. La Teor´ıa Combinatoria estudia especialmente el n´umero de agrupaciones que pueden ser obtenidas bajo alg´ un modo de composici´on de los elementos. Para ello, distingue b´asicamente tres conceptos: arreglos, permutaciones y combinaciones. Para calcular probabilidades, muchas veces es necesario determinar la cantidad de elementos de un conjunto dado (cardinal del conjunto), o la cantidad de elementos del conjunto integrado por las agrupaciones que podemos realizar tomando algunos de los elementos. A menudo, la tarea de contarlos uno a uno resulta tediosa. En cambio, para poder contar resulta de mucha utilidad el llamado Principio Fundamental de Conteo y los aportes realizados por la Teor´ıa Combinatoria.
4.2.
Principio Fundamental de Conteo
En el caso de que existan m´as de un suceso a observar, habr´ıa que contar el n´ umero de veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el principio fundamental de conteo:
81
4. An´alisis Combinatorio
Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas, entonces el n´umero de formas en que ambos sucesos pueden presentarse en ese orden es de n1 n2 . En otras palabras, basta multiplicar el n´umero de formas en que se pueden presentar cada uno de los sucesos a observar. Este principio nos remite autom´aticamente al factorial de un n´ umero natural, que se puede pensar como una funci´on con dominio los n´ umeros naturales junto con el cero y codominio los n´umeros naturales. El factorial de un n´ umero n, denotado n!, se define como: n! = n.(n
− 1).(n − 2)..,2,1,
si n > 0,
(4.1)
= 1, si n = 0.
Ahora, n es muy grande el proceso de c´alculo se vuelve tedioso y muy cargado, incluso para una computadora, por lo que se utiliza la aproximaci´ on de Stirling a n!: n!
∼ √2πn
2n+1 2
e−n .
∼
donde e 2,71828..., que es la base de los logaritmos neperianos. En el an´alisis combinatorio se definen las permutaciones, con o sin repetici´ combinaciones.
(4.2)
on, y las
Ejemplo 4.1 Una familia desea adquirir una vivienda en un balneario y se le presentan las siguientes posibilidades: casa o apartamento. A su vez, cada una puede ser de 1, 2 o 3 dormitorios. ¿ Cu´antos tipos posibles de vivienda tiene a disposici´ on? Como existen dos niveles, y se tienen 2 opciones para el primer nivel (casa o apartamento) y 3 opciones para el segundo (n´umero de dormitorios), se puede aplicar el principio fundamental de conteo para obtener la respuesta: 2 3 = 6 tipos de vivienda. Este resultado puede ser visualizado claramente con la ayuda de un diagrama de ´arbol.
4.3.
Arreglos
Dado un conjunto de n elementos, se define como arreglo de n de orden k (k < n) a cada k-upla ordenada que puede formarse tomando k elementos diferentes entre los n dados. Como una k-upla est´a constituida por k elementos dispuestos en determinado orden, dos arreglos ser´an diferentes, a´un conteniendo los mismos elementos, si los mismos se encuentran en distinto orden. Al n´ umero de arreglos de n de orden k lo notaremos como Ank . Para calcular dicho n´umero, es posible utilizar el principio fundamental de conteo. El primer lugar de la k-upla puede estar ocupado por uno cualquiera de los n elementos, mientras el segundo lugar puede estar ocupado por cualquiera de los elementos que no est´an en el primer lugar, es decir por uno de los ( n 1) elementos restantes, ya que los k
−
82
4.4. Variaciones (o arreglos) con repetici´on elementos deben ser diferentes. El tercer lugar puede estar ocupado por cualquiera de los elementos que no est´an ni en el primer lugar ni en el segundo, es decir por uno cualquiera de los ( n 2) elementos restantes. Si se contin´ua el razonamiento, para ocupar el k-´esimo lugar se tendr´an (n k + 1) elementos posibles. Entonces, el n´umero de arreglos de n de orden k es: Ank = n(n 1)(n 2)...(n + k 1), (4.3)
−
−
−
−
−
recordando la definici´on de factorial de un n´umero natural puede obtenerse otra f´ormula para el c´alculo del n´umero de arreglos: Ank = n(n
− k)(n − k − 1)..,1 = n! , − 1)(n − 2)...(n + k − 1) (n (n − k)(n − k − 1)..,1 (n − k)!
(4.4)
Los arreglos reciben tambi´ en el nombre de Variaciones. Ejemplo 4.2 De una caja que contiene cuatro bolillas numeradas del 1 al 4 se extraen sucesivamente 2 sin reposici´ on. ¿Cu´antas extracciones diferentes pueden resultar si se supone que interesa el orden de extracci´on? Las diferentes posibilidades son todos los arreglos de 4 de orden 2, es decir todos los pares ordenados posibles: (1,2), (1,3), (1,4), (2,1), (2,3), (2,4), (3,1), (3,2), (3,4), (4,1), (4,2), (4,3). Entonces, pueden resultar A42 = 4 (4-1) = 12 extracciones posibles.
{
}
Ejemplo 4.3 Sea el mismo conjunto A = a,b,c,d , ¿cu´antas ordenaciones sin repetici´ on se pueden obtener? Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.
4.4.
Variaciones (o arreglos) con r epetici´on
En la definici´on anterior se ha supuesto que los elementos con los cuales se trabaja son diferentes: se trataba de arreglos sin repetici´on o de arreglos simples. Ahora se considerar´a el caso de que en un mismo grupo, alg´un elemento pueda figurar varias veces. Al n´umero de arreglos con repetici´on de n de orden k lo notaremos como RPkn , que obviamente ser´ a mayor que P kn . Para calcular dicho n´umero es posible utilizar nuevamente el principio fundamental de conteo. El primer lugar de la k-upla puede estar ocupado por uno cualquiera de los n elementos. Como los elementos pueden repetirse, el segundo lugar tambi´ en puede estar ocupado por uno cualquiera de los n elementos y as´ı sucesivamente con los k lugares, por lo cual el n´ umero de arreglos con repetici´on de n de orden k ser´a: (RA)rn = (RV )rn = n r .
{
(4.5)
}
Ejemplo 4.4 Sea A = a,b,c,d , ¿cu´antas palabras de dos letras se pueden obtener?. Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En este caso r = 2 y n = 4. Las palabras formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd. En total son 16.
83
4. An´alisis Combinatorio Ejemplo 4.5 Se lanza un dado tres veces. ¿Cu´ antos resultados diferentes pueden obtenerse? Obviamente, es posible que el mismo n´ umero salga dos o incluso tres veces. Los resultados ser´ an todos los arreglos con repetici´on de 6 (cantidad de caras numeradas del dado) de orden 3 (cantidad de veces que se lanza el dado). Entonces la cantidad de resultados posibles ser´ a: (AP )63 = 63 = 216 . Ejemplo 4.6 De una bolsa que contiene tres fichas numeradas del 1 al 3 se extraen sucesivamente 4 con reposici´on. ¿Cu´antas extracciones diferentes pueden resultar? Las diferentes posibilidades son todos los arreglos con repetici´on de 3 de orden 4, es decir todas las cuaternas posibles, donde los elementos no son necesariamente distintos. Uno de el los ser´ıa, por ejemplo: (3,2,3,1). Entonces, la cantidad de extracciones posibles ser´a: (AR)34 = 34 = 81.
4.5.
Permutaciones (u ordenaciones) sin repetici´on
Dado un conjunto de n elementos, llamaremos permutaci´on de n a cada forma de ordenar los n elementos dados. Se observa que las permutaciones constituyen un caso particular de los arreglos ( k = n). Por consiguiente el n´umero de permutaciones de n (Pkn ) es igual al n´umero de arreglos de n de orden n. O sea, Pnn = P n =
n!
(n
n!
− n)! = 0! = n!.
(4.6)
Ejemplo 4.7 ¿De cu´antas maneras podemos colocar cuatro bolas de distintos colores en fila? La primera puede ser cualquiera de las cuatro. La segunda, cualquiera de las tres restantes, etc. La respuesta es 4 3 2 1 = 4! = 24 .
× × ×
Ejemplo 4.8 ¿Cu´ antas palabras, con o sin sentido, pueden obtenerse usando todas las letras de la palabra PRENSA? Como la palabra no tiene letras repetidas, la respuesta es 6! = 720 . M´ as adelante nos encontraremos la situaci´ on de palabras con letras repetidas.
4.6.
Permutaciones (u ordenaciones) con repetici´on
A diferencia del caso anterior, podemos suponer que todos los elementos no son distintos, es es, que algunos elementos pudieran estar repetidos. Permutaciones con repetici´ on de n elementos donde el primer elemento se repite a veces , el segundo b veces , el tercero c veces, es decir, n = a + b + c + ..., son los distintos grupos que pueden formarse con esos n elementos de forma que Pn a,b,c,... (RP )n = a! b! c! ... . (4.7)
× × ×
84
4.7. Combinaciones
4.7.
Combinaciones
Dado un conjunto de n elementos, llamaremos combinaci´on de n de orden k (k < n) a cada subconjunto que puede formarse tomando k elementos diferentes entre los n dados. Como en los conjuntos no interesa el orden de los elementos, dos combinaciones ser´ an diferentes si contienen por lo menos alg´un elemento diferente. Consid´erese, por ejemplo, un conjunto de n elementos diferentes del cual se extraen k sucesivamente y sin reposici´on, sin que interese el orden de extracci´on, o del cual se extraen k elementos simult´aneamente. En cualquiera de estos dos casos las extracciones posibles son todas las combinaciones de n de orden k. El n´umero de combinaciones de n de orden k se denota Ckn (tambi´ en llamado n´umero combinatorio). Para calcular este n´umero buscaremos la relaci´on existente entre ´este y los n´ umeros A nk y Pk .
{
}
Ejemplo 4.9 Si tomamos el mismo conjunto A = a,b,c,d , ¿cu´antos subconjuntos de 2 elementos cada uno se pueden obtener? Haci´endolos se obtienen: a,b, a,c, a,d, b,c, b,d, c,d. Son seis los subconjuntos. En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el n´ umero de combinaciones obtenidas est´an relacionadas por medio de A nk = C kn Pk , as´ı:
×
Cnr =
Ank = Pk
n r
=
n.(n
− 1).(n − 1)...(n − r + 1) = r!
n! , r!(n r)!
−
(4.8)
o, que es lo mismo, Cnr =
4.8.
n r
=
Pnr . r!
(4.9)
Combinaciones con repetici´on
A diferencia del caso anterior cuando podemos imponer la condici´on de que los elementos puedan repetirse, entonces lo que tenemos es combinaciones con repetici´ on. Al n´umero de arreglos (combinaciones) con repetici´on de n de orden k lo notaremos como RCkn , RCkn =
n+k n
−1
=
− −
(n + k 1)! . n!(k 1)!
(4.10)
Ejemplo 4.10 En una bodega hay cinco tipos diferentes de botellas. ¿De cu´ antas formas se pueden elegir cuatro botellas? Exactamente de 4+5
4
RC5 =
4
1
−
(4 + 5 = 4!(5
1)!
−−1)!
8! = (4!)2 = 70.
(4.11)
85
4. An´alisis Combinatorio
4.9.
An´ alisis y Meto dolog´ıa propuesta para la resoluci´ on de problemas de Teor´ıa de conteo
Para resolver problemas b´asicos y sencillos de teor´ıa de conteo basta con seguir el siguiente diagrama.
Figura 4.1.: Metodolog´ıa sencilla para la resoluci´ on de problemas de conteo.
4.10.
Problemas de final de cap´ıtulo
A continuaci´on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. Cu´antos resultados distintos pueden producirse al lanzar una moneda cuatro veces al aire. 2. Cu´antos n´umeros de cuatro cifras distintos pueden formarse con los elementos del conjunto 1, 2, 3, 4, 5, 6, 7.
86
4.10. Problemas de final de cap´ıtulo 3. ¿De cu´antas formas diferentes se pueden repartir tres juguetes diferentes entre cuatro ni˜nos, de manera que ning´un ni˜no tenga m´as de un juguete? 4. ¿De cu´antas formas diferentes se pueden distribuir cinco bolas distintas en tres cajas diferentes? 5. En un examen se proponen diez preguntas; cada pregunta tiene tres respues tas posibles (a,b,c). Si se contestan al azar, ¿cu´antos ex´amenes distintos pueden producirse? 6. Se extraen sucesivamente dos bolas de una bolsa que contiene seis de diferentes colores. ¿Cu´antos resultados distintos pueden producirse ? a) Con devoluci´on. b) Sin devoluci´ on. 7. El viaje de la ciudad A a la ciudad B se puede realizar por cinco carre teras distintas. ¿De cu´antas formas puede realizarse el viaje de ida y vuelta? 8. De A a B puede irse en coche, avi´on, moto, tren o barco. ¿De cu´antas formas posibles se puede hacer el viaje de ida y vuelta? 9. Resuelve: V m2 + Vm2 −2 + Vm2 −4 = 98. 10. Una matr´ ıcula de coche de un pa´ ıs europeo esta formada por 3 letras elegidas entre 27 y 4 n´umeros escogidos entre los n´umeros comprendidos entre 0 y 9. ¿Cu´antos coches se pueden matricular en cada pa´ıs con este sistema? 11. Tiras dos dados dife rentas al aire. ¿Cu´antos resultados distintos pueden producirse? 12. De Cu´antas formas distintas pueden sentarse cuatro personas alrededor de una mesa. 13. De Cu´antas formas pueden alinearse dos chicas y tres chicos. 14. De Cu´antas formas pueden actuar en T.V. cuatro cantantes y tres humoristas. 15. De Cu´antas formas distintas puede obtenerse la suma 8 al lanzar tres dados distintos y sumar los n´umeros aparecidos. 16. De cu´antas formas pueden ordenarse siete personas, entre las que figuran Juan y Mar´ıa de manera que Juan y Mar´ıa est´en colocados uno al lado de otro. 17. Se lanza una moneda o cho veces seguidas y se anotan sucesivamente los resultados obtenidos en cada uno de los lanzamientos. Los ocho lanzamientos constituyen una experiencia. ¿En cu´antas experiencias se pueden obtener cinco caras y tres cruces? 18. ¿Cu´antas de las permutaciones formadas por los n´umeros 3, 4, 5, 6, 7, 8 empezar´ an por 3? ¿Cu´antas por 64? ¿Cu´antas terminar´an por 875? 19. Cu´antos n´umeros de cinco cifras distintas se pueden formar con los n´ umeros 0, 1, 2, 3, 4.
87
4. An´alisis Combinatorio 20. ¿De cu´antas maneras pueden permutarse las letras de la palabra ESCAPARATE dejando fija la P y de modo que los lugares ocupados por vocales no puedan ser ocupados por consonantes y viceversa? 21. ¿Cu´antas comisiones de tres alumnos pueden formarse con los 35 alumnos de una clase? 22. ¿Cu´antos equipos de 5 atletas se podr´ıan formar para participar en una competici´on con los doce atletas mejor preparados? 23. En una carrera en la que toman parte 8 caballos se juega una apuesta que consis te en acertar los dos primeros sin tener en cuenta el orden. ¿Cu´ antas apuestas diferentes pueden jugarse en esa carrera? 24. De los 48 trabajadores de una empresa se presen tan 6 como candidatos a ocupar dos puestos de representante de los trabajadores. ¿Cu´ antas elecciones son posibles? 25. En un sal´on hay 6 matrimonios. Se eligen al azar dos de esas personas: (a) ¿Cu´ antas elecciones distintas son posibles? (b) ¿En cu´antas de las elecciones posibles habr´a dos hombres? (c) ¿En cu´antas habr´a una mujer y un hombre? (d) ¿En cu´ antas de las posibles elecciones habr´a un matrimonio? 26. En una l´ ınea f´errea hay 18 estaciones. Si el tren para en todas las estaciones, ¿cu´ antos viajes distintos pueden realizarse entre ellas? 27. Un alumno puede elegir 3 entre sus 15 compa˜ neros de clase para realizar un viaje, ¿cu´ antas elecciones distintas pueden hacerse? 28. Con 5 clase de vino, ¿cu´ antas mezclas se pueden formar de tres vinos? 29. De cu´antas formas posibles pueden elegirse dos botellas entre 18 existentes. 30. Con seis pesas de 1, 2, 5, 10, 20 y 50 gr, ¿cu´ antas pesadas posibles pueden realizarse?
88
5. Probabilidad What the use of P [the significance level] implies, therefore, is that a hypothesis that may be true may be rejected because it has not predicted observable results that have not occurred. - Sir Harold Jeffreys . Theory of Probability (1939), 316.
5.1.
Introducci´ on: La probabilidad
La palabra probabilidad no tiene una definici´on consistente. De hecho, hay dos amplias categor´ıas de interpretaciones de la probabilidad: los frecuencistas hablan de probabilidades s´olo cuando se trata de experimentos aleatorios bien definidos. La frecuencia relativa de ocurrencia del resultado de un experimento, cuando se repite el experimento, es una medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan las probabilidades a cualquier declaraci´on, incluso cuando no implica un proceso aleatorio, como una manera de representar su verosimilitud subjetiva. El estudio cient´ıfico de la probabilidad es un desarrollo moderno. Los juegos de azar muestran que ha habido un inter´es en cuantificar las ideas de la probabilidad durante milenios, pero las despu´ descripciones matem´aticas exactas de utilidad en estos problemas s´ olo surgieron mucho es. Seg´un Richard Jeffrey, “Antes de la mitad del siglo XVII, el t´ermino ’probable’ (en lat´ın probable) significaba aprobable, y se aplicaba en ese sentido, un´ıvocamente, a la opini´on y a la acci´on. Una acci´on u opini´on probable era una que las personas sensatas emprender´ıan o mantendr´ıan, en las circunstancias.” [Ve´ase: Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7]. Dos aplicaciones principales de la teor´ıa de la probabilidad en el d´ıa a d´ıa son en el an´ alisis de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente aplican m´etodos probabil´ısticos en regulaci´ on ambiental donde se les llama “an´ alisis de v´ıas de dispersi´ on”, y a menudo miden el bienestar usando m´etodos que son estoc´asticos por naturaleza, y escogen qu´ e proyectos emprender bas´ andose en an´alisis estad´ısticos de su probable efecto en la poblaci´on como un conjunto. No es correcto decir que la estad´ıstica est´ a incluida en el propio modelado, ya que t´ıpicamente los an´alisis de riesgo son para una u ´ nica vez y por lo tanto requieren m´ as modelos de probabilidad fundamentales, por ej. “la probabilidad de otro 11-S”. Una ley de n´ umeros peque˜nos tiende a aplicarse a todas aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas probabil´ısticas un tema pol´ıtico.
89
5. Probabilidad Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto generalizado sobre los precios del petr´oleo en Oriente Medio - que producen un efecto domin´ o en la econom´ıa en conjunto. Un c´ alculo por un mercado de materias primas en que la guerra es m´as probable en contra de menos probable probablemente env´ıa los precios hacia arriba o hacia abajo e indica a otros comerciantes esa opini´ on. Por consiguiente, las probabilidades no se calculan independientemente y tampoco son necesariamente muy racionales. La teor´ıa de las finanzas conductuales surgi´ o para describir el efecto de este pensamiento de grupo en el precio, en la p ol´ıtica, y en la paz y en los conflictos. Se puede decir razonablemente que el descubrimiento de m´etodos rigurosos para calcular y combinar los c´alculos de probabilidad ha tenido un profundo efecto en la sociedad moderna. Por consiguiente, puede ser de alguna importancia para la mayor´ıa de los ciudadanos entender c´omo se calculan los pron´ osticos y las probabilidades, y c´omo contribuyen a la reputaci´ on y a las decisiones, especialmente en una democracia. Otra aplicaci´on significativa de la teor´ıa de la probabilidad en el d´ıa a d´ıa es en la fiabilidad. Muchos bienes de consumo, como los autom´ oviles y la electr´onica de consumo, utilizan la teor´ıa de la fiabilidad en el dise˜ no del producto para reducir la probabilidad de aver´ıa. La probabilidad de aver´ıa tambi´en est´ a estrechamente relacionada con la garant´ıa del producto. Se puede decir que no existe una cosa llamada probabilid ad. Tambi´en se puede decir que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado de nuestra ignorancia dada una situaci´on. Por consiguiente, puede haber una probabilidad de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. Sin embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien 100 % o 0 %, y la el ecci´on correcta puede ser hecha con precisi´on por el que ve la carta. La f´ısica moderna proporciona ejemplos importantes de situaciones determin´ısticas donde s´ olo la descripci´on probabil´ıstica es factible debido a informaci´ on incompleta y la complejidad de un sistema as´ı como ejemplos de fen´ omenos realmente aleatorios. En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza de la mano y el periodo de esta fuerza es conocido, entonces el n´umero donde la bola parar´a ser´a seguro. Naturalmente, esto tambi´ en supone el conocimiento de la inercia y la fricci´ on de la ruleta, el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante el movimiento y as´ı sucesivamente. Una descripci´ on probabil´ıstica puede entonces ser m´ as pr´ actica que la mec´anica newtoniana para analizar el modelo de las salidas de lanzamientos repetidos de la ruleta. Los f´ısicos se encuentran con la misma situaci´on en la teor´ıa cin´etica de los gases, donde el sistema determin´ıstico en principio, es tan complejo (con el n´ umero de mol´eculas t´ıpicamente del orden de magnitud de la constante de Avogadro 6 10 23 ) que s´olo la descripci´on estad´ıstica de sus propiedades es viable. La mec´anica cu´antica, debido al principio de indeterminaci´on de Heisenberg, s´olo puede ser descrita actualmente a trav´ es de distribuciones de probabilidad, lo que le da una gran importancia a las descripciones probabil´ısticas. Albert Einstein coment´ o estupendamente
×
90
5.2. La probabilidad en una carta a Max Born: Jedenfalls bin ich ¨uberzeugt, daβ der Alte nicht w¨urfelt. (Estoy convencido de que Dios no tira el dado). No obstante hoy en d´ıa no existe un medio mejor para describir la f´ısica cu´antica si no es a trav´ es de la teor´ıa de la probabilidad. Mucha gente hoy en d´ıa confunde el hecho de que la mec´anica cu´antica se describe a trav´ es de distribuciones de probabilidad con la suposici´on de que es por ello un proceso aleatorio, cuando la mec´anica cu´antica es probabil´ıstica no por el hecho de que siga procesos aleatorios sino por el hecho de no poder determinar con precisi´ on sus par´ametros fundamentales, lo que imposibilita la creaci´ on de un sistema de ecuaciones determinista. (Tomado de wikipedia, busque “probabilidad”).
5.2.
La probabilidad
La probabilidad es una medida de la posibilidad de que un “evento ocurra. En vista de la caracter´ıstica de ´esta medida, la cantidad que la describe es siempre un n´ umero que se encuentra en un intervalo [0 , 1], donde o equivale a una posibilidad nula de que el evento ocurra mientras que 1 representa el hecho de que evento va a ocurrir con toda seguridad. En otras palabras, la medida de la probabilidad es siempre una fracci´ on o decimal indicando la porci´on o porcentaje de la veces que un evento ocurre. Ejemplo 5.1 40 % de chance de que l lueva, average de bateo de .313, la probabilidad de obtener un royal flush en poker es 1:649740. La interpretaci´ on: Un 40% de chance de que llueva significa que si nosotros miramos todos los d´ıas con caracter´ısticas similares, entonces de cada 100 d´ıas con estas condiciones, 40 de ellos ser´an d´ıas con lluvia; un porcentaje de bateo de .313 significa que el jugado llegar´ a a una base o har´ a un hit en el 31.3 % (.313) de todos los intentos al bateo, es decir, de cada 100 veces que batea, s´olo 31 veces aproximadamente hace un hit; dram´aticamente se tendr´a que si uno quiere obtener un royal flush en una partida de poker, entonces quiz´ as tenga que esperar hasta 649740 manos para obtener uno.
5.3.
Experimentos de Probabilidad
Un experimento probabil´ıstico es cualquier proceso que produce un resultado o una observaci´ on y tiene por finalidad de determinar posibilidades. Ejemplo 5.2 Lanzar un dado o una moneda, escoger un nombre de varios revueltos en un vaso, sacar una carta de un mazo. Cuando se realiza un experimento, se obtienen un conjunto de valores. A este conjunto de valores que puede tomar una variable se le denomina espacio muestral. Ejemplo 5.3 El universo de el experimento de lanzar una moneda tiene dos resultados: cara y sello, as´ı podemos escribir:
{
S = cara, sello
}
(5.1)
91
5. Probabilidad
En el experimento de lanzar un dado, se tienen 6 posibles resultados, as´ı:
{
S = 1, 2, 3, 4, 5, 6
}
(5.2)
Desde ahora definiremos evento como cualquier colecci´on de resultados de un espacio de eventos o universo, es decir, pudiera confeccionarse subconjuntos del universo de un evento y crear nuevos eventos. Si existen m´as de una variable, el espacio muestral est´a formado por las combinaciones de valores de cada una de las variables. Ejemplo 5.4 En el caso de el experimento de lanzar un dado, uno podr´ıa definir dos nuevos eventos del universo tomando algunos que tienen una caracter´ıstica com´ un, as´ ı
{
} { } {
} }
P = Resultados pares = 2, 4, 6 , I = Resultados impares = 1, 3, 5 ,
{
As´ı mismo podr´ıan confeccionarse eventos en el experimento de sacar una carta de un mazo, uno podr´ıa inventar nuevos eventos, por ejemplo, los resultados posibles de sacar un rey, tiene cuatro resultados correspondientes con los cuatro reyes de los cuatro distintos tipos de dibujo que tienen las cartas, o bien, el rey de corazones, el rey de picas, el rey de espadas y el rey de tr´ eboles. Un evento E para un experimento se dice que ocurre si y s´
olo si el resultado de el
experimento es uno de los que pertenecen a E . Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina un evento, y si ´este consta de un solo elemento entonces es un evento elemental. Ejemplo 5.5 Si P es el evento descrito anteriormente de obtener los n´ umeros pares en el lanzamiento de un dado, entonces si al lanzar el dado el n´ umero mostrado es un 4, entonces uno podr´ıa decir que el evento P ocurre, si el n´umero mostrado es 1, entonces uno debe decir que el evento P no ocurre. Como se puede uno imaginar, existen eventos que siempre, no importa el n´ umero de experimentos o su situaci´on, ocurren, y en cambio existen otros que nunca ocurren. Los que siempre ocurren son los eventos seguros, y los que nunca son los eventos imposibles. Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta raz´ on, se define como experimento aleatorio al proceso en el que se pueden predecir con certeza la ocurrencia de sus eventos, con excepci´on del seguro o del imposible. Hay que hacer la observaci´ on que esta definici´on habla en t´erminos generales y no espec´ıficamente sobre alg´un experimento en particular.
92
5.4. Calculando la probabilid ad de un evento A aquella variable que est´a asociada a un experimento de este tipo se le denomina variable aleatoria. En cambio, a un experimento no aleatorio se le denomina experimento determin´ ıstico. Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar varios casos. Si dos o m´as eventos no pueden ocurrir simult´aneamente, se llaman eventos mutuamente excluyentes, es decir, que la intersecci´on de ambos eventos es vac´ıa. Por otro lado, en ocasiones un evento o m´as eventos dependen de otro evento previo, es decir, un evento A ocurre dado que ocurri´o un evento B. Si existe este tipo de relaci´on entre eventos se dice que son eventos dependientes o condicionados (el evento A depende del evento B, o el resultado del evento A est´a condicionado al resultado del evento B). Por otro lado, si no existe tal relaci´on entre eventos se dice que son eventos independientes. Los criterios de dependencia o de independencia se definir´ an m´as adelante, en t´erminos de probabilidad condicional.
5.4.
Calculando la probabilidad de u n evento
Para calcular la probabilidad de eventos es necesario que ´estos se comporten de una manera m´as o menos estable. Precisamente, se echa mano de la regularidad estad´ıstica, que es la propiedad de los fen´ omenos aleatorios, y que consiste en que al aumentar el n´ umero de repeticiones de un experimento en condiciones pr´ acticamente constantes, la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo. La probabilidad de un evento E es denotada por P (E ) y siempre representa la fracci´on o porcentaje de o currencia de que E ocurra. Algunas caracter´ ısticas exhibe esta formulaci´on: Para un evento E , se tiene que 0
≤ P (E ) ≤ 1.
Un evento E es llamado evento imposible si ocurre que P (E ) = 0. Un evento E es llamado evento cierto si ocurre que P (E ) = 1. La probabilidad P (E ) puede ser calculada de dos modos distintos.
5.4.1.
Probabilidad Emp´ırica
Tambi´ en llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estad´ıstica. Esta definici´on ser´ ıa la m´ as real, pero proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales. Adem´as, los resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo. Por ejemplo, uno podr´ıa calcular la probabilidad de obtener una suma de 7 cuando dos dados son lanzados muchas veces, digamos 100 veces, y calculando que porcentaje de las veces sale 7. As´ı mismo tambi´ en se podr´ıa calcular la probabilidad de que un jugador de
93
5. Probabilidad basketball anote una cesta libre de tablero calculando el porcentaje de las veces que lo ha hecho en el pasado con estad´ısticas anteriores. Para calcular la probabilidad de esta manera podr´ıa usarse la siguiente f´ormula: P (E ) =
n´umero de intentos en los que ocurre E . n´umero de intentos totales
(5.3)
Ejemplo 5.6 Digamos que la siguiente tabla representa las notas que obtienen en un ex´ amenes en base a 100 puntos un grupo de estudiantes: Notas 90-99 80-90 70-79 60-69 50-59 40-49
N´umero de estudiantes 4 6 4 3 2 1
Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos, la probabilidad de sacar un examen al azar y que sea una nota entre 90 y 99 puntos ser´ a: P (A) =
5.4.2.
cantidad de estudiantes que obtienen notas entre 90 y 99 puntos cantidad total de estudiantes
=
4 = 0,20. 20 (5.4)
Probabilidad cl´ asica
La probabilidad cl´asica de un evento E , que denotaremos por P (E ), se define como el n´umero de eventos elementales que componen al evento E , entre el n´umero de eventos elementales que componen el espacio muestral: P (E ) =
n´ umero de eventos elementales que componen al evento E . n´umero de eventos elementales que componen el espacio muestral
(5.5)
Es la definici´on m´as utilizada porque supone de antemano, y se necesita como requisito indispensable, que todos los eventos elementales tienen la misma probabilidad de ocurrir. Ejemplo 5.7 Cuando se lanza una moneda, se obtienen dos resultados posibles: cara o sello. Digamos que el evento que salga cara lo denotamos por A y a la de sello B . La probabilidad de que salga una cara al lanzar la moneda ser´ a 1 P (A) = P (B) = P (cara) = P (sello) = . 2
(5.6)
En el caso del ejemplo en el que uno lanza un dado, entonces se tendr´ a 1 P (sale 1 ) = P (sale 5 ) = 6 .
94
(5.7)
5.5. Axiomas de la probabilidad Note que para el c´alculo de la probabilidad desde e´sta perspectiva cl´ asica no es necesario de ninguna manera que se tenga que confeccionar y realizar el experimento. Vasta, como se ve, que uno tenga pleno conocimiento de el espacio muestral y sus respectivos resultados, por su puesto.
5.5.
Axiomas de la probabilidad
Recordemos primero que las frecuencias relativas de una distribuci´on ten´ıan las siguientes propiedades: Las frecuencias relativas son mayores o iguales que cero. La frecuencia relativa del espacio muestral es igual a la unidad. Si dos eventos son mutuamente excluyentes, es decir que no ocurren simult´aneamente, entonces la frecuencia relativa de su uni´on es la suma de las frecuencias relativas de cada uno. Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definici´ on ya expuesta, es la frecuencia relativa cuando se aumenta el tama˜ no de la muestra, se tienen lo siguiente. Si E es un evento de un espacio muestral S y P (E ) es la probabilidad de E , entonces se satisfacen los axiomas de la probabilidad: 1. La probabilidad de un evento E , es un n´umero siempre entre 0 y 1, es decir, 0 P (E ) 1.
≤
≤
2. Se le llama a E evento seguro a un evento cuando P (E ) = 1. Por otro lado, se le llama evento imposible si P (E ) = 0. 3. La probabilidad del universo es la m´axima, P (S ) = 1. 4. Si E1 , E2 ,..., En , son eventos mutuamente excluyentes, entonces
n
P (E1
∪ E2 ∪ ... ∪ En) = P
n
Ei
i=1
=
P (Ei ).
(5.8)
i=1
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de eventos.
95
5. Probabilidad
5.6.
Posibilidades y probabilidades
En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las palabras posibilidad y probabilidad. La principal motivaci´on de esta secci´on es hacer una diferenciaci´ on de estas dos cosas. En principio pareciera l´ ogico que uno pudiera definir la probabilidad en t´ermino de las posibilidades de que un evento ocurra, sin embargo, hablando en t´erminos generales, la palabra posibilidad proviene de referirse a ciertos juegos de apuestas en las que se utiliza la frase: “la posibilidad de ganar es de x a y” , por ejemplo,
“la posibilidad de que gane es de 3 a 1” . Cuando uno habla de ´esa manera es inevitable pensar en que tal frase est´a ligada de alguna manera a razones, en el sentido matem´atico de la palabra. Efectivamente, la posibilidad de que ocurra un evento se determina mediante la raz´ on de la probabilidad de que ocurra a la probabilidad de que no ocurra. Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las posibilidades de que ocurra son x a y , si x p = , y 1 p
−
(5.9)
de tal manera que x y y son n´umeros enteros. Ejemplo 5.8 Si se tiran dos monedas normales (no trucadas), la probabilidad de que las dos monedas caigan cara es de 14 . Esto quiere decir si alguien apuesta a que las dos monedas no caen simult´aneamente en cara, la posibilidad de ganar la apuesta es de 3 4
1
= 3, 0,25 1 − 34 = 0,75
(5.10)
es decir, la posibilidad de ganar la apuesta es de 3 a 1. Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento, entonces se acostumbra mencionar las posibilidades en contra del evento. Ejemplo 5.9 Si se tira un dado no trucado, sabemos que la probabilidad de obtener un cuatro es 16 , es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se acostumbra decir que las posibilidades en contra, esto es, de no obtener un cuatro es de 6 a 1. Inversamente, en el caso de tener las posibilidades de un evento, entonces es f´acil obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces la probabilidad p de que ocurra tal evento es x p= . (5.11) x+y
96
5.7. Propiedades de la probabilidad de eventos no elementales Ejemplo 5.10 En la Copa Mundial de F´ utbol Francia 1998 se dec´ıa que el equipo mexicano ten´ıa una posibilidad de 1 a 75 de l legar a ser el campe´ on del torneo. Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser campe´ on, entonces se tiene que p=
x 1 1 = = = 0,01311, x+y 1 + 75 76
(5.12)
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinaci´ on con el tercer axioma de la probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre las posibilidades que le asignan a algunos eventos. Esto quiere decir que el c´ alculo de las probabilidades de dos eventos mutuamente excluyentes a partir de las posibilidades otorgadas de manera subjetiva resulta como un criterio de consistencia. Ejemplo 5.11 Un crimin´ologo piensa que las posibilidades de que en la pr´ oxima semana la cantidad de delitos en una ciudad aumente con respecto a la anterior es de 5 a 2, de que sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la cantidad o sea la misma es de 7 a 4. Si se desea saber si son consistentes las probabilidades correspondientes habr´ ıa que hacer los c´ alculos. Las probabilidades de que aumente la cantidad de delitos, que sea igual la cantidad de delitos, y de que aumente o sea igual la cantidad de delitos es, respectivamente, de paumente = 5
1
5 5 = , 5+2 7
pigual =
1 1 = , 1+3 4
paumente =
7 7 = , 7+4 11
(5.13)
27
4 = 28 (como son eventos mutuamente excluyentes) no es lo mismo que + criterios y7 dado que 7los , entonces del crimin´ologo pueden ser cuestionados. 11
5.7.
Propiedades de la probabilidad de event os no elem entales
Cuando se tienen eventos elementales no existe mucho problema en el sentido del c´alculo de las probabilidades, pues basta con una contabilizaci´ on o el uso directo del c´alculo combinatorio. Pero en el caso de eventos no elementales, que son los compuestos por m´as de un evento elemental, el proceder de manera an´aloga resulta muy complejo y las operaciones pueden sobrepasar la capacidad de c´alculo existente. Sin embargo, utilizando los axiomas de la probabilidad y las siguientes propiedades, se podr´ an expresar las probabilidades de estos eventos en t´erminos de los eventos elementales que lo componen, siempre y cuando se conozcan las probabilidades de ´estos. Veamos la probabilidad de una uni´ on de eventos, la cual la podremos calcular de la siguiente manera: 1. Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B, menos la probabilidad
97
5. Probabilidad de que ocurran A y B simult´aneamente. Es decir, P (A
∪ B) = P (A) + P (B) − P (A ∩ B)
(5.14)
Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene: 2. Propiedad 2. Si dos eventos, A y B , son mutuamente excluyentes entonces la probabilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B. Es decir
∪
P (A B) = P (A) + P (B). (5.15) Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del complemento de un evento E , que denotaremos como E¯ : ¯ su complemento, entonces 3. Propiedad 3. Si E es un evento y E ¯) = 1 P (E
5.8.
− P (E ).
(5.16)
Probabilidad condicionada
En el c´alculo de las probabilidades de algunos sucesos, el valor de dicha probabilidad dar´ a en funci´on del conocimiento de determinadas informaciones relativas a estos sucesos. Ejemplo 5.12 Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al 4, extraemos una bola y seguidamente la volvemos a introducir para realizar una segunda extracci´ on, la probabilidad de extraer, por ejemplo, la bola n´ umero 3 en la segunda extracci´ on es la misma que en la primera. Si realizamos el mismo proceso sin reemplazar la bola
extra´ ıda la probabilidad deıda extraer, por ejemplo, depender´ a de la bola extra´ en primer lugar. la bola n´umero 3 en la segunda extracci´on
Definici´ on. Sean A y B dos sucesos tal que P (A) = 0, se llama probabilidad de B condicionada a A, P (B A), a la probabilidad de B tomando como espacio muestral A, es decir, la probabilidad de que ocurra B dado que ha sucedido A. La probabilidad de que ocurra un evento A dado que ocurri´o el evento B (el evento A depende del evento B ) es:
|
|
P (A B) =
∩
P (A B) . P (B)
(5.17)
Hay que notar que esta propiedad no es conmutativa, situaci´ on que s´ı ocurre con la probabilidad de uni´on o la intersecci´on de eventos, por lo que no hay que confundir P (A B) y P (B A).
|
|
Ejemplo 5.13 Consideremos el experimento de “lanzar un dado al aire”. Calculemos, por ejemplo, la probabilidad de obtener un 3 sabiendo que ha salido un n´ umero impar. Definimos los sucesos A = sacar 3 y B = 1, 3, 5 ; entonces, P (A B) = 1/3, puesto que si sabemos que ha salido un n´ umero impar, los casos posibles ahora son 3 y los casos favorables al suceso A s´ olo 1.
{
98
}
{
}
|
5.9. Probabilidad total El conocimiento de que ha ocurrido el suceso A modifica, en algunas ocasiones, la probabilidad del suceso B, pero en otras no. Los sucesos en los que, conociendo que uno ha ocurrido, no se modifica la probabilidad del otro, decimos que son independientes y, si se modifica, decimos que son dependientes entre s´ı. Finalmente, el criterio para la independencia de eventos queda como sigue: Definici´ on. Dos eventos A y B son independientes si y s´olo si P (A B) = P (A),
P (B A) = P (B),
|
o, lo que es lo mismo,
(5.18)
| |
P (A B) = P (A)P (B).
5.9.
(5.19)
Probabilidad total
Llamamos sistema completo de sucesos a una familia de sucesos A 1 , A2 ,...,A plen: Son incompatibles dos a dos, Ai
Teorema de la probabilidad total
Sea A 1 , A2 ,...,A
n
que cum-
∩ Aj = φ.
La uni´on de todos ellos es el suceso seguro,
5.9.1.
n
n i=1 Ai
= S.
un sistema completo de sucesos tales que la probabilidad de cada uno
de ellos es distinta y sea Blaun suceso cualquier del que conocen condicionales P (Bde Aicero, ), entonces probabilidad del suceso B se viene dadalas porprobabilidades la expresi´on:
|
|
|
|
P (B) = P (A1 )P (B A1 ) + P (A2 )P (B A2 ) + ... + P (An )P (B An ).
5.10.
(5.20)
Teorema de Bayes
En el a˜no 1763, dos a˜nos despu´es de la muerte de Thomas Bayes (1702-1761), se public´o una memoria en la que aparece, por vez primera, la determinaci´ on de la probabilidad de las causas a partir de los efectos que han podido ser observados. El c´ alculo de dichas probabilidades recibe el nombre de teorema de Bayes. Sea A 1 , A2 ,...,A n un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades condicionales P (B Ai ). entonces la probabilidad P (Ai B) viene dada por la expresi´on:
|
|
P (Ai B) =
|
|
|
P (Ai )P (B Ai ) P (Ai )P (B Ai ) = . P (B) P (A )P (B A ) + P (A )P (B A ) + ... + P (A )P (B A ) 1 1 2 2 n n (5.21)
|
|
|
99
5. Probabilidad
5.11.
Problemas de final de cap´ıtulo
A continuaci´on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. Con los jugadores de un club de f´ utbol se forman dos equipos para jugar un partido de entrenamiento; entre los dos equipos se re´unen 6 defensas, 8 medios, 6 delanteros y 2 porteros. El entrenador sabe que en estos partidos, la probabilidad de que se lesione un jugador es 0.22 si es delantero, 0.11 si es medio, 0.055 si es defensa y 0 si es portero. (a) Calcular la probabilidad de que se lesione uno cualquiera de los jugadores en este partido. (b) Si se sabe que un jugador se ha lesionado, determinar la probabilidad de que haya sido un defensa. 2. Tras un estudio estad´ıstico en una ciudad se observa que el 70 % de los motoristas son varones y, de estos, el 60 % llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con casco es del 40 %. Se pide: (a) Calcular la probabil idad de que un motorista elegido al azar lleve casco. (b) Se elige un motorista al azar y se observa que lleva casco. ¿Cu´al es la probabilidad de que sea var´on? 3. En una ciu dad, el 35 % vota al part ido A, el 45 % vota al part ido B y el resto se abstiene. Se sabe adem´as que el 20% de los votantes de A, el 30% de los de B y el 15 % de los que se abstienen, son may ores de 60 a˜nos. Se pide: (a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 a˜ nos. (b) Hallar la probabilidad de que un ciudadano mayor de 60 a˜ nos se haya abstenido. 4. Los alumnos de Primero de Biolog´ıa tienen que realizar dos pruebas, una te´orica y otra pr´actica. La probabilidad de que un estudiante apruebe la parte te´ orica es de 0.6, la probabilidad de que apruebe la parte pr´ actica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. (a) ¿Son independientes los sucesos aprobar la parte te´orica y la parte pr´actica? (b) ¿Cu´al es la probabilidad de que un alumno no apruebe ninguno de los dos ex´amenes? (c) ¿Cu´al es la probabilidad de que un alumno apruebe solamente uno de los dos ex´amenes? (d) Se sabe que un alumno aprob´o la teor´ıa. ¿Cu´ al es la probabilidad de que apruebe tambi´ en la pr´ actica? 5. En una baraja de 40 cartas. (a) Se toman dos cartas sin reemplazamiento. ¿Cu´al es la probabilidad de que las dos sean de distinto n´ umero? (b) Y si se toman tres cartas, ¿Cu´al es la probabilidad de que los tres n´umeros sean distintos? 6. Tenemos un dado con tres “1”, dos “2” y un “3”. Lo tiramos dos vec es consecutivas y anotamos la suma de los resultados. (a) ¿Cu´ al es el Espacio Muestral? (b) ¿Cu´al es la probabilidad de que la suma sea 4? (c) ¿Cu´ al es la suma m´as probable? ¿Cu´anto vale su probabilidad?
100
5.11. Problemas de final de cap´ıtulo 7. Tenemos dos dado s A y B, ambos trucados. En el dado A hay tres “1” y tres “2” y en el dado B hay dos “1” y cuatro “2”. Se elige un dado al azar y se tira. (a) ¿Cu´ al es la probabilidad de obtener un “1”? (b) Sabiendo que se ha obtenido un “2”, ¿Cu´ al es la probabilidad de que se haya elegido el dado B? 8. En una caja hay x bolas blan cas y 1 bola roja. Al extraer de la caja dos bolas al azar sin reemplazamiento, la probabilidad de que sean blancas es 1/2. Calcula el n´ umero de bolas blancas que debe tener la caja. 9. El 35 % de los cr´editos de un banco es para vivienda, el 50 % para industrias y el 15 % para consumo diverso. Resultan fallidos el 20 % de los cr´ editos para vivienda, el 15 % de los cr´editos para industrias y el 70 % de los cr´editos para consumo. Calcula la probabilidad de que se pague un cr´edito elegido al azar. 10. El volumen de producci´on en tres plantas diferentes de una f´abrica es de 500 unidades en la primera, 1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades defe ctuosas producidas en cada planta es del 1 %, 0.8 % y 2 %, respectivamente, calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa. 11. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas. El 75 % de los ingeni eros o cupan un puesto directivo y el 50 % de los econom istas tambi´ en, mientras que de los no ingenieros y no economistas solamente el 20 % ocupan un puesto directivo. ¿Cu´al es la probabilidad de que un empleado directivo elegido al azar sea ingeniero? 12. Se toman dos barajas espa˜nolas de 40 cartas. Se extrae al azar una carta de la primera baraja y se introduce en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se extrae una carta, que resulta ser el dos de oros. ¿Cu´ al es la probabilidad de que la primera carta extra´ıda fuese una espada? 13. En un conjunto de estudiantes el 15 % estudia alem´an, el 30 % estudia franc´es y el 10 % ambas materias. (a) ¿Son independientes los sucesos estudiar alem´an y estudiar franc´ es?. (b) Si se elige un estudiante al azar, calcule la probabilidad de que no estudie franc´ es ni alem´ an. 14. Un ladr´on, al huir de un polic´ıa, puede hacerlo p or las calles A, B o C, con probabilidades p(A) = 0, 25, p(B) = 0, 6 y p(C ) = 0, 15 respectivamente. La probabilidad de ser alcanzado por la calle es 0,4 si huye por la calle B es 0,5 y si huye por la calle C es 0,6. (a) Calcule la probabilidad de que la polic´ıa alcance al ladr´on. (b) Si el ladr´on ha sido alcanzado, ¿cu´al es la probabilidad de que haya sido en la calle A? 15. De una urna con 4 bolas blan cas y 2 negras se extraen al azar, suces ivamente y sin reemplazamiento, dos bolas, (a) ¿Cu´al es la probabilidad de que las bolas extra´ıdas
101
5. Probabilidad sean blancas? (b) Si la segunda bola ha resultado ser negra, ¿cu´ al es la probabilidad de que la primera tambi´ en lo haya sido? 16. Sean A y B dos sucesos de un experimen to aleatorio tales que : P (A) = 0, 6, P (B) = 0, 5 y P (Ac B c ) = 0, 7. (a) Calc´ulese P (A B) y raz´onese si los sucesos A y B son independientes. (b) Calc´ ulese P (A B).
∪
∩
∪
17. En un estudio realizado en cierta Universidad se ha determinado que un 20 % de sus estudiantes no utilizan los transportes p´ublicos para acudir a sus clases y que un 65 % de los estudiantes que utilizan los trans portes p´ublicos tambi´ en hacen uso del comedor universitario. Calcular la probabilidad de que seleccionado al azar un estudiante en esa Universidad resulte ser usuario de los transportes p´ ublicos y del comedor universitario. Justificar la respuesta. 18. Una urna contiene dos monedas de plata y tres de cobre. Otra contiene cuatro monedas de plata y tres de cobre. Si se elige una urna al azar y se extrae una moneda al azar. ¿Cu´al es la probabilidad de que la moneda extra´ıda sea de plata?. 19. Un dado est´a trucado de manera que son iguales las probabilidades de obtener 2, 4 o 6, tambi´en son iguales las probabilidades de obtener 1, 3 o 5 y la probabilidad de obtener 2 es doble que la probabilidad de sacar 1. Deducir razonadamente cu´ al es la probabilidad de que al lanzar el dado dos veces se obtenga una suma igual a 7. 20. Una experiencia aleatoria consiste en preguntar a tres personas distint as, elegidas al azar, si son partidarias o no de consumir un determinado producto. (a) Escribe el espacio muestral asociado a dicho experimento, utilizando la letra s para las respuestas afirmativas y n para las negativas. (b) ¿Qu´ e elementos del espacio muestral anterior constituyen el suceso A:= al menos dos de las personas son partidarias de ¯ consumir el producto ? (c) Describe el suceso contrario de A:= m´as de dos personas son partidarias de consumir el producto .
}
{
}
{
21. En un supermercado el 70 % de las compras las realizan las mu jeres; de las compras realizadas por estas, el 80 % supera las 600 BsF, mientras que de las compras realizadas por hombres s´olo el 30 % supera esa cantidad . (a) Elegido un ticket de compra al azar, ¿cu´al es la probabilidad de que supere las 600 BsF? (b) Si se sabe que el ticket de compra no supera las 600 BsF ¿cu´ al es la probabilidad de que la compra haya sido hecha por una mujer? 22. Se extrae una carta de una baraja espa˜nola de 40 cartas. Si la carta extra´ ıda es un rey, nos dirigimos a la urna I; en caso contrario a la urna II. A continuaci´ on, extraemos una bola. El contenido de la urna I es de 7 bolas blancas y 5 negras y el de la urna II es de 6 bolas blancas y 4 negras. Halla: (a) La probabilidad de que la b ola extra´ıda sea blanca y de la urna II. (b) La probabilidad de que la bola extra´ıda sea negra.
102
5.11. Problemas de final de cap´ıtulo 23. En una ciudad el 55 % de los habitantes consume pan integral, el 30 % consume pan de multicereales y el 20 % consume ambos. Se pide: (I) Sabien do que un habitante consume pan integral, ¿cu´al es la probabilidad de que coma pan de multicereales? (II) Sabiendo que un habitante consume pan de multicereales, ¿cu´ al es la probabilidad de que no consume pan integral? (III) ¿Cu´al es la probabilidad de que una persona de esa ciudad no consuma ninguno de los dos tipos de pan? 24. Si A y B son dos suce sos tales que: P (A) = 38 , P (B) = P (Ac
∩ Bc).
1 2
B) = 14 . Calcula
y P (A
∩
25. Tengo dos urnas, dos bolas blan cas y dos bolas negra s. Se desea saber como debo distribuir las bolas en las urnas para que, al elegir una urna al azar, sea m´ axima la probabilidad de obtener una bola blanca. La ´unica condici´on exigida es que cada una tenga al menos una bola. 26. Se estima que s´olo un 20 % de los que compran acciones en Bolsa tiene n conocimientos burs´ atiles. De ellos el 80 % obtienen benefic ios. De los que comp ran acciones sin conocimientos burs´atiles, s´olo un 10% obtienen beneficios. Se desea saber: (a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios. (b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido beneficios, ¿cu´al es la probabilidad de que tenga conocimientos burs´ atiles? 27. El equipo directivo de cierta empresa del sector de hosteler´ıa est´a constituido por 25 personas de las que un 60 % son mujeres. El gerente tiene que seleccio nar a una persona de dicho equipo para que represente a la empresa en un certamen internacional. Decide lanzar una moneda: si sale cara, selecciona a una mujer y si sale cruz, a un hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingl´es, determina, justificando la respuesta, la probabilidad de que la persona seleccionada hable ingl´es. 28. Dos personas piensan cada una de ellas un n´umero del 0 al 9. Calcula la probabilidad de que las dos personas no piensen el mismo n´ umero. 29. Dos sucesos tienen probabilidades 0,4 y 0,5. Sabiendo que son independientes, calcula la probabilidad de que no suceda ninguno de los dos. 30. En una Universidad exis ten tres facu ltades: A, B y C. En A hay matriculadas 150 chicas y 50 chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos. (a) Calcula la probabilidad de que un estudiante, elegido al azar, sea chico. (b) Si un estudiante elegido al azar resultara ser chico, ¿cu´ al es su facultad m´as probable? 31. Se escuchan tres discos y se vuelven a guardar al azar. ¿Cu´ al es la probabilidad de que al menos uno de los discos haya sido guardado en el envoltorio que le correspond´ıa?
103
5. Probabilidad 32. Se considera una c´ elula en el instante t=0. En el instante t=1 la c´elula puede: bien reproducirse, dividi´endose en dos, con probabilidad 3/4, o bien morir con probabilidad 1/4. Si la c´elula se divide, entonces en el tiempo t=2 cada uno de sus dos descendientes puede tambi´en subdividirse o morir, con las mismas probabilidades que antes, independientemente uno de otro. (a) ¿Cu´antas c´elulas es posible que haya en el tiempo t=2? (b) ¿Con qu´ e probabilidad? 33. Una caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas consecutivamente de la caja. Calcula la probabilidad de que las dos sean blancas si: (a) Antes de extraer la segunda bola se vuelve a meter la primera en la caja. (b) La segunda bola se extrae sin haber metido la primera en la caja. 34. Un monedero contiene 2 monedas de plata y 3 de cobre, y otro contiene 4 de plata y 3 de cobre. Si se elige un monedero al azar y se extrae una moneda ¿Cu´ al es la probabilidad de que sea de plata? 35. En una oficina el 70% de los empleados son asturianos. De entre los asturianos, el 50 % son hombres, mientras que de los no asturianos, s´olo son hom bres el 20 %. ¿Qu´ e porcentaje de empleados no asturianos son mujeres? (a) Calcula la probabilidad de que un empleado de la oficina sea mujer. (b) Fernando trabaja en dicha oficina. ¿Cu´al es la probabilidad de que sea asturiano? 36. El 12 % de los habitantes de un pa´ıs padece cierta enfermedad. Para el diagn´ostico de esta, se dispone de un procedimiento que no es completamente fiable ya que da positivo en el 90 % de los casos de personas realmente enfermas, pero tambi´en da positivo en el 5 % de person as sanas. ¿Cu´al es la probabilidad de que est´e sana una persona a la que el procedimiento le ha dado positivo? 37. En un ayuntamiento hay 5 concejales del partido A, 4 del B y 1 del C. Si se eligen al azar y sucesivamente tres concejales, ¿cu´al es la probabilidad de que los tres sean del partido A? ¿y la de que pertenezcan a partidos distintos? 38. Un dado ha sido trucad o de manera que la probabil idad de sacar un n´umero par es el doble que la de sacar un n´umero impar. Se lanza el dado y se pide: La probabilidad de obtener un n´umero par (a) Si, a la vez, se lanza un dado no trucado, la probabilidad de obtener un n´umero par y un n´umero impar. (b) Si, a la vez, se lanza un dado no trucado, la probabilidad de obtener, al menos, un n´ umero impar.
104
6. Variable aleat oria y funci´on de distribuci´ on Whether statistics be an art or a science... or a scientific art, we concern ourselves little. It is the basis of social and political dynamics, and affords the only secure ground on which the truth or falsehood of the theories and hypotheses of that complicated science can be brought to the test. - Lambert-Adolphe-Jacques Quetelet. Letters on the Theory of Probabilities (1846), trans. O. G. Downes (1849).
6.1.
Introducci´ on
En este tema se tratar´a de formalizar num´ericamente los resultados de un fen´omeno aleatorio. Por tanto, una variable aleatoria es un valor num´erico que corresponde a un resultado de un experimento aleatorio. Algunos ejemplos son: n´ umero de caras obtenidas al lanzar seis veces una moneda, n´umero de llamadas que recibe un tel´efono durante una hora, tiempo de fallo de una componente el´ectrica, etc. El estudio que se har´a en este tema ser´a an´alogo al que se hace con las variables estad´ısticas en descriptiva. As´ ı retomaremos el concepto de distribuci´ on y las caracter´ısticas num´ericas, como la media y varianza. El papel que all´ı jugaba la frecuencia relativa lo juega ahora la probabilidad. Esto va a proporcionar aspectos y propiedades referentes a fen´ omenos aleatorios que permitir´an modelos muy estudiados en la actualidad. En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleatorias a un nivel muy general, lo que nos permitir´ a manejar los modelos estad´ısticos para describir los posibles resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen. Tanto en la vida cotidiana como en el campo cient´ıfico estamos habituados a observar fen´ omenos aleatorios cuyos resultados se expresan mediante n´ umeros; por ejemplo el voltaje de salida en una fuente de alimentaci´on, el n´umero de personas en la cola del cine, la velocidad de conexi´on a la red, etc. Incluso en problemas de naturaleza puramente cualitativa es muy frecuente recurrir a la codificaci´on num´ erica; en situaciones tales como: el diagn´ostico de un paciente sano o enfermo, preguntas del tipo ¿estudias o trabajas?, etc., las respuestas son usualmente codificadas con 0 y 1, aunque en realidad podr´ıa emplearse cualquier pareja de s´ımbolos con igual precisi´ on.
105
6. Variable aleatoria y funci´on de distribuci´on
6.2.
Variable aleatoria unidimensional
Este proceso de cuantificaci´on nos lleva de manera natural a considerar la siguiente definici´ on: Dado un experimento aleatorio y asociado al mismo, un espacio probabil´ıstico (E,A,P ), una variable aleatoria (V.A.) es una aplicaci´ on X : E R, a cada valor de X , del espacio muestral le hace corresponder un n´umero real. Se dice que X es una variable aleatoria si para cualquier x perteneciente a R, el conjunto de los sucesos elementales le hace corresponder un valor que verifica:
→
∀X ∈
R,
X (S )
≤X
(6.1)
Ejemplo 6.1 Consideramos un experimento aleatorio de lanzar una moneda al aire tres veces y anotamos el resultado. Se define la variable aleatoria X como n´umero de caras aparecidas en los tres lanzamientos. Calcular el espacio muestral y comprobar que es una variable aleatoria. La soluci´ on es la siguiente, el espacio muestral est´a dado por E = (C,X,X ), (X,C,X ), (X,X,C ), (C,C, en donde Eventos φ (X,X,X ) (C,C,C )(X,C,X )(X,X,C ) (C,C,X )(C,X,C )(X,C,C ) (C,C,C )
Valor de la v.a. X 0 0 X 1 1 X 2 2 X 3 X >3
≤ ≤ ≤ ≤ ≤ ≤ ≤
En general emplearemos las siglas v.a. para referirnos a una variable aleatoria. Para caracterizar la distribuci´on de probabilidad inducida por una v.a. X definiremos una nueva funci´on m´as sencilla de manejar: Definici´ on. (Funci´ on de distribuci´on). Dada la v.a. X se denomina funci´on de distribuci´on asociada a X , a la funci´on F : R R definida por:
→
F (t) = P r[X
≤ t] = P r(X ∈ (−∞, t]), ∀t ∈
R.
(6.2)
Las propiedades m´as importantes de las funciones de distribuci´on son:
−∞) = l´ımn→−∞ P r[X ≤ t] = 0. ∞ ≤ t] = 0.
1. F (
2. F ( ) = l´ımn→ ∞ P r[X
3. La funci´on es continua por la derecha, es decir, l´ımh→0+ F (t + h) = F (t) 4. F es no decreciente, es decir, si t 1 < t2 entonces F (t1 ) Teorema. Una funci´on F : R cuatro propiedades anteriores.
106
R
→
≤ F (t2).
se dice que es de distribuci´on si y s´olo si verifica las
6.3. Variables discretas
6.3.
Variables discretas
Definici´ on. (Variable discreta) . Una variable aleatoria discreta es aquella que s´ olo puede tomar valores dentro de un conjunto finito o infinito numerable. Definici´ on. (Funci´ on de probabilidad) . Sea X una v.a. discreta que toma los valores xi con probabilidades pi = P r(X = xi ), con i pi = 1. Se denomina funci´ on de probabilidad de la variable X a la funci´on que asigna a cada x i su probabilidad p i . En las variables aleatorias discretas la funci´on de distribuci´on viene dada por la siguiente expresi´ on: F (t) = P r[X t] = P r(xi ). (6.3)
≤
xi t
≤
Esta funci´on es escalonada, no decreciente, con saltos de discontinuidad en los puntos xi . El valor del salto en xi coincide con la probabilidad, pi , de dicho valor.
6.4.
Variables continuas
Definici´ on. (Variable continua). Una variable aleatoria continua es aquella que toma valores en uno o varios intervalos de la recta real. En las v.a. continuas la funci´on de distribuci´on no se puede calcular como la suma de las probabilidades de ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. Para abordar esta nueva situaci´ on necesitamos la noci´on de funci´on de densidad. Definici´ on. (Funci´ on de densidad) . Dada una v.a. continua X , su funci´on de densidad es la funci´on real de variable real f (x) = l´ım h
P r(x
− h ≤ X ≤ x + h) . 2h
→0+
(6.4)
De este modo, surge el concepto de funci´on de densidad como la funci´on l´ımite a la cual se aproxima el histograma. As´ı, la probabilidad de un intervalo (a, b) ser´a el ´area limitada por esta funci´on de densidad, las rectas x = a, x = b y el eje de abscisas. Aunque, de acuerdo con la anterior, la probabilidad de que la variable aleatoria tome un valor concreto es igual a cero, tiene sentido analizar lo denso que est´ a repartida la probabilidad en torno a ese valor. De la definici´on anterior, se deduce que la funci´ on de densidad verifica las siguientes propiedades: f (x) > 0,
∀x ∈
R,
(6.5)
−∞ f (x)dx = 1.
(6.6)
∞
107
6. Variable aleatoria y funci´on de distribuci´on En general, cualquier funci´on real que verifica las propiedades anteriores es la funci´ on de densidad de alguna v.a. continua X . La funci´on de distribuci´on de una v.a. continua X se expresa a partir de la funci´ on de densidad como: F (t) =
t
f (x)dx,
−∞
∀x ∈
R
(6.7)
Esta funci´on es continua. Por lo tanto, la funci´on de densidad de una v.a. continua es la derivada de su funci´ on de distribuci´ on, f (x) = F (x).
6.5.
Caracter´ısticas de una v.a.
Las medidas resumen definidas para v.e. pueden generalizarse al caso de variables aleatorias, sin m´as que equiparar las frecuencias relativas de variables estad´ısticas con las probabilidades de las variables aleatorias. Entre los descriptores m´as habituales de las variables aleatorias se encuentran los siguientes.
6.5.1.
Definici´ on. (Esperanza Matem´ atica)
Cuando se realiza un experimento determinista el resultado del experimento es ´ unico en contraposici´on con un experimento aleatorio en el cual existen un intervalo de valores, seg´un la variable aleatoria definida, donde es posible que ocurra cualquier resultado. En ocasiones, por simplicidad, se aproxima la forma de explicar un experimento aleatorio en t´erminos de un experimento determinista pero con la dificultad de no tener argumentos suficientes para escoger el resultado ´unico que se asociar´ıa al experimento determinista. El conocimiento del concepto de valor esperado ayuda a eliminar la dificultad planteada. Dada una v. a. X definida sobre (E,A,Pr), se denomina esperanza o valor medio de X a la siguiente expresi´on µ = E (X ) =
xi P (xi ),
si X es discreta,
(6.8)
xi S X
µ = E (X ) =
∈ ∞
xf (x)dx,
si X es continua
(6.9)
−∞
La esperanza de una v.a. verifica las siguientes propiedades: E (aX + b) = aE (X ) + b. E (X
± Y ) = E (X ) ± E (Y ).
Si X e Y son independientes, entonces E (XY ) = E (X )E (Y ).
(6.10) (6.11) (6.12)
La estructura de la Ecuaci´on 4.1 se presenta en otros contextos, como por ejemplo en Mec´ anica, donde la funci´on de densidad de probabilidades tiene el sentido de la distribuci´on de la masa a lo largo de un eje y el valor esperado se corresponde con el centro de esa masa.
108
6.6. Inecuaci´on de Chevyshev En el contexto de la teor´ıa de probabilidades una variable aleatoria estar´a definida en un cierto intervalo cuyo centro es su valor esperado. En este sentido, se podr´ıa decir que el experimento aleatorio est´a definido alrededor del valor esperado y la ponderaci´ on de cada uno de los posibles resultados viene dada en t´erminos del valor de la funci´ on de densidad correspondiente en cada punto. El concepto del valor esperado permite aglutinar en un n´ umero los aportes ponderados de cada uno de los posibles resultados del experimento. Ejemplo 6.2 Una v.a. Y cuya funci´on de densidad de probabilidad est´a dada por la ex-
−
≥
presi´ on: f (y) = exp( λy), cuando y 0 y cero para cualquier otro valor. Hallar el valor esperado de dicha funci´on de densidad de probabilidad.
6.5.2.
Definici´ on. (Varianza)
En la secci´on anterior se analiz´o la definici´on de valor esperado tanto desde el punto de vista matem´atico como desde el punto de vista del fen´ omeno aleatorio involucrado. Este valor permite ubicar r´apidamente la regi´on donde est´a definida la variable como aquella regi´ on que se encuentra alrededor del valor esperado. Pero no proporciona informaci´ on acerca del tama˜no de esa regi´on. Una medida de la dispersi´on o de la concentraci´on de la variable alrededor de su valor esperado lo proporciona la varianza. La varianza de una v.a. X viene dada por la expresi´on
σ 2 = V ar(X ) = E (X σ 2 = V ar(X ) = E (X
− µ)2
=
− µ)2
=
∈ ∞
− µ)2P (xi),
si X es discreta, (6.13)
− µ)2f (x)dx,
si X es continua (6.14)
(xi
x i SX
(x
−∞
La varianza de una v.a. verifica las siguientes propiedades: V ar(X ) 0. V ar(aX + b) = a 2 V ar(X ). V ar(X ) = E (X 2 )
(6.15) (6.16)
− E(X )2.
(6.17)
Si X e Y son independientes, V ar(X + Y ) = V ar(X
− Y ) = V ar(X ) + V ar(Y(6.18) ).
Ejemplo 6.3 Una v.a. Y cuya funci´on de densidad de probabilidad est´ a dada por la expresi´ on: f (y) = exp( λy), cuando y 0 y cero para cualquier otro valor. Hallar la varianza de dicha funci´on de densidad de probabilidad.
−
6.6.
≥
Inecuaci´ on de Chevyshev
La definici´on de variable aleatoria y de las funciones de distribuci´on y de densidad refleja el comportamiento del experimento aleatorio que se est´ a analizando. Se ha verificado en diversas oportunidades que la forma de las funciones de distribuci´ on y de densidad debe
109
6. Variable aleatoria y funci´on de distribuci´on seguir un cierto patr´on que obliga a que no todo tipo de funci´ on puede ser considerada para este tipo de representaci´on. En este orden de ideas, el conocimiento del valor esperado y la varianza proporciona informaci´on adicional acerca de la forma de estas funciones y, en consecuencia, de las probabilidades asignadas a diversos tipos de eventos. Este tipo de informaci´on llega hasta el extremo de indicar topes en el valor de la probabilidad de ocurrencia de ciertos eventos para cualquier tipo de variable aleatoria. La inecuaci´on de Chevyschev permite conocer un l´ımite al valor que puede tener la probabilidad de un cierto tipo de evento independientemente de la forma de su funci´ on de densidad de probabilidades. Definici´ on: Sea una variable aleatoria X de la cual s´olo conocemos su valor esperado E (X ) y su varianza V (X ). Sea un evento del tipo X E (X ) kσX , entonces la probabilidad de ocurrencia de este evento tiene un valor m´ınimo que es una funci´ on del valor real positivo k y no depende de la forma de la funci´ on de densidad de probabilidades de X. 1 P X E (X ) kσX 1 (6.19) k2 Notas:
−
−
≤
≤
−
El valor m´ınimo de la probabilidad del evento mencionado se calcula utilizando el lado derecho de la Ecuaci´on anterior. La expresi´on anterior se conoce como la inecuaci´on de Chevyschev.
6.7.
Problemas de final de cap´ıtulo
A continuaci´on una serie de problemas de repaso y estudio para fijar los conceptos anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas, as´ı como tambi´ en cualquier herramienta computacional o tecnol´ ogica disponible. 1. Se lanza al aire una moneda tres ve ces. Calcula la funci´on de masa y la de distribuci´on de X : No de cruces obtenido. 2. Se ha comprobado experimentalmente que la vida ´util de una bater´ıa es una variable aleatoria cuya funci´on de densidad es: f (x) = be −ax ,
si x
≥ 0, con a, b ≥ 0.
(6.20)
Determina la relaci´on entre a y b. Obt´ en la funci´ on de distribuci´on de la variable y calcula la probabilidad de que una bater´ ıa dure un tiempo mayor a 1/a. Sol. P=0,3678 3. Un PEQ consta de 10 pregunt as tipo test, cada una de ellas con 4 posibles respuestas. Cada pregunta contestada correctamente es un punto. Cada fallo descuenta 0,5 puntos. Como ser´a la calificaci´on del alumno si ´este contesta a todas al azar.
110
6.7. Problemas de final de cap´ıtulo 4. Por experiencia se sabe que la probabilidad de que llames al ambulator io y no comunique es de 0,25. Demuestra matem´aticamente que el n´umero esperado de llamadas que debes hacer para que te cojan es de 4. 5. Una variable aleatoria tiene por funci´on de densidad: f (x) =
1 2 (x + 1), 12
si 0
≤ x ≤ 3.
(6.21)
Calcular la media de X y su varianza. Sol. µ = 2,0625, σ 2 = 0,5461. 6. Los retrasos en las entregas de los pedidos en una f´abrica respecto de la planificaci´on establecida siguen una variable aleatoria cuya funci´on de densidad es: f (x) =
2 1 , π 1 + x2
si
−1 ≤ x ≤ 1.
(6.22)
Cu´ al es el retraso medio de un pedido y la desviaci´ on t´ıpica. Propone un intervalo de tiempos de retraso, cen trado en el retraso medio , para el 90 % de los casos. Sol. µ = 0, σ 2 = 2,28, (-0,84; 0,84) 7. Una f´abrica de coches vende de media, al a˜no, 50 unidades de su modelo m´ as caro, con una desviaci´on t´ıpica de 10. Cu´ antos coches de este modelo debe de tener disponibles si se quiere garantizar la demanda al momento de estos veh´ıculos, con una probabilidad del 95 %? Sol. 95 coches
111
7. Distribuciones de Probabilidad Binom ial y Normal If we betake ourselves to the statistical method, we do so confessing that we are unable to follow the details of each individual case, and expecting that the effects of widespread causes, though very different in each individual, will produce an average result on the whole nation, from a study of which we may estimate the character and propensities of an imaginary being called the Mean Man. - James Clerk Maxwell . ’Does the Progress of Physical Science tend to give any advantage to the opinion of necessity (or determinism) over that of the continuency of Events and the Freedom of the Will?’ In P. M. Hannan (ed.), The Scientific Letters and Papers of James Clerk Maxwell (1995), Vol. 2, 1862-1873, 818.
7.1.
Introducci´ on
Estudiaremos en este tema dos de las distribuciones de probabilidad m´ as importantes y que son imprescindibles a la hora de adentrarnos en el estudio de la inferencia estad´ıstica. La distribuci´on binomial es uno de los primeros ejemplos de las llamadas distribuciones discretas (que s´olo pueden tomar un n´umero finito, o infinito numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705), qui´ en escribi´ o el primer tratado importante sobre probabilidad, Ars conjectandi (El arte de pronosticar). Los Bernoulli formar on una de las sagas de matem´ aticos m´as importantes de la historia. La distribuci´on normal es un ejemplo de las distribuciones continuas, y aparece en multitud de fen´omenos sociales y cient´ıficos. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de los m´as famosos matem´aticos de la historia. La gr´afica de la distribuci´on normal en forma de campana se denomina Campana de Gauss.
7.2.
La distribuci´on binomial o de Bernoulli
La distribuci´on binomial est´a asociada a experimentos del siguiente tipo: Realizamos n veces cierto experimento en el que consideramos s´ olo la posibilidad de ´exito o fracaso. La obtenci´on de ´exito o fracaso en cada ocasi´on es independiente de la obtenci´on de ´exito o fracaso en las dem´ as ocasiones.
113
7. Distribuciones de Probabilida d Binomial y Normal La probabilidad de obtener ´exito o fracaso siempre es la misma en cada ocasi´on. Ve´amoslo con un ejemplo. Tiramos un dado 7 veces y contamos el n´ umero de cincos que obtenemos. ¿Cu´al es la probabilidad de obtener tres cincos?. Este es un t´ıpico ejemplo de distribuci´ on binomial, pues estamos repitiendo 7 veces el experimento de lanzar un dado. ¿Cu´al es nuestro ´exito?. Evidentemente, sacar un 5, que es en lo que nos fijamos. fracaso, ser´a 5, sino sacar cualquier otro n´umero. ´exito 1 = El E= sacarpor untanto, 5 p(E ) no = sacar p(F )Por = 56tanto, . 6 , Fracaso = F = no sacar un 5
{
}→
{
}→
Para calcular la probabilidad que nos piden, fij´emonos en que nos dicen que sacamos 3 cincos y por lo tanto tenemos 3 ´exitos y 4 fracasos, ¿de cu´antas maneras pueden darse estas posibilidade s?. Podr´ıamos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir: EEEFFFF. Pero tambi´ en podr´ıamos sacar EFEFFFE, es decir que en realidad estamos calculando de cu´ antas maneras se pueden ordenar 4 fracasos y 3 ´exitos. Recordando las t´ecnicas combinatorias, este problema se reduce a calcular las permutaciones con elementos repetidos: P73,4 = Y por tanto, como p(E ) =
1 6
· · · ·
7! 7 6 5 = =35formas 3!4! 3 2 1
y tengo 3 ´exitos y p(F ) =
p(tener 3 ´exitos y 4 fracasos) = 35
(7.1) 5 6
y tengo 4 fracasos:
· 16 · 16 · 16 · 56 · 56 · 56 · 56 = 0,0781
(7.2)
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad de ´exito 16 , la probabilidad de obtener 3 ´exitos es 0.0781, y lo expresar´ıamos:
Bin 7;
1 , entonces p(x = 3) = 0 ,0781 6
(7.3)
Como repetir este proceso ser´ıa bastante penoso en la mayor´ıa de los casos, lo mejor es recurrir a la siguiente f´ormula que expresa la probabilidad de obtener cierto n´ umero de ´exitos en una distribuci´ on binomial.
7.2.1.
Definici´ on de distribuci´on binomial
Si realizamos n veces un experimento en el que p odemos obtener ´exito, E, con probabilidad p y fracaso, F, con probabilidad q (q = 1 p), diremos que estamos ante una distribuci´ on binomial de par´ametros n y p, y lo representaremos por Bin(n; p). En este caso la probabilidad de obtener k e´xitos viene dada por:
−
p(x = k) =
114
n − k pk q(n k) =
n k pk (1
− p)(n−k)
(7.4)
7.2. La distribuci´on binomial o de Bernoulli
−
Observar que las probabilidades de ´exito y fracaso son complementarias, es decir, q = 1 p y p = 1 q , por lo que basta saber una de ellas para calcular la otra.
−
·
Ejemplo 7.1 Antes ten´ ıamos Bin 7; 16 , y quer´ ıamos calcular p(X = 3) (obtener 3 ´exitos). Aplicando la f´ormula: 7 3
p(x = 3) =
13 5 4 = 0,0781. 6 6
·
(7.5)
Ejemplo 7.2 Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. En este caso Exito = E = tener hijo y p(E ) = 0,5. Fracaso = F = tener hija y p(F ) = 0,5. Estamos por tanto ante una binomial Bin(6;0 ,5) y nos piden p(X = 2). Si aplicamos la f´ ormula es: 6 p(x = 2) = 0,52 0,54 = 0,2344. (7.6) 2
·
·
La elecci´on de ´exito o fracaso es subjetiva y queda a elecci´on de la persona que resuelve el problema, pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo anterior, si: Exito = tener hija , como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos, si el ´exito es tener hija hemos de plantearnos cu´ al es la probabilidad de tener 4 ´exitos (4 hijas), es decir: p(x = 4) =
6
0,54 0,52 = 0,2344.
(7.7) 4 Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el ´exito y el fracaso y la pregunta que nos hagan.
·
7.2.2.
·
El uso de la s tablas de la di stribuci´on binomial
La distribuci´on binomial se encuentra tabulada por lo que es f´acil calcular probabilidades sin necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribuci´on binomial es necesario conocer: El n´umero de veces que se realiza el experimento (n). La probabilidad de ´exito (p). El n´umero de ´exitos (k). La probabilidad p se busca en la primera fila (valores desde 0.01 hasta 0.5). El n´umero de veces que se realiza el experimento, en la primera columna (valores desde 2 a 10) y el n´umero de ´exitos a su lado.
115
7. Distribuciones de Probabilida d Binomial y Normal Ejemplo 7.3 Por ejemplo en el caso anterior, Bin(6;0 ,5) , p(X = 2), la columna p = 0,5 es la ´ultima, y cuando n = 6 y k = 2 encontramos 0.2344, el valor que hab´ıamos calculado. El caso en que p > 0,5, no se encuentra tabulado. La raz´on es bien sencilla. Si p > 0,5, entonces q < 0,5 y basta intercambiar los papeles de ´exito y fracaso para que podamos utilizar la tabla. Ejemplo 7.4 La probabilidad de que un alumno de 2do de Bachillerato apruebe las Ma-
tem´ aticas es de 0.7. Si consideramos un grupo de 8 alumnos, ¿cu´ al es la probabilidad de que cinco de ellos aprueben las Matem´aticas?. Si ´exito = aprobar y fracaso = suspender, entonces p = 0,7 y q = 0,3. Tenemos, por tanto, una Bin(8;0 ,7). Nos piden calcular p(X = 5), que no se puede calcular mediante las tablas porque p = 0,7 y s´ olo tenemos hasta p = 0,5. Por tanto si intercambiamos ´exito = suspender y fracaso = aprobar entonces p = 0,3, q = 0,7, es decir la nueva binomial es Bin(8;0 ,3) y nos piden que aprueben 5 de 8, es decir que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 ´exitos, p(X = 3), y buscando en la tabla es p(X = 3) = 0 ,2541. Tambi´ en, desde luego podr´ıamos haber utilizado la f´ormula desde el principio, utilizar la Bin(8;0 ,7) y olvidarnos de tablas para hacer: p(x = 5) =
7.2.3.
· 8 5
0,75 0,33 = 0,254.
·
(7.8)
Probabilidades acumuladas
Es posible que nos pidan no s´ olo la probabilidad de que ocurran un cierto n´ umero de ´exitos en concreto, sino que ocurran como mucho k e´xitos o preguntas similares. En el ejemplo anterior, por ejemplo, podr´ıan pedirnos: a) ¿Cu´al es la probabilidad de que aprueben como mucho 2 alumnos?. Si ´exito = aprobar y fracaso = suspender, p = 0,7 y q = 0,3, entonces nos piden p(X 2). En este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que aprueben 2, 1 o ninguno, es decir:
≤
p(X
≤ 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0 ,0001 + 0,0012 + 0,01 = 0 ,1013
(7.9)
(haz las cuentas). b) ¿Cu´al es la probabilidad de que aprueben entr e 3 y 6 alumnos (inclusive)?. Del mismo modo: p(3
≤ X ≤ 6)
= p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) = 0,0467 + 0,1361 + 0,2541 + 0,2965 = 0,7334
Hemos de tener en cuenta que para la distribuci´ on binomial, en las tablas s´ olo se admiten valores hasta n = 10 (10 repeticiones del experimento). Para valores de n > 10, inevitablemente hemos de utilizar la f´ormula.
116
7.3. La distribuci´on Normal Ejemplo 7.5 Los alumnos de cierta clase se encuentran en una proporci´ on del 67% que estudian ingl´ es y el resto franc´ es. Tomamos una muestra de 15 alumnos de la clase, calcular: a) Probabilidad de que al menos encontremos tres alumnos de ingl´ es. b) Probabilidad de que los 15 alumnos estudien ingl´ es. c) Probabilidad de que estudien ingl´ es entre 7 y 10 alumnos. Si ´exito = estudiar ingl´ es, p = 0,67 y fracaso = estudiar franc´ es, q = 1 0,67 = 0 ,33. Manejamos por tanto una Bin(15;0 ,67). Para la parte a), se tendr´a
−
p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + ... + p(X = 15).
(7.10)
Una opci´ on es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la f´ormula para calcular cada una, la tarea se puede hacer bastante larga. Otra opci´ on, m´as sencilla, es pasar al complementario. El complementario de encontrar al menos 3 alumnos de ingl´ es es encontrar como mucho 2 alumnos de ingl´ es, p(X 2) . Es decir,
≤
− p(X < 3) = 1 − p(X ≤ 2) = 1 − (p(X = 0 ) + p(X = 1 ) + p(X = 2)) (7.11) y s´ olo tenemos que calcular 3 probabilidades: p(X = 0) ∼ 0 , p(X = 1) = 0 ,000001, p(X > 3) = 1
p(X = 2) = 0 ,000026 (compru´ ebalo!). Por lo cual, p(X > 3) = 1
− (0 + 0,000001 + 0,000026) = 1 − 0,000027 = 0 ,999973
(7.12)
Para la parte b), se tendr´a p(X = 15) = 0 ,0025
(7.13)
(aplica la f´ormula). Para la parte c), se tendr´a p(7
7.2.4.
≤ X ≤ 10)
=
p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10) =
= 0,0549 + 0,1114 + 0,1759 + 0,2142 = 0,5564.
Media y desviaci´on t´ıpica en una distribuci´ on binomial
Aunque no se demostrar´a, en una distribuci´on binomial Bin(n; p), el n´umero esperado de ´exitos o media, viene dado por ¯x = np. (Recordemos que la media es una medida de centralizaci´ on). La desviaci´on t´ıpica, σ , que es una medida de dispersi´ on y mide lo alejados que est´ an los datos de la media, viene dada por σ = npq.
√
7.3.
La distribuci´on Normal
Al estudiar aspectos tan cotidianos como: Caracteres morfol´ogicos de individuos ( personas, animales, plantas) de una misma raza. como tallas, pesos, envergaduras, etc.
117
7. Distribuciones de Probabilida d Binomial y Normal Caracteres fisiol´ogicos, como el efecto de una misma dosis de un f´ armaco, o de una misma cantidad de abono. Caracteres sociol´ogicos, como el consumo de ciertos productos por individuos de un mismo grupo humano. Caracteres psicol´ogicos, como el cociente intelectual, grado de adaptaci´on a un medio. Caracteres f´ısicos, como la resistencia a la rotura de ciertas piezas. todos ellos tienen en com´un que se distribuyen normalmente. ¿Qu´ e quiere decir esta expresi´on?. Pues, por ejemplo, si hacemos una estad´ıstica para conocer la altura de 1400 mujeres y representamos los resultados en un diagrama de barras, obtenemos:
Figura 7.1.: Distribuci´on de estaturas de 1400 mujeres.
Las gr´aficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino hasta llegar a la parte central del recorrido, donde est´ a la mayor´ ıa de ellos. Definici´ on: Diremos que una distribuci´on de probabilidad sigue una distribuci´on normal de media ¯x y desviaci´on t´ıpica σ, y lo representaremos por N (¯x; σ) cuando la representaci´on gr´afica de su funci´on de densidad es una curva positiva continua, sim´etrica respecto a la media, de m´aximo en la media, y que tiene 2 puntos de inflexi´ on , situados a ambos lados de la media (¯x σ y x¯ + σ respectivamente) y a distancia de σ ella, es decir de la forma: Dependiendo de los valores que tomen ¯x y σ, la gr´afica de esta funci´on puede ser m´as o menos alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condiciones de simetr´ıa, continuidad, etc, rese˜ nadas anteriormente. El concepto de funci´on de densidad introducido anteriormente no se estudiar´ a con profundidad. Baste decir que la funci´on de densidad determina la forma de cada distribuci´ on de probabilidad. En el caso de la distribuci´on normal de par´ametros ¯x y σ, dicha funci´on viene dada por: x)2 (x−¯ 1 f (x) = 2πσ 2 e− 2σ 2 (7.14)
−
√
118
7.3. La distribuci´on Normal
1
Figura 7.2.: Distribuci´on normal N (¯x; σ). El m´aximo est´a en (¯x, √2πσ 2 ).
Propiedad: El ´area encerrada bajo la curva normal N (¯x; σ) siempre es 1. La demostraci´on de este resultado no es nada sencilla e implica el uso de resultados matem´aticos que exceden el nivel de este curso. De entre todas las curvas normales N (¯x; σ), la m´as sencilla, usada y conocida es aquella que tiene por media 0 y por desviaci´on t´ıpica 1, N (0, 1). Esta normal est´andar se suele representar por Z . La gr´afica de esta curva se denomina campana de Gauss y se puede observar en la figura:
Figura 7.3.: Distribuci´on normal N (0; 1). El m´aximo est´a en (0 , √12π ). Su funci´on de densidad ser´a: f (x) =
√12π e−
x2
(7.15)
2
Puesto que el ´area bajo esta curva normal es 1, podemos definir una probabilidad de la siguiente manera: Para un valor cualquiera k, definimos la probabilidad de que la distribuci´on Z , N (0; 1), sea meno r o igual que k como: p(Z
≤ k) = Area encerrada bajo la curva normal
N (0, 1) desde
−∞ hasta k
(7.16)
(es decir la parte rayada de la figura siguiente). Ahora bien, ¿c´omo calcular dicha ´area?. F´acil: Dichas ´areas o probabilidades se encuentran tabuladas.
119
7. Distribuciones de Probabilida d Binomial y Normal
Figura 7.4.: Area encerrada por la curva normal desde
7.3.1.
Uso de las t ablas de l a distribuci´on normal
−∞ hasta k.
N (0;1)
La normal N (0; 1) se encuentra tabulada, para valores a partir de 0 y hasta 3.99. Si p or ejemplo queremos calcular p(Z 2,78), hemos de realizar los pasos:
≤
Buscar la parte entera y las d´ecimas en la primera columna (en este caso 2.7). Buscar las cent´ esimas en la primera fila (en este caso 8). En el punto com´un a la fila y la columna que hemos encontrado, tenemos la probabilidad buscada, en este caso 0.9973. Por tanto p(Z 2,78) = 0,9973.
≤
Si queremos calcular una probabilidad de un valor mayor que 3.99, basta fijarse en que las probabilidades correspondientes a valores tales como 3.62 y mayores ya valen 0.9999 (pr´ acticamente 1). Por eso, para estos valores mayores que 3.99, diremos que la probabilidad es aproximadamente 1. As´ı: p(Z 5,62) 1 aunque no aparezca en la tabla. Por otra parte, fij´emonos en que en este tipo de distribuciones no tiene sentido plantearse probabilidades del tipo p(Z = k), ya que siempre valen 0, al no encerrar ning´ un ´area. Por tanto, si nos pidiesen p(Z = 3,2), basta decir que p(Z = 3,2) = 0. Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es 0 se denominan distribuciones continuas, para diferenciarlas de otras en las que esto no ocurre, como por ejemplo la binomial, que es una distribuci´ on discreta. As´ı, al pasar al complementario, si tenemos Z > k, su complementario ser´a Z < k, pero como incluir k no influye en la probabilidad, al calcular probabilidades podemos escribir:
≤
p(Z > k) = 1
∼
− p(Z < k) = 1 − p(Z ≤ k)
(7.17)
S´olo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no se puede hacer y hay que ser cuidadosos con el paso al complementario. Ejemplo 7.6 Buscar en la tabla de la normal est´andar N (0;1) las probabilidades: a) p(Z 1,15), b) p(Z 0,5), c) p(Z 0,82), d) p(Z 1,05), e) p(Z 4,27), f ) p(Z 18,09).
≤≤
120
≤
≤
≤
≤
7.3. La distribuci´on Normal
7.3.2.
C´ alculo de otras probabilidades
Si k es positivo y queremos calcular p(Z > k), es decir el ´area rayada: basta pasar
Figura 7.5.: p(Z > k). Basta pasar al complementario.
al complementario, es decir: p(Z > k) = 1 encuentra tabulada.
− p(Z ≤ k) y esta ´ultima probabilidad ya se
Ejemplo 7.7 Calcular p(Z > 0,3) y p(Z > 2,07).
≤−
Si k es positivo y queremos calcular p(Z k), es decir el ´area: por simetr´ ıa, p(Z k) = p(Z > k) y ´esta se calcula como en el caso anterior. Se puede observar la
≤−
Figura 7.6.: p(Z
≤ −k). Las probabilidades de valores negativos no est´ an tabuladas.
igualdad de ´areas en la figura:
≤ −0,78) y p(Z ≤ −3,2). Si k es positivo y queremos calcular p(Z > −k), es decir el ´area rayada: entonces, por simetr´ıa p(Z > −k) = p(Z ≤ k): Ejemplo 7.8 Calcular p(Z
Ejemplo 7.9 Calcular p(Z >
−0,96) y p(Z > −1,01). 121
7. Distribuciones de Probabilida d Binomial y Normal
Figura 7.7.: p(Z
≤ −k) = p(Z > k). La simetr´ıa permite reducir este caso al anterior.
Figura 7.8.: p(Z >
−
Figura 7.9.: p(Z > k) = p(Z est´a tabulado.
Figura 7.10.: p(k1
−k).
≤ k). La simetr´ıa permite reducir
≤ Z ≤ k2). Probabilidad comprendida entre dos valores.
Probabilidades comprendidas entre dos valores, p(k1 rayada: se calcula restando las ´areas:
122
este caso al que ya
Z
≤ ≤
k 2 ) ,es decir el ´area
7.3. La distribuci´on Normal
≤
Figura 7.11.: p(Z k 2 ) en la primera imagen. p(Z mos el ´area pedida.
≤ k1) en la segunda. Al restar obtene-
−
≤ Z ≤ 1,49) y p(−1,32 ≤ Z ≤ −0,57). Ejemplo 7.11 Calcular p(Z = 2), p(Z ≤ 2) , p(Z > 2) , p(Z ≤ −2), p(Z > −2), p(−2 ≤ Z ≤ 2) , p(0,81 ≤ Z ≤ 1,33). Ejemplo 7.10 Calcular p( 0,96
7.3.3.
C´ alculo de probabilidades en normales
N (¯ x; σ )
Si no tenemos una distribuci´on N (0;1), sino una N (¯x; σ) cualquiera, ¿¿c´omo calcular probabilidades, si no tenemos tabla salvo para N (0; 1)?. El siguiente resultado nos da la respuesta. Propiedad: Si X sigue una distribuci´on N (¯x; σ), entonces la variable Z = Xσ−x¯ sigue unapaso distribuci´ n N (0, 1).X (El de la ovariable variable X ).
→ N (¯x; σ) a la
Z
→ N (0; 1) se denomina tipificaci´on de la
Ejemplo 7.12 Las estaturas de 600 soldados se distribuyen de acuerdo a una distribuci´on normal de media 168 y desviaci´on t´ıpica 8 cm. ¿Cu´ antos soldados miden entre 166 y 170 cm?. Sea X la distribuci´on de los soldados , X es una N (168, 8). Nos piden p(166 X 170). Utilizando el resultado anterior, primero restamos x = 168 en la desigualdad: p(166 X 170) = p(166 168 X 168 170 168) = p( 2 X 168 2). Y ahora dividimos entre σ = 8, con lo que acabamos de tipificar: p(166 X 170) = 2 X −168 2 X −168 p( 2 X 168 2) = p = Z , ´esta ya es normal 8 8 8 . Llamando a 8 N (0, 1) y se encuentra en las tablas: p(166 X 170) = p( 0,25 Z 0,25) = p(Z 0,25) p(Z 0,25) = ( tablas) = 0,5987 0,4013 = 0,1974, (pues p(Z 0,25) = p(Z > 0,25) = 1 p(Z 0,25) = 1 0,5987 = 0,4013).
≤
≤
≤ ≤ − ≤ − ≤ − ≤− − ≤
−
− ≤ −
≤ − ≤ ≤ ≤ ≤ −
−
Ejemplo 7.13 En una distribuci´on N (22, 5), calcula: p(X p(15 X 20) , p(17 X 30) .
≤ ≤
≤ ≤
−
− ≤ − ≤ ≤ ≤ ≤ ≤ ≤ ≤−
27) , p(X > 27) , p(X > 125),
≤ 123
7. Distribuciones de Probabilida d Binomial y Normal Ejemplo 7.14 Los pesos de 60 soldados siguen una distribuci´ on N (67, 5). Calcula la probabilidad de que el peso sea: a) mayor de 80 kg, b) 50 kg. o menos, c) menos de 60 kg, d) 70 kg, e) entre 60 y 70 kg inclusive.
7.3.4.
Otro uso de la s ta blas
≤
Hasta ahora nos han dado la distribuci´on normal N (0; 1) y nos ped´ıan p(Z k) siendo k un cierto n´umero, y nos ped´ıan calcular dicha probabilidad. Ahora bien, otra pregunta puede ser: Dado que en una normal N (0; 1) sabemos que p(Z k) = 0,9573, ¿qui´ en es k?. La resoluci´on es bien sencilla. Basta buscar 0.9573 dentro de la tabla de la distribuci´ on normal, y lo encontramos en el cruce de la fila 1.7 con la columna 2, y por lo tanto k debe ser 1.72.
≤
Ejemplo 7.15 Calcular k si: a) p(Z
≤ k) = 0,8078. b) p(Z ≤ k) = 0,0028.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la distribuci´ on normal, pueden ocurrir dos posibilidades: Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproximadamente) de cada uno de ellos, por ejemplo: p(Z k ) = 0,7982. En este caso el valor buscado ser´a la media entre los valores extremos. Si buscamos en la tabla este valor no aparece directamente, sino que se encuentra entre los valores 0.7967 (que corresponde a 0.83) y 0.7996 (que corresponde a 0.84). Por tanto el valor de k ser´a:
≤
0,83+0,84
2 k= = 0,835. Si el valor est´a entre dos valores, pero muy cercano a uno de ellos, directamente tomamos este valor, por ejemplo: p(Z k) = 0,7970. El valor m´as cercano es 0.9767 (que corresponde a 0.83) y como el valor buscado est´ a muy cerca de ´el, entonces directamente k = 0,83.
≤
Si la distribuci´on no es normal N (0; 1), sino N (¯ x; σ), tendremos que tipificar previamente.
≤
Ejemplo 7.16 si X sigue una normal N (6;3) y p(X k) = 0,9082, calcula k . Tik −6 k−6 = 0,9082 p Z = 0,9082 pificando: p X3−6 , y buscando en la tabla, 3 3 k−6 k 6 = 3,99 k = 9,99. 3 = 1,33
→ −
≤
→
→
≤
≤ k) = 0,6141 y X sigue una N (15, 4). Ejemplo 7.18 De una variable normal N (¯x; σ) se sabe que p(X ≤ 7) = 0 ,9772 y p(X ≤ 6,5) = 0 ,8413. Calcular: a) x ¯ y σ . b) p(5,65 X 6,25). c) El n´umero k tal que p(X > k) = 0,3. ≤ ≤ Ejemplo 7.17 Calcular k si p(X
124
7.4. Relaci´on entre la distribuci´on binomial y la distribuci´on normal
7.4.
Relaci´on entre la distribuci´on binomial y la distribuci´on normal
Es un hecho comprobado que cuando tenemos una distribuci´on Bin(n; p), a medida que n crece, es dif´ıcil hacer uso de las f´ormulas y/o tablas. Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y 33 cincos (inclusive). 1 Si ´exitouna = obtener cinco entonces p = 1/6 y fracaso = no y las q tablas = 5/6. Tenemos Bin 100; X 33). Esobtener inviablecinco aplicar 6 , y nos piden p(20 (pues repetimos el experimento 100 veces) y tampoco la f´ ormula pues es inviable calcular, por ejemplo, 100 1 3 5 6 p(X = 32) = 2 8 (7.18) 32 6 6
≤
≤
· ·
¿C´omo resolver el problema?. Del siguiente modo.
7.4.1.
Teorema del L´ımite Central
La distribuci´on binomial Bin(n; p) se aproxima a una curva normal de media ¯x = np y desviaci´ on t´ıpica σ = npq, cuando n tiende a , es decir, cuando n se hace muy grande. La aproximaci´on se puede aplicar (es una buena aproximaci´ on) s´olo si n es grande, en concreto n > 30 y adem´as np > 5 y nq > 5. Si no se cumplen estas condiciones NO podemos aproximar la binomial que tengamos por una distribuci´ on normal. En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de una variable discreta (binomial) a una continua (normal), y por tanto son distribuciones diferentes. El precio que hay que pagar por pasar de una a otra se denomina correcci´ on por continuidad y consiste en hacer determinados ajustes para que la aproximaci´ on realizada sea lo m´as precisa posible. As´ı, si nos piden p(X = k) en una distribuci´on binomial X , y aproximamos X por una distribuci´ on normal, y, no podemos calcular directamente p(Y=k) porque, como ya se ha comentado anteriormente, en una distribuci´on continua todas estas probabilidades valen 0. La correcci´on por continuidad consiste en tomar un peque˜ no intervalo de longitud 1 alrededor del punto k. De otro modo, si nos piden p(X = k) con X binomial, con la aproximaci´on normal Y deberemos calcular p(k 0,5 Y k + 0,5). Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial. Algunos ejemplos. Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y k 0,5). La explicaci´on de que haya que restar 0.5 y no sumarlo es que queremos que X sea menor estrictamente que k, con lo cu´al, si sumase 0.5 , el propio k aparecer´ıa en la probabilidad a calcular y NO debe aparecer.
√
∞
−
−
≤ ≤
≤
125
7. Distribuciones de Probabilida d Binomial y Normal
≤
Por contra, si debi´ esemos calcular p(X k), con X binomial, fij´ emonos que ahora k SI est´a incluido en la probabilidad y por tanto al aproximar por la normal Y deber´ ıamos calcular p(Y k + 0,5). Comprender estos dos hechos es fundamental para realizar bien la correcci´ on por continuidad al aproximar una distribuci´on binomial por una normal.
≤
√
Ejemplo 7.19 En el caso anterior, x ¯ = np = 100 npq = 500 6 = 16,67 y σ = 36 = 3,73. De modo que, como n > 30, np = 16,67 > 5 y nq = 83,33 > 5, se pude aproximar la binomial por la normal, es decir: X
→ Bin
∼ 100;
1 6
Y
→ N (16,67;3 ,73)
(7.19)
−16,67 Y −16,67 33,5−16,67 = 33+0,5) = p 19,53,73 Entonces: p(20 X 33) ∗ p(20 0,5 Y 3,73 3,73 p(0,89 Z 4,51) = p(Z 4,51) p(Z 0,89) 1 0,8133 = 0 ,1867. Notemos que en el paso se˜nalado por (*) hemos cambiado X (binomial) por Y (normal) y se ha realizado la correcci´ on por continuidad.
≤ ≤
126
≤ ≤
≤
∼
− ≤ ≤ − ≤ ∼ −
≤
≤
8. Estimaci´ on puntual e intervalos de confianza. Inferencia estad´ıstica. To call in the statistician after the experiment is done may be no more than asking him to perform a postmortem examination: he may be able to say what the experiment died of. - Sir Ronald Aylmer Fisher . Indian Statistical congress, Sankhya, c.1938.
8.1.
Introducci´ on
La raz´on por la que llevamos a cabo una investigaci´ on estad´ıstica es para obtener una comprensi´ on de los fen´omenos en una poblaci´on de estudio. Por ejemplo, si uno quisiera tratar de averiguar si un cierto tratamiento basado en una cierta medicina es eficaz en el tratamiento de una cierta enfermedad, uno deber´ıa levar a cabo un experimento para saber esto. Sn embargo, dos cosas pasan. En primer lugar no es ´etico distribuir a una poblaci´on el medicamento sin tener conclusiones acerca de su funcionamiento y consecuencias. Esto no es parte de la estad´ıstica, aqu´ı no nos preocupamos p or eso. En segundo lugar no es factible distribuir un f´armaco experimental para toda la poblaci´ on, la cual pudiera ser mucha cantidad. En lugar de ´esto, uno pudiera estudiar un peque˜no subconjunto de la poblaci´on la cual sabemos se llama muestra. A continuaci´ on, se analiza la muestra y se tratan de hacer inferencias acerca de la poblaci´ on bas´andose en la muestra. Usando la teor´ıa de la probabilidad y el l´ımite central Teorema, se puede entonces medir la fiabilidad de la inferencia. Esto puede no ser siempre una tarea f´acil. A menudo se encuentra bastante complicado. Sin embargo, tenemos m´etodos que nos aseguran buenas inferencias. Ve´ amos como se hace esto. Ejemplo 8.1 Lupe est´a tratando de vender su casa y tiene que determinar el valor de mercado de la vivienda. la poblaci´on en este ejemplo ser´ıa todos los hogares que son similares a la suya en el barrio.El agente de bienes ra´ıces de Lupe elige para la muestra las ultimas ´ nueve casas en ese barrio que se venden en los ´ ultimos seis meses. El agente de bienes ra´ıces a continuaci´ on, ajusta algunos de los precios de venta para dar cuenta de las diferencias entre la casa de Lupe y las casas otras vendidas. Imagine que la muestra de las ´ ultimas 9 casas vendidas determinan los precios en miles de Bs.F, Muestra=420, 430, 430, 440, 450, 460, 470, 470, 480. A continuaci´ on, el agente de bienes ra´ıces toma la media de la muestra ajustada y recomienda a Lupe un valor de mercado de su casa de Bs.F. 450.000. La inmobiliaria ha hecho una inferencia sobre el
127
8. Estimaci´on puntual e intervalos de confianza. Inferencia estad´ıstica.
valor de la media de la poblaci´ on. Para medir la fiabilidad de la inferencia, el agente de bienes ra´ıces debe tener en cuenta factores como: el tama˜ no de la muestra pudiera ser muy peque˜ no, las casas puede haber cambiado su valor en los ´ ultimos seis meses, o que la casa de Lupe no es exactamente igual la muestra hogares. En lo que sigue vamos a empezar a definir y establecer la metodolog´ıa para probar fiabilidades de este tipo.
8.2.
Estimaci´ on puntual
El ejemplo anterior es un ejemplo de estimaci´on, una rama de la estad´ıstica inferencial donde las estad´ısticas de la muestra se utilizan para estimar los valores de un par´ametro de la poblaci´on. El agente de bienes ra´ıces de Lupe estaba tratando de estimar la media de la poblaci´on (µ), basado en la media de la muestra (¯ x). De ahora en adelante es necesario hacer una distinci´ on entre estimadores y par´ametros. LLamaremos estimadores a las medidas que corresponden a la descripci´ on de la muestra, miestras que llamaremos par´ametros de la descripci´on de la poblaci´on.
Media Varianza Desv. est´andar Proporci´on
Estad´ısticos (Muestra) ¯x s2 s pˆ
Par´ ametros (Poblaci´ on) µ σ2 σ p
Cuadro 8.1.: Definici´on de estadisticos y par´ametros. En el ejemplo anterior, el agente inmobiliario de Lupe calcula la media poblacional de las casas similares en el barrio de Lupe mediante el uso de la media muestral de Bs.F. 450.000 el precio ajustado de los hogares incluidos en la muestra.
8.2.1.
Intervalo de Estimaci´on
Una estimaci´on puntual es nuestra mejor estimaci´on de un par´ametro de la poblaci´on, sin embargo, probablemente no es exactamente igual al par´ ametro. En su lugar, podemos elegir un rango de valores que se denomina, intervalo de estimaci´ on, que es probable que incluya el valor del par´ametro de la poblaci´on. Si el intervalo de estimaci´on es sim´etrico, la distancia entre el estimador puntual a los puntos finales del intervalo de estimaci´on, se llama el margen de error. Ejemplo 8.2 En el ejemplo anterior, el agente inmobiliar io de Lupe podr´ıa decir que la media de la poblaci´ on real esta entre Bs.F. 425.000 y Bs.F. 475.000, lo que permite
128
8.3. Intervalos de confianza
un margen de Bs.F. 25.000 de error de la estimaci´ on srcinal de Bs. F. 450.000. Este intervalo de estimaci´on tambi´ en puede ser escrito tambi´ en como Bs.F. 450.000 25.000.
±
8.3.
Intervalos de confianza
Con probabilidad y el teorema del l´ımite central, podemos dise˜nar un intervalo de estimaci´on que podemos llamar intervalo de confianza que tiene una probabilidad conocida (nivel de confianza) de capturar el par´ametro real de la poblaci´on.
8.3.1.
Intervalo de confianza para la media poblacional
Para encontrar un intervalo de confianza para la media poblacional ( µ) cuando la desviaci´on est´andar de la poblaci´on (σ) es conocida, y n es suficientemente grande, podemos usar la funci´on de distribuci´on de probabilidad normal est´andar para calcular los valores cr´ıticos para el Nivel de Confianza:
Figura 8.1.: Nivel de confianza para la media poblacional.
Intervalo de confianza = ¯x
± Zc · √σn ,
(8.1)
donde ¯x es la media de la muestra y Zc es el valor cr´ıtico en la distribuci´on normal. Se tendr´ a revisando una tabla de la distribuci´on normal que: Ejemplo 8.3 El Decano de la Facultad quiere estimar el n´umero medio de horas trabajadas por semana por los estudiantes. La muestra de 49 estudiantes mostr´o una media de 24 horas con una desviaci´on est´andar de 4 horas. El punto estimaci´on es de 24 horas (media de la
129
8. Estimaci´on puntual e intervalos de confianza. Inferencia estad´ıstica. c: nivel de confianza 0.90 0.95 0.99
Zc : valor cr´ ıtico 1.645 1.960 2.578
Cuadro 8.2.: Valores cr´ıticos para distintos niveles de confianza.
muestra). ¿Cu´ al es el intervalo de confianza del 95% para el n´ umero promedio de horas trabajadas a la semana por los estudiantes? 24
√49· 4 = 24 ± 1,12 = [22,88;25 ,12]horas por semana. ± (1,96)
(8.2)
El margen de error para el intervalo de confianza es de 1.12 horas. Podemos decir con confianza del 95 % que el n´umero de horas trabajadas por los estudiantes es de entre 22.88 y 25.12 horas a la semana. Si el nivel de confianza es mayor, entonces el margen de error tambi´en se incrementar´ a. Por ejemplo, si se aument ar el nivel de confianza de 99 % para el ejemplo anteri or, entonces: (2,578) 4 24 = 24 1,47 = [22,53;25 ,47]horas por semana. (8.3) 49
± √ ·
±
Algunos puntos importantes acerca de los intervalos de confianza El intervalo de confianza se construye con variables aleatorias calculado a partir de datos de la muestra y los intentos de predecir un par´ ametro desconocido de la poblaci´on fija con un determinado nivel de confianza. Aumentar el nivel de confianza siempre aumentar´a el margen de error. Es imposible constr uir un intervalo de confianza del 100 % sin hacer un censo de toda la poblaci´on. Piense en la media de la poblaci´ on como un dardo que siempre va al mismo lugar, y el intervalo de confianza como un blanco en movimiento que trata de atrapar el dardo. Un intervalo de confianza del 95 % ser´ıa como un ob jetivo que tiene un 95 % de posibilidades de agarrar el dardo.
8.3.2.
Intervalo de con fianza para la media pobl acional usando la desvia ci´on est´ andar de la muestra. Distribuci´ on t de Student
La f´ormula para el intervalo de confianza para la media requiere el conocimiento de la desviaci´ on est´andar de la poblaci´on (σ). En la mayor´ıa de los problemas de la vida real,
130
8.3. Intervalos de confianza no conoce este valor por las mismas razones por las que no se conoce la media poblacional. Este problema fue resuelto por el estad´ıstico irland´es William Sealy Gosset, un empleado de elaboraci´on de la cerveza Guiness. Gosset, sin embargo, fue castigado por Guiness por ´ public´o bajo el el uso de su propio nombre en la publicaci´ on de art´ıculos cient´ ıficos. El nombre de A Student , y por lo tanto la distribuci´on que descubri´o fue llamada distribuci´ on t de Student .
Caracter´ısticas de la distribuci´ on t de Student Es continua, con forma de campana, y sim´etrica alrededor de cero como la distribuci´ on normal. Existe una familia de t-distribuciones que comparten una media de cero pero con diferentes niveles desviaciones est´andares basadas en grados de libertad. La distribuci´ on t de Student est´a m´as dispersa y m´as plana en el centro que la distribuci´on normal, pero se aproxima a la distribuci´on normal cuando el tama˜no de la muestra se hace m´as grande. Su intervalo de confianza para µ es
Figura 8.2.: Distribuci´on t de Student.
Intervalo de confianza = ¯x
± tc · √sn ,
(8.4)
donde ¯x es la media de la muestra y t c es el valor cr´ ıtico en la distribuci´on t de Student y tiene n 1 grados de libertad.
−
131
8. Estimaci´on puntual e intervalos de confianza. Inferencia estad´ıstica. Ejemplo 8.4 El a˜no pasado, un estudiante trabajaba en una Organizaci´ on de No Gubernamental (ONG) que ten´ıa una calificaci´ on de 62 (en una escala de 0-100) en un rating internacional que evalua el desempe˜ no de organizaciones; esto se bas´o en los registros acumulados sobre la ONG durante un largo per´ıodo de tiempo. Este a˜ no el estudiante cambi´o a una nueva ONG. Para evaluar la calificaci´on de la nueva ONG, 20 miembros de la ONG se sondearon y se consigui´o una nueva calificaci´on promedio de 65 con una desviaci´ on est´ andar de 10. Encontrar e interpretar un intervalo de confianza del 95 % para el promedio de la calificaci´on de la nueva ONG. Para este caso, la distribuci´on t de Student tendr´a 20-1 = 19 grados de libertad. Usando una tabla para esta distribuci´on o una calculadora, el valor cr´ıtico para el intervalo de confianza del 95 % ser´a tc = 2, 093, as´ ı 65
√20· 10 = 65 ± 4,68 = [60 ,32;69 ,68]calificaci´on de la ONG . ± (2,093)
(8.5)
Con un 95 % de confianza, podemos decir que la calificaci´on de la nueva ONG es de entre 60,32 y 69,68. As´ı la calificaci´ on de 62 de la anterior ONG est´ a en el intervalo de confianza, por lo cual, no podemos decir con una certeza del 95 % que la nueva ONG sea mejor o peor que la anterior ONG.
8.3.3.
Intervalo de confianza para la proporci´on poblacional
Recordemos de los cap´ıtulos anteriores sobre variables aleatorias de la distribuci´on binomial, donde se representaba a la proporci´on de ´exitos en una poblaci´ on dada. El modelo binomial era an´alogo a la situaci´on de lanzar una moneda con resultados de cara o sello, es decir, una dicotom´ıa en los resultados del muestreo. En la pr´ actica, algunas veces, queremos utilizar las estad´ısticas de la muestra para estimar la proporci´on de la poblaci´on. La proporci´on de la muestra (ˆp) es la proporci´on de ´exitos en una muestra de tama˜ no n, y es un estimador puntual de p, es decir, la proporci´on poblacional. Seg´un el teorema del l´ımite central, si np > 5 y n(1 p) = nq > 5, la distribuci´on de la proporci´on de la muestra
−
tendr´ a una distribuci´on aproximadamente normal. En este caso µpˆ = p y σpˆ = p(1n−p) . Us´ ando esta informaci´on podemos construir un intervalo de confianza para p, la proporci´on de la poblaci´on tiene un intervalo de confianza Intervalo de confianza = ˆp
±Z
p(1
− p) ≈ pˆ ± Z
n
p(1 ˆ
− p)ˆ .
n
(8.6)
Ejemplo 8.5 A 200 conductores de Maracaibo se les muetre´o mientras manejaban por la cuidad al azar y se descubri´o que 25 de estos conductores estuvieron ilegalmente hablando por tel´ efono celular sin el uso de un dispositivo de manos libres. Encuentre el estimador puntual para la proporci´on de conductores que est´an utilizando sus tel´ efonos celulares ilegalmente y construir un intervalo de confianza del 99 %. 25 = 0,125 o 12.5%. El estimador puntual para p es pˆ = 200
132
8.3. Intervalos de confianza
Un intervalo de confian za del 99 % para p es: Intervalo de confianza = 0,125
± 2,576
−
0,125(1 0,125) = 0,125 200
± 0,060.
(8.7)
El margen de error para esta encuesta es del 6 % y se puede decir con un 99 % de confianza que el porcentaje real de los conductores que usan sus tel´ efonos celulares ilegalmente oscila entre 6,5 % y 18,5 %.
8.3.4.
Estimador puntual para la desviaci´on est´ andar de la poblaci´ on
A menudo queremos estudiar la variabilidad, la volatilidad o la consistencia de una poblaci´on. Por ejemplo, digamos que hacemos dos inversiones en la bolsa de valores tal que ambas tiene n ingresos esper ados de 6 % por a˜no, pero una inversi´on es mucho m´as arriesgada que la otra, teniendo mayores altibajos. Para estimar la variaci´on o la volatilidad de un conjunto de datos, vamos a utilizar la desviaci´ on est´andar de la muestra como un estimador puntual de la desviaci´on est´andar de la poblaci´on. Por ejemplo, las inversiones A y B son ambas conocidas por tener una tasa de rendimiento de 6 % al a˜no. En los ´ultimos 24 meses, la inversi´on A tiene desviaci´on est´andar muestral del 3 % por mes, mientras que para la inve rsi´on B, la desviaci´on est´andar muestral es del 5 % mensual. Dir´ıamos que la inversi´ on B es m´as vol´atil y riesgosa que la inversi´on A debido a la mayor estimaci´on de la desviaci´on est´andar. Para crear un intervalo de confianza para la estimaci´ on de la desviaci´on est´andar, tenemos que introducir una nueva distribuci´on, llamada la distribuci´on Chi-cuadrado ( χ2 ).
La distribuci´ on Chi-cuadrado La distribuci´on Chi-cuadrado es una familia de distribuciones relacionadas con la distribuci´ on normal, ya que representa una suma de cuadrados de las variables aleatorias normales independientes. Al igual que la distribuci´ on t de Student, ´esta tiene grados de libertad iguales a n 1 y determinan la forma de la distribuci´on. Adem´as, como el Chicuadrado representa datos al cuadrado, la inferencia ser´a aproximadamente la varianza en lugar de la desviaci´on est´andar. La distribuci´on Chi-cuadrado ( χ2 ) es asim´etrica positiva y adem´ as es no negativa. Se basa en grados de libertad ( n 1) igual como la t de Student.
−
−
8.3.5.
Intervalo de confianza para la varianza y desviaci´on est´ andar de la poblaci´ on
Dado que la distribuci´on Chi-cuadrado representa datos al cuadrado, podemos construir intervalos de confianza para la poblaci´on y sacar la ra´ız cuadrada de la varianza de los extremos para obtener un intervalo de confianza para la desviaci´on est´andar de la poblaci´on. Debido a la asimetr´ıa de la distribuci´ on Chi-cuadrado el intervalo de confianza resultante
133
8. Estimaci´on puntual e intervalos de confianza. Inferencia estad´ıstica.
Figura 8.3.: Distribuci´on Chi-cuadrado.
no estar´a centrada en el estimador puntual, por lo que el margen de error no se entiende como en los casos anteriores.
Intervalo de confianza para la varianza de la poblaci´ on La confianza no es sim´etrica ya que la distribuci´ on Chi-cuadrado no es sim´etrica. Tome la ra´ız cuadrada de ambos extremos para obtene el intervalo de confianza de la desviaci´ on est´andar de la poblaci´on. As´ı se tendra que Intervalo de confianza =
(n
− 1)s2 , (n − 1)s2 χ2R
χ2L
.
(8.8)
Ejemplo 8.6 En la medici´on del rendimiento de las inversiones, la desviaci´ on est´andar es una medida de la volatilidad o el riesgo. Veinte meses de rentabilidades de un fondo de inversi´on muestran un rendimiento medio mensual del 1 % y muestra una desviaci´on est´ andar de 5 %. Encuentre un intervalo de confianza del 95 % para la desviaci´on est´andar mensual de los fondos de inversi´on.
La distribuci´ on Chi-cuadrado tendr´ a 20 1 = 19 grados de libertad. Usando una calculadora, los dos valores cr´ıticos para la Chi-cuadrado son: χ2L = 9,90655 y χ2R = 32,8523,
−
134
8.3. Intervalos de confianza
con lo cual se tendr´a que Intervalo de confianza =
19 52 19 52 , = [3,8; 7,3]. 32,8523 8,90655
·
·
(8.9)
Se puede decir con un 95 % de confianza de que la desvi aci´on est´andar para este fondo de inversi´on es de entr e 3,8 % y 7,3 % por me s.
135
9. Pruebas de hip ´otesis de una poblaci´on What the use of P [the significance level] implies, therefore, is that a hypothesis that may be true may be rejected because it has not predicted observable results that have not occurred. - Sir Harold Jeffreys . Theory of Probability (1939), 316.
9.1.
Introducci´ on
En la secci´on anterior hemos utilizado la inferencia estad´ıstica para hacer una estimaci´on de un par´ametro de la poblaci´on y medir la fiabilidad de la estimaci´ on a trav´ es de un intervalo de confianza. En esta secci´on, vamos a explorar en detalle el uso de la inferencia estad´ıstica en la prueba de una afirmaci´on sobre un par´ametro de la poblaci´on, que es el coraz´ on del m´etodo cient´ıfico utilizado en la investigaci´ on.
9.2.
Procedimientos de comprobaci´on de hip´otesis y el m´ etodo cient´ıfico
La realizaci´on real de una prueba de hip´ otesis es s´olo una peque˜na parte del m´etodo cient´ıfico. Despu´ es de formular una pregunta general, el m´etodo cient´ıfico consiste en: el dise˜ no de un experimento, la recogida de datos a trav´es de la observaci´on y la experimentaci´ on, la comprobaci´on de hip´otesis y elaboraci´on de informes de la de conclusiones generales. Las conclusiones se llevan a otras ideas de investigaci´on haciendo de este proceso de un flujo continuo de incorpora al acervo de conocimientos sobre los fen´ omenos que se estudian. Otros pueden elegir un conjunto m´ as formal y detallado de los procedimientos, pero los conceptos generales de la inspiraci´ on, dise˜no, experimentaci´on y conclusi´on permiten ver todo el proceso. Las preguntas m´as generales comenzar con una inspiraci´on o una idea sobre un tema o fen´ omeno de inter´ es. Algunos ejemplos de preguntas generales: (Cuidado de la Salud) ¿Un sistema de servicio p´ublico de salud ser´a m´as eficaz que un sistema de seguro privado en t´erminos de atenci´on? (Mano de obra) ¿Cu´al es el efecto de la inmigraci´on indocumentada y la externalizaci´on de puestos de trabajo en la tasa de desempleo.
137
9. Pruebas de hip´otesis de una poblaci´on (Econom´ıa) ¿es el paquete de medidas del gobierno un est´ımulo econ´ omico eficaz para disminuir el impacto de la recesi´on? (Educaci´ on) ¿son demasiado caros los colegios para los estudiantes de hoy? Es importante no ser tan espec´ıfico en la elecci´on de estas cuestiones generales. Sobre la base de datos potencialmente disponibles, podemos decidir m´as tarde qu´e hip´ otesis espec´ıficas de la investigaci´ on se formular´a y se probar´an para abordar la cuesti´on general. Durante recopilaci´ n de datos algunas otras ideas de pruebas puede n resultar y p odemos optar porlaredefinir la opregunta general.
9.3.
Dise˜no de hip´otesis de investigaci´on y la experimentaci´on
Despu´ es de desarrollar un problema general y que tengan alg´ un sentido a los datos que est´an disponibles o para ser recogidos, es tiempo de dise˜ nar un experimento y un conjunto de hip´otesis.
9.3.1.
Las hip´otesis y prueba de hip´otesis
Para prop´ositos de prueba, es necesario dise˜nar hip´otesis que son declaraciones sobre los par´ ametros de la poblaci´on. Algunos ejemplos de hip´otesis son: Al menos el 20 % de los delincuentes juveniles son capturados y condenad os a prisi´on. El ingreso promedio mensual de los graduados universitarios es de Bs.F. 1500. Las tasas de c´ancer de pulm´on en Maracaibo son m´as bajas que las tasas de Caracas. La desviaci´on est´andar de la Bolsa de Caracas hoy es mayor 10 puntos porcentuales que la de a˜nos anteriores. Estas mismas hip´otesis podr´ıa escribirse en notaci´on simb´olica: pdelincuentes > 0,20, µingresos > 1500, pM ar < p Car y σ bolsa > 10, respectivamente. La prueba de hip´otesis es un procedimiento basado en la evidencia muestral y la teor´ıa de probabilidades, que se utiliza para determinar si la hip´otesis es una afirmaci´on razonable y no debe ser rechazada, o no es razonable y por tanto debe ser rechazada. La hip´ otesis que se prueba se llama la hip´otesis nula designado por el s´ımbolo H0 . Si la hip´otesis nula no es razonable y debe ser rechazada, entonces la investigaci´ on estar´ ıa apoyada por una hip´otesis alternativa designada por el s´ımbolo Ha . As´ı entonces, la hip´otesis nula ( H0 ): es una declaraci´on sobre el valor del par´ ametro de una poblaci´on que se supone que es cierto para el prop´osito de la prueba. Por el contrario, la hip´ otesis alternativa (Ha ): es una declaraci´ on sobre el valor del par´ametro de una poblaci´on que se supone que es verdadera si la hip´otesis nula es rechazada durante la prueba.
138
9.3. Dise˜no de hip´otesis de investigaci´on y la experimentaci´on A partir de estas definiciones, es claro que la hip´ otesis alternativa debe contradecir la hip´ otesis nula, ambas no pueden ser verdad al mismo tiempo. Otros puntos importantes acerca de hip´otesis: Las hip´otesis deben ser enunciados acerca de los par´ ametros de poblaci´on, nunca acerca de las estad´ısticas de la muestra.
≤≥
En la mayor´ıa de las pruebas de hip´otesis, la igualdad (= , , ) se asocia con la hip´ otesis nula, mientra s la desigualdad ( =,<,> ) se asociar´a con la hip´otesis alternativa.
La hip´otesis nula es la que siempre se prueba en un intento de refutarla y apoyar por tanto apoyar la hip´otesis alternativa. Este proceso es an´alogo al concepto de un prueba por contradicci´on, o reducci´on al absurdo, en matem´aticas o en l´ogica, pero apoyar una hip´ otesis con un nivel de confianza no es lo mismo que una prueba matem´ atica absoluta. Algunos ejemplos de hip´otesis nulas y alternativas, son los siguientes: Hip´ otesis nula Hip´otesis alternativa H0 : p delincuentes 0,20 Ha : p delincuentes > 0,20 H0 : µ ingresos 1500 Ha : µ ingresos > 1500 H0 : p M ar p Car Ha : p M ar < pCar H0 : p M ar = p Car Ha : p M ar = p Car H0 : σ bolsa > 10 Ha : σ bolsa 10
≤ ≤ ≥
9.3.2.
≤
Modelo estad´ıstico y estad´ıstico de prueba
Para probar la hip´otesis tenemos que utilizar un modelo estad´ıstico que describe el comportamiento de los datos y el tipo de par´ametro de la poblaci´on que se est´a probando. Debido al teorema del l´ımite central, muchos modelos estad´ ısticos son de la familia normal, los m´as importantes, las distribuciones Z , t de Student, χ 2 , y F . Otros modelos en los que no es apropiado usar el teorema del l´ımite central se llaman modelos no param´ etricos y no ser´ an discutidos aqu´ı. Cada modelo elegido tiene requisitos para los datos, llamados supuestos del modelo, que deben revisarse para su adecuaci´on. Por ejemplo, muchos modelos requieren la media de la muestra, estos tienen aproximadamente una distribuci´on normal. Una vez que se elije el modelo, podemos determinar un estad´ıstico de prueba, un valor derivado de los datos que se utilizar´a para decidir si rechazar o no rechazar la hip´ otesis nula. Algunos ejemplos de modelos estad´ıstico y estad´ısticos de prueba, son los siguientes: Modelo estad´ıstico Media vs. valor hipot´etico Proporci´on vs. valor hipot´etico
Estad´ıstico de prueba t := x¯−sµ0 n Z := pˆ−p0 n
√
√p (1−p ) √ 0
Varianza vs. valor hipot´etico
χ2 :=
0
2
2 (n σ1)s
−
139
9. Pruebas de hip´otesis de una poblaci´on
9.3.3.
Los er rores en la Toma de Deci siones
Cada vez que tomamos una decisi´on o apoyamos una posici´on, siempre hay una posibilidad de que se haga mal la elecci´ on. El proceso de comprobaci´on de hip´otesis requiere que sea para rechazar la hip´otesis nula y apoyar la hip´otesis alternativa o no rechazar la hip´otesis nula. Esto crea la posibilidad de dos tipos de error: Error de tipo I: Rechazar la hip´otesis nula cuando en verdad es ´esta verdadera. Error de tipo II: No rechazar la hip´otesis nula cuando en realidad es falsa.
H0 es verdadera H0es falsa
No se rechaza H0 Se rechaza H0 Desici´on correcta Error de tipo I Error de tipo II Desici´ on correcta
En el dise˜no de las pruebas de hip´ otesis, tenemos que considerar cuidadosamente la probabilidad de cometer cualquiera de estos errores. Ejemplo 9.1 Imagine que una compa˜n´ ıa farmac´ eutica intent´ o comercializar una droga que m´as adelante se determin´o ser ineficaz (y quiz´as peligrosa) en el tratamiento de una enfermedad. Antes de la comercializaci´ on del f´armaco, la compa˜ n´ ıa determin´ o que el f´armaco era eficaz en el tratamiento, lo que significa que la empresa rechaz´ o la hip´otesis nula de que la droga no tuvo efecto sobre la enfermedad. Este es un ejemplo de error del tipo I.
Ejemplo Imagine que la misma compa˜ n´ıineficaz a en su en investigaci´ on decidieron abandonar las pruebas9.2 cuando mostraron que la droga fue el tratamiento de la enfermedad. La empresa, en este caso no pudo rechazar la hip´ otesis nula de que la droga era ineficaz. ¿Qu´ e sucede si el medicamento realmente era eficaz? ¿La empresa tiene un error de Tipo II? Es posible, pero ya que el f´armaco nunca se comercializ´ o, no tenemos forma de saber la verdad. Estos ejemplos nos acercan al problema de la investigaci´on estad´ ıstica: los errores pueden ser analizados utilizando los modelos de probabilidad, pero a menudo no hay manera de identificar errores espec´ıficos. Por ejemplo, existen personas inocentes en prisi´on en este momento debido a que un jurado cometi´o un error de tipo I en condenar injustamente a los demandados. En el dise˜ no de un experimento, hemos creado una probabilidad m´axima de toma de error de tipo I. Esta probabilidad es llamada el nivel de significaci´on o nivel de significancia de la prueba y designada por la letra griega α. El an´alisis del error de tipo II es m´as problem´atico, ya que hay muchos valores posibles que satisfacen la hip´ otesis alternativa. Para un valor espec´ıfico de la hip´ otesis alternativa, la probabilidad de dise˜no toma de error de tipo II se llama Beta ( β ), que se analizar´a en detalle m´as adelante en esta secci´on.
140
9.3. Dise˜no de hip´otesis de investigaci´on y la experimentaci´on
9.3.4.
Valor Cr´ıtico y Regi´ on de Rechazo
Una vez que el nivel de significaci´on de la prueba se elija, es entonces posible encontrar la regi´on (o las regiones) de la funci´ on de distribuci´on de probabilidad del estad´ıstico de prueba que permita que la hip´ otesis nula sea rechazada. Esta es llamada la regi´ on de rechazo y la frontera entre la regi´ on de rechazo y la de no rechazo es llamada el valor cr´ıtico. No puede haber m´ as de un valor cr´ ıtico y una regi´ on de rechazo. Lo que importa es que el ´area total de la regi´on de rechazo sea igual al nivel de significaci´ on α. En la figura siguiente se clarifica este punto.
Figura 9.1.: Prueba de hip´otesis de una y dos colas.
9.3.5.
Pruebas de un a y dos c olas
Una prueba es de una cola cuando la hip´otesis alternativa, H a , se encuentra en una s´ola direcci´ on, como por ejemplo: H0 : el ingreso medio de las mujeres es menor o igual a la renta media de los hombres. Ha : El ingreso medio de las mujeres es mayor que la de los hombres. Dado que la igualdad es generalmente parte de la hip´ otesis nula, entonces la hip´otesis alternativa queda determinada por cola. Por el contrario una prueba es de dos colas cuando no se especifica la direcci´on en la hip´otesis alternativa H a , tales como: H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. Ha : El ingreso medio de las mujeres no es igual a la renta media de los varones. En una prueba de dos colas, el nivel de significaci´ on se divide en dos partes ya que hay dos regiones de rechazo. en una prueba de hip´otesis el modelo estad´ıstico es sim´etrico, (por ejemplo, la distribuci´on normal Z o la t de Student), y por lo tanto, estas dos regiones ser´ıan iguales. Existe una relaci´on entre un intervalo de confianza y una prueba de dos colas: Si el nivel de confianza para un intervalo de confianza es igual a 1α, donde α es
141
9. Pruebas de hip´otesis de una poblaci´on el nivel de significaci´on de la prueba de dos colas, entonces los valores cr´ıticos ser´ıan los mismos. Estos son algunos ejemplos de las pruebas de media µ contra un valor hipot´etico µ0 : Ha : µ > µ0 significa probar la cola superior y tambi´ en se llama una prueba de extremo derecho. Ha : µ < µ0 significa probar la cola inferior y tambi´en se llama una prueba de extremo izquierdo. Ha : µ = = µ 0 significa probar las dos colas.
Decidir cu´ando llevar a cabo una prueba de una o dos colas es a menudo controvertido y muchas autoridades van m´as lejos como para decir que s´olo las pruebas de dos colas deben llevarse a cabo. En ´ultima instancia, la decisi´on depende de la formulaci´on del problema. Si queremos demostrar que una nueva dieta es efectiva para reducir el peso, se llevar´ıa a cabo una prueba de una cola, ya que no importa si la dieta causa aumento de peso. Si por el contrario, hemos querido determinar si la tasa de criminalidad en Maracaibo es diferente de la tasa de criminalidad media en Venezuela, ser´ıa una conveniente m´as bien una prueba de dos colas, ya que no hemos preguntado espec´ıficamente si es mayor o igual.
9.3.6.
Recopilar y analizar los datos experimentales
Despu´ es de dise˜ nar el experimento, el siguiente procedimiento ser´ıa recoger los datos de la situaci´on y verificar los datos. A efectos de la estad´ıstica y el an´alisis, supondremos que todas las muestras sean al azar, o utilizando alguna otra alternativa, simular´ an una muestra aleatoria.
Verificaci´ on de Datos Despu´ es de recoger los datos, pero antes de ejecutar la prueba, tenemos que verificar los datos. En primer lugar, obtener una gr´afica (histograma , punto, gr´afico de caja, etc) ser´ıa conveniente. Es importantes compruebe la asimetr´ıa, forma y cualquiera posibles valores at´ıpicos en los datos.
Ope raciones con valores at´ıpicos Un valor at´ıpico es punto de los datos que est´a muy alejado de los otros en el conjunto de datos. Los valores extremos pueden ser causados por: Errores cometidos en el registro de datos. Datos que no pertenecen a la poblaci´on. Los verdaderos eventos raros.
142
9.3. Dise˜no de hip´otesis de investigaci´on y la experimentaci´on Los dos primeros casos son f´aciles de tratar y por tanto se pueden corregir los errores o eliminar los datos que no pertenecen a la poblaci´ on. El tercer caso es m´ as problem´atico, ya que los valores extremos aumentar´an la desviaci´on est´andar dram´aticamente y sesgar´an fuertemente los datos.
La l´ogica de la prueba de hip´ otesis Despu´ es que los datos se verifican, queremos llevar a cabo la prueba de hip´otesis y llegar a una decisi´on, ya sea o no rechazar la hip´ otesis nula. El proceso de decisi´on es similar a una prueba por la contradicci´on que se utiliza en las matem´aticas, como ya lo hemos dicho: Suponemos H0 es cierta antes de observar los datos y complemento de H 0 .
Ha se dise˜na tal que sea el
Observe los datos (evidencia). ¿Cu´an inusuales son estos datos respecto de H 0 ? Si los datos son demasiado inusuales, hemos probado que H 0 es falsa: Se rechaza H 0 y se apoya H a (declaraci´on fuerte). Si los datos no son demasiado inusuales, no rechazamos H0 . Esta no prueba nada y nos dicen que los datos son inconcluyentes. (Declaraci´ on d´ebil). Nunca se puede probar H 0 , s´olo refutar la misma.
−
Demostrar en las estad´ısticas se refiere al soporte con (1 α) 100 % de cer teza. (Ejemplo: si α = 0,05, entonces estamos en al 95 % de confianza en nuestra decis i´on de rechazar H0 .
Regla de Decisi´on - Dos m´ etodos, la misma decisi´ on Anteriormente hemos introducido la idea de una prueba estad´ıstica que es un valor calculado a partir de los datos en virtud del modelo estad´ıstico apropiado de los datos que se pueden comparar con el valor cr´ıtico de la prueba de hip´otesis. Si el estad´ıstico de prueba cae en la regi´ on de rechazo del modelo estad´ıstico, rechazamos la hip´otesis nula nula. Recordemos que el valor cr´ıtico se determina por el dise˜no basado en el nivel deseado de significaci´on α. El m´etodo m´ as preferido de la toma de decisiones es calcular la probabilidad de obtener un resultado tan extremo como el valor del estad´ıstico de prueba. Esta probabilidad se llama el valor-p, y se puede comparar directamente a el nivel de significaci´on. valor-p: es la probabilidad, en el supuesto de que la hip´otesis nula es cierta, de obtener un valor del estad´ıstico de prueba por lo menos tan extremo como el valor calculado para la prueba. Si el valor-p es menor que el nivel de significaci´ on α, se rechaza H0 .
143
9. Pruebas de hip´otesis de una poblaci´on Si el valor-p es mayor que el nivel de significaci´ on α, H 0 no se rechaza. Tanto el valor-p y α son las probabilidades de obtener resultados tan extremos como los datos asumiendo H 0 es cierta. El valor-p se determina por los datos y est´ a relacionado con la probabilidad real de tomar error de Tipo I (Rechazar una hip´ otesis nula cuando es verdadera). Cuanto menor sea el valor-p, menor ser´ a la posibilidad de tener error de tipo I y, por tanto, m´as posibilidades tendremos de rechazar la hip´otesis nula. El nivel de significaci´on α se determina por dise˜no y es la probabilidad m´axima que estamos dispuestos a aceptar de rechazar una verdadera H0 . Dos reglas de decisi´on conducen a la misma decisi´on. 1. Si el estad´ıstico de prueba se encuentra en la regi´on de rechazo, se rechaza (m´etodo del valor cr´ ıtico)
H0 .
2. Si el valor-p < α, se rechaza H 0 . (m´etodo del valor-p) Este m´etodo valor-p de comparaci´ on se prefiere del m´etodo del valor cr´ıtico, porque la regla es la mismo para todos los modelos estad´ısticos: Rechazar H 0 si el valor-p si es menor a α. Ejemplo 9.3 (Prueba de media vs. valor hipot´ etico. Un ejemplo completo) Suponga que una empresa de alimentaci´on tiene una pol´ıtica que el contenidos vertido de un producto en su envase coincide perfectamente con lo que dice la etiqueta. Una pregunta general podr´ıa ser: ¿El peso expresado neto del producto alimenticio est´ a de acuerdo con el peso real? El departamento de control de calidad decide poner a prueba la botella de 16 onzas de salsa de soja y ahora debe dise˜nar el experimento. El estad´ıstico de control de calidad ha tomado muestras de 36 botellas de salsa de soja y sabe a partir de unas pruebas anteriores que la desviaci´ on est´andar de la poblaci´on es de 0,5 onzas. El modelo ser´ a una prueba de media poblacional vs. al valor hipot´ etico de 16 oz. Una prueba de dos colas se selecciona debido a que es preocupante el llenado insuficiente ya que no cumple con las normas, as´ı como tambi´ en el llenado excesivo ya que produce p´ erdidas en la empresa. Recuerdese que la pol´ıtica de la empresa es llenar las botellas con el peso real del producto. As´ ı podemos estableces la hip´ otesis de investigaci´ on. H0 : µ = 16 (La m´aquina de llenado est´a funcionando correctamente) Ha : µ = 16 (La m´aquina de llenado no est´a funcionando correctamente).
Dado que la desviaci´on est´andar d ela poblaci´on se conoce de pruebas pasadas el estad´ıstico de µ prueba ser´ a Z = x¯− n. Este modelo es apropiado, ya que el tama˜ no de la muestra asegura que σ la distribuci´ on de la media muestral es aproximadamente normal, tomando base en el Teorema del L´ ımite Central. Recordemos que error de tipo I ser´ıa rechazar la hip´ otesis nula y decimos que la m´ aquina no funciona correctamente cuando en realidad est´ a funcionando adecuadamente. Dado que la compa˜ n´ ıa no quiere dejar innecesariamente la producci´on y recalibrar la m´aquina, el estad´ ıstico elige limitar la probabilidad de error de tipo I mediante el establecimiento del nivel de significaci´on (α) a 5%. El estad´ıstico ahora lleva a cabo el experimento con las muestras de las 36 botellas y determina a partir de un diagrama de caja que existe un dato inuasual de 17.56 oz. El valor es revisado de nuevo y se mantiene en el conjunto de datos.
√
144
9.3. Dise˜no de hip´otesis de investigaci´on y la experimentaci´on A continuaci´ on, la media de la muestra y el estad´ıstico de prueba se calculan. x¯ = 16,12oz.,
Z =
− √
16,12 16 36 = 1 ,44. 0,5
(9.1)
La regla de decisi´on bajo el m´ etodo del valor cr´ıtico ser´ ıa rechazar la hip´ otesis nula cuando el valor de estad´ ıstico de prueba est´ a en la regi´on de rechazo. En otras palabras, rechazar H0 cuando Z > 1, 96 o Z < 1, 96. En base a este resultado, la decisi´on es no rechazar H 0 ya que el estad´ıstico de prueba no cae en la regi´on de rechazo.
−
Alternativamente preferiblemente) el estad´ ıstico utiliza el m´ etodo del valor-p de regla de decisi´ on. El valor-p para(y una prueba de dos colas debe incluir todos los valores (positivos y negativos) m´ as extremos del estad´ıstico de prueba, por lo que en este ejemplo, hallar la probabilidad de que Z < 1,44 o Z > 1, 44. Usando una calculadora, o software inform´atico o una tabla normal est´ andar, el valor-p = 0,1498. Puesto que el valor-p es mayor que α, la decisi´on es de nuevo no rechazar H0 . Por ´ultimo, el estad´ıstico debe reportar las conclusiones y hacer una recomendaci´ on a la compa˜ n´ıa: No hay pruebas suficientes para concluir que la m´ aquina que llena botellas de salsa de soja de 16 oz est´a funcionando correctamente. Esta conclusi´ on est´a basada en 36 mediciones tomada durante una hora corrida de producci´ on. Recomiendo el seguimiento continuado de la m´ aquina con empleados diferentes para una potencial posibilidad de error humano. El estad´ ıstico hace la declaraci´ on d´ ebil y no indica que la m´ aquina est´ a funcionando correctamente, s´olo que no hay pruebas suficientes para determinar si est´ a funcionando correctamente. El estad´ ıstico tambi´ en informa preocupaciones sobre el muestreo de un solo turno de empleados (restringiendo la inferencia a la muestra poblacional) y recomienda repetir el experimento en varios turnos.
−
145
A. La redacci´on de informes y presentaci´on de resultados A.1.
Definici´ on de Informe cient´ıfico
Los informes cient´ıficos aparecen en la d´ ecada del cuarenta como una modalidad de literatura gris. Es un documento confecc ionado de forma ordenada para describir los aspectos de una investigaci´on especialmente las relacionadas con los resultados obtenidos. Su objetivo no es la publicaci´on en una revista, sino que va dirigido, o bien, act´ ua como instrumento para comunicar los resultados a la comunidad cient´ıfica o quien haya encargado el traba jo. En ning´un traba jo cient´ıfico se aceptan los hallazgos con independencia del procedimiento mediante el cual se obtuvieron, y dicho procedimiento debe poder reproducirse en otros lugares y oportunidades. Los objetivos del Informe cient´ıfico son: Su contenido est´a destinado a contribuir al acopio de conocimientos. Exponer y declarar los procedimientos y t´ecnicas utilizados en la investigaci´ on para que pueda ser producida, constatada y verificada por otros cient´ıficos, al fin de juzgar la validez y fiabilidad de las nuevas aportaciones cient´ıficas que se proponen. Constituyen fuentes de informaci´on para una nueva investigaci´on.
A.2.
Tipos y clasificaciones del Informe cient´ıfico
Existen cuatro tipos de investigaciones: investigaciones emp´ıricas, revisiones, replicaciones de investigaciones anteriores y art´ıculos te´oricos. Las clases de informes son: El informe cient´ıfico: aquel basado en la observaci´on directa, se trabaja con la realidad inmediata. Por ejemplo, el trabajo de laboratorio, fundamental en las ciencias naturales. Consiste en la descripci´on de los fen´omenos observados y en una interpretaci´on de ellos en t´erminos de conocimiento te´orico. Se ci˜ne a los pasos del m´etodo experimental: observaci´on de un fen´omeno, formulaci´on de una hip´otesis, realizaci´on experimental, conclusi´on del hecho, en el cual se comprueba o refuta la hip´ otesis planteada. El informe de investigaci´on: que consiste en reproducir en forma objetiva el pensamiento vertido en una obra, ensayo, art´ ıculo, etc. Constar´ a de una breve introducci´on,
147
A. La redacci´on de informes y presentaci´on de resultados en la cual se indica el tema y el objetivo que tiene el trabajo, de un cuerpo donde se expone la materia y una conclusi´on, s´ıntesis de los elementos rescatados; son primordiales la objetividad y la claridad. El informe de suceso: el mismo de los anteriores, var´ıa solamente en la materia. Es el quehacer que se realiza cuando se asiste a exposiciones, encuentros literarios, etc. y luego se vuelca la informaci´on en tipo informe.
A.3.
Caracter´ısticas, particularidades y modalidades del Informe cient´ıfico
A.3.1.
Caracter´ısticas
Al tener un objetivo concreto, responde a la exigencia o a la necesidad de dar cuenta de algo determinado. Por eso, su tema no es de libre elecci´ on del autor. Los informes pueden contener diagramas, estad´ısticas, cuadros num´ ericos y pueden y acompa˜nados de anexos que prueban o ilustran lo informado en el texto. Deben reunir las siguientes cualidades: Claridad y sencillez. Exigen dos explicaciones, de dos formas, la m´as elemental, de dos palabras, la m´as breve. La claridad del escrito deriva de su correcci´ on morfol´ogica y sint´ actica. Un texto no ser´a sencillo ni claro si no sigue un ordenamien to y se emplean palabras artificiosas y vac´ıas, t´erminos no conocidos o definidos. Precisi´ on. Estrechamente vinculado con la claridad y sencillez. La precisi´ on debe emplearse en cada momento se utilicen las palabras justas y las expresiones que correspondan exactame nte a la idea que se quiere expresar. No debe haber ambig¨uedad en los t´erminos. Es necesaria en la redacci´ on cient´ıfica porque ´esta exige la mayor exactitud terminol´ogica posible y porque su fin es exponer de modo concreto y sin rodeos, los resultados de la investigaci´on. Sinceridad y srcinalidad. Escribir conforme a nuestra propia manera y seg´un nuestro estilo y en ning´un caso se pretenda con las palabras disfrazar la verdad ni enga˜ nar. Viveza. Debe proporcionar un m´ınimo inter´ es. Se debe evitar el estilo mon´ otono, plano, amorfo, inerte y pesado. Que se sepa destacar la importancia de lo que se escribe, su actualidad, vigencia y utilidad y explicaciones, que se de un cierto relieve a las ideas expresadas. Rigor y sistema. El rigor consiste en la propiedad y exactitud del contenido. Aqu´ı se puede distinguir tres dimensiones: extensi´on, profundidad y seriedad cient´ıfica. Un informe ser´a riguroso en la extensi´on si abarca todos los aspectos del tema. Ser´ a riguroso en la profundidad si se buscan los fundamentos ´ ultimos de las cuestiones y se llega, respecto a ellas, hasta el l´ımite intelectual posible. Y seriedad cient´ıfica en cuanto al cuidado en demostrar las tomas de posici´ on, en demostrar las pruebas que
148
A.3. Caracter´ısticas, particularidades y modalidades del Informe cient´ıfico justifiquen las aportaciones y descubrimientos, en sus referencias y citas y en el cumplimiento de todas las prescripciones metodol´ ogicas y expositivas que garantizan la solidez y la seriedad de la exposici´on de una investigaci´on cient´ıfica. En cuanto a la cualidad de sistematizaci´on, la redacci´on debe ser sistem´atica de modo que presente integrados en su totalidad los aspectos del tema desarrollados en el.
A.3.2.
Particularidades
El informe debe contener una ordenada secuencia l´ ogica, haciendo que los hechos se encadenen entre s´ı y tratando de organizarlos de un modo coherente, sin fracturas. Debe tener una estructura de modo tal que permita su comprensi´ on sin mayores dificultades.
Orden al hacer el informe cient´ıfico: Generalmente se necesita: materiales y m´ etodos, resultados, discusi´ on y conclusi´on, introducci´ on y resumen. Materiales y m´etodos se suele al escribir primero, ya que los materiales deben estar listos antes de comenzar la investigaci´ on, los m´etodos deben estar claros y descriptos detalladamente antes de comenzar a obtener los datos. Luego, se organizan los datos y se escriben los resultados, seguidos de la discusi´ on y de la conclusi´on. La introducci´ on es lo ´ultimo en escribir. Puede ir redact´andose en cualquier momento, pero no es hasta el final del informe que verdaderamente se organiza para ser presentado.
Orden al presentar el informe cient´ıfico: Se da cuando a trav´ es de la lectura contestamos las siguientes preguntas: ¿qu´ e se hizo?, ¿para qu´ e? (introducci´ on), ¿c´omo se hizo?, ¿qui´ en?, ¿cu´ ando?, ¿d´onde? (m´etodos y materiales), ¿qu´ e se encontr´ o? (resultados), ¿por qu´ e?, ¿qu´ e significa? (discusi´ on y conclusi´on).
A.3.3.
Modalidades
El informe cient´ıfico posee la siguiente estructura formal: Portada. Incluye el t´ıtulo de la investigaci´ on, el cual debe expresar el contenido del trabajo de forma breve, concisa y clara (longitud m´ axima recomendada es de 12 palabras), el nombre del autor o autores y su afiliaci´ on institucional o el nombre de la organizaci´on que patrocina el estudio y la fecha en que se presenta el reporte. ´Indice. Con apartados y subapartados. Resumen. Constituye el contenido esencial del reporte de investigaci´ on, usualmente incluye el planteamiento del problema, la metodolog´ıa, los resultados m´ as importantes y las principales conclusiones. Se presenta en una hoja aparte sin superar 120 palabras aproximadamente.
149
A. La redacci´on de informes y presentaci´on de resultados Introducci´ on. Incluye el planteamiento del problema (objetivos y preguntas de investigaci´on, as´ı como la justificaci´ on del estudio), el contexto general de la investigaci´ on (c´omo y d´onde se realiz´o), las variables y t´erminos de la investigaci´ on y sus definiciones, as´ı como las limitaciones de ´esta. Marco te´orico. (marco de referencia o revisi´on de la literatura) En el que se desarrollan los estudios e investigaciones antecedentes y las teor´ıas a manejar. M´etodo. Esta parte del reporte describe c´omo fue llevada a cabo la investigaci´on: Hip´ otesis y especificaci´on de las variables. Material, si es standard solo es necesario dar el nombre, pero si es espec´ıfico, es relevante describirlo con detalle. Dise˜ no utilizado (experimento o no experimento) Sujetos, universo y muestra (procedencia, edades, sexo y/o aquellas caracter´ısticas que sean relevantes de los sujetos; descripci´on del universo y muestra; y procedimiento de selecci´ on de la muestra). Instrumentos de medici´on aplicados (descripci´on precisa, confiabilidad, validez y variables medidas). Procedimiento (un resumen de cada paso en el desarrollo de la investigaci´on. Se incluyen en este paso los problemas enfrentados y la manera de c´ omo se resolvieron. Por ejemplo, en una encuesta se describe c´omo se contact´o a los sujetos y se realizaron las entrevistas, en un experimento se describen la manera de asignar a los sujetos, las instrucciones, los materiales, etc. Resultado. Aqu´ı el investigador se limita a describir los resultados, obtenidos del producto del an´alisis de los datos. Una manera de hacerlo es mediante tablas, dibujos, gr´aficas y figuras. Cada uno de estos elementos debe ir numerado (en ar´ abigo o romanos y con el t´ıtulo que lo identifica. Conclusiones, recomendaciones e implicaciones (o discusi´on). En este apartado se derivan conclusiones, se hacen recomendaciones para otras investigaciones, se analizan las implicaciones de la investigaci´on y se establece c´omo se respondieron las preguntas de investigaci´on y si se cumplieron o no los objetivos. Debe redactarse de tal manera que se facilite la toma de decisiones respecto a una teor´ıa, un curso de acci´on o una problem´ atica. Bibliograf´ıa. Que son las referencias utilizadas por el investigador para elaborar el marco te´orico. Se incluyen al final de los informes ordenados alfab´eticamente. Ap´ endices. Son u´tiles para describir con mayor profundidad ciertos materiales sin distraer la lectura del texto principal del informe. Por ejemplo, el cuestionario utilizado, el desarrollo de una f´ormula, fotograf´ıas, etc.
A.4.
Forma de presentaci´on y estilos del Informe cient´ıfico
Puede presentarse de las siguientes maneras. Algunas veces solamente se entrega el reporte publicado y se explica verbalmente. Otras veces la entrega del informe acompa˜ nado
150
A.5. Diferencias con el resto de los traba jos cient´ıficos con diversos apoyos como son gr´aficas, audiovisuales, videos y sistemas computarizados. Hoy en d´ıa los informes se elaboran utilizando distintos procesador es de textos y programas: Word, Works (textos y dibujos); PageMaker, PowrPoint, Harvard Graphics, Publisher (textos y gr´aficos); SPSS (an´alisis estad´ıstico y gr´ aficos), Excel (hoja de c´alculo y gr´aficos)
A.5.
Diferencias con el resto de los trabajo s cient´ıficos
Suele confundirse informe cient´ıfico con art´ıculo cient´ıfico, sin embargo entre ellos hay una marcada diferencia. Mientras que el informe cient´ıfico es un documento que reporta los resultados de una investigaci´on, no tiene como finalidad la publicaci´on en una revista (aunque en agencias gubernamentales normalmente se agrupan en vol´ umenes que representan una publicaci´on interna de la agencia), el art´ıculo cient´ıfico presenta informaci´ on acumulativa que provee para el conocimiento cient´ıfico, presenta an´alisis y conclusiones que pueden ser preliminares o finales acerca de los hallazgos que el investigador ha logrado a trav´ es del trabajo cient´ıfico. Su meta es que sea revisado por expertos y que se publique en una revista cient´ıfica.
151
B. C´ alculos de incertidumbre y de peque˜ nas variaciones En el laboratorio a la hora de realizar experimentos y hacer mediciones para comprobar diversos procesos de la naturaleza, se cometen inevitablemente errores. Algunos errores en el laboratorio son m´ as evidentes que otros, sin embargo, como quiera que sea o por muy peque˜no que sea, existe siempre un error asociado a cada una de las medidas que se toman en la experiencia. Lo curioso de la ciencia es que no existe una manera para encontrar el valor real de todas las cosas. Por muy exacto que sea el instrumento, por muy preciso y cuidadoso que sea el investigador, siempre encontrar´ a un valor aproximado de la medida en estudio. El valor verdadero de una medida depende de tantas cosas, que es imposible sellar todas las incertidumbres para lograr exactitud perfecta. Inclusive la misma tecnolog´ıa tiene un l´ımite, cuando ese l´ımite es sobrepasado, el instrumento ya deja de ser exacto para dar lugar a errores esperados. La mayor´ıa de las veces la repetici´on muchas veces del experimento logra minimizar estos errores, pero el investigador, sabe que existen. Lo m´as interesante de todo es que el conocimiento de ´estos errores son la base de la confiabilidad de la medida estudiada. Si en la repetici´ on simultanea, inclusive por distintos m´etodos, al medir una cierta cantidad, se encuentra que todos los resultados est´an cuidadosamente cercanos, entonces uno pudiera pensar que se tendr´a una medida cercana al valor real. Sup´ ongase que se ha medido la masa y e volumen de un cierto objeto en el laboratorio. Digamos, por ejemplo, que la masa est´a dada por m = 4,635 0,002g y el volumen V = 1,13 0,05mL. M´as adelante explicaremos que significan estas expresiones, por ahora bastar´ a con decir que el primer de los n´ umeros de la medida es el valor cercano al real, mientras que el segundo n´umero es la incertidumbre o el error cometido, cualquiera que fuera la fuente de su procedencia. La cuesti´ on es: si sabemos que estas son las medidas, ¿cu´ al ser´a la medida de la densidad y cu´al ser´a su incertidumbre asociada? M´as a´un, ¿c´omo procedemos al c´alculo de la densidad?, ¿en qu´e afectan los errores individuales de la masa y el volumen a la densidad?, ¿es posible que el c´ alculo de la densidad no conlleve errores? Estas son algunas de las dudas que podemos respondernos en este cap´ıtulo.
±
B.1.
±
Tipos de errores
Cada medida tiene asociada un incertidumbre, la cual de ahora en adelante usaremos como sin´onimo y/o definici´on de error experimental. Cada vez que sacamos conclusiones de una experiencia de laboratorio, estas pueden estar escritas en t´erminos de un muy
153
B. C´alculos de incertidumbre y de peque˜nas variaciones alto grado o un nivel m´ınimo de confidencialidad, es decir, con mucho error o con po co error, pero jam´as con seguridad absoluta. Los errores experimentales son clasificados en sistem´ aticos o aleatorios.
B.1.1.
Errores sistem´ aticos
El error sistem´atico, tambi´ en llamado error determinado , se debe a una falla en el equipo o el dise˜no de un experimento. Esto quiere decir, que si la medida se hace varias veces repitiendo el experimento para reproducir el valor de la medida, entonces se conseguir´a el mismo resultado. El error no depende, en otras palabras, del investigador, sino del instrumento usado o del dise˜ no. Seguramente este error pudiera ser salvado pero la mayor´ ıa de las veces resulta dif´ıcil. Los errores sistem´aticos pueden detectarse mediante tres acciones, a saber, al menos. Pudiera analizarse con el dise˜no o con el aparato en cuesti´ on alguna medida de la cual se sepa cu´anto es su valor, de tal manera que conviene escoger una que sea referencia est´andar de calibraci´on, por ejemplo, con la metodolog´ıa usada deber´ıa obtenerse el mismo valor, sino, entonces existen errores sistem´aticos. Otra manera de darse cuenta cuando se tiene un error sistem´atico, es usar un m´etodo diferente para medir la misma cantidad, si con ´este m´etodo nuevo se reproduce la medida est´andar, entonces estar´a en presencia tambi´ en de este tipo de error. Por u´ltimo, otra manera de darse cuenta es hacer que varias personas midan exactamente la misma cantidad en distintos laboratorios, de no tener errores sistem´aticos, entonces las medidas deber´ıan coincidir.
B.1.2.
Errores aleatorios
El error aleatorio, tambi´ en llamado error indeterminado , se debe a los efectos de que las variables no est´an controladas en la medici´on. El error aleatorio tiene la misma probabilidad de ser positivos o negativos. Siempre est´ a presente y no puede corregirse. El error aleatorio est´a la mayor´ıa de las veces asociado con la lectura de una escala en los aparatos de medici´on. Diferentes personas leyendo la escala reportar´ an una serie de valores que representan sus interpolaciones subjetivas entre las marcas. Una persona que lee el mismo instrumento varias veces podr´ıa informar de varias lecturas diferentes.
B.2.
Precisi´ on y exactitud
La precisi´ on de una medida est´a normalmente asociada a la capacidad de que el resultado pueda ser reproducible todas las veces. Una medida precisa es una medida que se puede volver a obtener por cualquiera otro m´etodo o por cualquier otro investigador, salvando, por su puesto, que se haya hecho una elecci´ on cuidadosa de aparatos y m´etodos de medici´on. En otras palabras, si medimos una cierta cantidad muchas veces y los valores est´an cercanamente iguales entre si, entonces uno pudiera decir que la medida es precisa. Si los valores difieren significativamente entonces la medida no es precisa.
154
B.3. Incertidumbre absoluta y relativa Por otro lado la exactitud est´a usualmente relacionada con el hecho de cu´an cercano es el valor de la medida con el valor real de dicha medida. En otras palabras, para darse cuenta de si una medida es exacta, entonces lo que hay que hacer es buscar una medida de referencia para esa cantidad y determinar si es significativamente cercana o no. De serlo, entonces nuestra medida ser´ıa exacta. Aun cuando una medida pudiera ser reproducibles, hay que tener en cuenta, que esto no quiere decir que dicha medida sea verdadera. Es decir, aunque midamos algo muchas veces, no podemos estar seguro de que ese valor sea verdaderamente bueno. Por ejemplo, imag´ınese que se quisiera medir la densidad de un l´ıquido en el laboratorio, pero por un descuido inesperado del que no se dio cuenta, se mezcl´ o un poco de ese l´ıquido con otro. Entonces, usted pudiera hacer el procedimiento y conseguir un conjunto de medidas para la densidad del l´ıquido, en el reporte, usted pudiera conseguir medidas muy cercanas entre si en la sucesiva repetici´on del experimento. En este caso usted tendr´ıa mucha precisi´on pero su exactitud ser´ıa bastante pobre. Por el contrario, usted pudiera haber hecho muchas mediciones y no coincidir mucho entre todas, sin embargo, en t´erminos promedios el valor de la medida es bastante cercano a su valor real. En este caso se tendr´ıa muy poca precisi´on pero bastante exactitud. Un proceso ideal ser´ıa tener tanto buena precisi´on como buena exactitud. Otro t´ermino merece tambi´ en ser aunque sea definido. Estrechamente ligado a la presentaci´ on precisa y exacta de los datos est´ a tambi´ en el asunto de la sensibilidad. Que el aparato sea sensible est´a estrechamente ligado al aumento de precisi´on y exactitud. La sensibilidad de un aparato es el valor m´ınimo de la magnitud que es capaz de medir. As´ı, si la sensibilidad de una balanza es de 5 mg significa que para masas inferiores a la citada, la balanza no podr´a medir significativamente. Normalmente, se admite que la sensibilidad de un aparato viene indicada por el valor de la divisi´ on m´as peque˜na de la escala de medida. En general, se puede decir que es m´as f´acil conocer la precisi´on de un aparato que su exactitud.
B.3.
Incertidumbre absoluta y relativa
Las incertidumbre relativas y absolutas se refieren a los errores relativos y absolutos respectivamente. Un error absoluto determina el margen de error asociado con una medida particularmente. El error absoluto en una medida x de determinada magnitud es la diferencia entre dicho valor y el valor verdadero de la medida; se notar´ a por ∆ x y, por tanto, su expresi´on es: ∆x := x x0 , (B.1)
| − |
donde x 0 representa el valor verdadero de la medida. El error absoluto cuantifica la desviaci´on en t´erminos absolutos respecto al valor verdadero. No obstante, en ocasiones es m´as interesante resaltar la importancia relativa de esa desviaci´ on. Por ello, se define el error relativo como el cociente entre el error absoluto y el valor verdadero; not´ andolo por su
155
B. C´alculos de incertidumbre y de peque˜nas variaciones expresi´ on es: :=
| − |
∆x x x0 = , x0 x0
(B.2)
y suele expresarse porcentualmente sin m´as que multiplicar por 100, a lo que llamamos com´unmente error relativo porcentual . En F´ısica, presentar una medida experimental significa dar el valor de dicha cantidad y expresar cual es su error; no tiene sentido establecer un determinado valor si no se acota debidamente el mismo. As´ı, la expresi´ on correcta de una medida debe ser: x
± |∆x|
−→
x+ probable = x + ∆x ,
x− probable = x
| |
− |∆x|,
(B.3)
y por lo tanto el intervalo [ x(−) , x(+) ] es el rango en el que las medidas de la cantidad x es v´alido en relaci´on con el error cometido. Dado el significado de cota de imprecisi´on que tiene el error absoluto, ´este siempre se expresa con una ´unica cifra significativa, es decir, con el primer d´ıgito comenzando por la izquierda distinto de cero; este n´umero debe ser redondeado por exceso en una unidad si la segunda cifra significativa es 5 o mayor de 5. Este convenio de expresi´on del error encuentra dos excepciones: que la primera cifra significativa sea un 1 o que siendo la primera un 2, la segunda no llega 5; en estos casos, el error vendr´ a dado por las dos primeras cifras significativas, procedi´endose al redondeo de la segunda en el mismo sentido que ya se ha explicado. Hay que resaltar que el valor de una magnitud debe tener el mismo orden decimal que el error absoluto. Esto es razonable dado que no tendr´ıa sentido encontrar el valor de una magnitud con un grado de precisi´on superior al del error de la medida. As´ı, no podemos medir d´ ecimas de mil´ımetro con una regla cuya sensibilidad es del mil´ımetro. Finalmente, se acepta como criterio que si el valor de una medida es le´ıdo de una tabla u otro lugar, sin indicaci´on de su error, se tomar´a como error una unidad del orden de la ´ ultima cifra con que se expresa; por ejemplo, si en una tabla aparece que el valor de una medida es de 0.056 sin ninguna indicaci´on de error, se conviene en que el mismo es de 0,001. En la siguiente tabla se dan distintos ejemplos.
±
Expresi´ on incorrecta 3,418 0,123 6,3 0,09 46288 1551 428,351 0,27 0,01683 0,0058
± ± ± ± ±
Expresi´on 3 ,42 6,30 46300 428 ,4 0 ,017
correcta
± 0,12 ± 0,09 ± 1600 ± 0,3 ± 0,006
Cuadro B.1.: Ejemplos de expresiones correctas e incorrectas en la descripci´on de incertidumbres.
156
B.3. Incertidumbre absoluta y relativa Como ya se ha explicado, cuando se realice la medida de cualquier magnitud hay que indicar el error asociado a la misma. Dado que no conocemos el valor verdadero de la magnitud que deseamos medir, se siguen ciertos procedimientos para hacer una estimaci´on del mismo y de su cota de error. Con el fin de alcanzar cierta validez estad´ıstica en los resultados de las medidas es muy conveniente repetir varias veces su determinaci´on; por convenio, se ha establecido en 3 este n´ umero m´ınimo. No obstante, es posible que en alguna o casi´on no tenga sentido llevar a cabo estas repeticiones, en cuyo caso se considera que el error absoluto coincide con el valor de la sensibilidad del aparato utilizado para realizar la medida. En el caso habitual, cuando son 3 las medidas tomadas, pueden presentarse poco o muy dispersas y en funci´ on de esta dispersi´on ser conveniente aumentar o no el n´umero de determinaciones del valor de la magnitud. Para decidir el n´umero determinaciones del valor de una magnitud f´ısica que se desea medir se sigue el siguiente procedimiento: se realizan las 3 mediciones xi de la magnitud en cuesti´on y se calcula su valor medio: n=3
x ¯ :=
i=1
xi , N
con N = 3 en este caso .
A continuaci´on se determina su dispersi´ on o lo que es llamado Rango diferencia entre los valores extremos de las medidas: D := x max
(B.4) D, esto es, la
− xmin,
(B.5)
finalmente, se obtiene el tanto por ciento de dispersi´ on, T , que viene dado por: T := 100 D . x ¯
(B.6)
Con estos par´ametros se pasa al siguiente cuadro que establece la casu´ıstica que puede darse; S representa la sensibilidad del aparato de medida, D6 es la dispersi´on para seis medidas y N el n´umero de medidas necesarias en cada caso. As´ı, por ejemplo, si se ha obtenido que la dispersi´on es mayor que la sensibilidad y el tanto por ciento de dispersi´on est´a comprendido entre el 2 % y el 8 %, son nece sarias 6 medidas; el valor verdadero queda establecido en la media aritm´etica de las 6 medidas y su error corresponde al m´aximo de entre la dispersi´on de las seis medidas dividido por 4 o la sensibilidad. Si se han realizado 15 o m´ as medidas, en realidad se est´a buscando que el conjunto de las mismas sea una distribuci´on gaussiana o normal, en cuyo caso, el error que se considera corresponde con el error cuadr´atico medio (ECM) 1 o desviaci´on standard; el significado 1
La varianza representa la media aritm´ etica de las desviaciones con respecto a la media que son elevadas al cuadrado. Si atendemos a la colecci´ on completa de datos (la poblaci´on en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atenci´ on s´olo a una muestra de la poblaci´on, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a
157
B. C´alculos de incertidumbre y de peque˜nas variaciones D D
D>S
TN
x
0
3 3 6 15 > 50
≤ ≤ ≤ ≤ ≤ ≤
T 2% 2% T 8% 8 % T 15% 15 % T
x ¯N :=
N xi i=1 N
∆x S S max D6/4, S ∆x =
{
n
}
−x¯N )2 N (N −1)
i=1 (x
Cuadro B.2.: Modelo sencillo para la determinaci´on de incertidumbres.
de este par´ametro puede encontrarse en cualquier volumen de estad´ıstica b´asica aunque podemos sintetizarlo de forma cuantitativa como sigue. En el intervalo: x ¯
− ∆x ≤ x ≤ x¯ + ∆x,
(B.7)
se encuentra el 68,3 % de las medidas realizadas en una gran serie de las mismas. De igual forma, es posible demostrar que en el intervalo: x ¯
− 2∆x ≤ x ≤ x¯ + 2∆x,
(B.8)
se encuentra el 95,4 % de las medidas reali zadas. Por ´ultimo, en el intervalo: x ¯
− 3∆x ≤ x ≤ x¯ + 3∆x,
(B.9)
continuaci´ on. n
2
X
i=1
i
−X
2
SX = n , una segunda manera de expresarla es:
Expresi´ on de la varianza muestral , n
2 SX =
X
2
i
i=1
n
− X2
Por otro lado, la expresi´on de la cuasivarianza muestral (estimador insesgado de la varianza poblacional): n
2
SX =
X
i=1
i
−X
2
n−1
Mientras que Expresi´ on de la desviaci´on est´andar poblacional:
(X = N
√
σ2
i
i=1
N
− µ)2
.
El t´ ermino desviaci´ on est´ andar fue incorporado a la estad´ıstica por Karl Pearson en 1894. Por la formulaci´ on de la varianza podemos pasar a obtener la desviaci´on est´ andar, tomando la ra´ız cuadrada positiva de la varianza. As´ı, si efectuamos la ra´ız de la varianza muestral, obtenemos la desviaci´ on t´ıpica muestral; y si p or el contrario, efectuamos la ra´ız sobre la varianza poblacional, obtendremos la desviaci´ on t´ıpica poblacional.
158
B.4. Propagaci´on de los errores se encuentra el 99,7 % de las medidas reali zadas en una gran serie de las mismas.
B.4.
Propagaci´ on de los errores
Recordemos la pregunta principal al iniciar el cap´ıtulo. La idea es poder describir de que manera puede ser calculado el error de una expresi´ on que es la composici´on de dos magnitudes distintas, cada una con su respectivo error. Esta secci´ on intenta responder a esa pregunta fundamental. Existen varias metodolog´ıas para poder ver esto.
B.4.1.
El m´ etodo de las derivadas parciales
Empecemos por decir, que una cierta medida pudiera escribirse como la composici´ on de varias otras medidas. En este caso estamos en la presencia de una medida indirecta . Digamos que a ´esta medida puede asociarse un funcional que se componga de varias medidas directas, es decir, y = f (xi , aj ), (B.10) donde f es una funci´on, en principio de cualquier dependencia, que relaciona las medidas directas xi (i = 1, 2,...,n ) con la medida indirecta y, mientras que aj (j = 1, 2,...,m ) representan constantes de la f´ısica (las cuales por cierto, dado que han sido medidas tambi´ en tienen su incertidumbre asociada). Luego, dado que el error absoluto es en esencia la diferencia entre el valor real y el valor medido, entonces el error es ∆ x, de esta manera, y sabiendo que la funci´ on en principio es continua, se tendr´a que el error absoluto se convierte en la diferencial total de dicha funci´ on, por tanto, error absoluto := dy =
+
i=1
· · · ∂x∂yn dxn
medidas
∂y ∂y da1 + da2 + ∂a 1 ∂a 2
n
=
∂y ∂y dx1 + dx2 + ∂x 1 ∂x 2
∂y dxi + ∂x i
· · · ∂a∂ym dam
constantes m
j=1
∂y daj . ∂a j
(B.11)
Recu´ erdese que en este caso hemos cambiado los incrementos ∆x a diferenciales dx por el car´acter continuo de la funci´on f (xi , aj ). De esta manera la expresi´on anterior pudiera ser escrita equivalentemente como n
∆y =
m
∂y
i i=1 ∂x i ∆x
+
∂y ∂a j ∆aj .
j=1
(B.12)
159
B. C´alculos de incertidumbre y de peque˜nas variaciones As´ı con el valor absoluto aseguramos que no importe si la desviaci´on a sido superior al valor real o inferior, lo que interesa en fin ´ultimas es reconocer la diferencia entre ambos valores. As´ı pues, la ecuaci´ on anterior representa el caso m´as favorable. Para hacer esto menos dependiente de las constantes universales, uno pudiera escoger una cantidad de cifras significativas convenientemente de tal manera que el ´ ultimo t´ermino de la ecuaci´ on no influya de manera importante. As´ı uno pudiera, hacer n
∆y =
∂y ∂x i ∆xi +
m
∂y ∂a j ∆aj = E 1 + E2 = (1 + α)E1 ,
i=1
j=1
≈
(B.13)
∂y ∂y donde hemos hecho que E1 := ni=1 ∂x ∆xi y E2 := m j=1 ∂a j ∆aj y luego escoger el i nivel de cifras significativas tal que E 2 := αE 1 , de tal manera que si α = 0,1, por ejemplo,
∆y = (1 + α)E1 = 1,1E1
n
≈ E1
i=1
∂y ∆xi . ∂x i
Veamos como se aplica esto con algunos casos particulares.
(B.14)
Caso: la funci´on es una suma algebr´ aica de medidas Digamos que y = f (x1 , x2 ) = x 1 + x2 , entonces, ∂y
∆y =
∂y
∆x1 +
∆y
∆x2 = ∆x1 + ∆x2
=
∆x1 + ∆x2
, (B.15) y x1 + x2 de ´esta manera, el error absoluto de una medida indirecta que es la suma de dos medidas directas, resulta ser la suma de los valores absolutos de cada una de las medidas directas. ∂x 1
→
∂x 2
Caso: la funci´on es una multiplicaci´on de medidas Digamos que y = f (x1 , x2 ) = x 1 x2 , entonces, ∆y =
∂y ∂y ∆x1 + ∆x2 = x 2 ∆x1 + x1 ∆x2 ∂x 1 ∂x 2
∆x2 1 → ∆yy = ∆x + . x1 x2
(B.16)
Caso: la funci´on es un cociente de medidas Digamos que y = f (x1 , x2 ) = ∂y
x1 x2 ,
entonces,
∂y
∆y = ∂x 1 ∆x1 + ∂x 2 ∆x2 =
160
x2 ∆x1
x1 ∆x2
−
x22
∆y
→
∆x1
y = x1
∆x2
−
x2 .
(B.17)
B.4. Propagaci´on de los errores
Caso: la funci´on es una medida potencial cuyo exponente es otra medida Digamos que y = f (x1 , x2 ) = x x1 2 , entonces, ∆y =
∂y ∂y ∆x1 + ∆x2 = x 2 xx1 2 −1 ∆x1 + xx1 2 ln x1 ∆x2 ∂x 1 ∂x 2
1 → ∆yy = x2x∆x + ln x1 ∆x2 . 1
(B.18)
Caso: la funci´on es exponencial Digamos que y = f (x1 , x2 ) = exp(x1 ), entonces, ∆y =
∂y ∆x1 = e x1 ∆x1 ∂x 1
Caso: la funci´on es logar´ıtmica
→ ∆yy = ∆x1.
(B.19)
Digamos que y = f (x1 , x2 ) = ln( x1 ), entonces, ∆y =
∂y ∆x1 ∆x1 = ∂x 1 x1
1 → ∆yy = x1∆x . ln(x1 )
(B.20)
Caso: la funci´on es una composici´on de funciones trigonom´ etricas Digamos que y = f (x1 , x2 ) = x δ1 sin(x2 ), entonces, ∆y =
∂y ∂y ∆x1 + ∆x2 = δxγ1 −1 sin(x2 )∆x1 + xγ1 cos(x2 )∆x2 ∂x 1 ∂x 2 ∆y γ ∆x1 = + ∆x2 cotg(x2 ). y x1
→
(B.21)
Cuando se trata de la teor´ıa de an´ alisis de errores puede ser obtenida una f´ormula general para la incertidumbre de una colecci´on de las mediciones. La f´ ormula se basa en la idea de un desarrollo en serie de Taylor de primer orden de funciones de muchas variables. Es v´ alida cuando las diversas incertidumbres ∆i de las variables son peque˜nas en comparaci´on con los valores de las cantidades y con la exigencia de que las incertidumbres no est´ an correlacionadas entre s´ı. En concreto, si se tiene el comportamiento de f (x,y,z,... ) de las variables f´ısicas x, y, z,. . . que tienen incertidumbres ∆ x , ∆y , ∆z . . ., entonces la incertidumbre en el valor del resultado de ∆ f viene dada por la f´ormula 2f = 2x
∂f ∂x
2
+ 2y
∂f ∂y
2
+ 2z
∂f ∂z
2
+
· · ·,
(B.22)
donde f , x , y , z , son los errores de la funci´on f y de x, y, z , respectivamente, los cuales denotaremos por a := σ a = ∆a , a
(B.23)
161
B. C´alculos de incertidumbre y de peque˜nas variaciones de acuerdo con la ecuaci´on (B.2). Por ejemplo, en Relatividad General para un universo plano, la definici´on del par´ametro de desaceleraci´on gravitacional, permite calcular la densidad cr´ıtica del universo, de tal manera que es posible calcular 3H 2 ρc = , (B.24) 8πG ˙
donde H := R es la constante de Hubble, la cual mide la velocidad con la cual las galaxias R se mueven alej´ andose unas de las otras, las ´ ultimas mediciones estiman su valor en H (75 25)Km s −1 M pc−1 . De tal manera que el error cometido al tratar de medir la densidad del universo puede ser conseguida tal que,
±
·
·
∆ρc =
3H ∆H 4πG
2
≈
2
3H − 8π3H2G ∆π − 8πG ∆G, 2
(B.25)
con lo cual
∆ρ ∆H ∆π ∆G =2 (B.26) , ρ H π G por tanto, sabiendo la incertidumbre de H , recordemos que el valor m´ as preciso de la constante de Gravitaci´on Universal est´a dado por G := (6 ,67428 0,00067) 10−11 m3 Kg −1 s−2 , luego, se tendr´a que
−
−
±
·
∆ρ = 0,66651 ρ
×
·
2
3H Kg Kg → ρ = 8πG = 1,0616879 × 10−38 3 → ∆ρ = 7,07634 × 10−39 3 , m m
(B.27)
lo cual quiere decir entonces que la densidad cr´ıtica pudiera estar medida en ρ = (1,0616879
± 0,707634) × 10−38 Kg , m3
(B.28)
por ´ultimo 2ρ = ρ =
B.4.2.
× ∆ρ ρ
2
= 2H
∂f ∂H
2
+ 2π
22H + 2π + 2G = 7,07634
∂f ∂π
2
+ 2G
10−39 .
∂f ∂G
2
= 0,44424 (B.29)
El m´ etodo del Neperiano
La regla de las derivadas parciales es v´alida siempre. Sin embargo, cuando la funci´on f s´olo tiene productos, divisiones o potencias (o es una combinaci´ on de estas operaciones), una forma alternativa de calcular el error de y es proceder de la siguiente forma: Se determina el logaritmo neperiano de los dos miembros de la ecuaci´on y = f (xi , aj ) ln y = ln f (x1 , x2 ,...,x n )
162
(B.30)
B.4. Propagaci´on de los errores Se toman diferenciales de ambos miembros de la ecuaci´ on anterior.
→
Se identifican los elementos diferenciales con los errores de las variables ( dy ∆y, dxi ∆x), y se sustituyen los valores correspondientes de y y xi en la expresi´on final:
→
Por ejemplo, imag´ınese que para un cierto experimento se tiene una dependencia de la forma xy α w = f (x,y,z ) = z , (B.31) por tanto se sabe que cada una de las medidas directas x, y y z, tienen errores absolutos asociados ∆ x, ∆y y ∆z. Por tanto tomando logaritmos neperianos a ambos lados de la expresi´ on se obtiene que ln(w) = ln
xy α z
= ln(x) + α ln(y)
− ln(z),
(B.32)
luego ahora derivamos a ambos lados y tendremos que dw dx dy = +α w x y
∆x ∆y ∆z − dzz −→ ∆w − z. = +α w x y
(B.33)
V´ ease que ´este resultado es exactamente el mismo que se conseguir´ıa con el m´etodo de las derivadas parciales. Por ejemplo, la frecuencia emitida o absorbida en el transcurso de una transmisi´on entre los niveles p y n del hidr´ogeno est´a dada por la relaci´on ν=
me4 820 h3
1 n2
− p12
,
(B.34)
donde n y p son n´umeros enteros y m es la masa del electr´on de carga e, siendo 4
R = 8me 2 h3 c ,
(B.35)
0
es la constante de Rydberg. Lo primero es verificar las unidades de dicha constante, digamos
me4 (M )(I 4 T 4 ) = −6 −2 8 4 6 3 −3 = T −1 (L M T I )(L M T ) 820 h3
me4 1 = T −1 T L−1 = L −1 . 820 h3 c (B.36) Ahora imaginemos que conocemos la relaci´on de la constante de Rydberg y quisieramos saber la incertidumbre en su medida en t´erminos de las cantidades anteriores, en este caso, podemos escribir, tomando logaritmos en ambos lados
R
ln( ) = 1 (ln(m) + 4 ln(e) 8
→ [R] =
− 2ln( 0) − 3ln( h) − ln(c)) ,
(B.37)
163
B. C´alculos de incertidumbre y de peque˜nas variaciones luego derivando a ambos lados de la igualdad, se tiene que
R R
ln( )
=
1 8
ln(m) ln(e) +4 m e
− 2 ln(00) − 3 ln(h) − ln(c) h c
(B.38)
,
y conociendo las incertidumbres en cada una de las medidas se tiene que c = (2,997925 0,000003) 10 8 )m/s, h = (6,6260693 0,000000011) 10 −34 )J s, e = (1,602176487 0,00000000040) 10−19 C , m = (9,10938215 0,0000000045) 10−31 kg, o sea,
×
±
×
×
±
×
·
± ±
ln( ) 12 R := = 6,66 10− . (B.39) Un ejemplo m´as. Piense en el p´endulo de torsi´on. La constante de Torsi´on C de un alambre, determinada por el m´etodo de oscilaciones de un p´endulo est´ a dada por la relaci´on
RR
×
C = 8π2 m
a 22 T22
− a21 − T12 ,
(B.40)
donde m es la masa de cada uno de los disco fijados sobre una barra horizontal a la distancia a del eje de rotaci´on. T1 y T2 son los periodos del p´endulo correspondientes a dos valores de a1 y a2 de a. Imag´ınese que se hizo la experiencia sobre un alambre de acero de masa (m = 354,0 0,5)g y las otras medidas fueron a 1 = (17,3 0,2)cm y a 2 = (37,3 0,2)cm, adem´as de T1 = (14,3 0,1)seg y T 2 = (17,6 0,1)seg. Luego
±
±
dC C
±
±
±
∆π ∆m a2 ∆a2 + a1 ∆a1 T2 ∆T2 + T1 ∆T1 + +2 +2 π m a22 a21 T22 T12 ∆π ∆m ∆a ∆T = + +2 +2 π m a2 a1 T2 T1 − 3 = (1,5 + 20 + 60) 10 10 %, = 2
−
−
×− ≈
−
(B.41)
ya que ∆a1 = ∆a2 := ∆a = 0,2cm y ∆T1 = ∆T2 := ∆T = 0,1seg. Por otro lado, la incertidumbre relativa m´as peque˜na es ∆m/m = 1,5 10−3 (mucho menor que la incertidumbre resultante). El error de π, para que sea despreciable, deber´a ser, por consiguiente, inferior a ese valor, esto se logra, tomando π = 3,14, lo que conduce a
×
× 10−3,
∆π =5 π
× 10−4,
∆π π
≈ 10−3.
(B.42)
× 9,86 × 0,354 × 1092 × 10−4 N w · m = 2,89 ×−2 N w · m ,
(B.43)
∆π = 15
y
2
Con lo cual C=
8
105,3
por consiguiente ∆C =
rad
C = 0,3 10
w·m × 10−2 N rad ,
y por ´ultimo C = (2,9
164
±
0,3)
rad
×
10
−
2Nw
m
·
rad
.
(B.44) (B.45)
Bibliograf´ıa [1] Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press. (1992). pp. 54-55 . ISBN 0-521-39459-7. [2] Olav Kallenberg, Probabilistic Symmetrie s and Invariance Principles. Springer Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4. [3] Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp. ISBN 0-387-95313-2. [4] P. Bevington and D. K. Robinson, Data reducti on and error analysis for the physic al sciences, 2nd ed. (McGraw Hill, New York, 1993). [5] Stuardt L. Meyer, Data analysis for scientists and engineers (John Willey & Sons, Inc., New York, 1975). [6] D. C. Baird, Experimentaci´on, 2a ed. (Prentice-Hall Hispanoamericana S.A., M´exico, 1991). [7] J. Higbie, Uncertainty in the linear regress ion slope. Am. J. Phys. 59, 184 (1991) [8] J. Orear, Least squares when both variables have uncertainties, Am. J. Phys. ibid., 50, 912 (1982). [9] Simple method for fitting data when both variables have uncertainties. D. Barker and L.M. Diana Am. J. Phys. 42, 224 (1974). [10] Linear least-squares fits with errors in both coordinates . II: Comments on paramete r variances - B. Cameron Reed - Am. J. Phys., Vol. 60, No. 1, 1992. [11] Estad´ıstica - M. Spiegel - McGraw Hill 2da. Ed. Bogot´a 1997 [12] S. Gil y E.Rodr´ıguez, F´ısica re-Creativa, Prentice Hall, Buenos Aires 2001. [13] Agresti, A. and Finlay, B., Statistical Methods for the Social Sciences, 3th Edition. Prentice Hall, 1997. [14] Anderson, T. W. and Sclove, S. L., Introductory Statistical Analys is. Houghton Mifflin Company, 1974. [15] Clarke, G.M. and Cooke, D., A Basic course in Statistic s.
165
Bibliograf´ ıa [16] Arnold, 1998. Electronic Statistics Textbook, http://www.statsoftinc.com/textbook/stathome.html. [17] Freund, J.E., Modern elementary statistics. Prentice-Hall, 2001. [18] Johnson, R.A. and Bhattacharyya, G.K., Statistics: Principles and Methods, 2nd Edition. Wiley, 1992. [19] Lepp¨al¨a, R., Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla, Tampereen yliopisto, Matematiikan, tilastotieteen ja filosofian laitos, B53, 2000. [20] Moore, D., The Basic Practice of Statistics. Freeman, 1997. [21] Moore, D. and McCabe G., Introduction to the Practice of Statistics, 3th Edition. Freeman, 1998. [22] Newbold, P., Statistics for Business and Econometrics. Prentice Hall, 1995. [23] Weiss, N.A., Introductory Statistics. Addison Wesley, 1999.
166