Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos procesos sociales
Índice Presentación Unidad I. La estadística descriptiva, los fenómenos naturales y procesos
1. Conocer los principios básicos de la estadística 2. Características de los fenómenos naturales y proceso sociales 3. Tipos de eventos: determinísticos y aleatorios 4. Fenómenos naturales y procesos sociales vinculados que pueden ser analizados utilizando la estadística 5. Tipos de variables: continuas y discretas, dependientes e independientes, cuantitativas y cualitativas 6. Muestreo: población, muestra, técnicas de muestreo 7. Ordenamiento Ordenamie nto de datos 8. Organización de información 8.1 Tablas de distribución de frecuencias 8.2 Tablas de distribución de frecuencias para datos no agrupados 8.3 Tablas de distribución de frecuencias de clase o de datos agrupados 9. Construcción de gráfcas
10. Distribución de probabilidad en los fenómenos naturales y procesos sociales 11. Distribución de probabilidad 12. Distribución binomial 13. Distribución de Poisson 14. Distribución normal 15. Conocer los tipos de hipótesis a probar en diversas investigaciones investigaciones científcas y
descartar las que no lo son Cierre Fuentes
1/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos procesos sociales
Presentación Propósito: Analizar fenómenos y procesos sociales de su entorno mediante el uso de conceptos conceptos básicos de la probabilidad y estadística (tipos de eventos, variables,
muestreo, grácas) para reconocer los diferentes diferentes tipos de distribución de la la información información y explicar el comportamiento de dichos fenómenos y proceso en un determinado contexto, en un ambiente de respeto y tolerancia.
Indicadores de desempeño:
•
Clasica un conjunto de fenómenos naturales y procesos sociales de acuerdo
a sus características especícas, con la nalidad de reconocer los de mayor mayor incidencia en su contexto. contexto.
• Identica los fenómenos naturales y procesos sociales en determinísticos y aleatorios de acuerdo a su naturaleza de ocurrencia para reconocer aquellos que puede analizar y predecir con elementos estadísticos.
•
Determina y analiza analiza los los tipos tipos de variables en la interpretación interpretación y explicación explicación de fenómenos naturales y procesos sociales.
• Identica y sitúa fenómenos naturales y procesos procesos sociales de su contexto contexto que pueden ser objeto de estudio estadístico y aquellos que no pueden ser estudiados a través de este método.
• Identica fenómenos fenómenos naturales naturales y procesos procesos sociales de su contexto y utiliza utiliza técnicas de muestreo para la obtención de datos que permitan interpretar y explicar dichos fenómenos que ocurren en su entorno.
• Identica y explica los diversos tipos de distribución de probabilidad a través través de grácas. Punto de partida En módulos anteriores estudiaste el uso de las matemáticas y la estadística en el conocimiento conocimiento y la interpretación de fenómenos naturales y sociales. Especícamente, el Módulo 13, Variación de procesos sociales , abordó modelos
2/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos procesos sociales
matemáticos para comprender las variaciones de los fenómenos sociales. En esta ocasión, retomarás a la estadística como una herramienta del conocimiento conocimiento
cientíco. Si bien en la historia de la l a humanidad, éste se ha aplicado de diferentes formas, en nuestra era, se sustenta en la posibilidad de demostrar y comprobar la interpretación interpretación que se tiene de un fenómeno, mediante el uso de la matemática, matemática, la
cual permite formular un pensamiento p ensamiento sólido, consistente y vericable. Es decir, decir, la comprobación ha requerido del desarrollo de la estadística con el n de recabar, ordenar y sistematizar los datos obtenidos de la realidad. Revisa el tema con atención, ya que puede ser de gran utilidad en la vida práctica. Vivimos en una era en la que se hacen campañas de publicidad con el argumento
de su vericación “cientíca”. Sin embargo, al concluir este módulo podrás p odrás constatar que existe muchas falsedad en esos mensajes publicitarios.
UNIDAD I. LA ESTADÍSTICA DESCRIPTIVA, LOS FENÓMENOS NATURALES Y PROCESOS 1. Conocer los principios principios básicos de la estadística La ciencia social logra avances gracias a diferentes formas de medición
y demostración de procesos humanos y naturales. Ninguna ciencia actúa independiente de las demás, aunque, probablemente, probablemente, la estadística es la
ciencia utilizada con mayor amplitud. Si observas, los datos estadísticos están en prácticamente todas las áreas del conocimiento: en medicina para la generación de nuevos nuevos medicamentos; en la demografía o estudio social de la población humana; en psicología en pruebas psicométricas; psicométricas; en deportes para calcular el desempeño de los participantes; entre muchos otros. Pero a pesar de lo anterior ¿qué es la estadística?,, ¿quién la inventó? y estadística? inventó? y ¿cómo ¿cómo funciona? La estadística nació como una actividad de
los gobiernos y su objetivo básico consistía en contar la cantidad de personas que estaban en su territorio, dicha actividad fue practicada por la primera dinastía de Faraones Faraones egipcios hace 3,000 3 ,000 años antes de Cristo. En China el emperador Yao usó
La estadística fue originalmen originalmente te una actividad de los gobiernos y su
objetivo básico consistía en contar la cantidad de personas en su territorio.
3/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos procesos sociales
la estadística para calcular el tamaño de sus actividades agríc agrícolas olas y de comercio comercio 2,238 años antes de Cristo. En Grecia, 1,200 años antes de Cristo, la estadística fue utilizada utilizada para conocer la cantidad de nacimientos, nacimientos, muertes y contabilizar contabilizar a los hombres con derecho a voto. En América, alrededor de 1,116 años antes de Cristo, el
rey Xolótl Xolótl del imperio Chichimeca ordenó contar a todos los súbditos que pagaban tributo (Wikipedia, 2016), entre muchos otros casos. Los iniciadores iniciadores de la estadística son muchos, pero en este módulo se centrará en tres principales: John Graunt, Adolphe Quetelet y Emile Durkheim. Graunt (1620-1674,
Londres) Londres) es considerado el primer demógrafo. Su obra Natural and Political Observations Observations Made upon the Bills e 1622 es un ejercicio de cuanticación of Mortality d
de nacimientos y decesos. Su objetivo fue calcular la propagación propagación de la peste bubónica en Inglaterra. Logró explicar dicha expansión de la enfermedad, pero su método era muy limitado porque no logró explicar en gran escala el problema de la peste bubónica ( Wikipedia, 2016) .
Adolphe Quetelet (1796-1874, (1796-1874, Bélgica) B élgica) fue el primer matemático matemático que aplicó las bases de la estadística a procesos sociales. Su obra L’homme et le développement de ses facultés ou Essai de physique sociale , sociale , publicada en 1896, construye una explicación sobre las sociedades
y cómo distinguirlas cuanticando la altura, el peso, la longevidad longevidad o cantidad de años de vida de las personas. También argumentó que la cantidad de suicidios y la duración de los matrimonios
podían ser exponentes de los “errores” “errores” en los que incurre una sociedad determinada al no aplicar el castigo adecuado a los delitos así como procurar la preservación de la familia. Con el tiempo su método tuvo mayor aplicación y avanzó en explicaciones certeras (Revista Índice, 2006) .
Pero fue Émile Durkheim (1858-1917, Francia) quien aplicó de forma rigurosa los principios de la estadística en la explicación de procesos sociales sociales como el suicidio. sociológico , editada En su obra Las reglas del método sociológico en 1895, señaló que los hechos sociales pueden ser
tratados como objetos; en otras palabras, la cuanticación de procesos sociales ayuda al cientíco social a quitar los prejuicios y permite p ermite encontrar lo que está detrás de aparentes situaciones situaciones
4/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
denominadas “normales” y “anormales”. Para Durkheim, el trasfondo de los procesos sociales puede ser demostrado en términos estadísticos en un contexto histórico
especíco en el que acontece el proceso en cuestión. Así, el observador puede conocer y medir los elementos que determinan diferentes procesos contextuales y cuantitativos de lo que analiza (Durkhiem, 1979). Un ejemplo del uso de la estadística en estos temas, es donde Durkheim demuestra
que el principal grupo que decide por el suicidio es el de los varones. Según la cuanticación que realizó, retomando datos de las morgues en Francia, la religión y la edad eran características asociadas al suicidio. Los hombres adultos mayores de 25 años católicos tenían mayor cantidad de muertes por suicidio.
John Graunt
Adolfe Quetelet
mile Durheim
Los autores que comenzaron a usar las matemáticas y la estadística en la explicación de procesos sociales, tuvieron interés por la época histórica y la sociedad en la que vivieron. La aplicación y difusión de la estadística se convirtió
en una herramienta para demostrar clara y objetivamente el curso de l as enfermedades, la razón de que las personas se suicidaran, las diferencias que conducen a que una sociedad sea más avanzada que otra, entre muchas otras cuestiones. ¿Cuáles son los principios básicos de la
estadística?
Los principios o las bases del pensamiento estadístico son el análisis y conocimiento del contexto de los datos, la fuente de los datos, el método de muestreo y las consecuencias prácticas.
La estadística fue originalmente una actividad de los gobiernos y su
objetivo básico consistía en contar la cantidad de personas en su territorio.
5/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
El contexto y la fuente de información consisten en conocer y analizar el objetivo de los datos recopilados: dónde y cuándo es recabada la información numérica.
Actividad Revisa los dos ejemplos siguientes:
A. Los estudiantes mexicanos de licenciatura suben un kilogramo de peso corporal durante sus primeros tres meses de clases.
B. Un estudio clínico realizado en el año 2004 para 200 personas en la Universidad de Chicago, EEUU, buscó la relación entre sobrepeso
y estrés. En el estudio se armaba que situaciones como los divorcios y las malas relaciones interpersonales en la escuela o el trabajo incrementan 10% los niveles de cortisol en el cuerpo, lo cual deriva en desajustes del metabolismo (Bienestar 180, 2016).
El ejemplo A es muy general y no precisa quién hace la armación ni indica el objetivo. El ejemplo B contiene la fuente, el objetivo y explica la relación entre sobrepeso y estrés. Por lo tanto, el objetivo y la fuente de los datos son información importante que asegura, se trata de un estudio estadístico.
El contexto y la fuente consisten en conocer y analizar el
objetivo de los datos recopilados, así como el lugar y tiempo de la información.
El método de muestreo hace referencia a los procedimientos utilizados para recopilar datos del estudio en cuestión. Es necesario mencionar que no es una actividad sencilla. El rigor en la recopilación es una condición indispensable
para sostener la conanza con la que puede aceptarse, por lo que no se debe olvidar que es una condición en
cualquier armación estadística. Por ejemplo, hay estudios estadísticos apoyados en una muestra de respuesta voluntaria y de muestra de respuesta aleatoria o al azar. En una muestra de respuesta voluntaria, las personas deciden participar en la encuesta o el estudio, esto genera un sesgo o distorsión en los resultados. Por otro lado una muestra aleatoria, implica que las personas
6/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
encuestadas tienen la misma probabilidad de ser elegidas. Entonces en una muestra de respuesta voluntaria la persona sabe previamente que será encuestada, esto produce una alteración en las respuestas. En una muestra aleatoria, la persona no sabe que será encuestada, es tomada por sorpresa, este procedimiento ayuda a disminuir las distorsiones en las respuestas.
Actividad Lee con atención los dos casos siguientes de muestreo.
C. La empresa operadora del tren suburbano Buenavista-Cuautitlán arma que 90% de sus usuarios están satisfechos con el precio que pagan al usar el tren en relación con el tiempo que ahorran de viaje. El estudio fue realizado por medio de Internet y se contó con la participación de 1,000 personas (Barrera, 2016).
D. Un investigador social demostró que 60% de los usuarios del tren suburbano Buenavista-Cuautitlán están inconformes con el precio que pagan usando este transporte. La armación está apoyada en una encuesta de 1,000 personas usuarias, realizada en las siete estaciones de dicho transporte.
¿Cuál de las anteriores armaciones utiliza la muestra aleatoria?, ¿Qué investigación utiliza la muestra de respuesta voluntaria? El caso C es una muestra voluntaria en la cual las personas usuarias de Internet consultan la página del tren suburbano y son invitadas a participar en una encuesta. En el caso D es aleatoria porque el investigador intercepta a los usuarios en las estaciones del tren sin saber que
participarán en una encuesta. Cada armación está apoyada en diferentes métodos de muestreo, sin importar cuál de los estudios es verdadero, la muestra genera
diferentes armaciones, por lo tanto pueden defender ideas contrapuestas de un mismo proceso social.
Muestra de respuesta voluntaria: las personas deciden participar y saben que serán encuestadas previamente.
Muestra aleatoria o al azar : las personas tienen la misma probabilidad de ser elegidas para la aplicación de encuestas, y no saben que serán encuestadas hasta que son interceptadas por los investigadores.
7/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Es importante señalar que los métodos de muestreo son actualmente determinantes para la validez de estudios sociales. Esto es así porque todo estudio social apoyado en información solicitada a personas debe seguir criterios de ética para investigaciones sociales (Triola, 2013, p. 6) los cuales consisten en:
Ética en estudios estadísticos : implica el consentimiento de las personas encuestadas al informar la
nalidad de la investigación, los datos son condenciales, el bienestar de las personas encuestadas está sobre los benecios que la investigación genere.
1. Todos los sujetos de un estudio deben dar su consentimiento y ser informados de la nalidad de la encuesta y del uso de su información.
2. Todos los datos de los individuos serán condenciales; ningún estudio puede hacer pública la información privada.
3. El bienestar de los sujetos siempre debe estar por encima de los benecios que el estudio brinda a la sociedad. Todo estudio estadístico buscará ser claro y tener armaciones comprensibles, cuando menos en sus conclusiones, para personas sin conocimiento de estadística; de lo contrario, el estudio sólo sería entendido por un sector muy reducido de personas. Por último, los estudios estadísticos deben ser valorados en su signicancia estadística y práctica, ambas son parte de las consecuencias aplicables.
Signifcancia estadística: demuestra, con base en un análisis matemático que un estudio estadístico es relevante y tiene efectos importantes a considerar.
Signifcancia práctica: consiste en reconocer que
27%
15% 58%
una investigación apoyada en el análisis estadístico tiene efectos importantes en la vida cotidiana.
8/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Un estudio con signicancia estadística es el que demuestra, con base en un análisis matemático, que un estudio estadístico tiene un efecto importante que se debe considerar. La signicancia práctica, por su parte, consiste en reconocer que una investigación apoyada en el análisis estadístico tiene efectos importantes en la vida cotidiana. Por ejemplo:
E. La dieta del doctor Atkins (Adelgazar rápido, 2016), la cual prescribe dejar de comer harinas y carbohidratos para bajar de peso, fue puesta a prueba por la investigación de Michael L. Dasinger (Dasinger et. al., 2003). El autor concluyó que las 40 personas que aceptaron tomar registros diarios de su peso durante un año, siguiendo la dieta de Atkins, lograron perder 950 gramos de peso, cantidad que es estadísticamente signicativa, no establece una signicancia práctica, en términos estadísticos, porque perder menos de un kilo en un año con esa dieta indica que no funciona para las personas estudiadas.
Actividad
Busca en Internet un caso similar al inciso E, donde la dieta logre tener signicancia práctica y signicación estadística. En resumen, los principios de la estadística son: •
Tener siempre presente el contexto de los datos pesentados en un estudio.
•
Observar cuál es la fuente o autor del estudio.
•
Entender y analizar el objetivo del estudio estadístico.
•
Identicar la técnica de recolección de datos o el proceso de muestreo.
•
Considerar si las conclusiones propuestas logran la signicancia estadística y signicancia práctica.
•
Observar si el estudio cumple con los criterios de ética.
Por lo tanto, la estadística es una herramienta cientíca que permite demostrar el efecto de procesos naturales y sociales. Los datos estadísticos no son verdad ni válidos por sí mismos. Los números no mienten, pero pueden ayudar a engañar si omiten y ocultan los principios antes mencionados.
9/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
2. Características de los fenómenos naturales y procesos sociales Lee con atención el siguiente segmento de un artículo de revista:
Sin confanza en la policía ( Castillo, 2016) El 70.3% de los adolescentes no se siente seguro en las calles, el
19.5% dice haber sufrido violencia y el 17.4% (83,392) participado en actos violentos, según los resultados de la Consulta Infantil y Juvenil 2015 realizada por el Instituto Nacional Electoral (INE). En la consulta participaron 2 millones 916,686 niñas, niños y adolescentes de los 6 hasta los 17 años. 19,079 adolescentes entre 14 y 17 años revela que han sido obligados a formar parte de un grupo de delincuentes. Si se habla de conanza, 2 1.7% dice conar en la policía, el 25.2% en el
ejército, el 4.9% en los partidos políticos y el 5.2% en los gobernantes. El factor conanza se centra en la familia con un 95.9% y en las amistades con un 70.3%
Sólo el 35% de los adolescentes encuestados pediría ayuda a un policía en una situación de peligro y el 5% a una institución de gobierno. Fuente: http://www.animalpolitico.com/2016/03/la-corrupcion-el-otro-castigo-para-los-
jovenes-infractores/
10/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
El argumento propuesto por Alejandra Castillo en su nota periodística puede ser analizado con los puntos del Tema 1, es decir, puede generar preguntas como: ¿Tienen validez los datos que presenta?, ¿indica cómo realizó el muestreo?, ¿qué
signicancia estadística y práctica tienen los datos presentados? Éste es un ejemplo que aborda un tema delicado, es decir los jóvenes y la relación con su entorno social. Quizá su muestra y la presentación del análisis dejen muchas dudas, pero permiten imaginar el tamaño del problema que describe.
Así una pregunta para la reexión: ¿Es adecuado explicar el comportamiento de la juventud y su relación con la delincuencia como lo propone la autora? ¿Y tú, cómo lo estudiarías?
Con base en el trabajo que se realizará en este módulo, es posible analizar las características de los fenómenos naturales y los procesos sociales. Para conocer las bases teóricas que permiten explicar los fenómenos naturales y sociales
es necesario entender algunos temas de losofía de la ciencia y los principios relevantes del positivismo. Con esos puntos tendrás un marco teórico sólido para explicar por qué los fenómenos naturales y sociales pueden ser estudiados por medio de la estadística. En el Tema 1, autores como Quetelet y Durkheim traducen los procesos sociales
a números. Mediante ese recurso cuantitativo buscan “limpiar” de prejuicios los eventos que eligieron en un tema de investigación. Ambos autores están
rmemente apoyados en la propuesta del positivismo. s una forma de trabajo cientíco El positivismoe que acepta los siguientes principios o reglas del pensamiento cientíco: la medición, el empirismo y la verificabilidad. La de un fenómeno implica el vínculo entre conceptos abstractos con indicadores empíricos (Hernández Sampieri et. al., 2014). El empirismo consiste en una forma de hacer ciencia, la cual acepta únicamente la validez de eventos captados mediante los sentidos como el tacto, la vista, el olfato, el oído.
11/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
En otras palabras, un evento es válido si es posible tocarlo, verlo y escucharlo; es decir, condiciones que hacen posible notar el tamaño del fenómeno elegido para conocerlo por medio de su estudio. Finalmente, el positivismo se fundamenta en el principio de verifcabilidad. Esta regla de pensamiento indica que los fenómenos captados con los sentidos y con capacidad para ser medidos, pueden ser comprobados en todos los casos.
Se explicarán estos principios mediante ejemplos: El positivismo es una forma
de trabajo cientíco que acepta los siguientes principios o reglas
de pensamiento cientíco: la medición, el empirismo y la
vericabilidad.
En un parque se observa que las ardillas
adultas son de color rojo o negro, y se cuentan 200 de un total de 500 que habitan en ese lugar. Entonces con esos hechos se está en condiciones de indicar lo siguiente:
Todas las ardillas adultas son de color rojo o negro.
En un segundo ejemplo, según los datos de CONAGUA, en el año 2015 las lluvias más intensas acontecieron, en gran parte del territorio nacional, en mayo. Por lo tanto, se puede concluir lo siguiente: Todos los años, en el mes de mayo tienen lugar los mayores índices de lluvias a nivel nacional. Con base en tu experiencia: ¿son válidos los ejemplos anteriores?,
¿son certeras las armaciones? Si observas, no todos los eventos naturales suceden exactamente en las mismas fechas; y en el caso de las ardillas adultas, al consultar la biología conoceremos
que exiten distintos tipos de ardillas, por ejemplo, en Exeter, Canadá son albinas (adultas). Por su parte, en el estudio de Castillo no se puede armar que todos los jóvenes entre 14 y 17 años son obligados a formar parte de grupos delictivos. Al considerar los puntos anteriores, hay características de los fenómenos naturales los fenómenos naturales y de los procesos sociales que son susceptibles de ser expresados en términos
medibles, empíricos y vericables por otros investigadores en otros lugares. No hay leyes universales o infalibles que indiquen que lo medido a través
de estadísticas sea igual en todos los casos. Sin embargo, la estadística trabaja con datos numéricos y, por medio de ellos, es posible indicar los rasgos singulares de una población y, de este modo, obtener información con la cual se pueden hacer cálculos.
12/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Los fenómenos naturales y los procesos sociales tiene las siguientes cualidades: son expresables en términos
medibles, empíricos y pueden ser vericados por otros investigadores en otros lugares.
En síntesis, todos los fenómenos naturales y los procesos sociales pueden ser expresados en términos medibles y empíricos, además cuentan con capacidad para
ser vericados. En los siguientes temas se presentarán las formas en que puede ser evaluada la calidad de los datos generados en explicaciones estadísticas.
13/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
3. Tipos de eventos: Determinísticos y Aleatorios
Existen dos maneras de clasicar los sucesos que analiza un investigador en estadística: eventos determinísticos y eventos aleatorios. Los eventos determinísticos consisten en sucesos predecibles con total precisión (Rojas Portilla et. al., 2009). Por ejemplo, es posible predecir que al reunir 5 manzanas con 4 naranjas se obtendrá una cantidad de 9 unidades. Los eventos determinísticos dejan poco que discutir en cuanto a lo que va suceder. 3
6
Otro ejemplo. ¿Cuántos enteros se formarán al sumar 4 + 8 ? ¿Es un resultado que ofrece incertidumbre? Es decir: ¿Puede existir un resultado entre 1 y 100? Al sumar tres cuartos más seis octavos se obtiene un resultado de doce octavos, lo que permite formar un entero y dos cuartos: Los eventos determinísticos no pueden variar
si lo hace una persona u otra, y si lo hace en un lugar u otro. Es decir, no cambian los resultados si lo realiza una persona el 1° de enero de 2016 y si otra persona lo realiza el 1° de marzo del mismo año, o si lo hace en China o en México, la
Los eventos determinísticos varían si
lo hacen diferentes personas en diferentes momentos o lugares.
suma de tres cuartos más seis octavos seguirá siendo un entero y dos cuartos:
14/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Eventos aleatorios: consisten
en sucesos donde se puede calcular el resultado, sin saberlo con precisión.
Ahora bien, los eventos aleatorios se basan en sucesos donde se puede estimar su resultado, sin saber con precisión el mismo. Por ejemplo: ¿Lloverá hoy?, ¿Los autos color rojo chocan con mayor frecuencia? En los ejemplos anteriores los resultados son inciertos. Se puede indicar que sucedará o no, sin saber con exactitud cuándo y cómo.
Para ese tipo de eventos, las matemáticas y la estadística han desarrollado un cúmulo de teorías y procedimientos con los cuales puede calcularse la probabilidad de que suceda o no el evento indicado. La primera forma para organizar el análisis de eventos aleatorios consiste en separarlos en tres formas: evento, evento simple y espacio muestral (Triola, 2013). Un evento es cualquier conjunto de resultados. Un evento simple es un resultado que no puede desglosarse en eventos simples. El espacio muestral está compuesto por todos los eventos posibles, es decir, son todos los resultados que ya no pueden desglosarse más. Por ejemplo: ¿Cuál es el espacio muestral de tres nacimientos registrados en un hospital durante el primer turno del día? El espacio muestral queda de la siguiente forma:
Caso analizado
Nacimientos registrados en un hospital durante el primer turno
Ejemplo de evento
Espacio muestral completo
Evento simple. Que el primer nacimiento sea niña (f) [f, m, fmf, fmm, m,
Evento simple. Que el segundo nacimiento sea niño (m)
mfm, mmf, mmm]
15/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Como puedes observar, los eventos simples son aleatorios: no se sabe exactamente si en el primer nacimiento será niño o niña, descartando que se conozcan los análisis previos neo-natales. Ahora bien, con los eventos aleatorios puede calcularse
la probabilidad de que suceda un evento especíco. Para ello hay tres métodos que se emplean en estadística para realizar dicho cálculo:
Método de frecuencias relativas . Consiste en calcular la probabilidad de que suceda un evento, teniendo registros previos. Este método asume que tales registros son correctos y calcula la
probabilidad de que suceda en el futuro un evento especíco. Método clásico. Consiste en aceptar que todos los eventos tienen la misma probabilidad de ocurrir.
Método de probabilidad subjetiva. Consiste en observar los resultados de eventos pasados y agregar elementos del contexto que puedan afectar el resultado que es analizado, además de que propone una probabilidad sin usar procedimientos matemáticos.
Método de frecuencias relativas . Consiste en calcular la probabilidad de que suceda un evento, teniendo registros previos.
Método clásico. Todos los eventos tienen la misma probabilidad de ocurrir.
Método de probabilidad subjetiva. Observa los resultados de eventos pasados y agrega elementos del contexto que pueden afectar el resultado, el cual es analizado, además no usa procedimientos matemáticos. En el primer caso, el método de frecuencias relativas s irve en ejemplos como el siguiente: En un año reciente en EEUU, de un total de 135,670,000 de autos registrados (según la Statiscal Abstract of the United States ) sólo tuvieron accidentes 6,511,100 ¿Cuál es la probabilidad de que un auto tenga un accidente? La solución por medio del método de frecuencias relativas es: la probabilidad de
que un auto tenga un accidente es igual al número de automóviles accidentados entre el número total de accidentes.
16/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
6,511,100
0.047
135,670,000
uede usarse en ejemplos como el siguiente: Determina la El método clásico p probabilidad de que exactamente dos de los tres nacimientos registrados en el hospital de la Tabla 1. Tipos de eventos sean varones. Para resolverlo, primero es necesario identicar correctamente el espacio muestral.
Espacio muestral Nacimientos registrados durante el primer turno de un hospital Primer nacimiento
Segundo nacimiento
Tercer nacimiento
Niño
Niño
Niño
Niño
Niño
Niña
Niño
Niño
Niña
Niño
Niña
Niña
Niña
Niño
Niño
Niña
Niño
Niña
Niña
Niña
Niño
Niña
Niña
Niña
El espacio muestral consta de ocho diferentes combinaciones y sólo tres responden exactamente a la probabilidad buscada: dos, de los tres nacimientos registrados, sean varones. Por lo tanto, usando el método clásico, queda de la siguiente forma:
Por último, el método subjetivo p uede ser utilizado en ejemplos como el siguiente: ¿Cuál es la probabilidad de quedar atrapado en un elevador? En estos casos no hay datos previos, tampoco es posible calcular un espacio muestral, por lo tanto se
17/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
recurre a la experiencia propia y nos percatamos de que nunca hemos quedado
atrapados en un elevador. Sólo sabemos de algunos comentarios de personas, por lo tanto estimamos que hay una probabilidad de 1 en 10,000; es decir, existe un 0.0001 de quedar atrapado en un elevador. La probabilidad sólo es estimada con base en datos de nuestra experiencia. Finalmente, cabe señalar que la probabilidad es diferente a la posibilidad. Lo probable puede ser calculado por medio de los métodos de frecuencia relativa
o con el método clásico. La posible, es una estimación subjetiva y no cuenta con ningún apoyo en datos. No los uses como sinónimos.
4. Fenómenos naturales y procesos sociales vinculados que pueden ser analizados utilizando la estadística La expresión numérica de
los fenómenos naturales y de los procesos sociales permite analizarlos con herramientas matemáticas y estadísticas.
Con el estudio de los temas previos, se aprecia que la estadística es una herramienta
cientíca que puede calcular y explicar los eventos expresados en términos cuantitativos. En este sentido, hay una gran cantidad de fenómenos naturales y procesos sociales que pueden ser estudiados con la estadística.
Retomando un tema actual, ¿cuáles son los fenómenos naturales y los procesos sociales vinculados que generan el cambio climático? Existen al menos dos líneas de análisis que responden a esa pregunta: a) las actividades humanas generan cambios en el ambiente natural del planeta y b) el planeta evoluciona y las acciones humanas tiene poco o nulo efecto sobre dicha transformación.
Para la nalidad de este tema se asume la respuesta a), las actividades humanas generan cambios en el ambiente natural del planeta. En este caso, uno de los temas centrales es la contaminación de los ecosistemas por la expulsión de dióxido de carbono a la atmósfera.
18/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
La respuesta más aceptada actualmente es que las altas concentraciones de dióxido de carbono producido por las ciudades acelera el cambio climático en la atmósfera del
planeta. Como lo indica la revista Ecojoven (Ecojoven, 2016) , el dióxido de carbono es
producido por las sociedades humanas, el cual ha aumentado de manera más acelerada desde la Revolución Industrial del siglo XIX. Desde otra perspectiva, según Mario F. Triola (Triola, 2013, p. 727) las concentraciones de dióxido de carbono han aumentado notablemente desde el año de 1880 hasta el 2000, situación que puede ser demostrada numéricamente por medio del registro de la cantidad de dicho gas en la atmósfera y el incremento de actividades humanas como el transporte motorizado de combustión interna, el creciente uso de combustibles fósiles como el petróleo, el consumo de energía eléctrica en la ciudades y la producción industrial.
Concentraciones de dióxido de 1880 a 2000 (Triola, 2013) Año
Partes de dióxido de carbono por millón
1880
290.7
1890
293.7
1900
295.6
1910
299.4
1920
301.4
1930
305.9
1940
307.4
1950
311.3
1960
316.9
1970
325.7
1980
338.7
1990
354.2
2000
369.5
19/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Si investigas lo que acontece en México entre 1970 y 1990, periodo en que la cantidad de dióxido de carbono aumentó en 30 millones de toneladas, podrás
constatar lo siguiente: En 1970 México tuvo 1,233,824 autos particulares y para 1990 llegó a 6,349,025 autos (Navarro, 2012). Asimismo, el consumo de energía eléctrica en casas habitadas durante 1970 fue del 16.6% y para 1990 llegó a 22.2% del total
producido en México. El consumo de energía eléctrica del sector industrial en 1970 fue del 54.7 y para 1990 llegó a 57.2% del total de energía producido en México (Cámara de Diputados, 2001).
Por lo tanto, con los datos señalados, se puede resumir que las actividades humanas tienen efecto en la cantidad de dióxido de carbono lanzado a la atmósfera. Particularmente las dos décadas que van de 1970 a 1990 muestran que la cantidad
de autos particulares creció en México cinco veces y el consumo de energía eléctrica lo hizo en 6%. Por lo tanto, si se analizan estadísticamente la cantidad
de autos que circulan actualmente en la Ciudad de México o bien se cuantica la cantidad de horas que están encendidos los aparatos electrodomésticos en
cada hogar y se asocia con el tipo de actividad que tenemos, trabajo, estudio, cocina, entre otros, se puede calcular el impacto de las actividades humanas en el incremento de dióxido de carbono en la atmósfera. Finalmente, la expresión numérica de los fenómenos naturales y los procesos sociales permite analizarlos con herramientas matemáticas y estadísticas. Con dicho proceso de análisis puede mostrarse la asociación de las actividades humanas y los fenómenos naturales que acontecen en nuestro planeta.
5. Tipos de variables continuas y discretas, dependientes e independientes, cuantitativas y cualitativas La estadística utiliza datos cuantitativos para desarrollar sus formas de medición
y cálculo. Sin embargo, en la vida cotidiana no están a nuestra disposición todos los datos numéricos de los problemas y objetos de investigación. Por ejemplo, no existen datos precisos de la cantidad de smartphones que tienen las personas que
viven en la Ciudad de México. No hay datos exactos de las personas que separan la basura en orgánica e inorgánica en el Estado de México, entre muchos otros puntos.
20/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
En muchos casos es necesario que el investigador genere su propia información
según el objeto de estudio y los objetivos que se proponga. Por supuesto, es posible consultar los datos de INEGI, pero no siempre responderán a los intereses
especícos de cada investigación.
Término o variable: concepto susceptible de medir y de ser expresado de forma cuantitativa.
Además de lo anterior, si ya se tiene la información necesaria para realizar un análisis estadístico, es necesario revisar que
responda a los objetivos y a las deniciones deseadas. Por ello, en estadística, las variables y las formas en las que pueden
ser recuperadas y analizadas deben pasar por una primera fase de denición; es decir, el investigador debe conocer si sus variables son cuantitativas o cualitativas; así como es indispensable conocer si las variables principales son continuas o discretas. Además, es necesario establecer cuál es la variable dependiente y cuáles serán las variables independientes. Por ello, este tema procede a indicar los rasgos de cada una de las variables mencionadas.
21/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
En primer lugar, un término o variable es un concepto susceptible de ser medido y expresado de forma cuantitativa. Es importante asegurarse de que las variables son medibles y observables. Regularmente, al iniciar una investigación, algunas personas cometen el error de introducir variables que no son posibles medir o
bien se proponen variables como “mal gobierno”, “mal comportamiento”, “actividad inhumana”, entre otros, que no han indagado previamente. Como se hace en algunos estudios, en los cuales se expresan mediciones de actividades como la corrupción, la indisciplina y la violencia. Por lo tanto, en estadística siempre se
debe estar seguro de que las variables sean expresadas en números, según las deniciones teóricas revisadas previamente. Por ejemplo:
Como puedes notar, las variables de
Variables independientes : tienen cambios en diferentes casos.
todos los ejemplos anteriores cambian o tienen variación. Si el procedimiento de construcción no es X , y se cambia por el procedimiento Y , entonces su efectividad
será otro, por ejemplo, de 60%. Lo importante es reconocer que las variables tienen cambios medibles en diferentes casos y en diferentes contextos.
Variables dependientes : variables de las que se desea saber si tienen cambios en relación con las variables independientes.
Las variables pueden ser divididas en dependientes e independientes. Las primeras son las que se desean probar, si tienen cambio o no. Las variables independientes son las que tienen cambios en diferentes casos. Por ejemplo,
22/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
al establecer la relación entre la efectividad de titulación y las tareas no entregadas a tiempo por semana, la edad y el género. O bien, al establecer la relación entre cometer una infracción de tránsito, tomando en cuenta las variables de edad, género y años de conductor. Como muestra la tabla, regularmente la variable dependiente es representada con la letra “Y ” y las variables independientes con la letra “X ”.
Como puedes observar, las variables dependientes “ Y ” son los eventos que deseamos poner a prueba. Las variables independientes “ X ” cambiarán según respondan las personas a las cuales aplicamos un cuestionario.
Después de establecer las variables independientes es indispensable observar la forma que tienen. En estadística es un procedimiento común indicar si las variables consisten en elementos cuantitativos o no cuantitativos, razón por la que las primeras son llamadas variables cuantitativas y las segundas variables cualitativas.
23/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
son datos numéricos que expresan el concepto que se Las desea mostrar por medio de un análisis estadístico. Este tipo de variables están subdivididas en dos niveles de medición: las primeras son las variables discretas, las cuales pueden ser contadas en número enteros. Las variables continuas son datos numéricos expresados en fracciones. Las variables cualitativas representan categorías o atributos, y consisten en nombres o etiquetas. A su vez están subdivididas en dos niveles de medición: nominales y ordinales. Las primeras son variables cualitativas que no tiene un orden especíco. Las variables cualitativas ordinales sí tienen un orden especíco. Por ejemplo:
6. Muestreo: Población, muestra, técnicas de muestreo La estadística puede generar explicaciones
generales para una población especíca o bien
Población: compuesta por el conjunto total de todos los elementos, individuos o
eventos especícos.
explicaciones generalizables; es decir, una muestra cuyos resultados es posible hacerlos extensibles a la población total que nos interesa. Estas dos situaciones son las más problemáticas en la vida real, porque no siempre es posible tener los datos de toda una población; por supuesto, el hacerlo depende del tamaño de la población a la cual deseamos analizar. La estadística tiene una poderosa herramienta para generar diferentes niveles de explicaciones dependiendo de la magnitud de la población que se desa investigar. Esa herramienta consiste en
24/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
el muestreo, la cual consta que la recolección de información de una parte de la población que es analizada por medio de técnicas de recolección. En primer lugar, la estadística asume que todo análisis realizado emerge de una
población¸ la cual se compone del conjunto de todos los elementos, individuos o eventos especícos. Es común encontrar que los “censos” contienen el total de información de una población especíca, como sucede con la información disponible en INEGI. Un censo, es decir la extracción de información de toda la población es costoso y requiere muchos recursos en tiempo, personas y otros insumos. Piensa en los 120 millones de personas que vivimos a lo largo y ancho del país. También hay otras agrupaciones llamadas
poblaciones. Por ejemplo, hay poblaciones de menor tamaño, como un lote de objetos o el total de mercancías que produce una empresa en un periodo determinado, por
ejemplo, una semana. Por supuesto no es
Muestreo: proceso por el cual se recopila información de una población. Muestra: información que recopila por medio del muestreo.
el total de lo que produce una empresa en el total de años que lleva en operación, pero sí es una población del total de mercancías elaboradas en periodo de tiempo
especíco y que tienen características únicas. También hay otras agrupaciones llamdas poblaciones. Por ejemplo, hay poblaciones de menor tamaño, como un lote de objetos o el total de mercancías que produce una empresa en un periodo determinado, por ejemplo, una semana. Por supuesto no es el total de lo que produce una empresa en el total de años que lleva en operación, pero sí es una población del total de mercancías elaboradas en periodo
de tiempo especíco y que tienen características únicas. La muestra es una parte del total de la población que nos interesa analizar con la
estadística. Por lo tanto, el muestreo es el proceso por el cual se reúne información de una población. La información recopilada por medio del muestreo se llama muestra.
Los métodos de muestreo se reeren a diferentes formas de recolectar información para generar una muestra. En general, hay dos grandes grupos de muestreo: el muestreo aleatorio y el muestreo sistemático. Ambos métodos de muestreo
tienen sus ventajas y limitaciones. Por otra parte, ninguno de los métodos es descartable; en todo caso, eso depende de los recursos y de los objetivos que sean buscados por el investigador.
25/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
La diferencia entre ambos métodos de muestreo depende del contexto y los rasgos de la población que se estudiará. Observa el siguiente cuadro:
Como puedes observar en la tabla, el muestreo aleatorio tiene mejores posibilidades para generalizar los datos. Si 200 tornillos tienen fallas visibles en su acabado, se puede indicar que la población total de los 5,000 tornillos tiene fallas. En el caso de la encuesta sobre uso de zapatos de tacón, los resultados de la
muestra son especícos para las personas encuestadas y no son generalizables. Sin embargo, puede decirse que las mujeres encuestadas en ese tiempo y espacio tienen ciertos rasgos especícos para las personas que contestaron el cuestionario. No se pueden extender esos datos a todas l as mujeres que acuden a las plazas comerciales.
26/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
7. Ordenamiento de datos Ordenamiento de datos : implica la jerarquización y la
El ordenamiento de datos implica su
jerarquización y organización de forma
organización de los datos de forma que puedan ser analizados de
que pueda ser factible su análisis. El primer paso para ordenar los datos implica forma eciente. reconocer el tipo de variables, tal como lo indica el Tema 5. Posteriormente, el investigador procede a iniciar el análisis de variables por separado o bien todas al mismo tiempo. Eso dependerá de la cantidad
de información con la que trabaje y de los objetivos que tenga la investigación con apoyo de procedimientos estadísticos. El siguiente tema profundiza en la parte operativa de la ordenación de datos. En síntesis, el ordenamiento de datos consiste en realizar estos pasos:
a) Determinar las variables dependientes e independientes. b) Establecer y ordenar jerárquicamente las variables discretas y continuas. c) Indicar cuántas y cuáles son las variables cualitativas que se van a utilizar. En este tema, el ordenamiento de los datos es un paso indispensable para poder darles un tratamiento estadístico consistente, de utilidad para conocer fenómenos sociales y naturales.
Actividad Desarrolla el siguiente ejercicio: 1. Contabiliza la edad en años cumplidos, el género y el grado escolar de estudio, en años y fracciones de los mismos tomando como referencia la primaria, de 20 vecinos de tu colonia. Comienza con personas que conozcas.
rganiza la información según el ejemplo: 2.O Variable cualitativa
Variable discreta
Variable continua
Género
Edad en años cumplidos
Grado escolar en años de estudio
Mujer
25 años
12.5 años de estudio
Hombre
18 años
10.5 años de estudio
...
27/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
8. Organización de información Por medio de los métodos como el muestreo, un investigador puede obtener una
gran cantidad de datos en relación al fenómeno que esté estudiando. Sin embargo, los datos por sí solos no proporcionan información sobre el fenómeno, por lo que es necesario pasarlos por un proceso que los sintetice o resuma de manera que sea más sencillo interpretarlos, entenderlos y usarlos. Las tablas de distribución de frecuencias son la herramienta para organizar y tratar los datos para que permitan observar la forma de su distribución.
8.1 Tablas de distribución de frecuencias En las tablas de distribución de frecuencias los valores de la variable, es decir, los datos (x i ) son organizados de manera ascendente o descendente junto con ) de cada dato. Es decir, el número de veces que el dato es las frecuencias (f i observado dentro de una tabla. La tabla puede ser para datos no agrupados, así como para datos agrupados o de intervalos de clase.
8.2 Tablas de distribución de frecuencias para datos no agrupados En el caso de que los datos se apropien de un número pequeño de valores o si la variable es discreta. Por ejemplo, cuando se toman sólo números enteros, es posible acomodar los datos en una columna y sus frecuencias respectivas en la segunda, ya
que la longitud de la tabla no será demasiado grande. Sin embargo, para un mejor estudio de los datos es conveniente considerar diferentes tipos de frecuencias, como son las siguientes:
Frecuencia absoluta (f i ). Es el número de veces que aparece un determinado dato x en el estudio. La suma de las frecuencias absolutas siempre es igual
al número total de datos que se estén considerando. Usualmente el número total se representa por la letra N mayúscula y el número total de variables a considerar se denota por minúscula. Entonces: 1 + f 2 + f
• • •
+ f n = N
Frecuencia relativa ( fr i ). En este tipo de frecuencia se hace la proporción de
la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es igual a 1.
f ri =
f i N
28/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Frecuencia acumulada ( fa i ). Es la suma
de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Por ejemplo, si hay 8 datos ordenados de menor a mayor, x1 , x2 , ... , x8 y se quiere saber el valor de la frecuencia acumulada del dato 5, la operación sería: a = f 1 + f 2 + f 3 + f 4 + f 5 f 5
Nota: En algunas ocasiones las frecuencias relativas y las relativas acumuladas se presentan en porcentajes, para lo cual basta con multiplicar esas cantidades por 100%.
Frecuencia relativa acumulada ( fra i ). Es
el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.
f r a i =
f a i N
Para mostrar la construcción de la tabla de distribuciones de frecuencias de datos no agrupados se considerará el siguiente ejemplo: Ejemplo 8.2
En un salón al que asisten 30 alumnos se les preguntó cuántos vasos de refresco consumieron en la semana anterior a la aplicación del cuestionario. Las respuestas obtenidas de los alumnos fueron las siguientes: {5, 6, 3, 1, 0, 4, 3, 1, 5, 5, 3, 2, 1, 2, 3, 2, 3, 4, 4, 1, 4, 1, 1, 3, 3, 1, 0, 0, 0, 2}
El primer paso para el tratamiento de los datos es agruparlos en orden ascendente, como se hizo a continuación: {0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6} De esta manera la tabulación de distribución es más sencilla, puesto que es fácil contabilizar cuantas veces se repite cada valor. La siguiente tabla incluye los diferentes tipos de frecuencia, a la vez que se expone la forma de calcularlas:
29/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Una vez teniendo la tabla de distribuciones de frecuencias es natural preguntarse acerca de la utilidad de esta,
Nota: Si realizas la operación en
Por ejemplo, de la tabla anterior se
las frecuencias relativas es posible que notes que la suma no es exactamente 1. Esto se debe al error que se causa por redondear el resultado de la división. Usualmente este es un resultado aproximado y se
pueden desprender, entre otras, las
ajusta según sea necesario.
pues en ella es muy sencillo identicar información sobre el conjunto de los datos. Pero ¿qué tipo de información?
siguientes armaciones: 1. Dado que la cantidad de alumnos que tomó 5 o más vasos de refresco es de 4 y se tienen 30 datos, se puede decir que
la mayoría consumió menos de 5 vasos de refresco. El porcentaje de alumnos que tomó menos de 5 vasos de refresco es de 87%.
2. El porcentaje de alumnos que tomó 5 vasos de refresco es de 29% 3. Ningún alumno tomó más de 6 vasos de refresco en la semana.
30/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Como puedes notar la información es presentada de manera entendible más que la lista de las respuestas a los alumnos. En realidad a lo que se dio importancia fue a dicha respuesta no a quién pertenecía. Para esta tabla la variable no era el niño sino
la cantidad de vasos que tomaba, y de ésta se extrajo la información. Dado que la cantidad de variables es pequeña, se pudo registrar cada una de ellas.
Existen casos en que esto resulta inapropiado para trabajar, aunque no hay una regla precisa de cuándo considerar todas las variables o cuándo agruparlas. Se recomienda que si el número total de datos N es mayor de 50 o si el recorrido de la serie de datos es mayor de 20, entonces se use el esquema agrupado de datos. En la siguiente sección se estudia la distribución con datos agrupados.
8.3 Tablas de distribución de frecuencias de clase o de datos agrupados En este caso la tabulación de los datos están ordenados en clases y aparece la frecuencia de cada una; es decir, los datos originales de varios valores cercanos en el conjunto se combinan para formar lo que se llama intervalo de clase. Por
ejemplo, en lugar de tomar la edad exacta de personas, pueden tomarse intervalos de edad: de 0 a 5 años, de 6 a 10, entre otros. Es más conveniente usar la distribución agrupada cuando las variables tomen valores continuos; es decir, la variable puede tomar cualquier valor entre dos
números dados al realizar un experimento. Por ejemplo, cuando se están considerando mediciones de longitud de algunos objetos. Ésta magnitud puede variar sólo milímetros entre los objetos y no tendría caso tabular los que tienen exactamente la misma medida. Es más útil saber cuántos objetos tienen una longitud que oscila en un cierto tamaño, como puede ser entre 1 y 3 cm. Para realizar la organización en clases se necesita un arreglo determinado de las observaciones, y para lograrlo se requiere seleccionar los intervalos de clase. Esta
selección depende de los datos o del fenómeno a estudiar. Sin embargo, el método más usual para el tratamiento de la información puede contener los siguientes puntos:
1. Ordenar los datos de menor a mayor para su clasicación. 2. Determinar la magnitud de la variación de los datos o el rango ( R ), es decir, la longitud del intervalo ( I ) en el que están contenidos todos los datos:
31/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
R = x máx - x min ; I = [ xmáx , x min ]
Donde x min , x más son los datos de menor y mayor valor numérico respectivamente.
3. El siguiente punto útil es defnir la cantidad de clases, el número de clases (Nc ) debe tener un tamaño razonable para poder interpretar la información en la tabla. Existen varios métodos para determinar este número: a. Método de raíz. Consiste en sacar la raíz cuadrada del número de datos ( n ) que se tengan y redondearlo hasta el siguiente entero en caso de que no sea exacta:
Nc = n b. Método de Sturges. Consiste en la elaboración de la siguiente operación matemática para obtener el número de clases: Nc = 1+3.3 (log10n). Se requiere de la operación de log10n, el cual es el logaritmo en base 10 del número de datos. Para realizar la operación puedes hacer uso de una calculadora científca o visitar el enlace http://www.wolframalpha.com/ input/?i=log10(). La operación es sencilla y sólo se escribe dentro del paréntesis el valor del número que quieres calcular, su logaritmo base diez y la página arroja el resultado (además proporciona mucha información adicional que requiere mucho más estudio de los temas siguientes para entenderlo mejor).
Logarítmos decimales De todas las posibles bases que pueden tomarse para los logaritmos, las más usuales son la base 10 y la base e. Los logaritmos que tienen base 10 se llaman logaritmos decimales, logaritmos vulgares o logaritmos de Briggs, y para representarlos se escribe sencillamente log sin necesidad de especifcar la base:
log 10 X = log X Para saber más, consulta en siguiente enlace: https://youtu.be/xTxNSVxh6uI
32/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
4. Una vez que se sabe cuántas clases hay, es necesario determinar el tamaño que tendrá cada clase, denominado amplitud de clase (Ac ), de manera que todos los datos que se tengan pertenezcan a alguna de ellas, para esto se realiza la operación: R
Ac =
Nc
5. Denir los límites superior (Ls ) e inferior ( Li ) de cada clase para que sean claras al momento de poner los datos. 6. Para evitar ambigüedades en el reparto de los datos se consideran los límites reales de clase como sigue: Límite real inferior (Lri ) = Li - 0.5 Límite real superior ( Lrs ) = Ls +0.5
7. Las frecuencias en cada clase, las frecuencias relativas, las frecuencias acumuladas y las frecuencias relativas acumuladas de cada clase se determinan igual que los datos no agrupados. 8. Se determina la marca de clase (m i ) como el punto medio de la amplitud de clase: Li + Ls
m i =
2
Para mostrar la forma de organizar los datos por medio de clases, considera el
siguiente ejemplo: Ejemplo 8. En un hospital son registradas las personas que ingresaron diariamente a visitar a alguno de los pacientes. El registro fue realizado por 40 días y se obtuvieron los siguientes datos: {30, 35, 15, 21, 18, 32, 39, 20, 19, 20, 20, 34, 13, 13, 20, 35, 30, 17, 30, 31, 10, 32, 22, 14, 30, 36, 23, 14, 20, 34, 20, 28, 20, 16, 31, 38, 22, 12, 28, 13} . Puedes realizar la tabla de frecuencias para analizar esta información. Para empezar es necesario organizar los datos en orden ascendente: {10, 12, 13, 13, 13, 14, 14, 15, 16, 17, 18, 19, 20, 20, 20, 20, 20, 20, 20, 21, 22, 22, 23, 28, 28, 30, 30, 30, 30, 31, 31, 32, 32, 34, 34, 35, 35, 36, 38, 39} .
33/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Los datos toman demasiados valores, algunos de los cuales sólo aparecen una vez. Esta observación implica que una tabla de datos no agrupados puede no ser apropiada1 para seguir con la organización de datos, por lo tanto hay que considerar usar los intervalos de clase y sus respectivas frecuencias. Para ello se encuentra los valores necesarios Rango: R = x
x min = 39 - 10
máx-
Número de clase: Nc =
40 ≈ 6.32 ≈ 6
Amplitud de clase: Ac =
R Nc
=
29 = 10 ≈ 4.8 ≈ 5 6
Acoplando toda la información en la tabla, el resultado es el siguiente:
Reexiona
De la tabla anterior ¿qué armaciones podrías hacer con respecto a la cantidad de personas que visitaban a los pacientes del hospital?, ¿para qué podría ser de utilidad está información?
Si bien las tablas de distribuciones ya son una forma más clara de organizar los datos que se tienen, también es importante presentar la información de manera
más visual, esto es por medio de grácos.
1
No hay un criterio claro para esta elección, muchas veces depende del investigador y de lo que se quiere exponer o del fenómeno en sí.
34/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
9. Construcción de gráfcas Es muy común ver en los medios de comunicación notas que reeren: el dinero, la salud o la economía, entre otros, muchos temas que han cambiado con respecto a otros tiempos o lugares. Al lado de esta información suele estar la imagen de una
gráca donde son presentados los datos que la apoyan. Su nalidad es concentrar la información obtenida de manera que pueda ser presentada al público y, sin conocimientos previos de estadística, puedan entender las conclusiones vertidas
lo mejor posible. Existen diferentes tipos de grácas que son usadas en función de la información que se desea resaltar para cada caso. A continuación se presenta la
manera de generar los grácos a partir de las tablas de distribución. Gráfca de barras y de pastel. Son más usadas si los datos
pertenecen a variables cualitativas. Por ejemplo, la población por cada estado de la República Mexicana. En la gráca de barras la base de cada rectángulo lleva el nombre de la variable y la altura de las barras es proporcional a los valores
que representa. Para la gráca de pastel el ángulo central es proporcional al valor que representa, para trazarla puede hacerse uso de la fórmula:
ángulo de la rebanada 360
=
valor que representa la rebanada suma de todos los valores
Histograma y polígono de frecuencias. Son grácas para representar la distribución de datos continuos. El histograma se presenta por medio de columnas y el polígono con una
gráca de línea. Ambas son usadas para ver la distribución de los datos, además proporcionan información sobre la clase que tiene mayor concentración. Las columnas del histograma tienen por base el ancho del intervalo de la clase sobre el eje x y sobre el eje y se coloca la frecuencia absoluta o relativa. Para el polígono de frecuencias se dibuja un punto por cada coordenada formada por la marca de clase en el lugar de la coordenada x y la frecuencia absoluta o relativa en el lugar de la coordenada para luego unir los puntos consecutivos por líneas rectas y cerrar los extremos
con el eje horizontal.
35/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Ojiva. Es una gráca de línea donde se representa la frecuencia
relativa acumulada. Para trazarla se dibuja sobre el plano cartesiano un punto con coordenadas en las marcas de . clase en el eje x y la frecuencia relativa acumulada en eje y
A continuación puedes ver grácas obtenidas a partir de los ejemplos.
xcel u Hoja de cálculo, para construir las grácas. Este Puedes usar el software E proceso es sencillo. Para elaborar una gráca es necesario que tengas la tabla con los datos o clases y las frecuencias, ya sea absolutas o relativas que desees gracar. 1. Selecciona los datos y las frecuencias en columnas sobre la tabla. 2. Elige la pestaña "Insertar" y, dentro de ésta, la opción "Gráficos recomendados" . 3. Elige la que necesitas o más te ayude a mostrar lo que requieres y da clic en "Aceptar".
36/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
El resultado es un recuadro en el que se encuentra el gráco. Hay varias opciones para mejorar la presentación, van desde cambiar el tipo de diseño de la gráca (en la imagen el círculo verde) hasta añadir elementos o los títulos de las variables (opción en círculo azul de la imagen). Algunas de estas modicaciones se pueden hacer dando doble clic con el botón izquierdo sobre el elemento. Para otros casos
se selecciona el gráco y se elige la pestaña: diseño, como se muestra en la gura:
37/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Refexiona Un tema que ha cobrado gran importancia en los últimos años, debido a los problemas en la salud pública por enfermedades relacionadas, es el consumo de bebidas azucaradas. En alguno de los ejemplos que se han dado, se incluye una relación entre la cantidad de refresco que consumen ciertas personas. El artículo Consumo de bebidas para una vida saludable: Recomendaciones para la población mexicana hace un pequeño 2
análisis sobre el consumo de bebidas azucaradas de personas en ciertos rangos de edad. Analiza los tipos de datos que se presentan a lo largo del artículo, ¿Qué tipos de grácas son usadas para presentar los datos? Extrae los datos de las guras 3 y 4 para crear tus propias grácas. Recuerda que esta información puede ser tratar de diferente manera. Propón formas de analizarla para obtener algunas conclusiones al respecto.
10. Distribución de probabilidad en los fenómenos naturales y procesos sociales Para denir lo que es una distribución de probabilidad son necesarios algunos conceptos básicos. Para empezar, la probabilidad es el cálculo de que un evento futuro suceda o no. Comúnmente la probabilidad es expresada con un número decimal entre cero y uno, en el caso de los extremos, lo cual mide la ocurrencia de un resultado o evento. Si el número es cercano a cero, el resultado no es fácil de obtener y, al contrario, los resultados con probabilidad cercana a uno son casi seguros de obtener. Para manejar mejor los términos en la probabilidad conviene considerar las siguientes deniciones: •
2
Experimento: consiste en observar los resultados en condiciones determinadas por el investigador. Por ejemplo: lanzar una moneda al aire, escoger una carta de una baraja completa, entre otros.
Juan A.,Rivera, Onofre Muñoz-Hernández et al. (2008). Consumo de bebidas para una vida saludable: recomendaciones para la población mexicana . Salud Pública de México. Vol. 50, no. 2. México. Disponible en Disponible en http://www.scielo.org.mx/scielo.php?script=sci_ arttext&pid=S0036-36342008000200011
38/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
•
Evento: son los resultados del experimento. Puede ser simple si sólo tiene una característica o conjunto con dos o más. Por ejemplo, obtener cara al lanzar una moneda es un evento simple y lanzar un dado y obtener un número par menor a cinco un evento compuesto.
•
Espacio muestral: es el conjunto de todos los posibles eventos que pueden ocurrir.
Al repetir varias veces un experimento es posible contabilizar las ocurrencias de cada uno de los eventos en el espacio muestral y tabular las frecuencias, así como también gracar. Una variable aleatoria , en ocasiones llamada variable estocástica , es una manera de describir los eventos en el espacio muestral por medio de números. Para ejemplicar se retomará la idea de observar, como experimento, los productos de una fábrica. Pueden estar defectuosos o no defectuosos. Estos dos resultados son el espacio muestral para la observación de un producto y es útil representarlos de manera numérica. Para eso puede considerarse, 0 para defectuosos y 1 para no defectuosos. Otro modo de variable aleatoria puede ser el experimento de lanzar una moneda 10 veces. La variable aleatoria puede registrar el número de águilas que salen. Para este caso, pueden considerarse los valores 0, 1, 2, 3, 4. Cabe mencionar que éstas no son las únicas variables aleatorias para estos ejemplos de experimentos. De manera concreta, una variable aleatoria es una función que va de los eventos en el espacio muestral a los números reales. Usualmente, son representadas con letras mayúsculas X o Y y también es común que una variable aleatoria tenga un signicado de algún tipo, tal como físico o geométrico. Observa que aunque se llame variable aleatoria en realidad es una función; sin embargo, es el nombre que se considera convencionalmente apropiado pero siempre es conveniente tener clara su naturaleza. Si la variable aleatoria toma un número nito o numerable de valores es llamada discreta y si toma una cantidad innita no numerable de valores es continua, como se vio en el Tema 6. Considera el siguiente ejemplo: Dos estudiantes realizaron un experimento que consistió en lanzar un dado. El primer estudiante se dispuso a lanzar un dado 600 veces y registrar las apariciones de los dados en la siguiente tabla de frecuencias:
39/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Números
Frecuencia
1
2
3
4
5
6
97
99
98
92
96
118
El otro estudiante lanzó simultáneamente dos dados 600 veces y sumo los números obtenidos. En este caso su espacio maestral es: {2,3,4,5,6,7,8,9,10,11,12}. Los resultados que obtuvo fueron los siguientes:
Números
2
3
4
5
6
7
8
9
10
11
12
Frecuencia
14
31
40
68
101
113
88
62
53
14
16
Para poder analizar mejor sus resultados construyeron las grácas de barras con las frecuencias correspondientes:
Como puedes ver, las grácas son muy diferentes. En una de ellas aparece casi el mismo número de veces en todos los eventos; y en la otra, hay ciertos valores que aparecen con mucha más frecuencia que otros. Esto se debe a la probabilidad que cada evento tiene. En estadística, la probabilidad teórica, para una variable aleatoria discreta, se determina dividiendo la cantidad de resultados favorables del evento x entre la cantidad de resultados totales. La probabilidad de tal evento x se denota P ( x ).
40/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
11. Distribución de probabilidad Es la asignación de probabilidades a los valores de la variable aleatoria, denotado por P ( x i ), y que cumplen con:
a)
0 ≤ P ( x i ) ≤ 1 n
b) ∑i
= 1 P ( x i ) = 1
Donde x i es el valor de la variable aleatoria X y P (x i ) es la probabilidad que se le asocia.
Para poder estudiar mejor tanto las variables aleatorias y las distribuciones de probabilidad son necesarias algunas deniciones. No obstante, éstas serán estudiadas con mayor profundidad en el tema de medidas de dispersión de la unidad siguiente debido a su importancia y a la información sobre el comportamiento de un fenómeno que cumple con cierta distribución de
probabilidad. A continuación se presentan las deniciones. Esperanza o valor esperado es el valor promedio que se obtendría si el
experimento se repitiera una cantidad innita de veces. Para calcularlo puedes expresarlo de la siguiente forma: { x 1 , x 2 , ... , x n } es el conjunto de los valores que toma la variable aleatoria X , con su respectiva probabilidad P (x i ). Entonces el valor esperado de X es:
E [X ] = P (x 1 ) x 1 + P (x 2 ) x 2
+ ••• + P (x ) x n
n
Varianza de un conjunto de datos {x 1 , x 2 , ... , x n } es el promedio de los cuadrados
de las diferencias entre la media aritmética y cada uno de los datos, es decir:
v=
(x 1 - x )2 + ••• + (x n -x )2 n
Desviación estándar es la raíz cuadrada de la varianza y se denota por:
41/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
La importancia de conocer estos valores es que pueden establecerse como los datos que distan de la media a partir de la desviación estándar. Esta propiedad se enuncia en el Teorema de Chebyshev:
Teorema de Chebyshev. Para cualquier conjunto nito de números y para cualquier número real h > 1 se tiene que por lo menos la fracción:
1-
1 h 2
De estos números dista de la media a lo más h veces la desviación estándar. Con este teorema se puede asegurar, por ejemplo, que para un conjunto nito de datos al menos 75% de ellos distan de la media a lo más dos veces la desviación estándar. Pues:
1-
3 1 = = 0.75 2 4 2
En los siguientes temas profundizará más en el estudio de la probabilidad y su
utilidad en los resultados de un evento. Un ejemplo podría ser el de los beisbolistas. Cuando un jugador toma su turno al bat y su record de jonrón es alto, se puede hacer un cálculo de probabilidad y formarse una idea si podrá anotar uno más en su carrera.
12. Distribución binominal Ejemplo: SI EL EVENTO O EXPERIMENTO TIENE DOS
RESULTADOS; SI O NO, SANO O ENFERMO, ÉXITO O FRACASO, ETCÉTERA Es la distribución de probabilidad de la variable aleatoria, la cual es el número de éxitos al repetir n veces un experimento con dos resultados posibles, con probabilidad p de obtener éxito en cada experimento. Para este caso, los valores de la esperanza, varianza y desviación estándar son:
E [X ] = np ,
v [X ] = np ( 1 - p ),
= np (1 - p )
42/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Para explicar mejor este tipo de distribución, se muestra el siguiente ejemplo: Ejemplo. Se considera la variable aleatoria X . Lo que hace esta variable es asignar el número de águilas obtenidas luego de lanzar una moneda 5 veces (el evento tiene dos resultados posibles: águila o sol). Para este experimento, el espacio muestral son todos los grupos de 5 ceros y unos, donde el 1 representa águila y 0 el sol. Por ejemplo, un evento posible es (0,1,0,1,1) y, entonces, la variable aleatoria es x (0,1,0,1,1) = 3. La probabilidad de cada evento es:
, a s ) = p k ( 1 - p )n-k , con X (a 1 ,
P (a 1 ,
•••
, a s ) = k
•••
En este experimento se tiene que hay
( 5k )3 eventos en el espacio muestral con k
unos, todos esos elementos tienen la misma probabilidad p k (1-p )n-k Para trabajar mejor los datos se construye la tabla de distribución de probabilidades de X como sigue:
Distribución de probabilidades de
3
5 k
p (x )
x
0
1 2
1
1 2
2
1 2
3
1 2
0
1
2
3
1 2
1 2
1 2
1 2
5
=
1 2
=
1 2
=
1 2
=
1 2
4
3
2
x
p (x )
5 k
5
1
0.0313
5
0.15625
10
0.3125
10
0.3125
5
5
5
La denición de coeciente binomial es precisamente la cantidad de formas de acomodar k unos en cinco elementos..
43/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
4
1 2
5
1 2
4
5
1 2
1 2
1
=
1 2
=
1 2
0
5
5
0.15625
1
0.0313
5
El histograma de la variable aleatoria X es el siguiente:
En cada lanzamiento de la moneda la probabilidad de obtener águila es =12, entonces el valor esperado, la varianza y la desviación estándar son:
E [X ] = np =
5 = 2.5 , v [X ] = np ( 1 - p ) = 5 2 = 1.25 = 1.180
1 2
1 = 1.25, 2
Según el teorema de Chebyshev es posible armar que la probabilidad de obtener un valor entre 0.264 y 4.736 es de al menos 75%. De acuerdo a la tabla, los valores entre 0.264 y 4.736 son 1,2,3,4 y la suma de las probabilidades para obtener esos números es:
0.15625 + 0.3125 + 0.3125 + 0.15625 = 9375 Se puede ver que la probabilidad que resulta es mucho más que lo que estima el teorema de Chebyshev. Esto se debe frecuentemente a que la distribución tiene una tendencia central.
44/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
13. Distribución de Poisson EVENTOS INDEPENDIENTES QUE OCURREN EN UN MÓDULO DISCIPLINAR DETERMINADO O A UNA VELOCIDAD CONSTANTE EN EL TIEMPO, PRESENCIA DE VIENTO, PRESENCIA DE GRANIZO, OCURRENCIA DE ACCIDENTES, ETCÉTERA Es de las distribuciones más comunes en la vida real. Y es usada para representar
el número de eventos de poca frecuencia que ocurren en el tiempo o en el espacio. Para este tipo de distribución es necesario saber el número promedio de eventos que ocurren en un intervalo de tiempo o espacio, como:
•
Cantidad de productos elaborados por día en una fábrica.
•
Accidentes que ocurren en una ciudad por semana.
• Número de manchas por metro cuadrado de tela, entre otros. La distribución de Poisson es una función de probabilidad descrita de la siguiente - x forma P (x ) = e x! , donde X y P (x ) es la probabilidad de x apariciones, es el
número promedio de eventos que ocurren por periodo de tiempo o unidad de espacio. La manera de representar la distribución de Poisson es la misma que
la binomial: por medio de una gráca de barras donde la altura de las columnas representa la probabilidad asociada a cada valor de X . Para este caso puede ser simétrica o presentar sesgo; es decir, cargarse más hacia un lado u otro, lo cual depende de . Para explicar un poco más el desarrollo de una distribución de Poisson considera el
siguiente ejemplo: Ejemplo. En la liga mexica de fútbol (Liga MX 2016) hasta la Jornada 15, el equipo que encabezaba la tabla de posiciones
era el Monterrey. En los primeros 15 partidos que disputó logró anotar 34 goles3. Se puede plantear las siguientes preguntas para hacer una investigación: ¿Qué probabilidad hay de anotar 3 goles más? ¿Cuál sería la probabilidad de que en su próximo partido el equipo logre anotar a lo más 2 goles? 3
Fuente para la Jornada 15: http://espndeportes.espn.go.com/futbol/posiciones/_/liga/mex.1
45/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
En este caso puede darse el valor de goles por cada partido. En promedio se anotaron 2.27 goles por cada 90 minutos de juego. Entonces, =2.27. La variable s el número de goles anotados por partido. De manera que la aleatoria x e probabilidad de anotar 3 goles es:
P ( X = 3) =
e
(-2.27)
2.27
3
= 0.021409
3!
Para saber la probabilidad de anotar como máximo dos goles se deben considerar las probabilidades de cada uno de los eventos y sumarlas, es decir:
P ( X ≤2) =
e
(-2.27)
0!
2.27
0
+
e
(-2.27)
1!
2.27
1
+
e
(-2.27)
2!
2.27
2
= 0.604009
Los resultados anteriores dicen que existe una probabilidad de un 20% de que el
equipo anote 3 goles. Sin embargo, hay 60% por ciento de posibilidades de que anote 0, 1 o 2 goles en su siguiente partido. En el caso de una distribución de Poisson, tanto la media como la varianza coinciden con el valor de .
Actividad Los puntos, goles o canastas en un encuentro deportivo son un buen
ejemplo de un fenómeno al que puede ajustarse una distribución de probabilidad de Poisson. Estudia los resultados de tu equipo favorito
(o el equipo que elijas) de cualquier deporte y analiza la probabilidad de obtener varios resultados en su siguiente juego. Puedes mejorar el intervalo de tiempo si cuentas con la información, por ejemplo, de canastas en básquetbol por cada cuarto o carreras por entrada en béisbol, con lo que puedes calcular la probabilidad de anotaciones en el próximo intervalo de tiempo.
46/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
14. Distribución normal Ejemplo. CARACTERÍSTICAS EN UNA POBLACIÓN: EDAD, ALTURA, PESO,
ETCÉTERA Esta es una de las distribuciones más usadas cuando se trata del estudio con características cuantitativas de poblaciones de individuos, como edades, peso, estaturas, entre otras. En principio, este tipo de distribución es usada para variables aleatorias continuas. Es sencillo considerar variables discretas como continuas, como son la altura o el peso de las personas. Cuando se tiene una distribución continua cada elemento tiene la misma probabilidad de ocurrencia 0 por lo que al trabajar este tipo de variables se debe determinar la probabilidad de que se tome un valor dentro de un cierto intervalo. La distribución normal tiene una gráca en
forma de campana, conocida como campana de Gauss o simplemente gaussiana, en honor a Carl Friedrich Gauss, quien hizo muchos estudios al respecto. La función que dene la distribución normal es:
1 f ( x )=
e
1 2
-
x - µ 2
= 2π
Donde µ es la media y la desviación estándar, la más común es cuando µ =0 y =1, conocida como distribución normal estándar. La gráca es de la forma:
0.4
0.3
0.2
0.1
4
2
Para determinar la propiedad de caer en un
2
4
intervalo es necesario obtener el área
bajo la gráca de la función en el intervalo que se necesita. Basados en la misma
47/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
regla de las distribuciones de probabilidad se debe cumplir que la probabilidad del espacio muestral Ω debe ser P ( Ω)=1, entonces el área bajo la función debe ser 1. Si se construye una función que describa variables aleatorias no negativas y cuya área bajo la gráca sea 1 se denominan funciones de densidad de probabilidad .
Para trabajar de manera práctica conviene recordar la siguiente tabla para la distribución de los datos:
Distancia de la media
Porcentaje de datos
dist ≤
68%
dist ≤ 2
95%
dist ≤ 3
99.7%
De acuerdo con las propiedades de la distribución normal, 68% de los datos distan de la media a lo más en una desviación estándar; 95% están cerca de la media en a lo más dos desviaciones estándar; y la mayoría de todos los datos, en 99.7%, distan a lo más 3 desviaciones estándar de la media. Con esta información se pueden hacer armaciones respecto del comportamiento de los datos, como :
Ejemplo. Se ha observado que la distribución de las calicaciones en una escuela
tiene un comportamiento aproximadamente normal. Si el promedio de calicación es de 6.5 y la desviación estándar es de 1.3, entonces es posible armar que aproximadamente
•
68% de los aspirantes sacan entre 5.2 y 7.8.
•
95% sacan entre 3.9 y 9.1
•
Y prácticamente todos, es decir 99.7%, obtienen una calicación entre 2.6 y 10.
48/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
15. Conocer los tipos de hipótesis a probar en diversas investigaciones científcas y descartar las que no lo son En los medios de comunicación, especialmente en Internet, es muy común encontrarse con noticias que arman que se ha comprobado cientícamente algún resultado. En principio está el problema de qué quieren decir con ese “cientícamente comprobado”. Lo común es que en algún lugar se ha hecho un estudio en el que rara vez se dan detalles al respecto. Sin embargo, más importante que eso es poder determinar un juicio propio sobre si el estudio referido puede tener algún sentido. En general, se trata de análisis estadísticos, pero con hipótesis y armaciones que no tienen mucha relación entre ellas y que son en su estructura falacias. Un ejemplo muy burdo es cargar una piedra todo el día durante una semana. Si en esta semana ningún tigre nos ataca, entonces signica que nuestra piedra funciona como un excelente repelente de tigres, con una efectividad de
100%. Como se puede ver, las armaciones ni siquiera se relacionan de manera clara. Muchas estadísticas falsas en Internet se basan e ns upuestos como éstos. Como un ejemplo más, hace poco tiempo se difundió una noticia en la que supuestamente en cierto día se pronosticaba un enorme terremoto en México debido a que los datos estadísticos de estos fenómenos en Japón y Perú así lo decían4. Esta información preocupó a mucha gente. Sin embargo, era totalmente falsa, como después personal del Sismológico Nacional advirtió. Sin importar los datos estadísticos de la posición e intensidad de los sismos previos, éstos no
estaban relacionados con las fuentes de sismos en México y, aún más, a la fecha estos fenómenos aún no se pueden predecir .
Actividad Busca alguna noticia que recurra al eslogan: “Cientícamente comprobado”. Analiza si las hipótesis y resultados que menciona pueden estar relacionados o son totalmente independientes.
4
Fuente: http://www.elasertivo.com/mexico/falsa-la-informacion-de-un-proximo-terremoto-en-mexico-ssn/
49/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
16. Cierre En esta unidad te has percatado de que cuando se habla de método, se reere a la forma ordenada y sistemática. Cuando se hacen las cosas, tales como reexiones, experiencias, incluso deportes o cualquier otra, de manera rigurosa, entonces
es posible alcanzar los objetivos que se proponen, aunque nunca habrá garantía absoluta de lograrlo. Por ello, aún cuando hay diferentes formas de llegar al conocimiento, no todas las rutas resultan exitosas.
En esta unidad se estudió un método riguroso de conocimiento y reexión que permite conocer el estado en que se encuentran las cosas. Sólo esa información es suciente para tomar decisiones y realizar acciones de mejora tanto del ambiente que nos rodea como de fenómenos sociales, políticos y económicos que nos competen. Además se revisó el razonamiento riguroso, con métodos de análisis y técnicas adecuadas, que también ofrecen la posibilidad de tener una visión de aproximación al futuro, tema que se retomará en la siguiente Unidad. Te habrás dado cuenta que por el comportamiento de los eventos, se puede hacer un cálculo de probabilidad y de aproximación, nunca con una visión infalible, de lo que podría pasar en el siguiente acontecimiento.
Por otro lado, hay dos conceptos que en el lenguaje común se usan de manera indiferente. Tal es el caso de posible y probable. El contenido de ambos es realmente diferente para la estadística. Cuando se dice que es posible que frente
a nuestra casa pase un automóvil Ferrari, se puede hacer un razonamiento. Si en la ciudad hay automóviles Ferrari, realmente es posible que en alguna ocasión llegue a circular uno frente a nuestro domicilio. Por el contrario, si frente a nuestro domicilio pasan diariamente 500 automóviles y ninguno de ellos es Ferrari, la probabilidad de que pase uno hoy es casi cero. De esta manera se puede entender la diferencia entre predicción y proyección. En el primer caso se hace una predicción, en tanto que en el segundo es una proyección con los datos de acontecimientos conocidos.
De esta manera, para que procures tener un método riguroso de reexión y no te dejes llevar por tanta charlatanería, como la que hoy nos ahoga con tanta información de los medios masivos de comunicación.
50/52
Módulo 17. Estadística en fenómenos naturales y procesos sociales Unidad I. La estadística descriptiva y los fenómenos naturales y procesos sociales
Fuentes Bibliográfcas Barrera, J. M. (10 de febrero de 2016). Surbubano, mejor transporte en el Valle de México. El Universal , p. Consultado el 12 de febrero 2016. Cámara de Diputados. (2001). Evolución y perspectiva del sector enrgético en México 1970-2000 . México, Palacio Legislativo de San Lázaro: Centro de estudios de las nanzas públicas. SAGE . (2009). Glossary of the Social and Behavioral Sciences . New York: SAGE Publications.
Triola, M. F. (2013). Estadística 11a Edición . México: Pearson educación. Durkhiem, E. (1979). La reglas del método sociológico. Buenos Aires: Pléyade. Dasinger et. al., M. L. (2003). Comparision of the Atkis, Ornish Weight Watchers and Zone Diets for weight loss and heart disease risk reduction. Journal od American Medical Association , 43-53.
Hernández Sampieri et. al., R. (2014). Metodología de la investigación . México: Mc Graw Hill.
Kuhn, T. (1971). La estructura de las revoluciones cientícas . México: Fondo de Cultural Económica.
Navarro, E. M. (2012). Estudio de la motorización en México mediante la dinámica de posesión vehicular: determinantes macroeconómicos y microeconómicos . Safandila, Querétaro: Secretaría de Comunicaciones y Transporte. Instituto Mexicano del Transporte.
Electrónicas Adelgazar rápido. (2016). HTTP://WWW.ADELGAZARRAPIDOWEB. COM/. Recuperado el 11 de marzo de 2016. Disponible en: HTTP://WWW. ADELGAZARRAPIDOWEB.COM/DIETAS-PARA-ADELGAZAR/DIETA-ATKINS/ Bienestar 180. (2016). 4 razones por las que el estrés aumenta tu peso . Recuperado
51/52