Estadística Aplicada a las Ciencias Sociales I
Aspectos generales Video de bienvenida https://www.youtube.com/watch?v=y_rEdgJlGpc
Datos de identicación • • • • • • • • •
Institución responsable: Facultad de Ciencias Políticas y Sociales. Suaed. UNAM. Nombre de la asignatura: Estadística Aplicada a las Ciencias Sociales I Autores: Laura Azucena Lira Jiménez, Lic. María Martha Miranda Hernández Semestre: Tercero Créditos: 08 Carácter: Obligatoria Clave: 2314 Área a la que pertenece: Metodológica Seriación: Indicativa
Objetivos Objetivo general Al término de la materia el alumno será capaz de: • Entender los conceptos matemáticos y estadísticos elementales elementales para la descripción de grupos y procesos sociales. Objetivos especícos • Distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de grupos y categorías sociales. • Entender el concepto de variable, correlación y causación desde la perspectiva matemática, aplicados a problemas sociales relevantes (pobreza, clase, identidad, producción, opinión). • Seleccionar y valorar resultados y datos datos sociodemográcos. • Representar datos sociodemográcos. • Comprender la lógica de la estadística y los modelos elementales. • Dominar la estadística descriptiva y realizar operaciones estadísticas estadísticas básicas con la nalidad de hacer inferencias generales sobre poblaciones delimitadas.
2
Temariorio Tema 1. LENGUAJE MATEMÁTICO Y TEORÍA DE CONJUNTOS 1.1 Conjuntos, y descripción de grupos, individuos y unidades sociales. 1.1.1 Denición de conjunto y elemento. 1.1.2 Complemento de Conjuntos. 1.1.3 Intersección de Conjuntos. 1.1.4 Unión de Conjuntos. 1.1.5 Inclusión de Conjuntos. 1.1.6 Igualdad de Conjuntos. 1.2 Denición de universo, pertenencia. 1.2.1 Notación. 1.2.2 Operaciones (pertenencia, unión, intersección). 1.2.3 Relaciones. 1.2.4 Funciones. 1.2.4.1 Gracar relaciones y funciones. 1.2.4.2 Clasicación de funciones. 1.2.4.3 Operaciones de funciones. Tema 2. ESTADÍSTICA 2.1 Introducción a la Estadística en Ciencias Sociales. 2.1.1 Estadística, ciencia y observación. 2.1.1.1 Inferencias de las poblaciones. Estadísticas Vitales y Estadísticas Matemáticas. 2.1.1.2 Utilidad y limitantes de la Estadística en las Ciencias Sociales. 2.1.1.3 Población y muestras. 2.1.1.3.1 Tipos de muestras. 2.1.1.3.2 Tipos de encuestas, general. 2.1.2 Estructura de información, métodos de investigación. 2.1.3 Variables, medición. 2.1.4 Anotación estadística. 2.2 Frecuencias. 2.2.1 Distribución de frecuencias. 2.2.2 Distribuciones – Tablas y Grácas (relaciones x, y). 2.2.2.1 Presentación de tablas, intervalos. 2.2.2.1 Presentación de tablas, intervalos. 2.2.3 Tendencia Central Total. 2.2.4 Promedio, Media, Moda. 2.2.4.1 Teorema Teorema de tendencia central y Skweness y Kurtosis. 2.3 Variabilidad. 2.3.1 Rango y rango intercuartil. 2.3.2 Desviación estándar. 2.4 Diseño de hipótesis en las Ciencias Sociales. 2.4.1 Causalidad y correlación Pearson. 2.4.2 Hipótesis nula. 2.4.3 Pruebas de hipótesis. 2.4.3.1 Error estándar. 2.4.3.2 Estimación. 2.4.3.3 Índice de conanza. 2.5 Modelos probabilísticos. 2.5.1 Normal. 2.5.2 Binomial. 2.5.3 Poisson.
3
Bibliografía Básica Tema 1. Elorza, H. (2008). Estadístic (3.ª ed.). México: Cengage Learning Estadísticas as para las ciencias sociales, del comportamiento y de la salud (3.ª Editores. García-Ferrando, M. (1999). Socioestadística: Introducción a la estadística en sociología. Madrid: Alianza. Rioboo, J. y Del Oro, C. (2000). Representaciones gráfcas de datos estadísticos. Madrid: AC. Zeisel, H. (1999). Dígalo con números. México: FCE. Tema 2. Pliego-López, J. y Ruiz-Pérez, L. (2002). Estadística I: Probabilidad . Madrid: AC. Triola, M. (2008). Estadística . México: Pearson Educación.
Bibliografía complementaria Bibliografía complementaria Ai-Camp, R. (1996). Encuestas y democracia: opinión pública y apertura política en México . México: Siglo XXI, 1996. Babbie, E. (2000). Fundamentos de la investigación social. México: Thomson Learning. Evans, M. (2005). Probabilidad y Estadística: la ciencia de la incertidumbre. Barcelona: Reverté. Flores-Villa, A. (1968). Nociones del método Estadístico. México: Porrúa. Jauset, J. (2000). La investigación de audiencias en televisión: Fundamentos estadísticos. estadísticos. Buenos Aires: Paidós. Malhotra, N. (1996). Investigación de mercados: un enfoque práctico. México: Prentice Hall Hispanoamericana.
Sitios de interés Sitios de interés Es un sitio académico reconocido internacionalmente por el éxito de su método para aprender matemáticas. Disponible en https://es.khanacademy.org/
ibliografía complementaria
4
Lenguaje matemático y teoría de conjuntos
Introducción En este tema estudiaremos los conceptos fundamentales del lenguaje matemático y la teoría de conjuntos, para que al nalizar el tema seas capaz de distinguir la diferencia entre relaciones y funciones en el contexto de la descripción de grupos y categorías sociales. La teoría de conjuntos es un marco para el análisis de hechos sociales. Diversos autores consideran el manejo de esta teoría como un instrumento fundamental para el cientíco social. Elorza (2008), por ejemplo, comenta que la teoría de conjuntos “es un instrumento adecuado para la sistematización de la información relevante que permite enfocar un problema en su totalidad, deslindando en él lo que es fundamental” (p. 83). Por su parte, Kleiman (2009) señala que la teoría de conjuntos es una “estructura lógica que unica los conceptos más fundamentales mediante un lenguaje intuitivo y simple” (p. 5). Él mismo destaca que buena parte del conocimiento matemático moderno ocupa en menor o mayor medida la teoría de conjuntos. El estudio de la teoría de conjuntos es importante porque te permitirá enfocar el análisis de problemas sociales desde una perspectiva lógico-matemática, sin que ello signique pasar por alto la complejidad y multidimensionalidad de los hechos sociales. Por el contrario, el análisis a través de lenguaje matemático debe mejorar la comprensión y sistematización de un problema, y fomentar la creatividad para generar hipótesis de trabajo. Para el estudio de este tema hemos desarrollado el contenido puntual, en un lenguaje sencillo y abundando en explicaciones, con la intención de que el lenguaje matemático por sí sólo no sea un impedimento para tu comprensión y uso de los conceptos elementales de la teoría de conjuntos. Además, en el desarrollo de contenido contenido encontrarás varios ejemplos ejemplos que se reeren a una realidad concreta: concreta: el estudio de los grupos y hechos sociales que tenemos a la mano. Lo hicimos así para que puedas utilizar los conceptos matemáticos en las situaciones de análisis que corresponden a las ciencias sociales. De esta manera, te proporcionamos un complemento a los textos clásicos sobre la teoría de conjuntos, en los cuales predominan los ejemplos abstractos y en lenguaje matemático. Los conceptos abordados en esta unidad te permitirán identicar elementos, conjuntos (grupos) y relaciones, en la descripción de problemas sociales. Podrás enunciar las características que determinan la pertenencia de un elemento a un conjunto. Ésta es una tarea de clasicación que pone en práctica el estudio de categorías sociales. Además, podrás identicar las operaciones que pueden darse entre conjuntos, por ejemplo, la inclusión, la unión, intersección, complementación y diferencia; si pensamos que dichos conjuntos representan unidades de estudio, es posible anticipar la utilidad que tiene identicar la factibilidad de las operaciones mencionadas. El estudio de las relaciones y funciones entre conjuntos fomenta la habilidad para detectar posibles relaciones entre variables de estudio.
5
Objetivos particulares Al término de la unidad el alumno será capaz de: • •
Distinguir la la diferencia entre relaciones relaciones y funciones en el contexto de la descripción de grupos y categorías sociales. Entender el concepto de variable, correlación y causación desde la perspectiva matemática, aplicados a problemas sociales relevantes (pobreza, clase, identidad, producción, opinión).
Temario 1.1 Conjuntos, y descripción de grupos, individuos y unidades sociales. 1.1.1 Denición de conjunto y elemento. 1.1.2 Complemento de Conjuntos. 1.1.3 Intersección de Conjuntos. 1.1.4 Unión de Conjuntos. 1.1.5 Inclusión de Conjuntos. 1.1.6 Igualdad de Conjuntos. 1.2 Denición de universo, pertenencia. 1.2.1 Notación. 1.2.2 Operaciones (pertenencia, unión, intersección). 1.2.3 Relaciones. 1.2.4 Funciones. 1.2.4.1 Gracar relaciones y funciones. 1.2.4.2 Clasicación de funciones. 1.2.4.3 Operaciones de funciones.
6
Exposición de los temas
1.1. CONJUNTOS Y DESCRIPCIÓN DE GRUPOS, INDIVIDUOS Y UNIDADES SOCIALES 1.1.1. DEFINICIÓN DE CONJUNTO Y ELEMENTO Kleiman (2009) expone que la denición de conjunto puede establecerse de manera intuitiva, a partir de nuestra experiencia en el mundo, y en su forma más elemental se reere a una colección denida de elementos. Estos elementos pueden ser objetos, personas, instituciones, animales, conceptos, ideas, periodos temporales, características, hechos, etcétera.
Tomado de https://mx.wikimedia.org/wiki/Archivo:Vista_de_um_ conjunto_residencial_em_Guar%C3%A1_(DF).jpg
Tomado de https://mx https://mx.wikimedia.org/wiki/ .wikimedia.org/wiki/Archivo:Conjunto_ Archivo:Conjunto_ espa%C3%B1ol_1999_Budapest.PNG
Un elemento es, por lo tanto, un miembro de un conjunto determinado. Hay tres condiciones para establecer un conjunto: 1. La pertenencia de un elemento a un conjunto debe estar denida sin ambigüedad. Es decir, se sabe si un elemento pertenece a un conjunto o no. Por ejemplo, si pensamos en el conjunto de cientícas reconocidas con un Nobel, es indispensable determinar si Marie Curie está entre ellas o no. Conjunto de cientícas con Nobel = {Marie Curie, Gerty Cori, Maria Goeppert, Doroty Crowfoot, Irène Joliot, Rosalyn Sussman} 2. Los elementos no se repiten en un mismo conjunto. Si pensamos en el conjunto de número de mascotas por persona, aunque varias personas tienen la misma cantidad de mascotas, sólo mencionaremos cada cantidad una vez. Conjunto de cantidad mascotas por persona = {0, 1, 2, 3, 4, 5…}
7
3. Los elementos pueden aparecer en cualquier orden y sigue siendo el mismo conjunto. Ejemplo: Conjunto de lenguas más habladas en Hidalgo = {náhuatl, otomí, tepehua, mixteco} Conjunto de lenguas más habladas en Hidalgo = {tepehua, náhuatl, otomí, mixteco}
Notación Quizá notaste que cada vez que menciono un conjunto escribo los elementos entre llaves y separados por comas, se debe a que es la notación matemática de un conjunto. Entonces, la notación son los símbolos que se usan para denir conjuntos de manera escrita. Los conjuntos generalmente se representan con letras mayúsculas, por ejemplo: M = {Conjunto de niños en situación de calle en Oaxaca de Juárez} P = {Conjunto de mujeres en situación de violencia en San Pedro Nuevo León}
V = {Conjunto de varones con enfermedades mentales en México} La lectura de un conjunto expresado con notación es como sigue: C = {soltero, casado, divorciado, viudo} Se lee “los elementos del conjunto C son soltero, casado, divorciado y viudo”. E = {alcoholismo {alcoholismo,, ansiedad, depresión, fobia}
Se lee “los elementos del conjunto E son alcoholismo, ansiedad, depresión y fobia”. En los ejemplos anteriores hemos escrito todos los elementos de un conjunto dentro de las llaves, a eso se le llama notación por extensión. Pero cuando los elementos de un c onjunto son decenas o miles es impráctico mencionarlos todos, por lo que en esos casos usamos la notación por comprensión: Y = {Municipios de México} Z = {Derechohabientes del IMSS} La notación por comprensión también utiliza otros símbolos matemáticos, como la barra “|”, se lee “tal que”, y literales para representar a los elementos. Se suele utilizar a la letra “x” para representar a los elementos, pero bien podría ser cualquier otra letra. Veamos un ejemplo: A = {x | x es un río nacional} Se lee así: “El conjunto A está formado por los elementos x tal que x es un río nacional” Luego la notación puede expresarse con rangos si nos referimos a medidas. Por ejemplo: T = {x | 140 x 90} Se lee “el conjunto T está formado por los elementos x tal que x es menor que 140 y mayor o igual que 90”. El conjunto anterior puede referirse a la talla (estatura) de los estudiantes de una primaria expresada en centímetros. Para denotar que que un elemento es parte de un un conjunto se usa el símbolo , que se lee “pertenece a”. Por el contrario, contrario, si un elemento no pertenece pertenece a un conjunto conjunto se cruza el símbolo y se lee “no pertenece a”. Por ejemplo: P = {La Prensa, Ovaciones, Metro, Publimetro, Reforma, El Gráco, La Jornada}
8
Entonces: Reforma D Se lee “Reforma pertenece al conjunto P”. El País D Se lee “El País no pertenece al conjunto P”. Otro ejemplo. Sea: F = {m | 180 x 90 } El conjunto F tiene los números mayores que 90 (sin incluir a 90) y menores o igual a 180. Así: 180 F Se lee “180 pertenece al conjunto F”. 90 F Se lee “90 no pertenece al conjunto F”. El conjunto F podría representar los pesos de mujeres de estatura media que padecen obesidad.
Cardinalidad La cardinalidad es el número de elementos que contiene un conjunto, se escribe así: n(A), y se lee “cardinalidad n del conjunto A”. Para el conjunto de siglos de la era cristiana tenemos una cardinalidad de 21, porque actualmente vivimos en el siglo XXI. Revísalo a continuación. H = {I, II, III, IV, V, VI, VII, VIII, IX, X, XI, XII, XII, XIV, XV, XVI, XVII, XVIII, XIX, XX, XXI} n(H) = 21 Se lee “la cardinalidad del conjunto H es igual a 21”. Los conjuntos cuya cardinalidad podemos calcular se llaman conjuntos nitos. Pero también hay conjuntos innitos, que su cardinalidad es imposible determinar, por ejemplo, el conjunto de números reales que se extiende y extiende y extiende.
Conjunto universal El conjunto universal o universo es aquel que contiene todos los elementos en un caso de estudio en particular. Por ejemplo, si estuviéramos estudiando las características de los pintores, escultores y actores, nuestro conjunto universal puede ser llamado “Artistas” y los contiene a todos. Otro ejemplo, si hablamos de “el sector turismo”, “el sector agropecuario”, “el sector industrial” y “otros sectores”, entonces podemos denir nuestro conjunto universal como “los sectores productivos del país”. Si estudiamos primarias, secundarias y preparatorias, el universo puede ser las instituciones educativas.
9
El conjunto universal se denota con el símbolo
o con el símbolo U.
1.1.2. COMPLEMENTO DE CONJUNTOS El complemento de un conjunto se trata del conjunto integrado por todos los elementos que están en el conjunto universal pero no están en un conjunto determinado. Entonces para el conjunto F, su complemento se integra por todos los elementos que pertenecen al universo y no pertenecen a F. Un complemento se denota con apóstrofo ‘, o con un superíndice Lo entenderemos mejor con un diagrama Venn-Euler:
El área coloreada corresponde al complemento del conjunto F se escribe así: F’ = {Biología, Antropología, Geografía} Existen dos casos especiales para la complementación:
10
● El complemento del conjunto vacío es el conjunto universal
=
● El complemento del conjunto universal es el conjunto vacío
=
1.1.3. INTERSECCIÓN DE CONJUNTOS La intersección es el conjunto formado por todos los elementos que pertenecen simultáneamente a dos o más conjuntos. Se representa con el símbolo . En el siguiente diagrama Venn-Euler se presenta sombreada el área que representa la intersección de tres conjuntos, se expresa de la siguiente forma:
A
B
C = {Jalisco}
Se lee “A intersección B intersección C igual a Jalisco”.
Observa en el diagrama anterior cómo la intersección es una operación que nos permite detectar los elementos que están presentes es varios conjuntos a la vez, por ejemplo, el Estado “Jalisco” es productor de maíz, de caña de azúcar y de sorgo.
1.1.4. UNIÓN DE CONJUNTOS La unión de conjuntos se forma por todos los elementos que pertenezcan a dos o más conjuntos. Se representa con el símbolo . En el siguiente diagrama Venn-Euler está sombreada el área que representa la unión de los conjuntos A, B y C:
11
Se expresa de la siguiente forma: A
B
C = {Sinaloa, Jalisco, Veracru Veracruz, z, Michoacán}
Se lee “A unión B unión C incluye a Sinaloa, Jalisco, Veracruz, Michoacán”. Nota que aunque un elemento pertenezca a dos o más conjuntos, en la unión de los conjuntos se menciona una sola vez.
1.1.5. INCLUSIÓN DE CONJUNTOS La inclusión se da cuando un conjunto contiene a otro. Esto también se expresa como que un conjunto es subconjunto de otro. Para anotar una relación de inclusión se utiliza el símbolo . Si por el contrario se quiere anotar que un conjunto no está incluido en otro, se usa el símbolo Por ejemplo: V = {x| x= trabajadores asalariados} W = {x| x= trabajadores que perciben un salario mínimo}
Para los conjuntos anteriores se puede decir que W
V
Se lee “W está incluido en V” o, bien, “W es subconjunto de V”. Podemos denir lo anterior porque los trabajadores que perciben el salario mínimo necesariamente son trabajadores asalariados, aunque en el conjunto “V” también pueden existir otros trabajadores que perciben más de un salario mínimo. Otro ejemplo: Y = {x| x= trabajadores trabajadores sindicalizados} sindicalizados}
V = {x| x= trabajadores asalariados}
12
Al reexionar sobre los conjuntos anteriores notamos que no necesariamente todos los trabajadores asalariados también están sindicalizados, por ello podemos establecer que V Y , es decir, decir, V no está incluido en Y o, bien, V no es subconjunto subconjunto de Y. Observa el diagrama que representa las operaciones de inclusión descritas:
Existen casos especiales en la inclusión de conjuntos: ● Si los conjuntos A y B son iguales, entonces podemos decir que A es subconjunto de B y también que B es subconjunto de A. ● Todo Todo conjunto es subconjunto de sí mismo, a esta relación se le denomina inclusión impropia y se simboliza con
,A
A
● Existe un conjunto vacío simbolizado con que está incluido en cualquier otro conjunto.
1.1.6. IGUALDAD DE CONJUNTOS La igualdad entre dos o más conjuntos se establece siempre que tengan exactamente los mismos elementos. Cuando esto ocurre se anota así: A = B Se lee “el conjunto a es igual al conjunto B”. Si por el contrario los conjuntos son desiguales, se anota así: A
B
Se lee “el conjunto A es diferente al conjunto B”.
13
Veamos un ejemplo: R = {x|x = ramas del derecho} Se lee “R contiene los elementos x tal que x representa a las ramas del derecho público”. D = {Administrativo, Constitucional, Penal, Procesal, Laboral, Tributario} En el conjunto R se menciona, por comprensión, las ramas del derecho público que son el derecho administrativo, constitucional, penal, procesal, laboral y tributario; justamente los elementos del conjunto D. Por ello estos conjuntos son iguales, entonces se puede anotar que: R=D Otro ejemplo: I = {x| x= Médicos} N = {x| x= Pediatras} Aunque todos los pediatras son médicos, no todos los médicos son pediatras. Por ello este par de conjuntos no son iguales, y se anota de la siguiente forma: N
I
1.2. DEFINICIÓN DE UNIVERSO, PERTENENCIA 1.2. Denición de universo, pertenencia El conjunto universal o universo está constituido por todos los elementos de estudio en una situación particular. Esto quiere decir que cada investigador dene el conjunto universal de estudio para un problema determinado. Incluso, para un mismo problema se pueden plantear varias posibilidades de conjunto universal. Aunque para la denición del conjunto universal el investigador investigador tiene amplia libertad, sí tendrá que establecer un conjunto preciso, preciso, y que se mantendrá jo mientras realiza un análisis basado en teoría de conjuntos.
1.2.1. Notación El conjunto universal se denota con el símbolo o con el símbolo U; en los diagramas Venn-Euler se representa como un rectángulo que contiene todos los elementos. Observa que en la siguiente imagen se ha sombreado todo el conjunto universal.
14
1.2.2. Operaciones (pertenencia, unión, intersección) Una vez que se dene un conjunto universal se asumen las siguientes propiedades:
●
Pertenencia: Todo conjunto es subconjunto del conjunto universo.
● Unión: La unión unión de un conjunto conjunto con el conjunto universal da por resultado el conjunto universal. Por ello se dice que el conjunto universal es un elemento absorbente de la unión. ● Intersección: La intersección de un conjunto con el conjunto universal universal da por resultado el conjunto conjunto inicial. Por ello se dice que el conjunto universal el un elemento neutro en la intersección.
1.2.3. Relaciones Una relación vincula los elementos de un conjunto con los elementos de otro conjunto. Veámoslo grácamente:
Se expresa como un conjunto de parejas ordenadas, donde el primer elemento pertenece al primer conjunto y el segundo elemento al segundo conjunto. De la siguiente forma:
15
Otros ejemplos de relaciones pueden ser:
Podrás encontrar tres tipos de relaciones: De un elemento del primer conjunto a un elemento del segundo conjunto.
De más de un elemento del primer conjunto a un elemento del segundo conjunto.
16
De un elemento del primer conjunto a más de un elemento del segundo conjunto.
Dominio y rango En una relación se puede determinar el dominio y el rango. El dominio es el conjunto formado por los primeros elementos de los pares ordenados, y se escribe así: El rango es el conjunto formado por los segundos elementos en los pares ordenado y se escribe así: Veámoslo grácamente:
En ciencias sociales estudiamos las relaciones entre conjuntos para proponer vínculos que nos ayuden a explicar y predecir características de nuestros objetos de estudio.
17
1.2.4. FUNCIONES Una función es una relación con las siguientes tres características: Tiene un dominio (generalmente se denota con la letra Tiene un rango (generalmente se denota con la letra Tiene una regla de correspondencia con las siguientes restricciones: 1. Cada elemento del dominio debe tener necesariamente un elemento asociado en el rango. 2. Un elemento del dominio no puede tener más que un sólo elemento asociado en el rango. Una función se denota generalmente con la letra Observa grácamente cuáles relaciones son funciones y cuáles no:
18
Imagina que una función es una especie de “caja” que recibe un valor
Una función generalmente se expresa así: y se lee “
=
(
) igual a función de
”.
La letra letra se representa representa a cualquiera de los elementos elementos del dominio de la función, función, es decir, su valor irá cambiando, por ello se dice que es una variable. También el valor de
tomará valores distintos, de de entre los valores posibles para el rango, por ello también es una variable.
Además, sabemos que el valor de depende del valor que se le asigne a, por eso decimos que es una variable dependiente. En cambio el valor de no depende de otra variable, por eso decimos que es una variable independiente.
Hasta ahora hemos representado las funciones con diagramas o con parejas ordenadas de elementos, pero ¿qué pasaría si tuviéramos una relación cuyo dominio está integrado por una cantidad innita de elementos? ¡Exacto! Hacer un diagrama o anotar todas las parejas posibles es impráctico. Por ello, los dominios de las funciones suelen representarse con ecuaciones, además se indica qué tipo de elementos pueden pertenecer. Por ejemplo:
19
Lo anterior se lee “ o igual que 6”.
igual a
cuadrada. Siempre que
pertenece a los números naturales, es mayor o igual a 2 y es menor
Otro ejemplo:
Que se lee “ es igual a 2 , pertenece a los números reales. En este caso no se aclara con cuál número inicia o naliza x, lo que signica que sus valores van de menos innito a innito, se escribiría así:
Para saber más… Repasa la diferencia entre relación y función, en el siguiente video: https://youtu.be/qd8QHJEo-6o
1.2.4.1. Gracar relaciones y funciones
Las funciones pueden representarse mediante grácas. Para elaborar la gráca de una función, determina cuáles son los puntos que debes situar en un eje cartesiano, es decir, las coordenadas y . Dichas coordenadas se acomodan en una tabla de doble entrada o tabulación. Veamos un ejemplo:
Dada la función la tabulación que te permitirá permitirá gracar la función es la la siguiente. En la tabulación anterior los valores de se obtuvieron del dominio de la función: , se lee “ pertenece a los números naturales, es mayor o igual a 2, es menor o igual a 6”. Entendiendo el dominio sabemos que los únicos valores posibles para x son: 2, 3, 4, 5 y 6. Después los valores de “ ” se obtuvieron resolviendo la función para cada valor de , así:
20
Una vez terminada la tabulación podemos elaborar la gráca acomodando los puntos
,
. Se muestra a continuación:
Finalmente, podemos especicar los conjuntos que forman el dominio y el r ango de la función: a) Dominio {2, 3, 4, 5, 6} b) Rango {4, 9, 16, 25, 36}
1.2.4.2. Clasicación de Funciones Pueden clasicarse en inyectivas, suprayectivas y biyectivas. En las funciones inyectivas para valores diferentes en el dominio hay valores diferentes en el rango. Observa esta característica en la siguiente imagen:
En las suprayectivas cada elemento del rango debe tener asociado un elemento en el dominio.
21
Finalmente, las funciones biyectivas son tanto inyectivas como suprayectivas:
1.2.4.2. OPERACIONES DE FUNCIONES Con funciones es posible realizar las siguientes operaciones algebraicas: suma, resta, multiplicación y división. También podemos hacer una quinta operación llamada composición. A continuación explicaremos cada una de ellas. Suma Dadas dos funciones f y g, la suma de éstas se expresa así:
22
Se lee “f de x más g de x igual a f más g, de x”. Un propiedad importante de la suma de funciones es que el dominio de una suma de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente forma:
Se lee “dominio de f más g, igual a la intersección del dominio de f con el dominio de g”. Veamos un ejemplo:
Para saber más… Revisa el siguiente video en el que se explica una suma de funciones: https://youtu.be/uXumaGG1yws
Resta Dadas dos funciones f y g, la resta de estas funciones se expresa así:
23
Se lee “f de x menos g de x igual a f menos g, de x”. También el dominio de una suma de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente forma:
Se lee “dominio de f menos g, igual a la intersección del dominio de f con el dominio de g”. Veamos un ejemplo:
Para saber más… Revisa el siguiente video en el que se explica una resta de funciones: https://youtu.be/L5Bwmis_d18
Producto o multiplicació multiplicación n
Dadas dos funciones f y g, la resta de estas funciones se expresa así: Se lee “f de x por g de x igual a f por g, de x”.
24
Se lee “f de x por g de x igual a f por g, de x”. También el dominio de un producto de funciones es igual a la intersección de los dominios de cada función. Se expresa de la siguiente forma:>
Se lee “dominio de f por g, igual a la intersección del dominio de f con el dominio de g”. Veamos un ejemplo:
Para saber más… Revisa el siguiente video en el que se explica un producto de funciones: https://youtu.be/E https://youtu.be/EV9TRVYs36k V9TRVYs36k Cociente o división
Cociente o división
Dadas dos funciones f y g, la división de estas funciones se expresa así:
25
Se lee “f de x entre g de x igual a f entre g, de x”. También el dominio de un cociente de funciones es igual a la intersección de los dominios de cada función, excluyendo los valores de x para los cuales g(x) = 0. Se expresa de la siguiente forma:
Se lee “dominio de f por g, igual a la intersección del dominio de f con el dominio de g, siempre que g de x sea diferente de 0”. Veamos un ejemplo:
Para saber más… Revisa el siguiente video en el que se explica un cociente de funciones: https://youtu.be/_hJkxqoZlCQ
Composición
Consiste en evaluar una función en otra. Dadas dos funciones f y g, la c omposición de éstas se expresa así: Se lee “f de x compuesta g de x igual a f compuesta g, de x”.
26
Siempre que el dominio de x pertenezca al dominio de g(x), y el dominio de g(x) pertenezca al dominio de f(x). Se expresa de la siguiente forma:
Se lee “dominio de f compuesta g de x, igual a x, tal que x pertenece al dominio de g ,y g de x pertenece al dominio de f de x”. Veamos un ejemplo:
Para saber más… Revisa en el siguiente video una introducción a la composición de funciones: https://youtu.be/Nc7dtwfgqtM Si aún tienes dudas sobre las operaciones con funciones revisa el siguiente video: Operaciones con funciones: suma, resta, multiplicación y división, https://youtu.be/78QxHDCibIE
27
Estadística
Introducción En la actualidad, la estadística se ha convertido en un método efectivo para describir con precisión los valores de datos políticos, sociales, económicos, psicológicos, etc., pues es una herramienta para relacionar y analizar dichos datos. La estadística se divide en estadística descriptiva y estadística inferencial. •
La estadística descriptiva o deductiva requiere del uso de modelos numéricos y grácos para resumir y presentar datos, es la que incluye las técnicas que se relacionan con el resumen y la descripción de datos numéricos.
•
Estadística inferencial o inductiva: Consiste Consiste en inferir propiedades propiedades de una población sobre la base de una muestra con resultados conocidos, se basada directamente en la teoría de la probabilidad. Es una disciplina puramente deductiva que proporciona una base racional para el razonamiento inductivo.
Objetivos particulares Al término de la unidad el alumno será capaz de: • • • •
Seleccionar y valorar resultados y datos sociodemográcos. Representar datos sociodemográcos. Comprender la lógica de la estadística y los modelos elementales. Dominar la estadística descriptiva y realizar operaciones estadísticas básicas con la nalidad de hacer inferencias generales sobre poblaciones delimitadas.
Temario 2.1 Introducción a la Estadística en Ciencias Sociales. 2.1.1 Estadística, ciencia y observación. 2.1.1.1 Inferencias de las poblaciones. Estadísticas Vitales y Estadísticas Matemáticas. 2.1.1.2 Utilidad y limitantes de la Estadística en las Ciencias Sociales. 2.1.1.3 Población y muestras. 2.1.1.3.1 Tipos de muestras. 2.1.1.3.2 Tipos de encuestas, general. 2.1.2 Estructura de información, métodos de investigación. 2.1.3 Variables, medición. 2.1.4 Anotación estadística.
28
2.2 Frecuencias. 2.2.1 Distribución de frecuencias. 2.2.2 Distribuciones – Tablas y Grácas (relaciones x, y). 2.2.2.1 Presentación de tablas, intervalos. 2.2.2.1 Presentación de tablas, intervalos. 2.2.3 Tendencia Central Total. 2.2.4 Promedio, Media, Moda. 2.2.4.1 Teorema Teorema de tendencia central y Skweness y Kurtosis. 2.3 Variabilidad. 2.3.1 Rango y rango intercuartil. 2.3.2 Desviación estándar. 2.4 Diseño de hipótesis en las Ciencias Sociales. 2.4.1 Causalidad y correlación Pearson. 2.4.2 Hipótesis nula. 2.4.3 Pruebas de hipótesis. 2.4.3.1 Error estándar. 2.4.3.2 Estimación. 2.4.3.3 Índice de conanza. 2.5 Modelos probabilísticos. 2.5.1 Normal. 2.5.2 Binomial. 2.5.3 Poisson.
Exposición de los temas
2.1.1. ESTADÍSTICA, CIENCIA Y OBSERVACIÓN La estadística es una rama de las matemáticas que, mediante las técnicas que proporciona, permite recolectar, organizar, organizar, presentar, analizar e interpretar datos, ya sea de una muestra o inferir sobre una población, lo cual permite tomar decisiones acertadas. Ciencia Es una disciplina que utiliza el método cientíco con la nalidad de hallar estructuras generales. Observación o dato
A cada resultado que se obtiene al realizar un experimento se le llama dato u observación.
2.1.1.1. INFERENCIAS EN LAS POBLACIONES. ESTADÍSTICAS VITALES Y ESTADÍSTICAS MATEMÁTICAS La inferencia estadística es un proceso que señala los aspectos contenidos en una población, utilizando únicamente la información de una muestra. El uso de la inferencia estadística tiene grandes v entajas, ya que se ahorra tiempo y dinero al recolectar información de una manera más sencilla.
29
Las estadísticas vitales son “el resultado del recuento de los hechos ocurridos en la vida de la población, como son: nacimientos, matrimonios, divorcios, defunciones y muertes fetales. Las estadísticas vitales son elementos básicos para el análisis demográco de la situación de un país, así como uno de los requisitos para poder llevar a cabo la planicación del desarrollo económico y social. Ya que proporcionan información sobre la tendencia del crecimiento natural de la población basándose en las tasas de natalidad y mortalidad; sobre la conducta de sus componentes, su distribución geográca y mediante su agregación a lo largo del tiempo, sobre el tamaño de la población y su estructura. Por otro lado, permite identicar a los grupos demandantes de servicios médicos, educación, vivienda, etc.” (INEGI, 2003, p. 1). La estadística es una rama de las matemáticas que estudia la recolección, organización y análisis de los datos, los resume y simplica para su análisis y estudio.
2.1.1.2. VENTAJAS Y LIMITANTES DE LA ESTADÍSTICA EN LAS CIENCIAS SOCIALES La estadística cuenta con una serie de técnicas que tienen aplicación en las más diversas disciplinas, el uso de ellas depende del conocimiento de las personas que las apliquen. Asimismo, provee los elementos básicos para fundamentar una investigación. Limitantes: Al Al utilizar la estadística es importante cuidar cómo se obtiene, cuantica y presentan los datos para no dar un mal uso de ellos, porque esto puede hacer que las personas interpreten mal la información y, por tanto, el trabajo pierde validez. Además, está la ética de quienes recolectan la información y no intervenir en los datos que s e obtienen. Considera que los problemas de investigación social requieren estar denidos teóricamente de manera correcta, de lo contrario de poco servirá el uso de un aparato estadístico (García, 1989).
2.1.1.3. POBLACIÓN Y MUESTRAS La población o universo se dene como el conjunto de todos los individuos, objetos, o medidas que poseen alguna característica común observable. Por ejemplo, todas las mujeres que son madres solteras de cierto país. La muestra es un subconjunto de la población, seleccionada mediante procedimientos aleatorios (al azar) o por métodos dirigidos a obtener representatividad de la población de donde se obtiene. Las muestras son consideradas como una autentica representación de la población donde todos y cada uno de los individuos objetos tienen la misma oportunidad de ser seleccionados, mediante los diferentes tipos de muestreo.
2.1.1.3.1. TIPOS DE MUESTRAS Muestras de conveniencia Cuando la conveniencia sea la consideración fundamental y sólo se escojan para observación las unidades elementales más fácilmente accesibles, el subconjunto resultante de todas ellas o de una población estadística asociada, constituye una muestra de conveniencia. La Constitución, en su parte orgánica, señala puntualmente el ámbito de competencia de cada poder y también contiene los medios de control de su actividad. En el siguiente cuadro se exponen sus rasgos fundamentales:
30
Muestras de juicio Éste es un tipo de muestra más compleja, ya que se basa en la experiencia previa, juega un papel importante en la selección de unidades elementales para observación. Sin embargo, formular dicho juicio puede ser punto menos que imposible, en especial cuando las unidades elementales son heterogéneas y la muestra deseada es pequeña.
Muestras aleatorias (o de probabilidad) Son de gran importancia, pues evitan el problema de la carencia de representatividad, es la muestra aleatoria o muestra de probabilidad, la cual es un subconjunto de todas las unidades de una población asociada de sus características, que se escoge por un proceso aleatorio que dará a cada unidad de una población asociada una posibilidad positiva y conocida de seleccionarse (aunque no necesariamente igual).
2.1.1.3.2. TIPOS DE ENCUEST ENCUESTAS, AS, GENERAL Una encuesta es una técnica cuantitativa que consta de una serie de preguntas realizadas a una muestra representativa de una población, diseñada para obtener información especíca de los participantes. A partir de esto se pueden obtener mediciones cuantitativas de cualidades tanto objetivas como subjetivas de la población. Las encuestas pueden ser clasicadas de distintas maneras.
31
Malhotra, N. (2008). Clasicación de la técnica de encuesta [esquema]. Tomado Tomado de:
2.1.2. ESTRUCTURA DE INFORMACIÓN, MÉTODOS DE INVESTIGACIÓN Una vez recolectada la información por alguna técnica cuantitativa, ésta se puede analizar mediante un método de investigación que permita la mejor toma de decisiones.
El siguiente diagrama muestra el proceso cuantitativo.
32
2.1.3. Variables, medición
Variable: Va riable: característica o fenómeno que puede tomar diferentes valores. Existen dos clases de datos, los c uales provienen de las siguientes variables.
Niveles de medición Los niveles de medición o escalas de medición rigen los cálculos que se llevan a cabo con el n de resumir y presentar los datos. Determinan las pruebas estadísticas que se deben realizar. Existen cuatro niveles de medición: nominal, ordinal de intervalo y de razón. La medición más baja, corresponde al nivel nominal. La más alta, o el nivel que proporciona la mayor información relacionada con la observación, es la medición de razón. El siguiente cuadro presenta la clasicación de dichos niveles.
33
El nivel de medición de los datos rige los cálculos que se llevan a cabo con el n de resumir y presentar los datos. También También determina las pruebas estadísticas que se deben r ealizar.
2.1.4. Notación estadística La notación estadística o nomenclatura es un lenguaje simbólico que se usa para representar de alguna forma ideas u operaciones matemáticas. La nomenclatura que se usa en estas notas se presentará de acuerdo con los temas que se vayan mencionando.
2.2. FRECUENCIAS Frecuencias: número de veces que ocurre un evento u observación, se representa ( f ).
2.2.1. Distribución de frecuencias Los datos ordenados en grupos o categorías reciben el nombre de distribución de frecuencias. Si se tiene un conjunto de datos, primero hay que organizarlos en forma ordenada y en subconjuntos que presentan características similares (misma asignatura, misma edad, misma estatura, etc.), con el propósito de facilitar su interpretación.
2.2.2. Distribuciones: tablas y grácas (relaciones x, y) El primer procedimiento que se emplea para organizar y resumir un conjunto de datos, organizándolos según su c lase y su frecuencia, es una tabla de frecuencias. Esta tabla puede ser utilizada para organizar y resumir datos cualitativos y datos cuantitativos. Ejemplo 1: La siguiente tabla de distribución de frecuencias es una muestra aleatoria de 130 personas en edad de votar en la ciudad M para elegir a un nuevo representante, está clasicada por grupo de edad.
34
En la primera columna se encuentran las clases o intervalos donde se clasican los datos de la muestra obtenida. El paréntesis indica el límite inferior de clase y el corchete el límite superior de clase. Por lo que el número de veces que se repite el evento sólo es en esa clase. En la segunda columna se encuentran el número de veces que se repite el evento en cada clase.
2.2.2.1 Presentación de tablas, intervalos Considerando el ejemplo 1, con los datos recolectados de la muestra de votantes se presenta el desarrollo de la Tabla de distribución de frecuencias absolutas y relativas. Tabla Tab la de distribución de frecuencias absolutas y relativas
Estas frecuencias se determinan de la siguiente manera: La Xi es un promedio aritmético de clase, que se obtiene sumando los límites reales de clase y dividiéndolos entre dos. De la clase 2 tenemos (24 + 30) / 2 = 27 La fr se obtiene de dividir la f de cada clase entre el total de datos u observaciones (en este caso son 130). La fa de una clase se obtiene de sumar la fa de esa clase y la f de la clase siguiente. El resultado de la clase 2 es 18 + 27 = 46. La fra de una clase se obtiene de sumar la fr acumulada de esa clase y la frecuencia relativa de la clase siguiente. El resultado de la fra de la clase 3 es 0.35 + 0.20 = 0.55.
Nomenclatura: f: frecuencia absoluta Xi: marca de clase o promedio de clase Fr: frecuencia relativa fa: frecuencia absoluta acumulada fra: frecuencia relativa acumulada
35
2.2.2.2. Histogramas, grácas de barra, polígonos
Los grácos son la representación de los datos en forma de dibujo, de tal manera que la persona que los vea pueda comprender los datos recabados sin tener que remitirse a una tabla de frecuencias. Las grácas se clasican según el tipo de datos, si son cualitativos o cuantitativos.
36
2.2.3 TENDENCIA CENTRAL TOTAL Las medidas de tendencia central son medidas descriptivas que indican hacia dónde tienden a concentrarse los valores contenidos en un conjunto de datos.
2.2.4. MEDIA (PROMEDIO), MEDIA, MODA Las medidas de tendencia central más utilizadas son la media, mediana y moda. Media es el punto del rango o distribución por encima o por debajo del cual hay un número exactamente igual de unidades de Media es desviación. Se obtiene dividiendo la suma de todas las puntuaciones por el número de éstas.
37
Mediana es el dato central o medida de posición. Moda es Moda es el valor que más veces se repite.
Para datos agrupados La media aritmética o promedio se denota con:
Se calcula con la fórmula siguiente: Media
Mediana LRi = límite real inferior de la clase que contiene la mediana. n = núm. total de observaciones en la distribución de frecuencias (n para muestra). fa = frecuencia acumulada de la clase que contiene la mediana. >fc = número de observaciones en la clase que contiene la mediana (donde se está trabajando). Moda Donde: LRi = límite real inferior de la clase que contiene la moda. d1 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase precedente. d2 = diferencia entre la frecuencia de la clase modal y la frecuencia de la clase siguiente.> i = tamaño del intervalo de clase.
38
De la distribución de frecuencias del ejemplo 1, determinar las medidas de tendencia central. Media
Realizar el producto de la frecuencia absoluta con la marca de clase, de cada clase. De la clase 3 se tiene 26 x 33 = 858, esto se hace con todas las clases para determinar la sumatoria y ésta es 4452.
Sustituyendo en la fórmula se tiene:
39
Mediana Se obtiene a partir de obtener la posición c entral
ésta se encuentra en la clase 3, de acuerdo a la fórmula fa = 46, y la fc que le corresponde es 26.
Sustituyendo en la fórmula tenemos:
Mediana En el caso de datos agrupados se identica la clase modal, es decir, la clase que contenga más datos o la de mayor frecuencia. En este caso es 28, por lo que se procede a determinar d1 = 28 – 18 = 10 y d2 = 28 – 26 = 2
Sustituyendo en la fórmula:
40
Para datos no agrupados Media
Mediana: se ordenan los datos de manera ascendente o descendente.
Moda: Es el valor que más se repite en una serie de datos. Moda: Es Ejemplo 2: Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:
Determinar: Media:
Mediana Una vez ordenados los datos, el dato central o medida de posición es 20 años de edad.
41
Moda La edad que más se repite es 20 años de edad.
2.2.4.1. TEOREMA DE TENDENCIA CENTRAL Y ASIMETRÍA (SKWENESS) Y KURTOSIS Las medidas de tendencia central dan un valor representativo de la distribución de frecuencias situado en un lugar intermedio (promedio) alrededor del cual se encuentran otros valores. Indican cuál es el comportamiento de los datos, es decir, hacia dónde tienden a agruparse. Asimetría de Pearson, el coeciente de asimetría de Pearson mide la desviación de la asimetría, expresando la diferencia entre la media y la mediana con respecto a la desviación estándar del grupo de mediciones. Las fórmulas son:
Para una distribución simétrica, el valor del coeciente de asimetría es siempre 0, porque la media y la mediana son iguales. Para una distribución con asimetría positiva, la media es siempre mayor que la mediana, por lo que el valor del coeciente es positivo. Para una distribución con asimetría negativa, la media es siempre menor que la mediana, por lo que el valor del coeciente es negativo. Coeciente de asimetría α3
42
La fórmula de momentos se determina para… Datos agrupados
Datos no agrupados
La curtosis es una medida de apuntamiento de una distribución de frecuencias, es el grado de concentración alrededor de la media su resultado representa el grado de apuntamiento de una distribución, es decir, qué tan puntiagudo o qué tan aplanada es la curva de una distribución. Las formas de una distribución simétrica reciben distintos nombres. Leptocúrtica: Es la curva donde se tiene mayor apuntamiento.
Mesocúrtica: De acuerdo a la distribución de valores, ni es plana, ni puntiaguda, tiene una proporcionalidad de concentración alrededor del centro de la distribución de frecuencias.
43
Platicúrtica: Se tiene poca concentración o menor apuntamiento alrededor del centro en ambas direcciones, su forma es plana.
El índice de curtosis se determina de acuerdo a los datos que se tengan, pueden ser de una muestra o de una población, o que los datos se encuentren agrupados o no agrupados. Se representa mediante la expresión α4
y su cálculo se realiza mediante la fórmula de momentos para datos agrupados.
El cuarto momento es siempre positivo y se usa para conocer el apuntamiento de la distribución o coeciente de curtosis. Cuando el índice de curtosis es:
El cuarto momento sirve como una medida absoluta de apuntamiento o curtosis.
44
Para datos no agrupados
Ejemplo 3: Con los datos del ejemplo 1, determinar el índice de curtosis. La tabla siguiente presenta los datos que se requieren para determinar la curtosis (recordemos que la media ya se había calculado). Se agregan las columnas para calcular la curtosis.
Media
Desviación estándar
45
Se calcula el momento 4, sustituyendo en la fórmula momento 4
y se determina el coeciente de curtosis sustituyendo en la fórmula
como α4 = 1.69, y 1.69 < 3 la forma es platicurtica, es decir, se tiene poca concentración o menor apuntamiento alrededor del centro.
2.3. VARIABILIDAD La variabilidad o dispersión permite comprender qué tan dispersos (esparcimiento) se encuentran las observaciones con respecto a un punto medio o promedio. Es decir, es un número que indica el grado de dispersión en un conjunto de datos con respecto al promedio.
2.3.1. RANGO Y RANGO INTERCUARTIL El rango o amplitud, se clasica como una medida de distancia. En el caso de una distribución de frecuencias se encuentra al considerar el valor del límite superior real de la última clase menos el valor del límite real inferior de la primera clase.
Para datos agrupados Para datos agrupados Donde: R = Rango o amplitud LSC = Límite superior real de la última clase LIC = Límite inferior real de la primera clase El rango intercuartílico permite intercuartílico permite medir la dispersión de los datos y es la diferencia entre el primero y el tercer cuartil. Los cuartiles dividen a la serie de datos en cuatro partes porcentuales.
46
El valor del Q2 es el que coincide con la mediana o punto medio. Por lo que el Q3 indica que es el valor del cual quedan tres cuartas partes por debajo de 75 %. Los cuartiles se calculan con la fórmula de la mediana, sólo cambia el número del cuartil a determinar.
Donde: m = 1, 2, 3 el número de cuartil a calcular. Li = Límite inferior de la clase donde s e encuentra el cuartil m. n = número de datos. fa = frecuencia acumulada de la clase que precede a la clase del cuartil m. i = tamaño del intervalo de la clase del cuartil m.
Con los datos de la tabla de frecuencias absolutas y relativas del ejemplo 1, determinar el rango y el rango intercuartil. Solución: Rango R = LSC - LIC Sustituir en la fórmula los datos correspondientes. R = 48-18 = 38 años de edad Para el rango intercuartil, primero se calculan Q3 y Q1 Sustituyendo en la fórmula se tiene
Por lo tanto R = 42.12 – 27.10 = 15.02
47
Para datos no agrupados El rango se puede conocer a partir de una muestra ordenada de tamaño n, en donde el rango es la diferencia que hay entre el valor máximo y el valor mínimo de la serie o conjunto de datos. R = Dm – dm Donde: dm Donde: Dm = Valor mayor dm = Valor menor Rango intercuartil El rango intercuartil es la diferencia entre el primero y tercer cuartil, permite medir la extensión o dispersión de los datos. Se calcula con la fórmula: R = Q3 - Q1 Para datos no agrupados los cuartiles se calculan con la fórmula:
Donde: Q = cuartil. m = 1, 2, 3 el número de cuartil a calcular. X = la posición del cuartil a calcular para encontrar su valor. n = número de datos. Con los datos del ejemplo 2, calcular el rango y el rango intercuartil. Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:
Rango Solución Sustituyendo en la fórmula R = 25 – 18 = 7
48
2.3.2. DESVIACIÓN ESTÁNDAR La desviación estándar es una medida de variabilidad que toma en cuenta la dispersión de los valores de los datos respecto a su media y su resultado se expresa en las mismas unidades de la variable que se examina. Se representa con la letra S para la muestra y σ para la población.
Fórmulas para datos agrupados
Fórmulas para datos no agrupados
49
Datos agrupados Con los datos del ejemplo 1 Determinar: Desviación estándar
Solución
Se agrega una columna para realizar lo que indica el numerador de a fórmula como se muestra en la siguiente tabla.
Sustituyendo en la fórmula
50
Datos no agrupados Con los datos del ejemplo 2 Se preguntó la edad a un grupo de estudiantes que se encuentran en la parada de la ruta 2 del PumaBús, se obtuvo lo siguiente:
Determinar: Desviación estándar
Solución: Primero calcular lo que indica la fórmula en el numerador (la media ya se había calculado y es 21), se puede realizar una tabla para que sea más práctico el cálculo.
∑ 79 Sustituyendo en la fórmula se tiene
51
Referencias INEGI. (2003). Síntesis metodológica de las estadísticas vitales. México: Dirección General de Estadística. Dirección de estadísticas demográcas y Sociales. Consultado de http://www http://www.inegi.org.mx/est/cont .inegi.org.mx/est/contenidos/espanol/metodologias/regi enidos/espanol/metodologias/registros stros García-Ferrando, M. (1989). Socioestadística: Introducción a la estadística en sociología. Madrid: Alianza editorial. Malhotra, N. (2008). Investigación de Mercados. México: Pearson Prentice Hall. Hernández, R., Fernández, C., Baptista, P. P. (2010). Metodología de la investigación. México: McGraw-Hill. Tipos de encuesta: http://www http://www.tiposde.org/escolares/123-tipos-de-encuest .tiposde.org/escolares/123-tipos-de-encuestas/#ixzz4PxJzA9ef as/#ixzz4PxJzA9ef What is Skewness - Business Statistics Tips. Disponible en: https://youtu.be/RAekTsenqPI https://youtu.be/RAekTsenqPI
2.4. DISEÑO DE HIPÓTESIS EN LAS CIENCIAS SOCIALES Una hipótesis es una armación sobre una característica de la población estudiada. Para conocer si podemos aceptar o rechazar una hipótesis recabamos información de la población. Sin embargo, no siempre será posible recabar información de todos los elementos de la población; en eso casos tomaremos datos de una o varias muestras. Estos datos se someten a un procedimiento estadístico llamado prueba de hipótesis para aceptar o rechazar nuestras armaciones iniciales. García (1989), en Socioestadística, nos explica que “Una parte importante de la investigación que se lleva a cabo en el campo de la sociología está relacionada con la aceptabilidad o rechazo de las hipótesis que se deducen de las teorías sociológicas” (p. 157). Por ello, en este tema revisaremos en qué consiste el diseño de una hipótesis y cómo se ponen a prueba.
2.4.1. CAUSALIDAD Y CORRELACIÓN PEARSON Una correlación es una relación, estadísticamente signicativa, entre dos variables. Nos interesa estudiar correlaciones porque si dos variables están correlacionadas podríamos predecir el comportamiento de una variable en función de la otra. La posibilidad de correlación entre dos variables puede ser vista como un supuesto, es decir, una hipótesis; existen procedimientos para analizar la existencia de correlaciones. Es posible analizar la relación entre variables utilizando grácos de dispersión, como los siguientes:
52
La gura (a) muestra una relación lineal positiva entre “ más o menos proporcional. La gura (b) muestra una correlación lineal negativa entre “ proporcional.
”y“
”, esto quiere decir que si aumenta x también aumenta y de manera ”y“
”, es decir, si aumenta x disminuye y, de manera más o menos
Además de la apreciación apreciación gráca de una correlación existen existen formas de medir medir la intensidad con la que se relacionan dos variables. variables. Para variables cuantitativas existe el coeciente de correlación lineal o coeciente de Pearson. Este estadístico arroja un resultado entre -1 y 1. Cuando el valor del coeciente de Pearson es c ero, decimos que no hay correlación entre las variables. Si el v alor del coeciente es negativo decimos que hay una correlación lineal negativa, y por el contrario si es positivo hay una correlación lineal positiva. Entre más se acerque el valor del coeciente a -1 o a 1 más fuerte será la correlación entre las dos variables. Cuando se estudian correlaciones es posible caer en el error de considerarlas como relaciones causales, es decir, suponer que una variable causa a otra. Sin embargo, es posible que una tercera variable esté inuyendo en el comportamiento de las dos variables estudiadas. A esa tercera variable se le llama interviniente.
Para saber más… Revisa el siguiente video en el que se explica un caso que confunde una correlación con causalidad: https://youtu.be/h01rR3M1OT8
2.4.2. HIPÓTESIS NULA Recordemos que en estadística una hipótesis es un supuesto sobre el valor de un parámetro poblacional. Por ejemplo, podemos suponer que los ingresos medios de los trabajadores del sector de la construcción son 7000 pesos. En este caso nuestra hipótesis se reere a la media de una variable para toda una población. La hipótesis de partida se llama hipótesis nula. Es común que se formule una hipótesis nula no con el propósito de probarla sino de rechazarla y de esta manera probar la armación deseada. Por ejemplo, si se quiere demostrar que un método de estudio da resultados diferentes a otro, la primera hipótesis nula sería “los métodos dan el mismo resultado”; luego hacemos la prueba y si rechazamos esta primera hipótesis al menos habremos obtenido evidencia de que los métodos estadísticos no dan el mismo resultado. La hipótesis nula se denota con A la evidencia de que la hipótesis nula es rechazable le llamamos hipótesis alternativa. Usualmente, la hipótesis alterna se reere a la hipótesis propuesta por el investigador. Siguiendo nuestro ejemplo, la evidencia de que los métodos estadísticos no dan el mismo resultado es nuestra hipótesis alternativa. La hipótesis nula es sometida a una prueba de hipótesis con la cual se le rechaza o se le acepta. En caso de que se le rechace, se asume como factible la hipótesis alterna.
2.4.3 PRUEBAS DE HIPÓTESIS Ya comentamos que una hipótesis estadística es una armación sobre una característica de la población estudiada. Veamos un ejemplo: “los habitantes de la ciudad participan en promedio en tres actos de corrupción al mes”; ésta es una armación sobre el parámetro media de la población estudiada. Ahora, una prueba de hipótesis es un procedimiento generalmente aceptado para tomar una decisión: se acepta o se rechaza la hipótesis. También También es conocida como prueba de signicancia, test de hipótesis, ensayo de hipótesis o contraste de hipótesis.
53
Un contraste de hipótesis consiste en comparar la hipótesis nula versus la hipótesis alternativa, para ello se dividen los datos muestrales en dos zonas, la zona de aceptación y la zona de rechazo. El valor que resulte de la prueba de hipótesis caerá en la zona de aceptación o en la zona de rechazo. Para ejemplicar este concepto grácamente observa la imagen de la siguiente distribución muestral:
Si el estadístico de contraste cae en la región de rechazo, entonces rechazamos la hipótesis nula. Si el estadístico de contraste cae en la región de aceptación entonces aceptaremos la hipótesis nula. A la región de rechazo se le conoce como como región crítica y los puntos que la delimitan son conocidos como puntos críticos de rechazo. García (1989) considera que los procedimientos estandarizados que se siguen en las pruebas de decisión estadística son los siguientes: • • • • • •
Formulación de las hipótesis estadísticas • Hipótesis nula • Hipótesis alternativa Elección de una prueba estadística con su modelo asociado para contrastar Especicación de un nivel de signicación y un tamaño de la muestra. Encontrar la distribución muestral de la prueba estadística en el supuesto Denición de la región de rechazo de la hipótesis nula. La denición de hipótesis nula e hipótesis alternativa ya se ha explicado en el apartado 4.2.
En cuanto a la elección de una prueba estadística, diremos que se trata de elegir un estadístico de contraste, es decir, una variable aleatoria, cuya distribución muestral nos permite determinar la probabilidad asociada a un determinado valor para el estadístico. Al criterio que utilicemos para saber si aceptamos o rechazamos la hipótesis nula le llamamos regla de decisión. Consiste en denir la zona de rechazo y la zona de aceptación de la hipótesis nula. La zona de rechazo contiene a todos los valores para el estadístico de contraste que se alejan de la hipótesis nula y por lo tanto es poco probable que ocurran si dicha hipótesis es verdadera. La prueba de contraste puede ser unilateral si para tomar la decisión utilizamos sólo valores de uno de los extremos de la gráca, como se muestra en la siguiente imagen:
54
También podemos hacer un contraste bilateral si utilizamos ambos extremos de la gráca.
55
2.4.3.1. ERROR ESTÁNDAR Existe la posibilidad de una vez concluida la prueba de hipótesis rechazar
cuando en realidad sí era verdadera; en este caso se
dice que se comete un error de tipo I. O por el contrario, podríamos aceptar de tipo II. Veámoslo en la siguiente tabla:
cuando en realidad era falsa, a esto se le llama error
Se llama nivel de signicación de una prueba de hipótesis a la probabilidad de cometer un error de tipo I. Se representa con la letra griega alfa . El nivel signicancia o nivel de riesgo se dene como la probabilidad de rechazar la hipótesis nula cuando es verdadera. Es posible que quien realiza la prueba de hipótesis determine el nivel de signicancia.
Para saber más… Repasa el concepto de tipos de errores con el siguiente video: https://youtu.be/XEULRVqVT0U
2.4.3.2. ESTIMACIÓN Los métodos básicos de la estadística inferencial son la estimación y el contraste de hipótesis. De una población se extrae una muestra, a partir de dicha muestra se determinan una serie de estadísticos (media muestral, varianza muestral, etc.), y a través de los procedimientos de estimación y contraste se hallan los parámetros (media poblacional, varianza poblacional, etc.) que describen a dicha población.
56
• •
Estimación puntual: determina un valor único para el parámetro. Estimación por intervalo de conanza: se determina un intervalo dentro del cual puede estar el parámetro.
Para saber más… Revisa en el siguiente video la diferencia entre una estimación puntual y una estimación por intervalo: https://youtu.be/DPpSrsndLJQ
Generalmente se realizan estimaciones por intervalo, porque tenemos mayor probabilidad de acertar sobre el valor de un parámetro si decimos que se encuentra entre todos los números posibles enmarcados por el límite inferior del intervalo y el límite superior del intervalo. Matemáticamente establecemos la siguiente denición:
Se lee “theta es mayor o igual que theta uno, y menor o igual que theta dos”. Donde es el parámetro a estimar y
son los límites inferior y superior respectivamente.
Donde es el parámetro a estimar y
son los límites inferior y superior respectivamente.
Variabilidad Vari abilidad del parámetro Habitualmente se usa la desviación típica poblacional.
Error de estimación Mide la precisión de la estimación. Cuanta más precisión necesitemos, más estrecho debe ser el intervalo de conanza, y por lo tanto menor será el error de estimación. Un menor error generalmente requiere de muestras más grandes.
Nivel de conanza Es la probabilidad de que el valor del parámetro que estamos buscando se sitúe en el intervalo de conanza. Se denota con y generalmente se expresa como porcentaje, es habitual tener niveles de conanza del 95 % y 99 %. Como ya habrás observado, si aumentamos el ancho de un intervalo tenemos un mayor nivel de conanza pero también admitimos un mayor error de estimación.
57
Valor Se lee como valor alfa. Conocido como nivel de signicación, es la probabilidad de fallar en la estimación del parámetro. Se calcula como la diferencia entre la certeza (la probabilidad 1) y el nivel de conanza. Entonces si establecemos un nivel de conanza de .95, alfa es igual a 1-0.95, es decir, alfa es igual a 0.05.
Valor crítico Z Es el valor de una abscisa en una distribución. Normalmente los valores críticos están tabulados.
Para saber más… Revisa el siguiente video para conocer cómo utilizar una tabla de valores Z: https://youtu.be/UEVkpAIEB1w
Existen diversos procedimientos para encontrar el intervalo de conanza de un parámetro, revisa uno de ellos en el siguiente video:
Para saber más… Procedimiento para realizar una estimación por intervalo de conanza: https://youtu.be/N36TGN8k2tY
2.4.3.3. ÍNDICE DE CONFIANZA (NIVEL DE CONFIANZA) Como ya revisamos en el punto anterior el nivel de conanza indica la proporción de veces que será cierto un parámetro al seleccionar muchas muestras. Ahora que conoces los conceptos referentes a la estimación es importante que los uses para interpretar el valor de un parámetro. Por ejemplo: si te dicen que un valor promedio se sitúa en 24 puntos, con 3 puntos de margen de error y un nivel de conanza del 95 %, debemos entender que el valor del promedio en realidad s e sitúa entre 22.5 y 25.5 puntos con una conanza de acertar en ese intervalo el 95 por cien de las veces que lo calculemos. Los límites del intervalo de conanza se obtienen de añadir al parámetro la mitad del margen de error hacia abajo y la mitad hacia arriba.
Para saber más… Repasa el concepto de nivel de conanza revisa el siguiente video: https://youtu.be/YDFzX4fT1BU
58
5. MODELOS PROBABILÍSTICOS Antes de explicarte los modelos probabilísticos te comentaremos de manera general en qué consiste la teoría de la probabilidad y su importancia. Esta teoría estudia qué tan posible es que ocurra un evento. Por ejemplo, ¿qué tan probable es que bajo ciertas condiciones llueva hoy? ¿Qué tan probable es que al lanzar una moneda caiga águila? La teoría de la probabilidad tiene su origen en los trabajos de Antoine Gombaud —llamado Caballero de Méré—, Blaise Pascal y Pierre de Fermat. Gombaud era un jugador asiduo sobre todo de cartas y dados, y tratando de encontrar la mejor manera de ganar estos juegos planteó varios problemas matemáticos relacionados con la probabilidad de obtener uno u otro valor en algún momento del juego. Pascal y Fermat, junto con Gombaud, comenzaron a resolver los problemas propuestos, y este conocimiento se convirtió en el fundamento de la teoría de la probabilidad (Hald, AÑO , p. 42). Matemáticamente, la probabilidad de que un evento ocurra se expresa de la siguiente forma: P(x)= Casos favorables / Casos posibles Se lee “la probabilidad de que ocurra x es igual a los casos favorables entre los casos posibles”.
Para saber más… https://youtu.be/D4Udmu3FHZA
Por último, podemos comentar que el objetivo de un modelo probabilístico es predecir la manera en como probablemente se comportará una variable aleatoria. Una variable aleatoria es aquella cuyo valor está determinado por el azar, es decir, puede tomar un valor dentro de un conjunto de valores posibles. Hay variables aleatorias discretas y continuas. Las discretas toman valores discontinuos y las continuas toman valores sin interrupciones. Veamos algunos ejemplos: Cantidad de personas formadas en una la. Es una variable discreta porque no puede haber 2.5 personas. Sólo puede haber 2 o 3 personas. Es decir, el valor de la variable se ve interrumpido, es discontinuo. Consumo de refresco al día. El consumo de refresco se puede medir en litros y es posible tener 2.1 litros, 2.18 litros, 2.1842 litros y así hasta el innito. Por lo tanto, la variable tiene valores continuos que nunca se interrumpen. En el siguiente esquema se observa la relación entre la estadística descriptiva, el estudio de la probabilidad y la cr eación de un modelo teórico.
59
Los modelos para encontrar la probabilidad de cada valor de una variable aleatoria se c onocen como distribuciones de probabilidad . Una distribución de probabilidad se concreta en una fórmula, gráca o tabla. Toda distribución de probabilidad cumple las siguientes condiciones: • •
La suma suma de las probabilidades probabilidades de todos todos los valores de de x es igual igual a 1. La probabilidad probabilidad de cada valor valor x es mayor mayor o igual a 0 y menor o igual a 1.
A continuación continuación mencionaremos algunas de las distribuciones de probabilidad más más usadas, brevemente, porque las estudiarás con más detalle cuando realices la actividad de aprendizaje.
2.5.1. NORMAL En una distribución normal una variable aleatoria continua se representa grácamente como una curva simétrica, en forma de c ampana (llamada campana de Gauss ). Es la distribución más utilizada porque muchos fenómenos estudiados se distribuyen con esta forma.
Una característica evidente del diagrama anterior es que coinciden en el mismo punto el valor medio, la mediana y la moda de la distribución.
Para saber más… https://youtu.be/csBanoXXmPc
60
2.5.2. BINOMIAL La distribución binomial sirve para estudiar la probabilidad de una variable aleatoria discreta que puede tomar uno de dos valores. Cumple con las siguientes condiciones: • • • •
Se efectúo un número jo de ensayos. El resultado de un ensayo no afecta a el resultado del resto. Todos los ensayos deben clasicarse en dos categorías. Las probabilidades se mantienen constantes para cada ensayo.
Una de las fórmulas generalmente empleadas es:
Donde: x = número de éxitos en “n” ensayos n = número de ensayos p = probabilidad de éxito q = probabilidad de fracaso (q es igual a 1 menos p)
Para saber más… https://youtu.be/bfbp2WaMYV8
2.5.3. POISSON La distribución de Poisson se utiliza para calcular la probabilidad de que ocurra un evento durante un intervalo especíco. Dicho intervalo puede referirse a tiempo, distancia, volumen o cualquier magnitud similar. Se ocupa la fórmula:
Donde: x = número de ocurrencias de un suceso durante un intervalo = media de la distribución e = número euler = 2.71828
61
Para saber más… https://youtu.be/uAcWCOOPWa8
Referencias García-Ferrando, M. (1989). Socioestadísti Socioestadística: ca: Introducción a la estadística en sociología . España: Alianza. Hald, A. (2003). A History Nueva Jersey: John Wiley & Sons. History of probability and statistics and their applications before 1750 Nueva Elorza, H. (2008). Estadístic (3.ª ed.). México: Cengage Learning Estadísticas as para las ciencias sociales, del comportamiento y de la salud (3.ª Editores. Triola, M. (2008). Estadística (9.ª ed.) México: Pearson Educación.
62