Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
ANALISIS ESTADISTICO DE DATOS Definiciones. Datos: Son las observaciones recolectadas Estadística:
Es una colección de métodos para planear estudios y experimentos, obtener datos y después organizar, resumir, presentar, analizar, interpretar y llegar a conclusiones basadas basadas en los datos.
Población:
Es la colección completa de todos los elementos a estudiar. Se dice que la colección es completa, pues incluye a todos los sujetos que se estudiaran.
Censo:
Es la colección de datos de cada uno de los miembros de la población.
Muestra:
Es un subconjunto de miembros seleccionados de una población.
Nota I. II.
Los datos muestrales deben ser representativos de la población. Los datos muestrales deben reunirse de una forma adecuada, como en un proceso de selección aleatoria.
TIPO DE DATOS (VARIABLES). Definiciones Parámetro:
Es una medición numérica que describe alguna característica de una población.
Estadístico:
Es una medición numérica que describe alguna característica de una muestra.
Datos Cuantitativos (Cuantificar):
Consiste en números reales que presentan conteos o mediciones.
Datos Cuantitativos (Categorías o Atributos):
Se dividen en diferentes categorías que se distinguen por alguna característica no numérica.
TIPOS DE DATOS CUANTITATIVOS Definiciones Datos Discretos (Numerables) (Numerables)
Es un conjunto finito o infinito de datos numerables. 1
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
Nota: Si el conjunto de datos posibles es finito entones es numerable.
Datos Continuos:
Resultan de un infinito de posibles valores que corresponden a alguna escala continua que cubre un rango de valores sin huecos.
TIPO DE DATOS CUALITATIVOS Definiciones Dato Nominal:
Nota: I. II. III.
Datos que consisten exclusivamente en números, nombres, etiquetas o categorías.
Los datos no se pueden acomodar en un esquema objetivo de orden. No tienen significado numérico. En ocasiones se asignan números a las distintas categorías.
Dato Ordinal: Son categorías que tienen un esquema de orden natural. Datos en Intervalos: Son datos ordenados, con la propiedad que la variación tiene
significado. Datos de Razón:
Son datos ordenados, con la propiedad que la variación tiene significado y que la comparación por medio de una proporcional tiene, también es significativo.
Pensamiento Crítico “Falacia o Estadística”
Se requiere de mucho criterio común en el estudio estadístico. Debido al desarrollo tecnológico, ahora nos enfocamos en la interpretación de datos y resultados. Tipos de Muestras Muestra voluntaria o auto seleccionada:
Es aquella en que los propios sujetos deciden ser incluidos.
Nota Las encuestas voluntarias por su naturaleza tienen graves errores. Ejemplo:
Encuestas por internet Encuestas por correo. Encuestas telefónicas. 2
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
Las cuales no sirven para sacar conclusiones acerca de la población. Muestras Pequeñas
Las conclusiones no se deben basar en muestras demasiado pequeñas. Gráficas Sirven para mostrar los diferentes datos, tales como: Barra Circular Otros elementos que hay que tomar en cuenta en una muestra son: - Pictogramas - Porcentajes - Preguntas Predispuestas - Orden de las preguntas - Falta de respuestas - Datos faltantes - Correlación y causalidad - Estudios para el propio beneficio - Números precisos - Imágenes parciales - Distorsiones deliberadas DISEÑO DE EXPERIMENTOS Nota I. Si los datos muestrales no se reúnen de una manera adecuada, todo estudio sobre ellos, podría resultar un estudio fallido. II. Los métodos estadísticos se rigen por los datos. Por lo general los datos se obtienen de dos fuentes distintas. A. Estudio Observacional Vemos y medimos características específicas, sin modificar los sujetos en estudio. Observan y miden, pero no modifican. B. Experimentos. Aplicamos algunos tratamientos y procedemos a observar sus efectos sobre los sujetos. Los sujetos son unidades experimentales. Tipos de estudios Observacionales
3
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez Los datos se observan, miden y resumen en un solo
Estudio Transversal:
momento. Estudio Retrospectivo:
Los datos se toman del pasado. Mediante Registros y/o entrevistas.
Estudio Prospectivo: Los datos se reunirán en el futuro y se toman de grupos (llamados
cohortes) que comparten factores comunes. Tipo de experimentos Nota: Los resultados de los experimentos en ocasiones se estropean debido a la confusión. Confusión:
Nota I. II.
Ocurre en un experimento, cuando uno no es capaz de distinguir entre los efectos de diferentes factores.
Siempre trate de planificar el experimento para que no se presenten errores. Es importante controlar los efectos de las variables.
Además de la confusión, los experimentos pueden fallar por otros factores. Ejemplo: Que la muestra no sea representativa de la población. Factores en el Diseño Experimental.>
I.
Control de los efectos de las variables. o Estudio a ciegas. o Bloques: Un conjunto de sujetos con condiciones similares.
Diseño de Bloques Aleatorios
Se utilizan para probar uno o más tratamientos diferentes. Sí, existen distintos grupos que pueden diferir en varios aspectos que podrían afectar las respuestas a los tratamientos. I. II.
Forme bloques de sujetos con características similares. Asigne los tratamientos de manera aleatoria a los sujetos dentro de cada bloque.
Diseño Experimental Completamente Aleatorio 4
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
Diseño Rigurosamente Controlado
Otros Factores Tamaño de la Muestra
La muestra debe ser lo suficientemente grande para que el comportamiento errático, que es característico de muestras muy pequeñas no tergiverse los efectos verdaderos. Réplica
Es la repetición de un experimento sobre un grupo suficientemente grande. Nota Utilice una muestra, de un tamaño que sea lo bastante grande para distinguir la verdadera naturaleza de cualquiera de los efectos. Obtenga la muestra utilizando un método apropiado, como uno basado en la aleatoriedad. Aleatoriedad Muestra Aleatoria:
Los miembros de la población se seleccionan de forma que, cada miembro individual, tiene la misma probabilidad de ser elegido.
Muestra Aleatoria Simple de n sujetos :
se selecciona de manera que cada posible muestra del mismo tamaño n tenga la misma posibilidad de ser elegida.
Muestra Probabilística:
Implica seleccionar miembros de una población de forma que cada miembro tenga una posibilidad conocida de ser elegido.
Muestreo Sistemático:
Elegimos algún punto de partida y luego seleccionamos cada k esimo elemento de la población.
Muestreo de Conveniencia: Simplemente se utilizan resultados que sean fáciles de
obtener. Muestreo Estratificado:
Subdividimos a la población, a lo menos en dos grupos (o extractos) diferentes de manera que los sujetos que pertenezcan al mismo subgrupo compartan la misma característica para luego obtener una muestra de cada subgrupo. 5
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
Muestreo por Conglomerado:
Primero dividimos el área de la población en secciones, luego elegimos al azar algunos de estos conglomerados y después, escogemos a todos los miembros de los conglomerados seleccionados
Muestreo de Etapas Múltiples:
Implica la selección de una muestra en diferentes pasos, los cuales suelen incluir distintos procedimientos de muestreo.
Errores de Muestreo:
Es la diferencia entre el resultado de una muestra y el resultado verdadero de la población. Este error es consecuencia de las fluctuaciones por azar.
Error que no es de Muestreo:
Sucede cuando los datos muestrales se obtienen, registran y analizan de forma incorrecta.
Característica Importante de los Datos 1. Centro Valor promedio o representativo que indica la localización de la mitad de los datos. 2. Variación Medidas de la cantidad en que los valores de los datos varían entre sí. 3. Distribución La naturaleza o forma de la distribución de los datos. 4. Valores Extremos Valores muestrales que están muy lejos de la vasta mayoría de los demás valores de la muestra. 5. Tiempo Característica cambiante de los datos.
6
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
DESTREZAS Y CONCEPTOS BASICOS Pag. 18, 19 y 20 libro mario triola Conocimientos estadísticos y pensamiento critico
1. Muestra de respuestas voluntarias. ¿Qué es una muestra de respuestas voluntarias y por qué generalmente no es adecuada para los métodos estadísticos? 2. Correlación y causalidad. Si realizamos un análisis estadístico y encontramos que hay una correlación (o una asociación) entre la cantidad de tiempo dedicado a estudiar y las calificaciones en distintos cursos, ¿podemos concluir que un mayor tiempo de estudio general calificaciones más altas? ¿Por qué? 3. Falta de respuestas. Un investigador determina que necesita los resultados de por lo menos 300 sujetos para realizar un estudio. Para compensar la baja tasa de respuestas devueltas por correo, envía una encuesta a 10.000 sujetos por este medio y recibe 320 respuestas. ¿El grupo de 320 respuestas es una buena muestra? 4. Pregunta predispuesta. El teléfono suena y una voz automatizada pregunta si usted está dispuesto a votar por un candidato ¨con una larga historia de aumento de impuestos y de malversación del dinero de los contribuyentes¨. Suponiendo que las llamadas se hacen a individuos elegidos al azar, ¿es probable que los resultados reflejen la preferencia de los votantes por dicho candidato? ¿Por qué?. 5. Estatura y ejercicio. Con base en un estudio de las estaturas de hombres y mujeres que juegan básquetbol, un investigador concluye que la ejercitación que se logra al jugar básquetbol causa que la gente crezca más. 6. Las personas que se gradúan de la universidad viven más tiempo. Con base en un estudio que revela que las personas que se gradúan de la universidad viven más tiempo que quienes no lo hacen, un investigador concluye que el estudio provoca que la gente viva más tiempo. 7. ¿Perfil racial? Un estudio revelo que en el condado de Orange se expiden más multas por exceso de velocidad a los individuos de grupos minoritarios que a los caucásicos. Conclusión: En el condado de Orange los individuos de grupos minoritarios exceden la velocidad límite más que los blancos. 8. Remedio contra el resfriado. En un estudio sobre los síntomas del resfriado, se encontró que todos los sujetos que estaban resfriados mejoraron dos semanas después de tomar píldoras de jengibre. Conclusión: Las píldoras de jengibre curan el resfriado.
7
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
9. El chocolate es un alimento saludable. El New York Times publicó un artículo que incluía la siguiente afirmación: “Por fin, el chocolate ocupa el lugar que merece en
la pirámide alimenticia, junto a sus vecinos de clase alta: el vino tinto, las frutas, los vegetales y el té verde. Varios estudios, reportados en el Journal of Nutrition revelaron que, después de comer chocolates, los sujetos a prueba incrementaron los niveles de antioxidantes en su sangre. El chocolate contiene flavonoides, antioxidantes asociados con la disminución del riesgo de enfermedades cardiacas y embolias. Mars, Inc., la empresa de dulces, y la Chocolate Manufacturers Association financiaron gran parte de la investigación”. ¿Qué es incorrecto en este
estudio? 10. Datos del censo.
Después de la realización del último censo nacional,
Poughkeepsie Journal imprimió el siguiente titular de primera página “281, 421, 906 en Estados Unidos”. ¿Qué es incorrecto en este titular?
11. Encuesta por correo. Cuando la autora Shere Hite escribió Woman and Love: A Cultural Revolution in Progress, basó sus conclusiones en las 4500 respuestas que recibió después de enviar por correo 110.000 cuestionaros a diversos grupos de mujeres. ¿Es probable que sus conclusiones sean válidas, en el sentido de que puedan aplicarse a la población general de todas las mujeres? ¿Por qué? 12. Números “900”. En una encuesta de “Nightline” de la Ab, 186.000 televidentes pagaron 50 centavos cada uno para llamar a un número telefónico “900” y dar su opinión acerca de mantener la sede las Naciones Unidas en Estados Unidos. Los resultados mostraron que el 67% de quienes llamaron estaban a favor de que las Naciones Unidas salieran de Estados Unidos. Interprete los resultados identificando lo que concluiríamos acerca del sentir de la población general, con respecto a mantener la sede de las Naciones Unidas en Estados Unidos. 13. Realización de encuestas. Usted planea realizar una encuesta para conocer el porcentaje de personas que vive en su estado que puedan identificar al asistente del gobernador, el cual planea postularse para el Senado de Estados Unidos. Usted obtiene direcciones y teléfonos de directorios y envía por correo una encuesta a 850 personas elegidas al azar. ¿Por qué no es correcto utilizar el directorio telefónico como fuente de los sujetos para la encuesta? 14. Pictogramas. Durante los últimos 10 años, los impuestos en Newport se han duplicado, y un candidato a alcalde desea elaborar una gráfica que destaque ese aspecto. El candidato representa los impuestos de hace 10 años utilizando una caja con anchura, longitud y altura de 1 pulgada. Luego, duplica cada dimensión para mostrar una caja más grande que represente los impuestos actuales. ¿Cuál es el volumen de la caja pequeña? ¿Cuál es el volumen de la caja grande? ¿Este 8
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
pictograma describe correctamente la relación entre los impuestos de hace 10 años y los impuestos actuales? 15. Cascos para motociclistas. El Senado del estado de Hawai entró en audiencia para considerar una ley que obligaba a los motociclistas a usar cascos. Algunos motociclistas testificaron que habían participado en choques donde los cascos resultaron inútiles. ¿Qué grupo importante no fue capaz de testificar? 16. Encuesta a un cliente de Merril Lynch. El autor recibió una encuesta de la empresa de inversiones Merril Lynch. La encuesta fue diseñada para medir su satisfacción como cliente, y contenía preguntas específicas para calificar al consultor financiero personal del autor. La portada de la carta incluía la siguiente afirmación: “Sus respuestas son extremadamente valiosas para su consultor financiero, Russell R. Smith y para Merril Lynch … Compartiremos su nombre y las respuestas con su consultor financiero” ¿Qué es incorrecto en esta encuesta?
17. Promedio de promedios. Un economista selecciona al azar a 10 individuos asalariados de cada una de las 50 entidades de Estados Unidos. Para cada estado calcula el promedio de los ingresos anuales y luego suma esos 50 valores y los divide entre 50. ¿Es probable que el resultado sea un buen estimado del promedio (media) de todos los individuos asalariados de Estados Uníos? ¿Por qué? 18. Pregunta incorrecta. Una encuesta incluye este reactivo: “Anote su estatura en pulgadas”. A partir de ese dato se espera obtener las estaturas reales de los encuestados y analizarlas; no obstante, hay dos problemas importantes en este reactivo. Identifíquelos. 19. Número de miembros de la familia. Usted necesita hacer un estudio para determinar el tamaño promedio de una familia en el estado donde vive. Para esto reúne datos que consten en el número de hermanos y hermanas de los estudiantes de su universidad. ¿Qué grupo de familias se pierde con este enfoque? ¿Los resultados serán representativos de todas las familias del estado? 20. SMSI. En una carta el editor del New York Times, la ciudadana de Moorestown, New Jersey, Jean Mercer criticó la declaración de que “colocar a los bebés en posición supina ha disminuido las muertes por SMSI”. SMSI son las siglas del
síndrome de muerte súbita infantil, y la posición supina implica estar acostado sobre la espalda con la cara hacia arriba. Ella sugirió que la siguiente afirmación es mejor: “Los pediatras aconsejaron la posición supina durante un periodo en el que disminuyeron las tasas de SM SI”. ¿Qué es incorrecto al decir que la posición
supina disminuyó las muertes por SMSI?
9
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
21. Porcentajes a. b. c. d.
Convierta la fracción 3/20 a un porcentaje equivalente. Convierta 56.7% a su equivalente decimal. ¿Cuál es el 34% de 500? Convierta 0.789 a un porcentaje equivalente.
22. Porcentajes a. ¿Cuál es el 15% de 620? b. Convierta 5% a su equivalente decimal. c. Convierta 0.01 a un porcentaje equivalente. d. Convierta la fracción 987/1068 a un porcentaje equivalente. Exprese la respuesta a la décima más cercana del porcentaje. 23. Porcentajes en una encuesta Gallup. a. En una encuesta Gallup, el 52% d3 1038 adultos encuestados manifestó que el tabaquismo pasivo es “muy dañino”. ¿Cuál es el número real de adultos que dijo que el tabaquismo pasivo es “muy dañino? b. De los 1038 adultos encuestados, 52 dijeron que el tabaquismo pasivo “no es dañino en absoluto”. ¿Cuál es el porcentaje de personas que escogió “no es dañino en absoluto”?
24. Porcentajes en un estudio de Lipitor. a. En un estudió del fármaco Lipitor contra el colesterol, a 270 pacientes se les dio u placebo, y 19 de esos 270 pacientes reportaron dolor de cabeza. ¿Qué porcentaje de este grupo placeo reportó dolor de cabeza? b. De los 270 pacientes del grupo placebo, el 3.0% reporto dolor de espalda. ¿Cuál es el número real de pacientes que reporto dolor de espalda? 25. Porcentajes delictivos en el campus. En un estudio sobre los delitos cometidos por estudiantes bajo la influencia de alcohol o drogas en los planteles universitarios, se aplicó una encuesta por correo a 1875 estudiantes. Un artículo de USA Today señaló que “el 8% de los estudiantes que respondieron de forma anónima afirmó
haber cometido un delito en el campus. En tanto que el 62% de ese grupo dijo que lo hizo bajo la influencia de alcohol o drogas”. Considerando que el número de estudiantes que respondió de manera anónima es 1875, ¿cuántos cometieron realmente un delito en el campus mientras estaban bajo la influencia de alcohol o drogas?
10
Análisis Estadístico de Datos
Profesor Juan Emilio Navarro Goncalvez
26. Porcentajes en los medios de comunicación y en la publicidad a. Un editorial del New York Times criticó un gráfico que describía un enjuague bucal que “reduce la placa dental en más del 300%”.
¿Qué es incorrecto en esta
afirmación? b. En el New York Times Magazine, un informe acerca de la disminución de la inversión occidental en Kenia afirmo que “después de años de vuelos diarios,
Lufthansa y Air France han interrumpido el servicio de pasajeros. La inversión extranjera cayó el 500% dur ante la década de 1990”. ¿Qué es incorrecto en esta afirmación? c. En un anuncio de Club, un dispositivo que se utiliza para disminuir los robos de automóviles, se afirmó que “Club reduce las probabilidades de robo de su automóvil en un 400 por ciento”. ¿Qué es incorrecto en esta afirmación?
11