Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Bioestadística Elemental e n e l Á re a d e l a S al u d Miguel Ángel Rodríguez Feliciano 1
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
INTRODUCCIÓN
¿Por qué la Bioestadística? ¿Usaron la estadística Galileo, Newton y Einstein? En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física, ...) aparece el concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no produce el mismo resultado) y asociado al mismo el de variable aleatoria. Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el mismo resultado) está caracterizada por un valor para cada condición. Una variable aleatoria está caracterizada por la llamada función densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condición. De manera general, se considera que la bioestadística, es el conjunto de métodos científicos ligados a la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. Arte de la decisión en presencia de incertidumbre. La Bioestadística es la ciencia que estudia los métodos que permiten realizar los procesos de encontrar y describir las variables aleatorias de interés y las relaciones entre ellas, para el problema en estudio. Estos métodos permiten resumir datos y acotar el papel de la casualidad (azar).
2
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
JUSTIFICACION En el area de la salud y en particular en el trabajo que se realiza en el Laboratorio Clínico, la Bioestadística es una de las herramientas indispensables en el quehacer cotidiano del laboratorio. La interpretación correcta de los resultados se debe en gran medida a la estandarización de valores de referencia de pacientes sanos y de significancia diagnóstica. Siendo la bioestadística quien se encarga de ello.
3
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
CONTENIDO
Distribuciones muestrales Inferencia Estadística Análisis de Varianza Regresión y Correlación Estadística no Paramétrica
4
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Universidad Autónoma de C Facultad de Ciencias Quí Campus IV
Asignatura Bi estadística Semestre Cuarto Carrera Químico Farmacobiólogo Prerrequisitos Estadística Elaborado Mtro. Miguel Ángel Rosales por: Guerrero
hiapas icas
Cré itos 8 lave QFDD43020819 Hrs./Teoría 3 Hrs./Prác Hrs./Sem ica na 52 Hrs./Sem stre 75 SEPTIEMBRE 2001
INTRODUCCION El conocimiento que se imparte en la materia permitirá des los alumnos en á eas específicas como Control de cali primas, Control d Procesos y Productos terminados, Normas y Sistemas, Interpretación de datos generados p de laboratorio, o más general, por las ciencias de l proporcionarles las bases para Diseñar Experimentos, crea para mejorar los pr cesos nuevos o ya existentes.
rrollar habilidades a ad de las materias stablecimiento de r pruebas rutinarias Salud, así como nuevos productos o
Se requiere del desarrollo de un pensamiento matemático, necesita de la comprensión, de la habilidad para el Procesamiento e información, del Razonamiento, de la capacidad de Análisis e interpretación de resultados. UBICACIÓN DE L MATERIA La materia de Bio stadística se encuentra insertada en el cuarto semestre del plan de estudios de la carrera de Químico Farmacobiólog o de la Facultad de Ciencias Químicas de la Universidad Autónoma de Chiapas. El plan de estudios consta de 9 semes res. El contenido de la materia es de formación básica de orden práctico y que tienen como obj tivo principal el de enlazar conocimientos para que se apliquen en las m terias de especialización de las dos car reras. Le anteceden la materia de Estadística, donde se estudió la parte descriptiva de la materia. ESTRATEGIAS DI ÁCTICAS SUGERIDAS El curso será implantado a partir del aprendizaje grupal se combinarán las sesiones teóricas on las prácticas de taller, así como ev ntualmente trabajos de investigación o de campo. En las dos primeras, la resolución de problemas tipo será interactiv . El avance del programa será determi ado por la clase, de acuerdo al entendi iento de los temas.
5
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
OBJETIVO GENERAL Al finalizar el curso, el alumno será capaz de aplicar diferentes técnicas de Inferencia estadística para el análisis de información experimental. UNIDADES TEMÁTICAS UNIDAD I.- INFERENCIA ESTADÍSTICA Objetivo Específico: Al finalizar la unidad, el alumno generalizará sobre poblaciones a partir de datos muéstrales, empleando para ello los métodos inferenciales de la estimación y de las hipótesis. 1.1 Conceptos de Inferencia Estadística 1.2 Técnicas de Inferencia Estadística 1.2.1 Estimadores y sus propiedades 1.2.2 Estimación puntual y por intervalo 1.2.3 factor de confianza y error estándar 1.2.4 Estimación de Medias Poblacionales 1.2.5 Estimación de Proporciones Poblacionales 1.2.6 Estimación de Varianzas Poblacionales 1.1.7 Estimación del Tamaño Muestral 1.3 Hipótesis 1.3.1 Planteamiento de Hipótesis 1.3.2 Tipos de Hipótesis 1.3.3 Decisión estadística 1.3.4 Errores tipo I y II 1.3.5 Hipótesis sobre las Medias Poblacionales 1.3.6 Hipótesis sobre las Proporciones Poblacionales 1.3.7 Hipótesis sobre las Varianzas Poblacionales 1.3.8 Pruebas de Bondad, Independencia y Homogeneidad Tiempo Estimado:
6
16 hrs.
UNIDAD II.- ANÁLISIS DE VARIANCIA Objetivo Específico: Al finalizar la unidad, el alumno detectará diferencias significativas entre mas de dos poblaciones, mediante la técnica de análisis de la VARIANCIA. 2.1 Conceptos de Diseño de experimentos 2.2 Comparación de mas de dos poblaciones 2.2.1 Diseños experimentales 2.2.1.1 Modelo matemático 2.2.1.2 Suposiciones 2.2.1.3 Cuadro de ANDEVA 2.2.2 Pruebas de diferencias significativas entre pares de medias Tiempo Estimado: 12 hrs.
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
UNIDAD III.- REGRESIÓN Y CORRELACIÓN LINEAL Objetivo Específico: Al finalizar la unidad, el alumno determinará la asociación entre variables, mediante las técnicas de regresión y correlación, evaluando la validez de los modelos propuestos 3.1 Regresión y Correlación Lineal simple 3.2 Modelo matemático 3.2 el método de Mínimos Cuadrados 3.3 Predicción Pruebas depor Validez. 3.3.1 Coeficientes de Relación y Determinación 3.3.2 Análisis de Varianza 3.3.3 Pruebas de Linealidad 3.4 Regresión y Correlación Lineal múltiple 3.5 Modelo Matemático 3.6 Estimación de los Coeficientes 3.7 Pruebas de Hipótesis Tiempo Estimado:
12 hrs.
UNIDAD IV.- ESTADÍSTICA NO PARAMETRICA Objetivo Específico: Al finalizar la unidad, el alumno diferenciará las estadísticas no paramétricas de las paramétricas y hará inferencias sobre datos cualitativos o de escala de medición débil. 4.1 Introducción 4.2 Prueba de Signos 4.4 Prueba de Rangos 4.5 Prueba de Bondad 4.6 Análisis de Varianza por rangos (Kruskal-Wallis y Friedman) Tiempo Estimado:
6 hrs.
FORMA DE EVALUACIÓN Y ACREDITACIÓN: Se tomarán en cuenta para la calificación final, los siguientes indicadores ponderados: 1. EXÁMENES PARCIALES 2. EXAMEN FINAL 3. PRACTICAS DE TALLER
30% 30% 15%
4. DE INVESTIGACIÓN 5. TRABAJOS CALIFICACION CUALITATIVA
10% 15% 100%
7
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
RELACION DE PRACTICAS DE BIOESTADÍSTICA Práctica 1 2 3 4 5 6 7 8 9
Nombre Repaso del manejo del Statgraphics Estimación por intervalo Hipótesis Tamaño de la muestra Microstat Ajuste de modelos Regresión no lineal Estadística no paramétrica Análisis de varianza Tiempo Estimado: 29 hrs.
BIBLIOGRAFÍA • • • • • • • • • •
BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS. DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA. ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA. MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V. JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS. MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL. MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL. PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS, TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V. SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO INTERAMERICANO. STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS, MÉXICO, ED. MC GRAW HILL, WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED. MCGRAW-HILL.
8
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Capitulo I: Distribuciones Muestrales
POBLACION Y MUESTRA Población Se le llama así al conjunto de unidades que poseen la característica en estudio. “El conjunto de elementos que poseen la variable por investigar, que han llenado las condiciones de inclusión y que se encuentran disponibles para la investigación en tiempo y espacio” Existen 2 tipos de poblaciones: 1) Finita 2) Infinita Muestra
9
Es aquella porción o subconjunto de elementos de la población en el cual el número (tamaño) y calidad de los elementos representan fielmente a la población. Mientras la población es más homogénea se requerirá de una muestra menor y si la población es más heterogénea se necesitara mayor muestra.
UNIDADES ESTADÍSTICAS DE MUESTREO Unidad de Investigacióón: de Investigaci ón: Es la unidad mínima que mantiene la integridad de los datos que interesan estudiar y analizar. Es decir, el ente que contiene las partes que se van a analizar. Unidades de Muestreo: Son aquellas que contienen las unidades de análisis de la de Muestreo población y que se utilizarán para confeccionar o seleccionar la muestra. En general, es la selección de los conjuntos que serán tomados en cuenta para la conformar la muestra final en la investigación. Observacióóón: Unidad ddee Observaci n: Se denomina a la unidad a través de la cual se obtiene la información, esta puede o no coincidir con el elemento. También se denomina unidad respondiente.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Anááálisis Unidad ddee An lisis: Está definida como el elemento que se examina y del que se busca la informació dentro de la unidad de investigación.
TIPOS DE MUESTREO Cuando selecciona algunos intención averiguar sobre una población deter osinada, nos elementos referimos acon estelagrupo de elede entos comoalgo muestra. Por supuesto, espe amos que lo que averiguamos en la mue tra sea cierto para la población en su con unto. La exactitud de la i formación recolectada depende en gran anera de la forma en que fue seleccionad la muestra. Cuando no es posi le medir cada uno de los indiv duos de una población, se toma una muestra representativa de la misma. La muestra descansa en el principio de qu las partes representan al to o y, por tal, refleja características definen lalaspoblació de la que que fue extraída, lo cual no indica que es representativa. Por lo tanto, la val dez de la generalización depende de la v lidez y tamaño de la muestra. LEYES LEYES DEL MÉTODO DE MUESTRE El método de mue treo se basa en ciertas leyes que le ot rgan su fundamento científico, las cuales son: •
•
Ley de los gr ndes números: si en una prueba, la probabilidad de un acontecimiento suceso es P, y si éste se repite una gran cantidad de veces, la relación entre l s veces que se produce el suceso y la can idad total de pruebas (es decir, la fr cuencia F del suceso) tiende a acercars e cada vez más a la probabilidad P. Cálculo de prob bilidades: La probabilidad de un hecho o suceso es la relación entre el númer de casos favorables (p) a este hecho con la cantidad de casos posibles, suponi ndo que todos los casos son igualmente osibles. El método de establecer la probabilidad es lo que se denomina cálculo de probabilidad.
10
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
De estas dos leyes fundamentales de la estadística, se infieren aquellas que sirven de base más directamente al método de muestreo: •
Ley de la regularidad estadística: un conjunto de n unidades tomadas al azar de un conjunto N, es casi seguro que tenga las características del grupo más grande.
•
Ley de la inercia de los grandes números: esta ley es contraria a la anterior. Se refiere al hecho de que en la mayoría de los fenómenos, cuando una parte varía en una dirección, es probable que una parte igual del mismo grupo, varíe en dirección opuesta.
•
Ley de la permanencia de los números pequeños: si una muestra suficientemente grande es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a la primera; y, si en la primera muestra se encuentran pocos individuos con características raras, es de esperar encontrar igual proporción en la segunda muestra MARCO MUESTRAL
Es el proceso de definir y enumerar los elementos sobre los cuales se realizan las inferencias estadísticas en el muestreo probabilístico. Es importante la construcción de un marco muestral lo más perfecto posible a fin de que exista una correspondencia biunívoca entre las unidades muestrales poblacionales y las listas físicas que lo conforman. Entre los factores que contribuyen a distorsionar la calidad de un buen marco muestral están: a) Elementos faltantes, b) Unidades ocultas por estar pareadas con otras, c) Unidades muestrales repetidas y d) Elementos extraños. TIPOS DE MUESTREO Muestreo Probabil Probabilíístico: ístico: Es cuando se puede determinar de antemano la probabilidad de selección de cada uno de los elementos de la población siendo esta distinta de cero. Este muestreo está basado en la teoría de la aleatoriedad o del azar, en la cual se fundamenta la estadística matemática. Algunos tipos de muestreo son: -
Aleatorio simple
-
Estratificado
-
Por conglomerado
-
Sistemático
-
Proporcional al tamaño de cada grupo
11
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Muestreo Muest reo Aleat rio Simple: La forma más común de obte er una muestra es la selección al azar. es decir, cada uno de los individuos de una población tiene la misma posibilidad de ser elegido. Si no se cumple este requisito, se dice que la mue tra es viciada. Pa a tener la seguridad de que la mue tra aleatoria no es viciada, debe emplearse para su constitu ión una tabla de n meros aleatorios o una tómbola de núm ros aleatorios. Muestreo Estra ificado: Una muestra es estratificada cuan do los elementos de la muestra son pr porcionales a su presencia en la població . La presencia de un elemento en un strato excluye su presencia en otro. Para este tipo de muestreo, se divide a la población en varios grupos o estrato con el fin de dar representatividad a los distintos factores que int gran el universo de estudio. Para la selección de los elementos o unidades representantes, se utiliza el método de muestreo leatorio, tomando elementos de ca a estrato. Muestreo Mu estreo Por onglomerado: Este método divide a toda la población en “K” muestras conteniendo “n” unidades srcinales, poste riormente se escoge una muestra de manera aleatoria de las “K” muestras realizadas al inicio. Muestreo Siste ático: Es un proceso diferente a los ante iores. Si la población tiene “N” unidades, estos se enumeran del 1 a “N” en lgun orden (tamaño, edad, pesos, etc..). Para seleccionar una muestrade “n” un idades, tomamos una unidad al azar e las primeras “K” unidades y de ahí en adelante cada K-esima unidad.
12
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Aleatorio simple
Sistemático
Estratificado
CARACTERISTICAS
VENTAJAS
Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de
•
inclusión de igual conocida n/N.y
INCONVENIENTES
Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas.
Requiere que se posea de antemano un listado completo de toda la población. Cuando se trabaja con muestras pequeñas es
•
Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos
posible que anola represente población adecuadamente.
Conseguir un listado de los N elementos de la población Determinar tamaño muestral n. Definir un intervalo k= N/n. Elegir un número aleatorio, r, entre 1 y k (r= arranque aleatorio). Seleccionar los elementos de la lista.
• •
Fácil de aplicar. No siempre es necesario tener un listado de toda la población. Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos.
Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección
En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a hacer un muestreo. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.
•
Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas. Se obtienen estimaciones más precisa Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las
•
•
•
•
•
Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación.
13
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
variables estratificadoras se refiere. Conglomerado
Se realizan varias fases de muestreo sucesivas (polietápico) La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.
•
•
Es muy eficiente cuando la población es muy grande y dispersa. No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.
•
•
El error estándar es mayor que en el muestreo aleatorio simple o estratificado. El cálculo del error estándar es complejo.
Muestreo No Probabil Probabilíístico: ístico: Es aquel utilizado en forma empírica, es decir, no se efectúa bajo normas probabilística de selección, por lo que sus procesos intervienen opiniones y criterios personales del investigador o muestrista o no existe norma bien o validada. Normalmente se acude a este tipo de omuestreo cuando es difícildefinida enumerar, listar o precisar el universo objeto de estudio cuando no existen registros de los datos. Algunos de estos tipos de muestreo son: -
Por cuotas
-
Por criterio
-
Accidental
Cuotas: Se divide a la población en estratos o categorías, y se Muestreo ppor or Cuotas: asigna una cuota para las diferentes categorías y, a juicio del investigador, se selecciona las unidades de muestreo. La muestra debe ser proporcional a la población, y en ella deberán tenerse en cuenta las diferentes categorías. El muestreo por cuotas se presta a distorsiones, al quedar a criterio del investigador la selección de las categorías. Muestreo Intencionado: También recibe el nombre de sesgado. El investigador selecciona los elementos que a su juicio son representativos, lo que exige un conocimiento previo de la población que se investiga.
14
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Muestreo Mixto: Se combinan diversos tipos de muestreo. Por ejemplo: se puede seleccionar las unidades de la muestra en forma aleatoria y después aplicar el muestreo por cuotas. Muestreo Tipo: La muestra tipo (master simple) es una aplicación combinada y especial de los tipos de muestra existentes. Consiste en seleccionar una muestra "para ser usada" al disponer de tiempo, la muestra se establece empleando procedimientos sofisticados; y una vez establecida, constituirá el módulo general del cual se extraerá la muestra definitiva conforme a la necesidad específica de cada investigación. TIPOS DE ERRORES Error Estándar: La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la proporción. La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se refiere a los valores srcinales, mientras que la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra. Error Muestra Muestrall o Error de Muestreo: La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño el error de las muestras, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población.
15
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
TAMAÑO DE MUESTRA MUESTRA Esta va a variar en elación al tipo de estudio y de los objetivo a alcanzar 1.-- Promedios 1.
2.-- Proporción de u a 2. población
3.Asociación entre 3.variables Como esta asociación se determina por m dio del estadístico de prue a X2, el tamaño se esti a en función al número de elementos en cad casilla (deberán de ser de o más)
16 TIPOS DE VARIABLES Por su Estructura
Por la Forma de Medirse
Sim ple C mpleja
C alitativas
C antitativas Por Dependencia
Mide un solo indicador Se requiere de 2 o más indicadores Nominales (nombres).- Nombra la modalidad de una característica in compararla con grados de intensidad (Ej.: rocedencia, religión, ocupación, etc.). Ordinales.- Expresa qu elementos pueden poseer características en distintos grados o intensidades (Ej.: bacterias por campo, color de orina, grado de estudios, etc.) Enteras (Ej.: 3, 5, 7, etc.)
Fraccionadas (Ej.: 3.1416, 9.7, etc.) Independientes (X) D pendientes (Y)
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
TIPOS DE ESTUDIOS CARACTERÍSTICAS DEL ESTUDIO
Tipo de estudio
Interferencia del Investigador
Periodo de captación de información
Evolución del fenómeno estudiado
Comparación de las poblaciones de estudio
Observacional
Prospectivo o Retrospectivo
Transversal
Descriptivo
•
Comparativo
•
Encuesta Descriptiva Encuesta Comparativa
Observacional
Retrospectivo
Longitudinal
Descriptivo
•
Revisión de casos
Observacional
Retrospectivo
Longitudinal
Comparativo de Efecto-Causa
•
Casos y controles
Observacional
Retrospectivo
Longitudinal
Comparativo de Causa-Efecto
•
Perspectiva histórica
Observacional
Prospectivo
Longitudinal
Descriptivo Comparativo
• •
Estudio de una cohorte Estudio de varias cohortes
•
Experimento
Experimental
Prospectivo
Longitudinal
CUESTIONARIO Es el instrumento por medio del cual, el investigador recoge la información de la realidad; dicho instrumento cuenta con 2 tipos de preguntas: a) abiertas y b) cerradas
Comparativo
PROCESAMIENTO DE LA INFORMACION Recolección de Datos Observación Experimentación Encuestas Organización de Datos Ordenación Tabulación Clasificación Presentación de Datos Gráficos Cuadros Descripción Análisis e Interpretación Conclusiones y Recomendaciones
17
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
TITULOS DE CUADROS CUADROSYYGRAFICAS GRAFICAS En el caso de los títulos de cuadros, estos van en la parte superior de estos, mientras que las figuras lo llevan en la parte inferior Elementos que debe contener un titulo de cuadros o gráficas: 1.- Naturaleza de la presentación (Cuadro o gráfico) 2.- Número de la presentación 3.- naturaleza de los datos (pesos, tallas, etc..) 4.- Unidades utilizadas (Kg., cm., etc..) 5.- Origen de los datos (personas, cultivos, etc..) 6.- Espacio: lugar de donde se obtuvieron 7.- Tiempo: periodo en el que se obtuvieron los datos
18
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
C pitulo IIIII:: In erencia Estadística La inferencia Estadística, es el procedimiento mediante el cu l se toman decisiones sobre una población en base al estudio de una muestra extraí a de ella.
19
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
DISTRIBUCIÓN NORMAL
Re resentación gráfica de esta función de densidad
20
a) Distribuciones normales con distinta b) Distribuciones normales con desviación estándar e igual media diferentes med as e igual desviación estándar Función de de Distribución •
Puede tomar cualquier valor (- α, + α)
•
Son más probables los valores cercanos a uno central que llamamos media ()
•
Conforme nos separamos de ese valor , la probabili ad va decreciendo de igual forma derecha e izquierda (es simétrica).
•
Conforme nos separamos de ese valor , la probabili ad va decreciendo de forma más menos rápida dependiendo de un par metro σ , que es la desviación tí ica.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Función de distribu ión
F(x) es el área sombread de esta gráfica
Tipificación Si la variable X tiene ~N (, σ ) entonces la variable tipifica a de X es sigue una distribución normal pero con =0 y σ =0, es decir ~ (0, 1)
y
Representación grá ica la función Z
a la variable Z se la denomina variable tipificada de X, y a la urva de su función de densidad curva nor al tipificada. Característica de la distribución normal tipificada (reducida, estándar) • •
No depende e ningún parámetro Su media es 0, su varianza es 1 y su desviación típica e 1.
•
La curva f(x es simétrica respecto del eje OY
•
Tiene un má imo en este eje
•
Tiene dos pu tos de inflexión en z =1 y z = -1
21
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Frecuentes— — Manejo ddee Tablas Casos Más Frecuentes Las ecuaciones consideran que se cuenta con tablas de una sol cola y valores de +Z
22
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
INTERVALOS DE CONFIANZA Se llama intervalo de confianza en estadística a un interval de valores alrededor de un parámetro poblacional (calculado en una muestra) en e l cual se encuentra el verdadero valor del arámetro, con una probabilidad determinada. La probabilidad d que el verdadero valor del parámetro se encuentre en el intervalo construid se denomina nivel de confianza, y se de ota 11-.-. α, en donde α es la probabilidad de equivocarnos, y se le conoce como nivel de significancia. Generalmente se construyen interv los con confianza al 95% es decir que se tiene una significancia del 5 . Menos frecuentes son los intervalos del 10% el 1%.
Intervalos de confia za para la Media de una Población
23
–Varianza –Varianza Conocida– Ecuación que describe el intervalo de confianza:
σ σ < µ < x + Zα = 1−α n n 2 2
P = x − Z α
Formula para calcu ar el intervalo de confianza:
σ n
µ = x ± Zα 2
EJEMPLO: Un laboratorio desea estimar con el 99% de co nfianza la media del Volumen Corpuscu ar en una población del municipio de rontera Hidalgo. Se considera que se ti ne una distribución normal y una varian a poblacional de 144. 144 En un muestreo de 5 individuos se obtuvo una media de 84.3 3. Z 0.01 = 2.58 2
σ n 2
x ± Zα
8 .3 ± 2.58(3.10) 8 .3 ± 8.0 8 .3 − 8 = 76.3 8 .3 + 8 = 92.3
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Intervalos de confia za para Proporciones de una Población Ecuación que describe el intervalo de confianza:
pˆ qˆ n 2
P = pˆ − Z α
pˆ qˆ = 1− α n 2
P < pˆ + Z α
Formula para calcu ar el intervalo de confianza:
P = pˆ ± Z α 2
pˆ qˆ n
EJEMPLO: Se re liza un estudio sobre el uso del pre ervativo en jóvenes universitarios sexualmente activos; para lo cual se tomo una muestra de 300 estudiantes de la acultad de Ciencias Químicas, encontrá dose que solo 123 lo usaban en cada r lación. Con un 95% de confianza cual es la proporción de individuos, que usa el preservativo en cada relación? p) =
Z 0.05 = 1.96 2
123 300
= 0.41
pˆ qˆ
P = pˆ ± Z α 2
(0. 1)(0.59) 300
P = 0.41 ± 1.96 P = 0.41 ± 0.05
24
0. 1 − 0.05 = 0.36 0. 1 + 0.05 = 0.46
Intervalos de confia za para la Media de una Población con V rianza Desconocida Desconocida Ecuación que describe el intervalo de confianza:
S < n 2
P = x − t α
S = 1− α n 2
< x + tα
Formula para calcu ar el intervalo de confianza:
µ = x ± tα 2
s n
EJEMPLO: El cont nido en litros de7 recipientes de H 2SO4 s n: 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6. Co un intervalo de confianza del 95% se des a estimar el volumen medio de todos lo recipientes que contienen este ácido, onsiderando que los valores tienen una istribución normal.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
t 0.05 = 2.447
S = 0.283
x = 10
2
s n 2
x ± tα
10 ± .447 (0.107 ) 10 ± .26 10 − .26 = 9.74 10 + .26 = 10.26
Intervalos de confia za para la Varianza de una Población Ecuación que describe el intervalo de confianza: (n − 1) s 2
P=
x2 α 1−
<σ 2
2
( n − 1) s 2
xα2 2
= 1−α
Formulas para calc lar el intervalo de confianza:
x2 =
( n − 1) s 2 σ2
25
∴ σ
2
)s 2 ± (n − 1 2
xα
2
EJEMPLO: En el uestreo a 10 persona de la población de Unión Juárez se les deter ino su hematocrito obteniéndose los sigu ientes resultados: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 46.0. Cual es la variació del hematocrito en esta población con u 95% de confianza. S2= 0.286 (9)(0.286) (9)(0.286) 2 <σ < = 1−α 19 . 023 2.70
P=
0.135 < σ 2 < 0.953
2
σ ±
( n − 1) s
x
2 α 2
2
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
PRUEBAS DE HIPÓTESIS
Una prueba de hipótesis estadística es una conjetura sobre un parámetro de una o más poblaciones. Para tener la certeza sobre una hipótesis, se debe examinar a la población entera, resultando en la mayoría de las veces difícil de poder hacer; por lo que se procede a tomar una muestra aleatoria de la población de interés y se utilizan los datos que contiene la muestra para proporcionar evidencia que confirme o no la hipótesis. La evidencia encontrada permite la aceptación o el rechazo de la hipótesis, a través de un estadístico de prueba. Por lo que, para cada tipo de prueba de hipótesis se debe calcular una prueba estadística apropiada. Además de que los datos deben de mostrar una distribución normal para que se pueda a proceder a la verificación de una hipótesis. La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula. Antes de continuar, es necesario mencionar que existen muchos tipos de hipótesis, pero las que competen a este material son las hipótesis estadísticas, las cuales son 2: Hipótesis alterna (Ha) e Hipótesis nula (Ho), siendo en la primera donde el investigador plantea su idea y la segunda es la que contiene la parte opuesta y complementaría, siendo la que se utiliza para evaluar de manera indirecta la hipótesis del investigador (Ha). De manera que contrario a lo que muchos piensan la primera hipótesis que se debe plantear es la alterna (Ha) por ser ahí donde se encuentra la idea srcinal del investigador, y sin la formulación de la hipótesis alterna (Ha) no puede existir la Hipótesis nula (Ho), por esta tan solo el complemento opuesto dela alterna (Ha).
26
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Tipos de planteami ntos 1.- Ho: = µo
Ha: µ ≠ µo
Z 0.995 => p = 2.58 Z 0.975 => p = 1.96
2.- Ho: ≥ µo
Ha: µ < µo
Z 0.01 => p = -2.33 Z 0.05 => p = -1.65
3.- Ho: ≤ µo
Ha: µ > µo
27 Z 0.99 => p = 2.33 Z 0.95 => p = 1.65
Prueba de Hipótesi para: Media Poblacional con Varianza Co ocida EJEM LO: Un laboratorio estima con el 99% de confianza que la
X −µo media del Volumen Corpuscular en una pobla ión del municipio de Z= Front ra Hidalgo es diferente de 90 µ 3. Se considera que se tiene una σ n Ho: µ = 90
distribución normal y una varianza poblacional de 144. 144 En un muest eo de 15 individuos se obtuvo una media e 84.3µ 84.3 3. Ha: µ ≠ 90
Z 0.01 = 2.58 2
Z=
X − µo 84.3 90 − 5.7 = = = −1.84 σ 12 3.10 N 1
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Prueba de Hipótesi para: Media Poblacional con Varianza De conocida Formula:
t=
X − µo S n
EJEMPLO: El cont nido en litros de7 recipientes de H 2SO4 s n: 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 9.6. Co un intervaloque de confianza se eestima que el de volumen medio de ytodos lo recipientes contienen del este95% ácido diferente 11lts, considerando que lo valores tienen una distribución normal. Ho: µ = 11
Ha: µ ≠ 11
t 0.05 = 2.447
= 10
S = 0.283
2
t=
X − µo 10 − 11 = = −9.35 S 0.283 n
7
No se acepta Ho, hay evidencia que indica que la medi del volumen de los recipientes es diferente de 11lts.
Prueba de Hipótessis is para: Diferencia entre Dos Pobla iones Normales con Varianzas Conocidas 1.- Ho: µ1 – µ2 = 0
Ha: µ1 – µ2 ≠ 0
2.- Ho: µ1 – µ2 ≥ 0
Ha: µ1 – µ2 < 0
3.- Ho: µ1 – µ2 ≤ 0
Ha: µ1 – µ2 > 0
28
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
EJEMPLO: Se real za un estudio en la comunidad de Mazat n, Chiapas, sobre los niveles de ac. Úri o en los habitantes de la población; y se considera que las concentraciones de hombres y mujeres no son iguales. Se t man muestras de 12 varones y 15 muje es encontrándose ambas poblaciones co valores distribuidos normalmente con u a media 4.5 y 3.4 mg/ml, respectivamente.. Ho: µhombres = µmujeres Z=
( x1 − x2 ) 2
2
σ1
+
n1
Z=
Ha: µhombres ≠ µmujeres
σ2
n2
( 4.5 − 3.4) 1 12
+
1
= 2.8
15
Prueba de Hipótessis is para: Diferencia entre Dos Pobla iones Normales con Varianzas Descono idas Antes que nada se ebe conocer, si las poblaciones tienen var anzas 2 mayor
iguales o diferente por lo que se procede a se una prueba de F = S 2 hipótesis para las v rianzas con el estadístico de prueba “F”. iendo S menor la formula a utiliza : Las hipótesis son: Ho: Las varianzas son iguales
Ha: Las varianzas son diferentes
Dependiendo de la aceptación o no aceptación de la Hipóte is nula (Ho), será la formula que se utili e: Con Varianzas Varianzas Iguales t=
Con Varianzas Varianzas Diferentes
( x1 − x2 ) − ( µ1 − µ 2 )
S p2
t=
S p2
n1 + n2 2
S p2 =
2
( n1 − 1) S1 + (n2 1) S 2 n1 + n2 − 2
( x1 − x2 )
S12 S 22 n1 + n2
29
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
EJEMPLO (Varianzas Iguales): Se realiza un estudio sob e el funcionamiento hepático de perros gatos mediante la enzima aminoaspart to transferasa (AST), contando con 22 pe ros y 15 gatos, con una media de 120 y 96 U/l respectivamente y una desviación est ndar de 40 y 35 respectivamente. Se uede considerar que ambas especies de animales tienen los niveles de AST. Ho: Las varianzas son iguales 2
Ha: Las varianzas son diferentes
2
La F de Tablas 1.90
= ( 40) 2 = 1.3061 F = S mayor 2 S menor (35)
Ho: Las medias son iguales S p2 =
t=
Ha: Las medias son diferentes
( n1 − 1) S12 − ( n2 1) S 22
S p2 =
n1 + n2 − 2
( x1 − x2 )
S p2 n1
+
S p2
t=
(120 − 96) 1450 15
n2
(se acept Ho para varianzas)
+
1450
21( 40) 2 − 14(35) 2 22 + 15 − 2
= 1450
= 1.88
22
30 La “t” de tablas 2.301 (se a epta Ho para medias) EJEMPLO (Varian as distintas): En el ganado bovino los niv les de glucosa oscilan entre los 45 y 75 mg/dl. Un grupo de investigadores desea saber si dos razas (lechera y producto a de carne), difieren con respecto al valo medio de la glucosa. Se toman 10 anim les productores de leche (n1 ) y 20 prod ctores de carne (n2), siendo sus medias de 62.6 y 47.2 respectivamente y las des viaciones estándar de 33.8 y 10.1. Ho: Las medias son iguales t=
( x1 − x2 )
S12 S 22 + n1 n2
t=
Ha: Las medias son diferentes
(62.6 − 47.2) (33.8) 2 10
+
(10.1) 2
= 1.41
20
T(28)0.05/2=2.0484 -2.0484 -2.0484 < 1.4 < 2.0484 Se acepta Ho.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Prueba de Hipótes s para: Muestreo a Partir de Poblaciones que no Presentan Distribución Normal Cuando el muestre se realiza a partir de poblaciones que no presentan distribu ión normal, losesresulta pos dos ble utilizar del teorema del li ite central si la magn tud de las muestras es grande (n ≥ 30). Cuando se extraen dos muestras aleatorias simple ( x1 − x2 ) independientes de ran magnitud de una población que no sigue una distrib ción normal se pueden utilizar las Z = σ 12 σ 22 varianzas poblacio ales si se conocen, de lo contrario se + utilizan como esti aciones las varianzas de las muestras, n1 n2 las cuales necesariamente deben de ser grandes.
EJEMPLO: Se real za un estudio en 75 pacientes con infeccio es gastrointestinales con sintomatología eniendo una lectura media de leucocitos d e 6800, y 80 pacientes con infecciones ga trointestinales sin sintomatología apar nte con una lectura media de leucoci os de 5450, con desviaciones están ar de 600 y 500 respectivamente. S considera que las poblaciones de donde se extraen las muestras no siguen una dist ibución normal, siendo el muestreo alea orio e independiente. ¿Se puede considerar que las lecturas de ambas poblaciones es la misma? Ho: µc/sintomas = µs/sintomas Z=
( x1 − x2 ) 2
σ1
n1
2
+
σ2
n2
Z=
Ha: µc/sintomas = µs/sintomas (6800 − 5450)
(600 ) ( )2 75
+
500 80
2
= 15.17
31
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Prueba de Hipótesi para: Comparaciones por Parejas Se utiliza cuando l s poblaciones a comparar, son dependien es una de la otra. La formula es: d −µ t
do
Sd n = d Sd
n
Una población con istintas mediciones
EJEMPLO: Se evalúan dos distintas dietas para ver con cual se gana más peso, siendo los resulta os en kg ganados:
t=
d Sd n
t=
− 2.2
1.983
32
=
− 2 .2
0.4977
= 4.42
t0.05/2,7 = 2.841
8 como tc > t0.05/2,7 ==> Se rechaza Ho
t0.01/2,7 =4.029
como tc > t0.01/2,7 ==> Se rechaza Ho
El efecto de las diet s no es el mismo en el incremento de pesode las personas.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Prueba de Hipótesi para: Proporciones –una –una población– población población– SU formula es: Z=
EJEMPLO: Un estudio para evaluar la eficacia de un nuevo tratamiento contra la Encefalitis Equi a Venezolana, da como resultado que de 300 animal s vacunados 123 presentaron la enfermedad. ¿Es posible oncluir a partir de estos datos que en la población de animales muestreados, la
p) − po p o qo n
proporción del 50% de animales que se protegen e la infección no es Ho: p = 0.50 p) =
Ha: p ≠ 0.50
x 123 = = 0.41 n 300
Z=
0.41 − 0.50 (0.50)(0.50)
=
− 0.09
0.0289
= −3.11
300
Se rechaza la Hipótesis nula.
33 Prueba de Hipótesi para: Proporciones –dos –dos Poblaciones– Poblaciones Poblaciones– Sus formulas son: ( p) − p) 2 ) − ( p1o − p2o ) ) − p) ) − ( p − p ) (p Z= 1 2 1o 2o ) Z= 1 σ p) − p) ) σ) ) 1
2
p=
x1 + x2 n1 + n2
p1 − p 2
EJEMPLO: Un estudio para comparar la eficacia de un nuevo tratamiento contra la malaria arroja el resultado de 78 individuos de 100 se alivian , mientras que con la cloroquina que es el método tradicional se alivian 90 de cada 100. p=
)
x1 + x2 n1 + n2
σ p)1 − p) 2 =
Z=
p=
p (1 − p ) p (1 − p ) + n1 n2
( p)1 − p) 2 ) − ( p1o
)
σ p)1 − p) 2
p2 o )
)
78 + 90 100 + 100
σ p)1 − p) 2 =
Z=
= 0.8
(.84)(.16) 100
(.90 − .78) .0518
=
+
(.84)(.16)
.12 .0518
100
= 2.32
= .0518
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
II:: C pitulo IIII II álisis de Varianza Análisis El análisis de la comparar más de d comparar varias m experimentos y, de
arianza, es un método que es necesar o cuando se quieren s medias. Sin embargo debido a que es u método que permite dias en diversas situaciones; se encuentra ligado, al diseño de lguna manera, es la base del análisis mul ivariado.
Los modelos Estadí ticos y el Análisis de la Varianza Varianza Se conoce como Modelo a la representación de un fenómeno de la vida real. Y un modelo matemático es aquel en el que se relaciona variables. iendo de dos tipos: DETERMINÍSTIC : Establece una relación exacta entre las ariables ESTADÍSTICO:: Es ablece la relación entre las variables depe de del aspecto aleatorio de los fenómenos –Siendo este el modelo con el que t abajaremos este capítulo–. MODELO MATEM MATEM TICO BASE DEL ANÁLISIS DE VARIA ZA En el muestreo, las observaciones (yi) provenientes de una población normal pueden ser epresentados por:
yi = µ + εi
con i = 1, 2, 3,........, n
µ: Es una constant , la cual depende de un conjunto de factor s con el mismo efecto para todos los valor s de la población. Es la media de todos los yi de la población εi: Es la parte aleat ria, la cual depende de un conjunto de fac ores que influyen en diferente forma sob e el fenómeno. Es el error de muestreo pa a cada yi
En el modelo anter or, los εi son aleatorios y pu den tomar valores tanto po itivos como negativos, debido que los yi también son aleat rios; y µ es una constante.
34
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
De manera que cualquier inferencia sobre µ –media poblacional dependerá del modelo probabilísti o que se suponga para la variable εi –erro de muestro– ESQUEMA DE MU M STREO En el esquema de muestreo se tiene:
yi = µ + εi
yi ∼ N (µ,. σ2) ==> ε i ∼ N (0, σ2)
y
Siendo µ una constante las gráficas yi y εi son:
σ
σ µ
yi
0
εi
La importancia del modelo, reside en la representación de l variable yi como la suma de un parám tro µ y una variable aleatoria no observable εii, dando srcen a una ecuación que p etende explicar el comportamiento de la v riable aleatoria yi. Para el análisis est dístico del modelo puede utilizarse el mé odo del Análisis de la Varianza (ANVA), el cual es un procedimiento aritmét co, que consiste en descomponer la Su a de Cuadrados Total (Variación Total) e fuentes de variación reconocidas, incluy ndo la variación que no se ha podido me ir, que es el ERROR EXPERIMENTAL. EXPERIMENTAL SUPUESTOS DE A LICACION En la aplicación del ANVA se suponen: 1. Los efectos de los tratamientos y los ambientales son a itivos. 2. El Error xperimental constituye un elemento al azar, normal e independien e, con una distribución normal con una media 0 y una varianza σ2 . CONCEPTOS DE APLICACIÓN 3. Dos conceptos en la aplicación del ANVA. 4. Grados de ibertad (G.L.): Es el número de contra tes o comparaciones ortogonales datos independientes) menos el número d restricciones (son las medias de la hipótesis) impuestas que se realiza en un grupo de datos.
35
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
5. Cuadrado Meedio dio (C.M.): Es el cociente de una suma de cuadrados (SC) entre su respectiv grado de libertad. [CM = SC / GL] 2
Si Ho: µ = µo es cierta, ento ces:
Fo =
n( y − µ ) S2
∼F
1 n-1
Por lo tanto se utili a Fo para probar el juego de hipótesis pla teado al inicio. REGLA DE DESIC ON La regla de decisión para la prueba con un nivel de significanc a α es de: Rechazar Ho si Fo > F 1nn---11, α Siendo Fo la calculada y la F1n-1, α la de tablas TABLA DE ANÁLI IS DE VARIANZA Todo el proceso ant s descrito se resume en una tabla llamad Tabla de Análisis de Varianza (ANVA), ue a continuación se detalla: Fuentes de Variación (FV)
Grados de Libert d (GL)
Media
1
Error
n-1
Total
N
Sumas de Cuadrados (SC)
Cuadrado Medio (CM)
2
n(
y -µoy)
n Σ i=1(yi)2 n 2 Σ i=1(yi-µo)
Fo
2
n(
y -µ) /1 y
[Σ ni=1(yi-
36 2
n( 2
2
) /n-1] =S
2
y -µ) /S
La estadística Fo, b jo la hipótesis nula, tiene una distribució F1n F1n---111, la Regla de Decisión consiste en: Rechazar Ho si Fo > F 1nn---11, α EJEMPLO: En un estudio de obre los niveles de hemoglobina de una comunidad que abita sobre los 1000 m. .n.m se cuantificaron los niveles de Hb de 28 personas que participaron de ma era voluntaria, siendo los valores obtenid s: 12.72
13.38
13.94
17.34
15.74
14.60
19.03
14.11
13.01
17.53
19.25
13.72
12.26
13.29
18.92
17.65
12.13
13.90
10.41
15.03
14.44
13.62
11.49
14.75
13.68
14.81
.21
17.03
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
De estudios previos se sabe que de una población parec da, el porcentaje de hemoglobina es de 13.23. a) ¿Cual es la pobla ión de interés en este estudio? b) ¿Se puede consi erar que el promedio del porcentaje de h moglobina es igual a 13.23. si es así a qu nivel de significancía? Solución: a) El nivel de hemo lobina de la población de estudio b) µo=13.23 El juego de hipótesi a probar es: Ho: µ=µo VS Ha: µ≠µo Como µo = Porcenta e de proteínas en la leguminosa “Leucaen ” Entonces Ho: µ=13. 3 VS Ha: µ≠ µ≠13.23 Este juego de hipót sis se probará mediante ANVA. En donde la suma de cuadrados es: S.C. Media = n(ÿ - o)2 S.C. Error =
Σni=1(yi-ÿ)2
= Σni=1y2i- (Σni=1yi)2/n
S.C. Total =
Σni=1(yi-µo)2
37
De los datos obteni os tenemos: n=28 Σy = 402.93 Σy2 = 6029.9671
Σy/n = ÿ = 14. 39
Sustituyendo en las formulas tenemos: S.C. Media = n(ÿ - o)2 =
28 (14.39 - 13.23)2 = 37.67
S.C. Error =
Σni=1y2i- (Σni=1yi)2/n
S.C. Total =
Σni=1(
FV Media Error Total FV Media
GL
1
Error Total
n-1 n
1 27 28 GL
F127,0.05 = 4.17
i-µo)2
= 6029.9671-(402.93)2/28=
231.66
= S.C. Error+S.C. Media = 231.66+37.67= 269.33 SC
CM 37.67 231.66 269.33
SC
n(ÿ-µo)2 Σni=1(yi-ÿ)2 n 2 Σ i=1(yi-µo) Fo > Ft
Fo 4.39*
37.67 8.58 CM
Fo
n(ÿ-µ)2/1 n(ÿ-µ)2/S2 [Σni=1(yi-ÿ)2/n-1]= S2 F127,0.01 = 7.56
Fo < Ft
Existe diferencia si nificativa al 5% por lo que a ese nivel se echaza Ho. No así al 1% donde se acepta Ho.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
DISEÑOS DISEÑO S EXPERI ENTALES Diseño Completam nte al Azar Es el tipo de arregl más sencillo; los tratamientos están asi nados completamente al azar a las unidades experimentales; por lo que la var abilidad total de las observaciones del e perimento se divide en: •
Una debido l efecto de los tratamientos
•
Otra debido l error experimental
El análisis de la arianza contiene únicamente dos fuent es de variación y se caracteriza por: •
Puede aplica se cuando se estudian dos o más tratamientos
•
Las unidade experimentales deben ser homogéneas
•
Los tratamientos deben asignarse a las unidades expe imentales totalmente al azar.
Ventajas: •
Puede utiliz rse cuando las repeticiones por tratamien o son diferentes
•
Cuando sea probable que parte del experimento, ya sean unidades experimenta es o tratamientos se pierdan o se rechacen por alguna razón.
•
El análisis e tadístico que se desarrolla es fácil En experim ntos pequeños, se tiene mayor precisión, ya que contiene más grados de libertad para estimar el error experimental.
•
Desventajas: •
Cuando las nidades experimentales son heterogéneas pierde precisión.
•
La variación que existe entre las unidades experimen tales forma parte del error experi ental.
Yi.
1 Y11 Y12 Y13 ... Y1n1 n1 Σ j=1Y1j
Tratamientos 2 3 ... Y1 Y31 ... Y2 Y32 ... Y3 Y33 ... ... ... ... Y n2 Y3n3 ... n2 n3 Σ j=1Y2j Σ j=1Y3j ...
... ... ... ... ... ... ...
... ... ... ... ... ... ...
t Yt1 Yt2 Yt3 ... Ytnk nk t nk Σ j=1Ytj Σ i=1Σ j=1Yij=Y..
38
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Si todos los trata ientos tienen el mismo número de repeticiones entonces: n1=n2=n3=.....=nk= . En la tabla, se ti ne que las observaciones se denotan c n una letra con dos subíndices, el primero indica el tratamiento ( i ) y el segundo l repetición ( j ).
La tabla del ANV , para cuando se tiene diferente número de repeticiones por tratamiento es la si uiente:
Si los tratamientos tienen igual número de repeticiones, ento ces el ANVA resulta ser:
Ft---1n. 1n.--t t(r--1), Regla de decisión: echazar Ho, si Fc > Ft 1n. -t ó t(r -1), α
39
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Ejemplo Se evaluó el incremento de tamaño de ratas de laboratorio, por efe to de tres dosis de una hormona sintética T4. El experimento se realizo a nivel de laboratorio en donde las U.E. fueron rat nes recién nacidos, después de 30 días se midió el tamaño de los ratones desde las patas traseras a las patas delanteras, e tirando al ratón sin forzarlo ni lastimarlo. El resultado de la edición del tamaño de cada ratón se hizo en Mm. y dio com resultado los valores que en siguiente cuadro se presentan: Pruebe la hipótesi de que los incrementos de tamaño de l os ratones no se ven afectados por los di erentes niveles de T4. Ho: µ1=µ2=µ3
V.S.
Ha: al menos un µi es diferente
40
Ft 0.05=3.81 ==> c > Ft
Ft 0.01=6.70 ==> F > Ft
Se rechaza la hip tesis nula. Si hay diferencias altament significativas en el crecieminto de los r tones con las tres diferentes dosis de la h rmona T4.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Diseño de Bloques al Azar Este diseño es uti izado cuando las U.E. son heterogéneas, por l que la varianza dentro de los tratamientos es muy alta, la cual está medida por el cuad ado medio del Error, que en este caso es grand , por lo que es más difícil rechazar la hipótes s de igualdad de medias de tratamientos. Bajo la situación antes menci nada, es conveniente dividir el material exper mental en grupos (BLOQUES), de tal forma que las U.E. sean homogéneas dentro de bloques y heterogéneas entre bloques. Cada tratamiento a ensayar e tá representado una sola vez en cada bloque, estos se asignan al azar a las U.E. de cada bloque y poste iormente cada bloque se distribuye al aza en su establecimiento. Con la asignación e los tratamientos y los bloques al azar, es posible estimar la varianza entre bloq es por separado y tener un Error Experimental pequeño. Características Las U.E. d ben de ser homogéneas dentro de ca a bloque, salvo por pequeñas v riaciones aleatorias; puede haber ciert heterogenicidad, el propósito de los bloques es: absorber en máximo gra o la variabilidad del material experimental. Es el más ut lizado en trabajos experimentales Aunque no e particularmente una característica, los g ados de libertad para el Error no debe ser menor de 12 12 Es fácil de planear y el procedimiento de cálculo es fáci La disposici n de tratamientos y bloques es ortogonal e tre sí. El establec miento del Diseño en Campo, los Bloques se colocan perpendicularmente al gradiente de variabilidad.
41
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
En la tabla, se ti ne que las observaciones se denotan c n una letra con dos subíndices, el primero indica el tratamiento ( i ) y el segundo e bloque ( j ). Ventajas: •
Es más prec so que el DCA cuando hay un factor que ausa variación en las U.E.
•
Es flexible, ebido a que puede tener cualquier númer de tratamientos y de bloques (mín mo dos)
•
Es posible estimar datos perdidos
Desventajas: •
Cuando el número es muy grande, s difícil mantener la homogeneid d dentrodedetratamientos bloques, se pierde precisión.
•
Estima el Er or Experimental con menos grados de lib rtad que el D.C.A.
Diseño
gl
DCA
t (r-1)
DBA
(t-1) (r-1)
42
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
FV Tratam.
GL t-1
SC
Bloques
r-1
Σ i=1(Y.j) /t - (Y..) /rt
S.C. Bloq r-1
Error
(t-1) (r-1)
S.C.Tot.-S.C.Tr.-S.C.Bl.
S.C.Err./t-1 r-1
Total
rt-1
Σti=1Σrj=1Y2ij - (Y..)2/rt
t
2
2
t
2
2
Σ i=1(Yi.) /r - (Y..) /rt
CM S.C. Trat. t-1
Fc C.M. Trat/ C.M. Error C.M. Bloq./ C.M. Error
El criterio de decisi n es: Rechazar Ho1, si Fc F > FtFt-1(t -1(t1(t-1)(r -1)(r1)(r-1), -1), α
Para tratamientos
Rechazar Ho2, si Fc F > FrFr-1(t -1(t1(t-1)(r -1)(r1)(r-1), -1), α
Para Bloques
Ejemplo: Se evalúa la eficiencia de un complemento alimentic o a 4 diferentes dosis para elevar los niv les del volumen sanguíneo en personas ue sufren de anemia ferropénica e hipov lemía. Dada la variabilidad de pesos y sexos, se decidió agrupar en bloque de personas por pesos lo más semejantes posibles. Se les dio el tratamien o durantesanguíneo 4 meses y se procedió a determinar su volumen dando los siguientes resultad s: Las hipótesis a probar son: Ho1: T1=T2=T3=T4 VS
Ha1: Al menos un tratamiento s diferente
Ho2: B1=B2=B3=B =B5 VS Ha2: Al menos un bloque es diferente
43
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Para Tratamientos Fc > Ft0.05 y Fc > Ft0.01 Para Bloques
Fc Ft0.05 y Fc < Ft0.01
Se rechaza Ho1 pa a tratamientos. Hay diferencias altamen e significativas entre los tratamientos. Algunas dosis funcionan mejor que otras del complemento. Se acepta Ho2. Ho2 No h ay diferencias significativas entre bloques..
Diseño Cuadrado L tino Se utiliza cuando hay dos factores que afectan sistemáticamente a las unidades experimentales. Para evitar que el e ecto de los factores se acumule en el error experim ntal se hace un doble bloqueo. Esta asignación de ortogonalidad (independencia) a los efectos de los ratamientos respecto a los dos factores de vari bilidad asociados con el experimento, requiere que cada tratamiento aparezca una vez en cada una de esas variantes, denominados: HIL RAS Y COLUMNAS. Características: Se genera cuando l bloques homogéneo columnas quienes completa de los trat
s tratamientos se agrupan en en dos direcciones: hileras y constituyen una repetición mientos.
Cualquier tratamie to aparece una sola vez en la misma co umna o en la misma hilera. Se impone a las U. . una restricción de doble bloqueo.
44
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
El número de repet ciones es igual al número de tratamiento a evaluar. Esto es, si hay t tratamientos, el total de U.E. será t2 t2. t es mayor de 2. Ventajas: Reduce el error xperimental al introducir el doble bloqueo. El análisis esta ístico es simple, ligeramente más complicado que DBA. Puede utilizarse cuando las U.E. forman una línea continu . Proporciona una comparación más precisa de los efectos de los tratamientos. Aún con datos p rdidos, el análisis estadístico es simple. Es más preciso ue el DBA. Desventajas: Es poco flexible, ya que el No. de Hileras o Columnas dependen del No. de tratamientos. No se pueden co parar muchos tratamientos, el rango es -10 Con pocos trat mientos, se tienen demasiados parámet os en el modelo con pocas observaciones, siendo ineficiente la estimación de la varianza del error.
45
En la tabla, se tie e que las observaciones se denotan con una l tra con tres subíndices, el primero indica el t atamiento ( i ), el segundo el bloque ( j ) y el te cero ( k ) la columna.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
El criterio de decisi n es: Rechazar Ho1, si Fc F > FtFt-1(t -1(t1(t-1)(t -1)(t1)(t-2), -2), α Rechazar Ho2, si Fc F > FrFr-1(t -1(t1(t-1)(t -1)(t1)(t-2), -2), α Rechazar Ho3, si Fc F > FrFr-1(t -1(t1(t-1)(t -1)(t1)(t-2), -2), α
Para tratamientos Para Hileras Para Columnas
Ejemplo: Se desea valuar en un experimento el efecto en la ganancia de peso de cuatro complemen os alimenticios en la dieta de ratone s recién nacidos de diferentes razas. Se pesaron los ratones al nacer y se pesaron después de 15 días de estarles dando l complemento alimenticio; obte iendo de la diferencias de peso la ganancia del mismo, obteniéndo e los siguientes resultados en gr.: Ho1:t1=t2 = t3
VS
Ha1:al menos un ti es difer nte (ti≠ti’)
Ho2:H1=H2 H3
VS
Ha2:al menos un Hi es dife ente (Hi≠Hi’)
Ho3:C1=C2 =C3
VS
Ha3:al menos un Ci es dife ente (Ci≠Ci’)
46
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
47
No existe diferenc a significativa en la ganancia de pes s por efecto de los complementos alim nticios, ni por las especies y pesos al nace .
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
V:: Capitulo IIV V Correlación y Regresión En la práctica con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe una relación inherente entre ellas. El aspecto estadístico del problema consiste en lograr la mejor estimación de la relación entre las variables El análisis de regresión es útil para encontrar la forma probable de las relaciones entre las variables , siendo el objetivo final cuando se emplea este método de análisis, el de predecir o estimar el valor de una variable en función al valor tomado por otra variable. El análisis de correlación se refiere a la medición de la intensidad de la relación entre las variables. Cuando se calculan mediciones de correlación a partir de un conjunto de datos, el interés recae en el grado de correlación entre las variables. Ecuaciones de curvas Línea recta
Y = ao + a1X
Parábola (curva cuadratica)Y = ao + a1X + a2X2 Curva cúbica Curva Cuartica
Y = ao + a1X + a2X2 + a3X3 Y = ao + a1X + a2X2 + a3X3 + a4X4
Curva de grado n
Y = ao + a1X + a2X2 + …… + anXn
Curva exponencial
Y = abx
Curva geométrica
Y = aXb
Hiperbola
1 Y = ----------------------ao + a1X
48
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Gráficas de Funciones
49 REGRESIÓN LINEAL SIMPLE En este modelo, se considera a la variable “X” como la variable independiente, ya que se encuentra bajo el control del investigador, es decir l s valores de “X” son seleccionados para obtener valores de “Y”, “Y” por lo que se le conoce como variable dependiente; por lo que se habla de una regresión de “Y” sobre “X”. Supuestos que fund mentan el modelo de Regresión lineal sim si ple 1.- Los valores de “ ” son seleccionados previamente por el in estigador. 2.- La variable “X” se midce sin error (la magnitud del er or en la medición es insignificante). 3.- Para cada valor e “X” existe una subpoblaciones de valore de “Y” 4.- Los valores de “ ” siguen una distribución normal 5.- Todas las varian as de las subpoblaciones de “Y” son igual s 6.- Todas las medi s de las subpoblaciones de “Y” se encue tran sobre la misma linea recta (supocisión de linealidad). µy/x = α + βx 7.- Los valores de “ ” son estadisticamente independientes en re ellas
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
L
Linealidad L
I
IIndependenc a
N
Normalidad N
I
IIgualdad de arianzas a: a Es el punto donde la recta cruza el eje vertical. Es el punto de inicio del valor de los datos d la pendiente. b: b Es el valor de la pendiente. Indica l cantidad con la cual “y” cambia por cada unidad que cambi “X”.
50
Evaluación de la ec ación de regresión Hipótesis a probar: Conclusiones: Si se acepta Ho, el modelo lineal no proporciona un uen ajuste para los dato .
Ho: β = 0
v.s.
Fuente de variación
g.l.
S.C.
C.M.
F
Regresión lineal
1
SCR
SCR/1
CMR/CMr
Residual
n-2
SCr
SCr/n-2
Si se rechaza H , el Total modelo l neal proporciona un bue ajuste para los datos.
n-1
Ha: β ≠ 0
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Formulas
SCT =
∑y
2 i
x ∑
(∑ i )
−
∑x
SCR = b 2
r2 =
n 2 i
−
xi )
(
n
−
n
(∑ yi )
2
yi2 −
SCR = SCT
n 2
∑
b 2
SCr = SCT − SCR
r=
∑ xy − (∑ x)( y ) b= n∑ x − (∑ x ) ∑ y − b∑ x a=
xi ) n
∑
xi − (
(∑ yi )
2
∑y
n
2
2 i
∑
2
(∑ xi )
2
b2
2
2
2 i
= SCR SCT
n
n
x
y
x2
y2
xy
51 Totales
CORRELACIÓN LI EAL SIMPLE En el modelo clasi o de regresión solo “y” es la variable de endiente (aleatoria), siendo “x” una variable fija determinada por el investigador. Sin embargo, cuan o “x” y “y” son variables aleatorias, se t ene lo que se conoce como modelo de cor elación. Por lo que el aná isis de regresión puede llevarse a cabo bajo el modelo de correlación. Pudiendo hacerse na regresión de “x” sobre “y”, así como una regresión de “y” sobre “x”. El objetivo es única ente obtener una medida de la intensid d de la relación entre las 2 variables, no i porta que recta se ajuste, ya que la med da que por lo general se calcula será la m sma en cualquier caso.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Supuestos que fund mentan el modelo de Correlación lineal s mple Se supone que “x” y “y”, varian conjuntamente en lo que se co oce como distribución conjunta, y si ade ás esta distribución sigue una distribu ión normal, recibe el nombre de distribu ión normal bivariada. 1.- Para cada valo de “X” existe una subpoblaciones de valores de “Y” con una distribución normal.. 2.- Para cada valo de “y” existe una subpoblaciones de valores de “x” con una distribución normal.. 3.- La distribución conjunta de “x” y “y” es una distribución no mal bivariada. 4.- Todas las subpo laciones de los valores de “Y” tiene la mis a varianza 5.- Todas las subpo laciones de los valores de “X” tiene la mis a varianza Coeficiente e correlación. –Mide la intensidad de la asociación entre las r: variables “X” y “Y”. r= 0.6 = 60%. Exist una asociación entre las variables del 60 . Coeficiente e determinación. – Representa la variaci n total de los valores r2: de la variable “Y” que se pueden contabilizar o explicar por una relación lineal con los valores de la var able aleatoria “X”.– r2=0.36 = 36%. El 3 % de la variación de los valores de “Y”, s deben a una relación lineal con los valore de “X”.
52
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
V:: Capitulo V Estadística No Paramétrica La estadística paramétrica “Estima” o “Prueba Hipótesis” acerca de uno ó más Población. Necesitandose para esto conocer la forma en que se Parametros de la Población distribuye la población de donde se tomarón las muestras para la Inferencia (aproximadamente normal). La estadística no paramétrica, estudia procedimientos que no se refieren a parámetros poblacionales, que además no dependen del conocimiento del comportamiento de la distribución de la población en estudio. Son procedimientos que no son afirmaciones acerca de los parámetros de la población.
Ventajas de la estadística no paramétrica 1.- Permiten probar hipótesis que no son afirmaciones acerca de valores de los parámetros poblacionales. 2.- Se pueden utilizar cuando se desconoce la forma de la distribución de la población muestreada. 3.- Son fáciles de calcular, aplicándose más fácil y rápidamente. 4.- Pueden aplicarse cuando los datos son solo categorías o clasificaciones.
Desventajas de la estadística no paramétrica 1.- Analizar información mediante estadística no parametrica, pudiendo usarse la estadística parametrica, produce un desperdicio de información. 2.- En muestras grandes la aplicación de la estadística no parametrica puede ser muy laboriosa.
53
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
PRUEBA DEL SIG O Esta prueba utiliza a la mediana como medida de tendencia central. Toma su nombre de la utilización de los signos “+” y “-” en lugar de los valores numéricos. En esta prueba se deben de evaluar los datos de tal for a que los que sean superiores a la me iana hipotética se les sustituye con el si no “+” y los que sean inferiores se les su tituye con el signo “-” y a los que tienen l exactamente mismo valor que la mediana se les asigna el valor de “0” (cero). Por lo que los valores “0” se eliminan del analisis y de la muestra -reduciendose el tamaño de la muestra (n). Las hipótesis alternas que pueden ocurrir son: Ha: P(+) > P(-) Ha: P(+) < P(-) Ha: P(+) ≠ P(-) Regla de decisión: Ha: P(+) > P(-). S rechaza Ho, cuando la probabilidad de observar k, o menos signos menos es me or o igual que α. Ha: P(+) < P(-). S rechaza Ho, cuando la probabilidad de observar k, o menos signos mas es meno o igual que α. Ha: P(+) ≠ P(-). Se r chaza Ho, cuando la probabilidad de obte er un valor k, tanto o más extremo como l calculado es menor o igual a α/2. La probabilidad s siguiente formula:
calcula mediante la
Ejemplo: Se tomó u a muestra aleatoria de 10 alumnos que llevan el curso de verano de bioestadística arrojando los siguientes resultad s HIPÓTESIS Ho: La mediana de a población es de 5 Ha: La mediana de a población es diferente de 5 α = 0.05
54
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Alum. 1 2 3
Calif. 4 5 8
Alum. 1 2 3
Calif. 0 +
x
P ( k ≤ x / n, p ) =
∑
n
Ck p k q n −k
k =0
1
P( k ≤ 1 / 9,0.5) =
∑
9
k
p k q 9 −k
k =0
4 5 6 7 8 9 10
8 9 6 10 7 6 6
4 5 6 7 8 9 10
+ + + + + + +
P(k ≤ 1/ 9,0.5) =9 C0 (0.5)0 (0.5)9−0 +9 C1 (0.5)1 (0.5)9−1 P ( k ≤ 1 / 9,0.5) = 0.00195 0.01758 = 0.0195
HIPÓTESIS Ho: mediana = 5 Ha: mediana ≠ 5 El valor encontrado cae en la zona de rechazo de la Hipót sis nula (Ho), por lo tanto la mediana tiene un valor difrente de 5.
Cuando se tienen parejas de datos, el procedimiento funcion asignando un signo “+” cuando la difere cia “x-y” es mayor y un signo “-” cuando es menor, y “0” cuando la diferencia es de c ro. Ejemplo: Se desea conocer si existe diferencia entre los ni eles de ac. Úrico de hombres y mujeres abitantes de la ciudad de San Cristóbal d las Casas. HIPÓTESIS Ho: Las medianas de la población de hombres y mujeres son i uales Ha: Las medianas e la población de hombres y mujeres son d ferentes α = 0.05
55
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
X ♀ 1.5 2 3.5
Y ♂ 2 2 4
signo
3 3.5 2.5 2 1.5 1.5 2 3 2
2.5 4 3 3.5 3 2.5 2.5 2.5 2.5
+ + -
0 -
11
C0 (0.5) 0 (0.5)11−0 +
11
C1 (0.5)1 (0.5)11−1 +
11
C2 (0.5) 2 (0.5)11−2 +
P( k ≤ 2 / 11,0.5) = 0.0327
IPÓTESIS o: mediana♀ = mediana♂ a: mediana♀ ≠ mediana♂
a probabilidad cae dentro de la zona de aceptación de la ipótesis nula (Ho), por lo que se conclu e que los niveles de cido úrico de hombres y mujeres son igua es.
56 PRUEBA DE WILCOXON de calificación con signo Cuando los datos p ra el análisis son medidos al menos en un escala de intervalos, la prueba del SIG O no es la más aconsejable; debido a que se desperdicia mucha información contenida en los datos. En estos casos la rueba de WILCOXON puede ser más ad ecuada, debido a que utiliza las magnitu es de las diferencias entre las medicion s y un parámetro de ubicación dada por na HIPÓTESIS en lugar de los signos de as diferencias. Esta prueba se basa en las siguientes suposiciones sobre los d tos: 1.- La muest a es aleatoria 2.- La variab e es continua 3.- Los datos se distribuyen simétricamente alrededor e la MEDIA. 4.-La escala e medición es al menos de intervalos Ejemplo: En una in estigación en varones con problemas de c lvicie, se les midio los niveles de androsterona la cual tiene valores de referencia e (2.0-5.0 mg/dl). Se sospecha que esta personas tienen niveles altos de la ho mona por lo que se considera que tiene niveles de 5.05. Los resultados obtenidos fueron los siguientes:
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
nAdros. 4.91 4.10 6.74 7.27
di=xi- o di di c/si no -0.14 1 -1 -0.95 7 -7 1.69 10 10 2.22 13 13
7.42 7.50 6.56 4.64 5.98 3.14 3.23 5.80 6.17 5.39 5.77
2.37 2.45 1.51 -0.41 0.93 -1.91 -1.82 0.75 1.12 0.34 0.72
14 15 9 3 6 12 11 5 8 2 4
14 15 9 -3 6 -12 -11 5 8 2 4
Ho: µ=5.05
Ha: µ≠5.05
T+ = 86 T- = 34 T=34 El valor en tabla con n=15 y α/2= 0.0240 (es el valor más cercano en la tabla) es de 25 Por lo que 34 > 25 y no se rechaza Ho
MANN---WHITNEY PRUEBA DE MANN WHITNEY Esta prueba utiliza una mayor cantidad de información inherente a los datos y se basa en los rangos de las observaciones. Los supuestos de esta prueba son: 1.- Las muestras (n y m) son extraídas de manera independiente y aleatoria. 2.- La escala de medición es por lo menos ordinal. 3.- Si las poblaciones son diferentes, difieren solo en lo que respecta a sus medianas. T =S−
n( n + 1) 2
S = suma de los rangos asignados a los valores de “x” n = número de observaciones de la muestra “x”.
Ejemplo: Se desea evaluar si existen diferencias entre los niveles de hemoglobina de personas fumadoras y no fumadoras. Ho: Mx = My Ha: Mx ≠ My
57
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
T =S−
n( n + 1) 2
T = 145 −
15(15 + 1
S = 145
58 = 25
2
El valor en tabla (k) con n=15, m=10 y a=0.025 es de 40. HIPÓTESIS Ho: mediana x = mediana y Ha: mediana x ≠ mediana y Se rechaza Ho. La mediana de la hemoglobina de umadores y no fumadores es difere te.
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
PRUEBAS DE ASO ASOCIACIÓN Este estadístico d mediante:
prueba, permite evaluar la asociaci n entre 2 variables
encia:: Prueba hipótesis nula para 2 crite ios de clasificación y Prueba de indepen encia ver si son independ entes cuando se aplican al mismo conjunt de entidades. Prueba de homog neidad: neidad: Se utiliza para evaluar si las muestras extraídas provienen de poblac ones homogéneas con respecto a algún cri erio de clasificación. X2 =
∑
(Vo − Ve) 2 Ve
Vo= Valores Observados Ve= Valores Esperados: Ha: Hay asociación Ho: No hay asociaci n Rechazar Ho, si X2c lc. ≥ X2tabla Grados de Libertad (g.l.) = (Columnas -1) (Hileras-1) Ejemplo: A 2 grupos de 100 personas de hombres y mujeres cada un , con diabetes mellitus, se les suministra un nu vo medicamento a ambos grupos, encontrándose en el grupo de los hombres 75 recuperados y en el de las mujeres 65. ¿Existe asociación entre el exo y la recuperación? X2 = X2 =
∑
(Vo − Ve) 2
Ve
(75 − 70) 2 70
+
( 25 − 30) 2 30
+
(65 − 70) 2 70
+
(35 − 30) 2 30
2
X = 0.357 + 0.833 + 0.357 + 0.833 = 2.381
G.L.= (2-1)(2-1)= 1 X20.01/2=7.879
X20.05/2=5.024
Rechazar Ho, si X2c lc. ≥ X2tabla De acuerdo a la regla de decisión, se acepta Ho, por lo que no ay asociación entre el sexo y la recuperaci n del paciente.
59
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Prueba Exacta de “ isher” Cuando las frecue cias esperadas son pequeñas (aunque l os estadísticos no se ponen de acuerdo s recomienda el criterio de menor de 5 o 3 n una celda), no debe usarse la prueba e chi cuadrada; debiéndose usar un procedimie to alterno llamado “Prueba ( a + b)! c + d )!( a + c )!(b + d )! p= Exacta de Fisher”. Se considera la suposición ( a!)(b!)(c!)(d !)(n!) INDEPENDENCIA, contingencia de 2x2 y se utiliza para la tabla de MEDICION DE LA ASOCIACION Razón de Riesgo
a ni RR = c no
Razón de Momios
RM =
( )(d ) ( )(C )
60
INDICE DE CONC RDANCIA K=
Po − Pe 1 − Pe
Po =
a+d N
Pe =
(mi )(ni ) + ( mo)(no) N2
Kappa---Escala Escala Kappa
Ejemplo: Se realiza una prueba de concordancia entre e laboratorio A con 1 casos de 100 positivos y el laboratorio con 10 casos de 10 positivos. Ambos trabajaron las misma muestras. ¿Cual es el nivel de concordancia de los resultado entre ambos labora orios? Pe = Pe =
( mi)(ni) + ( mo (no)
N2 (14)(10) + (86)(90) (100)
2
= 0.788
Po = Po =
a+d N 4 + 80 100
K= = 0.84
K=
o − Pe 1 − Pe .84 − 0.788 1 − 0.788
= 0.245
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
Conclusión: La concordancia entre ambos laboratorio es discreta
INDICE DE CONC RDANCIA -MULTINOMINALES -MULTINOMINALESMULTINOMINALESEjemplo: Dos patól gos desean saber la concordancia entre el diagnóstico de ambos, por lo que se procedió a que con las mismas muestras ambos procedieran a dar su diagnóstico siendo los resultados los que se muestran en la tabl :
k
Pe =
∑x x .i
i.
Pe =
i =1 k
Po =
∑x
Po =
ii
i =1
Po − Pe K = 1 − Pe
(18)(20) + ( 40)(43) + (22)(17) = 0.383 80 2 9 + 29 + 14 80
= 0.65
61
0.65 − 0.383
K = 1 − 0.383
= 0.433
INDICES DE VALI EZ Sen. =
a *100 a+c
Esp. =
d *100 b+d
Vp ( + ) =
a *100 a +b
Vp ( −) =
d c+d
*100
Sen.= Sensibilidad Esp.= Especificidad Vp(+)= Valor predict vo positivo Vp(-)= Vaor predicti o negativo
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
TABLAS
62
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
63
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
64
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
65
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
EJERCICIOS • Supóngase que un investigador está interesado en obtener una estimación del nivel promedio de una enzima en cierta población de seres humanos con un 95% de confianza. El investigador toma una muestra de 10 individuos, determina el nivel de la enzima en cada uno de ellos y calcula la media muestral X= 22. Además, se sabe que la variable de interés sigue una distribución aproximadamente normal con una varianza de 45. Se desea estimar el valor de • Se desea estimar la concentración media de amilasa en suero de una población sana. Las mediciones se efectuaron en una muestra de 15 individuos aparentemente saludables, con una distribución normal. La muestra proporcionó una media de 96 unidades/100ml y una desviación estándar de 35 unidades/100ml la varianza poblacional se desconoce. • Suponiendo que la población de las concentraciones de amilasa en suero, a partir de la cual se extrajo una muestra de tamaño 15, tiene una distribución normal. Construir el intervalo de confianza del 95% para σ2, sabiendo que el valor de s2 = 1225. • El IMSS realizó investigaciones sobre los tipos de circulación sanguínea en el miocardio a personas en el ejido el Edén en el que obtuvo datos con una muestra representativa de n=25 con enfermedad de la arteria coronaria encontrando una desviación estandar de 1.03, presentando una distribución normal. Construir intervalos de confianza para la desviación estandar poblacional • Suponer que se conoce que en una población de mujeres el 90% de las que comienzan su tercer mes de embarazo han tenido algún cuidado prenatal. Si se extrae de esta población una muestra aleatoria de tamaño 200 con distribución normal, ¿Cual es la probabilidad que hayan tenido cuidados prenatales? • Los datos que presentó un laboratorio de análisis clínicos respecto a la fórmula eritrocitica requieren de parámetros que sean representativos de la población a la que prestan sus servicios tanto el químico como el médico, ya que de ello depende que la población reciba la atención y tratamiento adecuado en caso de ser necesario. Estos parámetros son diferentes para cada población considerando que cada uno posee características propias como son la estructura socioeconómica, su educación, su cultura, sus hábitos, sus costumbres y su situación geográfica. •
El recuento de glóbulos blancos de una muestra de 10 hombres con algún
tipo de leucemia confianza del 95%produjo para δ2 yuna δ. varianza de 25,000,000. Construir los intervalos de • Se midieron las concentraciones de hemoglobina en 16 animales infestados con garrapata, registrándose los siguientes valores: 15.6, 14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4, 13.9, 14.8, 17.5. Construir los intervalos de confianza del 95% para δ2 y δ.
66
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
• En un estudio sobre los tiempos de circulación sanguínea en el miocardio, obteniéndose los tiempos de circulación aparente en una muestra de 30 pacientes con patología en la artería coronaria. La varianza de la muestra fue de 1.03. Construir los intervalos de confianza del 95% para δ2 y δ. • Se llevo a cabo el estudio en 16 municipios de la costa de Chiapas; se tomó una población de 30 individuos para cada sexo escogiendo 2 de cada municipio, prsentando una distribución normal. Las x y la s en la muestra en hombres y mujeres fueron: x s SEXO 4.9x106 357,771 Hombres 4.2x106 312,418 Mujeres Se desea conocer el intervalo de confianza para la población tomando en cuenta los datos de la muestras en hombres y mujeres (se tiene un 99% de confianza). • Como parte de una investigación nutricional se desean saber cuales son los valores en los que se encuentra la media de glucosa, colesterol, triglicéridos y ac. Urico, en estudiantes de la facultad de Ciencias Químicas. Para lo cual se tomo un na muestra de 24 personas completamente al azar. Suponiendo que los datos presentan una distribución normal, ¿cual es el intervalo de confianza para la media poblacional de cada analito? glucosa colesterol trigliceridos ac. Urico 12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
86 81 80 95 84 99 110 108 102 98 97 103 81 86 96 107 81 87 95
187 166 179 197 166 186 145 191 179 184 172 190 193 170 183 144 178 160 146
28 115 189 126 150 111 83 80 155 155 47 56 148 18 53 149 61 120 139
67 6 1 3 5 8 6 5 2 6 1 1 6 7 6 2 4 1
20 21 22 23 24
103 108 87 102 86
181 174 151 165 185
150 10 54 24 47
86 3 6 1
67
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
• El hospital de cancerología en la Ciudad de México ha realizado un estudio acerca del peso en onzas de tumores malignos extraídos a 37 pacientes, con distribución normal. Se desea saber si la media poblacional de hombres y la media poblacional de mujeres son diferentes. Cuando se considera un 95% de confianza y la σ1 = 4.85 y la σ2 = 2.65, respectivamente. HOMBRES 30 35 25 28 27
31 32 25 33 36
32 31 29 28 30
MUJERES
29 31 33 27 28
30 29 27 26 34
33 28 29 30 31
33 32 26 25 27 28 27 n1 = 20 n2 = 17 • Los pacientes con artritis reumatoide presentan el mayor riesgo de desarrollar osteoporosis, la razón de ello no se conocen en parte a las dificultades para evaluar cuantitativamente el metabolismo y contenido mineral del huso. Weisman y sus colaboradores (1986) midieron los valores de calcitocina humana (HCT) en varones y mujeres con artritis reumatoide y en sujetos control igualados en cuanto a edad y sexo que se eligieron entre un grupo de voluntarios sanos. Se quiere comprobar que la media poblacional de mujeres y la de hombres son diferentes (ambas presentan distribución normal). HOMBRES MUJERES 33 35 35 35 45 46 46 45 35 31 35 35 45 47 47 48 31 33 34 35 48 48 45 47 33 34 35 47 49 48 32 32 37 45 45 49 35 35 35 45 46 45 34 34 33 48 48 46 31 33 32 48 49 47 31 31 32 49 47 49 35 35 33 47 45 48 n1 = 33 n2 = 33 • En una población se ha padecido, de problemas en niveles sanguíneos (leucocitos) entre el año 2003 y 2004 dicho mal afecta a jóvenes de 18 – 25 años de edad, dicho estudio hecho en la ciudad de Tapachula a los márgenes de esta. Se desea saber si la µ es > a 4000 , con un 95 % de confianza. La población presenta una distribución normal Niveles de leucocitos 3500 1500 2500 2500 2500 4500 2500 4500 3500 2500 3500 4500 4500 4500 4500 3500 4500 3500 3500 2500
4500 2500 3500 4500 3500
2500 4500 3500 3500 2500
68
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
• A continuación se muestra una tabla indicando la variación de la Temperatura en algunas regiones del estado de Chiapas de hace varios años a la fecha la temperatura de la tierra a aumentado su temperatura debido a cambios externos climáticos como el fenómeno del niño por tal motivo un grupo de climatólogos predice que la variación de hace unos años al actual de que aumenta. Las lecturas presentan una distribución normal •riesgo Helmerich y colaboradores (1987) dirigieronconunelestudio evaluar el de trombosis venosa profunda en relación uso de para anticonceptivos orales. Mostraron interés especial en el riesgo relacionado con una dosificación baja (menos de 50 MG de estrógeno) y circunscribieron sus estudios a 30 mujeres menores de 50 años de edad, de las cuales 12 presentaron la enfermedad. Los datos arrojados por la Secretaria de Salud indican que 9 de cada 30 mujeres encuestadas han presentado la enfermedad. La población presento ua distribución normal • En trescientos pacientes deseamos investigar los efectos de dos tratamientos sobre los tiempos medios de recuperación de pacientes con cierta enfermedad. Estos 300 pacientes se dividieron aleatoria mente en 2 grupos iguales, presentandouna distribución normal. El primer grupo de 150 pacientes, cuyos elementos recibieron un tratamiento normal, 110 se recuperaron en un plazo de 5 días. El otro grupo de 150 personas que se trato con un nuevo método, 86 se recuperaron en 5 días • Se estudia a dos poblaciones de diferentes grupos etnicos en el estado de Chiapas (altos y costa) y se desea saber si sus niveles de colesterol son iguales, para lo cual se hizo el estudio que arrojo los siguientes resultados 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
Altos Costa 187 194 166 155 179 172 197 140 166 181 186 141 145 179 191 188 179 156 184 152 172 171 170 190 193 174 170 174 183 173 144 168 178 168
69
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
18 19 20 21 22 23 24
160 146 181 174 151 165 185
149 176 165 165 160 142 142
Diseño Completamente al Azar 1. Los niveles de estrógenos (E4) en mujeres durante la ovulación es de 280 pg/ml en promedio. En un estudio se les determino los niveles de E4 a mujeres de 3 distintas edades (20, 30 y 40 años aprox.), dando como resultado los valores que en la siguiente tabla se presentan: 20: 30: 40:
437, 380, 400, 420, 350, 370, 400. 250, 300, 320, 325, 290, 270. 122, 180, 200, 150, 190.
¿Influye de alguna forma la edad en la producción de E4? Explique 2. Se evalúa un tratamiento con la hormona T3 en pacientes con problemas de estatura a 3 diferentes dosis. La población fueron varones con edades de los 18 a los 25 años. se midió en “cm” el aumento de estatura dando como resultado los siguientes datos al año de estar con el tratamiento T1 T2 T3
5, 7, 4, 5, 5. 4, 4, 5, 6, 6, 4. 4, 5, 7, 6, 7.
¿Existen diferencias significativas en la ganancia de altura entre los tratamientos? Explique 3. El ruido producido por el motor de un vehículo no debe de exceder los 30 decibeles. 4 compañías indican que sus motores son los que poseen los índices más bajos de contaminación sonora (ruido), para tal efecto se tomaron muestras de varios automóviles y los resultados se presentan en la siguiente tabla: B C D
A
40, 45, 48, 36, 32. 38, 30, 47, 43. 48, 40, 40, 39, 35. 42, 41, 47, 48, 40
A que conclusión puede llegar. Explique 4. Se considera que la población joven de los países latinoamericanos se concentra en los lugares más urbanizados. En un estudio en la República Mexicana, se seleccionaron 3 sitios al azar siendo estos: Campeche, Guadalajara y Veracruz. En los cuales se muestreo gente al azar, a la cual se les pregunto su edad, siendo los resultados:
70
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Guadalajara: 22, 36, 40, 18, 25. Campeche: 32, 41, 56, 28, 37, 43. Veracruz: 18, 25, 32, 14, 29. A que conclusión llega con este estudio. Explique. 5. El promedio de la frecuencia respiratoria es de 12/min. en reposo. Se estudia a un grupo de personas para determinar si la complexión es un factor en la frecuencia respiratoria. Se tomaron muestras al azar de los 3 tipos de complexiones y los resultados fueron los siguientes: Delgados: 12, 13, 14, 15, 14. Medianos: 13, 12, 12, 14, 13. Gruesos: 16, 15, 14, 15. Cual es su conclusión. Explique. Diseño de Bloques al Azar 1. Tres empresas (A, B y C) concursan para venderle a la policía un equipo para la determinación de alcohol en el aliento. Los equipos son de diferentes precios, por lo que se hace una prueba con un equipo de cada compañía para determinar si existe diferencia entre estos. La prueba consiste en la medición de metanol (Valor de Referencia < 0.80 p.p.m.) al personal de oficina de la policía de diferentes edades. Los resultados obtenidos fueron: Edades
•
Empresas A B C I 0.90 0.80 0.70 II 0.70 0.70 0.60 III 0.70 0.60 0.80 IV 0.60 0.70 0.70 Existen diferencias en las mediciones de metanol con los equipos. Explique
2. El nivel máximo en la atmósfera de dióxido de azufre (SO2) recomendado por la OMS es de 40 gr/m3. Se considera al Distrito Federal la ciudad más contaminada del país; para comprobarlo se toman muestras de 4 de las ciudades con mayor número de habitantes del país (Distrito Federal, Monterrey, Guadalajara, Tijuana) durante una semana y se obtuvieron los siguientes resultados: Días 1 2 3 4 5 6 7
D.F. 82 90 71 60 75 100 110
Ciudades MTY GDA 70 74 82 68 75 90 88
67 49 54 72 94 98 85
TJA
61 53 48 45 67 62 49
71
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
•
En base a los resultados obtenidos concluya. Explique
3. La presión arterial promedio de un individuo es de 100 (80-120). Se toman muestras de las tres zonas del estado (Altos, Centro y Costa) a individuos seleccionados al azar de diversas edades y se les mide la presión arterial para determinar si la altitud a la que viven influye en está presión. Los resultados obtenidos son: Edades
ALT
Zonas
CEN COS I 110 95 100 II 115 98 98 III 105 102 94 IV 108 104 99 V 104 100 92 • ¿Es la altitud un factor que influya en la presión arterial de los individuos? Explique. • ¿Es la edad un factor que influya en la presión arterial de los individuos? Explique. En base a lo anterior concluya. 4. En la Ciudad de México el número de defunciones por mes atribuidas a la contaminación ambiental son de aproximadamente 1000. Se hace un estudio en tres ciudades del país (Mérida, Oaxaca y Tijuana) para determinar si el índice de mortalidad por efecto de la contaminación es el mismo entre las diferentes regiones del país. Para tal efecto se registraron el número de defunciones (por contaminación) por mes durante cinco meses, obteniéndose los siguientes datos: Meses
Ciudades MDA OAX TJA I 400 357 800 II 300 421 725 III 600 480 1005 IV 457 300 930 V 525 500 915 • ¿Fuera de la Ciudad de México los índices de mortandad son parecidos entre las diferentes regiones de la República? Explique y concluya. 5. Un experimento sobre adicciones se realizo en una población de adultos farmacodependientes con diferentes niveles de adicción y de diferentes edades a los cuales se les retiro la droga para establecer el número de días que lograban aguantar sin el consumo de esta. Los resultados fueron los siguientes:
72
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Edades
Niveles de Adicción Alt Med Baj I 12 14 15 II 10 8 13 III 12 10 10 IV 8 8 9 V 4 5 7 • ¿Existe diferencia para aguantar la abstinencia del consumo de droga de acuerdo a los niveles de adicción? Explique. • ¿Existe diferencia para aguantar la abstinencia del consumo de droga de acuerdo a las diferentes edades considerando que se tienen agrupadas de menor a mayor edad? Explique En base a lo anterior concluya. Diseño en Cuadrado Latino 1. Se evalúa un nuevo combustible (gasolina + alcohol) para automóviles, por lo que se hace una evaluación con tres marcas distintas de autos (A, B y C), con tres diferentes motores (I, II y III) por marca. Para la prueba se usan 3 diferentes concentraciones (t1, t2 y t3) de alcohol en la gasolina. Obteniéndose los resultados en rendimiento (km/lt), siendo estos: Motor
Marcas
A B C I t1-12.0 t2-14.0 t3-13.0 II t2-13.5 t3-14.2 t1-13.6 III t3-12.0 t1-10.0 t2-14.2 • ¿Existen diferencias entre las diferentes concentraciones de alcohol en el rendimiento (km/lt)? Explique. • ¿Existen diferencias entre las diferentes marcas de los autos en el rendimiento (km/lt)? Explique. • ¿Existen diferencias entre los diferentes motores en el rendimiento (km/lt)? Explique. En base a lo anterior concluya. 2. Se evalúan cuatro vacunas (t1, t2, t3 y t4) contra la brucelosis en ganado bovino de diferentes razas (A, B, C y D) y edades (I, II, III y IV). Se manejaron lotes de 25 animales por raza y edad. Se evaluaron al año de la aplicación de las vacunas, habiendo recibido un manejo Sanitario y Zootécnico normal. Se procedió a cuantificar el número de animales vacunados que contrajeron la enfermedad, obteniéndose los siguientes resultados
73
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
Edad
A
Razas
•
B I t1-18 t2-16 t3-12 II t4-22 t1-17 t2-18 III t3-11 t4-17 t1-19 IV t2-19 t3-18 t4-19 ¿Existen diferencias entre las diferentes Vacunas? Explique.
• •
¿Existen diferencias entre las diferentes Razas? Explique. ¿Existen diferencias entre las diferentes Edades? Explique.
C
t4-21 t3-19 t2-17 t1-20
D
En base a lo anterior concluya. 3. Se evalúan 4 diferentes insecticidas (t1, t2, t3 y t4) durante 4 semanas (I, II, III y IV) en 4 especies de Triatominos (A, B, C y D). Los resultados obtenidos se dieron en relación al número de triatominos encontrados muertos, siendo estos: Semanas
A
Especies
•
B I t1-12 t2-9 t3-6 II t4-6 t1-14 t2-10 III t3-5 t4-7 t1-11 IV t2-9 t3-5 t4-7 ¿Existen diferencias entre los diferentes Insecticidas? Explique.
•
¿Existen diferencias entre las diferentes Especies? Explique.
•
¿Existen diferencias entre las diferentes Semanas? Explique.
C
t4-7 t3-4 t2-8 t1-12
En base a lo anterior concluya. 4. Se evalúan 3 medidas contra la contaminación ambiental (t1, t2, y t3), en diversas ciudades del país (A, B y C), durante 3 semanas (I, II y III). El parámetro a medir fue el S02 en g/m3, (Índice recomendado 40 g/m3) los resultados obtenidos fueron los siguientes: Semanas
Ciudad A B C I t1-80 t2-69 t3-71 II t3-93 t1-83 t2-72 III t2-85 t3-88 t1-69 • ¿Existen diferencias entre las diferentes Medidas contra la contaminación? Explique. • ¿Existen diferencias entre las diferentes Ciudades? Explique. •
¿Existen diferencias entre las diferentes Semanas? Explique. En base a lo anterior concluya.
D
74
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
5. Se prueba una hormona sintética de la somatotropina bovina (STB), la cual es inductora de la producción de leche. Se prueba en un lote de vacas cebú con edades de 3, 4 y 5 años y con pesos de 400, 450 y 500 kg a 3 dosis diferentes de la STB. Los resultados fueron los aumentos en la producción de leche en Kg., siendo estos: Edad
•
Pesos 400 450 500 3 t1-0.5 t2-0.8 t3-1.2 4 t3-1.3 t1-1.6 t2-1.8 5 t2-2.0 t3-2.5 t1-2.5 ¿Existen diferencias entre las diferentes Dosis de STB? Explique.
•
¿Existen diferencias entre las diferentes Edades? Explique.
•
¿Existen diferencias entre los diferentes Pesos? Explique.
En base a lo anterior concluya. PRUEBAS DE ASOCIACIÓN 1.Una industria farmacéutica probó un nuevo fármaco para el control de la fiebre causado por el resfriado en 100
Vo
curados
No curados
Machos Hembras
20 28 48
30 22 52
ratones. Se está saber sidel el sexo influye en interesado el metabolismo fármaco, para ello se dividió la población equivalentemente obteniéndose:
50 50 100
2.Un químico realiza la prueba para la Vo Plantas Plantas certificación de un nuevo agroquímico para logradas no logradass 81 300 el control de la plaga de la sigatoca en el EQ-730 219 201 99 300 plátano de la variedad gran enano. Para ello ZR-1 420 180 600 la comparó con otro agroquímico ya certificado, el EQ-730. En un sembradío de 300 plantas para cada agroquímico se arrojaron los siguientes resultados: 3.-
Se desea saber si el síndrome de
Down estáunenestudio funciónendel paradeello se realizó un sexo, hospital los Estados Unidos de América, encontrándose que en los nacimientos de este año:
Vo
Con S.Down
Sin S.Down
Hombres Mujeres
19 23 42
31 27 58
50 50 100
75
Bioestadística Elemental n el Área de la Salud Miguel Ángel Rodríguez Feliciano
4.Se desea saber si la sensibilidad y especificidad de la prueba de brucelosis, por el metodo rosa de bengala, comparandola con l prueba confirmativa de rivanol, los resultados ueron los siguientes:
Rosa de Bengala Positivo Negativo
Positi o 6 2 8
5.Se desea s ber la concordancia entre el resultado de 2 laboratorios de patología animal, uno en Tapachula y otro en Huixtla, sobre la prueba de tuberculosis, los resultados fueron los siguientes:
Huixtla
Tapa hula
Positivo Negativo
Positi o 12 3 15
Rivanol
Negativo 6 11 17
12 13 25
Negativo 6 9 15
18 12 30
Un estudio de 19 embarazos proporcionó los siguientes datos sobre la relac ón que existe entre la hipertensión de la madre y cierta com licación del embarazo. 2.- Una muestra de 150 portadores de Hepatitis C, y una muestra de 500 no portadores, revelaron la siguiente distribución de l s grupos sanguíneos.
3.- A un grupo de 50 adultos, se les con problemas de sobrepeso se les p egunto si llevaban o no dieta. Las repuestas en base a sexo son las siguientes:
76
Bioestadística Elemental en el Área de la Salud Miguel Ángel Rodríguez Feliciano
BIBLIOGRAFÍA •
BOX, HUNTER W, HUNTER S. 1989. INTRODUCCIÓN AL DISEÑO DE EXPERIMENTOS, ANÁLISIS DE DATOS Y CONSTRUCCIÓN DE MODELOS.
•
DANIEL, W. 1989. BIOESTADÍSTICA, MÉXICO. ED. LIMUSA.
•
ELSTON, R.C Y JOHNSON W.D. 1990. PRINCIPIOS DE BIOESTADISTICA. MÉXICO, ED. EL MANUAL MODERNO, S.A. DE C.V.
• •
JOHNSON, ROBERT. 1979. ESTADÍSTICA ELEMENTAL, TRILLAS. MARQUEZ, M.J. 1990. PROBABILIDAD Y ESTADÍSTICA PARA CIENCIAS QUÍMICO - BIOLÓGICAS. MÉXICO., ED. MCGRAW-HILL.
•
MILTON, TSOKOS. 1987. ESTADÍSTICA PARA BIOLOGÍA Y CIENCIAS DE LA SALUD,. MÉXICO. ED. INTERAMERICANA.MCGRAW-HILL.
•
PÉREZ L. CESAR. 1997. ANÁLISIS ESTADÍSTICO CON STATGRAPHICS, TÉCNICAS BÁSICA, MÉXICO, ED. ALFAOMEGA S.A. DE C.V. SCHEFLER, W.C. 1981. BIOESTADÍSTICA, MÉXICO ED. FONDO EDUCATIVO INTERAMERICANO. STELL / TORRIE. 1990. BIOESTADÍSTICA PRINCIPIOS Y PROCEDIMIENTOS, MÉXICO, ED. MC GRAW HILL,
• • •
WALPOLE, MYERS. 1992. PROBABILIDAD Y ESTADÍSTICA, MÉXICO ED. MCGRAW-HILL.
77