SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD
División de Investigación en Medicina Programa de Apoyo a las Sociedades Científica de Estudiantes de Medicina (PASCEM) SEPARATA: BASES PARA EL ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
EXTRACTO Dr. José Antonio Supo Condori www.josesupo.com
01 Pastilla - Tipos de investigación 02 Pastilla - Niveles en investigación 03 Pastilla - Diseños en investigación 04 Pastilla - Variables e Indicadores
Arequipa 1 de Enero del 2010
05 Pastilla - Escalas de medición 06 Pastilla - Las variables según su relación 07 Pastilla - Criterios de Causalidad 08 Pastilla - Formulación del problema 09 Pastilla - Hipótesis metodológica 10 Pastilla - Hipótesis estadística 11 Pastilla - Objetivo estadístico 12 Pastilla - Ritual de la significancia estadística 13 Pastilla - Significancia estadística 14 Pastilla - Objetivo Estadístico (cualitativo) 15 Pastilla - Objetivo Estadístico (cuantitativo) 16 Pastilla - Objetivo comparativo 17 Pastilla - Técnicas de recolección de datos 18 Pastilla - Instrumentos de medición
Claves
19 Pastilla - Sesgos de selección
Pastilla: Temas resumidos en una sola hoja
20 Pastilla - Sesgos de medición
Sinopsis: Los cuadros sinópticos utilizan el razonamiento por analogía
21 Pastilla - Correlación de Pearson y Spearman
Formulario: Algoritmos más comunes en epidemiología Práctica: Ejercicio a desarrollar en 15 minutos
Nota: El desarrollo estadístico es explicado en vídeotutoriales, para lo cual deben ingresar a bioestadistico.com
22 Pastilla - Validez de un estudio 23 Pastilla - Control de un estudio 24 Pastilla - Tendencia central y dispersión 25 Pastilla - Medidas de posición y de Forma 26 Pastilla - Gráficas univariables 27 Pastilla - Error tipo I y II 28 Pastilla - Población y muestra
Arequipa - Perú 201o
29 Pastilla - Muestreo probabilistico 30 Pastilla - Validación de test psicométricos
SPBIS.ORG
SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 1
TIPOS DE ESTUDIO
1.
Según la intervención del Investigador: OBSERVACIONAL: No existe intervención del investigador; los datos reflejan la evolución natural de los eventos, ajena a la voluntad del investigador. EXPERIMENTAL: Siempre son prospectivos, longitudinales, analíticos y de nivel investigativo “explicativo” (causa – efecto); además de ser “controlados”.
2.
Según la planificación de la toma de datos PROSPECTIVO: Los datos necesarios para el estudio son recogidos a propósito de la investigación (primarios). Por lo que, posee control del sesgo de medición. RETROSPECTIVO: Los datos se recogen de registros donde el investigador no tuvo participación (secundarios). No podemos dar fe de la exactitud de las mediciones.
3.
Según el número de ocasiones en que mide la variable de estudio TRANSVERSAL: Todas las variables son medidas en una sola ocasión; por ello de realizar comparaciones, se trata de muestras independientes. LONGITUDINAL: La variable de estudio es medida en dos o más ocasiones; por ello, de realizar comparaciones (antes – después) son entre muestras relacionadas.
4.
Según el número de muestras a estudiar DESCRIPTIVO: El análisis estadístico, es univariado porque solo describe (finalidad cognoscitiva); o estima parámetros (propósito estadístico) en la población de estudio a partir de una muestra. ANALÍTICO: El análisis estadístico por lo menos bivariado; por que plantea y pone a prueba hipótesis explicativas (finalidad cognoscitiva); su nivel más básico establece la asociación entre factores (propósito estadístico).
IMPORTANTE: “Descriptivo no es sinónimo de observacional”. Un estudio observacional puede ser analítico. Ejm: El estudio de los casos y controles.
Pág. 2
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
NIVELES EN INVESTIGACIÓN 1.
EXPLORATORIO: Se plantean cuando el objetivo es examinar un tema o problema de investigación poco estudiado o que no ha sido abordado antes; su finalidad es establecer prioridades para investigaciones posteriores o sugerir afirmaciones verificables. No hay preguntas que conduzcan a problemas precisos, se exploran áreas problemáticas. Se trata de investigación cualitativa; por lo que no se requiere de manejo estadístico.
2.
DESCRIPTIVO: Describe fenómenos sociales o clínicos en una circunstancia temporal y geográfica determinada. Desde el punto de vista cognoscitivo su finalidad es describir y desde el punto de vista estadístico su propósito estimar parámetros. La estadística consiste en estimar frecuencias y/o promedios; y otras medidas univariadas. Ejm. los estudios de frecuencia de la enfermedad: Incidencia y Prevalencia.
3.
RELACIONAL: No son estudios de causa y efecto; porque las pruebas estadísticas solo demuestran dependencia entre diferentes eventos; aquí podemos encontrar los estudios de asociación sin relación de dependencia; y las correlaciones espurias. La estadística es bivariada; podemos hacer asociaciones y medidas de asociación; correlaciones y medidas de correlación. Ejm. Chi Cuadrado y R de Pearson.
4.
EXPLICATIVO: Su finalidad es explicar el comportamiento de una variable en función de otra(s); aquí se plantea una relación de causa-efecto, y tiene que cumplir otros criterios de causalidad (Bradford Hill); requiere de control tanto metodológico como estadístico. En los estudios observacionales la estadística multivariada; tiene por finalidad descartar asociaciones aleatorias, casuales o espurias. Ejm. Chi 2 de MantelHaenszel.
5.
PREDICTIVO: Se encarga de la estimación probabilística de eventos generalmente adversos, como puede ser las complicaciones de la enfermedad, la mortalidad, etc. La línea investigativa debe haber pasado previamente por los otros niveles. Se aplican un conjunto de técnicas estadísticas. Ejm. La validación de una prueba diagnóstica requiere: Alfa de Cronbach, Índice Kappa, ANOVA, Curvas ROC.
6.
APLICATIVO: Plantea resolver problemas de la vida cotidiana o a controlar situaciones prácticas. Puede ser programática o no programática, de manera que enmarca a la innovación técnica, artesanal e industrial como la propiamente científica. Las técnicas estadísticas apuntan a evaluar el éxito de la intervención, como medidas de impacto sobre los principales indicadores de salud: tasas, coberturas, rendimiento, etc.
SPBIS.ORG
SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 3
DISEÑOS EN INVESTIGACIÓN 1.
EPIDEMIOLÓGICOS: Describir la distribución de las enfermedades y eventos de salud en poblaciones humanas y descubren las leyes que gobiernan estas condiciones. Descriptivo: Pueden ser transversal (Ej. Estudio de prevalencia) y longitudinal (Ej. Estudio de incidencia): Observacional Analítico: No solo buscan demostrar dependencia entre eventos; sino la fuerza de asociación entre ellos, y plantea la relación de causalidad como una medida de riesgo. Ej. Casos y controles Cohortes. De intervención: No llegan a ser experimentos verdaderos, porque se ven limitados por las normas éticas. Ej. Ensayos clínicos y ensayos de población.
2.
EXPERIMENTALES: Requiere de dos condiciones básicas: intervención y asignación aleatoria. Siendo de nivel investigativo explicativo tienen control metodológico. Pre-experimento: La intervención sobre las unidades de estudio, no es apropósito de la investigación; sino que obedece a las necesidades terapéuticas del sujeto. Cuasi-experimento: Cuando no hay grupo control, no es posible realizar la asignación aleatoria de los sujetos, puesto que no se puede dejar sin tratamiento a los pacientes. Experimento verdadero: Cumple con la asignación aleatoria e intervención.
3.
COMUNITARIOS O ECOLÓGICOS: La unidad de análisis es la población y generalmente la fuente de datos suelen ser las estadísticas de morbilidad y mortalidad rutinarias. Exploratorios: El único propósito es buscar patrones espaciales o temporales que podrían sugerir temas de investigación. Aquí se encuentran los estudios cualitativos. De comparaciones múltiples: Este es diseño el ecológico más común. En un estudio analítico de comparación de grupos múltiples. La estadística varía solo por este hecho. Series temporales: Analiza las variaciones temporales de los niveles de exposición con otra serie de tiempo que refleja los cambios en la frecuencia de la enfermedad.
4.
ENSAYOS CLÍNICOS: Experimentos en seres humanos para evaluar métodos de prevención, diagnóstico, tratamiento o manejo de las enfermedades que les aquejan. Terapéuticos: Suelen ser estudios individuales y son los más comunes; su propósito es curar, aliviar y/o prolongar la vida del paciente. Ej. Excéresis de un tumor localizado. De intervención: Su propósito es modificar el curso natural de la enfermedad. Ej. Tratamiento de la diabetes para prevenir nefropatía diabética.
Pág. 4
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
VARIABLES E INDICADORES 1.
VARIABLES Y CONSTRUCTOS 1.1. VARIABLES Son propiedades, características o atributos que se dan en las unidades de estudio (personas, grupos, etc.) o por derivación de ellas; siempre deben ser medibles. Las variables individuales corresponden a las unidades de estudio individuales, ejm. el nivel de instrucción de las personas. Las variables colectivas son propiedades de grupos y su medición se basa en las propiedades individuales que poseen sus miembros, por ejemplo el índice de analfabetismo. El análisis estadístico de las variables individuales y las variables colectivas; incluso dentro de un mismo objetivo, no siempre es el mismo. 1.2. CONSTRUCTOS Un constructo es una propiedad que se supone posee una persona (unidad de estudio individual), es un concepto teórico, hipotético. Por ejemplo, la inteligencia, la motivación, la creatividad, las actitudes, etc. Los constructos se definen como propiedades subyacentes, que no pueden medirse de manera directa, sino mediante manifestaciones externas de su existencia, es decir, mediante indicadores. Los constructos son variables subyacentes, por lo cual, reciben la denominación común de variables.
2.
INDICADORES E INDICES 2.1. INDICADORES Cuando las variables no presentan ninguna dificultad para su identificación se dice que tienen indicadores directos o unidimensionales. Las variables subyacentes (constructos) que no pueden medirse de manera directa como, requieren de indicadores que permitan su medición. En este caso estamos hablando de indicadores indirectos o multidimensionales. Los instrumentos utilizados para medir variables subyacentes, deben tener una validez de constructo que corresponde su definición operacional. Así, el estrés de Burnout queda definido operacionalmente cuando es medido por el test de Maslach. 2.2. INDICES Es una combinación de dos o más variables o de sus indicadores elegidos por el investigador que propone como procedimiento para medir una cierta variable. Un índice puede estar representado por los indicadores de su definición operacional. Así tenemos que, el índice de la función sexual esta constituida por las dimensiones: el deseo, la función eréctil, función orgásmica y la satisfacción. Reciben también el nombre de índices los valores que toma una variable (por ejemplo, la tasa de mortalidad) en un período determinado, valores que son reducidos a porcentaje o a una cantidad exponencial de base 10.
SPBIS.ORG
SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 5
Escalas de Medición de las variables 1.
Variables Categóricas o Cualitativas
1.1. Escala NOMINAL: (ningún atributo) Posee categorías a las que se asigna un nombre sin que exista ningún orden implícito entre ellas. Ejemplos: Género: Masculino – Femenino Estado Civil: Soltero - Casado – Conviviente
1.2. Escala ORDINAL: (un atributo - Orden) Posee categorías ordenadas, pero no permite cuantificar la distancia entre una categoría y otra. Ejemplos: Intensidad del dolor: Leve - Moderado – Intenso Instrucción: Primaria - Secundaria – Superior
Observaciones Dicotómicas: Tienen solamente dos categorías. Politómicas: Tienen más de dos categorías.
2.
Variables Numéricas o Cuantitativas
2.1. Escala de INTERVALO: (dos atributos - Orden y Distancia) Tiene intervalos iguales y medibles. No tiene un origen real, por lo que puede asumir valores negativos. Ejemplos: Temperatura: -10°C, 0°C, 20°C, etc. Hora del día: 00 Horas, 10 Horas, 20 Horas, etc.
2.2. Escala de RAZÓN: (tres atributos - Orden, Distancia y Origen) Tiene intervalos constantes entre valores; además de un origen real. El cero significa la ausencia del individuo. Ejemplos: Peso: 00.00Kg, 10.24Kg, 20.00Kg, etc. Número de Hijos: Uno, Dos, Tres, etc.
Observaciones Continuas: Provienen de medir y se pueden representar con números enteros o fraccionarios Discretas: Provienen de contar y solamente pueden ser representados con números enteros.
Pág. 6
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
LAS VARIABLES SEGÚN SU RELACIÓN
Esta clasificación de las variables se fundamenta en la búsqueda de obtener explicación causal que puede ser observacional o experimental y correspondiente al nivel investigativo explicativo. Su estructura responde a la necesidad de realizar el control metodológico y/o estadístico de la relación causa-efecto. 1. Variable dependiente En este sistema de variables representa a la variable de interés o variable de estudio, es la que para su existencia y desenvolvimiento depende de otra independiente, su modo de ser, está condicionada por otros aspectos de la realidad. Es la que mide o describe el problema que se estudia. 2. Variable independiente Es aquella cuya existencia es autónoma, no depende de otra, más bien de ella dependen otras, representa los factores que constituirían la causa, siendo que previamente ha demostrado ser factor de riesgo para el problema que se estudia. En este sistema de variables se plantea solamente una variable independiente.
3. Variables intervinientes a. Variable intermedia Esta variable aparece de manera incalculada durante el proceso de una observación o inesperada dentro de un experimento, entre el factor causal y el efecto. Ocurre cuando no ha habido una buena elección de los factores de riesgo. El procedimiento más idóneo para su neutralizar su participación es el análisis multivariado. b. Variable de control Es una variable con una fuerte influencia sobre la variable dependiente, pero ningún efecto reconocido sobre la variable independiente; habitualmente se reconoce su participación en el momento de la planeación; por ello su control se realiza metodológicamente mediante los criterios de exclusión. c. Variables de confusión Su participación puede intensificar o antagonizar la relación aparente entre el problema y una posible causa, creando confusión en el investigador. Su influencia se da tanto sobre la variable independiente como en la dependiente. Su control se debe realizar mediante análisis estratificado.
SPBIS.ORG
SOCIEDAD PERUANA DE BIOESTADISTICA E INVESTIGACIÓN EN SALUD Pág. 7
CRITERIOS DE CAUSALIDAD Criterios de Bradford Hill (1965) 1. Asociación estadística: Se trata de averiguar si existe relación entre el supuesto factor causal y el efecto estudiado. Para esto hay que buscar estudios epidemiológicos (Cohortes o Caso - Control) que indiquen el riesgo significativo (Riesgo Relativo o Razón de Momios). 2. Constancia o Consistencia: Consiste en conocer si la relación entre las dos variables, a las que investigamos una posible relación causa-efecto, ha sido confirmada por más de un estudio, en poblaciones y circunstancias distintas por autores diferentes. 3. Especificidad: Es más fácil aceptar una relación causa-efecto cuando para un efecto sólo se plantea una sola etiología, que cuando para un determinado efecto se han propuesto múltiples causas. En este caso lo apropiado sería hablar de Especificidad de la causa. 4. Temporalidad: Se trata de asegurar que el factor de riesgo ha aparecido antes que el supuesto efecto. Puede ser difícil de demostrar cuando no se puede asegurar si la presunta causa apareció con anterioridad al presunto efecto. (Equivale a la cronología de Simonin) 5. Relación dosis-respuesta: Denominada “gradiente biológico”, La frecuencia de la enfermedad aumenta con la dosis o el nivel de exposición. (Equivale a la Intensidad de Simonin). Sin embargo, hay casos en que el gradiente biológico no se cumple (en una reacción alérgica). 6. Plausibilidad biológica: El contexto biológico existente debe explicar lógicamente la etiología por la cual una causa produce un efecto a la salud. Esta característica viene limitada por los conocimientos científicos que se tengan al respecto en el momento del estudio. 7. Coherencia: la interpretación de causas y efectos no puede entrar en contradicción con el comportamiento propio de la enfermedad o lesión. Este criterio combina aspectos de consistencia y plausibilidad biológica (Corresponde a la evolución de Simonin) 8. Experimentación: Es un criterio deseable de alta validez. Se trata de reproducir experimentalmente la asociación causa-efecto, o incidir en la causa para alterar el efecto cuando no sea posible o no se considere ética otra modalidad de experimentación. 9. Analogía: Se fundamenta en relaciones de causa-efecto establecidas, con base a las cuales si un factor de riesgo produce un efecto a la salud, otro con características similares debiera producir el mismo impacto a la salud. NOTA: Bradford Hill no considera el criterio de topografía introducido por Simonin, aunque no es aplicable en todos los casos. Por ejemplo, en cuando tratamos de encontrar la lesión topográfica que provoca la anorexia nerviosa es un esfuerzo inútil.
Pág. 8
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
FORMULACIÓN DEL PROBLEMA
Se trata de sintetizar la cuestión proyectada a investigar, generalmente a través de un interrogante. Los problemas de Investigación se formulan con los 5 componentes a continuación:
VARIABLES: Debe mencionarse al menos la variable de estudio; pueden también mencionarse todas las variables involucradas; o cuando son las variables son muy numerosas suele usarse términos que resuman de manera lógica un grupo de variables.
UNIDADES DE ESTUDIO: Unidades de observación, unidades experimentales, unidades de análisis. Reciben distintos nombres según el diseño de la investigación; y deben mencionarse, aunque a veces su presencia en el enunciado resulta implícita.
DISEÑO DEL ESTUDIO: Propósito estadístico, Especificidad, etc. Es muy variable de acuerdo a la investigación; es importante utilizar términos que den por aludido el diseño de la investigación, el nivel investigativo, el tipo de estudio, etc.
UBICACIÓN ESPACIAL: Es ineludible cuando se tratan de estudios descriptivos y se encuentra relacionado con el tamaño de la muestra; siendo que los fenómenos varían de un lugar a otro; se debe especificar sobre que población se realizará la inferencia estadística.
UBICACIÓN TEMPORAL: Al igual que en el criterio espacial, se requiere especificarlo cuando el fenómeno varía según el tiempo. En los estudios descriptivos sobre poblaciones
infinitas
o
desconocidas
relacionado con el muestreo accidental.
habitualmente
se
encuentra
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
HIPÓTESIS METODOLÓGICAS
Definición: Son conjeturas que plantea el investigador;
afirmaciones aun no demostradas y que
nacen de la experiencia (David Hume: empirismo) o de la deducción luego del análisis de los antecedentes investigativos (René Descartes: racionalismo). Deben referirse a una situación
real, en
términos comprensibles,
precisos,
concretos
y deben
estar
relacionadas con técnicas disponibles para probarlas.
Estructura: Fundamento: Es lo que nos lleva a sostener la hipótesis planteada. Las hipótesis relacionales carecen de fundamento porque nacen de la subjetividad de una observación; mientras
que
las
hipótesis
explicativas
se
fundamentan
en
los
antecedentes
hipótesis
del
investigador;
investigativos. Deducción:
Es
la
hipótesis
misma,
denominada
estadísticamente es la hipótesis alterna y se debe someter a contraste. Cuando se la plantea en forma de interrogante es la que da respuesta al enunciado.
Hipótesis según el nivel Investigativo: Descriptiva: Los estudios descriptivos no suelen contener hipótesis, así como tampoco los
estudios exploratorios; porque no se puede presuponer sobre algo que apenas se
comienza a conocer. En estos casos lo que si procede, es trabajar con objetivos descriptivos debidamente declarados. Su función es precisamente generar hipótesis. Relacional: Las hipótesis relacionales o empíricas son afirmaciones respecto a las relaciones entre dos o más variables sin fundamento, porque nacen de la observación y la experiencia, siempre deben estar sujetas a comprobación empírica. Solamente buscan concordancia entre hechos y generan la necesidad de plantear hipótesis explicativas. Explicativa: Las hipótesis explicativas o racionales son consideradas como explicaciones tentativas respecto al problema planteado. Cumple su función sólo si está relacionada con el conocimiento existente; nacen del razonamiento por analogía (Bradford Hill). Sin antecedentes investigativos no es posible plantear hipótesis explicativas.
Pág. 10
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
HIPÓTESIS ESTADÍSTICAS (De trabajo)
Ho: Hipótesis Nulas: Es la hipótesis de trabajo. Niegan lo que afirman las hipótesis de investigación y existen tantas hipótesis nulas como hipótesis de investigación. Es a la Nula a la que se le rechaza o no se le rechaza: Si el p-valor es menor a 0.05; rechazamos Ho por lo tanto concluimos en que hipótesis alterna es verdadera. Si el p-valor no es menor a 0.05; no rechazamos Ho; sin embargo esto no significa que debemos aceptarla; sino que, simplemente no hemos podido rechazarla. H1: Hipótesis Alternas: Es la hipótesis del investigador. Esta hipótesis se da por verdadera cuando rechazamos la hipótesis de trabajo (Ho) o cuando por alguna razón no podemos aceptar la nula. En el ritual de la significancia, procedemos a establecer las hipótesis estadísticas comenzando por al del investigador (H1) y luego la Nula (Ho); para proceder a trabajar con la Nula. El investigador procede a rechazar la Nula (Ho); para quedarse con la Alterna (H1), que es su planteamiento original; siendo que puede cometer un, entonces la estadística consiste en calcular ese error al tomar tal decisión. Ese es el p-valor
Hipótesis estadísticas De estimación: Del valor de una o varias variables que se van a observar en un contexto. Señalan la presencia de cierto hecho o fenómeno. De correlación: El cambio de una variable va acompañado de un cambio en otra correspondiente. Puede ser una correlación simple o múltiple. El orden en que se coloquen las variables no es importante, no hay una relación de causa-efecto; por lo mismo, no se habla de variables dependientes e independientes. De Diferencias: Dirigidas a comparar grupos y puede ser simple si no determina a cuál grupo favorece la diferencia o direccional en el caso contrario. Pueden ser parte de estudios relacionales si se limitan a establecer la diferencia, pero si además pretenden explicar el por qué de la diferencia, son hipótesis de estudios explicativos. De Causalidad: Buscan demostrar la relación de causalidad entre la variable independiente y dependiente; teniendo en cuenta que la existencia de una correlación no necesariamente establece una relación de causalidad; no se puede plantear una de estas hipótesis si no se ha realizado el control metodológico; caso contrario se debe realizar el control estadístico y plantearse una hipótesis con variables intervinientes.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
OBJETIVO ESTADÍSTICO
Uno de los criterios más importantes a la hora de escoger el estadístico de prueba, se encuentra intrínsecamente relacionado al nivel investigativo; en esta pastilla se ha omitido intencionalmente el objetivo estadístico comparar por ser el mas usado y encontrarse en todos los niveles merece una mención aparte.
1.
A nivel descriptivo
Estimar: Usado frecuentemente para la estimación puntual de un parámetro y los intervalos de confianza del mismo.
Determinar. Cuando buscamos
en obtener el resultado de una variable
subyacente o constructo y utilizamos un instrumento documental.
Describir: Para las variables que no son de estudio y que no involucra la utilización de instrumentos pues se tratan de variables unidimensionales o directas.
2.
A nivel relacional
Asociar: Plantea que dos sucesos ocurren de manera simultánea en repetidas ocasiones y que tal concurrencia no puede atribuirse al azar.
Concordar: Sucesos concurrentes que corresponden a diferentes observadores o al mismo observador pero con diferentes instrumentos.
Correlacionar: Plantea que en un mismo individuo las unidades de una de sus variables se correlaciona con otra diferente.
3.
A nivel explicativo
Evidenciar:
Propio
de
los
estudios
observacionales
donde
el
análisis
estratificado busca descartar asociaciones aleatorias, casuales o espurias.
Demostrar: Cuando el origen de los datos corresponde a un experimento, pretendemos demostrar algo que hemos evidenciado observacionalmente.
Probar: Luego de haber demostrado mediante un estudio experimental se tiene que repetir para probar consistencia o coherencia (Bradford Hill 1965)
4.
A nivel predictivo
Predecir: Calcular la probabilidad de ocurrencia de un suceso en una serie de eventos por consecuencia la variable a predecir es dicotómica.
Pronosticar: Calcular la probabilidad de ocurrencia de un suceso en función al tiempo por consecuencia la variable pronosticada es numérica.
Preveer: Calcular la probabilidad de necesitar, disponer o preparar medios contra futuras contingencias.
Pág. 12
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
RITUAL DE LA SIGNIFICANCIA ESTADÍSTICA 1.
Formulación de Hipótesis
Consiste en traducir la hipótesis metodológica en una hipótesis estadística de acuerdo al siguiente sistema: Ho: Hipótesis nula ó hipótesis de trabajo H1: Hipótesis alterna ó hipótesis del investigador El primer paso es colocar la hipótesis del investigador como Hipótesis Alterna (H1) y formular la Hipótesis Nula (Ho) que viene a ser la negación de la alterna. Se precisa este artificio porque es a la Hipótesis Nula a la que se le somete a contraste. 2.
Establecer el nivel de significancia.
El nivel de significancia denotado por la letra griega alfa es la probabilidad de rechazar la hipótesis nula cuando es verdadera a lo cual se le denomina error de tipo I, Según Fisher, el nivel de significación estadística equivale a la magnitud del error que se está dispuesto a correr de rechazar una hipótesis nula verdadera. Para la mayoría de los propósitos, el nivel de significación previamente establecido suele ser de 0.05. 3.
Elección de la prueba estadística.
El estadístico de prueba elegido está intrínsecamente relacionado con el objetivo estadístico correspondiente para su nivel investigativo; para esto debemos considerar la naturaleza de las variables y el comportamiento de los datos que corresponde a su distribución para los de naturaleza cuantitativa y las frecuencias esperadas para los de naturaleza cualitativa. 4.
Toma de la decisión
Luego de desarrollar la prueba estadística elegida se toma una decisión en función a la regla previamente establecida según las que
se acepta o se rechaza la hipótesis nula
para lo cual es imprescindible determinar el Valor critico, que es un número que divide la región de aceptación y la región de rechazo, según el valor de la probabilidad que se haya adoptado como nivel de significación estadística. 5.
Interpretación del p-valor.
Este último paso en el ritual de la significancia estadística no fue planteado originalmente por Fisher, pero cobra vital importancia con la aparición de los software estadísticos que nos calculan directamente el p-valor, el cual cuantifica el error tipo I y nos ayuda a tomar una decisión de rechazo a la hipótesis nula (Ho) cuando es menor al nivel de significancia y de no rechazo cuando su valor es mayor al alfa planteado.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
NIVEL DE SIGNIFICANCIA Al plantear un estudio sobre una población, idealmente debemos estudiar a todos los individuos que la conforman; pero no siempre podemos acceder a todos, entonces tenemos que escoger una muestra; sin embargo los resultados obtenidos de esta manera nunca serán exactamente iguales, a los que se obtendrían de estudiar a toda la población; es decir, siempre va a haber un margen de error.
Nivel de Significancia. Antes de realizar el estudio debemos plantearnos; que proporción de error estamos dispuestos a aceptar para dar por válido nuestro. El error es el objetivo principal del estudio. El análisis estadístico consiste en calcular la probabilidad de cometer este error y esperamos que sea menor al planteado preliminarmente como nivel significancia.
Nivel de confianza. Es la confianza que debemos alcanzar para generalizar el resultado de una muestra hacia toda la población. Es el complemento del nivel de significancia; es la confianza que tenemos, de que la conclusión a la que hemos llegado es cierta. Una probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es cercano a lo real y no debida al azar
Niveles convenidos:
a) α = 5%. Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza. b) α = 1%. Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza.
Definición de términos.
El error tipo I: Ocurre cuando afirmamos la hipótesis del investigador, siendo que es falsa. Por lo tanto, es un juicio de valor equivocado.
El p-valor: Es la probabilidad de equivocarse al aceptar nuestra hipótesis del investigador como verdadera; es decir la probabilidad de cometer un error tipo I.
El nivel de significancia: Es la máxima probabilidad de error que estamos dispuestos aceptar para dar como válida nuestra hipótesis del investigador.
Pág. 14
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
OBJETIVO ESTADÍSTICO NIVEL INVESTIGATIVO RELACIONAL: VAR CATEGÓRICA 1.
COMPARAR (Grupos): Es el objetivo estadístico más básico del análisis bivariado; aunque algunos autores piensan que es univariado, porque habitualmente involucra un solo evento aleatorio (diseños ecológicos), donde los grupos se construyen previamente a la ejecución del estudio; Sin embargo, su análisis involucra a dos variables y por ello corresponde al nivel investigativo relacional. Su finalidad es identificar las diferencias entre los grupos participantes. La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Homogeneidad. Ho: Las proporciones de los grupos no son diferentes. H1: Las proporciones de los grupos son diferentes.
2.
COMPARAR (Antes-Después): Es la comparación de un mismo grupo antes y después de una intervención o de un acontecimiento; la idea de hacer dos medidas sobre el mismo grupo, es verificar los cambios producidos entre una medida y otra; donde las variaciones pueden adjudicarse a la intervención o al periodo de seguimiento; por ello corresponden a estudios longitudinales. Estas comparaciones siempre son de individuo a individuo. La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Mc Nemar. Ho: No existe diferencia entre las dos medidas. H1: Existe diferencia entre las dos medidas.
3.
ASOCIAR (Categorías): Solamente la comparación de una variable dicotómica en dos grupos nos puede llevar a la asociación; y aunque se puede identificar en las tablas 2 x 2, debemos hacer una medida asociación. Para asociar hay que definir los factores de interés en ambas variables; y es que habitualmente la asociación involucra dos eventos aleatorios. Desde el punto de vista epidemiológico tenemos dos medidas de asociación relevantes: Riesgo Relativo y el Odds Ratio. La prueba de hipótesis se realiza con el estadístico: Chi cuadrado de Independencia. Ho: Existe independencia entre los dos eventos (variables). H1: Existe dependencia entre los dos eventos (variables).
4.
CONCORDAR: Es una medida de acuerdo entre dos observaciones donde el requisito fundamental es que se trata de un solo grupo y los resultados de la observación tienen las mismas opciones. Tenemos dos casos frecuentes: Cuando las observaciones corresponde a diferentes observadores y cuando las observaciones corresponden a diferentes instrumentos. En este caso el estadístico, es también un índice de concordancia. La prueba de hipótesis se realiza con el estadístico: Índice Kappa de Cohen. Ho: No existe concordancia entre las dos observaciones. H1: Existe concordancia entre las dos observaciones.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
OBJETIVO ESTADÍSTICO NIVEL INVESTIGATIVO RELACIONAL: VAR NUMÉRICA 1.
COMPARAR (Grupos): Su finalidad es identificar las diferencias entre los grupos participantes; se puede comparar dos o más grupos y habitualmente estos grupos se construyen en la etapa de planificación del estudio. La comparación inicial es a dos colas; pero debe complementarse con un test de una sola cola. Cuando se comparan mas de dos grupos, debe realizarse una prueba post Hoc, con la finalidad de detectarse diferencias entre cada uno de los grupos. La prueba de hipótesis se realiza con el estadístico: t de Student para muestras independientes. Ho: Los promedios de los grupos no son diferentes. H1: Los promedios de los grupos son diferentes.
2.
COMPARAR
(Antes-Después):
Siempre
corresponde
a
estudios
individuales,
es
la
comparación de un mismo grupo antes y después de una intervención o de un acontecimiento; la idea de hacer dos medidas sobre el mismo grupo, es detectar cambios entre una medida y otra; donde las variaciones pueden adjudicarse a la intervención o al periodo de seguimiento; por ello corresponden a estudios longitudinales. La hipótesis habitualmente es de una sola cola. La prueba de hipótesis se realiza con el estadístico: t de Student para muestras relacionadas. Ho: No existe variación entre las medidas antes y después de la intervención. H1: Existe variación entre las medidas antes y después de la intervención. 3.
CORRELACIONAR (Unidades): Se puede correlacionar las unidades de dos variables, incluso de diferente dimensión, para ello hay que definir las unidades en ambas variables; que habitualmente esta involucra dos eventos aleatorios. La correlación puede significar el primer paso para la asociación, muy útil cuando se realiza minería de datos. Ejm.: Correlacionar los niveles séricos de sodio con los valores de presión arterial en un grupo de pacientes hospitalizados. La prueba de hipótesis se realiza con el estadístico: Correlación R de Pearson. Ho: Existe independencia entre las dos variables. H1: Existe dependencia entre las dos variables.
4.
CORRELACIONAR (Como valor predictivo): Aquí se tiene por descontado la presencia de correlación; por lo que su fin es medir el grado de correlación. Desde el punto de vista de la evaluación de pruebas diagnósticas se utiliza la correlación para evaluar el valor predictivo de una variable sobre la otra. Ejm. Hallar el valor predictivo del ponderado fetal recién nacidos a término. En general para la validación de instrumentos se puede utilizar para calcular el Alfa de Cronbach: Correlación Ítem-Total La prueba estadística es el Índice Correlación R de Pearson ó el R Ho: No existe correlación entre las dos medidas. H1: Existe correlación entre las dos medidas.
2
Pág. 16
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
OBJETIVO COMPARATIVO
1.
EXPLORATORIO. Aquí agrupamos a las comparaciones sin métodos estadísticos, siendo que la investigación cualitativa no hace uso de las herramientas estadísticas, el principal diseño encontrado aquí son las comparaciones múltiples enmarcadas en los diseños comunitarios o ecológicos. Como ejemplo podemos mencionar la comparación de las costumbres a la hora del parto en la Región Quechua y Aymara. Comparación por juicio de expertos en la validación cualitativa de un instrumento. La comparación cualitativa es una opinión.
2.
DESCRIPTIVO. Las comparaciones descriptivas ocurren cuando evaluamos dos poblaciones en los estudios comunitarios o ecológicos, en este caso no se requiere aplicar pruebas estadísticas puesto que precisamente estamos estudiando a la población y no hay inferencia estadística. La comparación del rendimiento académico de dos estudiantes al momento de la graduación tampoco requiere de pruebas de hipótesis sino solamente de ver quién es el que tiene el mayor promedio. El objetivo estadístico describir según las variables epidemiológicas es el primer punto de partida para la verdadera comparación.
3.
RELACIONAL. Recordemos que el contraste de independencia entre dos variables responde a tres modelos matemáticos: modelo con los totales marginales de ambos factores fijos (modelo I), modelo con los totales marginales de uno de los factores fijos (modelo II), y el modelo con el total muestral fijo (modelo III); pues bien el objetivo comparativo a nivel bivariado (nivel relacional) corresponde al modelo II con un factor fijo y uno aleatorio. Dependiendo de la naturaleza de la variable se elegirá un determinado estadístico. La comparación puede ser de grupos independientes o de muestras relacionadas.
4.
EXPLICATIVO. La finalidad de este nivel es descartar asociaciones aleatorias, casuales o espurias sobre todo cuando hacemos análisis comparativo estratificado cuando queremos realizar el control estadístico en un estudio observacional, ésta es la función del test de Mantel-Haenszel. A nivel experimental podemos plantear objetivos comparativos de grupo aleatorizados; como por ejemplo comparar el efecto sobre la variable efecto en el grupo experimental y el grupo blanco, hablando de estudios epidemiológicos. Dentro de los experimentos verdaderos la factorización de las causas también corresponde al objetivo comparativo
5.
PREDICTIVO: Podemos comparar el valor predictivo de dos procedimientos diagnósticos o de dos formas de evaluar una variable predictiva; por ejemplo podemos comparar la eficiencia diagnóstica de dos métodos de detección de una enfermedad. En otro momento podemos comparar el pronóstico de la enfermedad o del tiempo de supervivencia de dos tratamientos en pacientes con cáncer. Incluso hay técnicas comparativas para el análisis de supervivencia de Kaplan-Meier.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
TÉCNICAS DE RECOLECCIÓN DE DATOS No es lo mismo que registro de datos 1.
Documentación Constituye la técnica de recolección de datos más básica y a la vez la más inexacta; sin embargo en ocasiones es la única disponible para recopilar la información; Habitualmente la información fue recolectada con fines distintos al estudio en curso; por ello los estudios realizados con esta técnica siempre son retrospectivos. Ejm. Análisis de contenido
2.
Observación: La observación científica se caracteriza por ser sistemática, controlada y con mecanismos destinados a evitar errores de subjetividad, confusiones, etc. Es una observación simple cuando no perturba la acción o situación que se está investigando. Por otro lado la observación participante puede ser natural cuando el observador pertenece al conjunto humano que investiga y artificial, cuando la integración del observador al grupo se hace con el objeto de desarrollar un trabajo de investigación. La experimentación es una observación participante artificial.
3.
Entrevista Consiste en una interacción entre dos personas, una de las cuales -el investigadorformula determinadas preguntas relativas al tema en investigación, mientras la otra -el investigado- proporciona la información que le es solicitada. La entrevista puede ser estructuradas y no estructurada; en la investigación cuantitativa se apoya en un cuestionario al cual se le denomina heteroadministrado.
4.
Encuesta La palabra "encuesta" se usa más frecuentemente para describir un método de obtener información de una muestra de individuos. Esta "muestra" es usualmente sólo una fracción de la población bajo estudio. Cuando se aplica al total de la población se llama censo y siempre es parametrada. Se apoya en un cuestionario que casi siempre es autoadministrado. La ventaja principal de tal procedimiento radica en la gran economía de tiempo y personal que implica, ya que los cuestionarios pueden enviarse por correo, dejarse en algún lugar apropiado, o pueden administrarse a grupos reunidos al efecto.
5.
Psicometría Los test psicológicos emplean una gran variedad de técnicas específicas, que se combinan según los objetivos deseados. Una gran proporción de ellos acude a la formulación de preguntas ya anotadas en algún cuestionario apropiado, que es el test mismo, y que se autoadministra.
Pág. 18
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
INSTRUMENTOS DE MEDICIÓN 1.
Instrumentos lógicos o Documentales: Subjetivos Cuestionario. Los términos cuestionarios e inventarios se suelen utilizar como sinónimos a pesar de que hay diferencias marcadas en la forma de su presentación. Un cuestionario supone un conjunto de preguntas que el sujeto tiene que responder a fin de evaluar alguna capacidad, generalmente cognitiva, lo cual debe ser calificado por el evaluador. Como ejemplo podemos citar a los exámenes para evaluar rendimiento académico Escalas. Los evaluados indican su acuerdo o desacuerdo con una serie de afirmaciones sobre el objeto en estudio. Por lo general, arrojan una calificación total que indica la dirección e intensidad de la actitud del individuo hacia una categoría de estímulos, por lo que las escalas requieren de una respuesta ordinal o de intervalo. Se han elaborado procedimientos especiales para alcanzar la unidimensionalidad o homogeneidad de los reactivos, la igualdad de las distancias entre las unidades de la escala y la comparabilidad de las calificaciones. El ejemplo más básico es la escala visual análoga. Inventario. Conjunto de frases o palabras a las que el sujeto tiene que responder eligiendo o marcando su posición ante ellas (por ejemplo, al ítem “Me gustan las revistas de mecánica, decoración o computadoras”, notemos que ninguna respuesta es calificada como correcta e incorrecta. Los inventarios cuentan con distintas posibilidades de respuesta Por ejemplo un test de inteligencias múltiples puede indicarnos inteligencia: Lingüística, Lógicomatemática, Musical, Naturalista, etc.
2.
Mecánicos: Objetivos Las técnicas objetivas hacen referencia a aquellas tareas o procedimientos estructurados que recogen las respuestas de un participante, respuestas que no pueden ser modificadas en la dirección deseada y cuya puntuación es independiente de la persona que evalúa. Las medidas que realizan mediante este método son por ejemplo las mediciones fisiológicas. Los instrumentos de evaluación cognitiva son aquellos instrumentos o aparatos que sirven para evaluar características cognitivas que se consideran observables (por ejemplo, el tiempo de reacción). La imagen más habitual de estas técnicas es la de una persona sentada frente a la pantalla de un ordenador que espera con atención la aparición de una serie de estímulos para apretar rápidamente un botón o una palanca.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
SESGOS DE SELECCIÓN
1.
Sesgo de prevalencia o incidencia (de Neymann): Se produce cuando la condición en estudio determina pérdida prematura por fallecimiento de los sujetos afectados por ella. La exclusión de los pacientes que fallecen determina este tipo de sesgo. Por ejemplo la duración del tratamiento del cáncer en nuestro medio es corto porque se diagnostican en estadios avanzados.
2.
Sesgo de admisión (de Berkson). En un estudio relacional ocurre cuando hay una mala selección del grupo de estudio y/o control. Ejm. cuando asociamos el hábito de fumar al cáncer broncogénico; los pacientes con diagnóstico de Ca ya han dejado de fumar; por lo que se observará menor frecuencia de fumadores en pacientes con este tipo de cáncer.
3.
Sesgo de no respuesta o efecto del voluntario. El grado de interés o motivación que pueda tener un individuo que participa voluntariamente en una investigación puede diferir sensiblemente en relación con otros sujetos. Igualmente, la negativa de algunos sujetos para ser incluidos en un estudio puede estar dada por motivaciones sistemáticas experimentadas por ellos.
4.
Sesgo de pertenencia (membresía) Se produce cuando entre los sujetos evaluados se presentan subgrupos de sujetos que comparten algún atributo en particular, relacionado positiva o negativamente con la variable en estudio. Ejemplo: Nivel de conocimientos sobre signos de alarma en las gestantes debe excluir a las gestantes que son profesionales de la salud.
5.
Sesgo del procedimiento de selección Puede observarse en diseños de investigación experimentales (ensayos clínicos controlados), en los cuales no se respeta el principio de aleatoriedad en la asignación a los grupos de experimentación y de estudio. En los preexperimentos
la
administración
del
medicamento
responde
necesidades terapéuticas del paciente y no a la del investigador.
a
las
Pág. 20
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
SESGOS DE MEDICIÓN 1.
Sesgo de procedimientos Ocasionalmente el grupo que presenta la variable dependiente resulta ser más interesante para el investigador que el grupo que participa como control. Por esta circunstancia, en el procedimiento de observación suele ser mas detenido. En el caso de un estudio en el que exista intervención, el sujeto del grupo experimental puede verse beneficiado con una mayor acuciosidad en la observación.
2.
Sesgo de memoria o de información Frecuente de observar en estudios retrospectivos, en los cuales se pregunta por antecedente de exposición a determinadas circunstancias en diferentes períodos de la vida, existiendo la posibilidad de olvido. Por ejemplo, exposiciones inadvertidas a diversos factores y que pueden afectar la medición ya sea por su omisión absoluta o en la determinación de niveles de exposición.
3.
Sesgo por falta de sensibilidad de un instrumento. Si no se cuenta con adecuados métodos de recolección de la información, es posible que la sensibilidad de los instrumentos empleados en tales mediciones carezca de la sensibilidad necesaria para poder detectar la presencia de la variable en estudio. Una consecuencia es que encontremos una frecuencia de la enfermedad inferior a la real.
4.
Sesgo de detección Su ocurrencia se explica por la introducción de metodologías diagnósticas diferentes a las inicialmente utilizadas al comienzo de un estudio. Es conocido que no existe coincidencia absoluta entre dos instrumentos de medición; por ello los estudios deben realizarse con un solo instrumento y un solo observador.
5.
Sesgo de adaptación En los estudios de intervención (experimentales), a veces los cuales individuos asignados inicialmente a un grupo deciden migrar de grupo por preferir un tipo de intervención por sobre otro. En un ensayo clínico controlado la ocurrencia de este tipo de sesgo se neutraliza mediante la asignación aleatoria de los sujetos y por la presencia del llamado "doble ciego”.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
EL COEFICIENTE DE CORRELACION La correlación es una prueba de hipótesis que debe ser sometida a contraste y el coeficiente de correlación cuantifica la correlación entre dos variables, cuando ésta existe. El coeficiente r de Pearson, por ser una prueba paramétrica requiere de variables numéricas con distribución normal; mientras que el coeficiente de correlación no paramétrica rho de Spearman acepta variables de libre distribución e incluso ordinales. INTERPRETACIÓN El coeficiente correlación varía entre 0 y 1, pudiendo ser positivo o negativo. El valor numérico indica la magnitud de la correlación. Sin correlación 0.0
Correlación mínima
0.2
0.4
Correlación baja
0.6
Correlación moderada
0.8
Correlación buena
Correlación perfecta 1.0
Correlación muy buena
El signo indica la dirección de la correlación Correlación directa (+) Signo positivo “a mayor X, mayor Y” ó “a menor X, menor Y”
Correlación inversa (-) Signo negativo “a mayor X, menor Y” ó “a menor X, mayor Y”
Significancia estadística Solo interpretamos el coeficiente si “p” es menor de significancia). Se puede indicar la significancia así: r = 0.48 (p<0.05).
0.05, (Nivel de
Coeficiente de determinación Cuando el coeficiente se eleva al cuadrado (r2), asume varias interpretaciones Por ejemplo. La correlación entre “El ponderado fetal” y “El Peso al nacer” es de 0.80. r = 0.80 2
Pág. 22
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
VALIDEZ DE UN ESTUDIO Desde la revolución científica ocurrida en el renacimiento en el siglo XV hasta nuestros días, el hombre se ha valido de la investigación científica para identificar las causas de las enfermedades o las mejores formas de tratarlas. Este elemento es parte integral del paradigma conocido como la Medicina Basada en la Evidencia. Este paradigma postula que las decisiones médicas deben basarse en la mejor evidencia científica disponible, adaptada al caso individual del paciente mediante la experiencia clínica.
3.
La validez interna Es la credibilidad de sus resultados, o dicho de otra manera la capacidad de demostrar o refutar la hipótesis propuesta. Es máxima cuando el estudio carece de sesgos. En términos generales, los sesgos que afectan la validez interna surgen siempre que los grupos estudiados difieren en más características que la exposición. Por ejemplo, si se está estudiando la frecuencia de infarto de miocardio en un grupo de sujetos obesos o de peso normal, cualquier diferencia en la edad de los grupos podría afectar la relación entre la obesidad y la ocurrencia de infarto de miocardio. Asimismo, existe sesgo siempre que los grupos de sujetos no son evaluados de la misma manera.
4.
La validez externa La aplicabilidad de los resultados del estudio se relaciona con la validez externa del estudio. En muchas ocasiones el universo e incluso el marco muestral es demasiado grande como para ser estudiado e incluso muestreado; es estos casos se realiza el estudio en una porción deliberada de la población; teniendo en cuenta que el conglomerado seleccionado es lo suficientemente homogéneo con el resto de la población; los resultados encontrados en este grupo podrán ser extrapolados a la población objeto del estudio. Por ejemplo si tratamos de conocer la satisfacción de la atención en los pacientes de un servicio de salud; bastará con estudiar a los pacientes que acudan durante un mes a dicho servicio; otro ejemplo más claro es cuando tomamos una muestra de sangre con la finalidad de conocer concentración de gases y asumimos que lo encontrado en 10 mililitros corresponde a los 5 litros de sistema circulatorio.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
CONTROL DE UN ESTUDIO
6.
CONTROL METODOLÓGICO a.
Sesgo de selección
Se produce cuando la condición en estudio determina pérdida prematura por fallecimiento de los sujetos afectados por ella. La exclusión de los pacientes que fallecen determina este tipo de sesgo. •
Criterios de inclusión
•
Criterios de exclusión
b.
Sesgo de medición
Por ejemplo la duración del tratamiento del cáncer en nuestro medio es corto porque se diagnostican en estadios avanzados.
7.
•
Validación de instrumentos
•
Calibración de instrumentos
CONTROL ESTADÍSTICO a.
Análisis estratificado
Se produce cuando la condición en estudio determina pérdida prematura por fallecimiento de los sujetos afectados por ella. La exclusión de los pacientes que fallecen determina este tipo de sesgo. •
Categóricos: Chi cuadrado de Mantel-Haenszel
•
Numéricas: ANOVA Factorial
b.
Análisis multivariado
Por ejemplo la duración del tratamiento del cáncer en nuestro medio es corto porque se diagnostican en estadios avanzados. •
Categóricos: Regresión logística
•
Numéricas: Regresión lineal múltiple
Pág. 24
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Medidas de resumen para variables numéricas MEDIDAS DE TENDENCIA CENTRAL
Media: Media aritmética, es la que se obtiene sumando los datos y dividiéndolos por el número de ellos. Se aplica por ejemplo para resumir el número de pacientes promedio que se atiende en un turno. Otro ejemplo, es el número promedio de controles prenatales que tiene una gestante.
Mediana: Corresponde al percentil 50%. Es decir, la mediana Divide a la población exactamente en dos. Por ejemplo el número mediana de hijos en el centro de salud “X” es dos hijos. Otro ejemplo es el número medina de atenciones por paciente en un consultorio.
Moda: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribución unimodal tiene una sola moda y una distribución bimodal tiene dos. Útil como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirúrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirúrgico. MEDIDAS DE DISPERSIÓN Desviación Estándar: Llamada también desviación típica; Es una medida que informa sobre la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.
La varianza: Es el valor de la desviación estándar al cuadrado; su utilidad radica en que su valor es requerido para todos los procedimientos estadístico.
Error típico: Llamado también error estándar de la media. Se refiere a una medida de variabilidad de la media; sirve para calcular cuan dispersa estaría la media de realizar un nuevo cálculo.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
MEDIDAS DE POSICIÓN Y DE FORMA MEDIDAS DE POSICIÓN: Cuantiles
Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%.
Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles. Se denotan como: Q1 o primer cuartil, Q2 segundo cuartil (la mediana) y Q3 tercer cuartil.
Deciles: Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. MEDIDAS DE FORMA Asimetría: una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden. Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson: Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.
Asimetría Derecha (+)
Simétrica (0)
Asimetría Izquierda (-)
Apuntamiento o Curtosis: la curtosis es una medida de la forma que busca cuantificar la mayor o menor concentración de frecuencias alrededor de la media y en la zona central de la distribución. Se mide con el coeficiente de apuntamiento o curtosis: Su valor es cero cuando la distribución es mesocúrtica, positivo cuando es leptocúrtica y negativo cuando es platicúrtica
Leptocúrtica (+)
Mesocurtica (0)
Platicurtica (-)
Pág. 26
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
GRÁFICAS UNIVARIABLES 1. Para variables categóricas a. Diagrama de sectores Se toma un círculo y se divide en tantos sectores como categorías tenga nuestra variable, siendo el arco del círculo proporcional a las frecuencias absolutas (también lo podemos hacer con las frecuencias relativas o porcentajes) Es ideal para variables dicotómicas o politómicas de menos cuatro o menos categorías. b. Gráfico de barras Es
una
representación
bidimensional
con
las
categorías dispuestas paralelamente de manera que la extensión de cada barra es proporcional a la magnitud que se quiere representar. Es ideal para variables politómicas de o incluso para variables de categorías no excluyentes.
2. Para variables numéricas a. Histograma Se utiliza cuando se estudia una variable continua, como la edad o la talla y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un gráfico de barras. b. Diagrama de Caja y Bigotes Gráfico basado en cuartiles, compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes". Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
ERROR TIPO I Y II Al establecer un criterio de decisión sobre la hipótesis nula, el investigador puede ponderar los errores que podría cometer en su decisión sobre la hipótesis nula. Una primer forma de error (se conoce como el error tipo I) consiste en rechazar una hipótesis nula verdadera, es decir, descartar el azar como explicación cuando los resultados podrían explicarse razonablemente con base en el mismo. Este es el error que comete el investigador que ve más lo que hay en los datos; es decir, el investigador concluye en que existe una relación real o verdadera entre las variables independiente y dependiente de la investigación, cuando en realidad la relación observada se puede explicar razonablemente como resultado del azar. El llamado error tipo I es el error del investigador que se apresura a concluir a favor de su hipótesis de investigación. Fisher no habló de ningún otro error, pues la prueba de la hipótesis nula para él no era otra cosa que un freno a la tendencia natural de un investigador a creer que hipótesis ha sido confirmada por el simple hecho de que los resultados de la investigación siguen la misma dirección de la hipótesis. En la estrategia de Fisher, sólo hay un error posible: rechazar una hipótesis nula verdadera. Una segunda forma de error (se conoce como el error tipo II), introducida por Egon Pearson y Jerzy Neyman consiste en no rechazar una hipótesis nula falsa, es decir, no descartar el azar aun cuando éste no constituye una explicación razonable de los datos. Este es el error que comete el investigador que ve menos que lo que hay en los datos; por miedo a rechazar incorrectamente el azar, el investigador puede exponerse al riesgo de pasar por alto una relación real o verdadera entre las variables de su investigación. Fueron Pearson y Neyman los que, al introducir un segundo tipo de error, bautizaron como error tipo uno al error de que había hablado Fisher. Según Fisher, el nivel de significación estadística equivale a la magnitud del riesgo que está dispuesto a correr el investigador, de cometer el error de rechazar una hipótesis nula verdadera (el llamado error tipo I). Para la mayoría de los propósitos, el nivel de significación
previamente
establecido
suele
ser
de
0.05,
aunque
en
áreas
de
investigación más rigurosas se trabaja con un nivel de significación de 0.01. Suponiendo que se trabaja con un nivel de significación de 0.05, se rechazaría la hipótesis nula siempre que la probabilidad de explicar los resultados obtenidos en una investigación como si fueran obra del azar sea igual o menor que 0.05. En la perspectiva de Pearson y Neyman, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson y Neyman llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de "poder de una prueba estadística", el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de "tamaño del efecto" que algunos han
Pág. 28
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
POBLACIÓN Y MUESTRA
UNIDAD DE ESTUDIO Conocido también como unidad de análisis, unidad de observación, unidad experimental, o unidad de población, son cada uno de los sujetos u objetos de estudio de la población del que hay que obtener la información. POBLACION Conjunto de todos los casos o grupo de unidades (sujetos u objetos de estudio) con alguna característica común. Las poblaciones deben situarse claramente en torno a sus características de contenido, lugar y tiempo. La delimitación de la población que va ser estudiada y sobre la cual se pretende generalizar los resultados, es un paso importante en una investigación. Si se dispone de una lista de unidades o elementos de muestreo se dice que es conocida; sino se dispone de tal listado se dice que es desconocida. La medición completa de todos los elementos que constituyen la población constituye el censo, mientras que cuando no podemos acceder a ella podemos hacer el análisis de una parte de esta. MUESTRA Una muestra representativa debe tener un tamaño mínimo calculado y responder a una selección parametrada (muestreo probabilístico). Así podemos conocer la parte de una población que debe examinarse con la finalidad de hacer inferencias sobre dicha población. El muestreo otorga una probabilidad conocida de integrar la muestra a cada elemento de la población, y dicha probabilidad no es nula para ningún elemento. Unidad de muestreo: Elementos de la población que se van a estudiar. Cada unidad de estudio pertenece sólo una unidad de muestreo. PARAMETRO Es la medida estadística que describe un determinado aspecto de una población. Los parámetros más usuales en una investigaron son: La media poblacional (µ), la varianza poblacional (s). ESTADIGRAFO Es la media estadística que describe un determinado aspecto de una muestra. Así, la media muestral (x), la varianza muestral (σ), etc., son estadígrafos porque se calculan para una muestra.
“Un parámetro es una constante, mientras que un estadígrafo es una variable.”
BIOESTADISTICO.COM
ANÁLISIS DE DATOS CLÍNICOS Y EPIDEMIOLÓGICOS
MUESTREO PROBABILISTICO 1.
Muestreo aleatorio simple Denominado también muestreo equiprobabilístico, porque si se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión igual y conocida de n/N.
Ventaja: Se desarrolla en software porque se basa en la teoría estadística Desventaja: Precisa un marco muestral o listado de todas las unidades
2.
Muestreo sistemático Para determinar una muestra de tamaño n conseguimos una lista de N elementos, definimos un intervalo de salto k=N/n y elegimos un número aleatorio entre 1 y k con el que comenzamos la selección de la muestra.
Ventaja: No es necesario tener un marco muéstralo listado de unidades. Desventaja: La constante podría asociarse con el fenómeno de interés
3.
Muestreo aleatorio estratificado Como el azar no es una garantía de representatividad, aquí se pretende asegurar la representación de cada grupo en la muestra. Cuanto más homogéneos sean los estratos, más precisas resultarán las estimaciones.
Ventaja: La muestra es homogénea en función a la variable involucrada. Desventaja: Se debe conocer la distribución en la población de la variable utilizada para la estratificación.
4.
Muestreo por conglomerados Denominado también muestreo por clusters aprovecha se caracterizan porque la variación en cada grupo es menor que la variación entre grupos lo cual resulta ventajoso en los estudios comunitarios o poblacionales.
Ventaja: Muy eficiente cuando las unidades están muy dispersas Desventaja: Requiere un manejo estadístico mas complejo que el resto
Pág. 30
PROGRAMA DE APOYO A LAS SOCIEDADES CIENTÍFICA DE ESTUDIANTES DE MEDICINA (PASCEM)
VALIDACIÓN DE TEST PSICOMÉTRICOS 1.
Validez de contenido (Juicio de Expertos o validación por jueces) Un instrumento de medición debe contener representados a todos los ítems del dominio de contenido de las variables a medir. Se refiere al grado en que la medición representa al concepto medido. Es decir, que el instrumento debe contener todos los aspectos o ítems del dominio de la variable que se esta midiendo, y se construye de acuerdo con la teoría.
2.
Consistencia interna (Alfa de Cronbach) Su valor aumenta cuando las correlaciones ítem – total son altas, por ello, mejores correlaciones, dan mayor fiabilidad al instrumento. Se puede decir también que es un índice de discriminación. El coeficiente de fiabilidad es afectado por la heterogeneidad de los individuos que contestan la prueba; cuanto más heterogéneo es el grupo de encuestados, mayor es el coeficiente de fiabilidad.
3.
Validez de constructo (Rotación de Varimax) El procedimiento consiste en aplicar el instrumento a dos o más grupos y ver si discrimina. Para ello hay que contar con una estructura Factorial del cuestionario. Por ejemplo en los instrumentos para medir variables psicológicas no podemos garantizar la existencia de un constructo psicológico que subyaga y dé sentido y significado a las puntuaciones del test; por lo mismo que no tenemos una prueba patrón.
4.
Estabilidad (ANOVA) Se refiere a la confianza que se concede a los datos; requiere de un retest en condiciones similares a la primera evaluación y está relacionada con la estabilidad o constancia test-retest. Se trata de ver hasta que punto un conjunto de medidas son reproducibles en el tiempo, el grado en que las puntuaciones son estables sería el grado de fiabilidad. Por ello es sinónimo de estabilidad.
5.
Punto de corte (Curvas ROC). Habitualmente requerimos que el instrumento nos conduzca a una decisión dicotómica (positivo-negativo) para tratar o no a alguien; Se realizan trazando un diagrama en el que la ordenada es la sensibilidad y la abscisa la especificidad. En este sentido la curva ROC nos muestra en un gráfico todos los pares sensibilidad-especificidad resultantes de la variación continua de los puntos de corte en todo el rango de resultados observados. Las Curvas de Roc optimizan el punto de corte.