Esta Es Estadistica tadi dist stic icaa Inferencial Inffer In eren enci cial al Intervalos de confianza y estimación confidencial Técnicas de muestreo Contrastes de Hipótesis Prueba de Ji-Cuadrado (X²) Análisis de la varianza Noviembr Novie mbree 2010 Profa. Debbie Figueroa Bioestadistica
Profa. Debbie Figueroa
Bioestadistica
1
«la se sele lecc cció ión n de una una técn técnic icaa es esta tadí díst stic icaa apr apropia opiada da la deter determin minaa el diseño diseño experimental, la hipótesis, y los datos recogidos «son son herra herramie mient ntas as mate matemá mátic ticas as que perm pe rmit iten en al in inves esti tiga gado dorr ge gene nera raliliza zarr a una una pobl poblac ació ión n de indi indivi vidu duos os basá basánd ndos ose e en la info inform rmac ació ión n obte obteni nida da de un núme númerro limi limita tado do de participantes participantes en la la inv investigación estigación
E stadística Inferencial Objetivos de la Estadística y
y
Es el de hacer inferencias (predecir, decidir) sobre algunas características de la población con base en la información contenida en una muestra tra. Determinar la confiabilidad de la inferencia de que los fenómenos observados en la muestra ocurrirán también en la población de donde se seleccionó la muestra.
Propósito y
y
La tarea fundamental de la estadística inferencial, es hacer inferencias acerca de la población a partir de una muestra extraída de la misma. Ejemplo la relación entre fumar y el cáncer de pulmón.
Profa. Debbie Figueroa
Bioestadistica
4
Neccesid Ne Necesidades idaade dess de la Estadística y
y
y
y
Dominio de la estadística descriptiva. Técnic Técnicaa de muest muestrreo eo.. Selección del estadístico de prueba. Diferenciar entre las técnicas que son válidas para el análisis de los datos cualitativos y de los datos cuantitativos.
Técnicas de Técnicas de muestr muestreo eo y
La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.
Profa. Debbie Figueroa
Bioestadistica
6
Tipos d Tipos de eT Técnicas écnic icaas d de e Estadística Estadí Est adísti stica ca Inf Infer Inferencial erenc encial ial y
y
y
En la estadístic estadísticaa inferencia inferenciall el investiga investigador dor se encuentra con dos tipos de técnicas, las Paramétricas y las No Paramétricas. Las paramétricas: establecen una serie de supuestos acerca acerca de la naturaleza de la población de la que se extrajo la muestra de estudio. ² Las Las no paramétricas: no requieren supuestos sobre sobre las características de la población y facilitan más el análisis de datos nominales y ordinales.
Ventajas y
Las ventajas de estudiar una población a partir de sus muestras son Principalmente:
Coste reducido: Si los datos que buscamos los podemos obtener a partir de una pequeña peq ueña parte del total de la población, los gastos de recogida recogida y tratamiento de los datos serán menores. x
Por ejemplo, cuando se realizan encuestas previas a un refer´en refer´endum, dum, es m´as barato preguntar preguntar a 4,000 personas su intención de voto, que a 30,000,000; Profa. Debbie Figueroa
Bioestadistica
8
Ventajas y
Mayo Mayorr ra rapi pide dez: z:
y
Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;
Más Más posi posibil bilida idade des: s:
Para hacer cierto cier to tipo de estudios, por ejemplo el de duración de cierto tipo de bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conc co nclu lusi sion ones es sobr sobree las las de demá más. s. Profa. Debbie Figueroa
Bioestadistica
9
Problemas y
Elección de la muestra (muestreo),
muestr muestreo eo aleato aleatorio rio - en el que todos los los elementos de la población tienen la misma probabilidad de ser extraídos x x
y
sin reposición de los elementos; con reposición.
Extrapolación de las conclusiones obtenidas sobre la muestra, al resto de la poblac población ión (infe (inferrencia) encia).. Profa. Debbie Figueroa
Bioestadistica
10
Técn Té Técnicas cnic icas as Paramétricas Para Pa ramé métr tric icas as y
y
Son más potentes que las no paramétricas y por consiguiente las inferencias inferencias que se realizan son son más fiables. El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramétrico, sobre todo en investigaciones investigaciones educativas y sociales.
Técnicas No Técnicas No Paramétricas Paramétricas y
y
Son fáciles de utilizar y algunas son tan pote potent ntes es como omo las las para paramé métr tric icas as.. El análisis de datos cualitativos ha generado técnicas propias, qu e actualmente constituyen toda una metodología específica que viene marcada por la propia idiosincrasia cualitativa y que toma determinadas opciones en relación a las unidades del registro de los datos y la forma de tratarlos.
La lógica de la prueba de hipótesis y
En el proceso de la estadística inferencial, hay dos tipos de hipótesis claves:
La hipótesis nula (H0), se construye artificialmente para que qu e el investigador investigador evalúe su hipótesis de investigación. Plantea que no existe relación entre entre los dos fenómenos. La hipótesis de alterna (H1), que simplemente señala la existencia de un hecho o de un evento, evento, o la la relación entre dos o más fenómenos.
Pasos para pr Pasos prob pro obar baarr hi hipó hipótesis póte tesi siss 1° Plan Plante team amie ient nto o. 2° Anticipar los eventos eventos que pueden pueden resultar resultar a partir de la observación o experimentación. 3° Especificar Especificar las condici condiciones ones bajo bajo las cuales cuales la hipótesis se puede rechazar o aceptar. 4° Realizar Realizar el el experim experimento ento y la observación observación y que se analice el evento o resultado. 5° Toma de decisión de rechazar o aceptar acepta r la hipótesis.
Pasos para verificar la hipótesis 1° Aclarar la hipótesis de de investigación investigación H1 H1 y crear cre ar la hipótesis nula H0. 2° Obtener la distribución del muestreo. 3° Selecciona Seleccionarr un nivel nivel de significan significancia cia y una una región de rechazo. rechazo. 4° Hacer la pr prueba estadísti ísticca. 5° Co Comp mpar arar ar y con concl clui uirr.
Posibilidades de la Prueba Prueb a de Hipótesis
Errores y Poder Errores y
Tipo I: Es la probabilidad de rechazar la hipótesis nula, cuando Ho es cierta. cier ta.
y
Tipo II: Es la probabilidad de no rechazar la hipótesis nula cuando H1 es cierta.
y
Esta probabilidad es comúnmente denotada por la letra , conocido también como el nivel de significancia.
Esta probabilidad es comúnmente denotada por la letra .
El poder de la prueba es definido defini do como:
1-=1-probabilidad 1-probabilidad de error tipo II Pr (rech (rechaza azarr Ho | H1 cierta) cierta)
Mues Mu Muestreo estr treo eo al alea aleatorio eato tori rio o y
Muestreo aleatorio sin reposición
Consideremos Consideremos una población E formada por N elementos. Si observamos un elemento particular par ticular,, e pert p ertence ence a E, en un muestreo mu estreo aleatorio sin reposición se da la siguiente circunstancia:
Profa. Debbie Figueroa
Bioestadistica
18
Con reposición
Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total to tal de la población. pobl ación. De esta forma un elemento puede ser extraído varias veces.
Profa. Debbie Figueroa
Bioestadistica
19
Mues Mu Muestreo estr treo eo si sist sistemático stem emát átic ico o y
Cuando los elementos de la población están ordenados ordenados en fichas o en una lista, una manera de muestrear muestrear consiste en:
Profa. Debbie Figueroa
Bioestadistica
20
Muestreo p Muestreo por po or co cong conglomerados nglo lome mera rado doss y
y
Si intentamos hacer un estudio sobre los habitantes de una ciudad, el muestreo aleatorio simple puede resultar muy costoso, ya que estudiar una muestra de tamáño n implica enviar a los encuestadores a n puntos distintos de la misma, de modo que en cada uno de ellos sólo se rea ealiliza za una una en entr tre evist vista. a. En esta situación es más económico realizar el denominado muestreo por conglomerados, que consiste en elegir aleatoriamente cierto rtos barrios dentro de la ciudad, para después elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos. Profa. Debbie Figueroa
Bioestadistica
21
Estimación y
y
y
Proceso de estimar el valor de un parámetro de la información obtenida de una muestra. Ejemplos: Una enfermera graduada gana un promedio de $32,786 anualesµ (National Assoc. of School Nurses)
y
Uno de 4 americanos hace dietaµ (Calorie Control Council)
Profa. Debbie Figueroa
Bioestadistica
22
Esti Es Estimación tima maci ción ón Confidencial Conf Co nfid iden enci cial al
Profa. Debbie Figueroa
Bioestadistica
23
Intterv In Intervalos ervaalos d de e co conf confianza nfia ianz nzaa pa par para rraa llaa m media edia ( conocida conocida o n> n>30) >30) y muestreo y
Estimado de punto
Un valor numérico específico estimado de un parámetro. El mejor estimado de punto de la media de una población (µ), es la media de la muestra (X).
Profa. Debbie Figueroa
Bioestadistica
24
Interv Intervalos rvaalos de de confianza y
Estimado de intervalo
y
Nivel de confianza
y
De un parámetro es u intervalo inter valo o un rango de valores utilizados para estimar un parámetro. El estimado puede o no contener el valor del parámetro siendo estimado. Es la probabilidad de que el estimado del intervalo contenga el parámetro parámet ro,, asumiendo asumiend o que un gran numero de muestras mue stras sean seleccionadas y que el proceso de estimación en el mismo parámetro parámet ro sea repetido.
Intervalo de confianza
Un intervalo especifico de un parámetro determinado por el uso de datos obtenidos de una muestra y utilizando un nivel de confianza especifico del estimado. estimado.
Profa. Debbie Figueroa
Bioestadistica
25
Interv Intervalos rvaalos de de confianza
Profa. Debbie Figueroa
Bioestadistica
26
Intterva In Intervalos rvallos de de co conf confianza nfiian anza za pa par para rraa llaa me med media dia ( conocida conocida o n> n>30) >30) y muestreo muestreo y
y
y
y
Para Para un inte interval rvalo o de co conf nfia ianz nzaa de 90% 90% z/2 = 1.65 Para Para un inte interval rvalo o de co conf nfia ianz nzaa de 95% 95% z/2 = 1.96 Para Para un inte interval rvalo o de co conf nfia ianz nzaa de 99% 99% z/2 = 2.58 z/2 = Err Error máximo máximo estima estimado do
Profa. Debbie Figueroa
Bioestadistica
27
Inte In Intervalo terva rvalo lo de co conf nf al 95% 95%
Profa. Debbie Figueroa
Bioestadistica
28
Ejemplo y
En una encuesta a 30 adultos se encontró que la edad media de un vehiculo primario de una persona es de 5.6 años. Asumiendo que la desviacion estandar de la poblacion es 0.8 años, encuentre el mejor punto estimado de la media de la poblacion y el 99% intervalo de confianza de la media de la poblacion.
Profa. Debbie Figueroa
Bioestadistica
29
Solución y
Dado a que la media poblacional es 5.6 años.
5.6 ² 2.58 (0.8/¥30) < µ < 5.6 + 2.58 (0.8/¥30) 5.6 ² 0.38 < µ < 5.6 ² 0.38 5.22 < µ < 5.98 5.2 < µ < 6.00 (redondeado) Uno puede estar confiado en un 99% en que la vida promedio de un vehículo primario esta entre 5.2 y 6.0 años, basado en 30 vehículos. Profa. Debbie Figueroa
Bioestadistica
30
Esti Es Estimación tima maci ción ón de dell ttamaño am añ o d de e muestra
E= z/2(/¥n) = E¥n = z/2() = ¥n = [z/2()]/E n = {[z/2()]/E }2 Profa. Debbie Figueroa
Bioestadistica
31
Ejemplo y
y
y
En los últimos ejemplos se ha estudiado la variable altura de los individuos de una población, considerando que ésta es una variable que se distribuye de modo normal o gaussiana. Para ello se tomó una muestra de 25 individuos (que podemos considerar piloto), que ofreció los siguientes resultados: Calcular el tamaño que debería tener una muestra para pa ra que se obtuviese un intervalo de confianza para la media poblacional con un nivel d significación = 0, 01 (al ( al 99 %) y con una precisión de d = 1 cm. Profa. Debbie Figueroa
Bioestadistica
32
Solución
Profa. Debbie Figueroa
Bioestadistica
33
INFERENCIA ((PRUEBAS INFERENCIA PRUEBAS PARAMÉTRICAS)) PARAMÉTRICAS
Profa. Debbie Figueroa
Bioestadistica
34
Contrastes de hipótesis Contrastes y
Implica, Implica, en cualquier cualqui er investigación, la existencia de dos teorías o hipótesis implícitas, que denominaremos hipótesis nula e hipótesis alternativa, que de alguna manera reflejarán reflejarán esa idea a priori que tenemos y que pretendemos contrastar con la realidadµ. realidadµ.
Profa. Debbie Figueroa
Bioestadistica
35
Contrastes
Profa. Debbie Figueroa
Bioestadistica
36
Ejemplo
Profa. Debbie Figueroa
Bioestadistica
37
Solución
Profa. Debbie Figueroa
Bioestadistica
38
Como hacer hacer u un n test test de te de hipótesis
Profa. Debbie Figueroa
Bioestadistica
39
Errores y
Error tipo I
y
Error tipo II
Profa. Debbie Figueroa
Bioestadistica
40
Observaciones
Profa. Debbie Figueroa
Bioestadistica
41
Ejemplo
Profa. Debbie Figueroa
Bioestadistica
42