Verificación de hipótesis sobre los parámetros poblacionales El estudio que se acaba de hacer en el Capitulo anterior sobre los conceptos y las técnicas de la estimación puntual y por intervalos ha servido para empezar a familiarizarnos con la inferencia estadística. En el presente capitulo se va a considerar otro enfoque de la inferencia estadística: la verificación de hipótesis. A pesar de que los temas referentes a la estimación por intervalos y a la verificación de hipótesis se tratan aquí en capítulos separados, no son cuestiones tan diferentes como lo podría indicar esta forma de tratarlos. Ambas ideas se fundamentan en los conceptos de probabilidad y de distribución muestral que se estudiaron en los capítulos anteriores. Ambos también hacen posible la toma de decisiones acerca de una población con base en la información contenida en una muestra de esa población. 6.1 HIPOTESIS La palabra hipótesis se define como: 1. Una afirmación que esta sujeta a verificación o comprobación, 2. Una suposición que se utiliza como base para una acción.* El punto clave de estas definiciones esta en que una hipótesis es una afirmación o suposición y no un hecho establecido. De esta manera, al no existir un conocimiento previo sobre la efectividad de dos métodos de enseñanza, un investigador puede proponer la hipótesis de que para la• enseñanza de la lectura a estudiantes de primer ano, el método A es superior al método B. Un fabricante de drogas puede hacer la hipótesis de que un determinado medicamento es más efectivo que otro que se venía usando normalmente en el tratamiento de una enfermedad. Un fabricante de plásticos puede hacer la hipótesis de que ciertas láminas de determinado tipo de plástico tienen una resistencia a la tracción promedio de 75 libras. Hipótesis de esta naturaleza pueden basarse en la experiencia y la observación, experimentación, o en la intuición. Las hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón podemos denominarlas hipótesis de investigación. Generalmente hay que volver a plantear las hipótesis de investigación antes de verificarlas estadísticamente. Cuando ya se han planteado en forma conveniente, de tal forma que se puedan comprobar por medio de los métodos estadísticos que se estudian en el presente capitulo, las hipótesis reciben el nombre de hipótesis estadísticas. Las hipótesis estadísticas son afirmaciones sobre una o mas poblaciones, o mejor, como es mas frecuente, afirmaciones sobre uno o mas parámetros de una o mas poblaciones. Las hipótesis estadísticas son de dos tipos. Primero esta la hipótesis nula, que se simboliza por Ho y que es la hipótesis que se debe comprobar. La hipótesis nula se llama también hipótesis de ninguna diferencia (por esto el término nula). Es una afirmación en la que se dice que no hay ninguna diferencia entre dos poblaciones, entre dos parámetros poblacionales o entre el valor verdadero de algún parámetro y su valor hipotético. Veamos nuevamente las tres hipótesis de investigación que se acabaron de enunciar y establezcamos para cada una de ellas la hipótesis nula correspondiente. En el caso de la hipótesis de investigación sobre los métodos de enseñanza de la lectura a alumnos de primer ano, supongamos que el criterio de efectividad con que se van a comparar los dos métodos es el puntaje obtenido en una prueba de rendimiento en lectura hecha al terminar el año. La hipótesis nula apropiada (Ho) consistiría en afirmar que no hay ninguna diferencia entre la efectividad de los dos métodos de enseñanza de lectura, o mas específicamente, que el puntaje promedio obtenido en la prueba por los estudiantes que aprendieron según el método A es igual (no es diferente de) al puntaje promedio de los estudiantes que aprendieron según el método B. Podemos expresar la hipótesis nula en forma mas compacta como
1
Supongamos que la efectividad de la nueva droga y la de la droga usual que se menciono antes, se mide en función de la proporción de casos que responden favorablemente al tratamiento mediante cada una. La hipótesis nula apropiada consistiría en afirmar que la proporción de casos que responden favorablemente a la nueva droga es igual a la proporción de casos que responden favorablemente a la droga usual, o
Finalmente, en el caso de la hipótesis de investigación que afirma que las laminas de cierto tipo de plástico tienen una resistencia promedio a la tracción de 75 libras, la hipótesis nula apropiada consistiría en decir que la resistencia a la tracción promedio es de 75 libras, o
Para verificar una hipótesis nula, examinamos los datos de la muestra tomada de la población pertinente y determinamos si son o no compatibles con la hipótesis nula. Si los datos de la muestra no son compatibles con la hipótesis nula, entonces H o se rechaza. Si los datos son compatibles con la hipótesis nula, entonces H o no se rechaza. En la Sección 6.2 explicaremos el criterio que se usa para determinar si los datos de la muestra son o no compatibles con la hipótesis nula. Si la hipótesis nula no se rechaza, decimos que los datos particulares de la muestra no dan suficiente evidencia como para que concluyamos que la hipótesis nula es falsa. Si la hipótesis nula se rechaza, decimos que los datos particulares de la muestra si dan suficiente evidencia como para hacernos concluir que la hipótesis nula es falsa y que una segunda hipótesis es verda dera. Esta segunda hipótesis, de la que hemos concluido que es verdadera si la hipótesis nula es rechazada, se denomina hipótesis alterna y se designa con el símbolo H 1. Generalmente la hipótesis alterna y la hipótesis de investigación son la misma. Vamos a referirnos nuevamente a las hipótesis de investigación que plan teamos anteriormente, para establecer en cada caso cual seria la hipótesis nula y la hipótesis alterna apropiada. 1 hipótesis de investigación: el método A es superior al método B para la enseñanza de la lectura a alumnos de primer año.
2 hipótesis de investigación: la nueva droga es más efectiva que la dro ga usual en el tratamiento de la enfermedad X.
3 hipótesis de investigación: la resistencia promedio verdadera a la tracción de las láminas del tipo A es 75 libras.
2
Obsérvese que en los dos primeros casos, la hipótesis de investigación y la hipótesis alterna son la misma, mientras que en el tercer caso la hipótesis de investigación es la misma que la hipótesis nula. Cuando se establecen hipótesis del tipo indicado en (1) y en (2) se pro cura generalmente que las hipótesis nula y alterna se complementen entre si y para esto se incluye una desigualdad en la hipótesis nula que vaya en dirección opuesta a la de la hipótesis alterna. Por ejemplo, podríamos escribir las hipótesis anteriores (1) y (2) como
Y
Este método de plantear las hipótesis nula y alterna realza el hecho de que cuando la hipótesis alterna establece una desviación respecto de una igualdad en una dirección, las desviaciones respecto de la igualdad en la dirección opuesta no tienen ningún interés. Por ejemplo, el director del departamento de control de calidad de una empresa manufacturera puede hacer las siguientes hipótesis como parte del procedimiento para aceptar o rechazar las remesas de materias primas procedentes de los distintos proveedores.
El director del departamento de control de calidad desea detectar todas aquellas remesas en que la proporción de artículos defectuosos sea mayor que µo, el nivel máximo aceptable, para poderlas rechazar. Si la proporción defectuosa es menor que el nivel aceptable, tanto mejor. 6.2 PROCEDIMIENTO DE VERIFICACION DE HIPOTESIS Como ilustración de los procedimientos para verificar hipótesis, examinemos el ejemplo siguiente. Con base en varios años de experiencia, un equipo de psicólogos cree que individuos no conformistas tienen un nivel mayor de amor propio que los conformistas. Aunque los psicólogos recuerdan muchos casos en que se pueden fundamentar sus aseveraciones, saben que, para darle mas peso a sus conjeturas, deben emplear un método científico en el análisis de la evidencia. Les parece que un procedimiento de verificación de hipótesis estadísticas les resulta más apropiado. De acuerdo con esto, establecen la siguiente hipótesis nula y la siguiente hipótesis alterna:
donde µx es el puntaje medio poblacional obtenido por los no conformistas en una prueba que tenía por objeto medir el nivel de amor propio y µy,. es el puntaje medio poblacional obtenido por conformistas en la misma prueba. La población sobre la que desean los psicólogos hacer inferencias, es la población de todas las personas que se pueden caracterizar como conformistas o no conformistas. Los psicólogos obtienen muestras independientes de conformistas y de no conformistas que, según ellos, se pueden tratar como muestras aleatorias de las poblaciones de interés. Administran las pruebas para medir el amor propio a los individuos de las dos muestras y calculan el puntaje promedio para cada una. Descubren que x A = 80 y x B = 75. Aunque la dirección de la diferencia de las medias muestrales es compatible con su hipótesis de investigación (y alterna), los psicólogos saben que existen por lo
3
menos dos maneras de explicar esta diferencia: (1) el puntaje verdadero medio de amor propio de la población de los no conformistas podría no ser superior al que corresponde a la población de los conformistas. Los resultados observados en la muestra se deben simplemente a la casualidad. (2) Los resultados observados en la muestra podrían reflejar el verdadero estado de las cosas y es acertado sacar como conclusión que el puntaje verdadero medio de amor propio para los no conformistas es superior al de los conformistas. El conocimiento y la comprensión de las sutiles ideas de los procedimientos de verificación de hipótesis permitirá que los psicólogos puedan escoger entre las dos explicaciones. Vamos a dedicar el resto de esta sección a los conceptos y técnicas específicas que se utilizan en la verificación de hipótesis. Podemos formalizar el procedimiento que se debe seguir para verifi car una hipótesis estableciendo, en forma secuencial, los diversos pasos que forman el procedimiento. En esta sección enumeramos y explicamos cada uno de estos pasos llevando el mismo orden que guardan normalmente en la práctica. Se pueden identificar nueve pasos principales. 1 Planteamiento de la hipótesis 2 Selección del nivel de significación 3 Descripción de la población que interesa y planteamiento de las suposiciones necesarias 4 Selección del estadístico pertinente 5 Especificación del estadístico de prueba y consideración de su distribución 6 Especificación de las regiones de rechazo y aceptación 7 Recolección de datos y cálculo de los estadísticos necesarios 8 Decisión estadística 9 conclusión A continuación, vamos a describir cada uno de estos pasos en términos generales y posteriormente los explicaremos con ejemplos específicos. 1 Planteamiento de la hipótesis. En la Sección 6.1 vimos las diferentes clases de hipótesis que se pueden hacer y la forma en que se expresan. En virtud de que el estudiante que se inicia en el estudio de la estadística encuentra con frecuencia dificultades cuando tiene que establecer la forma de plantear la hipótesis nula y la hipótesis alterna, vamos a ampliar esta materia. Generalmente, queremos obtener una conclusión (paso 9) rechazando la hipótesis nula. Es decir, ordinariamente preferimos que los datos de nuestra muestra apoyen la hipótesis alterna (en la Sección 6.4 explicaremos las razones de esto). En consecuencia, al determinar lo que debe ser la hipótesis alterna, debemos preguntarnos “¿que deseo concluir?" o "que creo que es verdadero?". La respuesta a estas preguntas constituye la expresión de la hipótesis alterna. Luego, el planteamiento complementario de la hipótesis alterna, sirve de hipótesis nula. Por ejemplo, consideremos un investigador que establece como hipótesis de investigación el hecho de que, en la enseñanza de la lectura a alumnos de primer año, el método A es superior al método B. Frente a la pregunta "¿que deseo concluir?", el investigador responderá que desea sacar la conclusión de que el método A es superior al método B. Por tanto, la hipótesis alterna consiste en µA > µB y la hipótesis nula, que es el complemento de este planteamiento, en PA < PB. Este ejemplo, muestra como, normalmente, se formula primero la hipótesis alterna. 2 Selección del nivel de significación. Teniendo en cuenta los resultados que se obtienen en el análisis de los datos de la muestra, rechazamos o no la hipótesis nula. Rechazar la hipótesis nula no
4
constituye una prueba de que sea falsa. Sin tener en cuenta que tan incompatible sea la evidencia de la muestra con la hipótesis nula, cabe la posibilidad de que esta última sea realmente verdadera. Análogamente, el hecho de no rechazar la hipótesis nula no es una prueba de que sea verdadera y de que la hipótesis alterna sea falsa. De la misma manera que en el caso anterior, aunque la hipótesis nula no sea rechazada, cabe la posibilidad de que sea falsa. La consideración de estos hechos nos lleva a la conclusión de que en el rechazo o el no rechazo de la hipótesis nula se corre el riesgo de equivocarse. Aunque generalmente no sabemos si en una determinada acción (rechazo o no rechazo de Ho) cometemos un error o no, podemos indicar los dos tipos de error posibles, de la manera siguiente:
(a) Rechazo de una hipótesis nula verdadera. Este error se denomina error de Tipo I. (b) aceptación de una hipótesis nula falsa. Este error se denomina error de Tipo II. Podemos ilustrar la relación entre la certeza de la hipótesis nula (es decir, si es verdadera o es falsa) y la decisión estadística (rechazar o no rechazar Ho) como se ve en la Tabla 6.1. Siguiendo la costumbre que se tiene en estadística, representaremos con la probabilidad de cometer un error de tipo I y con la probabilidad de cometer un error de Tipo II. Así pues
Para la verificación de una hipótesis determinada preferiríamos que y fueran pequeños. En virtud de la relación entre estas dos probabilidades, encontramos que, para un tamaño de muestra dado, una disminución de tiene como contraparte un aumento de y viceversa. Siendo esto así, parece prudente que, en una situación determinada, tratemos de minimizar la probabilidad de cometer el error mas serio. Desafortunadamente, en muchas áreas de investigación, es difícil, o imposible, evaluar los dos tipos de error en cuanto a la seriedad de cada uno de ellos. Entonces, lo que se hace en estas situaciones es seleccionar algún valor pequeño para , digamos 0.10, 0.05 ó 0.01. La elección de refleja la opinión que tiene el investigador sobre la seriedad del error de Tipo I. Mientras mas serias se consideren las consecuencias de cometer un error de Tipo I, menor será el valor que se le asigne a Con frecuencia, se denomina nivel de significación. Cuando se escoge un nivel de significación igual a y se rechaza la hipótesis nula, decimos que los resultados de la muestra son significativos. 3 Descripción de la población que interesa y planteamiento de las suposiciones necesarias. Los procedimientos para la verificación de hipótesis dependen de las características de la distribución muestral que esta implícita. Las características de la distribución muestral dependen en parte de la naturaleza de la población muestreada. Por esta razón, debemos investigar la naturaleza de la población muestreada para justificar la selección del procedimiento. Generalmente nos interesamos en conocer el tamaño aproximado de la población y en saber si se puede considerar o no normalmente distribuida, en forma aproximada. También, deseamos establecer el hecho de que sea razonable suponer que la muestra tomada constituye una muestra aleatoria simple de la población de interés. 4 Selección del estadístico pertinente. El estadístico particular que va a formar parte del procedimiento para la verificación de hipótesis esta determinado por el parámetro que tiene relación con la hipótesis. De esta manera, si se trata de verificar una hipótesis sobre una media poblacional, el
5
estadístico pertinente es x . o media muestral. también podríamos considerar la distribución muestral del estadístico pertinente. En términos generales lo que se desea saber es la media, la varianza (o la desviación típica) y la forma funcional aplicable de la distribución muestral. Por ejemplo, si estamos verificando una hipótesis sobre una media poblacional y si el muestreo se hace en una población que esta normalmente distribuida, sabemos que la distribución de x . la media de la muestra, estará normalmente distribuida con media µ y varianza σ2/n. 5 Especificación del estadístico de prueba y consideración de su distri bución. DEFINICION Un estadístico de prueba es una cantidad numérica que se calcula a partir de los datos de una muestra y que se utiliza para tomar la decisión de rechazar o no rechazar una hipótesis nula. El estadístico de prueba se determina teniendo en cuenta el parámetro sobre el que se hace la hipótesis y la naturaleza de la distribución muestral del estadístico pertinente. Cuando el muestreo se hace en una población normalmente distribuida, con varianza conocida, el estadístico de prueba que se usa para verificar una hipótesis sobre la media poblacional es:
donde x es la media de una muestra de tamaño n, µ0 es el valor hipotético de la media poblacional µ y σ es la desviación típica de la población. Este esta dístico de prueba se distribuye como la distribución normal estandarizada. Cuando el muestreo se hace en una población normalmente distribuida, con varianza desconocida, el estadístico de prueba que se usa para verificar una hipótesis sobre la media poblacional es:
donde x , µo y n se definen como se hizo anteriormente y S es la desviación típica de la muestra. Este estadístico de prueba sigue la distribución t de Student con n - 1 grados de libertad. Posteriormente estudiaremos otros estadísticos de prueba que se encuentran con frecuencia. 6 Especificación de las regiones de rechazo y de aceptación. DEFINICION En la verificación de una hipótesis, la región de rechazo consta de todos aquellos valores del estadístico de prueba que son de tal magnitud que, de ser el valor observado del estadístico de prueba igual a uno de ellos, la hipótesis nula se rechaza. La región de aceptación es el complemento de la región de rechazo. Si el valor observado del estadístico de prueba es igual a alguno de los valores que componen la región de aceptación, la hipótesis nula no se rechaza. Tal como vamos a ver, los tamaños de las regiones de rechazo y de acep tación están determinados por . Para explicar la manera de determinar las regiones de rechazo y aceptación, consideremos el caso de que, con el propósito de verificar una hipótesis sobre una media poblacional, se extrae una muestra de una población normalmente distribuida, con varianza conocida. Como ya lo hemos indicado, el estadístico de
6
prueba apropiado en este caso es Z. Supongamos que deseamos verificar la hipótesis nula de que una media poblacional, µ, es igual a algún valor particular µo, frente a la hipótesis alterna de que µ no es igual a µo. Las hipótesis nula y alterna se pueden plantear así:
Digamos además que , probabilidad de rechazar una hipótesis nula verdadera, es 0.05. Ahora consideremos la distribución muestral de las medias calculadas a partir de muestras de tamaño n tomadas de nuestra población específica. De acuerdo con lo que vimos anteriormente sabemos que la distribución muestral de x esta normalmente distribuida. Si la hipótesis nula es verdadera, la media de la distribución muestral es igual a µo. también sabemos que el (1 - ) % = 95% de todas las x caerán dentro de 1.96 errores típicos de la media, que, de ser Ho verdadera, es igual a µo. Esto lo podemos expresar por medio de la siguiente ecuación de probabilidad:
La Figura 6.1 describe gráficamente esta ecuación y la distribución muestral. La probabilidad de que una sola muestra aleatoria simple de tamaño n arroje un valor de x igual a o mayor que µo + 1.960 x es igual a /2 = 0.025.La probabilidad de que una sola muestra aleatoria arroje un valor de x igual o menor que µ0 - 1.96º x -, es también igual a /2 = 0.025. Si tenemos un valor numérico específico para µo, podemos calcular valores numéricos reales para µo ± 1.96σ x . Por ejemplo, supongamos que µo = 100 (esto es, hacemos la hipótesis de que µ es igual a 100), σ x = 30 y n = 25. Los valores numéricos de µo ± 1.96 (30/25) son 88.24 y 111.76.
Podemos decir que la probabilidad de observar un valor de x entre 88.24 y 111.76, siendo H o verdadera, es igual a 0.95. Si Ho es verdadera, la probabilidad de que una sola muestra aleatoria simple de tamaño 25 arroje una media igual o mayor que 111.76 es igual a 0.025 y la probabilidad de que una sola muestra aleatoria simple arroje una media igual o menor que 88.24 es igual también a 0.025. Supongamos que en realidad estamos observando un valor de x igual o mayor que 111.76 o igual o menor que 88.24. Tenemos que concluir que ha ocurrido un caso raro (con una probabilidad de ocurrir igual a 0.05) u ofrecer otra explicación. En un procedimiento de verificación de hipótesis la única alternativa que queda es afirmar que la hipótesis nula es falsa; o lo que es lo mismo, que la muestra no se extrajo de una población que tiene la media hipotética. En realidad, esta ultima explicación es la que se acepta cuando las hipótesis son Ho: µ = µo y H1: µ ≠ µo el nivel de significación es y se presenta un valor de x que es igual o mayor que µ0. + Z/2 (σn) o uno que es menor o igual a µo -Z/2 (σ/ n). Al aceptar esta explicación estamos rechazando la hipótesis nula. Si se decide rechazar en estas circunstancias la' hipótesis Ho se corre un riesgo, , de tomar una decisión equivocada. En consecuencia debemos asignarle a un valor pequeño (digamos 0.10, 0.05 ó 0.01) para que la
7
probabilidad de equivocarnos (de rechazar una hipótesis nula verdadera) sea pequeña. Como vamos a rechazar H o : µ = µo en favor de H1 : µ ≠ µo, cuando nuestra muestra única arroje una media x igual o mayor que µo + Z /2 (σ/'n), o igual o menor que µo - Z/2 (σ/'n), estos valores de x constituyen la región de rechazo para nuestra verificación de hipótesis. Su complemento, conforma por lo tanto la región de aceptación.
Podemos expresar las regiones de aceptación y de rechazo en función del estadístico de prueba, Z, observando que los números se transforman en - Z/2 y Z/2 respectivamente cuando utilizamos la formula Z= ( x -µo)/ (σ/'n)
La Figura 6.2 muestra las regiones de aceptación y de rechazo, tanto en función de x como de z, para verificar, con un nivel de significación a, H o µ = µ0 frente a la alternativa H1: µ ≠ µo . Si calculamos con base en los datos de la muestra un valor de
y este resulta mayor o igual a Z/2 o menor o igual a Z/2 rechazamos Ho. En cualquier otro caso, no rechazamos Ho. Se dice que un valor calculado de Z es significativo si nos lleva a rechazar una hipótesis nula. Llamamos valores críticos de un estadístico de prueba a aquellos valores que, como Z/2 y - Z/2 de la Figura 6.2 (b), separan una región de rechazo de una región de aceptación. Ellos nos dicen cuando debemos dejar de creer que la hipótesis nula es verdadera y empezar a creer que es falsa. Llamamos hipótesis alternas de dos lados o bilateral, a las hipótesis alternas de la forma H 1 µ ≠ µo puesto que generalmente nos conducen a una región de rechazo que esta compuesta de dos lados o colas de la distribución del estadístico de prueba. Y al procedimiento adecuado para verificar una hipótesis nula frente a una hipótesis alterna bilateral, como el que se describió anteriormente, le damos el nombre de prueba de hipótesis de dos lados o bilateral. Con frecuencia, como ya lo hemos visto, la hipótesis nula es de la forma Ho: µ < µo y la hipótesis alterna de la forma: HI: µ > µo. A una hipótesis alterna de este tipo la Llamamos hipótesis unilateral, puesto que solo valores grandes del estadístico de prueba causan el rechazo de la hipótesis nula y, por tanto, la región de rechazo esta localizada solamente en la cola superior de la distribución del estadístico de prueba. Es decir, que toda la probabilidad a esta localizada en una sola cola y no esta dividida por la mitad como sucede en la prueba bilateral. Por ejemplo, el equipo de psicólogos descrito anteriormente, que esta interesado en los puntajes de los conformistas y los no conformistas, utilizan una prueba unilateral con la región de rechazo localizada solamente en la cola superior. Si seleccionan un nivel de significación (probabilidad de rechazar una hipótesis nula verdadera) de 0.05, todo el valor 0.05 constituirá el área de la cola superior en la distribución muestral. Para las hipótesis alternas de la forma H1:. µ < µo solamente los valores pequeños del estadístico de prueba causan el rechazo de la hipótesis nula y, por tanto, toda la región de rechazo se encontrara en la cola inferior de la distribución.
8
Hasta este momento, nuestros ejemplos sobre la verificación de hipótesis se han restringido a pruebas con la media poblacional. En secciones posteriores, vamos a estudiar la verificación de hipótesis para aquellos casos en que el muestreo se toma de poblaciones que no están normalmente distribuidas, así como también para casos en que están implícitos otros parámetros poblacionales. 7 Recolección de datos y cálculo de los estadísticos necesarios. Los datos que se necesitan para verificar las hipótesis formuladas y que satisfacen las suposiciones necesarias de la prueba se deben recolectar en una forma adecuada. Una vez que se han recogido se calcula el estadístico apropiado y el estadístico de prueba. 8 Decisión estadística. Se compara el valor real calculado del estadístico de prueba con el valor crítico de este. Si el valor calculado esta en la re gión de rechazo, entonces se rechaza H o , de lo contrario, no se rechaza. 9 conclusión. En tanto que la decisión se expresa en función del esta dístico de prueba, la conclusión se expresa en función del parámetro y/o la población a que se refiere la prueba. Por ejemplo, cuando rechazamos H o: µ= µo , concluimos que "la media de población no es igual a µo ". Cuando no rechazamos la hipótesis nula nuestra conclusión carece de la fuerza de convicción que tiene cuando se rechaza una hipótesis nula. Esto se debe a que, aunque de antemano sabemos que la probabilidad de rechazar una hipótesis nula verdadera es pequeña (esto lo sabemos por la selección que hemos hecho de ), generalmente no conocemos el valor de o probabilidad de aceptar (no rechazar) una hipótesis nula falsa. Esta puede ser, y frecuentemente lo es, muy grande. (En la Sección 6.4 analizaremos este punto detalladamente). En consecuencia, al no rechazar H o : µ = µo concluimos que "la media de población puede
9
ser igual a µo ". En las próximas secciones explicaremos, con ejemplos, el procedimiento general para la verificación de hipótesis que se ha descrito en esta sección. Explicaremos la verificación de hipótesis cuando los parámetros de interés son la media poblacional, la diferencia entre dos medias poblacionales, una proporción poblacional, la diferencia entre dos proporciones poblacionales, la varianza poblacional y la razón entre dos varianzas poblacio nales. 6.3 VERIFICACION DE UNA HIPOTESIS SOBRE UNA MEDIA POBLACIONAL UNICA En esta sección vamos a explicar, con ejemplos, el procedimiento que se usa para la verificación, de hipótesis cuando el parámetro de interés es la media poblacional. Consideraremos tres casos: (1) el caso en que el muestreo se ha ce en una población normalmente distribuida, con varianza conocida, (2) el caso en que el muestreo se hace en una población normalmente distribuida con varianza desconocida y (3) el caso en que el muestreo se hace en una población que no esta normalmente distribuida. población normalmente distribuida, σ
2
conocida
Para explicar la verificación de hipótesis sobre medidas poblacionales, vamos a considerar primero el caso de que la población de interés est a distribuida normalmente y se conoce su varianza. Ejemplo 6.1 La media y la desviación típica del peso de los hombres que jugaron fútbol en una universidad durante las primeras 10 temporadas son µ = 162.5 libras y σ = 18.0 libras. El departamento de atletismo desea saber si hay alguna razón para creer el peso promedio de los que jugaron fútbol durante las 10 ultimas temporadas es diferente del peso promedio de los que jugaron fútbol durante las primeras diez temporadas. Los miembros del departamento desean basar su conclusión en una muestra de tamaño n = 25. El procedimiento para la verificación de la hipótesis se explica a continuación. 1 Planteamiento de la hipótesis. Los investigadores que desean saber si el peso promedio de los que jugaron fútbol durante las 10 últimas temporadas difiere de 162.5, piensan que una conclusión de esta naturaleza se justificaría si pudieran rechazar la hipótesis nula de que el peso promedio de la población de interés es igual a 162.5. Las hipótesis correctas, nula y alterna, son entonces las siguientes:
2 Nivel de significación. Los investigadores establecen que la probabilidad de cometer un error de Tipo I será igual a = 0.05. 3 Descripción de la población y suposiciones. La población consiste en los pesos de todos los hombres que jugaron fútbol durante las 10 últimas temporadas. Los investigadores piensan que los pesos de esta población están mas o menos distribuidos normalmente y que tienen una desviación típica igual a 18.0, o desviación típica de los pesos correspondientes a los que jugaron durante las primeras 10 temporadas. 4 El estadístico pertinente. Como las hipótesis se refieren a una media poblacional, el estadístico apropiado es x o media muestral. En virtud de que se supone que la población esta distribuida en forma aproximadamente normal, la distribución muestral de x , para todos los fines
10
prácticos, puede considerarse como distribuida en forma aproximadamente normal. Si la hipóte sis nula es verdadera, µx , la media de la distribución muestral, es igual a 162.5. Si, como lo creen los investigadores, la desviación típica de la población es 18.0 libras, entonces la desviación típica de la distribución muestral de x (o error típico de x ) es (σx = σn = 18.0/25 = 3.6. 5 El estadístico de prueba y su distribución. Como el estadístico pertinente es x , σ es conocida y se supone que x esta normalmente distribuida, el estadístico de prueba es Z, que esta normalmente distribuido cola media 0 y desviación típica 1. 6 Regiones de rechazo y de aceptación. Como a = 0.05 y como se trata de una prueba bilateral, la región de rechazo consta de dos partes. La primera parte, localizada en la cola derecha de la distribución de z consiste en todos los valores de z tales que, cuando Ho es verdadera, la probabilidad de ocurrencia aleatoria de una z de ese tamaño o mas grande es igual o menor que 0.025. La segunda mitad de la región de rechazo, localizada en la cola izquierda de la distribución de z, consta de todos aquellos valores de z tales que, cuando Ho es verdadera, la probabilidad de que ocurra al azar una z de ese tamaño o mas pequeña es igual o menor que 0.025. La Tabla E del Apéndice muestra que los valores críticos son z = + 1.96 y z = - 1.96. La región de aceptación consta de todos los valores de z que son menores que + 1.96 pero mayores que - 1.96. Si a partir de los datos de la muestra obtenemos un valor de z igual o mayor que + 1.96 o igual o menor que - 1.96, rechazaremos la hipótesis nula. Las zonas de rechazo y de aceptación también se pueden describir en función de x . La zona de rechazo consta de dos conjuntos de valores de x (calculados a partir de muestras de tamaño 25 extraídas de la población de interés): los que son tan grandes que la probabilidad de ocurrencia de valores de ese tamaño o mas grandes, cuando Ho es verdadera, es igual o menor que 0.025 y los que son tan pequeños que la probabilidad de ocurrencia de valores de ese tamaño o mas pequeños es igual o menor que 0.025. Los valores críticos para la región de rechazo son valores de x , que están localizados a una distancia de 1.96 errores típicos a cada lado de la media hipotética. Los valores críticos son:
Si la muestra arroja un valor de x que quede a una distancia de 1.96 errores típicos o mas medida desde la media hipotética (esto es, si la x calculada es mayor o igual a 169.6 o menor o igual que 155.4), rechazaremos H, ). En cualquier otro caso, no la rechazaremos. La Figura 6.3 muestra las regiones de rechazo y de aceptación en función tanto de z como de x . 7 Recolección de datos y cálculos. Se selecciona una muestra aleatoria simple de los puntajes de 25 personas que jugaron fútbol durante los d1timos diez anos. La media de los pesos de la muestra resulta ser igual a 178.7. 8 Decisión estadística. Con los datos de la muestra se calcula
Como 4.50 es mayor que 1.96, este valor de z cae dentro de la región de rechazo y por tanto rechazamos HO. Obsérvese también que 178.7 es mayor que 169.6, el valor critico superior expresado en función de x . Por tanto habríamos podido rechazar la hipótesis nula sin necesidad de calcular un valor z. 9 conclusión. Como rechazamos HO, volvemos a la hipótesis alterna para poder sacar una conclusión. En este ejemplo podemos concluir, con base en los datos de la muestra, que el peso
11
promedio de los jugadores de fútbol de la universidad durante la última década, es diferente al peso promedio de los jugadores durante la primera década.
Informe de los resultados. En los artículos de las revistas que contienen análisis estadísticos de proyectos de investigación, encontramos una variedad de maneras de presentar los resultados. A veces, se informa el valor del estadístico de prueba o el del estadístico de la muestra junto con la afirmación de si era o no significativo en el nivel de significación escogido. De acuerdo con este método, informaríamos los resultados del presente ejemplo, poniendo "z = 4.50, significativo en el nivel 0.05", o x = 178.7, significativo en el nivel 0.05". Cuando un resultado es significativo tanto en el nivel 0.05 como en el nivel 0.01, muchos autores lo indican por medio de asteriscos. A los resultados que son significativos en el nivel 0.05, pero no en el nivel 0.01, se les agrega un asterisco (*) y a los que son significativos en el nivel 0.01, dos asteriscos (**). Como, en el presente ejemplo, 4.50 es mayor que 2.58 (valor de z en una prueba bilateral con a = 0.01) el resultado se informaría como z = 4.50** 6 x = 178.7**. Tal vez la forma mas común de presentar los resultados, en la literatura, es utilizando valores p. DEFINICION Un valor p es el valor más pequeño de con el que se puede rechazar la hipótesis nula. Existe la probabilidad de obtener, cuando Ho es verdadera, un valor del estadístico de prueba tan extremo o más extremo que aquel que realmente se ha observado. Si los resultados estadísticos se presentan en una tabla, el valor p se indica generalmente en nota de pie de página. Si los resultados se exponen en el texto de un artículo, el valor p se informa generalmente de manera similar o a veces entre paréntesis. Al determinar un valor p, debemos tener en cuenta si la prueba es unilateral o bilateral. Si la prueba es bilateral, los valores de p serán dos veces más grandes de lo que serian en una prueba unilateral, puesto que habrá que tener en cuenta la probabilidad de obtener un valor extremo del estadístico de prueba en cualquier dirección. Para obtener el valor de p correspondiente al presente ejemplo, en el que la prueba es bilateral, debemos buscar la probabilidad de observar un valor de z tan extremo o más extremo que 4.50, en
12
cualquier dirección, cuando Ho es verdadera. Si consultamos la Tabla E del Apéndice, vemos que el valor tabulado mas grande de z es 3.09 y la probabilidad de obtener un valor de este tamaño o mas grande es 0.5 - 0.4990 = 0.001. Como 4.50 esta mucho mas a la derecha de 0 que 3.09, la probabilidad de observar un valor de z tan grande o mas grande que 4.50, cuando Ho es verdadera, es menor que 0.001. Como z = 4.50 se calcu1ó como parte de una prueba bilateral, debemos tener presente un valor tan extremo como 4.50 en la dirección opuesta. En consecuencia, el valor p que buscamos, es menor que 2(0.001) = 0.002. Este resultado lo presentaríamos en un informe como "p < 0.002". La Figura 6.4 muestra el valor p correspondiente a este ejemplo. Verificación de hipótesis unilateral. Con frecuencia la naturaleza de una hipótesis de investigación es tal, que conduce a una hipótesis alterna unilateral que, a su vez, lleva a una prueba unilateral que utiliza una región de rechazo unilateral.
Cuando solo valores extremadamente grandes del estadístico de prueba (o solo valores pequeños) dan origen al rechazo de la hipótesis nula, resulta conveniente utilizar una hipótesis alterna unilateral. Verificamos la hipótesis nula mediante una prueba unilateral y utilizamos entonces una región de rechazo unilateral. Supongamos, por ejemplo, que el muestreo se hace en una población normalmente distribuida con una varianza de población conocida y que la naturaleza de la hipótesis de investigación es tal que las hipóte sis estadísticas son
Como solamente valores grandes del estadístico de prueba darán origen al rechazo de H o (los valores pequeños trataran de apoyar la hipótesis nula), la región de rechazo estará compuesta de valores grandes del estadístico de prueba y por tanto, deberá localizarse en la cola superior de la distribución del estadístico de prueba. En realidad, la región de rechazo estará compuesta de aquellos valores del estadístico de prueba tan grandes que la probabilidad de observar valores de ese tamaño o mas grandes, siendo Ho verdadera, es igual o menor que . Figura 6.5 Regiones de aceptación y de rechazo para dos conjuntos de hipótesis estadísticas unilaterales. El muestreo se hizo en una población normalmente distribuida, con varianza de población conocida.
13
Por otra parte, si las hipótesis estadísticas son con un nivel de significación , la región de rechazo estará localizada en la cola inferior de la distribución del estadístico de prueba, puesto que solamente valores pequeños del estadístico darán origen al rechazo de la hipóte sis nula. La Figura 6.5 muestra las regiones de aceptación y de rechazo en estas dos situaciones.
Obsérvese que, para Ho µ ≤ µo y H1 µ> µ o , existe un gran número de valores hipotéticos para µ. La forma de la hipótesis indica que el procedimiento de la verificación de hipótesis podría resultar adecuado para cada uno de los valores hipotéticos. Sin embargo, por razones prácticas, se suele verificar la hipótesis nula, acompañada de una alterna unilateral, solo en el punto de igualdad. Un pequeño cálculo nos demuestra que si se rechaza Ho cuando la prueba se hace en el punto de igualdad, entonces H o se rechazara para cualquier otro valor hipotético de µ que este indicado por la hipótesis nula. Ejemplo 6.2 La experiencia ha demostrado que, el tiempo promedio de reacción a determinado estimulo en sujetos normales que están dentro de cierto limite de edad es de 65 milisegundos con una desviación típica de 15 milisegundos. Un equipo de investigaciones psicológicas cree que silos individuos reciben cierto tipo de entrenamiento muestran entonces, en promedio, un tiempo de respuesta mas corto. Con el fin de aclarar si esta opinión se puede probar, el equipo realizo el siguiente procedimiento para la verificación de hipótesis. 1 Planteamiento de la hipótesis. Podemos establecer formalmente la hipótesis de investigación correspondiente a este ejemplo así: el tiempo promedio de reacción al estimulo de los sujetos normales que reciben entrenamiento experimental es mas corto que el de los sujetos que no lo reciben". Esta hipótesis de investigación conduce a las siguientes hipótesis estadísticas:
La hipótesis alterna es unilateral puesto que solo los valores "pequeños" del estadístico de prueba darán origen al rechazo de la hipótesis nula. Obsérvese también que la hipótesis alterna y la hipótesis de investigación son la misma. 2 Nivel de significación. Sea = 0.01.
14
3 Descripción de la población y suposiciones. La población que consta de todos los valores de tiempo de respuesta al estimulo en sujetos normales es hipotética, puesto que, en realidad, no existe en el momento. Los investigadores creen que es razonable suponer que esta población de valores hipotéticos, de obtenerse, estará normalmente distribuida, con una desviación típica de 15, desviación típica de los sujetos normales que no reciben entrenamiento. En el experimento participa una muestra de 20 sujetos. 4 El estadístico pertinente. El estadístico mas importante es x , si suponen que la población esta normalmente distribuida, los investigadores pueden suponer también que la distribución muestral de x , será normal y tendrá una media de 65 y una desviación típica de ( x = 15√20 = 3.35), en caso de que la hipótesis nula sea verdadera. 5 El estadístico de prueba y su distribución. Como el estadístico mas importante, x , esta normalmente distribuido y como se supone que σ es conocida, el estadístico de prueba adecuado es Z. 6 Regiones de rechazo y de aceptación. En virtud de que solamente valores "pequeños" del estadístico de prueba calculado darán origen al rechazo de la hipótesis nula, la región de rechazo estará localizada en la cola izquierda de la distribución de z.
En otras palabras, la región de rechazo constara de todos los valores de z tan pequeños, que la probabilidad de obtener un valor de ese tamaño o menor, cuando H o es verdadera, es igual o menor que 0.01, o nivel de significación escogido. En la Tabla E del Apéndice encontramos que el valor crítico de z es igual a -2.33. Obtenemos el valor critico, en función de x , sabiendo que esta localizado a una distancia de 2.33 errores típicos a la izquierda de la media supuesta de la distribución muestral de x . Como x = 3.35, esta distancia es igual a 2.33 X 3.35 = 7.81. El valor critico, en función de x , es entonces, 65 - 7.81 = 57.19. La Figura 6.6 muestra las zonas de rechazo y de aceptación tanto en función de z como de x . 7 Recolección de datos y cálculos. Veinte sujetos normales recibieron el entrenamiento y en seguida se les hizo una prueba para determinar sus tiempos de reacción al estimulo. Los investigadores registraron un tiempo de reacción promedio de 55.5 milisegundos. Con base en estos datos, podemos calcular z = (55.5 - 65)/3.35 =-2.84. 8 Decisión estadística. Como el valor de z calculado,-2.84, es menor que -2.33 (es decir
15
como -2.84 cae en la región de rechazo), rechazamos Ho. Observemos también que x = 55.5 cae en la región de rechazo definida en términos de x . Sin tener en cuenta si el estadístico pertinente (en este caso x ) o el estadístico de prueba se utilizan para determinar si H o se rechaza o no, en una situación dada la decisión siempre será la misma. La Figura 6.6 muestra donde se localizan los valores calculados de x y z respecto de los valores críticos. De acuerdo con la Tabla E del Apéndice encontramos que la probabilidad de obtener un valor de z igual o menor que -2.84, cuando H o es verdadera, es 0.0023. Entonces, la probabilidad de observar un valor de x igual o menor que 55.5, cuando H o es verdadera, es de 0.0023. Por eso, el valor p correspondiente a este ejemplo es 0.0023 como se indica en la Figura 6.6. 9 Conclusión. Como rechazamos H O, concluimos que Hl es verdadera. Es decir, en el presente ejemplo, concluimos que el tiempo promedio de reacción de los sujetos que reciben entrenamiento especial es mas corto que el de aquellos que no lo reciben. Población distribuida normalmente, σ2 desconocida Cuando resulta apropiado verificar una hipótesis sobre una media poblacional, la varianza poblacional σ2 generalmente es desconocida y en consecuencia no se puede determinar exactamente σ√n, o error típico del estadístico pertinente x . Si la muestra es grande, se puede hacer una estimación satisfactoria de σ2 con los datos de la muestra. Si la población de interés esta normalmente distribuida, las medias muestrales lo estarán también y se podrá utilizar el estadístico de prueba z. Inclusive cuando la población no esta normalmente distribuida, la distribución muestral de la media esta distribuida en forma aproximadamente normal como consecuencia del teorema del límite central y, por tanto, se puede utilizar a z como estadístico de prueba. Sin embargo, cuando el tamaño de la muestra es pequeño, no se puede aplicar el teorema de límite central y es necesario buscar un estadístico de prueba distinto de z. Si se sabe que la población esta, al menos aproximadamente, distribuida en forma normal, o si, al no tenerse un conocimiento preciso esto parece ser una suposición razonable, el estadístico t, constituye la mejor elección de un estadístico de prueba. En el Capitulo 11 se estudiaran los procedimientos para la verificación de hipótesis que son apropiados cuando el tamaño de la muestra es pequeño y cuando no se puede suponer que la población esta normalmente distribuida. Ejemplo 6.3 Un fabricante de drogas dice que el tiempo promedio para que se disuelva el contenido de cierta cápsula es de 50 minutos. El equipo de investigaciones de una empresa competitiva no cree en esto. Por eso, hace una prueba con una muestra al azar de 20 cápsulas y calcula una media muestral de 54 minutos y desviación típica de 15. El equipo de investigaciones deseaba saber si puede concluir que el tiempo promedio que se requiere para que se disuelva el contenido es mayor que 50 minutos. El equipo Ilevo a cabo el siguiente procedimiento para la verificación de hipótesis. 1 Planteamiento de la hipótesis. La hipótesis de investigación es la siguiente: "el tiempo promedio requerido para que se disuelva el contenido de la cápsula es mayor que 50 minutos". Las hipótesis estadísticas son:
2 Nivel de significación. La probabilidad de cometer un error de Tipo I se fija en = 0.05. 3 Descripción de la población y suposiciones. El equipo de investigaciones supone que la población de los tiempos de disolución esta distribuida en forma aproximadamente normal. 4 El estadístico pertinente. El estadístico pertinente es x , la media de la muestra. 5 El estadístico de prueba y su distribución. En virtud de que n es pequeño (menor que 30), σ es desconocido y se supone que la población de la muestra esta normalmente distribuida, el estadístico
16
de prueba apropiado es:
que sigue la distribución t, de Student con n - 1 grados de libertad. 6 Regiones de rechazo y de aceptación. Mediante la Tabla F del Apéndice encontramos que el valor critico de t para una prueba unilateral con = 0.05 y 20 - 1 = 19 grados de libertad, es 1.7291. El valor critico, expresado en función de x esta dado por 50 + (1.7291) (15/√20) = 55.8. La Figura 6.7 muestra las regiones de aceptación y de rechazo en función de t . 7 Recolección de datos y cálculos. Como ya lo anotamos, una muestra al azar de 20 observaciones arrojo una media de 54 y una desviación típica de 15. A partir de estos datos podemos calcular
8 Decisión estadística. Como el valor de t calculado, 1.19, es menor que 1.7291 (es decir, cae en la región de aceptación) no podemos rechazar H O. Llegamos a la misma decisión observando que x = 54 es menor que 55.8 valor critico de x . Consultando la Tabla F del Apéndice podemos obtener algún conocimiento de la magnitud del valor p para esta prueba. Observamos que para 19 grados de libertad, la probabilidad de obtener un valor t tan grande o más grande que 1.328, cuando H o es verdadera, es 0.10. Como el valor de t calculado, 1.19, es menor que 1.328, concluimos que para esta prueba p > 0.10. Para obtener un valor más exacto de p, necesitaríamos consultar una tabla mas completa de la distribución t. 9 Conclusión. Como hemos rechazado HO, concluimos que Ho puede ser verdadera, es decir, que el tiempo promedio que se requiere para que el contenido de la cápsula se disuelva puede ser de 50 minutos o de menos. En el Capitulo 5 vimos que cuando el tamaño de la muestra es grande, muchos expertos en estadística prefieren utilizar la distribución z más bien que la distribución t cuando construyen intervalos de confianza para µ, aunque σ sea desconocida. De la misma manera, muchos expertos prefieren z, en vez de t, para verificar hipótesis, cuando tienen muestras grandes, a pesar de que a sea desconocida.
Esta practica se justifica por el hecho de que, cuando Ho es verdadera, (µ = µo ) y n es grande, el estadístico esta distribuido aproximadamente como la distribución normal estandarizada.
17
Cuando se sigue esta practica, se compara, para la significación, el valor calculado del estadístico de prueba con un valor apropiado de la distribución z. Muestreo en una población no distribuida normalmente Con frecuencia, la población de interés no esta normalmente distribuida. En otros casos, el investigador, que no conoce la forma funcional de la población, no quiere suponer que esta normalmente distribuida. En situaciones como estos, el estadístico t no es apropiado como estadístico de prueba y el estadístico z es apropiado únicamente si el tamaño de la muestra es grande. En el siguiente ejemplo, vamos a explicar el procedimiento para la verificación de hipótesis que se debe emplear cuando el muestreo se hace en una población no distribuida normalmente, con varianza desconocida (el caso usual) y cuando el tamaño de la muestra es suficientemente grande como para aplicar el teorema del Límite central. Ejemplo 6.4 Un grupo de profesores investigadores de una escuela de educación de cierta universidad partían de la hipótesis de que el enriquecimiento del plan de estudios en el colegio haría aumentar los puntajes en habilidad verbal cuando los estudiantes presentaran los exámenes de admisión de la universidad. Con el fin de observar si era posible obtener alguna evidencia para apoyar su hipótesis, los profesores introdujeron un programa de enriquecimiento en el plan de estudios de primer ano de un colegio local. El programa continuo, con esta clase, hasta el último ano. Al finalizar el ultimo año, 125 alumnos de esta clase tomaron exámenes de admisión en la universidad. El puntaje verbal promedio fue de 590 con una desviación típica de 35. El puntaje verbal promedio de los estudiantes que presentaron estos exámenes durante los 5 años anteriores fue de 580. Los profesores deseaban saber si podían sacar como conclusión que el enriquecimiento del plan de estudios había aumentado el puntaje verbal promedio. Se puede llevar a cabo el siguiente procedimiento para la verificación de hipótesis. 1 Planteamiento de la hipótesis . hipótesis de investigación: "el enriquecimiento del plan de estudios del colegio mejora los puntajes en habilidad verbal de los alumnos que presentan examen de admisión en la universidad".
2 Nivel de significación. Sea
0.05.
3 Descripción de la población y suposiciones. En virtud de que el tamaño de la muestra es grande, se puede aplicar el teorema del límite central sin tener en cuenta la forma funcional de la población. Se supone que los 125 puntajes constituyen una muestra aleatoria de una población grande de puntajes. 4 El estadístico pertinente. Como las hipótesis se refieren a la media de población, el estadístico más importante es x , o media muestral. La distribución de x esta distribuida en forma aproximadamente normal, puesto que n es grande. Si Ho es verdadera, la media de la distribución muestral de x es 580 o menos. Como la prueba se va a realizar en el punto de igualdad, la distribución pertinente tiene una media de 580, si Ho es verdadera. El error típico estimado de x esta dado por
s / n = 35 / √125 = 3.13. 5 El estadístico de prueba y su distribución. El estadístico de prueba apropiado es z, que esta normalmente distribuido, con media 0 y desviación típica 1. 6 Regiones de rechazo y de aceptación. El valor crítico de z es 1.645, de modo que la región de rechazo consta de todos los valores de z iguales o mayores que 1.645 y la región de aceptación consta de todos los valores de z menores que 1.645. El valor critico de x es 580 + (1.645) (3.13) =
18
585.15. Expresada en función de x la región de rechazo consta de todos los valores de x mayores o iguales a 585.15 y la región de aceptación de todos los valores de x menores que 585.15. 7 Recolección de datos y cálculos. Como ya lo advertimos, n = 125, x = 590, y S = 35. A partir de estos datos podemos calcular
8 Decisión estadística. Como el valor de z calculado, 3.19, es mayor que el valor critico de z, 1.645, rechazamos HO. también, puesto que la x observada, 590, es mayor que el valor critico de x , 585.15, rechazamos HO. El valor p para esta prueba es menor que 0.001. 9 Conclusión. Debido a que se rechaza HO, los profesores pueden concluir que el enriquecimiento del plan de estudios de un colegio mejora el puntaje en habilidad verbal de los exámenes de admisión en la universidad. EJERCICIOS 1 En una población normalmente distribuida con desviación típica igual a 32, se extrae una muestra aleatoria simple de tamaño 16, que arroja una media y una desviación típica de 520 y 40 respectivamente. A partir de estos datos, ¿se puede concluir, en el nivel de significación 0.05, que µ es mayor que 516? Hacer una grafica para explicar la localización de las zonas de rechazo y de aceptación en función tanto del estadístico pertinente como del estadístico de prueba. ¿Cual es el valor p para esta prueba? 2 Una muestra aleatoria simple de tamaño 9 tomada de una población normalmente distribuida arrojo una media y una desviación típica de 150 y 30 respectivamente. ¿Proporcionan estos datos evidencia suficiente para po der concluir que la media poblacional es menor que 160? Cual es el valor p para esta prueba? • 3 A partir de los datos de una muestra aleatoria simple de 100 estudiantes de bachillerato seleccionados en varios colegios de una ciudad se averiguo que los gastos medios semanales de los estudiantes eran de 3.25 pesos con una desviación típica de 1 peso. ¿Proporcionan estos datos suficiente evidencia como para decir que la media poblacional es diferente de $ 3.00? ¿Cual es el valor p para esta prueba? • 4 Un especialista en lectura cree que los estudiantes de ciases no programadas obtienen puntajes superiores en pruebas de comprensión de lectura que los estudiantes de clases programadas. El puntaje medio obtenido en la prueba de comprensión de lectura por los estudiantes de clases programadas que entraron a 4o. grado durante los 5 años anteriores es de 4.25. Un grupo de 81 estudiantes que asistió a clases no programadas durante sus 3 primeros años, obtuvo un puntaje en la prueba de comprensión de lectura de 5.30, con una desviación típica de 1.8. ¿Proporcionan estos datos evidencia suficiente como para apoyar la hipótesis del especialista en lectura? Sea = 0.01. ¿Cual es el valor p en esta prueba? 5 Un investigador agrícola creía que el número medio de acres que los hacendados de un determinado estado dedicaban a cierto cultivo era inferior a 6. El investigador envió por correo un cuestionario a una muestra aleatoria simple de 25 hacendados de ese estado en que les solicitaba información sobre el número de acres sembrados. La media y la desviación típica de la muestra fue de 5 y 1,5 acres respectivamente. ¿En el nivel de significación 0.05 sirven estos datos de apoyo a la opinión del investigador? ¿Cuál es el valor p para esta prueba? • 6 Un consejero escolar ha descubierto que durante los últimos 5 anos los alumnos de último ano que no tuvieron consejerìa vocacional y que tomaron una prueba de madurez, obtuvieron un puntaje promedio de 190. El consejero opina que los estudiantes que reciben consejerìa
19
vocacional individualmente tienen en promedio un puntaje superior a este. El puntaje promedio de 64 estudiantes de último ano que recibieron consejerìa vocacional individual durante su último ano de colegio, fue de 205 con una desviación típica de 24. ¿Constituyen estos datos un apoyo para la opinión del consejero? Sea a = 0.05. ¿Cuál es el valor p para esta prueba? • 7 Un trabajador social cree que el numero promedio de anos de escola ridad correspondiente a los adultos que se encuentran inscritos en el bienestar social, es menor que 5. Una muestra aleatoria de 169 de estos adultos arrojo una media de 4.6 años de escolaridad con una desviación típica de 3.9 años. ¿Proporcionan estos datos evidencia suficiente para que el trabajador social concluya que p < 5 años? Sea = 0.05. ¿Cuál es el valor p para esta prueba? 8 Una muestra aleatoria de 100 familias seleccionadas en un determinado sector arrojo un promedio de ingresos familiares por ano de 9700 y una desviación típica de 1000. ¿Proporcionan estos resultados suficiente evidencia para indicar que la media verdadera es menor de $10 000? Sea = 0.05. 9 Una muestra aleatoria de 16 hembras de una especie de pequeños mamíferos fue seleccionada en una región geográfica. La longitud promedio de la cola de las hembras de la muestra fue de 94 milímetros con una desviación típica de 12 milímetros. La longitud promedio de la cola de las hembras de esta misma especie en otra región geográfica fue de 81 milímetros. ¿Proporcionan estos datos evidencia suficiente para indicar que la muestra provenía de una población con una media mayor que 81? Sea = 0.05. ¿Cuál es el valor p para esta prueba? ¿Que suposiciones hay que hacer? 10 Una muestra aleatoria de 25 personas que desempeñan una ocupación determinada obtuvieron un puntaje promedio de actitud espacial de 89, con una desviación típica de 20. ¿Proporcionan estos datos suficiente evidencia para concluir que el puntaje promedio verdadero para la población prueba? • 11 Un trabajador social cree que el peso promedio de los muchachos de 10 años que viven en un sector rural determinado es inferior a 34 kilogramos. Una muestra aleatoria de 25 muchachos tomada de esa población arrojo un peso promedio de 30 kilogramos y una desviación típica de 10. ¿Proporcionan estos datos evidencia suficiente para concluir que la opinión del trabajador social es correcta en el nivel de significación 0.05? Expresar las suposiciones necesarias en la aplicación del procedimiento de verificación y calcular el va lor de p correspondiente. 12 Un nutricionista cree que el consumo diario promedio de proteínas en una población es menor que 75 gramos. Una muestra aleatoria de 16 sujetos arrojo una media de 73.8 gramos con una desviación típica de 2.4 gramos. ¿Constituyen estos datos un fundamento para la opinión del nutricionista? Sea = 0.05. Calcular el valor de p para esta prueba y enunciar las suposiciones que sean necesarias. • 13 Una encuesta de 64 empleados profesionales de una institución correccional revelo que el tiempo promedio de empleo en el campo correccional era de 5 años con una desviación típica de 4 anos. ¿Sirven estos datos de soporte a la hipótesis de que el tiempo promedio de empleo de todos los empleados de este tipo esta por debajo de los 6 años? Sea = 0.05. 14 Una encuesta hecha a 100 estudiantes matriculados en una universidad urbana revelo que durante un trimestre de primavera, la cantidad promedio de dinero gastado en vestuario se elevo a $55 con una desviación típica de $20.00. Verificar la hipótesis nula de que µ = $60.00. Sea = 0.05. Calcular el valor p para esta prueba. 6.4 EL ERROR DE TIPO II Y LA POTENCIA DE UNA PRUEBA En las pruebas de hipótesis que se acaban de estudiar, a, la probabilidad de cometer un error de Tipo I (rechazando una hipótesis nula verdadera), ha estado bajo el control del inves tigador y se le ha fijado un valor pequeño, como 0.05 6 0.01. En esta sección vamos a estudiar con más detalle a , o probabilidad de cometer un error de Tipo II (aceptando una hipótesis nula falsa).
20
El error de Tipo II Consideremos la hipótesis H o: µ, = µo y H1: µ ≠ µo con = 0.05. Supongamos que la población pertinente esta normalmente distribuida, con varianza conocida σ 2 . Siendo = 0.05, la región de rechazo queda definida y consta de todos los valores de x mayores o iguales a µ„ + 1.96 σ x y menores o iguales a µo - 1.96 ,, donde µ o es la media hipotética de la distribución muestral de x . La Figura 6.8 muestra esta distribución, base de la verificación de hipótesis. Si Ho es falsa, la distribución muestral verdadera de x no estará centrada en µ o , como se ve en la Figura 6.8, sino que quedara centrada sobre la media poblacional verdadera. Si µ es igual a µ1, por ejemplo, la distribución muestral de x quedara centrada sobre µ1. Sin embargo, las regiones de rechazo y de aceptación quedaran fijas, puesto que están determinadas por y por Ho. Si el valor de x calculado con los datos de la muestra simple, que se extrajo de la población para verificar Ho, cae en la región de aceptación, cuando µ realmente es igual a µ1, Ho será "aceptada" y se cometerá un error de Tipo II. La probabilidad, , de que este suceso ocurra es igual a la parte del área bajo la curva de x centrada sobre µ1 que coincide con el área bajo la curva de x centrada sobre µo que se encuentra entre los valores críticos de x . Ver Figura 6.9. Figura 6.8- distribución muestral hipotética de x para Ho: µ = µ o , H 1 µ ≠ µ o , cuando el muestreo se hace en una población normalmente distribuida con varianza σ2 ( = 0.05).
21
Bajo la hipótesis H1 µ ≠ µo, µ puede asumir un numero infinito de valores y por lo tanto existe un numero infinito de posibles valores de . Aquel que se deba aplicar en una situación dada, cuando H o es falsa, depende del valor verdadero de µ. En la practica, no conocemos el valor verdadero de µ cuando Ho es falsa y por tanto no sabemos el valor real de . La Figura 6.9 muestra algunas alternativas posibles para µ, cuando Ho es falsa y las correspondientes . En esta figura, las distribuciones muestrales correspondientes a diversos valores de µ aparecen verticalmente para más claridad. Debemos darnos cuenta de que, en realidad, los diversos valores de µ están todos localizados sobre el mismo eje x y, en consecuencia, todas las curvas de distribución muestral correspondientes tienen la misma línea x como eje horizontal. También debemos darnos cuenta de que, a pesar de que en la Figura 6.9 solamente se muestran seis alternativas diferentes de Ho : µ = µo. existe un numero infinito de ellas. Al observar la Figura 6.9 se puede ver que las alternativas para µo que están localizadas cerca de µo, producen valores más grandes de que las alternativas que están lejos de µo. Por ejemplo, la distancia que hay entre µ1 y µo es mas corta que la distancia que hay entre µ2 y µo y, en consecuencia, 1 es mayor que 2. Expliquemos ahora por medio de un ejemplo como se calcula un error de Tipo II. Ejemplo 6.5 Un psicólogo clínico deseaba verificar, en el nivel de significación 0.05, la hipótesis de que el promedio del CI de un grupo de retardados mentales era de 65. Una muestra aleatoria de 50 sujetos arrojo una desviación típica de 12. El psicólogo también deseaba calcular la probabilidad de cometer un error de Tipo II. Los valores diferentes de µ para los cuales se calculo fueron µ1 = 67, µ2=70, µ3=63, y µ4=61. Los valores críticos para la verificación de hipótesis son
22
La Figura 6.10 muestra estos valores críticos. Al determinar para los diferentes valores de µ, suponemos que S = 12, estimación muestral de σ, es una estimación apropiada para cada caso. Primero calcularemos para la alternativa µl = 67. Si Ho = 65 es falsa porque µ es realmente igual a 67, la distribución muestral apropiada de x estaría centrada en 67. Como los valores críticos de x , bajo la hipótesis Ho, son 62 y 68, "aceptaremos" H o siempre que un valor observado de x caiga entre 62 y 68. Si µ es realmente igual a 67, estaremos "aceptando" una hipótesis nula falsa. La probabilidad de "aceptar" una hipótesis nula falsa (cometiendo un error de Tipo II) cuando µ = 67 es igual al área, entre 62 y 68, que esta bajo la curva de x centrada sobre 67. Podemos expresar esta área en términos probabilísticas de la manera siguiente:
Para calcular esta probabilidad convertimos a x en la escala normal estandarizada y obtenemos
La figura 6.11 muestra gráficamente este valor 1 de
23
Cálculos semejantes para µ2 = 70, µ3 = 63 y µ4 = 61, dan respectivamente los valores 2 = 0.1190, 3 = 0.7208 y 4 = 0.2776. La Figura 6.12 muestra estos distintos valores de y también el de 1.
Obsérvese que disminuye cuando la distancia entre µo y el otro valor de µ, para el cual se calcula 13, aumenta. También obsérvese que en el Ejemplo 6.5 todos los valores calculados de , como se ve en la Figura 6.12, son mayores que el valor preseleccionado de = 0.05. En realidad, hay que seleccionar un valor de µ aproximadamente igual a 70.8 o a 59.2 para que el valor correspondiente de sea igual a 0.05. Así pues, la probabilidad de "aceptar" una hipótesis nula falsa, , es siempre mayor que , excepto cuando la hipótesis nula es falsa porque el verdadero valor de µ "esta muy lejos" de µo. En muchas situaciones practicas, no estamos motivados para verificar hipótesis sobre medias poblaciones tales que, si Ho es falsa, el valor real de µ esta muy lejos de µo . Por ejemplo, no podemos imaginar a alguien que este interesado en verificar estadísticamente la hipótesis nula de que la estatura promedio de los niños de seis años es igual a la estatura promedio de los adultos. Por el contrario, no pondríamos en tela de juicio el interés de alguien por verificar la hipótesis nula de que la estatura promedio de un grupo determinado de mujeres adultas es igual a la estatura promedio de otro grupo de mujeres. En otras palabras, en muchas situaciones practicas, si Ho es falsa, es falsa porque el valor verdadero de µ esta cerca de µo. Por otra parte, mientras mas cerca este el valor verdadero de µ respecto de µo, más grande será el valor de , la probabilidad de "aceptar" una hipótesis nula falsa. Es por esta razón que advertimos que una conclusión que se basa en una hipótesis nula rechazada es mas decisiva que una que se basa en una hipótesis nula "aceptada".
24
Es también por esta razón que, cuando rechazamos una hipótesis nula, decimos que Hl es verdadera, pero cuando "aceptamos" o dejamos de rechazar una hipótesis nula, decimos que Ho puede ser verdadera. La potencia de una prueba Un concepto muy util para evaluar las verificaciones de hipótesis lo constituye la potencia de una prueba. La potencia de una prueba es la probabilidad de rechazar una hipótesis nula falsa. Generalmente viene expresado por 1 - . Para una dada, decimos que una prueba es mas potente que otra, si el valor de 1 - es mayor en la una que en la otra para todos los valores de µ. Con frecuencia, es útil contar, para una prueba particular, con lo que se conoce con el nombre de función potencia. DEFINICION Una función potencia es una función que muestra la relación que existe entre la probabilidad de rechazar una hipótesis nula y los diferentes valores que puede asumir el parámetro dadas una hipótesis nula, una hipótesis alterna y un nivel de significación determinado. La Tabla 6.2 da algunos de los valores de la función potencia correspondiente al Ejemplo 6.5. Se puede obtener una curva de potencia representando gráficamente la función potencia. Los posibles valores del parámetro se representan sobre el eje horizontal y los valores de 1 - sobre el eje vertical. La Figura 6.13 muestra el grafico de la función potencia de la Tabla 6.2.
La función potencia se usa para determinar la magnitud de 1 - cuando son verdaderos los valores específicos de la hipótesis alterna. La Figura 6.13 muestra la apariencia general en forma de V de las curvas de potencia correspondientes a pruebas bilaterales. En términos generales una prueba bilateral que discrimina bien entre el valor del parámetro en Ho y los valores en H1 (excepto los que se encuentran cerca al valor expresado de Ho) da como resultado una curva de potencia en forma de V estrecha. Una curva en V extendida indica que la prueba discrimina pobremente en un intervalo relativamente amplio de valores diferentes del parámetro. La curva de potencia para una prueba unilateral con la región de rechazo en la cola superior toma la forma de una S alargada. Una prueba unilateral con la región de rechazo en la cola inferior de la distribución tiene como resultado una curva de potencia que se asemeja a una S alargada pero al revés. La Figura 6.14 muestra la curva de potencia para el Ejemplo 6.2, que utiliza una prueba unilateral con región de rechazo en la cola inferior de la distribuciòn muestral.
25
EJERCICIOS 1 5 Con los datos del Ejercicio 1, construir y representar gráficamente la función potencia. 16 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 3. 17 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 4. 18 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 6. 19 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 7. 20 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 8. 21 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 13. 22 Construir y representar gráficamente la función potencia correspondiente al Ejercicio 14. 6.5 VERIFICACIÓN DE UNA HIPÓTESIS SOBRE LA DIFERENCIA ENTRE DOS MEDIAS PÓBLACIÓNALES En el Capítulo 5 estudiamos la construcción de intervalos de confianza para la diferencia entre dos medias poblacionales. En el presente capítulo vamos plantearnos el problema de verificar hipótesis sobre la diferencia entre dos medias poblacionales. El ejemplo que se estudió anteriormente relacionado con el equipo de psicólogos interesado en los puntajes de amor propio de los conformistas y de los no conformistas es una ilustración de este tipo de pruebas de hipótesis. En ese ejemplo los psicólogos deseaban saber si era posible obtener la conclusión de que los puntajes
26
promedio de amor propio de los no conformistas es mayor que el de los conformistas. Podríamos 'citar otros ejemplos. Un biólogo podría estar interesado en saber si es posible concluir que la duración promedio de vida de algún animal es inferior en un tipo determinado de medio ambiente que en otro. Un sociólogo podría querer saber si el número promedio de años de educación es diferente en dos poblaciones. Un economista tal vez esté interesado en saber si el ingreso familiar promedio es diferente en dos grupos. Vamos a estudiar pruebas bilaterales y pruebas unilaterales para cada una de las tres situaciones siguientes: (1) cuando el muestreo se hace en dos poblaciones que están distribuidas en forma por lo menos aproximadamente normal, con varianzas conocidas, (2) cuando el muestreo se hace en dos poblaciones que están distribuidas en forma por lo menos aproximadamente normal con varianzas desconocidas pero iguales y (3) cuando el muestreo se hace en dos poblaciones que no están normalmente distribuidas. En el Capítulo 4 vimos las distribuciones muestrales apropiadas para cada una de estas situaciones. Poblaciones normalmente distribuidas, 12 y 22 conocidas Ejemplo 6.6 En un establecimiento escolar suburbano, se seleccionó al azar una muestra de 25 alumnos de quinto grado (grupo A) de una población de estudiantes pertenecientes a familias en que ambos padres trabajan. Se seleccionó también una muestra al azar de 15 estudiantes (grupo B) del mismo grado y establecimiento escolar entre aquellos estudiantes que pertenecen a familias en que solamente el padre trabaja. El análisis de los puntajes de rendimiento escolar de los dos grupos dio los siguientes resultados: Puntaje promedio ( x ) Grupo Grupo B
78 85
La experiencia muestra que las poblaciones de puntajes para ambos grupos están distribuidas en forma aproximadamente normal, con varianzas de σ = 81 y ( x ) = 25. Con el fin de determinar si se puede concluir, con base en estos datos, que la media de la población de la que se seleccionó el grupo A es inferior a la media de la población de la que se seleccionó el grupo B, se puede llevar a cabo la siguiente verificación de hipótesis. 1 Planteamiento de la hipótesis.
2 Nivel de significación. = 0.05. 3 Descripción de las poblaciones y suposiciones. Como ya lo hemos observado se cree que es razonable suponer que las dos poblaciones están distribuidas en forma aproximadamente normal. Las muestras son independientes. 4 El estadístico pertinente. En virtud de que se va a verificar una hipótesis sobre la diferencia entre dos medias poblacionales, el estadístico más adecuado es la diferencia entre las medias muestrales que se calcula a partir de las muestras tomadas de las poblaciones. El estadístico puede designarse como x 1 - x 2. De acuerdo con lo que vimos en el Capítulo 4 , sabemos que, en esta situación, podemos considerar que la distribución muestral de x está normalmente distribuida con varianza igual a
27
y con media igual a 0, si Ho es verdadera. 5 El estadístico de prueba y su distribución . Como suponemos que la población está normalmente distribuida y como conocemos las varianzas poblacionales, el estadístico de prueba más adecuado es z, que sigue la distribución normal estandarizada. 6 Regiones de rechazo y de aceptación. El valor crítico de z es - 1.645. El valor crítico de x A, - x B es
7 Recolección de datos y cálculos. De acuerdo con los resultados dados anteriormente encontramos que .x .A -.x B = 7 8 - 85 = -7. El valor z que se puede calcular con base en estos datos es
8 Decisión estadística. Como -7 < -3.64 y -3.16 < -1.645 podemos rechazar Ho . 9 Conclusión. Se concluye que en ese establecimiento escolar, los punt ajes promedio generales de rendimiento de los estudiantes de quinto grado que pertenecen a familias en que ambos padres trabajan son inferiores a los de los estudiantes que pertenecen a familias en que solamente el padre trabaja. Podemos hacer una forma semejante a la que se acaba de describir, hipótesis bilaterales que tienen la siguiente forma:
Poblaciones normalmente distribuidas, σ1 y σ'2 desconocidas pero iguales Ejemplo 6.7 Dos profesores de una escuela de educación de una universidad desean comparar los puntajes totales de rendimiento de los estudiantes de octavo grado que han sido móviles (población 1) durante sus años de escuela elemental con los puntajes de los estudiantes que no lo han sido (población 2). Específicamente desean saber si pueden concluir con los datos de la muestra (n 1 = 15, n 2 = 22), si el puntaje de rendimiento promedio es diferente en los dos grupos. Los profesores definieron como estudiantes móviles a aquellos que asistieron a dos o más escuelas elementales. Clasificaron como no móviles a los estudiantes que habían asistido a la misma escuela durante todos los años de escuela elemental. Los profesores efectúan el siguiente procedimiento para la verificación de hipótesis. 1 Planteamiento de la hipótesis. Como los investigadores no tienen cómo especificar la dirección de la diferencia que pudiera existir entre las dos medias poblacionales, hacen las siguientes hipótesis alternas bilaterales:
28
2 Nivel de significación. Sea = 0.05. 3 Descripción de las poblaciones y suposiciones. Los profesores suponen que ambas poblaciones están distribuidas en forma aproximadamente normal. Las varianzas poblacionales son desconocidas, pero los profesores suponen que son iguales. Las muestras son independientes. 4 El estadístico pertinente. El estadístico más adecuado es x 1- x 2, que, en virtud de que se supone que las dos poblaciones están distribuidas en forma aproximadamente normal, podemos considerar como normalmente distribuido. Si Ho es verdadera, la media de la distribución muestral es µ1 -µ2 = 0 y su varianza es ( 12 / n1 ,) + ( 22 / n2 ). Como 12 / n1 y 22 / n2 son desconocidas, no podemos calcular la varianza verdadera de x 1- x 2 y, en consecuencia, excluimos a z como estadístico de prueba. 5 El estadístico de prueba. Como se observó en el paso 4, z no es el estadístico de prueba apropiado. Como se supone que las dos poblaciones están distribuidas en forma aproximadamente normal, con varianzas desconocidas pero iguales, el estadístico de prueba más adecuado es el estadístico t de Student con n1 + n2 - 2 grados de libertad. 6 Regiones de rechazo y de aceptación. Como los grados de libertad son 15 + 22 -- 2 = del Apéndice, que los valores críticos de t son ±2.0301. No podemos calcular los valores críticos de x 1 -- x 2 , haber calculado las varianzas muestrales. 7 Recolección de datos y cálculos. Los profesores obtuvieron las siguientes medias y varianzas muestrales.
La estimación combinada de la varianza de la población común es:
que es el error típico de x 1 - x 2 . El valor de t que se puede calcular con base en estos datos es:
8 Decisión estadística. Como -2.0301 < -1.14 < 2.0301 es decir, como -1.14 cae en la región de aceptación, no podemos rechazar Ho. Haciéndolo de otro modo, podríamos haber basado nuestra decisión de rechazar o no a HO en la magnitud de la diferencia observada x 1 - x 2 = 85 - 87 = -2. Los valores críticos de x 1 - x 2 están dados por 0 ± (2.0301) (1.76) = ±-3.57
29
Como --3.57 < -2 < 3.57, no podemos rechazar Ho. 9 Conclusión. Con base en estos datos, los profesores pueden concluir que no debe haber ninguna diferencia entre las dos medias de población. Muestreo en poblaciones no distribuidas normalmente Ejemplo 6.8 Un equipo de consejeros de rehabilitación juvenil tiene la impresión de que los jóvenes reincidentes y los no reincidentes son diferentes en cuanto al promedio de edad en que caen en poder de las autoridades. Con el objeto de ver si pueden tener evidencias para corroborar esta idea, el equipo saca una muestra aleatoria de nR = 50 registros de reincidentes y una de n N = 60 de no reincidentes. Efectúan el siguiente procedimiento para la verificación de hipótesis. 1 Planteamiento de la hipótesis.
donde µ N es la edad promedio de los no reincidentes en el momento en que cayeron por primera vez en manos de la policía y la edad promedio en que los reincidentes cayeron por primera vez en manos de la policía. 2 Nivel de significación. Sea 3 Descripción de las poblaciones y suposiciones. Las formas funcionales de las poblaciones no se conocen, pero esto no trae ningún problema para la determinación del estadístico de prueba, puesto que las muestras son grandes. Podemos suponer que los tamaños de las muestras son suficientemente grandes como para proporcionar estimaciones aceptables de ( R2 y N2 . Las muestras son independientes. 4 El estadístico pertinente. El estadístico más adecuado es x N -- x R que, como consecuencia del teorema del límite central, está distribuido en forma aproximadamente normal, con un error típico de
y una media, de 0, si Ho es verdadera. Como R2 y N2 son desconocidas, podemos estimarlas mediante S R2 y S N2 para poder obtener
2 2 que es una estimación de ( x N y xR
5 El estadístico de prueba. Con base en las consideraciones hechas en el paso 4, el estadístico de prueba adecuado es z. 6 Regiones de rechazo y de aceptación. El valor crítico de z es 1.645. 7 Recolección de datos y cálculos. Se obtienen las siguientes medias y varianzas muestrales.
30
Con base en estos datos calculamos
8 Decisión estadística. Como 5.94 > 1.645, rechazamos Ho. Procediendo de otro modo, podríamos haber basado nuestra decisión en la magnitud de la diferencia entre las medias muestrales x N -- x R = 14.9 - 12.3 = 2.6, en comparación con el valor crítico de x N -- x R, que está dado por
Como 2.6 > 0.72, podemos rechazar Ho . 9. Conclusión. La edad promedio en que los no reincidentes tienen su primer contacto con las autoridades es mayor que la de los reincidentes. EJERCICIOS • 23 Un terapeuta ocupacional realizó un estudio para evaluar los méritos relativos de dos aparatos prostéticos ideados para facilitar la destreza manual. El terapeuta le entregó a 21 pacientes con idénticas dificultades uno de los dos aparatos para que lo usaran mientras realizaban determinada tarea. Once pacientes llevaron el aparato A y 10 el B. El investigador registró el tiempo que gastó cada paciente en realizar la tarea y obtuvo los siguientes resultados:
x = 65 segundos, S A2 = 81 x , = 75 segundos, S B2 = 64. ¿Darán estos datos evidencia suficiente como para concluir que el aparato A es más efectivo que el aparato B? Sea = 0.05.
24 Como parte de un estudio relacionado con la conducta de una especie animal, unos zoólogos realizaron un experimento para determinar si esa especie animal presentaba en promedio diferentes tiempos de respuesta a un estímulo bajo dos condiciones diferentes (condición I y condición II). Los investigadores sometieron una muestra aleatoria de 15 animales a la condición I. Para cada animal registraron el tiempo transcurrido entre el comienzo del estímulo y la respuesta. Tomaron los mismos registros con una muestra aleatoria de 17 animales que fueron sometidos a la condición II. Sus resultados fueron los siguientes:
¿Proporcionan estos datos evidencia suficiente como para concluir que el promedio de tiempos de respuesta es diferente bajo las dos condiciones? Sea = 0.01. • 25 Como parte de un proyecto de investigación, un psicólogo seleccionó una muestra aleatoria de 12 muchachas y otra de 9 muchachos. Luego, le pidió a cada individuo que dibujara una figura masculina. El tiempo promedio que gastaron las mujeres fue de 8 minutos con una varianza de 18. Para los hombres el tiempo fue de 13 minutos, con una varianza de 22.5. ¿Indican estos datos que los hombres en promedio gastan más tiempo cuando dibujan una figura de hombre que las mujeres? Sea = 0.05. • 26 Se llevó a cabo una encuesta entre los ancianos de una comunidad para comparar los niveles
31
de amor propio entre los que vivían y los que no vivían en ancianatos (solos o con parientes). Se le dio a cada uno una prueba para medir su amor propio. Se obtuvieron los siguientes resultados:
¿Proporcionarán estos datos evidencia suficiente como para deducir que los ancianos que no viven en los ancianatos tienen un puntaje promedio superior de amor propio a los que viven en ancianatos? Sea = 0.01. • 27 Se llevó a cabo un estudio para evaluar los efectos del hacinamiento sobre el aprendizaje, entre niños de escuela elemental. A una muestra aleatoria de 50 niños se le enseñó una destreza determinada en condiciones de hacinamiento y a otra de 45 niños se le enseñó la misma destreza, con los mismos profesores, pero sin hacinamiento. Al terminar el experimento se le adminis tró a cada niño una prueba para determinar su nivel de dominio de la habilidad. Se obtuvieron los siguientes resultados:
¿Proporcionan estos datos evidencia suficiente como para concluir que la enseñanza es menos efectiva bajo condiciones de hacinamiento? Sea = 0.05. • 28 Al comienzo del año escolar se distribuyeron al azar los alumnos de último año de un colegio en dos grupos, cada uno con 50 estudiantes. El grupo A recibió consejería vocacional individual. El grupo B no recibió ninguna consejería. Al final del año, se le hizo a cada alumno una prueba para medir su nivel de conocimientos sobre las distintas carreras. Los resultados fueron los siguientes:
¿Proporcionan estos datos evidencia suficiente como para concluir que la consejería individual es efectiva para aumentar el conocimiento de las carreras profesionales? Sea = 0.05. • 29 En un estudio cuyo objeto era evaluar los efectos del ruido sobre la capacidad de aprender, se distribuyeron aleatoriamente en dos grupos 24 estudiantes. Al grupo 1 se le enseñó una habilidad en condiciones de ruido. Al grupo 2 se le enseñó la misma habilidad, con el mismo profesor, pero sin ruidos. Al final del experimento se administró a cada estudiante una prueba para medir su nivel de dominio de la habilidad. Los resultados fueron los siguientes:
¿Proporcionan estos datos evidencia suficiente como para concluir que el ruido es un factor que impide el aprendizaje? Sea = 0.05. • 30 En un laboratorio de psicología, los investigadores hicieron llegar, por diferentes conductos, una sustancia tóxica hasta el sistema nervioso central de varios animales experimentales. La variable de interés fue el tiempo, en horas, que corrió entre la administración de la toxina y la iniciación de los síntomas. Se obtuvieron los siguientes resultados:
32
¿Proporcionan estos datos evidencia suficiente como para concluir que, en promedio, la iniciación de los síntomas se inicia más pronto cuando la toxina se administra por el conducto B? Sea = 0.05.
6.6 COMPARACIONES PAREADAS En el Capítulo 5 estudiamos la construcción de intervalos de confianza para diferencias entre medias poblacionales, teniendo en cuenta datos de muestras aleatorias que no son independientes. También, vimos la razón fundamental y las ventajas que ofrece utilizar este tipo de datos, que se denominan datos pareados u observaciones pareadas. Partiendo de la misma teoría que sirve de fundamento para la construcción de intervalos de confianza para diferencias entre medias poblacionales, podemos verificar también hipótesis acerca de diferencias entre medias poblacionales. Resulta conveniente una prueba bilateral cuando la hipótesis nula establece que la media verdadera de las diferencias entre dos conjuntos de observaciones pareadas es igual a 0, sin ninguna especificación de que la diferencia tenga una dirección y no otra. Si la hipótesis alterna establece que el conjunto de observaciones de una población es mayor (o menor) que el otro conjunto, es conveniente usar una prueba unilateral. Expliquémonos con un ejemplo.
8 Decisión estadística. Como el valor calculado de t, 2.20, es mayor que el valor crítico de 1.7613, rechazamos H o. 9 Conclusión. Concluimos que las situaciones que producen ansiedad aumentan el nivel de ese producto químico en la sangre. EJERCICIOS • 31 La Tabla 6.4 muestra los puntajes de CI de 12 niños a quienes se les diagnosticó inhabilidad para el aprendizaje antes y después de 9 meses de la iniciación de un programa remedial. ¿Proporcionan estos datos evidencia suficiente como para concluir que el programa remedial es efectivo para aumentar los puntajes de CI en este tipo de niños? Sea = 0.05. 32 La Tabla 6.5 muestra la concentración de cierto producto químico en la orina de 10 adultos después de la administración, por dos vías distintas, de una droga que contenía ese producto. ¿Proporcionan esos datos evidencia suficiente como para concluir que la administración intramuscular de la droga produce una mayor concentración del producto químico en la orina?. Sea
33
= 0.05.
33 Un psicólogo seleccionó al azar a 15 señoras con sus maridos entre los residentes de un sector urbano y les solicitó que-completaran un cuestionario para medir el nivel de satisfacción respecto de la comunidad donde vivían. La Tabla 6.6 muestra los resultados de la encuesta. ¿Proporcionan estos datos una indicación de que los maridos de ese sector están más satisfechos con la comunidad que sus esposas? Sea = 0.05. 6.7 VERIFICACION DE UNA HIPÓTESIS SOBRE UNA PROPORCIÓN PÓBLACIÓNAL ÚNICA Como ya lo hemos visto, con frecuencia deseamos hacer inferencias acerca de proporciones poblacionales. En el Capítulo 5 vimos cómo se construyen estimaciones por intervalos de confianza de proporciones poblacionales. En esta sección, vamos a explicar con ejemplos la verificación de hipótesis sobre proporciones poblacionales. En el Capítulo 4 estudiamos la distribución muestral apropiada que sirve de base para esta prueba. EJEMPLO 6.10 Un trabajador social cree que menos del 25% de las parejas de cierta región han utilizado por lo menos una vez alguna forma de control natal. Con el fin de ver si esta suposición es razonable, el trabajador social selecciona una muestra aleatoria de 120 parejas de la región y realiza el siguiente procedimiento para la verificación de hipótesis.
3 Descripción de la población y suposiciones. La población es binomial y está compuesta por el conjunto de respuestas a la pregunta "¿Ha utilizado usted alguna vez una forma de control natal?" Estas respuestas son del tipo si o no, la población es suficientemente grande en relación con el tamaño de la muestra para que podamos pasar por alto el factor de cpf. La muestra también es suficientemente grande para que podamos aplicar la aproximación normal a la distribución binomial en la verificación de la hipótesis. 4 El estadístico pertinente. El estadístico más adecuado es pˆ o proporción de parejas
34
de la muestra que ha empleado algún control natal. Bajo H o la distribución muestral de p está distribuida en forma aproximadamente normal con una media de p =p o = 0.25 (verificación en el punto de igualdad) y un error típico de
Obsérvese que hemos utilizado el valor hipotético de p , p o , en la fórmula para el cálculo de σ p . Esta es una práctica muy lógica puesto que se supone que la hipótesis nula es verdadera hasta que haya suficiente evidencia para recha zarla. 5 El estadístico de prueba. Como se considera que la distribución debe ser aproximadamente normal, el estadístico de prueba más conveniente es z, que se distribuye como la distribución normal estandarizada. 6 Regiones de rechazo y de aceptación. El valor crítico de z es -1.645, de modo que la región de rechazo consta de todos los valores de z iguales o menores que -1.645. La región de aceptación consiste en todos los valores de z mayores que -1.645. El valor crítico de pˆ está dado por
7 Recolección de datos y cálculos. De las 120 parejas de la muestra, 20 dijeron que habían empleado algún método de control natal. Con base en es ta información, calculamos
8 Decisión estadística. Rechazamos la hipótesis nula puesto que -2.03 < -1.645 (o también, 0.17 < 0.18). 9 Conclusión. Concluimos que menos del 25% de las parejas de la región han utilizado alguna vez control natal. Cuando una proporción poblacional es el parámetro de interés, se pueden efectuar también hipótesis bilaterales y unilaterales con la región de rechazo en la cola superior según sea conveniente. EJERCICIOS 34 Plantear las hipótesis estadísticas apropiadas para un investigador que desea verificar la hipótesis nula de que una proporción poblacional es igual a 0.40. Una muestra de tamaño 240 arroja una proporción muestral de 0.48. ¿Se debe rechazar Ho en el nivel de significación 0.05? Fundamentar la respuesta con el procedimiento adecuado para la verificación de hipótesis. • 35 Un empleado de un departamento estatal de rehabilitación cree que el 20% de los jóvenes admitidos en las escuelas de rehabilitación del estado es convicto de robo de automóviles. En una muestra aleatoria de 100 admisiones, 16 jóvenes habían sido admitidos debido a robo de automóviles. ¿Contradicen estos datos la opinión del empleado? 36 Un empleado del departamento de agricultura cree que más del 20 de los hacendados de una región trabajan en empleos de tiempo parcial además de trabajar en su hacienda. Una encuesta realizada
35
a 200 hacendados seleccionados al azar reveló que 60 trabajaban en empleos de tiempo parcial. ¿Son estos datos apoyo para la creencia del empleado? 37 Un candidato a un empleo estatal cree que menos del 25 % de las personas que pueden votar están a favor de que pase cierto proyecto de ley sobre el que debe él pronunciarse. En una muestra al azar de 200 votantes, 30 dijeron que estaban a favor del proyecto de ley. ¿Constituyen estos datos un apoyo para la opinión del candidato, en el nivel de significación 0.05'? • 38 Un sociólogo cree que más del 70% de los adultos que viven en una región de bajos ingresos estaría a favor del establecimiento de un centro de recreación de la comunidad. De una muestra aleatoria de 200 adultos de la región, 144 estuvieron en favor de la idea. ¿Apoyan estos datos la creencia del sociólogo? Sea = 0.05. 39 Un especialista que trabaja en una escuela de agricultura cree que con una dieta especial se lograría aumento de peso en tres meses en más del 80 % de un grupo de cerdos. En una granja experimental se escogieron al azar 400 cerdos para alimentarlos con esa dieta. Al final de los tres meses, 340 cerdos habían aumentado su peso. ¿Estos datos sirven de apoyo al especialista? Sea = 0.05. 40 Una muestra aleatoria de 225 habitantes de apartamentos reveló que 18 de ellos poseían perros. ¿Proporcionan estos datos evidencia suficiente como para concluir que menos del 10% de los habitantes de apartamentos poseen perros? Sea = 0.0.5. 41 El alcalde de una ciudad cree que más del 60 % de los residentes de un suburbio adyacente está a favor de anexarse a la ciudad. En una muestra aleatoria de 120 adultos, 76 dijeron que estaban a favor. ¿Proporcionan estos datos evidencia suficiente como para apoyar la opinión del alcalde? Sea = 0.05. • 42 Se estima que menos del 10% de los estudiantes de una universidad utilizan el transporte público para trasladarse a sus clases. En una muestra aleatoria de 225 estudiantes, 20 dijeron que utilizaban el transporte público. Ante esta evidencia, ¿será realista la estimación? Sea = 0.05. • 43 En una muestra aleatoria de 255 adultos de cierta región, 25 dijeron que, en su concepto, la mayoría de las enfermedades mentales eran heredita rias. ¿Servirán estos datos de fundamento para la hipótesis de que menos del 15% de los adultos de la región opinan de esta manera? Sea = 0.05. 6.8 VERIFICACION DE UNA HIPOTESIS SOBRE LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES En la práctica surgen situaciones en las que se desea verificar la hipótesis nula de que dos proporciones poblacionales, p1 y p2 , son iguales o de que difieren en alguna cantidad específica. Por ejemplo, quisiéramos verificar la hipótesis de que dos grupos de individuos no se diferencian respecto de la proporción de ellos que favorecen la aprobación de alguna ordenanza de la ciudad. O, también, quisiéramos saber si se puede obtener la conclusión de que la proporción de mujeres que regularmente miran un programa determinado de televisión excede, en alguna fracción precisa, a la proporción de hombres que ven regularmente el programa. Ya vimos anteriormente la distribución muestral más conveniente para verificar esta clase de hipótesis. Vamos a explicar ahora, con ejemplos, el método para verificar cada uno de estos dos tipos de hipótesis.
En el Capitulo 4 veíamos que la distribución muestral de la diferencia entre dos proporciones
36
muestrales está distribuida en forma aproximadamente normal si ni y n2 son suficientemente grandes y que tiene media igual a µ,,-„ y desviación típica iguala
Como en la práctica p l y p2 son desconocidas, es preciso hacer una estimación de p1 p 2 mediante
Si hacemos que x1 sea el número de elementos que presentan la característica que interesa en la muestra tomada de la población 1 y que X2 sea el número de elementos que presentan la característica en la población 2, podemos hacer una estimación combinada de p = p1 = p2 por medio de
Podemos entonces volver a escribir la fórmula del error típico de la siguiente manera:
El siguiente ejemplo ilustra la situación en que la hipótesis nula específica que las dos proporciones poblacionales son iguales.
EJEMPLO 6.11
Un antropólogo cree que las proporciones de individuos de dos poblaciones, que tienen doble bucle de cabello en la región occipital, son la misma. Con el fin de ver si hay alguna razón para dudar de esta hipótesis, el antropólogo toma muestras aleatorias independientes de cada una de las dos poblaciones y determina el número de individuos en cada muestra con esta característica. Los resultados son los siguientes:
El investigador puede llevar a cabo el siguiente procedimiento para la verificación de hipótesis. 1 Planteamiento de la hipótesis.
2 Nivel de significación. Sea = 0.05. 3 Descripción de las poblaciones y suposiciones. El antropólogo puede clasificar a cada una de las personas de las dos poblaciones según posea o no la característica. Las dos muestras son independientes. 4 El estadístico pertinente. Como la hipótesis se relaciona con p1- -p2, la diferencia entre las dos proporciones poblacionales, el estadístico más importante es pˆ 1 - pˆ 2 que está distribuido en
37
forma aproximadamente normal (puesto que n l y n2 son grandes), con un error típico que se obtiene por combinación y una media igual a 0 si la hipótesis nula es verdadera. 5 El estadístico de prueba y su distribución. Como la distribución del estadístico pertinente es aproximadamente normal, el estadístico de prueba es igual a
que se distribuye aproximadamente como la distribución normal estandarizada, cuando H o es verdadera. 6 Regiones de rechazo y de aceptación. Los valores críticos de z son ± 1.96. Expresados en función de p1 - P2, los valores críticos están dados por
7 Recolección de datos y cálculos. Con base en los datos de la muestra que se dieron anteriormente, calculamos su combinación queda
El error típico combinado es
El valor calculado para z, entonces, es
Podemos también calcular los siguientes valores críticos, en función de pˆ 1- pˆ 2
8 Decisión estadística. Como el valor de z calculado, - 0.67, cae entre -1.96 y +1.96, no podemos rechazar H o. Procediendo de otro modo, podemos basar nuestra decisión en la magnitud observada de pˆ 1- pˆ 2 . Como pˆ l - pˆ 2 = 0.23 - 0.27 = -0.04 cae entre -0.12 y +0.12, no podemos rechazar H0 . 9 Conclusión. En virtud de que no rechazamos H0 concluimos que las dos proporciones poblacionales pueden ser iguales. Es decir, la proporción de individuos con doble bucle de cabello en la región occipital, puede ser la misma en la población 1 que en la población 2. En el caso2, la hipótesis nula especifica que p 1 - p2 es distinto de 0. En consecuencia no hay ninguna justificación para combinar los datos de las dos muestras al hacer la estimación de
38
En el caso 2, lo mismo que en el caso 1, p 1 - p2 está distribuido en forma aproximadamente normal, si n1 y n2 son muestras aleatorias independientes grandes. En el caso 2, pˆ 1- pˆ 2 tiene una media igual a p 1 -p2 y un error típico estimado igual a
Ejemplo 6.12
Un especialista en política de una universidad cree que la proporción de votantes del área A que va a votar en las próximas elecciones excede en más de 0.05 a la proporción de votantes del área B que votará en las mismas elecciones. Con el fin de ver si los hechos corroboran esta hipótesis, el profesor hace una encuesta entre los votantes del área A y del área B, con los siguientes resultados.
El investigador puede llevar a cabo el siguiente procedimiento para la verificación de hipótesis y así determinar si los datos observados proporcionan evidencia suficiente como para sustentar la hipótesis (se supone que los votantes harán lo que dicen que van a hacer). 1 Planteamiento de la hipótesis.
2 Nivel de significación. 3 Descripción de las poblaciones y suposiciones. Las poblaciones consisten en los votantes del área A y los del área B. Suponemos que las dos muestras se han tomado independientemente y al azar en las respectivas poblaciones. 4 El estadístico pertinente. El estadístico más adecuado es pˆ A- pˆ B, que está distribuido en forma aproximadamente normal (puesto que nl y n2 son grandes). Si Ho es verdadera, la medía de la distribución es 0.05 o menos (la verificación se hace para 0.05). 5 El estadístico de prueba. El estadístico de prueba es
que, cuando Ho es verdadera, se distribuye aproximadamente como la distribución normal estandarizada. 6 Regiones de rechazo y de aceptación. El valor crítico de z es +1.645. 7 Recolección de datos y cálculos. Con base en los datos de la muestra calculamos pˆ A, = 113/150 = 0.75 y pˆ B = 104/160 = 0.65. El error típico es
39
con lo que podemos calcular
8 Decisión estadística. Como el valor de z calculado, 1.00, es menor que 1.645, no rechazamos Ho. 9 Conclusión. Con base en estos datos, no podemos concluir que la hipótesis del especialista en política sea verdadera. EJERCICIOS • 44 Un antropólogo cree que la proporción de individuos que tienen sangre tipo A es la misma en dos poblaciones, I y II. Una encuesta en las dos poblaciones da la siguiente información basada en muestras aleatorias independientes:
¿Proporcionan estos datos evidencia suficiente como para concluir que las proporciones de las dos poblaciones no son iguales? Sea = 0.05. 45 Un sociólogo desea verificar la hipótesis nula de que la proporción de parejas casadas que participan en actividades informales de grupo es la misma en dos comunidades. Las muestras aleatorias independientes de parejas de las dos comunidades arrojan los siguientes resultados:
¿Proporcionan estos datos evidencia suficiente como para concluir que las dos proporciones no son iguales? Sea = 0.05. • 46 Un investigador que trabaja con un departamento correccional cree que entre los jóvenes encarcelados por actos de violencia, el porcentaje de ellos que fue educado en hogares superpoblados está muy por encima del 10% respecto del porcentaje de personas encarceladas por todos los demás crímenes que se educaron en hogares superpoblados. Para obtener evidencia que apoye esta teoría, el investigador tomó muestras aleatorias independien tes de los registros de los últimos cinco años en los dos tipos de criminales, y obtuvo los siguientes resultados:
¿Proporcionan estos datos evidencia suficiente como para fundamentar la opinión del investigador en el nivel de significación 0.05? • 47 Un sociólogo cree que la proporción de hombres que pertenecen a un grupo socioeconómico determinado (grupo A) y que ven regularmente lucha en televisión, supera en mucho a un segundo grupo de hombres (grupo B) que también ven lucha. Muestras aleatorias simples de los dos
40
grupos arrojaron los siguientes resultados:
0.05.
¿Proporcionan estos datos evidencia suficiente como para apoyar la tesis del sociólogo? Sea =
• 48 En un estudio sobre la relación entre la conducta de los adolescentes y varios factores religiosos, los investigadores examinaron una muestra aleatoria de estudiantes de bachillerato identificados por sus profesores como pendencieros y una muestra aleatoria independiente de jóvenes no pendencieros. Cada estudiante de las dos muestras fue clasificado por sus compañeros en cuanto al grado de religiosidad. Los resultados fueron los siguientes:
¿Proporcionan estos datos evidencia suficiente como para creer que la proporción de estudiantes que son tenidos por muy religiosos es más alta entre los no pendencieros que entre los pendencieros? Sea = 0.05. 49 Una trabajadora social que desea comparar dos comunidades respecto de varias variables, selecciona una muestra al azar independiente de 120 hogares de la comunidad A y una muestra aleatoria independiente de 100 de la comunidad B. Treinta y seis familias de las 120 de la comunidad A y 35 de las 100 de la comunidad B están recibiendo asistencia oficial. ¿Serán estos datos suficientes para concluir que las proporciones de los hogares que reci ben asistencia oficial en las dos comunidades son diferentes? Sea = 0.01. • 50 Un consejero de rehabilitación que trabaja en un departamento correccional, cree que un programa de rehabilitación va a reducir en más de un 15% la reincidencia entre los prisioneros que se dejan en libertad. Se escogieron al azar 100 prisioneros para participar durante un año en el programa de rehabilitación. Otros 100 se escogieron, también al azar, para servir de grupo de control. Se hizo un seguimiento de los dos grupos durante cinco años. Al término de este período, 22 personas del grupo experimental y 45 del grupo control habían sido halladas nuevamente culpables. ¿Se justifica la tesis del consejero sobre el programa de rehabilitación? Sea = 0.05. 51 Un biólogo que investiga los efectos de dos métodos para hacer que una planta adquiera resistencia en una enfermedad, en el curso de su investigación obtiene los siguientes resultados:
¿Con base en estos datos puede concluir el biólogo que las proporciones de las plantas que adquieren resistencia son diferentes? Sea = 0.05.
41
42
APE NDICE D TABLAS
43
44
APENDICE D TABLAS
45
46
47
PROCEDIMIENTOS NO PARAMÉTRICOS DE PRUEBA DE HIPOTESIS. Presentación El siguiente manual tiene como propósito presentar en forma resumida la lógica de aplicación de algunas pruebas no paramétricas y sus procedimientos de cálculo mediante las ecuaciones correspondientes y vía el paquete estadístico SPSS1. No pretendemos ser exhaustivos en la revisión de todos los procedimientos, sino que se abarcan aquellos que corresponden a la asignatura de Estadística en el tercer semestre de la carrera de Psicología impartida en la Facultad de Psicología de la UNAM. Las pruebas que se presentan en la primera parte son la prueba X 2 como Bondad de Ajuste y la prueba del Signo que se consideran poderosas para observaciones en diseños de una muestra y que tienen como propósito general probar la hipótesis nula de que la distribución de datos de una muestra se ajusta a la distribución de los datos de la población de referencia que tiene características específicas (Pruebas de Bondad de Ajuste, Siegel y Castellan, 1995). En la segunda parte se revisan procedimientos para la prueba de hipótesis a partir de los datos de dos muestras que tienen como propósito identificar si existen diferencias entre dos condiciones o tratamientos para evaluar los efectos de una variable independiente sobre una variable dependiente, o bien entre dos condiciones distintas de observación Con tal propósito se pueden tener dos tipos de muestras: relacionadas o independientes. Las muestras relacionadas implican que un mismo sujeto es medido dos veces, esto alude a diseños de antes y después, o de dos condiciones relacionadas; este tipo de diseños reclama que el sujeto funja como su propio control o bien que se emparejen dos sujetos con características muy similares (pares igualados). Las muestras independientes implican una sola medición para cada grupo de sujetos. Por ejemplo si se desea evaluar el efecto de una droga para reducir el nivel de depresión, se puede tener muestras relacionadas cuando a un sujeto se le mide su nivel de depresión antes de darle la droga, se le da la droga, y después de un lapso se le vuelve a medir su nivel de depresión. El efecto se determina comparando los niveles de depresión antes y después de la droga. Se puede tener muestras independientes para probar la misma droga si a un sujeto se le administra la droga y a otro no (esto es un diseño de grupo experimental y grupo control), y después de un tiempo se comparan los niveles de depresión de los dos sujetos para evaluar el efecto de la droga. Existen varios procedimientos que cumplen el propósito de comparar dos grupos, ya sean muestras relacionadas o independientes, en este material se presentan algunos de dichos procedimientos que se consideran entre los más poderosos para los diseños que emplean dos muestras. En la tercera y última parte se revisan los análisis de varianza no paramétricos para k muestras relacionadas (Prueba de Friedman) y para k muestras independientes (Prueba de Kruskall Wallis) que permiten probar hipótesis sobre la diferencia estadística entre varios grupos. Es importante destacar que los procedimientos estadísticos no permiten establecer determinantes causales entre variables, sino que sólo nos permiten descartar al azar como explicación de los datos y/o de las diferencias entre los grupos o condiciones comparadas. Esperamos que este material sea útil para comprender algunos procedimientos no paramétricos y su adecuada aplicación en el análisis de datos.
48
49
Pruebas de Hipótesis Estadísticas sobre una Muestra: La Prueba X2 como Bondad de Ajuste y la Prueba del Signo
50
PRUEBA 2 COMO PRUEBA DE BONDAD DE AJUSTE Con frecuencia el investigador desea conocer el número de sujetos que caen en varias categorías de respuesta o variable, y además predecir que ciertos tipos serán mas frecuentes que otros. La prueba 2 Ji Cuadrada es útil para analizar este tipo de datos. Es bondad de ajuste porque pretende probar si existen diferencias significativas entre el número observado de respuestas a cada categoría y un número esperado basado en la hipótesis nula.
OBJETIVO Determinar si una muestra aleatoria proviene de una población específica (si la distribución de la muestra es igual o diferente que la distribución de la población) La lógica de la prueba implica la comparación de frecuencias observadas de cada una de las categorías a medir en la muestra contra las frecuencias esperadas para cada categoría en la población, es decir si los datos de una muestra se ajustan a los datos esperados para la población. SUPUESTOS 1. Una muestra obtenida en forma aleatoria. 2. Variables categóricas con escala de medida nominal 3. Muestras grandes (N > 30) 4. Frecuencia Esperada > 5 (cuando FE es menor a 5 se aplica el procedimiento de corrección de Yates
FO FE 0.5 / FE
(2 (
2
HIPOTESIS ESTADÍSTICAS A PROBAR Ho: La distribución de la muestra es igual a la distribución de la población (FE = FO) Hipótesis alterna sin dirección Hi: La distribución de la muestra es diferente a la distribución de la población (FE ≠ FO) Hipótesis alterna con dirección Hi: Los datos de la muestra son mayores a los datos de la población (FO > FE) Hi: Los datos de la muestra son menores a los datos de la población (FO < FE)
DISTRIBUCIÓN MUESTRAL. Distribución que proporciona los valores esperados con k - 1 grados de libertad (Donde k es el número total de categorías observadas)
TIPO DE DATOS
Frecuencias de casos observados en dos o más categorías propias de la variable. Estas categorías deben ser mutuamente excluyentes y pertenecer a la misma clase.
51
REGLA DE DECISIÓN
de k-1
Rechazamos Ho, o bien Si p (X2o) ≤ . Rechazamos Ho Con grados de libertad
Se emplea la tabla de valores críticos de X2 para obtener el valor de X2t, considerando la intersección en la tabla de los de grados de libertad y el nivel de significación. Para obtener la p(X2o) se considera el valor de la X2o o una aproximación de la misma en relación con los grados de libertad, la columna en donde se ubique el valor observado corresponderá a la probabilidad deseada. EJEMPLO PRUEBA X 2 COMO PRUEBA DE BONDAD DE AJUSTE Se intenta identificar si en la población de adolescentes de la zona sur del D. F. existe una proporción similar de elección entre ocho carreras comunes. Para tal efecto se tomó una muestra aleatoria de 144 estudiantes de secundaria de la zona sur del D. F., a quienes se encuestó sobre su preferencia vocacional tomando como base las ocho carreras comunes. Se registro la frecuencia de elección de cada carrera. Los datos se presentan en la tabla 1. Probar la Hipótesis nula de que la distribución de frecuencias observadas en la muestra es igual a la distribución de frecuencias esperadas en la población.
SOLUCIÓN Variable Categórica: Tipo de carrera elegida Número de categorías: 8
Paso 1. Establecer las hipótesis a probar Ho: FO = FE (La distribución de la muestr a es igual a la distribución de la población) Hi: FO ≠ FE (La distribución de la muestra es diferente de la distribución de la población)
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si efectivamente la proporción de casos es igual en cada categoría de acuerdo con lo esperado, los datos son nominales, la muestra es mayor a 30 y fue
52
tomada de forma aleatoria y ninguna de las FE es menor a 5, se aplicará la prueba X2 como prueba de bondad de ajuste
Paso 3. Especificar alfa mos una N = 144.
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (Prueba Bilateral).
Paso 5. Decisión Para obtener el valor observado de 2 y tomar la decisión estadística se aplica el procedimiento con la fórmula de 2. 5.1 Obtener el estadístico FÓRMULA
SUSTITUÍMOS X2 = [(29 - 18)2 /18+ (19-18)2 / 1 8 + ( 1 8 - 1 8 ) 2 / 18 + (25 - 18)2 /18 + (17-18)2 /18+ (10-18)2 /18 + (15-18) 2 /18 + (11 -18) 2 /18]=16.33 X2 =16.33
Dado que X2o > X2t, 0.05, gl= 7; podemos rechazar la Ho y señalar que la Hi tiene mayor probabilidad de ser aceptada.
Decisión estadística: Dado que rechazamos Ho podemos decir que si existe diferencia entre la distribución de la muestra y la distribución de la población (las frecuencias esperadas son diferentes de las frecuencias observadas y esta diferencia no es producto del azar); X 2o = 16.33; a 0.05, gl 7) Conclusión: Existe suficiente evidencia estadística para considerar que los adolescentes del sur del D. F. tienen preferencias vocacionales en proporciones distintas de acuerdo con las carreras consideradas
53
PROCEDIMIENTO DE CÁLCULO MEDIANTE EL PAQUETE SPSS A continuación se presentan los pasos a seguir para obtener el estadístico de la prueba de X2 de bondad de ajuste. Para la decisión estadística se toma la regla de decisión: Si p(z) ≤ se rechaza la Ho
Paso 1 Se elabora la base de datos Se definen dos variables desde el menú Data y el submenú Define Variable. Una de ellas para especificar las categorías etiquetando adecuadamente con números desde el 1 hasta k; la otra variable se denomina FO y se vacían la frecuencia que le corresponde a cada categoría de la variable (Ver figuras 1 a y l b). Si consideramos el criterio de la probabilidad asociada a X 2 para tomar la decisión estadística debemos ubicar la X2o en la tabla de valores críticos alrededor de los grados de libertad, y observar en qué columna de a se encuentra. Justamente esa será la probabilidad aproximada para X2o; en nuestro ejemplo X2o = 16.33 con 7 grados de libertad, tenemos que 16.27 es el valor más cercano y corresponde a la columna de a = 0.001. Así la p(X2o) de 0.001 es menor que el a elegido para probar nuestra Ho, por lo tanto podemos rechazarla. 2
Definir variable carrera
54
Paso 2 Ponderar frecuencias En todos los casos de ji cuadrada deben ponderarse las frecuencias desde el menú Data y el submenu Weight Cases Weight Cases by Pasar la variable FO
55
Paso 3 Obtener el estadístico
Para obtener el valor de Ji cuadrada debemos seguir la siguiente ruta (ver figura 3) Desde el menú Statistics y el submenu Non Parametric Test Chi Square
En la ventan de la prueba se señala cual es la variable a probar que debe ser la variable categórica, en este caso carrera (ver figura. 4), una vez seleccionada se oprime la tacla Ok para la hoja de resultados (el
output). El resto de las opciones en la ventana no se, modifican.
56
Figura 4. ventana de la prueba X 2 . En el caso de que las frecuencias esperadas no se quieran manejar igual para todas las categorías se le asignan valores en la sección correspondiente a Expected Values señalando los valores en values.
57
Paso 4. Tomar la decisión estadística interpretando la hoja de resultados El valor del estadístico X 2 es igual a 16.33 con una probabilidad asociada de 0.022. La decisión estadística es rechazar la Ho dado que la probabilidad asociada con la X2 (16.33) es de 0.022, valor que resulta menor al del nivel de significación elegido de 0.05. Recordemos que el criterio de decisión es: Si p(z) ≤ se rechaza la Ho La conclusión a la que se llega es exactamente la misma a la planteada al sacar el estadístico mediante la ecuación, esto es: Existe suficiente evidencia estadística para considerar que los adolescentes del sur del D. F. tienen preferencias vocacionales en proporciones distintas de acuerdo con las carreras consideradas.
58
TABLA F
Distribución ji-cuadrada (X2)
59
PRUEBA DEL SIGNO
OBJETIVO Poner a prueba una hipótesis respecto a la mediana de una pobla ción continua. La lógica de la prueba se basa en contrastar el número de signos “+” con el de signos”-“. Los signos + corresponden a los valores de la muestra que son mayores a la mediana, los signos - a los que son menores. Esta prueba se considera la alternativa no paramétrica de la prueba t para una muestra. SUPUESTOS 1. 2. 3. 4.
Una muestra cuya mediana poblacional es desconocida. Observaciones independientes. Muestreo aleatorio. Variable continua medida en escala ordinal, intervalar o de razón.
TIPO DE HIPÓTESIS A PROBAR Ho: La mediana muestra) es igual a la mediana poblacional. Hipótesis alterna sin dirección Hi: La mediana muestral es diferente de la mediana poblacional. Hipótesis alterna con dirección Hi: La mediana muestral es mayor a la mediana poblacional, o, Hi: La mediana muestral es menor a la mediana poblacional. DISTRIBUCIÓN MUESTRAL Para muestras con N s 50 se usa la distribución de N+ que muestra los valores esperados de N+ para pruebas de una y dos colas. Para N > 50 se usa la distribución normal. TIPO DE DATOS Puntajes individuales en escala ordinal. PROCEDIMIENTO Asignar una signo + a los valores que estén por arriba de la mediana y un signo - a los que estén por debajo de ella. A los valores iguales a la mediana se les asigna un cero y se descartan del análisis. Se cuenta el número de signos + y el número de signos - para obtener el valor de N, también se cuenta el número total de signos obtenidos (n) descartando los valores iguales a 0. El estadístico de prueba para hipótesis de dos colas es el signo que aparece con menor frecuencia. Para pruebas de cola inferior el estadístico de prueba es N+ y para cola superior es N-. Una vez determinado el valor de N se contrasta con el valor de tablas.
60
Para muestras grandes (N > 50) se usa la aproximación por la normal, aplicando la siguiente fórmula:
REGLA DE DECISIÓN Si N+o (ó N-o) ≤ N+t (o N-t), n, a Rechazamos Ho Si p(z) ≤ Rechazamos Ho
EJEMPLO PARA MUESTRAS PEQUEÑAS En un estudio sobre el tiempo de reacción ante un estímulo auditivo se desea saber si el tiempo de reacción es diferente de 3.50 segundos. Para probar tal suposición se selecciona una muestra aleatoria de 11 sujetos quienes son expuestos al estímulo y se mide su tiempo de reacción, obteniéndose los siguientes datos:
Determinar con alfa=.05 que el tiempo de reacción es diferente a 3.50. Se desconoce si la distribución de la cual provienen los datos posee una distribución normal.
SOLUCIÓN Variable: tiempo de reacción en escala intervalar
Paso 1. Establecer las hipótesis a probar Ho: El tiempo de reacción es igual a 3.50. Hipótesis alterna sin dirección Hi: El tiempo de reacción es diferente a 3.50.
Paso 2. Elegir la prueba estadística Dado que interesa probar que la muestra presenta un tiempo de reacción diferente a 3.50, se cuenta con puntajes individuales en escala de razón, la muestra fue tomada de forma aleatoria, pero se desconoce si su distribución es normal, se aplicará la prueba del signo.
Paso 3. Especificar alfa Se empleará un = 0.05
Paso 4. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución.
61
Paso 5. Decisión Para obtener el valor observado de N y tomar la decisión estadística se aplica el procedimiento descrito para determinar el valor de N.
5.1. Obtener el estadístico de prueba Asignar un signo + a los valores que estén por arriba de 3.50, un signo - a los que estén por debajo de 3.50 y cero a los que sean iguales a 3.50.
N+= 1
N-=9
n=10
Para una prueba de dos colas se elige el signo que aparece con menor frecuencia, en este caso N+=1
5.2. Obtener N+ de tablas. El valor de N+t se obtiene de la tabla E intersectando el tamaño de n con el nivel de significancia especificado para una prueba de dos colas. En este caso n=10, = 0.05.
5.3 Comparar el valor observado y el valor esperado aplicando la regla de decisión Si N+o ≤ N+t, Rechazamos Ho 1= 1 Dado que N+o = N+t,
odemos rechazar Ho
Decisión estadística: Dado que rechazamos Ho podemos decir que el tiempo de reacción es diferente de 3.50.
Conclusión: Existe suficiente evidencia estadística para decir que el tiempo de reacción al estímulo auditivo al que fueron expuestos los sujetos es diferente de 3.50 segundos. EJEMPLO PARA MUESTRAS GRANDES Retomando el mismo ejemplo pero ahora con una muestra de 60 sujetos, supongamos que se obtienen N+=20, N-=35, cinco valores iguales a 0 y n=55. SOLUCIÓN Variable: Tiempo de reacción en escala intervalar
62
Paso 1. Establecer las hipótesis a probar Ho: El tiempo de reacción es igual a 3.50. Hipótesis alterna sin dirección Hi: El tiempo de reacción es diferente a 3.50. Paso 2. Elegir la prueba estadística Dado que interesa probar que la muestra presenta un tiempo de reacción diferente a 3.50, se cuenta con puntajes individuales en escala de razón, la muestra fue tomada de forma aleatoria, pero se desconoce si su distribución es normal, se aplicará la prueba del signo. Paso 3. Especificar alfa Se empleará un
= 0.05
Paso 4. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución. Paso 5. Decisión Para obtener el valor observado de N y tomar la decisión estadística se aplica el procedimiento descrito para determinar el valor de N con muestras grandes. 5.1. Obtener el estadístico de prueba
Para una prueba de dos colas se elige el signo que aparece con menor frecuencia, en este caso N+=20
5.3 Comparar el valor observado y el valor esperado aplicando la regla de decisión
63
Decisión estadística: Dado que rechazamos Ho podemos decir que el tiempo de reacción es diferente de 3.50. Conclusión: Existe suficiente evidencia estadística para decir que el tiempo de reacción al estímulo auditivo al que fueron expuestos los sujetos es diferente de 3.50 segundos. Nota: La prueba del signo para una muestra no puede calcularse en SPSS ya que se contiene este análisis sólo para el caso de 2 muestras.
64
Tabla E. VALORES CRITICOS DE N+ PARA LA PRUIEBA DEL SIGNO. La tabla puede usarse con todos los valores de n (si el número de observaciones apareadas es menor a 51. Ejemplo: para una prueba de dos colas con n = 16 y a = 0.05, rechazar la hipótesis nula si el valor obtenido de N+ es menor o igual que 3 o si el valor obtenido de N – es menor o igual que 3. Para una prueba de un cola con n = 16 y a = 0.05, si se necesita una prueba de cola inferior, rechazar la hipótesis nula si el valor de N+ es menor o igual que 4. si se necesita una prueba de cola superior, rechazar hipótesis nula si la N – obtenida es menor o igual que 4.
65
66
PRUEBA DE HIPOTESIS ESTADÍSTICAS PARA EL CASO DE DOS MUESTRAS: LA PRUEBA DE McNEMAR, LA PRUEBA DE WILCOXON, LA PRUEBA 2 COMO PRUEBA DE HOMOGENEIDAD Y LA PRUEBA U DE MANN-WHITNEY
67
PRUEBA DE McNemar PARA LA SIGNIFICACIÓN DE LOS CAMBIOS La prueba de McNemar para la significación de los cambios es aplicable a diseños antes-después, en donde cada sujeto se utiliza como su propio control. Puede emplearse para probar la efectividad de un tratamiento.
OBJETIVO Identificar si existen cambios significativos en la proporción de casos que presentan cierta característica medida antes y después de un tratamiento. SUPUESTOS 1. Variables discretas con escala de medida nominal u ordinal 2. Diseño antes y después 3. muestras relacionadas TIPO DE HIPÓTESIS A PROBAR Ho. An = De (No existen cambios significativos después de un tratamiento) Hipótesis alterna sin dirección Hi: An De (Si existen cambios significativos después del tratamiento) Hipótesis alterna con dirección Hi: An > De (Los valores antes del tratamiento son mayores a los valores después del tratamiento) Hi: An < De (Los valores antes del tratamiento son menores a los valores después del tratamiento) DISTRIBUCIÓN MUESTRAL Distribución X2 que proporciona los valores esperados con gl = 1 TIPO DE DATOS Frecuencia de cambios observados de la variable (VD) medida en dos momentos (antes y después de un tratamiento o VI). Los datos se agrupan en una tabla de contingencia de cuatro entradas en la siguiente forma
Por ejemplo: si medimos la actitud ante la educación sexual en las escuelas como a favor y en contra, antes y después d una sesión informativa. Al tomar la frecuencia en estas dos mediciones tendríamos:
68
Frec. Frec. Frec. Frec.
De De De De
aquellos que opinan a favor antes de la sesión informativa. quienes opinan en contra antes de la sesión informativa. quienes opinan a favor después de la sesión informativa. aquellos que opinan en contra después de la sesión informativa.
Los datos que se manejan en la prueba de McNernar son la frecuencia de cambios: - en contra + a favor A aquellos que están a favor al principio y después en contra B aquellos que siempre estuvieron en contra C aquellos que siempre estuvieron a favor D aquellos que están en contra al principio y después a favor.
EJEMPLO DE LA PRUEBA DE MCNEMAR PARA LA SIGNIFICACIÓN DE LOS CAMBIOS Se intenta identificar el efecto de los textos narrativos sobre la comprensión lectora en niños de 2° de primaria. Para este propósito participaron 24 niños a los que se les aplicó una prueba de comprensión lectora previa al entrenamiento. Una vez realizada esta evaluación se procedió al entrenamiento en comprensión con textos narrativos. Después de cinco sesiones se aplicó la misma prueba que en la evaluación anterior. Se registro la frecuencia de casos de comprensión ( + ) y no comprensión ( - ) en ambas evaluaciones (ver tabla 1). Probar la Hipótesis alterna de que existen mas cambios de no comprensión a comprensión después del entrenamiento.
69
SOLUCIÓN VI: Textos narrativos (entrenamiento) VD: Frec. De comprensión y no comprensión lectora (medida antes y después del entrenamiento) Paso 1. Establecer las hipótesis a probar Ho: No existen cambios significativos después del entrenamiento Hi: Existe mayor proporción de cambios de no comprensión a comprensión
lectora después del entrenamiento (An < De en la categoría de comprensió:n -1 Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe cambios significativos en la frecuencia de la comprensión lectora después de un entrenamiento, que los datos son nominales, se trata de un diseño antes y después (muestras relacionadas), se aplicará la prueba de McNemar para la significación de los cambios Paso 3. Especificar alfa Se empleará un = 0.05 tomando en consideración que tenemos muestras de tamaño 24. Paso 4. Región de Rechazo Dado que la hipótesis alterna es con dirección negativa la Ho podrá ser rechazada si el valor observado cae en el extremo izquierdo de la distribución X 2 (prueba unilateral) Paso 5. Decisión Para obtener el valor observado de X2 y tomar la decisión estadística se aplica el procedimiento con la fórmula de X2 de la prueba de McNemar.
5.1. Agrupar las frecuencias observadas en una tabla de contingencias.
A los que muestran comprensión antes pero no después (2) B los que comprenden antes y después (6) C los que no comprenden ni antes ni después (4) D los que no comprenden antes pero sí después (12)
5.2. Obtener el estadístico
70
5.3. Obtener X2 t y su probabilidad asociada
5.4. Comparar el valor observado y el valor esperado aplicando la regla de decisión
Dado que X2o > X2t , 0.05, gl 1; y en términos de probabilidad = 0.02 (valor asociado a X2o) es menor que el alfa elegido de 0.05, podemos rechazar la Ho descartar el azar como explicación de los datos. Decisión estadística: Dado que rechazamos Ho podemos decir que existe la probabilidad de observar mayor proporción de cambios .de no comprensión a comprensión lectora después del entrenamiento: (X 2 5.786, p = 0.02, gl=1) Conclusión Dada la evidencia estadística podemos decir que los textos narrativos incrementan la frecuencia de comprensión lectora en niños de 2° de primaria. PROCEDIMIENTO DE CALCULO DE X 2 PARA LA PRUEBA DE MCNEMAR UTILIZANDO SPSS A continuación se presentan los pasos a seguir para obtener la hoja de resultados de la prueba de McNemar.
Paso 1 Se elabora la base de datos Como los datos se presentan en una tabla de contingencias deben crearse tre., columnas, una para
71
la primera medición (antes), otra para la segunda medición (después) y una tercera para las frecuencias observadas. La nomenclatura de las etiquetas que definirán las celdillas tanto en la primera y segunda medición, debe ser la misma para señalar el cambio de antes a después en la base de datos. En el ejemplo tenemos que comprensión ( + ) y no comprensión ( -) en ambas evaluaciones; sin embargo, el programa sólo acepta variables numéricas, por lo tanto, en lugar del signo + emplearemos el valor 1 y para el signo - el valor 2. La definición de las variables y sus etiquetas se realiza como sigue (Ver figura 1): Desde el menú Data y el submenú Define variable: en esta ventana defines la siguiente información: Variable name: nombra la variable para la primera columna (sólo acepta 8 caracteres). En este caso la variable se llama antes.
Labels Para activar esta ventana das clic en el botón Labels de la ventana Define Variable.(ver figura 2). En este submenú capturas el nombre de la variable en label (aquí puedes poner el mismo nombre y especificarlo usando más de ocho caracteres.) En el recuadro value capturas el valor 1 y en el recuadro value label escribes comprensión.Das c iic en Add. Posteriormente capturas el valor 2 y escribes no comprensión. Das clic en Continue. Para cerrar la ventana Define variable das clic en OK. A continuación, defines la variable después de la misma forma que la variable antes, incluyendo las mismas etiquetas. Posteriormente defines la variable frecuencias escribiendo, sólo su nombre en Variable name (recuerda que sólo puedes usar 8 caracteres). Una vez definidas las variables se teclearán los valores conforme a la tabla. Para capturar los datos de la primera celda (A) escribiríamos 1 en la columna antes, 2 en la columna después y 2 en la columna frecuence; con esto indicamos que los sujetos que primero comprendían y luego no fueron solamente dos. Para la segunda celda (B) sería 1, 1, 6, los sujetos que comprendieron antes y después fueron seis. Para la tercera celda (C) 2, 2, 4, los sujetos que no comprendieron ni antes ni después fueron 4. Para la cuarta celda (D), 2, 1, 12, los sujetos que no comprendían antes pero después sí fueron 12 (ver figura).
72
Paso 2 Ponderar frecuencias Antes de proceder a realizar el análisis hay que hacer un paso p revio, el cual consiste en indicarle al programa que se analizarán las frecuencia . La secuencia de indicaciones es: Data
Weight cases: en esta ventana hay que seleccionar Weight cases: dar un clic en el círculo para activarlo. Frequency variable: pasar la variable frecuenc. Dar clic en OK (Ver ejemplo en la figura 5)
73
Una vez que se ha hecho la indicación mencionada se procede a correr el análisis siguiendo la ruta: Statistics (o Analize). Nonparametrics tests 2 related samples (ver figura 6 a)
En la ventana Two-Related Samples Test seleccionar las variables antes y después y pasarla al recuadro de Test Par(s) List dando clic en el botón que está en medio de ambos recuadros. Desmarcar Wilcoxon dando un clic en el cuadro correspondiente y dar clic en McNemar. Dar clic en OK (Ver figura).
74
En el caso de la prueba de McNemar si las frecuencias esperadas son menores a 5 se hace uso de la distribución binomial, si son iguales o mayores que 5 se utiliza la distribución X 2. Con base en esta consideración el programa presenta los datos de la binomial o de X2. Cuando proporciona los datos de la binomial sólo presenta la probabilidad de ocurrencia del estadístico (ver hoja de resultados de la página anterior), en el caso de X 2 presenta el valor del estadístico, sus grados de libertad y su probabilidad asociada (como se muestra al final de este párrafo).
75
Paso 4 Tomar la decisión estadística interpretando la hoja de resultados En el ejemplo se presentaron frecuencias esperadas menores a 5 por lo que el programa proporciona la probabilidad del estadístico con base en la distribución binomial, la cual fue .013. Como la probabilidad proporcionada es para una prueba bidireccional y en el ejemplo se plantea una prueba unidireccional, dicha probabilidad se divide en dos, así .01312= .0065; la cual es contrastada con el alfa de .05 indicada en el ejemplo. Aplicando la regla de decisión: Si p(spss) > Aceptamos Ho. Si p(spss) ≤ Rechazamos Ho. tenemos que . 0065 < .05 y por lo tanto rechazamos Ho. Dado que rechazamos Ho podemos decir que existe mayor proporción de cambios de no comprensión a comprensión lectora después del entrenamiento, y en consecuencia podemos concluir que los textos narrativos incrementan la frecuencia de comprensión lectora en niños de 2° de primaria. Cuando el programa proporcione los datos de la prueba de McNemar con base en la distribución X2 se reportan el valor del estadístico, sus grados de libertad y su probabilidad asociada, ésta última es la que se contrasta con el alfa establecido en el problema. Dichos datos en el ejemplo son: X2 = 12.893, gl = 1 y p < 0.0001 (dado que la probabilidad no puede ser igual a 0 se añade el número 1 y se especifica como menor que).
76
PRUEBA DE RANGOS SEÑALADOS Y PARES IGUALADOS T DE WILCOXON Esta prueba considera las diferencias relativas de pares de mediciones en cuanto magnitud y dirección, adjudicando mayor peso a las diferencias de gran magnitud que a las diferencias pequeñas entre pares. Se utiliza con mucho éxito en Psicología cuando deseamos saber que miembros de los pares tienen mayores diferencias y establecer rangos de las diferencias en orden de tamaño absoluto, es decir puede hacer juicios de mayor que entre los valores de cualquier par, asi como de las diferencias entre dos pares cualquiera. OBJETIVO Identificar si existen diferencias entre dos condiciones en términos de su magnitud y dirección en distribuciones ordinales de muestras relacionadas. En otras palabras, se comparan dos tratamientos o condiciones a las que se expone el mismo grupo de sujetos (un sujeto sirve como su propio control) o bien sujetos igualados por pares, para identificar si los efectos producidos por cada condición son diferentes. SUPUESTOS 1. Variable continua a Escala ordinal 2. Diseño de dos muestras relacionadas TIPO DE HIPÓTESIS A PROBAR Ho: A = B (No existen diferencias entre las condiciones A y B) Hipótesis alterna sin dirección Hi: A ≠ B (Existen diferencias significativas entre las condiciones A y B) Hipótesis alterna con dirección Hi: A > B (Los puntajes en la condición A son mayores que los puntajes de la condición B) Hi: A < B (Los puntajes en la condición A son menores que los puntajes de la condición B) DISTRIBUCIÓN MUESTRAL Distribución T de Wilcoxon que proporciona los valores esperados con n menos aquellas diferencias iguales a 0 para muestras menores a 25. Para muestras mayores a 25, se fundamenta en la lógica del área bajo la curva normal. TIPO DE DATOS Puntajes ordinales en dos condiciones de medición PROCED IMIENTO Para muestras menores o iguales a 25, los datos se ordenan por pares de observaciones para obtener la diferencia y asignar rangos que se transforman al valor T.
77
• Rango d: Se considera que el rango 1 será asignado a la diferencia más pequeña y el último rango corresponderá a la diferencia más grande. No se considera como dato el valor de diferencias igual a 0, y además el signo de la diferencia no tiene valor aritmético, es decir el 2 es igual que el -2. .
Debe respetarse el signo de la diferencia sólo para identificar cuál es aquel signo menos frecuente.
Si existen diferencias iguales (ligas) se asignará el rango promedio. Por ejemplo supongamos que existen las siguientes diferencias: 4, 7, 8, -5, 8, 2, - 3, 5, 6, 9, 3.
La N para usarlo como valor de tabla siempre será igual al número total de pares menos aquéllos cuya diferencia es igual a 0.
78
REGLA DE DECISIÓN Para N ≤ 25 Si To
Rechazamos la Ho
Se emplea la tabla de valores críticos T de Wilcoxon tomado en cuenta para la ubicación de la T de tablas un valor de a específico para una o dos colas y cierto valor de N. Para N > 25 Si p(Z) ≤ Rechazamos Ho Se emplea la tabla del área bajo la curva normal tomando el área menor. EJEMPLO PARA N ≤25 Se intenta identificar si la presentación de imágenes asociadas con palabras mejoran el aprendizaje gramatical de las mismas en niños de primer grado de primaria. Para tal propósito participaron en un estudio 14 niños de 6 años. En una primera condición se les presentó una lista de 8 palabras en el pizarrón. Posteriormente se les dictó la misma lista, registrándose como dato el número de palabras escritas correctamente. Los mismos niños fueron expuestos a una segunda condición donde se les presentó la misma lista de palabras acompañadas de sus respectivas imágenes, registrándose también el número de palabras escritas correctamente después del dictado. Probar la hipótesis alterna de que en la condición B los puntajes ordinales son más altos. SOLUCIÓN Variable Independiente: Forma de presentación de las palabras: Condición A: Palabras solas Condición B: Palabras e imágenes Variable Dependiente: Número de palabras escritas correctamente Paso 1. Establecer las hipótesis a probar Ho: A ≥ B Hi: A < B Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe diferencias entre las condiciones A y B, tenemos una Variable Dependiente en escala ordinal medida en dos condiciones, muestras relacionadas y N menor a 25, aplicaremos la prueba T de Wilcoxon para muestras pequeñas.
79
Paso 3. Especificar alfa muestras de tamaño 14. Paso 4. Región de Rechazo Dado que la Hipótesis alterna es con dirección negativa la Ho podrá ser rechazada si el valor observado cae en el extremo izquierdo de la distribución T de Wilcoxon (Prueba unilateral) Paso 5. Decisión Para obtener el valor observado de T y tomar la decisión estadística se aplica el procedimiento para N ≤ 25 Agrupar los datos en la tabla para obtener los rangos y el valor T como se muestra en la tabla 2
5.2 Obtener Tt Dado que la hipótesis alterna es unidreccional, se toma el valor de la tabla correspondiente con el nivel de significación de una cola. Se ubica entonces en la tabla y se intersecta con el tamaño de N (sin considerar todas aquellas diferencias iguales a 0).
80
5.3 Comparar el valor observado y el valor esperado aplicando la regla de decisión
Dado que To < Tt Rechazamos Ho.
Decisión estadística: Dado que rechazamos Ho podemos decir que las diferencias observados a favor de la condición A no son resultado del azar, es decir, se apoya estadísticamente la consideración de que los puntajes en la condición A son menores que los puntajes en la condición B (To 12; 0.05, N = 13) Conclusión. Existe suficiente evidencia estadística para considerar que la presentación de palabras e imágenes mejora el aprendizaje gramatical en niños de primero de primaria, por lo menos en esta muestra. EJEMPLO PARA N > 25 Tomando en consideración el ejemplo anterior, con una muestra de 28 niños de 4° de primaria, con una lista de 60 palabras. Probar la Ho de que las condiciones son iguales. SOLUCIÓN Variable Independiente: Forma de presentación de las palabras Condición A: Palabras solas Condición B: Palabras e imágenes Variable Dependiente: Número de palabras escritas correctamente Paso 1. Establecer las hipótesis a probar Ho: A = B Hi: A ≠ B Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe diferencias entre las condiciones A y B, que tenemos una Variable Dependiente a escala ordinal medida en dos condiciones, muestras relacionadas y N mayor a 25, aplicaremos la prueba T de Wilcoxon para muestras grandes. Paso 3. Especificar alfa Se empleará un a = 0.05 tomando en consideración que tenemos muestras de tamaño 28. Paso 4. Región de Rechazo
Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución normal (Prueba bilateral). Paso 5. Decisión
81
Para obtener el valor observado de T y tomar la decisión estadística se aplica el procedimiento para N > 25 5.1. Agrupar los datos en la tabla para obtener los rangos y el valor T como se muestra en la tabla 3
FORMULA
82
5.3. Obtener la p asociada a z con la tabla del área bajo la curva normal de área menor o más allá de z. En la tabla de la distribución normal, se encuentra la columna C que contiene el área bajo la curva más allá de z (Pagano, 1998). Para determinar p, primero se ubica el valor de z calculado en la primera columna, despreciando su signo. (si no aparece el valor exacto se considera el más cercano), posteriormente se continúa sobre el renglón del valor z identificado hasta la columna C, siendo el valor encontrado la probabilidad asociada al valor z. Cuando la prueba es de una cola se toma tal cual el valor encontrado ya que la tabla da los valores del extremo derecho, cuando la prueba es de dos colas la probabilidad se duplica para considerar los dos extremos. Para el ejemplo: p (z) = 0.0001 5.4. Comparar el valor observado contra el valor esperado y aplicar la regla de decisión Si p (z) ≤ 0.0001 < 0.05
Rechazamos Ho
Dado que p (z) es < que
podemos rechazar la Ho
Decisión estadística: Dado que rechazamos Ho podemos decir que las diferencias que existen entre ambas condiciones son significativas, es decir, descartamos el azar como explicación de dichas diferencias (T = 29.5; p = 0.0001, N = 27)
Conclusión. Existe suficiente evidencia estadística para considerar que la presentación de palabras e imágenes proporciona resultados diferentes que la presentación de sólo palabras, respecto del aprendizaje gramatical en niños de cuarto de primaria, por lo menos en esta muestra. PROCEDIMIENTO DE CALCULO DE T PARA LA PRUEBA DE WILCOXON UTILIZANDO SPSS Paso1 Se elabora la base de datos Para capturar los datos primero se definen dos variables, una para la primera condición y otra para la segunda con el siguiente procedimiento: Data Define variable Variable name: nombra la primera condición. En este caso es palabras solas. OK La segunda condición se define de la misma forma. En este caso su nombre es palabras e imágenes. Recuerda que sólo puedes emplear ocho caracteres. Una vez definidas las variables teclea los valores correspondientes en forma de lista (Ver figura).
83
Paso 2. Se obtiene el estadístico Statistics (o Analize). Nonparametrics tests 2 related simples En la ventana Two-Related Samples Test seleccionar las variables antes y después y pasarla al recuadro de Test Par(s) List dando clic en el botón que está enmedio de ambos recuadros. Verificar que esté seleccionada la prueba de Wilcoxon. Dar clic en OK (Ver figura).
84
HOJA DE RESULTADOS (OUTPUT NPar Tests Wilcoxon Signed Ranks Test
85
1. En este caso el signo de rangos menos frecuente es el negativo porque el programa le resta a la segunda condición la primera (paleimag - palabras). Paso 3 Tomar la decisión estadística interpretando la hoja de resultados En el ejemplo para muestras pequeñas tenemos que el valor de T es 12 y convertido a puntaje z es -2.359 con una probabilidad asociada de .018 para una prueba bidireccional. Como en el ejemplo se plantea una prueba unidireccional la probabilidad asociada al estadístico se divide en dos, así .01812=.009; por lo tanto, z=-2.359, p=.009 para una cola. Aplicando la regla de decisión: Si p(spss) > Aceptamos Ho. Si p(spss) ≤ Rechazamos Ho. tenemos que . 009 < .05, por lo que rechazamos Ho. Podemos concluir que existe suficiente evidencia estadística para considerar que la presentación de palabras e imágenes mejora el aprendizaje gramatical en niños de primero de primaria.
86
TABLA I
Valores críticos de T para la prueba ele rangos con sigue ele Wilcoxon
87
88
APE NDICE D TABLAS
89
90
APENDICE D TABLAS
91
92
PRUEBA X2 COMO PRUEBA HOMOGENEIDAD OBJETIVO Identificar si existe diferencias significativas entre grupos o muestras independientes La lógica de la prueba implica identificar si la diferencia entre la FE y la FO de cada una de las categorías es significativa como resultado de la diferencia entre los grupos independientes. En este caso se maneja una variable categórica como Variable dependiente y una variable categórica como variable independiente (cada categoría de esta última representa un grupo o muestra). También se puede manejar en diseños que no implican necesariamente VI-VD, si existe algún criterio de definición de grupos independientes donde se observe la ocurrencia de datos de variables categóricas. SUPUESTOS 1. Muestreo aleatorio 2. Distribución normal de los datos (El tamaño de la muestra probabiliza que la distribución de los datos sea aproximada a la normal de acuerdo con la Ley de los Grandes Números.) 3. Variables categóricas con escala de medida nominal 4. Muestras grandes (n ≥ 30) 5. Dos o más muestras independientes 6. F E > 5 (Debemos recordar que si las FE son menores de 5 en alguna de las categorías se aplica el procedimiento con corrección de Yates) TIPO DE HIPÓTESIS A PROBAR Ho: G1 = G2 = Gn (No existe diferencia entre los grupos) Hipótesis alterna sin dirección Hi: G1≠ G2 ≠ Gn (Existe diferencia entre los grupos) Hipótesis alterna con dirección Hi: G1 < G2 Hi: G1> G2 En este caso la hipótesis alternativa direccional se plantea con mayor precisión cuando existen dos grupos independientes; para el caso en donde existen más de dos grupos es preferible plantear hipótesis alternativa sin dirección DISTRIBUCIÓN MUESTRAL
Distribución X2 que proporciona los valores esperados para todas las muestras posibles obtenidas
en forma aleatoria. Con gl = (c - 1)(r - 1). Donde c es el número total de columnas y r el número total de renglones) se obtiene el valor crítico de X2 TIPO DE DATOS Frecuencias de casos observados en cada categoría propia de las variables medidas. Cada variable debe incluir por lo menos dos categorías mutuamente excluyentes (los grupos en el caso de esta prueba representan categorías) Las frecuencias observadas se vacían en una tabla de contingencias que mínimamente debe
93
ser de cuatro entradas (dos categorías para cada variable o grupo) TABLA DE CONTINGENCIA
OTRAS FÓRMULAS:
b) Cuando tenemos una tabla de contingencia de cuatro entradas puede utilizarse la siguiente ecuación
REGLA DE DECISIÓN Si X2o ≥ X2t,
gl Rechazamos Ho
0 bien, Si p (X 2 ) ≤ . -. Rechazamos Ho Se emplea la tabla de valores críticos X2 que nos proporciona el valor esperado o de tablas y su probabilidad asociada como lo revisamos en el caso de la prueba de Bondad de Ajuste EJEMPLO PRUEBA X2 COMO PRUEBA HOMOGENEIDAD
94
Se intenta identificar si existen diferencias entre las prácticas de crianza que adoptan padres con diferentes estilos de relación de pareja. Para tal propósito se tomaron en forma aleatoria tres muestras o grupos de 32 parejas cada uno. Cada grupo se diferenció por su estilo de relación de pareja. El grupo 1 lo constituían parejas con un estilo agape (relación apoyada en la razón); grupo 2 lo constituyeron parejas con un estilo eros (relación apasionada) y el grupo 3 fueron parejas con un estilo ludus (relación apoyada en el juego). Se aplicó un cuestionario para clasificar la práctica de crianza adoptado por cada pareja. Se registró la frecuencia de casos para cada una de las siguientes categorías: autoritario, permisivo, negociador según el grupo de pertenencia. Los datos observados se distribuyen normalmente en cada categoría. Probar si existen diferencias significativas entre los grupos.
SOLUCIÓN Variable Medida. Estilos de crianza Categorías: autoritarios, permisivos, negociadores Variable de agrupamiento: Estilos de relación de pareja que definen los grupos Categorías: agape (G1), eros (G2), ludus (G3) Paso 1. Establecer las hipótesis a probar Ho: G1 = G2 = Gn Hi: G1≠ G2:≠ Gn
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe diferencias entre grupos independientes con respecto a las prácticas de crianza adoptados, que los datos son nominales, las muestras son mayores a 30 y tomadas de forma aleatoria, la distribución de los datos es normal, las muestras son independientes y ninguna de las FE es menor a 5, se aplicará la prueba X 2 como prueba de homogeneidad
Paso 3. Especificar alfa N = 96
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (prueba unidireccional).
Paso 5. Decisión Para obtener el valor observado de X2 y tomar la decisión estadística se aplica el procedimiento con la fórmula de X 2. 5.1 Agrupar las frecuencias observadas en una tabla de contingencias y calcular las Frecuencias esperadas
95
Calculo de las FE
5.2 Obtener el estadístico
5.4 Comparar el valor observado y el valor esperado aplicando la regla de decisión
Dado que X2o (1.754) < X2 t
0.05, gl 4; podernos rechazar la Hi y aceptar la Ho; la probabilidad asociada al valor observado de ji cuadrada es cercano a 0.8 mucho mayor que el alfa elegido. Decisión estadística: Dado que rechazarnos Hi podemos decir que no existen diferencias significativas entre grupos (X20 = 1.754; a 0.05, g1 4), es decir, la decisión estadística tomada implica que las diferencias observadas entre grupos son resultado del azar y no de la variable de ag rupamiento.
96
Conclusión Dada la evidencia estadística podernos decir que no existen diferencias en las prácticas de crianza adoptados por padres con diferentes estilos de relación de pareja, por lo menos en las muestras observadas. PROCEDIMIENTO DE CÁLCULO MEDIANTE EL PAQUETE SPSS A continuación se presentan los pasos a seguir para obtener el estadístico de la prueba de X2 de homogeneidad. Para la decisión estadística se toma la regla de decisión: Si p(z) ≤ se rechaza la Ho Paso 1 Se elabora la base de datos Se definen tres columnas. Una de ellas especifica las categorías correspondientes a una variable (en este caso a los grupos), otra de las columnas corresponde a las categorías de la otra variable (en este caso prácticas de crianza). Ambas variables deben etiquetarse adecuadamente con números desde el 1 hasta k categorías; la tercera columna corresponde a las FO. Una vez definidas se vacían los datos combinando las categorías de grupo y de la otra variable, es decir la base de datos debe quedar como la tabla de contingencia. Recuerda que para definir las variables usamos el menú Data y el submenú Define Variable y para etiquetar usamos !a opción label como se muestra en la figura siguiente Así la base de datos debe representar la tabla de contingencia con renglones y columnas (Ver figura)
Paso 2 Ponderar frecuencias En todos los casos de ji cuadrada deben ponderarse las frecuencias desde el menú Data Weight Cases Weight Cases by Pasar la variable FO (Ver figura 10)
97
Como se muestra en la figura, en la ventana de la prueba se señala cual es la variable que corresponde a los renglones o Row (en este caso prácticas), cual es la variable que corresponde a las columnas o Columns (en este caso grupos). Una vez definido lo anterior se da un click a Statistics en esta ventana y se pide la prueba chisquare. Se oprime Continue y para finalizar Ok para que aparezca el output.
Paso 3 Obtener el estadístico Desde el menú Statistics Sumarize Crosstabs se inicia el procedimiento para la X2 de homogeneidad (Ver figura)
98
Paso 4 Tomar la decisión estadística interpretando la hoja de resultados
Con los datos obtenidos como lo muestra la hoja de resultados podemos decir lo siguiente: Al aplicar la prueba X2 de homogeneidad para comparar las prácticas de crianza que adoptan los padres de tres grupos distintos se observo un valor X2 (4) = 1.748 con una probabilidad asociada de 0.789. Dado que el valor de la probabilidad es mayor al alfa elegido (0.05) se acepta la Ho, por lo tanto no existen diferencias estadísticamente significativas entre los grupos con respecto a sus prácticas de crianza. Hoja de resultados datos del análisis de X2
99
100
PRUEBA U DE Mann Whitney OBJETIVO Identificar si dos muestras independientes pertenecen a la misma población o a distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribución de dos muestras independientes es semejante o diferente. La lógica de la prueba implica identificar el orden de los datos según su valor de menor a mayor que de cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho. Esta prueba se aplica cuando se tienen diseños de dos grupos independientes que pueden ser: dos grupos experimentales; un grupo control y otro experimental; dos grupos de sujetos definidos por variables atributivas, entre otros. SUPUESTOS 1. Variables continuas 2. Escala Ordinal 3. Dos muestras independientes 4. Muestreo aleatorio (Es importante señalar que si el muestreo no fue probabilístico, puede aplicarse la prueba U si los sujetos a cada grupo son asignados aleatoriamente o bien puede aplicarse una prueba de aleatoriedad para identificar la misma en los datos y cubrir el supuesto.) TIPO DE HIPÓTESIS A PROBAR Hipótesis Nula: Ho: No existen diferencias significativas entre la distribución de la muestra 1 respecto de la distribución de
la muestra 2. (G1 = G2)
Hipótesis alterna sin dirección Hi: Si existen diferencias significativas entre la distribución de la muestra 1 respecto de la distribución de
la muestra 2. (G1 ≠ G2)
Hipótesis alterna con dirección Hi: G1 > G2 Hi: G, < G2, DISTRIBUCIÓN MUESTRAL Distribución U de Mann-Whitney que proporciona los valores esperados para todas las muestras posibles obtenidas al azar de tamaño N <_ 20; Para N > 20 los valores esperados los proporciona el área bajo la curva normal. TIPO DE DATOS Puntajes ordinales correspondientes a dos grupos independientes Ahora bien, esta prueba puede aplicarse a datos de muestras de diferente tamaño sin alterar su potencia- eficiencia: no obstante los procedimientos y la regla de decisión cambia conforme aumenta el tamaño de n 2 (siendo n2 el grupo independiente mas grande de los dos comparados y n1 la muestra mas pequeña).
101
PROCEDIMIENTOS El caso de n 2 < 20 1. Se construye una tabla de rangos para cada muestra (tales rangos se asignan considerando el orden jerárquico y la ligas o datos iguales para los datos agrupados de todas las observaciones, es decir combinando en cada muestra)
Donde R1 es la suma de los rangos correspondientes a los puntajes de n1 y R2 es la suma de los puntajes de n2 2. Se calcula el valor de U mediante las siguientes fórmulas:
Donde U' es el valor mas grande entre U1 y U2 REGLA DE DECISIÓN Si Uo
Rechazamos la Ho
La Ut se obtiene de la tabla de valores críticos de U de Mann -Whitney considerando el tamaño de n1 y n2 para un nivel de significación particular. EN EL CASO DE N2 > 20 1. Se aplica el mismo procedimiento anteriormente descrito para obtener U 2. Una vez obtenido el valor de U se aplica las siguientes fórmulas según el caso de: Fórmula para datos no ligados
102
3. Se identifica la p(z) con la tabla de valores del área bajo la curva normal más allá de z REGLA DE DECISIÓN Si p(Z) ≤ Rechazamos Ho EJEMPLO PARA n 2 ≤ 20 Un investigador está interesado en identificar si la presencia o ausencia de retroalimentación constante durante la enseñanza de las matemáticas afectan diferencialmente el aprendizaje de las mismas. Participaron en el estudio 30 estudiantes de secundaria asignados aleatoriamente a dos grupos independientes. El primer grupo o grupo control no recibió retroalimentación durante la práctica de matemáticas y el grupo 2 o experimental recibió retroalimentación constante durante la práctica. A ambos grupos se les aplicó un examen al final de la práctica que constaba de 80 preguntas. Con los datos probar la hipótesis nula de que no existen diferencias entre grupos
103
SOLUCIÓN Variable Independiente: Retroalimentación continua Grupo Control: Sin retroalimentación Grupo experimental: Con retroalimentación Variable Dependiente: Número de respuestas correctas en el examen
Paso 1. Establecer las hipótesis a probar Ho: G1 = G2 Hi: G1 ~ G2
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existen diferencias entre los grupos como resultado de la intromisión de la variable independiente (retroalimentación continua en el GE), que tenemos una Variable Dependiente (Número de respuestas correctas) continua a escala ordinal, dos muestras independientes y n2 es menor a 20, aplicaremos la prueba U de Mann-Whitney para muestras pequeñas.
Paso 3. Especificar alfa
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (Prueba bilateral).
Paso 5. Decisión Para obtener el valor observado de U y tomar la decisión estadística se aplica el procedimiento para n _< 20
5.1 Estructurar la tabla de rangos n1 = GC y n2 = GE Tabla 4. Datos correspondientes a las puntuaciones de los grupos
104
5.2 Calcular U aplicando las fórmulas:
5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisión 101.5 > 64
Rechazamos Ho.
Dado que Uo es mayor a Ut rechazamos Hi Decisión estadística: Dado que rechazamos Hi podemos decir que no existen diferencias significativas entre los grupos (U 101.5, a 0.05), es decir que las diferencia observadas en los puntajes del grupo control respecto del grupo experimental son resultado del azar. Conclusión Existe evidencia estadística que sugiere que la presencia o ausencia de retroalimentación no afectan diferencialmente el desempeño en pruebas de matemáticas en estudiantes de secundaria, por lo menos en esta muestra EJEMPLO PARA n2 > 20 El mismo estudio se realizó con estudiantes de 6° de primaria con el mismo propósito, sólo que se empleó una muestra mayor de sujetos Participaron en el estudio 60 estudiantes de primaria elegidos en forma aleatoria y asignados al azar al grupo control y al grupo experimental. El resto de las condiciones fueron las mismas que en el estudio con estudiantes de secundaria. Con los datos probar la Ho correspondiente.
105
SOLUCIÓN Variable Independiente: Retroalimentación continua Grupo Control: Sin retroalimentación Grupo experimental: Con retroalimentación Variable Dependiente: Número de respuestas correctas en el examen
Paso 1. Establecer las hipótesis a probar Ho: G1 = G2 Hi: G1 G2
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existen diferencias entre los grupos como resultado de la intromisión de la variable independiente (retroalimentación continua en el GE), que tenemos una Variable Dependiente (Número de respuestas correctas) continua a escala ordinal, dos muestras independientes y n2 es mayor a 20, aplicaremos la prueba U de Mann-Whitney para muestras grandes.
Paso 3. Especificar alfa Se empleará un = 0.05 tomando en consideración que N = 30
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (Prueba Bilateral).
Paso 5. Decisión Para obtener el valor observado de U y tomar la decisión estadística se aplica el procedimiento para n > 20
106
5.2 Estructurar la tabla de rangos n 1 = GC y n 2 = GE
5.3 Dado que n2 > 20 se aplica la fórmula de z para obtener la pro babilidad asociada a U mediante el área, bajo la curva más allá de z
107
5.5 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisión
Decisión estadística: Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos que no pueden ser atribuidas al azar (z = -5.56, p < 0.0001)
Conclusión Existe evidencia estadística que sugiere que la presencia o ausencia de retroalimentación afectan diferencialmente el desempeño en pruebas de matemáticas en estudiantes de primaria, por lo menos en esta muestra.
Conclusión general Podemos decir que la retroalimentación continua tiene efectos significativos sobre el número de respuestas correctas en una prueba de matemáticas en estudiantes de 6° de primaria pero no así en estudiantes de secundaria.
108
PROCEDIMIENTO DE CÁLCULO MEDIANTE EL PAQUETE SPSS (el procedimiento es el mismo independientemente del tamaño de n2) A continuación se presentan los pasos a seguir para obtener el estadístico de la prueba de U de MannWhitney. Se tomará el ejemplo de los grupos de primaria de las páginas anteriores. Para la decisión estadística se toma la regla de decisión. Si p(z) ≤ se rechaza la Ho
Paso 1 Se elabora la base de datos Se definen dos columnas. Una de ellas se denomina grupos y se especifican los grupos de pertenencia con los valores 1 y 2; la otra columna corresponde a los puntajes de cada sujeto para ambos grupos. Debemos definir la variable grupo etiquetando debidamente y puntaje sin etiquetas. Recuerda que para definir las variables debes entrar a la ventana de Define Variable desde el menú Data. Una vez en la ventana de definir variable se etiqueta desde la opción Label (Ver figura)
Así la base de datos debe tener una columna de grupos y otra de puntajes como se muestra en la figura.
109
Pase 2 Obtener el estadístico Como se muestra en la figura se pide el estadístico desde el menú Statistics Nonparametric tests 2 Independent samples
En la ventana de !a prueba se señala cual es la variable que se va a probar este caso puntaje) cual es la variable que corresponde a los grupos. Una vez asignada la varíale grupos en la ventana se activa un botón para definir grupos (en términos de la Atiquetación que se asignó en la base de datos), se da un clic y se escribe el número que corresponde a cada gi-upo.
110
Una vez definido lo anterior se da un click a la opción , de la prueba U aparece en el menú de pruebas y para finalizar Ok (Ver figura 16) para que aparezca la hoja de resultados o el output,
111
Paso 4 Tomar la decisión estadística interpretando la hoja de resultados Al aplicar la prueba U de Mann-Whitney para comparar el número de respuestas correctas en la prueba de matemáticas entre el grupo control y el grupo experimental encontramos que la p(U) < 0.0001 y dado que es menor al alfa elegido rechazamos Ho.
Decisión estadística. Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos no atribuibles al azar (z = -5.45, p < 0.0001)
Conclusión Existe evidencia estadística que sugiere que la presencia o ausencia de retroalimentación afectan diferencialmente el desempeño en pruebas de matemáticas en estudiantes de primaria, por lo menos en esta muestra.
112
113
APÉNDICE D TABLAS
114
115
116
PRUEBA DE HIPOTESIS ESTADÍSTICAS PARA EL CASO DE K MUESTRAS: LA PRUEBA FRIEDMAN LA PRUEBA KRUSKALL-WALLIS
117
PRUEBA DE FRIEDMAN OBJETIVO Identificar si tres o más muestras relacionadas o igualadas (k muestras) pertenecen a la misma población o a distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribución de tres o más muestras relacionadas es semejante o diferente. La lógica de la prueba implica identificar el orden de los datos según su valor de menor a mayor que dé cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho. Esta prueba se aplica cuando se tienen diseños en los que un mismo sujeto es medido tres o más veces o cuando sujetos diferentes son igualados en varias variables y se asignan de manera aleatoria a cada una de las condiciones, de tal suerte que se consideran como una misma fuente de observación de la cual se obtienen k medidas. SUPUESTOS 1. Variable continua 2. Escala Ordinal para la variable medida 3. Tres o más muestras relacionadas TIPO DE HIPÓTESIS A PROBAR Ho: No existen diferencias significativas entre la distribución de las distintas muestras (G1 = G2= G3 = ....Gk) Hipótesis alterna sin dirección Hi: Si existen diferencias significativas entre la distribución de las muestras. (G1:≠ G2 ≠ G3 ≠.... Gk ) DISTRIBUCIÓN MUESTRAL Distribución Xr2 que proporciona los valores esperados para muestras pequeñas y la distribución X2 proporciona los valores esperados para muestras grandes. TIPO DE DATOS Puntajes ordinales correspondientes a los k grupos relacionados. PROCEDIMIENTOS Muestras pequeñas (k=3 ó 4 y n<9) 1. Se ordenan los puntajes en una tabla de dos clasificaciones de k columnas (condiciones) y N renglones (sujetos). En cada renglón se asigna a cada observación el rango que le corresponda de manera ascendente (al valor más pequeño se le asigna el rango 1, al valor que le sigue el rango 2 y así sucesivamente) considerando las ligas. 2. Una vez asignados los rangos se calcula para cada condición la suma de los rangos y/ o su rango promedio.
118
Donde R1 es la suma de los rangos correspondientes a los puntajes de C 1 y R2 es la suma de los rangos de C2, etc. R1 es el rango promedio de C1, el cual se calcula dividiendo R1 entre el número de observaciones que tiene C 1.
3. Se calcula el valor del estadístico X r2 (o Fr) mediante la siguiente fórmula:
4. Se obtiene el valor esperado de X {2 (Xr2t) de la tabla de valores críticos de X r2 considerando el número de condiciones (k) y el número de renglones (N) para un nivel de significación particular. REGLA DE DECISIÓN Si Xr 2o ≥ Xr2t, Rechazamos la Ho MUESTRAS GRANDES (K ≥ 4 Y/O N ≥ 6) 1. Se aplica el mismo procedimiento anteriormente descrito para obtener Xr2 si no hay ligas en la muestra. 2. Si existen ligas Xr2 se calcula con la fórmula siguiente:
La fórmula para datos ligados se aplica, aún en muestras pequeñas, cuando existe el 25% o más de observaciones ligadas, y particularmente cuando algunos valores de t son grandes; por ejemplo cuando t=6. 3. Se obtiene el valor esperado de X r2 (Xr2 t) de la tabla de valores críticos de X 2 con gl= k-1 para un nivel de significación particular, donde k = número de condiciones (o muestras relacionadas). REGLA DE DECISIÓN
COMPARACIONES MÚLTIPLES
119
Xr2 sólo indica si las condiciones difieren o no entre sí en términos generales. Cuando Xr2 es significativo, es decir, se rechaza la hipótesis nula, X r2 sólo indica que existen diferencias en la variable dependiente según la condición pero no especifica cuáles son las condiciones en los que se observan tales diferencias. Para ello es necesario hacer comparaciones entre pares de condiciones para detectar entre qué par está dada la diferencia. PROCEDIMIENTO 1.
Determinar el número de comparaciones a realizar.
2. Obtener la diferencia absoluta, es decir, haciendo caso omiso del s igno, de los rangos promedio en cada comparación.
3. Calcular la diferencia crítica (DC). Como el número de casos (N) es el mismo en todas las condiciones sólo se calcula una diferencia crítica.
se obtiene de la tabla A II intersectando el número de comparaciones calculado en el paso 1 con el nivel de significancia especificado. 4. Comparar la diferencia de los rangos promedio con la diferencia crítica. La diferencia observada en el par comparado es significativa si es mayor o igual a DC. 5. Determinar a favor de quién está la diferencia en el par comparado mediante la observación de sus rangos promedio.
EJEMPLO PARA MUESTRAS PEQUEÑAS En una institución educativa se ponen a prueba tres métodos de enseñanza para mejorar la ejecución en tareas de solución de problemas matemáticos, en alumnos de educación media superior. Con tal fin se seleccionaron al azar 5 sujetos quienes fueron expuestos a los tres métodos a intervalos de dos semanas. Al término de la implementación de cada método cada sujeto resolvió un examen de problemas matemáticos y se registró el número de respuestas correctas (datos en la tabla 1) a .05, determine si existen diferencias entre los métodos y cuál de ellos es el que debe implementarse. Se sabe que la distribución de los datos en cada muestra no presenta normalidad.
120
SOLUCIÓN Variable Independiente: Tipo de método Contiene tres niveles: método1, método2, método3 Variable Dependiente: Número de respuestas correctas en el examen
Paso 1. Establecerlas hipótesis aprobar
Paso 2. Elegirla prueba estadística Dado que nos interesa identificar si existe diferencias entre las condiciones como resultado de la intromisión de la variable independiente (tipo de método), que tenemos una Variable Dependiente (Número de respuestas correctas) continua en escala ordinal, tres muestras relacionadas y el tamaño de N es igual a 5, aplicaremos la prueba de Friedman para muestras pequeñas.
Paso 3. Especificar alfa Se empleará un
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (Prueba Bilateral)
Paso 5. Decisión Para obtener el valor observado de Xr2 y tomar la decisión estadística se aplica el procedimiento para muestras pequeñas.
5.1 . Asignación de rangos para las observaciones de cada renglón por separado. Calcular en cada muestra la suma de rangos y el rango promedio.
121
5.2 Calcular Xr2 aplicando la fórmula: En este ejemplo sólo existe una liga y su.efecto puede despreciarse, por lo que se aplicará la fórmula sin datos ligados.
SUSTITUIMOS 5.3 Obtener el valor de Xr2t,a, n1, n2, n3
5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisión
Dado que Xr2o es mayor a Xr2t rechazamos Ho Decisión estadística: Dado que rechazamos Ho podemos decir que existen diferencias significativas no atribuibles al azar entre los distintos métodos (X r2= 7.95, = 0.05). Como Xr2o resultó significativa se procede a realizar comparaciones múltiples para determinar las diferencias entre los pares de métodos.
Paso 6. Comparaciones múltiples 6.1.
Determinar el número de comparaciones a realizar.
6.2.
Obtener la diferencia absoluta , es decir, haciendo caso omiso del signo, de los rangos promedio en cada comparación.
122
6.3.
Calcular la diferencia crítica (DC). Como el tamaño de las muestras es igual sólo se calcula una diferencia crítica.
se obtiene de la tabla AII intersectando el número de comparaciones calculado en el paso 1 con el nivel de significancia especificado. En este caso 3 comparaciones con un alfa de .05 para una prueba bidireccional (sólo se desea saber si hay diferencias entre los dos métodos que se comparan, no se especifica una dirección). Z/k(k-1) = 2.394
7. Comparar la diferencia de los rangos promedio con la diferencia crítica. La diferencia observada en el par comparado es significativa si es mayor o igual a DC.
8. En el par comparado cuya diferencia resultó significativa determinar a favor de quién está la diferencia mediante la observación de sus rangos promedio. IM1 - M3I = 2.7 - 1.0 = 1.7 > 1.51 Como la variable dependiente está medida en términos del número de respuestas correctas, un puntaje alto indica un mejor desempeño, así el método en el cual se encuentra un rango promedio alto indica que fue más efectivo para mejorar la ejecución. La diferencia entre los rangos promedio del método 1 y el 3 resultó significativa siendo el método 1 el que presenta un rango promedio más alto, por lo que puede decirse que este método es más efectivo que el método3. Conclusión Existe evidencia estadística que indica que hay diferencias significativas en la ejecución de problemas matemáticos según el método empleado, específicamente entre el método 1 y el método 3, de los cuales el método 1 es el más efectivo, por lo que podría decirse que éste es el más conveniente para implementarse. EJEMPLO PARA MUESTRAS GRANDES Se realizó un estudio semejante al anterior y con el mismo propósito, sólo que se empleó una muestra mayor de sujetos y se probaron 4 métodos de enseñanza en lugar de tres (datos en la tabla 3) Participaron en el estudio 10 estudiantes de educación media superior, quienes fueron expuestos a los cuatro métodos. Con los datos probar la Ho correspondiente.
123
SOLUCIÓN Variable Independiente: Tipo de método Contiene cuatro niveles: método1, método2, método3, método4 Variable Dependiente: Número de respuestas correctas en el examen
Paso 1. Establecer las hipótesis a probar
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe diferencias entre las cuatro condiciones como resultado de la intromisión de la variable independiente (tipo de método), que tenemos una Variable Dependiente (Número de respuestas correctas) continua en escala ordinal, cuatro muestras relacionadas y el tamaño de N es igual a 10, aplicaremos la prueba de Friedman para muestras grandes.
Paso 3. Especificar alfa Se empleará un a = 0.05.
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (Prueba Bilateral).
Paso 5. Decisión
124
Para obtener el valor observado de X r procedimiento para muestras grandes.
2
y tomar la decisión estadística se aplica el
5.1. Asignación de rangos para todas las observaciones de cada renglón por separado. Calcular en cada muestra la suma de rangos y el rango promedio. 5.2 Calcular Xr 2 aplicando la fórmula: En este ejemplo se aplica la fórmula para las ligas ya que el 35% de los datos están ligados.
En esta fórmula las ligas consideran valores de t=1. Para cada renglón determinaremos las ligas existentes y los valores de t.
125
SUSTITUIMOS
5.4. Obtener el valor de Xr2 t,a, n1, n2, n3, n4 Como n y k exceden los valores que se pueden consultar en la tabla para muestras pequeñas, se empleará la distribución X2 con gl=k-1.
126
5.5 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisión
Dado que Xr2 o es menor X2 aceptamos Ho Decisión estadística: Dado que aceptamos [lo podemos decir que no existen diferencias significativas entre los distintos métodos, es decir, que las diferencias observadas son resultado del azar. Como Xr2 o resultó no significativa no se procede a realizar comparaciones múltiples para determinar las diferencias entre los pares de métodos. Conclusión No existe evidencia estadística que sugiera que hay diferencias significativas en el rendimiento en la ejecución de problemas matemáticos según el método empleado, por lo que podría decirse que los cuatro métodos producen el mismo efecto en el rendimiento. PROCEDIMIENTO DE CÁLCULO MEDIANTE EL PAQUETE SPSS (el procedimiento es el mismo independientemente del número y tamaño de las muestras) A continuación se presentan los pasos a seguir para obtener el estadístico de la prueba de Friedman. Se tomará el ejemplo de muestras pequeñas. Para la decisión estadística se toma la regla de decisión: Si p(X2) ≤ se rechaza la Ho
Paso 1 Se elabora la base de datos Se definen k columnas. Cada una de ellas corresponde a una condición en la cual se capturan los puntajes de cada sujeto en esa condición (Ver figura). Definir cada columna con el nombre de la condición correspondiente sin etiquetas (Ver figura).
127
Figura 2. Ejemplo de la base de datos para la prueba de Friedman Paso 2 Obtener el estadístico Desde el menú Statistics Nonparametrics test
128
K Related Samples (Ver figura) En la ventana de la prueba se señala cuales son las variables que se van a probar (en este caso las columnas de los puntajes de cada una de las condiciones), seleccionando todas las variables a probar y pasándolas al recuadro de Tests Variables (Ver figura). Una vez hecho lo anterior se verifica que en el menú de pruebas esté seleccionada la opción Friedman, puesto que el programa la tiene ya seleccionada. Para finalizar se da clic en Ok para que aparezca la hoja de resultados (Figura).
129
Fig. 5 Ventana principal de la prueba de Friedman
Paso 3. Tomar la decisión estadística interpretando la hoja de resultados Al aplicar la prueba de Friedman para comparar el número de respuestas correctas en el examen de problemas matemáticos entre los tres métodos encontramos que la p(X 2) < 0.05 y dado que es menor al alfa elegido rechazamos Ho. Decisión estadística: Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los métodos (X 2 = 8.316, p = 0.016). Como se rechaza la hipótesis de nulidad es necesario hacer las comparaciones múltiples para determinar entre que par de métodos se encuentra la diferencia. En vista de que el programa no proporciona dicha información es necesario calcularlas a mano (ver sección de comparaciones múltiples), para lo cual se pueden retomar los valores de los rangos promedios que proporciona el programa en la tabla titulada Ranks para calcular las diferencias entre éstos.
Conclusión Existe evidencia estadística que indica que hay diferencias significativas en el rendimiento en la ejecución de problemas matemáticos según el método empleado, específicamente entre el método 1 y el método 3, de los cuales el método 1 es el más efectivo, por lo que podría decirse que éste es el más conveniente para implementarse.
130
Tabla M. Valores críticos para la prueba estadística de análisis (de varianza bifactorial por rangos de Friedman).
131
* # c es el número de comparaciones.
132
PRUEBA DE KRUSKAL-WALLIS OBJETIVO Identificar si tres o más muestras independientes (k muestras) pertenecen a la misma población o a distintas poblaciones; en otras palabras esta prueba nos permite determinar si la distribución de tres o más muestras independientes es semejante o diferente. La lógica de la prueba implica identificar el orden de los datos según su valor de menor a mayor que de cada uno de los grupos. Se asignan rangos para cada valor y se obtiene el rango promedio de cada grupo, si la diferencia entre tales promedios de rangos es significativa entonces se puede rechazar la Ho. Esta prueba se aplica cuando se tienen diseños de tres o más grupos independientes que pueden ser: dos o más grupos experimentales y uno control o tres o más grupos de sujetos definidos por variables atributivas, entre otros. SUPUESTOS 1. Variable continua 2. Escala Ordinal para la variable medida 3. Tres o más muestras independientes 4. Muestreo aleatorio. (Es importante señalar que si el muestreo no fue probabilístico, puede aplicarse la prueba de Kruskal-Wallis si los sujetos son asignados aleatoriamente a cada grupo o bien puede aplicarse una prueba de aleatoriedad para identificar la misma en los datos y cubrir el supuesto). TIPO DE HIPÓTESIS A PROBAR Ho: No existen diferencias significativas entre la distribución de las distintas muestras (G1 =G2=G3=....Gk) Hipótesis alterna sin dirección Hi: Si existen diferencias significativas entre la distribución de las muestras. (G1 ≠ G2 ≠ G3 ≠ . . . . Gk) DISTRIBUCIÓN MUESTRAL Distribución H que proporciona los valores esperados para muestras pequeñas y la
distribución X2 proporciona los valores esperados para muestras grandes. TIPO DE DATOS
Puntajes ordinales correspondientes a los k grupos independientes. Esta prueba puede aplicarse a datos de muestras de diferente tamaño sin alterar su potenciaeficiencia, PROCEDIMIENTOS Muestras pequeñas (k=3 y n ≤ 5) 1. Todas las muestras se consideran como una sola y a cada observación se le asigna el rango que le corresponda de manera ascendente (al valor más pequeño se le asigna el rango 1, al valor que le sigue el rango 2 y así sucesivamente) considerando las ligas o datos iguales.
133
2. Una vez asignados los rangos se calcula para cada muestra la suma de los rangos y su rango promedio.
Donde R1 es la suma de los rangos correspondientes a los puntajes de n1 y R 2 es la suma de los rangos de n2, etc. R 1 es el rango promedio de n1, el cual se calcula dividiendo R1 entre el número de observaciones que tiene n1. 3. Se calcula el valor del estadístico H (o KW) mediante la siguiente fórmula:
4 Se obtiene el valor esperado de H (Ht) de la tabla de valores críticos de H considerando el número de muestras (k) y el tamaño de cada una de ellas (n) para un nivel de significación particular. REGLA DE DECISIÓN Si Ho ≥Ht Rechazamos la Ho 4. Calcular la diferencia crítica (DC). Si el tamaño de las muestras es igual sólo se calcula una diferencia crítica, si el tamaño es diferente se calcula la diferencia crítica correspondiente a cada par.
Zk(k-1) se obtiene de la tabla AII intersectando el número de comparaciones calculado en el paso 1 con el nivel de significancia especificado. 6. Comparar la diferencia de los rangos promedio con la diferencia crítica. La diferencia observada en el par comparado es significativa si es mayor o igual a DC. 7.
Determinar a favor de quién está la diferencia en el par comparado mediante la observación de sus rangos promedio.
EJEMPLO PARA MUESTRAS PEQUEÑAS En una institución educativa se ponen a prueba tres métodos de enseñanza para mejorar la ejecución en tareas de solución de problemas matemáticos, en alumnos de educación media superior. Con tal fin se asignan al azar 5 sujetos a cada uno de los tres métodos. Al término de la implementación de cada método cada sujeto resuelve un examen de problemas matemáticos y se registra el número de respuestas correctas (datos en la tabla 5). Usando un alfa igual a .05, determine si existen diferencias entre los
134
métodos y cuál de ellos es el que debe implementarse. Se sabe que la distribución de los datos en cada muestra no presenta normalidad.
SOLUCIÓN Variable Independiente: Tipo de método Contiene tres niveles: método1, método2, método3 Variable Dependiente: Número de respuestas correctas en el examen
Paso 1. Establecerlas hipótesis aprobar
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe diferencias entre los grupos como resultado de la intromisión de la variable independiente (tipo de método), que tenemos una Variable Dependiente (Número de respuestas correctas) continua en escala ordinal, tres muestras independientes y el tamaño de las muestras es igual a 5, aplicaremos la prueba de Kruskal-Wallis para muestras pequeñas. Paso 3. Especificar alfa Se empleará un = 0.05.
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (Prueba Bilateral). Paso 5. Decisión Para obtener el valor observado de H y tomar la decisión estadística se aplica el procedimiento para muestras pequeñas. 5.1 . Asignación de rangos para todas las observaciones como si se tratara de una sola muestra. Calcular en cada muestra la suma de rangos y el rango promedio.
135
5.3 Calcular H aplicando la fórmula: En este ejemplo podría aplicarse la fórmula para las ligas ya que más del 25% de los datos están ligados (hay 9 datos ligados de un total de 15 lo cual representa el 60%); sin embargo, los valores de t son pequeños: existen 4 ligas, la primera con los puntajes de 5 con un valor de t=2 (el 5 aparece dos veces), la segunda con los puntajes de 7 con t=2 (el 7 aparece dos veces), la tercera con los puntajes de 9 con t=3 (el 9 aparece tres veces) y la cuarta con los puntajes de 10 con t=2 (el 10 aparece dos veces). Debido a que los valores de t son tan pequeños el efecto de las ligas resulta despreciable, por lo cual se aplicará la fórmula sin datos ligados.
SUSTITUIMOS 5.3 Obtener el
5.4 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisión Si Ho ≥ Ht, Rechazamos Ho. 10.715 > 5.78 Dado que Ho es mayor a Ht rechazamos Ho
136
Decisión estadística: Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los distintos métodos no atribuibles al azar (H= 10.715, 0.05). Como Ho resultó significativa se procede a realizar comparaciones múltiples para determinar las diferencias entre los pares de métodos. Paso 6. Comparaciones múltiples 8.1.
Determinar el número de comparaciones a realizar.
8.2. Obtener la diferencia absoluta, es decir, haciendo caso omiso del signo, de los rangos promedio en cada comparación.
8.3. Calcular la diferencia crítica (DC). Como el tamaño de las muestras es igual sólo se calcula una diferencia crítica.
Z -1) se obtiene de la tabla A„ intersectando el número de comparaciones calculado en el paso 1 con el nivel de significancia especificado. En este caso 3 comparaciones con un alfa de .05 para una prueba bidireccional (sólo se desea saber si hay diferencias entre los dos métodos que se comparan, no se especifica una dirección). (k-1) = 2.394 DC = 2.394< [(15(15+1))!12] (115 + 115) = 6.75 9. Comparar la diferencia de los rangos promedio con la diferencia crítica. La diferencia observada en el par comparado es significativa si es mayor o igual a DC. r
10. En el par comparado cuya diferencia resultó significativa determinar a favor de quién está la diferencia mediante la observación de sus rangos promedio.
Como la variable dependiente está medida como el número de respuestas correctas, un puntaje alto indica un mejor desempeño, así el método en el cual se encuentra un rango promedio alto indica que fue más efectivo para mejorar la ejecución. La diferencia entre los rangos promedio del método 1 y el 3 resultó significativa siendo el método 1 el que presenta un rango promedio más
137
alto, por lo que puede decirse que este método es más efectivo que el método3.
Conclusión Existe evidencia estadística que indica que hay diferencias significativas en el rendimiento en la ejecución de problemas matemáticos según el método empleado, específicamente entre el método 1 y el método 3, de los cuales el método 1 es el más efectivo, por lo que podría decirse que éste es el más conveniente para implementarse.
EJEMPLO PARA MUESTRAS GRANDES Se realizó un estudio semejante al anterior y con el mismo propósito, sólo que se empleó una muestra mayor de sujetos y se probaron 4 métodos de enseñanza en lugar de tres (datos en la tabla 7). Participaron en el estudio 40 estudiantes de educación media superior, 10 en cada método. Con los datos probar la Ho correspondiente.
SOLUCIÓN Variable Independiente: Tipo de método: Contiene cuatro niveles: métodol, método2, método3, método4 Variable Dependiente: Número de respuestas correctas en el examen
Paso 1. Establecerlas hipótesis a probar
Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe diferencias entre los grupos como resultado de la intromisión de la variable independiente (tipo de método), que tenemos una Variable Dependiente (Número de respuestas correctas) continua en escala ordinal, cuatro muestras independientes y el tamaño de las muestras es igual a 10, aplicaremos la prueba de Kruskal-Wallis para muestras grandes.
138
Paso 3. Especificar alfa Se empleará un = 0.05.
Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado cae en cualquiera de los extremos de la distribución (prueba Bilateral).
Paso 5. Decisión Para obtener el valor observado de H y tomar la decisión estadística se aplica el procedimiento para muestras grandes. 10.1. Asignación de rangos para todas las observaciones como si se tratara de una sola muestra. Calcular en cada muestra la suma de rangos y el rango promedio.
5.2 Calcular H aplicando la fórmula: En este ejemplo se aplica la fórmula para las ligas ya que el 95% de los datos están ligados, además hay valores de t grandes (existe una t=11).
139
H = 2.487/.965= 2.569 5.4. Obtener el valor de Ht,a, n1, n2, n3, n4 Como n y k exceden los valores que se pueden consultar en la tabla para muestras pequeñas, se empleará la distribución X Z con gl=k-1.
5.7 Comparar el valor esperado contra el valor obtenido aplicando la regla de decisión
Dado que Ho es menor X2 aceptamos Ho Decisión estadística: Dado que aceptamos Ho podemos decir que no existen diferencias significativas entre los distintos métodos, es decir, que las diferencias observadas entre los datos son resultado de¡ azar. Como Ho resultó no significativa no se procede a realizar comparaciones múltiples para determinar las diferencias entre los pares de métodos.
Conclusión No existe evidencia estadística que sugiera que hay diferencias sign ificativas en el rendimiento en la ejecución de problemas matemáticos según el método empleado, por lo que podría decirse que los cuatro métodos producen el mismo efecto en el rendimiento. PROCEDIMIENTO DE CÁLCULO MEDIANTE EL PAQUETE SPSS (el procedimiento es el mismo independientemente de/ número y tamaño de las muestras) A continuación se presentan los pasos a seguir para obtener el estadístico de la prueba de KruskalWallis. Se tomará el ejemplo de muestras pequeñas. Para la decisión estadística se toma la regla de decisión: Si p(X2) < se rechaza la Ho
140
Paso 1 Se elabora la base de datos Se definen dos columnas. Una de ellas se denomina grupos y se especifican los grupos de pertenencia con los valores de 1 a k; la otra columna corresponde al puntaje de cada sujeto para todos los grupos. Definir variable grupo etiquetando debidamente y puntaje sin etiquetas. Así la base de datos debe tener una columna de grupos y otra de puntajes (la base de datos queda como en el caso de la prueba U de Mann-Whitney, sólo que en este caso son más de dos grupos)
Paso 2 Obtener el estadístico Desde el menú Statístícs Nonpararnetrics test K Independent Samples En la ventana de la prueba se señala cual es la variable que se va a probar (en este caso puntaje) y cual es la variable que corresponde a los grupos. Una vez asignada la variable grupos en la ventana se activa un botón para definir los grupos (en términos de la etiquetación que se asigno en la hoja de datos), se da un clic y se escribe el número que corresponde al primer grupo y al último grupo, Una vez definido lo anterior se da un click a la opción de la prueba de Kruskal-Wallis que aparece en el menú de pruebas y para finalizar Ok para que aparezca la hoja de resultados (Ver figura 6)
141
142
Paso 3 Tomar la decisión estadística interpretando la hoja de resultados Al aplicar la prueba de Kruskal-Wallis para comparar el número de respuestas correctas en el examen de problemas matemáticos entre los tres métodos encontrarnos que es p(X2) < 0.05 por lo tanto se rechaza la Ho.
Decisión Estadística: Dado que rechazamos Ho podemos decir que existen diferencias significativas entre los grupos (X2 = 10.851, p = 0.004). Como se rechaza la Ho es necesario hacer comparaciones múltiples para determinar entre que pares de grupos se encuentra la mayor diferencia. En vista de que el programa no proporciona dicha información es necesario calcularlas a mano (ver sección de comparaciones múltiples).
Conclusión Existe evidencia estadística que indica que hay diferencias significativas en la ejecución de problemas matemáticos según el método empleado.
143
Tabla 0. Valores críticos para el análisis de varianza unifactorial por rangos de Crus kal-Wallis, K-W.
144
Bibliografía 1. Aguilar, J. (Coord.). (1998). Manual de prácticas de estadística. México: Facultad de Psicología, UNAM. 2. Castillo, A. y Ojeda, M. (1994). Principios de estadística no paramétrica. México: Universidad Veracruzana. 3. Daniel, W. (1978). Applied nonparametric statistics. Boston: Houghton Mifflin Company. 4. Daniel, W. (1988). Estadística con aplicaciones a las ciencias sociales y a la educación. México: McGraw-Hill. 5. Downie, N. y Heath, R. (1986). Métodos estadísticos aplicados. México: Harla. 6. Freund, J. y Simon, G. (1994). Estadística elemental, 8a. ed. México: PearsonPrentilce-Hall. 7. Hopkins, K; Hopkins, B. R. y Glass, G. (1997) Estadística básica para las ciencias sociales y del comportamiento. México: Prentice-Hall Internacional. 8. Pagano, R. (1999) Estadística para las ciencias del comportamiento. México: Thomson Internacional. 9. Siegel, S y Castellan,, N. J. (1995) Estadística no paramétrica aplicada a las ciencias de la conducta. México: Trillas 10. Runyon, R. y Haber, A. (1984) Estadística para las ciencias sociales. México: Fondo Educativo Interamericano. 11. Weimer, R. (1999). Estadística, 2a. reimpresión. México: C.E.C.S.A.
145
Presentación El siguiente manual tiene como propósito presentar en forma resumida la lógica de aplicación de algunas pruebas no paramétricas para determinar la existencia de asociación entre dos variables y sus procedimientos de cálculo mediante las ecuaciones correspondientes y vía el paquete estadístico SPSS. No pretendemos ser exhaustivos en la revisión de todos los procedimientos, sino que se abarcan aquellos que corresponden a la asignatura de Estadística en el tercer semestre de la carrera de Psicología impartida en la Facultad de Psicología de la UNAM. Las pruebas que se presentan son la X2 como prueba de independencia y varios coeficientes de correlación que permiten al investigador saber si existe asociación entre dos variables y cuán fuerte es esa asociación. La técnica de X2 no es proporciona una medida de correlación, ya que su valor no indica la magnitud ni la dirección de la relación, pero es de utilidad para saber, en primera instancia, si hay asociación o no entre variables nominales. La correlación se ocupa de establecer la existencia de una relación entre dos variables, así como de determinar su magnitud o dirección. La magnitud se refiere a la fuerza o grado de la asociación indicado por un valor, llamado coeficiente, que oscila entre 0 y 1: Nula = 0, no hay correlación entre las variables. Débil = .10 Moderada =. 50 Fuerte = .95 Perfecta = 1, las variables se asocian perfectamente La dirección indica si se trata de una relación positiva (conforme los valores de una variable aumentan los de la otra también) o negativa (conforme los valores de una variable aumentan los de la otra disminuyen). Así, el coeficiente de la correlación puede tener un signo + o un signo -.
Exceptuando el coeficiente de correlación de Pearson, el cual está incluido en la estadística paramétrica, pero se incluye en este material por su relación con el tema. z L a elaboración de este material se derivó de la revisión; de distintas fuentes bibliográficas. Es importante destacar que los procedimientos estadísticos presentados no establecen determinantes causales entre las variables, sino que sólo nos descartar al azar como explicación de la relación encontrada. Esperamos que este material sea útil para comprender procedimientos no paramétricos y su adecuada aplicación en el análisis de datos.
146
Prueba x2 como prueba independencia OBJETIVO Identificar si existe relación estadísticamente significativa entre dos variables categóricas. La lógica de la prueba implica identificar si la diferencia entre la FE y la FO de cada una de las categorías es significativa como resultado de la asociación entre las dos variables, es decir, qué frecuencias se esperaría que ocurrieran si no existiera asociación entre las dos variables, así mientras mayor sea la discrepancia entre las frecuencias esperadas y las observadas existe mayor grado de asociación entre variables. SUPUESTOS 1. Muestreo aleatorio 2. Distribución normal de los datos 3. Dos variables categóricas con escala de medida nominal 4. Muestras grandes (n ≥ 30) 5. FE >5 TIPO DE HIPÓTESIS A PROBAR Ho: No existe relación estadísticamente significativa entre las variables Hi: Si existe relación estadísticamente significativa entre las variables DISTRIBUCIÓN MUESTRAL Distribución X2 que proporciona los valores esperados con gI = (c - 1)(r - 1) (Donde c es el número total de columnas y r el número total de renglones) de acuerdo con la lógica de la distribución normal TIPO DE DATOS Frecuencias de casos observados en cada categoría propia de las variables medidas. Cada variable debe incluir por lo menos dos categorías mutuamente excluyentes. PROCEDIMIENTO DE CALCULO MANUAL DEL ESTADISTICO X2. Las frecuencias observadas se vacían en una tabla de contingencias que mínimamente debe ser de cuatro entradas.
147
REGLA DE DECISIÓN
Se emplea la tabla de valores críticos de X2 para obtener el valor de X2t, considerando la intersección en la tabla de los de grados de libertad y el nivel de significación. Para obtener la p(X2o) se considera el valor de la X2o o una aproximación de la misma en relación con los grados de libertad, la columna de a en donde se ubique el valor observado corresponderá a la probabilidad de ocurrencia de dicho valor. EJEMPLO Se intenta identificar si la adicción juvenil a cualquier tipo de estupefacientes está directamente relacionado con las características de la comunidad (marginada y no marginada). Para este fin se encuestó a una muestra tomada en forma aleatoria de 480 jóvenes entre los 16 y los 21 años de edad de diferentes escuelas públicas del D. F. y el área metropolitana. Los datos proporcionados permitieron identificar si los estudiantes eran o no adictos y a que tipo de comunidad pertenecían. Con los datos probar la hipótesis de que sí existe relación significativa entre las variables.
148
SOLUCIÓN Variable 1: Adicción juvenil Categorías: Ausencia y presencia Variable 2: Características de la comunidad Categorías: Marginada y No marginada Paso 1. Establecer las hipótesis a probar Ho: No existe relación significativa entre las variables Hi Si existe relación significativa entre las variables Paso 2. Elegir la prueba estadística Dado que nos interesa identificar si existe relación entre la adicción juvenil a cualquier estupefaciente y las características de la comunidad, los datos son nominales, la muestra es mayor a 30 por loo que se asume que su distribución es normal, fue tomada de forma aleatoria, y ninguna de las FE es menor a 5, se aplicará la prueba X2 como prueba de independencia Paso 3. Especificar alfa Se empleará un = 0.05 tomando en consideración que tenemos una muestra de tamaño 480. Paso 4. Región de Rechazo Dado que la Hipótesis alterna es sin dirección la Ho podrá ser rechazada el valor observado cae en cualquiera de los extremos de la distribución. Paso 5. Decisión Para obtener el valor observado de X2 y tomar la decisión estadística se aplica el procedimiento con la fórmula de X2. 5.1. Agrupar las frecuencias observadas en una tabla de contingencias y calcular las frecuencias esperadas
149
Al aplicar esta fórmula no es necesario el cálculo de las FE más que para garantizar que no existen FE menores a 5 (lo cual estará en duda sólo si tenemos FO pequeñas)
5.4 Comparar el X2o observado y un valor esperado aplicando la regía de decisión
.
. Dado que (31.845)> X2t (3.841) con un 0,05, gl=1, podemos rechazar la Ho y aceptar la Hi, la probabi!idad asociada al valor observado de Ji cuadrada es menor a 0.01 mucho menor que el alfa elegido. X2 o
150
Decisión estadística: Dado qua rechazamos Ho podemos decir que si existe relación significativa entre las variables (X2o = 31.845; =0.05. g! 1 o bien, X2= =31.845. g!=1. p<.01) Conclusión: Existe suficiente evidencia estadística para considerar que la adicción juvenil a cualquier estupefaciente está directamente relacionada con las características de a comunidad sea ésta marginada o no marginada. PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. A continuación se presentan los pasos a seguir para obtener el estadístico de la prueba de X2 de independencia. Para la decisión estadística se torna la regla de dedsión: Si p(X2o, gl) ≤ Rechazamos Ho Como los datos se presentan en una tabla de contingencias deben crearse tres columnas, una para la variable 1 otra para la variable 2 y una tercera para las frecuencias observadas. Para las variables es conveniente definir también sus categorías. La definición de las variables y frecuencias se realiza como se indica a continuación. Data Define variable: en esta defines la siguiente ínformación: Variable name: nombra la variable 1, adicción, juvenil, empleando un máximo de 8 caracteres. En este caso la variable se denominará adic, Labels: Para activa,, esta ventana das clic en e! botón Labels de la ventana Define Variable. En este submenú capturas el nombre de !a variable en Label (aquí puedes poner el nombre completo usando más de ocho caracteres), Para definir sus categorias, en el recuadro Value capturas el valor 1 y en el recuadro Value label escribes adicto. Das clic en Add. Posteriormente capturas el valor 2 y escribes no adicto (y así sucesivamente hasta capturar todas las categorías). Das clic en Continue. Para cerrar la ventana Define Variable das clic en OK La figura muestra como se define !a variable junto con sus categor1as.
151
Defines la variable características de la comunidad de la misma forma que la variable adicción juvenil, incluyendo sus categorías. Ver figura arriba. Define la variable frecuencias escribiendo sólo su nombre en Variable name (recuerda que sólo puedes usar 8 caracteres). Ver figura
Una vez definidas las variables se teclearán los valores conforme a la tabla de contingencia, Para capturar los datos de la primera celda (c11) escribiríamos 1 en la columna adic, 1 en la columna comuna y 125 en la columna frec; con esto indicamos que en la primera celda hay 125 sujetos que son adictos y que viven en una comunidad marginada, Para la segunda celda (c12) sería 1, 2, 183, indicando que hay 183 sujetos que son adictos y que viven en una comunidad no marginada; y así sucesivamente hasta terminar con todas las celdas. Ver figura. 152
Paso 2. Ponderar frecuencias. Antes de proceder a rea!izar e! análisis hay que hacer un paso previo, el cual consiste en indicarle al programa que se analizarán las frecuencias (Ver figura) La secuencia de indicaciones es: Data WeIght cases: en esta ventana hay que indicar Weight cases: dar un clic en, e! circulo para activarlo,. Frecuency variable: pasa la variable FREC. Dar clic en OK.
153
Paso 3. Obtener el estadístico. Una vez que se ha hecho la indicación mencionada se procede a correr el análisis siguiendo la ruta: Statistics (o Analize, según la versión de SPSS). Summarize Crosstabs (ver figura).
En le ventana Crosstabs seleccionar las variables de los renglones, en este caso adícc, y pasarla al recuadro Row(s) dando clic en el botón que está enmedio de ambos recuadros. Posteriormente seleccionar la variable de la columna, comuna, y pasarla al recuadro Colum(s). Ver figura.
154
Una vez seleccionadas las variables dar clic en el botón Statistics que aparece en esta misma ventana para abrirla y seleccionar Chi-square, dando clic en la opción que corresponde a este coeficiente (ver figura arriba) Dar clic en Continue para regresar a la ventana anterior y luego dar clic en OK para correr el análisis. Paso 4. Tomar la decisión estadística interpretando la hoja de resultados. Una vez dadas las indicaciones para correr el análisis se despliega una hoja de resultados (Output) que muestra los datos correspondientes a la prueba realizada. Con base en la información presentada se toma la decisión estadística. HOJA DE RESULTADOS (OUTPUT)
155
El valor de X2 es igual a 31.845 cuya probabilidad asociada es .000, (X2 =31.845, gl=1, p=.000), la cual es contrastada con el alfa de .05 indicada en el ejemplo. Aplicando la regla de decisión:
Conclusión Dado que rechazamos Ho podemos decir que existe suficiente evidencia estadística, paro considerar que la adicción juvenil a cualquier estupefaciente está directamente relacionada con las características de la comunidad sea ésta marginada o no marginada. 156
TABLA F Distribución ji-cuadrada (x2)
157
Coeficiente de correlación Phi (r) OBJETIVO Identificar si existe relación estadísticamente significativa entre dos variables dicotómicas, así como la magnitud de esa relación. SUPUESTOS 1. 2. 3. 4.
Variables discretas-dicotómicas Escala nominal Muestreo aleatorio Muestras grandes (N ≥ 30) TIPO DE DATOS
Frecuencia de observación en cada una de las categorías de las variables. PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE PHI. Las frecuencias observadas se vacían en una tabla de contingencias de cuatro entradas, en la cual se indican los totales marginales por columna y por renglón, así como el total de casos observados.
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE
El coeficiente por sí mismo no indica si existe asociación o no entre las variables, para ello es necesario obtener su significancia usando el estadístico X2, incluyendo los siguientes elementos: TIPO DE HIPOTESIS A PROBAR Ho: No existe relación estadísticamente significativa entre las variables Hi: Si existe relación estadísticamente significativa entre las variables DISTRIBUCIÓN MUESTRAL Se utiliza la distribución X2 que proporciona los valores esperados para todas las muestras 158
posibles obtenidas en forma aleatoria, con gl = (c - 1)(r - 1), donde c es el número total de columnas y r el número total de renglones.
Se emplea la tabla de valores críticos de X2 para obtener el valor de X2t, con gl = 1 y el respectivo nivel de significación, o su p(X2o). EJEMPLO Se intenta identificar si la adicción juvenil a cualquier tipo de estupefacientes está directamente relacionado con las características de la comunidad (marginada y no marginada). Para este fin se encuestó a una muestra tomada en forma aleatoria de 480 jóvenes entre los 16 y los 21 años de edad de diferentes escuelas públicas del D. F. y el área metropolitana. Los datos proporcionados permitieron identificar si los estudiantes eran o no adictos y a qué tipo de comunidad pertenecían. Con los datos identificar si existe relación entre las variables, y cuál es la magnitud de esa relación. Datos
Solución Vahmble X: ei tipo de comunidad: marginada, no marginada Variable Y: Presencia o ausencia de adicción Paso 1. Elegir la prueba estadística Dado que nos interesa identificar no sólo la existencia de relación entre la adicción juvenil a cualquier estupefaciente y las características de la comunidad sino también su magnitud, los datos son dicotómicos, la muestra es mayor a 30 y a!eatoria, se calculará el coeficiente Phi se probará su significancia con el estadístico X2. Paso 2. Construir la tabla de contingencia
159
Paso 4. Obtener su significancia 4.1. Establecer las hipótesis a probar Ho: La relación entre las variables no es significativa Hi La relación entre las variables es significativa Paso 4.2. Especificar alfa 480.
Se empleará un = 0.05 tomando en consideración que tenemos una muestra de tamaño
Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de X2` cae en cualquiera de los extremos de la distribución. Paso 4.4. Calcular el valor de X2
160
Paso 4.5. Decisión
Para tomar la decisión se calcula el valor de tablas de X2 y se aplica el criterio elegido. Dado que X2o (30.77) > X2t (3.841) con un Ho y aceptar la Hi; la probabilidad asociada al valor observado de ji cuadrada es menor a .01, mucho menor que el alfa elegido. Conclusión: Con los datos de esta muestra se observó una correlación significativa entre la presencia o ausencia de la adicción y el tipo de comunidad (X2 = 30.77; gl = 1 y = 0.05), dicha correlación fue baja entre (.257). Lo anterior implica que el tipo de comunidad marginada o no marginada no define en un alto porcentaje la presencia o ausencia de la adicción (posiblemente existan variables de mayor relación). PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. Paso 1 a 3. Elaboración de la base de datos, ponderación de frecuencias y selección del coeficiente. Como los datos se presentan en una tabla de contingencias se sigue el, mismo procedimiento descrito para la X2 como prueba de independencia para capturar la base de datos, ponderar las frecuencias y seleccionar las variables en la ventana de Crosstabs. Una vez seleccionadas las variables en la ventana Crosstabs dar clic en el botón Statistics que aparece en esta misma ventana para abrirla y seleccionar el coeficiente Phi, dando clic en la opción que corresponde a este coeficiente (ver figura 1). Dar clic en Continue para regresar a la ventana anterior y luego dar clic en OK para correr el análisis.
161
Paso 4, Tornar la decisión estadística interpretando la hoja de resultados. Una vez dadas las indicaciones para correr el análisis se despliega una hoja de resultados (Output) que muestra los datos correspondientes a la prueba realizada. Con base en la información presentada se toma la decisión estadístIca. El valor del coeficiente Phi es igual .258 cuya probabilidad asociada es (r =.2588, p=:000), la cual es contrastada con el 'alfa de .05 indicada en el ejemplo. Aplicando la regia de decisión:
Conclusión: Con los datos de esta muestra se observó una correlación significativa baja entre la presencia o ausencia de la adicción y el tipo de comunidad (r =.258, p=.000). Lo anterior implica que el tipo de comunidad marginada o no marginada no define en un alto porcentaje la presencia o ausencia de la adicción (posiblemente existan variables de mayor relación). HOJA DE RESULTADOS (OUTPUT)
162
La hoja de resultados presenta tres tablas, la primera da información sobre el número total de casos válidos y faltantes, en este caso tenemos todos los casos válidos, 480 (100%). La segunda tabla corresponde a la tabla de contingencia capturada, si los datos se metieron de manera correcta, esta tabla debe ser idéntica a la original. La tercera tabla proporciona el valor del coeficiente Phi en la columna Value y su probabilidad asociada en la columna Approx. Sig., .258 y .000, respectivamente.
163
Coeficiente de correlación V de Cramér OBJETIVO Identificar el grado de asociación entre dos variables categóricas en una tabla de contingencia de r x c, en donde las variables consisten en series no ordenadas de categorías. SUPUESTOS 1. 2. 3. 4.
Variables con escala de medida nominal (x, y), Muestreo aleatorio. Muestras grandes (n ≥ 30) FE >5
TIPO DE DATOS Frecuencias de casos observados en cada categoría propia de las variables medidas. Cada variable debe incluir por lo menos dos categorías mutuamente excluyentes. PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE V DE CRAMER. Las frecuencias observadas se vacían en una tabla de contingencias que mínimamente debe ser de cuatro entradas (dos categorías para cada variable) siguiendo la misma estructura para la prueba de X2. TABLA DE CONTINGENCIA
1. Calcular las frecuencias esperadas en cada una de las celdas multiplicando los totales marginales comunes a cada celda y dividiendo este producto por el número total de casos, N; (c11 = TMR1 x TMC1/N, c12 = TMR1 x TMC2/N, c1n= TMR1 x TMCn/N, etc,).
164
2. Calcular el valor de X2, Para tablas de 2 x 2
Para tablas de r x c, donde r y/o c son ≠ 2
3. Calcular el valor del coeficiente V de Cramér. Este coeficiente asume valores que van de 0 a 1.
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE Para probar que la asociación entre las variables es significativa se usa el valor calculado de X2. TIPO DE HIPÓTESIS A PROBAR Ho: No existe relación estadísticamente significativa entre las variables Hi: Si existe relación estadisticamente significativa entre las variables DISTRIBUCIÓN MUESTRAL Para probar la significación de la asociación se utiliza la distribución X2 que proporciona los valores esperados para todas las muestras posibles obtenidas en forma aleatoria, con gl = (c 1)(r - 1), donde c es el número total de columnas y r el número total de renglones. 165
REGLA DE DECISIÓN
Se emplea la tabla de valores críticos de X2 para obtener el valor de X2t, con gl = 1 y el respectivo nivel de significación, o su p(X2o). EJEMPLO En un estudio sobre psicología social se cree que existe una relación entre el ser prejuicioso o no y el nivel de escolaridad. Para probar tal suposición se tomó una muestra aleatoria de 164 sujetos a quienes se aplicó un cuestionario para evaluar su nivel de prejuicio (alto, medio, bajo) y se obtuvo su máximo nivel de estudios (primaria, secundaria, técnico, preparatoria, licenciatura, posgrado), y se clasificaron en función de estos dos criterios. Con los datos obtenidos se quiere determinar el grado de asociación entre las dos variables usando un alfa de .05. SOLUCIÓN Variable 1: nivel de prejuicio, con tres categorías: alto, medio, bajo. Variable 2: escolaridad, con 6 categorías: primaria, secundaria, técnico, preparatoria, licenciatura, posgrado. Paso 1. Elegir la prueba estadística Dado que nos interesa identificar no sólo la existencia de relación entre el grado de prejuicio y el nivel de escolaridad adicción, sino también su magnitud, los datos son nominales, la muestra es mayor a 30 y aleatoria, y ninguna de las FE es menor a 5, se calculará el coeficiente V de Cramér y se- probará su significancia con el estadístico :X2 . Paso 2. Construir la tabla de contingencia
Agrupar las frecuencias observadas en una tabla de contingencias. Paso 3. Calcular el coeficiente V de Cramér 3.1. Cálculo de las FE
166
3.2. Obtener el estadístico X2
Paso 4. Obtener su significancia 4.1. Establecer las hipótesis a probar Ho: La relación entre ¡as variables no es significativa Hi La relación entre las variables es significativa Paso 4.2. Especificar alfa 164.
Se empleará un = 0.05 tomando en consideración que tenemos una muestra de tamaño
Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de X2` cae en cualquiera de los extremos de la distribución. Paso 4.5. Decisión Para tomar la decisión se compara el valor de X2 calculado con el valor de tablas de X2 y se aplica el criterio elegido.
167
Dado que X2o (65.41) > X2t (3.841) con un 0.05, gl=10; podemos rechazar la Ho y aceptar la Hi; la probabilidad asociada al valor observado de ji cuadrada es menor a .01, mucho menor que el alfa elegido. Conclusión: Existe suficiente evidencia estadística para considerar que el nivel de escolaridad está directamente relacionado con el ser prejuicioso, (V=.446, X2= 65.41; gI = 10 y = 0.05). La correlación entre ambas variables es moderada, y observando las frecuencias vemos que a mayor escolaridad sé es menos prejuicioso. PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. Paso 1 a 3. Elaboración de la base de datos, ponderación de frecuencias y selección de¡ coeficiente. Como los datos se presentan en una tabla de contingencias se sigue el mismo procedimiento, descrito para la X2 corno prueba de independencia para capturar la base de datos (ver figura).ponderar las frecuencias y se!eccionar las variables en la ventana de Crosstabs. Una vez seleccionadas las variados en a ventana Crosstabs dar clic en el botón Statistics que aparece en esta misma ventana para abrirla y seleccionar el coeficiente Cramér’s V, dando clic en la opción que corresponde a este coeficiente (ver figura). Dar clic en Continue para regresar a la ventana anterior y luego dar clic en OK para correr el análisis.
168
HOJA DE RESULTADOS (OUTPUT)
La hoja de resultados presenta tres tablas, la primera da información sobre el número total de casos válidos y faltantes, en este caso tenemos todos los casos válidos, 164 (100%). La segunda tabla corresponde a la tabla de contingencia capturada, si los datos se metieron de manera correcta, esta tabla debe ser idéntica a la original. La tercera tabla proporciona el valor del coeficiente V de Crámer en la columna Value y su probabilidad asociada en la columna Approx. Sig., .447 y .000, respectivamente.
169
Paso 4. Tomar la decisión estadística interpretando la hoja de resultados. El valor del coeficiente V de Crámer es igual a .447 cuya probabilidad asociada es .000, (V=.447, p=.000), la cual es contrastada con el alfa de .05 indicada en el ejemplo. Aplicando la regla de decisión:
Tenemos que . 000 < .05, por lo que rechazarnos Ho. Conclusión: Existe suficiente evidencia estadística para considerar que el nivel de escolaridad está directamente relacionado con el ser prejuicioso, V=.447, p=.000). la correlación entre ambas variables es moderada, y observando las frecuencias vemos que a mayor escolaridad se es menos prejuicioso.
170
COEFICIENTE DE CORRELACIÓN BISERIAL PUNTUAL OBJETIVO Identificar el grado de asociación entre dos variables, una nominal con dos categorías (dicotómica) y otra intervalar. Este coeficiente es de gran utilidad para validar reactivos de pruebas y puede asumir valores entre -1 a 1. SUPUESTOS 1. Una variable con escala de medida nominal, dicotómica por naturaleza. 2. Una variable con escala de medida intervalar. 3. Muestreo aleatorio. TIPO DE DATOS Clasificación de los sujetos en la variable dicotómica, puntajes individuales en la variable intervalar. PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE BISERIALPUNTUAL. 1. Los datos se arreglan en una tabla de dos columnas, una contiene los datos de la variable intervalar y la otra los de la variable dicotómica. 2. Para cada una de las categorías de la variable nominal se calcula la media correspondiente en la variable intervalar. 3. Se determina el valor de n (número de casos) en cada categoría. 4. Se calcula la desviación estándar para todos los casos en la variable intervalar, (x- x)2/N 1, donde N es el número total de casos. Para aplicar esta ecuación hay que calcular la media de todos los puntajes. 5. Se calcula el coeficiente biserial-puntual con la siguiente ecuación:
171
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE Se determina la significancia del coeficiente empleando el estadístico t de Student. TIPO DE HIPÓTESIS A PROBAR Ho: No existe relación estadísticamente significativa entre las variables Hi: Si existe relación estadísticamente significativa entre las variables DISTRIBUCIÓN MUESTRAL Para probar la significación de la asociación se utiliza la distribución t de Student que proporciona los valores esperados para todas las muestras posibles obtenidas en forma aleatoria, con gl = N-2 donde N es el número total de pares x,y. FORMULA
REGLA DE DECISION
Se emplea la tabla de valores críticos de t de Student para obtener el valor de tt, con gl = n-2 y el respectivo nivel de significación, o su p(to, gI). EJEMPLO En un estudio sobre psicología de la salud se desea saber si existe relación entre el sexo y la ansiedad. Para ello se usó una muestra de 14 sujetos, 6 mujeres y 8 hombres, cuya ansiedad fue medida con una escala tipo Likert, en la que un puntaje alto indica mayor ansiedad. Con un alfa de .05 determinar el grado de asociación entre las variables,
172
SOLUCIÓN Variable X: sexo: hombre, mujer Variable Y: puntaje de ansiedad Paso 1. Elegir la prueba estadística Dado que nos interesa identificar no el grado de asociación entre una variable dicotómica, sexo, y una variable intervalar, puntaje de ansiedad, y la muestra es aleatoria, se calculará el coeficiente biserial-puntual y se probará su significancia con el estadístico t de Student. Paso 2. Arreglar los datos en una tabla con la codificación de la variable dicotómica Con fines de codificación de los datos, a los hombres se les asignó el valor de 0 y a las mujeres el valor de 1.
Paso 3. Calcular el coeficiente biserial-puntual X0 = media de la categoría mujeres (1) = 38.15 X1 = media de la categoría hombres (0) = 23.88 n1 = número de casos en la categoría 1 = 6 173
nQ= número de casos en la categoría 2 = 8 n = número total de casos en la muestra =14 sX= desviación estándar de todos los puntajes = (x- x)2/N -1 = 19.48
Paso 4. Obtener su significancia 4.1. Establecer las hipótesis a probar Ho: La relación entre las variables no es significativa Hi La relación entre las variables es significativa Paso 4.2. Especificar alfa Se empleará un = 0.05. Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de t cae en cualquiera de los extremos de la distribución. Paso 4.4. Calcular el valor de t
Paso 4.5. Decisión Para tomar la decisión se calcula el valor de tablas de t y se aplica el criterio elegido.
Como la prueba es bidireccional, en la tabla de t se identifica el alfa de .05 correspondiente a pruebas de dos colas, tt, .05, 12 = 2.179
174
Dado que to (1.37) < tt (2.179) con un 0.05, gl=12; podemos aceptar la Ho y rechazar la Hi; la probabilidad asociada al valor observado de t es mayor a .10, mucho mayor que el alfa elegido. Conclusión: No existe evidencia estadísticamente significativa para afirmar que la ansiedad se asocia con el sexo (r=,37, to = 1.37; gl = 10 y = 0.05). PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. Este coeficiente puede calcularse a través del coeficiente Eta, el cual también analiza la relación entre una variable intervalar y una nominal pero a diferencia de la biserial puntual, la variable nominal tiene más de dos categorías. Además el coeficiente Eta asume que hay una variable independiente y otra dependiente. Paso 1. Elaboración de la base de datos, Definir dos columnas, una para la variable dicotómica Junto con sus categorías, y otra para la variable intervalar. Los datos se capturan en forma de lista en !a variable correspondiente. Ver figura.
Paso 2. Obtener el estadístico. Una vez capturada la base se procede a correr el análisis siguiendo la ruta: Statistics (o Analize, según la versión de SPSS). 175
Summarize Crosstabs: pasar la variable intervalar en Row Pasar la variable nominal en Column Ver figura En el submenú Statistics de Crosstabs: Marcar el coeficiente Eta (ver figura ) Dar clic en Continue OK
Paso 3. Tomar la decisión estadística interpretando la hoja de resultados. Una vez dadas las indicaciones para correr el análisis se despliega una hoja de resultados (Output) que muestra los datos correspondientes a la prueba realizada. Con base en la información presentada se toma la decisión estadística. HOJA DE RESULTADOS (OUTPUT)
176
El valor del coeficiente biserial-puntual es igual a .377, lo cual indicaría que existe una correlación moderada entre el sexo y la ansiedad; sin embargo. el programa no muestra la probabilidad asociada a este coeficiente, por lo tanto, hay que realizar la prueba de significancia como se explica en la sección correspondiente para determinar si le correlación es significativa o no. En la prueba de significancia se obtuvo una p>.10 para un valor t-1.37, gl=12, la cual contrastada con el alfa de .05 resulta mayor pues al aplicar la regla de decisión:
Tenemos que . 10 > .05, por lo que aceptamos Ho. Conclusión No existe evidencia estadísticamente significativa para afirmar que la ansiedad se asocia con el sexo.
177
178
COEFICIENTE DE CORRELACIÓN R DE SPEARMAN (RS) OBJETIVO Identificar si existe relación estadísticamente significativa entre dos variables ordinales, así como la magnitud de esa relación. SUPUESTOS 1. Variables continuas 2. Escala ordinal 3. Muestreo aleatorio TIPO DE DATOS
Puntajes ordinales para las variables X y Y PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE rS DE SPEARMAN. Construir una tabla de datos que incluya los siguientes elementos. Calcular el coeficiente con alguna de las siguientes fórmulas:
179
PRUEBA DE SIGNIFICANCIA DEL COEFíCIENTE Para muestras pequeñas se determina la significancia del coeficiente empleando el estadístico t de Student, para muestras grandes se utiliza la distribución z. TIPO DE HIPÓTESIS A PROBAR Ho: No existe relación estadísticamente significativa entre las variables Hi: Si existe relación estadísticamente significativa entre las variables DISTRIBUCIÓN MUESTRAL Para probar le significación de la asociación se utiliza la distribución t de Student que proporciona los valores esperados para todas las muestras pequeñas posibles obtenidas en forma aleatoria, con gl = N-2 donde N es el número total de pares x,y. Para muestras grandes se sigue la lógica de la distribución normal estándar. FORMULA
REGLA DE DECISION Muestras pequeñas
Se emplea la tabla de valores críticos de t de Student para obtener el' valor de tt, con gl = n-2 y el respectivo nivel de significación, o su p(to, gl). Muestras grandes
Se emplea la tabla de valores críticos de la distribución normal estándar para obtener el valor de zt con él respectivo nivel de significación, o su p(z). 180
EJEMPLO (Muestras pequeñas) Se intenta identificar si existe relación significativa entre el nivel de desempeño obtenido por estudiantes del último grado de secundaria y su calificación en la prueba de selección para el nivel bachillerato. Se tomó una muestra aleatoria de 20 estudiantes de la Escuela Secundaria núm. 23 del sur del D. F., a quienes se les aplicó un inventario de desempeño que proporciona datos ordinales de 0 a 120; posteriormente se les aplicó una prueba similar al examen oficial de ingreso a bachillerato cuyo máximo puntaje es de 160. Identificar el grado de correlación entre las variables SOLUCIÓN Variables: Nivel de desempeño (X ) Calificación en la prueba ( Y ) Paso 1. Elegir la prueba estadística Dado que nos interesa identificar el grado de asociación entre el desempeño y la calificación en la prueba, los datos son ordinales y la muestra es aleatoria, se calculará el coeficiente de correlación de Spearman y se probará su significancia con el estadístico t ya que es una muestra pequeña (n=20).
Paso 3. Calcular el coeficiente De acuerdo con los datos, como ningún valor se repite se emplea la ecuación para datos no ligados
181
Paso 4. Obtener su significancia 4.1. Establecer las hipótesis a probar Ho: La relación entre las variables no es significativa Hi La relación entre las variables es significativa Paso 4.2. Especificar alfa Se empleará un = 0.05. Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de t cae en cualquiera de los extremos de la distribución. Paso 4.4. Calcular el valor de t Para muestras pequeñas
Paso 4.5. Decisión Para tomar la decisión se calcula el valor de tablas de t y se aplica el criterio elegido.
Como la prueba es bidireccional, en la tabla de t se identifica el alfa de .05 correspondiente 182
a pruebas de dos colas, tt, .05, 18 = 2.101 Si p (to, gl) ≤
Ho
Dado que to (12.324) > tt (2.101) con un 0.05, gl=18; podemos rechazar la Ho y aceptar la Hi; la probabilidad asociada al valor observado de t es menor a .0001, mucho menor que el alfa elegido. Conclusión: En la muestra estudiada, existe un grado de correlación significativa (to = 12.624; gl = 18 y = 0.05) de 0.9479 entre el nivel de desempeño obtenido por estudiantes del último grado de secundaria y su calificación en la prueba de selección para el nivel bachillerato. El valor del coeficiente indica una correlación alta y positiva entre las variables, es decir, que su relación es muy fuerte y que quienes muestran un mejor desempeño durante el tercer grado de secundaria obtendrán un puntaje alto en la prueba de selección para bachillerato. EJEMPLO (Muestras grandes) El mismo estudio se aplicó con otra muestra aleatoria de 33 estudiantes de la Escuela Secundaria Técnica # 41 del municipio de Tialnepantla. Identificar el grado de correlación entre las variables. SOLUCIÓN Variables: Nivel de desempeño (X ) Calificación en la prueba ( Y ) Paso 1. Elegir la prueba estadística Dado que nos interesa identificar el grado de asociación entre el desempeño y la calificación en la prueba, los datos son ordinales y la muestra es aleatoria, se calculará el coeficiente de correlación de Spearman y se probará su significancia con el estadístico z ya que es una muestra grande (n=33).
183
Paso 3. Calcular el coeficiente
184
Sustituir
Paso 4. Obtener su significancia 4.1. Establecer las hipótesis a probar Ho: La relación entre las variables no es significativa Hi La re!ación entre las variables es significativa Paso 4.2. Especificar alfa Se empleara un = 0.05. Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de z cae en cualquiera de los extremos de la distribución.
185
Paso 4.4. Calcular el valor de z Para muestras grandes
Paso 4.5. Decisión Para tomar la decisión se calcula el valor de tablas de z y se aplica el criterio elegido.
Como la prueba es bidireccional, para usar la tabla de z se divide el alfa de .05 entre dos, ya que la tabla muestra sólo un extremo, zt, .05/2 = 1 .96 Como la prueba es bidireccional, la probabilidad de z se multiplica por dos, ya que la tabla muestra sólo un extremo.
Dado que Zo (3.501) > zt (1.96) con un 0.05, podernos rechazar la Ho y aceptar la Hi; la probabilidad asociada al valor observado de Z es .0004, mucho menor que el alfa elegido. Conclusión: En la muestra estudiada, existe un grado de correlación significativa (zo = 3.501 y = 0.05) de 0.619 entre el nivel de desempeño obtenido por estudiantes dei último grado de secundaria y su calificación en la prueba de selección para el nivel bachillerato. El valor del coeficiente indica una correlación moderada y positiva entre las variables, es decir, que su relación no es tan fuerte como el ejemplo anterior, pero si representa una magnitud de considerable importancia, además indica que quienes muestran un mejor desempeño durante el tercer grado de secundaria obtendrán un puntaje alto en la prueba de selección para bachillerato. PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. Paso 1. Elaboración de la base de datos. Para elaborar le base de datos se definen dos columnas, una por cada variable (sin etiquetas), y los datos se capturan en forma de lista. Ver figura .
186
Paso 2. Obtener el estadístico. Una vez capturada la base se procede a correr el análisis siguiendo la ruta: Statistics (o Analize, según la versión de SPSS). Correlate Bivariate (ver figura) En este submenú se pasan las dos variables Se da clic en Pearson para desmarcarlo y se da clic en Spearman para indicar que es el coeficiente que se desea calcular. Si la hipótesis alterna es bidireccional se deja la opción Two-tailed, si es unidireccional se selecciona One-tailed. Se da clic en OK Ver figura
187
Paso 3. Tomar la decisión estadística interpretando la hoja de resultados. Una vez dadas las indicaciones para correr el análisis se despliega una hoja de resultados (Output) que muestra los datos correspondientes a la prueba realizada. Con base en la información presentada se toma la decisión estadística.
188
HOJA DE RESULTADOS (OUTPUT) Nonparametric Correlations
La hoja de resultados muestra las correlaciones entre todas las variables, incluyendo la correlación de la variable consigo misma, cuyo coeficiente es 1,00. Estos coeficientes de 1.00 dibujan una diagonal imaginaria dividiendo la tabla en dos triángulos, superior e inferior, en cada uno de ellos se encuentra la misma información de las correlaciones calculadas. Así, la correlación entre desempe y califica es la misma en ambos triángulos, por lo que da igual leer uno u otro. La correlación entre el desempeño y la calificación fue de .82 con una probabilidad asociada de .000, rS 0.82, p=.000, aplicando la regla de decisión:
tenemos que . 000 < .05, por lo que rechazamos H0 lo cual indica que existe una correlación significativa entre las variables. Conclusión: En la muestra estudiada, existe una correlación significativa (rs=.82, p=.000) entre el nivel de desempeño obtenido por estudiantes del ultimo grado de secundaria y su calificación en la prueba de selección para el nivel bachillerato. El valor del coeficiente indica una correlación alta y positiva entre !as variables, es decir, que su relación es fuerte, y que quienes muestran un mejor desempeño durante el tercer grado de secundaria obtendrán un puntaje alto en la prueba de selección para bachillerato.
189
APÉNDICE D TABLAS
190
191
192
193
194
COEFICIENTE DE CORRELACIÓN R DE PEARSON OBJETIVO Identificar si existe relación estadísticamente significativa entre dos variables intervalares, así como la magnitud de esa relación. SUPUESTOS 1. Variables continuas (con distribución normal) 2. Escala intervalar 3. Muestreo aleatorio TIPO DE DATOS Puntajes intervalares para los eventos X y Y PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE r DE PEARSON.
Calcular el coeficiente FORMULA (Considerando que son datos agrupados)
PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE Se determina la s!gnificancia del coeficiente empleando e! estadístico t de Student. TIPO DE HIPÓTESIS A PROBAR Ho: No existe relación estadísticamente significativa entre las variables Hi: Si existe relación estadísticamente significativa entre las variables DISTRIBUCIÓN MUESTRAL Para probar la significación de la asociación se utiliza la distribución t de Student que 195
proporciona los valores esperados para todas las muestras posibles obtenidas en forma aleatoria, con gl = N-2 donde N es el número total de pares x ,y. FORMULA
REGLA DE DECISION
Se emplea la tabla de valores críticos de t de Student para obtener el valor de tt, con gl = n-2 y el respectivo nivel de significación, o su p(to, gl). EJEMPLO Se intenta identificar si existe correlación significativa entre el nivel de razonamiento verbal y el nivel de razonamiento abstracto en niños de 6° de primaria. Para tal propósito se tomó una muestra aleatoria de 23 niños de la primaria pública Justo Sierra a quienes se les aplicó un inventario que proporcionaba datos intervalares para ambas variables (puntaje máximo 50). Identificar el grado de correlación entre las variables. SOLUCIÓN Variables: Razonamiento verbal (X ) Razonamiento abstracto ( Y ) Paso 1. Elegir la prueba estadística Dado que nos interesa identificar el grado de asociación entre el razonamiento verbal y el razonamiento abstracto, los datos son intervalares y la muestra es aleatoria, se calculará el coeficiente de correlación de Pearson y se probará su significancia con el estadístico t de Student. Paso 2. Construir tabla de datos Suj
X
Y
X2
Y2
XY
1
19
17
361
289
323
2
31
7
961
49
217
3
33
17
1089
289
561
4
44
28.5
1936
812.25
1254
5
25
27
625
729
675
6
35
31
1225
961
1085
7
34
20
1156
400
680
8
39
17
1521
289
663
196
9
44.56
45
1985.59
2025
2005.2
10
44
43
1936
1849
1892
11
24.5
10
600.25
100
245
12
37.5
28.5
1406.25
812.25
1065.75
13
24.6
13.45
605.16
180.25
330.87
14
40
43.2
1600
1866.24
1728
15
42
18
1764
324
756
16
32
16
1024
256
512
17
48
26
2304
676
1248
18
43
17.5
1849
306.25
752.5
19
33.5
36
1122.25
1296
1206
20
47
16
2209
256
752
21
38
37
1444
1369
1406
23
25
30
625
900
750
23
35.3
37.8
1246.09
1428.84
1334.34
EX= 818.96
EY= 581.95
EX2 = 30594.5936
EY 2= 17463.7325
EXY= 21441.66
197
Paso 4. Obtener su significancia 4.1. Establecer las hipótesis a probar Ho: La relación entre las variables no es significativa Hi La relación entre las variables es significativa Paso 4.2. Especificar alfa Se empleará un = 0.05. Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de t cae en cualquiera de los extremos de la distribución. Paso 4.4. Calcular el valor de t
Paso 4.5. Decisión Para tomar la decisión se calcula el valor de tablas de t y se aplica el criterio elegido.
Como la prueba es bidireccional, en la tabla de t se identifica el alfa de .05 correspondiente a pruebas de dos colas, tt, .05, 21 = 2.080
Dado que to (1.78) < tt (2.080) con un 0.05, gl=21; podemos aceptar la Ho y rechazar la Hi; la probabilidad asociada al valor observado de t es mayor a..10, mucho mayor que el alfa elegido. 198
Conclusión: No existe evidencia estadísticamente significativa para afirmar que el razonamiento verbal y el razonamiento abstracto están relacionados en los niños de 6° de primaria (r=.363, to = 1.78; 91 = 21 y . a = 0.05). PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. Pasos 1 y 2. Elaboración de la base de datos y selección dei coeficiente. Para obtener el coeficiente de correlación r de Pearson y su prueba de significancia se siguen los mismos pasos que en el caso del coeficiente de Spearman, recordemos que se elabora la base de datos definiendo una columna para cada una de las variables a correlacionar. Los pasos para el estadístico son: Statistics Correlate Bivariante Una vez en la ventana principal de las pruebas de correlación, se señalan ambas variables a correlacionar y se la un click a la opción Pearson. Ver figura .
Paso 3. Tomar la decisión estadística interpretando la hoja de resultados. Una vez dadas las indicaciones para correr el análisis se despliega una hoja de resultados (Output) que muestra los datos correspondientes a la prueba realizada. Con base en la información presentada se toma la decisión estadística.
199
N es el total de caso evaluados La correlación entre el razonamiento verbal y el razonamiento abstracto fue de .36 con una probabilidad asociada de .086, r=.36, p=.086, aplicando la regla de decisión:
tenemos que . 086 > .05, por lo que aceptamos Ho lo cual indica que no existe una correlación significativa entre las variables. Conclusión: No existe evidencia estadísticamente significativa para afirmar que el razonamiento verbal y el razonamiento abstracto están relacionados en los niños de 6° de primaria (r=.36, p=.086).
200
Coeficiente de concordancia de Kendall OBJETIVO Identificar el grado de asociación entre k variables, con base en las ordenaciones asignadas a N objetos (personas, reactivos, etc.). Este coeficiente es de gran utilidad en la validez entre jueces y en estudios de agrupaciones de variables. El coeficiente de concordancia de Kendall asume valores de 0 a 1, donde 0 representa no acuerdo entre las ordenaciones y 1, total acuerdo entre las ordenaciones. SUPUESTOS 1. Variables con escala de medida ordinal. 2. Las ordenaciones deben ser independientes entre un juez y otro. 3. Muestreo aleatorio. TIPO DE DATOS Puntajes individuales en rangos para todas las variables. PROCEDIMIENTO DE CALCULO MANUAL DEL COEFICIENTE DE CONCORDANCIA DE KENDALL. 1. Los datos se arreglan en una tabla de k columnas que representan a los N objetos que se ordenarán, y k renglones que representan a los jueces. 2. Se asignan rangos a cada uno de los N objetos de manera ascendente en cada uno de los renglones de manera independiente (como en el caso de la prueba de Friedman). Al puntaje más bajo se le asigna el rango 1, al que le sigue el rango 2 y así sucesivamente, tomando en consideración las ligas. 3. Para cada columna se calcula la suma de los rangos. 4. Se calcula el coeficiente de concordancia con la siguiente ecuación: Datos no ligados
donde: R2 = suma de los rangos de la iésima columna elevada al cuadrado k = número de jueces N= número de objetos ordenados
201
Datos ligados
donde: t= número de datos ligados en el grupo que conforma la liga. PRUEBA DE SIGNIFICANCIA DEL COEFICIENTE La prueba de significancia se obtiene por medio de la X2 TIPO DE HIPÓTESIS A PROBAR Ho: La correlación entre las k variables no es significativa. Hi: La correlación entre las k variables es significativa. DISTRIBUCIÓN MUESTRAL Para probar la significación de la asociación se utiliza la distribución W gl proporciona los valores esperados para todas las muestras pequeñas posibles obtenidas en forma aleatoria, con N (objetos) y k (jueces). Para muestras grandes se utiliza la distribución X2 con gl= N-1, donde N = número de objetos ordenados Para muestras pequeñas: Se obtiene Wt con un valor de k y N dados, y un nivel de significación específico (.05, .01) Para muestras grandes: Se calcula el valor de X2 con la fórmula
REGLA DE DECISION Muestras pequeñas Wo ≥ Wt se rechaza Ho Muestras grandes Se compara con X2 de tablas, con gl=N-1, donde N= número de objetos ordenados, si
EJEMPLO Se pidió a tres ejecutivos que entrevistarán a seis candidatos para ocupar el puesto de gerente, en donde evaluarán su grado habilidad para el puesto. A los puntajes originales se les asignó el 202
rango correspondiente conforme al procedimiento indicado. Con los datos obtenidos se quiere determinar el grado de acuerdo en el ordenamiento de los ejecutivos. SOLUCIÓN Variables: No. de ejecutivos, considerados como jueces (X ): tres jueces Grado de habilidad ( Y ) Paso 1. Elegir la prueba estadística Dado que nos interesa determinar el grado de acuerdo entre los ejecutivos, los cuales pueden considerarse como jueces, los datos son ordinales dado que ya se les ha asignado los rangos y la muestra es aleatoria, se calculará el coeficiente de concordancia de Kendall y se probará su significancia con el estadístico W ya que es una muestra pequeña (n=6). Paso 2. Construir tabla de datos Como ya se indicó se hizo la asignación de los rangos de la manera descrita y se obtuvo la suma de los rangos para cada columna.
Paso 3. Calcular el coeficiente Se aplicada fórmula para datos no ligados.
Paso 4. Obtener su significancia 4.1. Establecerlas hipótesis a probar 203
Ho: La relación entre las variables no es significativa Hi La relación entre las variables es significativa Paso 4.2. Especificar alfa Se empleará un = 0.05. Paso 4.3. Región de Rechazo Dado que la hipótesis alterna es sin dirección la Ho podrá ser rechazada si el valor observado de W cae en cualquiera de los extremos de la distribución. Paso 4.4. Calcular el valor de W Como la muestra es pequeña se puede obtener W de tablas con k y N. Wt, 3, 6, .05 = .660 Paso 4.5. Decisión Wo ≥ Wt,
Rechazamos Ho .16 <.66
Dado que Wo (.16) < Wt (.66 con un k=3, N=6, 0.05; podemos aceptar la Ho y rechazar la Hi. Conclusión: No existe acuerdo entre los jueces respecto a las asignaciones que hicieron de los candidatos. (W=.16 < Wo =.66, k=3 N= 6, a = 0.05). PROCEDIMIENTO DE CALCULO MEDIANTE EL PAQUETE SPSS. Paso 1. Elaboración de la base de datos. Para capturar la base de datos los renglones de la hoja de cálculo representan a los jueces (k) y las columnas representan a los objetos ordenados (N). Así se definen N columnas y en los k renglones se capturan la ordenación que dio cada juez a los objetos. El primer renglón contiene la ordenación del primer juez, el segundo renglón la ordenación del segundo juez y así sucesivamente. Ver figura 1.
204
Paso 2. Obtener el estadístico. Una vez capturada la base se procede a correr el análisis siguiendo la ruta: Statistics Nonparametrics tests related samples (ver figura 2) Se pasan todas las columnas definidas Se da clic en Friedman para desmarcarlo y se da clic en Kendall's W Ver figura
205
Paso 3. Tomar la decisión estadística interpretando la hoja de resultados. Una vez dadas las indicaciones para correr el análisis se despliega una hoja de resultados (Output) que muestra los datos correspondientes a la prueba realizada. Con base en la información presentada se toma la decisión estadística.
El acuerdo entre los ejecutivos presenta un valor del coeficiente W=.162 con una X2 =2.429, g1=5, p=.787, aplicando la regla de decisión: 206
Si pspss> Si pspss ≤
Ho.
tenemos que .787 > .05, por lo que aceptamos Ho lo cual indica que no existe un acuerdo significativo entre las ordenaciones que hicieron los ejecutivos. Conclusión: El valor de ji cuadrada no resulta significativo de acuerdo a la regla de decisión descrita, por lo tanto, W=.16 no muestra evidencia estadísticamente significativa de que hay acuerdo entre los ejecutivos.
207
Tabla 'I'. Valores críticos del coeficierne de acuerdos W de Kendall.*
208