TABLA DE CONTINGENCIA (contingencia – asociación) O tabla de doble entrada o tabla cruzada, análisis bi variado del análisis relacional: Tiene 2 variables, por ejemplo: Fumar y Cáncer que son variables categóricas !a cáncer a aquellos que más "uman y como se demuestra esto es con la tabla de contingencia #nalizar, estad$sticas descriptivas y tabla de contingencia %#& CO'& CO'&(C (C)( )('C 'C*# *#& & &*(+ &*(+-( ( .#' (' %#& CO% CO%)+'# )+'#& & /C#' /C#'C( C(- !( )%+0'1 %#& .#-*#%(& *'!('!*('T(& .#' .#' (' %#& F*%#& /3#*TO& !( F)+#-1
De 29 personas que tienen un ese!pe"o #a$ora# a#to% &2 tienen e ' a 2 inasistenci inasistencias as Estos &2 e #as 29 personas acen e# *&*+ CALC,LA- . -ECODI/ICA- 0A-IABLE1 (eso Ta##a) !(% (&O 4 %# T#%%# &( )(!( C#%C)%#- (% *'!*C( !( +# CO-O-#% 4 # #-T*- !( (&T( .#%O- &( C#%C)%# %O& .#%O-(& ) OT('(- (% (&T#!O ')T-*C*O'#% !( %#& (-&O'#& 'O& .#+O& # T-#'&FO-+#- 4 %)(5O C#%C)%#- .#-*#%( y en variable de destino escribir: *+C, y en e6presión num7rica se debe colocar la "ormula respectiva: eso8/talla9talla1 y luego aceptar aceptar %uego se debe ir a trans"ormar y la opción recodicar en distintas variables para ;allar el E1TADO N,T-ICIONAL
#ceptar y veremos la columna ')T-*C*O'#% %uego nos vamos a vista de variables para dar los valores como sigue: <: !esnutrido
2: (utróco =: &obrepeso >: Obesidad ?: Obesidad mórbida #;ora se puede encontrar las "recuencias para luego interpretar
C3I C,AD-ADO . CO4O 1E CALC,LA (Ci Cuarao 2 !uestras inepenientes) &e trabaja con variables categóricas nominales /dicotómicas y politómicas1 y permite reconocer la asociación #nalizar, estad$sticos descriptivos, tablas de contingencia, luego se asigna las variables a las las y columnas, se compara a trav7s de las columnas por lo que es importante colocar en la ubicación adecuada la variable en la columna y se e6presa a trav7s de los porcentajes, luego a casillas y se selecciona en porcentaje columna, continuar, (stad$stico se c;equea el c;i cuadrado, continuar y aceptar %#& F*%#& &( )T*%*@#' #-# 3#%%#- %#& F-(C)('C*#& #l analizar las "recuencias, se puede denir que: Aserá que el g7nero "emenino tiene un bajo rendimiento laboralB /2=D1, los datos tomados de esta tabla no son lo sucientemente conables, por lo que recurriremos a una prueba estad$stica que nos permita denir ello: -ecurriremos al c;i cuadrado: Tenemos el valor asignado al c;i cuadrado y el .#%O- O !('O+*'#!O &*5'*F*C#'C*# #&*'T0T*C# /*%#T(-#%1, este valor es la magnitud del error en caso de que aceptemos la ;ipótesis de que el empleado de g7nero "emenino está asociado con el bajo nivel de rendimiento laboral ara ello es importante denir el nivel de signicancia o grado de error que estamos dispuestos a aceptar como válida nuestra conclusión 3abitualmente este nivel de signi"icancia o al"a /E1 es del ?D o ?, por lo que el valor arrojado está por debajo del ?, muy bajo que quiere decir que estaos aceptando este error al aceptar la ;ipótesis y que estar$amos deniendo la asociación entre el g7nero y el rendimiento laboral
TE1T DE 4CNE4A- (AntesDespues) *dentica modicaciones de una variable categórica a trav7s del tiempo Cuando se trata de dos variables /antes y despu7s1 en medio de ellos deberá ;aber < variable /si ;ay una manipulación entonces se trata de un e6perimento, pero si se trata de un periodo de observación en este caso se trata de un estudio operacional1, por lo tanto el test de +c'emar sirve tanto para estudios observacionales y e6perimentales y a la vez deberá ser %O'5*T)!*'#% o por lo menos debe tener dos medidas ara esto es necesario aplicar el ritual de la signicancia estad$stica: < /or!u#ación e #a ipótesis :
2 = > ?
3: 3ipótesis nula o ;ipótesis de trabajo: /si es que no ;a e6istido modicación1 3<: 3ipótesis alterna o ;ipótesis del investigador: /qu7 quiere saber el investigador entre el antes y el despu7s, es que ;a ;abido modicación1 Ni5e# e signi6cancia : ?D ó ? Esta7stico e prue$a : Test de +c'emar Esti!ación e# p85a#or : To!a e ecisión : &* pG? entonces rec;azamos la ;ipótesis nula 'os quedamos con la ;ipótesis del investigador
(ntonces vamos a #nalizar, estad$stico descriptivo, tablas cruzadas, en las antes y en columnas despu7s, en estad$sticos seleccionamos solo +c'emar, continuar y en casillas seleccionamos en porcentajes TOT#%, continuar y aceptar (n la tabla podemos apreciar que ;ay personas que antes y despu7s tienen depresión, pero tambi7n ;ay que antes ten$an depresión y despu7s no o viceversa (n la siguiente tabla, lo que nos interesa es el .#%O- o &*5'*F*C#'C*# (H#CT# /*%#T(-#%1, que en este caso es de >2> y 7ste por encima del nivel de signicancia /?1, y si .#%O- (&T# O- !(#IO !( ? ('TO'C(& -(C3#@#+O& %# 3*0T(&*& ')%# #-# J)(!#-'O& CO' %# 3*0T(&*& !(% *'(&T*5#!O-
TE1T EACTO DE /I13E- (/iser) Test de probabilidad utilizado cuando las dos variables que participan en el análisis son jas /+#-5*'#% F*I#&1, las distribuciones nales de estas 2 variables no se pueden modicar en este caso son e6perimentales #nalizar, (stad$stica descriptiva, tablas cruzadas, las "rejoles y columnas larvas y aceptar y se tiene la tabla de contingencia, tenemos
T DE 1T,DENT A-A 4,E1T-A1 INDEENDIENTE1 (t stuent !uestras inepenientessa5) Clásicamente, cuando queremos comparar 2 grupos y la variable que queremos comparar es una variable num7rica, pensamos en la T de student para muestras independientes /cuando se trata de 2 grupos que no tienen ninguna relación entre ellos1, por ejemplo, el peso del reción nacido en varones y mujeres y la pregunta es: Aserá que el reci7n nacido varón tendrá el mismo peso que las mujeresB, si no ;ay di"erencia entonces no ;ay razón
de investigar, pero si el investigador piensa que ;ay di"erencia entre los grupos, entonces se deberá de investigar, por lo tanto: < /or!u#ación e #a ipótesis : 3: 3ipótesis nula o ;ipótesis de trabajo: /que los dos grupos no son distintos, es decir que son iguales, que son ;omogeneos1 3<: 3ipótesis alterna o ;ipótesis del investigador: /qu7 quiere saber el investigador piensa que ;ay di"erencia a es di"erente que b, o el grupo < es di"erente que el 21 2 Ni5e# e signi6cancia : ?D ó ? = Esta7stico e prue$a : t de student para muestras independientes > Esti!ación e# p85a#or : ? To!a e ecisión : &* pG? entonces rec;azamos la ;ipótesis nula 'os quedamos con la ;ipótesis del investigador #nalizar, comparar medias, t de student para muestras independientes, el peso en variables para contrastar y el se6o en variables de agrupación
(n la tabla de resultado nos damos cuenta que la media es di"erente entre varones y damas, pero a nosotros lo que nos interesa saber si es signicativa, por lo que nos vamos a la tabla de prueba de t para muestras independientes, y en la columna t /valor del estad$stico1 se puede ver el siguiente valor 2,>=<, pero actualmente este valor ya no nos sirve, lo que nos sirve es el .#%O- /&ignicancia bilateral1 que es la magnitud del error que nos da el siguiente valor ,22, por lo que G?, entonces rec;azamos la ;ipótesis nula y aceptamos la ;ipótesis del investigador /de di"erencias1, entonces podremos decir que el peso de los -' mujeres es di"erente que el peso del -' varón
T DE 1T,DENT A-A 4,E1T-A1 !uestras re#acionaassa5)
-ELACIONADA1 (t stuent
Comparación entre 2 grupos num7ricos y que pertenecen al mismo grupo, tenemos el peso de mujeres embarazadas, y despu7s de = meses despu7s del parto, entonces de nuevo se vuelve a pesar, por lo que podremos decir si ;ay *'C-(+('TO o !*&+*')C*0' entre este grupo, esto sgnica de una 3*0T(&*& !( )'# &O%# CO%#,
< /or!u#ación e #a ipótesis : 3: 3ipótesis nula o ;ipótesis de trabajo: 3<: 3ipótesis alterna o ;ipótesis del investigador: usca saber si ;ay di"erencia /incremento gracias al embarazo1 2 Ni5e# e signi6cancia : ?D ó ? = Esta7stico e prue$a : t de student para muestras relacionadas > Esti!ación e# p85a#or : ? To!a e ecisión : &* pG? entonces rec;azamos la ;ipótesis nula 'os quedamos con la ;ipótesis del investigador #nalizar, comparar medias, prueba T para muestras relacionadas,
%uego aceptar %a tabla resultante, comparamos las muestras y se ve que s$ ;ay di"erencia entre ambas por lo que nos vamos a la tabla de muestras relacionadas y nos vamos a la co#u!na t (esta7stico t)% pero #o que !;s nos interesa es e# 0ALO- < tiene e# siguiente 0ALO- '%=>*% entonces podremos decir que esta ci"ra está por encima del nivel de signicancia /?1, por lo que aceptamos la ;ipótesis nula
CO--ELACION DE EA-1ON
%a asociación que trabajábamos con las variables categóricas, se trasladan a la correlación cuando trabajamos con variables num7ricas, de manera que la asociación y la correlación sigan siendo lo mismo, lo comLn entre ambas es que tienen .#-*#%(& #%(#TO-*O& /es decir que su distribución no la conocemos ;asta la recolección de datos1, en el ejemplo se ;a recolectado la ;emoglobina de M mujeres durante la gestación y tambi7n se ;a evaluado el peso de los -eci7n 'acidos con la nalidad de que si el valor de la ;emoglobina de la madre está relacionada con el peso de su ;ijo ya que estamos determinando la validez a trav7s de la CO--(%#C*0' !( (#-&O', pero tambi7n podemos esto categorizar para aplicar C3* C)#!-#!O /clasicando la ;emoglobina como normal y bajo y el peso como adecuado y bajo /A1OCIACI?N11 #nalizar, Correlaciones, y ivariadas, seleccionamos ambas variables, por de"ecto está seleccionado earson, si queremos trabajar con datos ordinales se selecciona TauNb endall y &pearman es la versión no param7trica de earson (l $ndice de correlación es N?, pero la signicancia /bilateral1 es igual a 2 y es mayor que el nivel de signicancia /?1 por lo que rec;azamos la ;ipótesis del investigador y aceptamos la ;ipótesis nula (& )('#, 4# J)( %O J)( )&C# (% *'.(&T*5#!O- (& %# CO--(%#C*0' ('T-( #+#& .#-*#%(& %# .#%*!#C*0' &( !# CO' (% *'!*C( !( (#-&O' /cumplimiento de *ndice de - y -;o1 que en este caso el valor es ? y %# &*5'*F*C#'C*# /*%#T(-#%P 21
Inices - < -o
Interpretación
Q 2
*ntima correlación
2 Q >
escasa correlación
> Q
moderada correlación
Q K
buena correlación
K Q <
muy buena correlación
ANALI1I1 DE LA 0A-IAN@A ANO0A Cuando queremos comparar 2 grupos y las variables a contrastar es una variable num7rica utilizamos la T de student para muestras independientes, pero que pasar$a si lo grupos que comparamos es más de 2 en este caso utilizamos el An;#isis e #a 0ariana con un /actor o An;#isis e #a 0ariana e una 07a Con el ejemplo: #nalizar, comparar medias, #nova de un "actor, la variable que vamos a contrastar será el (&O y el "actor será rocedencia, OC*O'(& se selecciona los !(&C-*T*.O&
#ceptar (n el resultado se puede ver las medias de los pesos por ciudades, y se ve en la tabla de #'O.# y que var$a de un lugar a otro %a pregunta es:
1I EL E1O -O4EDIO DI/IE-E EN E1TA1 * LOCALIDADE1 O 1I EL E1O -O4EDIO E1 EL 4I14O < /or!u#ación e #a ipótesis : 3: 3ipótesis nula o ;ipótesis de trabajo: 3*0T(&*& !( *5)#%!#! 3<: 3ipótesis alterna o ;ipótesis del investigador: (l investigador siempre busca di"erencias 3*0T(&*& !( !*F(-('C*#& 2 Ni5e# e signi6cancia : ?D o ? = Esta7stico e prue$a : #nálisis de la varianza #'O.# > Esti!ación e# p85a#or : ? To!a e ecisión : &* pG? entonces rec;azamos la ;ipótesis nula 'os quedamos con la ;ipótesis del investigador %a tabla de #'O.# tiene su estad$stico /Columna F1, pero lo importante es la &*5'*F*C#'C*# #&*'T0T*C# que en este caso es el >M por lo que podemos apreciar que el N.#%O- es mayor que ? determinamos la ;ipótesis de *gualdad &i .#%O- ;ubiera sido menor, entonces determinar$amos que e6iste di"erencia entre ciudades, pero la pregunta es determinar cuál es esa di"erencia entre ciudades /cuál es la di"erencia entre #requipa y Tacna, #requipa y uno, etcR1, para ello necesitamos el cálculo de O1T 3OC debemos irnos: #nalizar, comparar medias, #nova de un "actor, ost 3oc y elegimos T)(4, Continuar y #ceptar y vemos la siguiente tabla:
odemos ver que, en la columna de la &ignicancia #sintótica, ninguna de los resultados es mayor de ? y en la siguiente tabla podemos ver que
&e puede ver que solo aparece una columna /la <1, la cual nos indica que no e6iste di"erencia ya que se encuentran en la misma columna, pero si se ;ubiera visto la columna 2 se podr$a ver la di"erencia signicativa entre la columna 2 y la columna < Tambi7n se puede ver la signicancia entre los grupos y que en este caso es de >?< signica tambi7n que no e6iste di"erencia entre grupos
-EG-E1I?N LINEAL 1I4LE
&e da cuando previamente se ;a demostrado relación entre 2 variables, pero no solamente en una relación aleatoria sino una relación causal, es que esta regresión corresponde a un +O!(%O -(!*CT*.O, mientras que una CO--(%#C*O' corresponde a una -)(# !( 3*0T(&*&, en el ejemplo tenemos una variable 4 /-endimiento #cad7mico1 y H /3oras de estudio a la semana1, en este caso ya sabemos que e6iste relación entre ellos /a más ;oras de estudio mayor es el rendimiento1, entonces no vamos a realizar la -)(# !( 3*OT(&*&, lo que vamos ;acer es construir un modelo para predecir el rendimiento acad7mico en "unción al nLmero de estudios a la semana, suponiendo que el rendimiento acad7mico depende Lnicamente de cuantas ;oras una persona lo dedica al estudio una semana #nalizar, -egresión y %ineales, en dependiente colocamos rendimiento acad7mico y en independientes ;oras de estudio a la semana y a 7sta tambi7n podemos colocar otras variables que inSuyan en el rendimiento acad7mico (n la Tabla -esumen del modelo podemos ver que en la columna - /- de earson1 tenemos un valor de K> y el - cuadrado /columna1 es de
4 si en esta tabla nos vamos a la columna /t Q t de student1 nos da la acertividad para la columna de &ignicancia en donde podemos ver que ambos valores son menores que ? por lo tanto la constante y el coeciente para las ;oras de estudio a la semana, son signicativos
-,EBA DE NO-4ALIDAD – OL4OGO-O0 14INO-0 Cuando queremos comparar 2 grupos y 7stos tienen distribución normal podemos construir #os iagra!as e caa < $igotes en Función a# error t7pico e #a !eia para #os #7!ites e #a caa U si la l$nea media de una caja se puede proyectas sobre el otro y 7ste se encuentra dentro de la caja entonces ;ay igualdad, pero s$ de ambos no están dentro, entonces son di"erentes /#-# #+O& (H*&T( &*+(T-*#1
ero qu7 pasa si una de las cajas es #&*+VT-*C# y a otra no
Ju7 pasa si dejamos de e6tender las cajas #&*+VT-*C#& para llevarlos a un estado &*+VT-*CO, estar$amos en la posición como el caso anterior %%(5#+O& # %# CO'C%)&*0' !( J)( #-# CO+#-#- !O& 5-)O& %#& C#I#& !((' &(- 1I4T-ICA1 (& !(C*- !(( 3#(- )'# DI1T-IB,CI?N NO-4AL ACómo demostramos que e6iste !*&T-*)C*0' 'O-+#% en los grupos de las .#-*#%(&B (s utilizando la prueba de O%+O5O-O. Q &+*-'O. (n el ejemplo: tenemos un conjunto de reci7n nacidos que pertenecen a 2 ciudades, por lo que debemos determinar la NO-4ALIDAD DE ,NA DI1T-IB,CI?N: #nalizar, ruebas no param7tricas, Cuadro de diálogos antiguos, N& de una muestra, luego trasladamos la variable a analizar /(&O -'1, dejar por de"ecto la elección y #ceptar < /or!u#ación e #a ipótesis : 3: 3ipótesis nula o ;ipótesis de trabajo: 3*0T(&*& !( 3O+O5('(*!#! 3<: 3ipótesis alterna o ;ipótesis del investigador: 3*0T(&*& !( !*F(-('C*#&
2 Ni5e# e signi6cancia : ?D o ? = Esta7stico e prue$a: rueba de normalidad O%+O5O-O. &+*-'O. > Esti!ación e# p85a#or : ? To!a e ecisión : &* pG? entonces rec;azamos la ;ipótesis nula 'os quedamos con la ;ipótesis del investigador .emos en la tabla de resultado lo siguiente:
.emos que la &ignicancia #sintótica es menor que ?, por lo que rec;azamos la nula y aceptamos la alterna, es decir que ;ay !*F(-('C*# ('T-( %# !*&T-*)C*0' !( %# .#-*#%( #'#%*@#!# 4 %# !*&T-*)C*0' !( %# .#-*#%( 'O-+#%, entonces no ;ay ;omogeneidad entre ambas distribuciones #;ora ana#iare!os #a nor!a#ia para cada uno de los grupos, recordando que se tiene 2 grupos: !atos, &egmentar #rc;ivo, seleccionamos la opción de Organizar los resultados por 5rupos y seleccionamos proceencia y le damos #ceptar y veremos que en la +#T-*@ !( !#TO& 3#C( +('C*0' !( DI0IDO O 1E4ENTADO O- -OCEDENCIAU #;ora nos vamos nuevamente a analizar la normalidad: #nalizar, pruebas no param7tricas, Cuadro de diálogos antiguos, N& de < muestra y como ya todo está congurado simplemente #ceptar .emos que la 'O-+#%*!#! &( 3# (.#%)#!O O- 5-)O&:
%uego debemos medir para cada comparación la signicancia #sintótica /bilateral1 y comparar con ? por lo que en el primer gráco no podemos rec;azar la 3 ')%# en cambio en el segundo gráco &W -(C3#@#+O& %# 3 ')%#
1i a!$as u$ieran sio !a
3O4OGENEIDAD DE 0A-IAN@A1 TE1T DE LE0ENE Cuando queremos comparar grupos tenemos que asegurarnos que la variabilidad de un grupo sea igual o por lo menos no distinta del otro grupo, Apara qu7B, para poder proyectar la l$nea media de un grupo sobre el otro y en el caso de que esta proyección est7 en el interior de la caja lleguemos a la conclusión de que son iguales, o si la proyección está por "uera de la caja lleguemos a la conclusión de que son di"erentes
Ju7 pasar$a si la longitud de una de las cajas no es igual a la del grupo comparativo, veamos en este caso se ;a encogido /C#&O <1, es menor, y la proyección de la l$nea media del primer grupo está por "uera de la caja del segundo, aunque la proyección del segundo sobre el primero se ;a mantenido Aqu7 ;a sucedidoB, es que la segunda caja o variable está más concentrada y por eso su caja es de menor magnitud .eamos un segundo caso /C#&O 21, cuando la caja se e6tiende por incremento de variabilidad, entonces la proyección de la l$nea media sobre el primer grupo está "uera de la caja, pero por ;aber proyectado la caja del segundo la l$nea media del primero está en su interior, en ambos casos /caso < y caso 21 no podemos decidir si ;ay di"erencias o no Apor qu7B, porque la variabilidad de los 2 grupos es distinta /el tamaXo de las cajas son distintas1 para el caso < y 2
Juiere decir que cuando queremos comparar 2 grupos, los tamaXos de las cajas deben ser iguales y esto eJpresao en tKr!inos e 5aria$i#ia signi6ca que #as 5arianas sean igua#es% sean o!ogKneas ta!$iKn ##a!aa co!o o!ogeneia e 5arianas o ta!$iKn o!oceasticia or lo que, para comparar la varianza de estos 2 grupos, nos vamos al &&&: #nalizar, comparar medias, prueba de t para muestras independientes, en la variable a contrastar el eso del -' y en la variable de agrupación, la procedencia, deniendo grupos /< y 2 por la procedencia que se ;a colocado en la vista de variables1, continuar y aceptar (n la tabla resultante de la rueba de muestras independientes se puede ver que e6iste una columna de prueba de %(.('( de igualdad de varianzas y en su columna F /su estad$stico1 se ve su valor de = y en el .#%O- /prueba de signicancia1 el valor de M?? y si nos vamos a la siguiente descripción: < /or!u#ación e #a ipótesis : 3: 3ipótesis nula o ;ipótesis de trabajo: 3*0T(&*& !( 3O+O5('(*!#! 3<: 3ipótesis alterna o ;ipótesis del investigador: 3*0T(&*& !( !*F(-('C*#& 2 Ni5e# e signi6cancia : ?D o ? = Esta7stico e prue$a: 3O+O5('(*!#! de varianzas Test de %(.('( > Esti!ación e# p85a#or : ? To!a e ecisión : &* pG? entonces rec;azamos la ;ipótesis nula 'os quedamos con la ;ipótesis del investigador or valor quiere decir que aceptamos la ;ipótesis nula y rec;azamos la del investigador, ya que M??Y? por lo que se interpretará que las varianzas de estos 2 grupos son iguales y no distintas que ser$a la ;ipótesis del investigador (ntonces ;ay 3O+O5('(*!#! de varianzas:
ero qu7 ;ubiera pasado si .#%O- era menor que ?, se dar$a que ;abr$a di"erencia de varianzas y estar$amos en el siguiente caso /3(T(-O5('(*!#!1:
(n el siguiente gráco, podemos ver que 7sta se divide en 2 las: una cuando se asume varianzas iguales /rueba %evene1 y la otra cuando no se asumen varianzas iguales /t de student1
&i quisi7ramos comparar el grupo < con el =, nos vamos al &&&: #nalizar, comparar medias, prueba de t para muestras independientes, y en denir grupos colocamos en vez de 2 el = o el >, pero que pasar$a si queremos compara los > grupos al mismo tiempo: #nalizar, comparar medias, #'O.# de un "actor, en lista dependiente el &O y en F#CTO- la rocedencia, y en opciones, prueba de ;omogeneidad de varianzas, continuar y #ceptar y podemos ver en la tabla resultante la prueba de signicancia de los > valores /para ello deberán tener los > los valores llenos1
NI0ELE1 DE IN0E1TIGACI?N < ' (6ploratorio: /&e desea saber el porqu7 de las cosas1
2 ' !escriptivo: /)nivariable, se calcula las "recuencias Q medidas de tendencia central para las variables categóricas y las medidas de dispersión para las variables num7ricas1 = ' Correlacional: /ivariado, estad$stica in"erencial #sociaciónNY. CategóricasNYC;i Cuadrado y CorrelaciónNY . 'um7ricasNYearson1 > ' (6plicativo: /+ultivariable, Causa ("ecto, inSuencia1 +ide el grado de inSuencia ? ' redictivo: redecir ' #plicativo: +ejoras a los resultados