Guía SPSS: Análisis Factorial Material de apoyo para la ayudantía de Análisis Estadístico IV Universidad de Chile- Departamento de Sociología
Monica Gerber Plüss Macarena Orchard Rieiro
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Actualización: Marzo 2006
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
I.
INTRODUCCIÓN
En la siguiente guía se ejemplifica el uso y el análisis de las salidas del programa estadístico SPSS v.13. para la técnica estadística multivariante Análisis Factorial. Para ello, se plantea un objetivo de investigación y se resuelve a través de la técnica mencionada. A continuación se presentan los objetivos del análisis a realizar, los datos y las variables a utilizar. Luego se describe la utilización de los comandos del programa y se analizan las salidas obtenidas.
II. PRESENTACIÓN DEL EJEMPLO
-
Base de datos: Para la ejemplificación del Análisis Factorial se utilizará una parte de la base de datos de la encuesta de “Tolerancia y No Discriminación” 1. Todas las variables que contiene la base de datos son parte de una escala Likert con 6 opciones de respuesta, que miden el grado en el que el encuestado se encuentra de acuerdo o en desacuerdo con una afirmación específica en torno a temas relacionados con tolerancia y discriminación. La encuesta está compuesta de una serie de subescalas, tales como homofobia, racismo anti-indígena, sexismo, dogmatismo, autoritarismo, entre otras.
-
Objetivos: El fin de este análisis es revisar la validez de las subescalas de Tolerancia y No-Discriminación. Dado que el análisis factorial permite analizar la estructura subyacente de una serie de variables, se constituye en la herramienta ideal para constatar que las variables que componen las distintas subescalas realmente son parte de una misma dimensión.
-
Variables: Cabe recordar que el análisis factorial es una técnica de interdependencia que opera con variables cuantitativas. Ya que en este análisis se utilizan 63 variables no las enumeraremos todas, pero a continuación pondremos algunas para ejemplificar:
-
A los homosexuales no se les debe permitir ser profesores de colegio. La mujer que trabaja debe hacerlo en tareas propias de su sexo, tales como enfermería, trabajos de oficina y cuidado de los niños. Hay dos clases de individuos en este mundo; los que están a favor o en contra de la verdad Los pobres son tan descuidados con su aspecto que da temor acercarse a ellos.
-
1
Encuesta Tolerancia y No Discriminación. Jaime Aymerich, Manuel Canales, Manuel Vivanco
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
La base de datos es la siguiente:
III. APLICACIÓN COMPUTACIONAL Para llevar a cabo el análisis seleccionamos el análisis factorial en Analizar (“Analyze”), Reducción de Datos (“Data Reduction”) y Análisis Factorial (“Factor”):
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
La ventana que obtenemos es la siguiente:
Al ser una técnica de interdependencia no definimos las variables dependientes e independientes, sino que incluimos todas las variables en el mismo recuadro. A continuación, en la ventana se da la opción de especificar en cuanto a: Descriptivos, Extracción, Rotación, Puntajes y Opciones. Para empezar abrimos la ventana de Descriptivos:
Las opciones que pueden pedirse son, por un lado, estadísticos, y por otro, matrices de correlación. Con respecto a los estadísticos, podemos pedir los Descriptivos Univariantes y la Solución Inicial, y con respecto a las Matrices de Correlación, los Coeficientes, los Niveles de Significación, la Determinante, KMO y la Prueba de Esfericidad de Bartlett, la Matriz Inversa, la Matriz Reproducida y la Matriz Anti-Imagen. En este caso decidimos marcar todas las opciones, exceptuando los Niveles de Significación y la Matriz Inversa para las Matrices de Correlación. La utilidad y el análisis de cada uno de estos estadísticos y matrices se explicarán al interpretar las salidas.
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Marcamos Continuar y luego abrimos la ventana de Extracción:
La primera decisión a tomar es el método de extracción. Como predeterminado viene el Método de Componentes Principales. Para fines de esta guía no nos detendremos mayormente en explicar cada uno de estos métodos, pero optamos por dejar la opción predeterminada. Luego se da la opción de elegir si el análisis se llevará a cabo a través de la Matriz de Correlaciones o de Covarianzas. También en este caso lo dejamos en el predeterminado. Además, el programa da la opción de mostrar la Solución no Rotada y el Gráfico de Solución. Se marcan ambas opciones. A continuación es necesario tomar una decisión con respecto al número de factores que serán extraídos. Nótese que en un principio se obtienen tantos factores como variables existentes. Si mantuviéramos todos los factores, no estaríamos reduciendo dimensiones. Es por eso que un criterio muy común es fijar el corte en factores con un autovalor mayor que 1, lo que implica que el factor explica por lo menos una variable. Otra opción es definir un número fijo de factores a conservar. En este caso se opta por utilizar el criterio del autovalor mayor a 1. Por último, se da la alternativa de elegir un número máximo de iteraciones a realizar por el programa. Vemos de manera predeterminada 25 iteraciones. No se harán modificaciones en este caso. Marcamos Continuar y abrimos la ventana de Rotación:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
En esta ventana debe seleccionarse el Método de rotación de los factores. La rotación ayuda a una mejor interpretación de los mismos. Existen varios métodos, entre ellos Varimax, Quartimax, Equamax, etc. La manera en la que estos distintos métodos reorganizan la varianza es distinta. Por ejemplo, el método Varimax busca simplificar la interpretación de las columnas de la matriz de factores. Esta es la opción más común y es la que se utilizará en este caso. Marcamos además la opción de mostrar la Solución Rotada y el Gráfico de Componentes en el espacio rotado. Nuevamente dejamos en 25 las iteraciones máximas. Marcamos continuar y abrimos la ventana de Puntajes:
Esta ventana da la opción de calcular por medio de varios métodos (Regresión, Bartlett, Anderson-Rubin) los puntajes de cada caso en las nuevas variables o dimensiones que se generen. La lógica subyacente tiene que ver con poder remplazar las variables antiguas por los nuevos componentes en un futuro análisis. Para esto es necesario asignarle a cada caso un puntaje en cada nueva variable, como si ésta hubiera sido medida directamente. En este caso, pedimos que guarde las nuevas variables y que el método de creación de los puntajes sea el de la regresión. Marcamos Continuar y abrimos la ventana de Opciones:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
En esta ventana se decide el tratamiento de los casos perdidos. Se selecciona la opción de remplazar los casos perdidos por la media. Además, existe la opción de que los coeficientes en las funciones sean ordenados por tamaño. Marcamos esta opción ya que ayuda a una interpretación más simple. Al marcar “Paste” (Pegar) obtenemos la sintaxis:
FACTOR /VARIABLES p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 p30 p31 p32 p33 p34 p35 p36 p37 p38 p39 p40 p41 p42 p43 p44 p45 p46 p47 p48 p49 p50 p51 p52 p53 p54 p55 p56 p57 p58 p59 p60 p61 p62 p63 /MISSING MEANSUB /ANALYSIS p1 p2 p3 p4 p5 p6 p7 p8 p9 p10 p11 p12 p13 p14 p15 p16 p17 p18 p19 p20 p21 p22 p23 p24 p25 p26 p27 p28 p29 p30 p31 p32 p33 p34 p35 p36 p37 p38 p39 p40 p41 p42 p43 p44 p45 p46 p47 p48 p49 p50 p51 p52 p53 p54 p55 p56 p57 p58 p59 p60 p61 p62 p63 /PRINT UNIVARIATE INITIAL CORRELATION DET KMO REPR AIC EXTRACTION ROTATION /FORMAT SORT /PLOT EIGEN ROTATION /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PC /CRITERIA ITERATE(25) /ROTATION VARIMAX /SAVE REG(ALL) /METHOD=CORRELATION .
Marcamos Continuar y en la ventana principal marcamos OK para procesar los datos. De este modo se obtienen las salidas. Cabe destacar que las salidas del Análisis Factorial son bastante amplias, ya que se incluyeron 63 variables. Es por esto que se irán mostrando solo pedazos de las tablas, suficientes para ejemplificar la interpretación:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Lo primero que obtenemos son los estadísticos descriptivos para cada variable:
A. factorial Es tadís ticos descriptivos Media Preg.1 Una perso na que práctica una religió n es más confiable que alguien ateo . Preg.2 No se debe permitir el divorcio pues se po ne en peligro la so lidez del matrimo nio y la familia. Preg.3 La obediencia y el respeto a la auto ridad so n las primeras virtudes que hay que enseñar a lo s niño s. Preg.4 Es natural y justo que se impo nga a las mujeres ciertas restriccio nes que no pesan so bre lo s hombres Preg.5 A lo s ho mo sexuales no se les debe permitir ser profeso res de co legio. Preg.6 Por sus características raciales los indígenas tendrán siempre una limitación so cial Preg.7 Las personas que usan barba , pelo largo y tatuajes, deben cambiar su aspecto para trabajar en cualquiera empresa. Preg.8 En alguno s caso s especiales el aborto es aco nsejable. Preg.9 Es triste admitirlo , pero las desigualdades so ciales so n necesarias para el funcionamiento de la eco no mía. Preg.10 Un colegio adecuado para las niñas es aquel do nde pueden aprender co rrectamente sus ro les de madre y espo sa.
Desviación a típica
a
N del análisis
N perdida
3,69
1,912
600
0
4,17
1,986
600
0
2,09
1,542
600
0
4,7 4
1,7 30
600
0
3,94
2,130
600
0
4,57
1,914
600
0
3,89
2,066
600
0
3,52
2,130
600
0
4,09
2,040
600
0
4,15
2,023
600
0
a. Para cada variable, lo s valores perdidos se sustituyen po r la media de la variable.
Los datos que obtenemos son la Media, la Desviación Standard, el número de casos válidos y los valores perdidos. Éstos no tienen mucha utilidad para el análisis mismo, pero sirven para tener una visión general de la base de datos. Cómo las variables son todas parte de una escala Likert, variables con promedios bajos implican un mayor acuerdo con la afirmación a la que refieren, y variables con promedios altos implican un mayor desacuerdo. Observamos además, que no existen valores perdidos y que en todos los análisis se incluyeron 600 casos.
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
La siguiente tabla es la Matriz de Correlaciones: Matriz de correlacionesa
Correlación
Preg.1 Una persona que práctica una religión es más confiable que alguien ateo. Preg.2 No se debe permitir el divorcio pues se pone en peligro la so lidez del matrimo nio y la familia. Preg.3 La obediencia y el respeto a la autoridad so n las primeras virtudes que hay que enseñar a lo s niño s. Preg.4 Es natural y justo que se imponga a las mujeres ciertas restriccio nes que no pesan sobre los hombres Preg.5 A lo s ho mosexuales no se les debe permitir ser profeso res de colegio .
Preg.1 Una persona que práctica una religión es más confiable que alguien ateo.
Preg.2 No se debe permitir el divo rcio pues se pone en peligro la solidez del matrimonio y la familia.
Preg.3 La obediencia y el respeto a la autoridad son las primeras virtudes que hay que enseñar a los niño s.
Preg.4 Es natural y justo que se imponga a las mujeres ciertas restricciones que no pesan sobre los hombres
Preg.5 A los ho mo sexual es no se les debe permitir ser profeso res de colegio.
1,000
,368
,268
,304
,196
,368
1,000
,220
,227
,292
,268
,220
1,000
,255
,178
,304
,227
,255
1,000
,120
,196
,292
,178
,120
1,000
a. Determinante = 8,66E-010
Si bien solo vemos una parte ínfima de la tabla, basta para entender lo que ésta significa. Tanto en las columnas como en las filas se encuentran todas las variables. Las correlaciones se interpretan de manera tradicional, desde el -1 hasta el 1, donde el 0 significa que no existe relación entre las variables. Si bien esta matriz no es muy útil para sacar conclusiones, sirve para tener una visión general de las variables que se encuentran Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
correlacionadas. En la diagonal vemos puros unos, ya que la correlación de una variable consigo misma es siempre perfecta. En el resto de la tabla se observan las correlaciones entre todas las variables. Por ejemplo, la Pregunta 1 tiene una correlación de 0,368 con la Pregunta 2. Si observamos al pie de la tabla, a mano izquierda, vemos la Determinante. Si la Determinante se encuentra cercana a 0, significa que existe relación entre las variables. En este caso vemos claramente que existe relación entre las variables.
Otra forma de analizar si existe relación entre las variables es por medio del Test de KMO y de Bartlett: KMO y prueba de Bartlett Medida de adecuació n mues tral de Kaiser-Meyer-Olkin. Prueba de esfericidad de Bartlett
Chi-cuadrado apro ximado gl Sig.
,927 12043,7 34 1953 ,000
El Kaiser-Meyer-Olkin Measure Sampling Adequacy (KMO) es un estadístico que mide la proporción de la varianza en las variables que es común. Si es cercano a 1, existen suficientes comunalidades como para llevar a cabo el análisis. En este caso es ,927, por lo que sin duda alguna, existe varianza común entre las variables. El Test de Bartlett contrasta la hipótesis nula de que la matriz de correlación es una matriz identidad. La matriz identidad es una matriz que tiene unos en la diagonal y ceros en los demás espacios. Si nuestra matriz fuera una matriz identidad, la única relación existente sería la relación de cada variable consigo misma. Por lo tanto, la matriz identidad es una matriz de independencia. Para aceptar que existen relaciones en la matriz, la significación ha de ser menor a 0,05. En este caso la significación es de ,000, por lo que podemos afirmar que nuestra matriz no es una matriz identidad. La siguiente tabla es la Matriz Anti-Imagen:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
En la diagonal observamos la Medida de Adecuación de la Muestra. Interesa que sea mayor a 0,5. En este caso, cumple el requisito. En el resto de la tabla, que es lo que nos interesa, se presentan las correlaciones que no se deben a los factores comunes. Si hay valores bajos, podemos afirmar que nuestra matriz tiene poca varianza no explicada. En este caso observamos valores cercanos a 0, por lo que la varianza que no se debe a factores comunes es muy baja. Ahora observamos las Comunalidades:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Comunalidades Inicial Preg.1 Una perso na que práctica una religió n es más confiable que 1,000 alguien ateo. Preg.2 No se debe permitir el divorcio pues se po ne en peligro la solidez 1,000 del matrimonio y la familia. Preg.3 La obediencia y el respeto a la auto ridad son las primeras virtudes 1,000 que hay que enseñar a lo s niño s. Preg.4 Es natural y justo que se impo nga a las mujeres ciertas 1,000 restriccio nes que no pesan so bre lo s ho mbres Preg.5 A lo s ho mo sexuales no se les debe permitir ser pro feso res de 1,000 co legio . Preg.6 Por sus características raciales lo s indígenas tendrán siempre 1,000 una limitación so cial Preg.7 Las perso nas que usan barba , pelo largo y tatuajes, deben 1,000 cambiar su aspecto para trabajar en cualquiera empresa. Preg.8 En alguno s caso s especiales el abo rto es aco nsejable. 1,000 Preg.9 Es triste admitirlo , pero las desigualdades sociales so n necesarias 1,000 para el funcio namiento de la eco no mía. Preg.10 Un co legio adecuado para las niñas es aquel do nde pueden 1,000 aprender correctamente sus ro les de madre y esposa. Preg.11 En Chile no se respeta como se debiera a lo s héro es de la patria 1,000 Preg.12 Es mejo r no meterse co n lo s gitano s , pues no so n de fiar 1,000 Preg.13 La mujer que trabaja debe hacerlo en tareas propias de su sexo , 1,000 tales co mo enfermería, trabajo s de o ficina y cuidado de lo s niño s. Preg.14 Es verdad que lo s peruano s necesitan empleo , pero los 1,000 empresarios deben preferir siempre a los chileno s Preg.15 Un libro que co ntiene ideas políticas erró neas debe ser retirado de 1,000 las librerías
Extracción ,551 ,527 ,463 ,436 ,583 ,622 ,57 8 ,634 ,620 ,647 ,650 ,530 ,654 ,518 ,460
Método de extracció n: Análisis de Co mpo nentes principales.
Al mirar la columna de Extracción vemos la parte de la varianza que es común en cada variable. De esta forma, valores cercanos a 1 implican que la variable tiene mucha comunalidad y que es útil para el análisis. En este caso los valores son en general bastante altos. Sin embargo, algunos autores plantean como límite una comunalidad de 0,5 y en nuestro caso tenemos comunalidades de 0,4. Podría argumentarse la necesidad de eliminar estas variables del análisis.
La tabla que sigue es la tabla del Total de varianza Explicada (presentamos sólo una parte, por problemas de espacio):
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Varianza total explicada
Co mpo nente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Auto valo res iniciales % de la To tal varianza % acumulado 14,228 22,584 22,584 2,391 3,7 95 26,37 9 2,203 3,498 29,87 7 1,826 2,898 32,7 7 5 1,692 2,685 35,460 1,434 2,27 6 37 ,7 37 1,37 6 2,185 39,921 1,354 2,150 42,07 1 1,261 2,002 44,07 3 1,211 1,922 45,995 1,17 6 1,867 47 ,862 1,134 1,800 49,662 1,103 1,7 50 51,412 1,088 1,7 27 53,140 1,020 1,619 54,7 59 1,003 1,593 56,351
Sumas de las saturacio nes al cuadrado Suma de las saturacio nes al cuadrado de la extracció n de la ro tació n % de la % de la To tal varianza % acumulado To tal varianza % acumulado 14,228 22,584 22,584 4,050 6,429 6,429 2,391 3,7 95 26,37 9 3,7 84 6,006 12,435 2,203 3,498 29,87 7 3,526 5,597 18,032 1,826 2,898 32,7 7 5 2,521 4,002 22,034 1,692 2,685 35,460 2,47 2 3,924 25,958 1,434 2,27 6 37 ,7 37 2,323 3,688 29,646 1,37 6 2,185 39,921 2,269 3,602 33,248 1,354 2,150 42,07 1 2,193 3,481 36,7 28 1,261 2,002 44,07 3 2,165 3,436 40,165 1,211 1,922 45,995 1,7 20 2,7 30 42,895 1,17 6 1,867 47 ,862 1,657 2,629 45,524 1,134 1,800 49,662 1,443 2,291 47 ,816 1,103 1,7 50 51,412 1,423 2,258 50,07 4 1,088 1,7 27 53,140 1,362 2,162 52,236 1,020 1,619 54,7 59 1,305 2,07 1 54,306 1,003 1,593 56,351 1,288 2,045 56,351
Méto do de extracció n: Análisis de Co mpo nentes principales .
Vemos 63 componentes, 1 por cada variable. Luego vemos los autovalores, el porcentaje de varianza y el porcentaje de varianza acumulada. El primer componente tiene un autovalor de 14,228, mucho mayor a todos los componentes que le siguen. La varianza explicada por el primer componente es el 22,58%. Si observamos bien, a la vez que vamos avanzando en los componentes el autovalor va bajando, al igual que el porcentaje de varianza explicada. Esto se debe a que los componentes se ordenan de manera jerárquica. Así mismo, habíamos definido como criterio de corte, un autovalor de 1. Hasta el componente 16, los autovalores son mayores que 1, pero ya el 17 tiene un autovalor menor que 1 (,977). La varianza explicada por este componente es muy baja (1,55%). Por lo tanto, nos quedamos con 16 componentes, reduciendo bastante las 63 variables. En las columnas adyacentes se repite la misma información, pero esta vez, sólo de los componentes que se mantienen. Si miramos en la varianza acumulada vemos que luego del componente 16, ésta es de 56,35%. Esto quiere decir, que si bien perdemos mucha información al reducir dimensiones, podemos mantener aún el 56,35% de ésta, reduciendo las variables de 63 a 16. Por último, en las columnas finales, encontramos la misma información, pero luego de haber sido aplicada la rotación. Recordemos que la rotación reordena la varianza. De esta forma, el primer componente ya no tiene un autovalor de 14, sino de 4, y la varianza que explica es ahora sólo el 6%. Lo que hace la rotación es emparejar los factores. Si bien el primer componente sigue siendo el que más explica, ahora no se encuentra tan lejos de los demás componentes. Cabe destacar que, sin embargo, si miramos la varianza acumulada, luego del componente 16, ésta es del 56,35%, igual que en la solución no rotada. La rotación reorganiza varianza, no la pierde.
El siguiente gráfico es el Gráfico de Sedimentación:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Este gráfico compara los componentes con los autovalores. Como podemos ver, el primer componente es el que tiene el mayor autovalor, muy separado de los demás componentes. La utilidad de este gráfico dice relación con si se quiere corroborar el corte que se hizo. En este caso, por ejemplo, cabría preguntarse si vale la pena incluir los componentes desde el 5 en adelante, ya que es ahí donde se produce el corte en cuanto a la magnitud de los autovalores. De todas formas, optamos por quedarnos con 16 componentes.
La siguiente tabla es la Matriz de Componentes, la cual se presenta sólo en parte, debido a su tamaño:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Matriz de componentesa Co mpo nente 1 Preg.50 Lo s jóvenes de ho y necesitan mano dura ya que le han perdido el respeto a todo Preg.18 Un país que permite muchas diferencias en las opinio nes de la gente puede entrar en peligro de conflictos graves. Preg.43 Mientras más religio nes se permitan en el país más difícil es inculcarle valo res a los hijos. Preg.38 Si se mezclan mucho lo s peruanos co n los chileno s, la calidad de la gente de nuestro país se va a echar a perder Preg.21 Lo s chilenos so n más valientes y patrio tas que las perso nas de lo s países vecinos. Preg.46 A pesar de que hay excepcio nes , está claro que lo s chileno s somo s más capaces que los habitantes de los países vecino s Preg.10 Un colegio adecuado para las niñas es aquel donde pueden aprender co rrectamente sus roles de madre y espo sa.
2
3
,607
-,082
-,368
4 ,020
5 -,119
,599
,040
-,164
-,068
,079
,598
,067
-,127
-,034
,031
,592
,185
-,094
-,096
,156
,592
,041
-,086
-,123
,173
,588
,143
-,186
-,214
,023
,57 9
-,349
,027
-,033
-,089
Méto do de extracció n: Análisis de compo nentes principales. a. 16 co mponentes extraídos
Esta matriz cruza cada variable (filas) con cada uno de los 16 componentes nuevos (columnas). De este modo, se define para cada variable su correspondencia con cada componente. Los valores son las correlaciones entre las variables y los factores. Una mayor correlación (más cercana a 1) significa que la variable tiene mayor peso en ese factor. Sin embargo, ésta es la matriz no rotada, que es difícil de interpretar, ya que, como vemos, la mayoría de las variables tienen peso (valores altos) en el primer componente. También observamos que las preguntas fueron ordenadas según las correlaciones, como fue pedido en un principio. Ya que es complejo interpretar esta matriz, se prefiere interpretar la matriz de componentes rotada. Ésta será interpretada más adelante.
La próxima tabla es la Matriz Reproducida:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Esta matriz compara valores esperados con valores observados. Es por esto que en la primera parte de la tabla se presentan las correlaciones reproducidas, mientras que en la segunda parte se presentan los residuos. Los residuos son las diferencias entre la matriz inicial y esta matriz reproducida. Mientras más cercanos a 0 se encuentren, menores serán los residuos, y más similares los valores esperados con los observados. Para un análisis más acabado, miramos el pie de la tabla:
Vemos aquí que los residuos computados entre las correlaciones observadas y reproducidas son el 18%. Sin embargo, es difícil interpretar este dato, ya que no existen criterios claros para definir si esto es aceptable o no.
A continuación observamos una parte de la Matriz Rotada:
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
a Matriz de componentes rotados
Co mpo nente 1 Preg.22 Para que hagamo s bien nuestro trabajo , es necesario que patrones y jefes no s indiquen cuidado sa y exactamente qué es lo que debemos hacer y co mo . Preg.50 Lo s jóvenes de ho y necesitan mano dura ya que le han perdido el respeto a to do Preg.54 Lo que necesita la juventud es auto ridad, determinació n y vo luntad de trabajar y luchar po r la familia y la patria Preg.18 Un país que permite muchas diferencias en las o pinio nes de la gente puede entrar en peligro de co nflicto s graves. Preg.26 Más que discusio nes entre no sotro s, lo que neces itamo s es un jefe Preg.3 La o bediencia y el respeto a la auto ridad so n las primeras virtudes que hay que enseñar a los niño s . Preg.43 Mientras más religio nes se permitan en el país más difícil es inculcarle valores a lo s hijos . Preg.49 Deben existir personas que censuren lo que sale en televisió n , pues no se pueden difundir valo res equivocados Preg.62 Dada la situació n actual, es inco nveniente que se co ntraten jó venes, pues se quejan demasiado y no valo ran el trabajo Preg.15 Un libro que contiene ideas po líticas erróneas debe ser retirado de las librerías Preg.33 Ante dificultades impo rtantes, lo s ho mbres tienen más valo r y están mejor preparado s que las mujeres para enfrentarlo s. Preg.19 Es normal que lo s empresario s prefieran a los hombres en lo s trabajos, pues tienen más experiencia que las mujeres. Preg.23 Salvo excepciones, las mujeres tienen meno s capacidad que lo s ho mbres para desarro llar cargos de alta respo ns abilidad Preg.47 Es normal que lo s ho mbres ganen más dinero que las mujeres pues tienen una familia que mantener
2
3
4
5
,592
,069
,143
,053
,234
,57 0
,07 7
,184
-,050
,17 3
,568
,089
,187
,039
,193
,539
,134
,157
,129
,090
,517
,17 2
,107
,219
,152
,515
,083
,164
,115
,085
,490
,104
,17 0
,232
,036
,445
,066
,410
,000
-,044
,395
,231
,057
,17 7
,077
,390
,17 1
,17 2
,145
,030
,112
,7 13
,142
,004
,061
,024
,7 02
,034
,166
,007
,07 7
,67 3
,016
,082
,022
,07 8
,600
,142
,103
,015
Método de extracció n: Análisis de co mpo nentes principales. Método de rotació n: No rmalizació n Varimax co n Kaiser. a. La ro tació n ha co nvergido en 16 iteracio nes.
Con la Matriz Rotada intentaremos definir qué variables se asocian a qué componente. El fin de esto es observar si las variables que se definieron como parte de una subescala efectivamente son ordenadas en un mismo componente. Si esto sucede así, podemos afirmar que la subescala tiene validez. En esta primera parte analizaremos las variables que pesan en el primer componente (que tienen correlaciones sobre 0,5 en este componente). Estas son: -
Para que hagamos bien nuestro trabajo, es necesario que patrones y jefes nos indiquen cuidadosa y exactamente qué es lo que debemos hacer y cómo. Los jóvenes de hoy necesitan mano dura ya que le han perdido el respeto a todo Lo que necesita la juventud es autoridad, determinación y voluntad de trabajar y luchar por la familia y la patria. Un país que permite muchas diferencias en las opiniones de la gente puede entrar en peligro de conflictos graves. Más que discusiones entre nosotros, lo que necesitamos es un jefe. La obediencia y el respeto a la autoridad son las primeras virtudes que hay que enseñar a los niños.
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Observando estas afirmaciones, vemos que claramente el componente al que pertenecen se asocia con el autoritarismo. Por lo tanto, podemos concluir que, por lo menos la subescala de autoritarismo tiene validez. Si observamos en las salidas las variables que pesan en el segundo componente, vemos que éstas se encuentran asociadas al sexismo: -
Ante dificultades importantes, los hombres tienen más valor y están más preparados que las mujeres para enfrentarlos. Es normal que los empresarios prefieran a los hombres en los trabajos, pues tienen más experiencia que las mujeres. Salvo excepciones, las mujeres tienen menos capacidad que los hombres para desarrollar cargos de alta responsabilidad. Es normal que los hombres ganen más dinero que las mujeres pues tienen una familia que mantener. La mujer que trabaja debe hacerlo en tareas propias de su sexo, tales como enfermería, trabajos de oficina y cuidado de los niños.
Si siguiéramos el análisis de todos los componentes, nos encontraríamos con situaciones similares. Para fines de esta guía, nos conformamos con el análisis de los dos componentes anteriores. De todos modos, es importante destacar que es en este proceso dónde las variables se asocian a los componentes y se definen los nombres de las nuevas variables, según las variables que los compongan (y el peso relativo de éstas). A continuación observaremos, sin Transformación de los Componentes:
detenernos
mucho
en
ello,
la
Matriz
de
Matriz de transformación de las componentes Compo nente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1 ,444 -,047 -,540 -,115 ,001 ,166 ,082 ,207 ,069 ,199 ,163 ,468 ,189 ,146 -,066 -,261
2 ,389 -,249 ,572 -,522 -,224 -,200 ,120 ,113 ,137 -,085 ,042 ,040 ,095 ,172 ,022 -,016
3 ,386 -,514 -,069 ,278 ,238 ,225 ,161 ,232 -,015 -,193 -,133 -,27 8 -,298 -,013 -,197 ,243
4 ,279 ,345 ,136 -,057 ,549 -,083 -,115 -,192 ,042 -,022 -,561 ,269 -,070 ,148 -,018 ,081
5 ,271 ,211 -,211 ,232 -,436 -,648 ,161 ,010 -,141 -,049 -,201 -,042 -,126 -,092 -,239 ,043
Méto do de extracció n: Análisis de co mpo nentes principales . Méto do de ro tació n: No rmalizació n Varimax con Kaiser.
Esta matriz se refiere a la magnitud de la rotación llevada a cabo. Si los valores que se encuentran fuera de la diagonal son cercanos a 0, significa que hubo poca rotación. Si observamos esta tabla, los valores son en general bastante cercanos a 0 (con algunas excepciones), por lo que podemos concluir que no hubo mucha rotación de los factores.
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Por último, observamos el Gráfico de Componentes Rotados:
Este gráfico nos muestra las variables en un espacio formado por 3 componentes. Su interpretación no es fácil, por lo que no tiene mucha utilización. Además, si se incluyeran los 16 componentes, sería prácticamente irreconocible. De todas formas sirve para ver como se distribuyen las variables.
Variables nuevas en la base de datos
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard
Al comienzo habíamos pedido guardar los puntajes de cada caso en los factores, y habíamos definido que esto se hiciera por medio de la regresión. Si volvemos ahora a la base de datos, y vemos en las últimas columnas, observaremos lo siguiente:
A mano derecha de la última variable encontraremos 16 factores, que corresponden a cada uno de los componentes nuevos. Cada caso tiene un puntaje asociado a estos componentes. Si bien estos puntajes no son interpretables de manera absoluta, son útiles para llevar a cabo un nuevo análisis, contemplando ahora solamente estas 16 nuevas variables. Recordemos que estos puntajes en los factores remplazan los puntajes en las otras variables.
Material de Apoyo Ayudantía Análisis Estadístico IV
Mónica Gerber – Macarena Orchard