Lucas Valle Modelo Ecuaciones Estructurales

Los modelos de ecuaciones estructurales son una familia de modelos estadísticos multivariantes que permiten estimar el efecto y las relaciones entre múltiples variables. Nacieron de la necesidad de dotar de mayor flexibilidad a los modelos de regresión, siendo menos restrictivos por el hecho que permiten incluir errores de medida tanto en las variables dependientes e independientes.

VALLE SIERRA Max Max D. 20091366H LUCAS MORALES Luis G. 20090393A

MODELOS DE ECUACIONES ESTRUCTURALES

LAS ECUACIONES ESTRUCTURALES SEM (Structural Equation Modelling ) * Ecuación: Una ecuación es una igualdad matemática entre dos expresiones algebraicas, denominadas miembros, en las que aparecen valores conocidos o datos, y desconocidos o incógnitas, relacionados mediante operaciones matemáticas. Los valores conocidos pueden ser números, coeficientes o constantes; y también variables cuya magnitud pueda ser establecida a través de las restantes ecuaciones de un sistema, o bien mediante otros procesos. Las incógnitas, representadas generalmente por letras, constituyen los valores que se pretende hallar.

1. ¿Qué son los modelos de Ecuaciones Estructurales?

La respuesta a esta pregunta no es sencilla. Sera necesario introducir algunos conceptos previos, de naturaleza estadística.  

El análisis de sendero (path analysis) El análisis factorial.

El elemento primario del análisis de senderos es el diagrama de senderos, que no es más que “( ...) Un gráfico en donde se encuentran representados las relaciones de causalidad que s e suponen que existen un conjunto de variables” (Andrade-Coba, 2005:1). Un ejemplo simple puede encontrase en (calzado, 2009:5), en el cual aparecen variables independientes X1 Y X2 (también denominadas variables exógenas) variables dependientes X3 Y X4(llamadas igualmente variables endógenas) y los residuos Xu y Xv con influencia sobre las variables exógenas del modelo.

1



3



2



4



 

Figura N°1 Ejemplo de diagrama de senderos según (calzado,2009:5)


A partir del diagrama de senderos se pueden construir ecuaciones estructurales , que completan el modelo de senderos.

 3   31 1   32 2   3   4 41 1 42 2 43 3 4  

En las mismas, los parámetros se les denominan coeficientes de Wright y son las incógnitas con cuyo valor se resuelven dichas ecuaciones. Como bien explican (Tristan et al, 2008:158); (…) “El conjunto de ecuaciones en términos de los coeficientes (que multiplican a las covarianzas de las variables seleccionadas) no son lineales, para su solución requieren de técnicas numéricas que obligan al uso de la computadora.”

Por su parte el análisis factorial “(…)Es un conjunto de técnicas utilizada para explicar un conjunto de variables no observables, llamadas factores. Básicamente, el modelo factorial sigue el siguiente fundamento_: se consideran variables que puedan agruparse por sus correlaciones entres sí, pero (que) tienen pequeñas correlaciones con variables de grupos diferente”(Andrade-Coba, 2005:3).

La relación entre variables observadas y sus correspondientes factores queda formalizada a través del modelo factorial, que visto en orma de matrices seria:

( 12)(1211 1222  12) (12)(12)   1 2     Sobre la base de los dos recursos estadísticos antes explicados, y siguiendo a (Andrade Coba, 2005:4) ya (Gutiérrez, 2008:11), se puede ofrecer la caracterización siguiente:

Los modelos de Ecuaciones Estructurales son representaciones que resultan de combinar las metodologías de análisis de sendero y de análisis factorial; incorporan variables latentes que son obtenidas de variables observadas correspondientes al objeto del estudio.


2. MODELOS DE ECUACIONES ESTRUCTURALES (SEM, siglas en ingles de Structural Equation Modelling)

Los modelos de ecuaciones estructurales (MES) es una técnica estadística multivariante para probar y estimar relaciones causales a partir de datos estadísticos y asunciones cualitativas sobre la causalidad.

2.1.

CONCEPTO

Esta técnica combina el análisis factorial con la regresión lineal para probar el grado de ajuste de unos datos observados a un modelo hipotetizado y expresado mediante un diagrama de senderos. Como resultado, los MES proporcionan los valores pertenecientes a cada relación, y más importante, un estadístico que expresa el grado en el que los datos se ajustan al modelo propuesto, confirmando su validez.

Entre los puntos fuertes de los MES se encuentra la habilidad de construir variables latentes: variables que no son medidas directamente, pero son estimadas en el modelo a partir de varias variables que covarían entre sí. Esto permite al modelador capturar explícitamente la fiabilidad del modelo. El análisis factorial, el análisis de caminos y la regresión lineal representan casos especiales del modelo de ecuaciones estructurales.

2.1.1. Diagrama de senderos o vías

El diagrama de senderos o también llamado diagrama de vías es un gráfico, parecido a un diagrama de flujo, que expresa las relaciones existentes entre las variables. Este gráfico es lo que se considera "el modelo", y se establece a priori. Es por ello que los MES están muy guiados por las hipótesis previas.

En un gráfico de senderos se utilizan rectángulos para expresar las variables observadas, que pueden ser endógenas (dependientes) o exógenas (independientes). Se utilizan elipses para expresar variables latentes, variables no observadas que se infieren a partir de los datos mediante análisis factorial. Ambos tipos de variables se interconectan entre sí mediante flechas, que pueden ser unidireccionales (regresión lineal) o bidireccionales (varianza común). Cuando dos variables no están relacionadas, se fuerza el modelo para que estas variables no tengan relación alguna, bloqueando su varianza común o asumiendo esta varianza como parte del error de medida.


Las variables exógenas deben ser consecuencia de una variable endógena o latente, pero además, se debe incluir la existencia del error de medida. Así pues, una variable dependiente siempre será el resultado de una variable independiente junto a un error de medida.

2.2.

Tipos de MES

Los MES permiten tanto modelado confirmatorio como exploratorio, significando que esta técnica es útil tanto para poner a prueba teorías ya existentes (confirmatorio), como para el desarrollo de nuevas teorías (exploratorio).

o

Exploratorio

Cuando se habla de exploración, se hace referencia a que no se conoce la estructura de los datos a priori, y la técnica exploratoria que utilicemos nos permitirá descubrir esta estructura.

En ecuaciones estructurales se pueden diseñar dos tipos de modelos: el análisis factorial exploratorio (EFA) y el análisis de componentes principales (PCA). El PCA es un subtipo de EFA. En el modelado, el PCA quedaría representado por líneas que van de las variables observadas a los factores. En el EFA al contrario. El EFA se utiliza extendidamente en el ámbito psicométrico y su función es reducir el número de variables en un conjunto de factores que expliquen la varianza común entre esas variables.


o

Confirmatorio

En los MES lo interesante no es replicar un modelo exploratorio, sino el reproducir un modelo confirmatorio. A diferencia del exploratorio, las vías que salen de un factor a variables que no tienen que ver con dicho factor se podan.

El modelo confirmatorio generalmente comienza con una hipótesis previa que queda representada como un modelo causal. Los conceptos utilizados en el modelo deben entonces ser operacionalizados de forma que permitan probar las relaciones entre los conceptos del modelo. El modelo pone a prueba los datos obtenidos a partir de medidas empíricas para determinar el grado en el cual los datos se ajustan al modelo. Las asunciones causales dentro del modelo comúnmente son falsables y esto es comprobado mediante los datos. Bajo este tipo de modelo se encuentra el análisis factorial confirmatoria, considerada un subtipo especial de MES. Consiste en una variante del análisis factorial exploratorio en el que se bloquea la posible relación entre los factores y las variables que no pertenecen al factor.

3. ¿Qué elementos podemos identificar en un Modelo de Ecuaciones Estructurales?

Variable observada o indicador: son aquellas que se mide a los sujetos, por ejemplo, la

información con la que contamos a partir de un cuestionario. Variable latente: Es la característica que se desearía medir pero que no se puede

observar. Error: representa tanto los errores asociados a la medición de una variable como el

conjunto de variables que no han sido contempladas en el modelo y que pueden afectar a la medición de una variable observada. Es decir, la proporción de la varianza no explicada. Variable exógena : es aquella que afecta a otra variable y que no recibe efecto de

ninguna variable. Las variables independientes de un modelo de regresión son exógenas. Variable endógena: es aquella que recibe efecto de otra variable. La variable

dependiente de un modelo de regresión es endógena. Toda variable endógena debe ir acompañada de un error.


4. ¿Para qué sirven los modelos de ecuaciones estructurales?

La modelación mediante ecuaciones estructurales ha encontrado aplicación en diversas áreas de investigación en ciencias sociales; por ejemplo para la clarificar la relación entre cultura de los grupos de trabajo, la satisfacción laboral y el compromiso organizacional de sus miembros. Topa Morales 2005 modela relación entre la satisfacción laboral y el síndrome de Bournot y las consecuencias para la salud en funcionarios de prisiones; mientras que ( Lozan: 2007 ) la empleo en la calibración de un instrumento de diagnóstico d las dificultades para la tomad e decisiones vocacionales, relacionando la decisión vocacional con la falta de motivación, la indecisión, las dificultades para auto-conocerse, buscar información y resolver conflictos internos y externos


5. ¿Cómo se utilizan los modelos de Ecuaciones Estructurales?

Los principales especialistas en el SEM consideran seis pasos a seguir para aplicar esta técnica: especificación, identificación, estimación de parámetros, evaluación del ajuste, reespecificación del modelo e interpretación de resultados (Kaplan, 2000; Kline, 2005). Además, incluyen un apartado a considerar: el análisis de la matriz de datos.

Figura N°2 Modelo estructural del Modelo de rendimiento académico propuesto por la Teoría Social Cognitiva del Desarrollo de Carrera (Lent, Brown & Hackett, 1994).

5.1.

Especificación del modelo

En esta fase el investigador aplica sus conocimientos teóricos del fenómeno estudiado al planteamiento de las ecuaciones matemáticas relativas a los efectos causales de las variables latentes y a las expresiones que las relacionan con los indicadores o variables observables. Esta distinción es importante porque cualquier relación entre variables, sin especificar por el investigador, se asume que es igual a cero. En la figura 2, la relación directa entre expectativa de resultados y el rendimiento académico es igual a cero, aunque la relación entre estas dos variables es mediada por ¡as metas de rendimiento. La especificación errónea en este modelo existirá si el mediador (metas de rendimiento) no explica completamente la relación entre las expectativas de resultados y el rendimiento académico. Además, en esta etapa, se formulan enunciados sobre el conjunto de parámetros, decidiendo entre los que serán libres para ser estimados o fijos, a los que se les asignará un valor dado, normalmente cero. Asimismo, se especifican los supuestos estadísticos sobre las fuentes de variación y en concreto sobre la forma de distribución conjunta, que en la mayoría de las técnicas empleadas se considera normalidad


multivariantes. La claridad del modelo viene determinada por el grado de conocimiento teórico que posea el investigador sobre el tema de estudio. En efecto, si la información es poco exhaustiva o detallada, la asignación de los parámetros será confusa a príori, por lo que el investigador deberá realizar luego diversas modificaciones, contemplando principalmente los aspectos teóricos.

5.2.

Identificación del Modelo

Si el modelo teórico es correcto, se procede a la identificación del modelo, en donde debemos asegurar que pueden ser estimados los parámetros del modelo. El modelo está identificado si todos los parámetros lo están, es decir, si existe una solución única para cada uno de los parámetros estimados. Determinar si un modelo está identificado debe analizarse antes de la recolección de datos, verificando que al menos se dispone para cada parámetro de una expresión algebraica que lo exprese en función de las varianzas y covarianzas muéstrales. Existe una serie de reglas generales aplicables para identificar un modelo, una de ellas es la regla de los grados de libertad. Los investigadores calculan el número de grados de libertad (gl) en un modelo utilizando la siguiente fórmula: (Número de variables observadas x [número de variables + 1J)/2. Se espera que los grados de libertad del modelo deban ser mayores o iguales a cero. Esto corresponde a lo que se denomina como modelo identificado o modelo sobre-identificado. Un modelo identificado tiene exactamente cero grados de libertad (gl=0). Aunque esto ofrece un ajuste perfecto del modelo, la solución no tiene interés puesto que no se puede generalizar. Un modelo sobre-identificado es el objetivo de todos los modelos de ecuaciones estructurales. Tiene más información en la matriz de datos que el número de parámetros a estimar, lo que significa que tiene un número positivo de grados de libertad (gl>0). Al igual que otras técnicas multivariantes, el investigador sé esfuerza por conseguir un ajuste aceptable con el mayor grado de libertad posible. Esto asegura que el modelo sea tan generalizable como sea posible. Finalmente, un modelo infra-estimado tiene grados de libertad negativo (gl<0), lo que significa que se intentan estimar más parámetros de los que permite la información disponible. Al aplicar esta revisión de identificación al modelo de la Figura 2, se evidencia que hay 11 variables observadas (66 elementos conocidos en la matriz de covarianza; (11 x [11+1])/2= 66), y hemos especificado 10 parámetros para ser estimados que están destacados con asteriscos. Restando los 10 parámetros a estimar de los 66 parámetros conocidos revela que para este modelo hay 56 grados de libertad. En resumen, mientras más grados de libertad, más parsimonioso es el modelo. Así, cuando un modelo es parsimonioso se ajusta bien a los datos, el investigador puede demostrar que las asociaciones entre variables observadas y latentes son más importantes.


5.3.

Evaluación de la calidad de la base de datos

Previo al análisis, es recomendable examinar todas las variables a los fines de evaluar la calidad de la base de datos. El primer tema a tratar es el tamaño de la muestra, ya que es uno de los aspectos donde menos consenso hay entre los especialistas. Algunos autores (por ejemplo, Kline, 2005) consideran que una muestra adecuada debería tener entre 10 a 20 participantes por parámetro estimado. Otros sugieren (MacCallum, Browne, y Sugawara, 1996) que el tamaño de la muestra depende del poder estadístico deseado, de las hipótesis nulas a evaluar y de la complejidad del modelo (cuando el modelo es más complejo, mayor tamaño de la muestra). Por su parte, Jackson (2003) sugiere que la confiabilidad de las medidas observadas y el número de indicadores por factor determinan el ajuste del modelo, y controlando estos factores, el tamaño de la muestra mínima recomendable es 200 sujetos para cualquier SEM. Otro aspecto a tener en cuenta es la multicolineidad entre las variables, donde variables altamente correlacionadas son consideradas redundantes. Una pauta para verificar si existe multicolineidad entre las variables es mediante una correlación y bivariada, donde valores superiores a r = 0,85 pueden señalar potenciales problemas (Kline, 2005). Cuando se observa que dos variables están altamente correlacionadas, la solución más práctica es retirar una de ellas del modelo. Los investigadores también deben examinar la existencia de casos con puntuaciones marginales (outliers) univariados y multivariados. Cuando los puntajes de un sujeto son extremos en solo una variable, se denomina casos atípicos univariados, pero cuando presentan puntajes extremos en más de una variable, se denominan casos atípicos multivariados. En Tabachntek & Fidell (2001) se presenta una exposición clara de cómo tratar los casos Finalmente, los estadísticos utilizados en SEM asumen que la distribución multivariada está normal. Violar esta suposición es problemático y afecta la precisión de las pruebas estadísticas. Sin embargo, evaluar la distribución normal multivariada generalmente es poco práctico, ya que esto implica ef examen de un número infinito de combinaciones lineales. Una solución a este problema es examinar la distribución de cada variable observada. Para determinar si existe normalidad univariada, el investigador debe examinar la asimetría y curstosis de cada variable observada, donde valores entre +1.00 y -1.00 se considerarán excelentes, mientras que valores inferiores a 1.60, adecuados (George & Mallery, 2001). Sin embargo, un método que incrementa la distribución de la normalidad es la transformación de los datos. Los métodos más comunes de transformación son la raíz cuadrada, el logaritmo, y el inverso. Eliminar o transformar los casos atípicos univariados o multivariados aumenta la distribución normal de los datos.


5.4.

Estimación de parámetros

La estimación implica determinar los valores de los parámetros desconocidos y su respectivo error de medición. Como en la regresión múltiple, los investigadores estiman los coeficientes no estandarizados y estandarizados de los parámetros. Para estimar los parámetros desconocidos, los investigadores utilizan programas especiales para el SEM, como el LISREL (Jóreskog & Sorbom, 1996), AMOS (Arbuckle, 2003), y el EQS (Bentler, 1995). Una de las técnicas ampliamente empleada en la mayoría de los programas informáticos para la estimación de modelos estructurales, es el de máxima verosimilitud (MV), que es eficiente y no sesgada cuando se cumplen los supuestos de normalidad multivariada. La sensibilidad de este método de estimación a la no normalidad, creo que genera la necesidad de técnicas de estimación alternativas, como el método mínimos cuadrados ponderados (WLS), mínimos cuadrados generalizados (GLS) y asintóticamente libre de distribución (AGL). La técnica AGL ha recibido particular atención debido a su insensibilidad a la no normalidad de los datos, pero este método exige un número considerable de casos (N=500 o más).

5.5.

Evaluación del ajuste e interpretación

La etapa de diagnóstico de la bondad del ajuste se refiere a la exactitud de los supuestos del modelo especificado para determinar si el modelo es correcto y sirve como aproximación al fenómeno real, precisando así su poder de predicción. Las medidas de calidad del ajuste pueden ser de tres tipos: (1) medidas absolutas del ajuste, que evalúan el ajuste global del modelo, (2) medidas del ajuste incremental, que comparad- el modelo propuesto con otros modelos especificados por el investigador, o (3) medidas del ajuste de parsimonia, que ajustan las medidas de ajuste para ofrecer una comparación entre modelos con diferentes números de coeficientes estimados, siendo su propósito determinar la cantidad del ajuste conseguido por cada coeficiente estimado (Hair et al., 2001). La literatura recomienda emplear múltiples indicadores para evaluar el ajuste del modelo (Hu & Bentler, 1995). Entre los más utilizados podemos destacar el estadístico chi-cuadrado, la razón de chi-cuadrado sobre los grados de libertad (CMIN/DF), el cambio en chi-cuadrado entre los modelos alternativos, el índice de ajuste comparativo (CFI), el índice de bondad de ajuste (GFI), y el error cuadrático medio de aproximación (RMSEA). Los valores de estos estadísticos de bondad del ajuste (CFI, GFI) varían por lo general entre 0 y 1, con 1 indicando un ajuste perfecto. Valores superiores a 0,9 sugieren un ajuste satisfactorio entre las estructuras teóricas y los datos empíricos, y valores de 0,95 o superiores, un ajuste óptimo. El chi cuadrado debe ser no significativo para indicar un buen ajuste de los datos. Esto es así porque un valor significativo de x2 implica que la estructura del modelo teórico propuesto es significativamente diferente de la indicada por la matriz de covarianza de los datos. No obstante, este último estadístico es sensible al tamaño muestral y debe interpretarse con precaución. Usualmente se interpreta también la razón de chi cuadrado sobre los grados de libertad, con valores inferiores a 2 indicando un buen ajuste. Cuando se comparan diferentes modelos teóricos, la reducción significativa en chi cuadrado de un modelo respecto a otro también sugiere un ajuste más adecuado a los datos (Tabachnick & Fidell, 2001).


El índice RMSEA es considerado óptimo cuando sus valores son inferiores a 0,06 (Hu & Bentler, 1995). Finalmente, además de considerar el ajuste del modelo, debe prestarse atención a la significación de los parámetros estimados que son análogos a los coeficientes de regresión. Al igual que en el análisis de regresión, un modelo que se ajusta bien a los datos, pero que posee pocos coeficientes significativos, no tendría mucho sentido 5.6.

Reespecificación del modelo

En raras ocasiones el modelo propuesto es el que mejor se ajusta. En consecuencia, el investigador normalmente busca métodos para mejorar el ajuste del modelo y/o su correspondencia con la teoría subyacente. En tal caso, puede iniciar la reespecificación del modelo, el proceso de añadir o eliminar los parámetros estimados del modelo original. Antes de tratar algunos enfoques para identificar las modificaciones del modelo, es aconsejable hacer tales modificaciones con cuidado y considerando las justificaciones teóricas antes que las empíricamente deseables. Si se realizan modificaciones, el modelo debería tener una validación cruzada (es decir, estimado sobre un conjunto distinto de datos) antes de que el modelo modificado sea aceptado. Para realizar una reespecificación se deben examinar los índices de modificación. El valor del índice de modificación corresponde aproximadamente a la reducción en el chicuadrado que se produciría si el coeficiente fuera estimado. Un valor de 3,84 o superior sugiere que se obtiene una reducción estadísticamente significativa en el chi-cuadrado cuando se estima el coeficiente (Hair et al., 2001). El investigador también puede examinar la matriz residual de la matriz de las predicciones de la covarianza y correlación, donde los valores residuales mayores que 2,58 se consideran estadísticamente significativos a¡ nivel de 0,05. Los residuos significativos indican un error de predicción sustancial para un par de indicadores.


6. Conclusiones: 





Los modelos de ecuaciones estructurales analizan las relaciones causales y no causales entre variables tomadas como indicadores de medida de los constructos, excluyendo del análisis el error de m edición.

Mediante la combinación del análisis factorial confirmatorio y el análisis de relaciones causales, los modelos de ecuaciones estructurales se constituye en una herramienta de análisis híbrida y completa.

Pese a su aparente demanda de minina de formación estadística se requiere una sólida formación matemática.


7. Bibliografía

Abascal Fernández, Elena (2011) Fundamentos y técnicas de investigación comercial ESIC (Escuela Superior de Gestión Comercial y Marketing) Madrid

Bentler, P. M. (1995). EQS structural equations program manual. Encino, CA: Multivariate Software.

GARCÍA VEIGA (2011) Análisis causal con ecuaciones estructurales de la satisfacción ciudadana con los servicios municipales UCS Santiago de Compostela

Ronald L. Tatham (2004) Analisis Multivariante de Datos ,Pearson, Prentice Hall , Madrid

Torres F. (2010) Modelo de ecuaciones Estructurales, Cuba.

Cristina C. Porral, Oscar Juanatey-Boga (2013) Análisis de dos Modelos de Ecuaciones Estructurales Alternativospara medir la Intencion De Compra. Revista Investigación Operacional Vol. 34, No. 3, 230-243. http://rev-inv-ope.univ-paris1.fr/files/34313/3431305.pdf .

Juan E. Wong, Rocío E. Montiel (2012) Introducción a los Modelos de Ecuaciones Estructurales con AMOS: Aplicaciones con la EMOVI. http://www.ceey.org.mx/site/files/ecuacionesestruc_jehw_0.pdf .

Miguel A. Ruiz(2010) Modelos de Ecuaciones Estructurales Madrid Papeles del Psicólogo, 2010. Vol. 31(1), pp. 34-45 http://www.papelesdelpsicologo.es/pdf/1794.pdf .

Lucas Valle Modelo Ecuaciones Estructurales

Recommend Documents