Regresión y Correlación simple y múltiple. Trabajo Colaborativo
Wendys Johana Carrascal Ana Karina Pérez Fernández Leonardo David Murallas Sara Beatriz Hernández María Teresa Aguas Yepes Grupo No: 204040_104
Tutor: Roberto Mario De León
Escuela de Ciencias Sociales, Artes y Humanidades Programade Psicología 25/11/2016
Introducción
La utilización del modelo de regresión lineal en los procesos relacionados con el análisis de datos demanda el conocimiento objetivo e instrumentación de la relación funcional de variables, el coeficiente de determinación y de correlación y la prueba de hipótesis como pilares fundamentales para verificar e interpretar su significancia estadística en el intervalo de confianza determinado. La presentación específica de los temas relacionados con el modelo de regresión lineal, el análisis de regresión, el uso de la ecuación de regresión como instrumento para estimar y predecir y la consideración del análisis de residuales ha sido realizada tomando como referente el estudio de problemas reales tales como los accidendentes de tránsitos
en la ciudad de
Medellín, utilizando como plataforma de apoyo la hoja de cálculo Excel. Se consideran en este trabajo grupal perteneciente a la unidad 3, los elementos teóricos correspondientes al análisis de regresión lineal, como técnica estadística empleada para estudiar la relación entre variables determinísticas o aleatorias que resultan de algún tipo de investigación, en la cual se analiza el comportamiento de dos variables, una dependiente y otra independiente Se muestra mediante la gráfica de dispersión el posible comportamiento de las variables: lineal directa, inversa, no lineal directa o no lineal inversa, con el fin de desarrollar las competencias interpretativas y propositivas requeridas para dimensionar integralmente la importancia de la estadística inferencial en la vida laboral de un psicólogo y en cualquier otra profesión donde se requieran ser implementadas.
Justificación
La realización de este trabajo es con el fin de analizar e interpretar la Regresión y correlación simple y múltiple tomando como punto de partida la base de dato de la alcaldía de Medellín. La aplicación de este método estadístico nos arroja probabilidades que determinan las relaciones entre las variables trabajadas y concluir si estas indicen en los 110 accidentes registrados, la regresión y correlación múltiple nos permite trabajar con dos v ariables y hasta tres que juegan un papel importante en el estudio de análisis además de eso nos facilita la comprensión y una posible hipótesis con cada ejercicio realizado.
Objetivos
General:
Adquirir conocimientos relacionados con Regresion y co rrelación de variables simples y múltiples, y aplicar esos conocimientos al problema en estudio. Específicos:
1. Determinar las variables cuantitativas del problema estudiado. 2. Graficar mediante un diagrama de dispersión las variables cuantitativas del problema en mención. 3. Determinar la sociabilidad entre las variables cuantitativas dependientes e indepe ndientes y su representación gráfica. 4. Determinar la recta de Regresion y el coeficiente de Correlación de las variables.
Regresión y Correlación lineal Simple
1. Identificar dos variables cuantitativas de la situación estudiada que puedan estar relacionadas. Edad y número de muertos
2. Realizar el diagrama de dispersión de dichas va riables y determinar el tipo de asociación entre las variables.
DIAGRAMA DE DISPERSIÓN 14 y = -0,0003x + 4,8368 R² = 1E-06
12 10 S O T 8 R E U M E D 6 ° N
4 2 0 0
10
20
30
40
50
60
70
EDAD
El tipo de asociación entre las variables Edad y N° de Muertos no es directamente proporcional lo anterior debido a que la pendiente es negativa (el valor o coeficiente X) es decir, mientras la variable Edad disminuye la variable N° de Muertos también aumenta.
3. Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. ¿Es confiable? El modelo matemático que permite predecir la relación entre las 2 variables Edad y N° de Muertos es Y = -0,0003x + 4,8368. Debido a que su R Cuadrado es muy lejano a 1 (1E-06) o en términos porcentuales lejano a 100%, (0,0001) se podría afirmar que la confianza del modelo es muy mala, pues la edad no se explica por las variaciones en el N° de muertos.
4.
Determine el porcentaje de explicación del modelo y el grado de relación de las dos variables. El porcentaje de explicación del modelo de las variables Edad y N° de muertos es de 0.0001% y el grado de relación entre las variables se determina con el coeficiente de Pearson, el cual se puede calcular aplicando raíz cuadrada al R Cuadrado, hechos los cálculos el grado de relación entre dichas variables es de 0,01
5. Relacionar la información obtenida con el problema. Con los resultados obtenidos se puede asegurar que la ecuación de la recta es negativa entre las dos variables. El
R
2
afirma además que el modelo explica el 0.0001% de la
información. Y el valor de r confirma además el grado de relación entre las variables: Edad que no está directamente relacionada (en un 0.0001%) con el N° de Muertos de los accidentes ocurridos en la ciudad de Medellín.
Regresión y Correlación Lineal Múltiple:
1.
Identificar una variable cuantitativa dependiente y varias variables indepen dientes del estudio de investigación. Cuantitativa Dependiente: velocidad Cuantitativa Independientes: horas y grados de alcohol.
2. Realizar el diagrama de dispersión de dichas variables.
RELACIÓN: HORA VS VELOCIDAD 160 140 y = 0,6779x + 72,894 R² = 0,0001
120 100 D A D I C O L E V
80 60 40 20 0 00:00
04:48
09:36
14:24 HORA
19:12
00:00
04:48
RELACIÓN: GRADOS DE ALCOHOL VS VELOCIDAD 160 140 120
y = 0,4983x + 45,552 R² = 0,7676
D100 A D I C 80 O L E V 60
40 20 0 0
20
40
60
80
100
120
GRADOS DE ALCOHOL DEL CONDUCTOR
3.
Calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación.
Ecuación
Y a
Y
b1 X 1
b2 X 2
43,2170 2,9867 X 1 16,5328 X 2
R^2= 0,7395, indicando que es cercano a 1, lo que significa que es confiable. r= 0.8599, que en términos es porcentuales sería 85.99%, entonces la correlación entre las variables buena, ya que ofrecen un 85,99%.
4. Relacionar la información obtenida con el problema. Con los resultados obtenidos se puede asegurar que la ecuación de la recta es aceptable entre las dos variables. El
R
2
afirma además que el modelo explica el 73,95% de la
información. Y el valor de r confirma además el grado de relación entre las variables: Velocidad que está aceptablemente relacionada (con un 85,99%) con las Horas y Grados de alcohol del conductor, de los accidentes ocurridos en la ciudad de Medellín.
Conclusión
En el presente trabajo se investigó y se realizaron ejercicios de regresión y correlación lineal simple y múltiple, en síntesis podemos decir que la regresión lineal es una técnica que permite y facilita cuantificar la relación que puede ser observad a cuando se gráfica un diagrama de puntos dispersos correspondientes a dos variables donde la tendencia general es rectilínea. Abreviada en la siguiente ecuación y = a + bx En esta ecuación, “y” representa los valores de la coordenada a lo largo del eje vertical en el gráfico (ordenada); en tanto que “x” indica la magnitud de la coordenada sobre el eje horizontal (abscisa). El valor de “a” (que puede ser negativo, positivo o igual a cero) es llamado el intercepto; en tanto que el valor de “b” (el cual puede ser negativo o positivo) se denomina la pendiente o coeficiente de regresión. Mientras que el análisis de correlación se encu entra estrechamente asociado con el análisis de regresión; donde ambos se pueden considerar como dos aspectos de un mismo problema. Por otro lado saber exactamente cómo cuantificar y graficar en un diagrama estas variables Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de “x” e “y”, utilizando la misma tabla y montos que se indican en los ejercicios ya resueltos donde se identifican las variables cuantitativas, los diagramas de dispersión dichas variables, los modelos temáticos y los porcentajes y grado de relación entre las variables. No obstante se relaciona la información obtenida de dichos laboratorios.
Bibliografía
Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas. 130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r &p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219
Churchill, G.A.(2009).Análisis de Correlación y de Regresión Simple. Mexico City: CengageLearning. Páginas 675 – 686 Recuperado de:http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&i t=r&p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41
Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados. Mexico City: CengageLearning. Páginas 686 – 695.Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r &p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9
Montero, J.M. (2007).Regresión y Correlación Múltiple. Madrid: Paraninfo. Páginas 191 – 225.Tomado de: http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it=r &p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2