Regresión y Correlación Universidad Universidad De San Carlos De Guatemala Facultad De Ciencias Económicas Escuela De Contaduría Pública Y Auditoria Seminario De Integración Integración Profesional Jornada Nocturna Onceavo Semestre Salón 101 Edificio S-12
Regresión y Correlación Trabajo # 5 Individuales Fase III
Grupo #16 Carné 200612615
Nombre Villegas Escot, Mario René
Lic. Walter A. Cabrera H. MSc. Aux. Rigoberto Pascual Castro.
Guatemala, 30 de septiembre de 2011 Seminario Integrador Profesional
Regresión y Correlación INDICE Pág. ........................ ............ ....................... ....................... ........................ ....................... ....................... ........................ ..................... .............. .......... .......... .......1 Guatemala, Guatem ala, 30 de septiembre septie mbre de 2011 201 1........... ...................... ....................... ...................... .............. ......... .......... ..... 1 Pág............ Pág. ....................... ........................ ....................... ....................... ........................ ....................... .................... .............. .......... .......... .......... ....... ..2 INTRODUCCIÓN INTRODU CCIÓN........... ...................... ....................... ........................ ....................... .................... .............. .......... .......... .......... .......... ......... .... i DISTRIBUCIONES DISTRIB UCIONES BIDIMENSIONALES BIDIMENS IONALES ........... ....................... ........................ ................... ............ .......... .......... .......... ..... 1 IDEA DE CORRELACIÓN........... ...................... ....................... ........................ ....................... ................ .......... .......... .......... .......... ..... 1 NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN DISP ERSIÓN ............ ....................... ....................... .................. ......... ...1 CORRELACIÓN LINEAL Y RECTA DE REGRESIÓN. REGRESIÓN............. ....................... ................... ............. .......... ........ ...2 MEDIDA DE LA CORRELACIÓN CORRELACIÓ N.......... ...................... ........................ ....................... ................. ........... .......... .......... .......... .......4 ESTIMACIÓN ESTIMAC IÓN MEDIANTE MEDI ANTE LA RECTA R ECTA DE D E REGRESIÓN REGRES IÓN........... ....................... ........................ ................. .......5 PROPIEDADES DE LA RECTA DE REGRESIÓN DE LOS MÍNIMOS CUADRÁTICOS............ CUADRÁTICOS. ....................... ........................ ....................... ....................... ........................ ................... ............ .......... ......... ........ .... 6 MAPA DE ESPARCIMIENTO ESPARC IMIENTO O NUBE DE PUNTOS ........... .................. ............ .......... .......... .......... .......... ....... ..6 ANALISIS DE REGRESIÓN REGRE SIÓN............ ....................... ....................... ........................ ....................... ...................... ................ .......... .......7 TIPOS ANÁLISIS A NÁLISIS DE REGRESIÓ REGRESIÓN N........... ...................... ....................... ........................ ....................... ..................... ............. ...7 REGRESIÓN REGRESIÓ N LINEAL SIMPLE ........... ....................... ....................... ....................... ................. .......... .......... .......... .......... ........ ... 7 FÓRMULAS PARA ENCONTRAR "a" y "b":........... ...................... ....................... ...................... ............... .......... .......8 DIAGRAMA DE ESPARCIMIENTO, ESPARCIMIENTO, NUBE DE PUNTOS O MAPA DE DISPERSION: DISPERSION: ........................ ............ ....................... ....................... ........................ ....................... ....................... ........................ ..................... .............. .......... .......... .......8 ERROR ESTANDAR ESTA NDAR DE REGRESIÓN: REGR ESIÓN:.......... ...................... ........................ ....................... .................... ............. ......... .......8 Hay dos formas de calcularlo: calcularlo :.......... ...................... ........................ ....................... ................. ........... .......... .......... .......... .......9 INTERVALO DE CONFIANZA: CONFIAN ZA:........... ....................... ....................... ....................... ..................... .............. .......... .......... ......... .... 9 ANALISIS DE CORRELACION........... ....................... ........................ ................... ............ .......... .......... .......... .......... .......... .......14 SÍMBOLO " r”.......... ...................... ........................ ....................... ....................... ........................ ................. .......... .......... .......... ......... .... 14 TIPOS DE CORRELA CORRELACIÓN CIÓN............ ........................ ....................... .................... .............. .......... .......... .......... .......... .......... ......... .... 14 CORRELACIÓN CORRELAC IÓN PERFEC PERFECTAMENTE TAMENTE POSITIVA .......... ...................... ........................ ....................... ............... .... 14 CORRELACIÓN CORRELAC IÓN PERFEC PERFECTA TA NEGATIVA ............................. ................. ........................ .................. ........... .......... ....... ..15 CORRELACIÓN CORRELAC IÓN IRREGULAR O NULA........... ....................... ........................ ..................... .............. .......... .......... .......15 COEFICIENTE COEFICI ENTE DE DETERMINA DETERMINACIÓN CIÓN........... ....................... ....................... ................. ........... .......... .......... .......... ....... ..16 COEFICIENTE COEFICI ENTE DE CORRELACIÓN CORRELACIÓ N............ ....................... ....................... ........................ ................... ............ .......... ........ ...16 EJERCICIO EJERCICI O............ ....................... ....................... ........................ ....................... ....................... ..................... .............. .......... .......... .......... ....... ..17 CONCLUSIONES CONCLUS IONES........... ....................... ....................... ....................... ........................ ....................... ................... ............. .......... .......... ..... 19 RECOMENDACIONES RECOME NDACIONES ........... ...................... ....................... ........................ ....................... ....................... ........................ ................ .... 20 Seminario Integrador Profesional
Regresión y Correlación BIBLIOGRAFÍA...............................................................................................21
Seminario Integrador Profesional
Regresión y Correlación INTRODUCCIÓN A continuación, desarrollare el grado de proporción entre dos o mas variables en lo que llamaremos análisis de correlación. Para representar esta concordancia utilizaremos una representación gráfica llamada diagrama de dispersión, estudiaremos un modelo matemático para estimar el valor de una variable basándonos en el valor de otra, en lo que llamaremos análisis de regresión. Finalmente Desarrollaremos un ejercicio aplicando lo aprendido, donde utilizaremos datos verdaderos de una empresa llamada chapín.
Seminario Integrador Profesional
Página i
Regresión y Correlación DISTRIBUCIONES BIDIMENSIONALES “Cuando sobre una población estudiamos simultáneamente los valores de dos variables estadísticas, el conjunto de los pares de valores correspondientes a cada individuo se denomina distribución bidimensional. Ejemplo 1: Las notas de 10 alumnos en Matemáticas y en Lengua vienen dadas en la siguiente tabla:
MATEMÁTICAS 2
4
5
5
6
6
7
7
8
9
LENGUA
2
5
6
5
7
5
8
7
10
2
Los pares de valores {(2,2), (4,2), (5,5),...;(8,7), (9,10)}, forman la distribución bidimensional. IDEA DE CORRELACIÓN Es frecuente que estudiemos sobre una misma población los valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas, es decir, si los cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las variables están correlacionadas o bien que hay correlación entre ellas. En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en Matemáticas, mejor es la de lengua. NUBE DE PUNTOS O DIAGRAMA DE DISPERSIÓN La primera forma de describir una distribución bidimensional es representar los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre de nube de puntos o diagrama de dispersión.
Seminario Integrador Profesional
Página 1
Regresión y Correlación
CORRELACIÓN LINEAL Y RECTA DE REGRESIÓN. Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan cerca de alguna curva. Aquí nos limitaremos a ver si los puntos se distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación lineal. La recta se denomina recta de regresión.
Hablaremos de correlación lineal fuerte cuando la nube se parezca mucho a una recta y será cada vez más débil (o menos fuerte) cuando la nube vaya desparramándose con respecto a la recta. En el gráfico observamos que en nuestro ejemplo la correlación es bastante fuerte, ya que la recta que hemos dibujado está próxima a los puntos de la nube.
Seminario Integrador Profesional
Página 2
Regresión y Correlación Cuando la recta es creciente la correlación es positiva o directa: al aumentar una variable, la otra tiene también tendencia a aumentar, como en el ejemplo anterior. Cuando la recta es decreciente la correlación es negativa o inversa: al aumentar una variable, la otra tiene tendencia a disminuir. Ejemplo 2: Una persona se entrena para obtener el carnet de conducir repitiendo un test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden a los intentos realizados. Observa que hay una correlación muy fuerte (los puntos están "casi" alineados) y negativa (la recta es decreciente).
Ejemplo 3: A 12 alumnos de un centro se les preguntó a qué distancia estaba su residencia del Instituto, con fin de estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:
Distancia (en km) 0,05 0,1 0,12 0,4 0,5 0,7 1 Nota media
8,4
4
5,7
Seminario Integrador Profesional
1,2 2,1 2,5 3
3
9,1 6,3 6,7 4,3 5,4 7,8 4,5 7,2 8,1
Página 3
Regresión y Correlación
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la correlación es prácticamente inexistente, es decir, no tiene nada que ver con el rendimiento académico la distancia del domicilio al instituto, MEDIDA DE LA CORRELACIÓN La apreciación visual de la existencia de correlación no es suficiente. Usaremos un parámetro, llamado coeficiente de correlación que denotaremos con la letra r, que nos permite valorar si ésta es fuerte o débil, positiva o negativa. El cálculo es una tarea mecánica, que podemos realizar con una calculadora o un programa informático. Nuestro interés está en saber interpretarlo. Antes de ponernos a trabajar destacaremos una de sus propiedades -1 < r < 1 A continuación tienes unos ejes con una nube de puntos que puedes modificar haciendo clic sobre ellos con el ratón y arrastrándolos. No tengas miedo de equivocarte, siempre puedes volver a la posición inicial pulsando el botón inicio. Las coordenadas de los puntos las puedes saber con aproximación naciendo clic en cualquier punto del plano y arrastrando hasta colocarte encima del punto. Observa el valor de r, así como el ajuste de la nube a la recta. Intenta deducir las propiedades de r, relacionando su valor con la forma de la nube y realizando los siguientes ejercicios. 1. Acerca los puntos a la recta. ¿Hacia qué valor se aproxima r? Seminario Integrador Profesional
Página 4
Regresión y Correlación 2. Aleja los puntos de la recta, separándolos entre sí ¿Hacia qué valor se aproxima r? 3. Mueve los puntos hasta que la recta tenga pendiente negativa, es decir, sea decreciente. En estas condiciones contesta a las preguntas anteriores. 4. Si alineas todos los puntos ¿Qué valor aproximadamente toma r? Anota tus conclusiones en tu cuaderno; puedes ayudarte con el siguiente esquema: ESTIMACIÓN MEDIANTE LA RECTA DE REGRESIÓN Es evidente que no todos dibujaríamos exactamente la misma recta para una nube de puntos, aunque la correlación fuera bastante fuerte. De todas las rectas posibles los matemáticos han elegido como la mejor aproximación la llamada de los mínimos cuadráticos, Su cálculo es también algo mecánico que podemos hacer con calculadora o un ordenador. En el siguiente apartado encontrarás un ejercicio para estudiar sus propiedades. La recta de regresión sirve para hacer estimaciones, teniendo en cuenta que: •
Los valores obtenidos son aproximaciones en términos de probabilidad: es probable que el valor correspondiente a x 0 sea y0.
•
La fiabilidad es mayor cuanto más fuerte sea la correlación.
•
La fiabilidad aumenta al aumentar el número de datos.
•
La estimación es más fiable para los valores de x próximos a la media.
Ejemplo 1: Con los datos del primer ejemplo, (las notas de 10 alumnos en Matemáticas y en Lengua), podemos contestar con aproximación a la siguiente cuestión: si un alumno no realizó el examen de lengua, pero sí el de matemáticas, obteniendo un 7, ¿qué nota cabe esperar que obtuviera en lengua? MATEMÁTICAS 2
4
5
5
6
6
7
7
8
9
LENGUA
2
5
6
5
7
5
8
7
10
2
Seminario Integrador Profesional
Página 5
Regresión y Correlación Observa el punto amarillo, cuya abscisa corresponde a la nota de matemáticas y su ordenada a la nota que esperamos que tenga en lengua. Es resultado es aproximado y relativamente fiable, ya que la correlación es fuerte Y el valor de la nota no está muy próximo a la media, aunque el nº de datos que tenemos no es muy alto. Puedes cambiar el valor de la nota de matemáticas sin más que cambiar su valor en el recuadro de la parte inferior. PROPIEDADES DE LA RECTA DE REGRESIÓN DE LOS MÍNIMOS CUADRÁTICOS. En la siguiente escena puedes comprobar las principales propiedades de la recta de regresión mínimo-cuadrática. 1. Observa la recta blanca, cuyos coeficientes
a
y
b
puedes hacer variar en los
recuadros inferiores de la escena, bien con las flechas o introduciendo los valores deseados. Observa los segmentos denominados
di,
que marcan las
distancias de los puntos de la nube a la recta en la dirección del eje OY”.
i
MAPA DE ESPARCIMIENTO O NUBE DE PUNTOS “Esla representación grafica del predictor y el predictando o sea de las variables consideradas, es decir los datos de dos variable, marcadas en un grafica. Como primer punto cuando se cuenta con dos variables, es representarlas gráficamente porque esto permite tener una apreciación visual del comportamiento lineal o no; también se puede apreciar si su comportamiento es positivo o negativo, importante porque si es negativo el valor del coeficiente de regresión “b” en la ecuación de regresión tendrá signo negativo. VALOR DE COMSUMO DE COMBUSTIBLE Q. 275 260 310 400 425
Seminario Integrador Profesional
KMS RECORRIDOS Y 300 290 325 400 410
Página 6
Regresión y Correlación
ANALISIS DE REGRESIÓN Es la técnica mas usada en investigación económica y comercial para buscar una relación entre 2 o mas variables ligadas de un modo causal. Consiste en general en: una función a partir de datos o información conocida para hacer estimaciones.
TIPOS ANÁLISIS DE REGRESIÓN a) REGRESION LINEAL SIMPLE: Se refiere al análisis de 2 variables. b) REGRESION MULTIPLE: Cuando se relacionan 3 o mas variables. REGRESIÓN LINEAL SIMPLE Para este análisis es necesario ajustar los datos a una línea recta, para poder estimar una variable con relación a otra. Para esto utilizamos la ecuación de la línea recta: Y = a+ bx === → yc = a+ bx = Ecuación de Regresión Donde: Yc
= Variable estimada o calculada.
a y b = Coeficientes de regresión. X
= Variable que sirve para estimar la otra variable. Predictor en base a ella
se estima el predictando.
(Variable Independiente).
Seminario Integrador Profesional
Página 7
Regresión y Correlación Y
= Constituye la Variable a estimar y recibe el nombre de Predictando.
(Variable Dependiente). Ecuaciones Normales: ∑ Y = n.a + b
∑ XY = ∑X a + b
∑X ∑ X2
FÓRMULAS PARA ENCONTRAR "a" y "b":
a =
∑ x2 (∑y
- ∑ x∑ xy
n∑x2 - ∑ x 2
b =
n∑xy - ∑ x∑ y n∑xy2 - ∑ x 2
DIAGRAMA DE ESPARCIMIENTO, NUBE DE PUNTOS O MAPA DE DISPERSION: Es la representación gráfica del Predictor y el predictando. Es una gráfica que nos muestra la forma en que los puntajes de dos variables cualquiera X y Y están dispersas. Así a cada elemento de una muestra de tamaño N se le puede hacer corresponder un par de números. Los números de cada par son las medidas o valores correspondientes a determinadas características o aspectos que tienen los elementos de la muestra. El diagrama de esparcimiento es la representación gráfica de los valores "X" y "Y" A continuación se presentan 4 tipos de gráficas que muestran los tipos de relaciones lineales:
RELACION LINEAL ASCEDENTE
RELACION LINEAS DESCENDENTE
RELACION LINEAL CURVILÍNEA
RELACION LINEAL CONSTANTE
ERROR ESTANDAR DE REGRESIÓN: (SÍMBOLO Syx) Mide el grado de error de las estimaciones alrededor de la línea de regresión; si este es igual a cero ( 0 ) se dirá que existe una estimación perfecta. Seminario Integrador Profesional
Página 8
Regresión y Correlación Propiedades de Syx;
Yc, +, - Syx
= Agrupa aproximadamente al 68.26% de los datos.
Yc , +, - 2 (Syx) = Agrupa aproximadamente al 95.46% de los datos.
Yc , +, - 3 (Syx) = Agrupa aproximadamente al 99.72% de los datos. Hay dos formas de calcularlo:
1.) Varianza no explicada (ve) ___________ Syx =
∑ (y- yc) N
2.) Formula general Syx =
∑ y2 - ∑y a - ∑XY b N
INTERVALO DE CONFIANZA: Yc = Z+,- Syx APLICACIÓN: Al tabular los costos Unitarios y la producción de una empresa industrial durante el año anterior, se encontró el siguiente comportamiento: COSTO POR UNIDAD Q 1.00 Q. 2.00 Q 3.00 Q. 4.00 Q. 5.00
PROD EN MILES DE UNIDADES 20 15 12 11 7
1.) Con los datos tabulados de la contabilidad de la empresa se pide: Elaborar la representación gráfica sabiendo que la empresa desea estimar su producción.
Seminario Integrador Profesional
Página 9
Regresión y Correlación ) Q s 25 e l i 20 M ( 15
n ó i 10 c c 5 u d o 0 r P 0
Serie1
2
4
6
Costo Unitario
x 1 2 3 4 5 15
DATOS
y 20 15 12 11 7 65
N ∑x ∑y ∑x2 ∑y2 ∑xy
x2 1 4 9 16 25 55
y2 400 225 144 121 49 939
= = = = = =
xy 20 30 36 44 35 165
DESARROLLO:
5 15 65 55 939 165
2). Encuentre la Ecuación de Regresión del comportamiento de la producción en función de los costos unitarios 65 =
5 a + 15b (-3) Factor que multiplica a la Ec. -195 = -15a -45b b = -30 b= -3 165 = 15 a + 55b 165 = 15a +55b 10 -30 = 10B Encontrar "a": 65 = 5 a + 15 (-3) Valor de “b” 65 = 5 a - 45 -5 a = -65 – 45 a = -110 = a = 22 -5 La Ecuación de regresión de la Producción en función de los costos = Seminario Integrador Profesional
Y = 22 – 3x Página 10
Regresión y Correlación 3.) OBTENER "a" y "b" por Fórmula: a = (∑x2 ) (∑y) – (∑x) (∑xy) n∑ x2 - (∑x)2 b =
n∑xy - (∑x) (∑y) n ∑x2 - (∑x) 2
a = ( 55 ) (65) – (15) (165) 5 (55) - (15) 2 b=
= 3575 – 2475 275 - 225
5 (165) – (15) (65) = 5 (55) - (15) 2
825 – 975 275 – 225
= 1100 50
= -150 50
a = 22
b = -3
4.) El Departamento de Ventas de la empresa solicita le indique qué número de unidades puede producir el presente año, si según estudios se considera que su costo unitario será igual a Q.3.75 Y = a + bx Yc = 22 – 3 (3.75) Yc = 22 – 11.25 = 10.75 5.) CALCULAR EN ERROR ESTANDAR DE REGRESION;
∑ y2 - ∑y.a - ∑xy.b
Syx =
N Syx =
939 – 22 ( 65) – (-3) 165 5
Syx =
939 – 1430 + 495 5
=
4 5
Syx = 0.894427191 Yc 19 16
Yc=22-3x 22 - 3 (1) 22 - 3 (2)
(y-Yc) 1 -1
(y-Yc)2 1 1
13
22 - 3 (3)
-1
1
10
22 - 3 (4)
1
1
7
22 - 3 (5)
0
0
65
xxxx
0
4
Seminario Integrador Profesional
Página 11
Regresión y Correlación Otra forma: ∑ (y- yc)2 Syx = N ___________ Syx = 4 5 Syx = 0.894427191 6.) Estimar por intervalo la producción para costo de Q.6.00 con un 85% de confianza yc = a +bx
4 +, - 1.43 (0.89442719)
yc = 22 +-3 (6)
4 + 1.28 = 5.28
yc = 22 – 18
4 – 1.28 = 2.72
yc = 4 La producción estimada para costos de
Q 6.00 oscila entre 2.72 y 5.28 miles de
unidades. 7.) Según el presupuesto de la empresa para el presente año su producción alcanzará la suma de 11,500 unidades. ¿Se quiere saber a qué costo debe producir ?.
En ejemplos anteriores en base al costo se estima la producción, en este caso es a
la inversa. Entonces, para el desarrollo de este caso se invierte la fórmula original Yc = a + bx
por la siguiente: Xc = a + by
Así como las ecuaciones normales, las cuales quedan así: x = n. A +
yb
xy =
y2b
ya+
15 = 5a + 65b (-13) 165 = 65a + 939b -195 = - 65a - 845b 165 = 65a + 939b -30
94b
b = -30
b = -0.31915
94 Encontrar el valor de "a": Seminario Integrador Profesional
Página 12
Regresión y Correlación 15 = 5 a + 65 ( -0.31915 ) → 15 = 5 a – 2074475
→ -5 a = -35.74475
-5 a = -15 – 20.74475
a = 7.14895 La Ecuación de los costos en función de la producción queda: X = 7.14895 - 0.31915y Costos a que debe producir: Xc = 7.14895- 0.31915 ( 11.5) Xc = 3.48 8.) Con las ecuaciones de regresión de la producción en función de los costos unitarios y los costos unitarios en función de la producción, encontrar el promedio del costo por unidad y el costo promedio. Las ecuaciones encontradas son: Y=22–3x X = 7.1489 – 0.319148y Las colocamos en orden: y = 22.0000 – 3x 0.319148y =
7.1489
- x (-3) Se multiplica por este valor la 2ª. Ecuación y =
22.0000 – 3x
-0.9574y = -21.4467 + 3x 0.0426y = 0.5533 Y = 0.5533 = 12.9882
Y = 13 Producción
0.0426
Promedio
Comprobación:
Y=
65
= 13 5
Costo Promedio: Y= 22-3X
= 13 = 22 – 3 (X) 3X = 22 – 13 3X = 9 X=3
Seminario Integrador Profesional
Página 13
Regresión y Correlación Comprobación
X=
15 =
3
5 ANALISIS DE CORRELACION Mide el grado de asociación de dos o más variables. La correlación también se puede usar por si misma para medir el grado de asociación de dos variables. SÍMBOLO Si r es igual a 0
= no existe correlación
Si r mayor que 0
= correlación positiva
Si r menor que 0
= correlación negativa
" r”
Si r es igual a menos 1 = correlación perfecta negativa Si r es igual a uno
= correlación perfecta positiva.
Entonces los límites o extremos del coeficiente de correlación son –1y 1. TIPOS DE CORRELACIÓN a.) Por el comportamiento de las variables: positiva, negativa y nula o irregular B) por el numero de variables: simple, múltiple y parcial
CORRELACIÓN PERFECTAMENTE POSITIVA Aumenta una variable y la otra también aumenta o a la inversa. Precio Venta (x) 1.0 2.0 3.0 4.0 5.0 15
Ingresos (y) 10.00 12.00 14.00 16.00 18.00 70.00
================= Mapa de Dispersión Seminario Integrador Profesional
Página 14
Regresión y Correlación
Correlación perfecta positiva r = 1
CORRELACIÓN PERFECTA NEGATIVA Una variable aumenta la otra disminuye. Costo Unids Unidad Vendidas (x) (y) 18.00 160.00 16.00 180.00 15.00 190.00 14.00 200.00 13.00 210.00 76.00 940.00 =================== Mapa de Dispersión Correlación perfecta negativa r = -1
CORRELACIÓN IRREGULAR O NULA No sabemos el compartimiento de la variable, Eje. Aumentamos costo, las ventas puede que aumenten o disminuyan.
Seminario Integrador Profesional
Página 15
Regresión y Correlación Precios (y) 1.00 2.00 3.00 4.00 5.00 15.00
Ingresos 11.00 9.00 2.00 15.00 8.00 45.00
===================
Mapa de Dispersión
No hay correlación r = 0
COEFICIENTE DE DETERMINACIÓN Es la forma primaria por la cual se puede medir la extensión o fuerza, de la asociación que existe entre 2 variables X y Y. r2 =
a (∑y) + b (∑xy) - n ( y )2 ∑y2 - n ( y )2 COEFICIENTE DE CORRELACIÓN
Sirve para medir la relación entre dos variables. Es la segunda medida que se pueda usar para describir lo bien que una variable se explica por otra. Cuando se está tratando de muestras, el coeficiente de correlación se denota por “1” y es la raíz cuadrada del coeficiente de determinación muestral . Fórmula .r =
r2
Seminario Integrador Profesional
Página 16
Regresión y Correlación o bien: a (∑y) + b (∑xy) - n ( y promedio)2 ∑y2 - n (y promedio)2
.r =
APLICACIÓN: Con los datos del ejemplo que se ha desarrollado en el Análisis de Regresión, calcular la forma en que primariamente se relacionan las variables: r2 =
a (∑y) + b (∑xy) - n ( y promedio)2 ∑y2 - n (y promedio)2
.r 2= 65 (22) + 165 (-3) - 5 ( 13)2 939 - 5 (13)2 .r2 = 0.957447 A continuación calcular el grado de asociación entre las dos variables, (la fuerza o extensión en que se asocian las variables): r=
0.957447
r = 0.978492 Por ser “r” mayor que cero se dice que la correlación es positiva”. ii EJERCICIO La empresa “Chapín” le proporciona a usted como asesor financiero de la empresa la siguiente información en miles de quetzales: Años Costos Ventas (Q. miles)
1 50 65
2 60 70
3 65 75
4 70 85
5 90 105
Se pide: a) Determinar la ecuación de regresión para estimar las ventas; b) Determinar las ventas para un costo de Q. 120,000.00; c) Determinar el grado de asociación entre las dos variables; d) Interpretar el coeficiente hallado en el inciso anterior; y e) El error estándar de estimación. Seminario Integrador Profesional
Página 17
Regresión y Correlación
n Costos (x) Ventas (y) 1 50 65 2 60 70 3 65 75 4 70 85 5 90 105 335 400
xy 3250 4200 4875 5950 9450 27725
x2 2500 3600 4225 4900 8100 23325
y2 4225 4900 5625 7225 11025 33000
a) Ecuación de regresión a=
a= a=
(Σx) ( Σ xy) – (Σy) (Σx2) (Σ x)2 – n(Σx2) (335) ( 27725) – (400) (23325) (335)2 - 5 (23325) -42125 -4400
a = 9.57 b= b=
(Σy) ( Σ x) – n (Σxy) (Σ x)2 – n(Σx2) (400) (335) – 5 (27725) (335)2 - 5 (23325)
b=
-4625 -4400 b = 1.05 Yc = 9.57 + 1.05 X b) Ventas para un costo de Q 120,000.00 Y (20,000) = 9.57 + 1.05 (120) Y (20,000) = 135.71 c) Grado de asociación de las variables Ŷ = 400 = Seminario Integrador Profesional
Página 18
Regresión y Correlación 80 5 a (Σ y) + (b)(Σ xy) – n(Ŷ)2 (Σ y2) – n(Ŷ )2
r =
r=
(9.57) (400) + (1.05) (27725) – (5) (80)2 (33000) – (5) (80) 2
r=
972.30113 6 1000 0.9723011 4
r= r = 0.9861
d) Interpretación del coeficiente de correlación Coeficiente de correlación positivo, lo que implica que al aumentar una variable (Costos) la otra (Ventas) también aumenta. e) Error Estándar de Estimación Syx =
∑ y2 – a ∑ y – b ∑ xy N
Syx =
(33000) – (9.57) (400) – (1.05) (27725) 5
Syx =
60.75 5
Syx =
12.15
Syx = 3.49 CONCLUSIONES
Seminario Integrador Profesional
Página 19
Regresión y Correlación
La correlación es frecuente que estudiemos sobre una misma población los
valores de dos variables estadísticas distintas, con el fin de ver si existe alguna relación entre ellas.
La primera forma de describir una distribución bidimensional es representar los
pares de valores en el plano cartesiano.
Cuando observamos una nube de puntos podemos apreciar si los puntos se
agrupan cerca de alguna curva.
El análisis de regresión es la técnica más usada en investigación económica y
comercial para buscar una relación entre 2 o más variables ligadas de un modo causal.
RECOMENDACIONES
Seminario Integrador Profesional
Página 20
Regresión y Correlación
Al realizar estimar una variable con base a la otra se trata de regresión y si se
desea conocer la relación existente entre variables entonces se refiere al tema de correlación.
La regresión y correlación son una herramienta estadística para la toma de
decisiones por tal motivo nos proporcionan indicadores que nos lleva a conocer el comportamiento de una variable a otra, la cual de esta manera obtendremos los resultados esperados.
BIBLIOGRAFÍA
Seminario Integrador Profesional
Página 21
..http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacion_regresion_recta_r
i
egresion/correlacion_y_regresion.htm. Verificado el 27/09/2011. ii
Libro de Estadística I Guía de Estudio, José Luis Reyes Donis, Catedrático de Estadística,
facultad de ciencias economías, Segunda Edición, Pág. 189 a 201.