CORRELACION: EL objetivo objetivo de un estudio de correlación es determinar la consistencia de una relación entre observaciones por partes. EL término “correlación “significa relación mutua, ye que indica el grado en el que los valores de una variable se se relacionan relacionan con los valores de otra. Se considera tres técnicas de correlación uno para datos de medición, otro para datos jerarquizados y el ltimo para clasificaciones nominales. En tanto, en probabilidad y estad!stica, estad!stica, la correlación es aquello que indica la fuerza y la dirección lineal que se establece entre dos variables aleatorias. Se considera que dos variables cuantitativas est"n correlacionadas cuando los valores de una de ellas var!an sistem"ticamente con respecto a los valores #omónimos de la otra$ si tenemos dos variables %& y '( e)iste correlación si al aumentar los valores de & lo #acen también los de ' y viceversa. La correlación entre dos variables no implica, por s! misma, ninguna ningu na relación de causalidad *uando r + e)iste una relación funcional entre las dos variables de modo que el valor de cada variable se puede obtener a partir de la otra. Los puntos de la nube est"n todos situados sobre una recta de pendiente positiva. Esto ocurre, por ejemplo, cuando una barra met"lica se somete a distintas temperaturas, ), )-,, )n, y se miden con precisión sus correspondientes longitudes, y, y-,, yn. Las longitudes se obtienen funcionalmente a partir de las temperaturas de modo que, conociendo la temperatura a que se va a calentar, se podr!a obtener la longitud que tendr!a la barra. *uando r es positivo y grande %pró)imo a ( se dice que #ay una correlación fuerte y positiva. Los valores de cada variable tienden a aumentar cuando aumentan los de la otra. Los puntos de la nube se sitan pró)imos a una recta de pendiente positiva. Es el caso de las estaturas, ), )-,, )n, y los pesos, y, y-,, yn, de diversos atletas de una misma especialidad. & mayor mayor estatura cabe esperar que tengan mayor peso, pero puede #aber e)cepciones. *uando r es pró)imo a cero %por ejemplo, r + /0,- o r + 0,01( se dice que la correlación es muy débil %pr"cticamente no #ay correlación(. La nube de puntos es amorfa. Es lo que ocurrir!a si lanz"ramos simult"neamente dos dados y anot"ramos sus resultados$ puntuación del dado rojo, )i2 puntuación del dado verde, yi. 3o e)iste ninguna relación entre las puntuaciones de los dados en las diversas tiradas. *uando r es pró)imo a / %por ejemplo, r + /0,45( se dice que #ay una correlación fuerte y negativa. Los valores de cada variable tienden a disminuir cuando aumentan los de la otra. Los puntos de la nube est"n pró)imos a una recta de pendiente negativa. . *uando r + / todos los puntos de la recta est"n sobre una recta de pendiente negativa. E)iste una relación funcional entre las dos variables.
La relación entre dos sper variables cuantitativas queda representada mediante la l!nea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una l!nea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma$ En ocasiones nos puede interesar estudiar si e)iste o no algn tipo de relación entre dos variables aleatorias. &s!, por ejemplo, podemos preguntarnos si #ay alguna relación entre las notas de la asignatura Estad!stica 6 y las de 7atem"ticas 6. 8na primera apro)imación al problema consistir!a en dibujar en el plano 9- un punto por cada alumno$ la primera coordenada de cada punto ser!a su nota en estad!stica, mientras que la segunda ser!a su nota en matem"ticas. &s!, obtendr!amos una nube de puntos la cual podr!a indicarnos visualmente la e)istencia o no de algn tipo de relación %lineal, parabólica, e)ponencial, etc.( entre ambas notas. En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El par"metro que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r , cuyo valor oscila entre : y ;
TIPOS DE CORRELACIÓN: La correlación puede clasificarse en dos tipos dependiendo de la cantidad de variables analizadas y por el tipo de relación lineal$ 1. Correlación simle: se estudia la dependencia nicamente entre dos variables. !. Correlación m"ltile: se estudia la dependencia entre m"s de - variables. #. Correlación arcial: cuando se incluye la influencia de variables e)ógenas no consideradas en el c"lculo de los coeficientes.
1. Correlación directa: La correlación directa se da cuando al aumentar una de las variables la otra aumenta. La recta correspondiente a la nube de puntos de la distribución es una recta creciente.
!. Correlación in$ersa: La correlación inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.
#. Correlación n%la: La correlación nula se da cuando no #ay dependencia de ningn tipo entre las variables. En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Los tipos de correlación que pueden presentarse son$
Correlación ositi$a o directamente roorcional r & '().
3os indica que al modificarse en promedio una variable en un sentido, la otra lo #ace en la misma dirección. Correlación ne*ati$a o in$ersamente roorcional r & '+). 3os muestra que al cambiar una variable en una determinada dirección %en promedio(, la otra lo #ace en sentido contrario u opuesto. Incorrelación r & , *uando la obtención de dic#o indicador “r= sea e)actamente igual a cero, se dice que no e)iste alguna relación, asociación o dependencia entre las variables estudiadas, siendo por tanto ellas, variables correlacionadas o faltes de alguna dependencia lineal.
>9&
La correlación ser" fuerte cuanto m"s cerca esté los puntos de la recta.
!. Correlación d-il La correlación ser" débil cuanto m"s separados estén los puntos de la recta.
#. correlación n%la El coeficiente de correlación lineal, el cociente entre la varianza el producto de las desviaciones t!picas ambas variables. El coeficiente de correlación lineal se e)presa mediante$
Coeficientes de correlación: E)isten diversos coeficientes que miden el grado de correlación, adaptados a la naturaleza de los datos. El m"s conocido es el coeficiente de correlación de Aearson %introducido en realidad por Brancis >alton(, que se obtiene dividiendo la covarianza de dos variables por el producto de sus desviaciones est"ndar. ?tros coeficientes son$ C *oeficiente de correlación de Spearman
C *orrelación canónica. Coeficiente de correlación de Pearson En estad!stica, el coeficiente de correlación de Aearson es un !ndice que mide la relación lineal entre dos variables aleatorias cuantitativas. & diferencia de la covarianza, la correlación de Aearson es independiente de la escala de medida de las variables. El coeficiente de correlación entre dos variables aleatorias D e es el cociente donde FD es la covarianza de %D,( y FD y F las desviaciones t!picas de las distribuciones marginales.
Coeficiente de correlación de Searman En estad!stica, el coeficiente de correlación de Spearman, G %ro( es una medida de la correlación %la asociación o interdependencia( entre dos variables aleatorias continuas. Aara calcular G, los datos son ordenados y reemplazados por su respectivo orden. El estad!stico G viene dado por la e)presión$
CORRELACIÓN /ALOR O RAN0O Aerfecta$ K9K + E)celente$ 0.4 + K9K 'uena$ 0.1 + K9K 0.4 9egular$ 0.M + K9K 0.1 7ala$ K9K 0.M
Ejemplo$ Las notas de - alumnos de una clase en 7atem"ticas y B!sica son las siguientes$ atem2ticas ! # 3 3 4 5 5 6 6 7 1, 1,
89sica
5
-
N
N
N
O
N
O
Qallar el coeficiente de correlación de la distribución e interpretarlo. xi
yi
xi ·yi
xi2
yi2
2
1
2
4
1
3
3
9
9
9
4
2
8
16
4
4
4
16
16
16
5
4
20
25
16
6
4
24
36
16
6
6
36
36
36
7
4
28
49
16
7
6
42
49
36
8
7
56
64
49
9
90
100
81
10
10
100
100
100
72
60
431
504
380
10
1 Qallamos las medias aritméticas.
! *alculamos la covarianza.
# *alculamos las desviaciones t!picas.
3 &plicamos la fórmula del coeficiente de correlación lineal.
P
4
0
&l ser el coeficiente de correlación positivo, la correlación es directa. *omo coeficiente de correlación est" muy pró)imo a la correlación es muy fuerte.
Correlación arcial: El procedimiento *orrelaciones parciales permite estudiar la relación lineal e)istente entre dos variables controlando el posible efecto de una o m"s variables e)traRas. 8n coeficiente de correlación parcial es una técnica de control estad!stico que e)presa el grado de relación lineal e)istente entre dos variables tras eliminar de ambas el efecto atribuible a terceras variables. El coeficiente de correlación parcial de primer orden, anotado aqu!, permite conocer el valor de la correlación entre dos variables & y ', si la variable * #ab!a permanecido constante para la serie de observaciones consideradas.
Los coeficientes de mayor orden se obtienen siguiendo la misma lógica. Qablamos de correlación de primer orden para indicar que se est" controlando el efecto de una variable2 de segundo orden, para indicar que se est" controlando el efecto de dos variables2 etc. Lógicamente, cuando no se est" controlando ninguna variable, es decir, cuando utilizamos el coeficiente de correlación de Aearson del apartado anterior, #ablamos de correlación de orden cero.