REGRESION LINEAL SIMPLE Y REGRESION LINEAL MULTIPLE
MAIBETH LUCIA PARDO, COD: 1018432677 MARIA DEL PILAR VILORIA, COD: 1066187792 MARIA ANDREA BULA, COD: 1067291821 ANGIE NOHELIS CADENA, COD: 100399672 LEISY LORENA SANTA, COD: 1128399793
GRUPO: 204040!187
TUTOR:ROBERTO MARIO DE LE"N
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA DISTANCIA #UNAD$ ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES PROGRAMA DE PSICOLOG%A ESTAD%STICA DESCRIPTIV DESCRIPT IVA A SAHAG&N ' COLOMBIA 2016
I()*+-../(
El siguiente trabajo muestra una serie de ejercicios de regresión y correlación lineal simple y múltiple donde se relacionan las variables de la bases de datos presentada de los accidentes de tránsito en Medellín en el 2015 donde se se identificaran dos variables variables cuantitativas de la situación estudiada ue puedan estar relacionadas! el diagrama de dispersión de dic"as variables! la asociación entre las variables! el modelo matemático ue permite predecir el efecto de una variable sobre la otra y si es confiable y el porcentaje de e#plicación del modelo y el grado de relación de las dos variables como la información obtenida con el problema$
-)//.5./(
I()*+-../(
El siguiente trabajo muestra una serie de ejercicios de regresión y correlación lineal simple y múltiple donde se relacionan las variables de la bases de datos presentada de los accidentes de tránsito en Medellín en el 2015 donde se se identificaran dos variables variables cuantitativas de la situación estudiada ue puedan estar relacionadas! el diagrama de dispersión de dic"as variables! la asociación entre las variables! el modelo matemático ue permite predecir el efecto de una variable sobre la otra y si es confiable y el porcentaje de e#plicación del modelo y el grado de relación de las dos variables como la información obtenida con el problema$
-)//.5./(
%on el fin de mejorar nuestro aprendi&aje atreves de las unidades e#puestas! se tomarán las temáticas temáticas regresió regresiónn y correl correlació aciónn lineal lineal simple simple y regres regresión ión correlaci correlación ón lineal múltiple donde se reali&ará una serie de ejercicios para su su mejor compresión y saber$
O)/+
'ara reali&ar los ejercicios primero se debe obtener los estimadores de los parámetros! estimar la varian&a del error! obtener los errores estándares de los parámetros estimados! probar la "ipótesis sobre los parámetros! cálculo de valores estimados basados en la ecuación estimada! estimar el ajuste o la falta de ajuste del modelo$ El modelo a utili&ar es () a* b#! a es el intercepto! b es la pendiente de la función! la ue nos indica el cambio marginal de ( respecto a +$ •
•
•
•
• •
•
•
En los ejercicios del laboratorio y el grupal se buscará primero en el simple identificar dos variables cuantitativas de la situación estudiada ue puedan estar relacionadas$ ,os reali&ar el diagrama de dispersión de dic"as variables y determinar el tipo de asociación entre las variables$ -Encontrar el modelo matemático ue permite predecir el efecto de una variable sobre la otra y si es confiable. ,eterminar el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ /elacionar la información obtenida con el problema$ En el múltiple se identificará una variable cuantitativa dependiente y varias variables independientes del estudio de investigación$ /eali&ar el diagrama de dispersión de dic"as variables y calcular la recta de regres regresió iónn y el coefi coeficie cient ntee de corr correla elaci ción ón para para prob probar ar esta estadí díst stica icame ment ntee su relación$ /elacionar la información obtenida con el problema$
A(;// .+**;5./( ;/(5; /<=; ;5 + 5*/5; .-5()/)5)/5 ;../+(55
Maibet" lucia pardo 1 R>* R>*/ /( ( ? C+** C+**;5. ;5./( /( ;/(5 ;/(5;; S/<=; S/<=;
a$ dentificar dos variables cuantitativas de la situación estudiada ue puedan estar relacionadas$ b$ /eali&ar el diagrama de dispersión de dic"as variables y determinar el tipo de asociación entre las variables$ c$ Encuentre el modelo matemático ue permite predecir el efecto de una variable sobre la otra$ Es confiable. d$ ,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ e$ /elacionar la información obtenida con el problema$ NUME VELO NUMER VELO NUMERO VELO RO DE CIDA O DE CIDAD DE CIDAD MUER D MUERT MUERTOS TOS OS 1 34 3 4 1 4 1 4 3 6 1 70 1 70 6 1 70 1 70 6 1 75 1 75 40 2 75 2 75 40 1 74 1 74 40 2 50 2 50 40 2 50 2 50 40 2 50 2 50 40 2 50 2 50 40 2 51 2 51 41 2 55 2 55 4 41 1 55 1 55 4 41 2 55 2 55 4 4 2 55 2 55 4 4 2 55 2 55 6 4 2 55 2 55 6 4
2 2 2 2 2 2 2 2 2 2 2 2 2
30 30 30 32 3 35 35 33 33 33 33 33 3 3 3 34 34 34 34
2 2 2 2 2 2 2 2 2 2 2 2 2
30 30 30 32 3 35 35 33 33 33 33 33 3 3 3 34 34 34 34
4 4 4 4 10 6 6 6 10 6 11 11 11 12 12 12 12 12
4 4 45 43 44 44 44 44 44 65 65 100 105 104 111 14 14 150
8olución$ a$ 9as variables cuantitativas son número de muertos y velocidad$ b$ El diagrama de dispersión es
VELOCIDAD 160 140 120 100
Velocidad
f(x) = 5.23x + 47.97 R² = 0.79
80 60 40 20 0
0
2
4
6
8
Número de Muertos
El tipo de asociación es lineal$
10
12
14
c$ El modelo matemático es y ) 5!2244# * 7!634! este modelo es confiable ya ue el grado de correlación es /: ) 0!60 d$ El grado de correlación es /: ) 0!60! con porcentaje de 6!0$ e$ 9a relación ue se obtiene entre la información de la tabla y el resultado del análisis de la regresión! muestra ue evidentemente e#iste una relación en cuanto al número de muertos versus la velocidad$
María del pilar ;iloria 1
R>*/( ? C+**;5./( ;/(5; S/<=; S+;-./(
@I()//.5* + 5*/5; .-5()/)5)/5 ;5 /)-5./( )-/55 - =-5( )5* *;5./+(55 •
;elocidad! número de "eridos$
< /eali&ar el diagrama de dispersión de dic"as variables y determinar el tipo de asociación entre las variables$
•
=sociación positiva$
@ E(.-()* ; <+;+ <5)<)/.+ - =*) =*./* ; .)+ -(5 5*/5; +* ;5 +)*5 E .+(/5; •
Modelo matemático y) 0!054# < 0!323 / 2)0!736$ Es un poco confiable porue su valor es un poco bajo$
@ D)*( ; =+*.()5 =;/.5./( ; <+;+ ? ; >*5+ *;5./( ;5 + 5*/5;
El modelo es / 2)0!736 'orcentaje 0!736>100)73!6? viene siendo de 73!6?$ 8u grado de relación es poco aceptable entre las dos variables$ r) √ R 2
2
r) √ 0,4693 r)0!021654 porcentaje 0!021654>100)0!21654? y su correlación @rA es regular$ 2
' R;5./+(5* ;5 /(+*<5./( +)(/5 .+( ; =*+;<5 •
%on los resultados obtenidos en la recta se puede decir ue tiene una relación es es poco aceptable entre las variables velocidad y número de "eridos el / 2 e#plica ue tiene un 73!6? y el valor de r confirma además ue su correlación es regular teniendo un porcentaje de 0!21654? entre las dos variables velocidad y número de "eridos! en los accidentes de tránsito de Medellín en el 2015$
María =ndrea Bula 1 R>*/( ? C+**;5./( ;/(5; S/<=;: 'I()//.5* + 5*/5; .-5()/)5)/5 ;5 /)-5./( )-/55 - =-5( )5* *;5./+(55 • •
;elocidad número de muertos
@ R5;/5* ; /5>*5<5 /=*/( /.F5 5*/5; ? )*(5* ; )/=+ 5+./5./( ()* ;5 5*/5;
Veloci dad vs # de m uerto s 14 f(x) = 0.15x - 6.29 R² = 0.8
12 10 8
No. De Muertos
6 4 2 0 20
40
60
80
100
120
140
160
velocidad
9a asociación es positiva$ @ E(.-()* ; <+;+ <5)<)/.+ - =*) =*./* ; .)+ -(5 5*/5; +* ;5 +)*5 E .+(/5;
()0!1514#<3!2454! / 2)0!61 Es confiable porue su valor es alto! el modelo es / 2)0!61 @ D)*( ; =+*.()5 =;/.5./( ; <+;+ ? ; >*5+ *;5./( ;5 + 5*/5;
El porcentaje 0!61#100)6!1? 8u grado de relación es bastante aceptable$ < R;5./+(5* ;5 /(+*<5./( +)(/5 .+( ; =*+;<5 $ 9os resultados obtenidos en la recta nos da una relación bastante aceptable entre las dos variables velocidad y numero de muerto teniendo una correlación del 46$24? entre las dos variables indicando ue a mayor velocidad mayor cantidad de muertes en accidentes de tránsito en la ciudad de Medellín$
=ngie Co"elis %adena 1@R>*/( ? C+**;5./( ;/(5; S/<=; I()//.5* + 5*/5; .-5()/)5)/5 ;5 /)-5./( )-/55 - =-5( )5* *;5./+(55
9as variables cuantitativas ue ui&ás podrían estar relacionadas son grados de alco"ol del conductor y número de "eridos < /eali&ar el diagrama de dispersión de dic"as variables y determinar el tipo de asociación entre las variables$
grados de alcohol del conductor n 8 7 6 5
N!mero de heridos 4
f(x) = 1 .17x + 1.63 R² = 0.51
3 2 1 0 0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
"rados de acohol del conductor
4.0
E(.-()* ; <+;+ <5)<)/.+ - =*) =*./* ; .)+ -(5 5*/5; +* ;5 +)*5 E .+(/5;
El modelo matemático se obtiene aplicando el mDtodo de mínimos cuadrados Modelos matemático de la forma () a*b1+1*b2+2 se trata de "allar de identificar los parámetros b1! b2 y a$ 'ara ello se procede utili&ando la E#cel arrojando los siguientes datos de manera automática /esumen Estadísticas de la regresión
%oeficiente de correlación múltiple %oeficiente de determinación /2 /2 ajustado Error típico Fbservaciones
0!67313517 0!46522565 0!46233661 1!004055 110
=CG988 ,E ;=/=CH= Grados de libertad
/egresión /esiduos
2 10
Iotal
106
ntercepción ;ariable + 1 ;ariable + 2
Coeficientes
<!03654632 0!056221055 2!0543507
a) <!036 b1)0$0562 b2)2$0543 /eempla&amos los datos en la ecuación () a*b1+1*b2+2 M+;+ <5)<)/.+ Y @306970092120862 D)*( ; =+*.()5 =;/.5./( ; <+;+ ? ; >*5+ *;5./( ;5 + 5*/5; RJ2 0!4652! 'or ser cercano a 1! el modelo matemático es confiable! dic"o de otra manera RJ2 0!4652>100? ) 45$62?! el modelo matemático e#plica el 45$62? de confiabilidad R J@ 0!4652A R 0!6731>100?) 67$31?
la correlación entre las variables es e#celente! dado ue su valor de coeficiente es de 0$6731! dic"o de manera porcentual! la correlación entre las variables es e#celente! ya ue ofrece el 67$31?$ 9o anterior comprueba estadísticamente la relación de las tres variables anali&adasK número de muertos! grados de alco"ol del conductor y la velocidad @ R;5./+(5* ;5 /(+*<5./( +)(/5 .+( ; =*+;<5
9os resultados anteriores indican ue las variables número de muertos! grados de alco"ol del conductor y la velocidad se encuentras relacionadas a travDs de un modelo matemático de regresión múltiple () <$036*0$0562+1*2$0543+2! este modelo e#plica el 45$42? de confiabilidad! esto debido a ue dic"a variables se encuentran en una correlación e#celente del 67$31?
9eisy 9orena 8anta 1$
/egresión y %orrelación lineal 8imple
@I()//.5* + 5*/5; .-5()/)5)/5 ;5 /)-5./( )-/55 - =-5( )5* *;5./+(55
Grados de alcohol del conductor (X)
0!0 0! 0!0 0!2 0!3 0!7 0!2 0!3 0! 0!5
Edades (Y)
26 4 52 73 21 14 57 52 4
@ R5;/5* ; /5>*5<5 /=*/( /.F5 5*/5; ? )*(5* ; )/=+ 5+./5./( ()* ;5 5*/5; D/5>*5<5 D/=*/( "rados de alcohol vs Edad del conductor 60 50 40
Edades
#$%& ' ().**% + ,(.- /0 ' 1.12
30 20 10 0 0.0
0.1
0.2
0.3
0.4
0.5
"rados de alcohol
0.6
0.7
0.8
< E(.-()* ; <+;+ <5)<)/.+ - =*) =*./* ; .)+ -(5 5*/5; +* ;5 +)*5 E .+(/5; MDtodo de mínimos cuadrados G*5+ 5;.+F+; ; .+(-.)+* #$ 0!0 0! 0!0 0!2 0!3 0!7 0!2 0!3 0! 0!5 3,
E5 #?$
x*y
x 2
y2
26 4 52 73 21 14 57 52 4 381
0 11!7 0 6!2 12!3 !2 10!4 16!4 3!7 16 126,4
0 0!06 0 0!07 0!3 0!13 0!07 0!3 0!76 0!25 1,8
471 1777 207 2113 771 27 2613 1046 207 1777 16023
'artimos de la ecuación lineal
b = a + bX
Y A X b
Lórmulas para "allar los valores aN y bN a=
b=
∑ y −b ∑ x n
∑ x∗ y −∑ x ∑ y n ∑ x −( ∑ x ) 2 n
2
= = = =
Variable independiente Intercepto con el eje “y” Variable dependiente Pendiente
Oallamos el valor bN b=
∑ x∗ y −∑ x ∑ y n ∑ x −( ∑ x ) 2
b=
10 ( 126,4 )−(3,5 )( 381 ) 10 (1,8)-(3,5) 2
b=
1264 −1333,5 18-12,25
b=
69,5 5,75
n
2
b = 12,0869565
Oallamos el valor aN a=
a=
a=
∑ y −b ∑ x n
( 381)−(12,086 )( 3,5 ) 10
( 381)− 42,301 10
a=
338,699 10
a = 33,8699
'odemos observar ue la variable independiente se encuentra relacionada con la variable dependiente$ a = 33,8699 b = a + bX b = 12,0869565
b = 12,08695 x + 33,8699
@ D)*( ; =+*.()5 =;/.5./( ; <+;+ ? ; >*5+ *;5./( ;5 + 5*/5;
H5;;5* ; .+/./() C+**;5./(
Se =
√
∑ y −a ∑ y −b ∑ x∗ y
Se =
√
16023,0−33,8699∗( 381 )−12,0869∗(126,4 ) 10 −2
2
n −2
Se =
√
16023,0−12904,4319−1527,78416 10 −2
Se =
√
1590,78394 8
Se = √ 198,847992 Se = 14,10134
Este valor euivale al error del estándar del estimado$ H5;;5* ; .+/./() D)*(5./(
Lormula de coeficiente de determinación$ 2 y ❑ ∑ 2 − 2 S = y
n
y
¿¿ =38,1 ¿
2
y
Oallar la varian&a de la variable separable 2
S y
2
∑ y =
S y =
n
2
−❑ 2 y
16023 −(38,1 )2 10
2
S y = 1602,3− 1451,61 2
S y = 150,69
'romedio de yN
Lórmula para "allar la correlación$
2
R = 1 -
2
R = 1 -
2
R = 1 -
Se
2
2
S y
( 14,10134 )2 150,69
198,8477 150,69
2
R = 1 - 1,3195 2
R = 0,3195
@ R;5./+(5* ;5 /(+*<5./( +)(/5 .+( ; =*+;<5
%on los resultados obtenidos se puede asegurar ue la ecuación de la recta es una muy proporcional a la relación entre las variables de edades y grados de alco"ol$ El /2 afirma además ue el modelo e#plica el 1!65 ? de la información y el valor de rN coeficiente de correlación lineal "ace una correlación afirmativa entre las variables edades y grados de alco"ol del estudio de investigación$ A(;// .+**;5./(
*/( ? C+**;5./( L/(5; MK;)/=;:
a$ dentificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigación$ b$ /eali&ar el diagrama de dispersión de dic"as variables$ c$ calcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación$ d$ /elacionar la información obtenida con el problema$
NUME ED RO DE AD HERID OS 1 26 2 4 52 0 73 2 21 2 14 1 57 0 2 52 4 73 7 26 1 1 2 22 1 55 30 2 2 73 2 55 16 7 21 72 73 3 7 5 2 7 2 7 27 77 1 7 50 0 7 74 5 7 5 2 73
VELOCI NUME ED DAD RO DE AD HERID OS 2 75 4 7 2 70 75 70 2 1 75 75 2 2 74 1 53 50 7 14 50 57 50 2 50 7 52 51 7 4 55 73 55 5 26 55 3 1 55 5 22 55 57 55 7 1 30 5 21 30 5 73 30 55 32 3 16 3 5 21 35 72 35 73 33 7 3 33 7 5 33 53 33 7 22 33 2 2 3 2 75 3 7 3 7 34 7 4 34 2 14 34 5 57 34
VELOCI NUME ED DAD RO DE AD HERID OS 34 7 52 36 5 4 36 7 73 36 26 36 5 1 36 7 22 36 7 36 7 73 0 5 55 0 7 16 0 21 0 72 0 73 0 3 3 0 5 5 0 7 55 1 7 22 1 5 14 2 3 57 2 3 5 52 4 5 73 7 3 26 7 1 7 5 22 5 3 4 5 3 52 5 5 73 5 7 21 3 14 57 7 30 5 2 4 73 4
VELOCI DAD
4 6 6 6 40 40 40 40 40 40 40 41 41 41 4 4 4 4 4 4 45 43 44 44 44 44 44 65 65 100 105 104 111 14 14 150
a$ 9as variables cuantitativas son número de muertos! edad y velocidad$ @variable independiente Edad y ;elocidadK ;ariable dependiente Cúmero de OeridosA$
b$ El diagrama de dispersión es
N3ME/O DE 4E/IDO5 V5 EDAD 12 10 8
EDAD
6 4 2 0
0
1
2
3
4
5
6
7
N6ME/O DE 4E/IDO5
N3ME/O DE 4E/IDO5 V5 VELOCIDAD 12 10 8
VELOCIDAD
6 4 2 0 0
1
2
3
4
N6ME/O DE 4E/IDO5
/esumen Estadísticas de la regresión
%oeficiente de correlación múltiple 0!365451 %oeficiente de determinación /2 0!743325237 /2 ajustado 0!702675 Error típico 1!1223314
5
6
7
Fbservaciones
110 Coeficientes
ntercepción ;ariable + 1 ;ariable + 2
< 0!0706744 1 < 0!01311504 0!054476 2
Error típico
0!57103213 0!00476174 0!005625343
Ecuación ()b0 * b1#1* b2#2 ()<0!07067441* <0!01311504# 1* 0!0544762# 2 El tipo de asociación es lineal$ c$ El modelo matemático es ()<0!07067441* <0!01311504# 1* 0!0544762# 2! este modelo no es muy confiable ya ue el grado de correlación es /: ) 0!702675 El grado de correlación es /: ) 0!702675! con porcentaje de 7!02675$ d$ 9a relación ue se obtiene entre la información de la tabla y el resultado del análisis de la regresión! muestra ue evidentemente e#iste una relación no muy notable en cuanto a las variables independiente edad y velocidad versus número de "eridos$ M5*/5 ; =/;5* V/;+*/5 2 R>*/( ? C+**;5./( L/(5; MK;)/=;: S+;-./(
• •
@I()//.5* -(5 5*/5; .-5()/)5)/5 =(/() ? 5*/5 5*/5; /(=(/() ; )-/+ /()/>5./( $ ;ariable dependiente cuantitativa velocidad ;ariables independientes cuantitativas número de muertos! número de "eridos! grados de alco"ol$ < /eali&ar el diagrama de dispersión de dic"as variables$
•
•
@ C5;.-;5* ;5 *.)5 *>*/( ? ; .+/./() .+**;5./( =5*5 =*+5* )5)/.5<() - *;5./( () a * b1#1 * b2#2 * b# y)77!063411*!4234663# 1*1!5234#2*!24155762# %oeficiente de determinación / 2) 0!4074057 El modelo matemático se puede decir ue es confiable por ue se apro#ima al 1$ 'orentaje de /2 0!4074057>100) 40!74057 2 2 r) √ R
r) √ 0,804803534 r) 0!46104726 la correlación entre las variables es aceptable dado ue su coeficiente es 0!46104724$ 'orcentaje$ 0!46104724>100) 46!104724 2
9o anterior comprueba estadísticamente la relación entre las cuatro variables velocidad! número de muertos! número de "eridos y grados de alco"ol$ @R;5./+(5* ;5 /(+*<5./( +)(/5 .+( ; =*+;<5 los resultados anteriores indican ue las variables velocidad! número de "eridos número de muertos y grados de alco"ol se encuentra relacionado atreves de un modelo matemático múltiple$ y)77!063411*!4234663# 1*1!5234#2*!24155762# Pue aplica el 40!74057 ? de confiabilidad$ Esto debido a ue las variables se encuentran bajo una correlación de 0! 46104726 ue es aceptable! ue es lo mismo ue decir 46!104726?
María =ndrea Bula 2 R>*/( ? C+**;5./( L/(5; MK;)/=;: @ I()//.5* -(5 5*/5; .-5()/)5)/5 =(/() ? 5*/5 5*/5; /(=(/() ; )-/+ /()/>5./( V5*/5; =(/(): velocidad V5*/5; /(=(/(): número de "eridos! número de muertos! grados de alco"ol$ @ R5;/5* ; /5>*5<5 /=*/( /.F5 5*/5;
Numero de muertos vs velocidad 160 140 120 100 Veo!"d#d
f(x) = 5.25x + 47.87 R² = 0.8
80 60 40 20 0 0
2
4
6
8
Numero de muertos
10
12
14
Numero de heridos vs velocidad 160 140 120 f(x) = 10.8x + 33.65 R² = 0.85
100 Veo!"d#d
80 60 40 20 0
0
1
2
3
4
5
6
7
8
Numero de $e r"dos
%r#dos de #!o$oem"# &s &eo!"d#d 160 140 120 100 Veo!"d#d
80
f(x) = 17.19x + 43.48 R² = 0.8
60 40 20 0 0
0.5
1
1.5
2
2.5
3
3.5
4
'r#dos de #!o$oem"#
@ .5;.-;5* ;5 *.)5 *>*/( ? ; .+/./() .+**;5./( =5*5 =*+5* )5)/.5<() - *;5./(
9a recta de regresión y coeficiente de correlación para probar la relación de las variables estadísticamente serian
() a*b1#1 * b2#2*b# () !235 * !357+ 1 * 7!4+2 * 7!714+ El coeficiente de determinación / 2) 0!4005! el modelo indica ue es confiable para su pro#imidad$ El porcentaje en el coeficiente / 2)0!4005 # 100) 40!05 2 r ) √ 0,8005
r )0!4670 # 100 r )46!7? @ R;5./+(5* ;5 /(+*<5./( +)(/5 .+( ; =*+;<5
=l relacionar la información obtenida del análisis de relación se puede distinguir la relación entre las variables velocidad! número de "eridos! grados de alco"ol y número de muertos! esta relación aceptable se observa a travDs del modelo matemático () !235 # !357+ 1 * 7!4+2 * 7!714+ Pue aplica el 40!05? de confiabilidad! con una aceptable correlación del 46!7? lo cual nos "ace afirmar ue en la accidentalidad en Medellín tiene muc"a influencia la velocidad y los grados de alco"ol ue llevan los conductores$ =ngie Co"elis %adena 2@R>*/( ? C+**;5./( L/(5; MK;)/=;:
dentificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigación$ V5*/5; =(/(): Cúmero de "eridos V5*/5; /(=(/() ;elocidad, Qrados de alco"ol del conductor
< /eali&ar el diagrama de dispersión de dic"as variables$
Re#!"* mero de $er"dos &s 'r#dos de #!o$o 8 7 6 5 f(x) = 1.17x + 1.63 R² = 0.51 4 Nmero d e $e r"dos 3 2 1 0 0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
%r#dos de #!o$o de !odu!tor
Re#!"* +mero de $er"dos &s &eo!"d#d 8 7
f(x) = 0 .06x - 0.63 R² = 0.47
6 5 N+mero de $er"dos
4 3 2 1 0 20
40
60
80
100
120
140
160
Veo!"d#d
%alcular la recta de regresión y el coeficiente de correlación para probar estadísticamente su relación$
Modelo matemático () a * b1 X 1 * b2+2 () 0!562540457551* 0!02230712766 #1*0!604526543717#2
9eisy 9orena 8anta SOLUCION
R I()//.5* -(5 5*/5; .-5()/)5)/5 =(/() ? 5*/5 5*/5; /(=(/() ; )-/+ /()/>5./( V5*/5; .-5()/)5)/5 =(/() V5*/5; V5*/5; V5*/5; I(=(/() I(=(/() D=(/() NK<*+ E5 ; NK<*+ G*5+ C+(-.)+* H*/+ A;.+F+; M-*)+ 26 1 1 0!0 2 4 1 0! 52 1 0!0 0 73 1 0!2 2 21 1 0!3 2 14 2 0!7 1 57 1 0!2 0 2 0!3 52 2 2 0! 4 2 0!5 1!7 73 04 26
V5*/5; /(=(/() V5*/5; D=(/() H+*5
2110 175 200 00 1622 075 210 2070 100 155
@ R5;/5* ; /5>*5<5 /=*/( /.F5 5*/5;
Muertos 4eridos en Accidentes de 7ransito 8or 4oras 2.5 N,-R/ -,R/
"e#r (N,-R/ -,R/)
2 1.5 "e#r (N,-R/ -,R/) 4orarios
"e#r (N,-R/ -,R/)
1
0.5 N,-R/0 R/ 0 0.5
1
1.5
"e#r (N,-R/ R/) 2 2.5 3 3.5
Cantidad de 9ersonas heridas muertas
A(;// ? .+(.;-/+(, 5 =5*)/* ;+ *-;)5+ +)(/+ ? 5=;/.5+ 5; =*+;<5 /)-5./( )-/55
8e podría decir ue las asociaciones en las tablas de frecuencias en la regresión y correlación lineal simple pueden ser positivas y negativas$ 9as relaciones pueden ser aceptables y poco aceptables dependiendo el resultado de análisis de regresión lineal e igual forma la correlación pueden ser perfecta! e#celente aceptable! regular! mínima$
C+(.;-/+(
R*(./5 B/;/+>*/.5
•
Montero! S$M$ @200A$/egresión y %orrelación 8imple$ Madrid 'araninfo$ 'aginas$ 10 T 12$ /ecuperado de "ttpUUgo$galegroup$comUpsUi$do.id)Q=9E ?%%+7052100011Vv)2$1Vu)unadVit)rVp)Q;/9VsW)WVasid)b42c41e64fcc 131e1626abe20c4216
%"urc"ill! Q$=$@2006A$=nálisis de %orrelación y de /egresión 8imple$ Me#ico %ity %engage 9earning$ 'áginas 35 T 343 /ecuperado de "ttpUUgo$galegroup$comUpsUi$do.id)Q=9E ?%%+705460022Vv)2$1Vu)unadVit)rVp)Q;/9VsW)WVasid)e554147ed46e5 d11ede11317cfce71 •
•
%"urc"ill! Q$=$@2006A$ X=nálisis de /egresión Múltiple$X Investigación de mercados $ Me#ico %ity %engage 9earning$ 'áginas 343 T 365$/ecuperado de
"ttpUUgo$galegroup$comUpsUi$do.id)Q=9E ?%%+705460027Vv)2$1Vu)unadVit)rVp)Q;/9VsW)WVasid)7655112db43a0 eb73dae43bbaf7cb6 •
Montero! S$M$ @200A$/egresión y %orrelación Múltiple$ Madrid 'araninfo$ 'áginas 161 T 225$Iomado de
"ttpUUgo$galegroup$comUpsUi$do.id)Q=9E ?%%+7052100012Vv)2$1Vu)unadVit)rVp)Q;/9VsW)WVasid)7eaa4f73c16ad1 af23a0a7e510de2 Frtegon! '$ M$ @201A$Yniversidad Ynad$ baguD$ /egresión y %orrelación 9ineal$ Iomado de "ttpUUWWW$unad&surlab$comUovasRibagueUregresionUpagina7$"tm •
•
Milton Lernando 'ava$YC=,$ @2015A$ "ttpUUWWW$unad&surlab$comUovasRibagueUregresionUpagina7$"tm
ANEOS MAIBETH LUCIA PARDO
1 El rendimiento del producto de un proceso uímico está relacionado con la temperatura de operación del proceso$ 8e desea establecer la relación ue e#iste entre la pure&a @yA del o#ígeno producido y el porcentaje de "idrocarburo @#A ue está presente en el condensador principal en un proceso de destilación! de acuerdo con los siguientes datos
+ @? de Oidro carburosA 0!66 1!02 1!15 1!26 1!73 1!3 0!4 1!2 1!55 1!7 1!16 1!15 0!64 1!01 1!11 1!2 1!23 1!2 1!7 0!65
( @'ure&aA 60!01 46!05 61!7 6!7 63! 67!75 4!56 61! 66!72 6!35 6!57 62!52 60!53 46!57 46!45 60!6 6!25 6!71 67!64 4!
a
/ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$
Diagrama de Dis8ersi:n 105 100 95
9ure=a
f(x) = 14.95x + 74.28 R² = 0.88
90 85 80 0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
; de 4idrocar
/espuesta %on los resultados obtenidos se puede asegurar ue la ecuación de la recta se puede utili&ar como una representación entre las variables ya ue tiene un coeficiente de correlación de 4!7?K entonces e#iste una relación lineal entre el porcentaje de "idrocarburo y la pure&a$ b
Encuentre el modelo matemático ue permite predecir el efecto de una variable sobre la otra$ Es confiable. /espuesta el modelo matemático ue permite predecir el efecto de una variable sobre la otra esK el modelo de regresión lineal simple
y ) 17!67# * 7!24$ Es confiable este
modelo porue tiene un coeficiente de correlación de 4!7?$ c
,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$
/espuesta El porcentaje de e#plicación es del 4$7?! este @ R2 ) afirma además ue el modelo e#plica la información y el valor de #r) .+/./() *;5./( ;/(5; confirma ue "ay la correlación entre las variables ? de Oidrocarburos y pure&a$ d
-%uál es el porcentaje de "idrocarburo cuando la pure&a del o#ígeno es igual a 51!7. Ienemos ue y)51!7 rempla&ando en y ) 17!67# * 7!24 51!7)17!67# * 7!24 51!7<7!24)17!67# <22!44U17!67)# <1!51)# Ienemos ue para una pure&a del o#ígeno igual a 51!7 obtenemos un porcentaje de <1!51 de "idrocarburo! lo cual es incorrecto ya ue los porcentajes de de Oidrocarburos son positivosK el modelo matemático lineal "allado plantea ue para un porcentaje #)0 @mínimoA tenemos una pure&a del 7!24 lo cual sobrepasa el nivel de pure&a pedido @51!7A! entonces el modelo reali&ado no es el más representativo para responder esta pregunta$ 2 El número de libras de vapor @yA consumidas mensualmente por una planta uímica! se relaciona con la temperatura ambiental promedio @en o LA$ 'ara el aZo 2015! se registraron los siguientes valores de temperatura y consumo anual$ 2014 R>/)*+ )<=*5)-*5 ? .+(-<+ 5=+*
Mes
Iemperatura
Ene$ Leb$ Mar$ =br$
21 27 2 7
%onsumo de vapor 145!6 217!7 244!0 727!47
May$ Sun$ Sul$ =go$ 8ep$ Fct$ Cov$ ,ic$
50 56 34 7 32 50 71 0
755 56 321!55 35!03 532!0 752!6 36!65 2!64
a$ /ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$
Diagrama de Dis8ersi:n 800 700 f(x) = 9.21x - 6.32 R² = 1
600 500
Consumo de Va8or 400 300 200 100 0 10
20
30
40
50
60
70
80
7em8eratura
El tipo de asociación entre las variables entre la temperatura y consumo de vapor es lineal! ya ue tiene un coeficiente de correlación de 0!6666$
b$ Encuentre el modelo matemático ue permite predecir el efecto de una variable sobre la otra$ Es confiable. El modelo es y ) 6!204# < 3!147! donde # representa la temperatura e y el consumo de vapor$
c$ ,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ El porcentaje de e#plicación del modelo y el grado de relación de las dos variables /: ) 0!6666 con un porcentaje de 66!66 apro#imado a 1! lo cual indica ue e#iste una buena relación lineal entre las variables$
$ 9os investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor$ 9a obesidad se mide como porcentaje sobre el peso ideal @#A$ 9a respuesta al dolor se mide utili&ando el umbral de reflejo de refle#ión nociceptiva @yA ue es una medida de sensación de pun&ada$ FbsDrvese ue ambas! + e (! son variables aleatorias
# @porcentaje de sobrepesoA 46 60 5 0 51 5 32 75 60 20
y @umbral de reflejo de fle#ión nociceptivaA 2 7 7!5 5!5 6 1 15 17
a /ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$
Diagrama de Dis8ersi:n 16 14 12 10
6me?o
f(x) = - 0.06x + 11.64 R² = 0.11
8 6 4 2 0 10
20
30
40
50
60
70
80
90
100
; de 5o
El tipo de asociación entre las variables no es lineal puesto ue el coeficiente de correlación es de 0!1115 muy bajo! es decir los valores tienen una alta dispersión$
b =juste un modelo matemático ue permita predecir el efecto de una variable c
sobre la otra$ Es confiable.
El modelo matemático es y ) <0!0326# * 11!372 donde # es el sobrepeso e y es el umbral de reflejo$ Este modelo no es confiable porue su coeficiente de correlación es de 0!1115$
d ,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ El porcentaje de e#plicación del modelo es de 11!15? y el grado de relación de las dos variables es de 0!1115 significativamente muy bajo$
e -%uál es el umbral de reflejo de fle#ión nociceptiva! cuando "ay un porcentaje de sobrepeso! de 50. Ienemos ue #)50! rempla&ando tenemos y ) <0!0326# * 11!372 y ) <0!0326@50A * 11!372 y ) 17!4 =sí el umbral de reflejo de fle#ión es de 17!4$ M5*5 ; =/;5* V/;+*/5
1$ El rendimiento del producto de un proceso uímico está relacionado con la temperatura de operación del proceso$ 8e desea establecer la relación ue e#iste entre la pure&a @yA del o#ígeno producido y el porcentaje de "idrocarburo @#A ue está presente en el condensador principal en un proceso de destilación! de acuerdo con los siguientes datos + @? de Oidro carburosA
( @'ure&aA
0!66 1!02 1!15 1!26 1!73 1!3 0!4 1!2 1!55 1!7 1!16 1!15 0!64 1!01 1!11 1!2
60!01 46!05 61!7 6!7 63! 67!75 4!56 61! 66!72 6!35 6!57 62!52 60!53 46!57 46!45 60!6
1!23 1!2 1!7 0!65
6!25 6!71 67!64 4!
a$ /ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$ b$ Encuentre el modelo matemático ue permite predecir el efecto de una variable sobre la otra$ Es confiable. c$ ,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ d$ -%uál es el porcentaje de "idrocarburo cuando la pure&a del o#ígeno es igual a 51!7. 8olución aA
<8u asociación es positiva$ bA el modelo matemático es y)17!67# * 7!24 / 2)0!47 es confiable porue se apro#ima al 1$ cA porcentaje de aplicación del modelo / 2)0!47 viene siendo de 4!7? el grado de relación viene siendo aceptable y en su correlación e e#elente a ue s apro#ima a 1$
r) √ R 2
2
r) √ 0,8774 r)0$6$ 2
dA y) a*b# y) 17!67#*7!24 ()17!67#*7!24 51!7)17!67+ *7!24 7!24<51!7)17!67+ 17!67+) 22!44 +)
22,883 14,947
+) 1!50672337 El porcentaje de "idrocarburo cuando la pure&a del o#ígeno es igual a 51!7 es de 1!50672337$
2014 R>/)*+ )<=*5)-*5 ? .+(-<+ 5=+*
Mes
Iemperatura
%onsumo de vapor
Ene$ Leb$ Mar$ =br$ May$ Sun$ Sul$ =go$ 8ep$ Fct$ Cov$ ,ic$
21 27 2 7 50 56 34 7 32 50 71 0
145!6 217!7 244!0 727!47 755 56 321!55 35!03 532!0 752!6 36!65 2!64
El número de libras de vapor @yA consumidas mensualmente por una planta uímica! se relaciona con la temperatura ambiental promedio @en o LA$ 'ara el aZo 2015! se registraron los siguientes valores de temperatura y consumo anual$
8olución
<=sociación positiva$ < El modelo matemático es y)6!204# T 3!147 apro#ima a 1$
/ 2)0!6666 es confiable porue se
r) √ R 2
2
r) √ 0,9999 2
r)0!666676664
$ 9os investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor$ 9a obesidad se mide como porcentaje sobre el peso ideal @#A$ 9a respuesta al dolor se mide utili&ando el umbral de reflejo de refle#ión nociceptiva @yA ue es una medida de sensación de pun&ada$ FbsDrvese ue ambas! + e (! son variables aleatorias
# @porcentaje y @umbral de reflejo de de sobrepesoA fle#ión nociceptivaA 46 60 5 0 51 5 32
2 7 7!5 5!5 6
75 60 20
1 15 17
f
/ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$ g =juste un modelo matemático ue permita predecir el efecto de una variable sobre la otra$ -Es confiable. " ,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ i -%uál es el umbral de reflejo de fle#ión nociceptiva! cuando "ay un porcentaje de sobrepeso! de 50. 8olución aA
<=sociación negativa BA Modelo matemático y)<0!0326# *11!372 / 2) 0!1115 es poco confiable porue su porcentaje es bajo$ cA porcentaje de aplicación del modelo / 2)0!1115 viene siendo 11!15? r) √ R 2
2
r) √ 0,1115 2
r)0$613151su correlación viene siendo mínima$ dA y) a*b# y)<0!0326# *11!372 y)<0!0326@50A*11!372 y) <$175*11!372 y)4!76 el umbral de reflejo de fle#ión nociceptiva! cuando "ay un porcentaje de sobrepeso! de 50 es de 4!76$ M=/= =C,/E= BY9= ESE/%%F8 1$ El rendimiento del producto de un proceso uímico está relacionado con la temperatura de operación del proceso$ 8e desea establecer la relación ue e#iste entre la pure&a @yA del o#ígeno producido y el porcentaje de "idrocarburo @#A ue está presente en el condensador principal en un proceso de destilación! de acuerdo con los siguientes datos + @? de Oidro carburosA
( @'ure&aA
0!66 1!02 1!15 1!26 1!73 1!3 0!4 1!2 1!55 1!7 1!16 1!15 0!64 1!01
60!01 46!05 61!7 6!7 63! 67!75 4!56 61! 66!72 6!35 6!57 62!52 60!53 46!57
1!11 1!2 1!23 1!2 1!7 0!65
46!45 60!6 6!25 6!71 67!64 4!
a$
/ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$
b$
Encuentre el modelo matemático ue permite predecir el efecto de una variable sobre la otra$ Es confiable. R=-)5: 8egún lo desarrollado en el modelo temático si es confiable ya ue nos da un resultado muy alto$ y ) 17!67# * 7!24 /: ) 0!47
c$
,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$
R=-)5: El /2 afirma ue el modelo e#plica el 4$7? de la información y el valor de r coeficiente de correlación lineal confirma además el grado de relación ? entre las variables$
d$ -%uál es el porcentaje de "idrocarburo cuando la pure&a del o#ígeno es igual a 51!7. R=-)5: El porcentaje de "idrocarburo cuando la pure&a del o#ígeno es igual a 51!7 es de 1!5
1$ El número de libras de vapor @yA consumidas mensualmente por una planta uímica! se relaciona con la temperatura ambiental promedio @en o LA$ 'ara el aZo 2015! se registraron los siguientes valores de temperatura y consumo anual$ 2014 R>/)*+ )<=*5)-*5 ? .+(-<+ 5=+*
Mes
Iemperatura
%onsumo de vapor
Ene$ Leb$ Mar$ =br$ May$ Sun$ Sul$ =go$ 8ep$ Fct$ Cov$ ,ic$
21 27 2 7 50 56 34 7 32 50 71 0
145!6 217!7 244!0 727!47 755 56 321!55 35!03 532!0 752!6 36!65 2!64
a$
/ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$
b$
Encuentre el modelo matemático ue permite predecir el efecto de una variable sobre la otra$ Es confiable. /espuesta El modelo temático es confiable porue el coeficiente de determinación /2 es apro#imadamente 1$
c$
,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables
/espuesta el coeficiente de determinación /2 e#plica el 66$66? de la información y el valor del coeficiente de correlación / confirma el grado de relación de la variables! ue es el 66$66?$
$ 9os investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor$ 9a obesidad se mide como porcentaje sobre el peso ideal @#A$ 9a respuesta al dolor se mide utili&ando el umbral de reflejo de refle#ión nociceptiva @yA ue es una medida de sensación de pun&ada$ FbsDrvese ue ambas! + e (! son variables aleatorias
# @porcentaje y @umbral de de reflejo de sobrepesoA fle#ión
nociceptivaA 46 60 5 0 51 5 32 75 60 20
2 7 7!5 5!5 6 1 15 17
a$ /ealice el diagrama de dispersión y determine el tipo de asociación entre las variables$
9a asociación de la variable no e#iste$ b$ =juste un modelo matemático ue permita predecir el efecto de una variable sobre la otra$ -Es confiable. /espuesta ,espuDs de reali&ar el ajuste me permite deducir ue el efecto Co es seguro debido a ue me da el ? de confiabilidad es bajo$
c$ ,etermine el porcentaje de e#plicación del modelo y el grado de relación de las dos variables$ /: ) 0!1115 El porcentaje de e#plicación del modelo es del 11!15? El valor de r coeficiente de correlación lineal confirma además el grado de relación !6? entre las variables d$ -%uál es el umbral de reflejo de fle#ión nociceptiva! cuando "ay un porcentaje de sobrepeso! de 50. y ) <0$0326>50 * 11$372 y ) 4$76 %uando el porcentaje de sobrepeso sea 50! el umbral de reflejo de fle#ión nociceptiva será 4!76$
A(>/ N+F;/ C5(5
ESE/%%F8 2. El rendimiento del producto de un proceso químico está relacionado con la temperatura de operacin del proceso. !e desea esta"lecer la relacin que existe entre la pure#a (y) del oxí$eno
producido
y el porcenta%e de
hidrocar"uro (x) que está presente en el condensador principal en un proceso de destilacin& de acuerdo con los si$uientes datos'
+ @? de Oidro carburosA 0!66 1!02 1!15 1!26 1!73
( @'ure&aA 60!01 46!05 61!7 6!7 63!
1!3 0!4 1!2 1!55 1!7 1!16 1!15 0!64 1!01 1!11 1!2 1!23 1!2 1!7 0!65
a.
67!75 4!56 61! 66!72 6!35 6!57 62!52 60!53 46!57 46!45 60!6 6!25 6!71 67!64 4!
Realice el dia$rama de dispersin y determine el tipo de asociacin entre las aria"les.
"dro!#ruros ure# 105 100 95 ;ure#
f(x) = 14.95x + 74.28 R² = 0.88
90 85 80 0.8
0.9
1
1.1
1.2
1.3
: de "dro!#ruros
1.4
1.5
1.6
= partir de los resultados obtenidos se podría decir ue tiene una tendencia positiva y una relación directa! el porcentaje de "idrocarburos es directamente proporcional a la pure&a$ El /2 ) 0!47 afirma ue la asociación entre las variables es fuerte< ".
Encuentre el modelo matemático que permite predecir el eecto de una aria"le so"re la otra. Es conia"le
El modelo matemático seria [
Ecuación$
y)17!67#*7!24 /: ) 0!47 [
/:) 0!4 es un coeficiente de determinación
[
,onde tenemos ue multiplicar 0!4 # 100) 4 seria un 4? de confiabilidad$
[
'ara pode sacar el coeficiente de correlación tenemos ue sacar la raí& cuadrada
del coeficiente de determinación donde esta raí& nos arroja un resultado de 0$6 [
Pue mediante el análisis del problema planteado se puede establecer ue la
ecuación reali&ada! ue el coeficiente de la determinación y el grado de correlación se puede identificar como confiable por los datos ue no entregados$ c.
+etermine el porcenta%e de explicacin del modelo y el $rado de relacin de las dos aria"les.
'odemos observar ue en la relación de las variables podemos determinar ue por el lado de coeficiente de correlación se puede destacar ue su valor debe de ser 0$60 y 1 para poder ser una variable confiable! en el problema presentando se puede ver ue por dic"o resultado es una variable confiable d$
-,uál es el porcenta%e de hidrocar"uro cuando la pure#a del oxí$eno es i$ual a -&/
+) "idrocarburos () pure&a Ecuación [
()17!67#*7!24
[
() 51$7
'or lo tanto tenemos ue /eempla&ar de esta forma 51$7) 17$67@#A * 7$24 51$7 T 7$24 ) 17$67 # @< 22$44A U 17$67 ) # /esultado +) < 1$5 /espuesta donde mediante el desarrollo de la ecuación se puede observar ue la pure&a del o#ígeno es igual a 51$7 y el porcentaje de "idrocarburo es <1$5?$ $
El n0mero de li"ras de apor (y) consumidas mensualmente por una planta química& se relaciona con la temperatura am"iental promedio (en
o
1). ara el a3o 24-& se
re$istraron los si$uientes alores de temperatura y consumo anual $
2014 R>/)*+ )<=*5)-*5 ? .+(-<+ 5=+*
Mes
Iemperatura
Ene$ Leb$ Mar$ =br$ May$ Sun$ Sul$ =go$ 8ep$ Fct$ Cov$ ,ic$
21 27 2 7 50 56 34 7 32 50 71 0
%onsumo de vapor 145!6 217!7 244!0 727!47 755 56 321!55 35!03 532!0 752!6 36!65 2!64
a) Realice el dia$rama de dispersin y determine el tipo de asociacin entre las aria"les.
emer#tur# !osumo de or 800 700 f(x) = 9.21x - 6.32 R² = 1
600 500
20
30
40
50
60
70
80
emer#tu r#
= partir de los resultados obtenidos se podría decir ue tiene una tendencia positiva y una relación directa! porue en la ecuación la recta es una buena estimación de la relación creciente entre dos variables! El /2 0! 6666 afirma ue la asociación entre las variables es fuerte Modelo matemático () a * b () 6$204# T 3$147
$ E(.-()* ; <+;+ <5)<)/.+ - =*) =*./* ; .)+ -(5 5*/5; +* ;5 +)*5 E .+(/5; El modelo matemático Ecuación$ () 6$204# T 3$147 /: ) coeficiente de determinación /:) 0$6666 En esta ecuación debemos de multiplicar 0!66 # 100) 66 seria un 66 ? • • • •
• •
de %onfiabilidad$ 'ara pode sacar el coeficiente de correlación tenemos ue sacar la raí& cuadrada del coeficiente de determinación donde esta raí& nos arroja un resultado de 0$66
8egún la información se puede decir ue es un 66? confiable! teniendo en cuenta el grado de relación! el coeficiente de determinación y la ecuación planteada$ .$ D)*( ; =+*.()5 =;/.5./( ; <+;+ ? ; >*5+ *;5./( ;5 + 5*/5;
'odemos observar ue en la relación de las variables podemos determinar ue por el lado de coeficiente de correlación se puede destacar ue su valor debe de ser 0$66 y 1 para poder ser una variable confiable! en el problema presentando se puede ver ue por dic"o resultado es una variable confiable$
/. 5os inesti$adores están estudiando la correlacin entre la o"esidad y la respuesta indiidual al dolor. 5a o"esidad se mide como porcenta%e so"re el peso ideal (x). 5a respuesta al dolor se mide utili#ando el um"ral de rele%o de relexin nociceptia (y) que es una medida de sensacin de pun#ada. 6"s7rese que am"as& X e Y& son aria"les aleatorias
# @porcentaje de sobrepesoA 46 60 5 0 51 5 32 75 60 20
y @umbral de reflejo de fle#ión nociceptivaA 2 7 7!5 5!5 6 1 15 17
a) Realice el dia$rama de dispersin y determine el tipo de asociacin entre las aria"les.
8orcenta?e de la oeo de >ex"? o!"!e8t")
20 15 8orcenta?e o
10 5
3"e#r (x (8or!et#e de sore8eso) 7 f(x) = - 0.06x +(umr# 11.64 de re>eo de R² = 0.11 >ex"? o!"!e8t"))
3"e#r (x (8or!et#e de sore8eso) 7 0 (umr# de re>eo de 0 50 100 >ex"? o!"!e8t")) 6M@/AL DE /ELEBO DE LEION NOCICE97IVA
En este tipo de diagrama se puede observar ue las variables es inversa debido a ue algunas aumentan y las otras a disminuir$ ") 8%uste un modelo matemático que permita predecir el eecto de una aria"le so"re la otra. 9Es conia"le
El modelo matemático es y)<0!0326#*11!372 /: ) 0!1115 en esta ecuación debemos multiplicar 0!11 # 100) 11 es decir un 11 ? •
•
de confiabilidad$ 'ara pode sacar el coeficiente de correlación tenemos ue sacar la raí& cuadrada del coeficiente de determinación donde esta raí& nos arroja un
•
resultado de 0$ ,e acuerdo al resultado del modelo matemático sobre el efecto de una variable a otra el resultado es muy bajo para obtener confiabilidad$
c) +etermine el porcenta%e de explicacin del modelo y el $rado de relacin de las dos aria"les