ESTADISTICA DESCRIPTIVA FASE 4 TRABAJO COLABORATIVO 3
PRESENTADO POR: MALKA MARTINLEYES MARTINLEYES FORERO: 55.312.807 55 .312.807 ELIZABET MADIEDO: ROBERTO PADILLA:
!R"PO: 100105A
T"TOR: DANIEL FRANCISCO CICA
"NIVERSIDAD "NIVERS IDAD NACIONAL ABIERTA Y A DISTANCIA DISTANCIA "NAD NOVIEMBRE# 201$.
INTROD"CCI%N. Por medio del siguiente trabajo se lleva a cabo la aplicación de conocimientos referentes a la regresión y determinación mediante la realización de ejercicios empleando las medidas de regresión y correlación lineal simple y múltiple con variables cuantitativas que tienen que ver con el caso estudiado a cerca de los accidentes de tránsito en la ciudad de Medellín.
J"STIFICACI%N.
En el presente informe se compararon datos cuantitativos para determinar su correlación y de sta manera analizarla! partiendo de una realidad que conocemos y entendemos se podrán formular propuestas encaminadas a la transformación de una realidad. Mediante un proceso gradual de clasificación! organización y tabulación de datos "emos analizado variables cualitativas y cuantitativas! lo que nos permite en ste momento elaborar un laboratorio apoyados en el análisis y fórmulas del programa Microsoft E#cel. $demás de todo esto el trabajo permite distintas perspectivas que complementan la entrega final! adquiriendo nuevas e#periencias a travs de la ejercitación de nuestras "abilidades interpretativas y argumentativas que se reúnen en torno a un tema común en donde prevalece la objetividad% todo esto a travs del trabajo colaborativo en donde asumiendo distintos roles potencializamos nuestras capacidades y aportamos desde nuestras e#periencias y fortalezas! con responsabilidad y compromiso.
OBJETIVOS.
!ENERAL &eterminar la correlación entre dos variables cuantitativas a travs de un laboratorio de regresión y correlación lineal
ESPEC&FICOS $nalizar datos agrupados para encontrar su relación Participar en la consolidación de un trabajo grupal que evidencie los aprendizajes adquiridos &eterminar la relación e#istente entre dos variables cuantitativas a travs de las "erramientas 'nfostat y E#cel
1. El rendimiento del producto de un proceso químico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación que existe entre la pureza (y) del oxígeno producido y el porcentaje de idrocarburo (x) que está presente en el condensador principal en un proceso de destilación! de acuerdo con los siguientes datos" # ($ de
&
%idro
('ureza)
#&
#
&
carburos) !**
*!1
+*!11
!*+
+11!+
1!,
+*!-
*!+
1!/
0*,*!*
1!1-
*1!/
1-!1/
1!,
+-*!/
1!,*
*!0/
1,!*,
1!
+0+0!,
1!/
*!0
1/1!,
,!1
*-!0
1!
*/!/-
1,+!/-
1!+-
+*,!+
!+0
+0!-*
0!,
!0
00,!
1!,
*1!00
11,!++
1!-1
+/,1!0
1!--
**!/,
1-/!1
,!/
*++/!
1!/
*!-
11!11
1!*
+00!
1!1*
*!-/
111!1
1!/,
+0/*!0
1!1-
*,!-,
1!/
1!,
+-!
!*+
*!-
++!0-
!*
+,1!1
1!1
+*!-/
*!//
1!,
+10!/
1!11
+*!+-
**!0
1!,
+0!
1!,
*!*
1+!/0
1!//
+10!/
1!,
*!,-
110!-
1!-*
+*-!
1!,
*!/1
1,!
1!0/
+0,-!/
1!/
*/!*+
1-!+,
,!/
*,1!,
!*-
+0!
+,!*
!*
0,!-
23,92
1843,21
2214,657
29,2892
170044,5
a. 2ealice el diagrama de dispersión y determine el tipo de asociación entre las 3ariables.
Pureza vs % hidrocarburos 105 100 95 Pureza
f(x) = 14.95x + 74.28 R² = 0.88
90 85 80 0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
% de Hidrocarburos
El tipo de asociación entre las 3ariables es de dispersión lineal ascendente con una correlación positi3a alta. b. Encuentre el modelo matemático que permite predecir el e4ecto de una 3ariable sobre la otra. Es con4iable5
&6 a 7 b # &6 1/!*/0# 7 0/!,+ 2 6 !+00/ 8a ecuación de la recta es con4iable porque el coe4iciente de la determinación (2,) está cercano a 1 y tiene una correlación excelente.
c. 9etermine el porcentaje de explicación del modelo y el grado de relación de las dos 3ariables.
Se alla a y b 23,92
¿ ¿
b6
20∗29,28−¿ 20∗2214,657 −( 23,92 ) ( 1843,21)
203,56
6
13,44
6 1-!1-
¿
a6
1843,21 −(15,15 ∗23,92 ) 20
1480,8
6
20
6 0/!/
:edia de # # 6 ,!*,;, 6 1!1*
:edia de y
& 6 1+/!,1;, 6 *,!1
8a ecuación de la recta está dada por" Y = 15,15X + 74,04
Error estándar de la recta"
Se 6
√
170044,5 −( 74,04 ) ( 1843,21 ) −(15,15 )( 2214,65 ) 20−2
6
√
21,29 18
6
Se alla el coe4iciente de determinación y el coe4iciente de correlación 170044,5
Sy6
20
− ( 92,16 ) 2
1,09
26 1 <
8,76
6 !+0 r 6
6 +.0
√ R ² 6 !*
√ 1,18 6 1.*
El grado de relación de las 3ariables es de !*
d. =>uál es el porcentaje de idrocarburo cuando la pureza del oxígeno es igual a *1!5
&6 1/!*/0# 7 0/!,+ &6 *1! 2eemplazando" *1! 6 1/!*/0# 7 0/!,+ 1/!*/0 # 7 0/!,+ 6 *1! 1/!*/0 # 6 *1! ? 0/!,+ 1/!*/0 # 6 10!10 17,017
#6
14,947
6 1!1/
>uando la pureza del oxígeno es igual a *1!! el porcentaje de idrocarburo es de 1!1/$
,. El n@mero de libras de 3apor (y) consumidas mensualmente por una planta química! se relaciona con la temperatura ambiental promedio (en o A). 'ara el aBo ,1-! se registraron los siguientes 3alores de temperatura y consumo anual.
2015 Registros de temperatura y cosumos de !apor" X
:es
Y
>onsum Cemperatura o de (oA) 3apor (8b)
#&
#
&
Ene. Aeb. :ar.
,1 ,/ ,
1+-!0* ,1/!/0 ,++!
Dbr.
/0
/,/!+/
:ay. un. ul.
- -* +
/--* ,1!--
Dgo.
0/
0-!
Sep.
,
-,!
Fct.
-
/-,!*
Go3.
/1
*!*-
9ic.
,0!*+
558
*1!-* -1/0!,+ *,1!* 1**0!/ + ,,0- 1+1 /,,-!/ /**-/!/ / /+/-!+ ,,/!1-10!* +,1*!/
265883 5062,63 ,86
//1 /-10!*, -0 /-**0!+ 1,/ +,*1!,+ ,,*
1+/+*
,- ,0,/+1 ,*-,1 /,/ +,/!/ -/0
/--0
+// 1-+00!0 ,- ,-1/-! 1+1
1+
*
0--!/
292 56
241649 3,37
a. 2ealice el diagrama de dispersión y determine el tipo de asociación entre las 3ariables.
2015 Reis!ros de !e"#era!ura $ co%su"os de va#or& 800 700
f(x) = 9.21x - 6.32 R² = 1
600 500
+o%su "o de va#or (,b* 400 300 200 100 0 10
20
30
40
50
60
70
80
'e"#era!ura ()*
El tipo de asociación entre las 3ariables es de dispersión lineal ascendente con una correlación positi3a alta.
b.
Djuste un modelo matemático que permita predecir el e4ecto de una 3ariable sobre la otra. Es con4iable5 y=9,2087#$6,3184 R% = 0,9999
8a ecuación de la recta es con4iable porque el coe4iciente de la determinación (2,) está cercano a 1 y tiene una correlación excelente.
c. 9etermine el porcentaje de explicación del modelo y el grado de relación de las dos 3ariables. Se alla a y b 558
¿ ¿
b6
12∗29256 −¿ 12∗265883,86 − ( 558 ) ( 5062,63 )
365658,78
6
39708
6 *!,1
¿ −76,55
5062,63 −( 9,21∗558 )
a6
12
6
12
6 <!/
:edia de # # 6 --+;1, 6 /!-
:edia de y
& 6 -,!;1, 6 /,1!++
8a ecuación de la recta está dada por" Y = 9,21X & 6,4
Error estándar de la recta"
Se 6
√
2416493,37 −( −6,4 ) ( 5062,63 )−( 9,21)( 265883,86 )
26 !** r 6
12−2
√ R ² 6 !**
6
√
103,8514 10
6 !,,
El grado de relación de las 3ariables es de !**
d. =>uál es el de consumo de 3apor cuando la temperatura es de 0 oA5
Y =9,2087X $ 6,3184 # 6 0 & 6 (*!,+0) (0) ? !1+/ &6 +!,*
Si la temperatura está en 0 oA el consumo de 3apor es de +!,*
. 8os in3estigadores están estudiando la correlación entre la obesidad y la respuesta indi3idual al dolor. 8a obesidad se mide como porcentaje sobre el peso ideal (x). 8a respuesta al dolor se mide utilizando el umbral de re4lejo de re4lexión nocicepti3a (y) que es una medida de sensación de punzada. FbsHr3ese que ambas! # e &! son 3ariables aleatorias
x y (umbral (porcentaj de re4lejo e de de 4lexión sobrepeso nocicepti3 ) a) +* * 0 -1
, / /!-!-
#&
#
&
10+ ,0 1,+!-
0*,1 +1 -,* ,1
/ * 1 ,!,!,-
0, /* , ,0
0 * 1 11/ 00
-,--+ -+1- ,+ //1!-
-,+// ,,+1 / /-1/1
/* +1 1* ,,1* 0**!-
a. 2ealice el diagrama de dispersión y determine el tipo de asociación entre las 3ariables.
% de sobre#eso -. u"bra, de re/e0o de /e1i2 ocice#!iva 16 14 12 10
f(x) = - 0.06x + 11.64
u"bra, de re/e0o de /e1i2 ocice#!iva*
8R² = 0.11 6 4 2 0 0 20 40 60 80 100
% de sobre#eso
b.
Djuste un modelo matemático que permita predecir el e4ecto de una 3ariable sobre la otra. Es con4iable5
&6 <!,*x 7 11!/, 2 6 !111-
8a ecuación de la recta no es muy con4iable porque el coe4iciente de la determinación (2,) está cercano a y tiene una correlación debil
c. 9etermine el porcentaje de explicación del modelo y el grado de relación de las dos 3ariables.
627
¿ ¿
b6
11∗ 45141 −¿ 11∗ 4461,5 −( 627 )( 77 )
797,5
6
103422
6 !0
¿ 77 −( 0,007∗627 )
a6
11
72,611
6
11
6 !1
:edia de # # 6 ,0;11 6 -0
:edia de y
& 6 00;11 6 0
8a ecuación de la recta está dada por" Y = 0,007X + 6,6
Error estándar de la recta"
Se 6
√
799,5 −( 6,6 ) (77 ) −( 0,007 )( 4461,5 ) 11−2
799,5
Sy6
11
− (7 ) 2
23,7
√
6 ,!0
5,37
26 1 <
6
6 !0+ r 6
√ R ² 6 !++
El grado de relación de las 3ariables es de !++
260,6 9
6 -!0
VEL OCI DA D (')
N" M ER O DE E d. =>uál es el umbral de re4lejo de 4lexión nocicepti3a! cuando ay un RI porcentaje de sobrepeso! de /5 DO S (Y) Y= $0,0629# + 11,642 (( ) *** + # 6 / (( * &6 =5 ,+ / , (( 0/ &6 <!,* (/) 7 11!/, ,, 0 // + &6 *!1, ( *-/ 0 ,, * (1 + >uando el porcentaje de sobrepeso es de /$ el umbral de 4lexión 0, nocicepti3a es de *!1, + ,) + *), ) (, 0 RE!RESI%N Y CORRELACI%N LINEAL SIMPLE + ,* / Identificar dos variables cuantitativas de la situación estudiada que puedan estar /+ relacionadas. ,, 0 * + DE ERIDOS N"MERO DEPENDIENTE Y // VELOCIDAD INDEPENDIENTE ' , + ,* (, * 0 ) / 0 ,) 1 (/ () ,) */ 1/ + ,( + (, // * ,, () + , 0 ,) + *), ) // (( +
3453+6. 7++3564'783575 64 96568834 20
15
/01(R* -( 2(R ,-*3
10
5
0 20
f(x) = 0.03x + 0.35 R² = 0.05 40
60
80
100
120
140
160
'()*+,-.-
Realizar el diagrama de dispersión de dichas variables y determinar el tipo de asociación entre las variables.
Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la otra. Es confiable?
y2 -!-))# 3 -!)01+
45 2 -!-0/)
2 6 coe4iciente de determinación6 /!- $ por lo tanto no es
Determine el porcentae de e!plicación del modelo y el grado de relación de las dos variables.
42 6oeficiente de correlación 42 4aíz cuadrada de -!-0/) 26 !,1 $ Go ay correlación
Relacionar la información obtenida con el problema.
En el caso estudiado referente a la accidentabilidad en la 6iudad de Medellín el grado de confiabilidad entre las variables 7elocidad y 8úmero de "eridos es de 0!/)9! lo cual significa
que no es confiable! no e#iste correlación entre ellas ya que su coeficiente corresponde a -!+*9! por lo tanto el número de "eridos no depende de la velocidad de los conductores.
RE!RESI%N Y CORRELACI%N LINEAL M*LTIPLE 'dentificar una variable cuantitativa dependiente y varias variables independientes del estudio de investigación. y #* #+ N"MERO VELOCID !RADOS DE AD DE M"ERTOS ALCOOL DEL COND"CT OR (( *!+ * *** )!* (( -!,-!( / -!+ (( -!* 0/ )!+ ,, *!0 // +!* * -!*-/ *!( ) ,, +!+ * (1 )!+ 0, *!* * +!0 ,) -!( *), *!( * (, -!* -!* ,* +!* /*!0 + ,, +!( * * )!) // +! * , -!( ,-!-
* * + + + * + * 0 + + + * * * * * * * * * * + * *
(, 0 / ,) (/ (,) 1/ ,( (, // ,, () , ,) *), // (( *-, (1 + 0 (1 1 (/ 0 /* / + ( // 0) (1 / //
+!1 -!( *!, -!*!* +!0 -!( -!+!1 *!) *!0 +!* -!, -!*!+ )!-!-!( *!1 +! *!* +!0 -!( *!( -!*!0 +!* -!, *!* +!0 -!*!( *!+ )!+! -!( -!)!*!* +!0
* * + * * + * * + ) * * + * + * + * * * + *
(1 /) ), (/*-/ ,1/ (( (1 ( ,) */// (( (, 1 1 ()) ,/ ,,* (+ 1 ( ,,,) (, 1 1 ,/ ((
-!*!( -!-!, -!) *!* +!0 -!( -!*!+ )!+! -!( *!1 *!* -!-!( *!( +!* -!, -!/ +! *!* +!0 -!( *!( *!0 +!* -!)!-!-!( *!1 *!0 -!+! -!( *!1 +!/ )!-
* * * + * * + * *
0/ ,* /,, * // , ( // 0) (1 -
-!( -!+! *!) +!* -!+!( )!+! -!( *!1 )!*!* +!0
Realizar el diagrama de dispersión de dichas variables.
R687+3:4; 4<96R= 56 9<6R'=. -s -68=+3575 4.5 4 3.5 3 2.5
4<69R= 56 9<6R'=.
2 1.5 1 0.5 0 20
40
60
80
100
-68=+3575
120
140
160
R().*/ /((R* -( (R* ' R.-* -( .)**) 4"5 4 3"5 3 2"5
/(R* -( (R*
2 1"5 1 0"5 0 0"0
0"5
1"0
1"5
2"0
2"5
3"0
R.-* -( .)**)
4esumen Estadísticas de la regresión
6oeficiente de correlación múltiple 6oeficiente de determinación 4:+ 4:+ ajustado Error típico ;bservaciones
-!+(0++(1,* -!-(1,*/,1 -!-/)1*/)*0 -!,+1*(+* *+-
$8<='>'> &E 7$4'$8?$ Grados de libertad
4egresión 4esiduos @
l
Promedio de Suma de los cuadrados cuadrados
F
Valor crítico de F
(!-0/001* )!-++)0/ + , 0!)1-/1( -!-*001*-1 ,-!/0(*1* -!(,,0+,1, ** / 1 ,(!/1*(((( **1
3"5
Coeficie ntes
I+,-/- /+ V'1 V'2
Error Estadísti Probabil Inferior Superior Inferior Superior típico co t idad 95% 95% 95!% 95!%
-!(1))1 -!)0/ *!11)1* -!-0,0, -!--0(, *!),+** -!--0(, *!),+**(0* (,, +*- /1 +)1 -/00 +)1 /00 B B B B -!--*, -!--0)+ -!0)+0 -!((/111 -!-*-0) -!--((1 -!-*-0) -!--((1 -1-, )),( *)( ) )*0, *))+ )*0, *))+ -!+*),) -!-0-0 +!,,0 -!--0(+) -!-(*, -!)(-0, -!-(*, -!)(-0, /(+ 11(1 (1/ 0* /0,) 1(0* /0,) 1(0*
y2 -!(1))13 AB-!--*,#*C3-!+*),)#+ y2 -!(1))1B-!--*,#*3-!+*),)#+ "alcular la recta de regresión y el coeficiente de correlación para probar estad#sticamente su relación.
4:+2-!-(1,D*-4:+2(!1,9 El modelo matemático es confiable en un (!1,9 42-!+( 8o "ay correlación entre las variables
Relacionar la información obtenida con el problema.
=os resultados estadísticos obtenidos indican que no "ay relación entre las variables número de muertos! grados de alco"ol y velocidad! esto lo podemos identificar mediante el modelo matemático de regresión múltiple! y2 -!(1))1B-!--*,#*3-!+*),)#+! a lo cual solo podemos obtener un (!1,9 de confiabilidad! teniendo en cuenta que el intervalo de correlación es
invalida o no "ay correlación alguna. Por consiguiente e claro decir que los muertos dentro de la accidentalidad en la ciudad de Medellín no dependieron de los grados de alco"ol ni la velocidad.
CONCL"SION >e puede concluir que se desarrolló con claridad todo el trabajo y se cumplieron cada uno de los lineamientos e#puestos por la universidad nacional abierta y a distancia F8$&! entendiendo cada uno de los procesos para llevar a cabo un desarrollo de una determina da investigación.
REFERENCIAS BIBLIO!R6FICAS •
Estadística descriptiva. 6ampus virtual F8$& "ttpGGcampus-).unad.edu.coGecbti-0GmodGforumGvieH.p"pIid2)1--
•
;rtegón Pava! Milton Jernando. $nálisis de las medidas univariantes "ttpsGGHHH.youtube.comGHatc"Iv2KtL+()qBB0
•
Neanete Ouitrago! 6ecilia 6árdenas. Jundamentos de estadística. Fniversidad >anto @omás! +-*)