Estadística descriptiva Trabajo Tr abajo colaborativo momento 3
Gonzalo Gómez Javier calderón Roger garzón Henry espejo
Grupo 11!"#$
Tutor% Tu tor% Hugo Galvis pinzón
&niversidad abierta y a distancia 'unad( )ngeniería de sistemas *ogot+ ,c -1!
)ntroducción
La Estadística como la ciencia encargada de recolectar, ordenar, analizar y representar a un conjunt conjunto o de datos, datos, los proces procesos os de planeac planeación ión,, control control y toma toma de decisi decisione oness económi económicas, cas, administrativas y financieras, de una población o muestra, con el fin de describir apropiadamente las características de éste, se basan en resultados obtenidos mediante el análisis estadístico de los fenóm fenómeno enoss en ello elloss invo involu lucr crad ados os.. Se trab trabaj ajaa sobr sobree las las dife difere rent ntes es mane manera rass de agru agrupa parr la información obtenida mediante encuestas e investigaciones, aplicando la estadística descriptiva y de esta forma poder acer algunas conclusiones. En este este traba trabajo jo pret preten endem demos os enfr enfrent entar ar medi mediant antee una una seri seriee de prob proble lema mass plant plantea eados dos y solucionados de manera grupal, y asociados al tema específico visto en la !nidad, .a regresión y correlación lineal/ simple y la regresión y correlación lineal m0ltiple, así como el uso del diagrama de dispersión, mediante las coordenadas cartesianas y ecuaciones como operaciones matemáticas para mostrar la relación entre dos variables, calcular las rectas de regresión y coeficiente de correlación, para relacionar la información obtenida y concluir de acuerdo al problema planteado.
Justiicación 2
La oportunidad de tomar como referencia una problemática actual y general del diario vivir, permite crear una conciencia como futuros profesionales sobre los diferentes entornos "ue pueden afectar nuestro espacio al igual "ue la aplicación de los conocimientos "ue se ad"uieren en el transcurso de la carrera. #e esta forma mediante la realización de este trabajo del análisis de los $2actores ue inluyen en el rendimiento acad4mico de instituciones p0blicas y privadas del territorio nacional5, permite poner en práctica el conocimiento ad"uirido sobre los diferentes tipos de representación estadístico basados en el desarrollo de la unidad, aplicando las diferentes erramientas para agrupar la información.
6bjetivos 3
El objetivo general del trabajo colaborativo del momento %, es profundizar en los conceptos de definición de las reglas para la construcción e interpretación de los diagramas de dispersión y los métodos matemáticos a emplear para calcular de una manera adecuada el análisis estadístico lineal y comportamiento de la relación entre dos variables, cuando una de ellas permanece constante. &omprendiendo la regresión como un método "ue se emplea para pronosticar el valor de una variable en función de los valores dados de la otra' asimismo la correlación, "ue ay entre ellas, mediante los coeficientes de correlación, para determinar el grado de relación e(iste. )demás, como objetivo en este trabajo colaborativo es comprender mediante ejercicios y problemáticas planteadas en la guía del momento %, el concepto de la regresión m*ltiple, las variables dependientes e independientes, el sistema de ecuaciones resolutivo para allar el valor de las constantes. +odo ello con el fin de proseguir y aondar de manera autónoma y colaborativa, a partir de los conceptos ad"uiridos en la !nidad, y la resolución de los problemas planteados en la guía.
4
.aboratorio Ejercicios
. El rendimiento del producto de un proceso "uímico está relacionado con la temperatura de operación del proceso. Se desea establecer la relación "ue e(iste entre la pureza -y del o(ígeno producido y el porcentaje de idrocarburo -( "ue está presente en el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos/ 0 3 -1 de 2idro -4ureza carburos 5,66 ,57 ,9 ,76 ,:< ,%< 5,8; ,7% ,99 ,: ,6 ,9 5,68 ,5 , ,7 ,7< ,%7 ,:% 5,69
65,5 86,59 6,:% 6%,;: 6<,;% 6:,:9 8;,96 6,;; 66,:7 6%,<9 6%,9: 67,97 65,9< 86,9: 86,89 65,%6 6%,79 6%,: 6:,68 8;,%%
5
a7 Realice el diagrama de dispersión y determine el tipo de asociación entre las variables7 8olución%
a 105
100
95
f(x) = 14.95x + 74.28 R² = 0.88
Pureza 90
85
80 0.8
0.9
1
1.1
1.2
1.3
1.4
1.5
1.6
Hidrocarburos(%)
b7 Encuentre el modelo matem+tico ue permite predecir el eecto de una variable sobre la otra7 Es coniable9 8olución/ y = :,6:;( > ;:,78% ?@ = 5,8;;: c7 ,etermine el porcentaje de e:plicación del modelo y el grado de relación de las dos variables7 8olución/ &on los resultados obtenidos se puede asegurar "ue la ecuación de la recta no es muy 2
buena estimación de la relación entre las dos variables. El R afirma además "ue el modelo e(plica el 8 ;.;: 1 de la información y el valor de r coeficiente de correlación lineal confirma además el grado de relación -86 entre las variables/ 2idrocarburos y 4ureza. d7 ;1/39 8olución% &uando la pureza #el o(ígeno es igual a 6, % el porcentaje en idrocarburo es igual al , 771
6
7. El n*mero de libras de vapor -y consumidas mensualmente por una planta "uímica, se relaciona con la temperatura ambiental promedio -en o A. 4ara el aBo 75:, se registraron los siguientes valores de temperatura y consumo anual.
-1? Registros de temperatura y consumos de vapor7
Ces
+emperatura &onsumo de -oA vapor -Lb
Ene.
7
89,;6
Aeb.
7:
7:,:;
Car.
%7
788,5%
)br.
:;
:7:,8:
Cay.
95
:99
Dun.
96
9%6
Dul.
<8
<7,99
)go.
;:
<;9,5<
Sep.
<7
9<7,5%
ct.
95
:97,6%
Fov.
:
%<6,69
#ic.
%5
7;%,68
7
a7 Realice el diagrama de dispersión y determine el tipo de asociación entre las variables7
Solución/ 800 700 f(x) = 9.21x - 6.32 R² = 1
600 500 !"#um! $e %ap!r e" &'
400 300 200 100 0 10
20
30
40
50
60
70
80
Temperatura Fº
b7 @juste un modelo matem+tico ue permita predecir el eecto de una variable sobre la otra7 Es coniable9 8olución% y = 6,758;( G <,%8: ?@ = 5,6666 c7 ,etermine el porcentaje de e:plicación del modelo y el grado de relación de las dos variables7
8olución% &on los resultados obtenidos se puede asegurar "ue la ecuación de la recta es muy 2
buena estimación de la relación entre las dos variables. El R afirma además "ue el modelo e(plica el 6 6.66 1 de la información y el valor de r coeficiente de correlación lineal confirma además el grado de relación -%1 entre las variables/ +emperatura y &onsumo de Hapor.
d7 ;
8
%. Los investigadores están estudiando la correlación entre la obesidad y la respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal -(. La respuesta al dolor se mide utilizando el umbral de reflejo de refle(ión nociceptiva -y "ue es una medida de sensación de punzada. bsérvese "ue ambas, 0 e 3, son variables aleatorias
( -porcentaje de y -umbral de sobrepeso reflejo de fle(ión nociceptiva 86 65 ;9 %5 9 ;9 <7 :9 65 75
7 % : :,9 9,9 ; 6 % 9 :
a7 Realice el diagrama de dispersión y determine el tipo de asociación entre las variables7
Solución/
9
16 14 12 10
Umbral de Refejo de fexion nociceptiva
f(x) = - 0.06x + 11.64 R² = 0.11
8 6 4 2 0
0
20
40
60
80
100
% de Sobrepeso
b7 @juste un modelo matem+tico ue permita predecir el eecto de una variable sobre la otra7 Es coniable9 8olución%
y = G5,5<76( > ,<:7 ?@ = 5,9
c7 ,etermine el porcentaje de e:plicación del modelo y el grado de relación de las dos variables7 8olución% &on los resultados obtenidos se puede asegurar "ue la ecuación de la recta es muy 2
buena estimación de la relación entre las dos variables. El R afirma además "ue el modelo e(plica el .9 1 de la información y el valor de r coeficiente de correlación lineal confirma además el grado de relación -1 entre las variables/ 1 de Sobrepeso y !mbral de ?eflejo de fle(ión nociceptiva.
10
d7 ;
. Edad 7. Caterias aprobadas %. b7 Realizar el diagrama de dispersión de dic=as variables y determinar el tipo de asociación entre las variables
DI!R" D# DISP#RSI$ 12 10 8
"'#RIS PR$DS
f(x) = 0.17x + 7.11 R² = 0.03
6 4 2 0 6
7
8
9
10
11
12
#DD (&$S)
Respuesta% se puede observar "ue las variables tienen una tendencia lineal. c7 Encuentre el modelo matem+tico ue permite predecir el eecto de una variable sobre la otra7 Es coniable9
Respuesta/ En este caso se utiliza el método de la regresión lineal simple
3=I5 >I0>E 11
d7 ,etermine el porcentaje de e:plicación del modelo y el grado de relación de las dos variables7 Arocedemos =allar los valores de BCD y BEdad 'aos( 6 ; 8 5 8 6 ; 8 8 8 5 5 ; 8 8 6 6 6 5 8 8 8 6 8 5 6
Faterias @probadas 5 9 8 ; 8 6 ; 5 8 8 5 ; 5 5 ; 8 6 < < 5 ; 5 ; 6 8 6 8 5 8 8 5 6 8 5 6
:Cy 65 %9 <: ;5 <: 66 ;; 65 9< 88 85 9< 5 85 ;5 85 66 :7 << 85 9< 5 <% 8 ;7 65 <: 5 <: <: 65 ;7 88 55 8
B8 :6 <: 55 <: 7 7 8 :6 7 <: <: 7 <: 55 55 7 :6 7 <: <: 7 8 8 8 55 <: 7 <: <: 8 <: 7 55 8
y55 79 <: :6 <: 8 :6 55 <: <: 55 :6 55 55 :6 <: 8 %< %< 55 :6 55 :6 8 <: 8 <: 55 <: <: 55 8 <: 55 8 12
8 8 8 5 8 5 6 ; 5 8 8 5 6 6 6 6 ; 5 8 8 8 8 6 6 5 5 5 8 6 5 8 5 5 5 8 8 ; 6 ; 6
5 6 6 6 8 8 ; 6 8 8 ; ; 8 6 6 5 5 6 6 6 ; 8 5 5 < ; < 8 6 6 6 8 8 6 8 6 6 6 6 8 8 8 5
85 66 ;7 ;7 85 <: ;5 66 ;7 9< ;5 9< <: 65 8 65 65 8 <% 65 9< <: 85 85 9: <% <5 85 65 ;7 8 85 <: 65 85 65 ;7 66 ;7 9< ;7 9< 65
<: 7 <: <: 55 <: 55 7 8 :6 55 <: <: 55 8 8 8 8 :6 55 <: <: <: <: 8 8 55 55 55 <: 8 55 <: 55 55 55 <: 7 <: :6 8 :6 8
55 8 8 8 <: <: :6 8 <: <: :6 :6 <: 8 8 55 55 8 8 8 :6 <: 55 55 %< :6 %< <: 8 8 8 <: <: 8 <: 8 8 8 8 <: <: <: 55 13
5 8 5 5 5 6 6 5 6 6 6 6 6 6 5 6 6 8 8 5 6 5 5 5 6 5 8 556
5 5 5 6 5 6 5 6 5 5 5 < 6 6 5 6 8 ; 6 5 5 5 6 6 5 5 8 6 5 8 5 6 69%
55 5 85 65 55 66 55 8 65 5 55 9: 8 8 65 8 ;7 ;5 66 5 65 65 ;7 ;7 55 65 85 65 55 ;7 55 ;7 8;<;
55 7 <: 55 55 7 55 8 8 7 55 8 8 8 8 8 8 55 7 7 8 8 <: <: 55 8 55 55 55 8 55 <: 6:59
55 55 55 8 55 8 55 8 55 55 55 %< 8 8 55 8 <: :6 8 55 55 55 8 8 55 55 <: 8 55 <: 55 8 8:
T6T@.
Luego se alla $)J y $IJ I= 5 K -8;<;G-556K-69% 11C'>?!('1>(-
= 7;6%
= 5.<6%%;;%
1#?># 14
)= 69%G-5.<6%%;;%-556 = ;.59<;%55: 5 !na vez se aya encontrado tanto I y ) se procede a cambiar los valores de la formula 3=a>I( 3= ;.59<;%55: > 5.<6%%;;%0
y se compara el resultado con los valores "uedan la grafica los cual tienen "ue ser iguales y = 5,<6<( > ;,58 ?@ = 5,57;6 &EA&EF+E #E &??EL)&F Error estándar del estimado Se= 8: G ;.59<;%55: K -69% G5.<6%%;;% K-8;<; 5G7
Se==.%679:;<<6
e Relacionar la in*ormaci+n obtenida con el problema Se puede observar "ue los niBos "ue tiene una edad entre los ; y aBos tiene un promedio de materias aprobadas entre 9 y 5, los estudiantes "ue tienen mejor rendimiento son los niBos te tiene 5 materias aprobadas.
Regresión y
a7 )dentiicar una variable cuantitativa dependiente y varias variables )ndependientes del estudio de investigación7
15
-Hariable #ependiente Estrato -Hariable ndependiente F*mero de +e(tos Escolares "ue posee en la casa -Hariable ndependiente Caterias )probadas
b7 Realizar el diagrama de dispersión de dic=as variables. •
,iagrama 1
Estrato vs umero de te:tos
3.5 3 f(x) = 0.02x + 2.09 R² = 0.03
2.5 2 #trat! 1.5 1 0.5 0
0
5
10
15
20
25
30
35
40
45
º $e Text!#
,iagrama -
Estrato vs 0mero de materias aprobadas
16
3.5 3 2.5 f(x) = - 0.01x + 2.37 R² = 0
2 #tra! 1.5 1 0.5 0
4
5
6
7
8
9
10
11
º *atera# ,pr!'a$a #
c7 calcular la recta de regresión y el coeiciente de correlación para estadísticamente su relación7
probar
8olución% ,iagrama 1
y = 5,5<( > 7,586: ?@ = 5,57;8 &on los resultados obtenidos se puede asegurar "ue la ecuación de la recta es muy buena 2
estimación de la relación entre las dos variables. El R afirma además "ue el modelo e(plica el 57.;8 1 de la información y el valor de r coeficiente de correlación lineal confirma "ue no es coniable, además el grado de relación -%1 entre las variables/ FM de +e(tos "ue se posee en casa y Estrato.
17
8olución% ,iagrama -
y = G5,557( > 7,%; ?@ = 5,555%
&on los resultados obtenidos se puede asegurar "ue la ecuación de la recta no es muy buena 2
estimación de la relación entre las dos variables. El R afirma además "ue el modelo e(plica el 55.5% 1 de la información y el valor de r coeficiente de correlación lineal confirma "ue no es coniable, además el grado de relación -71 entre las variables/ FM de Caterias aprobadas y Estrato.
d7 Relacionar la inormación obtenida con el problema7 ,iagrama 1 Las personas encuestadas de estrato % poseen una cantidad de libros en casa de :5 como dato más alto, en cambio tenemos en el estrato se tiene en cantidad de libros de 75 como má(imo. ,iagrama - observamos "ue el estrato 7 tuvo como mínimo un total de materias aprobadas de 9, en cambio el estrato tuvo como mínimo un total de materias aprobadas de ;.
18
Cediante los ejercicios propuestos comprendimos "ue la regresión lineal simple y la regresión m*ltiple, analiza la relación de dos o más variables continuas, cuando analiza dos variables a esta se le conoce como variable bivariantes "ue pueden corresponder a variables cualitativas. La finalidad de una ecuación de regresión es la de estimar los valores de una variable con base en los valores conocidos de la otra. #el mismo modo, una ecuación de regresión e(plica los valores de una variable en términos de otra. Es decir, se puede intuir una relación de causa y efecto entre dos o más variables. El análisis de regresión *nicamente indica "ué relación matemática podría aber, de e(istir una. 4or otro lado, )l ajustar un modelo de regresión simple o m*ltiple a una nube de observaciones es importante disponer de alguna medida "ue permita medir la bondad del ajuste. Esto se consigue con los coeficientes de correlación. Si el modelo "ue se ajusta es un modelo de regresión lineal, a ? se le denomina coeficiente de correlación y representa el porcentaje de variabilidad de la 3 "ue e(plica el modelo de regresión.
19
*ibliograía
•
ttp/NNestadisticadescriptivaunad5559.blogspot.com.coN
•
ttps/NNOOO.youtube.comNOatcPv=plH0nQ(miQO
20