REGRESIÓN LINEAL Y CORRELACIÓN “Un “Un vaso vaso medi edio vací vacío o de vino vino es tamb tambié ién n uno uno medi medio o llen lleno, o, pero pero una una mentira a medias , de ninguna manera es una media verdad” Jean Cocteau “Ent “Entre re afir afirma marr que que la cali calida dad d de un proceso es 50 buena o afirmar que es 50 50 mala, ala, se marc arca el futur uturo o del del empleo del gerente” !"#E
El método de los mínimos cuadrados Ha sido de interés en muchos problemas prácticos hallar la relación entre dos o más variables y medir el grado de tal relación. Cuando se presume una relac relación ión linea lineall entre entre dos dos varia variable bles, s, se utili utiliza za el método método de los mínimo mínimos s cuad cuadra rado dos s –deb –debid ido o al cien cientí tífi fico co alem alemán án art art !aus !auss, s, "### "###$" $"%& %&&$ &$ para para conseguir la línea recta o de regresión 'ue me(or pronostica los valores de una variable a partir de la otra y se emplea el coeficiente de correlación de )earson para medir la fuerza de la relación entre las dos variables. *upongamos 'ue 'ueremos hallar una relación entre el punta(e obtenido en la componente de +atemáticas del eamen de admisión de la -niversidad y el punta(e –calificación definitiva$ obtenida al finalizar el curso de matemáticas. )ara esto dispone de la información siguiente /studiante 0o. " 4 1 5 2 3 # % 2 "6
)unta(e matemático al 12 51 4" 35 5# 4% #& 15 &4
18
)unta(e al finalizar 3& #% &4 %4 4& %2 #1 2% &3 #&
7la tabla anterior anterior se le asocia un gráfico de puntos puntos denominado denominado 8diagrama de dispersión9.
/ste diagrama da apoyo intuitivo a la idea de 'ue eiste una relación lineal entre : y ;.
/n donde ? y @ son constantes AdesconocidasB, : es el punta(e matemático en el eamen de admisión AconocidoB 'ue permitiría hacer un pronóstico para el valor de ;, el punta(e en matemáticas, y > es una variable aleatoria, acerca de la cual haremos la hipótesis siguiente
( ) = 6, D ( > ) = δ
/>
4
;
(
CD >F, > E
) =6
para todo : y todo i ≠ (
/s decir, el valor esperado y la varianza de > no dependen del valor de :. 7sí /( ; ) = @: + ?
y
D ( ;) = G 4
bservemos 'ue a'uí : no es una variable aleatoria. *upongamos 'ue se escogen n valores de :, ", 4,, n. )ara cada i sea y i una observación independiente de la variable aleatoria ;, por tanto A ", y"B,, An, ynB puede
19
considerarse como una muestra aleatoria de la variable aleatoria I para los valores A ", 4,, nB dados.
e!inici"n# *upóngase 'ue tenemos /A;BJ@:K? con el significado previo. *ea A", y"B,,An, ynB una muestra aleatoria de ;. Los estimadores de 8mínimos cuadrados9 de ; son los valores de ? y @ 'ue minimizan a n
∑ [ ; $ ( @: + ?) ]
2
=
i 1
/ste criterio se puede interpretar intuitivamente en la figura siguiente. )ara cada par A i, y iB calculamos la diferencia entre y i, el valor observado, y @: iK?, el valor esperado. )uesto 'ue sólo nos interesa la magnitud de esta diferencia, se eleva al cuadrado y sumamos todas las diferencias, la línea buscada es a'uella para la cual esta suma es más pe'ueMa.
7 fin de obtener los estimadores pedidos para ? y @ procedemos como sigue *ea *C/( ?,@ ) = [ ; $ ( @: + ?) ] ecuaciones
2
. )ara minimizar a *C/ debemos resolver las
∂ ( *C/) ∂ ( *C/ ) = 'ue conducen a un sistema de dos ecuaciones ∂? ∂@
lineales con incógnitas ? y @ de fácil solución por determinantes, por e(emplo, denotando por a y b las soluciones óptimas se encuentra 'ue n
∑ y ( − ) b= ∑ ( − ) i
i
i =" n
y
4
i
i ="
%$a = y − b,
/l estimador del parámetro G 4 no pude obtenerse por los métodos anteriores. /stablecemos simplemente 'ue la estimación mediante los mínimos cuadrados está dada por el estadígrafo *
4
=
"
n
∑ [ ; $ (@: + ?) ] n−4 i="
4
=
*C/ n$4
E&ercicio 1' /stime la línea de regrsión de mínimos cuadrados con los datos de la página ". *i un estudiante obtiene 36N en la adisión,
O(ser)aci"n' a y b son funciones lineales de los valores maestrales y ", y4,, ynO basta visualizar las soluciones óptimas antes mencionadas.
E&ercicio $' Pecordando 'ue a y b son estimaciones puntuales de ? y @ 'ue dependen de la muestra observada de tamaMo n, 'ue pueden a su vez considerarse como valores de las variables aleatorias 7 y Q , demuestre 'ue /A7B = ? n
∑ D( 7 ) = n∑ ( − )
y
4
( )
i
i ="
n
G4
/( Q ) = @
DQ = y
4
G4 n
∑( ,
i
−,
)
4
i="
i
i="
O(ser)aciones adicionales /n el e(ercicio 4 se prueba 'ue 7 y Q son estimadores insesgados de ? y @, pero hay más aRn, son también los más eficientes. La prueba de esto es un caso particular del 8Ieorema general de !auss$+arSov9, 'ue establece 'ue ba(o ciertas condiciones los estimadores de mínimos cuadrados y los estimadores más eficientes son siempre los mismos.
$1
/l método de los mínimos cuadrados puede aplicarse a modelos no lineales por e(emplo si /( ; ) = γ :4 + @: + ? , podemos estimar ?, @ y γ de manera 'ue n
∑ [y − ( γ : i
4
+ @: + ?)]
4
"
*ea minimizada. *i se impone la hipótesis adicional de 'ue la variable aleatoria > sea normal nA>, 6, G4B se podría utilizar una estimación por máima verosimilitud.
E&ercicio *' )robar 'ue si 4
n
* ::
n
= ∑ ( i − ) = ∑ 4
i="
n ∑ i 4 " − i
n
"
4
n
* ;;
n
= ∑ ( yi − y ) = ∑ 4
i ="
n ∑ i 4 " −
"
* :;
i
n
n
n
i ="
"
= ∑ ( i − )( yi − y ) = ∑ i yi
n n ∑ i ∑ yi − " " n
/ntonces la estimaci"n +untual de , se puede epresar así b = * :; * ::
; la estimaci"n +untual de -$ así s4 =
*;; − b*:; n−4
)ruebe también 'ue s 4 es una estimación insesgada de G 4.
0ota La estimación puntual de @ es mas cómoda de resolver en el e(ercicio ".
bsérvese 'ue s en este modelo mide la dispersión de los puntos maestrales alrededor de la recta de mínimos cuadrados estimada. )or lo tanto, puede
$$
esperarse empíricamente 'ue el 2&N se encuentren a una distancia menor de 4s de la recta de mínimos cuadrados.
E&ercicio .' Calcule una estimación puntual de G 4, con los datos de los punta(es.
E&ercicio /' /stamos familiarizados con el hecho de 'ue la temperatura del aire disminuye con la altura del lugar, los datos siguientes refuerzan la idea y hacen presumir una relación lineal entre la temperatura ; y la altura : observada en ciertos puntos del Dalle de 7burrá al amanecer. : altura en metros "354 4454 "666 21# ""#% "&64 4651 "&64 "361 2#& "&52 "633 "52& "&6% "666 "666 "2#" 2%4 ""#1 26# "#26 4"62 "5"6 "### 2"6
; temperatura en UC "% "4 "2 4" "% "3 6 "5 "6 "3 "& 46 "& "% 41 "2 "2 41 "% 4" "4 "" "5 3 "2
a0 !rafi'ue el diagrama de dispersión.
$*
(0 /stime la línea de mínimos cuadrados. c0 *i usted se encontrara al amanecer, a 4666 m en inmediaciones de este Dalle, <'ué temperatura esperaría soportar=
d0 /stime G4. Coe!iciente de correlaci"n 7lgunas veces es deseable tener un indicador del grado de intensidad o fuerza de la relación lineal entre dos variables ; e : 'ue sea independiente de sus respectivas escalas de medición. 7 este indicador se le denomina coeficiente de correlación lineal entre : e ;. /l estadígrafo comRnmente utilizado se llama coeficiente de correlación del producto momento de )earson.
e!iniciones' *ea A:, ;B una variable aleatoria bidimensional, definimos ) :; el coe!iciente de correlaci"n entre : e ; como sigue p ,y =
[
][
]
/{ : − /( :) ; − /( ; ) } D ( :) D ( ;)
/l coe!iciente de correlaci"n muestral de 2earson es un estadígrafo para ):; y se define así V=
*,y *,,*yy
=b
O(ser)aciones /l signo de V es igual al de b así *i VW6 la relación será lineal creciente. *i VW6 la relación será lineal decreciente. *i VJ6 no hay relación lineal. *i
V ≅ " la
relación lineal es muy buena.
*i V ≅ 6 la relación lineal es muy débil.
$.
*,, *yy
La ausencia de relación lineal entre dos variables no implica 'ue sean independientes, a lo me(or eiste otra relación no lineal.
Límites de con!ian3a 4 +rue(as de si5ni!icaci"n en la re5resi"n lineal 7demás de la estimación de la línea de regresión entre : e ; para efectuar pronósticos, al estudioso le es muy Rtil poder hacer inferencia acerca de la pendiente b del intercepto a y de la validez general de la línea de regresión calculada. /s importante saber 'ué tan bien estima b a @ o 'ue tan bien pronostica la recta estimada el valor medio de ;. 7sumiendo 'ue Q es una variable aleatoria normal 'ue segRn el e(ercicio 4 posee media /AQB J @
y varianza DAQB J G 4 * :: , sabiendo también 'ue
( n − 4)*4 G 4 es unna variable chi$cuadrado con An$4B grados de libertad, concluimos por un teorema anterior 'ue el estadígrafo I
=
(Q − @)
G
*
*G
=
Q−@ *
*
Iiene una distribución t con An$4B grados de libertad lo 'ue nos permite establecer el siguiente intervalo de confianza para la pendiente @. -n inter)alo de con!ian3a al 6170 +ara la +endiente , de la línea de regresión /( ; ) = ?" + @: es t ? 4s
b ±
*,,
Xonde t?Y4 es un valor de la variable aleatoria t de forma 'ue )( I < t ? 4 ) =
∞
∫ f ( t ) dt = ? 4
t?
4
Con n$4 grados de libertad.
$/
E&ercicio : a) Calcule el coeficiente de )earson para los datos de los punta(es y halle
un intervalo de confianza al 2&N para @ en la línea de regresión asociada. Comente.
(0 Fgual 'ue en aB, pero con los datos del e(ercicio &. 7sociado al intervalo de confianza previo se puede diseMar una dócima para la pendiente @ con la siguiente metodología
10 H @ J @ $0 Ha @Z @ ó @ W @ ó @
≠ @
Auna o dos colasB.
*0 *eleccionar el nivel de significación ? y determinar la región crítica o región de rechazo para
HoO PC = I . I < $tα ó I > t? ó I < $t v =n$ 4
α
2
∧
I>t
α
2
.0 Calcular t =
b $ @6 s
*
/0 *i t cae en PC concluir 'ue se rechaza H O si t no cae en PC, no se puede rechazar H , o sea 'ue @ no difiere significativamente de @ .
E&em+lo# -sando los datos de los punta(es determinar si eiste una relación lineal entre los punta(es en la admisión y en matemáticas sabiendo 'ue b 6.##.
10 H @ J 6 Ano hay relación linealB $0 Ha @
≠ @
*0 ? J &N
Aeiste alguna relación linealB
I I < −t6.64& ∨ I > t6.64& PC = v = % grados de libertad
$:
≅
.0
b $ @6
6.## = t= = 5.1## > t 6.64& = 4.163 s *,, %.# 4.5#5 v =%
/0 Pechazamos H es decir @ difiere significativamente de 6. Xe una manera análoga, debido a 'ue el coeficiente de )earson V se anula cuando la pendiente b se anula, segRn la epresión
V = b * ,, * yy
, el
contraste de hipótesis para @ lo es también para p y el coeficiente de correlación.
E&ercicio ;' -sando los datos del e(ercicio &, determinar si eiste una relación lineal entre la altura y la temperatura.
/l intervalo de confianza y la prueba de hipótesis para el intercepto ? " de la linea de regresión parte también de 'ue la variable aleatoria 7 está distribuida normalmente con media /A7B J ? y )arian3a n
D ( 7 )
=
G 4 ∑ i
4
"
ns
7 $ ?"
I=
n
s
∑
4 i
ns
Iiene una distribución t con An$4B grados de libertad.
"
Iiene una distribución t con An$4B grados de libertad. /sto posibilita el siguiente inter)alo de con!ian3a +ara el interce+to 1 de la línea de regresión /( ; ) = ?" + @: es n
a ± t ? 4s
∑,
4 i
"
Xonde
t ?Y4 v =n − 4
tiene el significado usual.
$;
ns,,
*iguiendo la misma metodología de la dócima para la pendiente @ se puede diseMar una para el intercepto ? ".
E&ercicio 8. -sando los datos del e(ercicio & a0
Halle un intervalo de confianza al 2&N para el intercepto ? ".
(0
Contraste con el nivel de significación del "6N las hipótesis
H ?" J & Ha ?" W &
E&ercicio 9' -sando los datos de la página " a0 Hallar un intervalo de confianza al 2&N para el intercepto ? ". (0 Contraste con el nivel de significación del "6N las hipótesis H ?" J 56 Ha ?"
≠ 56
Inter)alo de con!ian3a +ara la res+uesta media a un ni)el !i&o de entrada <% *abemos 'ue /A;B J ?K@: y 'ue si :J: 6 entonces /( ; :o) = ? + @:o es [ = 7 + Q:o así estimada mediante el estadígrafo ;
( )
[ o = /( 7 + Q:o) = ? + @:o = /( ; :o) /;
[ 6 es el estadígrafo insesgado para /( ; :o ) . Xonde ;
Con el estadígrafo I =
[ o − /( ; ;o) ; s (" n)
+ [( 6 − )
4
s
] , 'ue tiene una distribución t con
An$4B grados de libertad establecemos -n intervalo al A"$?B"66N de confianza para la respuesta media /( ; :o ) está dada por [ o ± t α 4 s " n + ( 6 − ) 4 s I=;
$8
Con el significado usual para
t ?Y4 n−4
.
E&em+lo# Hallar un intervalo de confianza al 2&N para el valor esperado de la calificación definitiva de matemáticas si en la admisión obtuvo &6. 7'uí 6 J &6 entonces [ /( ; :o) = ?" + @, o = ; [ = 56.#% + 6.## × &6 = #2.4% ;
; sustituyendo en la fórmula para el intervalo de confianza obtenemos
[ ±t s ; ?4 n−4
" n
+
#2.4% ± ( t6.64& ) %.# vB =% . . . 4.163 #2.4% ± 3.&&
(,
6
−,
)
4
s ,,
" ( &6 − 53) "6
+
4
4.5#5
o sea
#4.#1 ≤ /( ; &6) ≤ %&.%1
/n el 2&N de las veces cuando los estudiantes obtienen un punta(e &6 en la admisión se espera obtendrán un punta(e entre #4.#1 y %&.%1 en matemáticas.
E&ercicio 1%' Halle un intervalo de confianza al 26N para la temperatura esperada a una altura de 4666 metros con los datos del e(ercicio &.
$9
Soluci"n con el +ro5rama SAS +ara el e&ercicio / de la +=5ina $$ Q* 7LI-P7 I/+) ) *IX) L2&+ -2&+ L2& -2& " "354 "% "5,5"23 6,3211" "4,2%&1 "&,%&1% %.6"25 46.%"2# 4 4454 "4 2,3255 ",132%2 3,%363 "4.&4%4 4.%515 "3.&5&5 1 "666 "2 "2,5#&& 6,%&315 "#,#656 4".4532 "4.22"5 4&.2&2& 5 21# 4" "2,2#"3 6,245%3 "%,6&%5 4".%%5% "1.55#5 43.52&% & ""#% "% "%,6#1# 6,325&5 "3,3132 "2.&"65 "".3#42 45.5#55 3 "&64 "3 "&,&44" 6,3"#25 "5,451% "3.%665 2."&&6 4".%%2" # 4651 2 "",43"3 ",""165 %,2&2" "1.&35" 5.3"4% "#.2"65 % "&64 "5 "&,&44" 6,3"#25 "5,451% "3.%665 2."&&6 4".%%2" 2 "361 "6 "5,#43# 6,333#1 "1,15#& "3."6&2 %.11%3 4".""5% "6 2#& "3 "2,3#45 6,%%422 "#,%5&% 4".522 "1."#16 43."#"# "" "&52 "& "&,"&46 6,313#3 "1,%15# "3.5324 %.###6 4".&432 "4 "633 46 "%,2& 6,#%222 "#,14"& 46.&%22 "4.&6#% 4&.5613 "1 "52& "& "&,#4 6,3"# "5,1615 "3.%&" 2.4""" 4".2515 "5 "&6% "% "&,5#5% 6,3"225 "5,"245 "3.# 2."6#6 4".%54# "& "666 41 "2,5#&& 6,%&315 "#,#656 4".4532 "4.22"5 4&.2&2& "3 "666 "2 "2,5#&& 6,%&315 "#,#656 4".4532 "4.22"5 4&.2&2& "# "2#" "2 "",%4%3 ",64&"" 2,#6%6 "1.2524 &.4563 "%.5"33 "% 2%4 41 "2,3"#4 6,%#&5& "#,%634 4".54%4 "1."444 43.""44 "2 ""#1 "% "%,""1" 6,32%45 "3,33%3 "2.&& "".#"63 45.&"&& 46 26# 4" 46,46#2 6,2&%23 "%,445" 44."2"3 "1.3343 43.#&1" 4" "#26 "4 "1,4&56 6,%41#" "",&&66 "5.2&% 3.#%%" "2.#466 44 1"62 "" "6,#5"% ","2316 %,43#" "1.4"33 5.61"5 "#.5&44 41 "5"6 "5 "3,4533 6,36165 "5,222" "#.525" 2.%% 44.36#&
*%
P 1.&%655 4.16&36 $6.5# ".64%12 $6.6#13% 6.5##2" "."3"&% ".&4462 5.#4332 1.3#41& 6."&"2& ".65516 6.#44 4.&4&"3 1.&45&1 6.5#&5# #."#"5" 1.1%4## 6.""16& 6.#24"1 ".4&564 6.4&%"2 4.45334
H 6.6&4%# 6.4635" 6.6%633 6.62562 6.6&163 6.65466 6."134# 6.65466 6.65%26 6.6% 6.65536 6.63%3& 6.65"#" 6.6544# 6.6%633 6.6%633 6.""&&2 6.6%516 6.6&131 6."6""& 6.6#531 6."6 6.65666
)P/** 1.#%614 4.26&16 6.&"#"2 "."1&"2 6.6##%6 6.52%%3 4.3"%1# ".&"%%4 5.2323% 5.6"3%1 6."&26& "."4"4# 6.36415 4.31334 1.%11#3 6.&"#"2 %."6%33 1.32546 6.""253 6.%%"4# ".1&&"& 6.16351 4.15644
*IXF 1.621%# 1.1""#2 1."1555 1."&1%& 1.625"& 1.6##%3 1.4"56# 1.6##%3 1.6%%61 1."5"%4 1.6%"32 1.""323 1.6##51 1.6#%43 1."1555 1."1555 1."%532 1."12#" 1.6252% 1."356" 1."4&3% 1.451%5 1.6#526
45 4&
"### 2"6
3 "2
"1,1&35 6,%"6#1 "",3#21 "&.611& 46,"%54 6,2&&&" "%,46#3 44."362
3.%2#& "1.35"
*1
"2.%"&1 43.#441
#.1&312 "."%545
6.6#416 #.24232 1."444% 6."6651 ".1"35& 1."342#
2RO>LE?AS SELECCIONAOS /n los siguientes problemas
aB
Xibu(e el diagrama de dispersión y observe si eiste una relación lineal entre las variables.
bB
Xetermine los valores de
α y
β
para la curva de regresión lineal, e
interprete de acuerdo al conteto del problema. cB
Calcule a
s4 ,
e interprete el significado de s de acuerdo al conteto del
problema.
α . Fnterprete.
dB
Xetermine el intervalo de confianza del 23N para
eB
Xetermine un intervalo de confianza del 2&N para β . Fnterprete.
fB
Xetermine un valor esperado de la variable respuesta de acuerdo a la línea de regresión en un nivel de la variable eplicativa 'ue sea diferente de los valores dados. Calcule el intervalo de confianza e interprete.
gB
Xetermine un valor esperado para una sola respuesta en el mismo punto de la variable eplicativa del punto anterior y calcule el intervalo de confianza e interprete.
hB
)ruebe una hipótesis con respecto a β . Fnterprete en el conteto del problema.
iB
)ruebe una hipótesis con respecto a una respuesta media y con respecto a una sola respuesta. Fnterprete en el conteto del problema.
(B
)ruebe la hipótesis si la asociación lineal p es significativa entre las variables : y ;.
".
*e realizó una prueba para determinar la relación entre el contenido de fósforo en una solución y la temperatura de cristalización. Los datos son los siguientes
Cantidad de ) AgYlB "." 4.1 1.4 5.1 &.5 3.3 #.% %.%
4.
Iemperatura de cristalización
( °C ) ".# 6.5 6.4 "." 4.1 1." 5.4 &.1
*e desarrolló un método analítico para el benzoilmetronidazol y desean saber si eiste linealidad en el método. *e agrega una cantidad conocida de benzoilmetronidazol y se determina la cantidad de activo con el método analítico desarrollado. *e obtienen los siguientes resultados
Qenzoilmetronidazol AmgB 6.& 6.# ".6 ".1 ".&
7ctivo AmgB 6.&"6 6.3%# ".666 ".116 ".&"6
1.
*e obtuvieron los siguientes datos sobre la cantidad de bromuro de potasio 'ue se puede disolver en "66 gramos de agua, a distintas temperaturas.
°C g
5.
6 &4
"6 36
46 35
16 #1
56 #3
&6 %"
Los siguientes datos representan el efecto del tiempo en la pérdida de hidrógeno en muestras de acero almacenadas a una temperatura de 46 °C .
Iiempo t AhB " 4 3 "# 16
&.
Contenido de H perdido AppmB % # 3 & 5
*e hicieron determinaciones de la cantidad AppmB de un compuesto soluble presente a dos diferentes profundidades en cierto nRmero de suelos.
"4 plg. 45 %5 "1 "1 5% 3" ""4
46 plg. 46 "61 "3 46 %3 13 &1
"4 plg. 33 1" 51 "2 # &6 #4
46 plg. %5 16 34 43 4" #1 %1
3.
*e realizó una prueba para determinar la relación entre la concentración de conservador en fase acuosa y la concentración en fase oleosa para la distribución de clorocrezol. Los resultados obtenidos son
Conc. fase acuosa AgYlB 6.4 6.5 6.3 ".6 6.% 6.1 6.& 6.#
Conc. fase oleosa AgYlB 6.5 6.# ".6 ".3 ".1 6.& 6.% ".4
#. -na muestra de "4 ho(as fue recogida aleatoriamente de un árbol y la longitud y el ancho de cada ho(a fueron medidos con una precisión de un milímetro. Los datos se muestran a continuación
Ho(a " 4 1 5 & 3 # % 2 "6 "" "4
Longitud 1& 4" 4& 1& 43 56 1& 56 4& 54 41 4&
7ncho && 55 53 36 && 35 3% &" 3" 53 55
%.
*e ha establecido 'ue la presión de vapor del /ugenol AmmHgB depende de la temperatura A °C B. La siguiente tabla muestra la relación entre estas dos variables.
IA °C B \AmmHgB
#%.5 "
"6%." &
"41.6 "6
"1%.# 46
"&&.% 56
"3#.1 36
"%4.4 "66
465.# 466
44%.1 566
4&1.& #36
2. *e realiza un eperimento para observar el efecto de un aumento en la temperatura sobre la potencia de un antibiótico . Ires porciones de " onza del antibiótico se almacenaron durante períodos de tiempo iguales, a cada una de las siguientes temperaturas 16 ° , &6 ° , #6 ° , 26 ° . Las potencias observadas a las temperaturas correspondientes fueron
)otencia, y Iemperatura, aB
1%, 51, 42 16°
14, 43, 11 &6°
"2, 4#, 41 #6 °
"5, "2, 4" 26°
/ncuentre la recta de mínimos cuadrados apropiada para estos datos.
bB
Pepresente los puntos y la recta, como verificación de sus cálculos.
cB
Calcule
s4 .
"6. *e realiza un eperimento psicológico para estudiar la relación entre el tiempo necesario para 'ue un ser humano tome una decisión y el nRmero de alternativas 'ue se le presentan.
La situación presentada a los
participantes re'uiere la clasificación de un ob(eto en una de dos o más categorías, similar a la situación 'ue se encontraría al clasificar un
producto de acuerdo a su calidad Ade primera, segunda, etc.B.
Cinco
individuos clasificaron un artículo en dos categorías posibles. tros cinco clasificaron un artículo en 1 categorías posibles y otros cinco en 5 categorías posibles. 7 cada uno de los "& participantes se le tomó el tiempo necesario para llegar a una decisión.
Iiempo de reacción y AsegB 0Rmero de alternativas, aB
", 1, 1, 4, 5 4
4, 5, 1, 5, & 1
&, 3, &, #, 5 5
/ncuentre la recta de mínimos cuadrados apropiada para estos datos.
bB
Pepresente los puntos y la recta para verificar sus cálculos.
cB
Calcule
s4 .
"". *e realiza un eperimento para investigar el efecto de un programa de entrenamiento sobre el tiempo 'ue le toma a un estudiante universitario típico, correr los "66 metros planos. 0ueve estudiantes se sometieron al programa. Xespués de dos semanas, se midió la reducción y del tiempo para correr los "66 metros planos a tres estudiantes. Xespués de cuatro semanas se hizo lo mismo para otros tres estudiantes.
Xespués de
cuatro semanas se hizo lo mismo para otros tres estudiantes y después de seis semanas de entrenamiento para los tres restantes. Los datos obtenidos son los siguientes
Peducción del tiempo, y AsegundosB *emanas de entrenamiento,
aB
".3, %, ".6
4.", ".3, 4.&
1.%, 4.#, 1."
4
5
3
/ncuentre la recta de mínimos cuadrados para estos datos.
bB /stime la reducción media del tiempo después de cuatro semanas de entrenamiento. -se un intervalo de confianza del 26N. cB
*upongamos 'ue se emplean sólo 1 estudiantes en el eperimento y 'ue se mide la reducción del tiempo para cada estudiante al final de 4, 5 y 3 semanas. <*e cumplirían las suposiciones re'ueridas para el intervalo de confianza=
dB
"4.
/pli'ue la respuesta.
Los siguientes datos codificados representan la producción, y, de un compuesto 'uímico para distintos niveles de la temperatura,
: ;
$4 5
$" 1
6 1
" 4
4 "
aB
Calcule la recta de mínimos cuadrados para estos datos.
bB
)ara verificar los cálculos de aB, represente los puntos A, yB y la recta ad(ustada
cB
[ y
.
Calcule *C/ y s para estos datos.
dB <)resentan los datos suficiente evidencia 'ue indi'ue 'ue hay una relación lineal entre y y = -se α = .6&
eB
/stime el verdadero valor de β" usando un intervalo de confianza del 2&N.
fB
Haga una predicción de un valor particular de y para
, = ",
usando
*i tuviéramos 'ue estimar el valor esperado de y para
, = ",
un intervalo de predicción del 26N. gB
[ y
en lugar de
y
.
"1. *upongamos 'ue los siguientes datos corresponden a pacientes de enfisema el nRmero de aMos 'ue el paciente ha fumado AB y la evaluación sub(etiva del médico en relación al daMo sufrido por los pulmones AyB. La Rltima variable se mide en una escala de 6 a "66. Las observaciones correspondientes a "6 pacientes son las siguientes )aciente " 4 1 5 & 3 # % 2 "6
7Mos 'ue ha fumado, 4& 13 44 "& 5% 12 54 1" 4% 11
XaMo en pulmones, y && 36 &6 16 #& #6 #6 && 16 1&
aB
Calcule el coeficiente de correlación r entre el nRmero de aMos 'ue ha fumado AB y el daMo a los pulmones AyB.
bB Calcule el coeficiente de determinación r 4 . Fnterprete r 4 cB
7(uste una recta de mínimos cuadrados a los datos. Pepresente la recta y los puntos. Compare la gráfica con la recta y los valores de r y r 4 calculados.
"5. 7lgunas variedades de lombrices viven en la tierra y se alimentan de las raíces del césped y de las plantas de los (ardines. /sta plaga, 'ue es particularmente problemática en los climas cálidos, se puede combatir con la aplicación de pesticidas. Los siguientes datos corresponden al porcenta(e de lombrices eliminadas para varias tasas de aplicación ASilos de ingrediente activo por cada 5.666 metros cuadradosB.
Iasa de aplicación, )orcenta(e eliminado, y aB
4 &6, &3, 5%
1 31, 32, #"
5 %3, %4, #3
& 25, 22, 2#
Calcule el coeficiente de correlación r, entre la tasa de aplicación AB y el porcenta(e AyB.
bB Calcule el coeficiente de determinación r 4 e interprételo. cB
7(uste una recta de mínimos cuadrados a los datos.
dB *upongamos 'ue se desea estimar el porcenta(e medio de lombrices eliminadas correspondiente a una aplicación de 5 Silos de pesticida
por 5.666 metros cuadrados. <*atisfacen los datos las suposiciones re'ueridas por los intervalos de confianza=
"&. La producción de soya importante fuente de proteínas, varía con el clima, con la cantidad de lluvia y con la producción de productos alternos. Los datos de la tabla siguiente muestran la producción anual en los /stados -nidos Aen cientos de miles de toneladasB para los aMos "236 y "2##.
7Mo "236 "23" "234 "231 "235 "23& "233 "23# "23% "232 "2#6 "2#" "2#4 "2#1 "2#5 "2#& "2#3 "2##
7Mo $ "236 6 " 4 1 5 & 3 # % 2 "6 "" "4 "1 "5 "& "3 "#
)roducción de soya y 2 "6 "" "6 "" "4 "1 "1 "5 "# "% "# "3 "2 "3 46 "% 46
aB
7(uste una recta de mínimos cuadrados a estos datos.
bB
)ronosti'ue la producción de soya en los estados -nidos para el aMo "2#%, usando un intervalo de predicción del 26N.
cB
bsérvese 'ue se ha pronosticado un valor de y fuera del intervalo de valores de usados para desarrollar la ecuación de predicción.
"3.
Los siguientes datos corresponden a dos tipos de analizadores del aliento, para los choferes sospechosos de encontrarse ba(o la influencia del alcohol. /stos tipos se denominan 87nalizador9 y 8D.*.9. Los datos corresponden a las mediciones hechas por estos dos dispositivos en "& personas.
7nalizador y ."& ."6 .62 ."5 .6% ."" ."4 ."6 .62 .62 .62 .62 .6% .6% .63 aB
/ncuentre la recta
D. *. : ."& .6% .6# ."5 .6# .6# .62 .6% .6% .6# .6% .62 .63 .6# .6& de
mínimos cuadrados 'ue relaciona las
mediciones del 7nalizador AyB con las del dispositivo D.*. AB. bB
Pepresente la recta y los puntos.
cB
<)roporcionan los datos suficiente evidencia 'ue indi'ue 'ue las mediciones de los dos dispositivos están relacionadas linealmente=
dB
*upongamos 'ue el aliento de una persona se analiza usando el dispositivo D.*. y 'ue se obtiene el valor .6". Haga una predicción de la medición 'ue se obtendría con el 7nalizador, usando un intervalo de predicción del 26N.