1. DIAG DIAGRA RAMA MA DE DIS DISPE PERS RSIÓ IÓN N 1.1. Concepto Es una representación gráfica de la relación entre dos variables, muy utilizada en las fases de Comprobación de teorías e identificación de causas raíz y en el Diseño de soluciones y mantenimiento de los resultados obtenidos. Tres conceptos especialmente destacables son ue el descubrimiento de las verdaderas relaciones de causa!efecto es la clave de la resolución eficaz de un problema, ue las relaciones de causa!efecto casi siempre muestran variaciones, y ue es más fácil ver la relación en un diagrama de dispersión ue en una simple tabla de n"meros. El análisis de un diagrama de dispersión consta de un proceso de cuatro pasos, se elabora una teoría razonable, se obtienen los pares de valores y se dibu#a el diagrama, se identifica la pauta de correlación y se estudian las posibles e$plicaciones. %as pautas de correlación más comunes son correlación fuerte positiva &' aumenta claramente con (), correlación fuerte negativa &' disminuye claramente con (), correlación d*bil positiva &' aument aumentaa algo algo con (), correl correlaci ación ón d*b d*bil il neg negati ativa va &' disminuy disminuyee algo algo con con (), correlación comple#a &' parece relacionarse con ( pero no de un modo lineal) y correlación nula &no +ay relación entre ( e '). Errores comunes son no saber limitar el rango de los datos y el campo de operación del proceso, perder la visión gráfica al sintetizarlo todo en res"menes num*ricos, entre otros.
1.1.1. 1.1.1. Co Corre rrelac lación ión Direc Directa ta %a recta correspondiente a la nube de puntos de la distribución es una recta creciente.
1.1.2.
Correlación Inversa
%a recta correspondiente a la nube de puntos de la distribución es una recta decreciente.
1.1.3. Correlación Nula En este caso se dice ue las variables son incorreladas y la nube de puntos tiene una forma redondeada.
1.1.. Correlación !uerte %a correlación será fuerte cuanto más cerca est*n los puntos de la recta.
1.1.". %a más
separados
Correlación D#$il correlación será d*bil cuanto est*n los puntos de la recta.
E%e&plo' Este es el diagrama de dispersión ue e$presa la cantidad de dinero ue se ganó ateo cada semana traba#ando en la tienda de su padre.
%as semanas están diagramadas en el e#e $, y la cantidad de dinero ue se ganó en esa semana en el e#e y. En general, la variable independiente &la variable ue no está influenciada por nada) está en el e#e $ y la variable dependiente &la ue es modificada por la variable independiente) está en el e#e y. En este diagrama se puede ver ue en la semana - ateo se ganó alrededor de s./-0, y en la semana /1 estuvo cerca de los s./20. 3ero más importante a"n es la tendencia. Con estos datos se puede ver ue ateo gana cada vez más seg"n pasan las semanas. 4uizá su padre le da más +oras a la semana o más responsabilidades.
2. EC(ACIÓN DE )A REC*A
%a ecuación e$plícita de una recta tiene la forma y=mx+b donde m es la pendiente de la recta y b el t*rmino independiente. E%e&plo' 5allar la ecuación de la recta ue tiene pendiente m=3 e intercepto b=10.
6e tiene ue +allar la ecuación de la recta, esto es, y=mx+b. 6e usa la información ue se tiene7 m=3 y b=10 y se sustituye en la ecuación y=3x+10.
%a ecuación ue se pide es y=3x+10.
REGRESIÓN )INEA) 3.1. Concepto 3.
3ermite determinar el grado de dependencia de las series de valores ( e ', prediciendo el valor y estimado ue se obtendría para un valor $ ue no est* en la distribución. El análisis de regresión es una t*cnica estadística para investigar la relación funcional entre dos o más variables, a#ustando alg"n modelo matemático. %a regresión lineal simple utiliza una sola variable de regresión y el caso más sencillo es el modelo de línea recta. El modelo de regresión lineal es el más utilizado a la +ora de predecir los valores de una variable cuantitativa a partir de los valores de otra variable e$plicativa tambi*n cuantitativa &modelo de regresión lineal simple). 8na generalización de este modelo, el de regresión lineal m"ltiple, permite considerar más de una variable e$plicativa cuantitativa.
. EC(ACIÓN DE (NA REC*A DE REGRESIÓN )INEA) (SAND+ )+S M,NIM+S C(ADRAD+S El ob#etivo de un análisis de regresión es determinar la relación ue e$iste entre una variable dependiente y una o más variables independientes. 3ara poder realizar esta relación, se debe postular una relación funcional entre las variables. Cuando se trata de una variable independiente, la forma funcional ue más se utiliza en la práctica es la
relación lineal. El análisis de regresión entonces determina la intensidad entre las variables a trav*s de coeficientes de correlación y determinación. ' %a ecuación de la regresión lineal es7 Y =a + bX , donde7 '9 es el valor pronosticado de la variable ' para un valor seleccionado de (. a es la ordenada de la intersección con el e#e ' cuando ( : ;. Es el valor estimado de ' cuando (:; b es la pendiente de la recta, o el cambio promedio en '9 para cada cambio de una unidad en (. El principio de mínimos cuadrados se utiliza para obtener a y b. %as ecuaciones para determinar a y b son7 b=
n(
∑ XY )−(∑ X )( ∑ Y ) n ( ∑ X ) −(∑ X ) 2
2
<
a=
∑ Y − b ∑ X n
n
E%e&plo' 3edro 3*rez, presidente de la sociedad de alumnos de la 8niversidad =acional E$perimental de >uayana, se ocupa de estudiar el costo de los libros de te$to. ?l cree ue +ay una relación entre el n"mero de páginas en el te$to y el precio de venta del libro. 3ara proporcionar una prueba, selecciona una muestra de oc+o libros de te$to actualmente en venta en la librería. Desarrolle una ecuación de regresión para la información dada ue se puede utilizar para estimar el precio de venta basado en el n"mero de páginas.
)i$ro @undamentos de la Administración lgebra Contabilidad de Costos Contabilidad Fntermedia ercadotecnia etodología de la Fnvestigación @inanzas 3"blicas @inanzas unicipales )i$ro @undamentos Administración
de
la
Pa-inas 0;;
Pa-inas 0;; ;; 1;; 2;; B;; 0;; 2;; 1;; Precio /s.0 1B
Precio /s.0 1B 0 2 1/ 2G G
B-.;;;
2 -0;.;;;
2 .;02
lgebra Contabilidad de Costos Contabilidad Fntermedia ercadotecnia etodología de
;; 1;; 2;; B;; 0;;
la
0 2 1/
Fnvestigación @inanzas 3"blicas 2;; 2G @inanzas unicipales 1;; G *+*A) .44 535 8 ( 397200 ) −( 4900 )( 636 ) = 0.05143 b= 8 ( 3150000 )−( 4900 )
0-.0;; .-;; BG.-;; -.2;; B;.0;;
B;.;;; 2B;.;;; G2;.;;; /2;.;;; -0;.;;;
0.2-0 .1;/ 0./1B B.2/ 2.02/
G.1;; B.B;; 36.244
G2;.;;; 2B;.;;; 3.1"4.444
G.2 1.2B "1.545
2
a=
636 8
−0.05143
4900 8
=48.0
Entonces7 '9:B1.;H;.;0/BG( 6e puede utilizar la ecuación de regresión para estimar valores de '. Y =48.0 + 0.05143 X = 48.0 + 0.05143 ( 800 )= 89.14 '
El precio de venta estimado de un libro de 1;; páginas es de s.1,/B.
". C+7ARIAN8A ES*IMACIÓN DE ERR+R ".1. Covarian9a Es un valor ue indica el grado de variación con#unta de dos variables aleatorias. Es el dato básico para determinar si e$iste una dependencia entre ambas variables y además es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o la recta de regresión. El signo de la covarianza, por lo tanto, e$presa la tendencia en la relación lineal entre las variables. %a fórmula suele aparecer e$presada como7
n
^= Q
n
´ )( Y −Y ´) X Y ∑ ( X − X ∑ = = i
i
i 1
=
n−1
xy
i
i
i 1
n− 1
E%e&plo' Calcula la covarianza de las variables estadísticas (, ' dadas por la tabla de valores7
B /.B
0 /.G
2 /.B
/.0
1 /.0
/.2
/; /.2
// /.
6e deben calcular las medias de ( y de ', y calcular los productos (iI'i. %os resultados ue se obtienen son7 n
x ∑ =
n
i
x´ =
i
1
n
=
60 8
=75
y ∑ =
< y´ = i
1
n
i
=
12 8
=1,5
8na vez calculadas las medias se procede a realizar el cálculo de la varianza7 n
n
x y =92,1 ∑ = i
i
i 1
".2.
x y ∑ =
< Q xy = i
i
1
n
i
−´ x∗´ y =0,26
Error :e Esti&ación
Es una medida de su precisión ue se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrec+o deberá ser el intervalo de confianza y, si se uiere mantener o disminuir el error, más observaciones deberán incluirse en la muestra estudiada. Este error de estimación, cuya unidad de medida es sigma &J), se basa en el cálculo de la raíz cuadrada de la varianza7 σ = ԑ
√
2
σ x n
=
σ x
√ n
E%e&plo' De acuerdo a los datos proporcionados por el Fnstituto =acional de Estadística se tiene una varianza de ;,1 de un total de datos de /;;;. σ = ԑ
√
0,98
2
1000
=
0,98
√ 1000
=
0,98 31,62
=0,03
6eg"n los resultados mane#ados por el F=E el error de estimación es de ;,;G.
5. C+E!ICIEN*E DE DE*ERMINACIÓN 8na vez a#ustada la recta de regresión a la nube de observaciones es importante disponer de una medida ue mida la bondad del a#uste realizado y ue permita decidir si el a#uste lineal es suficiente o se deben buscar modelos alternativos. Como medida de bondad del a#uste se utiliza el coeficiente de determinación, definido como sigue7 n
∑ ( y − y´ ) = ^
scE i 1 = n R = scG 2
2
i
( y − y´ ) ∑ =
2
( 6.15) o bien
2 scR n −2 s^ R =1− R =1− scG n −1 s^ 2Y 2
1
i
1
Como scE < scG, se verifica ue 0 < R2 < 1. El coeficiente de determinación mide la proporción de variabilidad total de la variable dependiente (Y) respecto a su media ue es e$plicada por el modelo de regresión. Es usual e$presar esta medida en tanto por ciento, multiplicándola por cien. y i− y´ = α ( x −´ x ) 3or otra parte, teniendo en cuenta ue , se obtiene ^
^
1
1
2
R
2
=
s XY 2
2
( 6.16 )
s X sY
Dadas dos variables aleatorias cualesuiera X e Y, una medida de la relación lineal ue +ay entre ambas variables es el coeficiente de correlación definido por7 Cov ( X , Y ) ( 6.17 ) ρ = σ ( X ) σ ( Y ) donde J&() representa la desviación típica de la variable X &análogamente para J&')). 8n buen estimador de este parámetro es el coeficiente de correlación lineal muestral &o coeficiente de correlación de 3earson), definido por7 r=
s XY s X sY
= signo ( α 1 ) √ R2∗( 6.18 ) ^
3or tanto, r ϵ K!/,/L. Este coeficiente es una buena medida de la bondad del a#uste de la recta de regresión. Evidentemente, e$iste una estrec+a relación entre r y
α 1 ^
aunue estos estimadores proporcionan diferentes interpretaciones del modelo7 r es una medida de la relación lineal entre las variables X e Y . α 1 mide el cambio producido en la variable Y al realizarse un cambio de una ^
unidad en la variable X . De las definiciones anteriores se deduce ue7 s XY =0 α 1=0 r =0 ⇔
^
⇔
6i r es significativo &distinto de cero) ya ue ello implica ue el modelo de regresión lineal es significativo. Desafortunadamente la distribución de r es complicada pero para tamaños muestrales mayores ue G; su desviación típica es
σ ( r)
≃
1
/ √ n , y
puede utilizarse la siguiente regla7
|r|>
2
√ n
⟹
res significativo( conα =0 05 )
En la interpretación del coeficiente de correlación se debe tener en cuenta ue7 r=±1 indica una relación lineal e$acta positiva &creciente) o negativa &decreciente). r=0 indica la no e$istencia de relación lineal estocástica, pero no indica independencia de las variables ya ue puede e$istir una relación no lineal incluso e$acta. Malores intermedios de r (0 < r < 1 ó -1 < r < 0) indican la e$istencia de una relación lineal estocástica, más fuerte cuanto más pró$imo a +1 (ó -1) sea el valor de r .