Varianza, desviación estándar, y coeficiente de variación La desviación sólo significa qué tan lejos de lo normal
Desviación estándar La desviación estándar (σ) mide cuánto se separan los datos. La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"
Varianza la varianza (que es el cuadrado de la desviación estándar: σ2) se define así: Es la media de las diferencias con la media elevadas al cuadrado. En otras palabras, sigue estos pasos: 1. Calcula la media (el promedio de los números) 2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Ahora calcula la media de esas diferencias al cuadrado. (¿Por qué al cuadrado?)
Ejemplo Tú y tus amigos habéis medido las alturas de vuestros perros (en milímetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm. Calcula la media, la varianza y la desviación estándar.
Respuesta: 600 + 470 + 170 + 430 + 300 Media =
1970 =
5
= 394 5
así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
Ahora
calculamos
la
diferencia
de
cada
altura
con
la
media:
Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media: 2062 + 762 + (-224)2 + 362 + (-94)2 Varianza: σ =
108,520 =
2
5
= 21,704 5
Así que la varianza es 21,704. Y la desviación estándar es la raíz de la varianza, así que: Desviación estándar: σ = √21,704 = 147 y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia menos de la desviación estándar (147mm) de la media:
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o extra grande o extra pequeño. Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se enteren!
*Nota: ¿por qué al cuadrado? Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los números negativos reduzcan la varianza) Y también hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho más grande que 502=2,500. Pero elevarlas al cuadrado hace que la respuesta sea muy grande, así que lo deshacemos (con la raíz cuadrada) y así la desviación estándar es mucho más útil.
¿Qué es el coeficiente de variación? El coeficiente de variación es una medida de dispersión que describe la cantidad de variabilidad en relación con la media. Puesto que el coeficiente de variación no se basa en unidades, se puede utilizar en lugar de la desviación estándar para comparar la dispersión de los conjuntos de datos que tienen diferentes unidades o diferentes medias. Por ejemplo, usted es el inspector de control de calidad de una planta embotelladora de leche que embotella el producto en recipientes pequeños y grandes. Usted toma una muestra de cada producto y observa que el volumen medio de los recipientes pequeños es de una 1 taza, con una desviación estándar de 0.08 tazas, y el volumen medio de los recipientes grandes es 1 galón (16 tazas), con una desviación estándar de 0.4 tazas. Aunque la desviación estándar del recipiente de un galón es cinco veces mayor que la desviación estándar del recipiente pequeño, sus coeficientes de variación (COV) apoyan una conclusión diferente:
Recipiente grande
CV = 100 * 0.4 tazas / 16 tazas = 2.5 El coeficiente de variación del recipiente pequeño es más de tres veces mayor que el coeficiente de variación del recipiente grande. En otras palabras, aunque el recipiente grande tiene una mayor desviación estándar, el recipiente pequeño presenta una variabilidad mucho mayor con respecto a su media.
Coeficiente de variación
El c o efic i ent e de var ia c ió n e s la re lació n e ntr e la desv ia c ió n t ípic a de una mue stra y su m edia .
El c o efic i ent e de var ia c ió n se sue le e xpre sar e n po rc e nta j es :
El c o efic i ent e de var ia c ió n pe r mite co mparar las disp er sio nes de do s dis tr ibucio ne s distin tas, sie mpr e que sus m edia s se an po sit iva s .
Se calcula para cad a una de las distr ibu cio ne s y lo s valo r e s que se o btie ne n se co mparan entr e sí.
L a ma yo r disper sió n cor re spo n der á al valo r de l c o efic i ent e de var ia c ió n m a yor .
Ej er c ic io :
Una di str ibuc ió n tie ne x = 1 40 y σ = 28 .28 y o tra x = 15 0 y σ = 24 . ¿C uál de las do s pr e se nta mayor dispe r sió n?
L a pr ime ra dis tr ibució n pr e se nt a m ayor di spe r sió n.