LECCIÓN 17 VARIANZA Y DESVIACIÓN ESTÁNDAR VARIANZA La varianza (que es el cuadrado de la desviación estándar: σ2) se define así: Es la media de las diferencias con la media elevadas al cuadrado . En otras palabras, sigue estos pasos: . !alcula la media (el promedio de los n"meros). #. $%ora, por cada n"mero resta la media & eleva el resultado al cuadrado (la diferencia elevada al cuadrado). '. $%ora calcula la media de esas diferencias al cuadrado. ( or qu* al cuadrado+). cuadrado+). ara datos no agrupados
ara datos agrupados
Eemplo: -e %an medido las alturas de algunos perros (en milímetros):
Las alturas (de los %ombros) son: //mm, 01/mm, 1/mm, 0'/mm & '//mm. !alcula la media, la varianza & la desviación estándar. 2espuesta: // 5 01/ 5 1/ 5 0'/ 5 '// 3edia 4
61/ 4
7
4 '60 7
$sí que la altura media es '60 mm. 8amos a dibuar esto en el gráfico:
$%ora calculamos la diferencia de cada altura con la media:
ara calcular la varianza, toma cada diferencia, el*vala al cuadrado, & %az la media: #/# 5 1# 5 (##0)# 5 '# 5 (60)# #
8arianza: 9 4
/;,7#/ 4
7
4 #,1/0 7
$sí que la varianza es #,1/0. < la desviación estándar es la raíz de la varianza, así que: =esviación estándar: σ = 21!7"# = 1#7 < lo bueno de la desviación estándar es que es "til: a%ora veremos qu* alturas están a distancia menos de la desviación estándar (01mm) de la media:
$sí que usando la desviación estándar tenemos una manera >estándar> de saber qu* es normal, o e?tra grande o e?tra peque@o. Los 2ottAeilers so$ perros grandes. < los =ac%sunds so$ un poco menudos.
DESVIACIÓN T%&ICA ' ESTÁNDAR La desviación estándar ( σ) mide cuánto se separan los datos. La fórmula es fácil: es la raíz cuadrada de la var(a$)a . $sí que, >qu* es la varianza+> ara datos Bo agrupados
ara datos agrupados
La desv(ac(*$ es+,$dar o desv(ac(*$ +-.(ca (denotada con el símbolo 9 o s, dependiendo de la procedencia del conunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) & de intervalo. -e define como la raíz cuadrada de la varianza de la variable. ara conocer con detalle un conunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambi*n la desviación que presentan los datos en su distribución respecto de la media aritm*tica de dic%a distribución, con obeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. La desviación típica es una medida del grado de dispersión de los datos con respecto al valor promedio. =ic%o de otra manera, la desviación estándar es simplemente el >promedio> o variación esperada con respecto a la media aritm*tica. or eemplo, las tres muestras (/, /, 0, 0), (/, , ;, 0) & (, , ;, ;) cada una tiene una media de 1. -us desviaciones estándar muestrales son 8.08 , 5.77 & 1.15 respectivamente. La tercera muestra tiene una desviación muc%o menor que las otras dos porque sus valores están más cerca de 1. La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de *stas. !uando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado aleada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es co%erente, &a que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicación centralC muestra la agrupación de los datos alrededor de un valor central (la media o promedio).
LECCIÓN 1/ C'E0ICIENTE DE VARIACIÓN Y DESVIACIÓN EDIA C'E0ICIENTE DE VARIACIÓN En estadística, cuando se desea %acer referencia a la relación entre el tama@o de la media & la variabilidad de la variable, se utiliza el coe(c(e$+e de var(ac(*$ . -u fórmula e?presa la desviación estándar como porcentae de la media aritm*tica, mostrando una meor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. or otro lado presenta problemas &a que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. or ello es importante que todos los valores sean positivos & su media d*, por tanto, un valor positivo. $ ma&or valor del coeficiente de variación ma&or %eterogeneidad de los valores de la variableC & a menor !.8., ma&or %omogeneidad en los valores de la variable. -uele representarse por medio de las siglas C3V3 E?igimos que:
-e calcula:
=onde
•
•
•
•
•
•
•
es la desviación típica. -e puede dar en tanto por ciento calculando:
El coeficiente de variación no posee unidades. El coeficiente de variación es típicamente menor que uno. -in embargo, en ciertas distribuciones de probabilidad puede ser o ma&or que . ara su meor interpretación se e?presa como porcentae. =epende de la desviación típica, tambi*n llamada >desviación estándar>, & en ma&or medida de la media aritm*tica, dado que cuando *sta es / o mu& pró?ima a este valor el !.8. pierde significado, &a que puede dar valores mu& grandes, que no necesariamente implican dispersión de datos. El coeficiente de variación es com"n en varios campos de la probabilidad aplicada, como teoría de renovación & teoría de colas. En estos campos la distribución e?ponencial es a menudo más importante que la distribución normal.
La desviación típica de una distribución e?ponencial es igual a su media, por lo que su coeficiente de variación es .
La distribuciones con un !.8. menor que uno, como la distribución de Erlang se consideran de =esviación media
DESVIACIÓN EDIA En estadística la desviación absoluta promedio o, sencillamente desviación media o promedio de un conunto de datos es la media de las desviaciones absolutas & es un resumen de la dispersión estadística. -e e?presa, de acuerdo a esta fórmula:
Ejemplo: Desviación media para datos no agrupados Dres alumnos son sometidos a una competencia para probar sus conocimientos en / materias diferentes, cada una sustentada con / preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional. El n"mero de preguntas buenas por materia se muestra a continuación:
a+er(a
Carlos
&edro
4ua$
#
1
7
#
6
#
'
/
#
7
0
#
7
7
'
7
'
7
1
6
0
;
6
1
7
6
/
0
7
0
S'L5CIÓN Lo primero que analizaremos es la media de los puntaes para cada uno de los alumnos, con el fin de determinar el alumno con ma&or promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 7 preguntas correctas por prueba. !uál sería entonces el indicador diferenciador entre los alumnos+. !omplementemos el análisis anterior calculando la desviación media: !arlos muestra una desviación media de ',6 indicando que los datos se alean en promedio de la media en ',6 preguntas buenas. edro disminu&e su variación (#,6), siendo uan el que menos variación presenta con /,6 preguntas tanto por arriba como por debao de la media aritm*tica. -e recomienda al colegio elegir como ganador en este caso a uan, presenta resultados más constantes que los otros dos alumnos, uan en promedio acierta 7 preguntas buenas con una variación mu& baa (rondando entre 0 & ).
5.1.2 Ejemplo: Desviación media para datos agrupados Fna maquina dispensadora de gaseosas esta programada para llenar un envase con '7/ c.c. de un refresco popular. $ partir de una muestra de prueba realizada sobre '/ envases se realizó la siguiente tabla de frecuencia:
N(
L6
Ls
0
c
'/./
0/.
#
'7.
#
0/.
7/.
7
07.
'
7/.
/.
0
77.
0
/.
1/.
0
7.
7
1/.
;/.
0
17.
;/.
6/./
;7.
To+al
"
!alcular e interpretar la desviación media.
S'L5CIÓN PASO 1: !alcular la media aritm*tica. PASO 2 : !alcular la desviación media. La desviación media es de apro?imadamente ;,; c.c. !oncluimos que con datos suministrados de una muestra, el dispensador llenó los '/ envases con un promedio de 71,/67 c.c. con una desviación media de ;,; c.c.
La desviación media describe un rango de dispersión promedio de llenado del dispensador, ubicándolo entre 0;,#67 c.c. (equivale a restar la media a la desviación media) & 7,;67 c.c. (sumar una desviación media a la media aritm*tica).