MEDIAS DE DISPERSION s s s s
VARIANZA La varianza es una medida de variabilidad que utiliza todos los datos. Esta basada en la diferencia entre los valores de cada observación ( xi ) y la media. ( x x para una muestra, m para una población). La varianza es el promedio de las diferencias al cuadrado entre cada valor de dato y la media. Si el conjunto de DATOS ES UNA MUESTRA, la varianza se denota por s2. 2
2 ( x −x ) ∑ 2 i s = n −1
CUANDO LOS DATOS SON AGRUPADOS Si el conjunto de DATOS ES UNA MUESTRA , la varianza es: s 2
s
f ( X ∑ = i
i
− x ) 2
n −1 Si el conjunto de DATOS ES UNA POBLACIÓN , la varianza se denota por σ 2.
2
∑ ( xi − µ ) 2 σ = N
CUANDO LOS DATOS SON AGRUPADOS Si el conjunto de DATOS ES UNA POBLACIÓN , la varianza es: 2
σ
=
∑ f i ( X i − µ )
2
N
DESVIACION ESTANDAR s s s
La desviación estándar de un conjunto de datos es la raíz cuadrada positiva de la varianza. Se mide en las mismas unidades que los datos, haciéndola mas comparable, que la variancia, a la media. Si el conjunto de DATOS ES UNA MUESTRA, la desviación estándar se denota por s.
s = s s
2
DATOS ES UNA POBLAC POBLACIÓ IÓN N, la desviación estándar se denota por Si el conjunto de DATOS (sigma). σ
=
σ
2
σ
COEFICIENTE DE VARIACION s
El coeficie coeficiente nte promedio.
Prof. Gabriel Matos Estadística Aplicada.
de variació variación n
indica que tan grande es la desviación estándar rn relación al
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
s
Si un conjunto de
datos es una muestra ,
el coeficiente de variación se calcula como sigue:
s
(100 )
x
s
Si un conjunto de datos es una población, el coeficiente de variación se calcula como sigue: σ
(100 )
µ
Mide la variación relativa de la variable con respecto a su promedio. Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud de la desviación estándar en relación con la magnitud de la media Expresa a la variación de los datos como porcentaje de su promedio .
Las medidas de forma son: Sesgo Es el grado de asimetría que tiene la distribución Una curva insesgada tiene sesgo cero Medimos en cuánto se aleja la distribución de una insesgada: Si el polígono de frecuencias tiene la mayor acumulación a la izquierda, tiene sesgo positivo o a la derecha. Si el polígono de frecuencias tiene la mayor acumulación a la derecha, tiene sesgo negativo o a la izquierda Coeficiente de Asimetría
Sesgo
=0
No hay sesgo. La distribución es insesgada
>0
La distribución tiene sesgo positivo o a la derecha.
<0
La distribución tiene sesgo negativo o a la izquierda.
Curtosis Mide qué tan “puntiaguda” es una distribución, con respecto a la Normal. La distribución Normal se considera mesocúrtica, es el término medio. Las distribuciones mas puntiagudas que la Normal se llaman leptocúrticas Lass dist distri ribu buci cion ones es me meno noss pu punt ntia iagu guddas qu quee la Norm Normal al se con conocen ocen como como La platocúrticas
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
Leptocúrtica Mesocúrtic P latocúrtic latocúrtic
Función Curtosis
Curtosis
=3
Mesocúrtica
>3
Leptocúrtica
<3
Platocúrtica
TEOREMA DE CHEBYSHEV Al menos (1 - 1/ k 2) 2) de los elementos en un conjunto de datos estará dentro de las k desviaciones estándar del promedio donde k es cualquier valor mayor que 1. • Al menos 75% de los elementos deben estar entre k = 2 desviaciones estándar de la media. • Al menos 89% de los elementos deben estar entre k = 3 desviaciones estándar de la media. Al menos 94% de los elementos deben estar entre k = 4 desviaciones estándar de la media.
Cualquiera que sea la forma de la distribución de los datos: al menos el 75% de los valores (población) caerán dentro de 2 desviaciones estándar respecto de la media de la distribución:
( X ± 2S)
al menos el 89% de los valores (población) caerán dentro de 3 desviaciones estándar respecto de la media de la distribución:
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.
SOLUCIÓN: La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana. La moda: el valor de la variable que presenta una mayor frecuencia es 60
v alor de la variable y la media La varianza S2: Es la media de los cu adrados de las diferencias entre cada valor aritmética de la distribución.
Sx2= La desviación típica S: es la raíz cuadrada de la varianza.
S = √ 427,61 = 20.67 El rango: diferencia entre el valor de las observaciones mayor y el menor 80 - 15 = 65 días El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética
CV = 20,67/52,3 = 0,39 EJEMPLO El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Eu ros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras b arras y el diagrama de caja. SOLUCIÓN: 2)
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
3) EJERCICIO RESUELTO
Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de cigarros que son consumidos en promedio al día por un conjunto de 20 encuestados. 2
4
10
6
0
4
1
0
3
6
10
2
4
2
3
2
5
5
8
0
x =
La media es igual a
∑ xi
=
77 20
= 3.85
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
37.8225
3.4225
0.0225
2
S
3.4225
0.7225
∑ ( x =
i
Por lo que
− x )
n
2
=
3.4225
171.83 20
1.3225
1.3225
17.2225
14.8225
= 8.5915
por por lo par paraa det determ ermina inarr la des desvia viació ción n est estánd ándar ar bas basta ta con obt obtener ener la raí raízz cua cuadra drada, da, con lo que fin finalm alment entee la desviación estándar es igual a:
S = 0.6554 cigarros.
4) EJERCICIO RESUELTO A continuación se le dan los resultados de una evaluación de Química aplicada a un grupo de alumnos de 9no grado. Encuentre: a) la Media Aritmética Aritmétic a (Promedio) b)la Varianza c) la Desviación Típica 9 14 18 20 13 14 11 10 10 15 9 15 12 11 10 19 12 12 15 16 12 7 13 13 17 16 14 15 17 11
PASO 1: Sume todos los valores y divida entre el número de sumandos: X = 400 / 30= 30= 13,333... PASO A REALIZAR 2) Elabore una Distribución Agrupada de frecuencias con una amplitud de 3 (por ejemplo) para cada intervalo.
INTERVALO DE CLASE
PASO A REALIZAR
INTERVALO DE CLASE 18 - 20 15 – 17 12 – 14 9 - 11 6-8
3) Agregue la columna de la marca de clase
18 - 20 15 – 17 12 - 14 9 - 11 6-8
Xi 19 16 13 10 7
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
columna de las frecuencias y efectúe la sumatoria
15 – 17 12 – 14 9 - 11 6-8
8 10 7 2
16 13 10 7
∑= PASO A REALIZAR 5) Calculemos la Media Aritmética. Revisa la lección correspondiente a Media aritmética de datos agrupados
INTERVALO DE CLASE 18 - 20 15 – 17 12 – 14 9 - 11 6-8
30
Xi
fi
Xi*f i
19 16 13 10 7
3 8 10 7 2
57 128 130 70 14
∑=
30
399
X = 399 / 30= 30=
13,3. Observa que el Resultado obtenido difiere del resultado exacto (13.3333...) Recuerda: Al menos que sea necesario, nunca agrupes para calcular la media aritmética:
PASO A REALIZAR
6) Construyamo C onstruyamoss la columna columna fi*(x – x i)2
INTERVALO DE CLASE 18 - 20 15 – 17 12 – 14 9 - 11 6-8
Xi
fi
Xi*f i
fi*(x – xi)2
19 16 13 10 7
3 8 10 7 2
57 128 130 70 14
97,47 58,32 0,9 76,23 79,38
30
399
312,3
∑=
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
65 - 70 70 - 75 75 - 80
21 16 10
a) Calcule Calcule el tiempo tiempo medio que que se demoran demoran los fiscalizado fiscalizadores. res. b) Calcule Calcule la varianza varianza de de los tiempos tiempos y su desviac desviación ión típica. típica. c) Se implement implementaa un software software que promete promete reducir en un 25% los tiempos tiempos de las declaracion declaraciones. es. ¿Cuál es el nuevo promedio y la nueva varianza de los tiempos? 1) La varianza varianza de dos números es 1 y su media aritmética aritmética es 8. 8. Calcule los números. 2) En una empresa empresa donde los los salarios por hora hora tienen una una media de $70 $70 y una desviación desviación estándar estándar de $15, el sindicato solicita que cada salario x i se transforme en y i mediante la siguiente relación. yi = 1,3xi + 10 El directorio acoge parcialmente la petición, rebajando los salarios resultantes yi en un 10%, lo que es aceptado por el sindicato. Se pide calcular la media aritmética y la varianza de la distribución final de los salarios. 6) La siguiente distribución, corresponde a las notas finales obtenidas por un curso de 30 personas en un curso de estadística: Xi 1 2 3 4 5 6 7
Fi
3 6 7 7 3 0 4
Calcule: a) Varianza, desviación estándar y coeficiente coeficiente de dispersión dispersión de de las notas notas b) Cuantifi Cuantifique que la simetría simetría en la distrib distribució uciónn de las notas notas
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
b) Calcule Calcule la media media aritmét aritmética ica de los los ingreso ingresos. s. 12) La siguiente tabla presenta las notas obtenidas en una prueba por un curso de 20 personas 4,0 3,0
3 2,7
4,3 4,5
3,1 3,4
3,9 4,2
4,5 2,5
4,8 1,9
3,6 4,3
2,1 3,6
4,5 1,1
a) Determine la media y la mediana mediana de las notas del curso (3,45 pts.; pts.; 3,6pts) 3,6pts) b) El profesor considera que que las notas son son demasiado demasiado bajas y por por ello propone propone elevarlas elevarlas mediante mediante la siguiente función: y i
= 1, 2 x i + 0,5
Determine el nuevo promedio de notas: (4,64 pts.) 13) La siguiente tabla muestra el salario de 100 trabajadores en miles de pesos SALARIO
Fi
100 – 110 110 – 120 120 – 130 130 – 140 140 - 150
8 22 40 18 12
a) Calcule Calcule el salario salario promedi promedioo de los trabaja trabajadore dores. s. b) Calcule Calcule la varianza varianza de los los salari salarios os c) Si la empresa empresa donde trabaja, les ofrece un aumento aumento de remuneracion remuneraciones es que permitirán permitirán a ellos $10.000 más o un aumento del 10% d) Recalcule Recalcule la varia varianza nza en razón razón a los aument aumentos os expuesto expuestoss 14) La siguiente tabla muestra la distribución de las edades según el sexo de los trabajadores de una empresa HOMBRE MUJER
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
The world's largest digital library
Try Scribd FREE for 30 days to access over 125 million titles without ads or interruptions! Start Free Trial Cancel Anytime.
16) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias ¿Cómo están relacionadas las medias? 17) El retraso en la entrega de los últimos 100 pedidos pedidos de material informático informático en una empresa se ha agrupado en 4 intervalos, recordándose solo los siguientes datos de la distribución: • • • •
a) b) c) d) e)
El primer intervalo tiene 6 días como extremo superior, una frecuencia relativa de 0,2 y una amplitud de 4 días. En el segundo intervalo se acumulan 60 entregas retrasadas. Las marcas de clases del segundo y cuarto intervalo son 8 y 50 días, respectivamente. El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de 30 días. Construya la tabla tabla de distribución distribución de frecuencia del tiempo tiempo de de retraso retraso en las entregas. entregas. ¿Cuál ¿Cuál es el tiempo tiempo medio medio de de demora demora en las las entrega entregas? s? Calcular la mediana, mediana, moda, moda, varianza, varianza, desviación desviación estándar, estándar, el coeficiente de variación variación ¿Entre qué valores se encuentra el 50% central central del tiempo tiempo de retraso retraso en las las entregas? entregas? Si descontamos descontamos el 15% 15% del tiempo tiempo de retraso menos menos en las entregas entregas y el 15% del tiempo de de retraso máximo en las entregas. ¿ En qué intervalo de puntuaciones se encuentran los restantes?