ESTADÍSTICA DESCRIPTIVA
ESTADÍSTI EST ADÍSTICA CA DESCR DESCRIPTIV IPTIVA A
Esta es una etapa de la metodología estadística, en la que no se involucra la teoría de la probabilidad como herramienta para realizar inferencias a toda la población, sin embargo se construyen indicadores, se hacen gráficos, se realizan comparaciones, siempre con el interés de conocer la población de donde fue tomada la muestra .
ESTADÍSTI EST ADÍSTICA CA DESCR DESCRIPTIV IPTIVA A
Esta es una etapa de la metodología estadística, en la que no se involucra la teoría de la probabilidad como herramienta para realizar inferencias a toda la población, sin embargo se construyen indicadores, se hacen gráficos, se realizan comparaciones, siempre con el interés de conocer la población de donde fue tomada la muestra .
ESTADÍSTI EST ADÍSTICA CA DESCR DESCRIPTIV IPTIVA A
Histograma de Frecuencias Absolutas 9
8
7
6 a t u l o s b A a i c n e u c e r F
5
4
3
2
1
0 43 3.. 15
4 4. 15
45 5.. 15
4 6. 15
4 7. 15
4 8. 15
4 9. 15
50 0.. 15
5 1. 15
52 2.. 15
53 3.. 15
5 4. 15
55 5.. 15
Logintud delHueso
ESTADÍSTICA EST ADÍSTICA DESCRIPTI DESCRIPTIV VA Diagrama de Sectores - Nivel Educativo
12,9%
9,5%
14,0% 12,9%
“organización, presentación y análisis de datos”.
18,2% 32,4%
Category DOCTORADO ESPECIALIZACION MAESTRIA PREGRADO PRIMARIA SECUNDARIA
DISTRIBUCIÓN DISTRIB UCIÓN DE FRECUENCIAS Es una tabla en la cual se consignan los valores que asume una variable frente a su frecuencia de ocurrencia.
Caso 1: Datos sin Agrupar Caso 2: Datos Agrupados
Caso 1: Datos sin Agrupar Supongamos que se tiene una población constituida por 200 cajas y se desea examinarlas, determinándose el número de piezas defectuosas que contiene cada caja. Por razones de tiempo y costo se desea que la investigación no sea exhaustiva, es decir, no se examinara la totalidad de las 200 cajas, sino que se seleccionara una muestra de tamaño 30. Los resultados se muestran a continuación:
3, 2, 0, 2, 3, 3, 1, 1, 0, 1, 3, 3, 4, 4, 3, 2, 4, 2, 4, 2, 0, 2, 4, 3, 1, 2, 4, 3, 0, 2. *En la primera caja examinada se encontraron 3 piezas defectuosas.
Distribución de frecuencias “Datos sin Agrupar” TABLA DE FRECUENCIA DEL NUMERO DE PIEZAS DEFECTUOSAS QUE CONTIENEN LAS CAJAS. xi
ni
f i
N i
Fi
Valor observado
Frecuencia Absoluta
Frecuencia Relativa
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
0
4
0.133
4
0.133
1
4
0.133
8
0.267
2
8
0.267
16
0.533
3
8
0.267
24
0.800
4
6
0.200
30
1.0
Total
30
1.0
Frecuencia Absoluta (ni) Se comienza organizando la información escribiendo los datos distintos de que consta la muestra y haciendo un conteo para determinar el número de veces que aparece cada dato xi (Valor observado)
Conteo
ni (Frecuencia absoluta)
0 1 2 3 4 Total
3, 2, 0, 2, 3, 3, 1, 1, 0, 1, 3, 3, 4, 4, 3, 2, 4, 2, 4, 2, 0, 2, 4, 3, 1, 2, 4, 3, 0, 2.
Frecuencia Absoluta (ni) Se comienza organizando la información escribiendo los datos distintos de que consta la muestra y haciendo un conteo para determinar el número de veces que aparece cada dato xi
Conteo
(Valor observado)
(Frecuencia absoluta)
0
||||
1
||||
2
||||| |||
3
||||| |||
4
||||| |
Total
ni
4
3, 2, 0, 2, 3, 3, 1, 1, 0, 1, 3, 3, 4, 4, 3, 2, 4, 2, 4, 2, 0, 2, 4, 3, 1, 2, 4, 3, 0, 2.
FrecuenciaAbsoluta Absoluta(n(ni)i) Frecuencia Se comienza organizando la información escribiendo los datos distintos de que consta la muestra y haciendo un conteo para determinar el número de veces que aparece cada dato xi
Conteo
(Valor observado)
ni (Frecuencia absoluta)
0
||||
4
1
||||
4
2
||||| |||
8
3
||||| |||
8
4
||||| |
6
Total
30
La frecuencia absoluta del dato x i se representa por medio de ni. Ej: el dato x 3=2 aparece 8 veces en la muestra, por tanto n3=8.
Frecuencia Relativa ( f i ) La frecuencia absoluta también puede expresarse como una fracción o porcentaje, surgiendo lo que se denomina frecuencia relativa (f i).
f i
ni
n
Ejemplo:
f 3
n3 n
8 30
0.267
xi
ni
0
4
1
4
2
8
3
8
4
6 30
f i
Frecuencia Relativa ( f i ) La frecuencia absoluta también puede expresarse como una fracción o porcentaje, surgiendo lo que se denomina frecuencia relativa (f i).
f i
ni
n
Ejemplo:
f 3
n3 n
8 30
0.267
Lo que indica que el dato x 3=2 representa el 26.7% de toda la muestra, es decir, que de acuerdo a la muestra, el 26.7% de las cajas tienen 2 piezas defectuosas.
xi
ni
f i
0
4
0.133
1
4
0.133
2
8
0.267
3
8
0.267
4
6
0.200
30
1.0
FRECUENCIA ABSOLUTA ACUMULADA (N i ) Número de datos que son inferiores o iguales a x i
N i
n1 n2
... ni
FRECUENCIA RELATIVA ACUMULADA (F i ) Fracción o porcentaje de la frecuencia absoluta acumulada hasta x i
F i
N i n
f 1 f 2 f i
Frecuencias Acumuladas En el ejemplo: N 3 N 3
F 3
n1 n2
n3
4 4 8 16
N 3 n
16 30
0.533
xi
ni
f i
N i
Fi
0
4
0.133
4
0.133
1
4
0.133
8
0.267
2
8
0.267
16
0.533
3
8
0.267
24
0.800
4
6
0.200
30
1.0
60
1.0
Frecuencias Acumuladas En el ejemplo: N 3 N 3
F 3
n1 n2
n3
4 4 8 16
N 3 n
16 30
0.533
xi
ni
f i
N i
Fi
0
4
0.133
4
0.133
1
4
0.133
8
0.267
2
8
0.267
16
0.533
3
8
0.267
24
0.800
4
6
0.200
30
1.0
60
1.0
Indica que 16 datos son iguales o inferiores al dato x 3=2, es decir que de acuerdo con la muestra, 16 cajas presentan 2 o menos piezas defectuosas. Indica que el 53.3% de los datos son iguales o inferiores al dato x 3=2, es decir que de acuerdo con la muestra, el 53.3% de las cajas presentan 2 o menos piezas defectuosas.
Distribución de frecuencias “Datos sin Agrupar” TABLA DE FRECUENCIA DEL NUMERO DE PIEZAS DEFECTUOSAS QUE CONTIENEN LAS CAJAS. xi
ni
f i
N i
Fi
Valor observado
Frecuencia Absoluta
Frecuencia Relativa
Frecuencia Absoluta Acumulada
Frecuencia Relativa Acumulada
0
4
0.133
4
0.133
1
4
0.133
8
0.267
2
8
0.267
16
0.533
3
8
0.267
24
0.800
4
6
0.200
30
1.0
Total
30
1.0
Propiedades y Relaciones Si se toma una muestra de n datos, de los cuales hay m distintos, que ordenados en forma creciente son x 1, x 2, …, x m, entonces:
1.
0 ni m
2.
ni
n
6.
n
7.
n n1 N 1 N 2 ... N m n
N m
j
i 1
3.
0 f i 1 m
4.
f i 1
i 1
j
5.
N j
ni i 1
8.
F j
f i i 1
9.
f 1 F 1 F 2 ... F m 1
Función de Distribución N( x ) Las frecuencias acumuladas pueden definirse como funciones sobre todos los números reales . N ( x)= “número de datos que son menores o iguales a x”
Para el ejemplo, la distribución de N( x ) es: xi
ni
f i
N i
Fi
0
4
0.133
4
0.133
1
4
0.133
8
0.267
2
8
0.267
16
0.533
3
8
0.267
24
0.800
4
6
0.200
30
1.0
Total
30
1.0
Ej: N ( x 2) 16
0 4 8 N ( x) 16 24 30
si x 0 si x 1 si x 2 si x 3 si x 4 si x 4
Función Empírica de Distribución Acumulada, F( x ) F ( x)= “fracción (o porcentaje) de los datos que son menores o iguales que x”
Para el ejemplo, la distribución de F( x) es: xi
ni
f i
N i
Fi
0
4
0.133
4
0.133
1
4
0.133
8
0.267
2
8
0.267 16 0.533
3
8
0.267 24 0.800
4
6
0.200 30
Total
30
1.0
1.0
Ej: F( x 2) 0.533
0 0.133 0.267 F ( x) 0.533 0.800 1
si x 0 si x 1 si x 2 si x 3 si x 4 si x 4
Funciones de Distribución En general la función N( x) se define como: 0 N ( x) N j n
si x x1 si x j x x j 1
j 1,2,...,k
si x xk
En general la función F( x) se define como: 0 F ( x) F j n
si x x1 si x j x x j 1 si x xk
j 1,2,..., k
Representación gráfica Cuando se trate de frecuencias absolutas o de frecuencias relativas, se realizará la representación por medio del llamado
diagrama de frecuencias (absolutas o relativas)
xi
ni
f i
0
4
0.133
1
4
0.133
2
8
0.267
3
8
0.267
4
6
0.200
30
1.0
Representación gráfica Cuando se trate de frecuencias absolutas o de frecuencias relativas, se realizará la representación por medio del llamado
diagrama de frecuencias (absolutas o relativas) xi
ni
f i
0
4
0.133
1
4
0.133
2
8
0.267
3
8
0.267
4
6
0.200
30
1.0
Representación gráfica Cuando se considere las frecuencias acumuladas, la representación gráfica consiste en llevar a un plano cartesiano las funciones N ( x) y F ( x). 0 4 8 N ( x) 16 24 30
si x 0 si x 1 si x 2 si x 3 si x 4 si x 4
Función de distribución N(x)
Representación gráfica Cuando se considere las frecuencias acumuladas, la representación gráfica consiste en llevar a un plano cartesiano las funciones N ( x) y F ( x). 0 0.133 0.267 F ( x) 0.533 0.800 1
si x 0 si x 1 si x 2 si x 3 si x 4 si x 4
Función empírica de distribución acumulada
EJERCICIO 1 Una fabrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se realiza un test de aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 10 puntos para medir el grado de aceptación. Los puntos obtenidos en los 30 niños fueron los siguientes: 2 ,6 ,8 ,7 ,4 ,5 ,10 ,6 ,6 ,7 ,6 ,7 ,3 ,8 ,7 6, 8, 6, 5, 4, 7, 8, 5, 7, 6, 7, 2, 7, 2, 7 La muestra estuvo compuesta por igual numero de niños de ambos sexos, de 5 a 12 años de edad residentes del barrio X de la ciudad de Cali. a) Cual es la población?
b) Cual es la muestra?
c) Cual es la variable?
d) De que tipo es la variable?
e) Que clase de escala se ha utilizado en la medición de la variable? f) Construya la distribución de frecuencias absoluta y relativa. g) Construya la distribución de frecuencias acumuladas. h) Realice el grafico para la frecuencia absoluta ó relativa.
Caso 2: Datos Agrupados Suponga que se tiene la siguiente información de la duración en horas de cierto dispositivo electrónico.
“Seguramente todos los datos sean distintos y la tabla de frecuencia no resumiría en nada la información” ¿Qué se puede hacer?
Solución
Agrupar la información
Caso 2: Datos Agrupados Una entidad encargada del control de contaminación de cierto río, lleva registros sobre el oxígeno disuelto (x), expresado en mg/l; éstos se presentan a continuación:
2.6 2.5 2.4 2.1 0.5
3.6 1.7 2.2 1.8 2.3
3.1 0.3 3.4 2.9
2.6 3.1 3.7 3.8
2.7 2.6 0.8 3.5
3.9 1.3 2.3 1.6
2.4 4.3 1.9 3.2
2.7 1.5 4.5 4.4
2.5 2.8 1.2 1.4
2.3 1.8 2.2 0.7
4.0 4.2 2.2 2.8
3.2 3.5 3.0 3.3
Distribución de Frecuencias “Datos Agrupados” TABLA DE FRECUENCIA DEL REGISTRO DE OXIGENO DISUELTO DE CIERTO RÍO (mg/l) Intervalos de Clase
Marca de clase
(0.29, 0.99]
x´ i
ni
f i
N i
Fi
0.64
4
0.08
4
0.08
(0.99, 1.69]
1.34
5
0.10
9
0.18
(1.69, 2.39]
2.04
11
0.22
20
0.40
(2.39, 3.09]
2.74
13
0.26
33
0.66
(3.09, 3.79]
3.44
10
0.20
43
0.86
(3.79, 4.50]
4.15
7
0.14
50
1.0
Total
50
1.0
Pasos para datos Agrupados 1. Determinar el numero de intervalos (k) que deseamos construir: [5 < m < 20] k
2
n
2
6
64 50
k = 6
2. Determinar el rango de variación (R):
Rango Max( xi ) Min ( xi )
R = 4.5 – 0.3 R = 4.2
3. Fijar el ancho de clases (C): C
R
k
C = 4.2 / 6
C = 0.7
Pasos para datos Agrupados 4. Construir cada una de las k clases:
L1
L0
C
L2
L1
C
Min
Lk
Lk 1
Clase No i
Intervalos de Clase
1
(0.29, 0.99]
2
(0.99, 1.69]
L4 2.39 0.7 3.09
3
(1.69, 2.39]
L5 3.09 0.7 3.79
4
(2.39, 3.09]
L6 3.79 0.7 4.50
5
(3.09, 3.79]
6
(3.79, 4.50]
L0 0.29
L0
C
L1 0.29 0.7 0.99 L2 0.99 0.7 1.69 L3 1.69 0.7 2.39
xi
Marca de Calase
Pasos para datos Agrupados 4. Construir cada una de las k clases:
L1
L0
C
L2
L1
C
Min
Lk 1
Intervalos de Clase
1
(0.29, 0.99]
2
(0.99, 1.69]
L4 2.39 0.7 3.09
3
(1.69, 2.39]
L5 3.09 0.7 3.79
4
(2.39, 3.09]
L6 3.79 0.7 4.50
5
(3.09, 3.79]
6
(3.79, 4.50]
L1 0.29 0.7 0.99 L2 0.99 0.7 1.69 L3 1.69 0.7 2.39
Lk
Clase No i
L0 0.29
L0
C
5. Calcular la marca de clase ( x’ i):
x 'i
Li 1 Li
2
xi
Marca de Calase
Pasos para datos Agrupados 4. Construir cada una de las k clases:
L1
L0
C
L2
L1
C
Min
Lk 1
Intervalos de Clase
1
(0.29, 0.99]
0.64
2
(0.99, 1.69]
1.34
L4 2.39 0.7 3.09
3
(1.69, 2.39]
2.04
L5 3.09 0.7 3.79
4
(2.39, 3.09]
2.74
L6 3.79 0.7 4.50
5
(3.09, 3.79]
3.44
6
(3.79, 4.50]
4.15
L1 0.29 0.7 0.99 L2 0.99 0.7 1.69 L3 1.69 0.7 2.39
Lk
Clase No i
L0 0.29
L0
C
5. Calcular la marca de clase ( x’ i):
x 'i
Li 1 Li
2
xi
Marca de Clase
Determina el punto medio de cada clase
Pasos para datos Agrupados 6. Determinar la frecuencia asociada con cada intervalo, deben contarse los datos que pertenecen a cada uno. Intervalos de Clase
x
(0.29, 0.99]
0.64
(0.99, 1.69]
1.34
(1.69, 2.39]
2.04
(2.39, 3.09]
2.74
(3.09, 3.79]
3.44
(3.79, 4.50]
4.15
i
´
Total
ni
f i
N i
Fi
2.6 3.9 4.0 3.1 2.8 2.2 1.9 3.0 3.5 0.7
3.6 2.4 3.2 2.6 1.8 3.4 4.5 2.1 1.6 2.8
3.1 2.7 2.5 1.3 4.2 3.7 1.2 1.8 3.2 3.3
2.6 2.5 1.7 4.3 3.5 0.8 2.2 2.9 4.4 0.5
2.7 2.3 0.3 1.5 2.4 2.3 2.2 3.8 1.4 2.3
Pasos para datos Agrupados 6. Determinar la frecuencia asociada con cada intervalo, deben contarse los datos que pertenecen a cada uno. Intervalos de Clase
x
(0.29, 0.99]
0.64
(0.99, 1.69]
1.34
(1.69, 2.39]
2.04
(2.39, 3.09]
2.74
(3.09, 3.79]
3.44
(3.79, 4.50]
4.15
i
´
Total
ni
4
f i
N i
Fi
2.6 3.9 4.0 3.1 2.8 2.2 1.9 3.0 3.5 0.7
3.6 2.4 3.2 2.6 1.8 3.4 4.5 2.1 1.6 2.8
3.1 2.7 2.5 1.3 4.2 3.7 1.2 1.8 3.2 3.3
2.6 2.5 1.7 4.3 3.5 0.8 2.2 2.9 4.4 0.5
2.7 2.3 0.3 1.5 2.4 2.3 2.2 3.8 1.4 2.3
Distribución de Frecuencias “Agrupados” TABLA DE FRECUENCIA DEL REGISTRO DE OXIGENO DISUELTO DE CIERTO RÍO (mg/l) Intervalos de Clase
x´ i
ni
f i
N i
Fi
(0.29, 0.99]
0.64
4
0.08
4
0.08
(0.99, 1.69]
1.34
5
0.10
9
0.18
(1.69, 2.39]
2.04
11
0.22
20
0.40
(2.39, 3.09]
2.74
13
0.26
33
0.66
(3.09, 3.79]
3.44
10
0.20
43
0.86
(3.79, 4.50]
4.15
7
0.14
50
1.0
Total
50
1.0
Distribución de Frecuencias “Datos Agrupados” TABLA DE FRECUENCIA DEL REGISTRO DE OXIGENO DISUELTO DE CIERTO RÍO (mg/l) Intervalos de Clase
x´ i
ni
(0.29, 0.99]
0.64
4
(0.99, 1.69]
1.34
5
33 mediciones presentaron un 0.08 4 0.08 registro de oxigeno disuelto inferior o9igual a0.18 3.09mg/l 0.10
(1.69, 2.39]
2.04
11
0.22
20
0.40
(2.39, 3.09]
2.74
13
0.26
33
0.66
(3.09, 3.79]
3.44
10
0.20
43
0.86
(3.79, 4.50]
4.15
7
0.14
50
1.0
El 20% de las mediciones presentaron un 50 registro de oxigenoTotal disuelto entre 3.09mg/l y 3.79mg/l
f i
1.0
N i
Fi
¿Cuál es el porcentaje de datos que son iguales o inferiores a x ? F x F Li 1
f i C
x Li 1
¿Qué porcentaje de datos se encuentran entre a y b? f a, b F b F a
¿Qué porcentaje de datos se encuentran entre 0.5 y 1.5?
Intervalos
x´ i
ni
f i
N i
Fi
(0.29, 0.99]
0.64
4
0.08
4
0.08
(0.99, 1.69]
1.34
5
0.10
9
0.18
(1.69, 2.39]
2.04
11
0.22
20
0.40
(2.39, 3.09]
2.74
13
0.26
33
0.66
(3.09, 3.79]
3.44
10
0.20
43
0.86
(3.79, 4.50]
4.15
7
0.14
50
1.0
Total
50
1.0
¿Qué porcentaje de datos se encuentran entre 0.5 y 1.5?
Intervalos
x´ i
ni
f i
N i
Fi
0.5
(0.29, 0.99]
0.64
4
0.08
4
0.08
1.5
(0.99, 1.69]
1.34
5
0.10
9
0.18
(1.69, 2.39]
2.04
11
0.22
20
0.40
(2.39, 3.09]
2.74
13
0.26
33
0.66
(3.09, 3.79]
3.44
10
0.20
43
0.86
(3.79, 4.50]
4.15
7
0.14
50
1.0
Total
50
1.0
¿Qué porcentaje de datos se encuentran entre 0.5 y 1.5?
Intervalos
x´ i
ni
f i
N i
Fi
0.5
(0.29, 0.99]
0.64
4
0.08
4
0.08
1.5
(0.99, 1.69]
1.34
5
0.10
9
0.18
(1.69, 2.39]
2.04
11
0.22
20
0.40
(2.39, 3.09]
2.74
13
0.26
33
0.66
(3.09, 3.79]
3.44
10
0.20
43
0.86
(3.79, 4.50]
4.15
7
0.14
50
1.0
Total
50
1.0
f 0.5,1.5 F 1.5 F 0.5
0.152857 0.024 0.1288 12.88%
Representación gráfica Cuando se trate de frecuencias absolutas, se realizará la representación por medio del llamado Histograma de frecuencias. i
Intervalos
x´ i
ni
f i
1
(0.29, 0.99]
0.64
4
0.08
2
(0.99, 1.69]
1.34
5
0.10
3
(1.69, 2.39]
2.04
11 0.22
4
(2.39, 3.09]
2.74
13
0.26
5
(3.09, 3.79]
3.44
10
0.20
6
(3.79, 4.50]
4.15
7
0.14
Total
50
1.0
Representación gráfica Cuando se trate de frecuencias absolutas o relativas acumuladas, se debe calcular su función de distribución (F(x)) y representarla por medio del grafico llamado Ojiva. 0 0.08 0 x 0.29 0.7 0.10 0.08 x 0.99 0.7 0.22 0.18 0.7 x 1.69 F ( x) 0.40 0.26 x 2.39 0.7 0.66 0.20 x 3.09 0.7 0.14 x 3.79 0.86 0.7 1
para x 0.29 para 0.29 x 0.99 para 0.99 x 1.69 para 1.69 x 2.39 para 2.39 x 3.09 para 3.09 x 3.79 para 3.79 x 4.50 para x 4.50
Representación gráfica Ojiva
EJERCICIO 2 Tiempos de atención (en minutos) de pacientes en el servicio de filtro urgencias de un hospital local: 13.1, 7.1, 14.8, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 22.3, 14.5, 17.1, 14.9, 12.0, 14.0, 18.4, 10.2, 15.8, 16.5, 15.0, 17.6, 4.2, 13.4, 21.2, 14.7, 13.8, 21.0, 14.3, 11.1, 18.9, 8.3, 16.6, 11.2, 20.2, 14.4, 13.5, 18.2, 12.4, 17.0, 26.7, 15.5, 22.0, 12.9, 17.9, 7.4, 18.0, 19.8, 16.0, 21.2. a) Cual es la variable? b) De que tipo es la variable? c) Que clase de escala se ha utilizado en la medición de la variable? d) Construya la distribución de frecuencias absoluta y relativa. e) Construya la distribución de frecuencias acumuladas. e) Construya una Ojiva.