GRUPOS DE ESTUDIO
LIBRO Nº4
Matemática Libro 4 GRUPOS DE ESTUDIO
DATOS Y AZAR
Nombre
Curso Profesor
MATEMÁTICAS GE- LIBRO N°4
LIBRO 4: DATOS Y AZAR I
CONTENIDOS -
CONCEPTOS ESTADÍSTICA
-
TABLA DE FRECUENCIA
-
GRAFICOS
-
MEDIDAS DE CENTRALIZACIÓN
-
MEDIDAS DE POSICIÓN
-
MEDIDAS DE DISPERSIÓN
-
DIAGRAMA DE CAJA Y BIGOTES
Página 2
MATEMÁTICAS GE- LIBRO N°4 ESTADISTICA Estadística:
Es una rama de la matemática que comprende Métodos y Técnicas que se emplean en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de conjuntos de datos.
Población:
Es un conjunto cuyos elementos poseen alguna característica común que se quiere estudiar. Las poblaciones pueden ser finitas o infinitas.
Muestra:
Es un subconjunto de la población, que debe ser representativa de ella y aleatoria.
Variable Cualitativa:
Son aquellas en que las observaciones realizadas se refieren a un atributo (no son numéricas), por ejemplo: sexo, nacionalidad, profesión, etc. Las variables cualitativas pueden ser de 2 tipos:
Variable Cuantitativa:
Nominal: Son clasificadas en categorías y no admiten criterio de orden: estado civil (casado, viudo, divorciado), color de pelo (negro, rubio, castaño), etc. Ordinal: En ellas existe una relación de orden intuitivo: nivel educacional (básico, medio, superior), medallas deportivas (oro, plata, bronce), etc.
Son aquellas en que cada observación tiene un valor expresado por un número real, por ejemplo: peso, temperatura, salario, etc. Las variables cuantitativas pueden ser de 2 tipos:
Discretas: Discretas: Toman sólo valores enteros, por ejemplo: número de hijos, número de departamentos en un edificio, etc. Continuas: Continuas: Susceptibles de tomar cualquier valor, por ejemplo: peso de un estudiante, estatura de un recién reci én nacido, etc.
EJEMPLOS 1.
Si se quiere hacer un estudio estadístico de las alturas de los alumnos de los cuartos medios A, B y C de un colegio, que tienen entre 16 y 18 años de edad, entonces ¿cuál sería la población de este estudio estadístico?
Página 3
MATEMÁTICAS GE- LIBRO N°4 2.
En estadística, ¿qué se entiende por muestra de la población?
3.
Se pregunta a alumnos de un curso por el deporte que prefieren, entre fútbol, basquetbol, tenis, natación o ciclismo; ¿qué tipo de variable estadística se esta trabajando?
4.
¿Cuál de los siguientes enunciados representa el uso de una variable cualitativa? Recuento del número de ventanas de un edificio Edades de los alumnos de un colegio Profesiones de los habitantes de una comuna Salario obtenido por los trabajadores de una empresa Las temperaturas máximas alcanzadas en el mes de Enero
5.
El peso de los pacientes de un consultorio médico, ¿a qué tipo de variable estadística corresponde?
6.
¿Cuál(es) de las siguientes variables es (son) cuantitativas discretas? -
Número de edificios en la comuna de providencia Metros cuadrados de Parque en la comuna de Ñuñoa Distancia de los alumnos de un colegio a su hogar Número de habitantes de las comunas de Santiago
RESPUESTAS: 1. 2. 3. 4. 5. 6.
Los alumnos de 4º A, B y C Un subconjunto de la población, aleatorio y representativo Cualitativa nominal Profesiones de los habitantes de una comuna Cuantitativa y continua Número de edificios en la comuna de providencia Número de habitantes de las comunas de Santiago
Página 4
MATEMÁTICAS GE- LIBRO N°4 TABULACIÓN DE DATOS Frecuencia (f): Número de veces que se repite un dato (también se le denomina frecuencia absoluta). Frecuencia acumulada (F): Es la que se obtiene sumando ordenadamente las frecuencias absolutas hasta la que ocupa la última posición. Frecuencia relativa (fr): Es el cuociente entre la frecuencia absoluta de uno de los valores de la variable y el total de datos, expresada en tanto por ciento. Frecuencia relativa acumulada (frac): Es aquella que se obtiene ordenadamente la frecuencia relativa hasta la que ocupa la última posición.
sumando
Marca de clase: Valor representativo de un intervalo, se calcula como el promedio de los límites aparentes, inferior y superior de éste. EJEMPLOS 1.
2.
La tabla adjunta, muestra la cantidad de televisores por hogar que hay en un condominio de 20 casas. ¿En cuántas casas hay menos de 4 televisores? Nº de Televisores por casa
Frecuencia Absoluta
2 3 4 5
4 6 8 2
Un alumno obtuvo las siguientes notas en matemática: 7; 2; 6; 6; 5; 4; 7; 6; 6 y 5. ¿Cuál es la frecuencia relativa a la nota 6?
Página 5
MATEMÁTICAS GE- LIBRO N°4 3.
El límite superior de un intervalo es 18 y su marca de clase es 16, entonces su límite inferior es
4.
La tabla adjunta, muestra la distribución de frecuencias del número de bicicletas (x) que tiene cada uno de los 25 alumnos de un curso. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? x 1 2 3 4
I) II) III)
5.
f 5 8 A 8
fac 5 13 17 25
fr 20% B% 16% 32%
fr ac 20% 52% 68% C%
El valor de A es 6. El 52% de los alumnos tiene una o dos bicicletas. El valor de C es 100.
La siguiente tabla estadística se refiere a las edades de personas que asisten a clases de Yoga. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s) con respecto a ella? I) II) III)
13 personas que asisten a estas clases tienen 20 años o menos. La marca de clase del intervalo 3 es 22,5. El 50% de estas personas tienen a lo menos 25 años.
RESPUESTAS: 1. 10
Página 6
2. 0,4
3. 14
4. II y III
5. II y III
Edad
frecuencia
[10, 15[
5
[15, 20[ [20, 25[
8 12
[25, 30[ [30, 35[
15 10
MATEMÁTICAS GE- LIBRO N°4 MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son indicadores que representan valores numéricos en torno a los cuales tienden a agruparse los valores de una variable estadística. Los principales son: la media aritmética, la mediana y la moda. Media Aritmética (x) Es el cuociente entre la suma de todos los datos y el número de datos. Si se tienen n datos; x1, x2, x3,…, xn, su media aritmética es x =
x1 + x2 + x3 + ... + x n n
Media Aritmética para datos organizados en una tabla de frecuencias Si los datos son; x1, x 2, x 3,…, xn, y las frecuencias respectivas son f 1, f 2, f 3,…, f n, entonces la media aritmética es
x =
x1 · f1 + x2 · f2 + x3 · f3 + ... + xn · fn f1 + f2 + f3 + ... + fn
Dato x1 x2 x3
Frecuencia f 1 f 2 f 3
xn
f n
Media Aritmética para datos agrupados en intervalos Si las marcas de clases son; c1, c2, c3,…, cn, y las frecuencias de los intervalos respectivos son f 1, f 2, f 3,…, f n, entonces la media aritmética es
x =
c1 · f1 + c2 · f2 + c3 · f3 + ... + cn · fn f1 + f2 + f3 + ... + fn
EJEMPLOS 1.
La media aritmética del siguiente conjunto de datos: 10; 8; 6; 0; 8; 3; 2; 2; 8; 0, es
Página 7
MATEMÁTICAS GE- LIBRO N°4 2.
La media aritmética entre los siguientes números: 0,1; 0,1; 0,22; 0,23, es
3.
La siguiente tabla de frecuencia, corresponde a la estatura de 10 personas. ¿Cuál es la media aritmética de las estaturas? Altura (m) 1,50 1,60 1,70
4.
La siguiente tabla muestra la distribución de frecuencias de las edades de 10 personas (agrupadas en intervalos). ¿Cuál es el promedio de sus edades? Edades de personas (en años)
[10, 20[ [20, 30[ [30, 40[ [40, 50[ [50, 60[
5.
f 3 2 5
Marca de clase
Frecuencia absoluta
15
2
35
2 1 1
55
La tabla adjunta contiene el número de minutos que un grupo de adolescente se conecta diariamente a las redes sociales. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III)
El intervalo de mayor frecuencia tiene marca de clase 75. La media de la muestra es 79,5. El 40% de los encuestados se conecta más de 90 minutos diarios.
RESPUESTAS: 1. 4,7 2. 0,062 Página 8
3. 1,62
4. 30 5. I y II
Tiempo (en minutos)
Frecuencia absoluta
[0, 30[ [30, 60[ [60, 90[ [90, 120[ [120, 150[
4 8 12 10 6
MATEMÁTICAS GE- LIBRO N°4 MODA (Mo) Es el dato que se repite mayor cantidad de veces en una muestra. MODA PARA TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS POR INTERVALOS
Para este caso la moda corresponde al dato que tiene una frecuencia mayor
MODA PARA TABLA DE FRECUENCIA DE DATOS AGRUPADOS POR INTERVALO
En una tabla de frecuencia de datos agrupados por intervalo es imposible saber con exactitud el valor de la moda, sin embargo se puede encontrar un intervalo modal y un valor estimativo para la esta. Intervalo Modal: Es el intervalo al que le corresponde una mayor frecuencia. Moda: En una tabla de frecuencia de datos aplicados por intervalos se puede encontrar un valor estimativo para la moda. Para determinar este valor estimativo se utiliza la siguiente fórmula: MO
=
LM
O
+
é D ù A ê ú×A êë DB + DA úû
LM : extremo inf erior del int ervalo modal 0
DA : diferencia entre la frecuencia del int ervalo modal y la clase que lo precede DB : diferencia entre la frecuencia del int ervalo modal y la clase que lo sigue A : amplitud de la clase modal
OSERVACIÓN:
La muestra puede ser: Amodal: Si no hay dato que tenga mayor frecuencia que el resto de ellos. Unimodal: Si existe un solo dato que tenga mayor frecuencia. Bimodal: Si existen dos datos que tienen la misma frecuencia y corresponde a la mayor. Polimodal: Si existen mas de 2 datos que tienen igual frecuencia y corresponde a la mayor. EJEMPLOS 1.
La tabla adjunta, muestra los resultados de una encuesta realizada a 100 personas respecto al número de hermanos. ¿Cuál es la moda?
Página 9
Número de Hermanos
f
0 1 2 3 4 5
19 18 19 14 20 10
MATEMÁTICAS GE- LIBRO N°4 2.
La moda del siguiente conjunto de datos: 3, 7, 6, 5, 5, 7, 6, 8 y 7 es
3.
De acuerdo al conjunto de datos: 1; 2; 2 y 4, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) Si se agrega un 1, la muestra es bimodal. II) Si se agrega un 1 y un 4, la muestra es amodal. III) Si se agrega un 1; 4 y 5, la muestra es polimodal.
4.
La tabla adjunta muestra los resultados de una encuesta referente al número de pantallas que tienen en su casa un grupo de personas. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? Número de Pantallas [0 – 2[ [2 – 4[ [4 – 6[ [6 – 8] I) II) III)
La muestra tiene 1 término central. El intervalo modal es [2 – 4[. El valor de la moda de la muestra es 5.
RESPUESTAS: 1. 4 2. 7 3. I, II y III
Página 10
Frecuencia
4. Ninguna
1 3 4 2
MATEMÁTICAS GE- LIBRO N°4 MEDIANA (Me) Para determinar la mediana se deben ordenar los datos, preferentemente en forma creciente el dato que ocupa la posición central de la muestra corresponde a la mediana. En cuanto al número de datos de la muestra, existen dos posibilidades: Que el número de datos sea impar: En este caso solo se tendrá un término central, el que corresponde a la mediana de la muestra. Que el número de datos sea par: En este caso se tendrán dos términos centrales, la mediana corresponderá al promedio de ellos. MEDIANA PARA TABLA DE FRECUENCIA DE DATOS NO AGRUPADOS POR INTERVALO
Para determinar la posición de la mediana se enfrentan dos situaciones diferentes Nº Impar de Datos : Un término central Posición de la mediana:
PM
e
=
N + 1 2
Nº Par de Datos : Dos términos centrales, la mediana corresponde al promedio de ellos, la posición de estos término será: P = T1
N 2
y
P = T2
N +2 2
MEDIANA PARA TABLA DE FRECUENCIA DE DATOS AGRUPADOS POR INTERVALO
Se deberá distinguir entre dos posibles preguntas: Intervalo que Contiene la Mediana: Para este caso se determina la posición de la mediana y luego se busca el intervalo correspondiente a la posición. Mediana: Para estimar el valor de la mediana en una tabla de intervalos se puede usar la siguiente fórmula: Me = LM
e
N 2 Fi - 1 + A f i
N : Número total de datos. LM : extremo inferior del intervalo que contiene la mediana. e
Fi-1 : frecuencia acumulada hasta el intervalo anterior al que contiene la mediana. f i
: frecuencia absoluta del intervalo que contiene la mediana.
A
: amplitud del intervalo que contiene la mediana.
Página 11
MATEMÁTICAS GE- LIBRO N°4 EJEMPLOS 1.
Se encuestaron 8 familias y el número de personas por familia dio los siguientes resultados: 7; 3; 6; 2; 4; 6; 4 y 6. Entonces, la mediana es
2.
De los siguientes datos: p + 2q, 8p + 16q, 10p + 20q, 6p + 12q, 2p + 4q y 4p + 8q, con p < q y ambos positivos, ¿cuál es la mediana?
3.
La siguiente tabla representa las edades de un grupo de personas. Con respecto a esta información determine si las siguientes afirmaciones son verdaderas o falsas Edad 17 18 19 20 Total
___ 22 personas tienen 19 años o menos. ___ la moda es 18 años. ___ el 33,3 % tiene 18 años. ___ la media aritmética es 18,6 años.
f 5 10 7 8 30
___ la mediana es 18 años.
4.
En la siguiente tabla, ¿cuál(es) de la(s) siguientes afirmaciones es (son) FALSA(S)? I) II) III)
El intervalo donde se encuentra la mediana es [20, 30[. La mediana es aproximadamente 20,6 . El dato mayor de la muestra es 40. Edades
[0, 10[
[10, 20[
[20, 30[
[30, 40[
f
1
2
3
4
RESPUESTAS 1. 5 2. 5p + 10q Página 12
3.
V-V-V-V-F
4. II y III
MATEMÁTICAS GE- LIBRO N°4 GRÁFICOS REPRESENTACIÓN GRÁFICA E INTERPRETACIÓN DE GRÁFICOS
A menudo, una representación gráfica de una distribución de frecuencias nos da una mejor idea de un estudio estadístico que un cuadro con números. Existen distintos tipos de gráficos, algunos de los más utilizados son GRÁFICO DE BARRAS
Utilizado en variables de tipo cualitativa y cuantitativa discreta, este gráfico (fig. 1), consiste en una serie de barras que indican a los datos, cuyas alturas representan la frecuencia absoluta de estos. Gráfico de Barras
X Dato 1 Dato 2 Dato 3 Dato 4 Dato 5
f A B C D E
) f (
A C
a i c n e u c e r F
fig. 1
D B E Dato 1
Dato 2
Dato 3 Dato 4
Dato 5
Dato (x)
GRÁFICO CIRCULAR
El gráfico circular (fig.2), es utilizado en variables de tipo cualitativa y cuantitativa discreta. El gráfico consiste en un círculo dividido en secciones proporcionales al tamaño de la muestra y la frecuencia de los datos. X Dato 1 Dato 2 Dato 3 Dato 4 Dato 5
f a b c d e
fr a% b% c% d% e%
Gráfico Circular
f x° = total 360°
Dato 5 Dato 4
Dato 1
fig. 2
f fr = total 100% Dato 3
HISTOGRAMA
Dato 2
Se utiliza para representar a los datos agrupados en intervalos (fig3). El histograma se elabora representando a los datos en el eje horizontal y a las frecuencias en el eje vertical, y trazando barras cuyas bases equivalgan a los intervalos de clase y cuyas alturas correspondan a las frecuencias de clase. d b fig. 3 x f c Intervalo 1 a a Intervalo 2 b Intervalo 3 c 1 2 3 4 Intervalo 4 d Intervalos a i c n e u c e r F
Página 13
MATEMÁTICAS GE- LIBRO N°4 POLÍGONO DE FRECUENCIAS
Al igual que el histograma, este gráfico (fig. 4), se utiliza en datos agrupados en intervalos. Para confeccionarlo, debemos unir con una recta a los puntos donde se intersectan la marca clase y la frecuencia de los intervalos. Para “anclar” el polígono al eje horizontal, debemos
agregar un intervalo de frecuencia cero, antes del primer y después del último intervalo. Polígono de frecuencias
X Intervalo 1 Intervalo 2 Intervalo 3 Intervalo 4
C Clase Clase Clase Clase
1 2 3 4
Frecuencia (f) 6
f a b c d
a5 c4 d3 b2
fig. 4
1 0 Clase
Clase 1 Clase 2
Clase 3
Clase 4
Clase
Clase (c)
POLÍGONO DE FRECUENCIAS ACUMULADAS U OJIVA
Este gráfico (fig. 5), se representa uniendo puntos referidos al límite superior y frecuencia acumulada de cada intervalo. Para “anclar” la Ojiva al eje horizontal, se posiciona en el límite inferior del primer intervalo. Polígono de frecuencias acumuladas (F) F
X [a, b[ [b, c[ [c, d[ [d, e[
F A B C D
D6 C5 4 3
fig. 5
2 1 B 0 A
a
Página 14
b
c
d
e
X (lim.sup.)
MATEMÁTICAS GE- LIBRO N°4 EJEMPLOS 1.
La tabla adjunta, muestra una distribución de frecuencias de las edades, en años, de los alumnos de un colegio que cursan 4 to medio. Edades (años)
Nº de alumnos
16 17 18 19 20
3 9 12 6 0
¿Cuál(es) de los siguientes gráficos puede(n) representar los datos de la tabla de distribución de frecuencia? I) de barras
II) poligonal Nº de alumnos
Nº de alumnos 12 9 6 3
12 9 6 3 0
2.
16 17 18 19 20 Edad (años)
III) circular 19 años 20%
16 años 10% 30%
17 años
40% 16 17 18 19 20 Edad (años)
18 años
Según el histograma de la figura y su tabla de frecuencia, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? Nº de alumnos
18
[16 – 18[ [18 – 20[
12 18
12
I) II) III)
Página 15
Nº de alumnos
Distancia de la casa al colegio en km
La amplitud de los intervalos es 2. Las marcas de clases son 17 km y 19 km. El promedio o media aritmética es 18.
16 17 18 19 20 km
MATEMÁTICAS GE- LIBRO N°4 3.
El gráfico de Ojiva de la figura, muestra el peso de niños al nacer, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III)
36 niños al nacer pesan menos de 4 kg. 4 niños al nacer sus pesos están en el intervalo [4 - 4,5[. El 90% de los niños pesan menos de 4 kg. al nacer. F( frecuencia acumulada) 40 6 36 5 28 3 2 12 1 0 4
2
RESPUESTAS: 1. I, II y III Página 16
2,5
2. I y II
3
3,5
4
3. I, II y II
4,5
Peso (kg.)
MATEMÁTICAS GE- LIBRO N°4 MEDIDAS DE POSICIÓN Las medidas de posición dividen la distribución en partes iguales y sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra. Así en la PSU al puntaje obtenido en la prueba se agrega el percentil en el que se encuentra, con esto el resultado del individuo queda clasificado dentro la población (individuos que rindieron PSU). En economía se utiliza principalmente para definir sectores socioeconómicos según ingreso per cápita familiar (por ejemplo quintiles). Para determinar las medidas de posición es necesario que los datos se encuentren ordenados en forma creciente. Las medidas de posición, más utilizadas son: Cuartiles, Quintiles, Deciles y Percentiles. Así como la mediana divide la distribución en dos partes iguales, existen tres cuartiles, cuatro quintiles, nueve deciles y noventa y nueve percentiles que dividen en cuatro, cinco, diez y cien partes iguales a la distribución. CUARTILES Los cuartiles son 3, dividen los datos ordenados en 4 partes. Los cuartiles son datos bajos los cuales se acumula el 25%, 50% y el 75% de los datos estudiados, se representan como Q 1, Q2 y Q3 respectivamente. OBSERVACIÓN : Q2 coincide con la mediana.
QUINTILES Los quintiles son 4, dividen los datos ordenados en 5 partes. Los quintiles son datos bajos los cuales se acumula el 20%, 40%, 60% y el 80% de los datos estudiados. DECILES Los deciles son 9, dividen los datos ordenados en 10 partes. Los deciles son datos bajos los cuales se acumula el 10%, 20% ,… y el 90% de los datos estudiados PERCENTILES Los percentiles son 99, dividen los datos ordenados en 100 partes. Los percentiles son datos bajos los cuales se acumula el 1%, 2%, 3%, 4%… y el 99% de los datos estudiados.
Página 17
MATEMÁTICAS GE- LIBRO N°4 Si el número de datos de la muestra o población es N, entonces para determinar el LUGAR en el que se ubica la medida de posición solicitada, existe una relación que depende de la medida de posición que se desee calcular. Medida de Posición Posición (lugar)
Cuartil PQ
K
=K
N+1 4
Quintil PK
K
=K
N+1 5
PQ
, indica la posición del cuartil K, siendo K = 1, 2, 3
PK
, indica la posición del quintil K, siendo K = 1, 2, 3, 4
Decil PD = K K
N +1 10
Percentil PP = K K
N +1 100
K
K
PD
, indica la posición del decil K, siendo K = 1, 2, 3 ,4 , 5, 6, 7, 8, 9
PP
, indica la posición del percentil K, siendo K = 1, 2, 3, 4,…………..,99
K
K
Para determinar una medida de posición para datos no agrupados, se procede de la siguiente manera: -
Ordenar los datos en forma creciente Determinar el lugar que ocupa la medida de posición buscada. Respecto a la posición tenemos dos posibilidades de resultados: Número entero: el valor será el dato que ocupa ese lugar. Número decimal: el valor será el promedio entre los datos que se encuentra a la izquierda de la posición con el dato que se encuentra a la derecha.
DATOS TABULADOS Si los datos se encuentran tabulados en una tabla de frecuencia, se debe proceder de manera similar a la utilizada para encontrar la mediana, se busca en la columna de frecuencia acumulada el lugar que corresponde a la media de posición buscada y de esta manera se determina el dato correspondiente. OBSERVACIÓN Cuando los datos se encuentren en una tabla de intervalos solo indicaremos el intervalo al que pertenece la medida de posición buscada. EJEMPLOS 1.
Para la variable números de televisores por hogar, se obtuvo la distribución que aparece en la tabla adjunta. El primer, segundo y tercer cuartil son, respectivamente, N° de televisores por hogar 0 1 2 3 4 5
Página 18
Frecuencia 26 22 30 54 30 38
MATEMÁTICAS GE- LIBRO N°4 2.
3.
La tabla muestra una parte de la Puntaje Corregido (PC) a Puntaje Estándar (PS) para un Facsímil de matemática con 80 preguntas y sus correspondientes percentiles. ¿Qué significado tiene que el puntaje de un alumno se encuentre en el percentil 89? PS
Percentil
43 44 45 46 47
623 626 629 633 640
87 88 88 89 90
El ingreso de Eugenio está ubicado en el tercer intervalo quintílico. Respecto a esta información, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III)
4.
PC
Su ingreso puede igualarse a la mediana. Su valor puede ser menor al valor correspondiente al tercer cuartil. Su ingreso se ubica entre el percentil 40 y el percentil 60.
El valor de x en una muestra está ubicado entre el segundo y tercer decil. ¿Cuál(es) de las siguientes afirmaciones respecto a x es (son) siempre verdadera(s)? I) II) III)
El valor de x es inferior al primer cuartil. El valor de x es inferior al segundo quintil. El valor de x es superior al percentil 28.
RESPUESTAS 1. 2. Q1 = 2 El 89% de los alumnos no lo supera Q2 = 3 Q3 = 4 Página 19
3. I , II y III
4. Solo II
MATEMÁTICAS GE- LIBRO N°4 MEDIDAS DE DISPERSIÓN Las medidas de dispersión, o medidas de variabilidad, indican la dispersión de los valores de la muestra respecto a su valor central. Mientras menor sea la medida de dispersión mas homogénea será la muestra. RANGO
Rango o recorrido es la diferencia entre el mayor y el menor de los datos. DESVIACIÓN ESTÁNDAR o TÍPICA
Es una medida de dispersión y nos indica cuánto tienden a alejarse los datos del promedio aritmético. Para calcular la desviación estándar () se utiliza la siguiente fórmula: Para datos no agrupados =
Para datos agrupados en tablas de frecuencia
=
(x1
f1 · (x1
x)2 + (x2
x)2 + ... + (xn n
x)2
x)2 +f2 · (x2 x)2 + ... + fn · (x n f1 + f2 + f3 + ..... + fn
x)2
Donde xi : dato que se encuentra en la posición i f i : frecuencia del dato de posición i OBSERVACIÓN:
Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de ellos, en lugar de x i. PROPIEDADES
Sea x una variable aleatoria y k un número real 1)
(x) 0 : La desviación estándar es un número real no negativo
2)
3)
4)
(k) = 0 : Si todos los datos de la muestra son iguales, la desviación estándar es 0. (x + k) = (x) : Al sumar a todos los datos de la muestra un mismo valor, la desviación estándar se mantiene constante. (kx) = k· (x) : Al multiplicar todos los datos de la muestra por un mismo valor k, la nueva desviación estándar será k veces la desviación estándar original.
Página 20
MATEMÁTICAS GE- LIBRO N°4 VARIANZA
Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar. Para datos no agrupados
Para datos agrupados en tablas de frecuencia
Var(x) =
Var(x) =
2
=
(x1
= f1(x1
2
x)2 + (x2
x)2 + ... + (xn n
x)2
x)2 + f2 (x2 x)2 + ... + fn (xn f1 + f2 + f3 + ... + f n
x)2
Siendo xi : dato que se encuentra en la posición i f i : frecuencia correspondiente al dato de posición i OBSERVACIÓN:
Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de ellos, en lugar de x i. PROPIEDADES DE LA VARIANZA
Sea x una variable aleatoria y k un número real 1) Var (x) 0
: La varianza es un número real no negativo
2) Var (k) = 0
: Si todos los datos de la muestra son iguales, la varianza es 0.
3) Var (x + k) = Var (x) : Al sumar a todos los datos de la muestra un mismo valor, la varianza se mantiene constante. 4) Var (kx) = k2 · Var(x) : Al multiplicar todos los datos de la muestra por un mismo valor k, nueva varianza será igual al producto del cuadrado de k por la varianza original.
EJEMPLOS 1.
El rango en el conjunto de datos {3, 7, 8, 11, 1, 10, 15, 20, 21, 22, 24, 23} es
Página 21
MATEMÁTICAS GE- LIBRO N°4 2.
¿Cuál(es) de las siguientes proposiciones es (son) verdadera(s)? I) II) III)
3.
Con respecto a la tabla de frecuencias adjunta, ¿cuál(es) de la siguientes proposiciones es (son) verdadera(s)? I) II) III)
4.
La desviación estándar es un número real no negativo. La diferencia entre un dato y el promedio de la muestra puede ser negativa. El rango es una medida de dispersión que puede ser negativa.
El promedio es 6. El total de datos es 5. La desviación estándar es
12,8
.
Edad (años) [0 – 4[ [4 – 8[ [8 – 12[
Nº de niños 2 1 2
En una familia las edades de sus hijos son 3, 4, 7, 9 y 12 años. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III)
Si todos aumentaran un año, entonces la media sería 5 unidades mayor. La muestra es amodal. La desviación estándar es de 10,8 años.
RESPUESTAS 1. 23 2. I y II 3. I, II y III 4. II y III Página 22
MATEMÁTICAS GE- LIBRO N°4 GRÁFICO DE CAJA Y BIGOTES El diagrama de caja es una representación gráfica basada en cuartiles, que ayuda a ilustrar una muestra de datos. Para elaborar este gráfico, sólo se necesitan cinco datos: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo de la muestra. TIPOS DE MUESTRA
Muestra Simétrica: Los valores intercuartílicos están igualmente dispersos. Valor mínimo
Q1
Q2
Q3
Valor máximo
Muestra Positivamente Asimétrica: Los valores más grandes se encuentran más dispersos que los más pequeños. Valor mínimo
Q1
Q2
Q3
Valor máximo
Muestra Negativamente Asimétrica: Los valores más pequeños se encuentran más dispersos que los más grandes. Valor mínimo
Q1
Q2
Q3
Valor máximo
EJEMPLO: 1. ¿Qué valores deben ser considerados de la muestra adjunta para construir un diagrama de caja y bigotes? 22 32 32 42 40 24 43 24 37 29 40
2. ¿A qué tipo de muestra se asemeja?
RESPUESTAS 1.
Valor mínimo: 22 Valor Máximo: 43
Página 23
Q1=24
Q2=32
Q3=40 2. Simétrica
MATEMÁTICAS GE- LIBRO N°4 EJERCICIOS ADICIONALES DE ESTADÍSTICA Y PROBABILIDAD
1.
Determine la veracidad o falsedad de las siguientes proposiciones a) ____ El número de calzado es una variable cualitativa. b) ____ El número de hermanos de un individuo es una variable cuantitativa continua. c) ____ La preferencia de un equipo de fútbol es una variable cualitativa. d) ____ La moda del conjunto {2,3,3,5,5,5,7,7,8,9} es 5. e) ____ La media aritmética entre a, b y c es
a+b+c 2
.
f) ____ La mediana del conjunto {3,5,7,9,11,12} es 8. g) ____ La mediana del conjunto {3,5,7,9,11} es 7. h) ____ El percentil 50 coincide con la moda de los datos en un conjunto. i) ____ El cuartil 2 coincide con la mediana. j) ____ En un estudio estadístico la cantidad de datos que está entre los cuartiles 1 y 3, corresponde al 75% de los datos. k) ____ Al realizar un estudio estadístico, el conjunto de todos los elementos que son objeto de estudio se llama muestra. l) ____ De las notas de un curso en una prueba se sabe que el percentil 75 corresponde a una nota 5, entonces se puede concluir que el 75% obtuvo nota 5 o menos. m) ____ El rango de los datos {2,3,3,8,6,7,19,11,17} es 15. n) ____ En un conjunto de datos la moda es siempre única. ñ) ____ La mediana no siempre es coincidente con alguno de los datos del conjunto dado.
Página 24
MATEMÁTICAS GE- LIBRO N°4 2.
La siguiente tabla muestra las notas de una prueba de química correspondiente a un curso. Notas
Frecuencia
1,0 2,0 3,0 4,0 5,0 6,0 7,0
1 4 5 6 9 12 8
Frecuencia Acumulada
Complete la tabla y responda las siguientes preguntas: a) b) c) d)
3.
4.
¿Cuántos alumnos rindieron la prueba? ¿Cuántos alumnos obtuvieron nota igual o inferior a 5? ¿Cuántos alumnos obtuvieron nota inferior a 4? ¿Cuántos alumnos obtuvieron nota superior a 6?
Dada la siguiente tabla de frecuencias, determine los valores de a, b, c, d, e, f, g, h, i, j, k Xi
Frecuencia Absoluta
Frecuencia Acumulada
Frecuencia Relativa
X1
12
d
0,08
X2
12
e
h
X3
a
48
0,16
X4
21
f
0,14
X5
15
84
i
X6
b
114
j
X7
21
135
k
X8
c
g
l
De los datos del conjunto A = {6,7,7,3,4,1,7,5}, determine las medidas de centralización de los valores.
Página 25
MATEMÁTICAS GE- LIBRO N°4 5.
La siguiente tabla muestra el precio de una revista en diferentes locales comerciales. Local 1 $ 940
Local 2 $ 1100
Local 3 $ 845
Local 4 $ 820
Local 5 $ 745
Determinar: a) El promedio. b) La moda.
6. Encuentre la Media Aritmética, Moda y Mediana de los datos de tabla adjunta.
Página 26
Notas
Frecuencia
7,0 6,0 5,0 4,0 3,0 2,0 1,0
6 8 15 10 12 8 2
MATEMÁTICAS GE- LIBRO N°4 Ejercicios Selección Múltiple (Preguntas Oficiales publicadas por Demre) 1.
La tabla adjunta muestra las edades de 220 alumnos de un colegio. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III) A) B) C) D) E)
2.
Solo I Solo II Solo I y II Solo II y III I, II y III
Edad (en años) Alumnos
15 50
16 40
17 60
18 50
19 20
El gráfico circular de la figura muestra las preferencias de 30 alumnos en actividades deportivas. ¿Cuál(es) de las siguientes afirmaciones es (son) correcta(s)? I) II) III) A) B) C) D) E)
3.
La moda es 17 años. La mediana es mayor que la media (promedio). La mitad de los alumnos del colegio tiene 17 o 18 años.
La frecuencia relativa porcentual del grupo de fútbol es de 40%. La frecuencia relativa porcentual del grupo de básquetbol es de 30%. La mitad del grupo no prefirió fútbol ni tenis.
Solo I Solo II Solo I y II Solo II y III I, II y III
Fútbol 12
Básquetbol 9
Tenis 3 Atletismo 6
La tabla adjunta muestra la distribución de los puntajes obtenidos por los alumnos de un curso en una prueba de matemática. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III) A) B) C) D) E)
El total de alumnos que rindió la prueba es 40. La mediana se encuentra en el intervalo [20 – 29]. El intervalo modal (o clase modal) es el intervalo [30 – 39].
Solo I Solo II Solo III Solo I y III I, II y III
Página 27
Intervalos de puntaje
Frecuencia
[10 – 19] [20 – 29] [30 – 39] [40 – 49] [50 – 59]
6 8 12 5 9
MATEMÁTICAS GE- LIBRO N°4 4.
Una misma prueba se aplica a dos cursos paralelos. En uno de ellos, con 20 estudiantes, la nota promedio fue 6 y, en el otro, con 30 estudiantes, la nota promedio fue 5. Entonces, la nota promedio correspondiente al total de alumnos de ambos cursos es A) B) C) D) E)
5.
5,7 5,6 5,5 5,4 5,3
Se ha lanzado un dado 100 veces y se obtuvo la siguiente tabla: Cara Frecuencia
1 13
2 15
3 17
4 16
5 20
6 19
¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III) A) B) C) D) E)
6.
El 50% de las veces se obtuvo un número par. El 30% de las veces resultó 1 o 3. El 20% de las veces salió el número 5.
Solo III Solo I y II Solo I y III Solo II y III I, II y III
A los 45 alumnos de un curso se les consultó acerca de cuál era su deporte favorito. La tabla adjunta muestra los resultados obtenidos. Para estos datos, ¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? I) II) III) A) B) C) D) E)
La moda es 19. La media aritmética (o promedio) es 11,25. La mediana es 11.
Solo I Solo I y II Solo II y III I, II y III Ninguna de ellas.
Página 28
Deporte
N° de alumnos
Tenis Básquetbol Fútbol Natación
9 13 19 4
MATEMÁTICAS GE- LIBRO N°4 7.
Sea el conjunto A formado por elementos a 1, a2, a3, a4, a5 y a6, con desviación estándar y varianza 2. ¿Cuál de las siguientes afirmaciones es verdadera? A) y 2 nunca son iguales. B) 2 nunca será cero. C) Siempre 2 > 0. D) Si los elementos de A son impares consecutivos, entonces = 1. E) Si los elementos de A son números positivos distintos entre sí, entonces mayor que 0.
8.
Si a, b y c son números enteros positivos cuya desviación estándar es desviación estándar de na, nb y nc, con n un número entero positivo es
es
, entonces la
A) n2 B) C) n D) n E) 3n 9.
Se tienen los puntajes del total de estudiantes de un curso en un examen de matemática, los cuales se agrupan posteriormente en intervalos como se muestra en la tabla adjunta. ¿Cuál de las siguientes afirmaciones es FALSA? A) B) C) D) E)
39 alumnos obtuvieron al menos de 20 puntos. 45 alumnos rindieron el examen. La mediana de los puntajes se encuentra en el intervalo [30,39]. 6 alumnos obtuvieron a lo más de 19 puntos. Se puede deducir que la moda de los puntajes se encuentra en el intervalo [40,50]. Puntaje Nº de alumnos [0,9] 2 [10,19] 4 [20,29] 7 [30,39] 15 [40,50] 17
10. Al observar los grupos de datos P y Q de la tabla adjunta, se puede deducir que P 10 12 13 13 15 16 Q 10 12 13 13 15 17 A) B) C) D) E)
Solo las medias aritmética y moda de P y Q son iguales. Las medias aritméticas y las medianas de P y Q son iguales. Las medianas y las modas de P y Q son iguales. Las medias aritméticas, las medianas y las modas de P y Q son iguales. Las medias aritméticas, las medianas y las modas de P y Q son distintas.
Página 29
MATEMÁTICAS GE- LIBRO N°4 RESPUESTAS EJERCICIOS ADICIONALES I.
Estadística
1.
a) F
b) F
c) V
d) V
e) F
f) V
j) F
k) F
l) V
m) F
n) F
ñ) V
2.
3.
4.
5.
6.
a) 45
b) 25
c) 10
g) V
h) F
i) V
d) 8
a = 24, b = 30, c = 15, d = 12, e = 24, f = 69, g = 150, h = 0,08, i = 0,10, j = 0,20, k = 0,14, l = 0,10
a) La moda es 7.
b) La mediana es 5,5.
a) El promedio es $ 890.
b) Amodal.
a) Promedio es 4,24 aprox. b) La moda es 5.
c) La media aritmética es 5.
c) La mediana es 4.
Claves Ejercicios Selección Múltiple Nº Pregunta Clave
Página 30
1 2 3 4 5 6 7 8 9 10 E E D D E E E D E C