1
Estatística & Probabilidade
A u l a 03: 0 3: Res Resu u mo de dados dado s e M edi edidas das de posiç posi ção. Problema 01. A seguir temos uma lista de possibilidades para classificar variáveis, em fun ção da escala adotada. (Observe a similaridade com a apresentada na aula anterior)
(a)
Razão
(b)
Ordinal
(c)
(d)
(e)
( ) Salários dos empregados empregados de uma indústria. indústria. ( ) QI de um individuo. ( ) Número de respostas certas certas de alunos alunos num teste teste com dez items.
Razão
( ) Opinião de consumidores sobre um determinado produto.
intervalar
( ) Porcentagem da receita receita de municípios aplicada em educação.
razão
( ) Temperatura Temperatura diária da cidade de João Monlevade. Monlevade. (f)
nominal
(g)
intervalar
( ) Opinião dos empregados da companhia MB sobre a realização ou não de cursos obrigatórios de treinamento.
Problema 02. Informações sobre estado civil, grau de instrução, número d e filhos, salario (expresso como fração do salario mínimo), idade (medida em anos e meses) e procedência de 36 empregados da seção de orçamento da companhia MB são apresentadas na seguinte tabela:
N º E stad stado o Civil
Grau Gr au de
N ºde
Sal ár i o
I dade
Reg egii ão de de
I n st strr u ção
filhos
(x sal. sal. M in .)
anos
meses pr ocedên ci cia a
1
Solteiro Ensino fundamental
-
4,00
26
03
Capital
2
Casado
Ensino médio
1
4,56
32
10
Interior
3
Casado
Ensino fundamental
2
5,25
36
05
Outra
4
Solteiro Superior
-
5,73
20
10
Outra
Dr. Francis Córdova
2
Estatística & Probabilidade
5
Solteiro Ensino médio
-
6,26
40
07
Outra
6
Casado
Ensino fundamental
0
6,66
28
00
Interior
7
Solteiro Ensino fundamental
-
6,86
41
00
Capital
8
Solteiro Ensino médio
-
7,39
43
04
Capital
9
Casado
1
7,59
34
10
Interior
10 Solteiro Superior
-
7,44
23
06
Capital
11 Casado
Ensino médio
2
8,12
33
06
Interior
12 Solteiro Ensino médio
-
8,46
27
11
Outra
13 Solteiro Superior
-
8,74
37
05
Outra
14 Casado
Superior
3
8,95
44
02
Interior
15 Casado
Ensino médio
0
9,13
30
05
Capital
16 Solteiro Ensino médio
-
9,35
38
08
Capital
17 Casado
Ensino fundamental
1
9,77
31
07
Interior
18 Casado
Ensino médio
2
9,80
39
07
Interior
19 Solteiro Ensino médio
-
10,53
25
08
Outra
20 Solteiro Superior
-
10,76
37
04
Outra
21 Casado
Ensino fundamental
1
11,06
30
09
Outra
22 Solteiro Ensino fundamental
-
11,59
34
02
Interior
23 Solteiro Ensino fundamental
-
12,00
41
00
Interior
24 Casado
Superior
0
12,79
26
01
Interior
25 Casado
Ensino médio
2
13,23
32
05
Outra
26 Casado
Ensino médio
2
13,60
35
00
Capital
27 Solteiro Ensino médio
-
13,85
46
07
Capital
28 Casado
Ensino fundamental
0
14,69
29
08
Outra
29 Casado
Ensino médio
5
14,71
40
06
Outra
Ensino médio
Dr. Francis Córdova
3
Estatística & Probabilidade
30
Casado
Ensino médio
2
15,99
35
10
Interior
31
Solteiro Ensino médio
-
16,22
31
05
Outra
32
Casado
Ensino fundamental
1
16,61
36
04
Outra
33
Casado
Ensino fundamental
3
17,26
43
07
Capital
34
Solteiro Ensino médio
-
18,75
33
07
Capital
35
Casado
Ensino fundamental
2
19,40
48
11
Interior
36
Casado
Ensino médio
3
23,30
42
02
Capital
Usando os dados, construa a distribuição de frequências das variáveis: (n=36 )
(a) Estado Civil Casado
Freqüência Proporção Porcentagem f i hi= f i/n 100xhi 20 0,5556 55,56%
Solteiro
16
0,4444
44,44
Total
36
1,0000
100,00
(b)
Capital
Freqüência f i 11
Proporção hi 0,3056
Porcentagem 100 hi 30,56
Interior
12
0,3333
33,33
Outra
13
0,3611
36,11
Total
36
1,0000
100,00
Região de Procedência
(c) Número de filhos dos empregados casados 0
Freqüência f i 4
Proporção hi 0,20
Porcentagem 100 hi 20,00
1
5
0,25
25,00
2
7
0,35
35,00
3
3
0,15
15,00
5
1
0,05
5,00
Total
20
1,00
100,00
Dr. Francis Córdova
4
Estatística & Probabilidade (d)
20 |
25
Freqüência f i 2
25 |
30
6
0,1667
16,67
30 |
35
10
0,2778
27,78
35 |
40
8
0,2222
22,22
40 |
45
8
0,2222
22,22
45 |
50
2
0,0556
5,56
Total
36
1,0001
100,01
Idade
Proporção hi 0,0556
Porcentagem 100 hi 5,56
Dr. Francis Córdova
5
Estatística & Probabilidade
Dr. Francis Córdova
6
Estatística & Probabilidade Problema 03. Complete os espaços em branco com o valor correspondente: População urbana. ( n = 27 )
Menos de 500.000
Freqüência f i 3
Proporção hi 0,1111
Porcentagem 100 hi 11,11
500.001 a 1.000.000
2
0,0740
7,40
1.000.001 a 5.000.000
15
0,5556
55,56
5.000.001 a 10.000.000
4
0,1481
14,81
Mais de 10.000.000
3
0,1111
11,11
Total
27
1,0000
100,00
Número de habitantes
Densidade populacional.
Densidade (hab/km2) Menos de 10
Freqüência f i 9
Proporção hi 0,3333
Porcentagem 100 hi 33,33
10 |
30
5
0,1852
18,52
30 |
50
4
0,1481
14,81
50 |
100
6
0,2222
22,22
Mais de 100
3
0,1111
11,11
Total
27
1,0000
100,00
Medidas de posição
Dr. Francis Córdova
7
Estatística & Probabilidade
Problema 04. Contou-se o número de erros de impressão da primeira página do jornal de João Monlevade durante 50 dias, obtendo-se o seguinte gráfico de barras: )i
10 n ( a t
8 ul o s
6 b a ai
4 c n ê
2 ü q e r F
0 5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Núme ro de e rros de impres são
a) Estabelecer as frequencias correspondentes a cada caso, numa tabela ordenada com f i , hi e 100xhi. b) Graficar o histograma correspondente. Dr. Francis Córdova
8
Estatística & Probabilidade
x i
f i
hi
x i *f i
F i
5
3
0.06
15
3
6
3
0.06
18
6
7
5
0.1
35
11
8
7
0.14
56
18
9
2
0.04
18
20
10
5
0.1
50
25
11
4
0.08
44
29
12
9
0.18
108
38
13
1
0.02
13
39
14
7
0.14
98
46
15
1
0.02
15
47
16
1
0.02
16
48
19
1
0.02
19
49
22
1
0.02
22
50
TOTAL
50
H i
)i
MEDIA = MEDIANA = MODA =
10 t
a
(
n
8 s
o
lu
6 b ai
a
4 c ê
n
2
F
r
e
q
ü
0 5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Número de erros de impressão
Dr. Francis Córdova
9
Estatística & Probabilidade Exemplo
Problema 05. Informações sobre idade e grau de instrução de 36 empregados da seção de orçamento da companhia MB são apresentadas como: 0,06
Superior 16,5%
27,77%
ai c
0,05
n
22,22%22,22%
ê ü q
1º grau 32,5%
0,04
er f
16,67%
e
0,03
d e d a
0,02
di s n e
2º grau 51,0%
5,56%
5,56%
0,01
D 0,00 0
20
25
30
35
40
45
50
Idade
(a) Histograma
(b) Gráfico de composição em setores (pizza)
a) Calcular a média, moda e mediana da variável Y: idade. b) Calcular a Moda da variável X : grau de instrução. Qual é a frequência absoluta de x = 2º grau?. Dr. Francis Córdova
10
Estatística & Probabilidade
Dr. Francis Córdova
11
Estatística & Probabilidade
Dr. Francis Córdova
12
Estatística & Probabilidade
Problema 06. a) Calcular a média e mediana da seguinte distribuição
Dr. Francis Córdova
13
Estatística & Probabilidade b) As taxas médias geométricas de incremento anual (por 100 habitantes) dos 30 maiores municípios do Brasil, estão dadas abaixo. 3,67 1,82 3,73 4,10 4,30 1,28 8,14 2,43 4,17 5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45 5,28 5,41 7.77 4,65 1,88 2,12 4,26 2,78 5,54 0,90 5,09 4,07 40,00%
0,2
ia c n ê
30,00%
ü q ref e d
0,1
e d a
13,33%
id
10,00%
s n
6,67%
e D 0,0 1
3
5
7
9
Taxa média geométrica de incr emento anual (por 100 habitantes)
Histograma a) Elaborar a tabela de frequências absoluta, relativa 100% e acumulada da variável continua X:Taxa média geométrica de incremento anual dos 30 maiores municípios do Brasil. b) Calcular a média de X. c) Calcular a moda de X. d) Elaborar o gráfico de composição em setores (pizz a)
Problema 07. Você foi convidado para chefiar a seção de orçamento ou a seção técnica da companhia MB. Após analisar o tipo de serviço que cada seção executa, você ficou indeciso e resolveu tomar a decisão baseado em dados fornecidos para as duas seções. |O departamento de pessoal forneceu os dados da tabela Problema 02 para os funcionários da seção de orçamentos, ao passo que para a seção técnica os dados vieram agrupados segundo as tabelas abaixo, que apresentam as frequências dos 50 empregados dessa seção, segundo as variáveis grau de instrução e salário. Baseado nesses dados, qual seria a sua decisão? Justifique.
Fundamental
Frequência f i 15
Médio
30
Superior
5
Total
50
Instrução
Proporção h i = f /n i
Porcentagem 100 h i
1,000
100,00
Dr. Francis Córdova
14
Estatística & Probabilidade Classe de salários 7,50 | 10,50
Ponto médio
Frequência f i
Proporção h i
Porcentagem 100 h i
1,0000
100,00
14
10,50 |
13,50
17
13,50 |
16,50
11
16,50 |
19,50
8
Total
50
Dica: Para decidir qual seção irei chefiar, primeiramente farei um gráfico de barras (utilizando a frequência relativa ao invés da frequência absoluta, devido ao diferente número de observações em cada seção ) para cada seção para comparar o grau de instrução dos funcionários. Em seguida, farei um histograma para cada seção (utilizando os mesmos intervalos para ambas as seções, facilitando assim a comparação) comparando assim o salário dos funcionários.
)i f
0.6 vi
0.5 al
0.4
a
( t e r
0.3 ai c
0.2 ü
0.1
ê
n q e r F
0 1o.grau
2o.grau
superior
Grau de instrução
Gráfico de barras para a Seção de Orçamentos ) i f 0.6 ( a v 0.5 i t a 0.4 l e r a 0.3 i c n 0.2 ê ü 0.1 q e r 0 F
1o.grau
2o.grau
superior
Grau de instrução
Gráfico de barras para a Seção Técnica Dr. Francis Córdova
15
Estatística & Probabilidade
0,09
0,15 33,33%
ai 0,08 c n
c n
27,78%
ê 0,07
ê
ü
ü
q 0,06 e rf
q
0,10
er
22,22%
f
0,05
e d
56,0%
ai
e d
e 0,04
28,0%
e
13,89%
d
a 0,03 d
d a
0,05
id
i s
16,0%
s
n 0,02 n
e
e
D 0,01
D
2,78%
0,00
0,00 0
4
8
12
16
20
24
Salário
Histograma para a Seção de Orçamentos
0
4
8
12
16
20
24
Salário
Histograma para a Seção Técnica
Através dos gráficos de barras, pode-se notar que ambas as seções têm proporções semelhantes de funcionários com grau de instrução de 1o grau ou superior e que, a seção técnica apresenta uma proporção levemente maior de funcionários com grau de instrução de 2o grau. Considerando os salários, pode-se notar que a seção de orçamentos apresenta salários mais distribuídos, desde salários mais baixos até bem altos. Então, você será chefe de qual departamento?
Dr. Francis Córdova
16
Estatística & Probabilidade
Aula 4: M edi das de di spersão e Gr áfico box pl ots
Dr. Francis Córdova
17
Estatística & Probabilidade Notações: dm(X) = desvio médio absoluto var(X) = variância
dp(X) = √var(X) = desvio padrão Observação: As formulas acima são utilizadas para um conjunto de dados x i , sem considerar repetições, isto é, sem considerar as frequências absolutas f i ou frequências relativas h i
Problema 01. Reescrever as fórmulas acima considerando as repetições, isto é, em função das frequências. Problema 02. Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma amostra de 50 páginas, encontrando-se o número de erros por página da tabela abaixo.
(a)
Erros x i 0
Freqüência f i 25
1
25
x i * f i 0
(x i - x ) 2 0,4356
20
45
20
0,1156
2,3120
2
3
48
6
1,7956
5,3868
3
1
49
3
5,4756
5,4756
4
1
50
4
11,1556
11,1556
Total
50
33
18,5424
35,2200
2 f i * (x i - x ) 10,8900
Qual o número médio de erros por página?
Sendo x
(b)
F i
x
o número médio de erros por página, tem-se:
0 25 1 20 2 3 3 1 4 1 50
33 50
0,66
E o número mediano? Representando o número mediano de erros por md, tem-se, pela ordenação dos valores observados, que os valores de ordem 25 e 26 são 0 e 1, respectivamente. Assim md
0 1 2
0,5
Dr. Francis Córdova
18
Estatística & Probabilidade (c)
Qual é o desvio padrão? 2
var( X )
25 0 0,66
20 1 0,66
2
3 2 0,66
2
1 3 0,66
2
1 4 0,66
50
25 0,4356 20 0,1156 3 1,7956 1 5,4756 1 11,1556 50
35,22 50
2
0,7044
Logo, dp( X )
(d)
0,7044
0,8393
Faça uma representação gráfica para a distribuição
30 )i n (
25 a t lu
20 o s b
15 ia
10
a c n ê
5 q
0
ü e r F
0
1
2
3
4
Número de erros de impressão
Gráfico de barras do número de erros por página
(e)
Se o livro tem 500 páginas, qual o número total de erros esperado no livro?
Uma vez que a média de erros por página é 0,66 e o livro tem 500 páginas, o número esperado de erros no livro é 0,66 500 330
Problema 03. As taxas de juros recebidas por 10 ações durante um certo período foram (medidas em porcentagem) 2,59; 2,64; 2,60; 2,62; 2,57; 2,55; 2,61; 2,50; 2,63; 2,64. Calcule a média, a mediana e o desvio padrão.
Média: x
2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64 10
2,595
Mediana: md
2,600 2,610 2
2,605 Dr. Francis Córdova
19
Estatística & Probabilidade Desvio Padrão: var( X )
0,0052 0,0452 0,0052 0,0252 0,0252 0,0452 0,0452 10
0,0152 0,0952 10
0,0018 dp( X )
0,0018
0,0424
Problema 04. Para facilitar um projeto de ampliação da rede de esgoto de uma certa região de João Monlevade, as autoridades tomaram uma amostra de tamanho 50 dos 270 quarteirões que compõem a região, e foram encontrados os seguintes números de casas por quarteirão:
(a)
2
2
3
10
13
14
15
15
16
16
18
18
20
21
22
22
23
24
25
25
26
27
29
29
30
32
36
42
44
45
45
46
48
52
58
59
61
61
61
65
66
66
68
75
78
80
89
90
92
97
Use cinco intervalos e complete a seguinte tabela Vmin = 2 = 19
Vmax = 9
Vmax – Vmin = 95
Classes nº casas 0| 20
Ponto médio
Frequência f i
Fi
Proporção h i
10
12
12
0,24
Amplitude de cada intervalo: 95/5
20|
40
30
15
27
0,30
40|
60
50
9
36
0,18
60|
80
60
9
45
0,18
100
70
5
50
0,10
80|
Total
50
1,00
0.015
e d a d i s n e D
0.010
0.005
0.000 0
20
40
60
80
100
Núm ero de casas por q u arteir ao
Dr. Francis Córdova
20
Estatística & Probabilidade
(b)
Determine uma medida de tendência central e uma medida de dispersão.
x i
Freqüência f i
F i
x i * f i
f i * (x i - x) 2
2
2
2
4
2952.1928
3
1
3
3
1400.2564
10
1
4
10
925.3764
13
1
5
13
751.8564
14
1
6
14
698.0164
15
2
8
30
1292.3528
16
2
10
32
1192.6728
18
2
12
36
1005.3128
20
1
13
20
416.9764
21
1
14
21
377.1364
22
2
16
44
678.5928
23
1
17
23
303.4564
24
1
18
24
269.6164
25
2
20
50
475.5528
26
1
21
26
207.9364
27
1
22
27
180.0964
29
2
24
58
260.8328
30
1
25
30
108.5764
32
1
26
32
70.8964
36
1
27
36
19.5364
Dr. Francis Córdova
21
Estatística & Probabilidade 42
1
28
42
2.4964
44
1
29
44
12.8164
45
2
31
90
41.9528
46
1
32
46
31.1364
48
1
33
48
57.4564
52
1
34
52
134.0964
58
1
35
58
309.0564
59
1
36
59
345.2164
61
3
39
183
65
1
40
65
66
2
42
132
68
1
43
68
760.6564
75
1
44
75
1195.7764
78
1
45
78
1412.2564
80
1
46
80
1566.5764
89
1
47
89
2360.0164
90
1
48
90
2458.1764
92
1
49
92
2660.4964
97
1
50
97
3201.2964
Total
50
2021
1270.6092
604.1764
1308.6728
33320.18
Respostas; Média: 40,42; desvio-padrão: 25,81.
Dr. Francis Córdova
22
Estatística & Probabilidade (c)
Dê uma situação prática onde você acha que a mediana é uma medida mais apropriada do que a média. A mediana é uma medida de posição mais importante do que a média, por exemplo, em situações em que a variável em estudo tem algum valor muito discrepante que “puxa” a média para cima ou para baixo. (Desenhe uma tabela onde isso acontece!)
(d)
Esboce um histograma onde a média e a mediana coincide. Existe alguma classe de histogramas onde isso sempre acontece? Em distribuições simétricas, a média e a mediana c oincidem. Por exemplo:
0.2
e d a d i s n e D
0.1
0.0
4
6
8
10
12
14
16
Histograma
(e)
Esboce os histogramas de três variáveis (X, Y, Z) com a mesma média aritmética, mas com as variâncias ordenadas em ordem crescente. Por exemplo, consideremos os seguintes gráficos:
0.10
X
e d a d i s n e D
0.05
0.00
-1 0
0
10
20
30
Média =10,0 e Variância = 4
Dr. Francis Córdova
23
Estatística & Probabilidade
0.08 0.07
Y
e d a d i s n e D
0.06 0.05 0.04 0.03 0.02 0.01 0.00
-1 0
0
10
20
30
Média =10,0 e Variância = 16
0.06
0.05
Z
e d a d i s n e D
0.04
0.03
0.02
0.01
0.00
-10
0
10
20
30
Média =10,0 e Variância = 36
Para garantir que você esta ligado com a ideia, faça as tabelas de frequências absoluta e relativa das variáveis X, Y, Z. Problema 05. Suponha que a variável de interesse tenha a distribuição como a figura abaixo,
Você acha que a média é uma boa medida de posição? E a mediana?. Justifique.
Dr. Francis Córdova
24
Estatística & Probabilidade Nessa situação, tanto a média quanto a mediana (que coincidem) não se apresentam como boas medidas de posição. Elas não retratam bem a distribuição da variável estudada. Nessas condições, seria melhor considerar a moda, ou modas, pois nesse caso a distribuição é bi-modal.
Problema 06. Numa pesquisa realizada com 100 famílias, levantaram-se as seguintes informações:
Numero de filhos
0
1
2
3
4
5
Mais que 5
Frequência de famílias
17
20
28
19
7
4
5
(a)
Qual é a mediana do número de filhos?.......
(b)
A moda do número de filhos é ........
(c)
Que problemas você enfrentaria para calcular a média? Faça alguma suposição e encontre-a.
O cálculo da média fica prejudicado pelo fato de haver uma categoria representada por “mais que 5” filhos, sem a especificação do valor exato. Neste caso, deve-se usar o conhecimento empírico que se tem da variável para propor um valor máximo para o intervalo, ou o ponto médio da classe.
Quantis Tanto a média como o desvio padrão podem não ser medidas adequadas para representar um conjunto de dados, pois: (a) são afetados, de forma exagerada, por valores extremos. (b) apenas com estes dois valores não temos ideia da simetria ou assimetria da distribuição dos dados. Para contornar esses fatos, outras medidas têm de ser consideradas. Vimos que a mediana é um valor que deixa metade dos dados abaixo e metade dos dados acima. De modo geral, podemos definir uma medida, chamada quantil de ordem p ou p-quantil, indicada por p(q), onde p é uma proporção qualquer 0 < p < 1, tal que 100p% das observações sejam menores do que q(p). Indicamos, abaixo, alguns quantis e seus nomes particulares. q(0,25): 1º quartil = 25º percentil = q1 q(0,50): Mediana = 5º Decil = 50º percentil = q2 q(0,75): 3º quartil = 75º percentil = q3 Dr. Francis Córdova
25
Estatística & Probabilidade q(0,40): 4º Decil q(0,95): 95º percentil Dependendo do valor de p, há dificuldades ao se calcular os quantis. Isso é ilustrado no problema a seguir: Uma medida de dispersão alternativa ao desvio padrão é a distancia ou in tervalo in terquar til , definida como a diferença entre o terceiro e o primeiro quartis, ou seja:
d = q(0,75) - q(0,25) = q 3 – q q 1 Problema 07. Suponha que tenhamos os seguintes valores de uma variável X: 15, 5, 3, 8, 10, 2, 7, 11, 12. Ordenando os valores temos n= 9 e x1 = 2, 3, 5, 7, 8, 10, 11, 12, xn = 15. (a) Elaborar a função de distribuição acumulada F(x) (b) Calcular: q(0,50), q(0,20), q(0,10) e q(0,75). Solução: Use a definição do p-quantil;
, ,=,,… = = ( )( ) ( ) + < << + ()= () () > {
Onde
= −−
Definição. Os cinco valores x 1 , q 1 , q 2 , q 3 e x n são importantes para se ter uma boa ideia da assimetria da distribuição dos dados. Para uma distribuição simétrica ou aproximadamente simétrica, deveríamos ter:
(a) Dispersã o i nferi or = q o superior 2 – x 1 ≈ x n – q 2 = Dispersã – q – q (b) q 2 1 ≈ q 3 2
– x (c) q 1 1 ≈ x n – q 3
(d) Distanci as entr e mediana e q 1 , q 3 menor es do que distan cias entr e os extr emos e q 1 , q 3 .
Dr. Francis Córdova
26
Estatística & Probabilidade Distribuição simétrica: Normal ou gaussiana
50 %
x 1
q q 1 2 q 3
x n
As cinco estatísticas de ordem consideradas acima podem ser representadas esquematicamente como
n q 2 q 1 x 1
q 3 x n
Problema 07. Baseado nas seguintes medidas verifique se a forma da distribuição dos dados é normal. 37 35 31
40
21
49
Intervalo interquartil: Dispersão inferior (di): Dispersão superior (ds): Os valores acima obtidos indicam que a distribuição dos dados tem forma ..................................
Problema 08. Obtenha o esquema dos cinco números para os dados do problema 4. Calcule o intervalo interquartil e as dispersões inferior e superior. Baseado nessas medidas verifique se a forma da distribuição dos dados é normal.
50 31 20
61
2
97
Dr. Francis Córdova
27
Estatística & Probabilidade
Intervalo interquartil:
Dispersão inferior (di):
Dispersão superior (ds):
q3
q2
q1
61
x(1)
x( n )
q2
20
31 2
41
29
97 31
66
Para que a distribuição dos dados tenha forma normal (simétrica, em geral), é necessário: di
ds
q2
q1
q2
q1 e q3
q3
q2
q2
di e ds
Os valores acima obtidos indicam que a distribuição d os dados não tem forma normal. Os valores acima obtidos indicam que a distribuição dos dados tem forma ..................................
Problema 09. Obter os três quartis, q(0,10) e q(0,90) para os dados do problema 4. q (0,10)
q (0,90)
13 14 2
78 80 2
13,5 ,
q(0,25)
19,5 ,
q(0,50)
31,0 ,
q (0,75)
61,0 ,
79,0
Desenho esquemático (Box plots) Considere a informação contida no esquema dos cinco números:
n q 2 q 1 x 1
q 3 x n
esta informação pode ser traduzida graficamente n um diagrama, ilustrado na seguinte figura:
Dr. Francis Córdova
28
Estatística & Probabilidade
3d /2 q
q 1 d q q 2 q 3 3d /2 q
Para construir este diagrama, consideremos um retângulo onde estão representados a mediana e os quartis. a partir do retângulo, para cima, segue uma linha até o ponto mais remoto que não exceda
LS = q + ( 1,5)d 3 q chamado limite superior. De modo similar, da parte inferior do retângulo, para baixo, segue uma linha até o ponto mais remoto que não seja menor do que
L I = q 1 - (1,5)d q chamado limite inferior. Os valores compreendidos entre esses dois limites são chamados valores adjacentes. As observações que estiverem acima do limite superior ou abaixo do limite inferior estabelecido serão chamadas pontos exteriores e representados por asteriscos. Essas são observações destoantes das demais e podem ou não ser o que chamamos de outliers ou atípicos.
Problema 10. Construa o Box plot para os dados do problema 02 da aula 3. Classe salarios
Freqüência f i
4,00 |
8,00
10
8,00 |
12,00
12
12,00 |
16,00
8
16,00 |
20,00
5
20,00 |
24,00
1
Total
36
Proporção h i
Porcentagem 100 h i 27,78
22,22
2,78 1,00
100,00
Dr. Francis Córdova
29
Estatística & Probabilidade 25
.) M. S(
15
s oi r al a S
5
Box-Plot dos Salários dos funcionários da Companhia MB Pode-se perceber uma distribuição assimétrica à direita.
Dr. Francis Córdova