UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA MAT021 - ESTATÍSTICA I B Exercícios de Fixação - 2ª Unidade – Unidade – 2012.1 2012.1 1.
Assinale A (Moda); B (Mediana) e C (Média) nas questões abaixo:
( ) Que medida de tendência central é considerada o ponto de equilíbrio de uma distribuição? distribuição? ( ) Que medida de tendência central representa o ponto de de frequência máxima em uma distribuição? ( ) Que medida medida de tendência central divide uma uma distribuição ao meio quando os valores estão dispostos em rol? ( ) Uma distribuição de rendas é fortemente assimétrica. Que medida de tendência central você utilizaria para caracterizar a renda? (
) Uma distribuição distribuição da força de posições em relação à legalização do aborto tem dois pontos de frequência máxima, o que indica
que muitas pessoas se opõem fortemente e muitas são definitivamente favoráveis ao aborto. Que medida de tendência central você empregaria para caracterizar a força das posições em relação à legalização do aborto? Resp.: C; A; B; B; A.
2.
Com base nas informações dispostas na tabela a seguir, responda (ASW, 2009): a.
Qual é o número médio de quartos dos nove hotéis?
b.
Calcule a pontuação global média.
c.
Qual é a porcentagem de hotéis localizados na Inglaterra?
d.
Qual é a porcentagem de hotéis com preços de quarto iguais a $$? Tabela. Avaliações de nove lugares para se hospedar na Europa Nome do estabelecimento Graveteye Manor
País Inglaterra Itália Alemanha França Suíça Inglaterra Áustria Bélgica França
Villa d’Este
Hotel Prem Hotel d’Europe
Palace Luzern Royal Crescent Hotel Hotel Sacher Duc de Bourgogne Villa Gallici
Preço do quarto $$ $$$$ $ $$ $$ $$$ $$$ $ $$
Número de quartos 18 166 54 47 326 45 120 10 22
Pontuação global 83,6 86,3 77,8 76,8 80,9 73,7 85,5 76,9 90,6
Resp.: Média = 89,78 quartos; Média = 81,34 pontos; 22,22%; 44,44%.
3.
Um grupo de estudantes do segundo grau foi monitorado quanto ao uso de várias drogas, inclusive o álcool. Ao serem interrogados sobre quantas vezes se embriagaram nos seis meses imediatamente anteriores, o s estudantes responderam: 4
2
0
2
1
3
0
1
7
Calcule (a) a mediana e (b) a média para estes valores auto -atribuídos. Interprete. Interprete. Resp.: a. 2; b. 2,55.
4.
Um grupo de cinco condenados recebeu as seguintes sentenças de prisão (em anos): 4 a. b. c. d.
5
3
3
40
Ache a moda. Interprete. Ache a mediana. Interprete. Ache a média. Interprete. Que medida dá a indicação mais precisa da tendência central desses dados?
Resp.: a. 3; b. 4; c. 11; d. Mediana.
5
3
5.
Os quatro programas de televisão de maior audiência nos Estados Unidos foram CSI, ER, Everybody Loves Raymond e Friends (Nielsen Media Research, 11 de janeiro de 2004). Seguem-se os dados que indicam os programas preferidos para uma amostra de 50 telespectadores (ASW, 2009). Calcule a medida de tendência central que melhor representa esta amostra. CSI CSI Friends ER CSI
Friends CSI CSI ER Friends
CSI Raymond ER Friends CSI
CSI ER Friends CSI CSI
CSI ER CSI Raymond Friends
ER CSI Friends Raymond CSI
ER Friends Friends Friends ER
ER Friends Raymond ER CSI
Friends CSI Friends Friends Friends
Raymond Raymond CSI CSI ER
Resp.: Moda = CSI
6.
Deseja-se estudar o número de erros de impressão em um livro. Para isso escolhe-se uma amostra de 50 páginas deste livro encontrando-se o seguinte número de erros por página: Erros 0 1 2 3 4 Total
f i 25 10 5 6 4 50
Encontre o número médio de erros. Qual a moda do número de erros de impressão? Resp.: Média = 1,08; Moda = 0.
7.
Foram monitoradas eletronicamente 25 residências, para determinar o número de horas em que a televisão da família permanecia ligada em um período de 24 horas. O resultado encontra-se a seguir na forma de distribuição de frequência. Número de horas 0 |-- 5 5 |-- 10 10 |-- 15 15 |-- 20 20 |-- 25 Total
Frequência 6 5 8 4 2 25
a.
Em média, quantas horas uma família passa com a televisão ligada?
b.
Em qual intervalo de horas se encontra a mediana?
Resp.: a. Em média 10,7 horas; b. No intervalo de 10 a 15 horas.
8.
A distribuição de frequências do salário (em salários mínimos) dos moradores do bairro Alfa que têm alguma forma de rendimento é apresentada na tabela a seguir:
a.
Faixa Salarial 0 | 2 2 4 4 6 6 8 8 10 10 12 12 14 Total Determine qual é a classe que contém a moda.
f i 211 120 80 50 40 40 19 560
b.
Calcule a média. A média é uma boa medida para representar estes dados? Justifique sua resposta.
c.
O histograma da distribuição salarial está representado a seguir. Identifique o tipo de assimetria;
Resp.: a. A 1ª classe; b. 4,23, a média não é uma boa medida para representar os dados, pois os dados tem distribuição assimétrica; c. Assimetria positiva.
250
200
150
100
50
0
0 |-2
2 |- 4
4 |- 6
6 |- 8
8 |- 10 10 |- 12 12 |- 14
faixa salarial
Fonte: Dados fictícios
9.
A tabela a seguir fornece dados dos registros de paciente em um determinado hospital. Calcule a medida de tendência central mais apropriada para cada uma das variáveis. Paciente
Quarto
Médico
Condição
202 203 203 205 201 203 204 202 204
Pablo Mário Lucas Lucas Pablo Mário Lucas Pablo Felipe
Crítica Estável Boa Estável Séria Boa Estável Crítica Séria
Carlos Levi Fabrício Gabriela André Pedro Sabrina Cardoso Marina
Duração da estadia (em dias) 8 4 5 7 2 9 5 1 2
Resp.: Quarto – Moda = 203; Médico – Moda = Pablo e Lucas; Condição – Moda = Estável; Estadia – Média = 4,78 dias.
10. Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa semana, arredondados para o valor mais próximo e apresentados em ordem crescente: 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240. Calcular (a) a média, (b) a mediana, (c) a moda, (d) os quartis. Interprete-os. Resp.: a. 170,50; b. 160; c. 140; d. 140, 160 e 195.
11. Um novo medicamento para cicatrização de ferimentos está sendo testado e um experimento é feito para estudar o tempo (em dias) de completo fechamento de cortes provenientes de cirurgia. Uma amostra em 12 cobaias forneceu os valores: 15
17
16
18
14
17
16
12
14
18
15
17
Qual o tempo (em dias) que acima dele estão 15% das cobaias que obtiveram os maiores tempos de fechamento dos cortes? Resp.: 18 dias.
12. Verifique se as afirmações abaixo são V (verdadeiras) ou F (falsas). Em qualquer caso, justifique sua resposta. a.
( ) Na série 100, 80, 90, 70, 60, 5, 0, os valores 5 e zero influem no cálculo da mediana.
b.
( ) Num concurso foram eliminados 70% dos candidatos. Para verificar qual a nota mínima para que o candidato fosse aprovado calculou-se o D 3.
c.
( ) Quando queremos verificar a questão de uma prova que apresentou maior número de erros, utilizamos a média.
d.
( ) A média, em qualquer conjunto de dados quantitativos, dá a indicação mais precisa da tendência central desses dados.
Resp.: a. F – influem no cálculo da média; b. F – calculou-se D7; c. F – utilizamos a moda; d. F – nem sempre, pois sofre a influência de valores extremos.
13. Na cidade A, a média de salários é de 1000 unidades monetárias (u.m.) e o 3o quartil é de 600 u.m. Escolhendo-se um trabalhador, ao acaso, na cidade A, o que é mais provável: ganhar mais ou menos do que 600 u.m.? Justifique. Resp.: Ganhar menos de 600 u.m., pois 75% dos trabalhadores recebem menos do que este valor.
14. Assinale a resposta correta de cada uma das questões abaixo: a.
Um professor quer separar seus alunos, segundo seus aproveitamentos, em quatro grupos de igual tamanho. Para tanto deverá calcular: ( ) a média aritmética ( ) a mediana ( ) a moda ( ) os quartis
b.
Numa distribuição de frequência o valor 75 separa os 30% inferiores da distribuição, portanto 75 é o resultado do cálculo de: ( ) Q 1 ( ) Q 2 ( ) D3 ( ) D7
c.
Num concurso foram classificados 60% dos candidatos. Para verificar qual a nota mínima para que o candidato fosse aprovado calculou-se: ( ) o Q 3 (
) o D4 (
) o P60 (
) a Md
Resp.: a. os quartis; b. D3; c. D4.
15. A direção de uma biblioteca quer conhecer a idade média dos títulos, através do ano de edição, para determinar se há necessidade de renovação do acervo. Para tal, fez um levantamento do ano de edição dos últimos 30 livros que foram devolvidos na última semana. As idades (em anos), já ordenadas, são apresentadas a seguir: 17
17
17
17
17
19
19
21
21
21
22
22
23
24
24
25
25
26
26
26
26
27
27
27
28
29
30
32
33
36
a.
Calcule a média, a moda e a mediana. Interprete os resultados.
b.
Calcule os quartis. Interprete os resultados.
Resp.: a. 24,13 – 17 – 24,5; b. 21 - 24,5 – 27.
16. Os valores seguintes representam o número de filhos em um grupo de 20 residências: 0
0
0
1
1
1
1
2
2
2
2
2
2
3
3
3
4
4
5
6
a.
Calcule o primeiro quartil, o decil 5 e o percentil 80. Interprete os resultados.
b.
Vinte por cento das residências que possuem a maior quantidade de filhos receberá um auxílio financeiro. Quantos filhos, no mínimo, a família deve ter para que tenha direito ao auxílio?
Resp.: a. 1 – 2 – 3,5; b. 3,5.
17. Um pesquisador interessado na eficiência de grupos de dieta pesou uma amostra de clientes de tamanho cinco após várias semanas do programa. Os valores das perdas de peso (em kg) foram: 13
12
6
9
10
Calcule: a.
a amplitude;
Resp.: a. 7; b. 7,5.
b.
a variância.
18. Foi medida a duração (em minutos) de cada apagão em residências em Salvador nos últimos dez anos. No final desses anos, retirou-se aleatoriamente uma amostra de tamanho 6 da duração. Os valores estão apresentados abaixo. 12
18
26
45
80
125
Em média o apagão durou 51 minutos, calcule o desvio padrão. Resp.: 43,79.
19. Coloque V(verdadeiro) e F(falso) e justifique: a.
( ) 50% dos dados de qualquer amostra situam-se acima da média;
b.
( ) Numa turma de 50 alunos onde todos tiraram a nota máxima, o desvio padrão é zero;
c.
(
) Somando-se (ou subtraindo-se) um valor constante e arbitrário a cada um dos elementos de um conjunto de
dados, a média aritmética fica adicionada (ou subtraída) dessa constante. d.
(
) Multiplicando-se (ou dividindo-se) um valor constante e arbitrário a cada um dos elementos de um conjunto de
dados, a média aritmética fica multiplicada (ou dividida) por essa constante. e.
(
) Somando-se (ou subtraindo-se) um valor constante e arbitrário a cada um dos elementos de um conjunto de
dados, o desvio padrão fica adicionado (ou subtraído) dessa constante. f.
(
) Multiplicando-se (ou dividindo-se) um valor constante e arbitrário a cada um dos elementos de um conjunto de
dados, o desvio padrão fica multiplicado (ou dividido) por essa constante. Resp.: a. F; b. V; c. V; d. V; e. F; f. V
20. O departamento de atendimento ao consumidor de uma co ncessionária de veículos recebe, por telefone, as reclamaç ões dos clientes. O número de chamadas dos últimos 10 dias foram: 3
4
5
4
4
5
6
9
4
4
resultando em uma média de 4,8 chamadas por dia e um desvio padrão de, aproximadamente, 1,69 chamadas. Admitindo que cada telefonema acarreta serviços sob a garantia avaliados em R$ 50,00 por chamada, calcule a média e o desvio padrão das despesas oriundas do atendimento ao consumidor. Resp.: Média = R$ 240,00 e Desvio padrão = R$ 84,50.
21. Dados os conjuntos de números A = {1.000, 1.001, 1.002, 1.003, 1.004, 1.005} e B = {0, 1, 2, 3, 4, 5}, podemos afirmar que: a.
O desvio padrão de A é igual a 1.000 vezes o desvio padrão de B.
b.
O desvio padrão de A é igual ao desvio padrão de B.
c.
O desvio padrão de A é igual ao desvio padrão de B multiplicado pelo quadrado de 1.000.
d.
O desvio padrão de A é igual ao desvio padrão de B dividido por 1.000.
e.
O desvio padrão de A é igual ao quadrado do desvio padrão de B.
Resp.: b.
22. Uma biblioteca está planejando reformar alguns livros que estão na seção se empréstimos. Para tal, fez um levantamento do número de defeitos nos últimos 50 livros que foram devolvidos na última semana. Os dados, já ordenados, são apresentados
a seguir: 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8 e 15. a.
Calcule média, moda e mediana.
b.
Calcule a amplitude total e o desvio padrão.
c.
Você identifica algum valor excepcional dentre os que foram observados? Se sim, remova-o e recalcule os itens (a) e (b). Comente as diferenças encontradas.
Resp.: a. Média = 3,64; Moda = 3; Mediana = 3; b. Amplitude = 14; Desvio médio Amplitude = 7; Desvio padrão
2,24; c. Retirando o número 15: Média = 3,41; Moda = 3; Mediana = 3;
1,54. Com a retirada do valor atípico, a média e todas as medidas que dependem da média tiveram seus valores reduzidos,
pois a média é modificada por valores extremos (bem como todas as medidas que dependem da média).
23. Os dados abaixo indicam o tempo, em dias, que os alunos demoram para devolver um determinado livro na biblioteca central da UFBA, no ano atual: 7
8
1
7
13
11
6
12
2
12
17
4
2
5
7
1
14
3
12
4
15
14
8
4
8
7
5
6
3
2
3
10
9
7
10
8
Calcule a média, a amplitude total e o desvio padrão. Interprete os resultados. Resp.: 7,42 – 16 – 4,28.
24. Um órgão do governo do estado está interessado em determinar padrões sobre o investimento em educação, por habitante, realizado pelas prefeituras. De um levantamento de dez cidades, foram obtidos os valores (codificados) do quadro a seguir: Cidade Investimento
A 26
B 16
C 14
D 10
E 19
F 15
G 19
H 16
I 19
J 18
a.
Calcule o investimento médio.
b.
Receberão um programa especial as cidades com valores de investimento inferiores à média menos duas vezes o desvio padrão. Alguma cidade receberá o programa? Ju stifique.
c.
Será considerado como investimento básico à média das observações compreendidas entre a média original menos dois desvios padrão e a média original mais dois desvios padrão. Calcule o investimento básico e compare com a média obtida no item (a). Justifique a diferença encontrada.
Resp.: a. 17,2; b. x 2 8,83 , nenhuma cidade receberá o programa, pois nenhuma tem o investimento inferior a 8,83; c. Investimento básico será a média das observações que estão entre x 2 8,83 e x 2 25,57 , logo o investimento básico será de x
16,22
.
25. Considere a distribuição a seguir relativa a notas de dois alunos de estatística durante determinado s emestre: Aluno A Aluno B
9,5 5,0
9,0 5,5
2,0 4,5
6,0 6,0
6,5 5,5
a.
Calcule as notas médias de cada aluno.
b.
Qual aluno apresentou resultado mais homogêneo? Justifique.
3,0 5,0
7,0 4,5
2,0 4,0
Resp.: a. Aluno A – nota média 5,6 e Aluno B – nota média 5,0; b. O aluno B possui um resultado mais homogêneo, pois seu coeficiente de variação 13% é menor do que o coeficiente de variação do aluno A 53%.
26. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi de 7,8 e o desvio padrão, 0,80. Em Computação Básica, entretanto, o grau médio final foi de 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? Resp.: CVEst=10,26%; CVComp=10,41%. A disciplina com maior dispersão foi Computação básica, mas a diferença é muito pequena.
27. A estatura média de 1.017 indivíduos é de 162,2 cm e o desvio-padrão de 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? Resp.: CVEst=4,94%; CVPeso =4,42%. A maior variabilidade é na estatura desses indivíduos, porém, a diferença é p equena.
28. Realizou-se uma prova de estatística para duas turmas, cujos resultados foram os seguintes: Turma A:
X
5 e S 2,5 ; Turma B: X 4 e S 2 .
Esses resultados permitem afirmar que: a.
A turma B apresenta maior dispersão absoluta.
b.
A dispersão absoluta é igual para ambas as turmas.
c.
A dispersão relativa é igual à dispersão absoluta para ambas as turmas.
d.
A dispersão relativa e a absoluta para a turma B são iguais.
e.
A dispersão relativa da turma A é igual à da turma B.
Resp.: e
29. São apresentados abaixo o comprimento (m) e a altura (em cm) de 10 tartarugas do sexo masculino de uma determinada espécie. Tartaruga Comprimento Altura
1 9,3 37
2 9,4 35
3 9,6 35
4 10 39
5 10,2 38
6 10,3 37
7 11 39
8 9,6 39
9 8,9 38
10 11,2 40
Calcule os coeficientes de variação para cada uma das variáveis e comente os resultados. Justifique porque não podemos comparar diretamente os desvios padrão neste caso. Resp.:
x
c
= 9,95; sc = 0,74; CVc = 7,43% e
x
a
= 37,7; sa = 1, 7; CVa = 4,52%.
Há uma maior variabilidade no comprimento das tartarugas do sexo masculino, pois o coeficiente de variação foi superior. Não podemos comparar os desvios padrão diretamente porque o comprimento e a altura têm unidades de medidas diferentes e escalas distintas.
30. Verifique se as afirmações abaixo são verdadeiras (V) ou falsas (F). Justifique, em qualquer caso, sua resposta. A prefeitura de uma cidade quer conhecer o padrão de consumo mensal de energia elétrica e de água de duas das suas regiões: residências de alto padrão de construção e de baixo padrão. Por questões de sigilo as companhias fornecedoras informaram o resumo dos dados solicitados apresentado abaixo.
a.
As residências de alto padrão apresentam um consumo médio de energia elétrica maior que as residências com baixo padrão. Entretanto, a variabilidade relativa de energia elétrica é a mesma nas duas regiões.
b.
Entre as residências de baixo-padrão, o consumo de água apresenta uma variabilidade relativa maior do que a variabilidade relativa do consumo de energia elétrica.
c.
Entre as residências de alto-padrão, o consumo de água apresenta variabilidade relativa menor do que a variabilidade relativa do consumo de energia elétrica.
d.
As residências de alto padrão apresentam variabilidade absoluta do consumo de energia elétrica idêntica as residências de baixo-padrão.
Resp.: a. F; b. F; c. V; d. V.
31. Dois estudantes em uma turma de estatística compararam suas notas em uma série de testes: Estudante A 4 9 3 8 9
Estudante B 6 5 7 5 6
Considerando os conceitos de tendência central e de variabilidade, determine: a.
Qual estudante tenderia a apresentar melhor desempenho nos testes?
b.
Qual tenderia a apresentar um desempenho mais consistente?
Resp.: a. Estudante A (Média de A > Média de B); b. Estudante B (Desvio padrão de B < Desvio padrão de A – Foi possível comparar a partir do desvio padrão, pois as duas variáveis são notas e possuem a mesma unidade de medida, além das médias das notas entre os estudantes não d iferirem muito).
32. No quadro a seguir tem-se informações sobre as alturas (em centímetros) e os pesos (em quilogramas) de um grupo de alunos da escola ABC, em 1990. Altura Peso
Mínimo 155 54
Máximo 199 100
Média 170 68
Variância 25 4
Com base nestas informações responda os itens a seguir. a.
Qual a variável que possui mais homogeneidade (menor dispersão)?
b.
Qual a medida que você utilizou para determinar qual a variável mais homogênea? Por quê?
Resp.: a. A altura e o peso dos alunos da escola ABC possuem a mesma variabilidade (CVA = 2,94% = CVP = 2,94%); b. O coeficiente de variação, pois a altura e o peso têm unidades de medidas diferentes e escalas distintas.
33. A figura a seguir mostra a distribuição de idades dos funcionários de três empresas similares A, B e C. Baseado neste gráfico, responda: a.
Qual o tipo de gráfico que está sendo apresentado?
b.
Você tem alguma crítica a fazer em relação à construção deste gráfico? Qual (is)?
c.
É possível construir um histograma com os resultados citados? Por quê?
d.
Em qual das empresas há o funcionário mais jovem? E o mais velho?
e.
Em qual das empresas é maior a mediana das idades?
f.
Qual das empresas apresenta menor amplitude interquartílica?
g.
Descreva, quanto à simetria, a forma das distribuições para cada empresa.
Resp.: a. Boxplot ; b. Pessoal; c. O Boxplot é um gráfico alternativo ao histograma, logo ele poderia ser construído, porém, como os dados estão separados por empresa precisaria construir três histogramas e a análise não ficaria tão clara como no Boxplot ; d. Na empresa C há o funcionário mais jovem e o mais velho está A; e. Na empresa B; f. Na empresa B; g. A empresa A tem assimetria positiva, enquanto que a empresa B é aproximadamente simétrica e por fim, a empresa C tem assimetria negativa.
34. As vendas anuais, em milhões de dólares, de 21 empresas produtoras de produtos farmacêuticos são apresentadas a seguir: 8.408 608 10.498
1.374 14.138 7.478
1.872 6.452 4.019
8.879 1.850 4.341
2.459 2.818 739
11.413 1.356 2.127
3.653 5.794 8.305
a.
Identifique os cinco elementos principais para definição do boxplot .
b.
Identifique os limites inferior e superior para detecção de valores discrepantes para estes dados. Existe algum valor discrepante?
c.
Defina um boxplot para representação destes dados.
d.
As vendas da Johnson & Johnson são as maiores da lista, com US$ 14.138 milhões. Suponha ter havido um erro de lançamento e que as vendas foram de US$ 41.138 milhões. O método definido no item (b) identifica o problema e possibilita a correção do mesmo?
Resp.: a. Mínimo = 608; Q 1 = 1.872; Md = 4.019; Q 3 = 8.305; Máximo = 14.138; b. Limites para valores discrepantes: (-7.77,5; 17.954,5). Não existe valor discrepante; c. Gráficos a seguir; d. Sim.
35. A JD Powers and Associates fez uma pesquisa com usuários de telefones celulares a fim de saber quantos minutos eles usavam telefones celulares por mês (Associated Press, junho de 2002). Uma análise descritiva com 15 usuários de telefones celulares apresentou os seguintes resultados: minutos ------------------------------------------------------------Percentiles Smallest 1% 105 105 5% 105 135 10% 135 180 Obs 15 25% 210 210 Sum of Wgt. 15 50% 75% 90% 95% 99%
380 615 830 1180 1180
Largest 615 690 830 1180
Mean Std. Dev.
422 295.7545
Variance Skewness Kurtosis
87470.71 1.246316 3.89279
a.
Qual a média e a mediana de minutos usados por mês por estes usuários? Interprete estes resultados.
b.
Qual é o primeiro quartil ? Interprete seu valor.
c.
Qual o coeficiente de variação do número de minutos usados por mês?
d.
O 80º. percentil é 774 minutos. A J.D. Powers and Associates divulgou que a média dos planos de assinatura de telefones sem fio permite até 750 minutos de uso por mês. O que estes dados sugerem a respeito da utilização que os assinantes de telefones celulares fazem de seus planos de assinatura mensal?
e.
Através da análise do boxplot com os minutos usados por mês em telefone celular, é possível identificar valores discrepantes? Especifique os limites para detecção de valores discrepantes para estes dados, justificando sua resposta anterior. ,
,
0 0 5
0
Resp.: a. Média = 422 minutos; Md = 380 minutos; b. Q 1 = 210 minutos; c. CV = 70,08%; d. Apenas 13,33% dos usuários fazem uso dos telefones por mais de 750 minutos. 75% usam até 615 minutos. Poucos usuários usam seu plano integralmente; e. Não há valores discrepantes. Limites para detecção de outliers = Lista_Exercícios_Estatística_Aplicada_Descritiva2 (-397,50; 1.222,50).
36. Em um teste automobilístico de quilometragem e consumo de gasolina, 13 automóveis foram testados na estrada, em um percurso de 482,80 quilômetros, em condições de dirigibilidade tanto na cidade como na rodovia. Os dados apresentados a seguir referem-se à análise do desempenho obtido em termos de quilometragem por galã o (1 galão = 3,78 litros). -------------------------------------------------------------------------> local = Cidade Desempenho em termos de quilômetros ------------------------------------------------------------Percentiles Smallest 1% 21.24 21.24 5% 21.24 23.17 10% 23.17 24.46 Obs 13 25% 24.62 24.62 Sum of Wgt. 13 50%
25.58
75% 90% 95% 99%
25.91 26.87 27.03 27.03
Largest 25.91 26.07 26.87 27.03
Mean Std. Dev.
25.05154 1.559892
Variance Skewness Kurtosis
2.433264 -1.056555 3.845761
-------------------------------------------------------------------------> local = Rodovia Desempenho em termos de quilômetros ------------------------------------------------------------Percentiles Smallest 1% 27.35 27.35 5% 27.35 27.35 10% 27.35 28.96 Obs 13 25% 28.96 28.96 Sum of Wgt. 13
a.
50%
29.93
75% 90% 95% 99%
30.89 32.18 33.95 33.95
Largest 30.89 31.22 32.18 33.95
Mean Std. Dev.
29.98846 1.863236
Variance Skewness Kurtosis
3.471648 .4640106 2.801077
Use a média, a mediana e algumas separatrizes para fazer uma afirmação sobre a diferença de desempenho quando se dirige na cidade e na rodovia.
b.
Qual é o primeiro quartil? Interprete seu valor. 5 3
0 3
5 2
0 2 Cidade
c.
Rodovia
Através da análise do boxplot da quilometragem de acordo com a estrada, é possível identificar valores discrepantes? Especifique os limites para detecção de valores discrepantes para estes dados, justificando sua resposta anterior. Caso hajam valores discrepantes, que valores são estes?
d.
Avalie a assimetria destas distribuições com base nos boxplots. Justifique sua resposta.
Resp.: a. Local: cidade – Média = 22,05 Km; Md = 25,58 km; Q 1 = 24,62 km; Q 3 = 25,91 km / Local: rodovia – Média = 29,99 km; Md = 29,93 km; Q 1 = 28,96 km; Q 3 = 30,89 km / Maior consumo, em geral, na cidade; b. Q 1 = 24,62 km, na cidade, e 28,96 km, na rodovia. Isto significa, que 25% dos carros na cidade fizeram 24,62 km por galão, enquanto que na rodovia este valor foi 28,96 km; c. Existem valores discrepantes tanto na cidade quanto na rodovia. Limites para dados cidade: (22,69; 27,85); Limites para dados rodovia: (26,07; 33,79). Valor discrepante cidade: 21,24 km; Valor discrepante rodovia: 33,95 km; d. Assimetria cidade: assimétrico positivo; Assimetria rodovia: aproximadamente simétrico.