UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIÊNCIAS EXATAS ESTATÍSTICA PEX 502
Prof. Paulo Henrique Henriqu e Sales Guimarães 2015-1
Lista de exercícios adicionais para o Encontro Presencial (Questão 1) Uma remessa de 800 estabilizadores de tensão é recebida pelo controle de qualidade de uma empresa. e mpresa. São inspecionados inspecionados 20 aparelhos da remessa, que será aceita se ocorrer no máximo um defeituoso. Há 80 defeituosos no lote. Qual a probabilidade de de o lote ser aceito? aceito?
Resposta: 0,3917. (Questão 2) Acredita-se que 20% dos moradores das proximidades de uma grande indústria siderúrgica têm alergia aos poluentes lançados ao ar. Admitindo que este percentual de alérgicos seja real (correto), sendo assim, calcule a probabilidade de que pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso.
Resposta: 0,2526. (Questão 3) O escore em um teste internacional de proficiência na língua inglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor desempenho. Informações, coletadas durante vários anos, permitem estabelecer o seguinte modelo para o desempenho desempenho no teste:
Várias universidades americanas exigem um escore mínimo de 600 pontos para aceitar candidatos de países de língua não inglesa. De um grande grupo de estudantes brasileiros que prestaram o último exame escolhemos escolhemos ao acaso 20 deles. deles. Qual a probabilidade de de no máximo máximo 3 atenderem ao requisito requisito mínimo mínimo mencionado?
Resposta: 0,867.
(Questão 4) Uma indústria de tintas recebe pedidos de seus vendedores por meio de fax, telefone e internet. A taxa média é de 5 pedidos por hora. a)
Qual a probabilidade da indústria receber mais de dois pedidos por hora?
Digamos que, no horário do almoço, a indústria fica impossibilitada de atender a mais de dois pedidos por hora. Você acha que deveria aumentar o nº de atendentes nesse período? b)
Em um dia de trabalho (8 horas) qual seria a probabilidade de haver 50
pedidos? A indústria deveria aumentar o nº de atendentes para receber mais de 50 pedidos por dia?
Resposta: a) 0,8754; b) 0,0177. Discussão: P[X>50] = 0,05262805. Logo, em aproximadamente 5% dos casos a indústria receberá mais de 50 pedidos. Portanto, se a gerência considerar esse índice alto, pode-se decidir em contratar mais funcionários. Caso contrário, não.
(Questão 5) Para determinar a eficiência de uma certa dieta na redução da quantidade de colesterol na corrente sanguínea, 100 pessoas são submetidas a essa dieta por um intervalo de tempo bastante prolongado. Em seguida são registrados os níveis de colesterol dessas pessoas. O nutricionista responsável pelo experimento decidiu endossar a dieta se pelo menos 65% dessas pessoas apresentarem um nível de colesterol menor após serem submetidas à dieta. Qual a probabilidade de que o nutricionista endosse a nova dieta se, na verdade, ela não tem efeito algum sobre o nível de colesterol? Calcule pela distribuição Binomial e pela aproximação para distribuição Normal. (Admita que se a dieta não tem efeito algum sobre a quantidade de colesterol, então o nível de colesterol de cada pessoa será maior após a dieta com probabilidade 0,5).
Resposta:
Sob hipótese de não efeito da nova dieta P[X≥65] = 1 – P[X<65]
=
0,001758821. X aprox. N (50,25). P[ X 65] Correção : P[ X 64, 5] 1 P[ Z 2, 9] 0, 001865.
(Questão 6) A probabilidade de uma lâmpada se queimar ao ser ligada é de 1/100. Numa instalação com 100 lâmpadas, qual a probabilidade de 2 lâmpadas se queimarem ao serem ligadas? Use a aproximação pela Poisson.
Resposta: 0,183940.
(Questão 7) Numa linha adutora de água, de 60 Km de extensão, ocorrem 30 vazamentos no período de um mês. Qual a probabilidade de ocorrer, durante o mês, pelo menos 3 vazamentos num certo setor de 3 Km de extensão?
Resposta: 0,191154. (Questão 8) Numa fita de som, há um defeito em cada 200 pés. Qual a probabilidade de que: a) Em 500 pés não aconteça defeito? b) Em 800 pés ocorram pelo menos 3 defeitos?
Resposta: a) 0,082085; b) 0,761896. (Questão 9) Determine as probabilidades de: a) P(Z < 1,58) b) P(-1,60 < Z < 1,40) c) P(Z > 2,10) d) P(Z > 4,5)
Resposta: a) 0,9430; b) 0,8644; c) 0,0179; d) 0. (Questão 10) Sabendo que X tem distribuição normal com média 10 e desvio padrão 2, determine: a) P (8 < X < 10) b) P (9 < X < 12) c) P(X <10) d) P (7< X <11)
Resposta: a) 0,3413; b) 0,5328; c) 0,50; d) 0,6247. (Questão 11) Suponha que a renda familiar de uma comunidade possa ser razoavelmente aproximada por uma distribuição normal com média igual a 15 unidades monetárias e desvio padrão igual a 3 U.M. Numa amostra de 50 famílias, quantas podemos esperar que tenham renda inferior a 10,5 U.M.?
Resposta: 3,34.
(Questão 12) O peso de 600 estudantes é normalmente distribuído com média de 65,3 kg e desvio padrão de 5,5 kg. Determine o numero de estudantes que pesam: a) entre 60 e 70 kg; b) mais de 63,2 kg; c) menos de 68 kg.
Resposta: a) 380; b) 389; c) 413. (Questão 13) Um fabricante de máquinas de lavar sabe, por longa experiência, que a duração de suas máquinas tem distribuição normal com média de 1000 dias e desvio padrão de 200 dias. Oferece uma garantia de um ano (365 dias). Produz mensalmente 2000 máquinas. Quantas esperam trocar, mensalmente, pelo uso da garantia? Resposta: 1,5.
(Questão 14) Suponha que o tempo necessário para atendimento de clientes em uma central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e desvio padrão de 2 minutos. a) Qual é a probabilidade de que um atendimento dure menos de 5 minutos? b) E mais do que 9,5 minutos? c) E entre 7 e 10 minutos? d) 75% das chamadas telefônicas requerem pelo menos quanto tempo de atendimento?
Resposta: a) 0,0668; b) 0,2266; c) 0,5328; d) 6,7 minutos. (Questão 15) Retirou-se uma amostra de 9 elementos de uma população com distribuição normal, obtendo média igual a 8,2. Considere o desvio padrão populacional igual a 0,4. Determinar o intervalo de confiança para a média populacional, usando 99% de confiança.
Resposta: [7,86 a 8,54]. (Questão 16) O tempo de montagem de determinados conectores utiliza um processo já há algum tempo, que dura em média 3,5 segundos. Está sendo analisada a possibilidade de troca deste processo para outro que se afirma possuir um tempo de montagem menor. Para esta análise foram observados os tempos de montagem de
conectores por um operário padrão utilizando o novo processo e foram anotados os seguintes valores (em segundos): 2,5 -2,5- 2,6- 3,0- 3,2- 3,5- 3,7- 3,7- 2,1- 2,4- 2,7- 2,8- 3,1- 3,1- 3,6- 3,6- 2,52,9- 2,8- 3,8. Considerando a situação exposta acima e utilizando um nível de confiança de 95%: a) Estime um intervalo de confiança para o tempo médio de montagem dos conectores utilizando o novo processo. Resposta: [2,767; 3,243]. b) Calcule o tamanho mínimo da amostra que seria necessária para estimar a média com 95% de confiança e precisão de 0,5 segundos. Resposta: n = 5.
(Questão 17) A satisfação da população em relação a determinado governo foi pesquisada através de uma amostra com a opinião de 1000 habitantes do estado. Destes, 585 se declararam insatisfeitas com a administração estadual. Admitindo-se um nível de significância de 5%, solucione os itens abaixo. a) Estime o percentual da população que está insatisfeita com a administração estadual. Resposta: 55,45% a 61,55%. b) Qual o tamanho da amostra necessária para a estimação se a empresa responsável pela pesquisa estipulou uma folga máxima de 2,5% ? Resposta: n = 1493.
(Questão 18) Um pesquisador deseja estimar a proporção de ratos nos quais se desenvolve certo tipo de tumor quando submetidos à radiação. Ele deseja que sua estimativa não se desvie da proporção verdadeira por mais de 0,02 com uma probabilidade de pelo menos 90%. a) Quantos animais ele precisa examinar para satisfazer essa exigência? Resolução: Pelo enunciado acima temos: - Erro da estimativa: e=0,02. - Coeficiente de confiança: P(e) = e = 0,90. Logo, pela tabela da distribuição Normal Padrão, temos que z é tal que A(z) =0,95, portanto, z=1,64. Como não temos uma informação preliminar sobre p, devemos utilizar p=0,5, que .
maximiza p(1-p). Assim, podemos calcular o tamanho da amostra da seguinte forma: 2
2
1,64 z n p(1 p ) 0, 25 1.681. 0,02 e
Logo, para que o erro cometido na estimação da proporção de ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiação seja no máximo 0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.681 animais. b) Como seria possível diminuir o tamanho da amostra utilizando a informação adicional de que em geral esse tipo de radiação não afeta mais que 20% dos ratos?
Resolução: Se p for no máximo 20%, o tamanho da amostra será: . 2
2
1,64 z n p(1 p) 0, 20*0,80 1.076. 0,02 e
Logo, se p for no máximo 20%, para que o erro cometido na estimação da proporção de ratos nos quais se desenvolve certo tipo de tumor quando submetidos a radiação seja no máximo 0,02 com probabilidade igual a 0,90, o pesquisador precisa examinar 1.076 animais.
(Questão 19) Suponha que X ~ N , 4 . Deseja-se testar as seguintes hipóteses: Ho: µ=10 H1: µ >10 a) A partir da probabilidade do erro tipo I igual a 0,03 e uma amostra de 16 elementos, obtenha a região critica (RC) do teste (na escala padronizada e na escala em X). R: {RC: Z>1,88} ou {RC:
X
>10,94}.
b) Suponha que em uma mostra aleatória de X com tamanho 16, observa-se que a média amostral é igual a 11,2. Teste as hipóteses de interesse utilizando a RC na escala padronizada e escala em X. R: rejeita Ho, Z=2,40. c) Calcule o erro tipo II para µ = 10,5, µ = 11, µ = 11,5 e µ = 12 e faça um esboço da curva de poder. R: P(Erro tipo II) = 0,8299, 0,4840, 0,1492, 0,0207.
(Questão 20) O tempo médio de atendimento em uma agência lotérica está sendo analisado por técnicos. Uma amostra de 40 clientes foi sistematicamente monitorada em relação ao tempo que levavam para serem atendidos, obtendo-se as seguintes estatísticas: tempo médio de atendimento de 195 segundos. Considere o desvio padrão populacional igual a 15 segundos.Considerando que o tempo de utilização segue uma distribuição normal: a) Faça uma estimação por intervalo para o tempo médio de utilização para toda a população de clientes da agência lotérica, utilizando um nível de confiança de 95%. R.
[190,35 a 199,65]. b) O dono da agência garante que o tempo médio de atendimento é de 3 minutos (se for maior ele se compromete a contratar mais um atendente). Com base nos dados da amostra a afirmação do dono é verdadeira, ou ele deve contratar um novo atendente? Use um nível de significância de 1%? R.: Sim, Z = 6,32.
(Questão 21) Um comprador, ao receber de um fornecedor um grande lote de peças, decidiu inspecionar 200 delas. Decidiu, também, que o lote será rejeitado se ficar convencido, ao nível de 5% de significância, de que a proporção de peças defeituosas no lote é superior a 4%. Qual será sua decisão (aceitar ou rejeitar o lote) se na amostra foram encontradas onze peças defeituosas? (Passos: defina as hipóteses, faça o teste, tome a decisão). R : Não se rejeita Ho, ou seja, a decisão será aceitar o lote.
(Questão 22) Vamos considerar um caso em suinocultura. Seja uma amostra de 50 leitões ( n = 50), aos quais foi fornecida a nova ração (B), deve-se ou não adotar essa ração, admitindo-se como resultado um ganho em peso médio diário de 504 g ( x a 504g ), fixando = 5%? Resposta: Como zobs < z c, não se rejeita H 0 ao nível de 5%.
(Questão 23) Um laboratório de vacinas contra febre aftosa reivindicou que ela imuniza 90% dos animais. Em uma amostra de 200 animais, nos quais foram aplicados a vacina, 160 foram imunizados. Verificar se a declaração do fabricante é verdadeira ao nível de 5%.
Resposta: RC = {Z -1,65}. Decisão: Como zobs < zc, rejeita-se H0 ao nível de 5%, ou seja, a proporção de imunização é menor do que 90%.
(Questão 24) Deseja-se saber se duas máquinas de empacotar café estão fornecendo o mesmo peso médio em kg. Extraem-se duas amostras, uma de cada máquina (supondo que os pesos das amostras sigam uma distribuição normal): Máquina Nova - 36 amostras, média = 0,81 kg, variância = 0,00020 kg 2. Máquina Velha - 39 amostras, média = 0,78 kg, variância = 0,00135 kg 2. Qual é a sua conclusão a 5% de significância?
Resposta: t calculado foi 4,73. Assim, concluímos com 95% de confiança (ou uma chance de erro de 5%) que há diferença entre os pesos médios dos pacotes fornecidos pelas duas máquinas. Seria recomendável descobrir qual das duas está com problemas para efetuar as correções necessárias.
(Questão 25) (Resolvido) Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X
2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0
Y
2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1
(a) Construa o diagrama de dispersão para esses dados. Diagrama de Dispersão 10,5 9,5 8,5 7,5 6,5
Y
5,5 4,5 3,5 2,5 1,5 2
3
4
5
6
X
7
8
9
10
(b) Trace no gráfico a reta com 45º de inclinação passando pela origem. Como essa reta pode ser útil na avaliação do instrumento?
10
y
5
0 0
5
10
x
Esta reta é útil, pois, quanto mais próximos os pontos estiverem nela, maior à precisão do instrumento, já que o ideal é Y=X. (c) Calcule o coeficiente de correlação entre as variáveis X e Y. X 6
Y 6,040
15
X i 660 2
i 1
Y i 663,380 2
i 1
15
( X
i
r
15
15
Y X i
i
661,200
i 1
X )(Y i Y )
i 1
S X S Y
0,996
(d) Obtenha a reta de regressão da variável Y em função de X. A reta de regressão estimada da variável Y e X é
Y 0,160 0,980 X .
(Questão 26) (Resolvido) É esperado que a massa muscular de uma pessoa diminuísse com a idade. Para estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre 40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y).
(a)
Massa muscular (Y)
Idade (X)
82.0
71.0
91.0
64.0
100.0
43.0
68.0
67.0
87.0
56.0
73.0
73.0
78.0
68.0
80.0
56.0
65.0
76.0
84.0
65.0
116.0
45.0
76.0
58.0
97.0
45.0
100.0
53.0
105.0
49.0
77.0
78.0
73.0
73.0
78.0
68.0
Construa o diagrama de dispersão e interprete-o.
120 110
r 100 a l u c s 90 u m . M 80 70 60 40
50
60
70
80
Idade
No gráfico de dispersão entre a variável massa muscular e idade, pode-se observar que há um forte indício de relação linear decrescente entre as variáveis em estudo. Nota-se que a massa muscular das pessoas diminui à medida que a idade aumenta. (b)
Calcule o coeficiente de correlação linear entre X e Y.
Denotamos as variáveis: Y = Massa Muscular e X = Idade n=18 X 61,556
18
X
Y 85
2 i
18
Y
70362
2
i
i 1
18
X
S XX
2 i
133300
i 1
18
Y X 91964 i
i
i 1
18 X 70362 18(61,556) 2 2157,460 2
i 1
S YY
18
Y i 18 Y 2
2
18(85) 2 3250 133300
i 1
18
r
18
X Y 18 X Y
( X i X )(Y i Y )
i 1
i
S XX S YY
i
i 1
S XX S YY
91964 18(85)(61,556) (2157,460)(3250)
-0,837
Segundo o resultado da correlação obtida, pode-se notar que há uma forte correlação linear entre a variável massa muscular e idade. Nota-se que à medida que a idade da pessoa aumenta a massa muscular diminui o que é coerente com o gráfico de dispersão apresentada anteriormente.
Ajuste uma reta de regressão para a relação entre as variáveis Y: massa
(c)
muscular (dependente) e X: idade (independente). 1 ˆ
S XY
91964 18(85)(61,556) 2157,460
S XX
-1,027
e
0 Y 1 X 85 1,027(61,556) 148,218 ˆ
ˆ
A reta de regressão estimada da variável Massa muscular (Y) em função da Idade (X) é
Y 148,218 1,027 X
(d)
Considerando a reta estimada dada no item (c), estime a massa muscular
média de mulheres com 50 anos.
Y 50 0 1 X 148,218 - 1,027(50) 96,868 . ˆ
ˆ