Título: Unidade 02
Autor: Marcelo Resende
ANÁLISE DE REGRESSÃO EXERCÍCIOS1 1) Suponhamos que uma cadeia de supermercados tenha financiado um estudo dos gas-
tos com mercadorias para famílias de quatro pessoas. A investigação se limitou a famílias com renda líquida entre $8.000 e $20.000. Obteve-se a seguinte equação:
Yc = -200 + 0,10x r2 = 0,71 sendo, Yc = despesa anual com mercadorias x = renda renda líquida anual Suponha que os dados tenham sido obtidos por amostragem aleatória. a)À luz do coeficiente r2 acima, qual sua opinião sobre a qualidade da reta para previsão de despesas? b)Estime a despesa de uma família f amília de quatro pessoas com renda anual de $15.000. c)Um dos diretores ficou intrigado com o fato de a equação aparentemente sugerir que uma família com $2.000 de renda não gaste nada em mercadorias. Qual é a explicação para isso? d)Explique suscintamente por que a equação acima não poderia ser usada nos casos seguintes: 1.Estimativa das despesas com mercadorias para famílias com cinco pessoas. 2.Estimativa das despesas com mercadorias para famílias com renda líquida de $21.000 a $35.000. 2) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o
peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela Peso real 18 30 42 62 73 97 120 Peso aparente aparent e 10 23 33 60 91 98 159 Calcule o índice de correlação.
3) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da esco-
la A: X Y
11 13
14 14
19 18
19 15
22 22
28 17
30 24
31 22
34 24
37 25
1
Extraídos de: CRESPO, Antônio Arnot. Estatística fácil., STEVENSON, Willian. Estatística Aplicada à Administração., DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada., WERKEMA, Maria Cristina Catarino, AGUIAR, Sílvio. Análise de Regressão: Como entender o relacionamento entre as variáveis de um processo, e outros badulaques. PUC Minas Virtual • 1
Verifique, graficamente, se existe correlação retilínea entre as variáveis. Em caso afirmativo, calcule o coeficiente de correlação. 4) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de
aço varia conforme a temperatura: Temperatura (ºC) Comprimento (mm)
10 1003
15 1005
20 1010
25 1011
30 1014
Determine: o coeficiente de correlação; a reta ajustada a essa correlação; o valor estimado do comprimento da barra para a temperatura de 18ºC; o valor estimado do comprimento da barra para a temperatura de 35ºC. (comente qual a ressalva necessária a esta estimação) 5) Certa empresa, estudando a variação da demanda de seu produto em relação à varia-
ção de preço de venda, obteve a tabela: Preço Demanda
38 350
42 325
50 297
56 270
59 256
63 246
70 238
80 223
95 215
110 208
Determine o coeficiente de correlação; Estabeleça a equação da reta ajustada; Estime Y para x=60 e x=120. 6) Calcule a reta de regressão, sendo M2 a variável independente:
M2 = moeda em circulação IPC = Índice de preços ao consumidor Ano 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
M2 1286,7 1389,0 1497,1 1629,8 1793,3 1952,9 2186,3 2374,7 2569,7 2811,6 2910,1 3069,9 3223,1 3327,8 3425,4
IPC 60,6 65,2 72,6 82,4 90,9 96,5 99,6 103,9 107,6 109,6 113,6 118,3 124,0 130,7 136,2
PUC Minas Virtual • 2
7) Com base nos dados abaixo:
a - calcule os coeficientes da equação de regressão. b - duplique cada valor de X e recalcule os coeficientes. c - duplique os X’s e os Y’s originais e recalcule os coeficientes. d - use os X’s originais mas some 2 a cada valor Y original e recalcule os coeficientes. Dados originais: x 1 y 2
2 4
3 5
4 6
5 7
6 7
7 9
a - Equação => bx y Equação => Comentário:_____________________________________________________ cx y Equação => Comentário:_____________________________________________________ dx y Equação => Comentário:_____________________________________________________ 8) Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica”(xi) e
“volume de produção nas empresas industriais”(yi), fez-se uma amostragem que inclui vinte empresas, computando-se os seguintes valores:
∑ x i =11,34 ∑ y i =20,72 ∑ xi2 =12,16 ∑ yi2 =84,96 ∑ xi yi =22,13 Determine: o cálculo do coeficiente de correlação; a equação de regressão de Y para X; a equação de regressão de X para Y; 2 Responda: há diferença entre o r de Y para X e de X para Y? 9) A tabela abaixo apresenta a produção de uma indústria:
1990 1991 1992 1993 1994 1995 1996 1997 1998 Anos Quantidade 34 36 36 38 41 42 43 44 46 PUC Minas Virtual • 3
Calcule: a) o coeficiente de correlação Sugestão: para simplificar os cálculos, use para o tempo uma variável auxiliar, por exemplo: xi’ = xi - 1994 b) a reta ajustada c) a produção estimada para 1999. Obs: lembre-se de que foi usada uma variável auxiliar. 10) A variação no valor do BTN (Bônus do Tesouro Nacional), relativamente a alguns me-
ses de 1990, deu origem à tabela: Meses Valor (Cr$)
• • •
abr.
mai.
jun.
jul.
ago.
set.
out.
nov.
41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76
Calcule o grau de correlação; Estabeleça a equação de regressão de Y sobre X; Estime o valor do BTN para o mês de dezembro.
Sugestão: Substitua os meses, respectivamente, por 1, 2, ..., 8. 11) Uma companhia com 09 lojas compilou dados sobre a área de vendas (em m 2) versus
lucro mensal. Determine a equação de regressão, bem como o coeficiente de determinação. Dê sua opinião quanto à pertinência dessa reta face aos dados levantados. Comente se, de fato, lucro depende de lojas maiores ou menores. Loja
Lucro Mensal (em $1.000)
M2 em (10.000)
A B C D E F G H I
45 115 120 75 170 130 75 105 200
55 200 180 90 260 200 85 180 300
12) Determine uma equação preditora do montante de seguro (em R$mil) em função da
renda anual (em R$milhão), com base nos dados abaixo.Em seguida, calcule o coeficiente de determinação e comente se a demanda de seguros depende da renda das pessoas. Renda Anual Seguro
20 10
25 12
26 15
18 10
16 15
17 20
32 30
13 5
38 40
40 50
42 40
13) A tabela abaixo relata os custos de manutenção por hora, classificados por idade de
máquinas em meses. Determinar a reta dos custos sobre a idade e fazer uma previsão de
PUC Minas Virtual • 4
custo para uma máquina de 3 anos e meio. Levantar o coeficiente de determinação, comentando a capacidade preditora da equação obtida. Idade (meses) Custos Médios ($)
6,0 9,7
15,0 16,5
24,0 19,3
33,0 19,2
42,0 26,9
14) A administração de um banco desejava estabelecer um critério para avaliar a eficiên-
cia de seus gerentes. Para isto levantou, para cada um dos sub-distritos onde possuía agência, dados a respeito do depósito médio mensal por agência e o número de estabelecimentos comerciais existentes nesses sub-distritos. São os seguintes os dados: Sub-distritos
Sabará Casa Verde Vila Formosa Mooca Brooklin Jardins Santo Amaro Lapa Pinheiros
No. de Estabelecimentos Comerciais
16 30 35 70 90 120 160 237 378
Depósito Médio por Agência ($10.000)
14 16 19 30 31 33 35 43 50
a)Levante o coeficiente de determinação e explique o que ele representa nesse quadro. b)Qual agência você considera a mais eficiente e a menos eficiente? 15) Quando da realização do orçamento anual, a empresa Americana de Tecidos levan-
tou os seguintes custos de materiais indiretos face às horas de máquinas empregadas na produção ao longo do ano: Mês
Horas de Uso Direto de Máquinas
Custo de Materiais Indiretos ($)
Jan 44.000 $875 Fev 41.000 850 Mar 45.000 875 Abr 43.000 850 Mai 36.000 750 Jun 22.000 550 Jul 23.000 500 Ago 15.000 450 Set 30.000 600 Out 38.000 700 Nov 41.000 800 Dez 44.000 850 a)Levante o coeficiente de determinação e comente a qualidade do modelo. b)O que representa o coeficiente linear na equação levantada? E o coeficiente angular? c)Qual seria o custo variável esperado de materiais indiretos, no caso de 28.500 horas de trabalho de máquina?
PUC Minas Virtual • 5
16) A Indústria MIMI vende um remédio para combater resfriado. Após 2 anos de opera-
ção, foram coletadas as seguintes informações: Trimestre
Vendas (10.000 unids)
Despesas com Propaganda
Temperatura Média no Trim.
1 2 3 4 5 6 7 8
25 13 8 20 25 12 10 15
11 5 3 9 12 6 5 9
2 13 16 7 4 10 13 4
a)Encontre as duas retas de regressão. b)Qual das duas você acha estatisticamente mais adequada para prever as vendas? Por quê? c)De acordo com a decisão acima, qual a previsão de vendas para um trimestre em que a despesa de propaganda será 8? E para a temperatura prevista de 10?
17) Seguem dados relacionados ao número de semanas de experiência de trabalhadores
numa empresa de eletrônicos, face ao número de itens rejeitados durante um período de tempo qualquer. Semanas de experiência No de itens rejeitados
7 26
9 20
2 38
14 16
8 23
12 18
10 24
4 26
6 28
11 22
Pede-se: a) Determinar a equação de regressão e o coeficiente de determinação. b) Esclarecer o significado dos valores dos coeficientes de determinação e angular encontrados no item anterior. c) Vejam que o terceiro elemento da tabela acima tem 2 semanas de experiência. Que comentários você faria a propósito desse elemento quanto a sua influência no conjunto dos dados amostrais levantados? 18) É possível prever o tempo gasto no caixa de um supermercado como função do valor
da compra? Para responder a essa pergunta tomou-se uma amostra de fregueses, medindo-se as duas variáveis. Os resultados estão no quadroa seguir. Com base nele, determine a equação da reta e o coeficiente de determinação. OBS: Resolva este exercí- cio sempre com 06 decimais.
Freguês 1 Tempo(min) 3,8 Valor($) 40
2
3
4,2 40
4
0,9 3
5
5,6 55
6
3,1 28
7
1,7 8
8
4,4 52
9
0,2 3
10
2,6 20
1,2 8
t = 2,306 a)Qual o tempo gasto para um freguês com despesa de $35? b)Qual o tempo mínimo gasto por um freguês que dispendesse $35, a 95% de certeza? (O valor t, dado, incorpora tal nível de certeza).
PUC Minas Virtual • 6
19) Um analista de uma empresa de transporte toma uma amostra aleatória de 9 carre-
gamentos recentes por caminhão feitos por sua companhia e anota a distância (em kms) e o tempo de entrega (em horas). Os valores levantados são: 825 215 1070 550 480 920 13,8 3,8 15,6 9,4 8,1 14,6 t(correspondente a um grau de certeza de 95%) = 2,365 Distância Tempo
1350 21,2
325 5,7
670 11,6
OBS: Resolva este exercício sempre com 06 decimais.
a)Levante a reta de regressão e o coeficiente de determinação. b)Explique os significados do coeficiente angular e do coeficiente de determinação para os valores encontrados. c)Qual o tempo esperado para uma viagem entre o Rio de Janeiro e Recife, na distância de 2.200 kms? d)A um grau de certeza de 95% (correspondente à estatística t acima), e se você fosse o responsável pelo setor de transporte desta empresa, como avaliaria o comportamento de um motorista que completasse um percurso de 1000 kms no tempo de 12 horas? e)E para motoristas que fizessem este percurso em 18,5 horas; qual seria sua avaliação?
20) Analise sua capacidade de conceituar:
a - regressão linear simples; b - reta de regressão; c - variável dependente; d - variável independente; e - cota da reta em y; f - coeficiente angular; g - método dos mínimos quadrados; h - correlação; i - intervalo de confiança.
PUC Minas Virtual • 7