JAIME FONSECA DANIEL TORRES
EDIÇÕES SÍLABO
É expressamente proibido reproduzir, no todo ou em parte, sob qualquer forma ou meio, NOMEADAMENTE FOTOCÓPIA, esta obra. As transgressões serão passíveis das penalizações previstas na legislação em vigor.
Visite a Sílabo na rede
www.silabo.pt
Editor: Manuel Robalo
FICHA TÉCNICA: Título: Exercícios de Estatística – Vol. 2 Autores: Jaime Fonseca e Daniel Torres � Edições Sílabo, Lda. Capa: Pedro Mota 1ª Edição – Lisboa, Junho de 2002 2ª Edição – Lisboa, Outubro de 2014 Impressão e acabamentos: Europress, Lda. Depósito Legal: 382188/14 ISBN: 978-972-618-774-5
EDIÇÕES SÍLABO, LDA. R. Cidade de Manchester, 2 1170-100 Lisboa Telfs.: 218130345 Fax: 218166719 e-mail:
[email protected] www.silabo.pt
Índice
PREFÁCIO
7
Capí tulo 6 ESTIMAÇÃO PONTUAL
9
Capí tulo 7 ESTIMAÇÃO REGIONAL
65
Capí tulo 8 TESTES DE HIPÓTESES
97
Capí tulo 9 REGRESSÃO LINEAR
171
Capí tulo 10 ANÁLISE DE VARIÂNCIA
223
BIBLIOGRAFIA
295
Prefácio
Na sequência do volume I surge agora o volume II de Exercí cios de Estatí stica, necessariamente mais virado para a Infer ência Estatí stica. A Estatí stica pretende fundamentalmente concluir sobre a população ou populações em estudo, em aspectos variados como sejam, a t í tulo de exemplo: determinação de estimativas (pontuais ou regionais) de par âmetros desconhecidos; estabelecer relações de ordem entre parâmetros desconhecidos de duas ou mais populações; fazer Previsões para uma determinada variável. Este volume II tenta acompanhar tais des í gnios. Usando uma perspectiva traçada no volume I, estamos seguros de que pode ser uma boa contribuição para o domí nio desses aspectos. Os autores
Capítulo 6
10
Exercício 1 Sabendo que certa população tem distribuição Binomial, com parâmetro p desconhecido, obtenha o estimador de máxima verosimilhança de p, com base numa amostra aleatória de dimensão n, ( X 1, X 2 , ... , X n ), dela obtida. Proceda à análise do estimador.
Resolução: Pode aplicar-se o método de máxima verosimilhança dado tratar-se de uma função regular segundo Cramer-Rao (é duplamente diferenciável e os limites de variação não dependem do parâmetro a estimar). 1.
Obtenção do estimador X ~> f X ( x )
=
L ( p )
n
n x = p (1 − p )n − x : µ = x
n
∏ x p x (1 − p)n − x
i =1
i
n p (1
− p)
i
n
∑ x i
n!
∏ x ! (n − x )! p i =1
i =1
σ2 =
=
i
n
=
n p ;
i
n
∑ (n − x i )
(1 − p ) i =1
i
Logaritmizando a função de verosimilhança, tem-se: n
log [ L ( p)]
∑ x i
n n! = log ∏ + x n x ! ! ( − ) i i =1 i
n n! = ∑ log + ∑ x i x i! (n − x i )! i =1 i =1
log p i = 1
n
n n! = ∑ log + ∑ x i x i! (n − x i )! i =1 i =1
log p
n
log p
+
n
+
∑ (n − x i )
log (1 − p ) i = 1
=
n
∑ (n − x i ) log (1 − p) =
i =1
+
2
n log (1 − p )
−
n
∑ x i log (1− p)
i =1
11
Derivando em ordem ao parâmetro, d log [ L ( p)]
=
d p
0
n
1
∑ x i p
+
+
n
2
i =1
n −1 −1 − ∑ x i 1 − p 1 − p i =1
Igualando a zero, tem-se, após eliminar denominadores, n
(1 − p ) ∑ x i i =1
−
n p
n
+ p ∑ x i =
⇔
0
i =1
n
⇔
2
n
n
∑ x i − p ∑ x i − n p + p ∑ x i
i =1
2
i =1
=
0
n
∑ x i − n2 p
⇔
i =1
=
0
⇔
i =1
n
⇔ −
n 2 p
∑ x i
n
= − ∑ x i ⇔
p
Análise do estimador pˆ
⇔
n
i =1
2.
= i =12
pˆ
=
x n
(estimativa)
X
=
n
i) Não enviesamento
Um estimador diz-se não enviesado ou centrado, desde que E [ θ ] = quentemente, ˆ
E [ pˆ ]
n X i ∑ X = E = E i = 12 = n n =
1 n
2
n
∑
E [ X i ]
=
i =1
1 n
2
n E ∑ X i = 2 n i =1
n
∑
i =1
n p
1
=
1 n
2
n n p
= p
Assim, pode dizer-se que θ é um estimador não enviesado para p. ˆ
12
θ. Conse-
ii) Coerência ou consistência
n ∑ X i X = Var = Var i = 12 = n n
Var [ pˆ ]
=
Sendo
n
1 n
4
∑
n p (1
− p ) =
i =1
lim Var [ pˆ ]
n→∞
=
lim
1 n
n
n
4
n n p (1
− p )
p (1
n→∞
4
1
2
=
n Var ∑ X i = i = 1
− p ) =
p (1 n
1 n
− p) 2
4
n
∑ Var [ X i ]
i =1
.
0,
Por ser não enviesado e por verificar a condição anterior, diz-se que
X n
é um
estimador coerente para p.
Exercí cio 2 a) Obtenha, através do método de máxima verosimilhança, com base na informação contida na amostra (4, 3, 0, 2, 1, 1), uma estimativa do parâmetro desconhecido da distribuição Poisson. b) Dessa população extraiu-se uma amostra aleatória ( X 1, X 2 , ... , X 5 ) . Escolha, entre os dois estimadores seguintes, o mais adequado para estimar
a média (µ ) da população. Justifique adequadamente a sua opção. T 1
= X
;
T 2
=
1 6
(2 X 1
− X 2 +
3 X 4
+
2 X 5 )
Resolu çã o: a) X ~> P (λ ) :
λ x − λ ; f X ( x ) = e x !
x
=
0, 1, 2,
13
Como a função é regular no sentido de Cramer-Rao (é duplamente diferenciável e os limites de variação não dependem do parâmetro a estimar) pode aplicar-se o método de máxima verosimilhança. Assim, L (λ )
=
∑ x i
x i
λ
e− λ
∏ x i!
i λ =
∏ x i!
i
log L (λ )
i
∑ x i log λ − ∑ log x i! − n λ
=
i
d log L (λ )
i
∑ x i
=
∂ λ
i
d log L (λ ) d λ
e− n λ
=
1
⇔
0
−
n
∑
x i
λ
i
ˆ = ⇔ λ ˆ = λ
1
λ 1
−
=
n
∑ x i − n λ =
⇔
0
i
∑ x i
= x
(estimativa)
∑ X i
= X
(estimador)
+
+1+
n i
1
⇔
0
n i
Cálculo do valor da estimativa ˆ = λ
1
∑ x i n
=
x
=
4
+
3
+
0
2
1
6
i
=
1,83333
b) Estimadores Consistentes?
i)
Análise do enviesamento 1.
Caso de T 1 ˆ] Para que seja um estimador n ão enviesado deverá ter-se E [λ ˆ] E [λ
1 n = E ∑ X i = n i =1 =
1
n
∑ E [ X i ] =
n i =1
= λ . Sendo
n E ∑ X i = n i =1 1
1
n
∑ λ =
n i =1
1 n
nλ
= λ
T 1 constitui assim um estimador centrado ou n ão enviesado para
14
µ
=
λ
2.
Caso de T 2
= µ = λ . Porque
Identicamente, deverá ter-se E [ T 2 ] E [ T 2 ]
= =
=
1 (2 X − 1 6
E
1 6 1 6
(2 E [ X ]
+
− E [ X 2 ] +
=
3 X 4
+
2 X 5 )
3 E [ X 4 ]
+
2 E [ X 5 ])
X 2
=
− µ + 3µ + 2µ) = 6µ = µ
(2µ
6
T 2 constitui assim um estimador centrado ou n ão enviesado para
µ
=
λ
ii) Análise da consistência 1.
Caso de T 1 Para que seja consistente ou coerente, deverá ter-se n
ˆ] lim V [λ
→ +∞
=
0 , desde
que o estimador seja não enviesado. Ora V [T 1 ]
= =
ˆ] V [λ
1
1 n = V ∑ X i = n i =1
n
∑
V [ X i]
n2 i = 1
Sendo que lim
λ →
=
1
1 n2
n V ∑ X i = i =1
n
∑ λ =
n2 i = 1
1 n2
nλ
=
λ n
0 e por se tratar de um estimador centrado podemos
n afirmar que o estimador é consistente.
2.
Caso de T 2 Var [ T 2 ]
=
Var
=
1
=
36 1 36
1 (2X − 1 6 (4 Var [ X 1 ] (4λ +
X2
+
3X 4
+
+ Var [ X 2 ] +
λ + 9λ + 4λ ) =
=
2X5 )
9 Var [ X 4 ]
18λ 36
=
+
4 Var [ X 5 ] )
=
λ 2
15
Porque lim
λ ≠ 2
0 , pode concluir-se que o estimador T 2 não é consistente.
Em conclusão, face a estes resultados, poder-se-í a concluir nesta fase que o melhor estimador para a média da população é T 1 .
Exercí cio 3 Obtenha através do método de máxima verosimilhança e da amostra que se segue, uma estimativa do parâmetro da distribuição exponencial. 4; 3; 2; 0; 3; 0
Resolu çã o: Obtenha-se em primeiro lugar a função de verosimilhança com base no produto das funções densidade exponencial. Função densidade da variável com distribuição exponencial:
λ e−λ x f X ( x ) = 0
; x ≥ 0 ; x < 0 n
L (λ )
=
n
n
∏ f X ( x i ) = ∏
i =1
i
λ e − λ x i
n
= λ
e
− λ ∑ x i i =1
i =1
Dado tratar-se de uma função regular no sentido de Cramer-Rao, pode aplicarse o método de máxima verosimilhança. Aplique-se a função logaritmo à função de verosimilhança para facilitar posteriormente a derivada.
log L (λ )
=
log
− λ ∑n x i n i = 1 λ e = =
n
log
n
λ +
n log
log e
λ − λ
− λ ∑ x i
n
∑ x i
i =1
16
i =1
=
Derive-se agora em ordem a λ e iguale-se a derivada a zero. d log L (λ ) d
λ
⇔
= n
n
1
λ
n
1
− ∑ x i =
λ
i =1
n
= ∑ x i
⇔
0
⇔
i =1
n
1
⇔
λ
∑ x i
= i =1 n
ˆ = λ
⇔
⇔
n
=
n
∑ x i
1 x
i =1
Logo com base na amostra dada tem-se o seguinte valor para a estimativa do parâmetro: ˆ = λ
1 x
=
6 4
+
3
+
2
+
0
+3+
0
=
6 12
=
0,5
Exercí cio 4 Seja ( X 1, X 2 , ..., X n ) uma amostra aleatória extraí da de uma população com função densidade da forma:
x 2 e− x / λ f ( x ) = 2 λ 3 0
; ;
x
>
0
,
λ >
0
c.c.
a) Identifique o estimador de máxima verosimilhança do parâmetro desconhecido, com base na amostra aleatória. b) Classifique o estimador, ao ní vel de enviesamento e consistência.
17
Resolu çã o: a) Obtenha-se em primeiro lugar a fun ção de verosimilhança com base no produto das funções densidade.
L (λ )
=
n
x i2 e
n
∏ f X ( x i ) = ∏ i
i =1
− x i / λ
2 λ 3
i =1
n
− ∑ x i / λ 1 n i =1 x e = 3 ∏ i 2 λ i = 1 n
2
Tratando-se de uma função regular segundo Cramer-Rao, aplique-se a fun ção logaritmo à função de verosimilhança para facilitar posteriormente a derivada.
log L (λ )
=
log
n
− ∑ x i / λ 1 n ∏ x i e i =1 3 = 2 λ i = 1 n
2
n
∑ x i
n
= − n log (2 λ 3 ) + 2 ∑ log x i − i = 1 λ i =1
Derive-se agora em ordem a λ e iguale-se a derivada a zero. n
d log L (λ ) d
λ
⇔ −
= −n
3n
3
∑ x i
+ i = 12 λ λ n
λ + ∑ x i = i =1
ˆ = ⇔ λ
x
ˆ = ⇔ λ
X
3 3
0
=
0
⇔
⇔
(estimativa) (estimador)
b) Em função do resultado anterior ficamos a saber que o estimador correspon-
ˆ = X . dente é λ 3
18
1.
Enviesamento E ( X )
=
1
n
∑ E ( X i )
n i =1
n (3λ )
=
n
= 3λ ,
uma vez que E [ X ] = 3λ , tratando-se de uma distribuição Ga (3, λ ). Assim, ˆ) E (λ
=
1 3
= λ ,
E ( X )
ˆ constitui um estimador não enviesado ou centrado para λ . ou seja, λ
2.
Consistência Atendendo a que V [ X ] = 3 λ 2 , ˆ lim V (λ )
n
→∞
=
1 9
lim V ( X ) n→∞
=
n
1 9n
2
∑ V ( X i )
λ 2
= lim
n → ∞ 3n
i =1
ˆ é um estimador consistente para Conclui-se assim que λ
=
0.
λ .
Exercí cio 5 Considere a variável aleatória X com a seguinte função densidade f X ( x )
=
δ+ 3
3
x δ 3 ;
0
≤ x ≤
1
,
α >
0
Estime com base numa amostra aleatória de tamanho n, através do método de máxima verosimilhança o parâmetro δ.
Resolu çã o: Como a função é regular no sentido de Cramer-Rao pode aplicar-se o m étodo de máxima verosimilhança.
19
L (δ )
=
n
n
∏ f X ( x i ) = ∏
i =1
δ+
3
δ3
i =1
=
x i
3
δ3
n log (δ
d log L (δ ) d δ
= =
d log L (δ ) d δ
=
d
+ 3) −
n
δ+
0
+
n log 3
n log (δ + 3) −
d δ
3
⇔ ⇔
+
δ3
+ 3)n n x ∏ i 3n i =1
(δ + 3)n n log L (δ ) = log x i ∏ n 3 i = 1
=
(δ
= δ
n
∑ log x i
3 i =1
n log 3
+
δ
n
∑ log x i =
3 i =1
n
1
∑ log x i
3 i =1
n
δ+
+
3
n
1
∑ log x i
3 i =1
=
⇔
0
n
3n
+ (δ + 3) ∑ log x i =
⇔
0
i =1
n
⇔ (δ + 3) ∑ log x i = −3n ⇔ i =1
⇔ δ+
3
=
− 3n n
⇔
∑ log x i
i =1
⇔ δˆ =
−
3n
−3
n
∑ log x i
i =1
δˆ =
− n
3n
∑ log x i
i =1
20
−
3 (estimativa)
e
δˆ =
− n
3n
∑ log X i
i =1
− 3 (estimador)
é licenciado em Economia (Universidade Lusíada, 1992) e mestre em Matemática Aplicada à Economia e à Gestão (Instituto Superior de Economia e Gestão Universidade Técnica de Lisboa, 1997). Possui uma pós-graduação em E-Business (Instituto Superior de Economia e Gestão, 2001). Obteve o DEA (Diploma de Estudios Avanzados ) do programa de Doutoramento em Sociedad de la Información y el Conocimiento pela UPSAM (Universidade Pontifícia de Salamanca-Pólo de Madrid, 2005). É Técnico Oficial de Contas e membro efectivo da Ordem dos Economistas. Desde 1992 tem exercido docência em várias universidades, entre as quais, Universidade Lusíada, Universidade Internacional, Instituto Superior de Gestão Bancária, Universidade Autónoma de Lisboa e Universidade Aberta. Para além da docência, no início da sua carreira profissional estagiou e trabalhou como técnico no departamento financeiro de uma empresa de factoring de um grupo bancário, tendo vindo ao longo da última década a desenvolver, ao nível da gestão, actividade como administrador e gerente de empresas e ao nível contabilístico-financeiro, actividade como director administrativo-financeiro e como Técnico Oficial de Contas de várias empresas.
DANIEL FERNANDES TORRES
JAIME RAÚL SEIXAS FONSECA
é licenciado em Engenharia Electrotécnica (Faculdade de Engenharia – Universidade do Porto, 1977) e mestre em Probabilidades e Estatística Computacional e Análise de Dados (Faculdade de Ciências – Universidade de Lisboa, 1988). Leccionou em universidades públicas e privadas, entre as quais, Universidade Nova, Instituto Superior Técnico – Universidade Técnica de Lisboa, Universidade Lusíada, Universidade Moderna e Universidade Internacional. Paralelamente exerceu funções no Instituto Português da Qualidade. Actualmente é docente no Instituto Superior de Ciências Sociais e Políticas – Universidade Técnica de Lisboa.
Baseado na longa experiência dos autores no ensino da estatística nos mais diversos cursos e escolas, esta obra apresenta um vasto conjunto de exercícios práticos resolvidos que permitirão aos alunos testar e validar os conhecimentos teóricos adquiridos. Os estudantes de estatística encontrarão aqui as mais variadas aplicações, podendo seleccioná-las de entre os temas tratados, consoante a área de ensino e a profundidade da abordagem feita à matéria.
ISBN 978-972-618-774-5
9 789726 187745
1 4 6