CONTROL CONTROLE E ESTA ESTATÍST TÍSTICO ICO DE QUALIDADE
Teste estess de de hipót hipóteses eses e AN ANOVA
SUMÁRIO CONCEITOS BÁSICOS; D E HIPÓTESES HIPÓ TESES PARA MÉDIA; • TESTES DE • 1-sample z; • 1-sample t; • 2-sample z; • 2-sample t; • t pareado; • ANOVA ANOVA one way; • Ruído •
SUMÁRIO CONCEITOS BÁSICOS; D E HIPÓTESES HIPÓ TESES PARA MÉDIA; • TESTES DE • 1-sample z; • 1-sample t; • 2-sample z; • 2-sample t; • t pareado; • ANOVA ANOVA one way; • Ruído •
CONCEITOS BÁSICOS Inferência estatística (MONTGOMERY, 2004): ramo da estatística que visa a obtenção de resultados ou tomada de decisão com base em uma amostra selecionada desta população. • Amostra aleatória: x1 , x2 , ..., xn – na amostra aleatória de tamanho n cada observação xi é independente e identicamente distribuída. •
POPULAÇÃO
AMOSTRA
CONCEITOS BÁSICOS Distribution Distribution Plot
Histogram of C1
Normal; Mean=100; Mean=100; StDev=5
350
0,09
300
0,08 0,07
250
0,06
y c 200 n e u q e r 150 F
y t 0,05 i s n e D 0,04 0,03
100
0,02
50
0,01 0,00 85
90
95
100
105
110
115
0
80
88
96
104
112
C1
X
POPULAÇÃO μ, média populacional σ, desvio-padrão populacional
Amostra ( x1 , x2 , ..., xn )
Robson Bruno Dutra Pereira
AMOSTRA , média populacional s, desvio-padrão populacional
x
CONCEITOS BÁSICOS •
A rugosidade superficial é uma característica de qualidade importante de um produto metálico. Em furos usinados é importante saber se a rugosidade difere no início e fim do furo. Foram realizados 28 ensaios e a rugosidade foi medida no início e no fim do furo de cada corpo de prova.
Corpo de prova
Rugosidade Experimento
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Resultados das medições de rugosidade média R z em (μm). Boxplot of Rz_I; Rz_F 7
6
5 a t a D
4
3
2 Rz_I
Rz_F
Robson Bruno Dutra Pereira
Ensaio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Rz_I (μm) 2,743 3,010 2,216 2,531 2,757 2,752 2,136 2,557 3,085 3,068 2,546 3,202 5,109 4,830 3,225 5,849 2,682 2,572 3,203 3,092 2,207 3,357 4,353 3,862 3,547 3,760 3,685 3,465
Rz_F (μm) 2,825 3,008 2,910 3,825 2,671 3,036 2,516 3,492 2,850 2,930 3,003 3,847 5,515 4,699 5,309 6,503 3,325 3,354 3,867 4,055 2,298 3,290 4,876 2,824 3,297 3,844 3,347 3,449
CONCEITOS BÁSICOS •
Avaliando apenas a média das rugosidades no início e fim do furo seria possível afirmar categoricamente se há diferença na qualidade superficial no início e fim do furo? NÃO
Uma técnica estatística de inferência chamada de teste de hipóteses pode ser usada para comparar a rugosidade no início e fim do furo. • Como neste exemplo para cada corrida mediu-se a rugosidade no início e fim de cada corpo de prova, o teste t emparelhado é o mais adequado (chegaremos lá)! •
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS Cada observação nos experimentos de medição de rugosidade na parede dos furos é chamada de corrida, ensaio ou experimento; • Há uma flutuação ou ruído nos resultados. Este ruído é comumente chamado de erro experimental; • A presença do erro experimental implica que a rugosidade é uma variável aleatória; • Uma variável aleatória pode ser discreta (assume valores finitos ou infinitos contáveis, ou seja, valores pertencentes ao conjunto dos números inteiros positivos) ou contínua (assume valores dentro de um intervalo, ou seja no conjunto dos números reais); •
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Distribuição de probabilidade: A estrutura de probabilidade de uma variável aleatória é descrita por sua distribuição de probabilidade; Distribuição discreta
Distribuição contínua
Distribution Plot
Distribution Plot
Binomial; n=20; p=0,25
Normal; Mean=0; StDev=1 0,4
0,4
P(a ≤ y ≤ b)
0,3
0,3 y t i l i b a b o r P
P(y = y j ) = p(y j )
y t i s n 0,2 e D
0,2
0,1
0,1
0,0
0,0 0
2
4
6
8
10
12
-3
Robson Bruno Dutra Pereira
-2
-1
0
a
1
b
2
3
CONCEITOS BÁSICOS •
Propriedades das distribuições: DISTRIBUIÇÕES DISCRETAS 0 p y j 1,
y j
p y y j p y j ,
p y j 1 j
y j
DISTRIBUIÇÕES CONTÍNUAS 0
f y b
p a y b f y dy a
f y dy 1
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Média, esperança e variância; yf y dy E y y j p y j j
distribuição contínua
,
distribuição discreta
,
y 2 f y dy, distribuiç ão contínua 2 2 y p y , distribuiç ão discreta j Var y
2
E y
Robson Bruno Dutra Pereira
2
CONCEITOS BÁSICOS •
Propriedades dos operadores de média e variância. Seja y uma va com média μ e variância σ 2, E c E y
E cy
c
Var c
cE y
c
0
Var y
2
Var cy
2
c Var y
2
c
2
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Se há duas va’s com E(y 1) = μ1 e Var(y 1) = σ 12 e E(y 2) = μ2 e Var(y 2) = σ 22, E y1 y2 E y1 E y2 1 2
•
É possível mostrar que: Var y1 y2 Var y1 Var y2 2Cov y1 , y2
•
A covariância é uma medida de associação linear entre y 1 e y2. Se y1 e y2 são independentes, então Cov(y1,y2) = 0 Cov y1 , y2 E y1
1
y2
Robson Bruno Dutra Pereira
2
CONCEITOS BÁSICOS •
Analogamente: Var y1 y2 Var y1 Var y2 2Cov y1 , y2
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Por fim, se y1 e y2 são independentes, Var y1 y2 Var y1 Var y2 1 2 E y1 y2 E y1 E y2
y1 E y1 E y2 E y2 Robson Bruno Dutra Pereira
1 2
CONCEITOS BÁSICOS Distribuição normal • Função densidade de probabilidade: •
f ( x) •
1 2
e
x 2 2 2
,
x
Parâmetros: N(μ,σ2) variância média
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Normal padrão: va com μ = 0 e σ2 = 1, ou seja Z~N(μ,σ2).
•
Procedimento para padronizar a normal:
•
Supondo X~N(μ,σ2), P ( X
Z
x
X x x) P P Z z
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS Exemplo: A resistência à compressão de amostras de cimento pode ser modelada por uma distribuição normal, com uma média de 6000 Kg/cm 2 e um desvio-padrão de 100 Kg/cm2. a) Qual é a probabilidade da resistência da amostra ser menor do que 6250 Kg/cm2? b) Qual é a probabilidade da resistência da amostra estar entre 5800 e 5900 Kg/cm2? c) Que resistência é excedida por 95% das amostras?
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS a) P (X < 6250) = 0 ,9938; Distribution Plot Normal; M ean=6000; StDev=100 0,004
0,9938
0,003
y t i s n 0,002 e D
0,001
0,000
6000
X
Robson Bruno Dutra Pereira
6250
CONCEITOS BÁSICOS b) P (5800 < X < 5900) = P (X < 5900) – P (X < 5800) = 0,158655 0,0227501 = 0,1359049 Distribution Plot
Distribution Plot
Normal; Mean=6000; StDev=100
Normal; Mean=6000; StDev=100
0,004
0,004
0,003
0,003
y t i s n 0,002 e D
y t i s n 0,002 e D
0,001
0,001
0,1587 0,02275 0,000
0,000
5900
6000
5800
X
6000
X
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS c) P (X > x) = 0,95 -> P[Z> (x- 6000)/100] = 0,95 -> (x – 6000)/100 = -1,65 ->x = 5835 Distribution Plot
Distribution Plot
Normal; Mean=6000; StDev=100
Normal; Mean=0; StDev=1 0,4
0,004
0,95
0,95 0,003
0,3
y t i s n 0,002 e D
y t i s n 0,2 e D
0,001
0,1
0,000
0,0
5836
6000
-1,645
X
0
X
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Estatística: função dos dados amostrais.
Amostra ( x1 , x2 , ..., xn ) σ n
x
μ
1
x
n
x n
i
i 1
Média amostral
i
2
S
x
i 1
n 1
Variância amostral
Robson Bruno Dutra Pereira
n
2
x
i
S
x
2
i 1
n 1
Desvio-padrão amostral
CONCEITOS BÁSICOS Distribuição amostral: É a distribuição de probabilidade de uma estatística. 2 • Seja x ~ N ( , ) ( x é uma variável aleatória com média μ e variância σ 2); •
Amostra ( x1 , x2 , ..., xn ) Pelo teorema central do limite a distribuição da média amostral é normal com média μ e variância σ 2 /n.
x
n
2 x ~ N , n Robson Bruno Dutra Pereira
x
CONCEITOS BÁSICOS •
Se a distribuição da população de origem não for normal, pelo TCL, a distribuição da média amostral será normal (n > 30)! 0,20
2 x~ N , n
0,15
y t i s n 0,10 e D
0,05
0,00 0
2
4
6
8
X
10
12
14
16
x
Robson Bruno Dutra Pereira
SE ( x )
Desvio-padrão
n da média
CONCEITOS BÁSICOS •
Distribuição qui-quadrado ( χ 2): Se x1 , x2 , ..., xn são va’s independentes e N(0,1), então a va y
2 2 z 1 z 2
2
... z n
Tem distribuição qui-quadrado com n graus de liberdade.
Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Distribuição t: Seja x uma va N(0,1) e y uma va χ 2 com k graus de liberdade e x e y são independentes, t
x
y k
é distribuída como t com k graus de liberdade.
K
∞
t ~ N(0,1) Robson Bruno Dutra Pereira
CONCEITOS BÁSICOS •
Distribuição F: Seja w e y duas vas independentes com distribuição quiquadrado com u e v graus de liberdade, logo w/u é distribuída como F com u graus de F liberdade no numerador e v no denominador. y / v
Robson Bruno Dutra Pereira
TESTES DE HIPÓTESES PARA MÉDIA •
•
Hipótese: afirmação sobre os parâmetros de uma distribuição de probabilidade. Exemplo: diâmetro de um mancal. H 0 :
0
H 0
H 1 :
0
H 1 : 1,500
: 1,500
Hipótese nula Hipótese alternativa
Como determinar μ0: • Evidência/conhecimento do processo; • Teoria/modelo do processo; • Especificações de contratos/projetos.
Robson Bruno Dutra Pereira
TESTES DE HIPÓTESES PARA MÉDIA •
Procedimento para o teste de hipóteses: 1. 2. 3. 4. 5. 6.
Identificar o parâmetro de interesse; Definir a hipótese nula H0 e a hipótese alternativa H 1; Escolher um nível de significância; Definir o teste estatístico apropriado e calcular a estatística de teste; Definir a região de rejeição; Comparar a estatística calculada com a estatística crítica (região de rejeição). A hipótese nula pode ser rejeitada? Distribution Plot T; df=19
0,4
0,3
H 0 : 0 x
H 1 : 0
α
x t 0
s
/
0
y t i s n 0,2 e D
t 0 t c ?
0,1
n
0,025
0,025
0,0 -2,093
0
X
Robson Bruno Dutra Pereira
2,093
TESTES DE HIPÓTESES PARA MÉDIA •
Nível de significância (α): probabilidade que determina a dimensão da região de rejeição; 0,4
α = P {Erro tipo I} = P {rejeitar H 0| H 0 é verdadeira} • Deseja-se que o erro do tipo I seja pequeno!
Região de rejeição de H0 0,3
y t i s n 0,2 e D
• Usualmente α = 0,05; 0,1
•
Nível de confiança: γ =1 – α.
γ =1 - α
α
Região de aceitação 0,0
Robson Bruno Dutra Pereira
tc
X
TESTES DE HIPÓTESES PARA MÉDIA •
Poder do teste (1 - β ): Relaciona-se ao Erro do tipo II.
δ γ =1 - α
β = P {erro tipo II} =
1 - β
= P {não rejeitar H 0| H 0 é falsa}
β
Poder = 1 – β =
α
= P {rejeitar H 0| H 0 é falsa}
μ0 Robson Bruno Dutra Pereira
zα μ +δ 0
TESTES DE HIPÓTESES PARA MÉDIA •
Considere a hipótese unilateral: H 0 : 0
•
Logo, quando H1 for verdadeira, a distribuição de Z0 será:
H 1 : 0
•
Supondo que H0 seja falsa, e que 0 , x
Z 0
Z 0
/ x
0 n
0
/
x
n
0
0
/
n
/
n
n
0
Robson Bruno Dutra Pereira
Z 0
n ,1
~
TESTES DE HIPÓTESES PARA MÉDIA •
Considerando um teste bilateral: P z 2
z 0
P z 2
z 2
-zα/2
z
zα/2
n
2
n n 0 z P z 2
•
Sabe-se que:
2
β
P Z z
n n z z 2
2
Robson Bruno Dutra Pereira
TESTES DE HIPÓTESES PARA MÉDIA •
Considerando um teste bilateral:
n n z z 2
•
Finalmente, z
z
2
n
2
n z 2
0,
•
E o tamanho da amostra fica
0
z
n
2
z
2
2
2
-zα/2
zα/2
z
n z z
β
2
Robson Bruno Dutra Pereira
TESTES DE HIPÓTESES PARA MÉDIA •
Poder do teste e tamanho da amostra
z
n
2
z
2
2
2
Q to menor a diferença ( δ ) a ser detectada, maior o tamanho da amostra, para garantir um determinado nível de 1 - β .
Robson Bruno Dutra Pereira
TESTES DE HIPÓTESES PARA MÉDIA •
•
Exemplo: As especificações de um propelente sólido de uma aeronave requerem uma taxa média de queima igual a 50 cm/s. O desvio-padrão da taxa de queima é igual a 2cm/s. Deseja-se um nível de significância, ou probabilidade de erro do tipo I, igual a 0,05. Deseja-se planejar o teste de modo que se a taxa média diferir de 50 cm/s por não mais que 1 cm/s o teste detecte esta diferença com uma probabilidade de 0,90.
H 0 : 50
z
n
H 1 : 50
n
51 50
0,05
0,10
poder
2
2
z
1
0,90
n
1,96
2
2
2
1,28 2 2
2
2
1 43
Robson Bruno Dutra Pereira
TESTES DE HIPÓTESES PARA MÉDIA Erro tipo I ~ Condenar um réu inocente; Erro tipo II ~ Absolver um réu culpado.
REALIDADE
H0 verdadeira
DECISÃO
Não rejeitar Decisão correta 1 - α H0 Rejeitar H0
Erro tipo I α
Robson Bruno Dutra Pereira
H0 falsa Erro tipo II β
Decisão correta 1 - β
Teste 1-sample z •
Teste para média de uma amostra, variância conhecida;
Hipóteses: H 0 : 0 H 1 : 0
Estatística do teste: Z 0
x
/
0
n
Se H0 é verdadeira, Z0 é N(0,1), consequentemente, espera-se que 100(1 − α) esteja entre –Zα /2 e Zα /2.
n > 40, variância desconhecida pode-se utilizar este teste!!
Robson Bruno Dutra Pereira
Teste 1-sample z Bilateral
Unilateral à esquerda
Unilateral à direita
H 0 : 0
H 0 : 0
H 0 : 0
H 1 : 0
H 1 : 0
H 1 : 0
0,4
0,4
0,4
0,3
0,3
0,3
y t i s n 0,2 e D
y t i s n e 0,2 D
y t i s n e 0,2 D
α /2
α /2
0,1
α
0,1
0,0
0,0
- zα /2
0
X
zα /2
Se: Z0 < - Zα /2 ou Z0 > Zα /2
α
0,1
0,0
- zα
0
0
X
X
Z0 < - Zα Robson Bruno Dutra Pereira
zα
Z0 > Zα, rejeita-se H0.
Teste 1-sample z Exemplo: Um produtor fabrica eixos para um motor de automóvel. O desgaste (0,0001 polegada) dos eixos depois de 100000 milhas é de interesse, visto que é provável ter um impacto nas reivindicações de garantia. Uma amostra aleatória de n = 15 eixos é testada e x = 2,78. Sabe-se que σ = 0,9 e que o desgaste é normalmente distribuído. a) Teste H 0 : μ = 3 versus H 1: μ ≠ 3 usando α = 0,05; b) Qual a potência deste teste se μ = 3,25? c) Que tamanho da amostra seria requerido para detectar uma média verdadeira de 3,75, se quiséssemos que a potência fosse no mínimo 0,9? •
Exercício 9.37 Montgomery EPE
Robson Bruno Dutra Pereira
Teste 1-sample z a) Zα/2 = 1,96
Z 0
x 0
/ n
2,78 3 0,9 / 15
0,95 Distribution Plot Normal; Mean=0; StDev=1 0,4
Como |z0|= 0,95 < 1,96 = Zα/2, não rejeita-se H0.
0,3
y t i s n e 0,2 D
0,1
Analisando o p-value: Como p-value = 2 x 0,1711 = 0,34 > 0,05, não rejeita-se H0.
0,1711
0,1711
0,0
-0,95
0
0,95
X
Distribution Plot Normal; Mean=0; StDev=1 0,4
0,3
y t i s n e 0,2 D
Z0 está na região de aceitação!
0,1
0,025
0,025
0,0
-1,960
0
X
Robson Bruno Dutra Pereira
1,960
Teste 1-sample z •δ •
= 3,25 – 3 = 0,25
1 – β = 0,19
Robson Bruno Dutra Pereira
Teste 1-sample z •δ •
= 3,75 – 3 = 0,75; Poder = 0,9;
n = 16!!
Robson Bruno Dutra Pereira
Teste 1-sample t •
Teste para média de uma amostra, variância desconhecida;
Hipóteses:
Estatística do teste:
H 0 : 0
t 0
H 1 : 0
Rejeita-se H0 se
t 0
t
/ 2,n 1
x
s /
0 n
, no caso bilateral.
Ou se p-value ( p valor ou valor p) for menor que α. Robson Bruno Dutra Pereira
Teste 1-sample t Exemplo: A precipitação pluviométrica, em acre-pé (unidade de volume), proveniente de 20 nuvens que foram selecionadas aleatoriamente e semeadas com nitrato de prata, segue: 18,0; 30,7; 19,8; 27,1; 22,3; 18,8; 31,8; 23,4; 21,2; 27,9; 31,9; 27,1; 25,0; 24,7; 26,9; 21,8; 29,2; 34,8; 26,7 e 31,6. a) Você pode sustentar a afirmação de que a precipitação média das nuvens semeadas excede 25 acres-pé? Use α = 0,01. Encontre o p-valor; b) Verifique se a precipitação é normalmente distribuída; c) Calcule o poder do teste se a precipitação média verdadeira for 27 acrespés; d) Que tamanho de amostra seria necessário para detectar uma precipitação média verdadeira de 27,5 acres-pés, se quiséssemos que o poder do teste fosse no mínimo de 0,9? •
Exercício 9. 52 Montgomery EPE
Robson Bruno Dutra Pereira
Teste 1-sample t a) média = 26,035; s = 4,785; n = 20 H 0 : 25
t 0
s /
0 n
T; df=19 0,4
0,3
p-value = 0,1721
H 1 : 25 x
Distribution Plot
0,1
26,035 25
4,785
20
y t i s n 0,2 e D
0,1721
0,97
0,0
0
0,97
X
Distribution Plot T; df=19 0,4
t0,01;19 = 2,539
0,3
y t i s n 0,2 e D
Como t0 = 0,97 < 2,539 = t0,01;19, ou p-value = 0,1721 > 0,01 = α, não rejeita-se H0. Robson Bruno Dutra Pereira
0,1
0,01 0,0
0
X
2,539
Teste 1-sample t b) Normalidade
H0: The data follow a normal distribution. H1: The data do not follow a normal distribution.
Summary Report for C1 Anderson-Darling Normality Test A-Squared P-Value Mean StDev Variance S ke wn es s K ur to si s N
0,21 0,827 26,035 4,785 22,894 - 0, 0109 94 - 0, 882869 20
Minimum 1st Qu ar ti le Median 3r d Qu ar til e Maximum
18,000 21, 925 26,800 30, 325 34,800
95% Confidence Interval for Mean 20
24
28
23,796
32
28,274
95% Confidence Interval for Median 22,559
28,894
95% Confidence Interval for StDev 3,639
6,988
95% Confidence Intervals Mean
Median 23
24
25
26
27
28
29
Robson Bruno Dutra Pereira
Teste 1-sample t c)
27 25 20 n 0,66977 0,7485 2,539 t 1; s 4,785 1 0,2515 n
Power curve p/ teste unilateral à direita
Robson Bruno Dutra Pereira
Teste 1-sample t d)
n
n
n
t
n 1;
t n 1;
s 2
2
2
2,539 1,3282 4,7852
2,5
2
54,78 Distribution Plot T; df=19
0,4
0,3
y t i s n 0,2 e D
0,1
0,1 0,0
0
X
tβ =
1,328
Robson Bruno Dutra Pereira
Teste 2-sample z •
Teste para média de duas amostras, variâncias conhecidas; Bilateral
Unilateral à esquerda
Unilateral à direita
H 0 : 1
2
H 0 : 1
2
H 0 : 1
2
H 1 : 1
2
H 1 : 1
2
H 1 : 1
2
Estatística do teste:
Z 0
X 1
X 2
2
1
n1
1
2
2
2 n2
Robson Bruno Dutra Pereira
Obs.: Na prática não se conhece a variância!! O Minitab não faz este teste!
Teste 2-sample z •
•
Exemplo: Duas máquinas são usadas para encher garrafas de plástico que têm um volume líquido de 16 onças. O volume de enchimento pode ser suposto normal, com desvio-padrão σ1 = 0,020 e σ2 = 0,025 onça. Um membro do grupo de engenheiros da qualidade suspeita que ambas as máquinas encham até o mesmo volume líquido médio, independentemente desse volume ser ou não 16 onças. Uma amostra aleatória de 10 garrafas é retirada na saída de cada máquina. (10.4 EPE)
Máquina 1
16,03 16,04 16,05 16,05 16,02
Máquina 2
16,01 15,96 15,98 16,02 15,99
16,02 15,97 15,96 16,01 15,99
Robson Bruno Dutra Pereira
16,03 16,04 16,02 16,01 16,00
Teste 2-sample z a) Você acha que o engenheiro está correto? Use α = 0,05. Qual o p-valor para este teste? H 0 : 1
2 Distribution Plot
H 1 : 1
Z 0
X 1
X 2
2 1
n1 Z 0
2
1 2
2 2
n2
Normal; Mean=0; StDev=1 0,4
0,3
16,015 16,005 (16 16) 0,020 10
2
0,025 10
2
y t i s n 0,2 e D
0,1
0,80
0,025
0,025
0,0
-1,960
0
X
Robson Bruno Dutra Pereira
1,960
Teste 2-sample t •
Teste para média de duas amostras, variâncias desconhecidas; Bilateral
Unilateral à esquerda
Unilateral à direita
H 0 : 1
2
H 0 : 1
2
H 0 : 1
2
H 1 : 1
2
H 1 : 1
2
H 1 : 1
2
Estatística do teste:
t 0
X 1 X 2 1 2 S p
1
n1
1
n2
2
S p
n
1
S
1
2
1
n
n1 n2
2
S
1
2
2
2
Estimador combinado de variâncias ( pooled estimator )
Robson Bruno Dutra Pereira
Teste 2-sample t •
Exemplo: Está sendo investigada a temperatura em que ocorre uma deflexão, devido à carga, em dois tipos diferentes de tubo plástico. Duas amostras aleatórias de 15 tubos são testadas e as temperaturas (em °F) observadas em que ocorre esta deflexão são reportadas a seguir: • •
Tipo 1: 206, 188, 205, 187, 194, 193, 207, 185, 189, 213, 192, 210, 194, 178, 205; Tipo 2: 177, 197, 206, 201, 180, 176, 185, 200, 197, 192, 198, 188, 189, 203, 192;
a) Construa diagramas de caixa e gráficos de probabilidade normal para as duas amostras. Esses gráficos confirmam as suposição de normalidade e variâncias iguais? b) Os dados confirmam a afirmação de que a temperatura em que ocorre a deflexão, devido à carga, do tubo tipo I excede àquela do tipo 2? Para concluir algo, use α = 0,05. Calcule o valor P. c) Se a temperatura média em que ocorre a deflexão do tubo tipo I exceder aquela do tubo tipo II por 5°F, é importante detectar esta diferença com probabilidade de no mínimo 0,9. A escolha de n1 = 15 é adequada? Robson Bruno Dutra Pereira
Teste 2-sample t a)
Boxplot of tipo I; tipo II 215 210 205 200 a t 195 a D
190 185 180 175 tipo I
tipo II
Robson Bruno Dutra Pereira
Teste 2-sample t b)
H 0 : 1 H 1 : 1
2
Summary Report for tipo II Anderson-Darling Normality Test A -S qu ar ed P -V al ue
2
Mean StDev V ar ia nc e Skewness Kurtosis N M in i mu m 1stQuartile M ed ia n 3rd Quartile Maximum
0 ,3 0 0, 54 9 192,07 9,44 89 ,0 7 -0,402043 -0,902384 15 1 76 ,0 0 185,00 1 92 ,0 0 200,00 206,00
95% Confidence Interval for Mean
Pooled estimator:
175
180
185
190
195
200
1 86 ,8 4
205
1 86 ,1 2
2
S p
2
S p
2
S p
n1 1S
n2 1S
n1 n2
2 2
1 99 ,2 5
95% Confidence Interval for StDev 6,91
2 1
1 97 ,2 9
95% Confidence Interval for Median
2
14,88
Summary Report for tipo I 95% Confidence Intervals
Anderson-Darling Normality Test A-Squared P-Value
Mean
Mean StDev Vari ance S ke wn es s K ur to si s N
Median 185,0
187,5
190,0
192,5
195,0
197,5
200,0
15 110,482 15 19,44 2
M in imu m 1 st Q u ar ti le Median 3rdQuartil e M ax imu m
15 15 2
0,46 0,220 196,40 10,48 109,83 0, 05 34 1 - 1, 12 66 0 15 178, 00 1 88 ,0 0 194,00 206,00 213, 00
95% Confidence Interval for Mean 180
190
200
190,60
210
202,20
95% Confidence Interval for Median 188,37 205,63
99,472
95% Confidence Interval for StDev 7,67
95% Confidence Intervals Mean
Median 190
Robson Bruno Dutra Pereira
195
200
205
16,53
Teste 2-sample t •
Distribution Plot
Cálculo da estatística do teste: t 0
X 1 X 2 S p
1
n1
1 2
1
n2
196,40 192,07 9,974
1 15
1
T; df=28 0,4
1,19
15
0,3
y t i s n
0,2 e D
P-value
0,1
0,1220 0,0
0
1,19
X
Como t0 = 1,19 < 1,701 = tc ou como p-value = 0,1220 > 0,05 = α, não rejeita-se H0. •
Distribution Plot T; df=28 0,4
0,3
y t i s n 0,2 e D
0,1
0,05 0,0
0
X
Robson Bruno Dutra Pereira
1,701
= tc
Teste 2-sample t c) Não, n = 15 não é suficiente. Para detectar uma diferença de 5°F com poder (1 - β) igual a 0,9, é necessário n = 69.
Robson Bruno Dutra Pereira
Teste t-pareado •
No caso de duas amostras, variâncias desconhecidas, e dependência entre as duas amostras, deve-se usar o teste t-pareado. No caso onde deseja-se detectar se há diferença na rugosidade no início e fim da superfície de furos usinados há dependência entre as duas amostras.
•
Em um mesmo corpo de prova, para cada corrida, faz-se a medição no início e fim do furo, caracterizando a dependência.
Robson Bruno Dutra Pereira
Ensaio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Rz_I (μm) 2,743 3,010 2,216 2,531 2,757 2,752 2,136 2,557 3,085 3,068 2,546 3,202 5,109 4,830 3,225 5,849 2,682 2,572 3,203 3,092 2,207 3,357 4,353 3,862 3,547 3,760 3,685 3,465
Rz_F (μm) 2,825 3,008 2,910 3,825 2,671 3,036 2,516 3,492 2,850 2,930 3,003 3,847 5,515 4,699 5,309 6,503 3,325 3,354 3,867 4,055 2,298 3,290 4,876 2,824 3,297 3,844 3,347 3,449
Teste t-pareado •
•
Diferença: d j y1 j y2 j ,
j
1,..., n
Hipóteses (teste bilateral) sobre a diferença:
H 0 : d
0
H 1 : d
0
d
•
Estatística do teste:
•
Apesar da dependência entre as amostras, supõem-se dj~N(μd,σd2).
t 0
sd /
n
Robson Bruno Dutra Pereira
Teste t-pareado Ensaio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Rz_I (μm) Rz_F (μm) 2,743 2,825 3,010 3,008 2,216 2,910 2,531 3,825 2,757 2,671 2,752 3,036 2,136 2,516 2,557 3,492 3,085 2,850 3,068 2,930 2,546 3,003 3,202 3,847 5,109 5,515 4,830 4,699 3,225 5,309 5,849 6,503 2,682 3,325 2,572 3,354 3,203 3,867 3,092 4,055 2,207 2,298 3,357 3,290 4,353 4,876 3,862 2,824 3,547 3,297 3,760 3,844 3,685 3,347 3,465 3,449
d j -0,082 0,002 -0,695 -1,293 0,086 -0,284 -0,380 -0,935 0,235 0,138 -0,458 -0,645 -0,406 0,131 -2,084 -0,654 -0,643 -0,782 -0,664 -0,963 -0,091 0,067 -0,523 1,038 0,250 -0,084 0,338 0,016
•
Normalidade das diferenças:
Robson Bruno Dutra Pereira
Teste t-pareado Ensaio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Rz_I (μm) Rz_F (μm) 2,743 2,825 3,010 3,008 2,216 2,910 2,531 3,825 2,757 2,671 2,752 3,036 2,136 2,516 2,557 3,492 3,085 2,850 3,068 2,930 2,546 3,003 3,202 3,847 5,109 5,515 4,830 4,699 3,225 5,309 5,849 6,503 2,682 3,325 2,572 3,354 3,203 3,867 3,092 4,055 2,207 2,298 3,357 3,290 4,353 4,876 3,862 2,824 3,547 3,297 3,760 3,844 3,685 3,347 3,465 3,449
d j -0,082 0,002 -0,695 -1,293 0,086 -0,284 -0,380 -0,935 0,235 0,138 -0,458 -0,645 -0,406 0,131 -2,084 -0,654 -0,643 -0,782 -0,664 -0,963 -0,091 0,067 -0,523 1,038 0,250 -0,084 0,338 0,016
d
1
n
d j 0,334 n
d
t 0
t 0
2 d d j j 1 sd n 1
n
1
0,334
sd /
j 1
0,6
n
28
2,95 Distribution Plot
2
T; df=27 0,4
0,6
0,3 y t i s n 0,2 e D
0,1
0,025
0,025
0,0 -2,052
0
X
Há diferença!! Robson Bruno Dutra Pereira
2,052
Teste t-pareado •
Poder do teste:
Para n = 28, δ = -0,334, sd = 0,6: • Poder = 1-β = 0,8 •
Robson Bruno Dutra Pereira
ANOVA one-way •
Sejam a tratamentos ou níveis de um único fator. j = 1, 2, ..., n Tratamentos
i = 1, 2, ..., a
Observações
Totais
1
y11
y12
2
y 21
y 22
a
y a1
y a 2
yij : j-ésima observação tomada no i-ésimo nível; Robson Bruno Dutra Pereira
Média
y1n
y1.
y1.
y 2 n
y 2.
y 2.
y an
y a .
y a .
y..
y..
ANOVA one-way •
Modelo de médias:
yij i ij
yij
: ij-ésima observação
i
: média do i-ésimo tratamento : erro aleatório
ij
i 1, 2, ..., a 1 , 2 ,..., j n
Tratamentos
Observações
Totais
1
y11
y12
2
y 21
y 22
a
y a1
y a 2
Robson Bruno Dutra Pereira
Média
y1n
y1.
y1.
y 2 n
y 2.
y 2.
y an
y a .
y a .
y..
y..
ANOVA one-way •
Modelo de efeitos:
i 1, 2, ..., a 1 , 2 ,..., j n
yij i ij yij
: ij-ésima observação
: média geral
i
: efeito do i-ésimo tratamento
ij
: erro aleatório
Tratamentos
Observações
Totais
1
y11
y12
2
y 21
y 22
a
y a1
y a 2
Robson Bruno Dutra Pereira
Média
y1n
y1.
y1.
y 2 n
y 2.
y 2.
y an
y a .
y a .
y..
y..
ANOVA one-way ANOVA one-way : Apenas um fator é investigado; • Os experimentos devem ser realizados em ordem aleatória; • Neste sentido, o planejamento experimental é chamado de Planejamento completamente aleatorizado . •
•
As observações são independentes! 2
yij ~ N i ,
Robson Bruno Dutra Pereira
ANOVA one-way •
Hipóteses: H 0 : 1 2 H 1 : i
Ou:
•
j
...
a para ao menos um par i , j
H 0 : 1
2
H 1 : i
j
... a para ao menos um par i , j
Deseja-se testar a igualdade das médias dos a tratamentos. CUIDADO: ANOVA é um teste para médias! O nome engana!
Robson Bruno Dutra Pereira
ANOVA one-way •
A ANOVA é derivada do particionamento da soma dos quadrados: a
2
n
SS T yij y..
n
yi . yij , a
2
n
y
ij
i 1 j 1
y..
a
2
a
2
n
n yi. y.. yij yi. i 1
i 1, 2, ..., a
j 1
i 1 j 1
a
yi . yi . n,
i 1 j 1
n
y.. yij , y.. y.. N i 1 j 1
yij: j-ésima observação tomada no i-ésimo nível; yi .: soma das observações no i-ésimo tratamento; yi .: média das observações no i-ésimo tratamento;
SST
SSTratamentos
SSErro
y..: soma de todas as N observações; y..:
Robson Bruno Dutra Pereira
média de todas as N observações;
ANOVA one-way •
Examinando a soma dos quadrados dos erros: SS E
a
2
n
y
ij
yi .
i 1 j 1
•
n yij yi i j
2
a
.
1
1
Dividindo o termo entre colchetes por n -1, tem-se a variância para o iésimo tratamento: 2 n
yij yi .
2 S i
j 1
n 1
,
i 1, 2, ..., a
Robson Bruno Dutra Pereira
ANOVA one-way variâncias amostrais podem ser combinadas para estimar uma única variância da população σ2 comum;
•a
n yij yi i j a n 1
2
a
.
1
1
SS E MS E N a
Robson Bruno Dutra Pereira
ANOVA one-way •
Da mesma forma, pode-se usar a variação da média dos tratamentos para estimar σ2, caso não haja diferença significativa entre os tratamentos.
•
Na ANOVA ANOVA há duas estimativas esti mativas de σ2: MS Trat
MS E
SS Trat a
1
SS E N
a
σ2between
Variância entre tratamentos
σ2within
Variância dentro dos tratamentos
Robson Bruno Dutra Pereira
ANOVA one-way •
Tabela ANOVA one-way Fonte de variação Entre (between) tratamentos Erro (within)
SS Trat
1
a
yi n
2 .
i 1
SS E
SS T a
Total
Graus de liberdade
Soma dos quadrados
n
N
SS Trat
2 SS T yij
i 1 j 1
y..2
a-1
N-a
Média dos quadrados MS Trat
MS E
2
y..
N
N-1
Robson Bruno Dutra Pereira
SS Trat a
1
SS E N
a
F0
F 0
MS Trat MS E
ANOVA one-way •
Rejeita-se H0 se há diferença entre as médias dos tratamentos, isto é: F 0
F , a 1, N a
A hipótese alternativa é bilateral e o critério de rejeição é unilateral. Porque? MS F testa-se , ou ou se seja, • Pois te MS quantas vezes a variância entre é maior que que a variância dentro • A distribuição F é razão de chiquadrados, que por sua vez é soma do quadrado de normais, de forma que F só assu assume me valo valore ress posi positi tivo vos! s!!! !! •
0
Distribution Plot F; df1=4; df2=10 0,7
Trat
0,6
E
0,5 y t 0,4 i s n e D0,3
0,2
0,1
0,05 0,0
0
Robson Bruno Dutra Pereira
3,478
X
ANOVA one-way •
O tempo de resposta em milissegundos foi determinado para três tipos de circuitos que podem ser usados em uma válvula automática de um mecanismo de desligamento. Tipo de circuito 1 2 3
Tempo de resposta (ms) 9 12 10 8 20 21 23 17 7 6 5 8
Robson Bruno Dutra Pereira
ANOVA one-way SS Trat
1
2
a
y n
2 i.
i 1
a
n
SS T y 2 ij
i 1 j 1
y..
N
y..2 N
1 4
39 2
2
2
81 26
2
2
2
146 12 2
2
413,17
2
9 12 10 ... 5 8 7
2
146 12
2
445,67
SS E SS T SS Trat 445,67 413,17 32,5 Tipo de circuito 1 2 3
Tempo de resposta (ms) 9 12 10 8 20 21 23 17 7 6 5 8
Robson Bruno Dutra Pereira
Totais Médias 39 9,75 81 20,25 26 6,5 146 12,17
ANOVA one-way MS Trat
SS Trat a
1
413,17
2
206,583
σ2between F 0
MS E
SS E N
a
32,50
9
3,611
σ2within
FV Circuito Erro Total
Robson Bruno Dutra Pereira
MS Trat MS E
DF 2 9 11
206,583 3,611
57,21
SS MS F 413,167 206,583 57,21 32,500 3,611 445,667
ANOVA one-way F 0
MS Trat MS E
206,583
3,611
57,21 > 4,256 = F0,05; 2; 12
Distribution Plot
Distribution Plot
F; df1=2; df2=9
F; df1=2; df2=9
1,0
1,0
0,8
0,8
y t 0,6 i s n e D 0,4
y t 0,6 i s n e D
0,4
P-value
0,2
7,6358E-06
0,0
0
57,21
0,2
0,0
0,05 0
X
4,256
X
Robson Bruno Dutra Pereira
ANOVA one-way •
Checando a adequação do modelo: examinando os resíduos! ^
eij Circuito Tempo FITS1 1 9 9,75 1 12 9,75 1 10 9,75 1 8 9,75 2 20 20,25 2 21 20,25 2 23 20,25 2 17 20,25 3 6 6,5 3 5 6,5 3 8 6,5 3 7 6,5
RESI1 -0,75 2,25 0,25 -1,75 -0,25 0,75 2,75 -3,25 -0,5 -1,5 1,5 0,5
yij
^
y ij
^
i
y.. yi. y..
yi.
^
y ij
^
^
y ij
y ij
Ruído •
Análise dos resíduos
Devem ser:
• Normais (0;σ2) • Constantes • Estáveis • Aleatórios • Independentes • Não-
Correlacionados
eij ~ N 0,
2