Université de Picardie Jules Verne UFR des Sciences Licence mention Mathématiques - Semestre 3 Formulaire de Statistique Inférentielle 1) Estimateurs Paramètre
Estimateur
Statistique et sa loi
n
X
1 X i n
S 2c
n S 2 , avec S 2 n 1
n
1 X 2 i n
X
2
Y 2
Student à n 1 d.d.l.
X : S c n
T
i1
2
2016-2017
si échantillon gaussien Khi deux à n 1 d.d.l.
n 1 S 2 : c 2
i1
si échantillon gaussien
n
X i p
F
i1
U
n
F p
:
p1 p n
Normale N 0; 1 (approx.) si np 10 et n 1 p 10
2) Intervalles de confiance au niveau 1 Paramètre
Intervalle de confiance
i
2
p
i 2
i p
f
sc s t , x c t n n
x
Valeurs tabulées t tel que P t
f 1 f u , f n 1
a et b tels que
f 1 f u n 1
1
1 2 2 PY b 2
PY 2 a
n 1 s 2 , n 1 s 2 c a c b
T t
u tel que P u
U u
1
3) Tests de conformité au risque H0
H1
Statistique de test
0
0
0
0
T
X 0 S c n
2 20 2
20
2
20
2
20
Y 2
p0
p
p0
p
p0
n 1 S 2 c 20
t tel que P t
t tel que P T t t tel que P T t
U
F p 0 p 0 1 p 0 n
T t
, i.e. t 1 ,
a et b tels que P a
b tel que P Y 2 b
u tel que P u
u tel que P U u u tel que P U u
t 2
b 2
, i.e. a 1 ,
1
, i.e. b
t 2
t 22
b
U u
Y 2
1
, i.e. t 1 ,
a tel que P Y 2 a
p p 0 p
Valeur(s) test(s)
a 2
1
1 , , i.e. u 1 , , i.e. u
u 2
u 2
Pour un intervalle de confiance de et/ou un test de conformité sur avec un grand échantillon (quelconque), on peut approcher la loi de Student par la loi Normale N 0; 1 , et remplacer t , t et t par u , u et u . 1
4) Tests d’homogénéité au risque H0
H1
Statistique de test et sa loi sous l’hypothèse H 0
Valeur(s) test(s) f tel que
1
2
1 2
S 2c,1
F
:
S 2c,2
2 en travaillant
PF f
Snédécor à n 1 1, n 2 1 d.d.l. si échantillons indépendants gaussiens
avec f 1 1 2 1
2
1
2
1
2
X 1 X 2
U
S 2c,1 n1
:
S 2c,2
2
1
2
1
2
2
1
2
1
2
T s c,1,2
X 1 X 2 1 1 n1 n2
2
1
2
1
2
:
indép. gaussiens et si 1 avec s 2c,1,2
D , où D S c,d n
U
X 1 X 2 :
D , où D S c,d n
T
p2
p 1
p2
p 1
p2
t
t
2
t
n 1 1s 2c,1 n 2 1s 2c,2 n 1 n 2 2
u
Normale N 0; 1 (approx.)
u
si grands échantillons appariés
X 1 X 2 :
u
Student à n 1 d.d.l.
t
si petits échantillons
t
appariés gaussiens
t
Normale N 0; 1 (approx.)
p 1 p 2 p 1
u
(approx.) si petits échantillons
1 2 1
u
Student à n 1 n 2 2 d.d.l.
1 2 1
Normale N 0; 1 (approx.)
si grands échantillons indépendants
n2
1 2 1
u
F 1 F 2
U
1 1 n1 n2
:
u
si n 1 f 1 5, n 1 1 f 1 5,
u
n 2 f 2 5, n 2 1 f 2 5,
f 1,2 1 f 1,2
avec f 1,2
u
n 1 f 1 n 2 f 2 n 1 n 2
5) Test d’ajustement à une loi théorique à r modalités au risque Hypothèse H 0 : le caractère suit la loi théorique définie par les probabilités p i . r N i np i 2 Statistique de test : D . np i
Hypothèse H 1 : H 0 .
i1
Loi de D sous l’hypothèse H 0 : khi deux à r 1 k d.d.l. Valeur test : b tel que P D b .
6) Test d’indépendance entre deux caractères à r et s modalités au risque Hypothèse H 0 : les deux caractères sont indépendants. r
Statistique de test : D
s
i1 j1
Hypothèse H 1 : H 0 .
2
N i, j np i, j , avec np i, j np i, j
n i, n , j , n i, n
Loi de D sous l’hypothèse H 0 : khi deux à r 1s 1 d.d.l. Valeur test : b tel que P D b . 2
s
r
n i, j et n , j n i, j . j1
i1
7) Régression linéaire simple On considère deux variables quantitative X et Y et le modèle de régression Y X , où suit la loi cov X , Y normale N 0; . On désigne par le coefficient de corrélation linéaire entre X et Y . X Y Droite des moindres carrés de y en x . Droite d’équation y
ax b , avec a
cov x, y , b s x2
y ax ,
et coefficient de corrélation linéaire r entre x et y avec :et r n
où x
1 x , y i n i1
n
1 y , s 2 i x n
n
i1
1 x 2 i n
cov x, y s x s y n
x
2
, s y2
i1
1 y 2 i n
n
2
y et cov x, y
i1
1 x y i i n
xy .
i1
Effectuant plusieurs expériences, et ainsi plusieurs échantillonnages, a, b et r apparaissent comme les valeurs observées des variables aléatoires A , B et R . 1 2 On a alors E A , E B et E R . Des estimations ponctuelles de , , 2 et sont 2n 1 2 n 1 r 2 s 2 et r (ou plus précisément r r 1 r ). alors respectivement a , b , s R2 y n 2 2n 3
Intervalle de confiance et tests pour un coefficient de régression linéaire La situation est celle décrite dans le paragraphe 1. 2 s2 suit la loi La variance de A est égale à 2 , et peut être estimée par s A2 R2 . La variable aléatoire T A s A ns x ns x de Student à n 2 degrés de liberté. On détermine alors le réel t 1 tel que P t 1 T t 1 1 1 (table 3). On en déduit un intervalle de confiance de au niveau 1 1 : i
a s A t 1 , a s A t 1 .
Test (bilatéral) de H 0 : 0 contre H 1 : 0 . a 0 On calcule t et on décide que : s A - si t t 1 , t 1 , alors on ne peut rejeter H 0 ; - si t t 1 , t 1 , alors on rejette H 0 avec une probabilité 1 de se tromper. Cas de . On peut mener une étude analogue pour en utilisant le fait que la variance de B est égale à n B s R2 x 2 , et peut être estimée par s 2 s 2 1 x 2 2 2 1 x T , et que la variable aléatoire B R i n n s B ns x2 ns x2 n 2 s x2 i1 suit la loi de Student à n 2 degrés de liberté. Prévision. L’ajustement affine peut servir à prévoir la valeur attendue pour Y quand l’expérimentateur fixe X x 0 . L’estimation ponctuelle de cette valeur est y 0 ax 0 b , et un intervalle de confiance de cette valeur au x 0 x 2 x 0 x 2 1 1 2 2 niveau 1 1 : i y 0 y 0 t 1 s R 1 n , y 0 t 1 s R 1 n . ns x2 ns x2 Intervalle de confiance et tests pour un coefficient de corrélation 1 arg th. Soit le nombre défini par 1 ln 2 1 Soit Z la variable aléatoire qui au cours de chaque échantillonnage prend la valeur z
1 ln 1 r 2 1 r Lorsque n est assez grand (n 20 en pratique), un intervalle de confiance de au niveau 1 : i
z
u , z n 3
u n 3
arg thr .
z 1 , z 2 .
D’où un intervalle de confiance de au niveau 1 : i r 1 , r 2 thz 1 , thz 2 . Test de H 0 : 0 contre H 1 : 0. R n 2 r n 2 Sous l’hypothèse H 0 , T suit la loi de Student à n 2 degrés de liberté. On calcule t : 1 R 2 1 r 2 - si t t , t , alors on ne peut rejeter H 0 ; - si t t , t , alors on rejette H 0 avec une probabilité de se tromper. 3
4
5
6
7
8