Introduction aux tests d’Hypothèses
Jan-16
Fethi Derbeli
1
Les Statistiques vont devenir un jour un besoin nécessaire pour l’éfficacité des citoyens comme l’aptitude à l’écriture et la lecture. H.G. Wells Circa 1925
Jan-16
Fethi Derbeli
2
Description Description de de la vérification vérification d ’hypothèse: ’hypothèse: •
Les statistiqu statistiques es communiqu communiquent ent des informati informations ons à partir partir des données. données.
•
Les stati statistiqu stiques es ne peuvent peuvent se substit substituer uer au jugeme jugement nt d’un profession professionnel. nel.
•
La véri vérific ficati ation on d ’hypot ’hypothès hèsee répo répond nd à une une ques questio tion n prat pratiqu ique: e: – “Y-a-t-il vraiment une différence différence entre _____ et _____ _____ ?”
•
Un problèm problèmee pratique pratique de processu processuss est est traduit traduit en une hypothèse hypothèse statistiqu statistiquee afin afin de répondre à cette question.
•
Dans la la vérifica vérification tion d’hypothèse d’hypothèse,, nous nous utilis utilisons ons des échanti échantillon llonss relativ relativemen ementt petits pour répondre répondre aux questions sur les paramètres paramètres de population. population.
•
Il est toujours toujours possible possible que que nous nous choisis choisissions sions un échanti échantillon llon qui n’est n’est pas représentatif de la population. Par conséquent, il y a toujours un risque que la conclusion soit erronée.
•
Avec quelque quelquess supposi supposition tions, s, les les statisti statistiques ques par déduct déduction ion nous permette permettent nt d’estimer d’estimer la probabilit probabilitéé d’avoir d’avoir un échantillon échantillon « bizarre bizarre ». Ceci nous permet permet de quantifier la probabilité (valeur-P) d’une conclusion erronée.
Jan-16
Fethi Derbeli
3
Pourquoi apprendre la vérificat vérification ion d ’hypothèse • La vérifi vérification cation d’hypoth d’hypothèse èse empl emploie oie des des tests tests basés sur des des donnée donnéess qui aident à déterminer les quelques X vitaux. • On utilise utilise cet outil outil pour identifier identifier des sources sources de variabi variabilité lité et établir établir des rapports entre les X et les Y. • Pour aider à identifi identifier er les quelq quelques ues X vitaux vitaux,, on peut prélever prélever un échantillon de données passées ou actuelles. – Passives: soit vous avez prélevé directement des données dans dans votre processus, soit vous avez obtenu des données d’échantillons passés. – Actives: vous avez modifié votre processus, puis vous avez prélevé prélevé des données. données.
• Les essais essais stat statist istiqu iques es appor apporten tentt des solut solution ionss objecti objectives ves à des des questions qui ont la plupart du temps une réponse subjective.
Jan-16
Fethi Derbeli
4
Terminologie Les termes dont vous devez vous souvenir 1. Hypothèse nulle (Ho) - énonce pas de changement changement ou de de différence. Cet énoncé énoncé est supposé vrai jusqu’à preuve du contraire.
Erreur Type Type I - le risque 2. Erreur risque du « faux positif positif » qui dit dit qu’il y a quelque quelque chose chose de signi significatif ficatif qui se passe alors que ce n’est pas vrai. 3. Risque Alpha - le risque ou la probabilité maximum maximum de faire une Erreur de Type Type I. Cette probabilité est est toujours supérieure supérieure à zéro, et se situe en général général autour de 5%. Le chercheur prend des décisions au plus haut niveau de risque qui est acceptable pour un faux positif.
signification - identique 4. Degré de signification identique au risque risque Alpha. Alpha. alternative (Ha) - énoncé 5. Hypothèse alternative énoncé d ’un chang changemen ementt ou d ’une différ différence. ence. On déduit déduit que cet énoncé est vrai si Ho est e st rejetée. 6. Terreur de Type II - le risq risque ue du du « faux faux négat négatif if » qui qui dit dit qu ’il n ’y a rien rien de sign signifi ificat catif if gros risque dans l’approche l’approche de la qui se passe alors que ce n’est pas vrai. C ’est là le plus gros Percée! Jan-16
Fethi Derbeli
5
Terminologie (suite) 7. Risque Beta - le risque ou la probabilité probabilité de faire une erreur du du type II ou de ne pas pas remarquer une solution efficace au problème.
Différence significative significative - le terme utilisé pour décrire les résultats d’une 8. Différence d’une vérification d’hypothèse statistique où la différence est trop large pour être êt re raisonnablement attribuée au hasard. Il se passe probablement quelque chose. 9. Puissance - l’aptitude d ’un test statistique à détecter quelque chose de de significatif significatif lorsqu’il y a vraiment quelque chose de significatif. Utilisé en général pour déterminer si les tailles des échantillons sont suffisantes pour détecter une différence entre les traitements s’il en existe une.
Statistiquee d ’essai ’essai - une valeur standard 10.Statistiqu standard (z, t, F, F, etc.) qui représente la faisabilité faisabilité d’un faux positif et qui est distribuée d’une manière connue de telle sorte que la probabilité de cette valeur observée puisse être déterminée. En général, plus le faux positif est faisable, moindre est la valeur absolue de la statistique d’essai et plus la probabilité d’observer cette valeur dans la distribution est grande.
Jan-16
Fethi Derbeli
6
Les Paramètres Paramètres de la population
Statistiques de l’échantillon
Moy.
x
Déviation Standard
s
Proportion (%)
P
p
1. Les paramètres de de population (valeurs) (valeurs) sont fixes, mais inconnus. 2. Les statistiques d’échantillon servent servent à estimer les valeurs valeurs de la population.
Les hypothèses sont des énoncés sur les paramètres de la population, pas des statistiques d’échantillons. d’échantillons. Jan-16
Fethi Derbeli
7
Formulation de l’hypothèse Hypothèse nulle (Ho)
Hypothèse alternative (Ha)
– la supposition •
•
Inte Interp rpré réta tati tion on stat statis isti tiqu que: e: il n’y a pas de différence entre les moyennes de population pour pour les générateurs A et B.
Ho :
a
b
Ha :
a
b
H o : a
b
– ce que vous voulez déduire •
Inte Interp rpré réta tati tion on stat statis isti tiqu que: e: les les moyennes de population pour les générateurs A et B viennent de distributions différentes;
Ha : a b Inte Interp rpré réta tati tion on prat pratiq ique ue:: il n’y a aucune différence Interp rpré réta tati tion on prat pratiq ique ue:: le le Ho : p a p b • Inte entre les rendements rendement moyen du Ha : p a p b moyens des deux générateur B diffère de celui générateurs. (vos du générateur A. modifications n’ont servi à rien) But: Nous devons montrer qu ’il est tellement tellement peu probable que les valeurs observées observées proviennent de la même population, que Ha doit être erronée. (Nous devons rejeter Ho, et par déduction, accepter Ha.) Jan-16
Fethi Derbeli
8
Tests de signification •
•
Type de dédu déducti ction on statis statistiq tique ue qui évalue évalue les indications fournies par les données d’échantillon pour accepter ou rejeter une déclaration (hypothèse) sur un paramètre de population. L’hypoth ’hypothèse èse nulle; nulle; Ho est est un énon énoncé cé sur sur un param paramètr ètree de population, en général une moyenne de population, une déviation standard ou un pourcentage de défectuosité.
•
En géné général ral l’hypo l’hypothè thèse se nulle, nulle, Ho, est un énon énoncé cé de « pas pas d’ef d’effe fett » ou « pas pas de dif différe férenc ncee ».
•
L’hypoth ’hypothèse èse altern alternati ative; ve; Ha, ou ou H1 est est un un énoncé énoncé qui l’on suspecte, sera vrai si Ho est rejeté. C’est à Ha d’apporter la preuve de sa validité... Nous continuons à croire Ho tant que les indications expérimentales expérimentales ne la contredisent pas fortement.
Jan-16
Fethi Derbeli
Ho:
a
b
Ha:
a
b
Ho:
a
b
Ha:
a
b
Ho: pa pb Ha: pa pb
9
Niveau de signification ... Si peu probable ... Quel degré degré d ’improba ’improbabilit bilité é? (C ’est le niveau niveau de signif significati ication on ( )) Nous aimerions qu ’il y ait moins moins de 10% de risque que ces observations surviennent au hasard ( = .10 ). ). Cinq pour cent est bien plus confortable ( Un pour cent, c’est très bien (
= .05 ). ).
Industry Standard
= .01). .01).
Ce niveau alpha est basé sur notre supposition d’aucune d’aucune différence et d’une certaine distribution de référence. Il y a un risque de % que nous nous trompions lorsque nous disons que le générateur modifié est meilleur. meilleur.
Jan-16
Fethi Derbeli
10
Niveau de signification, (alpha): •
Nous aimerion aimerionss qu’il qu’il y ait moins moins de 10% 10% de risque risque que que ces ces observat observations ions surviennent au hasard ( = .10).
•
Peut-ê Peut-être tre aim aimeri erions ons-no -nous us qu’i qu’ill y ait moin moinss de 5% de risqu risquee que ces ces observations surviennent au hasard ( = .05).
•
Ou, par par prudenc prudence, e, nous aimerion aimerionss qu’il qu’il y ait moins moins de 1% de risque risque que ces ces observations surviennent au hasard ( = .01).
•
Ce niv nivea eau u alp alpha ha néc néces essi site te deux deux chos choses es:: • une supp suppositi osition on d’aucu d’aucune ne différe différence nce (Ho), et • un unee dist distrib ributi ution on de référen référence ce
•
Rappel: Rappel: l’hypothès l’hypothèsee nulle Ho est supposée supposée être vraie. vraie. C’est une sorte de présomption d’innocence. d’innocence.
•
Vous êtes êtes le le procureu procureur. r. C’est C’est à vous de prouver prouver que cette cette présompti présomption on n’est n’est pas au-dessus de tout soupçon.
•
Ce soupçon est ().
Jan-16
Fethi Derbeli
11
Risque Alpha () ou Beta (b): -- est le risque de trouver une différence quand quand il n’y en n’a pas. Utilisé comme critère de décision pour rejeter Ho.
b -- est le le risque risque de de ne pas
trouver de différence quand en réalité il y en a une. C’et aussi le paramètre paramètre de déterminer la taille nécessaire des échantillons.
Accepter Ho Ha
Ho Réalité
Ha
Risque b aussi appelé: Erreur de type II Risque du consommateur Jan-16
Décision correcte Erreur Type II b
Erreur Type I
Risque - aussi aussi appelé appelé:: Erreur de type I Risque du producteur
1
2
Décision correcte b Fethi Derbeli
12
Concernant l’ Hypothesis nul
L’ Hypothèse nul (H o) est supposé être vrai Comme présumer que l’accusé est “non coupable”
Rappel: Le système judicaire
l’accusé est innocent jusqu’à
prouver qu’il est coupable
On assume pas qu’il y a un effet seulement si la probabilité de “non effet” est si faible de le croire
Ho: Pas d’ Effet Ha: Effet
Jan-16
Vous êtes l’avocat de l’accusé tu doit présenter des évidences You are the prosecuting attorney - you must provide evidence au delà des doutes raisonnables
Fethi Derbeli
13
Exemple: Jugement L’ Hypothèse nul (H o) est “pas coupable”
Décision du juge Pas coupable
Coupable
Consequence: Incarcerer l’innocent
Pas coupable Correcte
Erreur
En réalité Coupable
Erreur
Correcte
Consequence: Libérer le coupable Jan-16
Fethi Derbeli
14
Exemple: Sécutité Airport L’ Hypothèse nul (H o) est “il n’ y a rien dans la valise”
Décision de l’alarme Rien dans la valise
Rien dans la valise
Bombe dans la valise
Correcte
Erreur
Conséquences: Voyageurs en _____________ sécurité _____________
En réalité Bombe dans la valise
Erreur
Correcte
bombe dans l’avion Conséquences: Une _____________ Jan-16
Fethi Derbeli
15
Risque de décision • Notre Notre décis décision ion de de rejeter rejeter ou ou de confir confirmer mer l‘hy l‘hypo pothè thèse se est basé baséee sur les data • Notre Notre déci décisio sion n peut peut être être erron erronée ée sous sous deux deux form formes: es: – En rejetant l’hypothèse l’hypothèse nul par erreur Erreur Type I • Rejeter Rejeter l’hypo l’hypothèse thèse quand quand il est vrai vrai • Cette erreur erreur est connu connuee comme comme “risque du du producteu producteur” r” – Accepter l’hypothèse l’hypothèse nul par erreur Erreur Type II • Echouer Echouer à rejeter rejeter l’hypo l’hypothèse thèse nul nul quand quand il est est faut • Cette erreur est connu connu sous sous “risque “risque consomm consommateur” ateur” • On doit spécifier spécifier avant avant l‘inves l‘investigat tigation ion l‘ampleur l‘ampleur du risque risque qu‘on qu‘on est prêt à prendre en commettant ces erreurs Jan-16
Fethi Derbeli
16
Exemple: contrôle pièces The Null Hypothesis (H o) is “Part is Good”
Décision du contrôle Pièce bonne
Pièce mauvaise
Pièce bonne Correcte
Erreur
Conséquence: Une bonne pièce _____________ retouchée _____________
En réalité Pièce mauvaise
Erreur
Correcte
Conséquence: une pièce mauvaise livrée Jan-16
Fethi Derbeli
17
• La déci décisi sio on est est corr correc ecte te – Accepter l’hypothèse l’hypothèse Nul • C’est C’est l’inte l’interva rvalle lle de de confian confiance ce • La vale valeur ur typiqu typiquee de (1 - ) = 0.95
– Rejeter l’hypothèse l’hypothèse nul • Elle Elle est est appelé appelé “puiss “puissanc ancee du test” test” • La vale valeur ur typiqu typiquee de (1 - b) = 0.80 La valeur du P est très Importante Retenir cette parole: If P is Low , Ho Must Go! A quel degré P doit être faible? Ça dépend des conséquences de l’erreur l ’erreur typeI typeI Jan-16
Fethi Derbeli
18
Vérification d’hypothèse: • Les Les do donn nnée éess so sont nt coll collec ecté tées es •
Un test statistique est calculé calculé sur la base base d ’un taux taux signal-parasite (S/P) pour ces -Score), ), et valeur- P données comme Z- ou T-Score
• Si Ho est est vrai vraiee (aucun (aucunee diff différen érence ce entre entre ____ & ____ ____ ), ), alors alors – le taux S/P est très faible – et force le test test à produire une “valeur-p” “valeur-p” élevée
• Si Ha Ha est vraie vraie (véri (véritab table le diffé différen rence ce entre entre ____ ____ & ____ ____ ), ), alors alors – le taux S/P sera élevé – et forcera la “valeur-p” à être faible
• La “valeu “valeurr-p” p” est la la probabi probabilit litéé de l’hypo l’hypothès thèsee nulle nulle se produi produisan santt par hasard. • La valeur valeur-p -p est est basée basée sur une une distri distribut bution ion de réfé référen rence ce suppos supposée ée ou réell réellee (distribution normale, distribution-t, chi-au carré ou distribution-F).
Jan-16
Fethi Derbeli
19
Le taux de signal/parasite ? Taux de signal/parasite - C’est le taux de la différence entre les moyennes divisée par la déviation standard d’échantillon global.
Bon, d’accord, d’accord, mais qu qu ’est-ce que ça veut vraiment dire ?
Moyenne du Processus A - Moyenne du Processus B
Si nous installons un équipement qui produit des pièces consécutives, disons un processus A, puis nous mesurons une caractéristique CDQ, il y aura une certaine quantité de variabilité mesurée dans cet ensemble de conditions, nous appelons cela des parasites. Disons que nous pensons avoir identifié un nouvel ensemble de réglages qui va améliorer la caractéristique CDQ. Nous réglons la machine selon le nouveau réglage le processus B, fabriquons quelques pièces et les mesurons. Comme pour le processus A, nous pensons observer une variabilité mesurée. Pour déterminer s ’il y a une une amélioration, nous devons évaluer si la différence entre les deux processus est plus grande que la variabilité globale. Jan-16
45
55
65
Variabilité globale /Dév.Std. globale
Le taux Signal/Parasite est d’une importance critique pour nous aider à évaluer si nous avons amélioré le processus
Fethi Derbeli
20
Analyze Roadmap Roadmap
X Data
Discrete e t e r c s i D
a t a D Y
Jan-16
s u n i t n o C
Continus
Logistic
Chi-Square
Regression
ANOVA
Regression
Means / Medians Tests
Fethi Derbeli
21
Scenario #1 Un Superviseur veut savoir s’il y a une différence significative significative entre la Quantité de peinture faite par deux opétateurs
Quantité de pe_____ inture C’est quoiY ? ________
Opérateur C’est quoi X? _____________
Continues Type de Data ? ______________
Discrête Type de Data ? ______________
ANOVA Quel type d’outil on va utiliser ? ________________________
Jan-16
Fethi Derbeli
22
Scenario #2 La RH veut savoir s’il y a une liaison liaison entre l’age (Agé ou Jeune) et la date d’embauchement
Discrête Embauchement Type de Data ? ______________ C’est quoi Y? _____________
Age C’est quoi X ? _____________
Discrête Type de Data ? ______________
Chi-Square Quel type d’outil on va utiliser ? ________________________
Jan-16
Fethi Derbeli
23
Scenario #3 Une équipe R&D veut vérifier la relation entre entre la surface du cavité du four Et le temps de chauffage du nouveau four
Temps Y ? _____________
Continues Type de Data ? ______________
Surface X ? _____________
Continues Type de Data ? ______________
Regression __ Quel type d’outil on va utiliser? ________________________ ______________________
Jan-16
Fethi Derbeli
24
Scenario #4 Pour Analyser les accidents, accidents, OSHA veut vérifier s’il y a une liaison entre entre l’unité Du poids par mm² et les blessures des consommateurs
Blessures Y ? _____________
Discrête Type du Data ? ______________
Poids X ? _____________
Continues Type du Data ? ______________
Regression Logistique Quel type d’outil on va utiliser ? ________________________
Jan-16
Fethi Derbeli
25
Qu ’est-ce ’est-ce que la “vérific “vérificatio ation n d ’hypoth ’hypothèse” èse”? ?
Enoncez une “Hypothèse nulle” (H o) Hypothèses de moyennes
Ho: o = 13.6 Ha: o < 13.6
Hypothèses de déviations standard
Ho: A = B Ha: A > B
Enoncez l’ “Hypothèse alternative” (H a)
Etablissez vos critères ( )
Rassemblez des preuves (échantillon de réalité)
DECIDEZ: Que suggèrent les preuves ? Rejeter Ho? Jan-16
ou ne pas rejeter H o? Fethi Derbeli
26
Exemple •
•
Votre Votre centr centrale ale disp dispos osee de plus plusieu ieurs rs géné générat rateur eurs. s. Tous Tous se valent à peu près au niveau des performances. performances. Le responsable de la maintenance a décidé de dépenser 100000 $ pour modifier l’un d’entre eux afin d’améliorer son rendement. Avant de dépenser davantage d’argent, de temps et de ressources à modifier les autres, il veut savoir s’il a amélioré le rendement de façon substantielle. Après avoir prélevé un échantillon du rendement de deux générateurs (l’un modifié et l’autre pas) comment comment déterminer déterminer s’il existe une une « réelle différence » entre les deux rendements ? Regard Regardon onss les résult résultats ats.. Le géné générat rateur eur B est est celui celui qui qui a été modifié.
Géné Généra rate teur ur A Géné Généra rate teur ur B 89.7
84.7
81.4
86.1
84.5
83.2
84.8
91.9
87.3
86.3
79.7
79.3
85.1
82.6
81.7
89.1
83.7
83.7
84.5
88.5
“Y-a-t-il vraiment une différence entre le générateur A et le générateur B?”
Jan-16
Fethi Derbeli
27
Test d’hypothèse
• •
Hypo Hypoth thès èsee sta stati tist stiq ique ue:: il il n ’y a pas pas de différence entre les générateurs Ceci Ceci s’ap s’appe pell llee une une hyp hypot othè hèse se nu null llee (Ho) (Ho)
•
Hypo Hypoth thès èsee réel réelle le:: le géné généra rate teur ur modifié améliore son rendement
•
Ceci Ceci s’ap s’appe pell llee une une hy hypo poth thès èsee alternative (Ha)
Ho:
a
b
Ha:
a
b
Nous devons montrer montrer qu’il est tellement peu peu probable que les valeurs observées proviennent du du même processus, que Ho doit être erronée.
Jan-16
Fethi Derbeli
28
Exemple • Quest estion prati atique: les modifications du générateur B vontelles améliorer le rendement par rapport au processus actuel, représenté par le générateur A Descriptive Statistics Varia ariabl blee Mach Machin inee N Yield A 10 B 10
Mean Mean 84.24 85.54
StDe StDev v 2.90 3.65
• Question statistique: la moyenne du générateur B (85,54) diffère-telle assez de celle du générateur A (84,24) pour être considérée comme significative ? Ou les moyennes moyennes sont-elles assez rapprochées rapprochées pour être le résultat du du hasard et des variations au jour le jour? Concept statistique: Jan-16
Fethi Derbeli
29
Exemple Statistical Concept: • En réalité, les rendements des générateurs représententils deux populations différentes ?
Machine A
Machine B
A
AAB
B BB AAA AAAA A B AA BB A B
B
B
A
AAB
B BB AAAA AAA A B AA BB A B
B
B
• Ou les les ren rendemen ementts des des générateurs viennent-ils d ’une seule populatio population n?
Jan-16
Fethi Derbeli
30
Quel relation? p-value vs. critical critical value
Calc < Critical P-value > alpha
Calc = Critical P-value = alpha
Calc > Critical P-value < alpha
Critical Value Calculated Value Calculated Value
Calculated Value
= 5.0%
Jan-16
Fethi Derbeli
31
Un coté vs. deux cotés • Le test test d’égal d’égalité ité ; dévis dévisee le risque risque en en deux deux “cot “cotés” és” • Le test test de de supéri supérieur eur/in /inféri férieur eur à une une certain certainee valeur; met tous le risque en seul “coté”
H a : μ A μ B
2.5%
Jan-16
H a : μ A μ B
5.0%
2.5%
Fethi Derbeli
32
Une méthode pour vous aider L ’exemple qui suit suit concerne un test-t sur 2 échantillons, échantillons, toutefois cette méthode est valable pour toutes les vérifications d’hypothèse: 1. Identifiez l’hypothèse nulle 2. Identifiez l’hypothèse alternative 3. Etablissez votre risque alpha 4. Dessinez un schéma (comme celui ci-dessous) pour représenter la vérificati vérification. on. 5. Collectez les données effectuez la vérificati vérification, on, déterminez la valeur-p et décidez.
4
1 Ho: A = B 2 Ha: A > B 3 = 0.05
Ho
Ha
P > 0.05
P < 0.05 5 = 0.05
Jan-16
Fethi Derbeli
33
Les étapes étapes de la vérific vérificatio ation n d ’hypothès ’hypothèse: e: 1. Caract Caractéris ériser er le problè problème me et défini définirr les objectifs 2.
Elaborer les hypothèses
7.
Effe Effect ctue uerr la véri vérific ficati ation on et col colle lect cter er les les données
8.
Calculer la statistique du test (z, t, ou F) à partir des données.
- Enoncer Enoncer l’hypothè l’hypothèse se nulle nulle (Ho) (Ho) - Enoncer Enoncer l’hypothè l’hypothèse se alternative alternative (Ha).
9.
3. Décide Déciderr du du test test statis statistiq tique ue approp approprié rié (distribution de probabilité probabilité supposée, supposée, Z, t, 2 , F) 4. Indiqu Indiquer er le le nivea niveau u Alpha Alpha (en (en géné général ral 5%) 5. Défi Défini nirr la tail taille le de de l’éch l’échan anti till llon on 6. Dévelo Développe pperr le le plan plan d’écha d’échanti ntillo llonna nnage ge
Problème Pratique Jan-16
Problème Statistique
Déte Déterm rmin iner er la la prob probab abil ilit itéé que que se se produise par hasard hasard cette probabilité de test calculée = valeur-P . –
Si p-value < , reje rejete terr Ho
–
Si p-value > , accepter Ho
10. Reprod Reproduir uiree les résult résultats ats et trans transpo poser ser la conclusion statistique en une solution pratique
Solution Statistique Fethi Derbeli
Solution Practique
34
Exemple •
On veut veut savo savoir ir si si une pièce pièce de de monna monnaie ie n’es n’estt pas pas truqué truquée, e, pour pour répondre à cette question, on lance la pièce plusieurs fois et note le nombre de pile. Par chance si la pièce est juste quel % est attendue? • Si on on lance lance 10 fois fois la pièc piècee et et on a 10 fois fois piles piles donc donc on serr serr confia confiant nt que la pièce est truquée. Mais il y a une chance sur 1000 ‘avoir 10 piles avec une pièce non truquée. Donc on peut conclure conclure qu’on peut peut accepter 0.1% chance d’être incorrecte. • On sup suppos posee qu’on qu’on accept acceptee qu’on qu’on peut peut confir confirme merr si la pièce pièce n’est n’est pas truquée avec seulement seulement 10 lancées. On lance la pièce 10 fois et on obtient 08 piles quel sera la décision? • On peut peut util utilise iserr la prob probabi abilit litéé d’une d’une distri distribut bution ion binomi binomiale ale pou pourr répondre à la question. “Est-ce qu’il y a une différence significative significative entre une cette pièce et une pièce non truquée?” truquée?”
Jan-16
Fethi Derbeli
35
Exemple •
Notr Notree suppo supposi siti tion on ava avant nt le le test test ave avecc une une pièc piècee non truquée on attend devoir le pile à 50% des lancées.
•
Rappel:
n! p r (1 p) n P(r) r! (n r)!
•
r
Cumulative Probability Density Function Heads
Prob
Cum Prob
0
.0010
0.0010
1
.0098
0.0108
2
.0439
0.0547
3
.1172
0.1719
4
.2051
0.3770
–
r = le nombre des des piles lancées lancées
5
.2461
0.6231
–
n = 10 (total lancées)
6
.2051
0.8282
–
p = .5
7
.1172
0.9454
8
.0439
0.9893
9
.0098
0.9991
10
.0010
1.0000
Quel Quel prob probab abil ilit itéé d’av d’avoi oirr 07 07 p pil iles es ou moins oins ave avecc une pièce non truqués? Ou quel est la probabilité d’avoir 08 piles ou plus sur 10 lancées avec une pièce non truquée?
“Est-ce qu’il y a une différence significative significative entre une cette pièce et une pièce non truquée?” Jan-16
Fethi Derbeli
36
Exemple •
Ici la dist distrib ributi ution on binom binomial ialee avec la suppos suppositi ition on que que la probab probabili ilité té d’avoi d’avoirr l’évennement ( d’avoir un pile) est 0.50 pour chaque essai.
•
Si on conc conclu lu que que cette cette pièce pièce est est truqu truquée ée on pren prend d un risque risque de 11,7 11,7% % de se tromper de décision.
0.25
0.20
y 0.15 t i l i b a b .010 o r P 0.05
0.00
0
5
10
Number of Heads
Rejection Region
Jan-16
Zone of Acceptance
Fethi Derbeli
Rejection Region
37
Conclusion •
Test Test d’hypot d’hypothès hèsee est utili utilisé sé pour pour évaluer évaluer le mess message age qui qui contie contient nt les. les.
•
Un hypothè hypothèse se est accep accepté té ou ou rejeté rejeté selon le niveau niveau acceptabl acceptablee du du risque risque (alpha).
•
La collect collectee des données données est est destiné destinéee à avoir avoir des des échanti échantillon llonss représen représentativ tatives es sous des conditions conditions spécifiques spécifiques d’intérêts.
•
Les statis statistique tiquess et les distri distributi butions ons détermine déterminent nt la la valeur valeur critiq critique, ue, la la valeur valeur calculée et la valeur P pour les analyses.
•
On se baso basons ns sur sur les les critèr critères es ci ci dessu dessuss on peut peut conc conclur luree : – Les Tables de Référence tables tables – déterminent la valeur valeur critique et le compare compare avec les statistiques calculés – Minitab ou Excel – détermine le risque risque (p-value) d’avoir se trompé trompé si on rejette l’hypothèse nul.
Jan-16
Fethi Derbeli
38
Test d’Hypothèse: Roadmap
For all tests: p > 0.05 Fail to to Reject Ho Ho (null) p < 0.05 Reject Reject Ho
Hypothesis Testing
Non Normal Normal Ho: s1 = s2 = s3 = ... Ha: at least one is different Minitab: Stat - Anova – Test for Equal Equal Variances Variances For only two s‘s this is similar to an FTest: F=(S1)2 / (S2)2 If F calc > F table, then reject null. (Use Chi-Squared for one sample)
Normality Test Test
Levene’s Test
One Ho: 1 = target Sample Ha: 1 target Minitab: Chi-Squared Stat – Basic Stats Stats – Display Descriptive Descriptiv e Statistics Graphs: Graphical Summary If s target falls with CI, then fail to
Contingency Table Two or More Samples Ho: 1 = 2 = 3 = ... Ha: at leastone is different Minitab: Stat - Anova – Test for Equal Equal Variance Variance (For only two s‘s this is the same as an FTest: F=(S1)2 / (S2)2 If F calc > F table, then reject null.
Bartlett’s Test
reject Ho. Ho: 1 = target
Ha: 1 target 1 Sample T Test Minitab: Stat - Basic Stats Stats - 1 Sample-T Sample-T Two Stat – Basic Stats – Display Descriptive Descriptive Statistics Samples
Two or More Samples
One Way Anova
Graphs: Graphical Summary
2 or More Samples
Jan-16
Ho: Data is Normal Ha: Data is NOT Normal Minitab: Stat - Basic Stat - Normality Normality Test Use Anderson-Darling
Normal Two or More Samples
Ho: M1 = M target 1 Sample Ha: M1 M target Minitab: Stat - Nonparametric Nonparametric - 1 Sample-Sign Sample-Sign (OR) Stat - Nonparametric Nonparametric - 1 Sample-Wilcoxon Sample-Wilcoxon (This is also used for paired comparisons: Ho: M1 - M2 = 0) 0) M1 = Median of sample 1 M target = Target Median
Ho: M1 = M2 = M3 = ... Ha: at least one is different Minitab: Stat - Nonparametric Nonparametric - Mann-Whitney Mann-Whitney (OR) (OR) Stat - Nonparametric Nonparametric - Kruskal-Wallis Kruskal-Wallis (OR) Stat - Nonparametric Nonparametric - Mood’s Median Median (OR) (OR) Stat - Nonparametric Nonparametric - Friedmans M1 = Median of sample 1, etc...
Ho: Two factors are independent Ha: Two factors are dependent Minitab: Stat -Tables -Tables - Chi-square Test Test
Attribute Data (2 factors only)
Continuous Data (one factor only)
If Xbar target falls with
CI, then
fail to reject Ho.
Ho: 1 = 2
2 Sample T Test ( Variances Equal)
Ho: 1 = 2
2 Sample T Test (Variances Not Equal)
Ha: 1 2 Ha: 1 2 Minitab: Minitab: Stat - Basic Basic Stats - 2-Sample 2-Sample T Stat - Basic Basic Stats - 2-Sample 2-Sample T (Compares Means using pooled Std Dev) (Compares Means using each sample Std Dev) Assume equal variances Fethi Derbeli
Ho: 1 = 2 = 3 = ... Ha: at least one is different Minitab: Stat - AnovaAnova- One-way (or oneway unstacked) Assumes Equal Variances (Bartlett’s test must fail to reject that variances are =.
39
Questions?
Jan-16
Fethi Derbeli
40