Probabilité & Statistique
Jan-16
Fethi Derbeli
1
Programme • • •
Import Impo rtan ance ce de la pr prob obab abil ilit itéé et la st stat atiist stiq ique uess Méthodes d'analyse Mesures statistiques
– – • • • • •
Jan-16
Tendance centrale Dispersion
La courbe normale Prév Pr évis isio ions ns uti utili lisa sant nt une une dist distri ribu buti tion on nor norma male le Théorè rèm me de de la la lilimite ce centrale Intervalle de confiance Exercices
Fethi Derbeli
2
Pourquoi étudier les probabilité & statistiques ?
–
•
On entend par statistiques statistiques la collecte, l'organisation, l'analyse, l'interprétation et la présentation des données.
C'est un des des nombr nombreux eux outils perme permettant ttant de résou résoudre dre les probl problèmes èmes de qualité qualité..
•
Les statistiques descriptives nous donnent des informations sur les performances d'un procédé. • Les statistiques par inférence nous permettent de prévoir les performances futures d'un procédé sur la base de mesures actuelles. • L' L'ob obje ject ctif if fi fina nall es estt de prévoir & prévenir plutôt plutôt que de contrôler & détecter . • Les stat statist istique iquess peuvent peuvent avoi avoirr plusieu plusieurs rs formes formes : tab tabulai ulaires, res, numé numériq riques ues,, graphiqu graphiques. es.
La probabilité est la base des prévisions
Jan-16
Fethi Derbeli
3
Terminologie • Un échantillon est un nombre limité des éléments prise de la source des données. – le groupe d’objets d’objets véritablement véritablement mesuré dans une étude statistique – un échantillon est en général un sous-ensemble sous-ensemble de la population population à laquelle laquelle on s’intéresse. • Une population la source des éléments ou les échantillons sont prises. – un groupe entier entier d’objets qui ont été ou vont vont être créés, présentant une caractéristique intéressante – il est probable que nous ne connaissions connaissions jamais jamais les paramètres paramètres réels de la population • L'inférence L'inférence statistique implique la mesure sur un échantillon et les prévisions sur une population. • Généralem Généralement, ent, les symbo symboles les grecs grecs représenten représententt les les paramè paramètres tres de populati population on (m, ) et les lettres romaines (x, s) sont utilisées pour représenter les valeurs d'échantillon.
Jan-16
Fethi Derbeli
4
Les paramètres paramètres de population / les échantillons
“Statistiques d’échantillons”
“Paramètres “Paramètres de population”
Moyenne nne d ’écha ’échantill ntillon on X = Moye
= Déviation standard de population
s = Déviation standard d’échantillon
m = Moyenne de population
Population Echantillon
Jan-16
Fethi Derbeli
5
Principes statistiques fondamentaux de l’amélioration • Variabilité
– Le processus atteint-il ses objectifs concernant la variabilité minimum ? – On utilise la moyenne pour déterminer si le processus atteint son objectif, et la Déviation standard (, pour connaître la répartition. • Stabilité
– Quelle est la performance du processus sur une durée donnée ? – La stabilité est représentée par une variabilité moyenne constante et prévisible dans le temps. Graphique à barres des X du processus B
Graphique à barres des X du processus A LSC=77.20
80 n e y o m n 70 o l l i t n a h c 60 E
75 n e y o m n 70 o l l i t n a h c E 65
X=70.91
LIC =64.62 0
5
10
15
20
X=70.98 LIC =64.70
50 0
25
5
10
15
20
25
Nombre d’échantillons
Nombre d ’échantillons
Jan-16
LSC=77.27
Fethi Derbeli
6
Exercice pratique • • •
Supposons Suppos ons que les les mach machine iness A, B, et et C fabr fabriqu iquent ent des prod produits uits ide identi ntique quess Suppos Sup posons ons que la la valeur valeur cibl ciblée ée de cha chaque que vari variable able de produi produitt est est 100mm. 100mm. Répo Ré pond ndre re aux aux que quest stio ions ns sui suiva vant ntes es:: – – – – – –
n e y o m n o l l i t n a h c E
145 135 125 115 105 95 85 75 65 55
Quelle(s) machin(es) présente(ent) une variation? Sur quoi chaque machine est-elle centrée ? Quelles machines sont prévisibles ? Quelles machines présentent une variation ayant une cause spéciale ? Quelle machine choisiriez-vous pour fabriquer votre produit ? Quelle machine serait la plus facile à réparer ?
Graphique à barres des X de la machine A
Graphique à barres des X de la machine B
X-bar -bar Chart Chart for Machi achine A
X-bar -bar Chart Chart for Machi achine B
X=100.7
62.93 0
10
Nombre d ’échantillons
20
n e y o m n o l l i t n a h c E
X-bar -bar Chart Chart for Machine achine C
1
110
138.4
Graphique à barres des X de la machine C
108.5 X=101.0
100
93.42 90
120
119.7
n e y o m n o l l i 115 t n a h c E
X=115.0
110.4
110 0
10 Nombre d’échantillons
20
0
10
20
Nombre d’échantillons
Mars-10 Jan-16
Fethi Derbeli
7
Pouvons-nous tolérer la variabilité? • •
Tout pro proces cessus sus pré présen sentera tera tou toujou jours rs une une cert certain ainee varia variabil bilité ité Nous No us pouv pouvon onss tolé tolére rerr cette cette va vari riab abil ilité ité si si:: – le processus remplit ses objectifs; – la variabilité totale est relativement faible par rapport aux spécifications s pécifications du processus; – le processus est stable dans le temps. LIS
t û o C
LIS
Nom
USL LSS
Acceptable
Nom
LSS
Fonction de perte Taguchi
t û o C
Jan-16
Vue Traditionnelle
(Vue nouvelle)
Fethi Derbeli
8
Objectif Versus limites des spécification
Notre souci ne sera plus “est ce que nous sommes dans les specs?” Vision traditionnelle Cette valeur est il….
LSL
Nom
USL
Acceptable
Réllement different de celle la?
X X CTQ
Nous somme encore entrain d’utiliser l’une et de jetr l’autre ! Jan-16
Fethi Derbeli
9
Nouvelle vision qualité Notre souci devient “Est ce que nous somme à l’objectif avec le minimum de de variation?”
Nouvelle vision LSL
Nom
USL
CTQ distribution Perte en qualité en s’éloignant de l’objectif t û o C
CTQ Jan-16
Fethi Derbeli
10
Cost of Variability When on Target LSL
Nom
USL À l’objectif; minimum de variabilité
t û o C
LSL
Nom
USL À l’objectif; variabilité à la limite d’acceptation
t û o C
Jan-16
Fethi Derbeli
11
Cost of Variation and Off Target Performance LSL
Nom
USL Pas à l’objectif; minimum de variabilité
t û o C
LSL
Nom
USL Pas à l’objectif; variabilité à la limite d’acceptation
t û o C
Jan-16
Fethi Derbeli
12
Types de données d’arrivée
• At Attr tribu ibuts ts (d (donn onnées ées qu qual alit itat ativ ives) es) – – – – –
Catégories Oui, Non Passe, Ne passe pas Machine 1, Machine 2, Machine 3 Bon/Mauvais
• Var Varia iabl bles es (d (donn onnées ées qu quant antit itat ativ ives) es) – Données discontinues • Pannes Pannes d’équipem d’équipements ents de de maintenanc maintenance, e, rupture rupture de fibres, fibres, nombre de blocages
– Données continues • Les subdi subdivisi visions ons décim décimales ales ont un sens sens • Dime Dimension nsions, s, rendeme rendement nt chimiqu chimique, e, durée durée de cycle cycle Jan-16
Fethi Derbeli
13
Types d'analyses statistiques
• Tabulaire – distribution des fréquences, tableau des fréquence fréquencess
• Numérique – moyenne, médiane, étendue, variance, écart type
• Graphique – boîte à moustaches, histogramme
Jan-16
Fethi Derbeli
14
Les analyses de données nécessaires à l’amélioration
• Dé Déte term rmin iner er si le pr proc oces essu suss est est st stab able le
– Si le processus n’est pas stable, identifier et supprimer les causes (X) d’instabilité (variation évidente et non aléatoire) • Sit Situer uer la la moyen moyenne ne du proc process essus. us. Répo Répond-i nd-ill à ses ses object objectifs ifs ?
– Si ce n’est pas le cas, identifier les variables (X) qui affectent la moyenne et déterminer les réglages optima pour pou r atteindre les objectifs. • Estimer Estimer l’ampleur l’ampleur de de la variab variabilité ilité total totale. e. Est-ell Est-ellee acceptab acceptable le en ce ce qui concer concerne ne les exigences du client (limites de spécifications) spécifications)??
– Si ce n’est pas le cas, identifier les sources de variabilité et supprimer ou réduire leur influence sur le processus. • Nous allons allons main maintena tenant nt examin examiner er des des statist statistiques iques qui peuven peuventt aider aider ce proce processus. ssus.
Jan-16
Fethi Derbeli
15
Répartitions statistiques • On peut peut décr décrire ire le comp comport orteme ement nt de de n’imp n’import ortee quel quel processus ou système en indiquant de multiples points de données pour la même variable – sur une certaine durée – pour plusieurs produits – sur diverses machines, etc.
• L’accum L’accumula ulatio tionn de ces don données nées peut êtr êtree consid considérée érée comme une répartition de valeurs représentée par: – des graphiques à points – des histogrammes – des courbes normales ou autre répartition “arrondie” Jan-16
Fethi Derbeli
16
Mesures de tendance centrale • Moyenn Moyenne: e: moy moyenn ennee ari arithm thméti étique que d’un ens ensemb emble le de val valeurs eurs – Reflète l’influence de toutes les valeurs – Fortement influencée par les valeurs extrêmes
x =
n
x n n =1
n
• Médian Médiane: e: ref reflèt lètee les les 50% - le nom nombre bre cen central tral une foi foiss qu’u qu’unn ens ensem emble ble de chiffres a été trié – Ne tient pas forcément compte de toutes les valeurs dans le calcul – Est “dure” avec les valeurs extrêmes • Mode: – La valeur la plus fréquente dans les ensembles de données • Pou Pourqu rquoi oi utili utiliser ser la la moyenn moyennee au lieu lieu de la la médian médianee dans nos eff effort ortss d’amélioration du processus ? Jan-16
Fethi Derbeli
17
Exercice Set #1
S et #2
Set#3
98
105
107
102
109
169
108
116
131
105
76
84
89
148
81
Faites maintenant la série de données n°2 et 3 en groupes.
92
87
67
114
86
81
90
70
122
Série n°2
97
137
52
100
99
233
104
119
46
Nous allons calculer ensemble la moyenne et la médiane de la série de données n°1. Moyenne = Médiane =
Série n°3 Jan-16
Moyenne = Médiane = Moyenne = Médiane = Fethi Derbeli
18
Mesures de dispersion Étendue Distance numérique entre les valeurs les plus élevées et les valeurs R Range ange les plus basses d'une série de données – Très sensible aux valeurs extrêmes des données Étendue interquartile (IQR) Distance extrême entre le 1er et le 3ème quartile d'une série de données divisée en 4 groupes égaux – Utilisée pour générer des boîtes à moustaches
IQR = Q3 - Q1 n
2
Variance ( s ) Moyenne des carrés des écarts de chaque point de données individuel 2 par rapport à la valeur moyenne s – Pas du tout sensible aux valeurs extrêmes des données Écart type ( s Racine carrée de la variance ; distance moyenne des données par rapport à la moyenne – Mesure la plus communément utilisée pour quantifier une variation
Jan-16
= min - max
Fethi Derbeli
2 (X X ) i
=
i =1
n -1 n
(X i - X) s =
2
i =1
n -1 19
Exercice Nous allons calculer ensemble l'étendue, la variance et l'écart type de la série de données n°1. Étendue = Variance V ariance = s2 = Écart type = s = Faites maintenant la série de données Faites n°2 et 3 en groupes. Série n°2 Étendue = Variance V ariance = s2 = Écart type = s = Série n° 3 Étendue = Variance V ariance = s2 = Écart type = s = Jan-16
Fethi Derbeli
Set #1
Set #2
Set #3
98
105
107
102
109
169
108
116
131
105
76
84
89
148
81
92
87
67
114
86
81
90
70
122
97
137
52
100
99
233
104
119
46
20
Probabilité •
Nous avons Nous avons précéde précédemme mment nt défini défini les les valeur valeurss d'échan d'échantil tillon lon et et les param paramètr ètres es de population.
•
Une fonction de distribution de probabilité est une formule mathématique qui rapproche les valeurs des caractéristiques avec leur probabilité d'occurrence d'occurre nce dans la population.
•
Une col collec lectio tionn de val valeurs eurs de proba probabil bilité ité est appe appelée lée une distribution.
•
Lorsquee la caractér Lorsqu caractérist istiqu iquee mesuré mesuréee peut prendr prendree une valeur valeur quelco quelconque nque (dépe (dépendan ndantt de la finesse de la méthode de mesure), sa distribution de probabilité est continue.
– Les distributions normales, exponentielles et de Weibull sont des exemples. •
Lorsquee la caractér Lorsqu caractérist istiqu iquee mesuré mesuréee ne peut prendr prendree qu'une qu'une valeur valeur bien bien spécifi spécifique, que, sa sa distribution de probabilité est discrète.
– Binôme et Poisson sont des exemples. Jan-16
Fethi Derbeli
21
La répartition normale • La répart répartiti ition on “Norm “Normale” ale” est est une une répart répartiti ition on des des données données qui possèdent certaines caractéristiques cohérentes • Ces carac caractér térist istiqu iques es sont sont très très utiles utiles pour pour nous nous permett permettre re de comprendre les propriétés du processus d’où viennent les données • La plupar plupartt des phén phénomè omènes nes natu naturel relss et des des proces processus sus créé crééss par l’homme sont répartis normalement, ou peuvent être représentés comme tels.
Jan-16
Fethi Derbeli
22
Distribution normale • La distribu distribution tion utili utilisée sée le le plus plus communé communément ment dans les les analyse analysess statist statistiques iques de procédés industriels industriels est la distribution normale. • La fonc fonctio tionn de de dens densité ité de prob probabi abilit litéé (fdp (fdp)) est est :
y=
1 σ 2
e
2 2 - (X - μ ) /2
Les propriétés significatives sont les suivantes : La courbe est symétrique autour de la moyenne Les valeurs de l'asymétrie et du kurtosis = 0 La moyenne et l'écart type sont indépendants Moyenne = médiane Le domaine en-dessous de la courbe de - à + = 1
Jan-16
Fethi Derbeli
23
La répartition normale • Caract Caractéri éristi stique que 1: on ppeut eut décrir décriree une répart répartiti ition on normale en connaissant seulement: – la moyenne et – la déviation standard
Répartition N°1 Répartition N°2
Répartition N°3
Qu’est-ce qui différencie ces trois répartitions normales ? Jan-16
Fethi Derbeli
24
La courbe normale et ses probabilités • Caractéri Caractéristiqu stiquee 2: 2: la surfa surface ce en-de en-dessous ssous de la courb courbee peut peut être être utili utilisée sée pour estimer estimer la probabilité cumulative de la survenance d’un certain “évènement”.
r u e l a v a l e d é t i l i b a b o r P
Probabilité cumulative de l’obtention d’une valeur située entre ces deux valeurs
68%
40% n o l 30% l i t n a h20% c é ’ l e d10%
95%
99,73%
0% -4
-3
-2
-1
0
1
2
3
4
Nombre de déviations standard par rapport à la moyenne Jan-16
Fethi Derbeli
25
68,,26 % 68
des do donnnées tombe berront dans les li lim mites de + / - 1 par rapport à la moyenne
95,4 95 ,466 %
dess do de donn nnée éess to tomb mber eron ontt da dans ns le less li limi mite tess de + / -2 par rapport à la moyenne
99,7 99 ,733 %
dess do de donn nnée éess to tomb mber eron ontt da dans ns le less li limi mite tess de + / -3 par rapport à la moyenne
99,99 99, 9937 37 %
dess don de donné nées es to tombe mbero ront nt da dans ns le less limi limite tess de de + / -4 par rapport à la moyenne
99,9999433 % des données 99,99994 données tomberon tomberontt dans les les limites limites de de + / -5 par rapport à la moyenne 99,9999998 %des données tomberont dans les limites de + / -6 par rapport à la moyenne
68.26 %
95.46 % 99.73 % -3.0
Jan-16
-2.0
-1.0
-0.0
Fethi Derbeli
1.0
2.0
3.0
26
Test de Normalité • Dans certai certaine ne circon circonstan stances ces si si nécess nécessair aire, e, de savo savoire ire si si les données sont normalement distribuées. • Pour savoi savoirr si la la distri distribut bution ion est norm normale ale on on condui conduitt un test de normalité, on peut utiliser Minitab • Pour faire faire un un test test de de norma normalit litéé on a besoin besoin de list lister er quelques concepts fondamentales concernant le test d’hypothèse. • Pour con condui duire re un un test test d’hypot d’hypothèse hèse,, on on a besoin besoin de statuer notre hypothèse et décider le niveau de risque qu’on prend pour se tromper.
Jan-16
Fethi Derbeli
27
Test d’Hypothèse Concepts fondamentales
• Hy Hypo poth thès èsee Nu Null & Alte Altern rnat ativ ivee – Hypothèse Nul, Nul, H0: La confirmation confirmation de la supposi supposition tion (pas de changemen changement,t, pas de dépendence, pas de différence) qui suppose qui est vrai jusqu’à avoir suffisament d’évidence pour prouver le contraire. • Pour le test test de normalité normalité,, l’hypothèse l’hypothèse nul suppose suppose que les data data sont sont normallement distribuées – Hypothèse Alternative, Alternative, Ha: La confirmation de la supposition opposée de l’hypothèse nul; elle est vrai si on rejète l’hypothèse nul • Pour le le test normalité, normalité, l’Hypothèse l’Hypothèse alternative alternative suppose suppose que les les data data ne sont pas normallement distribuées. – Risque Alpha (): La probabilité d’avoir tort de rejeter H0 • Analyse Analyse Minitab Minitab toujours génère “la valeur-p valeur-p”” qui est égale égale au au risque risque alpha, alpha, on veut établir le maximum de risque qu’on veut prendre, avant de conduire le test; la valeur habituelle est .05 or 5% de risque.
Jan-16
Basi Basicc Stat Statss - 28 Fethi Derbeli
28
Test de Normalité par Minitab • • •
Collect Coll ecter er un écha échant ntill illon on de do donné nnéee du du proc proces essu suss Arra Arrang nger er les les donn donnée éess dans dans un un colonn colonnee dans dans Min Minit itab ab Fair Fairee le test test de Norm Normal alit itéé – Stat > Basic Statistics > Normality Test • Variab Variable le = Single Single colum columnn of data data
•
Example – fn: Demo.mtw • Use Use wei weigh ghtt dat dataa in C1 C122
Jan-16
Fethi Derbeli
29
Graphiques de probabilité normale • Nous Nous pouvon pouvonss teste testerr si un ensem ensemble ble de de données données peut peut être être décr décrit it comm commee “normal” grâce à un test appelé le graphique de probabilité normale. • Si la répartiti répartition on est est proche proche de la normale, normale, le le graphique graphique de probabi probabilité lité normale normale sera en ligne droite. • Minitab Minitab permet permet de de créer créer facile facilemen mentt un graphique graphique de probabi probabilité lité normale normale • Produire Produire un graphiq graphique ue normal normal pour pour chacune chacune des 3 premières premières colonnes. colonnes. Lequel Lequel paraît normal normal ? • Mainte Maintenan nant, t, produi produire re un hist histogr ogramm ammee pour pour chaque chaque.. • Que ré révèle-t-il ?
Jan-16
Fethi Derbeli
30
Résultat de Minitab
Jan-16
Fethi Derbeli
31
Graphiques de probabilité normale
Normal Probability Plots
Normal Probability Plots
Normal Probability Plots 300 300
100
y c n e u q e r F
y c n e u q e r F
y 200 c n e u q e r F
50
200
100
100
0
0
0
0 20
30
40
50
60
70
80
90
100
60
110
70
80
90
100
110
120
C2
Normal Distribution
Positive Skewed Distribution
.95 y t i l i b a b o r P
y t i l i b a b o r P
.80 .50 .20
y t i l i b a b o r P
.80 .50
.05 .01
.05 .01 .001
.001
36
46
56
66
76
86
96
106
60
Normal Average: 70 StdDev: 10 Nofdata:500
Jan-16
70
80
90
100
110
120
Average: 70 StdDev: 10 Nof data: 500
Anderson-Dar DarlingNorma lingNormalityTest A-Squared: 46.447 p-value: 0.000
Fethi Derbeli
50
60
70
80
.50 .20 .05 .01 .001
130
Pos Skew Anderson-DarlingNormalityTest malityTest A-Squared: 0.418 418 p-value: 0.328
40
.999 .99 .95 .80
0 26
30
Negative Skewed Distribution
.999 .99 .95
.20
20
C3
.999 .99
10
130
C1
10
20
30
40
50
60
70
80
Neg Skew Average: 70 StdDev: 10 Nof data: 500
Anderson-DarlingNorma lingNormalityTest A-Squared: 43.953 p-value: 0.000
32
Répartition mystère • Créer Créer un graph graphiqu iquee de proba probabil bilité ité norm normale ale pour pour la la variab variable le mystère en C5. • Qu’en Qu’en conclu concluez-v ez-vous ous ? S’ag S’agitit-il il d’une d’une répar répartit tition ion norm normale ale ? Distribution Mystère Mystery Distribution
.999
é t i l i b a b o r P
.99 .95 y t i l i b a b o r P
.80 .50 .20 .05 .01 .01 .001 50
100
150
Mystery Average erage: 100 Std Dev: 32.3849 N of data: 500
Ander Anderson son-D -Dar arling ling Norma ormality lity Test A-Squ A-Square ared: 27.108 7.108 p-value: 0.000
Mystère Jan-16
Fethi Derbeli
33
Statistique Descriptive •
Pour Pour génrer génrer un un resum resuméé des statis statistiq tique ue ddesc escrip riptive tive dan danss Minit Minitab, ab, – Fn: pulse.mtw – Stat > Basic Statistics > Display Descriptive Statistics – Under the graphs option, choose graphical summary
Selectionner la colonne
Jan-16
Fethi Derbeli
34
Statistique Descriptive Summary for Pulse2
Histogramme
60
A nderson-Darling N ormality Tes t
80
100
120
140
A -Squared P -V -V a lu lue <
2.38 0.005
M e an S tD ev V ariance Skewness Skewness K ur urto si si s N
80.000 17.094 292.198 1.12 1.1281 811 1 1 .3 .3 88 88 65 65 92
M in inim um um 1st 1st Quartil Quartile e
50.000 68.000 68.000
M ed edia n 3rd 3rd Q uarti uartile le M a xi xi mu mu m
76.000 87.000 87.000 1 40 40 .0 .0 00 00
Moyen Deviation standard
Interquartile Ecart/Range
95% C onfidence onfidence Interval for Me an 76.460
83.540
95% C onfidence onfidence Interval for Median
Boxplot
74. 000
80.000
95% C onfidence onfidence Interval for StD ev 95% Confidence Intervals
14. 930
19.996
Mean Median 74
Jan-16
76
78
80
82
84
Fethi Derbeli
35
Règles empiriques pour la déviation standard • •
Les règles règles précé précéden dentes tes de la proba probabil bilité ité cumul cumulati ative ve s’appl s’appliqu iquent ent même même si un ensemb ensemble le de données n’es pas réparti parfaitement normalement. Compar Comparons ons les les valeurs valeurs d’une d’une répar répartiti tition on théoriq théorique ue (parfa (parfaite) ite) et et d’une d’une répartit répartition ion empirique (concrète).
Jan-16
Nombre de déviations Standard
Théorique Normale
Empirique Normale
+/- 1
68%
6 0 -7 5 %
+/- 2
95%
9 0 -9 8 %
+/- 3
9 9 ,7 %
9 9 -1 0 0 %
Fethi Derbeli
36
Prévisions utilisant la courbe normale
• Les prév prévisi isions ons néc nécess essite itent nt 2 esti estima matio tions ns et et un tabl tableau eau :
– Estimation de m = X barre – Estimation de = s – Tableau Z • Transformation en en Z :
– Z = (X- m ) /
Jan-16
Fethi Derbeli
37
Prévision des niveaux de défauts
La transformation en Z :
z=
(x - μ (x - x σ
=
s
•
Cette tran Cette transfo sform rmati ation on prod produit uit une “va “valeu leur” r” de de distr distribu ibutio tionn où où : Moye Moyenne nne = 0 et et sigma = 1 • La vale valeur ur Z ind indiqu iquee com combie bienn de dévi déviati ations ons sta standa ndard rd “ent “entren rent” t” dan danss la dis distan tance ce entre X (tout nombre intéressant, comme une limite de spécification) et m (la moyenne d'une distribution distribution donnée) • Pou Pourr la prév prévisi ision on des des nivea niveaux ux de de défau défauts ts (ou (ou proba probabil bilité ité est estim imée) ée),, nous nous pouvo pouvons ns utiliser la moyenne actuelle et l'écart type du procédé et substituer la limite inférieure et la limite supérieure de la spécification (unes (unes à unes) pour x En utilisant cette méthode, nous pouvons calculer le score Z (ou Sigma) du procédé, les niveaux PPM et la probabilité de défaut • Analysons un exemple. Jan-16
Fethi Derbeli
38
calculer la note Z La conversion Z:
x - m ( x - x ( z = =
• • • • • •
s
Cette “transformat “transformation” ion” convertit convertit n’importe n’importe quelle quelle distribution distribution normale normale (avec une moyenne d’échantillon et un sigma d’échantillon) en une répartition standard qui a toujours une moyenne=0 et un sigma=1. Que l’on l’on mesure mesure en mm, en en pouces, pouces, Volts, Volts, etc. la la répartition répartition transformée transformée aura TOUJOURS TOUJOURS une moyenne=0 & sigma=1. Toute distribution est transformée en distribution normale standard grâce au “transformer”Z . La valeur z (ou note z), indique indique l’éloignement l’éloignement d’un chiffre chiffre particulier particulier,, X, de la moyenne d’échantillon, en unités standard de déviation. Par exemple, exemple, si z = 2, le le chiffre chiffre particulier particulier X est à 2 unités unités standa standard rd de déviati déviation on de la moyenne d’échantillon. Pour prédire prédire les niveaux niveaux d’échantillons d’échantillons,, (ou le rendement rendement estimé), estimé), nous substituons substituons à X la limite inférieure de spécification (LIS) et la limite supérieure de spécification (LSS). Nouss pouvons Nou pouvons ainsi ainsi calcul calculer er la propor proportio tionn de produit produit hors spéc spécifi ificat cations ions à parti partirr d’une moyenne d’échantillon et de la déviation standard. Appliquons cette idée aux données du shampoing. Jan-16
Fethi Derbeli
39
Exemple de transformation en Z u Les données à long terme récapitulées ici ont été collectées à partir
du processus d'un tour automatique produisant des broches pour garnitures nues (blank armature shafts) LSL
US L
LIS (LSL) LSS (USL) 9 .9 10 .1
10
y c n e u q e r F
Moyenne Ecart rtT Type 10.03 0.061
5
0 9.9
10.0
10.1
10.2
Diameter
Jan-16
Fethi Derbeli
40
Exemple de transformation en Z (suite) Problème pratique : Déterminer le % de produits hors spécifications. Problème statistique : Évaluer la proportion de la courbe normale en-dehors des limites supérieure et inférieure de la spécification spéci fication.. Nous y arrivo arrivons ns en “transformant” les données en une distribution normale standard et en calculant une valeur Z pour chaque limite de la spécification.
LIS (LSL)
LSS (USL)
700 600 500
y c n 400 e u q 300 e r F
200 100 0 0.8
0.9
1.0
1. 1
1.2
ra w
1. 3
LSS (USL)
LIS (LSL) 500 400 y c n 300 e u q e 200 r F
100 0 -4
-3
-2
-1
0
1
2
3
4
C2
Jan-16
Fethi Derbeli
41
Exemple de transformation en Z (suite) La fraction hors des limites de spéc. peut être estimée de la façon suivante : (USL - x)
ZU = =
ZL =
(10.1 - 10.03
=
Upper Spec
Pr ( x
Jan-16
≤
0.90
0.95
1.00
1.05
1.10
1.15
0.9 ) + Pr ( x
(9.9 - 10.03
.061 = - 2.13
.061
= 1.15
0.85
(LSL - x)
Lower Spec
1.20
1.25
≥ 1.1
0.80
0.85
0.90
0.95
1.00
1.05
1.10
) = Pr ( Z ≤ -2.13 ) + Pr ( Z = 1.7 % + 12.5 % @ 14.2 % Fethi Derbeli
1.15
1.20
≥ 1.15
)
42
Transformation Z Où allons-nous trouver ces probabilités ? Méthode 3 : utiliser les fonctions de répartition des probabilités de Minitab.
ZLSS
ZLIS
Function de répartition cumulative Function de répartition cumulative Normale avec moyenne = 0 et dév std = 1,00 Normale avec moyenne = 0 et dév std = 1,00 x P( X <= x) x P( X <= x) -2,3560 0,0092 1,0340 0,8494
Probabilité Probabilité ( Z < -2,356 ) = 0,0092 Probabilité ( Z < 1,034 ) = 0,8494 Question: Minitab donne-t-il un biseautage à droite ou à gauche de la répartition ? Z Z OU
? Jan-16
Fethi Derbeli
43
Transformation Z Calculer le Z à long terme:
La pire estimation à long terme de Z est calculée calculée en supposant que tous les défauts sont dans un biseau. Nous pouvons à présent calculer à rebours un Z global à partir du pourcentage total défectueux. Rappeler les informations suivantes:
Pr (Qté > 104) + Pr (Qté < 98) = Pr
Z=?
( Z > 1,034 ) + Pr ( Z < -2,356 ) = 0.1506 + 0,0092 @ 15,06 % + 0,92 % @ 15,98 %
% de produit hors spéc. Pire cas: % dans un biseau = 15,98 %
Jan-16
Probabilité ( Z > ? ) = 0,1598 Choisir une méthode N’importe quel tableau Z Fonction Fonction Wizard Wizard d’Excel d’Excel Fonctions de répartition des probabilités Minitab Conseil: vous recherchez maintenant maintenant une note Z à partir d’une probabilité cumulative. Réponse: Z LT = 0,9952 Fethi Derbeli
44
Exemple de transformation en Z (suite) •
Où ob obte tennon onss-n -noous ces pro robbab abil iliités ? –
Méthode 1 : chercher les valeurs dans une table (probabilité (probabilité pour une une distribution
normal standardisée) –
Méthode 2 : utiliser les tableaux informatiques informatiques d'EXCEL. d'EXCEL. • Lorsque Z(inférieur) Z(inférieur) = - 2.13 Proportion en-dessous de de la spéc. inf. = L = 0.017 • Lorsque Z(supérieur) Z(supérieur) = 1.15 Proportion au-dessus de la spéc. sup. = U = 0.1250 • Additionner L + U = .142 Processus global Z = 1.07
• Jan-16
Fais Fa ison onss la la dém démon onst stra rati tion on de dess deu deuxx mét métho hode dess Fethi Derbeli
45
Table de conversion u Comment décider s'il faut additionner ou soustraire 1.5 d'une
évaluation Sigma Convertir DE
Z court terme Z court terme
Pas d'action
Z long terme
+ 1.5
Convertir EN
Z long terme
- 1.5
Pas d'action
Par conséquent, u Les données à court terme sont sans causes attribuables. Par elles ne représentent que l'effet des causes aléatoires. u Les données à long terme reflètent l'influence des causes aléatoires aussi bien que celle des phénomènes attribuables. u Si les données de probabilité ou de défaut ont été collectées sur un grand intervalle de production, considérez la situation comme étant à long terme. Dans les autres cas, partez du principe qu'il s'agit de court cour t terme. ter me. Jan-16
Fethi Derbeli
46
Dérive •
Ques Qu esti tion on : Qu Qu'e 'est st-c -cee qui qui pe peut ut ca caus user er un dé déca cala lage ge de 1. 1.55
•
– Équipe de production production – Opérateur – Machine – Usure de l'outil – Arrêt pour réparation réparation – Étalonnage – Température – Humidité – Nouvelle matière matière LES LE S DER DERIV IVES ES EX EXIS ISTE TENT NT ! No Nous us de devo vons ns do donc nc en te teni nirr co comp mpte te..
Jan-16
Fethi Derbeli
47
Conclusions • Les Stat Statist istique iquess nous nous permet permetten tentt de compre comprendre ndre les processus d’une façon à nous n ous permettre de prédire le future performance au lieu de seulement détecter les problèmes actuels • No Nous us do donne nne un unee idée idée de ce qui se pa passe sse • Nou Nouss perm permet et de de comp compren rendre dre le comp comport orteme ement nt de la la population entière via des échantillons représentative du processus • Nou Nouss permet permet de prend prendre re des des décis décision ionss avec avec un un certa certain in niveau de confiance • Savoir Savoir la la capabi capabilit litéé actue actuelle lle du pproce rocessus ssus et prend prendre re ulterierement les décisions pour améliorer Jan-16
Fethi Derbeli
48
Questions?
Jan-16
Fethi Derbeli
49