Esercizi di: Statistica e Calcolo delle Probabilità
ESERCIZI DI STATISTICA E CALCOLO DELLE PROBABILITÀ
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
1
Esercizi di: Statistica e Calcolo delle Probabilità LISTA DEI SIMBOLI S, ∅, A, B, {·}: rispettivamente spazio campione evento
impossibile ed . eventi generici.
A∪ B: A unione B. j
∪ A k : unione degli eventi da Ai ad A j. k =i
A∩ B: A intersezione B. j
∩ A k ; : intersezione degli eventi da Ai ad A j. k =i
A : evento complementare di A (negazione di A). A⊆ B, A⊂ B: rispettivamente A è incluso in B, A è incluso strettamente in B. P(A): probabilità dell'evento A. P(⋅): probabilità dell'evento definito dall'asserzione logica
⋅ in (⋅).
P( A A⏐ H ): ): probabilità dell'evento A condizionata al verificarsi di H .
∀: qualsiasi. v.a.: variabile aleatoria. v.c.: variabile casuale (è sinonimo di variabile aleatoria). X : generica v.a. x: generica determinazione della v.a. X v.a. X . p(⋅): funzione massa di probabilità. f (⋅): funzione densità di probabilità. pr obabilità. s-indipendenza: indipendenza stocastica.
iid: v.a. indipendentemente ed identicamente distribuite. 2 X ~ N (µ,σ ): v.a. X v.a. X distribuita secondo una Normale di parametri µ e σ . µ X : valore atteso della v.a. X . E ( X) X): valore atteso di X . X ): Var( X ): varianza di X . σ X : deviazione standard o scarto quadratico medio della v.a. X . Cov(⋅,⋅): covarianza.
⎛ n⎞ n! = ⎜ r ⎟ r !( n − r )! ⎝ ⎠ ≅: circa eguale (FELLER): es. di riferimento principale relativo all'esercizio
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
2
Esercizi di: Statistica e Calcolo delle Probabilità LISTA DEI SIMBOLI S, ∅, A, B, {·}: rispettivamente spazio campione evento
impossibile ed . eventi generici.
A∪ B: A unione B. j
∪ A k : unione degli eventi da Ai ad A j. k =i
A∩ B: A intersezione B. j
∩ A k ; : intersezione degli eventi da Ai ad A j. k =i
A : evento complementare di A (negazione di A). A⊆ B, A⊂ B: rispettivamente A è incluso in B, A è incluso strettamente in B. P(A): probabilità dell'evento A. P(⋅): probabilità dell'evento definito dall'asserzione logica
⋅ in (⋅).
P( A A⏐ H ): ): probabilità dell'evento A condizionata al verificarsi di H .
∀: qualsiasi. v.a.: variabile aleatoria. v.c.: variabile casuale (è sinonimo di variabile aleatoria). X : generica v.a. x: generica determinazione della v.a. X v.a. X . p(⋅): funzione massa di probabilità. f (⋅): funzione densità di probabilità. pr obabilità. s-indipendenza: indipendenza stocastica.
iid: v.a. indipendentemente ed identicamente distribuite. 2 X ~ N (µ,σ ): v.a. X v.a. X distribuita secondo una Normale di parametri µ e σ . µ X : valore atteso della v.a. X . E ( X) X): valore atteso di X . X ): Var( X ): varianza di X . σ X : deviazione standard o scarto quadratico medio della v.a. X . Cov(⋅,⋅): covarianza.
⎛ n⎞ n! = ⎜ r ⎟ r !( n − r )! ⎝ ⎠ ≅: circa eguale (FELLER): es. di riferimento principale relativo all'esercizio
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
2
Esercizi di: Statistica e Calcolo delle Probabilità
1.
Statistica descrittiva
1.1
Dato il seguente insieme di misure, valutare la media, la mediana, la varianza, la deviazione standard, il primo quartile, il terzo quartile e la differenza interquartile. 109, 113, 111, 112, 111, 110, 106, 105, 108, 115 Soluzione Media 10
µ =
∑ x i =1
10 = 110
i
=
109+113+111+112+111+110+106+105+108+115 = 10
Varianza 10
σ
2
=
10
∑ ( x − µ ) ∑ x i =1
2
i
=
i =1
2
i
− µ 2 =
10 10 1092 +1132 +1112 +1122 +1112 +110 2 +1062 +1052 +1082 +1152 = − 1102 = 10 = 8.6
Deviazione standard
σ
=
σ 2
= 8 . 6 = 2 .9
Mediana
Una volta ordinati i dati, 105, 106, 108, 109, 110, 111, 111, 112, 113, 115 essendo il campione di dimensione pari (n=10) la mediana si calcola come segue:
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
3
Esercizi di: Statistica e Calcolo delle Probabilità x⎛ n ⎞ M e
=
⎜ 2⎟ ⎝ ⎠
+ x⎛ n
⎞ ⎜ 2 +1⎟ ⎝ ⎠
x⎛ 10 ⎞
=
⎜2⎟ ⎝ ⎠
+ x⎛ 10
⎞ ⎜ 2 +1⎟ ⎝ ⎠
2 2 110 + 111 = = 110.5 2
=
x(5)
+ x( 6) 2
=
Primo quartile
Considero solo i valori minori della mediana 105, 106, 108, 109, 110 e riutilizzo, limitatamente a questa sotto-popolazione, la formula valida per la ricerca della mediana Q1 = x⎛ n +1 ⎞ = x(3) = 108 ⎜ 2 ⎟ ⎝ ⎠
Si osservi che in questo caso la dimensione della sotto-popolazione è dispari ( n=5). Terzo quartile
Considero solo i valori maggiori della mediana 111, 111, 112, 113, 115, e ricavo: Q3 = x⎛ n+1 ⎞ = x(3) = 112 ⎜ 2 ⎟ ⎝ ⎠
Differenza interquartile IQR = Q3 − Q1 = 112 − 108 = 4
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
4
Esercizi di: Statistica e Calcolo delle Probabilità 1.2
Un certo carattere è distribuito in una popolazione nel modo seguente in funzione dell’età degli intervistati: ni i Classe [20-30] è una classe chiusa a 1 [20-30] 5 sinistra e chiusa a destra 2 (30-40] 7 (30-40] è una classe aperta a 3 (40-50] 10 sinistra e chiusa a destra 4 (50-60] 7 5 (60-70] 1 Valutare l’età media alla quale si presenta il carattere, l’età mediana, il primo ed il terzo quartile, individuare la classe modale; valutare varianza, deviazione standard e differenza interquartile. Diagrammare frequenza relativa e cumulata. Valutare la frequenza relativa della classe (30-50] anni. Soluzione Simbologia: ni=frequenza assoluta, f i=frequenza della i-esima classe
Classe [20-30] (30-40] (40-50] (50-60] (60-70]
i
1 2 3 4 5
ni
5 7 10 7 1
f i
5/30 7/30 10/30 7/30 1/30
relativa,
F i=frequenza
F i
5/30≅0.17 12/30=0.4 22/30≅0.73 29/30≅0.97 30/30=1
relativa cumulata, ci=centro
ci
25 35 45 55 65
Media k
∑c n 5 7 10 7 1 µ = = ∑ c f = 25 ⋅ + 35 ⋅ + 45 ⋅ + 55 ⋅ + 65 ⋅ = 30 30 30 30 30 ∑n i =1 k
i =1
i i
k
i =1
i
i
i
= 42.3 Mediana
Riconosciuto che la classe numero 3, (40-50], è la classe mediana (3 è infatti il più piccolo valore di i per cui risulta F i≥0.5) si può scrivere: 0.50 − F 3−1 0.50 − 0.40 M e = LI 3 + ( LS3 − LI 3 ) = 40 + ( 50 − 40 ) ⋅ = F3 − F 3−1 0.73 − 0.40 = 43.0 Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
5
Esercizi di: Statistica e Calcolo delle Probabilità Primo quartile
La classe che contiene il primo quartile è la numero 2, (30-40] (2 è il più piccolo valore di i per il quale risulta F i≥0.25) si può scrivere: 0.25 − F 1 0.25 − 0.17 Q1 = LI 2 + ( LS 2 − LI 2 ) ⋅ = 30 + ( 40 − 30 ) ⋅ = F2 − F 1 0.40 − 0.17 = 33.5 Terzo quartile
La classe che contiene il terzo quartile è la n° 4, (50-60] (4 è il più piccolo valore di i per il quale risulta F i≥0.75) si può scrivere: 0.25 − F 3 0.75 − 0.73 Q1 = LI 4 + ( LS 4 − LI 4 ) ⋅ = 50 + ( 60 − 50 ) ⋅ = F4 − F 3 0.97 − 0.73 = 50.8 Classe modale
La classe modale (classe per la quale si osserva la massima frequenza (assoluta o relativa)] è la classe n° 3 (40-50]. Varianza
σ
2
k ⎡ = ⎢ ∑ ( ci − µ )2 ni ⎤⎥ ⎣ i =1 ⎦
k
k
∑ n = ∑ (c − µ ) i =1
i
i =1
i
2
k
fi
=∑ ci ⋅ fi − µ = 2
2
i =1
5 7 10 7 1 + 352 ⋅ + 452 ⋅ + 552 ⋅ + 652 ⋅ − 42.32 = 30 30 30 30 30 = 119.6
= 252 ⋅
Deviazione standard
σ
=
σ 2
= 120 = 10.9
Diagramma della frequenza relativa
a v i t a l e r a z n e u q e r F
0.35 0.30 0.25 0.20 0.15 0.01 0.05 0.00
20-30 30-40 40-50 50-60 60-70
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
6
Esercizi di: Statistica e Calcolo delle Probabilità Diagramma della frequenza relativa cumulata a t a l u 1 m u c 0.8 a v i t 0.6 a l e r 0.4 a z n 0.2 e u q 0.0 e r F
20-30 30-40 40-50 50-60 60-70
Frequenza relativa della classe (30-50]
La frequenza relativa della classe (30-50] si ottiene sommando le frequenze relative delle classi (30-40] e (40-50]: 7 10 17 f 2 + f 3 = + = 30 30 30
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
7
Esercizi di: Statistica e Calcolo delle Probabilità
2.
Algebra degli eventi
2.1
Rappresentare mediante un diagramma di Venn gli eventi: (i) A⊂ B; (ii) A∪ B=S con A∩ B=∅; (iii) A ; (iv) A∩ B con A∩ B≠∅; (v) A∪ B⊂S . Soluzione (i)
(iii)
(ii) B A
A
B
(iv)
A
A
(v) B
A∩ B
A
B
A
A∪ B
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
8
Esercizi di: Statistica e Calcolo delle Probabilità 2.2
Si consideri lo spazio campione S ≡{0,1,2,3,4,5,6,7,8,9} e gli eventi A≡{1,2,3}, B≡{3,4,5}, C ≡{4,5,6}; si scrivano i numeri che sono elementi di ciascuno degli eventi composti di seguito definiti: (i) Non si verifica né A né B né C . (ii) Si verifica almeno uno dei tre eventi. (iii) Si verifica (esattamente o esclusivamente) uno dei tre eventi. (iv) Si verifica al più uno dei tre eventi. (v) Si verificano al più tre eventi. Si rappresenti, inoltre, su di un diagramma di Venn ciascuno degli eventi composti che è stato appena definito. Soluzione (i) (ii) (iii) (iv) (v)
{0,7,8,9}; {1,2,3,4,5,6}; {1,2,6}; {0,1,2,6,7,8,9}; S .
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
9
Esercizi di: Statistica e Calcolo delle Probabilità 2.3
(SVESHNIKOV)
dedurre quando valgono rispettivamente le eguaglianze (i) A∪ B= A, (ii) A∩ B= A Soluzione Risposta (i) B⊆ A
Infatti, in generale risulta: A ∪ B = A ∪ ( A ∩ B ) A ∩ B
A
A
B
Da ciò si ricava che per essere A ∪ B = A ∪ ( A ∩ B ) = A deve risultare A ∪ B = ∅
A
B
Risposta (ii) A⊆ B
B
A
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
10
Esercizi di: Statistica e Calcolo delle Probabilità 2.4
Un obiettivo consiste di 10 cerchi concentrici di raggio r k (k =1,2,...,10), =1,2,...,10), con r k
B = ∪ Ak ,
(i)
k =1
10
C = ∩ Ak
(ii)
k =5
Soluzione Premessa
Considerato che r k k< r k k+1 + 1 e che i cerchi sono concentrici si deduce che tra gli eventi A1 , A2 , A3 , A4 , A5 , A6 , A7 , A8 , A9 , A10 sussiste la relazione: A1 ⊂ A2 ⊂ A3 ⊂ A4 ⊂ A5 ⊂ A6 ⊂ A7 ⊂ A8 ⊂ A9 ⊂ A10 . Risposta (i)
Rappresentati come segue gli aventi A1 , A2 , A3 , A4 , A5 , A6 sul diagramma di Venn: A3
A2
A1
A4
A5
A6
Si deduce che l’evento 6
B = ∪ A k = A1 ∪ A2 ∪ A3 ∪ A4 ∪ A5 ∪ A6 k =1
coincide con l’evento A6 . Si conclude pertanto: B = A6
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
11
Esercizi di: Statistica e Calcolo delle Probabilità Nota
Si osservi che per rispettare la relazione logica che sussiste tra gli eventi A1 , A2 , A3 , A4 , A5 , A6 ( A j ⊂ Ai per ogni i> j) gli eventi sul diagramma di venne sono stati disegnati in maniera tale da garantire che per ogni i>j il verificarsi di A j implica il verificarsi di Ai . In altri termini, il diagramma di Venn deve esser disegnato in maniera da evidenziare che: se si verifica, ad esempio, l’evento A1 (ovvero se abbiamo colpito l’interno del cerchio di raggio r 1) allora sicuramente si verificano anche gli eventi A2 , A3 , A4 , A5 , A6 (ovvero ci troviamo sicuramente anche all’interno di tutte le circonferenze di raggio r2 , r3 , r4 , r5 , r6 ). Risposta (ii) 10
C = ∩ Ak = A5 ∩ A6 ∩ A7 ∩ A8 ∩ A9 ∩ A10 = A5 k =5
A7
A8
A6
A9
A5
A10
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
12
Esercizi di: Statistica e Calcolo delle Probabilità 2.5
(FELLER 15 PG. 25)
Elaborare mediante le regole dell'algebra degli eventi le seguenti espressioni: A∪ B)∩( A A∪ B ); (i) ( A A∪ B)∩( B B∪C ); (ii) ( A ); A∪ B)∩( A ∪ B)∩( A A∪ B ). (iii) ( A Soluzione (i) A (ii) B∪ A∩C ; (iii) A∩ B
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
13
Esercizi di: Statistica e Calcolo delle Probabilità
3.
Calcolo delle probabilità
3.1
Un test sull'inquinamento dell'aria atmosferica richiede che almeno due rilevamenti consecutivi su una serie di tre diano risultato positivo per far scattare misure urgenti antinquinamento. I tecnici hanno a disposizione due dispositivi A e B ed è noto dalle caratteristiche di targa che la probabilità di rilevamento dell'inquinamento del dispositivo A è maggiore di quella di B. I tecnici decidono di scegliere la migliore sequenza di test in base alla maggiore probabilità di rilevamento dell'inquinamento. Ci sono due possibili sequenze di test:
serie 1 serie 2
I test
II test
III test
A
B
A
B
A
B
I risultati dei test sono indipendenti l'uno dall'altro. Usare il calcolo delle probabilità per decidere quale sequenza di test i tecnici debbano preferire. Soluzione
La serie da preferire è la serie 2 (N.B. Il risultato non è intuitivo). Posto pA=P(rilevamento dispositivo A), pB=P(rilevamento dispositivo B) p1=P(rilevamento sequenza 1), p2=P(rilevamento sequenza 2), i valori di p1 (analogo ragionamento per p2) si ottengono come probabilità dell'unione di eventi favorevoli: P[( A∩ B∩ A)∪( A ∩ B∩ A)∪( A∩ B∩ A )], poiché gli eventi considerati sono tra loro mutuamente incompatibili, la probabilità dell'unione di eventi diventa: P( A∩ B∩ A)+P( A ∩ B∩ A)+P( A∩ B∩ A )= pA pB pA+(1- pA) pA pB+ pA pB(1- pA)= =pA pB[ pA+(1- pA)+(1- pA)]= pA pB(2- pA)
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
14
Esercizi di: Statistica e Calcolo delle Probabilità
In definitiva, si ha: p1=P(rilevamento sequenza 1)= pA pB(2- pA). Ragionando in maniera analoga per la sequenza 2 si ottiene: p2=P(rilevamento sequenza 2)= pA pB(2- pB). si vede che dal momento che pA> pB ⇒ (2-pA)<(2- pB) risulta p1< p2.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
15
Esercizi di: Statistica e Calcolo delle Probabilità 3.2
Qual è la probabilità che si realizzi la sequenza di tre sei consecutivamente in tre lanci di un dado "corretto"?. Si indichi con E 6 l'evento “esce 6 all'i-esimo lancio”. i
Soluzione P ( E61
1 1 1 1 6 6 6 216
∩ E6 ∩ E6 ) = ⋅ ⋅ = 2
3
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
16
Esercizi di: Statistica e Calcolo delle Probabilità 3.3
Qual è la probabilità che esca almeno un sei in una sequenza di tre lanci di un dado "corretto"? Soluzione
⎛3 ⎞ ⎛3 ⎞ 5 5 5 216 − 125 91 P ⎜ ∪ E6i ⎟ = 1 − P ⎜ ∩ E6i ⎟ = 1 − = = 666 216 216 ⎝ i =1 ⎠ ⎝ i =1 ⎠ Nota
⎛3 ⎞ ⎛3 ⎞ P ⎜ ∪ E6i ⎟ = 1 − P ⎜ ∩ E6 i ⎟ si La relazione ricava a partire da ⎝ i =1 ⎠ ⎝ i =1 ⎠ 3 3 ⎛3 ⎞ ⎛3 ⎞ P ⎜ ∪ E6i ⎟ = 1 − P ⎜ ∪ E6i ⎟ sfruttando l’uguaglianza ∪ E6i = ∩ E 6i (legge di De ⎜ ⎟ ⎝ i =1 ⎠ i =1 i =1 ⎝ i =1 ⎠ Morgan).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
17
Esercizi di: Statistica e Calcolo delle Probabilità 3.4
Qual è la probabilità che esca esattamente un sei in una sequenza di tre lanci di un dado "corretto"? Soluzione
Si procede mediante enumerazione degli eventi elementari che realizzano l'evento composto sopra specificato. Essi sono: 1 5 5 25 1. E61 ∩ E62 ∩ E 63 → P ( E61 ∩ E62 ∩ E63 ) = = 6 6 6 216 5 1 5 25 = 6 6 6 216
2.
E61
∩ E6 ∩ E 6 → P ( E6 ∩ E6 ∩ E6 ) =
3.
E61
∩ E6 ∩ E 6 → P ( E6 ∩ E6 ∩ E6 ) = 5 5 1 = 25
2
3
1
2
3
6 6 6 216 A noi interessa la probabilità dell’unione di tali eventi. Tali eventi sono incompatibili pertanto la loro unione si può ottenere sommando le probabilità calcolate ai punti 1), 2) e 3): 25 25 25 75 + + = 216 216 216 216 2
3
1
2
3
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
18
Esercizi di: Statistica e Calcolo delle Probabilità 3.5
Qual è la probabilità che escano tutte le facce del dado in sei lanci di un dado "corretto"? Soluzione p =
n f n
6 5 4 3 2 1 6! 6 6 6 6 6 6 66
= ⋅ ⋅ ⋅ ⋅ ⋅ =
Nota
la valutazione della probabilità richiesta può essere effettuata in 2 maniere Prima maniera
Considerato che lanciando 6 volte un dado si possono ottenere 66 differenti sequenze di risultati e considerato che tali sequenze (ordinate) sono equiprobabili (N.B. in virtù 1 della “correttezza” del dado ogni sequenza può essere ottenuta con probabilità 6 ), si 6 può calcolare la probabilità richiesta come rapporto tra i casi favorevoli (numero di sequenze ordinate che prevedono tutti esiti diversi) e il numero totale di sequenze ordinate che è possibile ottenere. Come precedentemente osservato, totale di sequenze ordinate che è possibile ottenere è pari a nT = 66 . I casi favorevoli sono invece n f =6!=6⋅5⋅4⋅3⋅2⋅1. Pari al numero di sequenze (costituite dai 6 differenti esiti possibili) che differiscono per l’ordine con cui tali esiti sono stati ottenuti. Essendo il numero di lanci pari al numero di facce del dado si dovranno infatti ottenere necessariamente sequenze del tipo: 1,2,3,4,5,6; 1,2,3,4,6,5; 1,2,36,4,5 etc. Ovvero sequenze (ordinate) che differiscono non nei risultati ottenuti ma solo per l’ordine con cui essi si sono presentati. n f 6! Rapportando n f ad nT si ottiene p = = 6 . n 6 Seconda maniera
Definiti i seguenti eventi: A1 ={Il primo lancio può dare luogo ad un esito qualsiasi} A j ={il j-esimo lancio da luogo ad un esito diverso da quello ottenuto nei j-1 lanci precedenti} Si può calcolata la probabilità richiesta come: P ( A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5 ∩ A6 ) = = P ( A1 ) ⋅ P ( A2 A1 ) ⋅ P ( A3 A1 , A2 ) ⋅ P ( A4 A1 , A2 , A3 )
⋅P ( A5 A1 , A2 , A3 , A4 ) ⋅ P ( A6
A1 , A2 , A3 , A4 , A5 ) =
6 5 4 3 2 1 6 6 6 6 6 6
= ⋅ ⋅ ⋅ ⋅ ⋅
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
19
Esercizi di: Statistica e Calcolo delle Probabilità 3.6
Qual è la probabilità, p, che in un gruppo di cinque persone ciascuno festeggi il compleanno in un giorno diverso da quello degli altri? S assuma che le nascite si distribuiscono “uniformemente” tra tutti i giorni dell'anno (si consideri un anno di 365 giorni). Soluzione Simbologia nf l numero di casi favorevoli n il numeroi di casi totali risposta p =
n f n
=
365 364 363 362 361 1 365! ⋅ ⋅ ⋅ ⋅ = 5⋅ 365 365 365 365 365 365 360!
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
20
Esercizi di: Statistica e Calcolo delle Probabilità 3.7
Un contratto stipulato da una ditta di pulizie prevede una penale qualora il livello di soddisfazione del cliente risulti minore del 95%. La squadra di pulizie è composta da due addetti. La probabilità che l'addetto A svolga un lavoro soddisfacente è pari a 0.90. La probabilità che l'addetto B svolga un lavoro soddisfacente è pari a 0.80. Qual è la probabilità che la squadra svolga un lavoro soddisfacente per il cliente? Pagherà o meno la penale? (i) Risolvere il problema nell'ipotesi d'indipendenza stocastica. (ii) Gli addetti erano stati soggetti a controllo in 100 casi con i risultati riportati nella seguente tavola (dalla quale sono stati ricavati i valori di probabilità riportati precedentemente nel testo). Risolvere il problema sulla base delle osservazioni effettuate e verificare l'ipotesi in (i). A
A
B
B
77 3 80
13 7 20
90 10 100
Soluzione: Risposta ( i )
L'evento a cui siamo interessati "la squadra svolge un lavoro soddisfacente per il cliente" si realizza nei seguenti casi: o solo l'operaio A svolge un lavoro soddisfacente ( A ∩ B ) o solo l'operaio B svolge un lavoro soddisfacente ( B ∩ A ) o entrambi gli operai svolgono un lavoro soddisfacente. ( A ∩ B ) . In termini di eventi siamo interessati ad ( A ∪ B ) . La probabilità dell'unione di due eventi A e B è: P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) , (1) che per l'ipotesi di indipendenza stocastica diventa: P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ) ⋅ P (B ) = 0.98 in questa ipotesi la ditta non incorre nella penale. Risposta (ii)
Dai rilievi effettuati è possibile ricavare direttamente la probabilità associata all'evento A ∩ B , per cui risulta: P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = 0.90 + 0.80 − 0.77 = 0.93 in questo caso la ditta incorrerebbe nella penale. Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
21
Esercizi di: Statistica e Calcolo delle Probabilità
E' facile verificare, data la validità delle seguenti disuguaglianze, che non è valida l'ipotesi d'indipendenza stocastica: P( A ∩ B) ≠ P ( A) ⋅ P ( B); P( A | B) ≠ P( A); P( B | A) ≠ P( B) 0.77 0.77 ≠ 0.90; ≠ 0.80 0.77 ≠ 0.90 ⋅ 0.80; 0.80 0.90
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
22
Esercizi di: Statistica e Calcolo delle Probabilità 3.8
In un'industria farmaceutica è stato messo a punto un test per la diagnosi di gravidanza precoce. Avendo definito gli eventi nel modo seguente: D={la diagnosi è di gravidanza}, G={la donna è in gravidanza}. É stato verificato che P( D|G)=0.98; P( D | G )=0.95. É noto che P(G)=0.01. Quanto vale la P(G |D)? Soluzione P (G D ) =
=
P ( D G ) ⋅ P (G ) P ( D G ) ⋅ P (G ) + P D G
(
) ⋅ P (G )
=
0.98 ⋅ 0.01 ≅ 0.165 0.98 ⋅ 0.01 + (1 − 0.95) ⋅ 0.99
Nota
Si osservi che la probabilità che la donna sia in gravidanza passa dal valore 0.01 a circa 0.16 dopo il test, che pur essendo una probabilità ancora non soddisfacente per un test è ben 16 volte più grande di quella relativa allo stato di conoscenze prima del test. In questo caso la sola applicazione reiterata del test può portare ad un valore soddisfacentemente elevato della probabilità di nostro interesse.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
23
Esercizi di: Statistica e Calcolo delle Probabilità 3.9
Supposto P( D|G)=P( D | G )= x e P(G |D) sia eguale a 0.999?
P( G )=0.99,
quale valore deve assumere x perché
Soluzione
0.999 =
x ⋅ P ( G ) x ⋅ P ( G ) + (1 − x ) ⋅ P ( G )
,
ossia: 0.999 =
x ⋅ 0.01 x ⋅ 0.01 + (1 − x ) ⋅ 0.99
da cui si ricava: 0.98901 = 0.99999 x = 0.98902
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
24
Esercizi di: Statistica e Calcolo delle Probabilità 3.10
Una famiglia possiede due televisori, uno a colori ed uno in bianco e nero. Sia A l'evento “il televisore a colori è acceso” e B l’evento “il televisore in bianco e nero è acceso”. Poste P( A)=0.4, P( B)=0.3 e P( A∪ B)=0.5, si trovi la probabilità degli eventi: (a) entrambi sono accesi, (b) il televisore a colori è acceso e l'altro è spento, (c) un solo televisore è acceso, (d) nessuno dei televisori è acceso. Soluzione Risposta (a)
Sono assegnate P ( A ∪ B ) , P ( A) e P ( B ) e si vuole calcolare P ( A ∩ B ) . Dalla relazione P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) si ricava l’espressione: P ( A ∩ B ) = P ( A) + P ( B ) − P ( A ∪ B ) da questa, sostituendo i dati disponibili, si ottiene P ( A ∩ B ) = 0.4 + 0.3 − 0.5 = = 0.2 Risposta (b)
Bisogna calcolare P ( A ∩ B ) . Partendo da: P ( A ) = P ⎡⎣( A ∩ B ) ∪ ( A ∩ B ) ⎤⎦ = P ( A ∩ B ) + P ( A ∩ B ) si ricava: P ( A ∩ B ) = P ( A ) − P ( A ∩ B ) = 0.4 − 0.2 =
= 0.2 Risposta (c)
Bisogna calcolare: P ⎡⎣( A ∩ B ) ∪ ( A ∩ B ) ⎤⎦ = P ( A ∩ B ) + P ( A ∩ B ) .
Partendo da: P ( A ∪ B ) = P ⎡⎣( A ∩ B ) ∪ ( A ∩ B ) ∪ ( A ∩ B ) ⎤⎦ =
= P( A ∩ B) + P( A ∩ B) + P( A ∩ B) si ricava: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
25
Esercizi di: Statistica e Calcolo delle Probabilità P ( A ∩ B ) + P ( A ∩ B ) = P ( A ∪ B ) − P ( A ∩ B ) = 0.5 − 0.2 =
= 0.3 Risposta (d)
Bisogna calcolare: P ⎡⎣( A ∩ B ) ⎤⎦ = P A ∪ B
(
).
Partendo da: P ⎡( A ∪ B ) ∪ A ∪ B
⎣
(
)⎤⎦ = P ( A ∪ B ) + P ( A ∪ B ) = 1
si ricava: P( A ∩ B) = P A ∪ B
(
) = 1 − P ( A ∪ B ) = 1 − 0.5 = 0.5
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
26
Esercizi di: Statistica e Calcolo delle Probabilità 3.11
Un lotto contiene 14 articoli: 10 buoni, 4 difettosi. Supposto di estrarre a caso (senza reimmissione) 3 articoli dal lotto, si calcoli la probabilità che esattamente 2 di essi siano buoni. Soluzione
Indicati rispettivamente con Bi e Di (con i=1,2,3) gli eventi: “alla i-esima estrazione è stato estratto un articolo buono” e “alla i-esima estrazione è stato estratto un articolo difettoso”, si può osservare che l’evento “esattamente 2 fra i 3 articoli selezionati siano buoni” si realizza se si ottiene una delle seguenti sequenze di risultati: 1. D1 ∩ B2 ∩ B3 , 2. B1 ∩ D2 ∩ B3 , 3. B1 ∩ B2 ∩ D3 . Pertanto si può scrivere: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) =
= P ⎡⎣( D ∩ B2 ∩ B3 ) ∪ ( B ∩ D2 ∩ B3 ) ∪ ( B ∩ B2 ∩ D3 )⎤⎦ 1
1
1
relazione che (per la incompatibilità degli eventi 1-3) si può riscrivere come: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) =
= P ( D ∩ B2 ∩ B3 ) + P ( B ∩ D2 ∩ B3 ) + P ( B ∩ B2 ∩ D3 ). 1
1
1
Calcolate le probabilità: 4 10 9 4 ⋅ 9 ⋅ 10 ⋅ ⋅ = P ( D1 ∩ B2 ∩ B3 ) = 14 13 12 12 ⋅ 13 ⋅ 14 10 4 9 4 ⋅ 9 ⋅ 10 ⋅ ⋅ = P ( B1 ∩ D2 ∩ B3 ) = 14 13 12 12 ⋅ 13 ⋅ 14 10 9 4 4 ⋅ 9 ⋅ 10 P ( B1 ∩ B2 ∩ D3 ) = ⋅ ⋅ = 14 13 12 12 ⋅ 13 ⋅ 14 sostituendo, si ottiene: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) = 4 ⋅ 9 ⋅ 10 4 ⋅ 9 ⋅ 10 4 ⋅ 9 ⋅ 10 4 ⋅ 9 ⋅ 10 = + + = 3⋅ = 12 ⋅ 13 ⋅ 14 12 ⋅ 13 ⋅ 14 12 ⋅ 13 ⋅ 14 12 ⋅ 13⋅ 14 90 = = 0.49 182
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
27
Esercizi di: Statistica e Calcolo delle Probabilità Soluzione alternativa: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) =
⎛ 4 ⎞⎛ 10 ⎞ 4! 10! ⎜ 1 ⎟⎜ 2 ⎟ 1!( 4 − 1)! 2!( 10 − 2) ! 4! 10! 4 ⋅ 10 ⋅ 9 2 ⋅10 ⋅ 9 2 = = ⎝ ⎠⎝ ⎠ = = 3! 2!8! = = 14! 14! 14 ⋅ 13 ⋅ 12 14 ⎛ ⎞ 14 ⋅ 13 ⋅ 2 ⎜3⎟ 3!(14 − 3)! 3!11! 3⋅ 2 ⎝ ⎠ = 90 = 0.49 182
Nota
Indicato con: nF il numero di eventi favorevoli (pari al numero di modi diversi in cui è possibile formare con i 14 articoli disponibili gruppi da 3 articoli di cui 2 buoni ed 1 difettoso), e con N il numero di eventi possibili (numero di modi diversi in cui è possibile formare con i 14 articoli disponibili gruppi da 3, comunque costituiti) la formula usata si ottiene dividendo nF per N . È importante osservare che i differenti N gruppi di 3 articoli considerati sono incompatibili ed hanno tutti la stessa probabilità di essere selezionati (tali condizioni devono essere necessariamente soddisfatte se si vuole calcolare la probabilità come nF N ). Il numero di eventi favorevoli, nF , si ottiene moltiplicando il numero di modi in cui (a prescindere dall’ordine di estrazione) è possibile selezionare 1 articolo difettoso da ⎛ 4⎞ un gruppo di 4 articoli difettosi, pari a ⎜ ⎟ (combinazioni di classe 1 di 4 elementi), ⎝ 1⎠ per il numero di modi in cui è possibile estrarre i rimanenti 2 articoli (buoni) da un ⎛10 ⎞ gruppo di 10 articoli (buoni) ⎜ ⎟ : ⎝2⎠ ⎛ 4 ⎞⎛ 10 ⎞ nF = ⎜ ⎟⎜ ⎟ . ⎝ 1 ⎠⎝ 2 ⎠ N (numero di casi possibili) si ottiene considerando indistinguibili gli articoli e conteggiando (come prima) il numero, totale, di gruppi di dimensione 3 che è ⎛14 ⎞ possibile formare con 14 articoli: N = ⎜ ⎟ . ⎝3⎠
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
28
Esercizi di: Statistica e Calcolo delle Probabilità 3.12
Un’indagine condotta tra le famiglie italiane che possiedono due automobili ha permesso di accertare che: • nel 70% dei casi l’automobile più vecchia è di fabbricazione italiana. • nel 50% dei casi l’automobile più nuova è di fabbricazione italiana. • nel 40% dei casi entrambe le automobili sono di fabbricazione italiana. Scelta a caso una famiglia tra quelle che sono state considerate per svolgere l’indagine, si calcolino le seguenti probabilità: P( B |A), P( A |B), P ( A B ) e P( A∩ B|almeno un’automobile è di fabbricazione italiana). Dove con A si è indicato l’evento {l’automobile più vecchia è di fabbricazione italiana} e con B l’evento {l’automobile più nuova è di fabbricazione italiana}. Soluzione P ( B A) = P( A B) =
P( A B) =
P( A ∩ B) P ( A) P ( A ∩ B) P( B) P( A ∩ B) P( B)
=
0.4 = 0.57 0.7
=
0.4 = 0.8 0.5
=
P A∪ B
(
P( B)
) = 1 − P ( A ∪ B) = 1 − P ( B)
1 − ⎡⎣ P ( A) + P ( B ) − P ( A ∩ B )⎤⎦ 1 − ( 0.7 + 0.5 − 0.4 ) = = 1 − P ( B) 0.5 0.2 = = 0.4 0.5
=
P( A ∩ B
almeno un'automobile è di fabbricazione italiana ) =
= P( A ∩ B A ∪ B) = =
P ⎡⎣( A ∩ B ) ∩ ( A ∪ B )⎤⎦ P( A ∪ B)
=
P( A ∩ B) P( A ∪ B)
=
0.4 0.4 = = 0.5 0.7 + 0.5 − 0.4 0.8 Nota ( A ∪ B ) = ( A ∩ B ) ∪ ( A ∩ B ) ∪ ( A ∩ B )
con:
( A ∩ B ) ∩ ( A ∩ B ) = ( A ∩ B ) ∩ ( A ∩ B ) = ( A ∩ B ) ∪ ( A ∩ B ) = ∅ da questo si deduce che: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
29
Esercizi di: Statistica e Calcolo delle Probabilità
( A ∪ B ) ∩ ( A ∩ B ) = = ⎡⎣( A ∩ B ) ∪ ( A ∩ B ) ∪ ( A ∩ B )⎤⎦ ∩ ( A ∩ B ) =
= ⎡⎣( A ∩ B ) ∩ ( A ∩ B )⎤⎦ ∪ ⎡⎣( A ∩ B ) ∩ ( A ∩ B )⎤⎦ ∪ ⎡⎣( A ∩ B ) ∩ ( A ∩ B )⎤⎦ = = ∅ ∪ ∅ ∪ ( A ∩ B ) = = ( A ∩ B )
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
30
Esercizi di: Statistica e Calcolo delle Probabilità 3.13
In una grande città, il 70 % dei conducenti d’auto ha più di 25 anni ed il 12% di essi infrangerà il codice della strada durante il prossimo mese. I conducenti d’auto con al più 25 anni rappresentano il 30% di tutti i conducenti d’auto ed il 28% di essi infrangerà il codice della strada durante il prossimo mese. 1. Calcolare la probabilità che un conducente d’auto commetta un’infrazione durante il prossimo mese. 2. Se ci informano che un conducente d’auto infrangerà il codice nel corso del prossimo mese, come valutiamo la probabilità che abbia più di 25 anni? Soluzione
Indicati con: I l’evento “il conducente dell’auto commette un’infrazione durante il prossimo mese” e con M l’evento “il conducente dell’auto ha più di 25 anni”. dal testo si ricavano le seguenti informazioni:
( ) = 0.3 , P ( I M ) = 0.12 , P ( I M ) = 0.28 .
P ( M ) = 0.7 , P M
Risposta (1)
Dobbiamo calcolare P ( I ) , per farlo usiamo il teorema delle probabilità totali:
(
P( I ) = P( I M ) ⋅ P(M ) + P I M
) ⋅ P ( M ) =
= 0.12 ⋅ 0.7 + 0.28 ⋅ 0.3 = 0.168 Risposta (2)
Dobbiamo calcolare P ( M I ) , per farlo usiamo il teorema di Bayes: P ( M I ) =
=
P( I M ) ⋅ P(M )
(
P( I M ) ⋅ P(M ) + P I M
=
) ⋅ P( M )
0.12 ⋅ 0.7 = 0.168
0.84 = 0.5 0.168
Nota
Gli eventi M e M rappresentano una partizione dello spazio campione (tale condizione deve necessariamente essere verificata sia se si vuole utilizzare il teorema delle probabilità totali che se si vuole utilizzare il teorema di Bayes).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
31
Esercizi di: Statistica e Calcolo delle Probabilità 3.14
L’urna A contiene 7 biglie rosse e 3 biglie nere. L’urna B contiene 10 biglie rosse e 10 biglie nere. Si lancia un dado regolare a 6 facce. Se si ottiene un risultato maggiore o uguale a 2 si estrae una biglia dall’urna A in caso contrario si estrae una biglia dall’urna B. Calcolare la probabilità di estrarre una biglia nera. Soluzione
Indicati con: A l’evento “la biglia viene estratta dall’urna A” B l’evento “la biglia viene estratta dall’urna B” N l’evento “la biglia estratta è nera” Utilizzando il teorema delle probabilità totali (quasi sempre utile quando si devono trattare esperimenti che, come in questo caso, sono realizzati in più stadi),si può scrivere: P ( N ) = P ( N A ) ⋅ P ( A) + P ( N B ) ⋅ P ( B ) con: 5 1 P ( A) = P ( esce un numero ≥ 2 ) = , P ( B ) = P ( esce 1) = , 6 6 3 10 , P ( N A) = , P ( N B ) = 10 20 Utilizzando questi dati si calcola: 3 5 10 1 1 1 4 1 ⋅ + ⋅ = + = = = 0.33 . P ( N ) = 10 6 20 6 4 12 12 3
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
32
Esercizi di: Statistica e Calcolo delle Probabilità 3.15
Un mazzo di carte napoletane (40 carte) viene ben mescolato e poi diviso in due mazzetti rispettivamente da 10 carte e 30 carte. Il primo dei 2 viene disposto nella posizione A il secondo nella posizione B. Dovendo estrarre a caso una carta da uno di questi mazzetti ed avendo come obiettivo l’estrazione del 10 di denari, da quale dei 2 mazzetti operereste l’estrazione? Si effettui la scelta puntando a massimizzare la probabilità di successo. Soluzione
Indichiamo con: D l’evento “la carta estratta è il dieci di denari”. Supponiamo di estrarre la carta dal mazzetto in A. Non sapendo, con certezza, se il dieci di denari è in A o in B, per calcolare P ( D ) dobbiamo procedere come segue: P ( D ) = P ⎡⎣ D il 10 è in A ⎤⎦ ⋅ P (10 in A )
+
+ P ⎡⎣ D il 10 non è in A ⎤⎦ ⋅ P [il 10 non è in A] = = P ⎡⎣ D il 10 è in A ⎤⎦ ⋅ P ( il 10 è in A ) = = 1 ⋅ 10 = 1
10 40 40 dove naturalmente P ⎡⎣ D il 10 non è in A⎤⎦ = 0 perché non si può estrarre il 10 dal mazzetto in A se il 10 non è in A. Analogamente, se ipotizziamo di estrarre la carta dal mazzetto in B otteniamo: P ( D ) = P ⎡⎣ D il 10 è in B ⎤⎦ ⋅ P ( il 10 è in B ) +
+ P ⎡⎣ D il 10 non è in B ⎤⎦ ⋅ P [il 10 non è in B] = = P ⎡⎣ D il 10 è in B ⎤⎦ ⋅ P ( il 10 è in B ) = 1 30 1 ⋅ = 30 40 40 Si vede che la probabilità di successo non dipende dalla scelta che dobbiamo effettuare.
=
Nota
La probabilità ottenuta è esattamente pari a quella di pescare il 10 di denari estraendo a caso una carta da un mazzo di 40 carte napoletane!
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
33
Esercizi di: Statistica e Calcolo delle Probabilità 3.16
Un mazzo di carte napoletane (40 carte) viene ben mescolato e poi diviso in due mazzetti da 20 carte. Questi mazzetti vengono disposti uno nella posizione A ed uno nella posizione B. Dopo aver compiuto tale operazione, da un mazzo di carte francesi (52 carte, anch’esse preventivamente ben mescolate) viene estratta a caso una carta. Se la carta estratta è di cuori si procede all’estrazione (ancora a caso) di una carta dal mazzetto di 20 carte napoletane disposto nella posizione A. In caso contrario si estrae una carta dal mazzetto disposto nella posizione B. Calcolare la probabilità che in questa seconda estrazione si ottenga il dieci di denari. Soluzione
Simbologia
indica l’evento “la carta viene estratta dal mazzetto in A” indica l’evento “la carta viene estratta dal mazzetto in B” indica l’evento “viene estratto il 10 di denari) Si vuole calcolare P ( D ) Utilizzando il teorema delle probabilità totali si può scrivere: P ( D ) = P ( D A) ⋅ P ( A) + P ( D B ) ⋅ P ( B ) pertanto, dedotto dal testo che: 13 P ( A) = P ( estrarre una carta di cuori ) = , 52 13 39 = . P ( B ) = P ( A ) = 1 − P ( A) = 1 − 52 52 Per ricavare il risultato richiesto non resta che calcolare le probabilità condizionate P ( D A) e P ( D B ) . Analogamente a quanto fatto nell’esercizio 3.15 calcoliamo: 1 20 1 20 ⋅ , P ( D B) = ⋅ P ( D A) = 20 40 20 40 quindi, sostituendo, otteniamo: 1 13 1 39 1 ⎛ 13 39 ⎞ 1 ⋅ + ⋅ = ⋅ + = : P( D) = 40 52 40 52 40 ⎜⎝ 52 52 ⎟⎠ 40 A B D
nota
nella espressione 1 20 ⋅ P ( D A) = 20 40 Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
34
Esercizi di: Statistica e Calcolo delle Probabilità
1 è la probabilità che si verifichi l’evento D estraendo da A dato che il 10 di denari 20 20 è in A, mentre è la probabilità che il 10 di denari sia effettivamente in A. 40
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
35
Esercizi di: Statistica e Calcolo delle Probabilità 3.17
Le probabilità che due allievi, A e B, vengano bocciati sono pari rispettivamente a 0.35 e 0.7. Si supponga che questi due eventi siano s-indipendenti. Calcolare: 1. la probabilità che sia A sia B vengano bocciati; 2. la probabilità che almeno uno venga bocciato; 3. la probabilità che uno solo venga bocciato; 4. la probabilità che un solo allievo venga bocciato, dato che almeno uno viene bocciato. Soluzione Risposta 1 P ( A ∩ B ) = 0.35 ⋅ 0.70 = 0.24 Risposta 2 P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) = 0.35 + 0.70 − 0.24 = 0.80
o, in alternativa: P ( A ∪ B ) = 1 − P ( A ∪ B ) = 1 − P ( A ∩ B ) = 1 − (1 − 0.35) ⋅ (1 − 0.70 ) =
= 1 − 0.65 ⋅ 0.3 = 0.80 Risposta 3 P ( A ∩ B ) + P ( A ∩ B ) = P ( A ∪ B ) − P ( A ∩ B ) = 0.80 − 0.24 = 0.56 o, in alternativa:
P ( A ∩ B ) + P ( A ∩ B ) = P ( A) ⋅ P ( B ) + P ( A ) ⋅ P ( B ) =
= 0.35 ⋅ 0.3 + 0.65 ⋅ 0.7 = 0.56 Risposta 4 P ⎡⎣( A ∩ B ) ∪ ( A ∩ B ) ( A ∪ B ) ⎤⎦ =
=
P ⎡⎣( A ∩ B ) ∪ ( A ∩ B ) ⎤⎦ P ( A ∪ B)
=
P
{⎡⎣( A ∩ B ) ∪ ( A ∩ B )⎤⎦ ∩ ( A ∪ B )} = P ( A ∪ B)
P ( A ∩ B) + P( A ∩ B ) P( A ∪ B)
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
= 0.56 = 0.69 0.8
36
Esercizi di: Statistica e Calcolo delle Probabilità
4.
4.1
Variabili aleatorie
(PARZEN)
Siano assegnate le seguenti probabilità: P( X =0)=0.10, P( X =1)=P( X =-1)=0.15, P( X =2)=P( X =-2)=0.30. (i) Verificare se si tratta di una funzione massa di probabilità ed, eventualmente, calcolare: (ii) P( X ≤1); (iii) P( X >1); (iv) P(-1< X ≤1); (v) P( X ≤1). Soluzione
(i) Avendo definito P( X
S
= { x1, x2 ,..., xk } = {−2, −1,0,1,2} , si tratta di verificare che risulti:
= xi ) ≥ 0 ∀i = 1,.., k ,
P(S ) =
k
∑ P ( X = x ) = 1: i =1
i
Per la prima condizione la verifica è immediata. Per la seconda si calcola: P( X =-2)+P( X =-1)+P( X =0)+ P( X =1)+P( X =2)=0.30+0.15+0.10+0.15+0.30=1 (i) 0.70. (ii) 0.30. (iii) 0.25. (iv) 0.40.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
37
Esercizi di: Statistica e Calcolo delle Probabilità 4.2
(PARZEN)
Data la funzione F ( x ) = x 2 4 per 0< x≤2, verificare se si tratta di una “funzione ripartizione” e ricavare la funzione densità di probabilità corrispondente. Soluzione
Occorre verificare che la funzione assegnata soddisfi le proprietà della funzione ripartizione nell'estremo inferiore e nell'estremo superiore dell'intervallo in cui assume valori la v.a. (supporto). 02 22 F ( 0 ) = = 0 ; F ( 2 ) = = 1 . 4 4 Bisogna inoltre verificare che F ( x ) per 0< x≤2 sia non decrescente ⇔ derivata non negativa per 0< x≤2. Anche questa condizione è verificata, infatti risulta: dF ( x ) x f ( x ) = = >0 ∀0< x≤ 2 dx 2
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
38
Esercizi di: Statistica e Calcolo delle Probabilità 4.3
Un servizio di vendita per corrispondenza dispone di quattro linee telefoniche. Sia X il numero di linee in uso in un dato momento. Supponendo che la pmf della X , p( x)=P( X = x), è data da: p(0)=0.1; p(1)=0.15; p(2)=0.3; p(3)=0.25; p(4)=0.2. Calcolare: 1. P(esattamente 2 linee siano in uso); 2. P(almeno 2 linee siano in uso); 3. P(tra 2 e 4 linee (estremi compresi) siano in uso). 4. Trovare e rappresentare graficamente la funzione ripartizione, F ( x)=P( X ≤x). 5. Calcolare il valore atteso, E( X ), e la varianza, Var( X ), della v.a. X . Soluzione Risposta 1 P(esattamente 2 linee siano in uso)=P ( X = 2 ) = 0.3 Risposta 2 P(almeno 2 linee siano in uso) = P ( X
4
≥ 2) = ∑ P ( X = x ) = x = 2
= P ( X = 2 ) + P ( X = 3) + P ( X = 4 ) = = 0.3 + 0.25 + 0.2 = 0.75 Risposta 3 P (tra 2 e 4 linee siano in uso) = P ( 2 ≤ X
4
≤ 4) = ∑ P ( X = x ) = x = 2
= P ( X = 2 ) + P ( X = 3) + P ( X = 4 ) = = 0.3 + 0.25 + 0.2 = 0.75 Risposta 4
La variabile X è una v.a. discreta che ha modalità 0,1,2,3,4. In corrispondenza di tali modalità la sua funzione ripartizione F ( x ) assume i valori riportati in tabella: x 0 1 2 3 4 F ( x) 0.1 0.25 0.55 0.80 1 Questi valori possono essere ottenuti sfruttando la formula generale ( N.B. X è una v.a. discreta): F ( x ) = P ( X ≤ x) = P ( X = xi )
∑
i:xi ≤ x
che per nel caso in esame produce le seguenti relazioni: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
39
Esercizi di: Statistica e Calcolo delle Probabilità F ( 0 ) = P ( X = 0 ) , F (1) = P ( X
= 0 ) + P ( X = 1) = F ( 0 ) + P ( X = 1) , F ( 2 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) = F (1) + P ( X = 2 ) , F ( 3) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) + P ( X = 3) = = F ( 2 ) + P ( X = 3) , F ( 4) = P ( X
= 0 ) + P ( X = 1) + P ( X = 2) + P ( X = 3) + P ( X = 4 ) = = F ( 3) + P ( X = 4 ) ,
Infine, ricordando che nel caso di v.a. discrete, la funzione ripartizione è una funzione a gradini si conclude che F ( x ) assume valore 0 nell’intervallo ( −∞,0 ) , aperto a sinistra e aperto a destra, valore 0.1 nell’intervallo [0,1) , chiuso a sinistra e aperto a destra, valore 0.25 nell’intervallo [1,2 ) , valore 0.55 nell’intervallo [ 2,3 ) , valore 0.80 nell’intervallo [3,4 ) e valore 1 nell’intervallo, [ 4, ∞ ) . Il grafico della funzione ripartizione è pertanto il seguente:
F (x)
-1
1 0.8 0.6 0.4 0.2 0
0
1
2
3
4
5
x
Risposta 5 E ( X ) =
4
∑ x ⋅ P ( X = x) =
x =0
= 0 ⋅ P ( X = 0 ) + 1 ⋅ P ( X = 0 ) + 2 ⋅ P ( X = 2 ) + + 3 ⋅ P ( X = 3) + 4 ⋅ P ( X = 4 ) = = 0 ⋅ 0.1 + 1 ⋅ 0.15 + 2 ⋅ 0.3 + 3 ⋅ 0.25 + 4 ⋅ 0.2 = = 2.3
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
40
Esercizi di: Statistica e Calcolo delle Probabilità Var ( X ) =
4
∑ ⎡⎣ x − E ( X )⎤⎦ ⋅ P ( X = x ) = E ( X 2 ) − E ( X )2 = 2
x = 0
4 ⎡ = ⎢∑ x 2 ⋅ P ( X = x )⎤⎥ − E ( X )2 = ⎣ x=0 ⎦ = 02 ⋅ P ( X = 0 ) + 1 2 ⋅ P ( X = 0 ) + 2 2 ⋅ P ( X = 2 ) + 32 ⋅ P ( X = 3) + + 42 ⋅ P ( X = 4 ) − 2.32 = = 02 ⋅ 0.1 + 12 ⋅ 0.15 + 22 ⋅ 0.3 + 32 ⋅ 0.25 + 42 ⋅ 0.2 − 2.32 = = 1.51
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
41
Esercizi di: Statistica e Calcolo delle Probabilità 4.4
Una compagnia di assicurazioni offre ai suoi assicurati un certo numero di opzioni differenti di pagamento del premio. Per un assicurato selezionato a caso, sia X il numero di mesi fra i pagamenti successivi. La cdf della variabile X è definita come segue:
⎧ 0 ⎪0.30 ⎪ ⎪0.40 F ( x) = ⎨ ⎪0.45 ⎪0.60 ⎪ ⎪⎩ 1 1. 2.
x < 1
1 ≤ x < 3 3 ≤ x < 4 4 ≤ x < 6 6 ≤ x < 12 x ≥ 12
Qual è la pmf della variabile X ? Calcolare P(3≤ X ≤6) e P( X ≥4) usando la cdf .
Soluzione Risposta 1
Dal testo si ricava: F ( x1 ) = F (1) = 0.30 F ( x2 ) = F ( 3) = 0.40 F ( x3 ) = F ( 4 ) = 0.45 F ( x4 ) = F ( 6 ) = 0.60 F ( x5 ) = F (12 ) = 1
F ( x)
1 0.9 0.7 0.5 0.4 0.2 0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
x
Grafico della funzione ripartizione
Assunto convenzionalmente F ( x0 ) = 0 , per calcolare la funzione massa di probabilità si può utilizzare la seguente relazione: p ( xi ) = P ( X = xi ) = F ( xi ) − F ( xi−1 ) . Utilizzando i dati assegnati si ottiene:
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
42
Esercizi di: Statistica e Calcolo delle Probabilità
i
xi
p ( xi )
1 2 3 4 5
1 3 4 6 12
0.3 0.1 0.05 0.15 0.4
p( x)
0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 11 12
x
Grafico della funzione massa di probabilità Risposta 2 P(3 ≤ X ≤ 6) = P ( x2
≤ X ≤ x4 ) = F ( x 4 ) − F ( x1 ) = = F ( 6 ) − F (1) = 0.6 − 0.3 = = 0.3 P ( X ≥ 4 ) = P ( X ≥ x3 ) = p ( x3 ) + p ( x4 ) + p ( x5 ) = = 1- ⎡⎣ p ( x1 ) + p ( x2 )⎤⎦ = 1 − F ( x2 ) = 1- F (3) = = 1 − 0.45 = = 0.55 Nota 1 5
∑ p ( x ) = p ( x ) + p ( x ) + p ( x ) + p ( x ) + p ( x ) = 1 i =1
i
1
2
3
4
5
F ( x2 ) = p ( x1 ) + p ( x2 )
1 − F ( x2 ) = ⎡⎣ p ( x1 ) + p ( x2 ) + p ( x3 ) + p ( x4 ) + p ( x5 )⎤⎦ − ⎡⎣ p ( x1 ) + p ( x 2 )⎤⎦ =
= p ( x3 ) + p ( x4 ) + p ( x5 ) Nota 2 F ( 6 ) = F ( x4 ) =
4
∑ p ( x ) =p ( x ) + p ( x ) + p (x ) + p (x ) = i =1
i
1
2
3
4
= p (1) + p ( 3) + p ( 4) + p ( 6 ) F ( 3) = F ( x2 ) =
2
∑ p ( x ) =p ( x ) + p ( x ) = i =1
i
1
2
= p (1) + p ( 3)
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
43
Esercizi di: Statistica e Calcolo delle Probabilità F ( 6 ) − F ( 3) =
4
2
∑ p( x ) − ∑ p(x ) = i =1
i
i
i =1
= ⎡⎣ p ( x1 ) + p ( x2 ) + p ( x3 ) + p ( x4 )⎤⎦ − ⎡⎣ p (1) + p (3)⎤⎦ = 4
= p ( 4 ) + p ( 6 ) = ∑ p ( xi ) = i =3
= P ( x3 ≤ X ≤ x4 ) = P ( 4 ≤ X ≤ 6 ) Nota 3 La v.a, X,
numero di mesi fra i pagamenti successivi è una v.a. discreta, risulta
pertanto: P ( 3 < X ≤ 6 ) = P ( 4 ≤ X ≤ 6 ) = P ( 3 < X < 12 ) = P ( 4 ≤ = F ( 6 ) − F ( 3)
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
X
< 12 ) =
44
Esercizi di: Statistica e Calcolo delle Probabilità
5.
Modelli di variabili aleatorie
5.1
Le prove d’esame per entrare in un college americano sono svolte da migliaia di studenti ogni anno e misurano due indici: SAT ed ACT. Le due variabile punteggio conseguito agli esami sono ben approssimate da v.c. Normali. Negli ultimi anni, per il punteggio SAT è stata stimata una media di 480 con una deviazione standard di 100; per il punteggio ACT è stata stimata una media di 18 con una deviazione standard di 6. 1. Una scuola di economia fissa pari 550 il punteggio SAT minimo per l’ammissione dei nuovi studenti. Quale percentuale di studenti avrà un punteggio maggiore di 550? 2. Quale punteggio minimo deve essere fissato per il test ACT per avere una pari percentuale di ammessi? 3. Qual è la probabilità che uno studente ammesso sulla base del test SAT abbia ottenuto più di 700? Soluzione Premessa
Indichiamo con X il punteggio SAT: 2 X ∼ N ( µ X , σ X ) = N ( 480,1002 ) con Y il punteggio ACT Y ∼ N ( µY , σ T 2 ) = N (18,62 ) : e con Z la v.a. normale standard: Z ∼ N ( 0,1) Risposta (I) P( X
⎛ X − µ x 550 − µ x ⎞ ⎛ 550 − µ x ⎞ ⎛ Z > 550 − 480 ⎞= > 550 ) = P ⎜ > = > = P Z P ⎟ ⎜ ⎟ ⎜ σx σ x 100 ⎟⎠ ⎝ σ x ⎠ ⎝ ⎠ ⎝ = P ( Z > 0.7 ) = 1 − F Z ( 0.7 ) = 1 − 0.758 = = 0.242
Si può prevedere una percentuale di promossi pari al 24.5%. Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
45
Esercizi di: Statistica e Calcolo delle Probabilità Risposta (II)
Vogliamo individuare il valore di y tale che: P (Y > y ) = 0.242 ⇔ P (Y ≤ y ) = 1 − 0.242 = 0.758 Quello che cerchiamo è quindi il percentile di ordine 75.8 della v.a. Y. Partendo dalla relazione:
⎛ Y − µY y0.758 − µ Y ⎞ ≤ ⎟= σ σ ⎝ Y ⎠ Y ⎛ y − µ ⎞ = P ⎜ Z ≤ 0.758 Y ⎟ = P ( Z ≤ z0.758 ) σ Y ⎝ ⎠
0.758 = P (Y ≤ y0.758 ) = P ⎜
si deduce che vale la seguente equazione: y0.758 −
σ Y
Y
= z0.758 ⇒ y0.758 =
Y
+ z0.758 ⋅ σ Y
che note: z0.758 = 0.7, µY = 18, σ Y = 6 Permette di calcolare: y0.758 = 18 + 0.7 ⋅ 6 = 22.2 Risposta (III)
IL testo richiede che si calcoli la seguente probabilità condizionata: P ( X > 700 X > 550 ) Effettuando i passaggi si ottiene: P ( X > 700 ∩ X > 550 ) P ( X > 700 ) = P ( X > 700 X > 550 ) = P ( X > 550 ) P ( X > 550 ) Da cui essendo: ⎛ X − µ X 700 − µ X ⎞ ⎛ 700 − µ X ⎞ P ( X > 700 ) = P ⎜ P Z ⎟= > = > ⎟ ⎜
⎝
σ X
σX
⎠
⎝
σ X
⎠
⎛ 700 − µ X ⎞ ⎛ 700 − 480 ⎞ = 1 − F 2.2 = F = 1 − F Z ⎜ = 1 − ) Z ⎜ Z ( ⎟ ⎟ σ 100 ⎝ ⎠ ⎝ ⎠ X = 0.014 e P ( X > 550 ) = 0.242 (risposta I) Si ottiene: P ( X > 700 ) 0.014 P ( X > 700 X > 550 ) = = = 0.057 P ( X > 550 ) 0.242 Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
46
Esercizi di: Statistica e Calcolo delle Probabilità Nota
Detto A l’evento { X > 700} e B l’evento { X > 550} si ha: “A implica B” ⇔ “ A ⊆ B ” ⇔ “ A ∩ B = A ”:
S
A
B
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
47
Esercizi di: Statistica e Calcolo delle Probabilità 5.2
Si valuti la probabilità di fare 13 al totocalcio giocando una sola colonna, Si valuti: i) la probabilità di fare (esattamente) 12 punti. ii) la probabilità di fare almeno 12 punti. Soluzione Premessa
Ipotizzeremo che i segni nella colonna vengano scelti: 1. in maniera casuale 2. indipendentemente dai pronostici effettuati per le altre partite presenti in schedina. Ne consegue che la probabilità di indovinare il risultato della generica partita presente in 1 schedina è pari ad (ipotesi 1). 3 In relazione alla i-esima partita possiamo pertanto definire la v.a. Bernoulliana ⎛ 1⎞ X i ∼ B ⎜1, ⎟ che assume valore 1 nel caso di pronostico corretto e valore 0 nel caso di ⎝ 3⎠ pronostico errato. 1 1 2 In altri termini la v.a. X i è tale che P ( X i = 1) = , P ( X i = 0 ) = 1 − = (qualunque sia 3 3 3 i=1,2,…,13 , ovvero per ognuna delle 13 partite). Possiamo definire inoltre la v.a.
13
Y
= ∑ X i che stante le ipotesi 1 e 2 risulta essere la i =1
somma di v.a. bernoulliane indipendenti ed identicamente distribuite (le bernoulliane hanno lo stesso parametro). 1 Si deduce pertanto che Y ∼ B ⎛⎜13, ⎞⎟ . ⎝ 3⎠ Si osservi che per come sono state definite le X i la v.a. Y conta i punti fatti nella colonna (numero di pronostici esatti) Nota 1 P (Y
⎛ n⎞ = y ) = ⎜ ⎟ p y ⋅ (1 − p )n− y ⎝ y ⎠
Risposta (i) 12 ⎛ 13 ⎞ ⎛ 1 ⎞12 ⎛ 1 ⎞13−12 13! 1⎞ 2 2 ⎛ P (Y = 12 ) = ⎜ ⎟ ⎜ ⎟ ⎜ 1 − ⎟ = = 13 12!(13 − 12 )!⎜⎝ 3 ⎟⎠ 3 313 ⎝12 ⎠ ⎝ 3 ⎠ ⎝ 3 ⎠
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
48
Esercizi di: Statistica e Calcolo delle Probabilità Risposta (ii)
L’evento fare almeno 12 punti si verifica se si fanno 12 o 13 punti. Si tratta pertanto di calcolare: P ⎡⎣(Y = 12 ) ∪ (Y = 13 )⎤⎦ = P (Y = 12 ) + P (Y = 13 ) =
⎛13 ⎞ ⎛ 1 ⎞ y ⎛ 1 ⎞13− y = ∑ ⎜ ⎟ ⎜ ⎟ ⎜1 − ⎟ 3⎠ y =12 ⎝ y ⎠ ⎝ 3 ⎠ ⎝ 13
ciò premesso, essendo ⎛13 ⎞ ⎛ 1 ⎞13 ⎛ 1 ⎞13−13 1 = 13 , P ( Y = 13 ) = ⎜ ⎟ ⎜ ⎟ ⎜1 − ⎟ 3 ⎝13 ⎠ ⎝ 3 ⎠ ⎝ 3 ⎠ vista anche la risposta i, si ricava che: 2 1 27 P ⎡⎣(Y = 12 ) ∪ (Y = 13) ⎤⎦ = 13 13 + 13 = 13 3 3 3 Nota 2
In virtù della incompatibilità degli eventi (Y = 12 ) e (Y = 13) si ha: P ⎡⎣(Y = 12 ) ∪ ( Y = 13) ⎤⎦ = P (Y = 12 ) + P ( Y = 13) . La incompatibilità ⎡⎣(Y = 12 ) ∩ (Y = 13) = ∅ ⎤⎦ si può diagnosticare osservando che con una singola colonna non è possibile che risultino “contemporaneamente” veri i due eventi {si sono fatti esattamente 12 punti}e {si sono fatti esattamente 13 punti}.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
49
Esercizi di: Statistica e Calcolo delle Probabilità 5.3
Tra tutti coloro che bevono il caffè prima di andare a letto, il 30% non riesce a dormire nella notte. Quindici persone sono scelte a caso e sono costrette a bere caffè. 1. Qual è la probabilità che almeno undici di loro riescano a dormire tutta la notte? 2. Qual è la probabilità che fra tre e sette di loro (estremi inclusi) riescano a dormire tutta la notte? 3. Qual è la probabilità che nessuno di loro riesca a dormire tutta la notte? 4. Quanti prevedete che dormiranno tutta la notte? Qual è la varianza del loro numero? Soluzione Premessa
Sotto ipotesi non eccessivamente restrittive (si veda la nota), si può assumere che la v.a., X, che conta il numero di persone (tra le 15 selezionate) che riesce a dormire nella notte si distribuisce come una Binomiale, X ∼ B ( n, p ) , di parametri n=15, p=0.7: ⎛ n ⎞ x ⎛ 15 ⎞ x n− x 15− x P ( X = x ) = ⎜ ⎟ p (1 − p ) = ⎜ ⎟ 0.7 (1 − 0.7 )
⎝ x ⎠
⎝ x⎠
Risposta 1 P ( X ≥ 11) =
⎛15 ⎞ x 15− x − = 0.51 0.7 1 0.7 ( ) ∑ ⎜ x ⎟ x =11 ⎝ ⎠ 15
Risposta 2 P ( 3 ≤ X ≤ 7 ) =
⎛15 ⎞ x 15− x ∑ ⎜ x ⎟ 0.7 (1 − 0.7 ) = 0.05 x =3 ⎝ ⎠ 7
Risposta 3
⎛15 ⎞ 0 15−0 0.7 1 − 0.7 = 0.5 ⋅ 10−7 ( ) ⎟ ⎝0⎠
P ( X = 0 ) = ⎜ Risposta 4
Noto che per una v.a. binomiale valgono i seguenti risultati: E ( X ) =
⎛ n ⎞ x n− x x ⋅ ⎜ ⎟ p (1 − p ) x =0 ⎝ x ⎠ n
∑
Var ( X ) =
= n⋅ p
2 ⎛ n ⎞ x n− x x E X p p − ⋅ − = n ⋅ p ⋅ (1 − p ) 1 ⎡ ⎤ ( ) ( ) ∑ ⎣ ⎦ ⎜ x ⎟ x = 0 ⎝ ⎠ n
posto n=15 e p=0.7 si ricava: E ( X ) = n ⋅ p = 15 ⋅ 0.7 = 10.5 Var ( X ) = n ⋅ p ⋅ (1 − p ) = 15 ⋅ 0.7 ⋅ 0.3 = 3.15
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
50
Esercizi di: Statistica e Calcolo delle Probabilità Nota
Ad ognuna delle 15 persone selezionate si può associare una v.a., (Yi , i = 1, 2,...,15) , che assume valore 1 se l’individuo in questione “riesce a dormire nella notte” e valore 0 in caso contrario. Poiché le 15 persone considerate sono scelte a caso da una popolazione in cui vi è una percentuale pari al 70% di individui che “riesce a dormire nella notte” ( N.B. il testo dice che il 30% non riesce), le Y i possono essere considerate v.a. bernoulliane ⎡⎣ B (1, p ) ⎤⎦ di uguale parametro, p=0.7. Supposto inoltre che i 15 individui siano stati estratti da una popolazione di dimensione estremamente grande (rispetto alla dimensione del campione, n=15) le Y i possono essere considerate anche (approssimativamente) s-indipendenti. Ne risulta che: 15
X
= ∑ Y i , i =0
In quanto somma di v.a. bernoulliane indipendenti ed identicamente distribuite, è una binomlale ⎡⎣ B ( n, p )⎤⎦ di parametri n=15 e p=0.7.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
51
Esercizi di: Statistica e Calcolo delle Probabilità 5.4
Tra i viaggiatori che passano attraverso un rivelatore di metallo dell'aeroporto una percentuale pari a 0.1% lo attiva, facendo suonare l’allarme. Detto X il numero di persone che attivano il rivelatore in un gruppo di 500 selezionate a caso: 1. qual è una buona approssimazione della pmf della variabile X ? 2. calcolare P( X =2) (in maniera approssimata). 3. calcolare P( X ≥2) (in maniera approssimata). Soluzione Risposta 1
La variabile aleatoria X, sotto ipotesi non eccessivamente restrittive (si veda l’esercizio precedente), può essere considerata distribuirsi come una Binomiale, X ∼ B ( n, p ) , di parametri n=500, p=0.001: ⎛ n ⎞ x ⎛ 500 ⎞ n− x 500− x x P ( X = x ) = ⎜ ⎟ p (1 − p ) = ⎜ − 0.001 1 0.001 . ( ) ⎟
⎝ x ⎠
⎝
x
⎠
Una buona approssimazione di tale v.a. per n grande e p piccolo si ottiene considerando la seguente v.a. di Poisson, X ∼ P ( n ⋅ p ) :
(n ⋅ p) ( 500 ⋅ 0.001) P( X = x) = exp ( −n ⋅ p ) = exp ( −500 ⋅ 0.001) = x! x! x ( 0.5) = exp ( −0.5) . x! x
x
Risposta 2 2
( 0.5 ) P ( X = 2 ) = exp ( −0.5) = 0.076. 2! Risposta 3 ∞
x
x
1 ( 0.5) ( 0.5) P ( X ≥ 2 ) = ∑ exp ( −0.5) = 1 − ∑ exp ( −0.5) = 0.910. x x ! ! x = 2 x =0
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
52
Esercizi di: Statistica e Calcolo delle Probabilità 5.5
Un dispositivo riparabile e "continuamente" sorvegliato è caratterizzato da una frequenza di guasto media pari a 0.001 guasti/ora. Si valuti la probabilità di dover effettuare 2 riparazioni in 10 ore di funzionamento effettivo. Soluzione
Indicati con X i guasti registrarti in 10 ore Possiamo calcolare: x 2 ( λ t ) − λ t ( 0.001 ⋅ 10 ) −0.00110 0.012 −0.01 ⋅ P ( X = 2 ) = e = e = e = x! 2! 2 = 4.9 ⋅ 10−5
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
53
Esercizi di: Statistica e Calcolo delle Probabilità 5.6
Un dispositivo riparabile sorvegliato periodicamente (un controllo ogni 2 ore) caratterizzato da una frequenza di guasto media pari a 0.001 guasti/ora. i) Si valuti la probabilità di dover effettuare y=2 riparazioni in 10 ore di funzionamento effettivo. ii) Si valuti la probabilità di dover effettuare un numero y di riparazioni comprese tra 2 e 4 riparazioni (estremi inclusi: 2 ≤ Y ≤ 4 ) in 6 ore di funzionamento effettivo. Soluzione Premessa
Se il dispositivo è sorvegliato periodicamente (un controllo ogni due ore) in ogni singolo intervallo di due ore si può registrare al più un guasto. Infatti l’eventuale guasto sarebbe rilevato solo in occasione della operazione periodica di controllo. Risposta (i) Indicati con X i
i guasti registrarti nella i-esima missione di 2 ore (i=1,2,..,5) Possiamo calcolare: 0 ( λ t ) − λ t −0.001⋅2 −0.002 P ( X i = 0 ) = =e = e =e 0! = 0.998 P ( X i = 1) = 1 − P ( X i = 0 ) = = 1 − 0.998 = 0.002 La singola X i è quindi una v.a. Bernoulliana di parametro p=0.002. Assunta l’indipendenza delle X i si deduce che la variabile che conta i guasti: Binomiale di parametri n = 5 e p = 0.002 : Y ∼ B ( 5,0.002 ) . con: ⎛ 5⎞ 5− y y P (Y = y ) = ⎜ ⎟ 0.002 ⋅ (1 − 0.002 ) .
5
Y
= ∑ X i è i =1
⎝ y ⎠
Si può pertanto calcolare: ⎛ 5⎞ 5! 5− 2 P (Y = 2 ) = ⎜ ⎟ 0.0022 ⋅ (1 − 0.002 ) = 0.0022 ⋅ 0.9983 = 2!( 5 − 2 ) ! ⎝ 2⎠
= 3.976 ⋅ 10−5 Risposta (ii)
In questo caso gli intervalli sono solo 3 (6 ore divise in 3 intervalli da 2). La variabile Y che conta i guasti sarà pertanto ancora Binomiale di parametri n = 3 e p = 0.002 . Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
54
Esercizi di: Statistica e Calcolo delle Probabilità Y ∼ B ( 3,0.002) .
Con: P (Y
⎛ 3⎞ = y ) = ⎜ ⎟ 0.002 y ⋅ (1 − 0.002)3− y . ⎝ y ⎠
Vogliamo calcolare la probabilità: P ( 2 ≤ Y ≤ 4 ) = P (Y = 2) + P (Y = 3 ) + P ( Y = 4) = 4
= ∑ P (Y = y ) y = 2
Ma per la nostra Binomiale risulta non più di 3 guasti in 3 intervalli). P(2 ≤ Y
P ( X = 4 ) = 0
(non più di un guasto per intervallo ⇔ 3
≤ 4 ) = P ( 2 ≤ Y ≤ 3) = (Y = 2 ) + P (Y = 3) = ∑ P (Y = y ) = y = 2
3 ⎛ 3 ⎞ y ⎛ 3⎞ 3− y = ∑ ⎜ ⎟ p (1 − p ) = ∑ ⎜ ⎟0.002 y (1 − 0.998)3− y = y = 2 ⎝ y ⎠ y =2 ⎝ y ⎠ 3
=
3! 3! 3− 2 3− 3 0.0022 ⋅ (1 − 0.002) + 0.0023 ⋅ (1 − 0.002) = 2!( 3 − 2 )! 3!( 3 − 3)!
= 3 ⋅ 0.0022 ⋅ 0.998 + 0.0023 = 1.1976 ⋅ 10−5 + 8.0000 ⋅ 10−9 = 1.1984⋅ 10−5
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
55
Esercizi di: Statistica e Calcolo delle Probabilità 5.7
Il direttore di un ristorante specializzato in piatti di pesce vuole determinare quante aragoste vive deve aver a disposizione ogni giorno per soddisfare le richieste della propria clientela. Assumendo che il numero, X , di aragoste richieste sia una v.a. di Poisson e sapendo che i clienti ordinano in media sette aragoste al giorno determinare: 1. la probabilità che avendo a disposizione nove aragoste il ristoratore non riesca a far fronte alle richieste della giornata, 2. il numero (minimo) di aragoste che il ristoratore deve avere a disposizione ogni giorno per garantirsi una probabilità pari almeno a 0.95 di soddisfare tutte le richieste Soluzione Risposta 1
Bisogna calcolare la probabilità che il numero, X , di aragoste richieste sia superiore a 9: P( X
∞
9
x =10
x =0
> 9) = ∑ P ( X = x ) = 1 − ∑ P ( X = x )
con: P( X
= x) =
µ x x!
exp ( − ) e
= E ( X ) = 7 .
Sostituendo si ottiene: ∞
9
9
7x P ( X > 9 ) = exp ( − µ ) = 1 − exp ( − µ ) =1 − exp ( −7 ) = x =10 x ! x =0 x ! x =0 x ! ⎡ 70 ⎤ 71 79 = 1 − ⎢ exp ( −7 ) + exp ( −7 ) + ... + exp ( −7 )⎥ = 1! 9! ⎣ 0! ⎦ = 1 − 0.0009 + 0.0064 + ... + 0.1015 = 1 − 0.830 = = 0.170
∑
µ x
∑
µ x
∑
Risposta 2
Vogliamo determinate il più piccolo valore di x (indichiamolo con x′ ) che soddisfa la relazione: P ( X ≤ x′ ) ≥ 0.95 (il valore cercato costituisce, per definizione, il 95-esimo percentile, x0.95 , della v.a. X ). La ricerca viene fatta per tentativi. Osservato che calcolando la probabilità P ( X ≤ x ) con x=9,10,11 e 12, rispettivamente, risulta: 9 x 7 P ( X ≤ 9 ) = F X (9 ) = exp ( −7 ) = x =0 x ! = 0.830 < 0.95
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
56
Esercizi di: Statistica e Calcolo delle Probabilità 9 7 x 7x 710 P ( X ≤ 10 ) = F X (10 ) = exp ( −7 ) = exp ( − 7) + exp ( − 7) = 10! x =0 x ! x=0 x! = 0.830 + 0.071 = 0.901 < 0.95 11 x 10 7 7x 711 P ( X ≤ 11) = F X (11) = exp ( −7 ) = exp ( −7 ) + exp ( −7 ) = 11! x = 0 x ! x =0 x ! = 0.901 + 0.045 = 0.947 < 0.95 12 x 11 x 7 7 712 P ( X ≤ 12 ) = F X (12 ) = exp ( −7 ) = exp ( − 7) + exp ( − 7) = 12! x =0 x ! x=0 x! = 0.947 + 0.026 = 0.973 > 0.95 si evince che il valore cercato, x′ ( x0.95 ) , è pari a 12. 10
∑
∑
∑
∑
∑
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
57
Esercizi di: Statistica e Calcolo delle Probabilità 5.8
Riprendendo l’esempio precedente supponiamo che il direttore intendesse utilizzare un’unica vasca per far fronte alle esigenze di due ristoranti. Assumendo che X ed Y, numero di aragoste richieste in un giorno rispettivamente nel primo e nel secondo ristorante, siano v.a. di Poisson s-indipendenti e sapendo che nel primo ristorante i clienti ordinano in media sette aragoste al giorno mentre nel secondo ne ordinano in media 5 determinare la probabilità che avendo a disposizione 15 aragoste il ristoratore non riesca a far fronte alle richieste della giornata. Soluzione
Bisogna calcolare la probabilità che il numero, Z = X +Y , di aragoste complessivamente richieste in una giornata sia superiore a 15. La variabile Z come somma di v.a. Poisson s-indipendenti è ancora una v.a. di Poisson di media pari alla somma delle medie di X e Y . Possiamo pertanto scrivere: z
⎡ E ( Z )⎤⎦ P(Z = z) = ⎣ z !
⎡ E ( X ) + E (Y )⎤⎦ − E ( Z ) e =⎣ z!
z
e
− ⎡⎣ E ( X )+ E( Y )⎤⎦
=
( 7 + 5 ) −(7+5) 12 z −12 e = = e z ! z! e quindi calcolare: z
P ( Z > 15 ) =
∞
µ
15
z
∑ z! exp ( −µ ) = 1 − ∑
x =16
z =0
15
12 z exp ( − µ ) =1 − exp ( −12) = z! z ! x =0 z
µ
∑
= 1 − 0.844 = = 0.156. Nota
Se in entrambi i ristoranti il numero medio di aragoste richieste fosse stato pari a 7 mettendo da parte 9+9=18 aragoste si sarebbe ottenuto: z ( 7 + 7 ) −(7+7 ) 14 z −14 P(Z = z) = e = e , z ! z! 18 14 z −14 P ( Z > 18 ) = 1 − e = 1 − 0.883 = 0.117 . 0 z ! Da tale risultato si evince che l’utilizzo di un “magazzino centralizzato” (a meno degli ovvi costi/problemi logistici) offre rilevanti vantaggi. Infatti, sempre nell’ipotesi di s-indipendenza delle v.a. X ed Y , la probabilità di riuscire a soddisfare tutte le richieste nel caso in cui le scorte siano gestite separatamente (9 aragoste nel primo ristorante e 9 nel secondo, per un totale di 18 aragoste), risulta pari a:
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
58
Esercizi di: Statistica e Calcolo delle Probabilità P ⎡⎣( X
≤ 9 ) ∩ (Y ≤ 9 )⎤⎦ = 9
9 7 x 7y P ( X ≤ 9 ) ⋅ P (Y ≤ 9 ) = exp ( −7 ) ⋅ exp ( −7 ) = x y ! ! x =0 y =0
∑
∑
= ( 0.830 )2 = 0.689 laddove la probabilità di soddisfare tutte le richieste (con le stesse 18 aragoste) nel caso di “magazzino centralizzato” è pari a: P ( Z ≤ 18) = 1 − P ( Z > 18 ) = 1 − 0.117 = 0.883 .
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
59
Esercizi di: Statistica e Calcolo delle Probabilità 5.9
Il servizio assistenza clienti di una grande azienda evade le richieste di intervento in un tempo, T, che si distribuisce come una variabile aleatoria esponenziale di media 5h: FT ( t ) = 1 − e
−
t
5
t > 0.
Avendo appena inoltrato una richiesta di intervento siamo interessati a calcolare: 1. la probabilità che la nostra richiesta venga evasa nelle prossime 3 ore? 2. la probabilità che la nostra richiesta venga evasa nelle prossime in un tempo compreso tra 3 e 5 ore. 3. Verificare infine che la media di T è pari a 5 e calcolare la sua varianza Soluzione Risposta (1) P (T
3 < 3) = F ( 3) = 1 − exp ⎛⎜ − ⎞⎟ = 0.45 ⎝ 5⎠
Risposta (2) P (3 < T
5
≤ 5 ) = ∫3
fT ( t )dt
5
= ∫0
fT ( t )dt −
∫
3
0
f T (t )dt
= FT (5 ) − FT (3 ) =
5 3 = ⎡⎢1 − exp ⎛⎜ − ⎞⎟ ⎤⎥ − ⎡⎢1 − exp ⎛⎜ − ⎞⎟ ⎤⎥ = 0.63 − 0.45 = ⎝ 5 ⎠⎦ ⎣ ⎝ 5 ⎠⎦ ⎣ = 0.18 Media e varianza di T E (T ) =
∫
∞
0
t ⋅ fT ( t ) dt =
∫
∞
0
1 − 5t t ⋅ e dt 5
dFT ( t )
1 − 5t = e con fT ( t ) = dt 5 Calcolando l’integrale per parti si ottiene: ∞
∞
t t t t t − ⎤ − ⎤ ∞ − ∞ − ∞1 − ⎡ ⎡ E (T ) = ⎢ −t ⋅ e 5 ⎥ + ∫ e 5 dt = ∫ e 5 dt = 5 ⋅ ∫ e 5 dt = 5 ⎢ − e 5 ⎥ = 0 0 5 ⎣ ⎦0 0 ⎣ ⎦0 = 5 ( −0 + 1) = 5
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
60
Esercizi di: Statistica e Calcolo delle Probabilità V ar (T ) =
∫
∞
0
∞
⎡⎣t − E (T )⎤⎦ ⋅ fT ( t ) dt = ∫0 2
1 − 5t ( t − 5 ) ⋅ e dt = 5 2
t − 1 = 0 (t 2 − 2 ⋅ 5t − 52 ) ⋅ e 5 dt = 5 t t t − ∞ 2 1 − ∞ ∞ 2 1 − 1 = 0 t ⋅ e 5 dt − 0 2 ⋅ 5t ⋅ e 5 dt + 0 5 ⋅ e 5 dt = 5 5 5 t t t ∞ 2 1 − ∞ 1 − 2 ∞ 1 −5 5 5 = 0 t ⋅ e dt − 2 ⋅ 5 ⋅ 0 t ⋅ e dt + 5 0 e dt = 5 5 5 t ∞ 2 1 − = 0 t ⋅ e 5 dt − 2 ⋅ 5 ⋅ E (T ) + 52 ⋅ 1 = 5 t ∞ 2 1 − = 0 t ⋅ e 5 d t − 2 ⋅ 52 + 52 = 5 t ∞ 2 1 − 5 = 0 t ⋅ e dt − 52 5 Integrando per parti si ottiene:
∫
∞
∫
∫
∫
∫
∫
∫
∫ ∫ ∫
∫
∞ 2
0
t
∞
t t − − ∞ ∞ ⎡ 2 − 5t ⎤ 5 5 5 ⋅ e dt = ⎢−t ⋅ e ⎥ + ∫0 2t ⋅ e dt = 2∫0 t ⋅ e ⋅ dt = ⎣ ⎦0 = 2 ⋅ 5 ⋅ E (T ) = 2 ⋅ 52.
−
t
Da cui sostituendo si ricava: t ∞ 2 1 − 5 V ar (T ) = t ⋅ e dt − 5 2 = 2 ⋅ 52 − 52 = 0 5 = 52 = 25.
∫
Nota 1
In generale per una v.a. esponenziale vale la relazione: 2 Var (T ) = ⎡⎣ E (T )⎤⎦ Nota 2
Per calcolare la varianza si poteva anche usare direttamente la relazione: 2
∞ Var (T ) = E (T ) − ⎡⎣ E (T )⎤⎦ = ∫ t ⋅ fT (t )dt − ⎡ ∫ t ⋅ fT ( t )dt ⎤ = ⎢⎣ 0 ⎥⎦ 0 2 t t ∞ 2 1 − ∞ 1 − ⎡ ⎤ = ∫0 t ⋅ e 5 dt − ⎢ ∫0 t ⋅ e 5 dt ⎥ = 2 ⋅ 52 − 52 = 25 5 5 ⎣ ⎦ 2
2
∞ 2
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
61
Esercizi di: Statistica e Calcolo delle Probabilità
6.
Stima puntuale
6.1
Una prova di tenuta effettuata su 915 radiatori d'auto selezionati casualmente da una certa popolazione ha evidenziato la presenza di perdite di liquido refrigerante attraverso le guarnizioni in 127 casi. i) Effettuare una stima puntuale della proporzione, p, di radiatori che presentano lo stesso difetto nell'intera popolazione. ii) Valutare il livello d'incertezza associato a detta stima. iii) Richiamare le eventuali ipotesi su cui è basato il calcolo. Soluzione: Risposta (i) Metodo dei momenti Strategia 1
Possiamo pensare ai risultati dell’esperimento come ad un campione bernoulliano di dimensione n=915. In questo caso indicata con X i la v.c. Bernoulliana: X i ~ B (1, p ) che assume (per l’i-esimo radiatore) valore 1 quando l’i-esimo radiatore perde e valore 0 quando non perde. Risultando: E ( X i ) = p, ∀i = 1,2,...,915 possiamo scrivere: 1 n 1 n xi ; 3 ) pˆ = x = xi . 1) µ1 = p; 2 ) µ ˆ1 = x = n
∑ i =1
n
∑ i =1
si ricava pertanto: 915
n
pˆ =
∑ x ∑ x i =1
i
=
i =1
i
915 n Strategia 2
=
127 = 0.139 . 915
Possiamo pensare ai risultati dell’esperimento come ad un campione casuale di dimensione k =1 estratto da una v.a. Binomiale (per ottenere il valore della v.a. Binomiale Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
62
Esercizi di: Statistica e Calcolo delle Probabilità
contiamo il numero di radiatori che perdono su 915 totali controllati). In questo caso indicata con Y la v.c. Binomiale: Y ~ B ( n, p ) = B ( 915, p ) risultando: E (Y ) = n ⋅ p = 915 ⋅ p possiamo scrivere: 1 k 1 k 1) µ1 = n ⋅ p; 2 ) µ ˆ1 = y = yi ; 3 ) n ⋅ pˆ = y = yi . k
∑
∑
k i =1
i =1
si ricava pertanto: 1 k 1 1 127 127 127 = 127 ⇒ pˆ = = = 0.139 . n ⋅ pˆ = yi = yi = k i =1 1 i =1 1 n 915 Risultato che (come deve essere) coincide con quello ottenuto utilizzando la strategia 1
∑
∑
Nota 915
Y
= ∑ X i i =1
Metodo della massima verosimiglianza Strategia 1 Campione Bernoulliano: Ricordando che X i ∼ B (1, p ) è una particolare Binomiale B ( m, p )
con m=1. Ricaviamo la espressione della funzione massa di probabilità della Bernoulliana partendo dalla formula della Binomiale: m =1 ⎛ m⎞ m ⎛ 1⎞ 1 m− x 1− x 1 − p p ) ⎜ ⎟ ( ⎜ ⎟ p (1 − p ) .
⇒ ⎝ x⎠
⎝ x ⎠
Espressione da cui osservato che le xi possono assumere solo i valori 1 e 0 (le xi sono ⎛ 1 ⎞ ⎛ 1⎞ Bernoulliane) e che ⎜ ⎟ = ⎜ ⎟ = 1 si ottiene: ⎝ 0 ⎠ ⎝ 1⎠ 1− x P ( X = xi ) = p x (1 − p ) . Utilizzando tale espressione della funzione massa di probabilità delle X i ricaviamo: n
L ( p; x ) =
n
∏
x
p
1− x
(1 − p ) = p
∑= x
i
i
1
n
x (1 − p ) ∑=1 , n−
i
i
i =1
ovvero: n n ⎛ ⎞ ⎛ ⎞ l ( p; x ) = ⎜ ∑ xi ⎟ ln ( p ) + ⎜ n − ∑ xi ⎟ ⎡⎣ln (1 − p ) ⎤⎦ , ⎝ i =1 ⎠ ⎝ i =1 ⎠
da cui derivando rispetto a p si ottiene:
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
63
Esercizi di: Statistica e Calcolo delle Probabilità n
dl ⎡⎣l ( p; x ) ⎤⎦
=
∑ x i =1
i
n−
−
n
∑x
i
i =1
, 1− p uguagliando a zero e risolvendo rispetto a p si ottiene lo stimatore cercato: dp
p
k ⎡ ⎤ ˆ ˆ p x p n x 1 − ⋅ − − ( ) x n x − ∑i=1 i ⎢⎣ ∑i=1 i ⎥⎦ ∑i=1 i ∑i=1 i − = =0 pˆ pˆ ⋅ (1 − pˆ ) (1 − pˆ ) n
k
n
Supposto pˆ ≠ 0 e (1 − pˆ ) ≠ 0 k ⎡ ⎤ (1 − pˆ ) ⋅ ∑ xi − pˆ ⎢ n − ∑ xi ⎥ = 0 i =1 ⎣ i =1 ⎦ k
k
k
k
k
∑ x − pˆ ∑ x − npˆ + pˆ ∑ x = 0 ⇔ ∑ x − npˆ = 0 ∑ x 127 i =1
i
i
i =1
i =1
i
i =1
i
n
pˆ =
i =1
i
n
=
915
= 0.139
Strategia 2 Campione Binomiale: Y è una v.a. Binomiale B ( n, p )
con n=915. La funzione massa di probabilità di Y è la seguente:
⎛ n ⎞ y n− y p p . − 1 ( ) ⎜ y ⎟ ⎝ ⎠
Ricaviamo pertanto: L ( p; y ) =
k
∏p
yi
(1 − p )
n − yi
,
y =1
che essendo k =1 si riduce a:
⎛ n ⎞ y n− y L ( p; y ) = ⎜ ⎟ p 1 (1 − p ) 1 ⎝ y1 ⎠
⎛ n⎞ = ⎜ ⎟ p y (1 − p ) n− y ⎝ y ⎠
ovvero
⎛ n⎞ l ( p; x ) = ln ⎜ ⎟ + y ⋅ ln ( p ) − ( n − y ) ⎡⎣ln (1 − p ) ⎤⎦ , ⎝ y ⎠ da cui derivando rispetto a p si ottiene: dl ⎡⎣l ( p; y ) ⎤⎦ y n − y = − , dp p 1− p espressione che posta uguale a zero e risolta rispetto a p fornisce lo stimatore cercato: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
64
Esercizi di: Statistica e Calcolo delle Probabilità
(1 − pˆ ) ⋅ y − pˆ ⋅ [ n − y ] − = =0 pˆ (1 − pˆ ) pˆ ⋅ (1 − pˆ ) che supposto pˆ ≠ 0 e 1 − pˆ ≠ 0 permette di scrivere: (1 − pˆ ) ⋅ y − pˆ [ n − y ] = 0 y − pˆ ⋅ y − n ⋅ pˆ + pˆ ⋅ y = 0 ⇔ y − n ⋅ pˆ = 0 y 127 pˆ = = = 0.139 . n 915 Che ovviamente coincide con il risultato ottenuto utilizzando la strategia 1. y
n− y
Nota
Gli stimatori e le stime fornite dal metodo dei momenti (come spesso capita) coincidono con quelle fornite dal metodi della massima verosimiglianza. Risposta (ii)
L’incertezza di stima può essere valutata calcolando l’errore quadratico medio dello stimatore. Lo stimatore ottenuto è uno stimatori corretto ⎡⎣ E ( Pˆ ) = p ⎤⎦ pertanto l’errore quadratico medio coincide con la sua varianza: p (1 − p ) Var ( Pˆ ) = n
Una stima della varianza dello stimatore si può ottenere sostituendo la stima pˆ ottenuta al valore incognito p. 127 ⎛ 127 ⎞ 1− ⎟ pˆ ⋅ (1 − pˆ ) 915 ⎜⎝ 915 ⎠ = 1.31 ⋅ 10−4 ˆ ( Pˆ ) = Var = n 915 Risposta (iii)
Nel fare i calcoli si è supposto: 1) X i ~ B (1, p ) ∀i = 1,2,...,915 2) le X i sono s-indipendenti (la loro funzione massa di probabilità congiunta è pari al prodotto delle marginali).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
65
Esercizi di: Statistica e Calcolo delle Probabilità 6.2
(ERTO)
Per ognuno dei k =200 giorni di monitoraggio ambientale sono stati selezionati (casualmente) e sottoposti ad analisi n=10 provini di aria. I risultati ottenuti sono riportati nella seguente tabella: Numero di provini inquinati su 0 1 2 3 totale ≥4 dieci ( xi) Frequenze osservate (k i) 133 52 12 3 0 200 Assunto che il numero di provini inquinati su n=10 ha una distribuzione Binomiale di parametro p, si formuli la stima tale parametro utilizzando: (i) Il metodo dei momenti; (ii) Il metodo della massima verosimiglianza. Soluzione Risposta (i) Detta X la v.c. Binomiale: X
~ B ( n, p ) risulta: E ( X ) = n ⋅ p = 10 ⋅ p .
Calcolata: 1 k 1 200 1 3 x = xi = x = i ⋅ k = k i =1 200 i =1 i 200 i =0 i ⋅ + ⋅ + ⋅ + ⋅ = 0 133 1 52 2 12 3 3 = 85 = 0.425 200 200 e posto: x = 0.425 = 10 ⋅ p = n ⋅ p si ricava: x 0.425 X pˆ = = = 0.0425 (N.B. Pˆ = ) n n 10
∑
∑
∑
Risposta (ii)
⎛ n ⎞ x n− x p p = − 1 ( ) ∏ ∏ ⎜ ⎟ i =1 i =1 ⎝ x ⎠ ⎛ k ⎛ n ⎞ x n− x ⎞ l ( p ) = ln ⎡⎣ L ( p ) ⎤⎦ = ln ⎜ ∏ ⎜ ⎟ ⋅ p (1 − p ) ⎟ = ⎝ i=1 ⎝ xi ⎠ ⎠ k ⎡ ⎛n⎞ ⎤ = ∑ ⎢ln ⎜ ⎟ + xi ⋅ ln p + ( n − xi ) ⋅ ln (1 − p )⎥ i =1 ⎣ ⎝ xi ⎠ ⎦
L ( p ) =
k
P( X
xi ) =
k
i
i
da cui derivando rispetto a p si ottiene: k dl ( p ) ⎡ x n − xi ⎤ = ⎢ i− dp 1 − p ⎥⎦ i =1 ⎣ p espressione che posta uguale a zero e risolta rispetto a p fornisce lo stimatore cercato:
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
66
Esercizi di: Statistica e Calcolo delle Probabilità
⎡ xi n − xi ⎤ ∑i=1 ⎢⎣ pˆ − 1 − pˆ ⎥⎦ = 0 ⇒ k
k
⇒
k
k
k
∑ x ∑ ( n − x ) ∑ x ∑ ( n − x ) i =1
i
−
pˆ
i =1
i
1 − pˆ
=
k
k
i =1
i =1
i =1
pˆ
i
−
i =1
i
1 − pˆ
=
= (1 − pˆ ) ⋅ ∑ xi − pˆ ⋅ ∑ ( n − xi ) = k
k
k
i =1
i =1
i =1
= ∑ xi − pˆ ∑ xi − pˆ ⋅ n ⋅ k + pˆ ∑ xi = k
= ∑ xi − pˆ ⋅ n ⋅ k = 0 ⇒ i =1
k
⇒ pˆ ⋅ =
∑ x i =1
i
n⋅k
=
x n
si ottiene pertanto: k
pˆ =
∑ x i =1
i
n⋅k
x
= = n
0.425 10
X (N.B. Pˆ = ) n
Nota
si vede che nel caso in esame gli stimatori ottenuti ai punti (i) e (ii) coincidono.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
67
Esercizi di: Statistica e Calcolo delle Probabilità 6.3
I giovani cetacei appartenenti ad una certa colonia sono colpiti da una malattia cronica. Tenendo sotto controllo un campione di 4 esemplari ammalati alcuni ricercatori registrano la loro morte nei seguenti giorni, conteggiati a partire dal giorno in cui la malattia si era manifestata: 10, 30, 40 58. ipotizzato che la v.c., T, tempo intercorrente tra il manifestarsi della malattia e la morte del generico cetaceo si distribuisca esponenzialmente: (i) ricavare una stima del tempo medio intercorrente tra l’istante in cui i cetacei manifestano la malattia e la loro successiva morte; (ii) stimare la probabilità che per un generico cetaceo ammalato risulti T >50. Soluzione
Premessa x = { x1 , x2 , ⋅⋅⋅, xn } . 1 ⎛ x ⎞ f X ( x ) = exp ⎜ − ⎟
⎝
θ ϑ = E ( X ) .
θ ⎠
Risposta (i) Metodo dei momenti: n ⎧ 1){ 1 = g1 (ϑ ) = ϑ ; 2 ) ⎨ µ ˆ1 = ∑ xi i =1 ⎩ n 4 ⎧ ˆ 3) ⎨ϑ = ∑ xi n = ∑ xi 4 = 34.5 i =1 ⎩ i =1
n;
Massima verosimiglianza:
n ⎛ x ⎞ xi ⎞ 1 1 ∑ ⎛ i =1 i ⎟ L (ϑ ; x ) = ∏ f ( xi ;θ ) = ∏ ⋅ exp ⎜ − ⎟ = n ⋅ exp ⎜ − ⎜ θ ⎟ ⎝ θ⎠ θ i =1 i =1 θ ⎝ ⎠ n
n
l (θ ; x ) = ln ⎡⎣ L (θ ; x )⎤⎦ = −n ⋅ ln (θ ) −
∑
n
xi
i =1
θ
la stima si ottiene risolvendo rispetto a θ si ottiene: n x ∂l (θ ; x ) n i =1 i
∂θ
=− +∑ θ
θ 2
da cui uguagliando a zero si ricava l’equazione:
− ˆ + ∑ˆi =21 i = 0 n
θ
n
x
θ
che (ipotizzato θ ˆ ≠ 0 )
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
68
Esercizi di: Statistica e Calcolo delle Probabilità
si può riscrivere come:
−n + ∑
n
xi
= 0. ˆ θ Da tale equazione si ottiene la stima:
θ ˆ =
∑
n
i =1
xi
i =1
n
.
Nel fare i calcoli si è supposto che θ ˆ fosse diversa da zero, pertanto una eventuale soluzione θ ˆ = 0 dovrà essere considerata non accettabile). Si osservi che anche in questo caso metodo dei momenti e massima verosimiglianza forniscono la medesima soluzione. Risposta(ii)
Osservato che: P (T
> 50 ) = 1 − F T ( 50 ) = 1 − ⎡⎢1 − exp ⎛⎜ − 50 ⎞⎟ ⎤⎥ = exp ⎛⎜ − 50 ⎞⎟ ⎝ θ ⎠⎦ ⎝ θ ⎠ ⎣
il problema richiede che venga effettuata una stima di tale probabilità. Una soluzione al problema si può facilmente ottenere ponendo: ⎛ 50 ⎞ ⎛ 50 ⎞ = 0.235 Pˆ (T > 50 ) = exp ⎜ − ⎟ = exp ⎜ − ⎟ ⎝ θ ˆ ⎠ ⎝ 34.5 ⎠
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
69
Esercizi di: Statistica e Calcolo delle Probabilità 6.4
È stato sottoposto a controllo un campione di 10 individui appartenenti ad una certa comunità che lavora in un ambiente a rischio. L’esame dei rispettivi livelli di azotemia ( X ) ha rilevato i seguenti valori: 41, 23, 39, 48, 21, 28, 20, 24, 40, 46. Noto che la v.c. X ~ N (µ ,σ 2), si effettui la stima di µ , σ 2 e σ utilizzando: (i) il metodo dei momenti; (ii) il metodo della massima verosimiglianza. Soluzione Risposta (i) Metodo dei momenti Detta X la v.c. Normale: X ~ N ( ,σ 2 ) E ( X ) =
risulta:
= µ , Var ( X ) = 2 − µ12 = σ 2 ⇒ µ 2 = σ 2 + µ12 = σ 2 + µ 2 1
si può pertanto scrivere:
⎧ µ ˆ n x n i ⎪⎪ 1 = ∑ ⎧ µ1 = g1 ( µ ,σ ) = µ i =1 1) ⎨ ; 2 ; 2) ⎨ n ⎩ 2 = g1 ( µ ,σ ) = σ + µ ⎪ µ ˆ = x 2 n i ⎪⎩ 2 ∑ i =1 n ⎧ n ⎧ µ ˆ = x n ˆ = ∑ xi n = x ⎧ µ ˆ = x µ ⎪ i ⎪⎪ ∑ i =1 ⎪ n ⎪ ⎪ i =1 2 n 3) ⎨ ⇒ ⇔ ⎨ ⎨ ( xi − x ) ∑ 2 n xi ∑ ⎪σˆ 2 + µ ˆ = ∑ xi2 n ⎪ ⎪ σ ˆ 2 = i=1 2 2 i =1 ⎪⎩ ⎪σ ˆ = ⎪⎩ − x n i =1 n ⎩ Sostituendo i dati si ottengono le stime: ˆ = x µ
n
= ∑ xi
n=
i =1
n
ˆ σ
2
=
∑ ( xi − x ) i =1
n
10
∑ x 10 = 33 ∑( x − x ) i =1
2
i
10
=
i =1
2
i
10
= 106.2
Risposta (ii) Metodo della massima verosimiglianza x = { x1 , x2 ,....., xn }
⎡ 1 ⎛ x − µ ⎞ 2 ⎤ 1 f X ( x ) = exp ⎢ − ⎜ ⎟⎥ σ 2 2π σ ⎝ ⎠ ⎦⎥ ⎣⎢
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
70
Esercizi di: Statistica e Calcolo delle Probabilità L ( µ ,σ ; x ) =
n
∏ i =1
f X ( xi ) =
n
∏ i =1
⎡ 1 x − µ ⎞ 1 exp ⎢ − ⎛⎜ i ⎟ 2π σ ⎢⎣ 2 ⎝ σ ⎠
2
⎤ ⎥= ⎥⎦
n ⎡ 1 n ⎛ xi − µ ⎞2 ⎤ 1 ⎞ ⎛ =⎜ ⎟ ⋅ exp ⎢ − 2 ∑ ⎜⎝ σ ⎟⎠ ⎥ π σ 2 ⎝ ⎠ ⎢⎣ i =1 ⎥⎦
2
1 n ⎛ xi − ⎞ l ( µ , σ ; x ) = ln L ( µ , σ ; x ) = − n ln ( 2π ) − n ln σ − . ⎜ ⎟ 2 i =1 ⎝ σ ⎠ Derivando rispetto ai parametri da stimare si ha:
∑
n
( xi − ) ∂ 2 n ⎛ xi − µ ⎞ −1 ∑ l ( µ ,σ ; x ) = − ∑ ⎜ ⋅ = i =1 2 ⎟ σ ∂µ 2 i =1 ⎝ σ ⎠ σ n ∂ 1 −2 1 n 1 n 2 2 l ( ,σ ; x ) = − n − 3 ⋅ ∑ ( xi − µ ) = − + 3 ∑ ( xi − µ ) σ σ 2 i =1 σ σ i=1 ∂σ Uguagliando a zero le espressioni ottenute e mettendo a sistema si ottiene (quando si uguaglia a zero si introducono i ˆ⋅ per indicare che le soluzioni del sistema sono le stime ricercate): n
∑ ( x − µ ˆ ) i =1
i
ˆ2 σ
=0
1 n − + 3 ( xi − µ ˆ )2 = 0 ˆ i =1 σˆ σ da cui supposto σ ˆ ≠ 0 si può scrivere: n
∑
n
∑ ( x − µ ˆ ) = 0 i =1
i
1
n
−n + 2 ∑ ( xi − µ ˆ )2 = 0 . σ
i =1
Risolvendo la prima si ricava: n
n
∑ ( x − µˆ ) = 0 ⇒ µ ˆ = ∑ x i =1
i
i =1
i
n.
Sostituendo nella seconda si ricava: 1 n 1 n 2 2 2 −n + 2 ( xi − µˆ ) = 0 ⇒ σ ˆ = ( xi − x ) ˆ i =1 σ n i =1 Si vede che gli stimatori, e quindi le stime ottenute, coincidono con quelli fornite dal metodo dei momenti.
∑
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
71
Esercizi di: Statistica e Calcolo delle Probabilità Nota 1 n
∑ ( x − x )
2
i
i =1
=
n
1
n
∑ ( x n
i
i =1
=
1
n
∑ n i =1
=
1
2
2
xi
n
∑ x n i =1
− 2x ⋅
1
n
∑ n i =1
2
i
− 2 xi ⋅ x + x ) = 2
xi ⋅ +
1
n
∑x n
n n
i
i =1
x2
2
−
1
1
n
n
∑ 2x ⋅ x + n ∑ x n i =1
i
2
=
i =1
=
− x2
Nota 2
Sia il metodo dei momenti che quello della massima verosimiglianza forniscono per σ 2 lo stimatore non corretto: n
ˆ σ
2
=
2 X X − ( ) ∑ i =1
i
n
. n
Per ottenere lo stimatore corretto bisogna moltiplicare σ ˆ = 2
n
fattore di correzione
n −1
S
=
n n −1
ˆ σ
2
=
n n −1
⋅
∑ ( X − X ) i =1
i =1
i
n
per il
:
n
2
2 X X − ( ) ∑
i
n
n
2
=
2 X X − ( ) ∑ i =1
i
n −1
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
.
72
Esercizi di: Statistica e Calcolo delle Probabilità 6.5
8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5 Supposto che la v.c. consumo si distribuisca normalmente si stimino la media e varianza della popolazione. Soluzione:
Per stimare i parametri usiamo per la media lo stimatore media campionaria (coincidete sia con lo stimatore ottenuto utilizzando il metodo dei momenti che con quello ottenuto utilizzando il metodo della massima verosimiglianza). Per la varianza utilizziamo invece la varianza campionaria corretta. 63.7 1 n 2 2 µˆ = x = = 8.0; σ ˆ = S = ⋅ ( xi − x )2 = 0.117 . n − 1 i =1 8 Nota Per i passaggi si veda l’esercizio 6.4.
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
73
Esercizi di: Statistica e Calcolo delle Probabilità 6.6
Assegnato un campione casuale di dimensione una stima puntuale del parametro . P( X
= x) =
µ x x!
estratto da una v.a. Poisson effettuare
n
e − µ
Soluzione
x = { x1 , x2 , ⋅⋅⋅, xn } . Metodo dei momenti: Ricordando che E ( X ) =
scriviamo:
n ⎧ 1){ 1 = g1 ( µ ) = µ ; 2 ) ⎨ µ ˆ1 = ∑ xi i =1 ⎩
n;
da cui si ricava:
⎧ µ ˆ n x 3) ⎨ = ∑ i i =1 ⎩
n
Metodo della massima verosimiglianza: n
L ( µ ; x ) =
n
∏
n
P( X
i =1
l ( µ ; x ) = −n ⋅ µ + d d µ
i =1
n
∑
; x ) = −n +
l(
= xi ) = ∏
i =1
xi
µ
xi !
xi ⋅ ln µ + ln
−µ
− µ
n
∑= x
⋅ e = ( e ) ⋅ µ n
1
i =1
i
i
i
1
⋅∏ 1 n
i =1
xi !
∏ x !
n
∑x i =1
i
µ n
n
∑ x
i =1
n
−n + ∑ xi µˆ = 0 ⇒ µ ˆ =
i =1
i
Nota
Si vede che anche in questo caso la soluzione ottenuta, coincide con quella fornita dal metodo dei momenti.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
74
Esercizi di: Statistica e Calcolo delle Probabilità 6.7
Assegnato un campione casuale di dimensione n estratto da una v.a. Weibull impostare il calcolo delle stime di massima verosimiglianza dei parametri del modello (il problema non può essere completamente risolto per via analitica). Soluzione
x = { x1 , x2 , ⋅⋅⋅, xn } . β ⎡ ⎤ x ⎛ β −1 i ⎞ f ( xi ;α , β ) = β ⋅ xi ⋅ exp ⎢ − ⎜ ⎟ ⎥ α ⎢⎣ ⎝ α ⎠ ⎥⎦
β
β ⎡ ⎤ x ⎛ ⎞ β −1 i L (α , β ; x ) = ∏ f ( xi ;α , β ) = ∏ β ⋅ xi ⋅ exp ⎢− ⎜ ⎟ ⎥ = i =1 i =1 α ⎢⎣ ⎝ α ⎠ ⎥⎦ n β ⎤ ⎡ x n β n ∑ = n⋅ β ⋅ ( ∏ i =1 x β i −1 ) ⋅ exp ⎢− i =1β i ⎥ α ⎢⎣ α ⎥⎦ l (α , β ; x ) = ln ⎡⎣ L (α , β ; x )⎤⎦ = n
n
β
x ∑ = n ⋅ ln β − n ⋅ β ⋅ ln α + ( β − 1) ⋅ ∑ ln ( x ) − α n
n
i =1
i =1 β
i
β i
derivando rispetto ad α e β si ottengono le due funzioni: ∂l (α , β ; x ) n ⋅ β n n β n⋅ β − β −1 β
∂α
=−
α
+ β ⋅ α
⋅ ∑ i =1 xi = −
α
+
α
β +1
β ⋅ ln ( xi x ∂l (α , β ; x ) n n ∑ i =1 i = − n ⋅ ln α + ∑ i =1 ln ( xi ) − β α β ∂ β n
⋅ ∑ i =1 xiβ
α )
Uguagliando a zero e risolvendo il sistema di equazioni risultante rispetto ad α ˆ e β ˆ si ricavano le stime desiderate. ˆ n n β n ⋅ βˆ n ⋅ βˆ − βˆ −1 βˆ ˆ − + β ⋅ α ˆ ⋅ i=1 xi = − + β ˆ +1 ⋅ i=1 xiβ ˆ = 0 ˆ α ˆ αˆ α n ˆ β ⋅ ln ( xi α ˆ ) x n n i =1 i − n ⋅ ln α ˆ + i =1 ln ( xi ) − =0 ˆ β ˆ β ˆ α da cui (ipotizzato αˆ , β ˆ ≠ 0 ) si ottiene :
∑
∑
∑
∑
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
75
Esercizi di: Statistica e Calcolo delle Probabilità
−n + ∑
ˆ
n
x β i =1 i ˆ β
ˆ α
=0
ˆ + ∑ i =1 ln ( xi ) − ∑ − n ⋅ ln α ˆ
n
n
ˆ
n
β ⋅ ln ( xi α ˆ ) x i =1 i
ˆ β
ˆ α
β
=0
ovvero: αˆ
ˆ β
=∑
n
βˆ i
x
i =1
n
⎡∑ x ⇔ α ˆ = ⎢ i =1 ⎢⎣ n n
ˆ β i
ˆ + ∑ i =1 ln ( xi ) − ∑ − n ⋅ ln α ˆ
n
n
⎤ ⎥ ⎥⎦
1 ˆ β
ˆ β
n
x i =1 i
⋅ ln ( xi α ˆ )
=0 β ˆ α β ˆ da qui, sostituendo la espressione di α ˆ β restituita dalla I equazione nella II, si ottiene la seguente equazione in forma implicita: n n ˆ βˆ β ˆ α ln ln x x x ( ) ( ) n n i i i i =1 ˆ + i =1 ln ( xi ) − n i =1 n βˆ + n − = n ⋅ ln α n ˆ β ˆ β x x
∑
∑
∑
= ˆ + ∑ i =1 ln ( xi ) − n ∑ n β ˆ β ∑ x n
n
i =1
i =1
i
ˆ
x β ln ( xi ) i =1 i
n
∑
i
∑
i =1
=0
i
ˆ Questa equazione, deve essere risolta per via numerica. Una volta trovato il valore β
ˆ utilizzando la I equazione: che la soddisfa sarà possibile calcolare α
⎡ ∑ xi ˆ = ⎢ i =1 α ⎢⎣ n n
ˆ β
⎤ ⎥ ⎥⎦
1 ˆ β
Nota 1
Facendo i calcoli si è supposto che αˆ e β ˆ fossero diversi da zero, pertanto eventuali soluzioni α ˆ = 0 o β ˆ = 0 dovranno essere considerate non accettabili).
Nota 2 n ∂ ⎛⎜ ∑ i =1 x β i ⎞⎟ ∂ n β = x ( ∑ ∂ β ⎜⎝ α β ⎟⎠ ∂β i =1 i
= ∑ i=1 n
∂ ( x ∂ β i
= ∑ i=1 ( xi n
α β β
α) β
α)
)=
∂ ⎡ n ( xi ∑ i =1 ⎣ ∂β
=∑ i =1
⋅ ln ( xi
n
∂ β ⋅ln( x e ∂β
i
β
α ) α)
⎤= ⎦
=∑ i=1 e β ⋅ln( x α ) ⋅ ln ( xi n
i
α ) =
α )
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
76
Esercizi di: Statistica e Calcolo delle Probabilità
7.
Stima intervallare
7.1
Sulla base di un campione di 9 elementi estratti casualmente da una popolazione con varianza pari a 3 è stata calcolata una media (campionaria) x =10.2. Si calcoli l'intervallo di confidenza della media della popolazione al livello di fiducia 0.95 Soluzione
Un intervallo di confidenza per la media al livello 0.95 è dato da:
⎛ x − z 1− 0.025 ⋅ ⎜ ⎝
σ n
, x + z1−0.025 ⋅
⎞. ⎟ n⎠
σ
Da tale espressione. essendo z1-0.025=z0.975=1.96 si ricava l’intervallo: (9.07, 11.33). Nota
Tale intervallo risulterà esatto se la X è Gaussiana approssimato (teorema del limite centrale) se la X è non Gaussiana.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
77
Esercizi di: Statistica e Calcolo delle Probabilità 7.2
Sono state eseguite con un'opportuna strumentazione 10 rilevazioni di un indice di x2,..., x x10. Utilizzando tale campione si sono calcolati per il livello inquinamento dell'aria x1, x (concentrazione) d'inquinante la media e la deviazione standard: 10
10
= ∑ xi = 10.48 , σ ˆ =
∑ ( xi − x )
2
= 1.36 . 10 9 i =1 Supposto che la X abbia una distribuzione Normale, di parametri µ e σ 2, si calcoli un intervallo di confidenza per µ (livello di confidenza 1-α=0.90). x
i =1
Soluzione
È noto che un intervallo di confidenza al livello 0.90 è dato da: ⎛ x − t ⋅ σˆ , x + t ⋅ σ ˆ ⎞ . 1−0.05 1−0.05 ⎜ ⎟
⎝
n
n⎠
Da tale espressione. essendo t 1-0.05 1-0.05 =t 0.95 0.95=1.83 (t di Student con n-1=9 gradi di libertà) si ricava l’intervallo: (9.69, 11.27).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
78
Esercizi di: Statistica e Calcolo delle Probabilità 7.3
Nelle misurazioni del livello di inquinamento di un motore a combustine interna si vuole essere sufficientemente certi che la differenza tra il valore medio stimato il valore medio vero del carico inquinante non sia maggiore di una certa quantità prefissata. Qual è la dimensione n del campione che si deve utilizzare perché risulti al livello di confidenza 0.99 che l'errore di stima x − non sia superiore a 0.1? Si supponga che la deviazione standard σ sia pari a 0.5. Soluzione
Un intervallo di confidenza per la media al livello 0.99 è dato da:
⎛ ⎝
P ⎜ − z1−0.005 ≤
X − µ
σ
n
⎞ σ ≤ z1−0.005 ⎟ = P ⎛⎜ − z1−0.005 ⋅ ≤ X − µ ≤ z1−0.005 ⋅ n ⎠ ⎝ = P ( X − µ ≤ z1−0.005 ⋅σ n ) = 0.99
⎞= ⎟ n⎠
σ
Da tale espressione. essendo z1-0.005=z0.995=2.576 si ricava l’equazione: z1−0.005 ⋅
σ n
≤ 0.1
con z0.995=2.576 e σ =0.5, =0.5, che risolta rispetto ad n fornisce la soluzione al problema: 2.576 ⋅ 0.5 n ≤ 0.1 ⇒ n ≥ 2.576 ⋅ 0.5 0. 0.1 ⇒
⇒ n ≥ ( 2.576 ⋅ 5)2 ⇒ n = 166
è pari al più piccolo intero che soddisfa la condizione n
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
79
Esercizi di: Statistica e Calcolo delle Probabilità 7.4
8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5 La media e la deviazione standard campionaria risultano (esercizio 6.5): 63.7 1 n = 8.0; σ ˆ = ⋅ ( xi − x )2 = 0.34 x = 8 n − 1 i =1 Si calcoli l'intervallo di confidenza per il consumo medio, µ , di tale modello di autovettura (livello di confidenza 0.95). Si supponga che la v.c. consumo si distribuisca normalmente.
∑
Soluzione
Un intervallo di confidenza al livello 0.95 è dato da: ˆ ⎞ σˆ σ ⎛ x − t ⋅ , + ⋅ x t 1−0.025 1−0.025 ⎜ ⎟.
⎝
n
n⎠
Da tale espressione. essendo t 1-0.025=t 0.975=2.365 (t di Student con n-1=7 gradi di libertà) si ricava l’intervallo: (7.71. 8.28).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
80
Esercizi di: Statistica e Calcolo delle Probabilità 7.5
8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5 Osservato che (da tale campione) risulta un consumo medio (campionario) pari a x = 8.0 , si calcoli l'intervallo di confidenza al livello 0.95 per il consumo medio, µ , di tale modello di autovettura. Si supponga che la v.c. consumo si distribuisca normalmente e che la sua varianza sia pari a σ 2 = 0.118 . Soluzione
Un intervallo di confidenza al livello 0.95 nel caso di varianza, σ 2 , nota è dato da:
⎛ x − z 1− 0.025 ⋅ ⎜ ⎝
σ n
, x + z1−0.025 ⋅
⎞. ⎟ n⎠
σ
Da tale espressione. essendo z1-0.025 =1.96 (Normale Standard). si ricava l’intervallo: (7.76. 8.24). Si noti che in questo esercizio pur avendo usato per x e σ gli stessi valori, 0.8 e 0.34 utilizzati per x e σ ˆ nell’esercizio (7.4) si ottiene per µ un intervallo meno ampio di quello calcolato in quell’esercizio. Questo risultato non è casuale, ma dipende dal fatto che nell’esercizio (7.4), non essendo nota la deviazione standard della popolazione, si è dovuta utilizzare la sua stima σ ˆ . Ciò ha determinato un maggiore stato di incertezza che ci ha costretti ad effettuare una valutazione più cautelativa [la maggiore cautela si concretizza nell’uso, nell’esercizio (7.4), della t di Student invece della Normale Standard usata in questo esercizio].
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
81
Esercizi di: Statistica e Calcolo delle Probabilità 7.6
La misura della capacità di 25 condensatori ceramici dello stesso tipo ha fornito un campione casuale di osservazioni sulla base del quale sono stati ottenuti i seguenti valori di media e deviazione standard campionaria: 1 n ⋅ ( xi − x )2 =845. x = 10953, σ ˆ = n − 1 i =1 Calcolare (i) una stima intervallare della capacità media (ii) una stima intervallare della varianza della popolazione specificando le eventuali ipotesi su cui è basato il calcolo.
∑
Soluzione Ipotesi: I campione casuale estratto da popolazione Normale. II Assumo livello di confidenza pari a 0.95
Risposta (i)
Un intervallo di confidenza per la media al livello 0.95 è dato da: ˆ ⎞ σˆ σ ⎛ x − t ⋅ + ⋅ , x t 1−0.025 1−0.025 ⎜ ⎟.
⎝
n
n⎠
Da tale espressione. essendo t 1-0.025=t 0.975=2.064 (t di Student con n-1=24 gradi di libertà) si ricava l’intervallo: (10597, 11309). Risposta (ii)
( n − 1)
ˆ2 σ σ
2
2
∼ χ n−1
⎡ 2 ⎤ ˆ2 σ P ⎢ χα 2 ≤ ( n − 1) 2 ≤ χ12−α 2 ⎥ = 1 − α σ ⎣ ⎦ ⎡ ˆ2 ⎤ σˆ 2 σ 2 P ⎢( n − 1) 2 ≤ σ ≤ ( n − 1) 2 ⎥ = 1 − α χ χ α 2 ⎥⎦ ⎢⎣ 1−α 2 l1 ( x ) = ( n − 1)
ˆ2 σ χ 12−α 2
l2 ( x ) = ( n − 1)
ˆ2 σ χ α 2 2
8452 = 24 ⋅ = 435336 ≅ 6602 39.36
8452 = 24 ⋅ = 1381856 ≅ 11762 12.40
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
82
Esercizi di: Statistica e Calcolo delle Probabilità 7.7
Per valutare la preparazione di uno studente gli somministriamo un questionario costituito da 40 domande, ognuna delle quali prevede tre possibili risposte (chiuse). Avendo lo studente risposto esattamente a 28 domande si calcoli l'intervallo di confidenza al livello 0.95 della probabilità p di rispondere esattamente alla generica domanda (parametro che può essere interpretato come il livello di preparazione dello studente).
Soluzione
Un intervallo di confidenza approssimato per il parametro p al livello 0.95 è dato da:
⎛ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎞ , pˆ + z1−0.025 ⋅ ⎜⎜ pˆ − z1−0.025 ⋅ ⎟⎟ n n ⎝ ⎠ da tale relazione, essendo: 28 z1−0.025 = z0.975 = 1.96 e pˆ = = 0.7 40 si ricava per p l’intervallo: (0.56, 0.84).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
83
Esercizi di: Statistica e Calcolo delle Probabilità 7.8
Una prova di tenuta effettuata su 915 radiatori d'auto selezionati casualmente da una certa popolazione ha evidenziato la presenza di perdite di liquido refrigerante attraverso le guarnizioni in 127 casi. Effettuare una stima intervallare della proporzione ( p) di radiatori che presentano lo stesso difetto nell'intera popolazione al livello di confidenza 0.95. Soluzione
⎛ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎞ , pˆ + z1−0.025 ⋅ ⎜⎜ pˆ − z1−0.025 ⋅ ⎟⎟ n n ⎝ ⎠ z1−0.025
= z0.975 = 1.96 e pˆ = 127 = 0.139
915 l’intervallo richiesto è il seguente: (0.116, 0.161).
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
84
Esercizi di: Statistica e Calcolo delle Probabilità 7.9
Su 150 lanci di una moneta si è ottenuto 35 volte testa. Si formuli un intervallo di confidenza, al livello 0.95, del parametro p=P(testa). Soluzione
⎛ pˆ (1 − pˆ ) pˆ (1 − pˆ ) ⎞ , pˆ + z1−0.025 ⋅ ⎜⎜ pˆ − z1−0.025 ⋅ ⎟⎟ n n ⎝ ⎠ 35 = 0.23 150 l’intervallo richiesto è il seguente: (0.16, 0.30).
z1−0.025
= z0.975 = 1.96 e pˆ =
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
85
Esercizi di: Statistica e Calcolo delle Probabilità
8.
Test di ipotesi
8.1
Una società di consulenza promette ad un pastificio che con il proprio intervento può far crescere la produzione giornaliera di più di 20kg. Per dimostrare la efficacia del proprio approccio tale società mostra i risultati (certificati) ottenuti in 60 casi aziendali seguiti in precedenza. nei quali l'incremento di produzione era risultato in media pari a 22kg. Il proprietario del pastificio vuole sapere se è possibile ritenere che le promesse fatte dai consulenti saranno mantenute. Noto che la deviazione standard σ è pari ad 8kg e posto α =0.05, quale test gli consigliereste di effettuare? (i) Si specifichino ipotesi nulla e ipotesi alternativa (ii) si definisca la regione critica (iii) Si calcoli il rischio di seconda specie nell’ipotesi che l’intervento produca un incremento della produzione media di 23 kg. (iv) si specifichi la decisione che bisogna prendere sulla base dei dati disponibili. Soluzione Risposta (i) H0: µ 0=20 contro H1: µ 1>20. Risposta (ii)
La statistica test è: H 0 ⎛ 82 ⎞ ⎛ 82 ⎞ X ∼ N ⎜ µ , ⎟ ⇒ X ∼ N ⎜ 20, ⎟ . ⎝ n⎠ ⎝ 60 ⎠ Dato che l'ipotesi alternativa è unidirezionale a destra (H 1: del tipo: R.C.: x >c. Con c tale che: P ( X ≤ c ) = 1 − α ⇒ P ( X > c ) = α .
1>20)
la regione critica è
Osservato che: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
86
Esercizi di: Statistica e Calcolo delle Probabilità P( X
⎛ −µ c−µ ⎞ ⎛ c − µ ⎞ > c ) = P ⎜ X > = > P Z ⎟ = α , ⎟ ⎜ ⎝ σ n σ n ⎠ ⎝ σ n ⎠
fissato α =0.05, si deduce che perché sia soddisfatta la condizione: P( X
deve risultare:
c − 20
8 60
> c ) = α
= z1−0.05 = 1.645
da cui si ricava: c = 20 + 1.645 ⋅ 8
60 = 21.70 .
Risposta (iii)
⎛ X − µ1 c − µ 1 ⎞ µ = µ 1 ⎟ = ≤ c µ = µ1 ) = P ⎜ ≤ ⎝ σ n σ n ⎠ ⎛ ⎛ c − µ 1 ⎞ c − µ1 ⎞ = ⎜ Z ≤ = Φ ⎟ ⎜ ⎟ σ σ n n ⎝ ⎠ ⎝ ⎠ Da tale relazione, posto c = 21.70 , µ 1 = 23 , n = 60 e σ = 8 si ottiene: ⎛ 21.7 − 23 ⎞ β ( µ 1 = 23) = Φ ⎜ ⎟ = Φ ( −1.25) = 0.10 ⎝ 8 60 ⎠ β ( µ1 ) = P ( X
Risposta (iv)
Decisione: x = 22 > c = 21.70 ⇔ x cade nella regione critica R.C. Il test è significativo (ovvero l’ipotesi nulla può essere rigettata) al livello di significativa α =0.05. In altre parole, si può ritenere al livello di significativa α =0.05 che la società di consulenza sia capace di mantenere le promesse fatte.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
87
Esercizi di: Statistica e Calcolo delle Probabilità 8.2
8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5 La media e la deviazione standard risultano (esercizio 6.5): 63.7 1 n ≅ 8.0; σ ˆ = ⋅ ( xi − x )2 = 0.34 . x = 8 n − 1 i =1
∑
Si effettui un test relativo a: H0: µ 0=7.7 contro H1: µ 1≠7.7 con α =0.05. Si supponga che la v.a. consumi si distribuisca normalmente. Soluzione
H0: µ 0=7.7.; H1: µ 1≠7.7; α =0.05. X − µ X − 7.7 H 0 ∼ tn −1 ⇒ ∼ t n−1 ˆ 8 σˆ 8 σ Essendo la ipotesi alternativa non direzionale la regione di accettazione può essere così definita: R.A.: c1 ≤ x ≤ c2 Partendo da: ⎛ ⎞ X − 7.7 P ⎜ −t1−α 2 ≤ ≤ t 1−α 2 ⎟ = 1 − α ˆ n σ ⎝ ⎠ si ottiene: P ( 7.7 − t1−α 2 ⋅ σˆ n ≤ X ≤ 7.7 + t1−α 2 ⋅ σˆ n ) = 1 − α da cui si deduce che: ˆ 8 = 7.7 − 2.365 ⋅ 0.34 8 = 7.42 c1 = 7.7 − t 1−0.025 ⋅ σ c2
= 7.7 + t 1−0.025 ⋅ σ ˆ 8 = 7.7 + 2.365 ⋅ 0.34 8 = 7.98
Decisione Il valore osservato di X ( x = 8.0 ) è esterno alla regione di accettazione: l'ipotesi nulla deve essere rigettata. Nota
Per giungere a questo risultato si può anche ragionare come segue: Si calcola un intervallo di confidenza al livello 0.95 per il parametro µ (si veda l’esercizio 7.4): Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
88
Esercizi di: Statistica e Calcolo delle Probabilità
(7.71. 8.28). si osserva che esso non contiene il valore 7.7 assegnato sotto H 0 e si conclude che l’ipotesi H0 può essere rigettata.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
89
Esercizi di: Statistica e Calcolo delle Probabilità 8.3
La resistenza elettrica di un certo tipo di resistori prodotti in serie è una v.a., X , Gaussiana. La deviazione standard di X costituisce una misura dello qualità del processo produttivo. Sulla base di 20 resistori scelti a caso tra quelli realizzati da tale processo si calcola una varianza campionaria pari a: n
2
S
=
20
∑ ( x − x ) ∑ ( x − x ) i =1
2
i
n −1
=
i =1
i
2
= 0.25
19 1. Si valuti se è possibile accettare l’ipotesi che la varianza della popolazione sia maggiore di 0.20. 2. Si valuti la probabilità di accettare l’ipotesi nulla nell’ipotesi che il vero valore di σ 2 sia pari a 0.23. Si ponga α =0.05 Soluzione
H0: σ 2 = σ 02 =0.20.; H1: σ 2 > 0.20;. Risposta (i) R.A.: S 2 ≤ c σ 02 χ 12−α ,n −1 = c= ( n − 1)
0.2 ⋅ 30.14 = 0.32 19
Decisione: 0.25 = S 2 ≤ c = 0.32 ⇒ accetto Ho Risposta (ii)
β (σ 2
= 0.23) = P ( S 2 ∈ R. A σ 2 = 0.23) = P ( S 2 ≤ c σ 2 = 0.23) = ⎛ ( n − 1) ⎞ 19 ( n − 1) = P ⎜ 2 S 2 ≤ 2 c σ 2 = 0.23 ⎟ = P ⎛⎜ χ 192 ≤ ⋅ 0.32 ⎞⎟ = σ 0.23 ⎠ ⎝ σ ⎠ ⎝ = P ( χ 192 ≤ 26.34 ) = 0.88
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
90
Esercizi di: Statistica e Calcolo delle Probabilità 8.4
Negli Stati Uniti molti ristoratori, in seguito agli interventi effettuati per migliorare la qualità del servizio, effettuano dei test sui clienti per valutare i risultati ottenuti. Nel questionari utilizzati allo scopo (usato per valutare l’incremento di qualità del servizio) sono proposte risposte raggruppate in due macro categorie: valutazioni positive e valutazioni non positive circa le modifiche apportate. Si supponga di avere somministrato il questionario ad 80 clienti abituali e che di questi 51 abbiano apprezzano le modifiche. È possibile concludere che è possibile accettare l'ipotesi che “una percentuale superiore al 50% esprime apprezzamento per le modifiche apportate al servizio” al livello di significatività α =0.01? Soluzione
H0: p=0.5 contro H1: p>0.5; Z
=
Pˆ − p0
⎡⎣ p0 (1 − p0 )⎤⎦
n →∞
n
∼ N ( 0,1)
(la dimensione campionaria relativamente elevata, dell’approssimazione). Test ad una coda. La zona di rigetto è del tipo: R.C.: pˆ >c. Dalla relazione:
⎛ Pˆ − p0 ⎜ P ⎜ ⎡⎣ p0 (1 − p0 )⎤⎦ ⎝
n=80,
⎞ ≥ z1−α ⎟ = P ( Pˆ ≥ p0 + z1−α ⋅ ⎡⎣ p0 (1 − p0 )⎤⎦ ⎟ n ⎠
n
“garantisce” la bontà
) = α
si ricava : c = p0
+ z1−α ⋅ ⎡⎣ p0 (1 − p0 )⎤⎦
n
da cui, essendo α =0.01 ( z0.99 = 2.33) , si calcola: c = 0.5 + 2.33 ⋅ 0.5
80 = 0.63 .
51 = 0.6375 . ricade nella zona di rigetto possiamo 80 concludere che c’è evidenza per rigettare H0 (accettare H1) al livello di significatività α =0.01. Poiché il valore osservato. pˆ =
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
91
Esercizi di: Statistica e Calcolo delle Probabilità 8.5
I “ritardi” registrati in partenza dai voli di una compagnia aerea sono classificati come accettabili ( A) o non accettabili (c A) a secondo che siano state registrati ritardi dell'orario effettivo di imbarco, rispetto all'orario ufficiale, inferiori a 5 minuti. Sulla base dei dati storici, relativi ad un numero molto elevato di controlli effettuati dalla compagnia prima di una importante ristrutturazione, è stata stimata una probabilità di incorrere in un “ritardo” non accettabile p=0.05. Dopo la ristrutturazione, per verificare l’efficacia del nuovo assetto organizzativo, si sono monitorati i primi 10 imbarchi registrando 2 “ritardi” non accettabili. Si può ritenere che il valore di p sia ancora pari a 0.05 (α=0.01). Soluzione
H0: p=0.05 contro H1: p≠ 0.05; Pˆ − p0 Sotto H0: Z = ⎡⎣ p0 (1 − p0 )⎤⎦
n →∞
∼ N ( 0,1)
n
effettuando i calcoli si ottiene: p0 (1 − p0 ) c2
= p0 + z1−0.005 ⋅
c1 = p0
− z1−0.005 ⋅
n p0 (1 − p0 ) n
= 0.05 + 2.57 ⋅
= 0.05 − 2.57 ⋅
0.05 (1 − 0.05) n
0.05 (1 − 0.05) n
= 0.227 = −0.127
pertanto, dovendo necessariamente pˆ si formula la seguente regione di accettazione R.A.: 0 ≤ pˆ ≤ 0.227 Decisione: pˆ appartiene alla regione di accettazione pertanto non si può rigettare l’ipotesi nulla. Nota
Le formule utilizzate forniscono soluzioni esatte solo per n → ∞ . Per n piccolo a causa della scarsa qualità dell’approssimazione adottata può capitare che pur essendo Pˆ una v.a. non negativa, si ottenga per c1 un valore negativo. In tali casi si deve porre c1 = 0 :
⎡ = c1 Max ⎢ 0, p0 − z1−α 2 ⋅ ⎢⎣
p0 (1 − p0 ) ⎤ n
⎥ ⎥⎦
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
92
Esercizi di: Statistica e Calcolo delle Probabilità 8.6
Per verificare l'efficacia di un nuovo tipo di farmaco si ricorre allo studio delle reazioni di 15 volontari cui viene somministrato. Non essendoci altri riferimenti si ipotizza che un'evidenza statistica di efficacia in più del 50% dei casi sia un buon risultato. (i) Si determini la regione di rigetto che assicuri un livello di significatività α =0.01. (ii) Si calcoli la probabilità di accettare l’ipotesi nulla nel caso in cui p = p1 = 0.6 (rischio di II specie). Soluzione
H0: p=0.5 contro H1: p>0.5; Risposta (i) c = p0
+ z1− 0.01 ⋅
p0 (1 − p0 ) n
= 0.5 + 2.33 ⋅
0.5 (1 − 0.5) = 0.8 15
R.C.: pˆ > 0.8 Risposta (ii)
In generale si può scrivere: β ( p1 ) = P ( Pˆ ∈ R. A. p = p1 ) = P ( Pˆ ≤ c
p = p1
)=
⎛ ⎞ Pˆ − p1 c − p1 p = p1 ⎟ ≅ = P⎜ ≤ ⎜ ⎡⎣ p1 (1 − p1 )⎤⎦ n ⎟ ⎡⎣ p1 (1 − p1 )⎤⎦ n ⎝ ⎠ ⎛ ⎞ ⎛ ⎞ c p c p − − 1 1 ⎟ = Φ⎜ ⎟ ≅ P ⎜ Z ≤ ⎜ ⎡⎣ p1 (1 − p1 )⎤⎦ n ⎟⎠ ⎜⎝ ⎡⎣ p1 (1 − p1 )⎤⎦ n ⎟⎠ ⎝ Da questa relazione, posto p1=0.6 ed n=15, si ricava:
⎛ ⎞ 0.8 − 0.6 ⎟ = Φ (1.58) = β ( p1 = 0.6 ) = Φ ⎜ ⎜ ⎡⎣0.6 (1 − 0.6 )⎤⎦ 15 ⎟ ⎝ ⎠ = 0.94
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
93
Esercizi di: Statistica e Calcolo delle Probabilità 8.7
Un produttore di palline da tennis afferma di realizzare una percentuale di prodotti difettosi minore del 3%. Il generico acquirente considera tollerabile tale livello di difettosità, ma sospettando che il produttore che possa aver dichiarato il falso decide di effettuare un test per verificare la veridicità di tale affermazione. A tale scopo estrae a caso un campione di 100 unità di prodotto (direttamente dalla linea di produzione) è conta il numero di palline. Le palline difettose risultano essere 10. È possibile affermare, al livello di significatività prossimo a 0.10, che il produttore abbia detto il falso? Soluzione
H0: p=0.03 contro H1: p>0.03. R.C.: pˆ > c p0 (1 − p0 ) 0.03(1 − 0.03) c = p0 + z1−0.1 ⋅ = 0.03 + 1.28 ⋅ = 0.052 n 100 Risultando: 10 pˆ = = 0.1 > c = 0.052 100 è possibile affermare al livello di significatività 0.10 che il produttore ha mentito.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
94
Esercizi di: Statistica e Calcolo delle Probabilità 8.8
(PICCOLO)
Un dado viene lanciato ripetutamente per vedere se è equilibrato. In 600 lanci le facce con X =1,2,⋅⋅⋅,6 puntini si sono presentate rispettivamente 120, 100, 90, 60, 110, 120 volte. Si vuole verificare al livello di significatività α =0.05 se il dado è equilibrato Soluzione
Dal testo si evince che l’ipotesi nulla è H o : P ( X = i ) = ricaviamo le frequenze teoriche in tabella. Utilizziamo la statistica test: 6 (ni − n ⋅ Pi )2 2 χ 0 = ~ χ 62−1 ( n ⋅ Pi ) i =1 Calcoliamo χ o2 con l’aiuto della seguente tabella:
1 ∀i = 1,2,⋅⋅⋅,6 , da cui 6
∑
Faccia del dado X 1 2 3 4 5 6 Totali
Frequenza Osservate Teoriche 120 100 100 100 90 100 60 100 110 100 120 100 600 600
(ni − n ⋅ Pi )2 ( n ⋅ Pi ) 4 0 1 16 1 4 χ o2 =26
2 Essendo χ12−α = χ 0.95 (6-1 gradi di libertà) pari a: 2 Risultando χ o2 =26>11.1= χ 0.95 si può rigettare l’ipotesi nulla che il dado sia corretto.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
95
Esercizi di: Statistica e Calcolo delle Probabilità 8.9 X è
una v.a. di distribuzione incognita che può assumere i valori 0,1,2,3,4,5. Si sospetta si tratti di una v.a. Binomiale, X ∼ B ( k , p ) , di parametri k =5 e p=0.6. Si verifichi l’ipotesi considerata utilizzando i dati raccolti nella seguente tabella (tali dati sono stati ottenuti osservando un campione casuale estratto dalla v.a. X ): xi
ni
Nota: la funzione massa di probabilità della B(5,0.6) è
0 4 1 13 2 25 3 21 4 28 5 9 Si ponga α =0.05.
la seguente
P(0) = 0.0102 P(1) = 0.0768 P(2) = 0.2304 P(3) = 0.3456 P(4) = 0.2592 P(5) = 0.0778
Soluzione
Per valutare la bontà dell’adattamento utilizziamo il test del χ 2. i
xi
ni
1 0 4 2 1 13 3 2 25 4 3 21 5 4 28 6 5 9 Si calcola: 6 n −c 2 ( i i) 2
χ 0
=∑ i =1
ci
ci
1.02 7.68 23.04 34.56 25.92 7.78
2
( ni − ci ) 8.649 3.685 0.167 5.320 0.167 0.193
ci
Costruiamo la seguente tabella con: n=
6
∑ n = 100 i =1
ci
i
= n ⋅ P ( X = xi )
= 18.18
Entrando nella tabella della χ 2 con 5 gradi di libertà ed α =0.05 si ricava: χ c2 = 11.1 Decisione: χ 02 > χ C 2 ⇒ al livello di significatività α = 0.05 non si può accettare l’ipotesi che X ∼ B ( 5,0.6 ) .
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
96
Esercizi di: Statistica e Calcolo delle Probabilità 8.10 X è
una v.a. di distribuzione incognita che può assumere i valori 0,1,2,3,4,5. Si sospetta si tratti di una v.a. Binomiale, X ∼ B ( k , p ) . Si verifichi l’ipotesi considerata utilizzando i dati raccolti nella seguente tabella (tali dati sono stati ottenuti osservando un campione casuale estratto dalla v.a. X ): xi 0 1 2 3 4 5 ni 3 12 26 25 25 9 Si ponga α =0.05. Soluzione
Per valutare la bontà dell’adattamento utilizziamo il test del χ2. Si stima il parametro p: 6
Pˆ =
∑n ⋅ x i =1
i
n ⋅ k
i
= 0.568 (si veda esercizio 6.2)
Si calcolano quindi i valori della funzione massa di probabilità Binomiale con k=5 e p=0.556. P(0) = P(1) = P(2) = P(3) = P(4) = P(5) =
0.0150 0.0989 0.2601 0.3420 0.2248 0.0591 Utilizzando questa funzione costruiamo la tabella: i
xi
ni
1 0 3 2 1 12 3 2 26 4 3 25 5 4 25 6 5 9 Si calcola: 6 n −c 2 ( i i) 2
χ 0
=∑ i =1
ci
ci
1.50 9.89 26.01 34.20 22.48 5.91
( ni − ci )
2
ci
1.49 0.45 0.00 2.47 0.28 1.61
Costruiamo la seguente tabella con: n=
6
∑ n = 100 i =1
ci
i
= n ⋅ P ( X = xi )
= 6.30
Entrando nella tabella della χ 2 con 4 gradi di libertà (si perde un grado di libertà perché si è stimato il parametro p) ed α =0.05 si ricava: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
97
Esercizi di: Statistica e Calcolo delle Probabilità χ c2
= 9.49
Decisione: χ 02
≤ χ C 2 ⇒ al livello di significatività
α = 0.05
si può accettare l’ipotesi H0 che X sia
Binomiale.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
98
Esercizi di: Statistica e Calcolo delle Probabilità 8.11
Assegnato il seguente campione casuale: 2.849, 5.879, 2.498, 4.092, 7.240, 4.219, 7.145, 3.967, 5.011, 2.532, 5.984 verificare se è possibile accettare l’ipotesi che sia stato estratto da una popolazione Gaussiana (si ponga α =0.05). Soluzione
Per testare l’ipotesi di gaussianità utilizziamo il test di Kolmogorov. I parametri della distribuzione non sono assegnati pertanto come primo passo si effettua una stima di media e varianza: X = 4.67 n
S 2
=
∑ ( xi − x ) i =1
2
= 2.97
n −1
Organizziamo quindi la tabella con: • Dati ordinati: x(i )
•
F empirica: F i =
=
x( i )
−
n x( i )
•
Z ( i )
•
F teorica = F Z z( i )
σ
≅
i
−x
S
( ) = Φ ( z( ) )
x(i)
i
i
Fi
1 2.498 0.091 2 2.532 0.182 3 2.849 0.273 4 3.967 0.364 5 4.092 0.455 6 4.219 0.545 7 5.011 0.636 8 5.879 0.727 9 5.984 0.818 10 7.145 0.909 11 7.240 1.000 Si calcola la statistica test: k0 = Max Fi − Φ ( z( i ) ) = 0.150
z(i)
Φ ( z(i) )
-1.263 -1.244 -1.060 -0.411 -0.338 -0.264 0.196 0.699 0.760 1.434 1.490
0.103 0.107 0.145 0.341 0.368 0.396 0.578 0.758 0.776 0.924 0.932
Fi
− Φ ( zi ) 0.012 0.075 0.128 0.023 0.087 0.150
0.059 0.031 0.042 0.015 0.068
i
si entra nella tabella del test di Kolmogorov con n=11 ed α = 0.05 e leggo: k c = 0.391 . Decisione: Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
99
Esercizi di: Statistica e Calcolo delle Probabilità k0
≤ k c ⇒ Accetto H0: al livello di significatività
α = 0.05
si può ritenere che il
campione sia stato estratto da una popolazione Gaussiana.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
100
Esercizi di: Statistica e Calcolo delle Probabilità 8.12
Un nostro fornitore fa parte dei pochi privilegiati che partecipano ad un programma di miglioramento della qualità finanziato dalla nostra azienda. Verificare sulla base delle seguenti osservazioni se il numero di prodotti difettosi sul totale dei prodotti consegnati è indipendente dall’attuazione del programma di miglioramento: difettosi non difettosi prima 20 80 100 dopo 25 175 200 45 255 300 Soluzione
Per provare la s-indipendenza si può applicare il test χ 2. Si definisce la regione di rigetto: 2 R.C.: χ 02 >3.84 ( χ 0.95 =3.84, si entra in tabella 1-α =0.95 ed 1 g.l.)
⎛ ⎝
Si calcola Statistica test ⎜ ci j = χ 02
2
2
= ∑∑ i =1 j =1
ni • ⋅ n• j n
⎞ ⎟: ⎠
2
(n − c ) = i j
ij
ci j
2 2 2 2 ( 20 − 15 ) ( 80 − 85 ) ( 25 − 30 ) (175 − 170 ) = + + + = 15 85 30 170 = 2.941 Osservato che 2.941<3.84 si decide che non è possibile rigettare l'ipotesi nulla.
Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
101
Esercizi di: Statistica e Calcolo delle Probabilità 8.13
Una compagnia aerea ha raccolto le seguenti informazioni su due suoi piloti (A e B): 1. Numero di voli in anticipo 2. Numero di voli in orario (al max ±5 minuti di differenza dall'orario ufficiale) 3. Numero di voli in ritardo Sfruttando la tabella di contingenza di seguito riportata. verificare che la puntualità o meno dei voli sia indipendente dal pilota (si fissi α =0.10). Voli in Voli in Voli in anticipo orario ritardo A 15 65 20 100 B 21 73 6 100 36 138 26 200 Soluzione
Il test d'indipendenza da impostare è un test χ 2. Regione di rigetto: R.C.: χ 2>4.61 ( χ 12−0.10 =4.61, per ν =2 gradi di libertà).
⎛ ⎝
Tabella dei valori attesi ⎜ tabella che contiene i valori: ci j = Voli in anticipo attesi 18 18 36
A B
Voli in orario attesi 69 69 138
ni • ⋅ n• j n
Voli in ritardo attesi 13 13 26
⎞ ⎟: ⎠
100 100 200
Statistica test: χ 02
3
2
= ∑∑ i =1 j =1
(
ni j
− ci j ) ci j
2
2
2
2
(15 − 18 ) ( 65 − 69 ) ( 20 − 13) = + + + 18 69 13 2
2
2
( 21 −18 ) ( 73 − 69 ) ( 6 − 13) + + + = 18 69 13 = 0.5+0.231+3.77+0.5+0.231+3.77= = 9.00 2 χ 02 =9.00>4.61= χ 0.90 ⇒ al livello di significatività α =0.10, si può rigettare l'ipotesi di sindipendenza della puntualità dei voli dai piloti (in altre parole si può ritenere che il ritardo dipende dal pilota) Esercizi di statistica e calcolo delle probabilità Prof. M. GIORGIO
102