Statistica – codice 30001
Soluzioni degli esercizi del libro di testo P. Newbold, W.L. Carlson, B. Thorne, Statistica
Capitolo 6
1
CAPITOLO 6 6.6 L’area di competenza di una squadra di soccorso comprende un tratto di fiume lungo 4 km. L’esperienza passata ha dimostrato che il luogo di intervento,misurato come distanza in km dal punto più a nord, può essere misurato da una variabile uniforme nell’intervallo da 0 a 4 chilometri.
X = distanza dal punto più a nord 0,25 0 x 4 f ( x) 0 altrove a) Rappresentare graficamente la funzione di densità 1
0.75
0.5
f(x)
0.25
0 4
x
N . B :
f ( x) dx 1
b) Determinare e rappresentare graficamente la funzione di ripartizione
x 0
0 F ( x ) 0,25 x 1
0 x 4 x 4
1
F(X)
0 4
x
N . B : F ( X )
x
f ( x) dx
c) Probabilità che si verifichi un’emergenza entro un chilometro
P ( X 1)
1
f ( x ) dx F (1) 0,25 1 0,25
d) Sede operativa si trova a metà del tratto del fiume
Y = distanza dalla sede
2
P (Y 1,5) P ( X 0,5) P ( X 3,5) P ( X 0,5)
0, 5
f ( x ) F (0,5) 0,5 0,25 0,125
P ( X 3,5) 1 P ( X 3,5) 1 F (3,5) 1 0,25 3,5 0,125 P ( X 0,5) P ( X 3,5) 0,125 0,125 0,25
6.7 Sia X la variabile aleatoria che registra il “reddito di una famiglia di una certa regione”; X è una variabile numerica, quantitativa continua. “Reddito mediano uguale a 60000$” si traduce in P(X≤60000) = P(X≥60000) = 0,5 (si ricorda che P(X≤x)=P(X
quindi 0,5 P(X 65000 ) 0,6.
6.8 All’inizio della stagione, un proprietario valuta 0,4 la probabilità di spendere complessivamente, nei tre mesi invernali, meno di 380$ nel riscaldamento e 0,6 quella di spendere meno di 460$.
X=spesa in riscaldamento
a. Qual è la probabilità che la spesa sia compresa tra 380 e 460? b. Senza ulteriori informazioni, cosa si può dire della probabilità che la spesa sia minore di 400$?
6.13 Sia X il numero di copie del libro vendute e Y la somma pagata dall’editore alla scrittrice. Tra X e Y sussiste la seguente relazione : Y = 10000 + 1,5X. Si sa che E(X) = 30000 e σX = 8000. Allora E (Y ) E (10000 1,5 X ) 10000 1,5 E ( X ) 10000 1,5 30000 55000 $ Y
(10000 1,5 X ) 1,5 X 1,5 8000 12000$.
6.16 Un agente di commercio ha uno stipendio di 6000$ più l’8% del valore delle ordinazioni che riceve. Il valore delle ordinazioni può essere rappresentato da una variabile aleatoria con media 600.000$ e deviazione standard 180.000$. Trovare media e deviazione standard dello stipendio. X = vendite Y = stipendio E(X) = 600.000$ 3
Y = 6.000+0.08X
V(Y)=V(6000+0.08X)=
6.17 Sfruttando la simmetria della distribuzione Normale standard e le sue tavole: a. P(Z 1,20) F (1,20) 0,8849 b. P(Z 1,33) 1 P ( Z 1,33) 1 F (1,33) 1 0,9082 0,0918 c. P(Z 1,70) P ( Z 1,70) 1 P ( Z 1,70) 1 F (1,70) 1 0,9554 0,0446 d. P(Z 1) P ( Z 1) F (1) 0,8413 e. P( 1,20 Z 1,33) P ( Z 1,33) P ( Z 1,20) F (1,33) F (1,20) 0,9082 0,8849 0,0233 f. P( 1.70 Z 1,20) F (1,20) [1 F (1,70)] 0,8849 (1 0,9554) 0,8403 g. P( 1.70 Z 1) P( 1 Z 1,70) F (1,70) F (1) 0,9554 0,8413 0,1141
6.18 Sfruttando la simmetria della distribuzione Normale standard e le sue tavole: a. Se P(Z z ) 0,70 , allora F ( z ) 0,70 . Nella tavola il valore F(z) più vicino a 0,7000 è 0,6985
che corrisponde a z 0,52 ; quindi z 0,52 . b. Se P(Z z ) 0,25 , allora F ( z ) 0,25 . Certamente z deve essere un valore negativo in quanto corrisponde a un valore della funzione di ripartizione di Z inferiore a 0,5. Poiché la tavola riporta solamente valori positivi di z , occorre sfruttare la simmetria della distribuzione Normale standard e operare come segue: se P ( Z z ) 0,25 , allora P ( Z z ) 0,25 , ossia 1 P ( Z z ) 0,25 , ossia 1 F ( z ) 0,25 , ossia F ( z ) 0,75 . Nella tavola il valore F(-z) più vicino a 0,7500 è 0,7486 che corrisponde a z 0,67 ; quindi z 0,67 . c. Se P(Z z ) 0,20 , allora 1 P(Z z ) 0,20 , ossia P(Z z ) 0,80 , ossia F ( z ) 0,80 . Nella tavola il valore F(z) più vicino a 0,8000 è 0,7995 che corrisponde a z 0,84 ; quindi z 0,84 . d. Se P(Z z ) 0,60 , allora z deve essere un valore negativo. Sfruttando la simmetria della distribuzione Normale standard P(Z z ) 0,60 equivale a P(Z z ) 0,60 , ossia F ( z ) 0,60 . Nella tavola il valore F(-z) più vicino a 0,6000 è 0,5987 che corrisponde a z 0,25 ; quindi z 0,25 .
6.19 Con l’ausilio della tavola della funzione di ripartizione della distribuzione Normale standard:
60 50
64
a. P(X 60) P Z
P ( Z 1,25) 1 F (1,25) 1 0,8944 0,1056 .
35 50
b. P( 35 X 62) P
Z
62 50
P (1,88 Z 1,50) F (1,50) F (1,88) 64 64 F (1,5) [1 F (1,88)] 0,9332 [1 0,9699] 0,9031. 4
55 50
64
c. P(X 55) P Z d.
Se P(X x) 0,20 ,
P ( Z 0,63) 0,7357 .
allora P Z
x 50
x 50 0,20 , ossia1 P Z 0,20 , ossia 64 64
x 50 F 0,80 . 64 Nella tavola il valore della funzione di ripartizione più vicino a 0,8000 è 0,7995 e x 50 F 0,84 0,7995 ; quindi si risolve 0,84 da cui x 50 0,84 64 56,72 . 64 e. Per un fissato valore k , un intervallo simmetrico rispetto alla media 50 di X si può rappresentare come segue: [50-k , 50+k]. 0,05 Poiché la probabilità su ciascuna coda vale 0,05/2 = 0,025, si ha P(X 50 k ) 1 0,975 . 2 X 50 50 k 50 k k P(X 50 k ) 0,975 P 0,975 P Z 0,975 F 0,975 8 64 8 64 Dalle tavole della distribuzione Normale standard F(z)=0,9750 quando z=1,96 . k Allora deve essere 1,96 , da cui k 15,68 . 8 L’intervallo richiesto è [ 50-k , 50 k] [ 50 15 ,68; 50 15 ,68 ] [ 34 ,32 ; 65 ,68 ] .
6.25 Sia X il tasso di rendimento delle azioni e X ~ N ( 12,2 ; 7,2) .
20 12,2 P ( Z 1,08) 1 0,8599 0,1401 7,2 In 14,01 % delle società ha avuto un tasso di rendimento superiore al 20%. 0 12,2 b. P(X 0) P Z P ( Z 1,69) 1 P ( Z 1,69) 1 0,9545 0,0455 7,2 Il 4,55 % delle società ha avuto un tasso di rendimento negativo. 15 12,2 5 12,2 Z c. P( 5 X 15) P P (1 Z 0,39) F (0,39) [1 F (1)] 7 , 2 7 , 2 0,6517 (1 0,8413) 0,493 . Il 49,3 % delle società ha avuto un tasso di rendimento compreso tra 5% e 15%.
a. P(X 20) P Z
6.27 Un costruttore ritiene che i costi necessari per completare un particolare progetto siano distribuiti normalmente, con media 500.000$ e deviazione standard 50.000$. a. Qual è la probabilità che tali costi siano compresi tra 460.000$ e 540.000$? X = costi
= P(z 5
b. Qual è il costo che ha probabilità 0,2 di non essere superato?
c. Determinate il più piccolo intervallo che, con probabilità 0,95, contenga i costi del progetto.
P( F(
)=0,95 -
=0,95
Ci sono infiniti intervalli. Il più piccolo è quello centrato nella media.
6.33 Un’azienda può rifornirsi di materie prime da due diversi fornitori. Un esame delle precedenti consegne indica che le percentuali di impurità seguono distribuzioni normali con i seguenti parametri.
L’azienda vuole che il livello di impurità non superi il 5% e si rifornirà dal fornitore che, con maggiore probabilità, è in grado di soddisfare la richiesta. Quale fornitore verrà scelto?
=1-0,9082=0,0918 Conviene rifornirsi dal fornitore A.
6.43 Dato un campione casuale di dimensione n=400 estratto da una popolazione distribuita secondo una bernulliana con p=0,20. a. Calcolate la probabilità che la percentuale di successi sia superiore a 0,25 nel campione estratto
Se In questo caso P
6
b. Calcolare la probabilità che la % di successi sia minore del 16%
= c. Calcolare la probabilità che la 5 di successi sia compresa tra 17% e 24%.
=
)-P
)=F(2)-F(-1,5)=F(2)-1+F(1,5)=0,9772-1+0,9332=0,9104
d. Qual è la percentuale di successi che ha probabilità 0,15 di non essere superata?
e. Qual è la percentuale di successi che ha probabilità 0,11 di essere superata?
6.45 Si sa che il 10% dei pezzi prodotti da un processo produttivo è difettoso. Si scelgono 400 pezzi dall’intera produzione. X = numero di pezzi difettosi su 400 a. Qual è la probabilità che almeno 35 pezzi siano difettosi? NB: approssimazione alla binomiale 1) Se n è grande e p molto piccolo (n>30;np<7) si può approssimare ad una distribuzione di Poisson:
2) Se n è grande: np(1-p)>9 si può approssimare a una distribuzione normale: Nel nostro caso .
7
b.
c. d. Senza svolgere calcoli, determinate quale dei seguenti intervalli per il numero di pezzi difettosi ha la maggiore probabilità:
(38;39) (40;41) NB: E(X)=40 L’intervallo è: (40;41)
(41;42)
(44;45)
(46;47)
6.49 I sacchi di prodotti chimici di una certa azienda hanno un contenuto di impurità che può essere rappresentato da una distribuzione normale con media 12,2 e deviazione standard 2,8. Scegliendo un campione casuale di 400 sacchi, qual è la probabilità che almeno 100 contengano meno di 10 grammi di impurità? X = contenuto di impurità ) a. Calcolare la probabilità che un sacco contenga meno di 10 grammi
b. Y = numero di sacchi che contengono meno di 10 grammi su 400 )
6.61 Due variabili aleatorie, X e Y, sono distribuite normalmente. La prima ha media 100 e varianza 100 mentre la seconda ha media 200 e varianza 400. Il coefficiente di correlazione lineare tra le due variabili è 0,5. Trovate media e varianza della variabile aleatoria: .
8
6.69 Si valuta che il numero di chilometri che un certo modello di automobile riesce a percorrere, con un litro di benzina in autostrada, può essere rappresentato da una variabile aleatoria con media 15 e scarto quadratico medio 2. Si scelgono in modo casuale 16 automobili di quel modello, ciascuna con un litro di benzina e si guidano in autostrada. Trovate la media e lo scarto quadratico medio del numero di chilometri percorsi totali.
X = numero di km percorsi da un’auto
Y = numero di km percorsi da 16 auto Y = X1+..+X16 E(Y) = E(X1+..+X16) = 16 E(X) = 16*15 = 240 V(Y) = V(X1+..+X16) = (poiché le estrazioni sono indipendenti) = 16*V(X) = 64
6.71 2 625) . Sia X la variabile “produzione giornaliera ”; X ~ N ( X 100 ; X
Sia Y la variabile “vendita giornaliera”; Y ~ N ( Y 100 ; Y 8) . La correlazione tra X e Y vale XY Corr ( X ,Y ) 0,6 . Sia R il ricavo totale giornaliero; allora R 10Y . Sia C il costo totale giornaliero; allora C 7 X 250 . Sia G il guadagno totale giornaliero; allora G R C 10Y 7 X 250 . Si richiede di valutare P ( R C ) P ( R C 0) P (G 0) . La variabile G ha distribuzione normale con media E(G) e varianza V(G) così calcolate: E (G) E (10Y 7 X 250) 10 E (Y ) 7 E ( X ) 250 10 100 7 100 250 50 $ V (G) V (10Y 7 X 250) 10 2 V (Y ) 7 V ( X ) 2 10 7 Cov( X , Y ) 2
10 2 82 7 625 2 10 7 120 20225 $ 2 2
in quanto Cov( X , Y ) Corr ( X , Y ) X Y 0,6 625 8 120 $ 2 . Allora G ~ N ( G 50 ; G2 20225) e la probabilità richiesta vale
P ( R C ) P (G 0) P Z
0 50
P ( Z 0,35) F (0,35) 0,6368. 20225
6.75 Sia X la variabile “offerta inferiore tra quelle proposte ”; X ~ Uniforme(8 ; 20) . Pro memoria sulla distribuzione Uniforme(a,b), dove a=8 e b=20: 1 1 se a x b funzione densità f ( x) b a 12 se 8 x 12 0 altrimenti 0 altrimenti
9
0 se x a 0 se x 8 1 1 funzione di ripartizione F ( x) x a se a x b x 8 se 8 x 20 b a 12 se x 20 1 se x b 1 ab media E ( X ) 14 2
varianza V ( X )
b a 2
12
12
1 10 8 0,1667 . 12 b. La consulente si aggiudica il contratto se le altre offerte proposte sono superiori alla sua offerta di 12 migliaia di dollari. Questo avviene con probabilità 66,67% in quanto 1 P ( X 12) 20 12 0,6667 . 12 c. Dalla risposta al punto b, la probabilità che la consulente si aggiudichi il contratto è 0,6667; in tal caso il suo guadagno è pari a 12-10 = 2 (migliaia di dollari). La probabilità che la consulente non si aggiudichi il contratto è 1-0,6667 = 0,3333; in tal caso il suo guadagno è pari a 0 (migliaia di dollari). Se ne deduce che il guadagno G è una variabile aleatoria avente la seguente funzione di probabilità: a. P ( X 10)
G
0
2
P(G)
0,3333
0,6667
Il guadagno atteso è pertanto: E (G)
2
x p( x ) 0 0,3333 2 0,6667 1,3334 (migliaia di dollari). i
i 1
i
d. Sia y l’offerta della consulente. Ovviamente l’offerta deve essere compresa tra 8 e 20 e), qualora la consulente si aggiudichi il contratto, tale da coprire i costi di realizzazione del progetto, pari a 10 (migliaia di dollari). Pertanto deve essere 10 y 20. Analogamente alla soluzione del quesito a., la probabilità di aggiudicarsi il contratto è 1 1 P ( X y ) 20 y e quella di non aggiudicarselo è P ( X y ) y 8 . 12 12 La funzione di probabilità della variabile guadagno G è la seguente: G
0
P(G)
1 12
y 8
y-10
1 20 y 12
E il guadagno atteso vale E (G)
2
1
1
x p( x ) 0 12 ( y 8) ( y 10) 12 (20 y) i
y 2 30 y 200
i
12 Si tratta di determinare l’offerta y (compresa tra 10 e 20) che rende massimo il guadagno atteso: occorre studiare E(G) come funzione di y. Si calcolano le prime due derivate: i 1
d y 2 30 y 200
2 y 30 12 12 dy 2 2 d E (G) d 2 y 30 2 12 dy dy 12
dE (G)
dy
10
I valori candidati ad essere punti di massimo sono quelli che rendono nulla la derivata prima, ossia 2 y 30 si risolve 0 e si ottiene y = 15 . 12 Poiché la derivata seconda è negativa, il valore y = 15 è un punto di massimo per la funzione E(G). Se la consulente volesse fare un’offerta che massimizzasse il guadagno, dovrebbe proporre 15000 $.
6.85 Sia X la variabile “tempo di consegna ”; X ~ N ( X 20 ; X 4) .
25 20 15 20 Z P (1,25 Z 1,25) 0,8944 (1 0,8944) 0,7888 4 4 30 20 b. P ( X 30) P Z 1 P ( Z 2,5) 1 0,9938 0,0062 4 a. P (15 X 25) P
c. Sia Y la variabile aleatoria che vale 1 se una pizza è gratuita perché consegnata in ritardo e 0 se non lo è. Allora Y ~ Bernoulli ( p 0,0062) .
Siano Y 1 , Y 2 , Y 3 , Y 4 , Y 5 le variabili aleatorie relative ai cinque giorni considerati; esse sono indipendenti e distribuite come Y . Sia B Y 1 Y 2 Y 3 Y 4 Y 5 il numero di pizze gratuite nei cinque giorni considerati; allora B ~ Binomiale (n 5; p 0,0062) . La probabilità che lo studente riceva almeno una pizza gratuita è 3,06% in quanto 5 0 5 0 P ( B 1) 1 P B 0 1 0,0062 (1 0,0062) 1 0,9694 0,0306 . 0 d. Poiché la distribuzione di X è normale, il più piccolo intervallo di tempo che contiene il 40% delle consegne è quello simmetrico rispetto a X : occorre determinare un valore k tale che P (20 k X 20 k ) 0,4 . Questa espressione equivale alle seguenti: k (20 k ) 20 k 0,7 ; P Z 0,7 ; F 0,7 4 4 4 Dalla tavola della distribuzione Normale standard il valore F(z) più vicino a 0,7 è 0,6985, corrispondente a z =0,52. Allora k/4=0,52 da cui k=2,08. L’intervallo richiesto è [20 k ; 20 k ] [20 2,08; 20 2,08] [17,92; 22,08]. e. Essendo tutti intervalli equiampi, il più probabile è l’intervallo [19; 21] in quanto simmetrico rispetto alla media di X. In ordine di probabilità (osservare il disegno per convincersene): P (19 X 21) P (20 X 22) P (18 X 20) P (21 X 23). f. [21; 23].
P ( X 20 k ) 0,5 0,4 / 2 0,7 ;
P Z
11
6.86 Sia X la variabile “spesa annua dei soci”; X ~ N ( 100 ; 2 ) ; è noto che P ( X 130) 0,10. Il valore di σ si determina come segue: 130 100 130 100 130 100 P ( X 130) 0,10 ; P Z 0,10 ; P Z 0,90 ; F 0,90
Dalla tavola della distribuzione Normale standard il valore di F(z) che più si avvicina a 0,90 è 0,8997 e corrisponde a z =1,28; allora (130-100)/σ = 1,28 da cui σ = (130-100)/1,28 = 23,4375. La probabilità richiesta è la seguente: 140 100 P ( X 140) P Z P ( Z 1,71) 1 F (1,71) 1 0,9564 0,0436. 23 , 4375
6.95 2 Sia X la variabile “prezzo di una azione A”; X ~ N ( X 10 ; X 16) .
Sia Y la variabile “prezzo di una azione B”; Y ~ N ( Y 12 ; Y 2 9) . La correlazione tra X e Y vale XY Corr ( X , Y ) 0,3 . a. Sia P la variabile “valore del portafoglio composto da 10 azioni A e 8 azioni B”. La variabile P è definita tramite la seguente combinazione lineare di X e Y: P 10 X 8Y . Ne segue che P ha distribuzione normale con media E(P) e varianza V(P) così calcolate: E ( P ) E (10 X 8Y ) 10 E ( X ) 8 E (Y ) 10 10 8 12 196 V ( P ) V (10 X 8Y ) 102 V ( X ) 82 V (Y ) 2 10 8 Cov( X , Y )
102 16 8 2 9 2 10 8 3,6 2752 in quanto Cov( X , Y ) Corr ( X , Y ) X Y 0,3 16 9 3,6 . b. Sia X1 la variabile “prezzo di una azione di tipo 1 ” : X 1 ~ N ( 1 10 ; 12 25) e Corr ( X 1 , Y ) 0,2 . Sia P 1 la variabile “valore del portafoglio composto da 10 azioni di tipo 1 e 8 azioni B”. Allora P 1 10 X 1 8Y ha distribuzione normale con media E(P 1 ) e varianza V(P 1 ) così calcolate:
E ( P 1 ) E (10 X 1 8Y ) 10 E ( X 1 ) 8 E (Y ) 10 10 8 12 196 2 2 V ( P 1 ) V (10 X 1 8Y ) 10 V ( X 1 ) 8 V (Y ) 2 10 8 Cov( X 1 , Y )
102 25 82 9 2 10 8 3 2596 in quanto Cov( X 1 , Y ) Corr ( X 1 , Y ) 1 Y 0,2 25 9 3 . Sia X2 la variabile “prezzo di una azione di tipo 2 ” : X 2 ~ N ( 2 10 ; 22 9) e Corr ( X 2 , Y ) 0,6 . Sia P 2 la variabile “valore del portafoglio composto da 10 azioni di tipo 2 e 8 azioni B”. Allora P 2 10 X 2 8Y ha distribuzione normale con media E(P 2 ) e varianza V(P 2 ) così calcolate:
E ( P 2 ) E (10 X 2 8Y ) 10 E ( X 2 ) 8 E (Y ) 10 10 8 12 196 2 2 V ( P 2 ) V (10 X 2 8Y ) 10 V ( X 2 ) 8 V (Y ) 2 10 8 Cov( X 2 , Y )
102 9 8 2 9 2 10 8 5,4 2340 in quanto Cov( X 2 , Y ) Corr ( X 2 , Y ) 2 Y 0,6 9 9 5,4 . Le due offerte P 1 e P 2 hanno lo stesso valore atteso del portafoglio P ; entrambe le offerte sono vantaggiose rispetto al portafoglio P in quanto hanno varianza inferiore rispetto alla varianza di P . Il gestore sceglierà il portafoglio P 2 in quanto ha minor varianza rispetto a P 1 e P .
12