1
˘T ˘ PROBABILITA ¸I S ¸ I STAT TATISTICA
Eugen P˘ alt˘ anea
Universita Univer sitatea tea Transilvania rans ilvania din Bra¸sov sov 2018
2
Cuprins 0.1
Intro ducere . . . . . . . . . . . . . 0.1.1 Date istorice . . . . . . . . . 0.1.2 Descrierea cursului . . . . . 0.1. 0.1.33 Princi Principi piil ilee de baz˘ baza˘. Limba j
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
1 Spa¸ii ¸t ii m˘ asurabile. asurabile. Cˆ ampuri ampuri de probabilitate. Scheme clasice de bilitate 1.1 Intro ducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Corpuri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Spat pa¸ii ¸tii m˘asurabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 1.4 Funct unct¸ii ¸ii m˘asurabile . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Caˆmpuri de probabilitate . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Evenimen Evenimente te independen independente, te, evenimente evenimente condit ¸ionate . . . . . . . . . 1.7 Scheme clasice de probabilitate . . . . . . . . . . . . . . . . . . . . 1.8 Rezumat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Variabile aleatoare. Caracteristici numerice 2.1 Intro ducere . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Variabile aleatoare . . . . . . . . . . . . . . . . . . . . 2.3 2.3 Funct unct¸ia ¸ia de repartit¸ie . . . . . . . . . . . . . . . . . . . 2.4 2.4 Varia ariabi bille alea aleato toar aree disc discre rete te.. Exem Exempl plee clas clasiice . . . . . . 2.5 2.5 Varia ariabi bille al aleato eatoar aree de de ti tip con conti tin nuu. uu. Exem Exempl plee clas clasiice . . 2.6 Media. Me Medii de ordin super perior . . . . . . . . . . . . . 2.7 Disp ersia . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8 2.8 Co Core rela lat¸tia . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 2.9 Funct unct¸ia ¸ia caracteristic˘ caracteristic˘ a . . . . . . . . . . . . . . . . . . . 2.10 Re R ezumat . . . . . . . . . . . . . . . . . . . . . . . . . . 2.11 Te Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Conve Converge rgent nt¸a ¸sirurilor de variabile aleatoare 3.1 Intro ducere . . . . . . . . . . . . . . . . . . . . . 3.2 3.2 Inega Inegali lit˘ t˘ at a¸i ¸ti fundamentale ˆın teoria probabilit˘ at a¸tilor 3.3 Tipuri Tipuri de conve convergen rgent¸˘ ¸ta. a˘. Relat¸ii . . . . . . . . . . . 3.4 Legile numerelor mari . . . . . . . . . . . . . . . . 3.5 Teorema eorema limit˘ limit˘ a central˘ a . . . . . . . . . . . . . . 3.6 Rezumat . . . . . . . . . . . . . . . . . . . . . . . 3.7 Test . . . . . . . . . . . . . . . . . . . . . . . . . 3
. . . . . . .
. . . . . . .
. . . . . . .
. . . .
. . . .
. . . .
. . . .
5 5 5 5
proba. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
7 7 7 9 10 11 13 14 18 22
. . . . . . . . . . .
23 . . . . . . . . . . 23 . . . . . . . . . . 23 . . . . . . . . . . 24 . . . . . . . . . . 26 . . . . . . . . . . 27 . . . . . . . . . . 30 . . . . . . . . . . 32 . . . . . . . . . . 33 . . . . . . . . . . 34 . . . . . . . . . . 37 . . . . . . . . . . 40
. . . . . . .
41 . . . . . . 41 . . . . . . 41 . . . . . . 42 . . . . . . 44 . . . . . . 46 . . . . . . 48 . . . . . . 50
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
4
4 Elemente de statistic˘ a matematic˘ a 4.1 Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Not¸iuni de baz˘a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Estimatori. Propriet˘ a¸ti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Estimatori bayesieni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Rezumat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Not¸iuni de statistic˘ a descriptiv˘ a . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Concepte de baz˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.2 Tipuri de distribut¸ii statistice empirice. Tabele statistice. Reprezent˘ ari grafice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.3 Indicatori statistici . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.4 Calculul indicatorilor statistici ai distribut¸iei variabilei X (Exemplul 1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.5 Calculul indicatorilor statistici ai distribut¸iei variabilei Y (Exemplul 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.6 Compararea a dou˘ a distribut¸ii empirice . . . . . . . . . . . . . . . . 4.6.7 Corelat¸ia ¸si coeficientul de corelat¸ie . . . . . . . . . . . . . . . . . . 4.6.8 Metoda corerat¸iei rangurilor . . . . . . . . . . . . . . . . . . . . . . 4.7 Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51 51 51 52 54 56 57 57 59 62 64 64 65 65 66 67
5
0.1
Introducere
0.1.1
Date istorice
Teoria probabilit˘ a¸tilor1 ¸si statistica matematic˘a studiaz˘ a fenomenele aleatoare, ˆın scopul predict¸iei ¸sanselor de realizare a unor rezultate a¸steptate. Studiul se bazeaz˘ a pe modelare matematic˘a ¸si rat¸ionamente deductive. Bazele teoriei probabilit˘ a¸tilor ¸si statisticii (studiului matematic al ”hazardului”) au fost puse ˆın secolele XVI-XVII. Astfel, Gerolamo Cardano scria ˆın 1526 prima carte dedicat˘ a unor concepte probabiliste: Liber de ludo aleae (”Cartea jocurilor de noroc”), publicat˘ a ˆın 1663. Contribut¸ii majore la punerea bazelor teoriei probabilit˘ a¸t ilor au avut matematicienii francezi Blaise Pascal ¸si Pierre de Fermat (ˆınceputul sec. al XVII-lea). ˆIn 1657, Cristiaan Huygens publica lucrarea De ratiociniis in ludo aleae (”Asupra rat¸ionamentelor ˆın jocurile de noroc”). Doctrina probabilit˘ at¸ilor se contureaz˘ a ˆın sec. al XVIII-lea prin lucr˘arile fundementale Ars conjectandi , publicat˘a ˆın 1713 de Jacob Bernoulli ¸si The Doctrine of Chances , publicat˘a ˆın 1718 de Abraham de Moivre. Un secol mai tˆ arziu, Pierre Simon Laplace public˘ a lucrarea Th´eorie analytique des probabilit´ees , ˆın care evident¸iaz˘ a legea erorilor (convergent¸a la legea normal˘ a ). Teoria modern˘ a a probabilit˘ a¸tilor (incluzˆ and formalizarea axiomatic˘ a) este datorat˘ a ˆın bun˘ a m˘ asur˘ a matematicianului rus Andrei Nikolaevici Kolmogorov, autorul c˘ art¸ii Foundation of the Theory of Probability , publicat˘a ˆın 1950. Printre lucr˘ arile de referint¸a˘ ˆın domeniu ale secolului XX trebuiesc amintite The Theory of Stochastic Processes (D.R Cox, H.D. Miller, 1965), An Introduction to Probability Theory (W. Feller, 1968) ¸si Probability and Measure (P. Billingsley, 1979). In ultimii 60 de ani, studiul proceselor aleatoare cunoa¸ste o dezvoltare ¸si diversificare teoretic˘ a exponent¸ial˘a, dar ¸si un cˆ amp foarte larg de aplicabilitate. S¸coala romˆaneasc˘a de probabilit˘ a¸t i se remarc˘ a prin numeroase contribut¸ii originale. Bazele acestei ¸scoli se datoreaz˘ a ˆın principal matematicienilor C. T. Ionescu-Tulcea, Gheorghe Mihoc, Octav Onicescu, Ion Cuculescu, Marius Iosifescu ¸si Constantin Tudor.
0.1.2
Descrierea cursului
Prezentul curs reprezint˘ a o introducere ˆın teoria probabilit˘ a¸tilor ¸si statisticii matematice. Sunt descrise ¸si caracterizate concepte de baz˘ a ale domeniului: cˆampuri de probabilitate, variabile aleatoare ¸si convergent ¸a ¸sirurilor de variabile aleatoare, e¸santioane, estimatori statistici etc. Pentru studiul acestor not ¸iuni sunt necesare cuno¸stint¸e elementare de analiz˘ a matematic˘a ¸si teoria m˘asurii. Cuno¸stint¸ele teoretice sunt exemplificate ¸si aplicate ˆın probleme ¸si lucr˘ari de laborator, menite s˘ a familiarizeze cursantul cu rat¸ionamentele specifice domeniului ¸si cu utilizarea unor softuri informatice.
0.1.3
Principiile de baz˘ a. Limbaj
Teoria probabilit˘ a¸t ilor analizeaz˘ a ¸sansele de realizare a unor evenimente ˆın urma unei experient ¸e ¸si este fundamentat˘a pe urm˘ atoarele trei principii: 1. Fiec˘arui eveniment rezultat ˆın urma unei experient ¸e i se atribuie un num˘ ar real din intervalul [0, 1] numit probabilitatea evenimentului . 1
Etimologie: probabilitas (lat.) = credibilitate
6 2. Oricare dou˘ a evenimente contrare au suma probabilit˘a¸tilor egal˘ a cu 1. 3. Probabilitatea de realizare simultan˘ a a dou˘ a evenimente este egal˘ a cu produsul dinte probabilitatea realiz˘ arii unuia dintre evenimente ¸si probabilitatea realiz˘ arii celuilalt eveniment, condit¸ionat˘ a de realizarea primului eveniment. In formalizarea matematic˘ a, evenimentele care pot rezulta ˆın urma efectu˘arii unei experient ¸e reprezint˘ a submult¸imi ale unei mult¸imi Ω (interpretat˘ a ca ”evenimentul sigur”). Aceste evenimente au o probabilitate de aparit¸ie (¸sans˘ a de realizare). Matematic, probabilitatea este o m˘ asur˘ a finit˘ a , definit˘a pe mult¸imea evenimentelor. Astfel, limbajului probabilistic ˆıi corespunde limbajul mult¸imilor. Urm˘atoarea schem˘ a evident¸iaz˘ a dualitatea de limbaj (relativ la o anumit˘ a experient¸a˘):
• evenimentul sigur = mult¸imea total˘a (de referint¸a˘): Ω; • evenimentul imposibil = mult¸imea vid˘a: ∅; • evemiment = submult¸ime a mult¸imii totale: A ⊂ Ω; • realizarea unui eveniment asigur˘ a realizarea unui alt eveniment (implicat ¸ia evenimentelor) = incluziunea mult¸imilor: A ⊂ B; • evenimentul contrar (unui eveniment) = complementara unei submult¸imi a mult¸imii totale: A = Ω \ A; • evenimentul realiz˘ arii a cel put ¸in unuia dintre dou˘ a evenimente (disjunct ¸ia evenimentelor) = reuniunea mult¸imilor: A ∪ B; • evenimentul realiz˘ arii simultane a dou˘ a evenimente (conjunct ¸ia evenimentelor) = intersect¸ia mult¸imilor: A ∩ B; c
Capitolul 1 Spat¸ii m˘ asurabile. Cˆ ampuri de probabilitate. Scheme clasice de probabilitate 1.1
Introducere
Vom defini ¸si caracteriza ˆın continuare not¸iunea de spat¸iu m˘asurabil (cˆ amp de evenimente) ¸si funct¸iile m˘asurabile, definite ˆıntre spat¸ii m˘asurabile. Not¸iunile respective modeleaz˘ a matematic rezultatele posibile ale unei experient¸e (evenimentele posibile) ¸si corespondent¸ele specifice asociate unor experient¸e. Astfel, definim not¸iunile: corp, σ-corp, borelianul unui spat¸iu topologic, spat¸iu m˘asurabil, funct¸ie m˘asurabil˘a ¸si evident¸iem propriet˘ a¸t ile lor de baz˘a. Se introduce not¸iunea de cˆ amp de probabilitate ¸si se preg˘ ate¸ste definirea conceptului de variabil˘ a aleatoare . Sunt evident¸iate propriet˘ a¸tile probabilit˘ a¸tii, definit˘a ca m˘asur˘a finit˘a pe spat¸iul evenimentelor (σ-corpul evenimentelor). Este discutat˘ a independent¸a evenimentelor ¸si not¸iunea de probabilitate condit¸ionat˘ a. Exemplele elementare de cˆ ampuri de probabilitate discrete sunt particularizate ˆın modelele clasice (scheme de probabilitate), adaptate studiului unor fenomene aleatoare.
1.2
Corpuri
Not¸iune de corp (de mult¸imi) reprezint˘ a cadrul minimal de modelare matematic˘ a a setului evenimentelor posibile rezultate ˆın urma unei experient¸e cu rezultate aleatoare. ¸ime nevid˘ a. O familie nevid˘ a C de submult ¸imi ale lui Ω Definit¸ia 1.2.1. Fie Ω o mult ( C P (Ω)) se nume¸ste corp a lui Ω dac˘ a satisface propriet˘ at ¸ile:
⊂
C 1 . Ac
∈ C, ∀ A ∈ C; C . A ∪ B ∈ C , ∀ A, B ∈ C . 2
Definit¸ia de mai sus are o serie de consecint¸e imediate.
Propozit¸ia 1.2.1. Fie C un corp a lui Ω. Au loc propriet˘ at ¸ile urm˘ atoare: C 3 .
n i=1 Ai
∪
∈ C, ∀ A ∈ C, i = 1, n , n ≥ 2; i
7
8 C 4 .
n i=1
∩ A ∈ C, ∀ A ∈ C, i = 1, n , n ≥ 2; C . ∅, Ω ∈ C ; C . A \ B ∈ C , ∀ A, B ∈ C . i
i
5
6
Demonstrat ¸ie. C 3 se verific˘ a prin induct¸ie. C 4 rezult˘ a din urm˘ atoarea relat¸ie (De Morn n c c gan): i=1 Ai = ( i=1 Ai ) ¸si propriet˘a¸tile C 1 ¸si C 3 . Pentru C 5 , consider˘ am A C; avem Ω = A Ac C ¸si = A Ac C . C 6 se obt¸ine din relat¸ia: A B = A B c ¸si C 4 .
∩ ∪ ∪ ∈ ∅
∩ ∈
\
∈
∩
Vom considera ˆın continuare intersect¸ii de corpuri ale unei mult¸imi fixate. ¸ie de corpuri ale unei mult ¸imi date este un corp al acelei Propozit¸ia 1.2.2. O intersect mult ¸imi. Demonstrat ¸ie. Fie Ci : i I o familie de corpuri ale mult¸imii Ω. Not˘ am C = a A C , atunci A C i , i I , P (Ω). Evident, Ω C (cf. P 3 ), deci C = . Dac˘ i∈I Ci c c de unde A C i , i I (cf. C 1 ), deci A C . Similar se verific˘a A B C , A, B C . Rezult˘a c˘a C este un corp a lui Ω.
∩
⊂
∈
{ ∈ } ∈ ∀ ∈
∅
∈
∈
∈
∀ ∈ ∪ ∈ ∀ ∈
Rezultatul de mai sus este util ˆın studiul corpurilor generate de familii de p˘ art¸i ale multimii totale considerate.
∅
Definit¸ia 1.2.2. Fie Ω = ¸si M Atunci mult ¸imea
⊂ P(Ω), M = ∅. Fie P = {C − corp a lui Ω | M ⊂ C}. C(M) =
C
∈
C P
se nume¸ste corpul generat de M. Vom observa la C(M) este cel mai mic corp a lui Ω care include familia de p˘ art¸i M a lui Ω. Ne vom referi acum la cazul corpurilor finite.
∅ 1. Dac˘ a M ⊂ P (Ω), M = ∅, este o mult ¸ime finit˘ a, atunci corpul C(M) este finit. 2. Dac˘ a C este un corp finit a lui Ω, atunci exist˘ a o partit ¸ie finit˘ a ∆ = {A , A , ··· , A }
Propozit¸ia 1.2.3. Fie Ω = .
1
2
n
a lui Ω astfel ca
C =
{∪ ∈ A i I
i
: I
⊂ {1, 2, ··· , n}}.
Demonstrat ¸ie. 1. Fie mult¸imile finite Mc = Ac : A M , M1 = M Mc , M2 = A∈H A : H M1 ¸si M3 = A∈G : G M 2 . Atunci C(M) = M 3 , deci este finit. 2. Partit¸ia ∆ este format˘ a din mult¸imile nevide A and proprietatea urm˘ atoare C, avˆ B A B = A sau B = , B C .
{∪ ⊂ ⇒
⊂ }
{
∅ ∀ ∈
∈ }
∪
∈
{∩
⊂ }
9
1.3
Spat¸ii m˘ asurabile
Not¸ iunea de corp (de mult¸imi), definit˘ a ˆın paragraful enterior, va fi extins˘ a ˆın cele ce urmeaz˘a la cea de σ corp. Aceasta va permite introducerea not¸iunii de spat ¸iu m˘ asurabil (cˆamp de evenimente).
−
Definit¸ia 1.3.1. Fie Ω o mult ¸ime nevid˘ a. O mult ¸ime nevid˘ a F Ω se nume¸ste σ a lui Ω dac˘ a satisface urm˘ atoarele condit ¸ii:
⊂
− corp
σ1 . Ac
∈ F , ∀ A ∈ F ; σ . dac˘ a A ∈ F , ∀n ∈ N∗ atunci ∪∞ 2
n=1 An
n
∈ F .
Perechea (Ω, F ) se nume¸ste spat ¸iu m˘ asurabil sau cˆ amp de evenimente. Vom observa c˘ a orice σ corp F a lui Ω este un corp a lui Ω. Astfel, pentru A, B F consider˘am ¸sirul (An )n≥1 definit prin A1 = A ¸si An = B, n 1. Conform σ1 , avem ∞ A B = n=1 An F . Deducem c˘a σ-corpul F este corp. Ca urmare, propriet˘ a¸tile C 3 C 6 r˘amˆan valabile ˆıntr-un σ-corp. Alte propriet˘ a¸ti sunt descrise ˆın propozit¸ia urm˘ atoare.
−
∪
∪
∈ −
∀ ≥
∈
¸iu m˘ asurabil. Au loc urm˘ atoarele propriet˘ at ¸i: Propozit¸ia 1.3.1. Fie (Ω, F ) un spat
∈ F , ∀n ∈ N∗ ⇒ ∩∞ A ∈ F ; σ . A ∈ F , ∀n ∈ N∗ ⇒ lim sup →∞ A ∈ F , lim inf →∞ A ∈ F , unde lim sup →∞ A = ∩∞ ∪∞ A ¸si lim inf →∞ A = ∪∞ ∩∞ σ3 . An 4
n=1
n
n
n
n
n
n
n=1
k=n
n
k
n
n
n
k=n A k .
n=1
Demonstrat ¸ie. σ3 . Conform relat¸iilor lui De Morgan ¸si Definit¸iei 1.3.1, avem: c c ( ∞ F . n=1 An ) σ4 . Se aplic˘a σ2 ¸si P 5 .
∪
∈
Remarc˘am c˘a familiile F 1 = P (Ω) ¸si F 2 = elementare ale lui Ω.
∩∞
n=1 An
=
{∅, Ω} reprezint˘a σ-corpuri (deci ¸si corpuri)
Intersect¸ia unor σ-corpuri ale unei mult¸imi este de asemenea un σ-corp al mult¸imii respective, demonstrat¸ia fiind similar˘a celei din Propozit¸ia 1.2.2. a F i , i I , reprezint˘ a o familie oarecare de σ corpuri ale mult ¸imii Propozit¸ia 1.3.2. Dac˘ Ω, atunci i∈I F i reprezint˘ a de asemenea un corp al mult ¸imii Ω.
∩
∈
−
Proprietatea de mai sus permite definirea not¸iunii de σ-corp generat de o mult¸ime de p˘art¸i (submult¸imi) ale unei mult¸imi Ω. ¸ime nevid˘ a ¸si M P (Ω). Intersect ¸ia tuturor σ corpurilor Definit¸ia 1.3.2. Fie Ω o mult lui Ω care includ mult ¸imea M se nume¸ste σ corpul generat de M ¸si se noteaz˘ a B(M).
−
⊂
−
Mult¸imea B(M) este cel mai mic σ-corp a lui Ω care include pe M. Un caz particular foarte important este cel ˆın care mult ¸imea M este o topologie pe spat¸iul Ω.
10 ¸iu topologic, unde O reprezint˘ a topologia lui Ω (familia Definit¸ia 1.3.3. Fie (Ω, O) un spat mult ¸imilor deschise). Atunci σ corpul generat de mult ¸imea O se nume¸ste borelianul spat ¸iului topologic (Ω, O) ¸si se noteaz˘ a (atunci cˆ and nu este pericol de confuzie) prin BΩ .
−
Topologia OR a mult¸imii numerelor reale R este familia reuniunilor cel mult num˘ arabile de intervale deschise disjuncte. Se poate demonstra c˘ a borelianul B R al spat¸iului topologic (R, OR) cont¸ine toate tipurile de intervale ¸si reuniunile cel mult num˘ arabile ale acestora. Reciproc, BR coincide cu σ - corpul generat de oricare tip de intervale reale.
1.4
Funct¸ii m˘ asurabile
Descriem ˆın continuare funct¸iile ”specifice” spat¸iilor m˘asurabile. ¸ii m˘ asurabile (cˆ ampuri de eveniDefinit¸ia 1.4.1. Fie (Ω, F ) ¸si (Ω , F ) o pereche de spat mente). O funct ¸ie f : Ω Ω se nume¸ste funct ¸ie m˘ asurabil˘ a dac˘ a
→
f −1 (A) F ,
∈
∀ A ∈ F ,
unde f −1 (A) = ω
{ ∈ Ω | f (ω ∈ A}.
ˆIn particular, dac˘ a Ω = R ¸si F = B R, funct¸ia f se va numi funct ¸ie real˘ a m˘ asurabil˘ a . R, avem: De remarcat faptul c˘ a, pentru o funct¸ie real˘ a m˘asurabil˘a f : Ω
→
1
• {f ≤ a} := f − ((−∞, a]) ∈ F , ∀ a ∈ R • {f > a} := f − ((a, ∞)) ∈ F , ∀ a ∈ R • {a ≤ f ≤ b} := f − ([a, b]) ∈ F , ∀ a, b ∈ R, a < b. 1
1
Conservarea m˘ asurabilit˘a¸tii prin operat¸ii algebrice este stabilit˘ a de propozit¸ia urm˘ atoare.
¸iu m˘ asurabil. Dac˘ a f, g : Ω ¸ii reale Propozit¸ia 1.4.1. Fie (Ω, F ) un spat R sunt funct m˘ asurabile ¸si a R atunci funct ¸iile reale f +a, af, f , f +g, fg, min f, g ¸si max f, g sunt m˘ asurabile.
∈
||
→
{ }
{ }
Funct¸iie continue sunt m˘asurabile. Astfel, are loc:
Propozit¸ia 1.4.2. Dac˘ a (Ω, BΩ ) este un spat ¸iu m˘ asurabil, cu BΩ reprezentˆ and borelianul R este o funct definit de o topologie pe Ω, iar f : Ω ¸ie continu˘ a, atunci f este o funct ¸ie real˘ a m˘ asurabil˘ a.
→
Not¸iunea de funct ¸ie real˘ a m˘ asurabil˘ a serve¸ste definirii not¸iunii de variabil˘ a aleatoare .
11
1.5
Cˆ ampuri de probabilitate
Not¸iunea de cˆ amp de probabilitate este fundamental˘ a ˆın teoria probabilit˘a¸tilor. Un cˆamp de probabilitate este un spat¸iu m˘asurabil dotat cu o m˘asur˘a finit˘a numit˘a ”probabilitate”.
Definit¸ia 1.5.1. Fie (Ω, F ) un spat ¸iu m˘ asurabil, cu σ corpul F denumit ”mult ¸imea evenimentelor”. O funct ¸ie P : F R se nume¸ste probabilitate dac˘ a satisface urm˘ atoarele axiome:
−
→
P1.
P(A)
≥ 0, ∀ A ∈ F ;
P2.
P(Ω)
= 1;
P3. Pentru oricare s¸ir de evenimente (An )n∈N , cu A n Am = ,
∞ P (∪n=1 An ) =
∅ ∀ n = m, are loc relat ¸ia
∩
∗
∞
P(An ).
n=1
Tripletul (Ω, F , P) se nume¸ste cˆ amp de probabilitate. Ultima proprietate a definit¸iei de mai sus se refer˘ a la ¸siruri de evenimente. ˆIn continuare, ne vom referi la ¸sirurile monotone de evenimente ¸si limitele de ¸siruri de evenimente. ampul de probabilitate (Ω, F , P). Definit¸ia 1.5.2. Fie (An )n∈N un ¸sir de evenimente din cˆ ∗
1. S ¸ irul (An)n∈N se nume¸ste monoton cresc˘ ator dac˘ a An ∞ A = n=1 An F . Not˘ am limn→∞ An = A ¸si A A. ∗
∪
∈
↑
⊂
2. S ¸ irul (An )n∈N se nume¸ste monoton descresc˘ ator dac˘ a An+1 ∞ A = n=1 An F . Not˘ am limn→∞ An = A ¸si A A. ∗
∩
∈
↓
An+1 ,
∀n≥
1. Fie
⊂ A , ∀ n ≥ 1. n
Fie
3. Limita superioar˘ a a ¸sirului (An )n∈N se define¸ste prin ∗
∞ lim sup An = ∞ n=1 k=n A k
∩ ∪
n
→∞
∈ F .
4. Limita inferioar˘ a a ¸sirului (An)n∈N se define¸ste prin ∗
∞ lim inf An = ∞ n=1 k=n A k n
→∞
∪ ∩
∈ F .
Probabilitatea are o serie de propriet˘ a¸t i fundamentale care decurg din Definit¸ia 1.5.1. Aceste propriet˘ a¸t i caracterizeaz˘ a ˆın fapt o m˘ asur˘ a finit˘ a . amp de probabilitate. Au loc urm˘ atoarele propriet˘ at ¸i Propozit¸ia 1.5.1. Fie (Ω, F , P) un cˆ
∅) = 0; P5. P(A ∪ B) = P(A) + P(B), ∀ A, B ∈ F , A ∩ B = ∅; P6. P(A ) = 1 − P(A), ∀ A ∈ F ; P4.
P(
c
12
\ B) = P(A) − P(B), ∀ A, B ∈ F , B ⊂ A; P8. P(A) ≤ P(B), ∀ A, B ∈ F , A ⊂ B; P9. P(A) ∈ [0, 1], ∀ A ∈ F ; P7.
P(A
P10. (Formula lui Poincar´e) n
∪
P(
n i=1 Ai )
=
−
( 1)
k+1
k
P( j=1 Aij );
∩
1 i1
≤
k=1
···
≤
P11. Dac˘ a (An )n≥1 este un ¸sir monoton (cresc˘ ator sau descresc˘ ator) de evenimente, cu limn→∞ An = A, atunci limn→∞ P(An ) = P(A). P12. Pentru oricare ¸sir de evenimente (An )n∈N avem ∗
∪∞
P ( n=1 An )
∞
≤
P(An ).
n=1
Demonstrat ¸ie. N∗ . P4. Presupunem, prin absurd, c˘ a P( ) = p > 0. Consider˘ am ¸sirul An = , n ∞ P(A ) = . Contradict¸ie. Conform [P 3], P( ) = P( ∞ n n=1 (An ) = n=1 P5. Alegem ¸sirul An = , n 3, A1 = A ¸si A 2 = B ¸si aplic˘am [P 3], [P 4]. P6. Relat¸ia rezult˘ a din Ac A = Ω ¸si propriet˘a¸t ile [P 2], [P 5]. P7. Se obt¸ine din A = B (A B) ¸si [P 5]. P8. Rezult˘ a din proprietatea anterioar˘ a, [P 7]. P9. Consecint¸a˘ a propriet˘ a¸t ilor [P 1], [P 2] ¸si [P 8]. P10. Formula se demonstreaz˘ a prin induct¸ie matematic˘ a. ∞ P11. Presupunem An . Avem A1 = n=1 (An An+1 ), cu (Ai Ai+1) (A j A j+1) = , i = j. Atunci P(A1 ) = ∞ a limn→∞ ∞ n=1 P (An An+1 ). Rezult˘ k=n P (Ak Ak+1 ) = 0. ∞ ∞ Dar k=n P (Ak Ak+1 ) = P ( n=1 (An An+1 )) = P(An). Deci limn→∞ P(An ) = 0 = P( ). Presupunem An A. Atunci (An A) , de unde limn→∞ P(An A) = 0 ¸si obt¸inem limn→∞ P(An) = P(A). Presupunem An A. Atunci Acn A c . Rezult˘ a limn→∞ P(Acn ) = P(Ac ), de unde obt¸inem limn→∞ P(An) = P(A). n−1 P12. Definim ¸sirul de evenimente (Bn)n≥1, B1 = A 1, Bn = A n A n, n > 1. k=1 Ak n n Avem k=1 Bk = k=1 Ak , n 1 ¸si Bi B j = , i = j. Ca urmare, conform propriet˘a¸t ilor [P 3] ¸si [P 8], avem
∅
∅ ∀ ∅
∪
∅
∪ ∅ ≥ ∪ ∪ \
↓ ∅
\ ↓ ↑
∪
∪∞
P ( n=1 An )
ceea ce trebuia demonstrat.
∞
∪ \ ∪ \ \ ↓ ∅ ↓
∀ ≥
\
= P( ∞ n=1 Bn ) =
\
∈
∩ \ \
\
\∪ ∅ ∀
∩
∪
∅
∞
n=1
P(Bn )
∞
≤ n=1
P(An ),
⊂
∀
13
1.6
Evenimente independente, evenimente condit ¸ionate
Un fenomen important studiat de teoria probabilit˘ a¸t ilor este cel al dependent¸ei (respectiv independent¸ei) evenimentelor.
Definit¸ia 1.6.1. Fie (Ω, F , P) un cˆ amp de probabilitate. Consider˘ am un eveniment A F , cu P(A) > 0. Pentru oricare eveniment B F numim probabilitatea lui B condit ¸ionat˘ a de (realizarea evenimentului) A m˘ arimea:
∈
∈
P(B
∩ A) . |A) := P(BP(A)
Evenimentele A ¸si B se numesc evenimente independente dac˘ a P(B A) = P(B), adic˘ a P(A B) = P(A) P(B). Mai general, G F se nume¸ste familie de evenimente independente dac˘ a pentru oricare evenimente distincte A1, A2 , , An G avem
∩
·
|
⊂
· ··
∈
n n
P ( i=1 Ai )
∩
=
P(Ai ).
i=1
Se constat˘ a astfel c˘ a dou˘ a evenimente sunt independente dac˘ a probabilitatea realiz˘ arii unuia dintre acestea nu este influient¸at˘ a de realizarea celuilalt. Se arat˘ a cu u¸surint¸a˘ c˘a evenimentele contrare ale unor evenimente independente sunt de asemenea independente. Pe de alt˘a parte, conceptul de evenimente condit ¸ionate permite considerarea sistemelor complete de evenimente .
Definit¸ia 1.6.2. Evenimentele Ai , i I, unde I este o mult ¸ime cel mult num˘ arabil˘ a de indici, formeaz˘ a un sistem complet de evenimente ˆın cˆ ampul de probabilitate (Ω, F , P) dac˘ a:
∈
1. Ai
∩ A = ∅, ∀ i = j j
2.
∪ ∈ A = Ω
3.
P(Ai ) > 0,
i I
i
∀ i ∈ I
amp de probabilitate, iar A i , i I , un sistem complet Propozit¸ia 1.6.1. Fie (Ω, F , P) un cˆ de evenimente. Dac˘ a A este un eveniment cu probabilitate nenul˘ a, atunci loc:
∈
1. Formula probabilit˘ at ¸ii totale P(A)
=
P(A
i I
∈
|A )P(A ) i
i
2. Formula lui Bayes P(Ak
|A) =
P(A
i I
∈
|A )P(A ) , ∀ k ∈ I . P(A|A )P(A ) k
k
i
i
14 Demonstrat ¸ie. 1. Avem A = A
∩ Ω = A ∩ (∪ ∈ A ) = ∪ ∈ (A ∩ A ) . Deoarece evenimentele A ∩ A , i ∈ I sunt incompatibile dou˘ a cˆate dou˘ a, obt¸inem P(A) = P (A ∩ A ) = P (A|A ) P (A ) , i I
i
i I
i
i
i
i I
i
i
i I
∈
∈
deci formula probabilit˘ a¸t ii totale este demonstrat˘ a. 2. Fie k I . Conform Definit¸iei 1.6.1 ¸si formulei probabilit˘ a¸tii totale, obt¸inem
∈
P(Ak
∩A ) = |A) = P(AP(A) k
deci formula lui Bayes este demonstrat˘ a.
1.7
P(A
i I
∈
|A )P(A ) , P(A|A )P(A ) k
k
i
i
Scheme clasice de probabilitate
Prezent˘ am ˆın continuare modelele de baz˘ a de cmpuri ˆ de probabilitate (discrete). 1. Cˆ ampul lui Laplace. Spat¸iul Ω este considerat o mult¸ime finit˘a, iar σ corpul F este considerat mult¸imea Ω se P(Ω) (mult¸imea submult¸imilor lui Ω). Probabilitatea unui eveniment A define¸ste prin: A P(A) = , Ω
−
⊂
| | | |
unde M reprezint˘ a num˘arul elementelor unei mult¸imi finite M . Elementele lui Ω determin˘a evenimentele elementare , echiprobabile . Astfel, pentru ω Ω, avem
| |
∈
{ω}) = n1 ,
P(
unde n = Ω .
| |
2. Cˆ amp discret de evenimente. Consider˘a m Ω = ωi : i I , unde mult¸imea de indici I este cel mult num˘ arabil˘a. Definim F = P(Ω). Consider˘ a m o m˘asur˘a de probabilitate ( pi )i∈I pe mult¸imea Ω, unde pi 0, i I ¸si i I pi = 1. Probabilitatea unui eveniment A = ω j : j J , cu J I , se define¸ste prin P(A) = p j .
⊂
{ ≥ ∀ ∈
∈ }
{
∈
∈ }
j J
∈
Modelele de mai sus se materializeaz˘ a concret ˆın scheme de probabilitate . Este vorba exemple cu un grad mare de generalitate ¸si utilizare frecvent˘ a ˆın calculul probabilit˘ at ¸ilor . Prezent˘ am ˆın continuare cele mai cunoscute scheme de probabilitate.
15 1. Schema lui Bernoulli. Este un exemplu de cˆ amp Laplace. Schema modeleaz˘ a urm˘atoarea experient¸a˘: O urn˘ a cont¸ine c bile, dintre care a sunt albe ¸si b sunt negre (a+b=c ). Se extrage o bil˘a, i se ˆınregistreaz˘ a culoarea, iar apoi se reintroduce ˆın urn˘ a. Se repet˘ a aceast˘ a experient¸a˘ de n ori. Se studiaz˘ a probabilitatea evenimentului Ak|n al aparit¸iei bilei albe de k ori ˆın cele n extrageri (cu repunerea bilei ˆın urn˘ a). Not˘am Pk|n = P Ak|n probabilitatea evenimentului ment¸ionat. Un rat¸ionament elementar ne conduce la formula de calcul
Pk|n
= C nk pk q n−k , k = 0, 1,
· ·· , n,
unde p = a/c este probabilitatea aparit¸iei unei bile la o extragere, iar q = b/c = 1 p este probabilitatea evenimentului contrar (aparit ¸ia unei bile negre).
−
Modelul este echivalent cu repetarea unei experient¸e (ˆın condit¸ii identice) de n ori ¸si studiul probabilit˘a¸t ii realiz˘arii unui anumit eveniment de k ori (din totalul de n experient¸e). Remarc˘am n
n
n
P
k=0
A k |n =
k=0
deci evenimentele Ak|n , k = 0, 1,
Pk|n =
C nk pk q n−k = (q + p)n = 1,
k=0
··· , n, reprezint˘a un sistem complet.
2. Schema multinomial˘ a. Este o extindere a schemei lui Bernoulli. Se consider˘ a o urn˘ a cont¸inˆand bile de s culori, cˆate ai bile din culoarea i Not˘am ai pi = s j=1 a j
∈ {1, 2, ··· , s}.
probabilitatea extragerii unei bile de culoarea i 1, 2, , s . Se fac n extrageri, cu repunerea bilei ˆın urn˘ a dup˘ a fiecare extragere. Fie (ki )i=1,s un vector de dimensiune s, cu componente naturale, avˆ and proprietatea si=1 ki = n. Not˘am P(ki )
∈{
i=1,s
·· · }
|n
probabilitatea evenimentului A(ki )i=1,s |n de extragere a exact ki bile de culoarea i, unde i = 1, 2, , s, din totalul de n bile extrase. Se constat˘ a c˘a
· ··
P(ki )
i=1,s
unde
|n =
n k1, k2 ,
··· , k
n k1 , k2 ,
· ·· , k
s
s
=
pk11 pk22
n! k1!k2 ! ks !
···
reprezint˘ a combin˘ arile multinomiale de n luate cˆate k1 , k2 , Avem
∈Ns ;
(ki )
s
i=1 ki =n
P(ki )
i=1,s
|n =
∈Ns ;
(ki )
s
i=1 ki =n
ks s ,
·· · p
n k1 , k2,
· ·· , k . s
·· · , k
s
pk11 pk22
· ·· p
ks s
=
16 = ( p1 + p2 + deci A(ki )i=1,s |n , cu (ki ) evenimente.
s
∈ N , astfel ca
· ·· + p ) s
s i=1
n
= 1,
ki = n, formeaz˘ a un sistem complet de
3. Schema lui Poisson. Reprezint˘ a o generalizare a schemei lui Bernoulli. Se consider˘ a n urne cu bile albe ¸si negre, dar ˆın proport¸ii diferite. Fie pi probabilitatea extragerii unei bile albe din urna i. Probabilitatea extragerii unei bile negre din urna i va fi q i = 1 pi , i = 1, 2, , n. Se extrage cˆ ate o bil˘a din fiecare urn˘ a. Se analizeaz˘ a probabilitatea evenimentului am Nn = 1, 2, Ak|n de a obt¸ine exact k bile albe din cele n extrase. Not˘ ,n . Avem pi q j . Pk|n = P Ak|n =
−
{
⊂Nn ; | I |=k i∈I
I
Observ˘am c˘a
Pk|n reprezint˘ a
· ·· ·· · }
j
∈Nn \I
coeficientul lui xk al polinomului
f (x) = ( p1 x + q 1 ) ( p2x + q 2 ) Evident,
··· ( p x + q ) . n
n
n
k=0
deci evenimentele Ak|n , k = 0, 1,
Pk|n = f (1)
= 1,
··· , n, reprezint˘a un sistem complet.
4. Schema geometric˘ a. Schema este un exemplu de cˆ amp discret de evenimente. Astfel, se repet˘ a continuu o experient¸a˘, ˆın condit¸ii identice, urm˘ arindu-se de fiecare dat˘ a realizarea unui anumit eveniment A. Fie P(A) = p. Consider˘ am momentul ˆın care evenimentul A se realizeaz˘a pentru prima dat˘ a . Fie n N∗ . Probabilitatea ca evenimentul A s˘a se realizeze pentru prima dat˘ a ˆın cea de a n-a experient¸a˘ este
∈
pn = pq n−1 , unde q = 1
− p. Avem
∞
∞
pn =
n=1
pq n−1 = p
n=1
∞
q k =
k=0
p
1
− q = 1.
5. Schema hipergeometric˘ a. Se consider˘ a o urn˘a cu N bile, dintre care a bile sunt albe iar restul de b bile sunt negre (a +b = N ). Se extrag n bile (f˘ar˘a a le repune ˆın urm˘a dup˘ a fiecare extragere). Not˘am pk|n probabilitatea evenimentului Ak|n de a avea exact k bile albe ˆıntre cele n bile extrase. Presupunem n N, k a ¸si n k b. Atunci
≤
≤
− ≤
C ak C bn−k pk|n = . n C N
Conform unei formule combinatoriale binecunoscute, obt¸inem min a,n
min a,n
{ }
k=max 0,n b
pk|n =
{ −}
{ }
k=max 0,n b
{ −}
C ak C bn−k = 1, n C N
17 deci Ak|n, max 0, n mente.
{
− b} ≤ k ≤ min{a, n}, formeaz˘a un sistem complet de eveni-
6. Schema hipergeometric˘ a generalizat˘ a. Se consider˘ a o urn˘a cu N bile de s culori. Fie ai num˘arul de bile de culoarea i, i = 1, 2, , s. Avem deci si=1 ai = N . Se extrag, f˘ ar˘a repunere, n bile. Consider˘ am s s N , cu vectorul (ki ) ıncˆ at ki ai , i = 1, 2, , s. Atunci i=1 ki = n, astfel ˆ probabilitatea extragerii a k i bile din culoarea i, pentru fiecare i 1, 2, , s , este
···
∈
≤
C ak11 C ak22 C akss p(ki ) = . n C N
···
∈{
· ··
··· }
18
1.8
Rezumat
ˆIn teoria probabilit˘ a¸tilor, evenimentele rezultate ˆın urma unei experient ¸e sunt interpretate ca o familie de submult¸imi ale evenimentului sigur, mult¸imea Ω. Mult¸imea evenimentelor formeaz˘a un σ corp (borelian). O mult¸ime nevid˘a F Ω se nume¸ste σ corp a lui Ω daca satisface urm˘ atoarele condit¸ii:
−
⊂
−
σ1 . Ac
∈ F , ∀ A ∈ F ; σ . dac˘ a A ∈ F , ∀n ∈ N∗ atunci ∪∞ 2
n=1 An
n
∈ F .
Perechea (Ω, F ) se nume¸ste spat¸iu m˘asurabil sau cˆamp de evenimente. Borelianul lui Ω = R, notat BR este σ corpul generat de mult¸imile deschise (topologia lui R), adic˘a cel mai mic σ corp a lui R care include mult¸imile deschise. BR cont¸ine toate tipurile de intervale ¸si este generat de oricare tip de intervale reale. Fie (Ω, F ) ¸si (Ω , F ) o pereche de spat¸ii m˘asurabile (cˆ ampuri de evenimente). O funct¸ie f : Ω Ω se nume¸ste funct ¸ie m˘ asurabil˘ a dac˘ a
−
−
→
f −1 (A) F ,
∈
∀ A ∈ F ,
unde f −1 (A) = ω Ω f (ω A . ˆIn particular, dac˘ a Ω = R ¸si F = BR, funct¸ia f se va numi funct ¸ie real˘ a m˘ asurabil˘ a . R, avem: Pentru o funct¸ie real˘ a m˘asurabil˘a f : Ω
{ ∈ |
∈ }
→ • {f ≤ a} := f − ((−∞, a]) ∈ F , ∀ a ∈ R • {f > a} := f − ((a, ∞)) ∈ F , ∀ a ∈ R • {a ≤ f ≤ b} := f − ([a, b]) ∈ F , ∀ a, b ∈ R, a < b. 1
1
1
R sunt funct Dac˘a f, g : Ω ¸ii reale m˘asurabile ¸si a R atunci funct¸iile reale f + a, af, f , f + g, fg, min f, g ¸si max f, g sunt m˘asurabile. Fie (Ω, F ) un spat¸iu m˘asurabil, cu σ corpul F denumit ”mult¸imea evenimentelor”. O funct¸ie P : F R se nume¸ste probabilitate dac˘ a satisface urm˘ atoarele axiome:
→
||
→ P1. P(A) ≥ 0, ∀ A ∈ F ; P2.
P(Ω)
{ }
∈
{ } −
= 1;
P3. Pentru oricare ¸sir de evenimente (An )n∈N , cu A n Am = ,
∩
∗
∞ P (∪n=1 An ) =
∞
P(An ).
n=1
Tripletul (Ω, F , P) se nume¸ste cˆ amp de probabilitate. Probabilitatea are propriet˘ a¸tile:
∅) = 0; P5. P(A ∪ B) = P(A) + P(B), ∀ A, B ∈ F , A ∩ B = ∅; P4.
P(
∅ ∀ n = m, are loc relat¸ia
19 P(Ac )
− P(A), ∀ A ∈ F ; P7. P(A \ B) = P(A) − P(B), ∀ A, B ∈ F , B ⊂ A; P8. P(A) ≤ P(B), ∀ A, B ∈ F , A ⊂ B; P9. P(A) ∈ [0, 1], ∀ A ∈ F ; P6.
=1
P10. (Formula lui Poincar´e) n
∪
P(
n i=1 Ai )
−
=
( 1)
k+1
k
P( j=1 Aij );
1 i1
≤
k=1
···
≤
∩
P11. Dac˘ a (An)n≥1 este un ¸sir monoton (cresc˘ ator sau descresc˘ ator) de evenimente, cu limn→∞ An = A, atunci limn→∞ P(An) = P(A). P12. Pentru oricare ¸sir de evenimente (An )n∈N avem ∗
∞ P (∪n=1 An ) ≤
∞
P(An ).
n=1
Consider˘am un eveniment A F , cu P(A) > 0. Pentru oricare eveniment B numim probabilitatea lui B condit¸ionat˘ a de (realizarea evenimentului) A m˘arimea:
∈
P(B
∈ F ,
∩ A) . |A) := P(BP(A)
Evenimentele A ¸si B se numesc independente dac˘ a P(B A) = P(B), adic˘a P(A B) = P(A)P(B). Mai general, G F se nume¸ste familie de evenimente independente dac˘ a pentru oricare evenimente distincte A1 , A2 , , An G avem
|
⊂
···
∈
n
n
P ( i=1 Ai )
∩
∩
=
P(Ai ).
i=1
Astfel, dou˘a evenimente sunt independente dac˘ a probabilitatea realiz˘ arii unuia dintre acestea nu este influient¸at˘a de realizarea celuilalt. Evenimentele Ai , i I , unde I este o mult¸ime cel mult num˘rabil˘a de indici, formeaz˘ a un sistem complet de evenimente ˆın cˆ ampul de probabilitate (Ω, F , P) dac˘ a:
∈
1. Ai
∩ A = ∅, ∀ i = j j
2.
∪ ∈ A = Ω
3.
P(Ai ) > 0,
i I
i
∀ i ∈ I
Dac˘a A este un eveniment cu probabilitate nenul˘ a (neneglijabil), atunci loc: 1. Formula probabilit˘ a¸t ii totale P(A)
=
i I
∈
P(A
|A )P(A ) i
i
20 2. Formula lui Bayes P(Ak
|A) =
|A )P(A ) , ∀ k ∈ I . P(A|A )P(A )
P(A
i I
∈
k
k
i
i
Modelele de baz˘ a de cmpuri ˆ de probabilitate discrete: 1. Cˆ ampul lui Laplace. Spat¸iul Ω este considerat o mult¸ime finit˘a, iar σ corpul F este considerat mult¸imea Ω se P(Ω) (mult¸imea submult¸imilor lui Ω). Probabilitatea unui eveniment A define¸ste prin: A P(A) = , Ω
−
⊂
| | | |
unde M reprezint˘ anum˘ arul elementelor unei mult¸imi finite M . Elementele lui Ω determin˘a evenimentele elementare , echiprobabile . Astfel, pentru ω Ω, avem
| |
∈
{ω}) = n1 ,
P(
unde n = Ω .
| |
2. Cˆ amp discret de evenimente. Consider˘a m Ω = ωi : i I , unde mult¸imea de indici I este cel mult num˘ arabil˘a. Definim F = P(Ω). Consider˘ a m o m˘asur˘a de probabilitate ( pi )i∈I pe mult¸imea Ω, unde pi 0, i I ¸si i I pi = 1. Probabilitatea unui eveniment A = ω j : j J , cu J I , se define¸ste prin P(A) = p j .
⊂
{ ≥ ∀ ∈
∈ }
{
∈
∈ }
j J
∈
Schemele de probabilitate reprezint˘ a modele/exemple cu un grad mare de generalitate
ˆın calculul probabilit˘ at ¸ilor . 1. Schema lui Bernoulli. Este un exemplu de cˆ amp Laplace. Schema modeleaz˘ a urm˘atoarea experient¸a˘: O urn˘ a cont¸ine c bile, dintre care a sunt albe ¸si b sunt negre (a+b=c ). Se extrage o bil˘a, i se ˆınregistreaz˘ a culoarea, iar apoi se reintroduce ˆın urn˘ a. Se repet˘ a aceast˘ a experient¸a˘ de n ori. Se studiaz˘ a probabilitatea evenimentului Ak|n al aparit¸iei bilei albe de k ori din cele n extrageri (cu repunerea bilei ˆın urn˘ a). Not˘am Pk|n = P Ak|n probabilitatea evenimentului ment¸ionat. Avem
Pk|n
= C nk pk q n−k , k = 0, 1,
· ·· , n,
unde p = a/c este probabilitatea aparit¸iei unei bile la o extragere, iar q = b/c = 1 p este probabilitatea evenimentului contrar (aparit ¸ia unei bile negre).
−
2. Schema multinomial˘ a. Este o extindere a schemei lui Bernoulli. Se consider˘ a o urn˘ a cont¸inˆand bile de s culori, cˆate ai bile din culoarea i Not˘am ai pi = s j=1 a j
∈ {1, 2, ··· , s}.
21 probabilitatea extragerii unei bile de culoarea i 1, 2, , s . Se fac n extrageri, cu repunerea bilei ˆın urn˘ a dup˘ a fiecare extragere. Fie (ki )i=1,s un vector de dimensiune s, cu componente naturale, avˆ and proprietatea si=1 ki = n. Not˘am
∈{
P(ki )
i=1,s
·· · }
|n
probabilitatea evenimentului A(ki )i=1,s |n de extragere a exact ki bile de culoarea i, unde i = 1, 2, , s, din totalul de n bile extrase. Avem
· ··
P(ki )
i=1,s
unde
|n =
n k1, k2 ,
··· , k
n k1 , k2 ,
· ·· , k
s
s
=
pk11 pk22
ks s ,
·· · p
n! k1!k2 ! ks !
···
reprezint˘ a combin˘ arile multinomiale de n luate cˆate k1 , k2 ,
· ·· , k . s
3. Schema lui Poisson. Reprezint˘ a o generalizare a schemei lui Bernoulli. Se consider˘ a n urne cu bile albe ¸si negre, dar ˆın proport¸ii diferite. Fie pi probabilitatea extragerii unei bile albe din urna i. Probabilitatea extragerii unei bile negre din urna i va fi q i = 1 pi , i = 1, 2, , n. Se extrage cˆ ate o bil˘a din fiecare urn˘ a. Se analizeaz˘ a probabilitatea evenimentului Ak|n de a obt¸ine exact k bile albe din cele n extrase. Not˘ am Nn = 1, 2, ,n . Avem Pk|n = P Ak|n = pi q j .
−
{
⊂Nn ; | I |=k i∈I
I
Observ˘am c˘a
a Pk|n reprezint˘
· ·· ·· · }
j
∈Nn \I
coeficientul lui xk al polinomului
f (x) = ( p1 x + q 1 ) ( p2x + q 2 )
··· ( p x + q ) . n
n
4. Schema geometric˘ a. Schema este un exemplu de cˆ amp discret de evenimente. Astfel, se repet˘ a continuu o experient¸a˘, ˆın condit¸ii identice, urm˘ arindu-se de fiecare dat˘ a realizarea unui anumit eveniment A. Fie P(A) = p. Consider˘ am momentul ˆın care evenimentul A se ∗ realizeaz˘a pentru prima dat˘ a . Fie n N . Probabilitatea ca evenimentul A s˘a se realizeze pentru prima dat˘ a ˆın cea de a n-a experient¸a˘ este
∈
pn = pq n−1 , unde q = 1
− p.
5. Schema hipergeometric˘ a. Se consider˘ a o urn˘a cu N bile, dintre care a bile sunt albe iar restul de b bile sunt negre (a +b = N ). Se extrag n bile (f˘ar˘a a le repune ˆın urm˘a dup˘ a fiecare extragere). Not˘am pk|n probabilitatea evenimentului Ak|n de a avea exact k bile albe ˆıntre cele n bile extrase. Presupunem n N, k a ¸si n k b. Atunci
≤
≤
− ≤
C ak C bn−k pk|n = . n C N
22
1.9
Test
1. Definit¸i not¸iunea de evenimente condit¸ionate. Enunt¸ati ¸si demonstrat¸i formula probabilit˘a¸t ii totale. 2. Aplicat¸i formula lui Poincar´e pentru n evenimente independente, echiprobabile, de probabilitate p (0, 1).
∈
3. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si evenimentele A, B F . S¸tiind c˘a P(A) = 1/5, P(B) = 3/5 ¸si P(A B) = 1/10, s˘a se calculeze probabilit˘ a¸tile:
∩
∈
∪ B); (b) P(A ∩ B); (c) P(A|B) = P (a)
P(A
B (A).
4. Un sportiv trage la o ¸t int˘a cu 5 pu¸sti diferite, cu probabilit˘ a¸t ile respective de ochire: p1 = 0, 8, p2 = 0, 7, p3 = 0, 4, p4 = 0, 9 ¸si p5 = 0, 5. S˘a se calculeze: (a) probabilitatea ca ¸tinta s˘ a fie nimerit˘a de exact 3 ori; (b) probabilitatea ca ¸tinta s˘ a nimerit˘ a cel put¸in o data. 5. Un portar ap˘ ar˘a o lovitur˘ a de la 11 metri cu probabilitatea p = 0, 3. La finalul unui meci, se execut˘ a 5 lovituri de la 11 metri. (a) Care este probabilitatea ca portarul respectiv s˘ a apere exact 2 lovituri? (b) Care este cel mai probabil num˘ ar de goluri primite? 6. Care este probabilitatea de a nimeri exact doua numere la jocul Loto 6 din 49 , dac˘a se joac˘ a o singur˘a variant˘ a? 7. Un baschetbalist execut˘ a arunc˘ ari de la distant¸a˘ la un panou de baschet, pˆ an˘a la prima reu¸sit˘ a. S¸tiind c˘a ¸sansa de reu¸sit˘ a a fiec˘ arei arunc˘ a ri este de 20%, s˘ a se determine probabilitatea ca sportivul s˘ a ˆınscrie primul co¸s din a patra aruncare. Care este cel mai probabil num˘ ar de arunc˘ ari pˆan˘a la prima reu¸sit˘a?
Capitolul 2 Variabile aleatoare. Caracteristici numerice 2.1
Introducere
2.2
Variabile aleatoare
Variabilele aleatoare se interpreteaz˘ a ca o ”enumerare” a rezultatelor (m˘ asurabile) potent¸iale ale unui anumit experiment. Fiecare din aceste rezultate posibile are o probabilitate de realizare. Definit¸ia de mai jos formalizeaz˘a matematic un experiment cu rezultate aleatoare, predictibile. amp de probabilitate. O funct ¸ie m˘ asurabil˘ a real˘ a Definit¸ia 2.2.1. Fie (Ω, F , P) un cˆ R se nume¸ X : Ω ste variabil˘ a aleatoare (real˘ a).
→
Conform definit¸iei, pentru o variabil˘a aleatoare X definit˘ a pe cˆampul de probabilitate (Ω, F , P), avem X I F ,
{ ∈ } ∈
pentru orice interval real I . In particular,
{X ∈ (−∞, a]} = {X ≤ a} ∈ F , ∀ a ∈ R.
Probabilit˘a¸t ile evenimentelor descrise mai sus ofer˘ a o informat¸ie fundamental˘ a privind variabila aleatoare. ˆIn fapt, cunoa¸sterea probabilit˘ a¸tile evenimentelor X a , a R, ofer˘a o informat¸ie precis˘ a privind distribut¸ia valorilor variabilei aleatore X . ˆIn sect¸iunea urm˘atoare, va fi introdus˘ a ¸si caracterizat˘ a funct ¸ia de repartit ¸ie a a unei variabile aleatoare, construit˘a pe baza probabilit˘ a¸t ilor ment¸ionate. O mult¸ime finit˘a de variabile aleatoare definite pe acela¸si cˆ amp de probabilitate va determina un vector aleator. Mai precis, avem urm˘ atoarea definit¸ie.
{ ≤ } ∈
Definit¸ia 2.2.2. Fie d > 1 un num˘ ar ˆıntreg ¸si (Ω, F , P) un cˆ amp de probabilitate. Cond sider˘ am borelianul BRd spat ¸iului R ( σ corpul generat de topologia lui Rd ). O funct ¸ie d R , (F , BRd ) m˘ X : Ω asurabil˘ a, se nume¸ste vector aleator.
−
→
Fie X i , i = 1, 2, , d, componentele scalare ale funct¸iei X , deci X = (X 1 , X 2 , Conform definit¸iei de mai sus,
·· ·
d
{X ≤ a , X ≤ a , ··· , X ≤ a } ∈ F , ∀ (a , a , ··· , a ) ∈ R . 1
1
2
2
d
d
23
1
2
d
··· , X ). d
24
2.3
Funct¸ia de repartit¸ie
Distribut¸ia valorilor unei variabile aleatoare reale este caracterizat˘ a prin not¸iunea de funct¸ie de repartit¸ie. De regul˘ a , cˆampul de probabilitate pe care este definit˘ a variabila aleatoare nu este ment¸ionat ˆın mod explicit.
Definit¸ia 2.3.1. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si X : Ω Funct ¸ia real˘ a F : R [0, 1], definit˘ a prin
→
→ R o variabil˘ aaleatoare.
F (x) = P X x = P( ω
{ ∈ Ω : X (ω) ≤ x}), x ∈ R,
{ ≤ }
se nume¸ste funct ¸ia de repartit ¸ie a variabilei aleatoare X . Propozit¸ia urm˘ atoare grupeaz˘ a propriet˘ a¸t ile de baz˘ a ale unei funct¸ii de repartit¸ie. ¸ia de repartit ¸ie a unei variabilei aleatoare X . Propozit¸ia 2.3.1. Fie F : R [0, 1] funct Au loc urm˘ atoarele propriet˘ at ¸i cu caracter general.
→
1. F este monoton cresc˘ atoare pe R; 2. F este continu˘ a la dreapta pe mult ¸imea R ( F (x + 0) := lim F (t) = F (x), t x
↓
3. lim F (x) = 0; x
→−∞
4. F (x
∀ x ∈ R);
lim F (x) = 1;
x
→∞
F (t) = P{X < x}, ∀ x ∈ R; − 0) := lim ↑ 5. P{X = x } = F (x) − F (x − 0), ∀ x ∈ R; 6. P{a < X ≤ b } = F (b) − F (a), ∀ a, b ∈ R, cu a < b; 7. P{X > x} = 1 − F (x), ∀ x ∈ R. t x
Demonstrat ¸ie. Fie (Ω, F , P) un cˆ ampul de probabilitate pe care este definit˘ avariabila aleatoare X . R, cu x1 < x2 . Avem X 1. Fie x1 , x2 x1 X x2 , de unde P X x1 P X x 2 , sau F (x1 ) F (x2 ). 2. Fiind monoton cresc˘ atoare pe R, funct¸ia F admite limite laterale finite pe R. Mai precis, pentru x anga ˆın x este F (x 0) = suptx F (t). Evident,
{ ≤ }
∈
{ ≤ } ⊂ { ≤ }
≤
∈
{ ≤ }≤
−
F (x
− 0) ≤ F (x) ≤ F (x + 0), ∀ x ∈ R. Fix˘am x ∈ R, arbitrar. Not˘am A = X ≤ x + ∈ F , N ∈ N∗ . Fie A = {X ≤ x }. Avem A = ∩∞ A ¸si A ↓ A. Conform Propozit¸iei 1.5.1, avem lim →∞ P(A ) = P(A). Dar, n
n=1
n
n
1 n
n
1 n
n
= F (x) ¸si limn→∞ P(An ) = limn→∞ F x + = F (x+0). Obt¸inem F (x+0) = F (x), deci F este continu˘ a la dreapta ˆın x. 3. Conform monotoniei, F admite limite finite la ¸si . Astfel, lim F (x) = P(A)
∞ −∞ →−∞ = {X ≤ − n}, C {X ≤ n}, n ∈ N∗ . x
inf F (x)
F (x) = sup F (x) ≤ 1. Fie B ≥ 0 ¸si lim →∞ ∈ Avem B ↓ ∅, respectiv C ↑ Ω. Ca urmare, lim F (x) = lim F (−n) = lim P(B ) = P(∅) = 0, →−∞ →∞ →∞ x
∈R
x
x
n
n
R
n
n
x
n
n
n
25 respectiv lim F (x) = lim F (n) = lim
x
n
→∞
n
→∞
→∞
P(C n )
= P(Ω) = 1.
4. Fie x R, arbitrar, fixat. Conform propriet˘ at¸ilor unei funct¸ii monoton cresc˘ atoare ¸si Propozit¸iei 1.5.1, avem
∈
F (x
F (t) = lim F − 0) = lim →∞ ↑ n
t x
− 1 n
x
= lim
P
n
→∞
≤ − 1 n
X x
=P X
{
}
5. Pentru x
∈ R, avem P{X = x } = P({X ≤ x } \ {X < x}) = P{X ≤ x } − P{X < x} = F (x) − F (x − 0). 6. Fie a, b ∈ R, a < b. Avem {a < X ≤ b } = {X ≤ b } \ {X ≤ a } ¸si {X ≤ a } ⊂ {X ≤ b }. Atunci, conform Propozit¸iei 1.5.1,
{a < X ≤ b} = P{X ≤ b} − P{X ≤ a} = F (b) − F (a). 7. Fie x ∈ R. Avem P{X > x} = P{X ≤ x } = 1 − P{X ≤ x } = 1 − F (x). Din propozit¸ia de mai sus rezult˘a c˘a, dac˘ a F este continu˘ a ˆın x ∈ R, atunci P{X = x } = 0. Ment¸ion˘ a m c˘a, reciproc, orice funct¸ie F : R → [0, 1] care satisface propriet˘ a¸tile P
c
0
0
1-3 din Propozit¸ia 2.3.1 este funct¸ia de repartit¸ie a unei anumite variabile aleatoare. Dou˘ a sau mai multe variabile aleatore care admit o funct¸ie de repartit¸ie comun˘ a vor fi denumite identic distribuite . De asemenea, putem defini funct¸ia de repartit¸ie a unui vector aleator, avˆ and propriet˘ a¸ti generale apropiate de cele ale funct¸iei de repartit¸ie a unei variabile aleatoare.
Definit¸ia 2.3.2. Fie X = (X 1 , X 2 , repartit ¸ie prin F : Rd [0, 1],
→
F (x1, x2,
··· , X ) un vector aleator. d
Definim funct ¸ia sa de d
·· · , x ) = P{X ≤ x , X ≤ x , ··· , X ≤ x }, (x , x , ··· , x ) ∈ R . d
1
1
2
2
d
d
1
2
d
. O not¸iune important˘ a este independent ¸a variabilelor aleatoare , definit˘a mai jos.
Definit¸ia 2.3.3. Variabilele aleatoare X i , i I , definite pe un cˆ amp de probabilitate (Ω, F , P), se numesc independente dac˘ a, pentru oricare oricare indici distinct ¸i i 1 , i2, , in din mult ¸imea I ¸si oricare A1 , A2 , , An B R are loc
∈
·· ·
··· ∈ P{X ∈ A , X ∈ A , ··· , X ∈ A } = P{X ∈ A }P{X ∈ A }··· P{X ∈ A }. ˆIn particular, dac˘ a variabilele aleatoare X , X , ··· , X , avˆand, respectiv, funct¸iile de repartit¸ie F , F , · ·· , F , sunt independente, atunci P{X ≤ a , X ≤ a , ··· , X ≤ a } = F (a )F (a ) ··· F (a ), ∀ a , a , · ·· , a ∈ R. i1
1
1
1
i2
2
2
1
in
n
i1
1
2
1
2
1
i2
2
in
n
n
n
2
2
n
n
1
2
n
n
1
2
n
Are loc urm˘ atorul rezultat de baz˘ a privind suma a dou˘a variabile aleatoare independente.
26 and funct ¸iile de repartit ¸ie Propozit¸ia 2.3.2. Fie variabilele aleatoare independente X ¸si Y, avˆ F ¸si respectiv G. Atunci funct ¸ia de repartit ¸ie a variabilei aleatoare Z = X + Y este H = F G, unde
∗
(F G)(x) =
∗
∞
F (x
−∞
− t)dG(t), ∀ x ∈ R.
Variabilele aleatoare cu valori ˆıntr-o mult¸ime cel mult num˘ arabil˘a se numesc discrete . Variabilele aleatoare cu funct¸ia de repartit¸ie derivabil˘a, cu derivata continu˘ a, se numesc continue . In sect¸iunea urm˘ atoare vom discuta aceste tipuri particulare, dar deosebit de importante, de variabile aleatoare. Vom ilustra cele dou˘ a tipuri de variabile aleatoare (discrete ¸si continue) prin exemple clasice, semnificative.
2.4
Variabile aleatoare discrete. Exemple clasice
ˆIn continuare, definim, caracteriz˘am ¸si exemplific˘ am variabilele aleatoare de tip discret. amp de probabilitate ¸si X : Ω a aleatoare. Definit¸ia 2.4.1. Fie (Ω, F , P) un cˆ R o variabil˘ X se nume¸ste variabil˘ a aleatoare discret˘ a dac˘ a mult ¸imea X (Ω) este cel mult num˘ arabil˘ a.
→
R, unde I este o mult Fie X ( Ω) = xi , i I ¸ime de indici cel mult num˘ arabil˘a. Not˘am Ai = X = xi I . Remarc˘ a m c˘a familia de evenimente Ai , i I F , i reprezint˘ a o partit¸ie a spat¸iului Ω. R funct Pentru A F , not˘am prin cA : Ω ¸ia caracteriatic˘ a a mult¸imii A, definit˘a prin 1, ω A cA (ω) = . 0, ω Ω A = A c
{ ∈
{
∈ } ⊂ }∈ ∈
{
∈ }
→
∈ ∈ \
Este elementar de verificat faptul c˘ a funct¸ia caracteristic˘ a a unui eveniment este o variabil˘a aleatoare. Are loc urm˘ atoarea reprezentare a variabilei aleatoare discrete X : X =
xi cAi .
i I
∈
Notu˘am p i = P(Ai ), i I . Avem pi 0, i I ¸si i∈I pi = 1. Distribut¸ia variabilei aleatoare X se reprezint˘ a convent¸ional astfel:
∈
≥ ∀ ∈ X :
xi pi
. i I
∈
Fie variabilele aleatoare discrete, independente, X ¸si Y , cu distribut¸iile X :
xi pi
, Y : i I
∈
y j p j
.
j J
∈
Atunci variabila aleatoare X + Y va avea distribut¸ia X + Y :
xi + y j pi p j
Exemplul 2.4.1. Variabile aleatoare Bernoulli.
. (i,j) I J
∈×
27 O variabil˘a aleatoare Bernoulli X ia doar dou˘ a valori: valoarea 1, cu probabilitatea p (0, 1) ¸si valoarea 0, cu probabilitatea q = 1 p. Distribut¸ia lui X se reprezint˘ a astfel:
∈
−
X :
0 1 q p
.
Not˘am X Bin(1, p).
∼
Exemplul 2.4.2. Variabile aleatoare binomiale. N∗ ¸ O variabil˘a aleatoare binomial˘ a X , de parametrii n si p (0, 1) ia valorile k k n−k k 0, 1, , n cu probabilit˘a¸tile p k = C n p q . Distribut¸ia lui X se reprezint˘ a astfel:
∈ {
∈
· ·· }
X :
··· ···
0 1 2 0 n 1 n−1 2 2 n−2 C n q C n pq C n p q
∈
n n n C n p
.
Variabila aleatoare binomial˘ a indic˘a num˘arul de realiz˘ ari ale unui eveniment avˆand probabilitatea p ˆın n experient¸e identice, independente (schema binomial˘ a - Bernoulli). Not˘am X Bin(n, p). Este important de remarcat c˘ a o variabil˘a aleatoare binomial˘ a de parametrii (n, p) este suma a n variabile aleatoare Bernoulli independente, identic distribuite (de parametru p).
∼
Exemplul 2.4.3. Variabile aleatoare Poisson. O variabil˘a aleatoare Poisson de parametru λ ia valoarea n cu probabilitatea pentru n N, avˆand deci distribut¸ia:
∈
X :
n λn −λ e n!
λn e λ, n!
−
. n
∈N
Not˘am X Poiss(λ).
∼
Exemplul 2.4.4. Variabile aleatoare geometrice. O variabil˘a aleatoare geometric˘ a X de parametru p ia valoarea n cu probabilitatea pq n−1 , pentru n N∗ , unde q = 1 p. X are distribut¸ia:
∈
−
X :
n pq n−1
.
n
∗
∈N
Not˘am X Geom( p). Variabila X indic˘a num˘arul de experient¸e, independente, identice, necesar realiz˘ arii (aparit¸iei) unui eveniment care are probabilitatea p de realizare ˆın cadrul fiec˘arei experient¸e (schema geometric˘ a).
∼
2.5
Variabile aleatoare de tip continuu. Exemple clasice
Un tip important de variabile aleatoare sunt cele de tip continuu.
28 amp de probabilitate ¸si X : Ω a aleatoare Definit¸ia 2.5.1. Fie (Ω, F , P) un cˆ R o variabil˘ avˆ and funct ¸ia de repartit ¸ie F : R [0, 1], F (x) = P X x . X se nume¸ste variabil˘ a aleatoare de tip continuu dac˘ a exist˘ a o funct ¸ie continu˘ a f : R [0, ) cu proprietatea
→ { ≤ } → ∞
→
x
F (x) =
f (t) dt,
∀ x ∈ R.
−∞
Funct ¸ia f se nume¸ste funct ¸ia de densitate (sau densitatea de probabilitate) a variabilei aleatoare X . Propriet˘a¸t ile densit˘ a¸t ii unei variabile aleatoare reale sunt evident¸ite ˆın propozit¸ia de mai jos.
Propozit¸ia 2.5.1. Fie f : R aleatoare de tip continuu X : Ω Atunci:
→ [0, ∞) funct ¸ia de densitate asociat˘ a unei variabile → R. Not˘ am F : R → [0, 1] funct ¸ia sa de repartit ¸ie.
1. F este de clas˘ a C1 pe R, cu F (x) = f (x), 2.
R
∀ x ∈ R;
f (t) dt = 1;
{X = x} = 0, ∀ x ∈ R; 4. P{a ≤ X ≤ b } = f (t) dt, ∀ [a, b] ⊂ R. 3.
P
b a
Demonstrat ¸ie. 1. Conform definit¸iei, F este o primitiv˘ a a lui f pe 2.
{ ≤ R
x
f (t) dt = lim x
→∞ −∞
R.
f (t) dt = lim F (x) = 1. x
3. F este continu˘ a pe R, deci 4. P a X b = P X b b = a f (t) dt, [a, b] R.
→∞
{X = x} = F (x) − F (x − 0) = 0, ∀ x ∈ R. ≤ } { ≤ } − P{X < a} = P{X ≤ b} − P{X ≤ a} = F (b) − F (a) = ∀ ⊂ Fie variabilele aleatoare continue, independente, X ¸si Y , cu densit˘ a¸tiile f, g : R → [0, 1]. Din Propozit¸ia 2.3.2 se deduce c˘ a variabila aleatoare X + Y are densitatea f ∗ g, unde f g : R
∗
P
→ [0, ∞), (f ∗ g)(x) =
R
f (x
− t)g(t) dt, ∀ x ∈ R,
este convolut¸ia densit˘ a¸tilor f ¸si g. Vom prezenta ˆın continuare cˆ ateva exemple clasice de repart¸it¸ii continue. ¸ia normal˘ a. Exemplul 2.5.1. Distribut Este cel mai important exemplu de distribut¸ie de tip continuu. Astfel, spunem c˘ ao variabil˘a aleatoare real˘ a X are o repartit a ¸ie normal˘ a (gaussian˘ a) de parametrii 0 ¸si 1 dac˘ are funct¸ia de densitate: 1 − t2 ϕ(t) = e 2, t R. 2π
√
∀ ∈
29 Variabila normal˘ a (standard) X admite funct¸ie de repartit¸ie: Φ(x) =
x t2 1 − e 2 dt, 2π −∞
√
∀ x ∈ R.
Not˘am X N (0, 1). Distribut¸ia normal˘ a standard este legea limit˘ a universal˘ a , conform Teoremei limit˘ a central˘ a .
∼
Generalizare. X N (µ, σ 2 ), unde µ R, σ > 0, dac˘a admite densitatea de probabilitate (t µ)2 1 − ϕ(t) = e 2σ2 , t R. σ 2π
∈
∈ √
−
∀ ∈
Exemplul 2.5.2. Distribut ¸ia exponent ¸ial˘ a. Variabila aleatoare X are o distribut¸ie exponent¸ial˘ a de parametru λ > 0, notat prin X Exp(λ), dac˘ a ia valori ˆın intervalul [0, ) (deci este o variabil˘ a aleatoare pozitiv˘ a ) ¸si admite funct¸ia de repartit¸ie
∼
∞
F (x) = 1
λx
− e− , ∀ x ≥ 0.
Distribut¸ia exponent¸ial˘ a este fundamental˘ a ˆın teoria fiabilit˘a¸tii, caracterizˆ and modelele de tip Markov.
Exemplul 2.5.3. Distribut ¸ia Gama. Variabila aleatoare X are o distribut¸ie Gama de parametrii α, β > 0, notat prin X Gama(α, β ), dac˘ a ia valori ˆın intervalul (0, ) ¸si admite funct¸ia de densitate
∼
∞
x
xα−1 e− β f (x) = α , β Γ(α) unde Γ(α) =
∞
∀ x > 0,
xα−1 e−x dx
0
este funct¸ia lui Euler de prima spet¸a˘. ˆIn statistic˘ a, distribut¸ia de tip Gam(n/2, 2), cu n major˘a.
2 n
∈ N∗, notat˘a prin χ , are o important¸a˘
Exemplul 2.5.4. Distribut ¸ia Beta. Variabila aleatoare X are o distribut¸ie Beta de parametrii α, β > 0, notat prin X a ia valori ˆın intervalul (0, 1) ¸si admite funct¸ia de densitate Beta(α, β ), dac˘
∼
xα−1 (1 x)β −1 f (x) = , B(α, β )
−
unde
1
B(α, β ) =
xα−1 (1
0
este funct¸ia lui Euler de a doua spet¸a˘.
∀ x ∈ (0, 1),
) − x) − dx = Γ(α)Γ(β Γ(α + β ) β 1
30
2.6
Media. Medii de ordin superior
Pentru o variabil˘ a aleatoare real˘ a, media ¸si dispersia reprezint˘ a cele mai importante caracteristici numerice. Astfel, media unei variabile aleatoare (dac˘ a exist˘a) indic˘acea mai a¸steptat˘a valoare a variabilei aleatoare.
Definit¸ia 2.6.1. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si X : Ω avˆ and funct ¸ia de repartit ¸ie F : R [0, 1]. M˘ arimea:
→
E(X )
:=
∞
→ R o variabil˘ aaleatoare
x dF (x)
−∞
se nume¸ste media lui X . Media este definit˘ a ˆın ipoteza c˘ a integrala de tip Stieltjes-Riemann de mai sus este convergent˘ a. Calculul mediei se expliciteaz˘ a astfel: 1. pentru o variabil˘ a aleatoare X de tip discret, cu distribut¸ia X : devine E(X )
=
xi pi
, media
i I
∈
xi pi ;
i I
∈
2. pentru o variabil˘ a aleatoare X de tip continuu, cu funct¸ia de densitate f : [0, ), media devine
∞
E(X )
:=
∞
R
→
xf (x) dx.
−∞
Urm˘atoarea propozit¸ie stabile¸ste propriet˘a¸t ie de baz˘ a ale mediei variabilelor aleatoare.
Propozit¸ia 2.6.1. Fie X ¸si Y dou˘ a variabile aleatoare cu medie finit˘ a. 1.
E(aX )
= a E(X ),
∀ a ∈ R;
2.
E(X +
Y ) = E(X ) + E(Y );
3. dac˘ a X ¸si Y sunt independente, atunci E(XY ) = E(X )E(Y ). Demonstrat ¸ie. Vom trata doar cazul discret. Presupunem c˘ a X ¸si Y au distribut¸iile X :
xi pi
, Y : i I
∈
y j p j
,
j J
∈
unde I ¸si J sunt mult¸imi de indici cel mult num˘ arabile. 1. Pentru a R, avem:
∈
E(aX )
=
(axi ) pi = a
i I
xi pi = a E(X ).
i I
∈
∈
2. Fie Aij = X = x i , Y = y j ¸si pij = P(Aij ), (i, j) I
{
}
pij =
j J
∈
j J
∈
P(Aij )
= P( j∈J Aij
∪
∈ × J. Atunci ) = P{X = x } = p , ∀ i ∈ I , i
i
31 respectiv
pij =
i I
P(Aij )
i I
∈
∈
= P( i∈I Aij ) = P Y = y j = p j ,
∪
{
}
∀ j ∈ J.
Deaoarece X + Y are distribut¸ia
X + Y :
xi + y j pij
, (i,j) I J
∈×
obt¸inem E(X +
Y ) =
(xi + y j ) pij =
xi
i I
∈×
(xi pi ) +
i I
pij
i I
∈
(y j p j ) = E(X ) + E(Y ).
∈
3. Dac˘a X ¸si Y sunt independente, atunci pij = p i p j ,
=
(xi y j ) pij =
(i,j) I J
(xi pi )(y j p j )
∈×
(xi pi )
i I
∀ (i, j) ∈ I × J . Rezult˘a
(i,j) I J
∈×
=
∈
pij
j J
∈
E(XY )
j J
∈
y j
+
j J
∈
(i,j) I J
=
(y j p j ) = E(X )E(Y ).
j J
∈
∈
Astfel, propriet˘ a¸tile mediei sunt demonstrate ˆın cazul discret. R o variabil˘ R o funct Fie X : Ω a aleatoare iar ϕ : R ¸ie real˘ a m˘asurabil˘a (ˆın R este de asemenea o particular, ϕ continu˘ a). Funct¸ia compus˘ a ϕ(X ) := ϕ X : Ω variabil˘a aleatoare definit˘ a pe Ω. Dac˘ a X admite funct¸ia de repartit¸ie F , atunci
→
→ ◦
E(ϕ(X ))
=
∞
→
ϕ(x) dF (x),
−∞
ˆın ipoteza c˘a integrala este convergent˘ a. ˆIn particular, ˆın cazul cˆ and ϕ este o funct¸ie putere sau modului unei funct¸ii putere, obt¸inem mediile de ordin superior, respectiv mediile absolute de ordin superior.
Definit¸ia 2.6.2. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si X : Ω
→ R o variabil˘ aaleatoare.
∈ N∗ a variabilei aleatoare X se define¸ste prin
1. Media de ordin k
E
∞
k
X
=
xk dF (x),
−∞
dac˘ a integrala este convergent˘ a.
∈ N∗ a variabilei aleatoare X se define¸ste prin ∞ = |x| dF (x), E |X |
2. Media absolut˘ a de ordin k
| | ∞ k
k
−∞
dac˘ a integrala este convergent˘ a. Not˘ am cu Lk = L k (Ω) mult ¸imea variabilelor aleatoare R cu proprietatea E X k < X : Ω .
→
32 Ment¸ion˘ am c˘a mult¸imea de funct¸ii L k (Ω) este un spat¸iu vectorial normat ˆın raport cu norma de ordinul k, definit˘a prin X k = E1/k X k , X Lk (Ω). Din inegalitatea lui Lyapunov (Teorema 3.2.4) se obt¸ine
| |
Lk+1 (Ω)
∈
k
⊂ L (Ω), k ∈ N∗. Deducen c˘ a, pentru n ∈ N∗ , o variabil˘a aleatoare X ∈ L (Ω) are medie finit˘ a de ordinele k = 1, ··· , n. n
Exemplul 2.6.1. Mediile unor distribut ¸ii clasice. 1. Distribut ¸ia Bernoulli: X Bin(1, p)
∼ ⇒ E(X ) = p. 2. Distribut ¸ia binomial˘ a: X ∼ Bin(n, p) ⇒ E(X ) = np. 3. Distribut ¸ia Poisson: X ∼ Poiss(λ) ⇒ E(X ) = λ. 4. Distribut ¸ia geometric˘ a: X ∼ Geom( p) ⇒ E(X ) = 1/p. 5. Distribut ¸ia normal˘ a: X ∼ N (µ, σ ) ⇒ E(X ) = µ. 6. Distribut ¸ia exponent ¸ial˘ a: X ∼ Exp(λ) ⇒ E(X ) = 1/λ. 2
2.7
Dispersia
Dispersia unei variabile aleatoare (din spat¸iul L2 ) este un indicator al gradului de ˆımpr˘ a¸stiere a valorilor sale ˆın jurul mediei.
Definit¸ia 2.7.1. Fie X L 2 (Ω), cu E(X ) = µ. M˘ arimea:
∈
V (X ) =
∞
−∞
(x
2
− µ)
dF (x) = E (X
se nume¸ste dispersia lui X . M˘ arimea σ(X ) =
− E(X ))
2
V (X )
se nume¸ste abaterea medie p˘ atratic˘ a a variabilei aleatoare X . Dispersia are urm˘ atoarele propriet˘a¸ti elementare.
Propozit¸ia 2.7.1. Fie X, Y L 2 (Ω).
∈
1. V (X )
≥ 0;
2. V (X ) = E(X 2 )
2
− E (X ) (formula de calcul a dispersiei); 3. V (aX ) = a V (X ), ∀ a ∈ R; 2
4. dac˘ a X ¸si Y sunt v.a. independente, atunci V (X + Y ) = V (X ) + V (Y ).
33 Demonstrat ¸ie. Propriet˘ a¸tile 1 ¸si 3 sunt evidente. Fie µ = E(X ) ¸si η = E(Y ). Formula de calcul a dispersiei se obt¸ine astfel:
V (X ) = E (X
− µ)
2
= E X 2
− 2µX + µ
2
= E X 2
−
2µE(X ) + µ2 = E X 2
−
Conform Propozit¸iei 2.6.1 ¸si formulei demonstrate avem: V (X + Y ) = E (X + Y )2
−
[E(X + Y )]2 = E X 2 + 2XY + Y 2
= E X 2 + E Y 2 +2µη µ2 2µη η 2 =
− − −
− − − E
X 2
µ2 +
Y 2
E
µ2 .
(µ + η)2
η 2 = V (X ) +V (Y ).
¸ii clasice. Exemplul 2.7.1. Dispersiile unor distribut 1. Distribut ¸ia Bernoulli: X Bin(1, p)
∼ ⇒ V (X ) = pq . 2. Distribut ¸ia binomial˘ a: X ∼ Bin(n, p) ⇒ V (X ) = npq . 3. Distribut ¸ia Poisson: X ∼ Poiss(λ) ⇒ V (X ) = λ. 4. Distribut ¸ia geometric˘ a: X ∼ Geom( p) ⇒ V (X ) = q/p . 5. Distribut ¸ia normal˘ a: X ∼ N (µ, σ ) ⇒ V (X ) = σ . 2
2
2.8
2
Corelat¸ia
Corelat¸ia a dou˘a variabile aleatoare este un indicator al tipului de dependent¸a˘ al acestora.
Definit¸ia 2.8.1. Fie X, Y L2 (Ω). Corelat ¸ia variabilelor aleatoare X ¸si Y se define¸ste prin: λ(X, Y ) = E [X E(X )][Y E(Y )] .
∈
{ −
−
ρ(X, Y ) =
λ(X, Y ) σ(X )σ(Y )
M˘ arimea
}
se nume¸ste coeficientul de corelat ¸ie al variabilelor aleatoare X ¸si Y . Propozit¸ia urm˘ atoare stabile¸ste formula de calcul a corelat ¸iei ¸si o proprietate a coeficientului de corelat¸ie. ¸iile anterioare, avem: Propozit¸ia 2.8.1. Cu notat 1. λ(X, Y ) = E(XY )
− E(X )E(Y );
2. dac˘ a X ¸si Y sunt independente, atunci λ(X, Y ) = 0; 3. ρ(X, Y ) [ 1, 1].
∈−
34 Demonstrat ¸ie. 1. Avem λ(X, Y ) = E (XY
− µY − ηX + µη) = E(XY ) − µE(Y ) − ηE(X ) + µη = E(XY ) − µη.
2. Din inegalitatea E
sau
2
− µ) + (Y − η)] ≥ 0, ∀ t ∈ R,
[t(X
V (X )t2 + 2λ(X, Y )t + V (Y ) obt¸inem ∆ := 4 λ2 (X, Y ) Rezult˘a ρ(X, Y )
|
2.9
| ≤ 1.
≥ 0, ∀ t ∈ R,
− V (X )V (Y ) ≤ 0.
Funct¸ia caracteristic˘ a
Funct¸ia caracteristic˘ a asociat˘ a unei variabile aleatoare reprezint˘ a un instrument matematic important. Pentru variabilele aleatoare de tip continuu, funct ¸ia caracteristic˘a reprezint˘ a transformata Fourier a funct¸iei de densitate. Transformarea integral˘ a Fourier este important˘ a ˆın calculul operat ¸ional .
Definit¸ia 2.9.1. Fie X o variabil˘ a aleatoare avˆ and funct ¸ia de repartit ¸ie F . Funct ¸ia ϕX : R C , definit˘ a prin
→
∞
itX
ϕX (t) = E e
=
eitx dF (x), t
−∞
∈ R,
se nume¸ste functia caracteristic˘ a a variabilei aleatoare X. Fie X o variabil˘a aleatoare de tip continuu, cu densitatea de probabilitate f . ˆIn acest caz, functia sa caracteristic˘ a se reprezint˘ a astfel ϕX (t) =
∞
eitx f (x)dx, t
−∞
∈ R,
adic˘a ϕX reprezint˘ a transformata Fourier a funct¸iei f . Dac˘a X este o variabil˘a aleatoare discret˘ a, cu distribut¸ia X :
xk pk
, k I
∈
atunci funct¸ia sa caracteristic˘a se calculeaz˘ a astfel ϕX (t) =
eitxk pk .
k I
∈
Prezent˘ am ˆın continuare principalele propriet˘ a¸t i ale funct¸iei caracteristice.
Teorema 2.9.1. Fie X o variabil˘ a aleatoare avˆ and funct ¸ia de reaprtit ¸ie F ¸si funct ¸ia carC. Au loc urm˘ acteristic˘ a ϕX : R atoarele propriet˘ at ¸i:
→
35 1. ϕX (0) = 1; 2. ϕ( t) = ϕ X (t),
∀ t ∈ R; 3. |ϕ (t)| ≤ 1, ∀ t ∈ R; 4. ϕ (t) = e ϕ (at), ∀ t ∈ R, ∀ a, b ∈ R; −
X
ibt
aX +b
X
5. ϕX este uniform continu˘ a (deci ¸si continu˘ a) pe R; 6. dac˘ a X L n (Ω), atunci ϕX este derivabil˘ a de ordinul n, cu
∈
(n) ϕX (t)
n n=1 L (Ω),
∈ ∩∞
7. dac˘ a X
= i
n
∞
xn eitx dF (x), t
∈ R;
−∞
atunci ϕX este dezvoltabil˘ a ˆın serie Taylor ˆın jurul originii: ϕX (t) =
∞
tn (n) ϕ (0), n! X
n=0
n n cu ϕ(n) X (0) = i E (X ) , n
∈ N.
Demonstrat ¸ie. 1. ϕX (0) = E (e0 ) = E(1) = 1. 2. ϕX ( t) = E e−itX = E eitX = ϕ X (t),
− ≤ | | ∈
3. ϕX (t) =
|
∞ itx −∞ e dF (x)
∀ t ∈ R.
∞ itx ∞ −∞ e | dF (x) = −∞ 1dF (x) = 1, ∀ t ∈ R. ∞ ∞ R. ϕaX +b (t) = −∞ eit(ax+b) dF (x) = e ibt −∞ ei(at)x dF (x)eibt ϕX (at).
4. Fie a, b 5. Fie t R ¸si h > 0. Avem
∈
X (t
|ϕ
∞
+ h)
X (t)
−ϕ
| =
∞
eitx eihx
−∞
∞
1 dF (x)
∞
hx 1 dF (x) = 2 sin dF (x). 2 −∞
≤ − ≤ ≤ | | eitx
−
eihx
−∞
∞ −∞ dF (x) = 1, deducem c˘a exist˘a a > 0 astfel ca
Fie ε > 0. Cum −∞ sin hx dF (x) 2
sin
(
−∞,−a]∪[a,∞)
hx dF (x) < ε/4. 2
Apoi, pentru h < ε/2a, avem 2
[ a,a]
−
Rezult˘a
hx sin dF (x) 2
|ϕ
X (t
+ h)
a
≤ ∀ ∈
h x dF (x)
[ a,a]
−
−ϕ
| < ε,
X (t)
ha
dF (x)
−a
h
0,
ε . 2a
≤ ha < ε/2.
36 Ca urmare, ϕX este uniform continu˘ a pe R. 6. Se aplic˘a teorema de derivare a integralelor improprii cu parametru. 7. Conform formulei anterioare, avem (n) ϕX (0)
= i
n
∞
xn e0 dF (x) = in E (X n) .
−∞
Atunci, dezvoltˆ and ˆın serie Taylor exponent¸iala, obt¸inem
∞ tn ∞ tn ∞ ∞ (itx)n (n) n n ϕX (t) = e dF (x) = dF (x) = [i E (X )] = ϕX (0), n! n! −∞ −∞ n=0 n! n=0 n=0 ∞
pentru oricare t
itx
∈ R.
Teorema 2.9.2. (Teorema multiplic˘ arii) Dac˘ a X 1 , X 2 , , X n sunt variabile aleatoare independente, atunci ϕX 1 +X 2 +···+X n = ϕ X 1 ϕX 2 ϕX n .
· ··
· ··
Demonstrat ¸ie. Media produsului unui num˘ar finit de variabile aleatoare independente este egal˘ a cu produsul mediilor acestor variabile aleatoare. Atunci ϕ n
k=1 X k
(t) = E e
it
n
n
k=1 X k
n
n
itX k
e
=E
=
E
k=1
itX k
e
=
k=1
ϕX k (t), t
∈ R.
k=1
a aleatoare cu funct ¸ia de repartit ¸ie Teorema 2.9.3. (Teorema de unicitate) Fie X o variabil˘ F ¸si funct ¸ia caracteristic˘ a ϕX . Atunci 1. F (x2) 2.
− F (x ) = P { 1
c −itx1 1 e e−itx2 x1 < X x 2 = lim ϕX (t) dt, π c→∞ −c it
−
≤ }
c −ity 1 e e−itx F (x) = lim lim ϕX (t) dt, 2π y→−∞ c→∞ −c it
−
Demonstrat ¸ie. Se aplic˘ a transformarea Fourier invers˘ a.
∀ x < x ;
∀ x ∈ R.
¸iile caracteristice ale unor distribut ¸ii clasice. Exemplul 2.9.1. Funct 1. Distribut ¸ia Bernoulli: X Bin(1, p)
it
∼ ⇒ ϕ (t) = 1 + p (e − 1) , t ∈ R. 2. Distribut ¸ia binomial˘ a: X ∼ Bin(n, p) ⇒ ϕ (t) = [1 + p (e − 1)] , t ∈ R. 3. Distribut ¸ia Poisson: X ∼ Poiss(λ) ⇒ ϕ (t) = e ( − ) , t ∈ R. 4. Distribut ¸ia geometric˘ a: X ∼ Geom( p) ⇒ ϕ (t) = , t ∈ R. − 5. Distribut ¸ia normal˘ a: X ∼ N (µ, σ ) ⇒ ϕ (t) = e − , t ∈ R. 6. Distribut ¸ia exponent ¸ial˘ a: X ∼ Exp(λ) ⇒ ϕ (t) = − , t ∈ R. X
it
X
λ eit 1
X
X
2
peit eit +1
peit
iµt
X
X
t2 σ 2
2
λ λ it
n
1
2
37
2.10
Rezumat
Variabilele aleatoare se interpreteaz˘ a ca o ”enumerare” a rezultatelor (m˘ asurabile) potent¸iale ale unui anumit experiment. Fiecare din aceste rezultate posibile are o probabilitate de realizare. R se Fie (Ω, F , P) un cˆamp de probabilitate. O funct ¸ie m˘asurabil˘a real˘ a X : Ω nume¸ste variabil˘ a aleatoare . Conform definit¸iei, X I F pentru orice interval real I . In particular, X ( , a] = X a a R. F , d R , (F , BRd ) m˘ O funct¸ie X : Ω asurabil˘a, se nume¸ste vector aleator . Fie X i , i = 1, 2, , d, componentele scalare ale funct¸iei X , deci X = (X 1 , X 2 , , X d ). Atunci
→
{ ∈ } ∈ { ∈ −∞ } { ≤ } ∈ ∀ ∈ →
·· ·
··· {X ≤ a , X ≤ a , ··· , X ≤ a } ∈ F , ∀ (a , a , ··· , a ) ∈ R . Fie X : Ω → R o variabil˘a aleatoare. Funct¸ia real˘ a F : R → [0, 1], definit˘a prin F (x) = P{X ≤ x } = P({ω ∈ Ω |X (ω) ≤ x }), x ∈ R, 1
1
2
2
d
d
1
2
d
d
se nume¸ste funct ¸ia de repartit ¸ie a variabilei aleatoare X . Funct¸ia de repartit¸ie are urm˘ atoarele propriet˘ a¸ti: 1. F este monoton cresc˘ atoare pe R; 2. F este continu˘ a la dreapta pe mult¸imea R (F (x + 0) := lim F (t) = F (x), t x
↓
3. lim F (x) = 0; x
→−∞
4. F (x
∀ x ∈ R);
lim F (x) = 1;
x
→∞
F (t) = P{X < x}, ∀ x ∈ R; − 0) := lim ↑ 5. P{X = x } = F (x) − F (x − 0), ∀ x ∈ R; 6. P{a < X ≤ b } = F (b) − F (a), ∀ a, b ∈ R, cu a < b; 7. P{X > x} = 1 − F (x), ∀ x ∈ R. Variabilele aleatoare X , i ∈ I , se numesc independente dac˘ a, pentru oricare oricare indici distinct¸i i , i , · ·· , i din mult¸imea I ¸si oricare A , A , ··· , A ∈ B are loc P{X ∈ A , X ∈ A , ··· , X ∈ A } = P{X ∈ A }P{X ∈ A }··· P{X ∈ A }. t x
i
1
i1
1
2
i2
n
2
1
in
n
i1
2
1
n
i2
2
R
in
n
a dac˘ a mult¸imea X (Ω) este cel mult num˘ arabil˘a. X se nume¸ste variabil˘a aleatoare discret˘ R, unde I este o mult Fie X (Ω) = xi , i I ¸ime de indici cel mult num˘ arabil˘a. Not˘am pi = P X = xi , i I . Avem pi 0, i I ¸si i∈I pi = 1. Distribut¸ia variabilei aleatoare X se reprezint˘ a prin: xi X : . pi i∈I
{
{
∈ } ⊂ } ∈
≥
∀ ∈
R
Variabila aleatoare X se nume¸ste de tip continuu dac˘ a exist˘a o funct¸ie continu˘ a f : [0, ) cu proprietatea
→ ∞
x
F (x) =
−∞
f (t) dt,
∀ x ∈ R.
Funct¸ia f se nume¸ste densitatea de probabilitate a variabilei aleatoare X (sau funct ¸ia de densitate a v.a. X). Densitatea de probabilitate are propriet˘ a¸tile:
38 1. F este de clas˘ a C1 pe 2.
R
R,
cu F (x) = f (x),
∀ x ∈ R;
f (t) dt = 1;
{X = x} = 0, ∀ x ∈ R; 4. P{a ≤ X ≤ b } = f (t) dt, ∀ [a, b] ⊂ R. Fie X : Ω → R o variabil˘a aleatoare avˆ and funct¸ia de repartit¸ie F : R → [0, 1]. 3.
P
b a
M˘arimea:
E(X )
∞
:=
x dF (x)
−∞
se nume¸ste media lui X . Media este definit˘ a ˆın ipoteza c˘ a integrala de tip Stieltjes-Riemann de mai sus este convergent˘ a. Explicit˘ am mai jos calculul mediei ˆın cazul variabilelor de tip discret ¸si de tip continuu. 1. Pentru o variabil˘ a aleatoare X de tip discret, care ia valorile x i cu probabilit˘ a¸tile p i , pentru i I , avem: E(X ) = xi pi .
∈
i I
∈
2. Pentru o variabil˘a aleatoare X de tip continuu, cu funct¸ia de densitate f : [0, ), avem:
∞
E(X )
∞
:=
R
→
xf (x) dx.
−∞
Media are urm˘ atoarele propriet˘ a¸ti: 1.
E(aX )
= a E(X ),
∀ a ∈ R;
2.
E(X +
Y ) = E(X ) + E(Y );
3. dac˘ a X ¸si Y sunt independente, atunci E(XY ) = E(X )E(Y ). Dac˘a X admite funct¸ia de repartit¸ie F , iar ϕ este o fuct¸ie real˘ a m˘asurabil˘a, atunci E(ϕ(X ))
=
∞
ϕ(x) dF (x),
−∞
ˆın ipoteza c˘a integrala este convergent˘ a. Definim:
∈ N∗ a variabilei aleatoare X :
1. media de ordin k
E
∞
k
X
=
xk dx,
−∞
dac˘a integrala este convergent˘a.
∈ N∗ a variabilei aleatoare X : ∞ E |X | = |x| dx,
2. media absolut˘ a de ordin k
k
k
−∞
dac˘a integrala este convergent˘ a. Not˘am L k = L k (Ω) mult¸imea variabilelor aleatoare (definite pe Ω) cu medie absolut˘ a finit˘a de ordinul k.
39
• M˘arimea: V (X ) =
∞
(x
−∞
− µ))
2
dF (x) = E(X
− E(X ))
2
= E(X 2 )
2
− E (X )
se nume¸ste dispersia lui X .
• M˘arimea
σ(X ) =
V (X )
se nume¸ste abaterea medie p˘ atratic˘ a a variabilei aleatoare X . Dispersia are urm˘ atoarele propriet˘ a¸ti: 1. V (X )
≥ 0;
2. V (X ) = E(X 2 )
2
− [E(X )] (formula de calcul a dispersiei); 3. V (aX ) = a V (X ), ∀ a ∈ R; 2
4. dac˘ a X ¸si Y sunt v.a. independente, atunci V (X + Y ) = V (X ) + V (Y ). Corelat¸ia a dou˘ a variabile aleatoare este un indicator al tipului de dependent ¸˘ a al acestora. Astfel, corelat ¸ia variabilelor aleatoare X ¸si Y se define¸ste prin: λ(X, Y ) = E [X
{ − E(X )][Y − E(Y )]}.
M˘arimea ρ(X, Y ) =
λ(X, Y ) σ(X )σ(Y )
se nume¸ste coeficientul de corelat ¸ie al variabilelor aleatoare X ¸si Y . Formula de calcul a corelat¸iei λ(X, Y ) = E(XY ) E(X )E(Y ). Dac˘a X ¸si Y sunt v.a. independente, atunci λ(X, Y ) = 0; Avem ρ(X, Y ) [ 1, 1]. Fie X o variabil˘a aleatoare avˆ and funct¸ia de repartit¸ie F . Funct¸ia ϕX : R C , definit˘a prin
−
∈−
→
∞
itX
ϕX (t) = E e
=
eitx dF (x), t
−∞
∈ R,
se nume¸ste functia caracteristic˘a a variabilei aleatoare X. Dac˘a X este o variabil˘a aleatoare de tip continuu, cu densitatea de probabilitate f , atunci ∞ ϕX (t) = eitx f (x)dx, t R.
∈
−∞
Dac˘a X este o variabil˘a aleatoare discret˘ a, cu distribut¸ia X : atunci ϕX (t) =
k I e
∈
itxk
pk .
xk pk
, k I
∈
40
2.11
Test
1. Definit¸i funct¸ia de repartit¸ie a unei variabile aleatoare ¸si descriet¸i propriet˘ a¸tile acesteia. Discutat¸i cazul variabilelor aleatoare independente. 2. Calculat¸i media, dispersia ¸si funct¸ia caracteristic˘ a pentru o variabil˘a aleatoare: (a) Poisson; (b) exponent¸ial˘a; (c) geometric˘ a. 3. Variabila aleatoare X are distribut¸ia discret˘ a: X :
1 2 3 p1 p2 p3
,
unde p 1 , p2, p3 > 0, cu p 1 + p2 + p3 = 1. S¸tiind c˘a X are media E (X ) = 47 ¸si dispersia 11 V (X ) = 16 , s˘a se determine probabilit˘ a¸tile p1 , p2 , p3. 4. S˘a se determine constantele reale a ¸si b astfel ca funct¸ia F (x) = a + b arctg x, x R, s˘a fie funct¸ia de repartit¸ie a unei variabile aleatoare X ¸si apoi s˘a se calculeze E (X 2 ).
∈
5. Fie funct¸ia f : R
→ R, f (x) =
√ 1a−x2 , x ∈ ( −1, 1) x (
∈ −∞, −1] ∪ [1, ∞)
0,
.
(a) S˘ a se determine a > 0 astfel ˆıncˆ at f s˘a reprezinte densitatea de probabilitate a unei variabile aleatoare X . (b) S˘ a se determine media E (X ) ¸si dispersia V (X ) a variabilei aleatoare X . (c) S˘ a se calculeze
P
1 2
| | ≤ X
.
6. Timpul de a¸steptare ˆıntr-o stat¸ie de autobuz este o variabil˘ a aleatoare cu funct¸ia de repartit¸ie 0, x < 0; x/2, 0 x < 1; F (x) = 1/2, 1 x < 2; x/4, 2 x < 4; 1, x 4. S˘a se determine:
≤ ≤ ≤ ≥
(a) probabilitatea ca o persoan˘ a s˘a a¸stepte ˆın stat¸ie mai mult de 3 minute; (b) probabilitatea ca o persoan˘ a s˘a mai a¸stepte ˆın stat¸ie cel put¸in de 2 minute, dup˘a ce a a¸steptat 1 minut. 7. S˘a se calculeze funct¸ia caracteristic˘ a a variabilei aleatoare X cu densitatea de probabilitate: 0, x 2; f (x) = | x| , x < 2 . 1 1 2 2
−
| |≥ ||
Capitolul 3 Convergent¸a ¸sirurilor de variabile aleatoare 3.1
Introducere
Studiul convergent¸a ¸sirurilor de variabilelor aleatoare, ˆın accept ¸iuni specifice teoriei probabilit˘a¸t ilor, evident¸iaz˘ a fenomene asimptotice utile. Un ¸sir de variabile aleatoare poate converge la o variabil˘ a aleatoare (distribut¸ie limit˘a) ˆın sens ”tare” sau ˆın sens ”slab”. Convergent¸a frecvent¸ei de realizare a unui eveniment, ˆıntr-un ¸sir de experient¸e identice ¸si independente, la probabilitatea acelui eveniment este asigurat˘ a de Legea numerelor mari . Legea slab˘ a a numerelor mari se deduce din inegalitatea lui Cebˆı¸sev. Teorema limit˘ a central˘ a , considerat cel mai important rezultat al teoriei probabilit˘ a¸tilor, stabile¸ste convergent¸a la legea normal˘ a a distribut¸iei normalizate a sumelor part¸iale ale unui ¸sir de variabile aleatoare independente ¸si identic distribuite. Rezultatele asimptotice ment ¸ionate au o important¸a˘ major˘ a ˆın statistica matematic˘ a .
3.2
Inegalit˘ a¸ti fundamentale ˆın teoria probabilit˘ a¸t ilor
Urm˘atoarele inegalit˘ a¸t i elementare joac˘ a un rol fundamental ˆın teoria probabilit˘ a¸tilor.
Teorema 3.2.1. (Inegalitatea lui Markov) Fie X L n(Ω), unde n
∈
∈ N∗. Atunci
n
|X | ) , ∀ a > 0. P{|X | > a} ≤ a E(
n
Demonstrat ¸ie. Fie F funct¸ia de repartit¸ie a variabilei aleatoare X a > 0, avem n
|X | ) =
E(
[ a,a]
−
n
|x| dF (x) +
(
−∞,−a]∪[a,∞)
= a n [F ( a) + 1
−
n
|x| dF (x) ≥ a n
n
(
− F (a)] ≥ a P{|X | > a},
de unde concluzia.
41
n
∈ L (Ω).
−∞,−a]∪[a,∞)
Pentru
1 dF (x)
42
Teorema 3.2.2. (Inegalitatea lui Cebˆı¸sev (Chebyshev)) Fie X E(X ) = µ ¸ si dispersia V (X ) = σ 2. Atunci
{|X − µ| > a} ≤
P
σ2 , a2
2
∈ L (Ω), avˆ and media
∀ a > 0.
Demonstrat ¸ie. Aplic˘am inegalitatea lui Markov variabilei aleatoare Z = X µ, pentru n = 2. Inegalitatea lui Cebˆı¸sev se utilizeaz˘ a la demonstrarea legii slabe a numerelor mari .
−
Teorema 3.2.3. (Inegalitatea lui H¨ older) Fie p, q > 1 astfel ca variabile aleatoare X ¸si Y are loc inegalitatea p
E(
1
q
|XY |) ≤ [E (|X | )] · [E (|Y | )] p
1 q
1 1 + = 1. Pentru dou˘ a p q
.
ˆ In particular, pentru Y = 1, avem E(
1
p
|X |) ≤ [E (|X | )] , ∀ p > 1. p
Pentru p = 2, obt¸inem inegalitatea lui Cauchy-Buniakovski: E(
| |≤
E (X 2 ).
X )
Inegalitatea de mai sus exprim˘ a faptul c˘ a dispersia variabilei aleatoare X pozitiv˘a. Astfel, V (X ) = E X 2
−
[E(X )]2
≥E
X 2
−
[E( X )]2
| | ≥ 0.
a aleatoare ¸si r, s Teorema 3.2.4. (Inegalitatea lui Lyapunov) Fie X o variabil˘ r < s. Are loc inegalitatea 1 1 [E ( X r )] r [ E ( X s )] s .
| |
≤
Demonstrat ¸ie. Fie p = s/r > 1 ¸si q = p/( p inegalit˘a¸t ii lui H¨older, obt¸inem 1
[E ( X r )] r
| |
Consecint¸˘ a. Ln (Ω)
3.3
⊂ L
n+1
pr
2
∈ L (Ω) este ∈ N∗, cu
| |
− 1) > 1. Avem p1 + 1q = 1. Atunci, conform
≤ [E (|X | )] (Ω), ∀ n ∈ N∗ .
1 rp
1
= [E ( X s )] s .
| |
Tipuri de convergent ¸˘ a. Relat¸ii
Vom defini convergent ¸a ¸sirurilor de variabile aleatoare , ˆın diverse accept¸ iuni. Studiul comport˘ arii asimptotice a ¸sirurilor de variabile aleatoare reprezint˘ a o preocupare major˘ a a teoriei probabilit˘ a¸tilor.
Definit¸ia 3.3.1. Fie X o variabil˘ a aleatoare ¸si (X n )n≥1 un ¸sir de variabile aleatoare definite pe cˆ ampul de probabilitate (Ω, F , P). Fie F funct ¸ia de repartit ¸ie a variabilei aleatoare X , iar F n funct ¸ia de repartit ¸ie a variabilei aleatoare X n, n 1. Definim urm˘ atoarele tipuri de convergent ¸˘ a ale ¸sirului (X n)n≥1 c˘ atre limita X :
≥
43 1. ¸sirul (X n )n≥1 converge ˆın distribut ¸ie (repartit ¸ie) la X , notat prin X n
d
→ X,
dac˘ a lim F n (x0 ) = F (x0), pentru orice punct de continuitate x0
∈ R al funct ¸iei F ;
n
→∞
2. ¸sirul (X n )n≥1 converge ˆın probabilitate la X , notat prin X n dac˘ a lim
P
n
→∞
p
→ X,
{|X − X | > ε} = 0, ∀ ε > 0; n
3. ¸sirul (X n )n≥1 converge aproape sigur la X , notat prin X n
a.s.
→ X,
dac˘ a P X n
{ → X } = 1;
4. ¸sirul (X n )n≥1 converge ˆın spat ¸iul Lk (Ω) la X , unde k
∈ N∗, notat prin
X n dac˘ a lim n
→∞
E
|
X n
|
− X
k
Lk
→ X,
= 0.
Convergent¸ele ”ˆın distribut¸ie” ¸si ”ˆın probabilitate” sunt convergent ¸e slabe , ˆın timp ce k convergent¸ele ”aproape sigur˘ a” ¸si ”ˆın spat¸iul L (Ω)” sunt convergent ¸e tari . Aceast˘a clasificare formal˘ a este sust¸inut˘a de urm˘atoarea teorem˘ a de ierarhizare a tipurilor de convergent¸a˘ definite anterior.
Teorema 3.3.1. Fie X o variabil˘ a aleatoare ¸si (X n )n≥1 un ¸sir de variabile aleatoare definite pe cˆ ampul de probabilitate (Ω, F , P). Au loc implicat ¸iile 1.
p
d
X n
→ X =⇒
X n
→ X ;
X n
a.s.
X n
→ X ;
X n
→ X =⇒
X n
→ X.
2. 3.
→ X =⇒ Lk
p
p
Implicat ¸iile reciproce sunt false. Demonstrat ¸ie. p 1. Presupunem X n X. Fie x0 R un punct de continuitate al funct¸iei F . Consider˘am ε > 0, arbitrar. Deoarece, pentru n 1, avem
→
∈
≥ {X ≤ x − ε}\{|X − X | > ε} ⊂ {X ≤ x − ε} \ {X < X − ε} ⊂ {X ≤ x } , 0
n
0
n
n
0
obt¸inem F (x0
− ε) − P {|X − X | > ε} ≤ P ({X ≤ x − ε}\{|X − X | > ε}) ≤ F (x ) . n
0
n
n
0
44 Pe baza ipotezei, lim
P
n
→∞
{|X − X | > ε} = 0. Atunci F (x − ε) ≤ lim inf F (x ) . →∞ n
0
n
n
0
(3.1)
Apoi, pentru n
≥ 1, avem {X ≤ x }\{|X − X | > ε} ⊂ {X ≤ x } \ {X n
0
n
n
0
n
< X
− ε} ⊂ {X ≤ x + ε} , 0
de unde F n (x0 )
− P {|X − X | > ε} ≤ P ({X ≤ x }\{|X − X | > ε}) ≤ F (x + ε) . n
n
0
n
0
Pe baza ipotezei, rezult˘ a lim sup F n (x0) n
→∞
≤ F (x + ε) .
0
Din (3.1), (3.2) ¸si continuitatea lui F ˆın x 0 , obt¸inem lim F n (x0 ) = F (x0). Deci X n 2. Presupunem X n
n
→∞
a.s.
(3.2) d
→ X.
→ X. Avem ω ∈ {X → X } ⇔ ∀ ε > 0, ∃ n ≥ 1, ∀ k ≥ n : |X (ω) − X (ω)| < ε. n
n
Conform ipotezei, rezult˘ a
∞
∪
P
n=1
de unde
∩∞ {|X − X | < ε} n+ p
p=0
∞
∩
}
= 1,
∀ ε > 0,
{|X − X | < ε = 1, ∀ ε > 0. − X | < ε} ⊂ {|X − X | < ε}, vom deduce lim P{|X − X | < ε} = 1, ∀ ε > 0, →∞ lim
P
n
→∞
∞ X n+ p Cum p=0
∩ {|
n+ p
p=0
n
n
n
sau, trecˆ and la evenimentele contrare, lim
n
→∞
{|X − X | ≥ ε} = 0, ∀ ε > 0.
P
n
p
Rezult˘a X n X. 3. Implicat¸ia rezult˘ a din inegalitatea lui Markov. Astfel, pentru oricare ε > 0, avem
→
{|X − X | > ε} ≤
P
n
E
X n X k εk
|
− | → 0, pentru n → ∞.
3.4
Legile numerelor mari
Legea numerelor mari reflect˘ a urm˘atoare proprietate: frecvent ¸a de aparit ¸ie a unui eveniment ˆıntr-un ¸sir de experient ¸e identice, independente, tinde c˘ atre probabilitatea de realizare a evenimentului ˆın fiecare experient ¸˘ a. Proprietatea a fost descris˘ a pentru prima dat˘ a la
45 sfˆar¸situl sec. al XVI-lea de matematicianul italian Gerolamo Cardano (1501-1576). Formalizarea matematic˘ a (pentru variabile aleatoare binare) ca o lege a numerelor mari i se datoreaz˘ a lui Jacob Bernoulli (publicat˘ a ˆın lucrarea Ars conjectandi , 1713). ˆIn 1837, S.D. Poisson a descris-o sub numele de ”la Loi des grands nombres”. Contribut ¸ii importante la demonstrarea riguroas˘ a ¸si extinderea rezultatului sunt datorate lui Chebyshev (demonstrarea legii slabe a numerelor mari, 1837), Markov, Borel (demonstrarea legii tari a numerelor mari, 1909), Cantelli, Kolmogorov ¸si Khinchin. Formalizarea Bernoulli a fenomenului observat de Cardano este urm˘ atoarea. S˘ a consider˘a m c˘a, ˆıntr-o experient¸a˘, un anumit eveniment A se produce cu probabilitatea p = si identic distribuite P(A). Fie ¸sirul (X n )n≥1 de variabile aleatoare Bernoulli, independente ¸ (iid), asociate ¸sirului de experient¸e considerat, avˆ and distribut¸ia comun˘ a X n :
0 1 q p
, n
∈ N∗.
· ··
Not˘am S n = X 1 +X 2 + +X n care indic˘a num˘arul de aparit¸ii (realiz˘ari) ale evenimentului A ˆın n experient¸e. Frecvent¸a de realizare a evenimentului A este deci S n/n. Fenomenul descris de legea numerelor mari este prin urmare S n n
→ p = E(X ). 1
Conergent¸a frecvent¸ei de aparit¸ie a evenimentului la probabilitatea sa se poate realiza ˆın sensul unui tip de convergent¸a˘ slab (lege slab˘ a a numerelor mari) sau ˆın sensul unui tip de convergent¸a˘ tare (lege tare a numerelor mari). Rezultatul este extins la variabile aleatoare cu medie ¸si dispersie finite. a a numerelor mari) Teorema 3.4.1. (Legea slab˘ Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1 ) = µ ¸ N∗ . Atunci are si V (X 1) = σ2 . Not˘ am S n = X 1 + X 2 + + X n , n loc convergent ¸a ˆın probabilitate S n p µ. n
···
∈
→
Demonstrat ¸ie. Vom interpreta µ = E(X n ), n N∗ , ca o variabil˘a aleatoare constant˘ a, n care ia valoarea µ cu probabilitatea 1. Avem E(S n ) = k=1 E(X k ) = nµ ¸si V (S n ) = n 2 a¸tii lui Chebyshev, k=1 V (X k ) = nσ . Fie ε > 0, arbitrar. Conform inegalit˘
∈
Rezult˘a
P
S n n
− µ >ε
→∞
2
) σ = . {| − E(S )| > nε} ≤ V (S nε nε
= P S n
lim
n
P
S n n
n 2 2
n
− µ >ε
2
= 0.
Cum ε > 0 este arbitrar, obt¸inem concluzia. Ment¸in˘am c˘a legea slab˘ a a numerelor poate fi formulat˘ a pentru ¸siruri de variabile aleatoare independente (dar neidentic distribuite) cu dispersii uniform marginite (Chebyshev), respectiv pentru siruri de variabile de v.a. cu proprietatea V (S n )/n2 0 (Markov). Prezent˘ am (f˘ar˘a) demonstrat¸ie ¸si o versiune a legii tari a numerelor mari .
→
46
Teorema 3.4.2. (Legea tare a numerelor mari) Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), din spat ¸iul L4 ( E( X 1 4) < ) cu E(X 1 ) = µ. Fie S n = X 1 + X 2 + + X n , n N∗ . Atunci
| |
∞
···
S n n
3.5
∈
a.s.
→ µ.
Teorema limit˘ a central˘ a
Teorema limit˘ a central˘ a, ˆın versiunea clasic˘ a, stabile¸ste c˘a sumele part¸iale ”normalizate” ale unui ¸sir de variabile aleatoare iid, cu dispersie finit˘ a, tind ˆın distribut¸ie c˘atre legea normal˘a (gaussian˘ a). Rezultatul admite numeroase extinderi relativ la ¸siruri de variabile aleatoare heterogene, neindependente, supuse unor anumite condit ¸ii. De asemenea, rezultatul se extinde la ¸siruri de vectori aleatori. Prima versiune a acestei teoreme a fost formulat˘ a de Abraham de Moivre (1733) pentru variabile aleatoare de tip Bernoulli, cu p = 1/2). Pierre-Simon Laplace generalizeaz˘ a rezultatul ˆın lucrarea Theorie Analytique des Probabilit´es (1812), constatˆ and apropierea ˆ distribut¸iei binomiale de distribut¸ia normal˘ a. In 1901, matematicianul rus Aleksandr Lyapunov a definit ˆın termeni generali ¸si a demonstrat riguros teorema limit˘ a central˘ a . Teorema limit˘ a central˘ a este considerat˘ a rezultatul principal al teoriei probabilit˘ a¸tilor. Enunt¸a˘m pentru ˆınceput rezultatul datorat lui de Moivre ¸si Laplace relativ la ¸siruri iid de v. a. Bernoulli.
Teorema 3.5.1. (Teorema de Moivre-Laplace) Fie (X n )n≥1 un ¸sir de variabile aleatoare Bernoulli independente ¸si identic distribuite (iid), de parametru p, avˆ and media comun˘ a n ∗ p ¸si dispersia comun˘ a pq (unde q=1-p). Pentru n N , not˘ am S n = k=1 X k ¸si
∈
I n =
√ − k
np , k = 0, 1, npq
··· , n
.
Atunci, pentru oricare interval [a, b] lim
n
→∞
sup x I n [a,b]
∈ ∩
⊂ R, are loc: S − np 2πnpq · P √ npq = x − e−
n
x2
2
=0
Demonstrat¸ia se bazeaz˘ a pe aproximarea factorialului dat˘ a de formula lui Stirling n!
√ = 2nπ
n e
n
eθn ,
1 unde 0 < θn < 12n , n 1. Din Teorema de Moivre-Laplace se deduce o versiune particular˘a a Teoremei limit˘a central˘ a . Enunt¸ul clasic general al acestei teoreme este prezentat ˆın continuare.
≥
Teorema 3.5.2. (Teorema limit˘ a central˘ a) Fie (X n)n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1) = µ ¸si V (X 1 ) = σ 2 . Consider˘ am ¸sirul de ∗ variabile aleatoare S n = X 1 + X 2 + + X n, n N . Atunci:
·· ·
1. lim
n
→∞
P
≤ a
S n nµ σ n
−√ ≤ b
∈
=
1 2π
√
b
a
x2
e− 2 ,
∀ a, b ∈ R, a < b;
47 2. (versiunea Lindeberg-L´ evy) Are loc urm˘ atoarea convergent ¸a ˆın distribut ¸ie c˘ atre o variabil˘ a aleatoare gaussian˘ a:
√ n σ
S n n
− → µ
d
X,
unde X N (0, 1).
∼
Demonstrat ¸ie. (schit¸a˘) Consider˘am ¸sirul de v. a. iid Y n = X nσ−µ , n 1, de medie comun˘a 0 ¸si dispersie comun˘a 1. Atunci, conform Teoremei 2.9.1, 7, funct¸ia caracteriatic˘ a a variabilelor aleatoare Y n este de forma t 2 ϕY n (t) = 1 + 0 t2 , t 0. 2 Fie n Y k S n nµ Z n = k=1 = , n 1. n σ n
≥
−
√
−√
→
≥
Pe baza propriet˘ a¸t ilor funct¸iei caracteristice (Teorema 2.9.1), obt¸inem n
√ −
ϕZ n (t) = ϕY 1
t n
= 1
t2
t2 +0 2n
t2 n
n
t2 →∞ − → e 2.
n
Dar, pentru X N (0, 1), avem ϕX (t) = e − 2 , t R (a se vedea Exemplul 3.10.1). Cond form teoremei de unicitate (Teorema 2.9.2) se obt ¸ine Z n X . Astfel, teorema limit˘ a central˘ a este demonstrat˘ a.
∈
∈
→
48
3.6
Rezumat
Inegalitatea lui Markov Fie X L n (Ω), unde n
∈
∈ N∗. Atunci
n
{|X | > a} ≤ E (|aX | ) , ∀ a > 0.
P
n
Inegalitatea lui Cebˆı¸sev (Chebyshev) Fie X dispersia V (X ) = σ 2 . Atunci P
{|X − µ| > a} ≤
2
∈ L (Ω), avˆand media E(X ) = µ ¸si
σ2 , a2
∀ a > 0.
Definim urm˘atoarele tipuri de convergent¸˘ a ale ¸sirului (X n )n≥1 c˘atre limita X : 1. ¸sirul (X n )n≥1 converge ˆın distribut¸ie (repartit¸ie) la X , notat prin X n
d
→ X,
dac˘a lim F n (x0 ) = F (x0 ), pentru orice punct de continuitate x0
∈ R al funct¸iei F ;
n
→∞
2. ¸sirul (X n )n≥1 converge ˆın probabilitate la X , notat prin X n dac˘a lim
P
n
→∞
p
→ X,
{|X − X | > ε} = 0, ∀ ε > 0; n
3. ¸sirul (X n )n≥1 converge aproape sigur la X , notat prin X n dac˘a
P
a.s.
→ X,
{X → X } = 1; n
4. ¸sirul (X n )n≥1 converge ˆın spat¸iul Lk (Ω) la X , unde k
∈ N∗, notat prin
X n dac˘a lim n
→∞
E
|
X n
|
− X
k
Au loc implicat¸iile p
d
• X → X =⇒ X → X ; • X → X =⇒ X → X ; n
n
p
a.s.
n
n
Lk
• X → X =⇒ n
X n
p
→ X.
= 0.
Lk
→ X,
49 Implicat¸iile reciproce sunt false. Legea slab˘ a a numerelor mari Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1) = µ ¸si V (X 1 ) = σ2 . Not˘ am S n = X 1 + X 2 + ∗ + X n, n N . Atunci are loc convergent¸a ˆın probabilitate
···
∈
S n n
p
→ µ.
Legea tare a numerelor mari Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), din spat¸iul L4 (E( X 1 4) < ) cu E(X 1) = µ. Fie S n = ∗ X 1 + X 2 + + X n , n N . Atunci
· ··
| |
∈
S n n
∞
a.s.
→ µ.
Teorema limit˘ a central˘ a Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1 ) = µ ¸si V (X 1 ) = σ 2 . Consider˘ am ¸sirul de variabile ∗ aleatoare S n = X 1 + X 2 + + X n , n N . Atunci:
· ··
1. lim
n
→∞
P
≤ a
∈
S n nµ σ n
−√ ≤ b
=
1 2π
√
b
x2
e− 2 ,
a
∀ a, b ∈ R, a < b;
2. (versiunea Lindeberg-L´evy) Are loc urm˘ atoarea convergent¸a ˆın distribut¸ie c˘atre o variabil˘a aleatoare gaussian˘ a:
√ n σ unde X N (0, 1).
∈
S n n
− → µ
d
X,
50
3.7
Test
1. S˘a se enunt¸e ¸si s˘a se demonstreze Legea slab˘ a a numerelor mari. 2. S˘a se enunt¸e Teorema limit˘ a central˘ a, adaptat˘ a pentru variabile aleatoare de tip geometric. 3. S˘a se determine funct¸ia de repartit¸ie a variabilei aleatoare X care admite funct¸ia caracteristic˘a 1 2 1 + eit . ϕX (t) = 4
4. Inegalitatea lui Cebˆı¸sev aplicat˘ a variabilei aleatoare X , cu media E (X ) = 3 ¸si dis2 persia V (X ) = σ , stabile¸ste: P
{|X − 3| ≥ 2} ≤ 0, 16.
S˘a se determine σ. 5. La un concurs de biatlon, un sportiv nimereste ¸tinta cu probabilitatea de 54 . S¸tiind c˘a sportivul execut˘ a ˆın concurs 25 de trageri, s˘ a se arate c˘ a ¸sansa ca acesta s˘ a nimereasc˘a ¸tinta de cel put¸in 15 ori este mai mare de 85%. 6. Probabilitatea ca un monitor de calculator s˘ a nu aib˘a rezolut¸ia acceptabil˘ a este de 0,1. S-au cump˘arat 1000 de monitoare. Care este probabilitatea ca mai mult de 100 monitoare s˘ a nu fie acceptabile? (Not˘ a: se va utiliza aproximarea oferit˘ a de Teorema limit˘a central˘a.)
Capitolul 4 Elemente de statistic˘ a matematic˘ a 4.1
Introducere
Statistica matematica este o ramur˘ a important˘ a a matematicii, care utilizeaz˘ a rezultatele oferite de teoria probabilit˘ a¸tilor. Progresul ˆın societate, ˆın particular ˆın ¸stiint¸˘ a, este adeseori datorat experimentului . Cercet˘ atorul realizeaz˘ a o experient¸a˘ ¸si obt¸ ine o serie de date, pe baza c˘ arora generealizeaz˘ a rezultatele experient¸ei la o clas˘a de experient¸e similare. Acest tip de extindere se datoreaz˘ a unui rat¸ionament de tip inductiv (obt¸inerea unor informat¸ii generale din analiza unor informat¸ii particulare). Statistica analizeaz˘ a date concrete, locale, obt¸inute experimental, pentru a prognoza date cu caracter general, a descoperi legile care guverneaz˘ a fenomemul aleator studiat. ˆIn acela¸si timp, statistica se preocup˘ a de verosimilitatea matematic˘ a a prognozei, m˘asurˆand cu mijloace matematice gradul de ˆıncredere ˆın rezultatele generale propuse. Prezentarea de fat¸a˘ are ca obiectiv familiarizarea cu cˆ ateva not¸iuni de baz˘ a din teoria statisticii matematice, precum: populat ¸ie statistic˘ a, sonda j, e¸santion, estimator ¸si caracteristicile sale. Pentru simplificarea expunerii, ne vom rezuma la descrierea unor elemente de statistica e¸santioanelor Bernoul li .
4.2
Not¸iuni de baz˘ a
Statistica opereaz˘ a cu not¸iuni specifice. Astfel, populat a mult¸imea ¸ia statistic˘ a reprezint˘ tuturor elementelor avute ˆın vedere ˆın cadrul unui studiu statistic. De regul˘ a, pentru o populat¸ie mare, studiul statistic se realizeaz˘ a prin sondaj . Sondajul const˘ a ˆın observarea (examinarea, chestionarea) unei p˘ art¸i a populat¸iei, numit˘a e¸santion . Num˘arul elementelor unui e¸santion (obt¸inut prin sonda j ¸si examinat) se nume¸ste volumul e¸ santionului . De regul˘ a, volumul e¸santionului se stabile¸ste (pe baza unor evalu˘ ari matematice) astfel ˆıncˆa t s˘a poat˘ a furniza date generale concludente/veridice. Scopul studiului statistic este estimarea unei propriet˘ a¸tii/particularit˘ a¸t i a populat¸iei statistice. Funct¸ia matematic˘a care realizeaz˘ a estimarea se nume¸ste estimator . Apelˆand la modelul particular al e¸santioanelor Bernoulli, vom trece ˆın revist˘ a calit˘a¸t ile impuse unui estimator de calitate. 51
52
4.3
Estimatori. Propriet˘ a¸ti
Cel mai simplu studiu statistic se refer˘ a la analiza cazului binar: fiecare individ (element) al populat¸iei statistice are valoarea 1 sau 0 (r˘ a spunde cu 1 sau 0 la un chestionar). Ne intereseaz˘ a proport¸ia indivizilor cu valoarea 1 ˆın cadrul ˆıntregii populat¸ii statistice. Examinarea/chestionarea indivizilor prin sondaj se modeleaz˘ a printr-o variabil˘ a aleatoare ”bservabil˘ a”, care indic˘ a num˘arul indivizilor care valoreaz˘ a 1 ˆıntr-un e¸santion de volum n. La o populat¸ie ”mic˘a”, este logic s˘ a apel˘ am la modelul oferit de legea hipergeometric˘ a, ˆıntrucˆat extragerea unui e¸santion dintr-o populat¸ie mic˘a afecteaz˘ a ˆın mod cert proport¸ia valorii 1 ˆın cadrul populat¸iei nesondate. ˆIn schimb, dac˘a volumul populat¸iei este ”mare” ˆın raport cu volumul e¸santionului atunci este rezonabil s˘ a consider˘ a c˘a fiecare element al populat¸iei statistice se reprezint˘ a printr-o variabil˘ a aleatoare Bernoulli X , cu distribut¸ia X :
0 1
−
1 θ θ
,
unde parametrul θ (necunoscut) reprezint˘ a proport¸ia valorii 1 ˆın populat¸ia statistic˘ a. Astfel, P X = 1 = θ reprezint˘ a ¸sansa ca elementul X s˘a aib˘a valoarea 1. Evident, a ¸sansa ca X s˘a ia valoarea 0. Obiectul studiului statistic P X = 0 = 1 θ reprezint˘ ˆıntreprins const˘a ˆın estimarea parametrului θ, din observarea unui e¸santion de volum n, (X 1 , X 2 , , X n ), reprezentˆ and un vector aleator cu componentele variabile aleatoare iid, ¸ia e¸ santionului se define¸ste distribut¸ia comun˘ de tip Bin(1, θ). Distribut a a v. a. X 1, X 2 , , X n. a (sau un estimator ) se define¸ste ca o funct O statistic˘ ¸ie a variabilelor aleatoare ”observabile” (cele ale n-e¸santionului), deci care nu depinde de parametrii necunoscut ¸i. Pentru evaluarea aprioric˘ a a parametrului necunoscut θ se propune estimatorul media empiric˘ a , definit prin:
{ } ··· · ··
{
} −
X =
S n , unde S n = X 1 + X 2 + n
··· + X . n
ˆIn fapt, media empiric˘ a exprim˘a frecvent¸a de aparit¸ie a valorii 1, deci, intuitiv, pare a oferi o bun˘ a evaluare a parametrului θ. Descriem ˆın continuare propriet˘ a¸tile principale ale mediei empirice X , ca estimator a lui θ.
1. X este un estimator f˘ ar˘ a abatere a lui θ:
Demonstrat ¸ie.
Eθ (X )
Eθ (X )
n k=1 Eθ (X k )] /n =
=[
= θ,
∀ θ ∈ (0, 1).
(nθ)/n = θ.
ar˘ a abatere a lui θ, care depinde de S n . 2. X este unicul estimator f˘
Demonstrat ¸ie. Fie g : 0, 1, 2,
{
··· , n} → R, astfel ˆıncˆat θ = E [g(S )] = θ, ∀ θ ∈ (0, 1). θ
Avem Eθ [g(S n )]
=
n
n
n
k=0
g(k)P S n = k =
{
}
k=0
g(k)C nk θk (n
1 k
− θ) − ,
(4.1)
53 iar pe de alt˘a parte θ =
Eθ (X )
= Eθ
n
S n n
=
k=0
k P S n = k = n
{
}
n
k=0
k k k C θ (1 n n
n k
− θ) − .
Atunci, conform (4.1), obt¸inem n
− − − k C nk n
g(k)
k=0
θ
k
∀ θ ∈ (0, 1).
= 0,
θ
1
Rezult˘a c˘a polinomul f = nk=0 g(k) nk C nk X k este identic nul. Prin urmare g(k) = k/n, k = 0, 1, , n, deci g(S n ) = X .
· ··
a verosimilitate. 3. X este estimatorul lui θ de maxim˘ Demonstrat ¸ie. S˘a presupunem c˘ a au fost observate valorile (x1 , x2 , , xn ) 0, 1 n . Not˘am sn = nn=1 xk . Probabilitatea de a observa aceste valori este θ sn (1 θ)n−sn . Atunci, cea mai verosimil˘ a valoare pe care o poate lua θ este cea care maximizeaz˘ a funct¸ia
··· −
L : [0, 1]
→ [0, 1], L(u) = u
sn
(1
n sn
− u) −
∈ { }
.
Presupunem 0 < sn < n. Avem L (u) = L(u)
sn nu . u(1 u)
− −
R˘ad˘acina derivatei lui L este u0 = snn . Urm˘arind semnul derivatei, deducem c˘ a L ˆı¸si atinge maximul ˆın u0. Rezult˘ a c˘a X = S n/n este estimatorul de verosimilitate maxim˘a. and talia e¸santionului tinde la infinit, X converge la θ cu o rat˘ a exponent ¸ial˘ a. 4. Cˆ
and c˘ a, pe baza inegalit˘ a¸tii lui Chebyshev, Demonstrat ¸ie. Vom remarca ˆın primul rˆ X
p
→ θ (legea slab˘a numerelor mari).
Pe de alt˘a parte, conform Teoremei limit˘ a central˘ a (Teorema 3.5.2),
θ(1
n
− θ)
d
− → X
θ
X,
unde X N (0, 1). Faptul c˘ a rata convergent¸ei este exponent¸ial˘ a se deduce din Teorema marilor deviat ¸ii , pe care nu o vom include ˆın aceast˘ a prezentare.
∈
atratic mediu al estimatorului X a lui θ converge la 0. 5. Riscul p˘
54 Demonstrat ¸ie. Riscul p˘atratic mediu al estimatorului X este defint prin Avem Eθ
− − − →
de unde
X
θ
Eθ
X
2
S n n
= Eθ
θ
2
θ
=
1 Eθ (S n n2
− nθ)
2
=
Eθ
2
− X
θ .
n θ(1 θ) V (X ) = 1 n2 n
− ≤ 1, 4n
2 n
→∞ 0.
6. Abaterea lui X fat ¸˘ a de θ poate fi evaluat˘ a prin Teorema limit˘ a central˘ a.
Demonstrat ¸ie. Fie a > 0. Pentru n
√ √ − ≥ 2, de unde √ S − nθ a n ≥ nθ(1 − θ) θ(1 − θ)
4θ(1 θ) , a2
−
avem
a n
θ(1 θ)
{| − | ≥ } − ≤ − ≥ ≈ √ Pθ
X
θ
a =
n
P
S n nθ nθ(1 θ)
P
4.4
≥
1 x2 e− 2 dx < 0, 05. 2π |x|≥2
2
Estimatori bayesieni
Media empiric˘ a X este o estimare judicioas˘ a a parametrului θ ˆın absent¸a oric˘ aror informat¸ii suplimentare. Dar problema se modific˘ a ˆın cazul unor informat¸ii apriorice despre θ. Dac˘a aceste informat¸ii exist˘a, mai precis, dac˘a se cunoa¸ste o m˘ asur˘a de probabilitate pe [0, 1] reprezentˆ and distribut¸ia valorilor posibile ale lui θ, atunci se va cerceta estimatorul g(S n ) a lui θ care minimizeaz˘ a riscul p˘atratic mediu, ¸tinˆand cont de aceast˘ a distribut¸ie. Fie D o mult¸ime num˘arabil˘a din [0, 1], iar ρ : D [0, 1] o m˘asur˘a de probabilitate pe D, cu x∈D ρ(x) = 1. Pentru o funct¸ie g definit˘ a pe 0, 1, , n cu valori ˆın [0, 1], riscul p˘atratic mediu al estimatorului g(S n ) este
→ { ··· }
n
ρ(θ)Eθ [g(S n )
− θ]
θ D
∈
2
=
ρ(θ)
θ D
k k n
2 k
n
C nk
n k
− θ) C θ (1 − θ) −
k=0
∈
2
(g(k)
n k
− θ) θ (1 − θ) − . ∈ Pentru k ∈ {0, 1, · ·· , n}, consider˘ am funct¸ia ψ : [0, 1] → [0, ∞), definit˘ a prin ψ (x) = ρ(θ)θ (1 − θ) − (x − θ) , x ∈ [0, 1]. =
k=0
ρ(θ)(g(k)
θ D
k
k
k
n k
2
θ D
∈
Avem
ψk (x) = 2
ρ(θ)θk (1
θ D
∈
n k
− θ) − (x − θ), x ∈ [0, 1].
Studiind semnul derivatei, deducem c˘ a ψk atinge minimul ˆın punctul xk =
k+1 (1 − θ)n−k ∈ ∈ [0, 1]. k (1 − θ)n−k ρ(θ)θ θ ∈D
θ D ρ(θ)θ
55 Vom defini deci estimatorul bayesian a lui θ de risc p˘ atratic mediu minim: g(S n ) =
S n +1 (1 − θ)n−S n ∈ . S n (1 − θ)n−S n ρ(θ)θ θ ∈D
θ D ρ(θ)θ
Similar, dac˘a se cunoa¸ste ”a priori” densitatea de probabilitate f a lui θ pe intervalul [0, 1], atunci estimatorul bayesian a lui θ, dependent de S n, avˆand riscul p˘ atratic minim , va fi 1 S n +1 θ (1 θ)n−S n f (θ)dθ 0 g(S n ) = 1 . S n S − n n θ (1 θ) f (θ)dθ 0
− −
56
4.5
Rezumat
Statistica matematica utilizeaz˘ a rezultatele oferite de teoria probabilit˘ at¸ilor pentru a generealiza rezultatele unei experient¸ la o clas˘ a de experient¸e similare. Acest tip de extindere se datoreaz˘a unui rat¸ionament de tip inductiv (obt¸inerea unor informat¸ii generale din analiza unor informat¸ii particulare). Statistica analizeaz˘ a date concrete, locale, obt¸inute experimental, pentru a prognoza date cu caracter general, a descoperi legile care guverneaz˘ a fenomemul studiat. Not¸iuni specifice:
• populat ¸ia statistic˘ a reprezint˘a mult¸imea tuturor elementelor avute ˆın vedere ˆın cadrul unui studiu statistic ;
• sondajul reprezint˘a examinarea (chestionarea) unei p˘art¸i a populat¸iei statistice, numit˘a e¸santion ;
• num˘arul elementelor unui e¸santion (obt¸inut prin sondaj ¸si examinat) se nume¸ste volumul e¸ santionului ;
• scopul unui studiu statistic este estimarea unei propriet˘a¸tii/particularit˘a¸ti a populat¸iei statistice. Funct¸ia matematic˘ a care realizeaz˘ a estimarea se nume¸ste estimator ;
• o statistic˘ a (sau un estimator se definet¸e ca o funct¸ie de variabilelor aleatoare observabile (cele ale n -e¸santionului) ¸si nu depinde de parametrii necunoscut¸i.
Statistica e¸santioanelor Bernoulli. Modelare: fiecare element al populat¸iei statistice se reprezint˘ a printr-o variabil˘ a aleatoare Bernoulli X , cu distribut¸ia 0 1 X : , 1 θ θ Pentru evaluarea aprioric˘ a a prametrului necunoscut θ se propune estimatorul media empiric˘ a , definit prin: S n X = , unde S n = X 1 + X 2 + + X n . n Media empiric˘ a exprim˘a frecvent¸a de aparit¸ie a valorii 1, deci ofer˘ a o evaluare a parametrului θ. Propriet˘ a¸t ile principale ale mediei empirice X , ca estimator a lui θ. 1. X este un estimator f˘ ar˘ a abatere a lui θ: Eθ (X ) = θ, θ (0, 1). ar˘ a abatere a lui θ, care depinde de S n . 2. X este unicul estimator f˘ 3. X este estimatorul lui θ de maxim˘ a verosimilitate and talia e¸santionului tinde la infinit, X converge la θ cu o rat˘ a exponent ¸ial˘ a. 4. Cˆ 5. Riscul p˘ atratic mediu al estimatorului X a lui θ converge la 0. ¸˘ a de θ poate fi evaluat˘ a prin Teorema limit˘ a central˘ a. 6. Abaterea lui X fat Definim estimatorul bayesian a lui θ, de risc p˘atratic mediu minim:
−
···
∀ ∈
g(S n ) =
S n +1 (1 − θ)n−S n ∈ . S n n−S n θ∈D ρ(θ)θ (1 − θ)
θ D ρ(θ)θ
Dac˘a θ admite densitatea de probabilitate f pe [0, 1], atunci estimatorul bayesian a lui θ este 1 S n +1 θ (1 θ)n−S n f (θ)dθ 0 g(S n ) = 1 . S n S − n n θ (1 θ) f (θ)dθ 0
− −
57
4.6
Not¸iuni de statistic˘ a descriptiv˘ a
4.6.1
Concepte de baz˘ a
• Statistica, ramur˘a a matematicii, studiaz˘a metodele de ˆınregistrare, descriere ¸si analiz˘a a datelor experimentale referitoare la un anumit fenomen ˆın scopul formul˘ arii unor previziuni.
• Populat¸ia
statistic˘ a este mult¸imea (ˆın sens matematic) care face obiectul unui anumit studiu statistic.
• Unitate statistic˘a (individ) este un element component al unei populat¸ii statistice. • Caracteristic˘a statistic˘a este una din ˆınsu¸sirile unit˘a¸tii statistice.
O caracteristic˘ a cantitativ˘ a este m˘ asurabil˘ a , iar una calitativ˘ a este atributiv˘ a . Un studiu statistic a vizeaz˘ a una sau mai multe caracteristici statistice ale indivizilor unei populat¸ii statistice.
• E¸santionul este o submult¸ime a populat¸iei statistice, obt¸inut˘a printr-o select¸ie,
pentru care se realizeaz˘ a evaluarea caracteristicii statistice. Pentru unele studii statistice, e¸santionul reprezint˘ a ˆıntreaga populat¸ie statistic˘ a . Num˘ arul de elemente al e¸santionului se nume¸ste volumul (efectivul) e¸santionului.
• Sondajul este act¸iunea de prevalare ¸si ˆınregistrare a valorilor uneia sau mai multor caracteristici statistice ale indivizilor unui e¸santion fixat.
• Tabelul statistic cont¸ine ˆınregistrarea valorilor numerice (datelor experimentale), numite valori observate obt¸inute prin m˘ asurarea caracteristicii tuturor unit˘ a¸tilor statistice ale e¸santionului select¸ionat.
• Frecvent¸a
arul relativ˘ a a unei valori a caracteristicii este raportul dintre num˘ indivizilor e¸santionului pentru care s-a ˆınregistrat valoarea respectiv˘ a ¸si volumul e¸santionului.
• Distribut¸ia statistic˘a empiric˘a reprezint˘a reprezint˘a repartit¸ia valorilor obser-
vate ale caracteristicii pentru e¸santionul select ¸ionat (ˆınregistrate ˆın tabelul statistic). Din punct de vedere matematic, distribut ¸ia statistic˘ a (empiric˘a) este funct¸ia care realizeaz˘ a corespondent¸a ˆıntre numerele reale, obt¸inute ca valori observate ale caracteristicii, ¸si frecvent¸a relativ˘ a a ˆınregistr˘arii lor.
• Distribut¸iile (repartit¸iile) statistice teoretice reprezint˘a modele matematice idealizate ale distribut¸iilor empirice. Concret, o distribut¸ie statistic˘ a teoretic˘ a este ∞ descris˘a de o funct¸ie f : R → [0, 1] cu proprietatea −∞ f (x) dx = 1, numit˘a den-
sitate de probabilitate . Pentru anumite fenomene analizate statistic, distribut ¸ia empiric˘a tinde la o anumit˘a distribut¸ie teoretic˘ a, dac˘ a (ne imagin˘am c˘a) volumul e¸santionului tinde la infinit.
• Teoria
a cu not¸iunile de spat ¸iu m˘ asurabil, probabilitate probabilit˘at¸ilor opereaz˘ ¸si variabil˘ a aleatoare . O variabil˘a aleatoare este o funct¸ie X , definit˘a pe un spat¸iu m˘asurabil cu probabilitate, cu valori reale, avˆ and proprietatea c˘ a pentru orice num˘ ar
58 real x se poate evalua probabilitatea F probabilitatea F ((x) ca X ca X s˘a ia valori ˆın intervalul intervalul ( anume: F ( F (x) = P X x [0, [0 , 1]. 1].
−∞, x], ¸si
{ ≤ ≤ } ∈
Spunem c˘ a variabila aleatoare X are are densitatea de probabilitate f a: f dac˘a: x
F ( F (x) =
f ( f (t) dt, pentru orice orice num˘ num˘ ar ar real x
−∞
Media unei variabile aleatoare X aleatoare X cu densitatea de probabilitate probabilitate f f se se calculeaz˘ a prin:
∞
M (X ) =
x f ( f (x) dx
−∞
aleatoare X cu cu densitatea de probabilitate f probabilitate f se se calculeaz˘ a Dispersia unei variabile aleatoare X prin: 2
σ (X ) =
∞
(x
−∞
2
f (x) dx, unde m = M = M ((X ) − m) f (
Un caz particular particular ˆıl constituie constituie variabilele variabilele ale aleato atoar aree finite . O astfe astfell de varia ariabi bil˘ l˘ a aleatoare X X are un num˘ar ar finit de valori reale x1 < x2 < < xk cu probabilit˘at a¸ile ¸tile p1, p2, , pk [0, [0 , 1]. 1]. Avem deci: pi
· · · ∈ = P {X = x }, i
···
i = 1, 2,
· · · , k;
p1 + p + p2 +
· · · + p
= 1.
k
ˆIn acest caz, media ¸si si respectiv dispersia variabilei ariabilei aleatoare X se X se calculeaz˘ a dup˘a urm˘atoarele atoarele formule: formule: k
m = M = M ((X ) = x 1 p1 + x2 p2 + 2
σ (X ) = (x1
2
2
· · · + x p
k k
=
i=1
2
( x − m) p + · · · + (x (x − m) p − m) p + (x 1
2
2
k
xi pi
k
=
k
(xi
i=1
2
− m) p . i
• Exemple de distribut¸ii ¸ii (repartit¸ii, ¸ii, legi) teoretice clasice:
a de medie m ¸si 1. Legea normal˘ si dispersie σ2 are densitatea de probabilitate: (x m)2 1 − f ( f (x) = e 2σ2 , x R 2 2πσ Graficul lui f are f are forma unui clopot, cunoscut sub denumirea de de clopotul lui Gauss . Legea Legea norm normal al˘ a˘ (sau legea lui Gauss-Laplace ) joac˘ a un rol central ˆın teoria probabilit˘ probabilit˘ at a¸ilor, ¸t ilor, fiind legea fiind legea limit˘ a a sumelor normalizate ale ¸sirurilor sirurilor de variabile variabi le aleato al eatoare are independente independen te ¸si si identic i dentic distribuite distri buite . −
√
∈
f ( f (x)
O
m
.. .
− 2σ
... ... ... ... ... ... ... ... . m
.. . m + 2σ 2σ
x
Valorile unei
59 variabile aleatoare X aleatoare X cu cu distribut¸ie ¸ie normal˘ a de medie m medie m ¸ ¸si si disp di sper ersi siee σ 2 se ”concentreaz˘ a” a” cu o probabilitate probabilitate de 95% ˆın intervalul intervalul [m 2σ, m + 2σ ], centrat ˆın valoarea valoa rea medie med ie m. Mai precis avem:
−
P m unde
√ σ = σ
2σ} = 0, 9544 · · · { − 2σ ≤ X ≤ ≤ m + 2σ
2
se nume nume¸¸ste st e abaterea standard a variabilei aleatoare X .
¸ia χ2 cu m grade de libertate are densitatea de probabilitate: 2. Repartit¸ia f ( f (x) =
1 2 2 Γ m
m
m 2
unde:
m Γ = 2
x
x 2 −1 e− 2 , x > 0
∞
m
x 2 −1 e−x dx.
0
Dac˘a o variabil˘a aleatoare X are X are repartit¸ia ¸ia χ2 cu m grade de libertate, atunci media ¸si si respectiv r espectiv dispersia variabilei aleatoare sunt urm˘ atoarele: atoarele: M ( M (X ) = m σ 2 (X ) = 2m Repartit¸ia ¸ia χ2 are un rol r ol impor im portant tant ˆın statis s tatistica tica matematic˘ mate matic˘a ˆın deducer de ducerea ea repart r epartit it ¸ei statistice a unor estimatori unor estimatori ¸ ¸si si ˆın veri verific ficar area ea ipotezelor ipotezelor statistice .
4.6. 4.6.2 2
Tipu Tipuri ri de dist distri ribu but¸ii ¸tii statisti statistice ce empirice. empirice. Tabele statistic statistice. e. Reprezent˘ ari ari grafice.
In cadrul cadrul unui unui studiu studiu statist statistic, ic, datele datele experime experimenta ntale le obt ¸inute prin m˘asurarea asurarea valoric˘ a a unei caracteristici a unui e¸santion santion considerat sunt ˆınregistrate ˆıntr-un tabel statistic. Acesta evident¸iaz˘ ¸iaz˘ a o anumit˘a distrib distribut ut¸ie ¸ie statistic˘ statistic˘ a. Dupa˘ natura natura repartit repartit ¸iei valorilor alorilor ˆınregistra ınreg istrate, te, disting d istingem em dou˘ do u˘ a tipuri de distribut¸ii ¸ii statistice empirice empirice (experimentale). (experimentale). 1) Tipul finit (sau discret) de distribut¸ie ¸ie corespunde cor espunde cazului ˆın ın care, ipotetic, caracteristica masurat˘ a poate lua un num˘ ar ar finit (sau num˘ arabil) arabil) de valori. alori. In contin continuare uare vom trata numai cazul finit. Consider˘am am un e¸santion santion fixat de volum n.. Aceasta Aceast a ˆınseamn˘ ınsea mn˘a c˘a num˘ arul arul de unit˘ at a¸i ¸ti statistice pentru care se determin˘ a ¸si si se ˆınre ın regi gist stre reaz az˘ a˘ valoarea caracteristicii este egal cu n. S˘a presupunem c˘a valorile ˆınregistrate ale caracteristicii sunt numerele reale x1 < x2 < ar ar natura nat urall cuprin cup rinss ˆıntre ıntr e 1 ¸si n si n.. < xk unde k este un num˘ Fiecarei valori realizate (ˆınregistrate) a caracteristicii ˆıi determin˘ am ”frecvent¸a” ¸ a” de aparit¸ie. ¸ie.
···
¸a absolut˘ abso lut˘a a valorii • Frecvent¸a
xi este num˘ arul n arul n i de subiect¸i ¸i pentru care valoarea k caracteristicii este xi . Din Din defini definit¸ie ¸tie rezult˘ a 0 ni n ¸si si i=1 ni = n, unde k ¸ia ¸ia simbolic˘a a sumei n1 + n2 + + nk . i=1 ni este notat
arul • Frecvent¸a ¸a relativ˘a a valorii x este num˘arul relat¸iile: ¸iile: f ∈ [0, [0 , 1] ¸si si f = 1. i
i
k i=1
i
≤ ≤ ···
f i =
ni . n
Constat˘ am a m c˘a au loc
60 ni n
arul p = 100 · = 100 · f . • Frecvent¸a ¸a procentual˘ proc entual˘ a a valorii x este num˘arul Avem p ∈ [0, [0 , 100] 10 0] ¸si si p = 100. 100. Pentru a evident¸ia ¸ia c˘a p reprezin˘ a o m˘arime arime i
k i=1
i
i
i
i
i
procentual˘a, a, se s e folose¸ f olose¸ste ste curent cure nt notat no tat¸ia p ¸ia p i %. %.
Frecvent¸ele ¸ele determinate ale valorilor, indicˆ and and distribut¸ia ¸ia statistic˘ a empiric˘ a, a , pot fi central tr aliz izat atee ˆın ın tabelul frecvent ¸elor sau ¸elor sau pot fi reprezentate grafic prin diagrama prin diagrama de structur˘ a, histograma ¸ ¸si si respe res pecti ctiv v poligonul frecvent ¸elor.
D iagra grama ma de struc str uctur tur˘ ˘ a ilustreaz˘ a distribut¸ia ¸ia statistic˘ a empiric˘ a prin partit¸ia ¸ia unui • Dia disc ˆın ın sectoare de cerc cu ariile proport¸ionale ¸ionale cu frecvent¸ele ¸ele relative ale valorilor. Sectorul Secto rul reprezentˆ repr ezentˆand and valoarea x valoarea x are unghiul de la centru de m˘ asur˘ asur˘a α = f · 360 . ¸elor se obt¸ine, ¸ine, ˆıntr-un sistem de axe de coodonate, coo donate, unind sucsu c• Poligonul frecvent¸elor cesiv cesiv prin segmente segmente punctele punctele de coordonat coordonatee (x , f ), (x , f ), · · · , (x , f ). coo donate, frecvent fr ecvent ¸ele relative (sau • Histograma ilustreaz˘a,a, ˆıntr-un sistem de axe de coodonate, i
i
1
1
2
2
k
i
o
k
procentuale) ale valorilor x valorilor x i prin dreptungh drep tunghiuri iuri de ˆın˘ ın˘ alt alt¸ime f ¸ime f i (respectiv pi) dispuse cu baza pe axa absciselor, ˆın ın dreptul absciselor x absciselor x i .
Exempl Exemplul ul 1 La o prob˘ a sportiv sportiv˘ a˘ fiec fiecare are partici participa pant nt a efectuat efectuat 6 arunc˘ aruncari ˘ la co¸sul sul de baschet, realizˆ and an d ˆıntre ın tre 0 ¸si si 6 arunc˘ aru nc˘ ari reu¸site. sit e. Rezultatele Rezulta tele obt ob¸inute t de cei 40 de participant ¸i sunt prezentate sintetic sinteti c ˆın ın tabelul urm˘ ator: num˘arul arul de arunc˘ ari reu¸site 0 1 2 3 4 5 6 num˘arul arul de participant¸i 2 4 8 15 4 6 1 total 40 Volumul e¸antionului antionului considerat este n = 40 iar num˘arul arul de valori ale caracteristicii este k = 7. 7. Prezen Prezent˘ t˘ am am tabelul frecvent¸elor, ¸elor, diagrama de structur˘a, a, histograma ¸si si respectiv poligonul frecvent¸elor ¸elor asociate studiului statistic considerat.
A) Tabelul frecvent¸elor ¸elor valorile xi 0 1 2 3 4 5 6
frecvent¸ele ¸ele absolute (n (ni ) rela relati tiv ve (f i ) proce procen ntual tualee ( pi %) 2 0,050 5,0 % 4 0,100 10,0 % 8 0,200 20,0 % 15 0,375 37,5 % 4 0,100 10,0 % 6 0,150 15,0 % 1 0,025 2,5 % 7 7 7 i=1 ni = 40 i=1 f i = 1 i=1 pi = 100
B) Diagrama de structur˘ a
2
1 0 3 6 5 4
61
C) Histograma 37, 5% 20% 10%
5%
10%
15% 2, 5%
0
1
2
3
4
5
6
D) Poligonul frecvent¸elor .. . .. .. .. . . .. .. . . . .. .. .. .. .. .. . . . . .. . . . . . . 0 1 2 3 4 5 6 2) Tipul continuu de distribut¸ie corespunde cazului cˆ and valorile caracteristicii sunt numere reale situate ˆıntr-un anumit interval [a,b]. Pentru a grupa valorile caracteristicii, se fixeaz˘ a, ¸tinˆand cont de specificul studiului statistic efectuat, un num˘ ar ˆıntreg k > 1 ¸si b−a se ˆımparte intervalul (a, b] ˆın k subintervale de aceea¸si lungime l = k . Not˘am, ˆın ordine, −a) , a + i(b−a) ], i = 1, 2, , k. Fie aceste intervale I 1 , I 2 , , I k . Astfel, I i = (a + (i−1)(b k k un e¸santion fixat de volum n cu n > k. Fiec˘arui interval I i i se asociaz˘ a ”frecvent¸a de −a) , aparit¸ ie”; vom nota cu xi valoarea ”central˘a” a intevalului, adic˘ a xi = a + (2i−1)(b 2k obt¸inut˘a f˘acˆand media aritmetic˘ a a capetelor intervalului I i (a se vedea figura urm˘ atoare).
···
axa real˘ a
a x1 ( ı I 1
|
·· ·
x2 ı I 2
|
x3 ı I 3
|
x4 ı I 4
|
...............
|
xk b ı ] I k
• Frecvent¸a absolut˘a a intervalului I este num˘arul n de subiect¸i pentru care i
i
valoarea caracteristicii apart¸ine intervalului I i .
ni n
• Frecvent¸a relativ˘a a intervalului I este num˘arul f = . • Frecvent¸a procentual˘a a intervalului I este num˘arul p = 100 · f . i
i
i
i
i
Frecvent¸ele determinate ale valorilor, indicˆ and distribut¸ia statistic˘ a empiric˘ a , pot fi centralizate ˆın tabelul frecvent ¸elor sau pot fi reprezentate grafic prin diagrama de structur˘ a, histograma ¸si respectiv poligonul frecvent ¸elor care nu difer˘a de cele descrise pentru distribut¸ii finite.
62 a contracronometru de ciclism au participat 148 de concurent ¸i. Exemplul 2 La o prob˘ Dup˘ a ˆın registrarea timpilor de parcurs, s-au grupat rezultatele ˆın 6 intervale de cˆ ate 30” ¸si s-au calculat frecvent ¸ele intervalelor, obt ¸inˆ andu-se urm˘ atorul tabel: intervalele I i (48 , 48 30”] (48 30”, 49 ] (49 , 49 30”] (49 30”, 50 ] (50 , 50 30”] (50 30”, 51 ]
4.6.3
valorile centrale xi 48 15” 48 45” 49 15” 49 45” 50 15” 50 45”
Tabelul frecvent¸elor frecvent¸ele absolute (ni ) relative (f i ) procentuale ( pi %) 7 0,047 4,7 % 28 0,189 18,9 % 53 0,358 35,8 % 42 0,283 28,3 % 10 0,067 6,7 % 8 0,054 5,4 % 6 6 6 i=1 ni = 148 i=1 f i = 1 i=1 pi = 100
Indicatori statistici
Pentru o distribut¸ie statistic˘ a empiric˘ a, consemnat˘ a ˆın tabelul frecvent¸elor, determin˘ am o serie de indicatori statistici ˆın scopul obt¸inerii unor informat¸ii cu caracter general privind repartizarea valorilor carateristicii studiate. Cei mai important¸i indicatori statistici sunt: media, mediana ¸si respectiv dispersia distribut¸iei. Media ¸si dispersia indic˘ a, fiecare ˆın parte, valorea ”central˘ a” sau valoarea ”de mijloc” a distribut¸iei respective, ˆıntr-o o accept¸iune specific˘ a fiec˘ arei not¸iuni. Dispersia si respectiv abaterea standard indic˘ a gradul de ”ˆımpr˘ a¸stiere” a valorilor fat¸a˘ de valoarea ”central˘ a” a distribut¸iei. Coeficientul de variat¸ie, calculat prin raportarea abaterii standard la medie, ofer˘ a posibilitatea stabilirii gradului de omogenitate al e¸santionului. Consider˘am o distribut¸ie statistic˘ a empiric˘ a, asociat˘ a unei caracteristici (variabile empirice) X , care ia valorile x1 < x2 < < xk cu frecvent¸ele absolute n1 , n2 , , nk ¸si respectiv frecvent¸ele relative f 1 , f 2 , , f k .
···
• Media
· ··
···
a prin: x = M (X ) a variabilei X se calculeaz˘ x = x 1 f 1 + x2 f 2 +
··· + x f ,
sau, utilizˆand scrierea prescurtat˘ a, x = M (X ) =
• Mediana
k k
k i=1 xi f i .
M ed = M ed(X ) a variabilei X , corespunzˆ and unui e¸santion de volum n, se define¸ste astfel: se ordoneaz˘ a cresc˘ ator valorile caracteristicii tuturor subiect¸ilor e¸santionului, obt¸inˆandu-se ¸sirul de valori v1
≤ v ≤ ··· ≤ v . 2
n
Distingem dou˘ a situat¸ii: 1. dac˘ a n = 2 p + 1, cu p - num˘ar natural (deci n este un num˘ar natural impar), atunci Med = v p+1 ; 2. dac˘ a n = 2 p, cu p - num˘ar natural (deci n este un num˘ ar natural par), atunci vp +vp+1 Med = . 2
63 Observ˘a m c˘a din definit¸ia medianei reiese c˘ a aceasta este valoarea care ”ˆımparte” e¸santionul ˆın ˆın dou˘ a p˘ art ¸i de volume egale Mediana se mai poate determina ¸si utilizˆ and frecvent¸ele absolute n1 , n2, valorilor x1 < x2 < < xk , dup˘a cum urmeaz˘ a:
·· ·
M ed =
xi ,
xi +xi+1 , 2
• Amplitudinea
dac˘ a n1 + n2 +
dac˘ a
n 2
n 2
·· · , n
ale
k
··· + n − < < n + n + ··· + n − + n = n + n + ·· · + n − + n i 1
1
2
1
i 1
2
i 1
i
i
W = W (X ) a variabilei X se define¸ste prin: W = x max
−x
min
Astfel, dac˘a X are o distribut¸ie de tip finit atunci W = x k x1 , iar dac˘ a X are o distribut¸ie de tip continuu cu valorileˆın intervalul (a, b], atunci W (X ) = b a.
−
• Dispersia
−
σ 2 = σ 2 (X ) a variabilei X se define¸ste prin: k 2
σ =
2
− x) f ,
(xk
i=1
i
unde x = M (X ) este media variabilei X .
• Abaterea standard
σ = σ(X ) a variabilei X se define¸ste prin: σ=
√
σ2
C v = C v (X ) al variabilei X , se define¸ste, numai ˆın cazul cˆand toate valorile xi ale distribut ¸iei X sunt pozitive , prin:
• Coeficientul de variat¸ie
C v =
σ x
• Expresia procentual˘a coeficientului de variat¸ie C C = 100 · C %
v % = C v% (X )
v%
este:
v
Tabelul urm˘ ator prezint˘ a interpretarea curent˘ a a omogenit˘ at¸ii e¸santionului ˆın raport cu variabila X dup˘a valorile coeficientului de variat¸ie exprimat procentual: Coeficientul de variat¸ie C v% Omogenitatea 0-10% omogenitate mare 10-20% omogenitate medie 20-35% omogenitate mic˘ a peste 35% e¸santion neomogen S˘a urm˘arim calculul indicatorilor statistici definit¸i anterior pentru distribut¸iile din exemplele anterioare. Vom nota cu X variabila empiric˘ a cu distribut¸ia prezentat˘ a ˆın Exemplul 1 ¸si respectiv cu Y variabila empiric˘ a cu distribut¸ia descris˘ a ˆın Exemplul 2.
64
4.6.4
Calculul indicatorilor statistici ai distribut ¸iei variabilei X (Exemplul 1).
Media: x = 0 0, 05 + 1 0, 1 + 2 0, 2 + 3 0, 375 + 4 0, 1 + 5 0, 15 + 6 0, 025 = 2, 925 Rezult˘a c˘a num˘arul mediu de reu¸site este:
·
·
·
·
·
·
·
∼
x = M (X ) = 3
Mediana: Avem n : 2 = 20 ¸si n1 +n2 +n3 = 14 < 20 < 29 = n 1 +n2 +n3 +n4 , deci Med(X ) = x 4 , sau: Med(X ) = 3. Amplitudinea: W (X ) = 6
−0=6
Dispersia: σ (X ) = (0 2, 925)2 0, 05+(1 2, 925)2 0, 1 + ( 2 2, 925)2 0, 2 + ( 3 2, 925)2 0, 375+ (4 2, 925)2 0, 1+(5 2, 925)2 0, 15+(6 2, 925)2 0, 025 = 1, 969 Dispersia valorilor (abaterea medie p˘ atratic˘a) este deci: 2
− ·
−
· −
− ·
· −
− ·
·
· ··
−
·
∼
σ 2 (X ) = 1, 97
Abaterea standard : σ(X ) =
Coeficientul de variat¸ie:
∼
1, 969 = 1, 403
1, 403 = 0, 4797 2, 925 Expresia procentual˘ a a coeficientul de variat¸ie:
∼
C v (X ) =
∼
C v% (X ) = 48 % Interpretare: e¸santion neomogen .
4.6.5
Calculul indicatorilor statistici ai distribut ¸iei variabilei Y (Exemplul 2).
Media x = 48, 25 0, 047+48, 75 0, 189+49, 25 0, 358+49, 75 0, 283+50, 25 0, 067+50, 75 0, 054 = 49, 29 (minute) Rezult˘a c˘a timpul mediu ˆınregistrat al probei este:
·· ·
·
·
·
·
·
·
∼
M (Y ) = x = 49 18”
Mediana: Avem: n : 2 = 74 ¸si n 1 + n2 = 35 < 74 < 88 = n 1 + n2 + n3, deci M ed(Y ) = x 3 , adic˘a: M ed(Y ) = 49 15”
65
Amplitudinea: W (Y ) = 51
− 48 = 3 (minute)
Dispersia: σ (Y ) = (48, 25 49, 29)2 0.047 + (48, 75 49, 29)2 0, 189 + (49, 25 49, 29)2 0, 358 + (49, 75 49, 29)2 0, 283+(50, 25 49, 29)2 0, 067+(50, 75 49, 29)2 0, 054 = 0, 34325 2
−
− ·
·
− · − · σ (Y ) ∼ = 0, 343
−
·
−
·
···
2
Abaterea standard : σ(Y ) =
Coeficientul de variat¸ie:
∼
0, 343 = 0, 586
0, 586 = 0, 012 49, 29 Exprimarea procentual˘ a a coeficientului de variat¸ie:
∼
C v (Y ) =
∼
C v% (Y ) = 1, 2 % Interpretarea: e¸santion foarte omogen .
4.6.6
Compararea a dou˘ a distribut ¸ii empirice
S˘a presupunem c˘ a pentru un e¸santion fixat de volum n se sondeaz˘ a ˆın paralel dou˘a caracteristici (variabile empirice) X ¸si Y ¸si se pune problema existent¸ei unei conexiuni ˆıntre distribut¸iile acestora. Pentru obt¸inerea unei concluzii se recurge la calculul unor indici de corelat¸ie asociat¸i perechii de variabile X ¸si Y .
4.6.7
Corelat¸ia ¸si coeficientul de corelat¸ie
Fie x = M (X ), y = M (Y ) mediile variabilelor X ¸si Y , iar σX , σY abaterile lor standard. Presupunem c˘ a X ia valorile x1 < x2 < < xk iar Y ia valorile y1 < y2 < yl . Not˘am ni,j num˘arul unit˘ a¸tilor statistice ale e¸santionului pentru care caracteristica X ia valoarea xi iar caracteristica Y ia valoarea y j , unde i = 1, 2, , k ¸si j = 1, 2, , l. Fie ni,j f i,j = n frecvent¸a relativ˘ a a perechii de valori (xi , y j ).
···
···
·· ·
···
Corelat¸ia cX,Y a variabilelor X ¸si Y se definet¸e prin: cX,Y = M ((X
− x)(Y − y)) =
(xi
− x)(y − y)f j
i,j
i=1,k j=1,l
Coeficientul de corelat¸ie r = r X,Y al variabilelor X ¸si Y al variabilelor X ¸si Y se define¸ste prin: cX,Y r = . σX σY
·
66 Pe baza unei inegalit˘a¸ti matematice fundamentale (inegalitatea lui Cauchy ) se demonstreaz˘a c˘a, oricare ar fi distribut¸iile variabilelor X ¸si Y , avem:
−1 ≤ r ≤ 1. Interpretarea valorii coeficientului de corelat ¸ie r este urm˘ atoarea: 1. dac˘ a r este pozitiv, atunci variabilele X ¸si Y sunt corelate , adic˘a tendint¸a este ca atunci cˆ and variabila X ia o ”valoare mare” ¸si variabila Y s˘a ia tot o ”valoare mare”. Variabilele X ¸si Y sunt cu atˆat mai puternic corelate cu cˆ at coeficientul lor de corelat¸ie este mai apropiat de valoarea 1. 2. dac˘ a r este negativ, atunci variabilele X ¸si Y sunt invers corelate , adic˘a tendint¸a este ca atunci cˆ and variabila X ia o ”valoare mare” variabila Y s˘a ia o ”valoare mic˘a”. 3. dac˘ a r este apropiat de valoarea 0, atunci variabilele X ¸si Y sunt independente sau cu o dependent ¸˘ a slab˘ a .
4.6.8
Metoda corerat¸iei rangurilor
Aceast˘a metod˘ a, datorat˘ a lui Spearman, se utilizeaz˘ a atunci cˆ and volumul e¸santinului este mic (de regul˘ a n < 30). Fiec˘ arui individ i 1, 2, n al e¸santionului i se asociaz˘a o pereche de ranguri (ri (X ), ri (Y )), cu ri (X ), ri (Y ) [1, n]. Aceste ranguri se determin˘ a ˆın urma realiz˘ arii a cˆate unui ”clasament” cresc˘ ator al valorilor ˆınregistrate pentru fiecare din caracteristicile (variabilele) X ¸si Y . Rangurile ri (X ) ¸si respectiv ri (Y ) exprim˘a ”pozit¸ia” (eventual intermediar˘ a) a individului i ˆın fiecare din cele dou˘ a ”clasamente” de valori cresc˘atoare. Not˘am di = r i (X ) ri (Y ), i = 1, 2, , n. Coeficientul de corelat¸ie al rangurilor ρ = ρ X,Y asociat variabilelor X ¸si Y se define¸ste prin: 6 ni=1 d2i ρ = 1 n(n2 1)
∈ {
−
·· · } ∈
···
−
−
Se poate verifica prin calcul c˘ a, indiferent de distribut¸ia rangurilor, avem: 0
≤ ρ ≤ 1
Dac˘a ρ este apropiat de 1, atunci variabilele X ¸si Y sunt corelate iar dac˘a ρ este apropiat de 0, atunci variabilele X ¸si Y sunt invers corelate .
67
4.7
Test
1. Definit¸i media empiric˘ a ¸si descriet¸i propriet˘ a¸tile acestui estimator ˆın cazul e¸santioanelor Bernoulli. 2. Determinat¸i estimatorul bayesian al unui e¸santion Bernoulli asociat unei distribut ¸ii Beta(α, β ) a parametrului de estimat θ. 3. Se observ˘a dou˘ a variabile aleatoare Bernoulli indepedente X 1 ¸si X 2 , de parametru θ (0, 1). S˘a se arate c˘ a nu se poate g˘ asi un estimator a f˘ar˘a abatere a lui 1−θ θ care s˘a depind˘ a de X 1 ¸si X 2 .
∈
4. Cu ajutorul unui n-e¸santion Bernoulli de parametru θ se caut˘ a estimarea dispersiei θ(1 θ). S˘a se arate c˘ a estimatorul T = X (1 X ) nu este f˘ ar˘a abatere, dar exist˘ a un multiplu al s˘au avˆand aceast˘ a proprietate.
−
−
68