Probabilitate statistica

1

˘T ˘ PROBABILITA ¸I S ¸ I STAT TATISTICA

Eugen P˘ alt˘ anea

Universita Univer sitatea tea Transilvania rans ilvania din Bra¸sov sov 2018

2

Cuprins 0.1

Intro ducere . . . . . . . . . . . . . 0.1.1 Date istorice . . . . . . . . . 0.1.2 Descrierea cursului . . . . . 0.1. 0.1.33 Princi Principi piil ilee de baz˘ baza˘. Limba j

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

1 Spa¸ii ¸t ii m˘ asurabile. asurabile. Cˆ ampuri ampuri de probabilitate. Scheme clasice de bilitate 1.1 Intro ducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Corpuri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Spat pa¸ii ¸tii m˘asurabile . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 1.4 Funct unct¸ii ¸ii m˘asurabile . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Caˆmpuri de probabilitate . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Evenimen Evenimente te independen independente, te, evenimente evenimente condit ¸ionate . . . . . . . . . 1.7 Scheme clasice de probabilitate . . . . . . . . . . . . . . . . . . . . 1.8 Rezumat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Variabile aleatoare. Caracteristici numerice 2.1 Intro ducere . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Variabile aleatoare . . . . . . . . . . . . . . . . . . . . 2.3 2.3 Funct unct¸ia ¸ia de repartit¸ie . . . . . . . . . . . . . . . . . . . 2.4 2.4 Varia ariabi bille alea aleato toar aree disc discre rete te.. Exem Exempl plee clas clasiice . . . . . . 2.5 2.5 Varia ariabi bille al aleato eatoar aree de de ti tip con conti tin nuu. uu. Exem Exempl plee clas clasiice . . 2.6 Media. Me Medii de ordin super perior . . . . . . . . . . . . . 2.7 Disp ersia . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8 2.8 Co Core rela lat¸tia . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 2.9 Funct unct¸ia ¸ia caracteristic˘ caracteristic˘ a . . . . . . . . . . . . . . . . . . . 2.10 Re R ezumat . . . . . . . . . . . . . . . . . . . . . . . . . . 2.11 Te Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Conve Converge rgent nt¸a ¸sirurilor de variabile aleatoare 3.1 Intro ducere . . . . . . . . . . . . . . . . . . . . . 3.2 3.2 Inega Inegali lit˘ t˘ at a¸i ¸ti fundamentale ˆın teoria probabilit˘ at a¸tilor 3.3 Tipuri Tipuri de conve convergen rgent¸˘ ¸ta. a˘. Relat¸ii . . . . . . . . . . . 3.4 Legile numerelor mari . . . . . . . . . . . . . . . . 3.5 Teorema eorema limit˘ limit˘ a central˘ a . . . . . . . . . . . . . . 3.6 Rezumat . . . . . . . . . . . . . . . . . . . . . . . 3.7 Test . . . . . . . . . . . . . . . . . . . . . . . . . 3

. . . . . . .

. . . . . . .

. . . . . . .

. . . .

. . . .

. . . .

. . . .

5 5 5 5

proba. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

7 7 7 9 10 11 13 14 18 22

. . . . . . . . . . .

23 . . . . . . . . . . 23 . . . . . . . . . . 23 . . . . . . . . . . 24 . . . . . . . . . . 26 . . . . . . . . . . 27 . . . . . . . . . . 30 . . . . . . . . . . 32 . . . . . . . . . . 33 . . . . . . . . . . 34 . . . . . . . . . . 37 . . . . . . . . . . 40

. . . . . . .

41 . . . . . . 41 . . . . . . 41 . . . . . . 42 . . . . . . 44 . . . . . . 46 . . . . . . 48 . . . . . . 50

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

4

4 Elemente de statistic˘ a matematic˘ a 4.1 Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Not¸iuni de baz˘a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Estimatori. Propriet˘ a¸ti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4 Estimatori bayesieni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Rezumat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Not¸iuni de statistic˘ a descriptiv˘ a . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Concepte de baz˘ a . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.2 Tipuri de distribut¸ii statistice empirice. Tabele statistice. Reprezent˘ ari grafice. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.3 Indicatori statistici . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.4 Calculul indicatorilor statistici ai distribut¸iei variabilei X (Exemplul 1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.5 Calculul indicatorilor statistici ai distribut¸iei variabilei Y (Exemplul 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.6 Compararea a dou˘ a distribut¸ii empirice . . . . . . . . . . . . . . . . 4.6.7 Corelat¸ia ¸si coeficientul de corelat¸ie . . . . . . . . . . . . . . . . . . 4.6.8 Metoda corerat¸iei rangurilor . . . . . . . . . . . . . . . . . . . . . . 4.7 Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51 51 51 52 54 56 57 57 59 62 64 64 65 65 66 67

5

0.1

Introducere

0.1.1

Date istorice

Teoria probabilit˘ a¸tilor1 ¸si statistica matematic˘a studiaz˘ a fenomenele aleatoare, ˆın scopul predict¸iei ¸sanselor de realizare a unor rezultate a¸steptate. Studiul se bazeaz˘ a pe modelare matematic˘a ¸si rat¸ionamente deductive. Bazele teoriei probabilit˘ a¸tilor ¸si statisticii (studiului matematic al ”hazardului”) au fost puse ˆın secolele XVI-XVII. Astfel, Gerolamo Cardano scria ˆın 1526 prima carte dedicat˘ a unor concepte probabiliste: Liber de ludo aleae (”Cartea jocurilor de noroc”), publicat˘ a ˆın 1663. Contribut¸ii majore la punerea bazelor teoriei probabilit˘ a¸t ilor au avut matematicienii francezi Blaise Pascal ¸si Pierre de Fermat (ˆınceputul sec. al XVII-lea). În 1657, Cristiaan Huygens publica lucrarea De ratiociniis in ludo aleae (”Asupra rat¸ionamentelor ˆın jocurile de noroc”). Doctrina probabilit˘ at¸ilor se contureaz˘ a ˆın sec. al XVIII-lea prin lucr˘arile fundementale Ars conjectandi , publicat˘a ˆın 1713 de Jacob Bernoulli ¸si The Doctrine of Chances , publicat˘a ˆın 1718 de Abraham de Moivre. Un secol mai tˆ arziu, Pierre Simon Laplace public˘ a lucrarea Théorie analytique des probabilitées , ˆın care evident¸iaz˘ a legea erorilor (convergent¸a la legea normal˘ a ). Teoria modern˘ a a probabilit˘ a¸tilor (incluzˆ and formalizarea axiomatic˘ a) este datorat˘ a ˆın bun˘ a m˘ asur˘ a matematicianului rus Andrei Nikolaevici Kolmogorov, autorul c˘ art¸ii Foundation of the Theory of Probability , publicat˘a ˆın 1950. Printre lucr˘ arile de referint¸a˘ ˆın domeniu ale secolului XX trebuiesc amintite The Theory of Stochastic Processes (D.R Cox, H.D. Miller, 1965), An Introduction to Probability Theory (W. Feller, 1968) ¸si Probability and Measure (P. Billingsley, 1979). In ultimii 60 de ani, studiul proceselor aleatoare cunoa¸ste o dezvoltare ¸si diversificare teoretic˘ a exponent¸ial˘a, dar ¸si un cˆ amp foarte larg de aplicabilitate. S¸coala româneasc˘a de probabilit˘ a¸t i se remarc˘ a prin numeroase contribut¸ii originale. Bazele acestei ¸scoli se datoreaz˘ a ˆın principal matematicienilor C. T. Ionescu-Tulcea, Gheorghe Mihoc, Octav Onicescu, Ion Cuculescu, Marius Iosifescu ¸si Constantin Tudor.

0.1.2

Descrierea cursului

Prezentul curs reprezint˘ a o introducere ˆın teoria probabilit˘ a¸tilor ¸si statisticii matematice. Sunt descrise ¸si caracterizate concepte de baz˘ a ale domeniului: câmpuri de probabilitate, variabile aleatoare ¸si convergent ¸a ¸sirurilor de variabile aleatoare, e¸santioane, estimatori statistici etc. Pentru studiul acestor not ¸iuni sunt necesare cuno¸stint¸e elementare de analiz˘ a matematic˘a ¸si teoria m˘asurii. Cuno¸stint¸ele teoretice sunt exemplificate ¸si aplicate ˆın probleme ¸si lucr˘ari de laborator, menite s˘ a familiarizeze cursantul cu rat¸ionamentele specifice domeniului ¸si cu utilizarea unor softuri informatice.

0.1.3

Principiile de baz˘ a. Limbaj

Teoria probabilit˘ a¸t ilor analizeaz˘ a ¸sansele de realizare a unor evenimente ˆın urma unei experient ¸e ¸si este fundamentat˘a pe urm˘ atoarele trei principii: 1. Fiec˘arui eveniment rezultat ˆın urma unei experient ¸e i se atribuie un num˘ ar real din intervalul [0, 1] numit probabilitatea evenimentului . 1

Etimologie: probabilitas (lat.) = credibilitate

6 2. Oricare dou˘ a evenimente contrare au suma probabilit˘a¸tilor egal˘ a cu 1. 3. Probabilitatea de realizare simultan˘ a a dou˘ a evenimente este egal˘ a cu produsul dinte probabilitatea realiz˘ arii unuia dintre evenimente ¸si probabilitatea realiz˘ arii celuilalt eveniment, condit¸ionat˘ a de realizarea primului eveniment. In formalizarea matematic˘ a, evenimentele care pot rezulta ˆın urma efectu˘arii unei experient ¸e reprezint˘ a submult¸imi ale unei mult¸imi Ω (interpretat˘ a ca ”evenimentul sigur”). Aceste evenimente au o probabilitate de aparit¸ie (¸sans˘ a de realizare). Matematic, probabilitatea este o m˘ asur˘ a finit˘ a , definit˘a pe mult¸imea evenimentelor. Astfel, limbajului probabilistic ˆıi corespunde limbajul mult¸imilor. Urm˘atoarea schem˘ a evident¸iaz˘ a dualitatea de limbaj (relativ la o anumit˘ a experient¸a˘):

• evenimentul sigur = mult¸imea total˘a (de referint¸a˘): Ω; • evenimentul imposibil = mult¸imea vid˘a: ∅; • evemiment = submult¸ime a mult¸imii totale: A ⊂ Ω; • realizarea unui eveniment asigur˘ a realizarea unui alt eveniment (implicat ¸ia evenimentelor) = incluziunea mult¸imilor: A ⊂ B; • evenimentul contrar (unui eveniment) = complementara unei submult¸imi a mult¸imii totale: A = Ω \ A; • evenimentul realiz˘ arii a cel put ¸in unuia dintre dou˘ a evenimente (disjunct ¸ia evenimentelor) = reuniunea mult¸imilor: A ∪ B; • evenimentul realiz˘ arii simultane a dou˘ a evenimente (conjunct ¸ia evenimentelor) = intersect¸ia mult¸imilor: A ∩ B; c

Capitolul 1 Spat¸ii m˘ asurabile. Cˆ ampuri de probabilitate. Scheme clasice de probabilitate 1.1

Introducere

Vom defini ¸si caracteriza ˆın continuare not¸iunea de spat¸iu m˘asurabil (cˆ amp de evenimente) ¸si funct¸iile m˘asurabile, definite ˆıntre spat¸ii m˘asurabile. Not¸iunile respective modeleaz˘ a matematic rezultatele posibile ale unei experient¸e (evenimentele posibile) ¸si corespondent¸ele specifice asociate unor experient¸e. Astfel, definim not¸iunile: corp, σ-corp, borelianul unui spat¸iu topologic, spat¸iu m˘asurabil, funct¸ie m˘asurabil˘a ¸si evident¸iem propriet˘ a¸t ile lor de baz˘a. Se introduce not¸iunea de cˆ amp de probabilitate ¸si se preg˘ ate¸ste definirea conceptului de variabil˘ a aleatoare . Sunt evident¸iate propriet˘ a¸tile probabilit˘ a¸tii, definit˘a ca m˘asur˘a finit˘a pe spat¸iul evenimentelor (σ-corpul evenimentelor). Este discutat˘ a independent¸a evenimentelor ¸si not¸iunea de probabilitate condit¸ionat˘ a. Exemplele elementare de cˆ ampuri de probabilitate discrete sunt particularizate ˆın modelele clasice (scheme de probabilitate), adaptate studiului unor fenomene aleatoare.

1.2

Corpuri

Not¸iune de corp (de mult¸imi) reprezint˘ a cadrul minimal de modelare matematic˘ a a setului evenimentelor posibile rezultate ˆın urma unei experient¸e cu rezultate aleatoare. ¸ime nevid˘ a. O familie nevid˘ a C de submult ¸imi ale lui Ω Definit¸ia 1.2.1. Fie Ω o mult ( C P (Ω)) se nume¸ste corp a lui Ω dac˘ a satisface propriet˘ at ¸ile:

⊂

C 1 . Ac

∈ C, ∀ A ∈ C; C . A ∪ B ∈ C , ∀ A, B ∈ C . 2

Definit¸ia de mai sus are o serie de consecint¸e imediate.

Propozit¸ia 1.2.1. Fie C un corp a lui Ω. Au loc propriet˘ at ¸ile urm˘ atoare: C 3 .

n i=1 Ai

∪

∈ C, ∀ A ∈ C, i = 1, n , n ≥ 2; i

7

8 C 4 .

n i=1

∩ A ∈ C, ∀ A ∈ C, i = 1, n , n ≥ 2; C . ∅, Ω ∈ C ; C . A \ B ∈ C , ∀ A, B ∈ C . i

i

5

6

Demonstrat ¸ie. C 3 se verific˘ a prin induct¸ie. C 4 rezult˘ a din urm˘ atoarea relat¸ie (De Morn n c c gan): i=1 Ai = ( i=1 Ai ) ¸si propriet˘a¸tile C 1 ¸si C 3 . Pentru C 5 , consider˘ am A C; avem Ω = A Ac C ¸si = A Ac C . C 6 se obt¸ine din relat¸ia: A B = A B c ¸si C 4 .

∩ ∪ ∪ ∈ ∅

∩ ∈

\

∈

∩

Vom considera ˆın continuare intersect¸ii de corpuri ale unei mult¸imi fixate. ¸ie de corpuri ale unei mult ¸imi date este un corp al acelei Propozit¸ia 1.2.2. O intersect mult ¸imi. Demonstrat ¸ie. Fie Ci : i I o familie de corpuri ale mult¸imii Ω. Not˘ am C = a A C , atunci A C i , i I , P (Ω). Evident, Ω C (cf. P 3 ), deci C = . Dac˘ i∈I Ci c c de unde A C i , i I (cf. C 1 ), deci A C . Similar se verific˘a A B C , A, B C . Rezult˘a c˘a C este un corp a lui Ω.

∩

⊂

∈

{ ∈ } ∈ ∀ ∈

 ∅

∈

∈

∈

∀ ∈ ∪ ∈ ∀ ∈

Rezultatul de mai sus este util ˆın studiul corpurilor generate de familii de p˘ art¸i ale multimii totale considerate.

 ∅

Definit¸ia 1.2.2. Fie Ω = ¸si M Atunci mult ¸imea

⊂ P(Ω), M = ∅. Fie P = {C − corp a lui Ω | M ⊂ C}. C(M) =



C

∈

C P

se nume¸ste corpul generat de M. Vom observa la C(M) este cel mai mic corp a lui Ω care include familia de p˘ art¸i M a lui Ω. Ne vom referi acum la cazul corpurilor finite.

∅ 1. Dac˘ a M ⊂ P (Ω), M =  ∅, este o mult ¸ime finit˘ a, atunci corpul C(M) este finit. 2. Dac˘ a C este un corp finit a lui Ω, atunci exist˘ a o partit ¸ie finit˘ a ∆ = {A , A , ··· , A }

Propozit¸ia 1.2.3. Fie Ω = .

1

2

n

a lui Ω astfel ca

C =

{∪ ∈ A i I

i

: I

⊂ {1, 2, ··· , n}}.

Demonstrat ¸ie. 1. Fie mult¸imile finite Mc = Ac : A M , M1 = M Mc , M2 = A∈H A : H M1 ¸si M3 = A∈G : G M 2 . Atunci C(M) = M 3 , deci este finit. 2. Partit¸ia ∆ este format˘ a din mult¸imile nevide A and proprietatea urm˘ atoare C, avˆ B A B = A sau B = , B C .

{∪ ⊂ ⇒

⊂ }

{

∅ ∀ ∈

∈ }

∪

∈

{∩

⊂ }

9

1.3

Spat¸ii m˘ asurabile

Not¸ iunea de corp (de mult¸imi), definit˘ a ˆın paragraful enterior, va fi extins˘ a ˆın cele ce urmeaz˘a la cea de σ corp. Aceasta va permite introducerea not¸iunii de spat ¸iu m˘ asurabil (câmp de evenimente).

−

Definit¸ia 1.3.1. Fie Ω o mult ¸ime nevid˘ a. O mult ¸ime nevid˘ a F Ω se nume¸ste σ a lui Ω dac˘ a satisface urm˘ atoarele condit ¸ii:

⊂

− corp

σ1 . Ac

∈ F , ∀ A ∈ F ; σ . dac˘ a A ∈ F , ∀n ∈ N∗ atunci ∪∞ 2

n=1 An

n

∈ F .

Perechea (Ω, F ) se nume¸ste spat ¸iu m˘ asurabil sau cˆ amp de evenimente. Vom observa c˘ a orice σ corp F a lui Ω este un corp a lui Ω. Astfel, pentru A, B F consider˘am ¸sirul (An )n≥1 definit prin A1 = A ¸si An = B, n 1. Conform σ1 , avem ∞ A B = n=1 An F . Deducem c˘a σ-corpul F este corp. Ca urmare, propriet˘ a¸tile C 3 C 6 r˘amân valabile ˆıntr-un σ-corp. Alte propriet˘ a¸ti sunt descrise ˆın propozit¸ia urm˘ atoare.

−

∪

∪

∈ −

∀ ≥

∈

¸iu m˘ asurabil. Au loc urm˘ atoarele propriet˘ at ¸i: Propozit¸ia 1.3.1. Fie (Ω, F ) un spat

∈ F , ∀n ∈ N∗ ⇒ ∩∞ A ∈ F ; σ . A ∈ F , ∀n ∈ N∗ ⇒ lim sup →∞ A ∈ F , lim inf →∞ A ∈ F , unde lim sup →∞ A = ∩∞ ∪∞ A ¸si lim inf →∞ A = ∪∞ ∩∞ σ3 . An 4

n=1

n

n

n

n

n

n

n=1

k=n

n

k

n

n

n

k=n A k .

n=1

Demonstrat ¸ie. σ3 . Conform relat¸iilor lui De Morgan ¸si Definit¸iei 1.3.1, avem: c c ( ∞ F . n=1 An ) σ4 . Se aplic˘a σ2 ¸si P 5 .

∪

∈

Remarc˘am c˘a familiile F 1 = P (Ω) ¸si F 2 = elementare ale lui Ω.

∩∞

n=1 An

=

{∅, Ω} reprezint˘a σ-corpuri (deci ¸si corpuri)

Intersect¸ia unor σ-corpuri ale unei mult¸imi este de asemenea un σ-corp al mult¸imii respective, demonstrat¸ia fiind similar˘a celei din Propozit¸ia 1.2.2. a F i , i I , reprezint˘ a o familie oarecare de σ corpuri ale mult ¸imii Propozit¸ia 1.3.2. Dac˘ Ω, atunci i∈I F i reprezint˘ a de asemenea un corp al mult ¸imii Ω.

∩

∈

−

Proprietatea de mai sus permite definirea not¸iunii de σ-corp generat de o mult¸ime de p˘art¸i (submult¸imi) ale unei mult¸imi Ω. ¸ime nevid˘ a ¸si M P (Ω). Intersect ¸ia tuturor σ corpurilor Definit¸ia 1.3.2. Fie Ω o mult lui Ω care includ mult ¸imea M se nume¸ste σ corpul generat de M ¸si se noteaz˘ a B(M).

−

⊂

−

Mult¸imea B(M) este cel mai mic σ-corp a lui Ω care include pe M. Un caz particular foarte important este cel ˆın care mult ¸imea M este o topologie pe spat¸iul Ω.

10 ¸iu topologic, unde O reprezint˘ a topologia lui Ω (familia Definit¸ia 1.3.3. Fie (Ω, O) un spat mult ¸imilor deschise). Atunci σ corpul generat de mult ¸imea O se nume¸ste borelianul spat ¸iului topologic (Ω, O) ¸si se noteaz˘ a (atunci cˆ and nu este pericol de confuzie) prin BΩ .

−

Topologia OR a mult¸imii numerelor reale R este familia reuniunilor cel mult num˘ arabile de intervale deschise disjuncte. Se poate demonstra c˘ a borelianul B R al spat¸iului topologic (R, OR) cont¸ine toate tipurile de intervale ¸si reuniunile cel mult num˘ arabile ale acestora. Reciproc, BR coincide cu σ - corpul generat de oricare tip de intervale reale.

1.4

Funct¸ii m˘ asurabile

Descriem ˆın continuare funct¸iile ”specifice” spat¸iilor m˘asurabile. ¸ii m˘ asurabile (cˆ ampuri de eveniDefinit¸ia 1.4.1. Fie (Ω, F ) ¸si (Ω , F  ) o pereche de spat  mente). O funct ¸ie f : Ω Ω se nume¸ste funct ¸ie m˘ asurabil˘ a dac˘ a

→

f −1 (A) F ,

∈

∀ A ∈ F ,

unde f −1 (A) = ω

{ ∈ Ω | f (ω ∈ A}.

În particular, dac˘ a Ω = R ¸si F  = B R, funct¸ia f se va numi funct ¸ie real˘ a m˘ asurabil˘ a . R, avem: De remarcat faptul c˘ a, pentru o funct¸ie real˘ a m˘asurabil˘a f : Ω

→

1

• {f ≤ a} := f − ((−∞, a]) ∈ F , ∀ a ∈ R • {f > a} := f − ((a, ∞)) ∈ F , ∀ a ∈ R • {a ≤ f ≤ b} := f − ([a, b]) ∈ F , ∀ a, b ∈ R, a < b. 1

1

Conservarea m˘ asurabilit˘a¸tii prin operat¸ii algebrice este stabilit˘ a de propozit¸ia urm˘ atoare.

¸iu m˘ asurabil. Dac˘ a f, g : Ω ¸ii reale Propozit¸ia 1.4.1. Fie (Ω, F ) un spat R sunt funct m˘ asurabile ¸si a R atunci funct ¸iile reale f +a, af, f , f +g, fg, min f, g ¸si max f, g sunt m˘ asurabile.

∈

||

→

{ }

{ }

Funct¸iie continue sunt m˘asurabile. Astfel, are loc:

Propozit¸ia 1.4.2. Dac˘ a (Ω, BΩ ) este un spat ¸iu m˘ asurabil, cu BΩ reprezentˆ and borelianul R este o funct definit de o topologie pe Ω, iar f : Ω ¸ie continu˘ a, atunci f este o funct ¸ie real˘ a m˘ asurabil˘ a.

→

Not¸iunea de funct ¸ie real˘ a m˘ asurabil˘ a serve¸ste definirii not¸iunii de variabil˘ a aleatoare .

11

1.5

Cˆ ampuri de probabilitate

Not¸iunea de cˆ amp de probabilitate este fundamental˘ a ˆın teoria probabilit˘a¸tilor. Un câmp de probabilitate este un spat¸iu m˘asurabil dotat cu o m˘asur˘a finit˘a numit˘a ”probabilitate”.

Definit¸ia 1.5.1. Fie (Ω, F ) un spat ¸iu m˘ asurabil, cu σ corpul F denumit ”mult ¸imea evenimentelor”. O funct ¸ie P : F R se nume¸ste probabilitate dac˘ a satisface urm˘ atoarele axiome:

−

→

P1.

P(A)

≥ 0, ∀ A ∈ F ;

P2.

P(Ω)

= 1;

P3. Pentru oricare s¸ir de evenimente (An )n∈N , cu A n Am = ,

∞ P (∪n=1 An ) =

∅ ∀ n = m, are loc relat ¸ia

∩

∗

∞



P(An ).

n=1

Tripletul (Ω, F , P) se nume¸ste cˆ amp de probabilitate. Ultima proprietate a definit¸iei de mai sus se refer˘ a la ¸siruri de evenimente. În continuare, ne vom referi la ¸sirurile monotone de evenimente ¸si limitele de ¸siruri de evenimente. ampul de probabilitate (Ω, F , P). Definit¸ia 1.5.2. Fie (An )n∈N un ¸sir de evenimente din cˆ ∗

1. S ¸ irul (An)n∈N se nume¸ste monoton cresc˘ ator dac˘ a An ∞ A = n=1 An F . Not˘ am limn→∞ An = A ¸si A A. ∗

∪

∈

↑

⊂

2. S ¸ irul (An )n∈N se nume¸ste monoton descresc˘ ator dac˘ a An+1 ∞ A = n=1 An F . Not˘ am limn→∞ An = A ¸si A A. ∗

∩

∈

↓

An+1 ,

∀n≥

1. Fie

⊂ A , ∀ n ≥ 1. n

Fie

3. Limita superioar˘ a a ¸sirului (An )n∈N se define¸ste prin ∗

∞ lim sup An = ∞ n=1 k=n A k

∩ ∪

n

→∞

∈ F .

4. Limita inferioar˘ a a ¸sirului (An)n∈N se define¸ste prin ∗

∞ lim inf An = ∞ n=1 k=n A k n

→∞

∪ ∩

∈ F .

Probabilitatea are o serie de propriet˘ a¸t i fundamentale care decurg din Definit¸ia 1.5.1. Aceste propriet˘ a¸t i caracterizeaz˘ a ˆın fapt o m˘ asur˘ a finit˘ a . amp de probabilitate. Au loc urm˘ atoarele propriet˘ at ¸i Propozit¸ia 1.5.1. Fie (Ω, F , P) un cˆ

∅) = 0; P5. P(A ∪ B) = P(A) + P(B), ∀ A, B ∈ F , A ∩ B = ∅; P6. P(A ) = 1 − P(A), ∀ A ∈ F ; P4.

P(

c

12

\ B) = P(A) − P(B), ∀ A, B ∈ F , B ⊂ A; P8. P(A) ≤ P(B), ∀ A, B ∈ F , A ⊂ B; P9. P(A) ∈ [0, 1], ∀ A ∈ F ; P7.

P(A

P10. (Formula lui Poincaré) n

∪

P(

n i=1 Ai )

=

−

( 1)



k+1

k

P( j=1 Aij );

∩

1 i1
≤

k=1

···

≤

P11. Dac˘ a (An )n≥1 este un ¸sir monoton (cresc˘ ator sau descresc˘ ator) de evenimente, cu limn→∞ An = A, atunci limn→∞ P(An ) = P(A). P12. Pentru oricare ¸sir de evenimente (An )n∈N avem ∗

∪∞

P ( n=1 An )

∞

 ≤

P(An ).

n=1

Demonstrat ¸ie. N∗ . P4. Presupunem, prin absurd, c˘ a P( ) = p > 0. Consider˘ am ¸sirul An = , n ∞ P(A ) = . Contradict¸ie. Conform [P 3], P( ) = P( ∞ n n=1 (An ) = n=1 P5. Alegem ¸sirul An = , n 3, A1 = A ¸si A 2 = B ¸si aplic˘am [P 3], [P 4]. P6. Relat¸ia rezult˘ a din Ac A = Ω ¸si propriet˘a¸t ile [P 2], [P 5]. P7. Se obt¸ine din A = B (A B) ¸si [P 5]. P8. Rezult˘ a din proprietatea anterioar˘ a, [P 7]. P9. Consecint¸a˘ a propriet˘ a¸t ilor [P 1], [P 2] ¸si [P 8]. P10. Formula se demonstreaz˘ a prin induct¸ie matematic˘ a. ∞ P11. Presupunem An . Avem A1 = n=1 (An An+1 ), cu (Ai Ai+1) (A j A j+1) = , i = j. Atunci P(A1 ) = ∞ a limn→∞ ∞ n=1 P (An An+1 ). Rezult˘ k=n P (Ak Ak+1 ) = 0. ∞ ∞ Dar k=n P (Ak Ak+1 ) = P ( n=1 (An An+1 )) = P(An). Deci limn→∞ P(An ) = 0 = P( ). Presupunem An A. Atunci (An A) , de unde limn→∞ P(An A) = 0 ¸si obt¸inem limn→∞ P(An) = P(A). Presupunem An A. Atunci Acn A c . Rezult˘ a limn→∞ P(Acn ) = P(Ac ), de unde obt¸inem limn→∞ P(An) = P(A). n−1 P12. Definim ¸sirul de evenimente (Bn)n≥1, B1 = A 1, Bn = A n A n, n > 1. k=1 Ak n n Avem k=1 Bk = k=1 Ak , n 1 ¸si Bi B j = , i = j. Ca urmare, conform propriet˘a¸t ilor [P 3] ¸si [P 8], avem

∅

∅ ∀  ∅



∪

∅

∪ ∅ ≥ ∪ ∪ \

↓ ∅

\ ↓ ↑



∪

∪∞

P ( n=1 An )

ceea ce trebuia demonstrat.

∞

∪ \ ∪ \ \ ↓ ∅ ↓

∀ ≥

\

= P( ∞ n=1 Bn ) =

\

∈

∩ \ \

\



\∪ ∅ ∀ 

∩

∪

∅

∞

 n=1

P(Bn )

∞

 ≤ n=1

P(An ),

⊂

∀

13

1.6

Evenimente independente, evenimente condit ¸ionate

Un fenomen important studiat de teoria probabilit˘ a¸t ilor este cel al dependent¸ei (respectiv independent¸ei) evenimentelor.

Definit¸ia 1.6.1. Fie (Ω, F , P) un cˆ amp de probabilitate. Consider˘ am un eveniment A F , cu P(A) > 0. Pentru oricare eveniment B F numim probabilitatea lui B condit ¸ionat˘ a de (realizarea evenimentului) A m˘ arimea:

∈

∈

P(B

∩ A) . |A) := P(BP(A)

Evenimentele A ¸si B se numesc evenimente independente dac˘ a P(B A) = P(B), adic˘ a P(A B) = P(A) P(B). Mai general, G F se nume¸ste familie de evenimente independente dac˘ a pentru oricare evenimente distincte A1, A2 , , An G avem

∩

·

|

⊂

· ··

∈

n n

P ( i=1 Ai )

∩

=



P(Ai ).

i=1

Se constat˘ a astfel c˘ a dou˘ a evenimente sunt independente dac˘ a probabilitatea realiz˘ arii unuia dintre acestea nu este influient¸at˘ a de realizarea celuilalt. Se arat˘ a cu u¸surint¸a˘ c˘a evenimentele contrare ale unor evenimente independente sunt de asemenea independente. Pe de alt˘a parte, conceptul de evenimente condit ¸ionate permite considerarea sistemelor complete de evenimente .

Definit¸ia 1.6.2. Evenimentele Ai , i I, unde I este o mult ¸ime cel mult num˘ arabil˘ a de indici, formeaz˘ a un sistem complet de evenimente ˆın cˆ ampul de probabilitate (Ω, F , P) dac˘ a:

∈

1. Ai

∩ A = ∅, ∀ i = j j

2.

∪ ∈ A = Ω

3.

P(Ai ) > 0,

i I

i

∀ i ∈ I

amp de probabilitate, iar A i , i I , un sistem complet Propozit¸ia 1.6.1. Fie (Ω, F , P) un cˆ de evenimente. Dac˘ a A este un eveniment cu probabilitate nenul˘ a, atunci loc:

∈

1. Formula probabilit˘ at ¸ii totale P(A)

=



P(A

i I

∈

|A )P(A ) i

i

2. Formula lui Bayes P(Ak

|A) =

P(A



i I

∈

|A )P(A ) , ∀ k ∈ I . P(A|A )P(A ) k

k

i

i

14 Demonstrat ¸ie. 1. Avem A = A

∩ Ω = A ∩ (∪ ∈ A ) = ∪ ∈ (A ∩ A ) . Deoarece evenimentele A ∩ A , i ∈ I sunt incompatibile dou˘ a câte dou˘ a, obt¸inem P(A) = P (A ∩ A ) = P (A|A ) P (A ) , i I

i

i I

i

i





i

i I

i

i

i I

∈

∈

deci formula probabilit˘ a¸t ii totale este demonstrat˘ a. 2. Fie k I . Conform Definit¸iei 1.6.1 ¸si formulei probabilit˘ a¸tii totale, obt¸inem

∈

P(Ak

∩A ) = |A) = P(AP(A) k

deci formula lui Bayes este demonstrat˘ a.

1.7

P(A



i I

∈

|A )P(A ) , P(A|A )P(A ) k

k

i

i

Scheme clasice de probabilitate

Prezent˘ am ˆın continuare modelele de baz˘ a de cmpuri ˆ de probabilitate (discrete). 1. Cˆ ampul lui Laplace. Spat¸iul Ω este considerat o mult¸ime finit˘a, iar σ corpul F este considerat mult¸imea Ω se P(Ω) (mult¸imea submult¸imilor lui Ω). Probabilitatea unui eveniment A define¸ste prin: A P(A) = , Ω

−

⊂

| | | |

unde M reprezint˘ a num˘arul elementelor unei mult¸imi finite M . Elementele lui Ω determin˘a evenimentele elementare , echiprobabile . Astfel, pentru ω Ω, avem

| |

∈

{ω}) = n1 ,

P(

unde n = Ω .

| |

2. Cˆ amp discret de evenimente. Consider˘a m Ω = ωi : i I , unde mult¸imea de indici I este cel mult num˘ arabil˘a. Definim F = P(Ω). Consider˘ a m o m˘asur˘a de probabilitate ( pi )i∈I pe mult¸imea Ω, unde pi 0, i I ¸si i I pi = 1. Probabilitatea unui eveniment A = ω j : j J , cu J I , se define¸ste prin P(A) = p j .

⊂

{ ≥ ∀ ∈

∈ }



{

∈

∈ }



j J

∈

Modelele de mai sus se materializeaz˘ a concret ˆın scheme de probabilitate . Este vorba exemple cu un grad mare de generalitate ¸si utilizare frecvent˘ a ˆın calculul probabilit˘ at ¸ilor . Prezent˘ am ˆın continuare cele mai cunoscute scheme de probabilitate.

15 1. Schema lui Bernoulli. Este un exemplu de cˆ amp Laplace. Schema modeleaz˘ a urm˘atoarea experient¸a˘: O urn˘ a cont¸ine c bile, dintre care a sunt albe ¸si b sunt negre (a+b=c ). Se extrage o bil˘a, i se ˆınregistreaz˘ a culoarea, iar apoi se reintroduce ˆın urn˘ a. Se repet˘ a aceast˘ a experient¸a˘ de n ori. Se studiaz˘ a probabilitatea evenimentului Ak|n al aparit¸iei bilei albe de k ori ˆın cele n extrageri (cu repunerea bilei ˆın urn˘ a). Not˘am Pk|n = P Ak|n probabilitatea evenimentului ment¸ionat. Un rat¸ionament elementar ne conduce la formula de calcul

 

Pk|n

= C nk pk q n−k , k = 0, 1,

· ·· , n,

unde p = a/c este probabilitatea aparit¸iei unei bile la o extragere, iar q = b/c = 1 p este probabilitatea evenimentului contrar (aparit ¸ia unei bile negre).

−

Modelul este echivalent cu repetarea unei experient¸e (ˆın condit¸ii identice) de n ori ¸si studiul probabilit˘a¸t ii realiz˘arii unui anumit eveniment de k ori (din totalul de n experient¸e). Remarc˘am n

n

n

   P

k=0

A k |n =

k=0

deci evenimentele Ak|n , k = 0, 1,



Pk|n =

C nk pk q n−k = (q + p)n = 1,

k=0

··· , n, reprezint˘a un sistem complet.

2. Schema multinomial˘ a. Este o extindere a schemei lui Bernoulli. Se consider˘ a o urn˘ a cont¸inând bile de s culori, câte ai bile din culoarea i Not˘am ai pi = s j=1 a j



∈ {1, 2, ··· , s}.

probabilitatea extragerii unei bile de culoarea i 1, 2, , s . Se fac n extrageri, cu repunerea bilei ˆın urn˘ a dup˘ a fiecare extragere. Fie (ki )i=1,s un vector de dimensiune s, cu componente naturale, avˆ and proprietatea si=1 ki = n. Not˘am P(ki )

∈{

i=1,s

·· · }



|n

probabilitatea evenimentului A(ki )i=1,s |n de extragere a exact ki bile de culoarea i, unde i = 1, 2, , s, din totalul de n bile extrase. Se constat˘ a c˘a

· ··

P(ki )

i=1,s

unde



|n =



n k1, k2 ,

··· , k

n k1 , k2 ,

· ·· , k

s



s

=



pk11 pk22

n! k1!k2 ! ks !

···

reprezint˘ a combin˘ arile multinomiale de n luate câte k1 , k2 , Avem



∈Ns ;

(ki )

s

i=1 ki =n

P(ki )

i=1,s

|n =

 

∈Ns ;

(ki )

s

i=1 ki =n

ks s ,

·· · p

n k1 , k2,

· ·· , k . s

·· · , k

s



pk11 pk22

· ·· p

ks s

=

16 = ( p1 + p2 + deci A(ki )i=1,s |n , cu (ki ) evenimente.

s

∈ N , astfel ca

· ·· + p ) s



s i=1

n

= 1,

ki = n, formeaz˘ a un sistem complet de

3. Schema lui Poisson. Reprezint˘ a o generalizare a schemei lui Bernoulli. Se consider˘ a n urne cu bile albe ¸si negre, dar ˆın proport¸ii diferite. Fie pi probabilitatea extragerii unei bile albe din urna i. Probabilitatea extragerii unei bile negre din urna i va fi q i = 1 pi , i = 1, 2, , n. Se extrage cˆ ate o bil˘a din fiecare urn˘ a. Se analizeaz˘ a probabilitatea evenimentului am Nn = 1, 2, Ak|n de a obt¸ine exact k bile albe din cele n extrase. Not˘ ,n . Avem pi q j . Pk|n = P Ak|n =

−

{

     ⊂Nn ; | I |=k i∈I

I

Observ˘am c˘a

Pk|n reprezint˘ a

· ·· ·· · }

j

∈Nn \I

coeficientul lui xk al polinomului

f (x) = ( p1 x + q 1 ) ( p2x + q 2 ) Evident,

··· ( p x + q ) . n

n

n

 k=0

deci evenimentele Ak|n , k = 0, 1,

Pk|n = f (1)

= 1,

··· , n, reprezint˘a un sistem complet.

4. Schema geometric˘ a. Schema este un exemplu de cˆ amp discret de evenimente. Astfel, se repet˘ a continuu o experient¸a˘, ˆın condit¸ii identice, urm˘ arindu-se de fiecare dat˘ a realizarea unui anumit eveniment A. Fie P(A) = p. Consider˘ am momentul ˆın care evenimentul A se realizeaz˘a pentru prima dat˘ a . Fie n N∗ . Probabilitatea ca evenimentul A s˘a se realizeze pentru prima dat˘ a ˆın cea de a n-a experient¸a˘ este

∈

pn = pq n−1 , unde q = 1

− p. Avem

∞

∞

  pn =

n=1

pq n−1 = p

n=1

∞



q k =

k=0

p

1

− q = 1.

5. Schema hipergeometric˘ a. Se consider˘ a o urn˘a cu N bile, dintre care a bile sunt albe iar restul de b bile sunt negre (a +b = N ). Se extrag n bile (f˘ar˘a a le repune ˆın urm˘a dup˘ a fiecare extragere). Not˘am pk|n probabilitatea evenimentului Ak|n de a avea exact k bile albe ˆıntre cele n bile extrase. Presupunem n N, k a ¸si n k b. Atunci

≤

≤

− ≤

C ak C bn−k pk|n = . n C N

Conform unei formule combinatoriale binecunoscute, obt¸inem min a,n

min a,n





{ }

k=max 0,n b

pk|n =

{ −}

{ }

k=max 0,n b

{ −}

C ak C bn−k = 1, n C N

17 deci Ak|n, max 0, n mente.

{

− b} ≤ k ≤ min{a, n}, formeaz˘a un sistem complet de eveni-

6. Schema hipergeometric˘ a generalizat˘ a. Se consider˘ a o urn˘a cu N bile de s culori. Fie ai num˘arul de bile de culoarea i, i = 1, 2, , s. Avem deci si=1 ai = N . Se extrag, f˘ ar˘a repunere, n bile. Consider˘ am s s N , cu vectorul (ki ) ıncˆ at ki ai , i = 1, 2, , s. Atunci i=1 ki = n, astfel ˆ probabilitatea extragerii a k i bile din culoarea i, pentru fiecare i 1, 2, , s , este

···

∈



≤

C ak11 C ak22 C akss p(ki ) = . n C N

···

∈{

· ··

··· }

18

1.8

Rezumat

În teoria probabilit˘ a¸tilor, evenimentele rezultate ˆın urma unei experient ¸e sunt interpretate ca o familie de submult¸imi ale evenimentului sigur, mult¸imea Ω. Mult¸imea evenimentelor formeaz˘a un σ corp (borelian). O mult¸ime nevid˘a F Ω se nume¸ste σ corp a lui Ω daca satisface urm˘ atoarele condit¸ii:

−

⊂

−

σ1 . Ac

∈ F , ∀ A ∈ F ; σ . dac˘ a A ∈ F , ∀n ∈ N∗ atunci ∪∞ 2

n=1 An

n

∈ F .

Perechea (Ω, F ) se nume¸ste spat¸iu m˘asurabil sau câmp de evenimente. Borelianul lui Ω = R, notat BR este σ corpul generat de mult¸imile deschise (topologia lui R), adic˘a cel mai mic σ corp a lui R care include mult¸imile deschise. BR cont¸ine toate tipurile de intervale ¸si este generat de oricare tip de intervale reale. Fie (Ω, F ) ¸si (Ω , F  ) o pereche de spat¸ii m˘asurabile (cˆ ampuri de evenimente). O funct¸ie  f : Ω Ω se nume¸ste funct ¸ie m˘ asurabil˘ a dac˘ a

−

−

→

f −1 (A) F ,

∈

∀ A ∈ F ,

unde f −1 (A) = ω Ω f (ω A . În particular, dac˘ a Ω = R ¸si F  = BR, funct¸ia f se va numi funct ¸ie real˘ a m˘ asurabil˘ a . R, avem: Pentru o funct¸ie real˘ a m˘asurabil˘a f : Ω

{ ∈ |

∈ }

→ • {f ≤ a} := f − ((−∞, a]) ∈ F , ∀ a ∈ R • {f > a} := f − ((a, ∞)) ∈ F , ∀ a ∈ R • {a ≤ f ≤ b} := f − ([a, b]) ∈ F , ∀ a, b ∈ R, a < b. 1

1

1

R sunt funct Dac˘a f, g : Ω ¸ii reale m˘asurabile ¸si a R atunci funct¸iile reale f + a, af, f , f + g, fg, min f, g ¸si max f, g sunt m˘asurabile. Fie (Ω, F ) un spat¸iu m˘asurabil, cu σ corpul F denumit ”mult¸imea evenimentelor”. O funct¸ie P : F R se nume¸ste probabilitate dac˘ a satisface urm˘ atoarele axiome:

→

||

→ P1. P(A) ≥ 0, ∀ A ∈ F ; P2.

P(Ω)

{ }

∈

{ } −

= 1;

P3. Pentru oricare ¸sir de evenimente (An )n∈N , cu A n Am = ,

∩

∗

∞ P (∪n=1 An ) =

∞



P(An ).

n=1

Tripletul (Ω, F , P) se nume¸ste cˆ amp de probabilitate. Probabilitatea are propriet˘ a¸tile:

∅) = 0; P5. P(A ∪ B) = P(A) + P(B), ∀ A, B ∈ F , A ∩ B = ∅; P4.

P(

∅ ∀ n = m, are loc relat¸ia

19 P(Ac )

− P(A), ∀ A ∈ F ; P7. P(A \ B) = P(A) − P(B), ∀ A, B ∈ F , B ⊂ A; P8. P(A) ≤ P(B), ∀ A, B ∈ F , A ⊂ B; P9. P(A) ∈ [0, 1], ∀ A ∈ F ; P6.

=1

P10. (Formula lui Poincaré) n

∪

P(

n i=1 Ai )

−

=

( 1)



k+1

k

P( j=1 Aij );

1 i1
≤

k=1

···

≤

∩

P11. Dac˘ a (An)n≥1 este un ¸sir monoton (cresc˘ ator sau descresc˘ ator) de evenimente, cu limn→∞ An = A, atunci limn→∞ P(An) = P(A). P12. Pentru oricare ¸sir de evenimente (An )n∈N avem ∗

∞ P (∪n=1 An ) ≤

∞



P(An ).

n=1

Consider˘am un eveniment A F , cu P(A) > 0. Pentru oricare eveniment B numim probabilitatea lui B condit¸ionat˘ a de (realizarea evenimentului) A m˘arimea:

∈

P(B

∈ F ,

∩ A) . |A) := P(BP(A)

Evenimentele A ¸si B se numesc independente dac˘ a P(B A) = P(B), adic˘a P(A B) = P(A)P(B). Mai general, G F se nume¸ste familie de evenimente independente dac˘ a pentru oricare evenimente distincte A1 , A2 , , An G avem

|

⊂

···

∈

n

n

P ( i=1 Ai )

∩

∩

=



P(Ai ).

i=1

Astfel, dou˘a evenimente sunt independente dac˘ a probabilitatea realiz˘ arii unuia dintre acestea nu este influient¸at˘a de realizarea celuilalt. Evenimentele Ai , i I , unde I este o mult¸ime cel mult num˘rabil˘a de indici, formeaz˘ a un sistem complet de evenimente ˆın cˆ ampul de probabilitate (Ω, F , P) dac˘ a:

∈

1. Ai

∩ A = ∅, ∀ i = j j

2.

∪ ∈ A = Ω

3.

P(Ai ) > 0,

i I

i

∀ i ∈ I

Dac˘a A este un eveniment cu probabilitate nenul˘ a (neneglijabil), atunci loc: 1. Formula probabilit˘ a¸t ii totale P(A)

=

 i I

∈

P(A

|A )P(A ) i

i

20 2. Formula lui Bayes P(Ak

|A) =

|A )P(A ) , ∀ k ∈ I . P(A|A )P(A )

P(A



i I

∈

k

k

i

i

Modelele de baz˘ a de cmpuri ˆ de probabilitate discrete: 1. Cˆ ampul lui Laplace. Spat¸iul Ω este considerat o mult¸ime finit˘a, iar σ corpul F este considerat mult¸imea Ω se P(Ω) (mult¸imea submult¸imilor lui Ω). Probabilitatea unui eveniment A define¸ste prin: A P(A) = , Ω

−

⊂

| | | |

unde M reprezint˘ anum˘ arul elementelor unei mult¸imi finite M . Elementele lui Ω determin˘a evenimentele elementare , echiprobabile . Astfel, pentru ω Ω, avem

| |

∈

{ω}) = n1 ,

P(

unde n = Ω .

| |

2. Cˆ amp discret de evenimente. Consider˘a m Ω = ωi : i I , unde mult¸imea de indici I este cel mult num˘ arabil˘a. Definim F = P(Ω). Consider˘ a m o m˘asur˘a de probabilitate ( pi )i∈I pe mult¸imea Ω, unde pi 0, i I ¸si i I pi = 1. Probabilitatea unui eveniment A = ω j : j J , cu J I , se define¸ste prin P(A) = p j .

⊂

{ ≥ ∀ ∈

∈ }



{

∈

∈ }



j J

∈

Schemele de probabilitate reprezint˘ a modele/exemple cu un grad mare de generalitate

ˆın calculul probabilit˘ at ¸ilor . 1. Schema lui Bernoulli. Este un exemplu de cˆ amp Laplace. Schema modeleaz˘ a urm˘atoarea experient¸a˘: O urn˘ a cont¸ine c bile, dintre care a sunt albe ¸si b sunt negre (a+b=c ). Se extrage o bil˘a, i se ˆınregistreaz˘ a culoarea, iar apoi se reintroduce ˆın urn˘ a. Se repet˘ a aceast˘ a experient¸a˘ de n ori. Se studiaz˘ a probabilitatea evenimentului Ak|n al aparit¸iei bilei albe de k ori din cele n extrageri (cu repunerea bilei ˆın urn˘ a). Not˘am Pk|n = P Ak|n probabilitatea evenimentului ment¸ionat. Avem

 

Pk|n

= C nk pk q n−k , k = 0, 1,

· ·· , n,

unde p = a/c este probabilitatea aparit¸iei unei bile la o extragere, iar q = b/c = 1 p este probabilitatea evenimentului contrar (aparit ¸ia unei bile negre).

−

2. Schema multinomial˘ a. Este o extindere a schemei lui Bernoulli. Se consider˘ a o urn˘ a cont¸inând bile de s culori, câte ai bile din culoarea i Not˘am ai pi = s j=1 a j



∈ {1, 2, ··· , s}.

21 probabilitatea extragerii unei bile de culoarea i 1, 2, , s . Se fac n extrageri, cu repunerea bilei ˆın urn˘ a dup˘ a fiecare extragere. Fie (ki )i=1,s un vector de dimensiune s, cu componente naturale, avˆ and proprietatea si=1 ki = n. Not˘am

∈{

P(ki )

i=1,s

·· · }



|n

probabilitatea evenimentului A(ki )i=1,s |n de extragere a exact ki bile de culoarea i, unde i = 1, 2, , s, din totalul de n bile extrase. Avem

· ··

P(ki )

i=1,s

unde



|n =



n k1, k2 ,

··· , k

n k1 , k2 ,

· ·· , k

s



s

=



pk11 pk22

ks s ,

·· · p

n! k1!k2 ! ks !

···

reprezint˘ a combin˘ arile multinomiale de n luate câte k1 , k2 ,

· ·· , k . s

3. Schema lui Poisson. Reprezint˘ a o generalizare a schemei lui Bernoulli. Se consider˘ a n urne cu bile albe ¸si negre, dar ˆın proport¸ii diferite. Fie pi probabilitatea extragerii unei bile albe din urna i. Probabilitatea extragerii unei bile negre din urna i va fi q i = 1 pi , i = 1, 2, , n. Se extrage cˆ ate o bil˘a din fiecare urn˘ a. Se analizeaz˘ a probabilitatea evenimentului Ak|n de a obt¸ine exact k bile albe din cele n extrase. Not˘ am Nn = 1, 2, ,n . Avem Pk|n = P Ak|n = pi q j .

−

{

     ⊂Nn ; | I |=k i∈I

I

Observ˘am c˘a

a Pk|n reprezint˘

· ·· ·· · }

j

∈Nn \I

coeficientul lui xk al polinomului

f (x) = ( p1 x + q 1 ) ( p2x + q 2 )

··· ( p x + q ) . n

n

4. Schema geometric˘ a. Schema este un exemplu de cˆ amp discret de evenimente. Astfel, se repet˘ a continuu o experient¸a˘, ˆın condit¸ii identice, urm˘ arindu-se de fiecare dat˘ a realizarea unui anumit eveniment A. Fie P(A) = p. Consider˘ am momentul ˆın care evenimentul A se ∗ realizeaz˘a pentru prima dat˘ a . Fie n N . Probabilitatea ca evenimentul A s˘a se realizeze pentru prima dat˘ a ˆın cea de a n-a experient¸a˘ este

∈

pn = pq n−1 , unde q = 1

− p.

5. Schema hipergeometric˘ a. Se consider˘ a o urn˘a cu N bile, dintre care a bile sunt albe iar restul de b bile sunt negre (a +b = N ). Se extrag n bile (f˘ar˘a a le repune ˆın urm˘a dup˘ a fiecare extragere). Not˘am pk|n probabilitatea evenimentului Ak|n de a avea exact k bile albe ˆıntre cele n bile extrase. Presupunem n N, k a ¸si n k b. Atunci

≤

≤

− ≤

C ak C bn−k pk|n = . n C N

22

1.9

Test

1. Definit¸i not¸iunea de evenimente condit¸ionate. Enunt¸ati ¸si demonstrat¸i formula probabilit˘a¸t ii totale. 2. Aplicat¸i formula lui Poincaré pentru n evenimente independente, echiprobabile, de probabilitate p (0, 1).

∈

3. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si evenimentele A, B F . S¸tiind c˘a P(A) = 1/5, P(B) = 3/5 ¸si P(A B) = 1/10, s˘a se calculeze probabilit˘ a¸tile:

∩

∈

∪ B); (b) P(A ∩ B); (c) P(A|B) = P (a)

P(A

B (A).

4. Un sportiv trage la o ¸t int˘a cu 5 pu¸sti diferite, cu probabilit˘ a¸t ile respective de ochire: p1 = 0, 8, p2 = 0, 7, p3 = 0, 4, p4 = 0, 9 ¸si p5 = 0, 5. S˘a se calculeze: (a) probabilitatea ca ¸tinta s˘ a fie nimerit˘a de exact 3 ori; (b) probabilitatea ca ¸tinta s˘ a nimerit˘ a cel put¸in o data. 5. Un portar ap˘ ar˘a o lovitur˘ a de la 11 metri cu probabilitatea p = 0, 3. La finalul unui meci, se execut˘ a 5 lovituri de la 11 metri. (a) Care este probabilitatea ca portarul respectiv s˘ a apere exact 2 lovituri? (b) Care este cel mai probabil num˘ ar de goluri primite? 6. Care este probabilitatea de a nimeri exact doua numere la jocul Loto 6 din 49 , dac˘a se joac˘ a o singur˘a variant˘ a? 7. Un baschetbalist execut˘ a arunc˘ ari de la distant¸a˘ la un panou de baschet, pˆ an˘a la prima reu¸sit˘ a. S¸tiind c˘a ¸sansa de reu¸sit˘ a a fiec˘ arei arunc˘ a ri este de 20%, s˘ a se determine probabilitatea ca sportivul s˘ a ˆınscrie primul co¸s din a patra aruncare. Care este cel mai probabil num˘ ar de arunc˘ ari pân˘a la prima reu¸sit˘a?

Capitolul 2 Variabile aleatoare. Caracteristici numerice 2.1

Introducere

2.2

Variabile aleatoare

Variabilele aleatoare se interpreteaz˘ a ca o ”enumerare” a rezultatelor (m˘ asurabile) potent¸iale ale unui anumit experiment. Fiecare din aceste rezultate posibile are o probabilitate de realizare. Definit¸ia de mai jos formalizeaz˘a matematic un experiment cu rezultate aleatoare, predictibile. amp de probabilitate. O funct ¸ie m˘ asurabil˘ a real˘ a Definit¸ia 2.2.1. Fie (Ω, F , P) un cˆ R se nume¸ X : Ω ste variabil˘ a aleatoare (real˘ a).

→

Conform definit¸iei, pentru o variabil˘a aleatoare X definit˘ a pe câmpul de probabilitate (Ω, F , P), avem X I F ,

{ ∈ } ∈

pentru orice interval real I . In particular,

{X ∈ (−∞, a]} = {X ≤ a} ∈ F , ∀ a ∈ R.

Probabilit˘a¸t ile evenimentelor descrise mai sus ofer˘ a o informat¸ie fundamental˘ a privind variabila aleatoare. În fapt, cunoa¸sterea probabilit˘ a¸tile evenimentelor X a , a R, ofer˘a o informat¸ie precis˘ a privind distribut¸ia valorilor variabilei aleatore X . În sect¸iunea urm˘atoare, va fi introdus˘ a ¸si caracterizat˘ a funct ¸ia de repartit ¸ie a a unei variabile aleatoare, construit˘a pe baza probabilit˘ a¸t ilor ment¸ionate. O mult¸ime finit˘a de variabile aleatoare definite pe acela¸si cˆ amp de probabilitate va determina un vector aleator. Mai precis, avem urm˘ atoarea definit¸ie.

{ ≤ } ∈

Definit¸ia 2.2.2. Fie d > 1 un num˘ ar ˆıntreg ¸si (Ω, F , P) un cˆ amp de probabilitate. Cond sider˘ am borelianul BRd spat ¸iului R ( σ corpul generat de topologia lui Rd ). O funct ¸ie d R , (F , BRd ) m˘ X : Ω asurabil˘ a, se nume¸ste vector aleator.

−

→

Fie X i , i = 1, 2, , d, componentele scalare ale funct¸iei X , deci X = (X 1 , X 2 , Conform definit¸iei de mai sus,

·· ·

d

{X ≤ a , X ≤ a , ··· , X ≤ a } ∈ F , ∀ (a , a , ··· , a ) ∈ R . 1

1

2

2

d

d

23

1

2

d

··· , X ). d

24

2.3

Funct¸ia de repartit¸ie

Distribut¸ia valorilor unei variabile aleatoare reale este caracterizat˘ a prin not¸iunea de funct¸ie de repartit¸ie. De regul˘ a , câmpul de probabilitate pe care este definit˘ a variabila aleatoare nu este ment¸ionat ˆın mod explicit.

Definit¸ia 2.3.1. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si X : Ω Funct ¸ia real˘ a F : R [0, 1], definit˘ a prin

→

→ R o variabil˘ aaleatoare.

F (x) = P X x = P( ω

{ ∈ Ω : X (ω) ≤ x}), x ∈ R,

{ ≤ }

se nume¸ste funct ¸ia de repartit ¸ie a variabilei aleatoare X . Propozit¸ia urm˘ atoare grupeaz˘ a propriet˘ a¸t ile de baz˘ a ale unei funct¸ii de repartit¸ie. ¸ia de repartit ¸ie a unei variabilei aleatoare X . Propozit¸ia 2.3.1. Fie F : R [0, 1] funct Au loc urm˘ atoarele propriet˘ at ¸i cu caracter general.

→

1. F este monoton cresc˘ atoare pe R; 2. F este continu˘ a la dreapta pe mult ¸imea R ( F (x + 0) := lim F (t) = F (x), t x

↓

3. lim F (x) = 0; x

→−∞

4. F (x

∀ x ∈ R);

lim F (x) = 1;

x

→∞

F (t) = P{X < x}, ∀ x ∈ R; − 0) := lim ↑ 5. P{X = x } = F (x) − F (x − 0), ∀ x ∈ R; 6. P{a < X ≤ b } = F (b) − F (a), ∀ a, b ∈ R, cu a < b; 7. P{X > x} = 1 − F (x), ∀ x ∈ R. t x

Demonstrat ¸ie. Fie (Ω, F , P) un cˆ ampul de probabilitate pe care este definit˘ avariabila aleatoare X . R, cu x1 < x2 . Avem X 1. Fie x1 , x2 x1 X x2 , de unde P X x1 P X x 2 , sau F (x1 ) F (x2 ). 2. Fiind monoton cresc˘ atoare pe R, funct¸ia F admite limite laterale finite pe R. Mai precis, pentru x anga ˆın x este F (x 0) = suptx F (t). Evident,

{ ≤ }

∈

{ ≤ } ⊂ { ≤ }

≤

∈

{ ≤ }≤

−

F (x

− 0) ≤ F (x) ≤ F (x + 0), ∀ x ∈ R. Fix˘am x ∈ R, arbitrar. Not˘am A = X ≤ x + ∈ F , N ∈ N∗ . Fie A = {X ≤ x }. Avem A = ∩∞ A ¸si A ↓ A. Conform Propozit¸iei 1.5.1, avem lim →∞ P(A ) = P(A). Dar, n

n=1

n

n



1 n

  

n

1 n

n

= F (x) ¸si limn→∞ P(An ) = limn→∞ F x + = F (x+0). Obt¸inem F (x+0) = F (x), deci F este continu˘ a la dreapta ˆın x. 3. Conform monotoniei, F admite limite finite la ¸si . Astfel, lim F (x) = P(A)

∞ −∞ →−∞ = {X ≤ − n}, C {X ≤ n}, n ∈ N∗ . x

inf F (x)

F (x) = sup F (x) ≤ 1. Fie B ≥ 0 ¸si lim →∞ ∈ Avem B ↓ ∅, respectiv C ↑ Ω. Ca urmare, lim F (x) = lim F (−n) = lim P(B ) = P(∅) = 0, →−∞ →∞ →∞ x

∈R

x

x

n

n

R

n

n

x

n

n

n

25 respectiv lim F (x) = lim F (n) = lim

x

n

→∞

n

→∞

→∞

P(C n )

= P(Ω) = 1.

4. Fie x R, arbitrar, fixat. Conform propriet˘ at¸ilor unei funct¸ii monoton cresc˘ atoare ¸si Propozit¸iei 1.5.1, avem

∈

F (x

F (t) = lim F − 0) = lim →∞ ↑ n

t x

− 1 n

x

= lim

P

n

→∞

 ≤ −  1 n

X x

=P X
{

}

5. Pentru x

∈ R, avem P{X = x } = P({X ≤ x } \ {X < x}) = P{X ≤ x } − P{X < x} = F (x) − F (x − 0). 6. Fie a, b ∈ R, a < b. Avem {a < X ≤ b } = {X ≤ b } \ {X ≤ a } ¸si {X ≤ a } ⊂ {X ≤ b }. Atunci, conform Propozit¸iei 1.5.1,

{a < X ≤ b} = P{X ≤ b} − P{X ≤ a} = F (b) − F (a). 7. Fie x ∈ R. Avem P{X > x} = P{X ≤ x } = 1 − P{X ≤ x } = 1 − F (x). Din propozit¸ia de mai sus rezult˘a c˘a, dac˘ a F este continu˘ a ˆın x ∈ R, atunci P{X = x } = 0. Ment¸ion˘ a m c˘a, reciproc, orice funct¸ie F : R → [0, 1] care satisface propriet˘ a¸tile P

c

0

0

1-3 din Propozit¸ia 2.3.1 este funct¸ia de repartit¸ie a unei anumite variabile aleatoare. Dou˘ a sau mai multe variabile aleatore care admit o funct¸ie de repartit¸ie comun˘ a vor fi denumite identic distribuite . De asemenea, putem defini funct¸ia de repartit¸ie a unui vector aleator, avˆ and propriet˘ a¸ti generale apropiate de cele ale funct¸iei de repartit¸ie a unei variabile aleatoare.

Definit¸ia 2.3.2. Fie X = (X 1 , X 2 , repartit ¸ie prin F : Rd [0, 1],

→

F (x1, x2,

··· , X ) un vector aleator. d

Definim funct ¸ia sa de d

·· · , x ) = P{X ≤ x , X ≤ x , ··· , X ≤ x }, (x , x , ··· , x ) ∈ R . d

1

1

2

2

d

d

1

2

d

. O not¸iune important˘ a este independent ¸a variabilelor aleatoare , definit˘a mai jos.

Definit¸ia 2.3.3. Variabilele aleatoare X i , i I , definite pe un cˆ amp de probabilitate (Ω, F , P), se numesc independente dac˘ a, pentru oricare oricare indici distinct ¸i i 1 , i2, , in din mult ¸imea I ¸si oricare A1 , A2 , , An B R are loc

∈

·· ·

··· ∈ P{X ∈ A , X ∈ A , ··· , X ∈ A } = P{X ∈ A }P{X ∈ A }··· P{X ∈ A }. În particular, dac˘ a variabilele aleatoare X , X , ··· , X , având, respectiv, funct¸iile de repartit¸ie F , F , · ·· , F , sunt independente, atunci P{X ≤ a , X ≤ a , ··· , X ≤ a } = F (a )F (a ) ··· F (a ), ∀ a , a , · ·· , a ∈ R. i1

1

1

1

i2

2

2

1

in

n

i1

1

2

1

2

1

i2

2

in

n

n

n

2

2

n

n

1

2

n

n

1

2

n

Are loc urm˘ atorul rezultat de baz˘ a privind suma a dou˘a variabile aleatoare independente.

26 and funct ¸iile de repartit ¸ie Propozit¸ia 2.3.2. Fie variabilele aleatoare independente X ¸si Y, avˆ F ¸si respectiv G. Atunci funct ¸ia de repartit ¸ie a variabilei aleatoare Z = X + Y este H = F G, unde

∗

(F G)(x) =

∗

∞



F (x

−∞

− t)dG(t), ∀ x ∈ R.

Variabilele aleatoare cu valori ˆıntr-o mult¸ime cel mult num˘ arabil˘a se numesc discrete . Variabilele aleatoare cu funct¸ia de repartit¸ie derivabil˘a, cu derivata continu˘ a, se numesc continue . In sect¸iunea urm˘ atoare vom discuta aceste tipuri particulare, dar deosebit de importante, de variabile aleatoare. Vom ilustra cele dou˘ a tipuri de variabile aleatoare (discrete ¸si continue) prin exemple clasice, semnificative.

2.4

Variabile aleatoare discrete. Exemple clasice

În continuare, definim, caracteriz˘am ¸si exemplific˘ am variabilele aleatoare de tip discret. amp de probabilitate ¸si X : Ω a aleatoare. Definit¸ia 2.4.1. Fie (Ω, F , P) un cˆ R o variabil˘ X se nume¸ste variabil˘ a aleatoare discret˘ a dac˘ a mult ¸imea X (Ω) este cel mult num˘ arabil˘ a.

→

R, unde I este o mult Fie X ( Ω) = xi , i I ¸ime de indici cel mult num˘ arabil˘a. Not˘am Ai = X = xi I . Remarc˘ a m c˘a familia de evenimente Ai , i I F , i reprezint˘ a o partit¸ie a spat¸iului Ω. R funct Pentru A F , not˘am prin cA : Ω ¸ia caracteriatic˘ a a mult¸imii A, definit˘a prin 1, ω A cA (ω) = . 0, ω Ω A = A c

{ ∈

{

∈ } ⊂ }∈ ∈

{

∈ }

→



∈ ∈ \

Este elementar de verificat faptul c˘ a funct¸ia caracteristic˘ a a unui eveniment este o variabil˘a aleatoare. Are loc urm˘ atoarea reprezentare a variabilei aleatoare discrete X : X =



xi cAi .

i I

∈



Notu˘am p i = P(Ai ), i I . Avem pi 0, i I ¸si i∈I pi = 1. Distribut¸ia variabilei aleatoare X se reprezint˘ a convent¸ional astfel:

∈

≥ ∀ ∈ X :

  xi pi

. i I

∈

Fie variabilele aleatoare discrete, independente, X ¸si Y , cu distribut¸iile X :

  xi pi

, Y : i I

∈

  y j p j

.

j J

∈

Atunci variabila aleatoare X + Y va avea distribut¸ia X + Y :



xi + y j pi p j

Exemplul 2.4.1. Variabile aleatoare Bernoulli.



. (i,j) I J

∈×

27 O variabil˘a aleatoare Bernoulli X ia doar dou˘ a valori: valoarea 1, cu probabilitatea p (0, 1) ¸si valoarea 0, cu probabilitatea q = 1 p. Distribut¸ia lui X se reprezint˘ a astfel:

∈

−

X :

  0 1 q p

.

Not˘am X Bin(1, p).

∼

Exemplul 2.4.2. Variabile aleatoare binomiale. N∗ ¸ O variabil˘a aleatoare binomial˘ a X , de parametrii n si p (0, 1) ia valorile k k n−k k 0, 1, , n cu probabilit˘a¸tile p k = C n p q . Distribut¸ia lui X se reprezint˘ a astfel:

∈ {

∈

· ·· }

X :



··· ···

0 1 2 0 n 1 n−1 2 2 n−2 C n q C n pq C n p q

∈

n n n C n p



.

Variabila aleatoare binomial˘ a indic˘a num˘arul de realiz˘ ari ale unui eveniment având probabilitatea p ˆın n experient¸e identice, independente (schema binomial˘ a - Bernoulli). Not˘am X Bin(n, p). Este important de remarcat c˘ a o variabil˘a aleatoare binomial˘ a de parametrii (n, p) este suma a n variabile aleatoare Bernoulli independente, identic distribuite (de parametru p).

∼

Exemplul 2.4.3. Variabile aleatoare Poisson. O variabil˘a aleatoare Poisson de parametru λ ia valoarea n cu probabilitatea pentru n N, având deci distribut¸ia:

∈

X :



n λn −λ e n!



λn e λ, n!

−

. n

∈N

Not˘am X Poiss(λ).

∼

Exemplul 2.4.4. Variabile aleatoare geometrice. O variabil˘a aleatoare geometric˘ a X de parametru p ia valoarea n cu probabilitatea pq n−1 , pentru n N∗ , unde q = 1 p. X are distribut¸ia:

∈

−

X :



n pq n−1



.

n

∗

∈N

Not˘am X Geom( p). Variabila X indic˘a num˘arul de experient¸e, independente, identice, necesar realiz˘ arii (aparit¸iei) unui eveniment care are probabilitatea p de realizare ˆın cadrul fiec˘arei experient¸e (schema geometric˘ a).

∼

2.5

Variabile aleatoare de tip continuu. Exemple clasice

Un tip important de variabile aleatoare sunt cele de tip continuu.

28 amp de probabilitate ¸si X : Ω a aleatoare Definit¸ia 2.5.1. Fie (Ω, F , P) un cˆ R o variabil˘ avˆ and funct ¸ia de repartit ¸ie F : R [0, 1], F (x) = P X x . X se nume¸ste variabil˘ a aleatoare de tip continuu dac˘ a exist˘ a o funct ¸ie continu˘ a f : R [0, ) cu proprietatea

→ { ≤ } → ∞

→

x

F (x) =



f (t) dt,

∀ x ∈ R.

−∞

Funct ¸ia f se nume¸ste funct ¸ia de densitate (sau densitatea de probabilitate) a variabilei aleatoare X . Propriet˘a¸t ile densit˘ a¸t ii unei variabile aleatoare reale sunt evident¸ite ˆın propozit¸ia de mai jos.

Propozit¸ia 2.5.1. Fie f : R aleatoare de tip continuu X : Ω Atunci:

→ [0, ∞) funct ¸ia de densitate asociat˘ a unei variabile → R. Not˘ am F : R → [0, 1] funct ¸ia sa de repartit ¸ie.

1. F este de clas˘ a C1 pe R, cu F  (x) = f (x), 2.

 R

∀ x ∈ R;

f (t) dt = 1;

{X = x} = 0, ∀ x ∈ R; 4. P{a ≤ X ≤ b } = f (t) dt, ∀ [a, b] ⊂ R. 3.

P

b a



Demonstrat ¸ie. 1. Conform definit¸iei, F este o primitiv˘ a a lui f pe 2.

  { ≤ R

x

f (t) dt = lim x



→∞ −∞

R.

f (t) dt = lim F (x) = 1. x

3. F este continu˘ a pe R, deci 4. P a X b = P X b b = a f (t) dt, [a, b] R.

→∞

{X = x} = F (x) − F (x − 0) = 0, ∀ x ∈ R. ≤ } { ≤ } − P{X < a} = P{X ≤ b} − P{X ≤ a} = F (b) − F (a) = ∀ ⊂ Fie variabilele aleatoare continue, independente, X ¸si Y , cu densit˘ a¸tiile f, g : R → [0, 1]. Din Propozit¸ia 2.3.2 se deduce c˘ a variabila aleatoare X + Y are densitatea f ∗ g, unde f g : R

∗

P

→ [0, ∞), (f ∗ g)(x) =

 R

f (x

− t)g(t) dt, ∀ x ∈ R,

este convolut¸ia densit˘ a¸tilor f ¸si g. Vom prezenta ˆın continuare cˆ ateva exemple clasice de repart¸it¸ii continue. ¸ia normal˘ a. Exemplul 2.5.1. Distribut Este cel mai important exemplu de distribut¸ie de tip continuu. Astfel, spunem c˘ ao variabil˘a aleatoare real˘ a X are o repartit a ¸ie normal˘ a (gaussian˘ a) de parametrii 0 ¸si 1 dac˘ are funct¸ia de densitate: 1 − t2 ϕ(t) = e 2, t R. 2π

√

∀ ∈

29 Variabila normal˘ a (standard) X admite funct¸ie de repartit¸ie: Φ(x) =

x t2 1 − e 2 dt, 2π −∞

√



∀ x ∈ R.

Not˘am X N (0, 1). Distribut¸ia normal˘ a standard este legea limit˘ a universal˘ a , conform Teoremei limit˘ a central˘ a .

∼

Generalizare. X N (µ, σ 2 ), unde µ R, σ > 0, dac˘a admite densitatea de probabilitate (t µ)2 1 − ϕ(t) = e 2σ2 , t R. σ 2π

∈

∈ √

−

∀ ∈

Exemplul 2.5.2. Distribut ¸ia exponent ¸ial˘ a. Variabila aleatoare X are o distribut¸ie exponent¸ial˘ a de parametru λ > 0, notat prin X Exp(λ), dac˘ a ia valori ˆın intervalul [0, ) (deci este o variabil˘ a aleatoare pozitiv˘ a ) ¸si admite funct¸ia de repartit¸ie

∼

∞

F (x) = 1

λx

− e− , ∀ x ≥ 0.

Distribut¸ia exponent¸ial˘ a este fundamental˘ a ˆın teoria fiabilit˘a¸tii, caracterizˆ and modelele de tip Markov.

Exemplul 2.5.3. Distribut ¸ia Gama. Variabila aleatoare X are o distribut¸ie Gama de parametrii α, β > 0, notat prin X Gama(α, β ), dac˘ a ia valori ˆın intervalul (0, ) ¸si admite funct¸ia de densitate

∼

∞

x

xα−1 e− β f (x) = α , β Γ(α) unde Γ(α) =

∞



∀ x > 0,

xα−1 e−x dx

0

este funct¸ia lui Euler de prima spet¸a˘. În statistic˘ a, distribut¸ia de tip Gam(n/2, 2), cu n major˘a.

2 n

∈ N∗, notat˘a prin χ , are o important¸a˘

Exemplul 2.5.4. Distribut ¸ia Beta. Variabila aleatoare X are o distribut¸ie Beta de parametrii α, β > 0, notat prin X a ia valori ˆın intervalul (0, 1) ¸si admite funct¸ia de densitate Beta(α, β ), dac˘

∼

xα−1 (1 x)β −1 f (x) = , B(α, β )

−

unde

1

B(α, β ) =



xα−1 (1

0

este funct¸ia lui Euler de a doua spet¸a˘.

∀ x ∈ (0, 1),

) − x) − dx = Γ(α)Γ(β Γ(α + β ) β 1

30

2.6

Media. Medii de ordin superior

Pentru o variabil˘ a aleatoare real˘ a, media ¸si dispersia reprezint˘ a cele mai importante caracteristici numerice. Astfel, media unei variabile aleatoare (dac˘ a exist˘a) indic˘acea mai a¸steptat˘a valoare a variabilei aleatoare.

Definit¸ia 2.6.1. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si X : Ω avˆ and funct ¸ia de repartit ¸ie F : R [0, 1]. M˘ arimea:

→

E(X )

:=

∞



→ R o variabil˘ aaleatoare

x dF (x)

−∞

se nume¸ste media lui X . Media este definit˘ a ˆın ipoteza c˘ a integrala de tip Stieltjes-Riemann de mai sus este convergent˘ a. Calculul mediei se expliciteaz˘ a astfel: 1. pentru o variabil˘ a aleatoare X de tip discret, cu distribut¸ia X : devine E(X )



=

  xi pi

, media

i I

∈

xi pi ;

i I

∈

2. pentru o variabil˘ a aleatoare X de tip continuu, cu funct¸ia de densitate f : [0, ), media devine

∞

E(X )

:=

∞



R

→

xf (x) dx.

−∞

Urm˘atoarea propozit¸ie stabile¸ste propriet˘a¸t ie de baz˘ a ale mediei variabilelor aleatoare.

Propozit¸ia 2.6.1. Fie X ¸si Y dou˘ a variabile aleatoare cu medie finit˘ a. 1.

E(aX )

= a E(X ),

∀ a ∈ R;

2.

E(X +

Y ) = E(X ) + E(Y );

3. dac˘ a X ¸si Y sunt independente, atunci E(XY ) = E(X )E(Y ). Demonstrat ¸ie. Vom trata doar cazul discret. Presupunem c˘ a X ¸si Y au distribut¸iile X :

  xi pi

, Y : i I

∈

  y j p j

,

j J

∈

unde I ¸si J sunt mult¸imi de indici cel mult num˘ arabile. 1. Pentru a R, avem:

∈

E(aX )

=



(axi ) pi = a

i I



xi pi = a E(X ).

i I

∈

∈

2. Fie Aij = X = x i , Y = y j ¸si pij = P(Aij ), (i, j) I

{

}

  pij =

j J

∈

j J

∈

P(Aij )

= P( j∈J Aij

∪

∈ × J. Atunci ) = P{X = x } = p , ∀ i ∈ I , i

i

31 respectiv

  pij =

i I

P(Aij )

i I

∈

∈

= P( i∈I Aij ) = P Y = y j = p j ,

∪

{

}

∀ j ∈ J.

Deaoarece X + Y are distribut¸ia



X + Y :



xi + y j pij

, (i,j) I J

∈×

obt¸inem E(X +

 

Y ) =

(xi + y j ) pij =

xi

i I

∈×

(xi pi ) +

i I

pij

i I

∈

(y j p j ) = E(X ) + E(Y ).

∈

3. Dac˘a X ¸si Y sunt independente, atunci pij = p i p j ,



=

(xi y j ) pij =

(i,j) I J



(xi pi )(y j p j )

∈×

  (xi pi )

i I

∀ (i, j) ∈ I × J . Rezult˘a

(i,j) I J

∈×

=

∈

pij

j J

∈

E(XY )

j J

∈



y j

+

j J

∈

(i,j) I J

=

     

(y j p j ) = E(X )E(Y ).

j J

∈

∈

Astfel, propriet˘ a¸tile mediei sunt demonstrate ˆın cazul discret. R o variabil˘ R o funct Fie X : Ω a aleatoare iar ϕ : R ¸ie real˘ a m˘asurabil˘a (ˆın R este de asemenea o particular, ϕ continu˘ a). Funct¸ia compus˘ a ϕ(X ) := ϕ X : Ω variabil˘a aleatoare definit˘ a pe Ω. Dac˘ a X admite funct¸ia de repartit¸ie F , atunci

→

→ ◦

E(ϕ(X ))

=

∞



→

ϕ(x) dF (x),

−∞

ˆın ipoteza c˘a integrala este convergent˘ a. În particular, ˆın cazul cˆ and ϕ este o funct¸ie putere sau modului unei funct¸ii putere, obt¸inem mediile de ordin superior, respectiv mediile absolute de ordin superior.

Definit¸ia 2.6.2. Fie (Ω, F , P) un cˆ amp de probabilitate ¸si X : Ω

→ R o variabil˘ aaleatoare.

∈ N∗ a variabilei aleatoare X se define¸ste prin

1. Media de ordin k

E

∞

   k

X

=

xk dF (x),

−∞

dac˘ a integrala este convergent˘ a.

∈ N∗ a variabilei aleatoare X se define¸ste prin ∞ = |x| dF (x), E |X |

2. Media absolut˘ a de ordin k

   | |  ∞ k

k

−∞

dac˘ a integrala este convergent˘ a. Not˘ am cu Lk = L k (Ω) mult ¸imea variabilelor aleatoare R cu proprietatea E X k < X : Ω .

→

32 Ment¸ion˘ am c˘a mult¸imea de funct¸ii L k (Ω) este un spat¸iu vectorial normat ˆın raport cu norma de ordinul k, definit˘a prin X k = E1/k X k , X Lk (Ω). Din inegalitatea lui Lyapunov (Teorema 3.2.4) se obt¸ine

| | 

 

Lk+1 (Ω)

∈

k

⊂ L (Ω), k ∈ N∗. Deducen c˘ a, pentru n ∈ N∗ , o variabil˘a aleatoare X ∈ L (Ω) are medie finit˘ a de ordinele k = 1, ··· , n. n

Exemplul 2.6.1. Mediile unor distribut ¸ii clasice. 1. Distribut ¸ia Bernoulli: X Bin(1, p)

∼ ⇒ E(X ) = p. 2. Distribut ¸ia binomial˘ a: X ∼ Bin(n, p) ⇒ E(X ) = np. 3. Distribut ¸ia Poisson: X ∼ Poiss(λ) ⇒ E(X ) = λ. 4. Distribut ¸ia geometric˘ a: X ∼ Geom( p) ⇒ E(X ) = 1/p. 5. Distribut ¸ia normal˘ a: X ∼ N (µ, σ ) ⇒ E(X ) = µ. 6. Distribut ¸ia exponent ¸ial˘ a: X ∼ Exp(λ) ⇒ E(X ) = 1/λ. 2

2.7

Dispersia

Dispersia unei variabile aleatoare (din spat¸iul L2 ) este un indicator al gradului de ˆımpr˘ a¸stiere a valorilor sale ˆın jurul mediei.

Definit¸ia 2.7.1. Fie X L 2 (Ω), cu E(X ) = µ. M˘ arimea:

∈

V (X ) =

∞



−∞

(x

2

− µ)



dF (x) = E (X

se nume¸ste dispersia lui X . M˘ arimea σ(X ) =

− E(X ))

2





V (X )

se nume¸ste abaterea medie p˘ atratic˘ a a variabilei aleatoare X . Dispersia are urm˘ atoarele propriet˘a¸ti elementare.

Propozit¸ia 2.7.1. Fie X, Y L 2 (Ω).

∈

1. V (X )

≥ 0;

2. V (X ) = E(X 2 )

2

− E (X ) (formula de calcul a dispersiei); 3. V (aX ) = a V (X ), ∀ a ∈ R; 2

4. dac˘ a X ¸si Y sunt v.a. independente, atunci V (X + Y ) = V (X ) + V (Y ).

33 Demonstrat ¸ie. Propriet˘ a¸tile 1 ¸si 3 sunt evidente. Fie µ = E(X ) ¸si η = E(Y ). Formula de calcul a dispersiei se obt¸ine astfel:



V (X ) = E (X

− µ)

2

= E X 2

 

− 2µX + µ

2

= E X 2

  −

2µE(X ) + µ2 = E X 2

 −

Conform Propozit¸iei 2.6.1 ¸si formulei demonstrate avem: V (X + Y ) = E (X + Y )2



−

[E(X + Y )]2 = E X 2 + 2XY + Y 2

= E X 2 + E Y 2 +2µη µ2 2µη η 2 =

  

− − −

−   −    −  E

X 2



µ2 +

Y 2

E

µ2 .

(µ + η)2

η 2 = V (X ) +V (Y ).

¸ii clasice. Exemplul 2.7.1. Dispersiile unor distribut 1. Distribut ¸ia Bernoulli: X Bin(1, p)

∼ ⇒ V (X ) = pq . 2. Distribut ¸ia binomial˘ a: X ∼ Bin(n, p) ⇒ V (X ) = npq . 3. Distribut ¸ia Poisson: X ∼ Poiss(λ) ⇒ V (X ) = λ. 4. Distribut ¸ia geometric˘ a: X ∼ Geom( p) ⇒ V (X ) = q/p . 5. Distribut ¸ia normal˘ a: X ∼ N (µ, σ ) ⇒ V (X ) = σ . 2

2

2.8

2

Corelat¸ia

Corelat¸ia a dou˘a variabile aleatoare este un indicator al tipului de dependent¸a˘ al acestora.

Definit¸ia 2.8.1. Fie X, Y L2 (Ω). Corelat ¸ia variabilelor aleatoare X ¸si Y se define¸ste prin: λ(X, Y ) = E [X E(X )][Y E(Y )] .

∈

{ −

−

ρ(X, Y ) =

λ(X, Y ) σ(X )σ(Y )

M˘ arimea

}

se nume¸ste coeficientul de corelat ¸ie al variabilelor aleatoare X ¸si Y . Propozit¸ia urm˘ atoare stabile¸ste formula de calcul a corelat ¸iei ¸si o proprietate a coeficientului de corelat¸ie. ¸iile anterioare, avem: Propozit¸ia 2.8.1. Cu notat 1. λ(X, Y ) = E(XY )

− E(X )E(Y );

2. dac˘ a X ¸si Y sunt independente, atunci λ(X, Y ) = 0; 3. ρ(X, Y ) [ 1, 1].

∈−

34 Demonstrat ¸ie. 1. Avem λ(X, Y ) = E (XY

− µY − ηX + µη) = E(XY ) − µE(Y ) − ηE(X ) + µη = E(XY ) − µη.

2. Din inegalitatea E

sau



2



− µ) + (Y − η)] ≥ 0, ∀ t ∈ R,

[t(X

V (X )t2 + 2λ(X, Y )t + V (Y ) obt¸inem ∆ := 4 λ2 (X, Y ) Rezult˘a ρ(X, Y )

|

2.9

| ≤ 1.



≥ 0, ∀ t ∈ R,



− V (X )V (Y ) ≤ 0.

Funct¸ia caracteristic˘ a

Funct¸ia caracteristic˘ a asociat˘ a unei variabile aleatoare reprezint˘ a un instrument matematic important. Pentru variabilele aleatoare de tip continuu, funct ¸ia caracteristic˘a reprezint˘ a transformata Fourier a funct¸iei de densitate. Transformarea integral˘ a Fourier este important˘ a ˆın calculul operat ¸ional .

Definit¸ia 2.9.1. Fie X o variabil˘ a aleatoare avˆ and funct ¸ia de repartit ¸ie F . Funct ¸ia ϕX : R C , definit˘ a prin

→

∞

   itX

ϕX (t) = E e

=

eitx dF (x), t

−∞

∈ R,

se nume¸ste functia caracteristic˘ a a variabilei aleatoare X. Fie X o variabil˘a aleatoare de tip continuu, cu densitatea de probabilitate f . În acest caz, functia sa caracteristic˘ a se reprezint˘ a astfel ϕX (t) =

∞



eitx f (x)dx, t

−∞

∈ R,

adic˘a ϕX reprezint˘ a transformata Fourier a funct¸iei f . Dac˘a X este o variabil˘a aleatoare discret˘ a, cu distribut¸ia X :

  xk pk

, k I

∈

atunci funct¸ia sa caracteristic˘a se calculeaz˘ a astfel ϕX (t) =



eitxk pk .

k I

∈

Prezent˘ am ˆın continuare principalele propriet˘ a¸t i ale funct¸iei caracteristice.

Teorema 2.9.1. Fie X o variabil˘ a aleatoare avˆ and funct ¸ia de reaprtit ¸ie F ¸si funct ¸ia carC. Au loc urm˘ acteristic˘ a ϕX : R atoarele propriet˘ at ¸i:

→

35 1. ϕX (0) = 1; 2. ϕ( t) = ϕ X (t),

∀ t ∈ R; 3. |ϕ (t)| ≤ 1, ∀ t ∈ R; 4. ϕ (t) = e ϕ (at), ∀ t ∈ R, ∀ a, b ∈ R; −

X

ibt

aX +b

X

5. ϕX este uniform continu˘ a (deci ¸si continu˘ a) pe R; 6. dac˘ a X L n (Ω), atunci ϕX este derivabil˘ a de ordinul n, cu

∈

(n) ϕX (t)

n n=1 L (Ω),

∈ ∩∞

7. dac˘ a X

= i

n

∞



xn eitx dF (x), t

∈ R;

−∞

atunci ϕX este dezvoltabil˘ a ˆın serie Taylor ˆın jurul originii: ϕX (t) =

∞

tn (n) ϕ (0), n! X

 n=0

n n cu ϕ(n) X (0) = i E (X ) , n

∈ N.

Demonstrat ¸ie. 1. ϕX (0) = E (e0 ) = E(1) = 1. 2. ϕX ( t) = E e−itX = E eitX = ϕ X (t),

    −      ≤  | | ∈

3. ϕX (t) =

|

∞ itx −∞ e dF (x)

∀ t ∈ R.

∞ itx ∞ −∞ e | dF (x) = −∞ 1dF (x) = 1, ∀ t ∈ R. ∞ ∞ R. ϕaX +b (t) = −∞ eit(ax+b) dF (x) = e ibt −∞ ei(at)x dF (x)eibt ϕX (at).

4. Fie a, b 5. Fie t R ¸si h > 0. Avem

∈

X (t

|ϕ

∞

+ h)

X (t)

−ϕ

| =

∞

 

eitx eihx

−∞

∞

1 dF (x)

∞



 

hx 1 dF (x) = 2 sin dF (x). 2 −∞

 ≤    −     ≤          ≤  | |   eitx

   −  

eihx

−∞

∞ −∞ dF (x) = 1, deducem c˘a exist˘a a > 0 astfel ca

Fie ε > 0. Cum −∞ sin hx dF (x) 2

sin

(

−∞,−a]∪[a,∞)

hx dF (x) < ε/4. 2

Apoi, pentru h < ε/2a, avem 2

[ a,a]

−

Rezult˘a

hx sin dF (x) 2

|ϕ

X (t

+ h)

a

 ≤   ∀ ∈

h x dF (x)

[ a,a]

−

−ϕ

| < ε,

X (t)

ha

dF (x)

−a

h

0,

ε . 2a

≤ ha < ε/2.

36 Ca urmare, ϕX este uniform continu˘ a pe R. 6. Se aplic˘a teorema de derivare a integralelor improprii cu parametru. 7. Conform formulei anterioare, avem (n) ϕX (0)

= i

n

∞



xn e0 dF (x) = in E (X n) .

−∞

Atunci, dezvoltˆ and ˆın serie Taylor exponent¸iala, obt¸inem

∞ tn ∞ tn ∞ ∞ (itx)n (n) n n ϕX (t) = e dF (x) = dF (x) = [i E (X )] = ϕX (0), n! n! −∞ −∞ n=0 n! n=0 n=0 ∞



pentru oricare t

 

itx

∈ R.







Teorema 2.9.2. (Teorema multiplic˘ arii) Dac˘ a X 1 , X 2 , , X n sunt variabile aleatoare independente, atunci ϕX 1 +X 2 +···+X n = ϕ X 1 ϕX 2 ϕX n .

· ··

· ··

Demonstrat ¸ie. Media produsului unui num˘ar finit de variabile aleatoare independente este egal˘ a cu produsul mediilor acestor variabile aleatoare. Atunci ϕ n

k=1 X k



(t) = E e

it

n

n

k=1 X k

n

n

       itX k

e

=E

=

E

k=1

itX k

e

=

k=1

ϕX k (t), t

∈ R.

k=1



a aleatoare cu funct ¸ia de repartit ¸ie Teorema 2.9.3. (Teorema de unicitate) Fie X o variabil˘ F ¸si funct ¸ia caracteristic˘ a ϕX . Atunci 1. F (x2) 2.

− F (x ) = P { 1

c −itx1 1 e e−itx2 x1 < X x 2 = lim ϕX (t) dt, π c→∞ −c it

−



≤ }

c −ity 1 e e−itx F (x) = lim lim ϕX (t) dt, 2π y→−∞ c→∞ −c it

−



Demonstrat ¸ie. Se aplic˘ a transformarea Fourier invers˘ a.

∀ x < x ;

∀ x ∈ R.



¸iile caracteristice ale unor distribut ¸ii clasice. Exemplul 2.9.1. Funct 1. Distribut ¸ia Bernoulli: X Bin(1, p)

it

∼ ⇒ ϕ (t) = 1 + p (e − 1) , t ∈ R. 2. Distribut ¸ia binomial˘ a: X ∼ Bin(n, p) ⇒ ϕ (t) = [1 + p (e − 1)] , t ∈ R. 3. Distribut ¸ia Poisson: X ∼ Poiss(λ) ⇒ ϕ (t) = e ( − ) , t ∈ R. 4. Distribut ¸ia geometric˘ a: X ∼ Geom( p) ⇒ ϕ (t) = , t ∈ R. − 5. Distribut ¸ia normal˘ a: X ∼ N (µ, σ ) ⇒ ϕ (t) = e − , t ∈ R. 6. Distribut ¸ia exponent ¸ial˘ a: X ∼ Exp(λ) ⇒ ϕ (t) = − , t ∈ R. X

it

X

λ eit 1

X

X

2

peit eit +1

peit

iµt

X

X

t2 σ 2

2

λ λ it

n

1

2

37

2.10

Rezumat

Variabilele aleatoare se interpreteaz˘ a ca o ”enumerare” a rezultatelor (m˘ asurabile) potent¸iale ale unui anumit experiment. Fiecare din aceste rezultate posibile are o probabilitate de realizare. R se Fie (Ω, F , P) un câmp de probabilitate. O funct ¸ie m˘asurabil˘a real˘ a X : Ω nume¸ste variabil˘ a aleatoare . Conform definit¸iei, X I F pentru orice interval real I . In particular, X ( , a] = X a a R. F , d R , (F , BRd ) m˘ O funct¸ie X : Ω asurabil˘a, se nume¸ste vector aleator . Fie X i , i = 1, 2, , d, componentele scalare ale funct¸iei X , deci X = (X 1 , X 2 , , X d ). Atunci

→

{ ∈ } ∈ { ∈ −∞ } { ≤ } ∈ ∀ ∈ →

·· ·

··· {X ≤ a , X ≤ a , ··· , X ≤ a } ∈ F , ∀ (a , a , ··· , a ) ∈ R . Fie X : Ω → R o variabil˘a aleatoare. Funct¸ia real˘ a F : R → [0, 1], definit˘a prin F (x) = P{X ≤ x } = P({ω ∈ Ω |X (ω) ≤ x }), x ∈ R, 1

1

2

2

d

d

1

2

d

d

se nume¸ste funct ¸ia de repartit ¸ie a variabilei aleatoare X . Funct¸ia de repartit¸ie are urm˘ atoarele propriet˘ a¸ti: 1. F este monoton cresc˘ atoare pe R; 2. F este continu˘ a la dreapta pe mult¸imea R (F (x + 0) := lim F (t) = F (x), t x

↓

3. lim F (x) = 0; x

→−∞

4. F (x

∀ x ∈ R);

lim F (x) = 1;

x

→∞

F (t) = P{X < x}, ∀ x ∈ R; − 0) := lim ↑ 5. P{X = x } = F (x) − F (x − 0), ∀ x ∈ R; 6. P{a < X ≤ b } = F (b) − F (a), ∀ a, b ∈ R, cu a < b; 7. P{X > x} = 1 − F (x), ∀ x ∈ R. Variabilele aleatoare X , i ∈ I , se numesc independente dac˘ a, pentru oricare oricare indici distinct¸i i , i , · ·· , i din mult¸imea I ¸si oricare A , A , ··· , A ∈ B are loc P{X ∈ A , X ∈ A , ··· , X ∈ A } = P{X ∈ A }P{X ∈ A }··· P{X ∈ A }. t x

i

1

i1

1

2

i2

n

2

1

in

n

i1

2

1

n

i2

2

R

in

n

a dac˘ a mult¸imea X (Ω) este cel mult num˘ arabil˘a. X se nume¸ste variabil˘a aleatoare discret˘ R, unde I este o mult Fie X (Ω) = xi , i I ¸ime de indici cel mult num˘ arabil˘a. Not˘am pi = P X = xi , i I . Avem pi 0, i I ¸si i∈I pi = 1. Distribut¸ia variabilei aleatoare X se reprezint˘ a prin: xi X : . pi i∈I

{

{

∈ } ⊂ } ∈

≥

∀ ∈

 

R



Variabila aleatoare X se nume¸ste de tip continuu dac˘ a exist˘a o funct¸ie continu˘ a f : [0, ) cu proprietatea

→ ∞

x

F (x) =



−∞

f (t) dt,

∀ x ∈ R.

Funct¸ia f se nume¸ste densitatea de probabilitate a variabilei aleatoare X (sau funct ¸ia de densitate a v.a. X). Densitatea de probabilitate are propriet˘ a¸tile:

38 1. F este de clas˘ a C1 pe 2.

 R

R,

cu F  (x) = f (x),

∀ x ∈ R;

f (t) dt = 1;

{X = x} = 0, ∀ x ∈ R; 4. P{a ≤ X ≤ b } = f (t) dt, ∀ [a, b] ⊂ R. Fie X : Ω → R o variabil˘a aleatoare avˆ and funct¸ia de repartit¸ie F : R → [0, 1]. 3.

P

b a



M˘arimea:

E(X )

∞



:=

x dF (x)

−∞

se nume¸ste media lui X . Media este definit˘ a ˆın ipoteza c˘ a integrala de tip Stieltjes-Riemann de mai sus este convergent˘ a. Explicit˘ am mai jos calculul mediei ˆın cazul variabilelor de tip discret ¸si de tip continuu. 1. Pentru o variabil˘ a aleatoare X de tip discret, care ia valorile x i cu probabilit˘ a¸tile p i , pentru i I , avem: E(X ) = xi pi .

∈

 i I

∈

2. Pentru o variabil˘a aleatoare X de tip continuu, cu funct¸ia de densitate f : [0, ), avem:

∞

E(X )

∞



:=

R

→

xf (x) dx.

−∞

Media are urm˘ atoarele propriet˘ a¸ti: 1.

E(aX )

= a E(X ),

∀ a ∈ R;

2.

E(X +

Y ) = E(X ) + E(Y );

3. dac˘ a X ¸si Y sunt independente, atunci E(XY ) = E(X )E(Y ). Dac˘a X admite funct¸ia de repartit¸ie F , iar ϕ este o fuct¸ie real˘ a m˘asurabil˘a, atunci E(ϕ(X ))

=

∞



ϕ(x) dF (x),

−∞

ˆın ipoteza c˘a integrala este convergent˘ a. Definim:

∈ N∗ a variabilei aleatoare X :

1. media de ordin k

E

∞

   k

X

=

xk dx,

−∞

dac˘a integrala este convergent˘a.

∈ N∗ a variabilei aleatoare X : ∞ E |X | = |x| dx,

2. media absolut˘ a de ordin k

   k

k

−∞

dac˘a integrala este convergent˘ a. Not˘am L k = L k (Ω) mult¸imea variabilelor aleatoare (definite pe Ω) cu medie absolut˘ a finit˘a de ordinul k.

39

• M˘arimea: V (X ) =

∞



(x

−∞

− µ))

2

dF (x) = E(X

− E(X ))

2

= E(X 2 )

2

− E (X )

se nume¸ste dispersia lui X .

• M˘arimea

σ(X ) =



V (X )

se nume¸ste abaterea medie p˘ atratic˘ a a variabilei aleatoare X . Dispersia are urm˘ atoarele propriet˘ a¸ti: 1. V (X )

≥ 0;

2. V (X ) = E(X 2 )

2

− [E(X )] (formula de calcul a dispersiei); 3. V (aX ) = a V (X ), ∀ a ∈ R; 2

4. dac˘ a X ¸si Y sunt v.a. independente, atunci V (X + Y ) = V (X ) + V (Y ). Corelat¸ia a dou˘ a variabile aleatoare este un indicator al tipului de dependent ¸˘ a al acestora. Astfel, corelat ¸ia variabilelor aleatoare X ¸si Y se define¸ste prin: λ(X, Y ) = E [X

{ − E(X )][Y − E(Y )]}.

M˘arimea ρ(X, Y ) =

λ(X, Y ) σ(X )σ(Y )

se nume¸ste coeficientul de corelat ¸ie al variabilelor aleatoare X ¸si Y . Formula de calcul a corelat¸iei λ(X, Y ) = E(XY ) E(X )E(Y ). Dac˘a X ¸si Y sunt v.a. independente, atunci λ(X, Y ) = 0; Avem ρ(X, Y ) [ 1, 1]. Fie X o variabil˘a aleatoare avˆ and funct¸ia de repartit¸ie F . Funct¸ia ϕX : R C , definit˘a prin

−

∈−

→

∞

   itX

ϕX (t) = E e

=

eitx dF (x), t

−∞

∈ R,

se nume¸ste functia caracteristic˘a a variabilei aleatoare X. Dac˘a X este o variabil˘a aleatoare de tip continuu, cu densitatea de probabilitate f , atunci ∞ ϕX (t) = eitx f (x)dx, t R.



∈

−∞

Dac˘a X este o variabil˘a aleatoare discret˘ a, cu distribut¸ia X : atunci ϕX (t) =



k I e

∈

itxk

pk .

  xk pk

, k I

∈

40

2.11

Test

1. Definit¸i funct¸ia de repartit¸ie a unei variabile aleatoare ¸si descriet¸i propriet˘ a¸tile acesteia. Discutat¸i cazul variabilelor aleatoare independente. 2. Calculat¸i media, dispersia ¸si funct¸ia caracteristic˘ a pentru o variabil˘a aleatoare: (a) Poisson; (b) exponent¸ial˘a; (c) geometric˘ a. 3. Variabila aleatoare X are distribut¸ia discret˘ a: X :



1 2 3 p1 p2 p3



,

unde p 1 , p2, p3 > 0, cu p 1 + p2 + p3 = 1. S¸tiind c˘a X are media E (X ) = 47 ¸si dispersia 11 V (X ) = 16 , s˘a se determine probabilit˘ a¸tile p1 , p2 , p3. 4. S˘a se determine constantele reale a ¸si b astfel ca funct¸ia F (x) = a + b arctg x, x R, s˘a fie funct¸ia de repartit¸ie a unei variabile aleatoare X ¸si apoi s˘a se calculeze E (X 2 ).

∈

5. Fie funct¸ia f : R

→ R, f (x) =



√ 1a−x2 , x ∈ ( −1, 1) x (

∈ −∞, −1] ∪ [1, ∞)

0,

.

(a) S˘ a se determine a > 0 astfel ˆıncˆ at f s˘a reprezinte densitatea de probabilitate a unei variabile aleatoare X . (b) S˘ a se determine media E (X ) ¸si dispersia V (X ) a variabilei aleatoare X . (c) S˘ a se calculeze

P

1 2

| | ≤  X

.

6. Timpul de a¸steptare ˆıntr-o stat¸ie de autobuz este o variabil˘ a aleatoare cu funct¸ia de repartit¸ie 0, x < 0; x/2, 0 x < 1; F (x) = 1/2, 1 x < 2; x/4, 2 x < 4; 1, x 4. S˘a se determine:

  

≤ ≤ ≤ ≥

(a) probabilitatea ca o persoan˘ a s˘a a¸stepte ˆın stat¸ie mai mult de 3 minute; (b) probabilitatea ca o persoan˘ a s˘a mai a¸stepte ˆın stat¸ie cel put¸in de 2 minute, dup˘a ce a a¸steptat 1 minut. 7. S˘a se calculeze funct¸ia caracteristic˘ a a variabilei aleatoare X cu densitatea de probabilitate: 0, x 2; f (x) = | x| , x < 2 . 1 1 2 2

  −

| |≥ ||

Capitolul 3 Convergent¸a ¸sirurilor de variabile aleatoare 3.1

Introducere

Studiul convergent¸a ¸sirurilor de variabilelor aleatoare, ˆın accept ¸iuni specifice teoriei probabilit˘a¸t ilor, evident¸iaz˘ a fenomene asimptotice utile. Un ¸sir de variabile aleatoare poate converge la o variabil˘ a aleatoare (distribut¸ie limit˘a) ˆın sens ”tare” sau ˆın sens ”slab”. Convergent¸a frecvent¸ei de realizare a unui eveniment, ˆıntr-un ¸sir de experient¸e identice ¸si independente, la probabilitatea acelui eveniment este asigurat˘ a de Legea numerelor mari . Legea slab˘ a a numerelor mari se deduce din inegalitatea lui Cebˆı¸sev. Teorema limit˘ a central˘ a , considerat cel mai important rezultat al teoriei probabilit˘ a¸tilor, stabile¸ste convergent¸a la legea normal˘ a a distribut¸iei normalizate a sumelor part¸iale ale unui ¸sir de variabile aleatoare independente ¸si identic distribuite. Rezultatele asimptotice ment ¸ionate au o important¸a˘ major˘ a ˆın statistica matematic˘ a .

3.2

Inegalit˘ a¸ti fundamentale ˆın teoria probabilit˘ a¸t ilor

Urm˘atoarele inegalit˘ a¸t i elementare joac˘ a un rol fundamental ˆın teoria probabilit˘ a¸tilor.

Teorema 3.2.1. (Inegalitatea lui Markov) Fie X L n(Ω), unde n

∈

∈ N∗. Atunci

n

|X | ) , ∀ a > 0. P{|X | > a} ≤ a E(

n

Demonstrat ¸ie. Fie F funct¸ia de repartit¸ie a variabilei aleatoare X a > 0, avem n

|X | ) =

E(



[ a,a]

−

n

|x| dF (x) +

 (

−∞,−a]∪[a,∞)

= a n [F ( a) + 1

−

n

|x| dF (x) ≥ a n

n

 (

− F (a)] ≥ a P{|X | > a},

de unde concluzia.

41

n

∈ L (Ω).

−∞,−a]∪[a,∞)

Pentru

1 dF (x)

42

Teorema 3.2.2. (Inegalitatea lui Cebˆı¸sev (Chebyshev)) Fie X E(X ) = µ ¸ si dispersia V (X ) = σ 2. Atunci

{|X − µ| > a} ≤

P

σ2 , a2

2

∈ L (Ω), avˆ and media

∀ a > 0.

Demonstrat ¸ie. Aplic˘am inegalitatea lui Markov variabilei aleatoare Z = X µ, pentru n = 2. Inegalitatea lui Cebˆı¸sev se utilizeaz˘ a la demonstrarea legii slabe a numerelor mari .

−

Teorema 3.2.3. (Inegalitatea lui H¨ older) Fie p, q > 1 astfel ca variabile aleatoare X ¸si Y are loc inegalitatea p

E(

1

q

|XY |) ≤ [E (|X | )] · [E (|Y | )] p

1 q

1 1 + = 1. Pentru dou˘ a p q

.

ˆ In particular, pentru Y = 1, avem E(

1

p

|X |) ≤ [E (|X | )] , ∀ p > 1. p

Pentru p = 2, obt¸inem inegalitatea lui Cauchy-Buniakovski: E(

 | |≤

E (X 2 ).

X )

Inegalitatea de mai sus exprim˘ a faptul c˘ a dispersia variabilei aleatoare X pozitiv˘a. Astfel, V (X ) = E X 2

 −

[E(X )]2

≥E

X 2

 −

[E( X )]2

| | ≥ 0.

a aleatoare ¸si r, s Teorema 3.2.4. (Inegalitatea lui Lyapunov) Fie X o variabil˘ r < s. Are loc inegalitatea 1 1 [E ( X r )] r [ E ( X s )] s .

| |

≤

Demonstrat ¸ie. Fie p = s/r > 1 ¸si q = p/( p inegalit˘a¸t ii lui Hölder, obt¸inem 1

[E ( X r )] r

| |

Consecint¸˘ a. Ln (Ω)

3.3

⊂ L

n+1

pr

2

∈ L (Ω) este ∈ N∗, cu

| |

− 1) > 1. Avem p1 + 1q = 1. Atunci, conform

≤ [E (|X | )] (Ω), ∀ n ∈ N∗ .

1 rp

1

= [E ( X s )] s .

| |



Tipuri de convergent ¸˘ a. Relat¸ii

Vom defini convergent ¸a ¸sirurilor de variabile aleatoare , ˆın diverse accept¸ iuni. Studiul comport˘ arii asimptotice a ¸sirurilor de variabile aleatoare reprezint˘ a o preocupare major˘ a a teoriei probabilit˘ a¸tilor.

Definit¸ia 3.3.1. Fie X o variabil˘ a aleatoare ¸si (X n )n≥1 un ¸sir de variabile aleatoare definite pe cˆ ampul de probabilitate (Ω, F , P). Fie F funct ¸ia de repartit ¸ie a variabilei aleatoare X , iar F n funct ¸ia de repartit ¸ie a variabilei aleatoare X n, n 1. Definim urm˘ atoarele tipuri de convergent ¸˘ a ale ¸sirului (X n)n≥1 c˘ atre limita X :

≥

43 1. ¸sirul (X n )n≥1 converge ˆın distribut ¸ie (repartit ¸ie) la X , notat prin X n

d

→ X,

dac˘ a lim F n (x0 ) = F (x0), pentru orice punct de continuitate x0

∈ R al funct ¸iei F ;

n

→∞

2. ¸sirul (X n )n≥1 converge ˆın probabilitate la X , notat prin X n dac˘ a lim

P

n

→∞

p

→ X,

{|X − X | > ε} = 0, ∀ ε > 0; n

3. ¸sirul (X n )n≥1 converge aproape sigur la X , notat prin X n

a.s.

→ X,

dac˘ a P X n

{ → X } = 1;

4. ¸sirul (X n )n≥1 converge ˆın spat ¸iul Lk (Ω) la X , unde k

∈ N∗, notat prin

X n dac˘ a lim n

→∞

E

|

X n

|

− X

k

Lk

→ X,

= 0.

Convergent¸ele ”ˆın distribut¸ie” ¸si ”ˆın probabilitate” sunt convergent ¸e slabe , ˆın timp ce k convergent¸ele ”aproape sigur˘ a” ¸si ”ˆın spat¸iul L (Ω)” sunt convergent ¸e tari . Aceast˘a clasificare formal˘ a este sust¸inut˘a de urm˘atoarea teorem˘ a de ierarhizare a tipurilor de convergent¸a˘ definite anterior.

Teorema 3.3.1. Fie X o variabil˘ a aleatoare ¸si (X n )n≥1 un ¸sir de variabile aleatoare definite pe cˆ ampul de probabilitate (Ω, F , P). Au loc implicat ¸iile 1.

p

d

X n

→ X =⇒

X n

→ X ;

X n

a.s.

X n

→ X ;

X n

→ X =⇒

X n

→ X.

2. 3.

→ X =⇒ Lk

p

p

Implicat ¸iile reciproce sunt false. Demonstrat ¸ie. p 1. Presupunem X n X. Fie x0 R un punct de continuitate al funct¸iei F . Consider˘am ε > 0, arbitrar. Deoarece, pentru n 1, avem

→

∈

≥ {X ≤ x − ε}\{|X − X | > ε} ⊂ {X ≤ x − ε} \ {X < X − ε} ⊂ {X ≤ x } , 0

n

0

n

n

0

obt¸inem F (x0

− ε) − P {|X − X | > ε} ≤ P ({X ≤ x − ε}\{|X − X | > ε}) ≤ F (x ) . n

0

n

n

0

44 Pe baza ipotezei, lim

P

n

→∞

{|X − X | > ε} = 0. Atunci F (x − ε) ≤ lim inf F (x ) . →∞ n

0

n

n

0

(3.1)

Apoi, pentru n

≥ 1, avem {X ≤ x }\{|X − X | > ε} ⊂ {X ≤ x } \ {X n

0

n

n

0

n

< X

− ε} ⊂ {X ≤ x + ε} , 0

de unde F n (x0 )

− P {|X − X | > ε} ≤ P ({X ≤ x }\{|X − X | > ε}) ≤ F (x + ε) . n

n

0

n

0

Pe baza ipotezei, rezult˘ a lim sup F n (x0) n

→∞

≤ F (x + ε) .

0

Din (3.1), (3.2) ¸si continuitatea lui F ˆın x 0 , obt¸inem lim F n (x0 ) = F (x0). Deci X n 2. Presupunem X n

n

→∞

a.s.

(3.2) d

→ X.

→ X. Avem ω ∈ {X → X } ⇔ ∀ ε > 0, ∃ n ≥ 1, ∀ k ≥ n : |X (ω) − X (ω)| < ε. n

n

Conform ipotezei, rezult˘ a

∞

∪

P

n=1

de unde

∩∞ {|X − X | < ε} n+ p

p=0

∞

∩

 }

= 1,

∀ ε > 0,

{|X − X | < ε = 1, ∀ ε > 0. − X | < ε} ⊂ {|X − X | < ε}, vom deduce lim P{|X − X | < ε} = 1, ∀ ε > 0, →∞ lim

P

n

→∞

∞ X n+ p Cum p=0

∩ {|

n+ p

p=0

n

n

n

sau, trecˆ and la evenimentele contrare, lim

n

→∞

{|X − X | ≥ ε} = 0, ∀ ε > 0.

P

n

p

Rezult˘a X n X. 3. Implicat¸ia rezult˘ a din inegalitatea lui Markov. Astfel, pentru oricare ε > 0, avem

→

{|X − X | > ε} ≤

P

n

E

X n X k εk

|



− | → 0, pentru n → ∞.



3.4

Legile numerelor mari

Legea numerelor mari reflect˘ a urm˘atoare proprietate: frecvent ¸a de aparit ¸ie a unui eveniment ˆıntr-un ¸sir de experient ¸e identice, independente, tinde c˘ atre probabilitatea de realizare a evenimentului ˆın fiecare experient ¸˘ a. Proprietatea a fost descris˘ a pentru prima dat˘ a la

45 sfâr¸situl sec. al XVI-lea de matematicianul italian Gerolamo Cardano (1501-1576). Formalizarea matematic˘ a (pentru variabile aleatoare binare) ca o lege a numerelor mari i se datoreaz˘ a lui Jacob Bernoulli (publicat˘ a ˆın lucrarea Ars conjectandi , 1713). În 1837, S.D. Poisson a descris-o sub numele de ”la Loi des grands nombres”. Contribut ¸ii importante la demonstrarea riguroas˘ a ¸si extinderea rezultatului sunt datorate lui Chebyshev (demonstrarea legii slabe a numerelor mari, 1837), Markov, Borel (demonstrarea legii tari a numerelor mari, 1909), Cantelli, Kolmogorov ¸si Khinchin. Formalizarea Bernoulli a fenomenului observat de Cardano este urm˘ atoarea. S˘ a consider˘a m c˘a, ˆıntr-o experient¸a˘, un anumit eveniment A se produce cu probabilitatea p = si identic distribuite P(A). Fie ¸sirul (X n )n≥1 de variabile aleatoare Bernoulli, independente ¸ (iid), asociate ¸sirului de experient¸e considerat, avˆ and distribut¸ia comun˘ a X n :

  0 1 q p

, n

∈ N∗.

· ··

Not˘am S n = X 1 +X 2 + +X n care indic˘a num˘arul de aparit¸ii (realiz˘ari) ale evenimentului A ˆın n experient¸e. Frecvent¸a de realizare a evenimentului A este deci S n/n. Fenomenul descris de legea numerelor mari este prin urmare S n n

→ p = E(X ). 1

Conergent¸a frecvent¸ei de aparit¸ie a evenimentului la probabilitatea sa se poate realiza ˆın sensul unui tip de convergent¸a˘ slab (lege slab˘ a a numerelor mari) sau ˆın sensul unui tip de convergent¸a˘ tare (lege tare a numerelor mari). Rezultatul este extins la variabile aleatoare cu medie ¸si dispersie finite. a a numerelor mari) Teorema 3.4.1. (Legea slab˘ Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1 ) = µ ¸ N∗ . Atunci are si V (X 1) = σ2 . Not˘ am S n = X 1 + X 2 + + X n , n loc convergent ¸a ˆın probabilitate S n p µ. n

···

∈

→

Demonstrat ¸ie. Vom interpreta µ = E(X n ), n N∗ , ca o variabil˘a aleatoare constant˘ a, n care ia valoarea µ cu probabilitatea 1. Avem E(S n ) = k=1 E(X k ) = nµ ¸si V (S n ) = n 2 a¸tii lui Chebyshev, k=1 V (X k ) = nσ . Fie ε > 0, arbitrar. Conform inegalit˘

∈



Rezult˘a

P

 

S n n

  −  µ >ε

→∞

2

) σ = . {| − E(S )| > nε} ≤ V (S nε nε

= P S n

lim

n



P

 

S n n

n 2 2

n

   −  µ >ε

2

= 0.

Cum ε > 0 este arbitrar, obt¸inem concluzia. Ment¸in˘am c˘a legea slab˘ a a numerelor poate fi formulat˘ a pentru ¸siruri de variabile aleatoare independente (dar neidentic distribuite) cu dispersii uniform marginite (Chebyshev), respectiv pentru siruri de variabile de v.a. cu proprietatea V (S n )/n2 0 (Markov). Prezent˘ am (f˘ar˘a) demonstrat¸ie ¸si o versiune a legii tari a numerelor mari .

→

46

Teorema 3.4.2. (Legea tare a numerelor mari) Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), din spat ¸iul L4 ( E( X 1 4) < ) cu E(X 1 ) = µ. Fie S n = X 1 + X 2 + + X n , n N∗ . Atunci

| |

∞

···

S n n

3.5

∈

a.s.

→ µ.

Teorema limit˘ a central˘ a

Teorema limit˘ a central˘ a, ˆın versiunea clasic˘ a, stabile¸ste c˘a sumele part¸iale ”normalizate” ale unui ¸sir de variabile aleatoare iid, cu dispersie finit˘ a, tind ˆın distribut¸ie c˘atre legea normal˘a (gaussian˘ a). Rezultatul admite numeroase extinderi relativ la ¸siruri de variabile aleatoare heterogene, neindependente, supuse unor anumite condit ¸ii. De asemenea, rezultatul se extinde la ¸siruri de vectori aleatori. Prima versiune a acestei teoreme a fost formulat˘ a de Abraham de Moivre (1733) pentru variabile aleatoare de tip Bernoulli, cu p = 1/2). Pierre-Simon Laplace generalizeaz˘ a rezultatul ˆın lucrarea Theorie Analytique des Probabilités (1812), constatˆ and apropierea ˆ distribut¸iei binomiale de distribut¸ia normal˘ a. In 1901, matematicianul rus Aleksandr Lyapunov a definit ˆın termeni generali ¸si a demonstrat riguros teorema limit˘ a central˘ a . Teorema limit˘ a central˘ a este considerat˘ a rezultatul principal al teoriei probabilit˘ a¸tilor. Enunt¸a˘m pentru ˆınceput rezultatul datorat lui de Moivre ¸si Laplace relativ la ¸siruri iid de v. a. Bernoulli.

Teorema 3.5.1. (Teorema de Moivre-Laplace) Fie (X n )n≥1 un ¸sir de variabile aleatoare Bernoulli independente ¸si identic distribuite (iid), de parametru p, avˆ and media comun˘ a n ∗ p ¸si dispersia comun˘ a pq (unde q=1-p). Pentru n N , not˘ am S n = k=1 X k ¸si



∈

I n =

 √ − k

np , k = 0, 1, npq

··· , n



.

Atunci, pentru oricare interval [a, b] lim

n

→∞



sup x I n [a,b]

∈ ∩

⊂ R, are loc: S − np 2πnpq · P √ npq = x − e−

 





n

x2

2

 

=0

Demonstrat¸ia se bazeaz˘ a pe aproximarea factorialului dat˘ a de formula lui Stirling n!

√ = 2nπ

n e



n

eθn ,

1 unde 0 < θn < 12n , n 1. Din Teorema de Moivre-Laplace se deduce o versiune particular˘a a Teoremei limit˘a central˘ a . Enunt¸ul clasic general al acestei teoreme este prezentat ˆın continuare.

≥

Teorema 3.5.2. (Teorema limit˘ a central˘ a) Fie (X n)n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1) = µ ¸si V (X 1 ) = σ 2 . Consider˘ am ¸sirul de ∗ variabile aleatoare S n = X 1 + X 2 + + X n, n N . Atunci:

·· ·

1. lim

n

→∞

P

≤ a

S n nµ σ n

−√ ≤ b

∈



=

1 2π

√

b

 a

x2

e− 2 ,

∀ a, b ∈ R, a < b;

47 2. (versiunea Lindeberg-L´ evy) Are loc urm˘ atoarea convergent ¸a ˆın distribut ¸ie c˘ atre o variabil˘ a aleatoare gaussian˘ a:

√ n σ



S n n

 − → µ

d

X,

unde X N (0, 1).

∼

Demonstrat ¸ie. (schit¸a˘) Consider˘am ¸sirul de v. a. iid Y n = X nσ−µ , n 1, de medie comun˘a 0 ¸si dispersie comun˘a 1. Atunci, conform Teoremei 2.9.1, 7, funct¸ia caracteriatic˘ a a variabilelor aleatoare Y n este de forma t 2 ϕY n (t) = 1 + 0 t2 , t 0. 2 Fie n Y k S n nµ Z n = k=1 = , n 1. n σ n

≥



−

√

−√

→

≥

Pe baza propriet˘ a¸t ilor funct¸iei caracteristice (Teorema 2.9.1), obt¸inem n

  √   −

ϕZ n (t) = ϕY 1

t n

= 1

t2

t2 +0 2n

t2 n

 

n

t2 →∞ − → e 2.

n

Dar, pentru X N (0, 1), avem ϕX (t) = e − 2 , t R (a se vedea Exemplul 3.10.1). Cond form teoremei de unicitate (Teorema 2.9.2) se obt ¸ine Z n X . Astfel, teorema limit˘ a central˘ a este demonstrat˘ a.

∈

∈

→

48

3.6

Rezumat

Inegalitatea lui Markov Fie X L n (Ω), unde n

∈

∈ N∗. Atunci

n

{|X | > a} ≤ E (|aX | ) , ∀ a > 0.

P

n

Inegalitatea lui Cebˆı¸sev (Chebyshev) Fie X dispersia V (X ) = σ 2 . Atunci P

{|X − µ| > a} ≤

2

∈ L (Ω), având media E(X ) = µ ¸si

σ2 , a2

∀ a > 0.

Definim urm˘atoarele tipuri de convergent¸˘ a ale ¸sirului (X n )n≥1 c˘atre limita X : 1. ¸sirul (X n )n≥1 converge ˆın distribut¸ie (repartit¸ie) la X , notat prin X n

d

→ X,

dac˘a lim F n (x0 ) = F (x0 ), pentru orice punct de continuitate x0

∈ R al funct¸iei F ;

n

→∞

2. ¸sirul (X n )n≥1 converge ˆın probabilitate la X , notat prin X n dac˘a lim

P

n

→∞

p

→ X,

{|X − X | > ε} = 0, ∀ ε > 0; n

3. ¸sirul (X n )n≥1 converge aproape sigur la X , notat prin X n dac˘a

P

a.s.

→ X,

{X → X } = 1; n

4. ¸sirul (X n )n≥1 converge ˆın spat¸iul Lk (Ω) la X , unde k

∈ N∗, notat prin

X n dac˘a lim n

→∞

E

|

X n

|

− X

k

Au loc implicat¸iile p

d

• X → X =⇒ X → X ; • X → X =⇒ X → X ; n

n

p

a.s.

n

n

Lk

• X → X =⇒ n

X n

p

→ X.

= 0.

Lk

→ X,

49 Implicat¸iile reciproce sunt false. Legea slab˘ a a numerelor mari Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1) = µ ¸si V (X 1 ) = σ2 . Not˘ am S n = X 1 + X 2 + ∗ + X n, n N . Atunci are loc convergent¸a ˆın probabilitate

···

∈

S n n

p

→ µ.

Legea tare a numerelor mari Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), din spat¸iul L4 (E( X 1 4) < ) cu E(X 1) = µ. Fie S n = ∗ X 1 + X 2 + + X n , n N . Atunci

· ··

| |

∈

S n n

∞

a.s.

→ µ.

Teorema limit˘ a central˘ a Fie (X n )n≥1 un ¸sir de variabile aleatoare independente ¸si identic distribuite (iid), cu E(X 1 ) = µ ¸si V (X 1 ) = σ 2 . Consider˘ am ¸sirul de variabile ∗ aleatoare S n = X 1 + X 2 + + X n , n N . Atunci:

· ··

1. lim

n

→∞

P

≤ a

∈

S n nµ σ n

−√ ≤ b



=

1 2π

√

b



x2

e− 2 ,

a

∀ a, b ∈ R, a < b;

2. (versiunea Lindeberg-Lévy) Are loc urm˘ atoarea convergent¸a ˆın distribut¸ie c˘atre o variabil˘a aleatoare gaussian˘ a:

√ n σ unde X N (0, 1).

∈



S n n

 − → µ

d

X,

50

3.7

Test

1. S˘a se enunt¸e ¸si s˘a se demonstreze Legea slab˘ a a numerelor mari. 2. S˘a se enunt¸e Teorema limit˘ a central˘ a, adaptat˘ a pentru variabile aleatoare de tip geometric. 3. S˘a se determine funct¸ia de repartit¸ie a variabilei aleatoare X care admite funct¸ia caracteristic˘a 1 2 1 + eit . ϕX (t) = 4

 

4. Inegalitatea lui Cebˆı¸sev aplicat˘ a variabilei aleatoare X , cu media E (X ) = 3 ¸si dis2 persia V (X ) = σ , stabile¸ste: P

{|X − 3| ≥ 2} ≤ 0, 16.

S˘a se determine σ. 5. La un concurs de biatlon, un sportiv nimereste ¸tinta cu probabilitatea de 54 . S¸tiind c˘a sportivul execut˘ a ˆın concurs 25 de trageri, s˘ a se arate c˘ a ¸sansa ca acesta s˘ a nimereasc˘a ¸tinta de cel put¸in 15 ori este mai mare de 85%. 6. Probabilitatea ca un monitor de calculator s˘ a nu aib˘a rezolut¸ia acceptabil˘ a este de 0,1. S-au cump˘arat 1000 de monitoare. Care este probabilitatea ca mai mult de 100 monitoare s˘ a nu fie acceptabile? (Not˘ a: se va utiliza aproximarea oferit˘ a de Teorema limit˘a central˘a.)

Capitolul 4 Elemente de statistic˘ a matematic˘ a 4.1

Introducere

Statistica matematica este o ramur˘ a important˘ a a matematicii, care utilizeaz˘ a rezultatele oferite de teoria probabilit˘ a¸tilor. Progresul ˆın societate, ˆın particular ˆın ¸stiint¸˘ a, este adeseori datorat experimentului . Cercet˘ atorul realizeaz˘ a o experient¸a˘ ¸si obt¸ ine o serie de date, pe baza c˘ arora generealizeaz˘ a rezultatele experient¸ei la o clas˘a de experient¸e similare. Acest tip de extindere se datoreaz˘ a unui rat¸ionament de tip inductiv (obt¸inerea unor informat¸ii generale din analiza unor informat¸ii particulare). Statistica analizeaz˘ a date concrete, locale, obt¸inute experimental, pentru a prognoza date cu caracter general, a descoperi legile care guverneaz˘ a fenomemul aleator studiat. În acela¸si timp, statistica se preocup˘ a de verosimilitatea matematic˘ a a prognozei, m˘asurând cu mijloace matematice gradul de ˆıncredere ˆın rezultatele generale propuse. Prezentarea de fat¸a˘ are ca obiectiv familiarizarea cu cˆ ateva not¸iuni de baz˘ a din teoria statisticii matematice, precum: populat ¸ie statistic˘ a, sonda j, e¸santion, estimator ¸si caracteristicile sale. Pentru simplificarea expunerii, ne vom rezuma la descrierea unor elemente de statistica e¸santioanelor Bernoul li .

4.2

Not¸iuni de baz˘ a

Statistica opereaz˘ a cu not¸iuni specifice. Astfel, populat a mult¸imea ¸ia statistic˘ a reprezint˘ tuturor elementelor avute ˆın vedere ˆın cadrul unui studiu statistic. De regul˘ a, pentru o populat¸ie mare, studiul statistic se realizeaz˘ a prin sondaj . Sondajul const˘ a ˆın observarea (examinarea, chestionarea) unei p˘ art¸i a populat¸iei, numit˘a e¸santion . Num˘arul elementelor unui e¸santion (obt¸inut prin sonda j ¸si examinat) se nume¸ste volumul e¸ santionului . De regul˘ a, volumul e¸santionului se stabile¸ste (pe baza unor evalu˘ ari matematice) astfel ˆıncâ t s˘a poat˘ a furniza date generale concludente/veridice. Scopul studiului statistic este estimarea unei propriet˘ a¸tii/particularit˘ a¸t i a populat¸iei statistice. Funct¸ia matematic˘a care realizeaz˘ a estimarea se nume¸ste estimator . Apelând la modelul particular al e¸santioanelor Bernoulli, vom trece ˆın revist˘ a calit˘a¸t ile impuse unui estimator de calitate. 51

52

4.3

Estimatori. Propriet˘ a¸ti

Cel mai simplu studiu statistic se refer˘ a la analiza cazului binar: fiecare individ (element) al populat¸iei statistice are valoarea 1 sau 0 (r˘ a spunde cu 1 sau 0 la un chestionar). Ne intereseaz˘ a proport¸ia indivizilor cu valoarea 1 ˆın cadrul ˆıntregii populat¸ii statistice. Examinarea/chestionarea indivizilor prin sondaj se modeleaz˘ a printr-o variabil˘ a aleatoare ”bservabil˘ a”, care indic˘ a num˘arul indivizilor care valoreaz˘ a 1 ˆıntr-un e¸santion de volum n. La o populat¸ie ”mic˘a”, este logic s˘ a apel˘ am la modelul oferit de legea hipergeometric˘ a, ˆıntrucât extragerea unui e¸santion dintr-o populat¸ie mic˘a afecteaz˘ a ˆın mod cert proport¸ia valorii 1 ˆın cadrul populat¸iei nesondate. În schimb, dac˘a volumul populat¸iei este ”mare” ˆın raport cu volumul e¸santionului atunci este rezonabil s˘ a consider˘ a c˘a fiecare element al populat¸iei statistice se reprezint˘ a printr-o variabil˘ a aleatoare Bernoulli X , cu distribut¸ia X :



0 1

−

1 θ θ



,

unde parametrul θ (necunoscut) reprezint˘ a proport¸ia valorii 1 ˆın populat¸ia statistic˘ a. Astfel, P X = 1 = θ reprezint˘ a ¸sansa ca elementul X s˘a aib˘a valoarea 1. Evident, a ¸sansa ca X s˘a ia valoarea 0. Obiectul studiului statistic P X = 0 = 1 θ reprezint˘ ˆıntreprins const˘a ˆın estimarea parametrului θ, din observarea unui e¸santion de volum n, (X 1 , X 2 , , X n ), reprezentˆ and un vector aleator cu componentele variabile aleatoare iid, ¸ia e¸ santionului se define¸ste distribut¸ia comun˘ de tip Bin(1, θ). Distribut a a v. a. X 1, X 2 , , X n. a (sau un estimator ) se define¸ste ca o funct O statistic˘ ¸ie a variabilelor aleatoare ”observabile” (cele ale n-e¸santionului), deci care nu depinde de parametrii necunoscut ¸i. Pentru evaluarea aprioric˘ a a parametrului necunoscut θ se propune estimatorul media empiric˘ a , definit prin:

{ } ··· · ··

{

} −

X =

S n , unde S n = X 1 + X 2 + n

··· + X . n

În fapt, media empiric˘ a exprim˘a frecvent¸a de aparit¸ie a valorii 1, deci, intuitiv, pare a oferi o bun˘ a evaluare a parametrului θ. Descriem ˆın continuare propriet˘ a¸tile principale ale mediei empirice X , ca estimator a lui θ.

1. X este un estimator f˘ ar˘ a abatere a lui θ:

Demonstrat ¸ie.

Eθ (X )

Eθ (X )

n k=1 Eθ (X k )] /n =



=[

= θ,

∀ θ ∈ (0, 1).

(nθ)/n = θ.

ar˘ a abatere a lui θ, care depinde de S n . 2. X este unicul estimator f˘

Demonstrat ¸ie. Fie g : 0, 1, 2,

{

··· , n} → R, astfel ˆıncât θ = E [g(S )] = θ, ∀ θ ∈ (0, 1). θ

Avem Eθ [g(S n )]

=

n

n

n





k=0

g(k)P S n = k =

{

}

k=0

g(k)C nk θk (n

1 k

− θ) − ,

(4.1)

53 iar pe de alt˘a parte θ =

Eθ (X )

= Eθ

n

   S n n

=

k=0

k P S n = k = n

{

}

n

 k=0

k k k C θ (1 n n

n k

− θ) − .

Atunci, conform (4.1), obt¸inem n



   − −   − k C nk n

g(k)

k=0

θ

k

∀ θ ∈ (0, 1).

= 0,

θ

1

Rezult˘a c˘a polinomul f = nk=0 g(k) nk C nk X k este identic nul. Prin urmare g(k) = k/n, k = 0, 1, , n, deci g(S n ) = X .

· ··

a verosimilitate. 3. X este estimatorul lui θ de maxim˘ Demonstrat ¸ie. S˘a presupunem c˘ a au fost observate valorile (x1 , x2 , , xn ) 0, 1 n . Not˘am sn = nn=1 xk . Probabilitatea de a observa aceste valori este θ sn (1 θ)n−sn . Atunci, cea mai verosimil˘ a valoare pe care o poate lua θ este cea care maximizeaz˘ a funct¸ia

··· −



L : [0, 1]

→ [0, 1], L(u) = u

sn

(1

n sn

− u) −

∈ { }

.

Presupunem 0 < sn < n. Avem L (u) = L(u)

sn nu . u(1 u)

− −

R˘ad˘acina derivatei lui L este u0 = snn . Urm˘arind semnul derivatei, deducem c˘ a L ˆı¸si atinge maximul ˆın u0. Rezult˘ a c˘a X = S n/n este estimatorul de verosimilitate maxim˘a. and talia e¸santionului tinde la infinit, X converge la θ cu o rat˘ a exponent ¸ial˘ a. 4. Cˆ

and c˘ a, pe baza inegalit˘ a¸tii lui Chebyshev, Demonstrat ¸ie. Vom remarca ˆın primul rˆ X

p

→ θ (legea slab˘a numerelor mari).

Pe de alt˘a parte, conform Teoremei limit˘ a central˘ a (Teorema 3.5.2),



θ(1

n

− θ)

d

 −  → X

θ

X,

unde X N (0, 1). Faptul c˘ a rata convergent¸ei este exponent¸ial˘ a se deduce din Teorema marilor deviat ¸ii , pe care nu o vom include ˆın aceast˘ a prezentare.

∈

atratic mediu al estimatorului X a lui θ converge la 0. 5. Riscul p˘

54 Demonstrat ¸ie. Riscul p˘atratic mediu al estimatorului X este defint prin Avem Eθ

 −   −   −  →

de unde

X

θ

Eθ

X

2

S n n

= Eθ

θ

2

θ

=

1 Eθ (S n n2

− nθ)

2

=

Eθ

2

 −  X

θ .

n θ(1 θ) V (X ) = 1 n2 n

− ≤ 1, 4n

2 n

→∞ 0.

6. Abaterea lui X fat ¸˘ a de θ poate fi evaluat˘ a prin Teorema limit˘ a central˘ a.

Demonstrat ¸ie. Fie a > 0. Pentru n

√ √ − ≥ 2, de unde √ S − nθ a n ≥ nθ(1 − θ) θ(1 − θ)

4θ(1 θ) , a2

−

avem

a n

θ(1 θ)

   {| − | ≥ }      −    ≤   −  ≥ ≈ √ Pθ

X

θ

a =

n

P

S n nθ nθ(1 θ)

P

4.4

≥

1 x2 e− 2 dx < 0, 05. 2π |x|≥2

2

Estimatori bayesieni

Media empiric˘ a X este o estimare judicioas˘ a a parametrului θ ˆın absent¸a oric˘ aror informat¸ii suplimentare. Dar problema se modific˘ a ˆın cazul unor informat¸ii apriorice despre θ. Dac˘a aceste informat¸ii exist˘a, mai precis, dac˘a se cunoa¸ste o m˘ asur˘a de probabilitate pe [0, 1] reprezentˆ and distribut¸ia valorilor posibile ale lui θ, atunci se va cerceta estimatorul g(S n ) a lui θ care minimizeaz˘ a riscul p˘atratic mediu, ¸tinând cont de aceast˘ a distribut¸ie. Fie D o mult¸ime num˘arabil˘a din [0, 1], iar ρ : D [0, 1] o m˘asur˘a de probabilitate pe D, cu x∈D ρ(x) = 1. Pentru o funct¸ie g definit˘ a pe 0, 1, , n cu valori ˆın [0, 1], riscul p˘atratic mediu al estimatorului g(S n ) este

→ { ··· }



n



ρ(θ)Eθ [g(S n )

− θ]

θ D

∈

2

=

  ρ(θ)

θ D

k k n

2 k



n

  C nk

n k

− θ) C θ (1 − θ) −

k=0

∈

2

(g(k)

n k

− θ) θ (1 − θ) − . ∈ Pentru k ∈ {0, 1, · ·· , n}, consider˘ am funct¸ia ψ : [0, 1] → [0, ∞), definit˘ a prin ψ (x) = ρ(θ)θ (1 − θ) − (x − θ) , x ∈ [0, 1]. =

k=0

ρ(θ)(g(k)

θ D

k

k

 

k

n k

2

θ D

∈

Avem

ψk (x) = 2

ρ(θ)θk (1

θ D

∈

n k

− θ) − (x − θ), x ∈ [0, 1].

Studiind semnul derivatei, deducem c˘ a ψk atinge minimul ˆın punctul xk =

k+1 (1 − θ)n−k ∈ ∈ [0, 1]. k (1 − θ)n−k ρ(θ)θ θ ∈D



θ D ρ(θ)θ

55 Vom defini deci estimatorul bayesian a lui θ de risc p˘ atratic mediu minim: g(S n ) =

S n +1 (1 − θ)n−S n ∈ . S n (1 − θ)n−S n ρ(θ)θ θ ∈D



θ D ρ(θ)θ

Similar, dac˘a se cunoa¸ste ”a priori” densitatea de probabilitate f a lui θ pe intervalul [0, 1], atunci estimatorul bayesian a lui θ, dependent de S n, având riscul p˘ atratic minim , va fi 1 S n +1 θ (1 θ)n−S n f (θ)dθ 0 g(S n ) = 1 . S n S − n n θ (1 θ) f (θ)dθ 0

 

− −

56

4.5

Rezumat

Statistica matematica utilizeaz˘ a rezultatele oferite de teoria probabilit˘ at¸ilor pentru a generealiza rezultatele unei experient¸ la o clas˘ a de experient¸e similare. Acest tip de extindere se datoreaz˘a unui rat¸ionament de tip inductiv (obt¸inerea unor informat¸ii generale din analiza unor informat¸ii particulare). Statistica analizeaz˘ a date concrete, locale, obt¸inute experimental, pentru a prognoza date cu caracter general, a descoperi legile care guverneaz˘ a fenomemul studiat. Not¸iuni specifice:

• populat ¸ia statistic˘ a reprezint˘a mult¸imea tuturor elementelor avute ˆın vedere ˆın cadrul unui studiu statistic ;

• sondajul reprezint˘a examinarea (chestionarea) unei p˘art¸i a populat¸iei statistice, numit˘a e¸santion ;

• num˘arul elementelor unui e¸santion (obt¸inut prin sondaj ¸si examinat) se nume¸ste volumul e¸ santionului ;

• scopul unui studiu statistic este estimarea unei propriet˘a¸tii/particularit˘a¸ti a populat¸iei statistice. Funct¸ia matematic˘ a care realizeaz˘ a estimarea se nume¸ste estimator ;

• o statistic˘ a (sau un estimator se definet¸e ca o funct¸ie de variabilelor aleatoare observabile (cele ale n -e¸santionului) ¸si nu depinde de parametrii necunoscut¸i.

Statistica e¸santioanelor Bernoulli. Modelare: fiecare element al populat¸iei statistice se reprezint˘ a printr-o variabil˘ a aleatoare Bernoulli X , cu distribut¸ia 0 1 X : , 1 θ θ Pentru evaluarea aprioric˘ a a prametrului necunoscut θ se propune estimatorul media empiric˘ a , definit prin: S n X = , unde S n = X 1 + X 2 + + X n . n Media empiric˘ a exprim˘a frecvent¸a de aparit¸ie a valorii 1, deci ofer˘ a o evaluare a parametrului θ. Propriet˘ a¸t ile principale ale mediei empirice X , ca estimator a lui θ. 1. X este un estimator f˘ ar˘ a abatere a lui θ: Eθ (X ) = θ, θ (0, 1). ar˘ a abatere a lui θ, care depinde de S n . 2. X este unicul estimator f˘ 3. X este estimatorul lui θ de maxim˘ a verosimilitate and talia e¸santionului tinde la infinit, X converge la θ cu o rat˘ a exponent ¸ial˘ a. 4. Cˆ 5. Riscul p˘ atratic mediu al estimatorului X a lui θ converge la 0. ¸˘ a de θ poate fi evaluat˘ a prin Teorema limit˘ a central˘ a. 6. Abaterea lui X fat Definim estimatorul bayesian a lui θ, de risc p˘atratic mediu minim:



−



···

∀ ∈

g(S n ) =

S n +1 (1 − θ)n−S n ∈ . S n n−S n θ∈D ρ(θ)θ (1 − θ)

  

θ D ρ(θ)θ

Dac˘a θ admite densitatea de probabilitate f pe [0, 1], atunci estimatorul bayesian a lui θ este 1 S n +1 θ (1 θ)n−S n f (θ)dθ 0 g(S n ) = 1 . S n S − n n θ (1 θ) f (θ)dθ 0

− −

57

4.6

Not¸iuni de statistic˘ a descriptiv˘ a

4.6.1

Concepte de baz˘ a

• Statistica, ramur˘a a matematicii, studiaz˘a metodele de ˆınregistrare, descriere ¸si analiz˘a a datelor experimentale referitoare la un anumit fenomen ˆın scopul formul˘ arii unor previziuni.

• Populat¸ia

statistic˘ a este mult¸imea (ˆın sens matematic) care face obiectul unui anumit studiu statistic.

• Unitate statistic˘a (individ) este un element component al unei populat¸ii statistice. • Caracteristic˘a statistic˘a este una din ˆınsu¸sirile unit˘a¸tii statistice.

O caracteristic˘ a cantitativ˘ a este m˘ asurabil˘ a , iar una calitativ˘ a este atributiv˘ a . Un studiu statistic a vizeaz˘ a una sau mai multe caracteristici statistice ale indivizilor unei populat¸ii statistice.

• E¸santionul este o submult¸ime a populat¸iei statistice, obt¸inut˘a printr-o select¸ie,

pentru care se realizeaz˘ a evaluarea caracteristicii statistice. Pentru unele studii statistice, e¸santionul reprezint˘ a ˆıntreaga populat¸ie statistic˘ a . Num˘ arul de elemente al e¸santionului se nume¸ste volumul (efectivul) e¸santionului.

• Sondajul este act¸iunea de prevalare ¸si ˆınregistrare a valorilor uneia sau mai multor caracteristici statistice ale indivizilor unui e¸santion fixat.

• Tabelul statistic cont¸ine ˆınregistrarea valorilor numerice (datelor experimentale), numite valori observate obt¸inute prin m˘ asurarea caracteristicii tuturor unit˘ a¸tilor statistice ale e¸santionului select¸ionat.

• Frecvent¸a

arul relativ˘ a a unei valori a caracteristicii este raportul dintre num˘ indivizilor e¸santionului pentru care s-a ˆınregistrat valoarea respectiv˘ a ¸si volumul e¸santionului.

• Distribut¸ia statistic˘a empiric˘a reprezint˘a reprezint˘a repartit¸ia valorilor obser-

vate ale caracteristicii pentru e¸santionul select ¸ionat (ˆınregistrate ˆın tabelul statistic). Din punct de vedere matematic, distribut ¸ia statistic˘ a (empiric˘a) este funct¸ia care realizeaz˘ a corespondent¸a ˆıntre numerele reale, obt¸inute ca valori observate ale caracteristicii, ¸si frecvent¸a relativ˘ a a ˆınregistr˘arii lor.

• Distribut¸iile (repartit¸iile) statistice teoretice reprezint˘a modele matematice idealizate ale distribut¸iilor empirice. Concret, o distribut¸ie statistic˘ a teoretic˘ a este ∞ descris˘a de o funct¸ie f : R → [0, 1] cu proprietatea −∞ f (x) dx = 1, numit˘a den-



sitate de probabilitate . Pentru anumite fenomene analizate statistic, distribut ¸ia empiric˘a tinde la o anumit˘a distribut¸ie teoretic˘ a, dac˘ a (ne imagin˘am c˘a) volumul e¸santionului tinde la infinit.

• Teoria

a cu not¸iunile de spat ¸iu m˘ asurabil, probabilitate probabilit˘at¸ilor opereaz˘ ¸si variabil˘ a aleatoare . O variabil˘a aleatoare este o funct¸ie X , definit˘a pe un spat¸iu m˘asurabil cu probabilitate, cu valori reale, avˆ and proprietatea c˘ a pentru orice num˘ ar

58 real x se poate evalua probabilitatea F probabilitatea F ((x) ca X ca X s˘a ia valori ˆın intervalul intervalul ( anume: F ( F (x) = P X x [0, [0 , 1]. 1].

−∞, x], ¸si

{ ≤ ≤ } ∈

Spunem c˘ a variabila aleatoare X are are densitatea de probabilitate f a: f dac˘a: x

F ( F (x) =



f ( f (t) dt, pentru orice orice num˘ num˘ ar ar real x

−∞

Media unei variabile aleatoare X aleatoare X cu densitatea de probabilitate probabilitate f f se se calculeaz˘ a prin:

∞



M (X ) =

x f ( f (x) dx

−∞

aleatoare X cu cu densitatea de probabilitate f probabilitate f se se calculeaz˘ a Dispersia unei variabile aleatoare X prin: 2

σ (X ) =

∞



(x

−∞

2

f (x) dx, unde m = M = M ((X ) − m) f (

Un caz particular particular ˆıl constituie constituie variabilele variabilele ale aleato atoar aree finite . O astfe astfell de varia ariabi bil˘ l˘ a aleatoare X X are un num˘ar ar finit de valori reale x1 < x2 < < xk cu probabilit˘at a¸ile ¸tile p1, p2, , pk [0, [0 , 1]. 1]. Avem deci: pi

· · · ∈ = P {X = x }, i

···

i = 1, 2,

· · · , k;

p1 + p + p2 +

· · · + p

= 1.

k

În acest caz, media ¸si si respectiv dispersia variabilei ariabilei aleatoare X se X se calculeaz˘ a dup˘a urm˘atoarele atoarele formule: formule: k

m = M = M ((X ) = x 1 p1 + x2 p2 + 2

σ (X ) = (x1

2

2

· · · + x p

k k

=

 i=1

2

( x − m) p + · · · + (x (x − m) p − m) p + (x 1

2

2

k

xi pi

k

=

k



(xi

i=1

2

− m) p . i

• Exemple de distribut¸ii ¸ii (repartit¸ii, ¸ii, legi) teoretice clasice:

a de medie m ¸si 1. Legea normal˘ si dispersie σ2 are densitatea de probabilitate: (x m)2 1 − f ( f (x) = e 2σ2 , x R 2 2πσ Graficul lui f are f are forma unui clopot, cunoscut sub denumirea de de clopotul lui Gauss . Legea Legea norm normal al˘ a˘ (sau legea lui Gauss-Laplace ) joac˘ a un rol central ˆın teoria probabilit˘ probabilit˘ at a¸ilor, ¸t ilor, fiind legea fiind legea limit˘ a a sumelor normalizate ale ¸sirurilor sirurilor de variabile variabi le aleato al eatoare are independente independen te ¸si si identic i dentic distribuite distri buite . −

√

∈

f ( f (x) 

O

m

.. .

− 2σ

... ... ... ... ... ... ... ... . m

.. . m + 2σ 2σ

 x

Valorile unei

59 variabile aleatoare X aleatoare X cu cu distribut¸ie ¸ie normal˘ a de medie m medie m ¸ ¸si si disp di sper ersi siee σ 2 se ”concentreaz˘ a” a” cu o probabilitate probabilitate de 95% ˆın intervalul intervalul [m 2σ, m + 2σ ], centrat ˆın valoarea valoa rea medie med ie m. Mai precis avem:

−

P m unde

√ σ = σ

2σ} = 0, 9544 · · · { − 2σ ≤ X ≤ ≤ m + 2σ

2

se nume nume¸¸ste st e abaterea standard a variabilei aleatoare X .

¸ia χ2 cu m grade de libertate are densitatea de probabilitate: 2. Repartit¸ia f ( f (x) =

1 2 2 Γ m

m

m 2

   

unde:

m Γ = 2

x

x 2 −1 e− 2 , x > 0

∞

m

x 2 −1 e−x dx.

0

Dac˘a o variabil˘a aleatoare X are X are repartit¸ia ¸ia χ2 cu m grade de libertate, atunci media ¸si si respectiv r espectiv dispersia variabilei aleatoare sunt urm˘ atoarele: atoarele: M ( M (X ) = m σ 2 (X ) = 2m Repartit¸ia ¸ia χ2 are un rol r ol impor im portant tant ˆın statis s tatistica tica matematic˘ mate matic˘a ˆın deducer de ducerea ea repart r epartit it ¸ei statistice a unor estimatori unor estimatori ¸ ¸si si ˆın veri verific ficar area ea ipotezelor ipotezelor statistice .

4.6. 4.6.2 2

Tipu Tipuri ri de dist distri ribu but¸ii ¸tii statisti statistice ce empirice. empirice. Tabele statistic statistice. e. Reprezent˘ ari ari grafice.

In cadrul cadrul unui unui studiu studiu statist statistic, ic, datele datele experime experimenta ntale le obt ¸inute prin m˘asurarea asurarea valoric˘ a a unei caracteristici a unui e¸santion santion considerat sunt ˆınregistrate ˆıntr-un tabel statistic. Acesta evident¸iaz˘ ¸iaz˘ a o anumit˘a distrib distribut ut¸ie ¸ie statistic˘ statistic˘ a. Dupa˘ natura natura repartit repartit ¸iei valorilor alorilor ˆınregistra ınreg istrate, te, disting d istingem em dou˘ do u˘ a tipuri de distribut¸ii ¸ii statistice empirice empirice (experimentale). (experimentale). 1) Tipul finit (sau discret) de distribut¸ie ¸ie corespunde cor espunde cazului ˆın ın care, ipotetic, caracteristica masurat˘ a poate lua un num˘ ar ar finit (sau num˘ arabil) arabil) de valori. alori. In contin continuare uare vom trata numai cazul finit. Consider˘am am un e¸santion santion fixat de volum n.. Aceasta Aceast a ˆınseamn˘ ınsea mn˘a c˘a num˘ arul arul de unit˘ at a¸i ¸ti statistice pentru care se determin˘ a ¸si si se ˆınre ın regi gist stre reaz az˘ a˘ valoarea caracteristicii este egal cu n. S˘a presupunem c˘a valorile ˆınregistrate ale caracteristicii sunt numerele reale x1 < x2 < ar ar natura nat urall cuprin cup rinss ˆıntre ıntr e 1 ¸si n si n.. < xk unde k este un num˘ Fiecarei valori realizate (ˆınregistrate) a caracteristicii ˆıi determin˘ am ”frecvent¸a” ¸ a” de aparit¸ie. ¸ie.

···

¸a absolut˘ abso lut˘a a valorii • Frecvent¸a

xi este num˘ arul n arul n i de subiect¸i ¸i pentru care valoarea k caracteristicii este xi . Din Din defini definit¸ie ¸tie rezult˘ a 0 ni n ¸si si i=1 ni = n, unde k ¸ia ¸ia simbolic˘a a sumei n1 + n2 + + nk . i=1 ni este notat



arul • Frecvent¸a ¸a relativ˘a a valorii x este num˘arul relat¸iile: ¸iile: f ∈ [0, [0 , 1] ¸si si f = 1. i

i

k i=1



i



≤ ≤ ···

f i =

ni . n

Constat˘ am a m c˘a au loc

60 ni n

arul p = 100 · = 100 · f . • Frecvent¸a ¸a procentual˘ proc entual˘ a a valorii x este num˘arul Avem p ∈ [0, [0 , 100] 10 0] ¸si si p = 100. 100. Pentru a evident¸ia ¸ia c˘a p reprezin˘ a o m˘arime arime i

k i=1



i

i

i

i

i

procentual˘a, a, se s e folose¸ f olose¸ste ste curent cure nt notat no tat¸ia p ¸ia p i %. %.

Frecvent¸ele ¸ele determinate ale valorilor, indicˆ and and distribut¸ia ¸ia statistic˘ a empiric˘ a, a , pot fi central tr aliz izat atee ˆın ın tabelul frecvent ¸elor sau ¸elor sau pot fi reprezentate grafic prin diagrama prin diagrama de structur˘ a, histograma ¸ ¸si si respe res pecti ctiv v poligonul frecvent ¸elor.

D iagra grama ma de struc str uctur tur˘ ˘ a ilustreaz˘ a distribut¸ia ¸ia statistic˘ a empiric˘ a prin partit¸ia ¸ia unui • Dia disc ˆın ın sectoare de cerc cu ariile proport¸ionale ¸ionale cu frecvent¸ele ¸ele relative ale valorilor. Sectorul Secto rul reprezentˆ repr ezentând and valoarea x valoarea x are unghiul de la centru de m˘ asur˘ asur˘a α = f · 360 . ¸elor se obt¸ine, ¸ine, ˆıntr-un sistem de axe de coodonate, coo donate, unind sucsu c• Poligonul frecvent¸elor cesiv cesiv prin segmente segmente punctele punctele de coordonat coordonatee (x , f ), (x , f ), · · · , (x , f ). coo donate, frecvent fr ecvent ¸ele relative (sau • Histograma ilustreaz˘a,a, ˆıntr-un sistem de axe de coodonate, i

i

1

1

2

2

k

i

o

k

procentuale) ale valorilor x valorilor x i prin dreptungh drep tunghiuri iuri de ˆın˘ ın˘ alt alt¸ime f ¸ime f i (respectiv pi) dispuse cu baza pe axa absciselor, ˆın ın dreptul absciselor x absciselor x i .

Exempl Exemplul ul 1 La o prob˘ a sportiv sportiv˘ a˘ fiec fiecare are partici participa pant nt a efectuat efectuat 6 arunc˘ aruncari ˘ la co¸sul sul de baschet, realizˆ and an d ˆıntre ın tre 0 ¸si si 6 arunc˘ aru nc˘ ari reu¸site. sit e. Rezultatele Rezulta tele obt ob¸inute t de cei 40 de participant ¸i sunt prezentate sintetic sinteti c ˆın ın tabelul urm˘ ator: num˘arul arul de arunc˘ ari reu¸site 0 1 2 3 4 5 6 num˘arul arul de participant¸i 2 4 8 15 4 6 1 total 40 Volumul e¸antionului antionului considerat este n = 40 iar num˘arul arul de valori ale caracteristicii este k = 7. 7. Prezen Prezent˘ t˘ am am tabelul frecvent¸elor, ¸elor, diagrama de structur˘a, a, histograma ¸si si respectiv poligonul frecvent¸elor ¸elor asociate studiului statistic considerat.

A) Tabelul frecvent¸elor ¸elor valorile xi 0 1 2 3 4 5 6

frecvent¸ele ¸ele absolute (n (ni ) rela relati tiv ve (f i ) proce procen ntual tualee ( pi %) 2 0,050 5,0 % 4 0,100 10,0 % 8 0,200 20,0 % 15 0,375 37,5 % 4 0,100 10,0 % 6 0,150 15,0 % 1 0,025 2,5 % 7 7 7 i=1 ni = 40 i=1 f i = 1 i=1 pi = 100







B) Diagrama de structur˘ a

  2

1      0  3     6   5 4

61

C) Histograma 37, 5% 20% 10%

5%

10%

15% 2, 5%

0

1

2

3

4

5

6

D) Poligonul frecvent¸elor ..  .  ..   ..   .. .   . .. ..      . . .   .. .. .. .. ..   .. . . . . ..  .  . . . . . 0 1 2 3 4 5 6 2) Tipul continuu de distribut¸ie corespunde cazului cˆ and valorile caracteristicii sunt numere reale situate ˆıntr-un anumit interval [a,b]. Pentru a grupa valorile caracteristicii, se fixeaz˘ a, ¸tinând cont de specificul studiului statistic efectuat, un num˘ ar ˆıntreg k > 1 ¸si b−a se ˆımparte intervalul (a, b] ˆın k subintervale de aceea¸si lungime l = k . Not˘am, ˆın ordine, −a) , a + i(b−a) ], i = 1, 2, , k. Fie aceste intervale I 1 , I 2 , , I k . Astfel, I i = (a + (i−1)(b k k un e¸santion fixat de volum n cu n > k. Fiec˘arui interval I i i se asociaz˘ a ”frecvent¸a de −a) , aparit¸ ie”; vom nota cu xi valoarea ”central˘a” a intevalului, adic˘ a xi = a + (2i−1)(b 2k obt¸inut˘a f˘acând media aritmetic˘ a a capetelor intervalului I i (a se vedea figura urm˘ atoare).

···

axa real˘ a

a x1 ( ı I 1 

|

 

·· ·

x2 ı I 2

|

 

x3 ı I 3

|

 

x4 ı I 4

|

...............



|



xk b ı ] I k





• Frecvent¸a absolut˘a a intervalului I este num˘arul n de subiect¸i pentru care i

i

valoarea caracteristicii apart¸ine intervalului I i .

ni n

• Frecvent¸a relativ˘a a intervalului I este num˘arul f = . • Frecvent¸a procentual˘a a intervalului I este num˘arul p = 100 · f . i

i

i

i

i

Frecvent¸ele determinate ale valorilor, indicˆ and distribut¸ia statistic˘ a empiric˘ a , pot fi centralizate ˆın tabelul frecvent ¸elor sau pot fi reprezentate grafic prin diagrama de structur˘ a, histograma ¸si respectiv poligonul frecvent ¸elor care nu difer˘a de cele descrise pentru distribut¸ii finite.

62 a contracronometru de ciclism au participat 148 de concurent ¸i. Exemplul 2 La o prob˘ Dup˘ a ˆın registrarea timpilor de parcurs, s-au grupat rezultatele ˆın 6 intervale de cˆ ate 30” ¸si s-au calculat frecvent ¸ele intervalelor, obt ¸inˆ andu-se urm˘ atorul tabel: intervalele I i (48 , 48 30”] (48 30”, 49 ] (49 , 49 30”] (49 30”, 50 ] (50 , 50 30”] (50 30”, 51 ]

4.6.3

valorile centrale xi 48 15” 48 45” 49 15” 49 45” 50 15” 50 45”

Tabelul frecvent¸elor frecvent¸ele absolute (ni ) relative (f i ) procentuale ( pi %) 7 0,047 4,7 % 28 0,189 18,9 % 53 0,358 35,8 % 42 0,283 28,3 % 10 0,067 6,7 % 8 0,054 5,4 % 6 6 6 i=1 ni = 148 i=1 f i = 1 i=1 pi = 100





Indicatori statistici



Pentru o distribut¸ie statistic˘ a empiric˘ a, consemnat˘ a ˆın tabelul frecvent¸elor, determin˘ am o serie de indicatori statistici ˆın scopul obt¸inerii unor informat¸ii cu caracter general privind repartizarea valorilor carateristicii studiate. Cei mai important¸i indicatori statistici sunt: media, mediana ¸si respectiv dispersia distribut¸iei. Media ¸si dispersia indic˘ a, fiecare ˆın parte, valorea ”central˘ a” sau valoarea ”de mijloc” a distribut¸iei respective, ˆıntr-o o accept¸iune specific˘ a fiec˘ arei not¸iuni. Dispersia si respectiv abaterea standard indic˘ a gradul de ”ˆımpr˘ a¸stiere” a valorilor fat¸a˘ de valoarea ”central˘ a” a distribut¸iei. Coeficientul de variat¸ie, calculat prin raportarea abaterii standard la medie, ofer˘ a posibilitatea stabilirii gradului de omogenitate al e¸santionului. Consider˘am o distribut¸ie statistic˘ a empiric˘ a, asociat˘ a unei caracteristici (variabile empirice) X , care ia valorile x1 < x2 < < xk cu frecvent¸ele absolute n1 , n2 , , nk ¸si respectiv frecvent¸ele relative f 1 , f 2 , , f k .

···

• Media

· ··

···

a prin: x = M (X ) a variabilei X se calculeaz˘ x = x 1 f 1 + x2 f 2 +

··· + x f ,

sau, utilizând scrierea prescurtat˘ a, x = M (X ) =

• Mediana

k k



k i=1 xi f i .

M ed = M ed(X ) a variabilei X , corespunzˆ and unui e¸santion de volum n, se define¸ste astfel: se ordoneaz˘ a cresc˘ ator valorile caracteristicii tuturor subiect¸ilor e¸santionului, obt¸inându-se ¸sirul de valori v1

≤ v ≤ ··· ≤ v . 2

n

Distingem dou˘ a situat¸ii: 1. dac˘ a n = 2 p + 1, cu p - num˘ar natural (deci n este un num˘ar natural impar), atunci Med = v p+1 ; 2. dac˘ a n = 2 p, cu p - num˘ar natural (deci n este un num˘ ar natural par), atunci vp +vp+1 Med = . 2

63 Observ˘a m c˘a din definit¸ia medianei reiese c˘ a aceasta este valoarea care ”ˆımparte” e¸santionul ˆın ˆın dou˘ a p˘ art ¸i de volume egale Mediana se mai poate determina ¸si utilizˆ and frecvent¸ele absolute n1 , n2, valorilor x1 < x2 < < xk , dup˘a cum urmeaz˘ a:

·· ·

M ed =

 

xi ,

xi +xi+1 , 2

• Amplitudinea

dac˘ a n1 + n2 +

dac˘ a

n 2

n 2

·· · , n

ale

k

··· + n − < < n + n + ··· + n − + n = n + n + ·· · + n − + n i 1

1

2

1

i 1

2

i 1

i

i

W = W (X ) a variabilei X se define¸ste prin: W = x max

−x

min

Astfel, dac˘a X are o distribut¸ie de tip finit atunci W = x k x1 , iar dac˘ a X are o distribut¸ie de tip continuu cu valorileˆın intervalul (a, b], atunci W (X ) = b a.

−

• Dispersia

−

σ 2 = σ 2 (X ) a variabilei X se define¸ste prin: k 2

σ =



2

− x) f ,

(xk

i=1

i

unde x = M (X ) este media variabilei X .

• Abaterea standard

σ = σ(X ) a variabilei X se define¸ste prin: σ=

√

σ2

C v = C v (X ) al variabilei X , se define¸ste, numai ˆın cazul când toate valorile xi ale distribut ¸iei X sunt pozitive , prin:

• Coeficientul de variat¸ie

C v =

σ x

• Expresia procentual˘a coeficientului de variat¸ie C C = 100 · C %

v % = C v% (X )

v%

este:

v

Tabelul urm˘ ator prezint˘ a interpretarea curent˘ a a omogenit˘ at¸ii e¸santionului ˆın raport cu variabila X dup˘a valorile coeficientului de variat¸ie exprimat procentual: Coeficientul de variat¸ie C v% Omogenitatea 0-10% omogenitate mare 10-20% omogenitate medie 20-35% omogenitate mic˘ a peste 35% e¸santion neomogen S˘a urm˘arim calculul indicatorilor statistici definit¸i anterior pentru distribut¸iile din exemplele anterioare. Vom nota cu X variabila empiric˘ a cu distribut¸ia prezentat˘ a ˆın Exemplul 1 ¸si respectiv cu Y variabila empiric˘ a cu distribut¸ia descris˘ a ˆın Exemplul 2.

64

4.6.4

Calculul indicatorilor statistici ai distribut ¸iei variabilei X (Exemplul 1).

Media: x = 0 0, 05 + 1 0, 1 + 2 0, 2 + 3 0, 375 + 4 0, 1 + 5 0, 15 + 6 0, 025 = 2, 925 Rezult˘a c˘a num˘arul mediu de reu¸site este:

·

·

·

·

·

·

·

∼

x = M (X ) = 3

Mediana: Avem n : 2 = 20 ¸si n1 +n2 +n3 = 14 < 20 < 29 = n 1 +n2 +n3 +n4 , deci Med(X ) = x 4 , sau: Med(X ) = 3. Amplitudinea: W (X ) = 6

−0=6

Dispersia: σ (X ) = (0 2, 925)2 0, 05+(1 2, 925)2 0, 1 + ( 2 2, 925)2 0, 2 + ( 3 2, 925)2 0, 375+ (4 2, 925)2 0, 1+(5 2, 925)2 0, 15+(6 2, 925)2 0, 025 = 1, 969 Dispersia valorilor (abaterea medie p˘ atratic˘a) este deci: 2

− ·

−

· −

− ·

· −

− ·

·

· ··

−

·

∼

σ 2 (X ) = 1, 97

Abaterea standard : σ(X ) =

Coeficientul de variat¸ie:

∼



1, 969 = 1, 403

1, 403 = 0, 4797 2, 925 Expresia procentual˘ a a coeficientul de variat¸ie:

∼

C v (X ) =

∼

C v% (X ) = 48 % Interpretare: e¸santion neomogen .

4.6.5

Calculul indicatorilor statistici ai distribut ¸iei variabilei Y (Exemplul 2).

Media x = 48, 25 0, 047+48, 75 0, 189+49, 25 0, 358+49, 75 0, 283+50, 25 0, 067+50, 75 0, 054 = 49, 29 (minute) Rezult˘a c˘a timpul mediu ˆınregistrat al probei este:

·· ·

·

·

·

·

·

·

∼

M (Y ) = x = 49  18”

Mediana: Avem: n : 2 = 74 ¸si n 1 + n2 = 35 < 74 < 88 = n 1 + n2 + n3, deci M ed(Y ) = x 3 , adic˘a: M ed(Y ) = 49 15”

65

Amplitudinea: W (Y ) = 51

− 48 = 3 (minute)

Dispersia: σ (Y ) = (48, 25 49, 29)2 0.047 + (48, 75 49, 29)2 0, 189 + (49, 25 49, 29)2 0, 358 + (49, 75 49, 29)2 0, 283+(50, 25 49, 29)2 0, 067+(50, 75 49, 29)2 0, 054 = 0, 34325 2

−

− ·

·

− · − · σ (Y ) ∼ = 0, 343

−

·

−

·

···

2

Abaterea standard : σ(Y ) =

Coeficientul de variat¸ie:

∼



0, 343 = 0, 586

0, 586 = 0, 012 49, 29 Exprimarea procentual˘ a a coeficientului de variat¸ie:

∼

C v (Y ) =

∼

C v% (Y ) = 1, 2 % Interpretarea: e¸santion foarte omogen .

4.6.6

Compararea a dou˘ a distribut ¸ii empirice

S˘a presupunem c˘ a pentru un e¸santion fixat de volum n se sondeaz˘ a ˆın paralel dou˘a caracteristici (variabile empirice) X ¸si Y ¸si se pune problema existent¸ei unei conexiuni ˆıntre distribut¸iile acestora. Pentru obt¸inerea unei concluzii se recurge la calculul unor indici de corelat¸ie asociat¸i perechii de variabile X ¸si Y .

4.6.7

Corelat¸ia ¸si coeficientul de corelat¸ie

Fie x = M (X ), y = M (Y ) mediile variabilelor X ¸si Y , iar σX , σY abaterile lor standard. Presupunem c˘ a X ia valorile x1 < x2 < < xk iar Y ia valorile y1 < y2 < yl . Not˘am ni,j num˘arul unit˘ a¸tilor statistice ale e¸santionului pentru care caracteristica X ia valoarea xi iar caracteristica Y ia valoarea y j , unde i = 1, 2, , k ¸si j = 1, 2, , l. Fie ni,j f i,j = n frecvent¸a relativ˘ a a perechii de valori (xi , y j ).

···

···

·· ·

···

Corelat¸ia cX,Y a variabilelor X ¸si Y se definet¸e prin: cX,Y = M ((X

− x)(Y − y)) =



(xi

− x)(y − y)f j

i,j

i=1,k j=1,l

Coeficientul de corelat¸ie r = r X,Y al variabilelor X ¸si Y al variabilelor X ¸si Y se define¸ste prin: cX,Y r = . σX σY

·

66 Pe baza unei inegalit˘a¸ti matematice fundamentale (inegalitatea lui Cauchy ) se demonstreaz˘a c˘a, oricare ar fi distribut¸iile variabilelor X ¸si Y , avem:

−1 ≤ r ≤ 1. Interpretarea valorii coeficientului de corelat ¸ie r este urm˘ atoarea: 1. dac˘ a r este pozitiv, atunci variabilele X ¸si Y sunt corelate , adic˘a tendint¸a este ca atunci cˆ and variabila X ia o ”valoare mare” ¸si variabila Y s˘a ia tot o ”valoare mare”. Variabilele X ¸si Y sunt cu atât mai puternic corelate cu cˆ at coeficientul lor de corelat¸ie este mai apropiat de valoarea 1. 2. dac˘ a r este negativ, atunci variabilele X ¸si Y sunt invers corelate , adic˘a tendint¸a este ca atunci cˆ and variabila X ia o ”valoare mare” variabila Y s˘a ia o ”valoare mic˘a”. 3. dac˘ a r este apropiat de valoarea 0, atunci variabilele X ¸si Y sunt independente sau cu o dependent ¸˘ a slab˘ a .

4.6.8

Metoda corerat¸iei rangurilor

Aceast˘a metod˘ a, datorat˘ a lui Spearman, se utilizeaz˘ a atunci cˆ and volumul e¸santinului este mic (de regul˘ a n < 30). Fiec˘ arui individ i 1, 2, n al e¸santionului i se asociaz˘a o pereche de ranguri (ri (X ), ri (Y )), cu ri (X ), ri (Y ) [1, n]. Aceste ranguri se determin˘ a ˆın urma realiz˘ arii a câte unui ”clasament” cresc˘ ator al valorilor ˆınregistrate pentru fiecare din caracteristicile (variabilele) X ¸si Y . Rangurile ri (X ) ¸si respectiv ri (Y ) exprim˘a ”pozit¸ia” (eventual intermediar˘ a) a individului i ˆın fiecare din cele dou˘ a ”clasamente” de valori cresc˘atoare. Not˘am di = r i (X ) ri (Y ), i = 1, 2, , n. Coeficientul de corelat¸ie al rangurilor ρ = ρ X,Y asociat variabilelor X ¸si Y se define¸ste prin: 6 ni=1 d2i ρ = 1 n(n2 1)

∈ {

−

·· · } ∈

···

−



−

Se poate verifica prin calcul c˘ a, indiferent de distribut¸ia rangurilor, avem: 0

≤ ρ ≤ 1

Dac˘a ρ este apropiat de 1, atunci variabilele X ¸si Y sunt corelate iar dac˘a ρ este apropiat de 0, atunci variabilele X ¸si Y sunt invers corelate .

67

4.7

Test

1. Definit¸i media empiric˘ a ¸si descriet¸i propriet˘ a¸tile acestui estimator ˆın cazul e¸santioanelor Bernoulli. 2. Determinat¸i estimatorul bayesian al unui e¸santion Bernoulli asociat unei distribut ¸ii Beta(α, β ) a parametrului de estimat θ. 3. Se observ˘a dou˘ a variabile aleatoare Bernoulli indepedente X 1 ¸si X 2 , de parametru θ (0, 1). S˘a se arate c˘ a nu se poate g˘ asi un estimator a f˘ar˘a abatere a lui 1−θ θ care s˘a depind˘ a de X 1 ¸si X 2 .

∈

4. Cu ajutorul unui n-e¸santion Bernoulli de parametru θ se caut˘ a estimarea dispersiei θ(1 θ). S˘a se arate c˘ a estimatorul T = X (1 X ) nu este f˘ ar˘a abatere, dar exist˘ a un multiplu al s˘au având aceast˘ a proprietate.

−

−

68

Probabilitate statistica

Recommend Documents