173
8 | FUNCIÓN GENERATRIZ DE MOMENTOS Y FUNCIÓN CARA CTERÍSTICA Algunas de las herramientas más importantes en teoría de probabilidad son tomadas de otras ramas de las matemáticas. En este capítulo discutiremos discutiremos dos de tales herramientas cercanamente relacionadas. Comenzamos con las funciones funciones generatrices de momentos y luego trataremos a las funciones características. características. Las últimas son un poco más difíciles de entender en un nivel elemental debido a que requieren del uso de números complejos. Sin embargo, vale la pena vencer este obstáculo, pues el conocimiento de las propiedades de las funciones características nos permite probar la Ley Débil de los Números Grandes y el Teorema Central del Límite (Sección 8.4).
8.1 8.1 Funcio nes Generatrices Generatrices de Momentos (f.g.m.) MX(t) de una v.a. X se define por La funci ón generatriz de momentos (f.g.m.) MX(t) = E(e tX). El dominio de MX son todos los números reales t, tales que E(e tX ) existe (es decir, tal que etX tiene esperanza finita).
Ejemplo 1. Si X está distribuida en forma normal con media µ y varianza σ2. Entonces MX (t) = E ( t tX ) =
∫
∞
-∞
e tx
2 2 1 e -[(x-µ ) /2σ ]dx σ 2π
2 2 1 e -[y /2 σ ] dy -∞ σ 2π ∞ 2 2 1 = e µt e ty - [y /2σ ] dy . -∞ σ 2π 2 y (y - σ2t)2 σ2t 2 Ahora, ty . Consecuentemente = + 2σ 2 2σ2 2
=
∫
∞
e t(y + µ )
∫
MX (t) = e
1 2
µt + σ2 t2
, si -∞ < t < ∞.
Ejemplo 2. Si X tiene la densidad gama con parámetros α y λ. Entonces ∞ tx λ α MX (t) = ∫ e x α -1e -λxdx 0 Γ(α) λ α ∞ α -1 -(λ− t )x = x e dx Γ(α) ∫ 0 λ α Γ(α ) = , para -∞ < t < λ. Γ(α) (λ-t)α
(1)
174
Por otro lado, la integral diverge para λ ≤ t < ∞. Así, α
⎛ λ ⎞ , para - ∞ < t < λ. MX (t) = ⎜ ⎟ ⎝ λ -t ⎠
(2)
Ahora, supóngase que X es una v.a. discreta, cuyos posibles valores son enteros no negativos. Entonces ∞
MX (t) =
∑ e P(X = n). nt
n= 0
En el Capítulo 3, definimos la función generatriz de probabilidad para tales v.a.'s como
Φ X (t) = E ( t
X
∞
) = ∑ t nP(X = n). n =0
De estas dos fórmulas es claro que MX(t) = ΦX(et)
(3)
La fórmula (3) nos permite determinar la f.g.m. directamente de la función generatriz de probabilidades. Por ejemplo, si X tiene una distribución binomial con parámetros n y p, entonces, como se mostró en el Ejemplo 16 del Capítulo 3, ΦX(t) = (pt + 1 - p) n. De donde, se sigue inmediatamente que MX(t) = (pe t + 1 - p) n Similarmente, si X tiene una distribución Poisson con parámetro λ, entonces, de acuerdo con el Ejemplo 18 del Capítulo 3, ΦX(t) = e λ(t-1) . Consecuentemente t
MX(t) = e λ (e -1) . Por supuesto, en estos dos ejemplos MX(t) puede obtenerse fácilmente en forma directa de la definición de f.g.m.. Si X e Y son v.a.'s independientes, entonces etX y etY también son independientes. En consecuencia MX+Y(t) = E[e t(X + Y)] = E(etXetY) = E(etX)⋅E(etY) = MX(t)⋅MX(t). Se sigue fácilmente que si X1,…, X entonces MX1 ++ Xn (t) =
n
(M
son independientes e idénticamente distribuidas, n
X1 (t) ) .
(4)
Para ver porque MX(t) es llamada f.g.m., escribimos
⎛ ∞ tn Xn ⎞ MX (t) = E(e ) = E ⎜ ∑ ⎟. n! ⎝ n =0 ⎠ tX
Suponiendo que MX(t) es finita sobre -t0 < t < t0, para algún número positivo t0. En este caso uno puede mostrar que en la última expresión para MX(t) se permite intercambiar el orden de la esperanza y la sumatoria. En otras palabras
175
∞
E(Xn ) n MX (t) = t, n! n =0
∑
para -t 0 < t < t 0.
(5)
En particular, si MX(t) es finita para toda t, entonces (5) se cumple para toda t. La serie de Taylor (alrededor de 0) para MX(t) es
⎞ tn ⎛ dn MX (t) = M (t)| ⎜ X t =0 ⎟. n n =0 n! ⎝ dt ⎠ ∞
∑
(6)
Ahora, comparando los coeficientes de tn en (5) y (6), vemos que dn E(X ) = n MX (t)|t =0. dt n
(7)
Ejemplo 3. Sea X una v.a. distribuida en forma normal con media 0 y varianza σ2. Use la f.g.m. para encontrar los momentos de X. En principio, observe de (1) que σ2t 2
MX(t) = e
2
n
⎛ σ 2 t 2 ⎞ 1 ∞ σ 2n 2n ⎟⎟ = ∑ ⎜⎜ =∑ n t . n =0 ⎝ 2 ⎠ n! n =0 2 n! ∞
Así, todos los momentos de orden impar para X son cero, y los momentos de orden par están dados por E(X 2n ) σ 2n (2n)! = n , o bien E(X 2n ) = n σ 2n . (2n)! 2 n! 2 n! Lo cual concuerda con el resultado obtenido en el Capítulo 7. 2 2
Este ejemplo puede usarse para ilustrar (7). d2 e dt 2
σ2 t 2 2
σ2 t 2
= (σ + σ t ) e 2
4 2
2
Puesto que,
2 2
d σ 2t , se sigue que, e dt
2 2
σ t d σ 2t 2 e = σ te 2 , y dt 2 2
= 0, y t =0
d2 σ 2t e dt 2
= σ2, los cuales, t =0
son exactamente los dos primeros momentos de X.
8.2 Funciones Características La función característica (f.c.) de una v.a. X está definida como: ϕX(t) = E(e itX), para -∞ < t < ∞, donde i = - 1 . Las funciones características son ligeramente más complicadas que las funciones generatrices de momentos debido a que involucran números complejos. Sin embargo, ellas tienen dos importantes ventajas sobre las funciones generatrices de momentos. Primera, son finitas para cualquier v.a. X y todo número real t. Segunda, la f.d. de la v.a. X, y generalmente la f.d.p., si ésta existe, puede obtenerse de la función característica por medio de una "fórmula de inversión".
176
Usando las propiedades de las funciones características podremos probar la Ley Débil de los Números Grandes y el Teorema Central del Límite, lo cual no podríamos hacer con la f.g.m. Antes de discutir las funciones características, primero resumiremos brevemente algunos hechos que serán requeridos y que involucran variables complejas. Cualquier número complejo puede ser escrito como z = x + i⋅y, donde x e y son números reales. La magnitud o norma, |z|, de un número complejo, está definida por |z| = (x2 + y2)1/2. La distancia entre dos números complejos z1 y z2 está definida como |z1 − z2|. Si una función de variable real tiene una expansión en serie de potencias con radio de convergencia positivo, podemos usar esta serie de potencias para definir una ∞ zn z correspondiente función de variable compleja. Así, definimos: e = , para cualquier n! = n 0 z1 + z2 z1 z2 número complejo z. La relación: e = e ⋅ e , es válida para cualesquiera números complejos z1 y z2. Tomando z = i⋅t, donde t es un número real, vemos que ∞ (it)n t 2 it 3 t4 it 5 eit = = (1 + it - ⋅⋅⋅) + + n! 2 3! 4! 5! n= 0 t2 t4 t3 t5 + = (1 - ⋅⋅⋅) + i(t + - ⋅⋅⋅). 2 4! 3! 5!
∑
∑
Puesto que, las dos series de potencias en la última expresión corresponden a las del Cos(t) y Sen(t), se sigue que eit = Cos(t) + i⋅Sen(t).
(8)
Usando el hecho de que Cos(-t) = Cos(t) y Sen(-t) = - Sen(t), vemos que e-it = Cos(t) - i⋅Sen(t). De las fórmulas anteriores podemos resolver para Cos(t) y Sen(t), obteniéndose: eit + e- it eit − e- it Cos(t) = , y Sen(t) = . 2 2i
(9)
De (8) se sigue que | eit| = [Cos2(t) + Sen2(t)]1/2 = 1. Si f(t) y g(t) son funciones de valor real en t, entonces h(t) = f(t) + i ⋅g(t) define una función de valor complejo en t. Podemos diferenciar h(t), diferenciando f(t) y g(t) de forma separada; esto es: h'(t) = f'(t) + i ⋅g'(t), siempre que f'(t) y g'(t) existan. De forma semejante definimos:
∫
b
a
h(t) dt =
∫
b a
f(t) dt + i ⋅
contienen a f y g, existan. La fórmula:
∫
b a
g(t) dt,
siempre que las integrales que
d ct e = c ⋅ ect , es válida para cualquier constante dt
177
compleja c. El teorema fundamental del cálculo sigue siendo válido y, en particular, si c b ecb -eca ct es una constante compleja diferente de cero, entonces: e dt = . a c Una v.a. de valor complejo Z puede escribirse en la forma Z = X + i⋅Y, donde X e Y son v.a.'s de valor real. Su esperanza E(Z) está definida como:
∫
E(Z) = E(X + i⋅Y) = E(X) + i⋅E(Y), siempre que, E(X) y E(Y) estén bien definidas. Exactamente como las v.a.'s de valor real, Z tiene esperanza finita si y sólo si E(|Z|) < ∞, en cuyo caso: |E(Z)| ≤ E(|Z|). La fórmula: E(a1Z1 + a2Z2) = a1⋅E(Z1) + a2⋅E(Z2), es válida siempre que a1 y a2 sean constantes complejas y, Z1 y Z2 sean v.a.'s complejas con esperanzas finitas. Supondremos que X e Y con o sin subíndices, continúan denotando v.a.'s de valor real. Así, en la frase "sea X una v.a. . . .", se entiende que es una v.a. de valor real. Ahora, supóngase que X es una v.a. y t es una constante (se reserva el símbolo t para denotar una constante real). Entonces, |eitX| = 1, así que eitX tiene esperanza finita y X tiene función característica dada por: ϕX(t) = E(eitX), si - ∞ < t < ∞, la cual está bien definida. Vemos que: ϕX(0) = E(e0) = E(1) = 1 y, si - ∞ < t < ∞, |ϕX(t)| = |E(e itX)| ≤ E(|eitX|) = E(1) = 1. La razón por la que la función característica es finita para toda t, mientras que la f.g.m. no lo es, en general, se debe a que eit, para - ∞ < t < ∞ es acotada, en tanto que et, para - ∞ < t < ∞ no lo es.
Ejemplo 4. Si X es una v.a. que toma el valor a con probabilidad 1. Entonces
ϕX(t) = E(eitX) = eita, para - ∞ < t < ∞. En particular, si X toma el valor cero con probabilidad característica es idénticamente igual a 1.
1,
entonces su función
Si X es una v.a., y las constantes a y b son números reales, entonces ϕa+bX(t) = E[eit(a+bX)] = eita⋅E(eibtX), de donde,
ϕa+bX(t) = eita⋅ϕX(bt), para -∞ < t < ∞. Ejemplo 5. Sea U
~
U(-1, 1). Entonces, para t ≠ 0, se tiene
1 1 eitu ϕU (t) = -1e ⋅ du = 2 2 it
∫
Si
X=
tiene que
(10)
1
itu
1 ⎛ eit -e-it ⎞ sen(t) = ⎜ ⎟= t . 2 it ⎝ ⎠ -1 1
a + b b-a U, para a < b. Entonces X + 2 2
~
U(a, b) y por (10), para t ≠ 0, se
178
ϕX (t) = eit(a+b)/2 ⋅
sen[(b − a)t / 2] . (b − a)t / 2
Alternativamente
ϕX (t) =
∫
b
a
eitx ⋅
1 dx. b-a
Es fácil comprobar por medio de (9) que estas dos respuestas coinciden.
Ejemplo 6. Si X tiene una distribución exponencial con parámetro λ. Entonces
ϕX (t) = Puesto que, lim
x →∞
(e λ ) = - x
∫
∞
0
- λx
e λe dx = λ itx
∫
∞ 0
e
-(λ -it)x
λ -(λ -it)x 0 dx = e . λ -it ∞
lim ( e - λx e itx ) = 0, entonces, x →∞
ϕX (t) =
λ . λ-it
Supóngase que X e Y son v.a.'s independientes. Entonces eitX y eitY son también v.a.'s independientes; en consecuencia
ϕX+Y(t) = E[eit(X + Y)] = E(eitXeitY) = E(eitX)⋅E(eitY), de donde
ϕX+Y(t) = ϕX(t) ϕY(t), para -∞ < t < ∞.
(11)
La fórmula (11) se extiende inmediatamente para producir el hecho de que la función característica de la suma de un número finito de v.a.'s independientes es igual al producto de las funciones características de cada una de las v.a.'s que forman la suma. Puede mostrarse que ϕX(t) es una función continua respecto a t. Además, si X tiene n-ésimo momento finito entonces, ϕ(n) existe, es continua en t, y puede calcularse X (t) como dn dn itX itX ϕ (t) = n E(e ) = E[ n e ] = E[(iX)neitX ]. dt dt (n) X
En particular n n ϕ(n) X (0) = i ⋅ E(X ).
(12)
Podemos intentar expandir ϕX(t) en una serie de potencias de acuerdo a la fórmula
⎛ ∞ (itX)n ⎞ ∞ inE(Xn ) n ϕX (t) = E(e ) = E ⎜ ∑ ⎟ = ∑ n! t . n! = n 0 ⎝ ⎠ n =0 itX
(13)
179
∞
E(X n ) n Supóngase que, MX(t) = t , es finita en -t0 < t < t0, para algún t0. Entonces n! n=0 (13) también se cumple en -t 0 < t < t0.
∑
Ejemplo 7. Supóngase que X se distribuye en forma normal con media 0 y varianza σ2. Encontrar ϕX(t). En el Capítulo 7 se mostró que E(Xn) = 0 para cualquier entero positivo impar Además, si n = 2k es un entero par, entonces
n.
σ 2k (2k)! E(X ) = E(X ) = . 2 k ⋅ k! n
2k
Por lo que ∞
i2k E(X2k ) 2k t = ϕ X (t) = (2k)! k =0
∑
2 2
σ t (-σ2 t 2 /2)k =e 2 . k! k =0 ∞
∑
De forma más general, si X se distribuye normalmente con media µ y varianza σ2. Entonces Y = X - µ se distribuye en forma normal con media 0 y varianza σ2. Puesto que X = µ + Y vemos de la Fórmula (10) y el Ejemplo 7 que
ϕX (t) = eitµe
-
σ2 t2 2
, si -∞ < t < ∞.
(14)
Sea X una v.a. cuya f.g.m. MX(t) es finita en -t0 < t < t0 para algún número positivo t0. Puesto que MX(t) = E(e tX)
y
ϕX(t) = E(eitX),
deberíamos esperar que
ϕX(t) = M X(it).
(15)
En otras palabras, esperaríamos que si reemplazamos t por it en la fórmula para la f.g.m., obtendremos la fórmula correspondiente para la función característica. Realmente este es el caso, pero un entendimiento profundo de las ideas que contiene requiere de un concepto (extensión analítica) sofisticado de la teoría de variable compleja. Como un ejemplo de (15), si X se distribuye normalmente con media µ y varianza σ2. Entonces, como ya hemos visto µt
MX (t) = e e
σ2 t2 2
,
y de donde MX (it) = eµ(it)e
σ2 (it)2 2
= eiµte
que es ϕX(t) como puede observarse de (14).
-
σ2 t 2 2
,
180
8.3 Fórmulas de Inversión y el Teorema de Continuidad Si X es una v.a. de valor entero. Su función característica está dada por ∞
ϕX (t) = ∑ ei j t fX (j). -∞
Una de las propiedades más útiles de ϕX(t) es que puede usarse para calcular f X(k). Específicamente tenemos la "fórmula de inversión" 1 2π
fX (k) =
π
∫
-π
e -ikt ϕX (t) dt.
(16)
Para verificar (16) escribimos el lado derecho de esta fórmula como
1 2π
⎛ ∞ ijt ⎞ e e f (j) ∑ ∫ -π ⎜⎝ -∞ X ⎟⎠ dt. π
-ikt
Un teorema en teoría de integración justifica el intercambio en el orden de la integral y la sumatoria en le expresión anterior obteniéndose ∞
∑ f (j) ⋅ 21π ∫ -∞
X
π
-π
ei(j-k) t dt.
Para tener completa la demostración de (16) debemos probar que la última expresión es igual a f X(k). Para hacer esto es suficiente mostrar que
1 2π
∫
⎧ 1, si j = k, ei(j-k) t dt = ⎨ -π ⎩0, si j ≠ k. π
(17)
La fórmula (17) es obvia cuando j = k, pues en este caso ei(j - k)t = 1 para toda t. Si j ≠ k, entonces
1 2π
∫
π
-π
ei(j-k) t
i(j-k) t
e
π -π
ei(j-k) π -e-i(j-k) π sen[(j-k)π] dt = = = = 0, 2πi(j-k) 2πi(j-k) π(j-k)
puesto que: sen(mπ) = 0, para todo entero m. Esto completa la demostración de (17) y por lo tanto también de (16).
Ejemplo 8. Sean X1, X 2, ⋅ ⋅ ⋅, X n v.a.'s independientes, idénticamente distribuidas y de valor entero, y sea Sn = X1 + ⋅ ⋅ ⋅ + Xn. Entonces ϕ S (t) = (ϕ X (t) ) n , y n
1
consecuentemente por (16) fSn (k) =
1 2π
∫
π
-π
n
e -ikt ( ϕ X1 (t) ) dt.
(18)
181
La fórmula (18) es la base para casi todos los métodos en el análisis del comportamiento de fSn (k) para valores grandes de n, y en particular, la base para la demostración del Teorema Central del Límite "local" tratado en el Capítulo 7. También existe un resultado análogo al de (16) para v.a.'s continuas. Sea X una v.a.
ϕX(t) es integrable, esto es,
cuya función característica
∫
∞ -∞
| ϕ X (t) | dt < ∞ .
Puede
mostrarse que en este caso X es una v.a. continua que tiene una densidad f X dada por 1 2π
fX (x) =
∫
∞
-∞
e -ixt ϕX (t) dt.
(19)
Ejemplo 9. Sea X una v.a. normalmente distribuida con media 0 y varianza σ2. Mostraremos directamente que (19) es válida para tal v.a. Del Ejemplo 7, sabemos que X tiene función característica ϕ X (t) = e definición de función característica, e
-
σ2 t 2 2
-
σ2 2
t2
. Así, por la
x2
- 2 1 = e e 2σ dx. -∞ σ 2π
∫
∞
itx
Si reemplazamos t por -t, y σ por 1/σ en la fórmula anterior, tenemos que e
-
t2 2σ2
=
∞
∫
-∞
e
-itx
σ 2π
e
-
σ2 x2
dx,
2
o equivalentemente, 1
σ 2π
e
-
t2 2σ2
1 = 2π
∞
∫
-∞
e
-itx
e
-
σ2 x 2 2
dx.
Finalmente, si intercambiamos el papel de los símbolos x y t en la última ecuación, obtenemos x2
- 2 1 1 e 2σ = 2π σ 2π
∞
∫
-∞
e
-ixt
e
-
σ2 t2 2
dt,
lo cual concuerda exactamente, en este caso especial, con (19). Ahora supóngase que X denota cualquier v.a. Si Y es una v.a. que es independiente de X y que tiene distribución normal estándar, y si c denota una constante positiva. Entonces
X + cY tiene la función característica: ϕ X (t)e -
acotada en valor absoluto por 1 y e
c 2 t2 2
-
c2 t2 2
.
Puesto que
ϕX(t) es
es integrable, se sigue que X + cY tiene una
182
función característica integrable. En consecuencia, podemos aplicar (19) y X + cY es una v.a. continua cuya densidad está dada por 1 fX+cY (x) = 2π
∫
∞
-∞
e -itx ϕX (t)e
-
c2t2 2
dt.
Si integramos ambos lados de esta ecuación sobre a ≤ x ≤ b e intercambiamos el orden de integración, concluimos que 1 P(a ≤ X + cY ≤ b) = 2π 1 = 2π
c t ⎛ ∞ -itx ⎞ 2 ϕ e (t)e dt ⎜ ⎟⎟ dx ∫ a ⎜⎝ ∫ -∞ X ⎠ 2 2
b
∫ (∫ ∞
b
-∞
a
)
e -itx dx ϕ X (t)e
-
c 2t 2 2
dt
o bien 1 P(a ≤ X + cY ≤ b) = 2π
2 2
c t ⎛ e-ibt - e-iat ⎞ ∫ -∞ ⎜⎝ -it ⎟⎠ ϕX (t)e 2 dt .
∞
(20)
La importancia de la ecuación (20), es que ésta se cumple para una v.a. X arbitraria. El lado derecho de (20) depende de X sólo a través de ϕX(t). Usando este hecho y haciendo en (20) que c→0, se puede mostrar que la f.d. de X está determinada por su función característica. Este resultado es conocido como un "teorema de unicidad" y puede expresarse como sigue:
Teorema 1. Si dos v.a.'s tienen la misma función característica, ellas tienen la misma función de distribución.
Ejemplo 10. Use el teorema de unicidad para mostrar que la suma de dos v.a.'s independientes normalmente distribuidas tiene distribución normal. Sean X e Y
v.a.'s
independientes con distribución normal η(µ1, σ12) y η(µ2, σ22),
respectivamente. Entonces, ϕX (t) = e
iµ1t
ϕX+ Y (t) = ei(µ +µ 1
2)
t
⋅e
-
⋅e
σ12 t 2 2
ϕY (t) =e
, y
-(σ12 +σ 22 )
t2 2
iµ2 t
⋅e
-
σ22 t 2 2
. Por lo que,
.
Esto es, la función característica de X + Y es la misma que la función característica de una v.a. que tiene distribución normal con media µ1 + µ2 y varianza σ12 + σ22. Por el teorema de unicidad X + Y debe tener esa distribución normal. La aplicación más importante de la fórmula de inversión dada en (20) es su uso en la derivación del próximo resultado, el cual, básicamente es la demostración de la Ley Débil de los Números Grandes y el Teorema Central del Límite.
183
Teorema 2. Sean Xn con n ≥ 1 y X v.a.'s tales que lim ϕ Xn (t) = ϕ X (t) , para -∞ < t < ∞.
(21)
n→ ∞
Entonces lim FXn (x) = FX (x) , en todo punto x donde FX es continua.
(22)
n→∞
Este teorema afirma que la convergencia de funciones características implica la convergencia de las correspondientes funciones de distribución o, en otras palabras, que las funciones de distribución "dependen en forma continua" sobre sus funciones características. Por esta razón el Teorema 2 comúnmente es conocido como el "Teorema de Continuidad". La demostración de este teorema es complicada, no presentaremos los detalles de la demostración pero indicaremos brevemente algunas de las principales ideas de uno de los métodos de demostración. Primero elegimos una v.a. Y que tenga la distribución normal estándar independiente de cada una de las v.a.'s Xn, para n ≥ 1.
y sea
Sean a < b y c una constante positiva. Entonces por la fórmula de inversión dada en (20), 1 P(a ≤ Xn + cY ≤ b) = 2π
⎛ e-ibt -e-iat ⎞ ∫ -∞ ⎜⎝ -it ⎟⎠ ϕX (t)e-c t /2dt ∞
2 2
n
(23)
y 1 P(a ≤ X + cY ≤ b) = 2π
2 2
c t ⎛ e-ibt -e-iat ⎞ ∫ -∞ ⎜⎝ -it ⎟⎠ ϕX (t)e 2 dt
∞
(24)
Por la suposición de que ϕ X (t) → ϕ X (t) , cuando n→∞, y un teorema de la teoría de integración, se sigue que, el lado derecho de (23) converge al lado derecho de (24) cuando n→∞. Lo anterior implica que n
lim P(a ≤ Xn + cY ≤ b) = P(a ≤ X + cY ≤ b)
n→ ∞
(25)
Existen aún dos pasos más para concluir la demostración del teorema. Primero, uno debe mostrar (haciendo que a→ -∞ en (25)) que lim P( Xn + cY ≤ b) = P(X + cY ≤ b)
n→ ∞
(26)
Finalmente, debemos mostrar (haciendo que c→ 0 en (26)) que lim P(Xn ≤ b) = P(X ≤ b),
n→ ∞
siempre que P(X = b) = 0. Este último resultado es equivalente a la conclusión del teorema.
184
8.4 La Ley Débil de los Números Grandes y el Teorema Central del Límite
En esta sección usaremos el teorema de continuidad para probar los dos importantes teoremas en teoría de probabilidad expresados en el título de esta sección. Ambos teoremas fueron discutidos sin demostración en capítulos anteriores. Para probar estos teoremas se hace necesario, en principio, estudiar el comportamiento asintótico de la función log(ϕX(t)) para valores de t cercanos a 0. Sea z un número complejo tal que |z - 1| < 1. Se puede definir log(z) por medio de la serie de potencias (z - 1) 2 (z - 1) 3 + − ⋅⋅⋅ log(z) = (z - 1) − 2 3 (para |z - 1| ≥ 1 es necesaria otra definición de log(z)). Con esta definición tenemos las propiedades usuales: log(1) = 0, elog(z) = z, |z - 1| < 1, y si h(t) para a < t < b es una función diferenciable de valor complejo tal que |h(t) - 1| < 1, entonces d h' (t) log(h(t)) = . dt h(t) Sea X una v.a. con función característica ϕX(t). Esto es ϕX(t) es continua y ϕX(0) = 1. Así, log(ϕX(t)) está bien definida para valores de t cercanos a cero y log(ϕX(0)) = 0. Ahora supóngase que X tiene media finita µ. Entonces ϕX(t) es diferenciable y por (12), ϕX'(0) = iµ. De donde lim t →0
log(ϕ X (t))
t
= lim
log(ϕ X (t)) - log( ϕ X (0))
t-0
t →0
=
ϕ ' (0) d = iµ . log( ϕ X (t)) |t =0 = X ϕ X (0) dt
Como consecuencia de lo anterior se tiene que lim
log(ϕ X (t)) - iµt
t →0
t
=0.
(27)
Supóngase que X también tiene varianza σ2 finita. Entonces ϕX(t) es dos veces diferenciable y por (12)
ϕX''(0) = − E(X2) = − (µ2 + σ2). Ahora, podemos aplicar la regla de l'Hôspital para obtener
log(ϕ X (t)) - iµt = lim 2 t →0 t →0 t
lim
ϕ X ' (t) − iµ ϕ X (t) 2t
ϕ X ' (t) - iµ ϕ X (t) ϕ ' (t) - iµ ϕ X (t) = lim X . t →0 t →0 2tϕ X (t) 2t
= lim
185
Por una segunda aplicación de la regla de l'Hôspital vemos que log(ϕ X (t)) - iµt ϕ X ' ' (0) - iµϕ X ' (0) − (µ 2 + σ 2 ) − (iµ) 2 − µ 2 − σ 2 + µ 2 lim . = = = t →0 2 2 2 t2 En otras palabras lim
log( ϕ X (t)) - iµt
t →0
t2
=−
σ2 2
.
(28)
Teorema 3. (Ley Débil de los Números Grandes). Sean X1, X2, ⋅ ⋅ ⋅ v.a.'s independientes e idénticamente distribuidas con media finita µ y sea S n = X1 + ⋅ ⋅ ⋅ + Xn. Entonces, para cualquier ε > 0, ⎛ S ⎞ (29) lim P⎜⎜ n − µ > ε ⎟⎟ = 0. n→ ∞ n ⎝ ⎠ Sn X + ⋅ ⋅ ⋅ + Xn −µ = 1 − µ es e -iµt (ϕ X (t/n))n . Demostración: La función característica de 1 n n Supóngase que t esta fija. Entonces para n suficientemente grande, t/n suficientemente cercana a cero de tal forma que log ( ϕ X (t/n)) está bien definida y
está
1
{
}
e -iµt (ϕ X1 (t/n))n = exp n ⎡⎣log( ϕ X1 (t/n))-i µ(t/n) ⎤⎦ .
(30)
Enseguida afirmamos que lim n ⋅ ⎡⎣log(ϕX1 (t/n)) − iµ(t/n) ⎤⎦ = 0 .
n→ ∞
(31)
La Ecuación (31) es obvia para t = 0, puesto que, log(ϕ X1 (0)) = log(1) = 0. Si t ≠ 0 podemos escribir el lado izquierdo de (31) como log(ϕX (t/n)) - iµ(t/n) . n→∞ t/n
t ⋅ lim
Ya que t/n → 0 cuando n → ∞, por (27) el último límite es 0. Esto completa la demostración de (31). Siguiéndose de (30) y (31) que la función característica de Sn − µ , se aproxima a 1, cuando n → ∞. Ahora, la función constante 1 es la función n característica de una v.a. X tal que P(X = 0) = 1. Así, la f.d. de X está dada por
⎧0, si x < 0, FX(x) = ⎨ ⎩1, si x ≥ 0. Esta f.d. es continua casi dondequiera excepto en x = 0. Eligiendo ε > 0, por el teorema de continuidad,
186
⎛ Sn ⎞ − µ ≤ - ε ⎟ = FX (- ε) = 0 ⎝ n ⎠
lim P⎜
n→ ∞
y
(32)
⎛ Sn ⎞ − µ ≤ ε ⎟ = FX (ε) = 1 , lo cual lleva a ⎝ n ⎠
lim P⎜
n→ ∞
⎛ Sn ⎞ − µ > ε ⎟ = 0, que junto con ⎝ n ⎠
lim P⎜
n→ ∞
(32) implica que (29) se cumple. En el próximo teorema usamos, Φ(x), para denotar a la función de distribución normal estándar dada por
∫
Φ(x) =
x
-∞
2 1 e − y /2 dy, 2π
para -∞ < x < ∞ .
Recordando que esta función de distribución es continua en todos los valores de x.
X1, X2, ⋅ ⋅ ⋅ v.a.'s independientes e idénticamente distribuidas con media finita µ y varianza finita σ2. Entonces ⎛ S -nµ ⎞ lim P ⎜ n ≤ x ⎟ = Φ(x), para -∞ < x < ∞. n→ ∞ ⎝ σ n ⎠ S - nµ Demostración: Estableciendo S ∗n = n . Entonces para t fijo y n suficientemente grande, σ n
Teorema 4. (Teorema
Central del Límite). Sean
ϕS∗ (t) = e-inµt/σ n ϕS ( t/σ n ) n
n
=e
-inµt/σ n
n
⎡ϕX ( t/σ n )⎤ , ⎣ ⎦ 1
o bien
{
}
ϕS∗ (t) = exp n ⎡⎣log ( ϕ X (t/σ n) ) − iµ(t/σ n) ⎤⎦ . n
1
(33)
Ahora, afirmamos que 2
t lim n ⋅ ⎡log ( ϕX (t/σ n) ) − iµ(t/σ n) ⎤ = − . n→∞ ⎣ ⎦ 2 1
(34)
Si t = 0, entonces ambos lados de (34) son igual a cero y claramente (34) se cumple. Si t ≠ 0 podemos escribir el lado izquierdo de (34) como t2
lim
σ 2 n→ ∞
log[ϕ X1 (t/σ n )] − iµ(t/σ n )
(t/σ n ) 2
,
que por (28) es igual a t 2 ⎛ σ 2 ⎞ t2 ⎜− ⎟ = − . 2 σ 2 ⎜⎝ 2 ⎠⎟ Por lo que (34) se cumple para todo valor de t. Se sigue, por lo tanto, de (33) y (34) que
187
2
lim ϕ S∗ (t) = e − t /2 , para - ∞ < t
n →∞
n
<∞.
2
De acuerdo al Ejemplo 7, e − t /2 , es la función característica de una v.a. X que tiene f.d. normal estándar Φ(x). Así, por el Teorema de Continuidad, se concluye que lim P(S ∗n
n→ ∞
≤ x) = Φ(x), para - ∞ < t < ∞,
que es la conclusión deseada.
Ejercicios 1.- Si X está distribuida de forma uniforme sobre (a, b). Encontrar MX(t). 2.- Expresar la función generatriz de momentos para Y = a + bY en términos de MX(t) (aquí a y b son constantes). 3.- Si X tiene una distribución Poisson con parámetro λ. Use la función generatriz de momentos para encontrar la media y la varianza de X. 4.- Si X tiene una distribución binomial negativa con parámetros α y p. (a) Encontrar la función generatriz de momentos de X. (b) Use esta función generatriz de momentos para hallar la media y la varianza de X. 5.- Si X es una v.a. continua con densidad f X(x) = (1/2)e -|x|, para - ∞ < x < ∞. (a) Mostrar que MX(t) = 1/(1 - t 2), para -1 < t < 1. (b) Use esta función generatriz de momentos para encontrar una fórmula para E(X2n) (observe que todos los momentos de orden impar de X son cero). 6.- Si X tiene una distribución binomial con parámetros n y p. (a) Encontrar dMX(t)/dt y d2MX(t)/dt2. (b) Use (a) y la Fórmula 7 para calcular la media y la varianza de X. 7.- Si X1, . . ., X n son v.a.'s independientes e idénticamente distribuidas tal que M X (t) es finita para toda t. Use la función generatriz de momentos para probar que E(X1 + ⋅ ⋅ ⋅ + Xn)3 = nE(X12) + 3n(n - 1)E(X12)⋅E(X1) + n(n - 1)(n - 2)(E(X 1)3. d3 n Ayuda: Encontrar ( t ) ( ) M t =0 . X 1 dt 3 8.- Si X es una v.a. tal que M X(t) es finita para toda t. Use el mismo argumento que en la demostración de la desigualdad de Chevyshev para concluir que P(X ≥ x) ≤ e-txMX(t), para t > 0. De donde se sigue que P(X ≥ x) ≤ min e-txMX(t), 1
t ≥0
con la condición de que e-txMX(t), tenga un mínimo en 0 ≤ t < ∞. 9.- Si X tiene una distribución gama con parámetros α y λ. Usar el resultado del Ejercicio 8 para mostrar que P(X ≥ 2α/λ) ≤ (2/e)α. 10.- Si X tiene una distribución Poisson con parámetro λ. Encontrar ϕX(t). 11.- Si X tiene una distribución geométrica con parámetro p. Encontrar ϕX(t). 12.- Si X1, . . ., Xn son v.a.'s independientes que tienen distribución geométrica con parámetro p. Encontrar la función característica de X = X1 + . . . + X n.
188
13.- Si X1, . . ., X n son v.a.'s independientes que tienen distribución exponencial con parámetroλ. Encontrar la función característica de X = X1 + . . . + X n. 14.- Sea X una v.a. discreta cuyos posibles valores son enteros no negativos. ¿Qué relación debemos esperar se cumpla entre la función característica de X y la función generatriz de probabilidades de X (recuerde las Fórmulas (3) y (15))?. 15.- Sea X cualquier v.a.. (a) Mostrar que ϕX(t) = E(cos(tX)) + i ⋅E(sen(tX)). (b) Mostrar que ϕ- X(t) = E(cos(tX)) - i ⋅E(sen(tX)). (c) Mostrar que ϕ- X(t) = ϕX(-t). 16.- Si X es una v.a. simétrica, esto es, X y −X tienen la misma función de distribución. (a) Mostrar que E(sen(tX)) = 0 y que ϕX(t) es de valor real. (b) Mostrar que ϕX(-t) = ϕX(t). 17.- Sean X e Y v.a.'s independientes e idénticamente distribuidas. Mostrar que ϕX-Y(t) = |ϕX(t)|2. Ayuda: Use el Ejercicio 15. 18.- Sea X una v.a. tal que ϕX(t) es de valor real. (a) Mostrar que X y −X tienen la misma función característica (use el Ejercicio (15). (b) ¿Porqué se sigue de (a) que X y −X tienen la misma función de distribución? 19.- Si X es una v.a. continua que tiene la densidad f X(x) = (1/2)e -|x|, para -∞ < x < ∞. (a) Mostrar que ϕX(t) = 1/(1+t2). (b) Use (a) y la fórmula de inversión dada en (19) para concluir que ∞ -ixt 1 e-|x| = e dt . -∞ π(1+ t 2 ) (c) Mostrar usando (b) que ∞ ixt 1 e-|x| = e dt . -∞ π(1+ t 2 ) 20.- Sea X una v.a. que tiene densidad Cauchy 1 f X(x) = , para - ∞ < x < ∞ . π(1+ x 2 ) Mostrar que ϕX(t) = e -|t|, para -∞ < t < ∞. Ayud a: Intercambiar el papel de x y t en el Ejercicio 19. 21.- Sean X e Y v.a.'s independientes con densidad Cauchy. (a) Encontrar la función característica de X + Y, y de (X + Y)/2. (b) ¿Porqué se sigue que (X + Y)/2 también tiene densidad Cauchy? 22.- Extender el resultado del Ejercicio 21 para mostrar que si X1, X 2, ⋅ ⋅ ⋅, X n son v.a.'s independientes con densidad Cauchy, entonces (X1 + ⋅ ⋅ ⋅ +Xn)/n también tiene densidad Cauchy. 23.- Para λ > 0, sea Xλ una v.a. que tiene distribución Poisson con parámetro λ. (a) Use un argumento semejante al usado en la prueba del Teorema Central del Límite para mostrar que si -∞ < t < ∞, 2 lim E(e it(Xλ - λ )/ λ = lim exp[λ(e it/ λ − 1 − it/ λ )] = e -t /2 .
∫
∫
λ →∞
λ →∞
(b) ¿Qué conclusión debería seguirse de (a) por una modificación apropiada del Teorema de Continuidad?.
189