Notas para un curso de Probabilidad y Estad Estad´´ıstica Borradores: Variables aleatorias (e ( e) Ap´endice 29 de marzo de 2010
Las leyes f´ısicas deben tener la simplicidad y belleza de las matem´ aticas. (Paul Adrien Maurice Dirac)
1
´ Indice 1. Variables mixtas
2
1.1. Descomposici´ on de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Funciones generalizadas
2.1. 2.2. 2.3. 2.4.
5
Funciones generalizadas . . . . . . . . . . . Operaciones con funciones generalizadas . . Densidades de probabilidades generalizadas . “Unificaci´ on” de la definici´on de Esperanza .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3. Bibliograf´ıa consultada
1. 1.1.
2 4
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
5 6 7 9 10
Variables mixtas Descomposici´ on de Jordan
Sea X una variable aleatoria mixta y sea F (x) su funci´ on de distribuci´ on. Como X no es continua, el conjunto A = {a ∈ R : F (a) − F (a−) > 0 } es no vac´ıo. Como X no es discreta, p := a∈A P(X = a) ∈ (0, 1). Componentes de las variables mixtas.
1. Componente discreta. La funci´ on F d : 1 F d (x) := p
R
→ [0, 1] definida por
P(X = a)1{x ≥ a },
(1)
a∈A
denominada la componente discreta de F (x), tiene las siguientes propiedades: es creciente, continua a derecha, l´ımx→−∞ F d (x) = 0 y l´ımx→∞ F d (x) = 1.
Observando que la funci´ on pF d (x) = a∈A P(X = a)1{x ≥ a} es la suma de todos los saltos de F (x) es dable esperar que la diferencia F (x) − pF d (x) sea una funci´ o n no negativa, continua y creciente. Por otra parte, es claro que l´ımx→−∞ F (x) − pF d(x) = 0 y l´ımx→∞ F (x) − pF d (x) = 1 − p. 2. Componente continua. La funci´on F c : R → [0, 1] definida por F c (x) :=
1 (F (x) − pF d (x)) , 1 − p
(2)
denominada la componente continua de F (x), tiene las siguientes propiedades: es creciente, continua, l´ımx→−∞ F c (x) = 0 y l´ımx→∞ F c (x) = 1. Resumiendo, la funci´ on de distribuci´ on F (x) de una variable aleatoria mixta es una combinaci´ on convexa de su componente discreta F d (x) y su componente continua F c (x): F (x) = pF d (x) + (1 − p)F c (x). 2
(3)
o n de Jordan). Toda funci´ on de distribuci´ on es una comTeorema 1.1 (Descomposici´ binaci´ on convexa de una funci´ on de distribuci´ on discreta y una funci´ on de distribuci´ on continua. Tal descomposici´ on es unica. ´ Chung, K. L.: A Course in Probability Theory. Academic Press, San Diego. (2001). P´ aginas 8-10. Demostraci´ on.
La componente discreta de una funci´ on de distribuci´on F (x) se obtiene sumando todos sus saltos, a∈A P(X = a)1{x ≥ a}, y cambiando de escala para que la unidad de medida coincida con el peso total de los atomos, ´ p = P(X ∈ A). La componente continua de una funci´ on de distribuci´ on F (x) se obtiene rest´ andole todos sus saltos, F (x) − a∈A P(X = a)1{x ≥ a } y cambiando de escala para que la unidad de medida coincida con el peso restante, q = 1 − p. M´ etodo gr´ afico de descomposici´ on.
on de distribuci´ o n es Ejemplo 1.2. Sea X una variable aleatoria cuya funci´ F (x) =
2x + 5 8
1{−1 ≤ x < 1 } + 1{x ≥ 1 }
1 7/8
1/8
3/8
0
−1
1
x
Figura 1: Gr´afico de la funci´ on de distribuci´ on F (x): se observan saltos de alturas 3/8 y 1/8 en los puntos x = −1 y x = 1, respectivamente. El peso total de sus ´atomos es p = 3/8 + 1/8 = 1/2. Por lo tanto, su componente discreta es F d (x) = 2 38 1{x ≥ −1} + 18 1{x ≥ 1 } = 34 1{x ≥ −1} + 14 1{x ≥ 1 } La componente continua se obtiene observando que la suma total de los saltos puede expresarse en la forma pF d (x) = 38 1{−1 ≤ x < 1 } + 12 1{x ≥ 1 }. Restando los saltos y simplificando algunos t´erminos resulta
F (x) − pF d (x) =
x + 1 4
1 2
1{−1 ≤ x < 1 } + 1{x ≥ 1 }.
Finalmente, cambiando de escala se obtiene F c (x) =
3
x+1
2
1{−1 ≤ x < 1 } + 1{x ≥ 1 }.
1 3/4
0
−1
1/4
1
x
Figura 2: Gr´afico de la componente discreta de la funci´ on de distribuci´ on F (x).
1
−1
0
1
x
Figura 3: Gr´afico de la componente continua de la funci´ on de distribuci´ on F (x).
1.2.
Esperanza
La noci´ on de esperanza para variables mixtas se obtiene combinando las nociones anteriores. Sea X una variable aleatoria mixta y sea F (x) = pF d (x)+(1 − p)F c la descomposici´ on de Jordan de su funci´on de distribuci´ on en las componentes discreta y continua. Sabemos que existen una variable aleatoria discreta X d tal que F d (x) = P(X d ≤ x) y una variable aleatoria continua X c tal que F c (x) = P(X c ≤ x). La esperanza de X se puede definir como la combinaci´ on convexa de las esperanzas de las variables X d y X c : E[X ] := p E[X d] + (1 − p)E[X c ] Extendiendo la noci´ on a variables mixtas.
Definici´ o n 1.3 (Esperanza de una variable mixta). Sea X una variable aleatoria mixta
con funci´on de distribuci´on F (x) y sea F (x) = pF d (x) + (1 − p)F c la descomposici´on de Jordan de F (x) en sus componentes discreta y continua, respectivamente. La esperanza de X , denotada por E[X ], se define como la combinaci´ on convexa E[X ]
:= p E[X d] + (1 − p) E[X c ],
(4)
de las esperanzas de dos variables aleatorias, X d y X c , una discreta y otra continua, con funciones de distribuci´ on F d (x) y F c (x), respectivamente.
4
Sobre el c´ alculo de la esperanza de una variable mixta.
pE[X d ] = p
xP(X d = x) =
x∈A
Observando que
xP(X = x),
(5)
x∈A
∞
(1 − p)E[X c ] = (1 − p)
xf c (x)dx =
−∞
∞
xf (x)dx,
(6)
−∞
donde A = {x ∈ R : F (x) − F (x−) > 0 } es el conjunto de todos los a´tomos de F (x) y f (x) es una funci´on que coincide con la derivada de F (x) salvo en el siguiente conjunto de puntos aislados F c (x + h) − F c (x) ∃ l´ım A ∪ x ∈ R : h→0 h
,
(7)
se obtiene que la esperanza de X se puede calcular de la siguiente manera ∞
E[X ]
=
xP(X = x) +
xf (x)dx,
(8)
−∞
x∈A
donde f (x) es un funci´ on que coincide con la derivada de F (x) en los puntos donde ´esta derivada existe y vale cero en otro lado.
2. 2.1.
Funciones generalizadas Funciones generalizadas
Es c´omodo determinar la distribuci´ o n de masas a lo largo de una recta mediante su densidad. Sin embargo, si la recta tiene puntos con masas positivas, est´ a claro que la densidad de la distribuci´on no se puede describir como ninguna funci´ on “corriente”. Esta dificultad se puede superar ampliando el concepto de funci´ on, introduciendo las llamadas funciones generalizadas .1 La idea principal es la siguiente. Sea f una funci´on definida sobre la recta e integrable en cada intervalo finito. A cada funci´on φ terminal suave (φ se anula fuera de un intervalo finito y tiene derivadas continuas de todos los ordenes) se le puede asignar el n´ umero ∞
(f, φ) :=
f (x)φ(x)dx
(9)
−∞
(debido a la terminalidad de φ(x), la integral se toma, de hecho, respecto a un intervalo finito). En otras palabras, la funci´ on f se puede considerar como una funcional lineal definida sobre el espacio vectorial K de las funciones terminales suaves. Sin embargo, las funcionales de tipo (9) no son las u ´ nicas que se pueden definir en este espacio; por ejemplo, 1
Una exposici´on formalmente precisa sobre este tema puede consultarse en Kolmogorov, A. N., Fom´ın, S.V. (1975) Elementos de la teor´ıa de funciones y del an´ u. alisis funcional . Mir, Mosc´
5
asignando a cada funci´ on φ su valor en el punto x = 0, obtenemos una funcional lineal que no se puede representar en la forma (9). De esta manera las funciones f se incluyen en un conjunto m´ as amplio, el conjunto de todas las funcionales lineales sobre las funciones terminales suaves. Definici´ on 2.1. Se llama funci´ on generalizada (definida en la recta −∞ < x < ∞ ) a toda
funcional lineal definida sobre el espacio vectorial K. δ -funci´ on generalizada definida por on de Dirac Es la funci´ (δ, φ) := φ(0). En la teor´ıa de se˜ nales y circuitos esta funcional se la denomina funci´ on impulso o funci´ on impulsiva y se la representa en la forma ∞
δ (x)φ(x)dx = φ(0),
(10)
−∞
donde por δ (x) se entiende una “funci´ on” que es igual a cero en toda la recta, salvo en el origen donde ´esta se convierte en infinito de modo que su integral es igual a la unidad: δ (x) =
∞
si x = 0, si x = 0.
0 ∞
y
δ (x)dx = 1.
(11)
−∞
La relaci´ on (10) se denomina propiedad filtrante o propiedad selectiva de la se˜ nal . δ -funci´ on desplazada Sea (δ a , φ) := φ(a). De acuerdo con la notaci´ on (10), es natural representar esta funcional en la forma ∞
δ (x − a)φ(x)dx = φ(a).
(12)
−∞
2.2.
Operaciones con funciones generalizadas
Diremos que la sucesi´ on de funciones generalizadas f n converge a f , cuando para cada φ ∈ K se cumple la relaci´ on Paso al l´ımite.
(f n, φ) → (f, φ). La δ -funci´on se puede representar como l´ımite de las funciones llamadas impulsos rectangulares de ´ area 1 1 f ǫ (x) = 1 {−ε ≤ x ≤ ε } . 2ε 6
En efecto, usando el teorema del valor medio para integrales puede verse que para cada funci´on φ ∈ K y para cada ε > 0, existe xε ∈ [ −ε, ε] tal que ∞
1 (f ε , φ) = f ε (x)φ(x)dx = 2ε −∞
Como las funciones φ ∈
ε
φ(x)dx = φ(xε ).
−ε
continuas, l´ımε→0 φ(xǫ ) = φ(0). Por lo tanto,
K son
(f ε , φ) → (δ, φ). Consideramos primero una funcional de K definida mediante una funci´on f diferenciable (en el sentido cl´ asico): Diferenciaci´ on.
∞
(f, φ) =
f (x)φ(x)dx.
−∞
Es natural definir su derivada como la funcional dada mediante la f´ ormula ∞
′
(f , φ) =
f ′ (x)φ(x)dx.
−∞
Empleando la f´ormula de integraci´ o n por partes y teniendo en cuenta que toda funci´ on φ ∈ K se anula fuera de un intervalo finito, obtenemos ∞
′
(f , φ) =
∞
′
f (x)φ(x)dx = −
−∞
f (x)φ′ (x)dx;
−∞
de esta forma obtenemos una expresi´ on para f ′ en la que no figura la derivada de f . Estas consideraciones sugieren la siguiente definici´ on. on generalizada f a la funcional definida Definici´ on 2.2. Se llama derivada f ′ de la funci´ mediante la f´ ormula (f ′ , φ) = −(f, φ′ ). Directamente de la definici´ on de la derivada de una funci´on generalizada se deduce la validez de las proposiciones siguientes. 1. Toda funci´ on generalizada tiene derivadas de todos los ordenes. ´ 2. Si una sucesi´ on f n de funciones generalizadas converge a una funci´ on generalizada f (en el sentido de la definici´ on de convergencia de funciones generalizadas), la sucesi´ on f n′ de derivadas converge a la derivada f ′ . Esto equivale a que toda serie convergente compuesta por funciones generalizadas se puede derivar t´ermino a t´ermino cualquier cantidad de veces.
2.3.
Densidades de probabilidades generalizadas
Ejemplo 2.3 (Variable absolutamente continua). Sea X una variable aleatoria y sea F (x)
su funci´on de distribuci´ on. Si X es absolutamente continua y la derivada de F (x) es continua (o continua a trozos), entonces su derivada como funci´ on generalizada coincide con su derivada en el sentido habitual. 7
Ejemplo 2.4 (Masa puntual). La variable aleatoria que concentra toda la masa en el 0 tiene funci´on de distribuci´ on F (x) = 1 {x ≥ 0 }. Esta funci´ on, denominada la funci´ on salto
unidad o escal´ on unitario, define la funcional lineal ∞
(F, φ) =
φ(x)dx
0
De acuerdo con la definici´ on de la derivada de una funci´ on generalizada, tenemos ∞
′
′
(F , φ) = −(F, φ ) = −
φ′ (x)dx = φ(0)
0
(puesto que φ es igual a 0 en el infinito). Por consiguiente, la derivada de la funci´ on salto unidad es la δ - funci´ on : d 1{x ≥ 0 } = δ (x). dx 1
0
x
Figura 4: Gr´ afico de la funci´ on de distribuci´ on de la masa puntual en el 0: un escal´o n de salto 1 en el 0. o n de disEjemplo 2.5 (Caso mixto). Sea X una variable aleatoria y sea F (x) su funci´ tribuci´o n. Si en los puntos x1 , x2 , . . . la funci´on F (x) tiene saltos de alturas p1 , p2 , . . . respectivamente y es diferenciable en los dem´ as puntos (en el sentido cl´ asico) su derivada (como funci´ on generalizada) representa la suma de la derivada cl´ asica F ′ (en los puntos donde ´esta existe) m´ as la suma de tipo
pi δ xi (x).
i
o n de Definici´ o n 2.6 (Densidad generalizada). Sea X una variable aleatoria con funci´ distribuci´on F (x). La densidad de probabilidades generalizada de X , f (x), se define por f (x) := F ′ (x)1{x ∈
R
\ A} +
pa δ a (x),
(13)
a∈A
donde F ′ (x) es la derivada (cl´ asica) de F (x) en los puntos donde ´esta existe; A es el conjunto de todos los a´tomos de F y para cada a ∈ A, pa := P(X = a) = F (a) − F (a−). 8
Cuando, para calcular probabilidades, se utiliza la f´ormula f (x)dx para densidades con impulsos, debe tenerse el cuidado de incluir o excluir los impulsos en los puntos a y b: Nota Bene: Curva peligrosa. b a
b+
P(a
< X ≤ b) =
b+
P(a ≤ X ≤ b)
f (x)dx,
=
a+
< X < b) =
b−
P(a ≤ X
f (x)dx,
< b) =
a+
2.4.
f (x)dx
a−
b−
P(a
f (x)dx
a−
“Unificaci´ on” de la definici´ on de Esperanza
Las tres definiciones de esperanza para variables aleatorias discretas, continuas y mixtas que presentamos previamente se pueden unificar usando la noci´ o n de densidad de probabilidades generalizada definida en (13). Definici´ on 2.7 (Esperanza). Sea X una variable aleatoria con densidad de probabilidades
generalizada f (x). La esperanza de X , E[X ], se define por ∞
E[X ]
:=
xf (x)dx.
(14)
−∞
Observar que seg´ un la Definici´on 2.7: ∞
E[X ]
: =
xf (x)dx
−∞ ∞
=
x F ′ (x)1{x ∈
R
\ A} +
−∞ ∞
=
xF ′ (x)dx +
−∞ ∞
=
xF ′ (x)dx +
−∞
pa δ a (x) dx
a∈A
∞
pa
a∈A
xδ a(x)dx
−∞
aP(X = a).
a∈A
Este resultado coincide con la definici´ on que presentamos para el caso mixto. Si A = ∅, i.e., X es absolutamente continua, la sumatoria del lado derecho es 0 y recuperamos la definici´ on ′ presentada para el caso continuo. Si X es discreta, F (x) = 0 en R \ A, la integral del lado derecho se anula y recuperamos la definici´ on presentada para el caso discreto. on de distribuci´ on Ejemplo 2.8 (Caso mixto). Sea X una variable aleatoria cuya funci´ F (x) tiene el gr´afico que se muestra en la figura 5. El conjunto de saltos de F (x) es A = {−1/2, 1}. Esto significa que, en esos puntos X concentra cierta cantidad de masa. La cantidad de masa concentrada en cada punto est´a determinada por la longitud del salto de la funci´ on de distribuci´ on: 1 1 P (X = − 1/2) = F ( −1/2) − F ( −1/2−) = − 0 = , 4 4 1 1 = . P(X = 1) = F (1) − F (1 −) = 1 − 2 2 9
1 1/2 1/2 1/4
0
−1/2
1
x
Figura 5: Gr´afico de la funci´ on de distribuci´ on de X . En los puntos donde F (x) es continua, F (x) es derivable y vale que F ′ (x) =
1/2 − 1/4 1 1 {−1/2 < x < 1 } = 1 {−1/2 < x < 1 } . 1 − (−1/2) 6
De acuerdo con (13) la densidad de probabilidades generalizada de X es f (x) = 1{x ∈
R
\ A}F ′ (x) +
pa δ a (x)
a∈A
=
1 1 1 1 {−1/2 < x < 1 } + δ −1/2 (x) + δ 1 (x). 6 4 2
La esperanza de X se calcula del siguiente modo: ∞
∞
1 xf (x)dx = x 1 {−1/2 < x < 1 } dx + E[X ] = 6 −∞ −∞ 1 1 1 1 1 1 − (−1/2)2 3 = xdx − + = + = 6 −1/2 8 2 6 2 8
3.
1 1 · + 1 · 4 2 1 3 3 7 · + = . 6 8 8 16
−
1 2
Bibliograf´ıa consultada Para redactar estas notas se consultaron los siguientes libros:
1. Chung, K. L.: A Course in Probability Theory. Academic Press, San Diego. (2001) 2. Feller, W.: An introduction to Probability Theory and Its Applications. Vol. 2. John Wiley & Sons, New York. (1971) 3. Kolmogorov, A. N., Fom´ın, S.V.: Elementos de la teor´ıa de funciones y del an´ alisis funcional. Mir, Mosc´ u. (1975)
10