DISTRIBUCIÓN GAMMA La distribución Gamma Es una distribución adecuada para modelizar el comportamiento de variables aleatorias continuas con asimetría positiva. Es decir, variables que presentan una mayor densidad de sucesos a la izquierda de la media que a la derecha. En su expresión se encuentran dos parámetros, siempre positivos, (α) y (β) de los que depende su forma y alcance por la derecha, y también la función Gamma Γ(α), responsable de la convergencia de la distribución. Los parámetros de la distribución El primer parámetro (α) situa la máxima intensidad de probabilidad y por este motivo en algunas fuentes se denomina “la forma” de la distribución: cuando se toman valores próximos a cero aparece entonces un dibujo muy similar al de la distribución exponencial. Cuando se toman valores más grandes de (α) el centro de la distribución se desplaza a la derecha y va apareceiendo la forma de una campana de Gauss con asimetría positiva. Es el segundo parámetro (β) el que determina la forma o alcance de esta asimetría positiva desplazando la densidad de probabilidad en la cola de la derecha. Para valores elevados de (β) la distribución acumula más densidad de probabilidad en el extremo derecho de la cola, alargando mucho su dibujo y dispersando la probabilidad a lo largo del plano. Al dispersar la probabilidad la altura máxima de densidad de probabilidad se va reduciendo; de aquí que se le denomine “escala”. Valores más pequeños de (β) conducen a una figura más simétrica y concentrada, con un pico de densidad de probabilidad más elevado. Una forma de interpretar (β) es “tiempo promedio entre ocurrencia de un suceso”. Relacionándose con el parámetro de la Poisson como β=1/λ. Alternativamente λ será el ratio de ocurrencia: λ=1/β. La expresión β-1 también será necesaria más adelante para poder llevar a cabo el desarrollo matemático. Relación con otras distribuciones Si se tiene un parámetro α de valores elevados y β pequeña, entonces la función Gamma converge con la distribución normal. De media μ = α * β, y varianza μ2 = α * β2. Cuando α =1 y β =0 la distribución Gamma es exactamente la distribución exponencial con parámetro α=1 Cuando la proporción entre parámetros es [α = ν2 , β = ν] entonces la variable aleatoria se distribuye como una Chi-cuadrado con grados de libertad. Si α=1, entonces se tiene la distribución exponencial negativa de parámetro λ=1/β.
Ventajas De esta forma, la distribución Gamma es una distribución flexible para modelizar las formas de la asimetría positiva, de las más concentradas y puntiagudas, a las más dispersas y achatadas. Como ejemplos de variables que se comportan así: - Número de individuos involucrados en accidentes de tráfico en el área urbana: es más habitual que la mayoría de partes abiertos den la proporción de 1 herido por vehículo, que otras proporciones superiores. - Altura a la que se inician las precipitaciones; sucede de forma más habitual precipitaciones iniciadas a una altura baja, que iniciadas a gran altitud. Tiempo o espacio necesarios para observar X sucesos que siguen una distribución de Poisson. - Distribución de la finura de fibras de lana: la mayoría presentan una menor finura que unas pocas fibras más gruesas. Inconvenientes Problemas en la complejidad de algunos cálculos, especialmente respecto a la función Gamma cuando el parámetro α es un valor no entero. También problemas de cálculo en la estimación de los parámetros muestrales. Ambos inconvenientes se pueden abordar satisfactoriamente con ordenador. Para valorar la evolución de la distribución al variar los parámetros se tienen los siguientes gráficos. Primero se comprueba que para α=1 la distribución tiene similitudes con la exponencial.
Si ahora se hace variar el parámetro alfa,
Y para valores altos de α y pequeños de β, se observa la convergencia con la normal,
Como ya se ha indicado, la expresión de la distribución Gamma incluye la propia función Gamma Г (α), que para valores enteros de alpha se ha demostrado que Г (α) = (α – 1)! En este caso la distribución Gamma se conoce como “distribución de Erlang”.
Para valores no enteros, el valor de la función Gamma se obtiene a partir de,
La función de densidad de la distribución Gamma es,
Donde x>0 y β,α son parámetros positivos. Se puede ver que para α=1 la función de densidad será,
Lo que significa que una distribución Gamma de parámetro α=1 y β =0 es una distribución exponencial de parámetro α=1. Se demuestra que f(x) es una función de densidad porque para f(x)≥0 y haciendo el cambio de variable h = 1β
La función de distribución es,
La función característica es, teniendo en cuenta de nuevo que h = 1β
Y volviendo a β=1/h,
La esperanza matemática será, siendo h = 1β
Volviendo a β; La varianza será, Donde otra vez h =
1β
Y volviendo a β;
Si se buscan estimadores de los parámetros de la distribución, el Método de Máxima Verosimilitud es el más adecuado ya que goza de más propiedades que el estimador obtenido por el método de los momentos (Chico, 2010). Sin embargo la máxima verosimilitud conduce a un sistema de ecuaciones que no se puede resolver de forma analítica, y se necesita recurrir al método numérico, por ejemplo de Newton-Raphson.
Distribución gamma continua A pesar de que la distribución normal puede resolver muchos problemas en ingeniería, hay otras situaciones que requieren de diferentes tipos de funciones de densidad. Funciones como éstas son la exponencial, la gamma, la Weibull, la beta, etc. Hay muchas situaciones en que la variable de interés, para el experimentador, pueda tener una distribución oblicua. Siendo así, entonces, una familia de funciones de probabilidad de densidad (pdf) que dan una amplia variedad de distribuciones sesgadas es la familia de distribuciones gamma. Como se dijo antes, la distribución gamma es un caso especial de la distribución exponencial. Las funciones exponenciales y la función gamma juegan un papel muy importante en la teoría de filas que esperan el orden de su llegada. La distribución gamma puede ser vista como una distribución gamma estandariza o como una distribución gamma no estandarizada. Si una variable aleatoria continua x tiene una distribución gamma, con parámetros α y β, entonces, para cualquier x > 0 la distribución acumulada de frecuencia (cdf) de x está dada por: P(X ≤ x) = F(x;α,β) = F(x/β;α) (5-18) Donde: α es el primer parámetro de forma que define la distribución gamma β es el parámetro de escala que define la distribución gamma (porque valores mayores que la comprimen o estiran la función de probabilidad de densidad (pdf) en la dirección de x); F(x/β;α) es una función de gamma incompleta. En la familia de distribuciones gamma una variable aleatoria continua X se dice que tiene una distribución gamma no estandarizada si la pdf de X es: f(x;α,β) = {1/ βα Г(α) xα-1 e-x/β x ≥ 0
(5-19)
O de otra manera Donde los parámetros α y β satisfacen α > 0 y β > 0 Si se pone β = 1 la expresión (5-19) se reduce a la forma de de la distribución gamma estándar descrita abajo. f (x;α) = 0xxα-1 e-x / Г(α) dx
x > 0 (5-20)
La función (5-20) se llama función de gamma incompleta, cuando no tiene el denominador con Г (α) en el integrador. Cuando se usan las funciones (5-19) y (5-20) la tarea se facilita usando la tabla de la distribución gamma, con valores de α = 1, 2, 3,…,10 y de x = 1, 2,…,15. El promedio y la varianza de la distribución gamma son, respectivamente:
Y
E(X) = μ = αβ V(X) = σ2 = αβ2
(5-21) (5-21a)
Figura 5.10. Gráficas con distribuciones gamma de densidad con diferentes valores de α y β y curvas de densidad gamma estándar. Nótese que cuando β = 1, es la curva exponencial. (Devore 2000). Ejemplo #29. Supóngase que se tiene una distribución gamma estándar con parámetro α = 3, calcular: (a) La probabilidad de que X esté entre 4 y 5. (b) La probabilidad de que X sea mayor que 4 Solución: Debido a que P(a ≤ X ≤ b) = F (b) – F(a) cuando X es continua, por lo tanto: (a) P (4 ≤ X ≤ 5) = F (5; 3) – F (4; 3) = 0.875 – 0.762 = 0.113 (b) P(X > 4) = 1 – P(X ≤ 4) = 1 – F (4,3) = 1 - .762 = 0.238 Ejemplo #30. Este problema involucra un experimento con conejillos de India seleccionados al azar. Este es un estudio relacionado con el tiempo X de supervivencia, en semanas. Los animales fueron expuestos a una radiación de 400 rads (dosis de radiación absorbida), es decir, de radiación gamma (energía radiante). Se asume que esta situación sigue a una distribución gamma con parámetros de escala de α = 10 y β = 20. Siendo así, hacer los siguientes cálculos: (a) Calcular la media de supervivencia y la varianza. (b) Calcular la probabilidad de que un conejillo sobreviva entre 80 y 120 días. (c) La probabilidad de que un animal sobreviva, cuando menos 20 días. Solución: Aquí usamos la distribución gamma no estandarizada. (a) El promedio es: E(X) = μ = αβ = (10) (20) = 200 días. La varianza es: V(X) = σ2 = αβ2 = (10) (20)22 = 4000 días.
(b) P(80 ≤ X ≤ 120) = F(120/20;10) – F(80/20;10) = F(6;10) – F(4;10) = 0.084 - 0.008 (de la tabla de la distribución de gamma) = 0.076 Esto dice que el valor de 0.076 es la probabilidad de que un conejillo sobreviva entre 80 y 120 días. (c) P(X ≥ 20) = 1 - P(X < 20) = 1 - F(20/20;10) = 0.000 (de la tabla de la distribución gamma) Distribución Weibull La distribución Weibull fue introducida por el físico sueco Waloddi Weibull en 1939. En forma análoga a las distribuciones gamma y exponencial la distribución de Weibull tiene aplicaciones relacionadas con tiempo de falla o longitud de vida. Es decir, para medir la confiabilidad de un componente o producto, como la probabilidad de que si funcionará apropiadamente, por cuando menos un tiempo especificado bajo condiciones experimentales especificadas. Esta función, igualmente, se usa en el diseño de sistemas complicados, cuya operación o seguridad depende de los varios componentes involucrados en el sistema. Por ejemplo, una columna de acero puede vencerse. Otra aplicación es el modelado de algún aparato sensible al calor que pueda fallar. Otra aplicación sería el estudio de componentes idénticos sujetos a condiciones ambientales idénticas, que puedan fallar a tiempos diferentes e impredecibles. La función de probabilidad de densidad (pdf) de la distribución Weibull es: f (x) = α xα-1 exp-(x/β)2 / βα , x>0 (5-22) Donde α y β son los parámetros condicionados a α > 0 y β > 0
Figura 5.11. Gráfica mostrando la curva de densidad de Weibull. Nótese que cuando α = 1 y β = 1, la curva se torna exponencial. (Devore, 2000) Proposición: La función de distribución acumulada (cdf) de una variable aleatoria que tiene parámetros α y β es: F(x;α,β) = {1 – exp-(x/β)α x≥0 (5-22a) Ejemplo #31. Supóngase que X tiene una distribución de Weibull con parámetros α = 20 y β = 100 (Devore, 2000). Entonces, calcular: (a) P(X ≤ 105) (b) P(98 ≤ X ≤ 102) Solución: (a) P(X ≤ 105) = F(105;20,100) = 1 – exp-(105/100)20 = 1 - .070 = .930 (b) P(98 ≤ X ≤ 102) = F(102;20,100) – F(98;20,100) = exp-(.98)20 – exp-(1.02)20 = .513 - .226 = .287
La distribución de Weibull La distribución de Weibull complementa a la distribución exponencial y a la normal, se usa cuando se sabe de antemano que una de ellas es la que mejor describe la distribución de fallos o cuando se han producido muchos fallos (al menos 10) y los tiempos correspondientes no se ajustan a una distribución más simple.
La distribución de Weibull nos permite estudiar cuál es la distribución de fallos de un componente clave de seguridad que pretendemos controlar y que a través de nuestro registro de fallos observamos que éstos varían a lo largo del tiempo y dentro de lo que se considera tiempo normal de uso.
La distribución de Weibull se representa normalmente por la función acumulativa de distribución de fallos F (t):
Siendo la función densidad de probabilidad:
La tasa de fallos para esta distribución es:
Las ecuaciones (1), (2) y (3) sólo se aplican para valores de (t - t 0) ≥ 0. Para valores de (t - t0) < 0, las funciones de densidad y la tasa de fallos valen 0. Las constantes que aparecen en las expresiones anteriores
tienen una interpretación física: •
t0 es el parámetro de posición (unidad de tiempos) 0 vida mínima y define el punto de partida u origen de la distribución.
•
η es el parámetro de escala, extensión de la distribución a lo largo, del eje de los tiempos. Cuando (t - t0) = η la fiabilidad viene dada por: R (t) = exp - (1)ß = 1/exp 1ß = 1 / 2,718 = 0,368 (36,8%) Entonces la constante representa también el tiempo, medido a partir de t0 = 0, según lo cual dado que F (t) = 1 - 0,368 = 0,632, el 63,2 % de la población se espera que falle, cualquiera que sea el valor de ß ya que como hemos visto su valor no influye en los cálculos realizados. Por esta razón también se le llama usualmente vida característica.
•
ß es el parámetro de forma y representa la pendiente de la recta describiendo el grado de variación de la tasa de fallos.
F(x)= F(x)= 1.4 1.2 1 0.8 0.6 0.4 0.2 1.9
1.8
1.7
1.6
1.5
1.4
1.3
1.2
1
1.1
0.9
0.8
0.7
0.6
x
0.5
0
Se trata de un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un mecanismo falla, etc. La función de densidad de este modelo viene dada por:
Que, como vemos, depende de dos parámetros: α > 0 y β > 0, donde α es un parámetro de escala y β es un parámetro de forma (lo que proporciona una gran flexibilidad a este modelo). La función de distribución se obtiene por la integración de la función de densidad y bale:
La función de densidad de una variable aleatoria con la distribución de
Weibull x es:[ Donde k > 0 es el parámetro de forma y λ > 0 es el parámetro de escala de la distribución. La distribución modela la distribución de fallos (en sistemas) cuando la tasa de fallos es proporcional a una potencia del tiempo: •
Un valor k<1 indica que la tasa de fallos decrece con el tiempo.
•
Cuando k=1, la tasa de fallos es constante en el tiempo.
•
Un valor k>1 indica que la tasa de fallos crece con el tiempo.
•
Propiedades Su función de distribución de probabilidad es:
Para x ≥ 0, siendo nula cuando x < 0. La tasa de fallos (hazard) es
La función generadora de momentos del logaritmo de la distribución de
La distribución de Weibull desplazada (a través de un parámetro adicional) también se encuentra en la literatura. Tiene función de densidad
Para y f(x; k, λ, θ) = 0 cuando x < θ, donde k > 0 es el parámetro de forma, λ > 0 es el parámetro de escala y θ, el de localización. Coincide con la habitual cuando θ=0. La distribución de Weibull puede caracterizarse como la distribución de una variable aleatoria X tal que
Sigue una distribución exponencial estándar de intensidad 1.[2] De hecho, la distribución de Weibull coincide con la exponencial de intensidad 1/λ cuando k = 1 y la de distribución de Rayleigh de moda cuando k = 2. La función de densidad de la distribución de Weibull cambia sustancialmente cuando k varía entre 0 y 3 y, en particular, cerca de x=0. Cuando k < 1 la densidad tiende a ∞ cuando x se aproxima a 0 y la densidad tiene forma de J. Cuando k = 1 la densidad tiene un valor finito en x=0. Cuando 12, la densidad y su pendiente son nulas en cero y la densidad es unimodal. Conforme k crece, la distribución de Weibull converge a una delta de Dirac soportada en x=λ. La distribución de Weibull también puede caracterizarse a través de la distribucion uniforme: si X es uniforme sobre (0,1), entonces sigue una distribución de Weibull de parámetros k y λ. Este resultado permite simular numéricamente la distribución de manera sencilla.
Graficas de la distribución de Wiebull
Función de densidad de probabilidad probabilidad
Parámetros
scale (real) shape (real)
Función de densidad de
Dominio
Función de densidad
Función de distribución
Media
Varianza
Coeficiente de simetría
si k > 1
Entropía
Función generadora de momentos
Función característica