STATGRAPHICS – Rev. 4/25/2007 Análisis de Weibull
Resumen
El procedimiento del Análisis de Weibull está diseñado para ajustar una distribución de Weibull a un conjunto de n observaciones. Es comúnmente usado para analizar datos representando tiempos de vida o tiempos hasta que se presente error. Los datos pueden incluir censura en los cuales algunas veces los errores no son conocidos exactamente debido al desplazamiento de algunos objetos de la prueba. La distribución se grafica y los percentiles estimados son mostrados. Si se desea, se pueden especificar los datos para más de un grupo. En tales casos, una estimación aparte de la distribución para cada grupo será derivada.
StatFolio de Muestra: Weibull analysis.sgp Datos de Muestra: El archivo absorbers.sf3 contiene los datos de una prueba de vida sobre de n = 38 amortiguadores de choques, reportada por Meeker y Escobar (1998). Una parte de los datos se muestra abajo:
Distance Censores (Distancia) (Censurado) 6700 6950 7820 8790 9120 9660 9820 11310 11690 11850 11880 12140 … 28100
0 1 1 1 0 1 1 1 1 1 1 1 … 1
La columna Distance representa el número de kilómetros de uso de cada amortiguador cuando fue inspeccionado. La columna Censored contiene un 0 para cada amortiguador que había fallado en el momento de la inspección y un 1 para cada amortiguador que no falló. Todos los datos contienen información acerca del momento hasta se presentó una falla en los amortiguadores. Para aquellos que habían fallado, la observación es un momento de error verdadero. Para aquellos que no habían fallado, la observación es un error censurado a la derecha hasta el momento en cual el error conocido va a ser mayor que el valor indicado.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 1
STATGRAPHICS – Rev. 4/25/2007
Captura de Datos El cuadro de diálogo de captura de datos requiere información acerca de los momentos de los errores y su estado:
• Datos: columna numérica con los n momentos observados n veces. • Censurados:
columna numérica de 0´s y 1´s . Un 0 indica que la observación no está censurada y por lo tanto representa un momento verdadero hasta el momento en que se presenta el error. Un 1 indica que la observación está censurada a la derecha con el momento en que se presenta el error conocido solamente si es mayor a lo indicado.
• Selección: selección del subconjunto.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 2
STATGRAPHICS – Rev. 4/25/2007
Resumen del Análisis El Resumen del Análisis muestra una tabla que exhibe la distribución de Weibull ajustada:
Análisis Weibull - Distance Datos/Variable: Distance Censura: Censored Método de Estimación: máxima verosimilitud Tamaño de muestra = 38 Número de fallas = 11 Forma estimada = 3.16047 Escala estimada = 27718.7 Umbral especificado = 0.0
La distribución de Weibull de 3 parámetros tiene una función de densidad de probabilidad definida por:
f ( x) =
α
( x − θ )α −1 exp[− ( x − θ ) / β ]α
α
β
(1)
Tiene 3 parámetros: 1. Parámetro Forma α > 0 2. Parámetro Escala β > 0 3. Parámetro Inicio θ El rango de valores para la variable aleatoria X Weibull son:
E ( X ) = θ +
≥ θ. La media y la varianza de la distribución de
1 ⎞ Γ⎛ ⎜ ⎟ α ⎝ α ⎠
β
β 2
V ( X ) = α
(2)
[ ( ) ( )] 2Γ
2
α
1
1
α
α
− Γ
Frecuentemente el parámetro inicio 2 parámetros.
2
(3)
θ se fija en 0, lo que resulta en la distribución de Weibull de
La tabla del Resumen del Análisis muestra:
• Tamaño de muestra – el número total de observaciones n. • Número de fallas
– el número de observaciones que corresponden a los momentos de error no censurados.
• Forma y Escala Estimadas – las estimaciones de los parámetros de la forma y escala,
ˆ α
ˆ. y β
© 2006 por StatPoint, Inc.
Análisis de Weibull - 3
STATGRAPHICS – Rev. 4/25/2007
• Umbral especificado
- el valor del parámetro inicio. Dependiendo de las especificaciones en el cuadro de diálogo Opciones de Análisis, éste parámetro puede ser estimado de los datos o especificado por el usuario.
• Método de estimación
– el método usado para estimar los parámetros. El método predeterminado es de máxima verosimilitud el cual es el mismo método usado por los procedimientos de Ajuste de Distribución, sin embargo otros métodos pueden ser requeridos en el cuadro de diálogo Opciones de Análisis.
Opciones de Análisis El cuadro de diálogo Opciones de Análisis controla cómo los parámetros de la distribución de Weibull son estimados:
• Umbral Inferior: Especifica un valor para el parámetro inicio θ, o solicita que sea estimado de los datos. Si se estima θ, el usuario debe seleccionar el método de máxima verosimilitud. • Método de Estimación: el método usado para estimar los parámetros. Están disponibles tres opciones: 1. Regresión por Rangos – Ajusta una línea a los datos en la Gráfica de Weibull al regresar n valores ln(X i-θ ) contra los posiciones graficadas especificadas en el cuadro de diálogo. 2. Máxima Verosimilitud - Estima los parámetros maximizando la función de verosimilitud.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 4
STATGRAPHICS – Rev. 4/25/2007 3. Weibayes - Estima el parámetro de la escala suponiendo que los parámetros de inicio y forma son conocidos e igual a los valores indicados en el cuadro de diálogo.
• Posición en Gráfica
– define las posiciones de graficación verticales en la gráfica de Weibull. Esto también afecta los parámetros estimados si el método Regresión del Rango ha sido seleccionado. El método predeterminado es Kaplan-Meier Modificado . Ver la sección Cálculos para las definiciones de las diferentes opciones.
Gráfica de Weibull La Gráfica de Weibull muestra cómo los momentos de error no censurados graficados sobre una escala logarítmica en el eje horizontal X. Las posiciones de graficación del eje vertical se definen en las Opciones de Análisis.
Gráfica Weibull 99.9 99 90 o 70 d a 50 l u 30 m 20 u c a 10 e j 5 a
t n e c r o p
Est.: MLE Forma: 3.16047 Escala: 27718.7 Umbral: 0.0 Fallas: 11 Tamaño de muestra: 38
1 0.5 0.5 0.1 0.1 1000
10000 Distance
100000
Si los datos provienen de una distribución de Weibull, los puntos deben caer aproximadamente a lo largo de una línea recta sobre esta gráfica la cual corresponde a la distribución de Weibull ajustada.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 5
STATGRAPHICS – Rev. 4/25/2007
Cuadro de Opciones
• Intervalos de Confianza - añade intervalos de confianza al radio de verosimilitud para X p, el p-ésimo percentil de la distribución de Weibull.
• Percentil - calcula y muestra el seleccionado percentil. • Histograma de Valores Censurados
– añade un histograma de los valores de datos
censurados. Ejemplo: Gráfica mostrando Bandas de Confianza, 90
vo
Percentil, y el Histograma Censurado
Gráfica Weibull 99.9 99 90 o 70 d a 50 l u 30 m 20 u c a 10 e j 5
a t n e c r o p
90.0
Est.: MLE Forma: 3.16047 Escala: 27718.7 Umbral: 0.0 Fallas: 11 Tamaño de muestra: 38
1 0.5 0.5 36089.5 [29146.8,56446.6]
0.1 0.1 1000
© 2006 por StatPoint, Inc.
10000 Distance
100000
Análisis de Weibull - 6
STATGRAPHICS – Rev. 4/25/2007 El 90 percentil de Distancia es estimado para ser aproximadamente 36,090 km. Los límites de confianza del 95% se extienden sobre un rango de 29,147 km a 56,447 km, correspondientes a las bandas alrededor de la línea ajustada. vo
Histograma de Frecuencias El Histograma de Frecuencias muestra la distribución de las observaciones junto con la función de densidad estimada.
Distribución Weibull Ajustada 20 No Censurados Censurados
16 e j a t n e c r o p
12 8 4 0 1000
10000 Distance
100000
La presencia de muchos valores censurados causa que la curva se incline sobre la derecha del histograma observado.
Opciones del Cuadro de Diálogo
• Número de clases:
el número de intervalos dentro de los cuales los datos serán divididos. Los intervalos son adyacentes el uno al otro y de igual amplitrud (antes de que el logaritmo sea calculado). El número de intervalos dentro de los cuales los datos se agrupan de manera predeterminada es colocado por la regla especificada en la tabulación EDA del cuadro de diálogo Preferencias en el menú Edición.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 7
STATGRAPHICS – Rev. 4/25/2007
• Límite Inferior: límite inferior del primer intervalo. • Límite Superior: límite superior del último intervalo. • Mantener:
mantiene el número seleccionado de intervalos y límites aún si la fuente de los datos cambia. De manera predeterminada, el número de clases y los límites son recalculados en cuanto los datos cambian. Esto es necesario para que todas las observaciones sean mostradas aún si algún dato actualizado cae más allá de los límites originales.
• Número de Grupo: si más de un grupo de datos ha sido ajustado, el número del grupo será mostrado.
• Escala Log para el Eje X:
Si el eje horizontal debería ser mostrado usando escala
logarítmica.
Prueba de Bondad de Ajuste El cuadro Prueba de Bondad de Ajuste realiza hasta 7 diferentes pruebas para determinar si o no los datos podrían razonablemente provenir de una distribución de Weibull. Para todas las pruebas las hipótesis de interés son:
• Hipótesis Nula:
los datos son muestras independientes de la distribución de Weibull
estimada.
• Hipótesis Alternativa:
los datos no son muestras independientes de la distribución de
Weibull estimada. Las pruebas que se van a realizar son seleccionadas usando Opciones de Cuadro. Pruebas de Bondad-de-Ajuste para Distance D de Kolmogorov-Smirnov Modificada
Weibull D Forma Modificada Valor-P
0.0901357 0.568059 >=0.10
Pequeños P-Values (menores que 0.05 si se opera en un nivel de significancia de 5%) conducen a rechazar la distribución de Weibull. En el ejemplo actual, el P-Value es grande lo que sugiere que la distribución de Weibull es un modelo razonable para los datos. Las pruebas de Bondad de Ajuste son descritas con detalle para datos no censurados en la Datos no Censurados) y para datos censurados en documentación para Ajustes de Distribución ( Datos
Ajuste de la Distribución (Datos Censurados).
© 2006 por StatPoint, Inc.
Análisis de Weibull - 8
STATGRAPHICS – Rev. 4/25/2007
Opciones del Cuadro de Diálogo
• Incluir – selecciona las pruebas a ser incluidas. Las pruebas disponibles dependen del tipo de censura.
• Calcula la distribución para P-Values específicos
– si se verifica los P-Values estarán basados en las tablas o fórmulas específicamente desarrolladas para la distribución de Weibull. De otro modo, los P-values estarán basados en una tabla general o fórmula que se aplica para todas las distribuciones. El acercamiento general es más conservador (no rechazará una distribución tan fácilmente) pero puede ser preferido cuando se comparan PValues entre diferentes distribuciones.
• Censura – selecciona el tipo de datos censurados. Los tipos se definidos como: Aleatorio – indica que los valores de los datos han sido aleatoriamente censurados. El censuramiento aleatorio ocurre cuando los valores son censurados por varias razones y no caen en el mecanismo del Tipo I o II.
Tipo I – indica que los datos son “momento-censurados”, por ejemplo cuando se han removido datos de la prueba en un momento predeterminado. Si este tipo de censuramiento es seleccionado todos los valores censurados deben ser iguales o un mensaje de error será generado.
Tipo II – indica que la prueba fue parada después de que un predeterminado número de errores ha ocurrido. Si se selecciona este tipo de censuramiento, todos los valores censurados deben ser iguales o un mensaje de error será generado.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 9
STATGRAPHICS – Rev. 4/25/2007
Función de Densidad Esta grafica muestra la función de densidad de probabilidad estimada f(x): Distribución istr ibución Weibull (X 0.00001) 5 4 d a d i s n e d
3 2 1 0 1000
10000 Distance
100000
La función de densidad puede ser usada para determinar la probabilidad de que el momento de error de un suceso se encuentre dentro de un intervalo especificado.
Opciones del Cuadro de Diálogo
• Escala Log para el Eje X: si es seleccionado una escala log será usada para el eje horizontal.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 10
STATGRAPHICS – Rev. 4/25/2007
CDF La Función de Distribución Acumulada (CDF) muestra la probabilidad estimada de que un dato que ha fallado en el tiempo t : Distribución istr ibución Weibull 1 a d a l u m u c a d a d i l i b a b o r p
0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 1000
Se incrementa de 0.0 en
10000 Distance
100000
θ a 1.0 en valores grandes de X.
Función de Supervivencia La Función de Supervivencia grafica la probabilidad estimada de que un suceso sobrevivirá o durará hasta el tiempo t : Distribución istr ibución Weibull a i c n e v i v r e p u s e d d a d i l i b a b o r p
1 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0 1000
10000 Distance
100000
Decrece de 1.0 en θ a 0.0 en valores grandes de X.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 11
STATGRAPHICS – Rev. 4/25/2007
Función de Supervivencia Log La Función de Supervivencia Log es el logaritmo natural de la función de supervivencia: Distribución istr ibución Weibull 3 a i c n e v i v r e p u s g o l e d . b o r p
-7
-17 -17
-27 -27
-37 -37 1000
10000 Distance
100000
Función de Riesgo La Función de Riesgo es una estimación de la tasa instantánea de error:
Distribución istr ibución Weibull (X 0.0001) 15 12 o g s e i r
9 6 3 0 1000
10000 Distance
100000
Las unidades de la función de riesgo son la fracción de errores por unidad de tiempo. Si el ˆ < 1, la función de riesgo será monotéticamente decreciente. Si parámetro de forma estimado β ˆ > 1, la función de riesgo será monotéticamente creciente. Si β ˆ = 1, la función de riesgo será β constante.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 12
STATGRAPHICS – Rev. 4/25/2007
Áreas de las Colas Este cuadro muestra el valor de la distribución acumulada hasta para 5 valores de X. Areas de las Colas para Distance X Área Cola Inferior (<)
Área Cola Superior (>)
10000.0 20000.0 30000.0 40000.0 50000.0
0.960916 0.700142 0.276934 0.0412835 0.00157716
0.0390841 0.299858 0.723066 0.958716 0.998423
The table displays:
• Área de la Cola Inferior – la probabilidad de que la variable aleatoria sea menor que o igual a X.
• Área de la Cola Superior – la probabilidad de que la variable aleatoria sea mayor que X. Por ejemplo, la probabilidad de ser menor que o igual a X = 30,000 es aproximadamente 72.3%.
Opciones del Cuadro de Diálogo
• Valores Críticos: valores de X en los cuales la probabilidad acumulada será calculada.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 13
STATGRAPHICS – Rev. 4/25/2007
Valores Críticos Este cuadro calcula el valor de la variable aleatoria X debajo del cual yace una probabilidad especificada. Valores Críticos para Distance X Área Cola Inferior (<)
Área Cola Superior (>)
6466.15 13600.0 24683.6 36089.5 44939.6
0.99 0.9 0.5 0.1 0.01
0.01 0.1 0.5 0.9 0.99
La tabla muestra el valor de X tal que la probabilidad de ser menor que o igual a X es igual al área deseada de la cola. La tabla de arriba muestra que el c.d.f. de la distribución de Weibull ajustada es igual a 50% en X = 24,683.6.
Opciones de Cuadro
• Áreas de Colas:
valores del c.d.f. en los cuales se determinan los percentiles de las distribuciones ajustadas.
© 2006 por StatPoint, Inc.
Análisis de Weibull - 14
STATGRAPHICS – Rev. 4/25/2007 Cálculos
Estimación Usando el Método de Regresión del Rango Regresar ln(X i-θ ) versus las posiciones graficadas especificadas en Opciones de Análisis . Los parámetros de forma y escala son estimados a partir del intercepto y la pendiente de la línea ajustada de acuerdo con: 1
ˆ= α
(4)
slope ˆ = exp(intercept) β
(5)
Estimación Usando Método de Máxima Verosimilitud Las estimaciones son obtenidas por maximización numérica de la función de verosimilitud. n
L = ∏ l ( X i )
(6)
i =1
donde
⎧ f ( X i ) l ( X i ) = ⎨ ⎩1 − F ( X i )
si Xi es
uncensored right − censored
(7)
Estimación Usando Método de Weibayes Si no hay errores, el parámetro de escala es estimado por 1 / α
⎧ n α ⎫ − ( θ ) X ∑ i ⎪ ⎪⎪ i =1 ˆ =⎪ β ⎨ ⎬ ⎪ − ln(0.05) ⎪ ⎪⎩ ⎪⎭
El cual es una banda de confianza inferior del 95% para
⎡ n α ⎤ ⎢ ∑ ( X i − θ ) ⎥ ˆ = ⎢ i =1 ⎥ β d ⎢ ⎥ ⎥⎦ ⎢⎣
(8)
β.
De otra manera:
1 / α
(9)
donde d es el número de momentos de error no censurados.
Posiciones de Graficación: Rangos de Medias Los datos se ordenan del más pequeño al más grande y se asignan a un rango ajustado ji = ji-1 + Δ, donde Δ = 1 inicialmente y es modificado en cada momento censurado de acuerdo con:
© 2006 por StatPoint, Inc.
Análisis de Weibull - 15
STATGRAPHICS – Rev. 4/25/2007 (n+1) – rango ajustado del error previo Δ = --------------------------------------- --------------------------------------------------------------------------------------1 + número de observaciones más allá del dato censurado
(10)
Las posiciones de graficación están dadas por:
F i =
ji − 0.3 n + 0.4
(11)
Posiciones de Graficación: Rangos esperados Los datos se ordenan primero en orden inverso, por ejemplo, r 1 = n, …, r n = 1. Las estimaciones se calculan de la forma
⎡ r ⎤ Ri = ⎢ i ⎥ Ri −1 ⎣ r i + 1⎦
(12)
donde R0=1, y las posiciones de graficación son F i = (1- Ri).
Posiciones de Graficación: Kaplan-Meier Similar a los rangos esperados, excepto en
⎡ r − 1⎤ Ri = ⎢ i ⎥ Ri −1 ⎣ r i ⎦
(13)
Posiciones de Graficación: Kaplan-Meier Modificado Usando las estimaciones Kaplan-Meier
Ri'i =
Ri + Ri −1
(14)
2
donde R0=1, y las posiciones de graficación son F i = 1 − Ri'i .
Límites de Confianza Los límites de confianza son estimados sobre una base puntual al determinar todos los valores X = Q + θ para los cuales ~
~, β ) + 2 log L(α ˆ ) ≤ χ 2 ˆ , β Λ = −2 log L(α 1− p ,1
(15)
~ ~ y β ˆ son los estimadores de máxima verosimilitud, mientras que α ˆ y β dondeα donde α satisfacen las ecuaciones
r
~ − r ln(Q) + β
⎛ ( X i − θ ) ⎞ ⎟⎟ Q i =1 ⎠ n
∑ ln( X − θ ) + ln(1 − p)∑ ⎝ ⎜⎜ i
i∈S
© 2006 por StatPoint, Inc.
~ β
⎛ ( X i − θ ) ⎞ ⎟⎟ = 0 Q ⎝ ⎠
ln⎜⎜
(16)
Análisis de Weibull - 16
STATGRAPHICS – Rev. 4/25/2007 ~= α
Q ~ [− ln(1 − p)]1 / β
(17)
y S es el conjunto de momentos de error d .
© 2006 por StatPoint, Inc.
Análisis de Weibull - 17