Tiempo Medio Entre Fallas y Tiempo Medio Para Reparar Tiempo Medio Entre Fallas y Tiempo Medio Para Reparar son dos KPI importantes en el mantenimiento de planta. MTBF = (Tiempo total de funcionamiento) / (número de fallas) MTTR = (Tiempo total de inactividad) / (número de fallas)
¿Qué significan? "Tiempo Medio" significa, estadísticamente, el tiempo promedio. El "Tiempo Medio Entre Fallas" (MTBF) es literalmente el promedio de tiempo transcurrido entre una falla y la siguiente. Usualmente la gente lo considera como el tiempo tiempo promedio que algo funciona hasta que falla y necesita ser reparado (otra vez). El "Tiempo Medio Para Reparar" (MTTR) es el tiempo promedio que toma reparar algo después de una falla. Para algo que no puede ser reparado, el término correcto es "Tiempo Medio Para Falla" (MTTF). Algunos definirían el MTBF –para aparatos capaces de reparación- como la suma de MTTF más MTTR. (MTBF = MTTF + MTTR). En otras palabras, el tiempo medio entre fallas es el tiempo tiempo de una falla a otra. Esta distinción es importante si el tiempo tiempo de reparación (MTTR) es una fracción significativa del MTTF. Aquí hay un ejemplo. ejemplo. Un bombillo en un candelabro candelabro no es reparable, por lo que el MTTF es más apropiado. (El bombillo será sustituido). El MTTF podría ser 10,000 horas. Por otro lado, sin cambios de aceite, el motor de un automóvil puede fallar luego de 150 horas de conducción en carretera –ese es el MTTF. Asumiendo 6 horas para quitar y sustituir el motor (MTTR), (MTTR), el MTBF es 150 + 6 = 156 horas. Como los automóviles, la mayoría del equipo de fabricación será reparado, en lugar de sustituido después de una falla, por lo que el MTBF es la medida más apropiada.
¿Qué es una Falla? "Falla" puede tener múltiples significados. significados. Examinemos brevemente las "fallas" de un aparato. Una Fuente de Poder Ininterrumpida (UPS) puede tener cinco funciones bajo dos condiciones:
Cuando la energía principal está disponible: o
Permitir que la energía fluya desde la fuente principal a la máquina que está siendo protegida
o
Acondicionar la energía limitando limitando los picos de energía o bajones de voltaje
o
Almacenar energía en una bacteria, hasta la carga total de de la batería
Cuando la energía principal se interrumpe:
Proveer energía continua a la máquina que está siendo protegida
Emitir una señal para indicar que la energía principal está apagada
No hay duda de que el UPS ha fallado si impide que la energía principal f luya hacia la máquina que está siendo protegida (función 1). Fallas debidas a las funciones 2, 3 o 5 tal vez no sean obvias, porque la máquina "protegida" todavía está funcionando por la energía principal o por la batería. Incluso si lo notamos, estas fallan puede que no provoquen medidas correctivas inmediatas porque la máquina "protegida" sigue funcionando y puede que sea más importante mantenerla trabajando que reparar o sustituir el UPS.
¿Qué es Disponibilidad? La "disponibilidad" de un aparato es, matemáticamente, MTBF / (MTBF + MTTR) para el tiempo de trabajo programado. El automóvil del ejemplo anterior está disponible durante 150/156 = 96.2% del tiempo. La reparación es tiempo de inactividad no programado. Con un cambio de aceite de media hora no programado cada 50 horas – cuando un indicador del tablero alerta al conductor – la disponibilidad incrementaría a 50/50.5 = 99%. Si los cambios de aceite se programaran adecuadamente como una actividad de mantenimiento, entonces la disponibilidad sería 100%.
¿Por qué son importantes? La "disponibilidad" es un indicador clave de rendimiento en la fabricación, es parte de la medida de "Eficiencia General de Equipos" (OEE). Un programa de producción que incluye tiempo de inactividad para mantenimiento preventivo puede predecir con precisión la producción total. Los programas que ignoran el MTBF y el MTTR son simplemente futuros desastres esperando remedio.
Cómo calcular el MTBF actual El MTBF actual o histórico se calcula utilizando observaciones en el mundo real. (Existe una disciplina aparte para que los diseñadores de equipo pronostiquen el MTBF, basándose en los componentes y la carga de trabajo prevista). El cálculo del MTBF actual requiere de un c onjunto de observaciones, cada observación es:
Momento del tiempo de funcionamiento: el momento en el cual una máquina empieza a trabajar (inicialmente o después de una reparación) Momento del tiempo de inactividad: el momento en el cual una máquina falló después de trabajar a partir del momento de tiempo de funcionamiento previo
Por lo que cada Tiempo Entre Falla (TBF) es la diferencia entre una observación del Momento del tiempo de funcionamiento y el subsecuente momento del tiempo de inactividad. Se necesitan tres cantidades:
n = Número de observaciones.
ui = Este es el iésimo Momento del tiempo de funcionamiento di = Este es el iésimo Momento del tiempo de inactividad que sigue al iésimo Momento del tiempo de funcionamiento
Por lo que el MTBF = Sumatoria (di – ui)/ n , para todos los i = 1 durante n observaciones. Más sencillamente, es el tiempo de trabajo total dividido entre el número de fallas.
El cálculo de la Confiabilidad Claro, no basta con un solo índice para medir la gestión del mantenimiento. Para tener una visión más completa, se hace necesario analizar el índice de confiabilidad junto con la disponibilidad, la mantenibilidad, etcétera. Aún así, la metodología para llevar a cabo el cálculo de este índice no aparece con claridad en los textos especializados o se remiten al empleo de la distribución de Weibull — el cual es complejo por el cálculo de sus parámetros—; y he tenido la experiencia con asesores en la implementación de programas de mantenimiento, que éstos sólo se limitan al cálculo de variables como el MTBF (Tiempo Medio entre Fallas) y el MTTR (Tiempo Medio Para Reparación) como un indicativo de la confiabilidad y ninguna referencia directa al cálculo de ésta. Con base en lo anterior, el objetivo del presente artículo es desarrollar un método para el cálculo de este índice, con base en el MTBF y el MTTR y teniendo en cuenta los tres posibles arregles de los sistemas: Serie, Paralelo y Redundante, pues la confiabilidad se ve afectada de forma directa dependiendo del tipo de sistema. Es de aclarar que el método de cálculo de la confiabilidad que se presenta es un método discreto, en contraposición al método que emplea la distribución de Weibull, que es una distribución continua. El método se basa en la ecuación que presenta el Ingeniero Lourival Augusto Tavares para el cálculo de la confiabilidad [1]. Con respecto a esta ecuación, el ingeniero Augusto Tavares dice lo siguiente: “La fórmula indicada por Ud. (una de las cuatro que aparece en
mi libro)[1] es la más sencilla de utilizar y el valor, aún con un pequeño error (que no llega a perjudicar el análisis y la toma de decisiones) puede ser depurado cuando se utiliza los cálculos estadísticos, como los indicados por Ud. de la distribución de Weibull.[2]
2. LOS DATOS BASE Para que la confiabilidad calculada tenga una alta credibilidad, los datos con los cuales se efectúa el cálculo deben ser igualmente creíbles; y estos datos no son más que los registros de los paros de los activos. Es por ello que el registro de los paros debe hacerse de la manera más imparcial y objetiva posible. El registro de los paros implica: codificación y clasificación; esta última se puede subdividir en propios, ajenos y programados. Los paros propios son aquellos imputables al equipo. Los paros ajenos son paros no imputables al equipo pero que causan la parada del mismo. Por ejemplo, una falta de energía externa. Los paros programados son aquellos que están establecidos en el programa de mantenimiento anual. Dentro de la división anterior, es necesario clasificarlos por especialidad: Mantenimiento y Producción, ya que si se desea calcular la confiabilidad por mantenimiento únicamente, por ejemplo, sólo se deben tener en cuenta los paros imputables a éste. La codificación permite establecer rápidamente la falla que se imputará al activo sin ambigüedades.
3. DEFINICIÓN DE CONFIABILIDAD Para tener claro nuestro horizonte, en lo referente al cálculo, se debe tener claro qué es confiabilidad, para lo cual se puede definir de la siguiente manera: Es la probabilidad de que un sistema, activo o componente lleve a cabo su función adecuadamente durante un período bajo condiciones operacionales previamente definidas y constantes [2]. Como se deduce de esta definición, la confiabilidad es un dato estadístico, pues es una probabilidad la cual es determinada o calculada
a partir de la información de los registros de los paros. Como veremos más adelante, el cálculo de la confiabilidad — según el método que expongo — se basa en la definición clásica de Laplace de probabilidad. Otro aspecto importante de la definición anterior, es que la confiabilidad se puede aplicar a un sistema, a un activo o a un componente. Es en este punto donde se debe tener en cuenta si el sistema es en serie, en paralelo o redundante. Un activo, por ejemplo una volqueta, puede considerarse como un sistema en serie. Véase el ejemplo al final. Es importante resaltar, además, que la confiabilidad se determina para un determinado período de tiempo, el cual puede ser semanal, mensual, anual, etcétera, y bajo el contexto operacional en el cual opera el activo o el sistema. No es lo mismo, por ejemplo, una bomba que impulsa agua a otra bomba que impulsa una mezcla de caliza y agua. Aquí los contextos operacionales son diferentes e influye directamente en la operación del activo, aun si ambas bombas son iguales.
4. ECUACIÓN BÁSICA Como se mencionó en el numeral 1, la ecuación para el cálculo se basa en la expresión desarrollada por el ingeniero Lourival Tavares, en la cual la confiabilidad está en función del MTBF y el MTTR: (1)
Donde: R: Confiabilidad.
MTBF: Tiempo Medio Entre Fallas.
MTTR: Tiempo Medio Para Reparación.
Ahora veamos como se relacionan las tres variables de la ecuación (1): (2) [1] Como se observa en la ecuación (2), dicha expresión no es más que la definición de probabilidad según Laplace: Número de aciertos ( MTBF= tiempo total que funciona el activo sin fallar) sobre el número total de eventos (tiempo total que funciona el activo más el tiempo que estuvo parado para reparaciones). Esta es la ecuación básica para el cálculo de la confiabilidad. Ahora bien, ¿cómo se determinan el MTBF y el MTTR? Las ecuaciones son las siguientes.
(3)
(4) Donde. hT: Horas trabajadas o de marcha durante el período de evaluación. p: Número de paros durante el período de evaluación. hp: Horas de paro durante el período de avaluación. Es aquí donde se hace importante tener, de manera clara, la clasificación de los paros por mantenimiento o producción, pues si se quiere calcular la confiabilidad por mantenimiento, por ejemplo, las horas de paro y el número de paros deben ser los imputados a mantenimiento exclusivamente. 5. SISTEMA EN SERIE
Los sistemas en serie se caracterizan por que el funcionamiento de cada ítem que lo compone depende directamente del funcionamiento del componente que lo antecede y precede; es decir, si uno de l os componentes falla, falla todo el sistema. Véase la figura 1
La confiabilidad del sistema está dada por: (5) Donde Cf1, Cf2,....., Cfn son las confiabilidades de cada ítem. De la expresión anterior, se concluye que la confiabilidad del sistema es el producto de las confiabilidades individuales de sus componentes. Generalizando para n componentes:
(6)[3] Donde: RS: Confiabilidad del sistema. Rj: Confiabilidad del j-ésimo componente. Es el carácter multiplicativo de las confiabilidades que hace a este sistema tan sensible a las fallas. Dado que la confiabilidad de un sistema en serie es el producto de las confiabilidades de sus componentes, se puede concluir que: La confiabilidad total de un sistema en serie es menor que la confiabilidad de cualquiera de sus componentes.
6. SISTEMA EN PARALELO
Según Lour ival Tavares: “La confiabilidad final de un conjunto de equipos, será obtenida por la suma de los productos de las confiabilidades de cada ítem por sus capacidades de producción, dividido por la suma de las capacidades de producción de esos ítems” [4]. Véa se la figura 2.
Según la definición anterior, la confiabilidad de un sistema en paralelo está dada por:
(7)[1] Donde Cf1, Cf2,...., Cfn son las confiabilidades de cada uno de los equipos. Pr1, Pr2,...., Prn son las participaciones de cada uno de los eq uipos en la producción del sistema evaluado. Generalizando para n equipos en paralelo:
(8)
De la expresión anterior, se concluye que el paro de un equipo no implica el paro del sistema. Esta característica de los sistemas en paralelo se debe al carácter aditivo de las confiabilidades ponderadas con la producción de cada uno de ellos. Con respecto a la participación en la producción de cada uno los equipos involucrados, es válida la siguiente observación: No necesariamente la sumatoria de las participaciones debe ser 100% pues, por lo general, las líneas de producción son sobredimensionadas.
7. SISTEMA REDUNDANTE Se entiende por un sistema redundante, un sistema que permanece en stand bay (reserva) con el propósito de garantizar la operación normal del proceso. En la realidad, sistemas completos en reserva son poco comunes, por el costo que ello implica. Un ejemplo de ello lo constituye una planta donde se producen químicos letales para el ambiente y la vida en general. En este tipo de plantas se hace obligatorio tener un sistema de control de emisiones al ambiente en reserva por las implicaciones que se derivan de la emisión al ambiente de estos químicos. Lo que si es común, es tener equipos de reserva para garantizar la normal operación del proceso. Citando nuevamente a Lourival Tavares, un sistema redundante se puede definir como: “Cualquier elemento que tenga por un período el 100% de confiabilidad hace “1” a toda la ecuación. Ocurrida la falla, si la
conmutación es inmediata, la confiabilidad se mantendrá en el 100% hasta la siguiente falla de este elemento” [1]. Véase la figura 3.
Según la definición anterior, la confiabilidad de un sistema redundante está dada por: (9) Donde las variables tienen el mismo significado que en los casos anteriores. Generalizando para n equipos:
(10)[3] De la expresión anterior se puede concluir lo siguiente: La redundancia, que en la ecuación (10) es representada por el uno fuera de la productoria, garantiza una confiabilidad cercana al 100% al sistema productivo, siempre y cuando la conmutación (o el cambio al sistema en reserva) se haga inmediatamente. Dicha ecuación también nos dice que si al menos un componente del sistema tiene confiabilidad del 100%, todo el sistema alcanza una confiabilidad del 100%. Con respecto a los comentarios anteriores, es importante señalar que el sistema redundante no se menciona en la literatura técnica, y que la ecuación para su cálculo la toma para un sistema en paralelo. La fórmula para calcular la confiabilidad para un sistema en paralelo es un aporte importante del Ing. Lourival Tavares, la cual verifiqué con datos reales y la comparé con la ecuación que tradicionalmente se emplea para el sistema en paralelo, siendo la indicada por Tavares la que arrojó datos fiables.
8. EJEMPLO DE CÁLCULO Para el ejemplo que se da a continuación, se empleó el programa OptiMax del cual soy el autor. Este es un programa escrito en VBA (Visual Basic para Aplicaciones) y tiene como plataforma al software Microsoft Excel.
El programa calcula la confiabilidad con base en el MTBF y el MTTR, y para ello solicita los datos: horas de paros, horas trabajadas y número de paros para el período considerado. Estos datos son obtenidos por el programa a partir de los registros de paros que se llevan en el ERP de la compañía. Lo interesante de la interfaz de usuario de OptiMax es la representación, en diagramas de bloque, de los equipos y su sistema de alarma con base en colores, el cual, dependiendo de los valores de alarma de confiabilidad previamente definidos, éstos se indicarán por medio de los colores amarillo, verde y rojo. En la siguiente tabla se da el significado de los colores y los respectivos valores de alarma.
El ejemplo a analizar se muestra en la figura 4.
Como se observa en la Figura 4, se tienen tres equipos automotrices (Volquetas) los cuales forman el subsistema Transporte Materias Primas y están dispuestos en una serie en paralelo, pues no es redundante ya que trabajan al mismo tiempo; también se observa que cada equipo está dividido en secciones, cada una de ellas correspondiente a un sistema en que normalmente se dividen este tipo de equipos. Esta división forma un sistema en serie, es decir, cada equipo es un sistema en serie y el funcionamiento del conjunto (equipo) depende de cada una de ellas. Si una sección falla, falla todo el equipo. El valor dentro de cada bloque
representa la confiabilidad de cada uno de ellos, el cual es calculado por OptiMax con base en la ecuación fundamental. Continuando con el análisis, en el bloque Conf. Equipo (Confiabilidad Equipo) se indica el valor de la confiabilidad del equipo tomado en su conjunto. Este valor lo calcula el programa con base en la ecuación de un sistema en serie y está de acuerdo con el análisis efectuado en el numeral 5: La confiabilidad total de un sistema en serie es menor que la confiabilidad de cualquiera de sus componentes. Hay que tener en cuenta que el programa redondea los valores a cero decimales. Por último, el valor de confiabilidad del subsistema en su conjunto es el resultado de aplicar la ecuación para un sistema en paralelo, que para el ejemplo es del 41%. Ahora bien, ¿cómo interpretar estos valores? Dado que el período para el cual se calcularon estas confiabilidades es de un mes, las cifras se pueden interpretar de la siguiente manera: Si las condiciones operaciones (Contexto operacional) no cambian para el próximo mes, la probabilidad de que el activo llegue sin fallar al final del período es de 1%, 76% y 47% respectivamente. Lo anterior implica que para el subsistema Transporte Materias Primas la probabilidad de llegar final del período sin fallar es del 41%. La gráfica en sí nos está diciendo: El motor en el primer equipo y el chasis en el tercero son el problema y los que están afectando de forma directa la confiabilidad del subsistema en su conjunto; pero la situación más grave se presenta en el motor. Estas conclusiones son inmediatas gracias al sistema de alarma implementado en el programa OptiMax. Según lo anterior, los mayores esfuerzos se deben encaminar en mejorar la confiabilidad del motor sin olvidar la situación del chasis si se quiere aumentar la confiabilidad de todo el subsistema. Esta es otra de las ventajas de OptiMax: permite visualizar, de forma inmediata, cuales son los componentes problemas para concentrarnos en ellos y así reducir el abanico de posibilidades. Otra posibilidad de OptiMax: permite generar gráficas donde se muestra el comportamiento, mes a mes, de los equipos, los subsistemas o sistemas desde el punto de vista de confiabilidad. Véase la figura 5.
9. CONCLUSIONES
El método que se describe, es un método discreto y aproximado comparado con el método de la distribución de Weibull, y aunque se genera un pequeño error en los resultados, éste no impide llevar a cabo el análisis respectivo de la situación. El método facilita los cálculos para tener una idea del comportamiento de los activos desde el punto de vista de la confiabilidad y tomar acciones proactivas, preventivas y correctivas si fuere el caso. Aunque el método no permite hacer predicciones en cuanto a la confiabilidad, si facilita la toma de decisiones a futuro con base los resultado obtenidos. De los tres sistemas analizados, el sistema en serie es el menos confiable y el más confiable es el sistema redundante; el sistema en paralelo tiene una confiabilidad intermedia.
10. BIBLIOGRAFÍA [1] Tavares, Lourival. Mantenimiento y Confiabilidad, VI Congreso Internacional de Mantenimiento, 3 y 4 de junio de 2004, Bogotá, Colombia. [2] Huerta, Rosendo. Proceso de Análisis Integral de Disponibilidad y Confiabilidad como Soporte para el Mejoramiento Continuo de las Empresas. Reliability World 2006, junio 5 al 9 de 2006, Monterrey, México. [3] Gómez Martínez, Álvaro. Análisis y pronóstico de fallas en mantenimiento, 4 y 5 de diciembre de 2006, Bogotá, Colombia.
[1] Se refiere a su libro Manutenção Centrada no Negocio, escrito en portugués. [2] En comunicación personal, vía e-mail el 15 de marzo de 2008
¿Qué es el MTBF? El Tiempo Medio Entre Fallas conocido como MTBF, por sus siglas en inglés (Mean Time Between Failures), es un indicador que representa el tiempo promedio en el que un equipo funciona sin fallas, dicho de otra forma, el tiempo promedio que transcurre entre una falla y la siguiente.
Tiempo medio entre fallos
¿Qué es el MTTR? El Tiempo Medio Entre Reparaciones conocido como MTTR, por sus siglas en inglés (Mean Time Through Repair), es una medida que indica el tiempo estimado que un equipo estará parado mientras es reparado, dicho de ora forma, el tiempo promedio en que se efectúa una reparación. Tiempo medio gracias a la reparación