M A N U A L
DE
Co n f i a b i l i d a d ¡ De l as det enci ones al máxi mo t i empo de ut i l i zaci ón! Joh n D. Campbel l , Edi t or Líder Gl obal , Gest i ón de Act i vos Físi cos Pr i cew at er h ou seCoop er s LLP. Tr adu ci do al esp añ ol por MRQ Con su l t or es ( Ch i l e) . w w w . mr q. cl
M A N U A L
DE
Co n f i a b i l i d a d CONTENIDO INTRODUCCION
3
Confiabilidad: pasado, presente y futuro Por John D. Campbell Establece el marco de trabajo histórico y teórico del RCM (Mantenimiento basado en la confiabilidad confiabilidad))
22
¿Es RCM la herramienta correcta para usted?
5 La evolución de la confiabilidad Por Andrew K.S. Jardine El desarrollo de RCM como un enfoque viable de mantenimiento
CAPÍTULO DOS
7 Haga un inventario de su operación Por Leonard Middleton y Ben Stevens Medir y comparar (“benchmarking”) la confiabilidad de su planta ♦ ♦ ♦
♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦
Los beneficios del benchmarking ¿Que debería medir? Relacione el desempeño de mantenimiento con los objetivos del negocio Negocios con exceso de capacidad (limitaciones de costos) Negocios limitados limitados por capacidad Cumplimiento de requerimientos ¿Cuan efectivo es su desempeño? Las conclusiones y el compartir los resultados Fuentes externas de datos Buscar datos secundarios Consideraciones generales del benchmarking Benchmarking interno Benchmarking a nivel de industria Benchmarking con industrias comparables
CAPÍTULO TRES
♦
Por Jim V. Picknell Determine sus confiabilidad ♦ ♦ ♦
CAPÌTULO UNO
♦
♦ ♦ ♦ ♦ ♦ ♦ ♦
necesidades
de
Los 7 pasos del proceso RCM El “producto” del RCM ¿Qué puede lograr el RCM? ¿Qué se necesita para aplicar RCM? ¿Cuánto va a costar? Razones para el fracaso del RCM Las “versiones” del RCM RCM dirigido por capacidad ¿Cómo se decide? La lista de verificación de decisiones del RCM
CAPÍTULO CUATRO
39 El problema de la incertidumbre Por Murray Wiseman Que hacer cuando sus planes de confiabilidad confiabilida d no se ven muy confiables ♦ ♦ ♦ ♦ ♦ ♦
Las cuatro funciones básicas Resumen Distribuciones Típicas Un ejemplo Consideraciones de la vida real – el problema de los datos Datos censurados o suspensiones
CAPÍTULO CINCO
♦
Políticas de reemplazo por edad Cuando usar reemplazo por bloque sobre el reemplazo por edad Definir políticas de mantenimiento basadas en el tiempo
CAPÍTULO SEIS
54
Optimizar sintomático
el
mantenimiento
Por Murray Wiseman Aprovechar el equipo al máximo antes de una reparación ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦
Primer paso: Preparar la información Datos de eventos e inspecciones Una muestra de datos de inspección Gráficos cruzados Limpiar los datos Transformaciones de datos Segundo paso: Construir modelo de riesgo proporcional (PHM) Tercer paso: Probar el PHM Cuarto paso: El modelo probabilístico de transición Discusión sobre la probabilidad de transición Quinto paso: La decisión óptima Sexto paso: Análisis de sensibilidad Conclusión
47
APÉNDICE
Por Andrew K.S. Jardine
Navegar la red en búsqueda de información de confiabilidad
Optimizar mantenimiento basado en tiempo Las herramientas para formular una estrategia de reemplazos para sus componentes críticos ♦ ♦ ♦ ♦
Aumentar la confiabilidad vía el reemplazo preventivo Políticas de reemplazo por bloque Formulación del problema Resultado
69
Por Paul Challen ¿Está buscando páginas útiles Internet? Aquí tiene tiene donde empezar ♦ ♦ ♦ ♦
Centro de Análisis Confiabilidad Libros y material impreso Organizaciones profesionales Información general
en
de
Una Palabra de Para bien o para mal, la industria minera es una industria intensiva en bienes de capital, donde parte muy significativa de su potencial rentabilidad depende de la disponibilidad y utilización extraída de sus activos físicos físicos o equipos. No deja de sorprender así la tradicional poca atención prestada en la industria al tema del mantenimiento de esos activos – actividad que típicamente involucra alrededor de un tercio de la dotación y entre 35-40% de los gastos operativos de la empresa. Aún más, si consideramos el costo costo asociado a las pérdidas de producción producción resultantes de interrupciones operacionales por falla de equipos en terreno, vemos rápidamente que este es un tema trascendental y estratégico para una industria sumergida en una competitividad global con productos sometidos a constantes constantes presiones de precios. Por estos motivos, John Campbell y su equipo de expertos en el Centro de Excelencia en Mantenimiento de PricewaterhouseCoopers en Toronto han hecho el esfuerzo de generar una guía resumida y ágil sobre las principales tendencias de punta en tecnología de mantenimiento, tendencias aplicadas y probadas en diversas industrias que comparten la dependencia crítica de servicio de activos que caracteriza a la industria minera. Esta guía se centra particularmente en el tema de confiabilidad de equipos, o lo que termina siendo lo mismo, en el aseguramiento de la continuidad operativa, vía el enfoque de Mantenimiento Basado en Confiabilidad, más típicamente típicamente conocido por sus siglas en en inglés RCM. El objetivo es proveer a los lectores con información reciente y directa acerca del tema RCM, en conjunto con algunos TIPS que pudieran necesitar para poner esta información en práctica. Lo que verán en las próximas páginas representa lo último en investigación investigación de confiabilidad e implantación de técnicas técnicas proveniente de una firma q ue es una de las proveedoras líderes de este tipo de información a prof esionales de planta alrededor de todo el mundo. ¡Esperamos que la disfruten y la usen bien! –
Sobre los autores: JOHN D. CAMPBELL
es socio de PricewaterhouseCoopers y director de la práctica de consultoría en gestión de mantenimiento de la firma. Especialista en en mantenimiento y gestión de materiales, materiales, tiene más de veinte años de experiencia mundial en lo que es evaluación/implantación de estrategia, gestión y sistemas para el mantenimiento, los materiales y funciones de ciclo de vida de los activos físicos. Escribió los libros: El Máximo tiempo de utilización: Estrategias para la Excelencia de Gestión de Mantenimiento Mantenimiento (1955), y es coautor de Planificación y Control de Sistemas de Mantenimiento: Modelo y Análisis (1999) . Lo pueden contactar el 416-941-8448, o por correo electrónico a
[email protected] .
ANDREW JARDINE
es profesor en el Departamento de Ingeniería Mecánica e Industrial en la Universidad de Toronto e investigador principal en el Laboratorio de Mantenimiento Basado en la Condición del Departamento donde ha sido desarrollado el software EXAKT. También actúa como consultor senior senior asociado en el Centro Internacional de Excelencia de Gestión de Mantenimiento de PricewaterhouseCoopers. El Dr. Jardine escribió escribió Mantenimiento, Reemplazo y Confiabilidad Confiabilidad , publicado por el libro Mantenimiento, primera vez en 1973 y actualmente en en su sexta edición. Lo pueden contactar al 416-869-1190 anexo 2475 a al correo electrónico
[email protected] .
JAMES PICKNELL
es gerente en el Centro de Excelencia Excelencia de Consultoría de Gestión de Mantenimiento. Tiene mas de 21 años de experiencia en ingeniería y mantenimiento incluyendo consultoría internacional en gestión de mantenimiento de planta e instalaciones, desarrollo e implantación de estrategias, ingeniería de confiabilidad, gestión de inventario de repuestos, costeo y análisis de ciclo de vida de activos, benchmarking para mejores prácticas, rediseño de procesos de mantenimiento e implantación de Sistemas Computarizados de Gestión de Mantenimiento (CMMS). Lo pueden ubicar en el 416-941-8360 o al correo electrónico
[email protected] .
LEN MIDDLETON
es gerente en la práctica de consultoría de gestión de activos activos físicos. Tiene más de veinte años de experiencia profesional en una variedad de industrias, incluyendo práctica independiente en gestión de proyectos y servicios de ingeniería. ingeniería. Su experiencia incluye incluye una variedad de proyectos técnicos en plantas de manufactura y en talleres de reparación, y proyectos que involucran la introducción de nuevos productos a una planta operativa operativa existente. Lo pueden contactar en el 416-941-8383, anexo 62893 o al correo
[email protected].. electrónico
[email protected]
BEN STEVENS
es gerente del Centro de Excelencia de Consultoría de Gestión de Mantenimiento. Tiene más de 30 años de experiencia incluyendo los últimos doce dedicados al marketing, ventas, desarrollo, justificación e implantación de Sistemas Computarizados Computarizados de Gestión Gestión de Mantenimiento. Mantenimiento. Su experiencia previa incluye el desarrollo, construcción e implantación de sistemas de monitoreo de producción, gestión gerencial de mantenimiento, finanzas, funciones administrativas, y gestión de reingeniería para un importante banco canadiense. Lo pueden ubicar en el 416-941-8383 o al
[email protected].. correo electrónico
[email protected]
MURRAY
WISEMAN
es gerente de PricewaterhouseCoopers y ha estado en el área de mantenimiento por más de 18 años. Ha sido ingeniero de mantenimiento en una fundición de aluminio, y superintendente de mantenimiento en una importante cervecería. También fundó un laboratorio de análisis de aceite donde desarrollo un sistema en red de Análisis de Criticidad de Modos de Falla y sus Efectos, incorporando un sistema experto y conexiones a dos bases de datos de tasa de falla/distribución de modos en el Centro de Análisis de Confiabilidad. Lo pueden contactar al 416-815-5170 o al
[email protected].. correo electrónico
[email protected]
Introducción
Confiabilidad: pasado, presente y futuro Establecer el marco de trabajo histórico y teórico del RCM (Mantenimiento basado en la Confiabilidad) Por John D. Campbell Hace no mucho tiempo atrás, el diseño del equipamiento y de los ciclos de producción creaban un ambiente en el cual el mantenimiento del equipo era relativamente secundario al mantener la operación continua entre eventuales fallas del equipo. Hoy en día, sin embargo, el sintomático y el avance del Mantenimiento Basado en la Confiabilidad han cambiado las reglas del juego. En el comienzo de este nuevo milenio, es lógico que enfoquemos una discusión acerca del mantenimiento. Hace medio milenio, Galileo descubrió que la tierra orbitaba alrededor del sol. Hace mil años, el diseño de ruedas eficientes para girar en torno al eje de carrozas era de alta sofisticación. Cuatro mil años atrás, el telar era la última maravilla de la ingeniería. Un poco más recientemente, hemos visto una evolución substancial de la gestión de mantenimiento con el pasar del último siglo. La función de mantenimiento no estaba ni siquiera contemplada por los primeros diseñadores de equipo, probablemente debido a la poco compleja y robusta naturaleza de la maquinaría. Pero a medida que hemos adoptado la obsolescencia incorporada, hemos visto una evolución desde el mantenimiento planificado y preventivo en la Segunda Guerra Mundial, al sintomático, la computarización y la gestión del ciclo de vida en los noventas. Hoy, la evolución de características del equipo está dictando prácticas de mantenimiento con tácticas predominantes, pasando desde correr-a-la-falla a la prevención y ahora a la predicción. ¡Hemos recorrido un largo camino! La gestión de confiabilidad es muchas veces mal entendida. La confiabilidad es muy específica es el proceso de administrar el tiempo entre fallas. Si la disponibilidad es una medida del tiempo en marcha del equipo, o a la inversa, la duración de las detenciones, la confiabilidad puede entenderse como una medida de la frecuencia de las detenciones. Veamos un ejemplo. En el caso 1, su máquina de moldaje por inyección está detenida por un trabajo de reparación de 24 horas en el medio de lo que se suponía iba a ser una sólida corrida de 5 días. Por ende, su disponibilidad es de 80 por ciento ((120 hrs – 24hrs) / 120hrs). La confiabilidad de la máquina es de 96 horas (96 horas / 1 falla). En el caso 2, su máquina se detuvo 24 veces por una hora cada vez. Su disponibilidad sigue siendo del 80% ((120hrs – 24hrs) / 120hrs), pero ¡Su confiabilidad es de sólo cuatro horas (96hrs / 24fallas)! Ambas medidas, sin embargo, están íntimamente relacionadas: Disponibilidad =
Confiabilidad . Confiabilidad + Mantenibilidad
donde la mantenibilidad es el tiempo promedio de reparación. Uno de los enfoques más robustos para administrar la confiabilidad es adoptar el Mantenimiento Basado en la Confiabilidad. El recientemente liberado estándar SAE para RCM es un buen lugar para comenzar a ver si uno está listo para adoptar esta metodología. A pesar de que el SAE define el RCM como “un proceso lógico y técnico... para alcanzar la confiabilidad de diseño,” esto requiere del insumo de todos los involucrados con el equipo para hacer que el programa de mantenimiento resultante funcione. Aún así estamos manejando un gran nivel de incertidumbre.
Lidiar con la incertidumbre en el equipo es de alguna forma como tratar con personas. Si por las últimas tres generaciones sus antepasados han vivido hasta la edad de 95, existe una gran posibilidad de que Ud. también lo haga. Hay sin embargo una cantidad de eventos fortuitos que podrían ocurrir entre ahora y ese entonces, y que modificarían la expectativa. A pesar de este azar que enfrentamos, podemos hacer uso de las estadísticas para que nos ayuden a saber qué tareas realizar (y no realizar) y cuando realizarlas para maximizar la duración de nuestras vidas. Haga ejercicio tres veces a la semana y no fume – y análogamente haga monitoreo de vibraciones mensualmente y no un “overhaul” anual. Cuando integramos el costo a esta ecuación, comenzamos a entrar al reino de la optimización. Para esto, existen varias técnicas de modelamiento que han probado ser útiles para balancear el correr-a-lafalla, el reemplazo basado en el tiempo y el mantenimiento sintomático. Nuestro objetivo es minimizar costos y maximizar la disponibilidad y la confiabilidad. Nuestro equipo de Gestión de Activos Físicos en PricewaterhouseCoopers se complace en entregarles esta introducción a la gestión de confiabilidad y la optimización del mantenimiento. Si usted está interesado en una discusión más a fondo en estos temas, asegúrese de leer nuestro nuevo libro: Excelencia en el Mantenimiento: Optimizando Decisiones del Ciclo de Vida del Equipo , publicado por Marcel Dekker, Nueva York (Primavera 2000).
capítulo uno
La Evolución de la Confiabilidad El desarrollo de RCM como un enfoque viable de mantenimiento Por Andrew K.S. Jardine Las matemáticas y la ingeniería de confiabilidad se desarrollaron realmente durante la Segunda Guerra Mundial, como parte del diseño, desarrollo y uso de misiles. Durante este período, el concepto de que una cadena era sólo tan fuerte como el más débil de sus eslabones claramente no aplicaba a sistemas que sólo funcionaban correctamente si primero funcionaba un número de subsistemas. Esto resultó en “la ley de producto para sistemas en serie,” la cual demuestra que un sistema altamente confiable requiere de subsistemas altamente confiables. Para ilustrar esto, considere un sistema que consta de tres subsistemas (A, B y C) que deben trabajar en serie para que el sistema completo funcione (como ilustrado en figura n° 1).
Entrada
Subsistema A
Subsistema B
Subsistema C
salida
Figura 1: Confiabilidad de sistemas en serie En este sistema, donde los subsistemas tienen valores de confiabilidad de 97%, 95% y 98% respectivamente, el sistema completo tiene una confiabilidad de 90% (se obtiene de 0.97 x 0.95 x 0.98). No es de 95% como indicaría la teoría del eslabón más débil. Claramente, para sistemas realmente sofisticados donde la configuración de diseño es dramáticamente más compleja que la de la figura 1, el cálculo de la confiabilidad del sistema es asimismo más complejo. Hacia finales de la década de los cuarentas, los esfuerzos para mejorar la confiabilidad de sistemas se enfocaron a mejorar la ingeniería de diseño, usando materiales más fuertes y superficies más duras y de desgaste más parejo. Por ejemplo, General Motors extendió la vida útil de motores a tracción usados en locomotoras, de 250,000 millas a 1,000,000 de millas, mediante el uso de mejor aislamiento, pruebas de altas temperaturas, y rodamientos cónicos mejorados. En los años cincuenta, hubo un extenso desarrollo de las matemáticas de la confiabilidad por parte de los especialistas en estadística, con el Departamento de Defensa de EEUU coordinando el análisis de confiabilidad de sistemas electrónicos por medio del establecimiento del AGREE (Grupo Consultor de la Confiabilidad del Equipo Electrónico). La década de los sesenta vivió un gran interés en las aplicaciones aerospaciales, y esto condujo al desarrollo de diagramas de bloques de confiabilidad (tales como los de la figura n°1) para el análisis de sistemas. El profundo interés en la confiabilidad de sistemas continuó hacia los años setenta, principalmente impulsado por la industria nuclear. También en los sesenta creció el interés en la
confiabilidad de sistemas en la industria de la aviación civil, de la cual surgió el Mantenimiento Basado en la Confiabilidad (RCM) que será cubierto en el capítulo 3 de este manual. Como resultado de los éxitos iniciales del RCM, éste se ha convertido en la metodología predominante de empresas (militares, industriales, etc.) en los setenta, ochenta y noventa para establecer operaciones confiables de planta. El próximo milenio verá al RCM continuar jugando un rol significativo en lo que es el establecimiento de programas de mantenimiento, pero con una característica nueva que será el enfoque de profesionales de mantenimiento a examinar minuciosamente los planes que resulten del análisis RCM y a usar procedimientos que permitan que estos planes sean optimizados. Otras secciones (Capítulo 5, “Optimizar el mantenimiento basado en el tiempo”, y Capítulo 6, “Optimizar el mantenimiento sintomático”) de este manual se refieren a procedimientos ya disponibles para apoyar este avance hacia la optimización del mantenimiento. Ambas cubren herramientas, políticas, métodos de análisis y técnicas de preparación de la información para apoyar la implantación de una estrategia de RCM.
Referencias Ingeniería de Confiabilidad y Análisis de Riesgos, Henley y Komamoto, Prentice Hall, 1981.
capítulo dos
Haga un inventario de su Operación Medir y comparar (“benchmarking”) la confiabilidad de su planta Por Leonard G. Middleton y Ben Stevens ¿Opera su negocio basado en el “manejo de caja”? Esto es cuando usted cuenta su dinero al comienzo y final de cada mes. Si tiene más cuando llega el final del mes, entonces está bien. Si no, bueno, tratará de hacerlo mejor el próximo mes – o por lo menos hasta que se acabe el dinero. Ningún negocio verdaderamente exitoso opera usando este modelo; sin embargo, el mantenimiento a menudo se organiza y lleva a cabo sin usar mediciones pertinentes para determinar su impacto en el éxito del negocio. El uso de mediciones de desempeño está creciendo rápidamente en áreas de mantenimiento alrededor del mundo. Esto nace de un concepto bastante simple: no se puede administrar lo que no se puede medir. La medición del desempeño es así un elemento crucial de la gestión de mantenimiento. Las metodologías para determinar el desempeño son de vital importancia, ya que mediciones poco confiables llevan a conclusiones poco confiables y, por ende, a acciones deficientes. Los beneficios del benchmarking El benchmarking refuerza el comportamiento positivo y la asignación efectiva de recursos. Facilita el progreso más rápido hacia metas aportando experiencias, vía el ejemplo del participante y el mayor compromiso. Usando estándares externos de desempeño, una organización puede mantenerse competitiva al disminuir el riesgo de ser sobrepasada por el desempeño de sus competidores, y por los requerimientos de clientes. Primordialmente, el benchmarking satisface las necesidades de información de “stake-holders” y alta gerencia al enfocarse a los procesos críticos que agregan valor, logrando al mismo tiempo una visión integrada del negocio. El benchmarking es un proceso que genera demandas a todos los participantes, pero es una de las mejores maneras de encontrar prácticas que funcionen bien dentro de situaciones comparables.
¿Que debería medir? No hay nada místico acerca de la medición del desempeño – la clave está en la manera de usar los resultados para generar acciones requeridas. Esto depende de que se den un número de condiciones – incluyendo información confiable y consistente, análisis de alta calidad, una clara y persuasiva presentación de la información, y un ambiente de trabajo receptivo (vea figura 2).
ENTRADAS ♦ ♦ ♦ ♦ ♦ ♦ ♦
Mano de obra capacitada Equipo y herramientas Materiales y suministros Servicios contratados Indirectos técnicos Indirectos de gestión Facilidades y talleres
SALIDAS ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦
Disponibilidad Tasa de proceso Calidad Mantenibilidad Confiabilidad Efectividad del equipo Utilización Costo ciclo de vida Retorno sobre la inversión
Medidas de la Efectividad del Proceso ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦ ♦
Carga de trabajo pendiente por especialidad Tiempo de anticipación de ordenes de trabajo % de trabajo que c orresponde a mantenimiento preventivo % de mantenimiento preventivo completado según programa % de trabajo que es planificado Número de ordenes de trabajo de emergencia % de trabajo que c orresponde a mantenimiento predictivo % uso de sintomático rotación de inventario nivel de servicio de la bodega Frecuencia y severidad de accidentes Tasa de ausentismo
Figura 2: Entradas, salidas y medidas de efectividad de proceso En línea con la proposición que la optimización de mantenimiento es tema de la alta gerencia y directorio, es esencial que los resultados se muestren como reflejo de la ecuación básica del negocio: El mantenimiento es un proceso de negocio que convierte insumos en productos aprovechables. La figura 3 muestra los tres elementos principales de esta ecuación – las entradas, las salidas y el proceso de conversión con ejemplos de medidas de desempeño. La medición de las entradas se traduce en los recursos que asignamos al proceso de mantenimiento. La medición de las salidas son los resultados del proceso de mantenimiento. Las mediciones de efectividad del proceso de mantenimiento determinan en que lugar deben hacerse mejoras. Métricas específicas de confiabilidad incluyen TMEF (Tiempo medio entre falla), TMPR (Tiempo medio para reparar.).
ENTRADAS
Si tiene limitaciones de costos, empiece aquí
PROCESO
SALIDAS
Si tiene limitaciones de producción, empiece aquí
Figura 3: optimización de mantenimiento – el punto de partida
Relacionar la medición del desempeño con los objetivos del negocio Hay tres escenarios operacionales básicos de negocio que impactan en el enfoque y estrategias de mantenimiento. Estos son: 1. Capacidad operacional excedente; ♦ 2. Capacidad operacional limitada; ♦ 3. Foco de cumplimiento a requerimientos de servicio, calidad o reglamentación. ♦ Las mediciones de benchmarking deben reflejar el escenario operacional predominante del negocio en el momento. Aún cuando algunas métricas son comunes a los tres escenarios, el enfoque de mantenimiento debe alinearse con el enfoque actual de la organización. El escenario operacional puede cambiar debido a cambios en la economía. Por ejemplo, una economía fuerte o una baja en las tasas de interés podrían causar un aumento de la demanda de materiales de construcción. Como consecuencia, las industrias de materiales de construcción (como fábricas de ladrillos o de paneles de yeso) cambiarán del primer escenario (capacidad excedente) al segundo (capacidad limitada). La mayoría de las entradas en la figura 1 son familiares al departamento de mantenimiento y fácilmente medidas – como la mano de obra, materiales, equipos y contratistas. También hay entradas que son más intangibles, más difíciles de medir con precisión – tales como experiencia, técnicas, trabajo en equipo, historial de trabajo – sin embargo, cada una puede tener impacto muy significativo en resultados. De la misma forma, algunas de las salidas son fácilmente reconocibles e igualmente fáciles de medir; otras presentan más dificultades para medirlas efectivamente. Así como con las entradas, algunas son intangibles, tal como la contribución al espíritu del equipo que viene después de completar según programa una tarea difícil. Las mediciones de asistencia al trabajo y de ausentismo son substitutos muy inexactos para estos intangibles, e indicadores generales del desempeño del mantenimiento son demasiado amplios como para resolverlos. No obstante la contribución de los intangibles al mosaico del desempeño general de mantenimiento, el enfoque de este manual se centrará en medición de los tangibles. El proceso de convertir las entradas de mantenimiento en salidas requeridas es la parte esencial del trabajo del gerente de mantenimiento – sin embargo la tasa de conversión absoluta es pocas veces de gran interés por sí sola. Convertir las horas de mano de obra utilizada en confiabilidad, por ejemplo, probablemente haga poco o nada de sentido – hasta que pueda ser usada como una medida de comparación, a través del tiempo o con otra empresa o división similar. Asimismo, el consumo promedio de materiales por orden de trabajo es poco significativo – a menos que se vea, digamos, que la prensa A ocupa el doble de materiales de reparación que la prensa B para el mismo rendimiento de producción. De hecho, una manera simple de reducir el consumo de materiales por orden de trabajo es de dividir los trabajos y por tanto aumentar el número de ordenes de trabajo. Así, el foco debe estar en la posición comparativa de una empresa o división, o el mejoramiento de efectividad de mantenimiento de un año al otro. Estas comparaciones resaltan otro notable valor de la medición del mantenimiento – es decir, su uso en comparaciones regulares de progreso hacia objetivos y metas específicas. Este proceso de benchmarking – a través del tiempo, con otras divisiones u otras empresas – está siendo utilizado cada vez más por la alta gerencia como indicador clave de la buena gestión de mantenimiento, y frecuentemente revela sorprendentes discrepancias en desempeño. Un reciente ejercicio de benchmarking (vea figura 4) entregó interesante información sobre la industria de la celulosa.
Figura 4: Costos de mantenimiento según benchmarking en industria de celulosa
Una mirada rápida a los resultados muestra algunas discrepancias significativas – no solamente en la estructura general de costos, sino que también en la manera en que la “compañía X” hace negocios – por ejemplo, una estructura gerencial de más peso y un uso mucho menor de contratistas. Lo que queda claro de este benchmarking de alto nivel es que algo se tendrá que hacer para conservar la competitividad de mercado de la compañía X. Sin embargo, para determinar exactamente lo que hay que hacer es necesario un análisis más detallado. Como uno podría prever, el número de mediciones potenciales de desempeño excede por mucho la habilidad (o voluntad) del gerente de mantenimiento para recolectar, analizar y actuar basado en la información. Por esto, una parte importante de cualquier programa para implantar medición del desempeño es un entendimiento pleno de los pocos, pero claves indicadores de desempeño. Potenciar al máximo debe ser siempre la primera prioridad; es decir, uno primero debe identificar los indicadores que muestran resultados y progreso en aquellas áreas que tienen una necesidad más crítica de mejoramiento. Como un punto de partida, considere la figura 3 en página anterior.
Una parte importante de cualquier programa para implementar la medición del desempeño es el entendimiento pleno de los indicadores claves de desempeño – con un especial énfasis a los indicadores que muestran progreso en las áreas que necesitan el mayor apoyo dentro de las operaciones de mantenimiento de una empresa. Si un negocio es capaz de vender una mayor cantidad de productos o servicios si baja sus precios, entonces diremos que ese negocio es “limitado en costo”. Bajo estas circunstancias, es muy posible que la mayor ganancia venga de concentrarse en el control de las entradas – es decir mano de obra, materiales, costos de los contratistas y los indirectos. Si un negocio puede vender lucrativamente todo lo que produce, entonces lo denominamos un negocio “limitado en producción”, y es probable que alcance su mayor ganancia si se enfoca a maximizar las salidas mediante la confiabilidad, disponibilidad y mantenibilidad de los activos.
Negocios con capacidad excedente (limitado en costo) Las mediciones financieras típicas de mantenimiento podrían incluir: 1. Presupuesto de mantenimiento versus gastos (es decir, predictibilidad de costos); 2. Flujo de caja de gastos de mantenimiento (es decir, capacidad de pagar los gastos); 3. Gastos de mantenimiento relativos a salidas (es decir, costo de mantenimiento por unidad de producción); 4. Mediciones derivadas de gastos describiendo las actividades para las cuales se destinaron: reparación de emergencia, sintomático, trabajo correctivo planificado, paros de planta, eficiencia de procesos, porcentajes de tiempos de ciclo, o porcentajes de tasa de producción (no tasa absoluta de producción).
Negocios con capacidad operacional limitada Mediciones típicas de la productividad o salida de mantenimiento pueden incluir: 1. Efectividad general de equipo, y cada uno de sus componentes de disponibilidad, tasa de producción y tasa de calidad de equipos particulares como medidas primarias; 2. TMEF y TMPR, como medidas secundarias usadas para analizar problemas con respecto a la disponibilidad. El análisis RCM (véase capítulo 3) debería incluir todos los cuellos de botella operacionales y equipo crítico (considerando el impacto de redundancias de equipos o sistemas, o de procesos paralelos) en las evaluaciones de tácticas.
Cumplimiento de requerimientos Los factores críticos de éxito de una organización generalmente dependen fuertemente en cumplimiento de un conjunto de requerimientos determinados por agencias regulatorias o por clientes. El cumplimiento puede tener relación con la operación, como es el caso de un equipo de monitoreo de efluente. Los servicios públicos regulados, productos farmacéuticos o para el cuidado de la salud, o los productos de prestigio son negocios cuyos márgenes y naturaleza son tal que el cumplimiento es su aspecto operacional más crítico. Las mediciones financieras y las de salidas siguen siendo importantes, pero pasan a un nivel secundario. Las mediciones típicas del mantenimiento en este escenario operacional pueden incluir: 1. Tasa de calidad; 2. Disponibilidad (por ejemplo, requerimiento regulado de cumplimiento) 3. Precisión o repetitibilidad del equipo o sistema. El análisis RCM debería entonces enfocarse a los aspectos críticos de cumplimiento, tal como es requerido por los “stakeholders” externos.
¿Cuán efectivo es su desempeño? Los 10 ítems de medición del proceso de mantenimiento en la figura 5 (abajo) resultan del ejercicio de benchmarking y un análisis subsecuente. Proveen los objetivos globales y la capacidad de medir progreso hacia el logro de metas establecidas.
Referencia
Lo mejor
Referencia
Figura 5:
Midiendo la brecha
Las conclusiones y el compartir de los resultados Las “mejores prácticas” son identificadas por organizaciones que realizan benchmarking, tomando en cuenta las limitaciones que puedan existir. Se desarrolla entonces un plan de implantación para hacer que las “mejores prácticas” formen parte del proceso de mantenimiento de la organización que realiza el benchmarking (véase figura 6). En el espíritu de benchmarking, los resultados del estudio se comparten con los participantes. Reciben un informe que detalla las conclusiones del estudio de benchmarking, pero sin las recomendaciones específicas particulares a la organización que generó el estudio. Este informe es crítico, ya que es el valor esencial que reciben por el esfuerzo desarrollado.
Figura 6: Actuar sobre los resultados del benchmarking
Fuentes externas de datos Vías legales de obtener datos adicionales para comparación requieren búsqueda de información secundaria (más abajo) y benchmarking. El benchmarking puede ser de uno o más de los siguientes tipos: 1. Benchmarking interno; 2. Benchmarking dentro de la industria; 3. Benchmarking con organizaciones comparables fuera de la industria. Una vez obtenida, un tema importante con información externa es ver cuan comparable es. La información financiera es particularmente difícil de comparar, ya que tanto prácticas financieras (incluye restricciones GAAP) como de contabilidad de costos varían acorde a objetivos de la organización. Las preguntas que se debería hacer cuando esté analizando información contable pueden incluir: ¿Están los repuestos, materiales y servicios externos incluidos en el presupuesto de mantenimiento o en el de compras? ¿Están los convenios de sustitución y rotación de componentes incluidos en el presupuesto de mantenimiento o de capital? ¿Al calcular disponibilidad de equipo, se considera todo tiempo de detención, o solamente el no programado? Las respuestas van a depender de lo que la organización esté intentando medir con el cálculo.
Búsqueda de información secundaria Información secundaria es información recolectada para otros propósitos. Típicamente son informes gubernamentales, de asociaciones industriales, o informes anuales de empresas transadas públicamente. La información tiene cierto número de limitaciones. Es probable que los datos sean cuantitativos y haya poca información adicional para entender contexto. Puede no estar actualizada. Métricas comparables de desempeño pueden no estar disponibles porque los datos base no se recolectaron.
Consideraciones generales en benchmarking Benchmarking es compartir información similar entre participantes. Este puede ser extensivo, cubriendo a toda la organización, o enfocado a proceso o conjunto de métricas particular (véase figura 7).
Figura 7: Comparaciones de benchmarking El benchmarking puede tomar diferentes formas. Información específica, aunque generalmente cualitativa, puede obtenerse vía encuestas telefónicas cortas (15 a 30 minutos). Se puede obtener información detallada mediante uso de cuestionarios exhaustivos; pero aquí la participación se convierte en un tema importante. Un estudio de benchmarking focalizado puede centrarse en intereses específicos, pero el contenido debe ser lo suficientemente amplio como para poder obtener participación (véase figura 8).
Referencia: Particularizar enfoque para cumplir requerimientos ♦ Convenir metas y énfasis específico. ♦ Definir recursos y el cronograma ♦ Acuerde alcance y objetivos ♦
Completar el Cuestionario Definición acordada de todas las preguntas ♦ Apoyo en línea para personal durante la completación ♦ Mejorado cada año para reflejar las necesidades cambiantes de la industria ♦
Programa de Entrevistas: Llevado a cabo una vez que ha sido completado el cuestionario ♦ Compruebe el entendimiento ♦ Diagrame los procesos claves ♦ Identifique los impulsadores y medidas claves de desempeño. Entreviste personas a través y a todo nivel en la organización ♦
Análisis, validación y revisión de datos • Los datos se consolidan • Los datos se validan • Ingresados a la base de datos de nuestro modelo y analizados • Benchmarks a través de distintos procesos son comparados para comprender relaciones casuales
Retroalimentar a los participantes • Una evaluación cualitativa y cuantitativa • Resumen y evaluación general • Recomendaciones de las áreas claves a atacar y próximos pasos
ETAPA 1 ETAPA 2 ETAPA 3
ETAPA 4
ETAPA 5
Figura 8: Etapas del benchmarking
Benchmarking interno La mayor dificultad en benchmarking es la obtención de datos críticos necesarios para la comparación. El benchmarking interno resuelve este tema comparando datos de otras organizaciones y divisiones dentro de la empresa. Información puede ser libremente intercambiada ya que no presenta ventaja a un competidor. Datos intercambiados mediante un programa de benchmarking interno son típicamente cuantitativos, ya que información cualitativa requiere de un análisis de mayor envergadura. La limitación del benchmarking interno es que el conocimiento del desempeño con relación a empresas externas no se establece. Sin comparaciones externas, una empresa no puede determinar si verdaderamente se está desempeñando de la mejor manera posible.
Benchmarking a nivel industria En algunas industrias se comparte información por medio de un tercero. Puede ser una asociación industrial o un externo que haya desarrollado experiencia en la industria y quiera mantenerse como punto focal en ella (por ejemplo, el informe de benchmarking global de la Industria Forestal de PwC). Este tercero asegura que la información permanecerá confidencial y que no será directamente atribuida a ninguna de las organizaciones participantes. La organización formula también el cuestionario, aún cuando el aporte de los participantes ayuda a dar dirección para asegurar que los resultados sean de la mayor utilidad. A veces es difícil conseguir participación de todos los entes claves, ya que algunas empresas ven sus operaciones como ventaja estratégica sobre la competencia. Si en realidad son mejores que sus competidores y no tienen nada que aprender de ellos, entonces esto se cumple– pero, la verdad es que siempre hay algo que aprender.
Benchmarking con industrias comparables Cuando una organización quiere efectuar mediciones específicas, es posible llevar a cabo un estudio de benchmarking focalizado. Usando un externo para mantener la confidencialidad (es decir, qué datos le pertenecen a qué empresa), una organización puede medir y comparar partes específicas de sus procesos con las mejores prácticas reveladas por el ejercicio. Aunque a menudo es difícil obtener información de competidores directos, generalmente es posible obtenerla de otras industrias que cuentan con los mismos problemas de producción y las mismas limitaciones. Un beneficio del benchmarking con industrias comparables es el descubrimiento de nuevas ideas que no constituyen práctica común en la industria de uno, pero que sí podrían ser adoptadas. Por ejemplo, un cliente de la industria de refinación de gas & petróleo deseaba hacer benchmarking de su gestión de mantenimiento eléctrico y de instrumentación. El criterio de selección de participantes para otras organizaciones fue: 1. El mantenimiento eléctrico y de instrumentos es crítico para operaciones confiables; 2. Producción es un proceso continuo que requiere operar 24 horas diarias, 7 días a la semana; 3. Las ramificaciones de detenciones no programadas son graves, y existe un esfuerzo considerable y focalización de mantenimiento para evitar las detenciones; y 4. El mantenimiento es proactivo. La lista de posibles participantes que reunieron todos, o la mayor parte de los requisitos, incluyó plantas químicas, plantas de generación eléctrica, plantas de tratamiento de aguas servidas, plantas siderúrgicas, así como también otras refinerías de gas & petróleo. El mantenimiento es parte esencial del negocio de una organización, y debe por tanto ajustarse a los objetivos y directrices de esa organización. El mantenimiento no puede operar en aislamiento. El ciclo
de mejoramiento continuo que es clave para mejorar mantenimiento debe ser impulsado por, y complementarse con, el ciclo de planificación, ejecución y retro-alimentación propio de la empresa. Frecuentemente ocurren incongruencias debido a la falla de mantenimiento de alinearse desde el nivel corporativo al nivel de departamento – por ejemplo, si la empresa establece una moratoria de nuevos gastos de capital, esto debe alimentar la estrategia de mantenimiento y reemplazo de equipos del departamento de mantenimiento. De la misma manera, si la misión corporativa es producir el producto de mayor calidad posible, entonces probablemente no estará de acuerdo con objetivos del departamento de mantenimiento de minimizar costos. Este tipo de incongruencias aparece generalmente dentro del departamento de mantenimiento en sí; si la misión del departamento de mantenimiento es ser el de mejor desempeño en la industria, entonces es poco probable que una estrategia que excluya el mantenimiento sintomático y la confiabilidad alcance los resultados deseados (véase figura 9). Asimismo, si el planteamiento de estrategia proyecta un incremento de 10% en confiabilidad, deben estar disponibles datos confiables y consistentes para poder hacer las comparaciones.
Figura 9: El ciclo de mejoramiento continuo del mantenimiento
Prioridades incompatibles para el gerente de mantenimiento En la industria moderna, todo departamento de mantenimiento enfrenta el mismo dilema – ¿Cual de las tantas prioridades es la número uno de la lista? (Atrévase uno a sumarle “... esta semana?”) ¿Debería la organización minimizar los costos de mantenimiento o maximizar el rendimiento de la producción? ¿Minimizar el tiempo de detenciones o concentrarse en la satisfacción del cliente? ¿Debería gastar dinero en el corto plazo en un programa de confiabilidad para reducir los costos en el largo plazo? Las prioridades corporativas son fijadas por el gerente general y ratificadas por la junta directiva. Una vez ratificadas, estas prioridades deberían fluir a todas las partes de la organización. La tarea del gerente de mantenimiento es adoptar estas prioridades y convertirlas en prioridades, estrategias y tácticas correspondientes de mantenimiento para lograr los resultados; luego debe investigarlas y mejorar basado en ellas.
MACRO
Benchmark Externo
MICRO
Acciones Internas
1. Costos de Mantenimiento por tonelada están por sobre el estándar de la industria en un 15% 1. Fijación objetivos de reducción 2. Implantación medios para asignar costos a equipos y tareas 3. Analizar el desglose de los costos entre equipos, tareas y tipos de costos 4. Examinar y comparar los métodos 5. Aplicar “mejores prácticas” en todas las áreas
Figura 10: Relacionando mediciones macro con tareas micro La figura 10 muestra un ejemplo de cómo las prioridades corporativas pueden fluir hacia las tácticas de mantenimiento que controlan el trabajo diario del departamento. Así, si la prioridad corporativa es maximizar la venta de productos, entonces esto puede ser legítimamente convertido en prioridades de mantenimiento que se enfoquen a maximizar el rendimiento y por tanto la confiabilidad del equipo. Como resultado, las estrategias de mantenimiento también reflejarán esto, y podrían incluir (por ejemplo) la implantación un programa formal de aumento de la confiabilidad apoyado por un programa sintomático. De estas estrategias surgen las tácticas diarias, semanales y mensuales – suministrando las listas de tareas individuales que se convertirán en los trabajos que aparecerán en ordenes de trabajo del EAM o CMMS. El uso de la orden de trabajo como el aviso para asegurar que las inspecciones se lleven a cabo ya ha sido difundido; donde las organizaciones fallan frecuentemente es en asegurar que el análisis de seguimiento y los informes sean completados regular y oportunamente. El método más efectivo para lograr esto es de asignarlas como tareas semanales de ordenes de trabajo, las cuales están entonces sujetas al mismo seguimiento de desempeño que las ordenes de trabajo de reparaciones y de mantenimiento preventivo. Al buscar maneras de mejorar el desempeño, un gerente de mantenimiento se enfrenta a muchas alternativas que parecen incompatibles. Hay diversas técnicas de análisis disponibles para establecer donde se encuentran organizaciones con relación a estándares de la industria o mejores prácticas de mantenimiento. Las mejores técnicas son aquellas que también indican la ganancia que será derivada de la mejora y, por ende, de las prioridades. Las técnicas de análisis tienden a ser divididas en enfoques macro (cubriendo todo el departamento de mantenimiento y su relación con el negocio) y micro (focalizado en una parte del equipo en particular o en sólo un aspecto de la función de mantenimiento). Las técnicas líderes comprenden:
1. Evaluaciones de efectividad de mantenimiento: cubren la efectividad general de la función de
2.
mantenimiento y su relación con estrategias de negocio de la organización. Pueden ser llevadas a cabo interna o externamente, y generalmente cubren áreas tales como: Estrategia de mantenimiento y comunicación; ♦ Organización de mantenimiento; ♦ Recursos humanos y el empoderamiento de los empleados; ♦ Uso de tácticas de mantenimiento; ♦ Uso de ingeniería de mantenimiento y enfoques basados en confiabilidad para equipos; ♦ Monitoreo y mejoramiento de desempeño de equipos; ♦ Tecnología de información y sistemas de gestión; ♦ Uso y efectividad de planificación y programación; ♦ Gestión de materiales en apoyo a mantenimiento. ♦ Benchmarking externo: hace analogías con otras organizaciones para establecer posición de la organización en relación con estándares de la industria. La confidencialidad es un factor clave, y
3.
4.
5.
resultados se presentan generalmente como rangos de indicadores de desempeño y el posicionamiento propio dentro de ese rango. Algunos de los temas cubiertos en el benchmarking se sobrepondrán con el análisis de efectividad del mantenimiento; algunos temas adicionales incluyen: Naturaleza de las operaciones del negocio • Estrategias y prácticas actuales de mantenimiento • Planificación y programación • Prácticas de gestión de inventarios y bodegas • Presupuesto y costos • • Desempeño de mantenimiento y métricas Uso de CMMS y otras herramientas TI • • Reingeniería del proceso de mantenimiento Comparaciones Internas: Estas medirán un conjunto de parámetros similares al benchmark externo, pero serán obtenidos de distintos departamentos o plantas dentro de la misma organización. Como tal, son generalmente más baratos y, si los datos son consistentes, pueden ilustrar diferencias en las prácticas de mantenimiento en plantas similares. Estas diferencias luego se convierten en la base de experiencias compartidas y eventual adopción de las mejores prácticas obtenidas de estas experiencias. Evaluación de mejores prácticas: toma los estándares de proceso y operación del departamento de mantenimiento y los compara con los mejores en la industria. Esto es generalmente el punto de partida de programas de mejoramiento del proceso de mantenimiento, y enfoca áreas tales como: • Mantenimiento preventivo; • Inventarios y compras; • Flujo de trabajo de mantenimiento; • Involucramiento de operaciones; • Mantenimiento predictivo; • Mantenimiento basado en confiabilidad; • Mantenimiento productivo total; • Optimización financiera; • Mejoramiento contínuo. Efectividad General del Equipo (OEE): métrica global de la efectividad operacional de planta luego de restar las pérdidas causadas por detenciones programadas y no programadas, desempeño del equipo, y calidad. En cada caso, los sub-componentes habrán sido definidos meticulosamente para proveer uno de los pocos indicadores de desempeño del equipo razonablemente objetivo y de uso común. Al ver el resumen de resultados de una empresa (ver figura 11), recuerde que los valores de cada categoría se multiplican en el cálculo para llegar al resultado final. Así, la empresa Y que logra 90% o más en cada categoría (que parecen ser muy buenos valores), solamente tendrá un OEE de 74%. Esto significa que al incrementar el OEE, digamos a un 95%, la compañía Y puede aumentar su producción en un 28% ((95 – 74)/74 = 28) con mínimos gastos de capital. Logrando esto en tres plantas hace innecesaria la construcción de una cuarta.
Figura 11: Efectividad general del equipo
Estos entonces son algunos de los indicadores de alto nivel que sirven para dar a la gerencia una perspectiva general de la efectividad y posición competitiva del departamento de mantenimiento. Son muy útiles para destacar los temas claves a nivel gerencial, pero requieren una evaluación más detallada para generar acciones específicas. Estas típicamente también requerirán apoyo de la alta gerencia y financiamiento corporativo. Afortunadamente, existen muchas medidas que pueden (y deben) ser implantadas dentro del departamento de mantenimiento que no requieren de aprobación externa o de financiamiento corporativo. Estas son importantes para los mantenedores ya que pueden ser usadas para estimular un clima de mejoramiento y progreso. Algunos de los indicadores a nivel micro son: 1. Evaluación de los beneficios que siguen a la compra o implantación de un sistema (EAM) o equipo en comparación con los resultados planificados o la justificación inicial de los costos. 2. Análisis de confiabilidad/tasas de fallas de la maquinaria: enfocado a máquinas individuales o líneas de producción. 3. Análisis de efectividad de la mano de obra: medir la asignación de mano de obra a trabajos o categorías de trabajos en comparación con el año anterior. 4. Análisis del uso de materiales, disponibilidad de equipo, utilización, productividad, pérdidas, costos, etc. Todos estos indicadores proporcionan información útil relativa al negocio de mantenimiento y a cuan bien se están realizando las tareas. Un gerente de mantenimiento efectivo tendrá que ser capaz de seleccionar aquellos que contribuyan de la manera más directa tanto al logro de las metas del departamento de mantenimiento como al de las metas generales del negocio.
capítulo tres
¿Es RCM la herramienta correcta para Ud.? Determinando sus necesidades de confiabilidad Por Jim V. Picknell En este capítulo definimos Mantenimiento Basado en la Confiabilidad (RCM) como un “proceso lógico, técnico para determinar los requerimientos apropiados de tareas de mantenimiento para lograr la confiabilidad de diseño de sistema bajo condiciones operacionales específicas en un ambiente operacional específico.” El recientemente liberado estándar SAE, JA1011, “Criterio para la Evaluación de los Procesos de Mantenimiento Basados en Confiabilidad (RCM)” establece un conjunto de criterios que cualquier proceso debe cumplir para ser calificado como RCM. Aún cuando la intención es que se use este nuevo estándar para determinar si un proceso califica como RCM, no especifica el proceso en sí. El estándar presenta siete preguntas que el proceso debe responder. Este capítulo describe ese proceso y algunas variaciones. Una revisión del estándar SAE provee un entendimiento exhaustivo de todos los criterios RCM. No podemos alcanzar una confiabilidad mayor que aquella que fue diseñada en los sistemas por sus diseñadores. Cada componente tiene sus propios y únicos modos de falla con sus respectivas tasas de falla. Cada combinación de componentes es única y la falla de un componente puede llevar a la falla de otros. Cada “sistema” opera en un ambiente único que comprende su ubicación, altura, profundidad, atmósfera, presión, temperatura, humedad, salinidad, exposición a productos o fluidos del proceso, velocidad, aceleración, etc. Cada uno de estos factores puede influenciar los modos de falla haciendo algunos más dominantes que otros. Por ejemplo, el switch de nivel en un estanque de aceite de lubricación sufrirá menos corrosión que el mismo switch en un tanque de agua salada. Es probable que una aeronave que opere en un ambiente marítimo temperado sufra más corrosión que una operando en un desierto árido. Generalmente, los manuales técnicos recomiendan un programa de mantenimiento para el equipo y los sistemas. En lo posible, a veces toman en cuenta diferentes ambientes operacionales. Por ejemplo, el manual de un automóvil especificará distintas densidades del lubricante y del anticongelante que varían con la temperatura ambiente en la cual se opera. Pero, no especifican acciones de mantenimiento basadas en el estilo de manejo – digamos, agresivo v/s defensivo – o basadas en el uso del vehículo – como por ejemplo una flota de taxis vs. viajes semanales a la iglesia o a visitar a los nietos. En un ambiente industrial es muy poco común ver que los manuales se ajusten específicamente a su ambiente operacional. Su compresor de aire de instrumentación instalado en una ubicación subártica puede tener los mismos manuales y especificaciones de punto de rocío que uno instalado en un clima tropical húmedo. El RCM es un método para controlar su propio destino con respecto al mantenimiento de flota, planta e instalaciones.
Los 7 pasos del proceso RCM El RCM tiene siete pasos básicos: 1. Identificar el equipo/sistema a ser analizado; 2. Determinar sus funciones; 3. Determinar que es lo que constituye falla de esas funciones; 4. Identificar los modos de falla que causan esas fallas funcionales; 5. Identificar los impactos o efectos de ocurrencia de esas fallas; 6. Usar lógica RCM para seleccionar tácticas apropiadas de mantenimiento; y 7. Documentar su programa final de mantenimiento (sujeto a perfeccionamiento conforme vaya obteniendo experiencia operacional).
Estos siete pasos tienen como intención responder las siete preguntas propuestas en el nuevo estándar SAE. La figura 12 ilustra todo el proceso RCM.
Próximo equipo para análisis
Seleccione equipo para el análisis
FMEA
Determine y especifique las funciones que desempeña Describa las fallas de esas funciones Describa COMO ocurren esas fallas (modos de falla)
Nuevos modos de falla descubiertos
Describa los efectos de esas fallas Use lógica RCM para seleccionar acciones de mantenimiento o ingeniería apropiadas y determine la frecuencia de las tareas
refinamientos
Documente sus resultados y comience el monitoreo de su programa de mantenimiento
Figura 12: Visión general del proceso RCM
Como primer paso, el profesional de RCM debe decidir qué analizar. Las partes o equipos más críticos son los que requieren mayor atención. Hay muchos criterios posibles y aquí sugerimos algunos: Seguridad del personal ♦ Cumplimiento con normas ambientales ♦ Capacidad de producción ♦ Calidad de la producción ♦ Costos de producción (incluyendo costos de mantenimiento) e; ♦ Imagen pública ♦ Cuando ocurre una falla en algún sistema, el equipo o dispositivo puede tener distintos grados de impacto en estos criterios, desde “ningún impacto” hasta “alto riesgo” y desde “impacto menor” hasta “impacto mayor”. A cada uno de estos criterios e impactos se le puede asignar un peso. Los partes o equipos con mayor impacto combinado sobre todos los criterios deberían ser analizados primero. Las funciones de cada sistema son lo que los sistemas hacen – de una manera activa o pasiva. Las funciones activas son generalmente aquellas obvias por las que nombramos al equipo. Por ejemplo, un centro de control de motores es usado para controlar las operaciones de varios motores. Algunos sistemas también tienen funciones secundarias o hasta protectoras menos obvias. Un ciclo químico recuperativo y un horno tienen ambos funciones secundarias de contención, y puede que también tengan funciones protectoras dadas por propiedades de aislamiento térmico o de resistencia a la corrosión química.
Es importante notar que algunos sistemas no desempeñan su rol activo hasta que ocurre algún otro evento, como los sistemas de seguridad. Este estado pasivo de sistemas hace que las fallas sean difíciles de encontrar, y que se encuentren cuando ya es demasiado tarde. Cada función tiene también su conjunto de límites operacionales. Estos parámetros definen la operación “normal” de la función. Cuando el sistema opera fuera de los parámetros “normales”, se considera que ha fallado. La definición de fallas funcionales sigue estos límites. Se puede dar que las fallas de nuestros sistemas estén caracterizadas por condiciones altas, bajas, abiertas cerradas, de encendido, de apagado, de ruptura, de inestabilidad, de bloqueo, etc.
Figura 13: ¿Que está en juego cuando
falla?
Funciones se determinan con mayor facilidad para las partes de un ensamble que para el ensamble en sí. Existen dos enfoques para determinar funciones, que dictan la manera en que se llevará a cabo el análisis. Una alternativa es mirar las funciones del equipo. Para considerar todos los modos de falla es necesario imaginarse todo lo que puede fallar en este ensamble de relativamente alto nivel. Este enfoque es bueno para determinar los principales modos de falla pero puede omitir algunos menos obvios. Otra alternativa es mirar las funciones de las “partes”. Esto se hace dividiendo el equipo en ensambles y piezas, muy parecido a cuando se desarma el equipo. Cada parte tiene sus propias funciones y modos de falla.
Figura 14:
¿Cuan complejo? ¿Cuales funciones son más fácilmente definidas?
Un modo de falla es “como” el sistema falla al desempeñar su función. Un cilindro puede estar atascado en una posición debido a falta de lubricación por parte del fluido hidráulico que está siendo usado. La falla funcional es la falla en suministrar movimiento lineal, pero el modo de falla es la pérdida de propiedades lubricantes del liquido hidráulico. Por supuesto, hay muchas causas posibles para este tipo de falla que debemos considerar al determinar la acción de mantenimiento correcta para evitar la falla y sus consecuencias. Las causas pueden incluir: uso del fluido incorrecto, la ausencia de fluido por fuga, mugre en el fluido, corrosión en la superficie debido a humedad en el líquido, etc. Cada una de estas puede revisarse al hacer un chequeo, cambiar, o acondicionar el fluido. Estas son intervenciones de mantenimiento. No todas las fallas son iguales. Las consecuencias de fallas son sus efectos en el resto del sistema, planta y ambiente operacional en las cuales están sucediendo. La falla del cilindro (planteada arriba) puede causar un flujo excesivo de efluente hacia un río, si es que está activando una válvula de compuerta o un vertedor en una planta de tratamiento – es decir, un impacto severo. Los efectos pueden también ser tan menores como la falla en liberar el freno por “peso-muerto” en un cargador frontal que va a ser usado para apilar pallets en una bodega – un impacto relativamente menor. En uno de los casos el impacto es al medio ambiente y en el otro es posible que sólo sea una molestia de mantenimiento. Al conocer las consecuencias de cada falla, podemos determinar si la falla es merecedora de prevención, esfuerzos para predecirla, algún tipo de intervención periódica para evitarla, rediseño para eliminarla, o simplemente ninguna acción. La figura 15 muestra gráficamente la lógica RCM. RCM ayuda a clasificar fallas como ocultas o Modo de falla y efectos
¿Es este modo de falla detectable por medio del monitoreo?
¿Generalmente hay suficiente tiempo de advertencia para hacer acciones planeadas?
Si
Describa el monitoreo y asigne frecuencia
Si
No No
¿Existe otra tecnica de monitoreo disponible?
Si No
¿Es la frecuencia de la falla predecible con certeza ?
No
¿Esta el modo de falla escondido?
Si
¿La reparación o acciones de reacondicionamiento devolveran un desempeño de tan bueno como nuevo? ¿El reemplazo del ítem devolvera la función a "tal como nueva"?
No
Si
Si
Describa la tarea de reemplazo y asigne su frecuencia
Si
¿Hay alguna tarea buscadora de falla o una prueba de desempeño que revele este problema?
Si
No
Rediseñe para eliminar el modo de falla y sus consecuencias
Si
No Examine la economia de la falla vs. el rediseño
Si
Describa la prueba y asigne una frecuencia a esta
Rediseñe para revelar o eliminar el modo de falla
No ¿La falla resulta en un riesgo, impacto o accidente de seguridad o de medio ambiente?
Describa acción de reparación reacondicionamiento y asigne frecuencia
¿El rediseño produce un beneficio?
Si
No
Figura 15: Lógica de decisión RCM
I n p u t s p l a n d e m a n t e n i m i e n t o
Rediseñe
Corra-a-la-falla
d P r e o c c a e m s b o i d o e r n e i q g u e e n i r e i r d í o a
no, y a ver si tienen impactos en la seguridad, el medio ambiente, la producción o el mantenimiento. Para simplificar el diagrama clásico de la lógica RCM, hemos mostrado las preguntas clasificadoras de fallas más cercanas al final del árbol de lógica. Investigaciones de modos de fallas revelan que la mayoría de las fallas de sistemas complejos compuestos de componentes mecánicos, eléctricos e hidráulicos se darán de una manera aleatoria – es decir, que no son predecibles con algún grado de confianza. Muchas de estas fallas sin embargo serán detectadas antes de que lleguen a un punto donde la falla funcional pueda ser considerada como dada. Por ejemplo, la falla de una bomba booster en rellenar un embalse en uso para proporcionar presión de trabajo para un sistema municipal de agua, puede no causar una pérdida de funcionalidad del sistema. Puede ser detectada antes que perdamos presión de agua potable, sin embargo, si le estamos haciendo seguimiento - esa es la esencia del sintomático. Buscamos la falla que ya ha ocurrido pero que no ha progresado hasta el punto de degradar la funcionalidad del sistema. Encontrando estas fallas en este estado fallido “temprano”, podemos evitar las consecuencias en el desempeño general. Dado que la mayoría de las fallas son de naturaleza aleatoria, la lógica RCM primero pregunta si es posible detectarlas a tiempo para evitar la pérdida de función del sistema. Si la respuesta es afirmativa, entonces el resultado es la necesidad de un sintomático. Para evitar el evento de falla funcional debemos monitorear con frecuencia suficiente para tener confianza de detectar el deterioro con bastante anticipación para actuar antes de perder la función. Por ejemplo, en el caso de la bomba booster podríamos revisar una vez al día si está funcionando correctamente ya que sabemos que demoramos un día en repararla y que toma dos días vaciar el embalse. Eso nos da por lo menos 24 horas entre la detección de falla en la bomba y la restauración de servicio sin pérdida de función del sistema del embalse. La optimización de estas decisiones está cubierta mas adelante en el capítulo 7. Si la falla no es detectable con suficiente tiempo como para evitar la falla funcional, la lógica nos pregunta si es posible reparar el modo de falla de la parte o equipo para reducir la tasa de falla. Algunas fallas son bastante predecibles aún si no pueden ser detectadas oportunamente. Por ejemplo, podemos predecir con seguridad el desgaste de frenos, correas, neumáticos, erosión, etc. Puede que estas fallas sean difíciles de detectar mediante el monitoreo sintomático con suficiente tiempo como para evitar la falla funcional, o pueden ser tan predecibles que el monitoreo para aquello que es obvio sea innecesario. ¿Cuál es la razón para suspender trabajo de un equipo para monitorear desgaste de correa si sabemos que es muy probable que no aparezca en por lo menos dos años? Podríamos monitorear todos los años, pero en algunos casos sería más lógico simplemente reemplazar las correas cada dos años sin revisar su condición. Existe un riesgo de que la falla ocurra anticipadamente y también un riesgo de que se cambien correas que ni siquiera estén desgastadas. Estas decisiones serán cubiertas más adelante en el capítulo 6. Si no es práctico reemplazar componentes o devolverles su condición original por medio de alguna acción basada en el tiempo, entonces puede que sea posible cambiar el equipo entero. Generalmente esto hace sentido si la pérdida de la función es demasiado critica, ya que implica una política de repuestos para apoyar este enfoque. Quizás el costo de la producción perdida en el tiempo de detención asociado con el reemplazo de partes es muy caro, y el costo del reemplazo completo es menor. De nuevo, este tipo de decisiones será cubierto en el capítulo 6. En el caso de los modos de falla ocultos en sistemas de protección o de seguridad puede no ser posible el monitoreo del deterioro ya que el sistema está normalmente inactivo. Si el modo de falla es aleatorio, puede que no tenga sentido reemplazar el componente sobre la base de tiempo porque se podría estar reemplazando con otro componente similar que falle apenas recién instalado. Uno no puede saber. En estos casos la lógica RCM nos pide explorar el uso de pruebas de detección de fallas funcionales. Estas son pruebas que podemos efectuar para causar que el dispositivo se active, mostrando la presencia o ausencia de un funcionamiento correcto. Si una prueba como ésta no puede efectuarse, se debe rediseñar el componente o sistema para eliminar la falla oculta.
En el caso que las fallas no sean ocultas, no se puedan predecir con suficiente tiempo como para prevenir la falla funcional, y no se pueda prevenir la falla mediante reemplazos basados en tiempo o en uso, se puede rediseñar o aceptar la falla y sus consecuencias. En caso de consecuencias de seguridad o medio ambiente, se debería rediseñar. En caso de consecuencias relacionadas con la producción, se puede elegir el rediseño o el correr-a-la-falla dependiendo de los términos económicos asociados con las consecuencias. Si no se presentan consecuencias en la producción, pero sí hay costos de mantenimiento que considerar, entonces hay una elección similar. En estos casos la decisión está basada en factores económicos – es decir, el costo de rediseño vs. el costo de aceptar las consecuencias de falla (como la producción perdida, costos de reparación, sobretiempo, etc.) La frecuencia de las tareas es generalmente difícil de determinar con seguridad. Los capítulos 6 y 7 discuten este problema en detalle, pero para los propósitos aquí basta con reconocer que el historial de la falla es uno de los principales determinantes. Uno debería reconocer que las fallas no ocurrirán exactamente en el momento que uno predice, por lo que hay que aceptar un margen de error. También hay que reconocer que la información en la que uno se basa para tomar las decisiones puede ser deficiente o incompleta. Para simplificar el próximo paso, que vincula la agrupación de tareas similares, tiene sentido predeterminar un número de frecuencias aceptables, tales como diarias, semanales, por turno, anuales, unidades producidas, distancias viajadas o número de ciclos de operación, etc. Seleccione aquellas que estén más cercanas a las frecuencias que su historial de operaciones o de mantenimiento le indican tienen más sentido. Luego de haber pasado los modos de falla por la lógica mostrada arriba, el profesional debe consolidar las tareas en un plan de mantenimiento para el sistema. Este es el “producto final” de RCM. Cuando esto ha sido producido, el mantenedor y el operador deben continuamente buscar las posibles mejoras del producto. Las frecuencias de tareas que sean originalmente seleccionadas pueden ser muy conservadoras o muy largas. Si se experimentan demasiadas fallas que deberían estarse previniendo, entonces probablemente no se están realizando intervenciones de mantenimiento proactivo con la suficiente frecuencia. Si ya no se ven nunca las fallas comunes que tenían pequeñas consecuencias, o si los costos preventivos son mayores de los que se tenían cuando no se hacía mantenimiento preventivo, entonces es posible que se esté manteniendo la unidad con demasiada frecuencia. Aquí es donde entran las técnicas de optimización. (Véanse los capítulos 6 y 7 para una discusión completa.)
El “producto” de RCM El “producto” RCM es un plan de mantenimiento. Este documento contiene listados consolidados con descripciones de las intervenciones sintomáticas, reemplazos basados en tiempo o uso, tareas detectoras de fallas, decisiones de rediseño, y decisiones de correr-a-la-falla. Este documento no es un “plan” en el verdadero sentido; no contiene la información típica de planificación de mantenimiento tal como la duración de tareas, herramientas y equipo de prueba, requerimientos de repuestos y materiales, requerimientos de mano de obra y la secuencia detallada de pasos. En un sistema complejo se pueden identificar miles de tareas. Para tener una idea del tamaño del producto, considere una típica planta de proceso que tiene repuestos para más o menos el 50% de sus componentes. Cada uno de ellos puede tener varios modos de falla. Esta planta probablemente mantiene entre 15,000 y 20,000 números individuales de partes (SKUs) en inventario. Esto significa que habrá algo como 40,000 partes con uno o más modos de falla y decisiones de tareas. Afortunadamente hay un número limitado de técnicas de monitoreo sintomático disponibles, y estas cubrirán gran parte de la lista de tareas ya que la mayoría de modos de falla son aleatorios. Estas tareas pueden ser agrupadas según la técnica (por ejemplo, análisis de vibraciones), según la ubicación (por ejemplo, sala de máquinas), y según la sub-ubicación en una ruta. Puede ser posible agrupar decenas y hasta centenas de modos de falla individuales para así reducir el número de tareas para la planificación detallada de mantenimiento. Es necesario considerar las frecuencias con que los grupos de tareas fueron especificados.
Las tareas basadas en uso o en tiempo son fáciles de agrupar. Todas las tareas de reemplazo o reacondicionamiento para equipos particulares pueden ser agrupadas por frecuencia de tareas en una sola tarea de “overhaul”. De la misma manera, múltiples “overhauls” en un área específica de planta pueden ser agrupados en un solo plan de paro. Otra manera de agrupar las tareas es según el responsable de ellas. Tareas asignadas a operadores se efectúan generalmente usando sentidos del tacto, vista, olfato u oído. Estas a menudo se agrupan lógicamente en listas de chequeo diarios o por turno o de rondas de inspección. Al final, uno debería tener una lista completa que nos diga qué tiene que hacer mantenimiento y cuando debe hacerlo. El planificador tiene el trabajo de determinar los detalles necesarios para ejecutar el trabajo.
¿Qué puede lograr el RCM? El RCM ha estado rondando por aproximadamente 30 años. Comenzó con los estudios de fallas de aviones comerciales en los años sesenta, para reducir la cantidad de trabajo de mantenimiento requerida para lo que en ese momento era la nueva generación de aeronaves más grandes de fuselaje ancho. A medida que las aeronaves crecieron y aumentó su número de partes y por ende había mas cosas que podían fallar, era evidente que los requerimientos de mantenimiento iban a crecer de forma similar y consumir tiempo de vuelo necesario para generar utilidades. En el extremo, la seguridad podría haber sido muy costosa de lograr y habría hecho el volar un mal negocio. Al éxito de la industria de aerolíneas en aumentar el número de horas de vuelo, drásticamente mejorar su registro de seguridad, y demostrarle al mundo que el uso de un enfoque de mantenimiento casi enteramente proactivo es posible, se puede atribuir al éxito de RCM.
El éxito de la industria de las aerolíneas fue un espaldarazo altamente visible del éxito de RCM, y le demostró al mundo los beneficios de un enfoque casi enteramente proactivo de mantenimiento. Las nuevas aeronaves que tenían su mantenimiento determinado por el uso de RCM requerían menos horas-hombre de mantenimiento por hora de vuelo. Desde los sesenta, el desempeño de seguridad de las aeronaves ha ido mejorando dramáticamente.
Figura 16:
Las aeronaves son ahora más confiables que hace varios años atrás y eso se debe en parte al RCM.
Fuera de la industria aeronáutica, el RCM también ha sido usado con éxito. Proyectos militares generalmente decretan el uso de RCM porque permite a usuarios finales gozar del tipo de alto desempeño de confiabilidad de equipo que tienen las aerolíneas. El autor participó en un proyecto de construcción de buques donde la carga total de trabajo de mantenimiento de la tripulación se redujo en casi un 50% de lo que era común en otros buques de similar clase y tamaño. Al mismo tiempo, la disponibilidad de servicio
se mejoró en un 60 a 70% por medio de reducción del tiempo de detención para intervenciones de mantenimiento. La industria minera se encuentra operando típicamente en lugares remotos lejanos de proveedores de repuestos y materiales y de mano de obra de reemplazo. Consecuentemente, las mineras quieren alta confiabilidad y disponibilidad del equipo - tiempo mínimo de detenciones y productividad máxima de los equipos. RCM ha sido un gran aporte para mejorar disponibilidad de flotas de camiones y otros equipos, al mismo tiempo que reduce los costos de mantenimiento en repuestos y mano de obra y el tiempo de detención planificado de mantenimiento. RCM también ha tenido éxito en plantas químicas, refinerías de petróleo, plantas de gas, estaciones remotas de compresión y bombeo, refinerías y fundiciones de mineral, plantas siderúrgicas, de aluminio, papel y celulosa, operaciones de transformación de papel tissue, procesamiento de alimentos y bebidas, y cervecerías. Cualquier lugar en el que alta disponibilidad y confiabilidad sean importantes, es un lugar potencial de implantación de RCM.
¿Que se necesita para llevar a cabo el RCM? El RCM no es una sigla. Debe ser aprendido y practicado para obtener la pericia y acceder a los beneficios que pueden ser obtenidos. La implantación del RCM significa: • Selección de equipo de profesionales con disposición; • Su capacitación en RCM; • Enseñar a otros “stakeholders” en la operación y mantenimiento de planta lo que es RCM y lo que puede lograr para ellos; • Selección de un proyecto piloto para mejorar la pericia del equipo y demostrar el éxito, y • Replicación del proceso a todas las otras áreas de la planta. Una clave del éxito en RCM es su demostración. Antes de comenzar el análisis, el equipo RCM debe establecer las métricas de referencia de confiabilidad y disponibilidad de planta, así como la cobertura y cumplimiento del programa de mantenimiento. Estas mediciones serán usadas posteriormente en comparaciones de lo que ha cambiado y del éxito que se está obteniendo.
Figura 17: ¡El RCM puede significar mucho trabajo!
El equipo de trabajo debe ser multi-disciplinario y capaz de hacer uso del conocimiento de especialistas cuando sea necesario. Requiere del conocimiento de las operaciones cotidianas de planta y equipo, en conjunto con el conocimiento detallado del equipo en sí. Esto hace necesaria la incorporación de por lo menos un operador y un mantenedor. El conocimiento de planificación, de programación y de operaciones y capacidades generales de mantenimiento, son también necesarios para asegurar que las tareas sean verdaderamente realizables en el ambiente de la planta, así como representación gerencial de operaciones y mantenimiento. Finalmente, el conocimiento detallado de diseño del equipo también es
importante para el equipo de trabajo. Este requerimiento de conocimiento genera la necesidad de un ingeniero o técnico senior / tecnólogo del área de mantenimiento o producción, generalmente de sólidos antecedentes en disciplinas eléctrica o mecánica. El equipo lleva ahora cinco personas, y la experiencia muestra que esto es el óptimo. Demasiada gente demora el progreso, y muy pocos significa que se va a gastar mucho tiempo buscando respuestas a las tantas preguntas que inevitablemente surgen. Inicialmente el equipo de trabajo va a necesitar ayuda para empezar. La capacitación puede demorar entre una semana a un mes dependiendo del enfoque que se use. Esta es generalmente seguida por el proyecto piloto. El piloto es una parte de la capacitación que se usa para generar un producto real. La capacitación del equipo de trabajo debería llevarse a cabo en una semana. La capacitación de otros “stakeholders” puede demorarse tan poco como un par de horas o un día o dos dependiendo de su grado de interés y de su “necesidad de saber”. La duración del proyecto piloto puede variar ampliamente dependiendo de la complejidad del equipo o sistema seleccionado para el análisis. Una buena pauta es permitir un mes de análisis piloto para asegurar que el equipo conozca bien el RCM y se sienta cómodo al usarlo. Cada modo de falla puede tomar cerca de una media hora de análisis. Usando el ejemplo anterior de la planta de proceso, un análisis exhaustivo de todos los sistemas involucrando por lo menos 40,000 partes (muchas con más de un modo de falla) consumiría más de 20,000 horas-hombre (es decir, aproximadamente 10 años-hombre para una planta entera). Si uno se restringe a sólo un equipo de trabajo, dividiendo la carga de trabajo entre los cinco miembros del equipo implicaría que el esfuerzo de análisis tomara hasta dos años para una planta de esa envergadura. En términos prácticos, el equipo inicial sirve como semillero de equipos adicionales que propagan el análisis a través de sus áreas; así, un período de un año sería más típico del tiempo involucrado.
¿Cuánto va a costar? Entonces, ¿cuánto espera pagar por la capacitación, software, apoyo de consultores, y el tiempo de su personal? Se puede ver del ejemplo que en una planta de proceso grande se requerirá un esfuerzo substancial para hacer el análisis. Este esfuerzo tiene un cierto precio. Diez años-hombre a, digamos US$50,000 por persona, asciende a la suma de US$500,000 solamente por el tiempo de su personal. La capacitación del equipo y de otras personas requerirá un par de semanas y un tercero experto. El experto también debería permanecer como parte del proyecto durante la duración del piloto – y ese es otro mes. Dependiendo del apoyo esperado del tercero, dichos servicios pueden variar de US$20,000 a US$200,000 para un piloto focalizado; el nivel de apoyo deseado está obviamente dictado por el grado de aseguramiento de una buena plataforma de lanzamiento necesario para lograr la efectiva propagación a través de la planta. Existen varias herramientas de software que lo conducen a través del proceso RCM y registran todas sus respuestas y resultados a medida que los genera. Algunos de los softwares se pueden comprar por sólo unos pocos miles de dólares para unas pocas licencias de usuario. Ciertos paquetes vienen con la capacitación RCM incluida, y otros se adquieren como parte de grandes sistemas computarizados de gestión de mantenimiento. Los precios de estos sistemas de ultima generación que incluyen RCM están generalmente en los cientos de miles de dólares. Para asistir en la determinación de frecuencias de tareas va a ser necesario tener conocimiento de historiales de fallas de planta, o ser capaz de acceder a bases de datos de tasas de falla. El historial de falla de planta debería estar disponible a través de su sistema de gestión de mantenimiento. Se puede requerir apoyo en la construcción de consultas e informes de historial, y esto puede requerir tiempo del personal de programación. Hay bases de datos externas de confiabilidad disponibles, aunque no siempre fácilmente localizables, y su acceso puede requerir el pago de derechos de uso o de una licencia. El RCM ha tenido un alto grado de éxito y amplia aceptación en algunas industrias donde la seguridad y elevados niveles de confiabilidad son importantes. Sin embargo, hay que reconocer que ha fracasado en otros intentos.
Razones para el fracaso de RCM Hay muchas razones para el fracaso de RCM que incluyen, pero no necesariamente se limitan, a: ♦ Falta de liderazgo y apoyo de la gerencia; ♦ Falta de “visión” del resultado final del programa RCM; ♦ Falta de enunciación clara de las razones para llevar a cabo RCM (se convierte simplemente en otro “plan mensual”); ♦ Falta de los recursos humanos adecuados para llevar a cabo el esfuerzo, especialmente en ambientes minimalistas de operación; ♦ Choque entre las bases proactivas de RCM y la cultura tradicional y altamente reactiva de planta; ♦ Darse por vencido antes de completar; ♦ Errores continuados en el proceso y resultados que no concuerdan con la mentalidad práctica de mantenedores. La mala composición del equipo de trabajo o la falta de entendimiento contribuyen a esto; ♦ Falta de información disponible sobre el equipo / sistema bajo análisis. En la realidad, esto no tiene por qué ser un obstáculo relevante pero generalmente detiene por completo a las personas; ♦ Se genera desilusión cuando las tareas generadas por RCM parecen ser las mismas que ya se encontraban en el programa PM en uso desde hace bastante tiempo. Surgen críticas que apuntan a que éste es un ejercicio que está simplemente demostrando lo que ya se está haciendo; ♦ Falta de éxito temprano medible en el programa RCM. Esto es porque no se tomaron mediciones iniciales, no existía una meta, y no se fueron registrando o tomando mediciones a lo largo del camino; ♦ Los resultados no llegan con suficiente rapidez. Generalmente los impactos de hacer el PM correcto no aparecen inmediatamente y toma tiempo para que aparezcan – típicamente 12 a 18 meses; ♦ No hay ninguna razón apremiante para mantener el impulso o incluso comenzar con el programa; ♦ Se acaban los fondos destinados al programa; ♦ A la organización le falta la habilidad de implementar los resultados del análisis RCM (por ejemplo, falta de un sistema funcional de ordenes de trabajo que gatille ordenes PM en una base predeterminada). Hay un número de soluciones para estos problemas. Una que generalmente funciona es el uso de un facilitador o consultor externo. Un consultor de conocimiento y experiencia ayudará al cliente a navegar estos problemas y mantener el impulso. También se han desarrollado diversos atajos y soluciones prácticas para ayudar a las empresas a superar estos problemas.
Las “versiones” de RCM En una de las versiones metodológicas de RCM, la lógica se usa para probar la validez de un programa PM existente. Un inconveniente de este enfoque es que omite reconocer lo que ya está faltando en su programa PM. Por ejemplo, si su programa PM actual hace uso extendido de análisis de vibración y de análisis termográfico pero de nada más, va a captar adecuadamente todos los modos de falla que resulten en vibraciones o en calor; pero no va a reconocer otros modos de falla que se manifiesten por fisuras, reducción de espesor, desgaste, degradación de propiedad lubricante, deposición de residuos de metal por desgaste, deterioro de acabado de superficie o dimensional, etc. Claramente este programa no cubre todas las posibilidades. En otra de las versiones de RCM, la criticidad se usa para filtrar previamente modos de falla del análisis. Típicamente, los modos de falla ignorados aparecen ya sea en componentes del equipo considerados como no-críticos o los modos de falla y sus efectos son considerados no-críticos, y la lógica
RCM no se aplica. En estos casos, el programa está pasando por alto fallas porque no exceden algún criterio de impacto. Los ahorros surgen porque se reduce el esfuerzo de análisis. Cuando la criticidad se aplica a los modos de falla mismos, el riesgo de causar un problema crítico es relativamente menor. La desventaja de este enfoque es que uno gasta la mayor parte del esfuerzo y costos para llegar a una decisión de no hacer nada – recuerde que estamos aquí en el paso cinco de siete. Por tanto, lo que se ahorra es relativamente poco. Cuando se aplica un filtro de criticidad al equipo, las decisiones de reducir el análisis pueden tomarse antes de que se haga la mayor parte del análisis (en el paso uno). Algunos, pero no necesariamente todos los modos de falla van a ser intuitivamente conocidos por los que están llevando a cabo el análisis de criticidad, pero no van a ser documentados en este momento. Se gasta así poco esfuerzo y se pueden ahorrar costos considerables del programa. Este método va a ser atractivo para aquellas empresas que estén limitando sus presupuestos para estos esfuerzos proactivos. Esta última versión de RCM puede ser totalmente aceptable si las consecuencias de posibles fallas son conocidas y son aceptables para las áreas de producción, mantenimiento, costos, medio ambiente y recursos humanos. Por ejemplo, muchas fallas no tienen más que consecuencias relativamente menores adicionales a la pérdida de producción y discontinuidad del proceso operacional, y sus costos asociados. Los puristas podrían alegar que cualquier otra cosa menos que un RCM completo es irresponsable, porque sin el análisis completo uno está potencialmente ignorando fallas reales y críticas, aun cuando sea inadvertidamente. Esto es de hecho cierto, y es la preocupación que impulsó al SAE a desarrollar el estándar JA-1011. Desgraciadamente también es cierto que muchas empresas sufren de una o más de las razones descritas para el fracaso. Sin la fuerza de ley, los estándares RCM tales como SAE JA-1011, Nowland & Heap y otros son meras guías que pueden o no ser adheridas dependiendo de decisiones tomadas en cada empresa. A menudo estas decisiones las toman aquellos que, aunque a nivel gerencial, no tienen un conocimiento extenso de RCM. Profesionales conocedores o partidarios entusiastas de ser proactivos pueden reconocer cuando sus respectivas plantas exhiben una o más de estas potenciales causas de fracaso. Deberíamos hacer lo posible para mitigar las posibles consecuencias y evitar el riesgo. Como ingenieros y mantenedores responsables, nos podemos encontrar en una situación que exija que comencemos lentamente y vayamos creciendo hasta llegar al RCM completo. El simple hecho de revisar un programa MP existente usando la lógica RCM no va a lograr mucho. Analizar solamente equipo crítico logra más y lo hace cuando más cuenta. Revisar el equipo crítico primero y después ir bajando por la escala de criticidad de nuevo logra más, y es posible que cumpla con todos los objetivos del RCM. Si al verlo de una perspectiva realista llevar a cabo RCM es simplemente demasiado para su empresa, puede que un enfoque alternativo sea más accesible y represente su mejor alternativa. De alguna forma esto reducirá el riesgo y será mucho mejor que quedarse de manos cruzadas.
El RCM dirigido por capacidad Si la lógica RCM progresa desde el equipo a los modos de falla, y después vía la lógica de decisiones a un resultado, ¿podrá ser que el proceso opuesto no contemple muchas de las fallas aún cuando no estén claramente identificadas? ¿Porqué no empezar con las soluciones (de las cuales hay un número finito) y buscar buenos lugares para aplicar esas soluciones? Vale la pena revisar las siguientes preguntas: ♦ ¿Qué tiene de malo usar técnicas existentes de monitoreo sintomático y extender su uso a otras partes del equipo? Si se puede hacer análisis de vibración a algún equipo ¿porqué no hacerlo a otros?
♦
♦
¿Qué tiene de malo fijarse específicamente en fallas de desgaste y simplemente decidir hacer reemplazos basados en el tiempo? Si uno puede identificar las principales áreas de problemas de desgaste ¿porqué no usar esta técnica? ¿Qué tiene de malo operar equipo stand-by (redundante) para asegurar que funcione cuando sea requerido, y así llevar a cabo una “tarea de detección de falla”?
Las respuestas concretas a estas tres preguntas son: se corre el riesgo de excederse en el mantenimiento de algunas partes del equipo; se puede no tomar en cuenta algunos modos de falla y sus acciones de mantenimiento debido a la falta de rigor; se pierden oportunidades de rediseño. Sin embargo, sí aprovecha sus capacidades para efectuar MP y se apega de cerca a principios RCM como vía para escalar hacia la implantación completa de RCM. Denominamos este enfoque RCM dirigido por capacidad o CDRCM. Un mantenedor puede dar pasos basado en lo anterior que ayudarán a mitigar consecuencias de fallas. Cuando se demuestre el éxito, esos pasos pueden conducir a que el mantenedor gane suficiente influencia como para extender su enfoque proactivo hacia incluir análisis RCM. Este enfoque no está orientado a evitar, o actuar como atajo para el RCM, sino más bien es un paso preliminar que generará resultados positivos que no son inconsistentes con RCM y sus objetivos. El enfoque CD-RCM que logrará esto es el siguiente: ♦ Asegúrese que su sistema de Ordenes de Trabajo MP realmente funciona – es decir, que las ordenes de trabajo MP puedan ser gatilladas automáticamente, que las ordenes de trabajo se liberan, y que se ejecutan según programa. (Si esto no ocurre, pare de leer aquí. Necesita ayuda más allá del alcance de este manual); ♦ Identifique su inventario de equipo / activos (esto es parte del primer paso del RCM), ♦ Identifique las técnicas de monitoreo sintomático disponibles que puedan ser usadas (lo que está probablemente limitado por la capacidad de su planta), ♦ Determine los tipos de modos de fallas que cada una de estas técnicas pueden revelar; ♦ Identifique los equipos donde estos modos de falla son d ominantes; ♦ Decida cuales son las frecuencias apropiadas para estas tareas de monitoreo e impleméntelas en su sistema de ordenes de trabajo MP; ♦ Identifique el equipo que tiene modos de falla de desgaste dominantes; ♦ Programe el reemplazo periódico de estos componentes de desgaste y de aquellos otros que se ven comprometidos en reemplazos como mantenimientos basados en tiempo usando su sistema de órdenes de trabajo MP; ♦ Identifique todo su equipo stand-by y sistemas de seguridad (alarmas, sistemas de paro, equipo stand-by redundante, sistemas de respaldo, etc.). Estos son equipos y sistemas que están normalmente inactivos hasta que ocurre algo que gatilla su uso; ♦ Determine pruebas apropiadas para operar periódicamente este equipo tal que se revelen las fallas detectables, e impleméntelas en su sistema de ordenes de trabajo MP; ♦ Examine las fallas que se presentan luego de poner en marcha el programa de mantenimiento, para determinar la causa-raíz de las fallas y llevar a cabo acciones apropiadas para eliminar esas causas o sus consecuencias. El resultado de aplicar este enfoque CD-RCM puede parecerse a lo siguiente: ♦ Uso extensivo de técnicas sintomáticas como: análisis de vibración, análisis de lubricante / aceite, inspecciones visuales y algunas pruebas no-destructivas. ♦ Uso limitado de reemplazos por tiempo y “overhauls”. ♦ En plantas que tengan altos niveles de redundancia, cambios cotidianos entre equipos, del A al B y de vuelta, posiblemente combinado con nivelación de las horas operativas. ♦ Programa extendido de pruebas de sistemas de seguridad. ♦ Captura sistemática de información de fallas que ocurren y el análisis de esa información y las fallas en sí para determinar sus causas-raíces y las acciones para eliminarlas.
Aún cuando este enfoque no logra todos los resultados que lograría el análisis RCM completo, está basado en los principios RCM y pondrá a la organización en el camino a ser más proactiva. CD-RCM está orientado a construir sobre éxitos iniciales con métodos probados enfocados en áreas donde hacen sentido, tal que se gane credibilidad e incremente la viabilidad de implantación de RCM completo.
¿Cómo se decide? Se puede ver que RCM significa mucho trabajo y que llevarlo a cabo puede ser costoso. Existen alternativas que son menos rigurosas. Puede que sea enfrentado al desafío de justificar los costos asociados a un programa completo RCM, y que no sea capaz de decir con seguridad cuáles serán los ahorros que se van a lograr. Esta es una situación difícil de afrontar, y cada situación tendrá sus propias peculiaridades y personalidades con las que haya que lidiar. RCM es el enfoque más exhaustivo y completo que podría tomarse para determinar los enfoques correctos de mantenimiento proactivo para lograr alta confiabilidad de sistemas. Es costoso y consume bastante tiempo – los resultados, aunque impresionantes, pueden tardar en aparecer. Generalmente este tiempo es suficiente para que RCM no exceda los ciclos de decisión acostumbrados en el mundo moderno de inversiones de negocio. La simple revisión de su programa MP con enfoque RCM no es una alternativa real para un gerente responsable - se arriesga a omitir demasiadas cosas que podrían ser críticas, o significativas para el medio ambiente o la seguridad. RCM simplificado (o “Lite”) puede ser apropiado para ambientes industriales en los cuales se reconoce y usa la criticidad para guiar esfuerzos de análisis usando los recursos o tiempo limitados de que se dispone. Esto logrará los resultados RCM deseados en un subconjunto menor pero bien dirigido de modos de falla en los equipos y sistemas críticos. Donde la inversión RCM no sea opción, la alternativa es llegar a ella usando CD-RCM que le agrega un poco de lógica al enfoque tradicional de conseguir una nueva tecnología y aplicarla en todas las áreas. En CD-RCM tomamos una medida de lo que podemos hacer ahora, nos aseguramos que lo estamos aplicando lo más ampliamente posible, y demostramos el éxito cumpliendo con el nuevo programa. Después de demostrar el éxito, se puede expandir el programa usando ese éxito como “evidencia” de que funciona y produce los resultados deseados. Eventualmente, RCM podrá usarse para asegurar que el programa está completo.
La lista de verificación de decisiones del RCM Se deben responder un número de preguntas y evaluar varias alternativas para determinar si RCM es lo correcto para usted. Estas preguntas están planteadas a lo largo de este capítulo, pero están resumidas aquí para tenerlas como referencia: 1. ¿Puede su planta u operación vender todo lo que produce? Si la respuesta es sí, entonces alta confiabilidad es importante, RCM debería ser considerado, y debería saltar a la pregunta cinco. Si la respuesta es no, entonces necesita enfocarse a medidas de reducción de costos. 2. ¿Hay un desempeño inaceptable en seguridad o impacto ambiental? Si la respuesta es sí, entonces RCM es probablemente para usted – avance a la pregunta cinco. 3. ¿Tiene ya un extenso programa de mantenimiento preventivo en operación? Si la respuesta es afirmativa, puede beneficiarse de RCM si los costos del programa son inaceptablemente altos. Si la respuesta es no, también puede beneficiarse de RCM si sus costos de mantenimiento son relativamente altos con relación a la competencia.
Cuando la inversión RCM completo no es opción, hay otras opciones como “RCM Lite” o RCM por capacidad (CD-RCM) que pueden ser solución para su operación en el corto plazo.
4.
¿Son altos sus costos de mantenimiento en relación con otros en su negocio? Si su respuesta es afirmativa, entonces avance a la pregunta cinco. Si no lo es, entonces probablemente no se beneficiará de RCM y puede parar aquí.
En este punto, ya tiene una o varias de las siguientes: Una necesidad de alta confiabilidad; ♦ Problemas de seguridad o medio ambientales; ♦ Un programa MP costoso y de bajo rendimiento o; ♦ Ningún programa significativo de PM y altos costos generales de mantenimiento. ♦ 5.
RCM es para usted. Necesita asegurarse que su organización está lista para ello. ¿Tiene ya un ambiente de mantenimiento “controlado”, donde la mayor parte del trabajo es predecible y planificado y en el cual puede esperar confiadamente que trabajo planificado, como MP o MPd, se va a efectuar según programa? Si la respuesta es sí, pasa la prueba básica para ver si está listo – su ambiente de mantenimiento está bajo control – y puede seguir a la pregunta seis. RCM no funcionará bien si no lo puede llevar a cabo en un ambiente controlado. Si no puede, necesita ayuda más allá de lo que RCM por sí solo puede hacer. Busque ayuda para tomar control de sus actividades de mantenimiento antes de seguir adelante.
Necesita RCM y su organización está ya bajo control – está listo. Ahora necesita aprobación para llevarlo a cabo. Si puede directamente aprobar, entonces hágalo. Si no: 6.
7.
¿Puede conseguir el apoyo de la alta gerencia para la inversión de tiempo y dinero en la capacitación y piloto e implantación de RCM? Si es así, entonces está listo para RCM y RCM está preparado para su caso – pare aquí, su decisión está hecha. Si no, entonces necesita considerar alternativas al RCM completo – proceda a la pregunta 7. ¿Puede conseguir el apoyo de la alta gerencia para la inversión de tiempo y dinero en la capacitación y piloto de RCM “Lite”? Esta inversión requerirá cerca de un mes de tiempo de su equipo de trabajo (5 personas), más un consultor por el mes. Si puede, entonces debería considerar el uso del método RCM “Lite” para demostrar éxito antes de implantar RCM en toda la organización. Puede parar aquí – su decisión ya está hecha. Si no es así, enfrentará el desafío de demostrar éxito con un enfoque menos exhaustivo que requiera poca inversión inicial y use capacidades existentes. La alternativa que aún queda es la de CD-RCM y un crecimiento gradual del éxito y credibilidad para expandirlo.
capítulo cuatro
El problema de la incertidumbre Que hacer cuando sus planes de confiabilidad no se ven muy confiables Por Murray Wiseman Cuando se está enfrentado la incertidumbre nuestra reacción humana instintiva es a menudo la indecisión y angustia. Todos preferiríamos que la oportunidad y resultado de nuestras decisiones fuesen conocidos con certeza. Puesto de otra manera, nos gustaría que todo problema y su solución fuese determinístico. Los problemas en los cuales la oportunidad y resultado de una acción dependen del azar se conocen como probabilísticos o estocásticos. Sin embargo, en mantenimiento no podemos ignorar dichos problemas ya que la incertidumbre es inevitable. Más bien, nuestra meta es cuantificar incertidumbres asociadas con decisiones significativas de mantenimiento, para revelar el curso de acción más apropiado para lograr nuestro objetivo. Los métodos descritos en este capítulo no solo lo ayudarán a lidiar con la incertidumbre sino que pueden, esperamos, persuadirlo a que trate este fenómeno como a un aliado más que como a un enemigo. A cuántos nos han dicho desde la niñez que “el fracaso es la madre del éxito” y que “a partir de los errores se aprende”. En ningún otro lugar es esta sabiduría popular más valorada que en un departamento de mantenimiento que usa herramientas de ingeniería de confiabilidad. En un ambiente tan iluminado, las fallas – un hecho impersonal de la vida – pueden ser tratadas y convertidas a conocimiento valioso seguido de acción productiva. Para obtener esta elevada, pero alcanzable meta en las operaciones, requerimos un sólido enfoque cuantitativo para lidiar con incertidumbre en mantenimiento. Por esta razón, comencemos el ascenso en tierra sólida – el fácilmente conceptuado histograma de frecuencia relativa de fallas pasadas.
Las cuatro funciones básicas En esta sección descubriremos el Histograma de Frecuencia Relativa y las cuatro funciones básicas: 1) la función de Densidad de Probabilidad; 2) la función de Distribución Acumulativa; 3) la función de Confiabilidad; y 4) la función d e Riesgo. Asuma que de una población de 48 ítems comprados y puestos en servicio a principio del año todos han fallado al llegar Noviembre. Haga una lista de fallas según oportunidad como se muestra en figura 18. Agrúpelas en segmentos convenientes de tiempo, en este caso meses. Diagrame el número de fallas en cada segmento como en la figura 19. Las barras altas del centro representan los tiempos más “populares” o probables de falla. Sumando el número de fallas que ocurrieron antes de abril, 14, y dividiendo por el número total de la población, 48, podemos estimar que la probabilidad acumulativa de que el ítem falle en el primer trimestre del año es de 14/48. La probabilidad de que todos los ítems fallen antes de Noviembre es 48/48 o 1.
Figura 18: Fallas mensuales para 48 ítems en servicio
s a l l a f e d o r e m ú N
Tiempo de la falla Figura 19: Histograma de edades de las fallas Para transformar el número de fallas en probabilidades, el histograma de frecuencias relativas puede ser convertido a una forma matemática más útil llamada la función de densidad de probabilidad (PDF). Para lograrlo, los datos son diagramados nuevamente tal que el área bajo la curva represente la probabilidad acumulativa de falla como se muestra en la figura 20. (La manera en que se calcula la PDF y como se dibuja será discutida de manera más extensa en el capítulo 5.) El área total bajo la curva de la función de densidad f(t) es 1, ya que tarde o temprano el ítem fallará. La probabilidad de que el componente falle antes de o en el tiempo t es igual al área bajo la curva entre 0 y el tiempo t. Esta área es F(t), la función de distribución acumulativa (CDF). Es conclusión directa entonces que el área restante (sombreada) es la probabilidad de que el componente sobreviva hasta el tiempo t, y es conocida como la función de confiabilidad, R(t). La R(t) puede ser trazada por sí sola en función del tiempo. Si se hace así, el tiempo medio entre falla (TMEF) es el área bajo la curva de Confiabilidad o R(t)dt [ref. 1]. De la función de confiabilidad R(t) y la función de densidad f(t) podemos derivar una cuarta función útil, la tasa de falla o función de riesgo, h(t) = f(t)/R(t), que puede ser representada gráficamente como en la figura 21. La función de riesgo es la probabilidad instantánea de falla a un tiempo dado t.
Area R(t) es la probabilidad de que el ítem sobreviva el tiempo t. Area f(t) es la probabilidad de falla antes de o en el tiempo t.
Densidad de Probabilidad, probabilidad acumulativa y función de confiabilidad
Figura 20:
Resumen En sólo unos cortos párrafos hemos aprendido las cuatro funciones básicas en la ingeniería de confiabilidad: la PDF o función de densidad de probabilidad f(t); la CDF o función de distribución acumulativa F(t); la función de confiabilidad R(t); y la función de riesgo h(t). Conociendo cualquiera de éstas, podemos derivar las otras tres. Armados con estos conceptos estadísticos fundamentales, podemos salir a combatir con el azar de la ocurrencia de fallas a través de nuestra planta. A pesar de que las fallas son eventos aleatorios, podremos, no obstante, descubrir cómo determinar los mejores momentos para realizar mantenimiento preventivo y las mejores políticas de mantenimiento de largo plazo. Habiendo estimado “con confianza” (es decir con un nivel dado y aceptable de confianza estadística) la PDF (por ejemplo), nos basaremos en ella o en sus funciones hermanas para construir modelos de optimización. Los modelos describen situaciones típicas de mantenimiento representándolas en ecuaciones matemáticas. Esto es muy conveniente si deseamos optimizar el modelo. El objetivo de optimización es generalmente lograr el menor costo global, promedio, y de largo plazo de mantenimiento de nuestro equipo de producción. Discutiremos y crearemos modelos en los capítulos 5 y 6.
Distribuciones típicas En la sección anterior definimos las cuatro funciones claves que podemos aplicar a nuestros datos cuando de alguna forma los hemos transformado en una distribución de probabilidad. El paso requerido para convertir o ajustar los datos es el tema de esta sección. ¿Cómo encuentra uno la PDF apropiada para un componente o sistema real? Hay dos enfoques posibles para este problema: 1. Trace la curva de mejor ajuste a datos obtenidos del ciclo de vida del equipo, o 2. Haga una hipótesis de que será una cierta función paramétrica, cuyos parámetros puedan ser estimados por medio de técnicas estadísticas de muestreo y de la realización de numerosas pruebas de confianza. Este enfoque será el que adoptaremos. Afortunadamente, encontramos de observaciones de fallas en el pasado que las funciones de densidad de probabilidad (y por tanto sus funciones derivadas de confiabilidad, distribución acumulativa y función de riesgo) de datos reales generalmente satisfacen alguna de un conjunto de formulas matemáticas cuyas características ya son familiares para los ingenieros de confiabilidad. Estas distribuciones conocidas incluyen la exponencial, la de Weibull, la Lognormal y la Normal. Estas pueden ser completamente especificadas si podemos estimar sus parámetros. Por ejemplo, la CDF de Weibull es:
F(t) = 1 – e-(t/ ) , donde t ≥ 0 Los parámetros β y η pueden estimarse de los datos usando métodos a describir. Una vez estimados con confianza sus parámetros, podremos procesar nuestros datos de falla y reemplazo vía alguna de las distribuciones conocidas. Hacemos esto manipulando las funciones estadísticas que aprendimos en la sección anterior para: a) entender nuestro problema; y b) pronosticar fallas y analizar riesgos para tomar mejores decisiones de mantenimiento. Estas decisiones van a impactar la oportunidad que elijamos para reparar, reemplazar o reacondicionar maquinaria, así como ayudarnos a optimizar muchas otras decisiones de mantenimiento. La clave es triple: 1) recolectar buenos datos; 2) elegir la función apropiada que represente nuestra propia situación, y luego estimar los parámetros de la función; y finalmente 3) evaluar el nivel de confianza que podamos tener en el modelo resultante. Hay softwares modernos que hacen este proceso fácil y entretenido. El software de confiabilidad sin embargo es mucho más que un juguete para ingenieros, ya que nos entrega la capacidad de comunicar y compartir con nuestra gerencia la meta común de negocio – idear
y seleccionar procedimientos que minimicen costos y riesgo a la vez que mantienen o incrementan el volumen y calidad de productos. Las cuatro funciones de tasa de falla o funciones de riesgo correspondientes a las cuatro funciones de densidad (exponencial, Weibull, lognormal, y normal) se muestran en la figura 21.
Exponencial
Weibull
Figura 21: Curvas de función de
Lognormal
Normal
riesgo para las distribuciones de fallas comunes
De las cuatro funciones, los datos observados generalmente se aproximan más a la distribución de Weibull. Esto es afortunado – y fue subestimado por el mismo Waloddi Weibull quien dijo al presentar su ensayo clave en 1951 “...puede que alguna vez rinda un buen servicio”. La reacción a su ensayo varió del escepticismo hasta el rechazo directo. A la larga, como con todas las buenas ideas que caen en tierra fértil y florecen, la Fuerza Aérea de Estados Unidos reconoció y financió la investigación de Weibull por los posteriores 24 años hasta 1975. Hoy el Análisis Weibull es el método líder en el mundo para cálculos sobre datos de ciclo de vida [ref. 3]. El objetivo de este capítulo es atraer la atención de profesionales de mantenimiento hacia tales métodos de toma de decisiones, y mostrar que son esfuerzos válidos y provechosos para la administración de activos físicos de su empresa.
Un ejemplo Concretemos estos conceptos usando un ejemplo que ilustra como uno puede extraer información significativa de datos de fallas. Asúmase que hemos determinado (usando métodos a discutir más adelante en este capítulo y en el capítulo 7) que cierto componente eléctrico tiene una función de distribución acumulativa exponencial, F(t) = 1- e -λt, donde λ = 0.0000004 hrs. – 1. Tenemos entonces que responder lo siguiente: (a) ¿Cuál es la probabilidad de que una de estas piezas falle antes de 15,000 horas de uso? (b) ¿Cuánto tiempo debemos esperar para alcanzar un 1% de fallas?
(a) F(t) = 1- e- t = 1 – e -0.0000004 x 15,000 = 0.001 = 0.6% Reordenando
(b) t = -ln(1 – F(t))/ = ln(1 - .01)/.0000004 = 25.126 hrs. (c) ¿Cuál sería el tiempo medio entre falla (TMEF)?
(c) TMEF = R(t)dt = e- tdt = 1/ = 250,000 hrs.
(d) ¿Cuál sería la mediana del tiempo medio entre falla (el tiempo en el cual la mitad de la población ha fallado)?
(d) F(T50) = 0.5 = 1- e -
t
50
T50 = ln2/ = 0.693/.0000004 = 1,732,868 hrs. Este es el tipo de información que podemos esperar examinando los datos vía principios de ingeniería de confiabilidad incorporados en el software. Continúe la lectura para ver como hacerlo.
Consideraciones de la vida real – el problema de los datos Irónicamente, a menudo dejamos que la poca información requerida para gestión de confiabilidad se nos escape entre los dedos mientras perseguimos implacablemente el siempre elusivo control sobre los costos de mantenimiento de nuestra planta y equipo productivo. La administración de los datos es el primer paso hacia una gestión de activos físicos exitosa. Buenos datos personifican una rica experiencia de la cual uno puede aprender – y por ende mejorar – el actual proceso de gestión de mantenimiento de su empresa. Un rol esencial de la alta gerencia es poner amplios recursos computacionales y métodos científicos en manos de profesionales de mantenimiento que han sido entrenados para recolectar, filtrar, y procesar datos con el propósito explícito de guiar las decisiones. La intención de este capítulo es inspirar a mantenedores, planificadores, ingenieros, y gerentes a recolectar de manera seria y continua sus propios datos de mantenimiento y reemplazo, con un renovado entendimiento de su alto valor para el resultado final de su organización.
Irónicamente, a menudo dejamos que la poca información requerida para gestión de confiabilidad se nos escape entre los dedos mientras perseguimos implacablemente el siempre elusivo control sobre los costos de mantenimiento de nuestra planta y equipo productivo. Sin duda el primer paso en cualquier actividad que mire hacia el futuro es obtener buena información. En importancia, este paso pesa más que los pasos de análisis subsecuentes que pueden parecer triviales por comparación. La historia de la humanidad es una de progreso construido sobre la base de sus experiencias. Sin embargo, han habido incontables momentos en que se han derrochado oportunidades por omitir la recolección y procesamiento de datos que estaban disponibles. Hoy, desgraciadamente, muchos departamentos de mantenimiento caen en esa categoría. Por esto una de las métricas más importantes usadas en el Centro de Excelencia de Gestión de Mantenimiento de PricewaterhouseCoopers para hacer benchmarks relativos a mejores prácticas clase mundial de la industria, es la medida en que datos son retro-alimentados para guiar sus decisiones, tácticas y políticas de mantenimiento. A continuación se dan ejemplos de decisiones basadas en gestión de datos de confiabilidad: Un planificador de mantenimiento detecta tres fallas durante operación de un componente en ♦ un período de tres meses. Para prever la planificación de suficiente mano de obra disponible el superintendente pregunta, “¿Cuántas fallas va a tener en el próximo trimestre?” Para ordenar repuestos y programar la mano de obra de mantenimiento, ¿Cuántas cajas de ♦ cambio van a ser devueltas a bodega para reacondicionamiento por cada modo de falla en el próximo año? Un sistema de tratado de efluente requiere una detención regulatoria para ♦ reacondicionamiento cada vez que el nivel contaminante excede un límite tóxico por más de 60 segundos en un mes. ¿Qué nivel y frecuencia de mantenimiento se requiere para evitar interrupciones de producción de este tipo? Después de una modificación de diseño para eliminar un modo de falla, ¿Cuántas unidades ♦ deben probarse y por cuánto tiempo para verificar que ese modo de falla ha sido eliminado, o significativamente mejorado con una confianza de 90%? Las transmisiones de una flota de camiones de extracción se reacondicionan rutinariamente a ♦ las 12,000 horas según lo estipulado por el fabricante. Un número de fallas ocurre antes del
♦
♦
reacondicionamiento. ¿Por cuanto se debería adelantar o retrasar el reacondicionamiento reacondicionamiento para reducir los costos promedios de operación? El costo de producción perdida es cuatro veces el costo de reemplazo preventivo de un componente desgastado. ¿Cuál es la frecuencia óptima de reemplazo? Los valores fluctuantes de hierro y plomo en el análisis trimestral de aceite de transmisiones de 35 camiones de extracción, así como los tiempos de falla de las 35 unidades en los últimos tres años, están disponibles en la base de datos. datos. ¿Cuál es el momento momento óptimo de reemplazo, dadas las edades de las unidades y los últimos resultados de laboratorio de los niveles de hierro y plomo? (Este problema será examinado en el capítulo 6.)
Vale la pena sin duda, por tanto, implantar procedimientos que registren datos de vida a nivel de sistema y, donde se justifique, a nivel de componente. componente. Los datos de vida de un componente o sistema dado comprenden los registros de reemplazo reemplazo preventivo y la temporalidad temporalidad de fallas. fallas. Cuando un mantenedor reemplaza un componente, digamos una bomba hidráulica, una de las tantas idénticas de un equipo cuya disponibilidad es crítica para la operación de la empresa, debería indicar cuál fue la bomba específica que falló. Más aún, debería especificar como como falló (el modo de falla), falla), por ejemplo ejemplo “fugando” o una “insuficiencia de presión presión o volumen”. Dado que las horas de operación del equipo se conocen, la vida útil de componentes individuales críticos críticos puede ser calculada y monitoreada vía vía software. Esta información se convertirá en parte valiosa del activo intelectual de la empresa – la base de datos de confiabilidad.
Datos censurados o suspensiones Un problema inevitable en el análisis de datos es que al momento de hacer nuestras observaciones y análisis, no todas las unidades habrán fallado. Conocemos la edad de las unidades que actualmente actualmente no han fallado, y sabemos también que todavía están en un estado de no-falla, pero no sabemos (obviamente) la edad a la que van a fallar. fallar. Algunas unidades pueden haber sido reemplazadas reemplazadas de manera manera preventiva. En estos casos tampoco sabemos la edad de falla. Se dice que estas unidades están suspendidas o simplemente censuradas. Si bien no es estadísticamente estadísticamente ideal, aún podemos hacer uso de estos estos datos, ya que sabemos que las unidades han durado por lo menos todo este este tiempo. Buenos softwares de confiabilidad, confiabilidad, como Winsmith para Windows, RelCode, y EXAKT descritos en el capítulo 5 y 6, pueden manejar en forma apropiada el tema de datos suspendidos.
Uno de los problemas inevitables de administrar este tipo de datos es que al momento de d e nuestras observaciones y análisis, no todas las las unidades van a haber fallado. Conocemos las edades actuales de las unidades que no han fallado, pero no conocemos la edad de falla.
Referencias: 1. Introducción a la Ingeniería de Confiabilidad y de Mantenibilidad , Charles E. Ebeling, ISBN 007-018852-1, 1997. 2. Confiabilidad de Sistemas y Análisis de Riesgos , Ernst G. Frankel. 3. El Nuevo Manual de Weibull segunda edición, Robert B. Abernethy. 4. www.barringer1.com.
capítulo cinco
Optimizar mantenimiento por tiempo Herramientas para diseñar un sistema de reemplazos para sus componentes críticos Por Andrew K.S. Jardine La meta de este capítulo es introducir herramientas que pueden ser usadas para deducir decisiones óptimas de mantenimiento y reemplazo. Se pondrá especial atención en establecer el período óptimo de reemplazo para componentes críticos (también conocidos como unidades de reemplazo, o LRUs) dentro de un sistema. Miraremos también también estrategias de reemplazo por edad y por bloques a nivel nivel de LRU. Esto permite introducir el paquete de software RelCode como herramienta para ayudar a gerentes de mantenimiento a optimizar sus decisiones decisiones de mantenimiento mantenimiento de LRU. Además daremos una mirada mirada a los criterios criterios de optimización de minimización de costos, maximización de disponibilidad, y requerimientos de seguridad.
Aumentar la confiabilidad vía el reemplazo preventivo La confiabilidad del equipo puede incrementarse reemplazando en forma preventiva componentes críticos dentro en momentos apropiados. Determinar cuál es el momento momento apropiado depende del objetivo general, tal como la minimización minimización de costos o la maximización maximización de disponibilidad. Aún cuando el mejor momento para reemplazo preventivo puede ser el mismo para ambos casos, la minimización de costos y la maximización maximización de disponibilidad, no es necesariamente así. Hay que obtener y analizar los datos antes de poder identificar el mejor momento momento de reemplazo preventivo. En este capítulo se presentarán varios procedimientos de optimización que pueden usarse fácilmente para establecer tiempos óptimos de reemplazo preventivo de componentes críticos.
Políticas de reemplazo por bloques La política de reemplazo por bloques es algunas veces denominada política de grupo o de intervalo constante, ya que el reemplazo preventivo ocurre en intervalos fijos de tiempo con reemplazos por falla ocurriendo cada vez que sea necesario. La política se ilustra en la figura 22, en la cual Cp y Cf son los costos totales asociados con reemplazo preventivo y por falla respectivamente, y t p es el intervalo fijo entre reemplazos preventivos. En la figura se puede ver que durante el primer primer ciclo no hay fallas, mientras mientras que hay dos en el segundo, y ninguna en el tercero o cuarto.
Cf
Nuevo Item
Cf
Cp
tp
Cp
tp
Cp
tp
La política de reemplazo preventivo por intervalo Figura 22: Política de reemplazo por bloques
Cp
tp
t
A medida que se incremente el intervalo entre reemplazos preventivos habrá mayor cantidad de fallas en cada intervalo, y la optimización se logra al obtener el mejor balance entre la inversión en reemplazos preventivos y las consecuencias de falla. Este caso se ilustra en la figura 23 para un criterio de minimización de costos, donde C(t p) es el costo semanal total asociado a la política de reemplazo preventivo de componentes en un intervalo fijo de tiempo t p, con reemplazos por falla cada vez que sea necesario. La ecuación de la curva de costo costo total puede encontrarse en varios textos, incluyendo Duffuaa, Raouff, y Campbell [ref. 1].
Costo total por semana C(tp)
Reem lazo or falla a n a m e S / $
Reemplazo preventivo
Intervalo optimo de reemplazo preventivo
Conflictos Conflictos de costos del reemplazo reemplazo preventivo preventivo
Figura 23:
Política por bloques: líneas optimas de reemplazo
El próximo problema se ha resuelto usando el paquete de software RelCode, que incorpora el modelo de costos para establecer el mejor intervalo entre reemplazos preventivos.
Enunciado del problema Se ha determinado que la ocurrencia de fallas del rodamiento de ventilador usado en los motores diesel se comporta según una distribución de Weibull, con una vida media de 10,000 Km y una desviación estándar de 4,500 km. La falla del rodamiento en operación operación es costosa y, en total, un reemplazo por falla falla es 10 veces más caro que un reemplazo preventivo. Necesitamos determinar determinar el intervalo óptimo de reemplazo reemplazo preventivo (o política de bloque) para minimizar minimizar el costo total total por kilómetro. ¿Cuál es el ahorro de costos asociado a la po lítica óptima vs. una política d e correr-a-la-falla? Dado que el costo de falla es de $200,000, ¿cuál es el costo por kilómetro asociado a la política óptima?
Resultado La figura 24 muestra un “pantallazo” de RelCode, donde se puede apreciar que el período óptimo de reemplazo preventivo es de 4,140 km. La figura provee además mucha información información adicional que puede ser valiosa para el planificador planificador de mantenimiento. mantenimiento. Por ejemplo:
Figura 24: Salida de RelCode: reemplazo por bloques
♦ ♦
El ahorro comparado a una política de correr-a-la-falla es: $0.1035/km (55.11%) El costo por kilómetro asociado a la mejor política es: $0.0843/km
Políticas de reemplazo por edad La política de reemplazo por edad es donde el tiempo de reemplazo preventivo depende de la edad del componente. Si ocurre un reemplazo por falla, entonces el reloj registrador vuelve a cero, lo que difiere con la política de reemplazo por bloques. La figura 25 ilustra una política por edad, donde podemos ver que no hay fallas en el primer ciclo. Después de la primera falla, el reloj vuelve a cero y el componente alcanza su edad de reemplazo preventivo planeado, t p. Después de este segundo reemplazo preventivo, el componente nuevamente sobrevive hasta la edad de reemplazo preventivo planificado.
Cf
Nuevo Item
Cp
tp
Cp
tp
Cp
tp
La política de reemplazo preventivo por intervalo Fi ura 25: Política de reem
lazo or edad
t
Las consecuencias de costo en conflicto asociadas con esta política son idénticas a aquellas mostradas en la figura 23, excepto que el eje de abscisas - x mide la edad real (o utilización) del ítem, en vez de un intervalo fijo de tiempo. El próximo problema se ha resuelto usando el paquete de software RelCode, que incorpora el modelo de costos para establecer el mejor intervalo entre reemplazos preventivos.
Enunciado del problema La centrífuga de una refinería de azúcar es una máquina compleja compuesta de muchas partes y sujeta a fallas repentinas. Un componente en particular, el brazo seleccionador, es considerado candidato a reemplazo preventivo. La política que hay que considerar es por edad, con reemplazos preventivos que ocurran cuando el brazo seleccionador alcance una edad específica. ¿Cuál es la política óptima para minimizar el costo por hora? Para resolver este problema se han reunido los siguientes datos: 1. Los costos de mano de obra y materiales asociados con un reemplazo preventivo o por falla son de $2000; 2. El valor de pérdidas de producción asociadas con reemplazo preventivo es de $1000, mientras que con reemplazo por falla es de $7000; 3. La distribución de fallas del brazo seleccionador se describe adecuadamente por una distribución Weibull con vida media de 152 horas y desviación estándar de 30 horas.
Resultado La figura 26 muestra un “pantallazo” de RelCode, donde la edad óptima de reemplazo preventivo de la centrífuga es de 112 horas. La figura también entrega información clave que puede ser usada por el planificador de mantenimiento. Por ejemplo, podemos ver que la política óptima cuesta un 45.13% del costo asociado a una política de correr-a-la-falla, y por tanto está claro que reemplazo preventivo es una táctica de mantenimiento muy útil. Además, la curva de costo total es relativamente plana en la región entre las 90 y las 125 horas, y de esta manera concede flexibilidad al programador de mantenimiento para planificar reemplazos preventivos.
Figura 26: Salida de RelCode: reemplazo basado en la
edad
Cuándo usar reemplazo por bloques en vez de por edad El reemplazo por edad puede parecer más atractivo que el reemplazo por bloque, ya que un componente recién instalado nunca es reemplazado de manera preventiva. Siempre se permite que el componente permanezca en servicio hasta su edad programada de reemplazo preventivo. Sin embargo, la implantación de una política por edad requiere que se mantenga un registro de la edad real de componentes, y que si ocurre una falla el tiempo esperado de reemplazo preventivo sea cambiado. Claramente, para componentes costosos va a ser económicamente justificable monitorear la edad de un ítem y aceptar la reprogramación del tiempo de reemplazo. Para componentes que no son costosos, puede ser apropiado adoptar una política de fácil implantación como la de reemplazo por bloques; sabiendo que al momento de efectuar los reemplazos preventivos la unidad que esté siendo reemplazada pueda ser bastante nueva debido a su reciente instalación a causa de un reemplazo por falla. Este compromiso es obviado por software moderno de gestión de activos, que puede convenientemente hacer seguimiento de edades operativas de componentes si es notificado de eventos de falla y reemplazo.
Establecer políticas de mantenimiento basadas en tiempo Restricciones de seguridad: hasta ahora, la discusión ha presumido que el objetivo era establecer el mejor momento para reemplazar un componente de manera preventiva, tal de minimizar el costo total. Si la meta es asegurar que la probabilidad de falla antes del próximo reemplazo preventivo no exceda un valor particular, como por ejemplo un cinco por ciento, entonces el tiempo para programar un reemplazo preventivo puede obtenerse de la distribución de falla como se ilustra en la figura 27. Es decir, simplemente necesitamos identificar en el eje de las abscisas el tiempo que corresponde a un valor de cinco por ciento en el eje de las ordenadas.
Figura 27: Edad óptima de reemplazo: mantenimiento basado en riesgo
Minimización de costos y maximización de disponibilidad: En la discusión de arriba, el objetivo era la minimización de costos. La maximización de disponibilidad simplemente requiere que, en los modelos, el costo total de reemplazos preventivos o por falla sea reemplazado por el tiempo total de detención asociado con reemplazos preventivos o el tiempo total de detención asociado a reemplazo por falla. La minimización del tiempo total de detención es, entonces, equivalente a la maximización de disponibilidad. Los lectores que deseen trabajar con una variedad de problemas usando RelCode pueden hacerlo obteniendo una versión de demostración del software contactando al autor [ref. 2]. Referencias: 1. 2.
Duffuaa S.O., Raouff A., Campbell J.D., Planificación y Control de Sistemas de Mantenimiento , Wiley 1998. Lectores pueden contactar al autor vía correo electrónico a
[email protected].
capítulo seis
Optimizar mantenimiento sintomático Aprovechando el equipo al máximo antes de una reparación Por Murray Wiseman El Mantenimiento Sintomático o Basado en Condición (CBM) es obviamente una muy buena idea. Surge del supuesto lógico de que las reparaciones o reemplazos preventivos de equipos o sus componentes estarían óptimamente programadas si se dieran justo antes de la ocurrencia de falla. Nuestro objetivo es obtener la máxima vida útil de cada uno de los activos físicos antes de sacarlo de servicio para efectuar reparaciones preventivas. La traducción de esta idea en un programa de monitoreo efectivo se ve bloqueada por dos dificultades. La primera es: cómo seleccionar de la multitud de parámetros de monitoreo aquellos que con más certeza pueden indicar el estado de salud de la máquina. La segunda es: cómo interpretar y cuantificar la influencia de mediciones en el resto de vida útil (RUL) de maquinaria. En este capítulo tomaremos en cuenta ambos problemas. Las preguntas esenciales que se hacen al implementar un programa sintomático (CBM) son: 1. ¿Porqué monitorear? 2. ¿Cuáles componentes del equipo monitorear? 3. ¿Cómo monitorear (qué parámetros)? 4. ¿Cuándo monitorear? 5. ¿Cómo interpretar y actuar basado en los resultados del monitoreo de condición? Según la descripción del capítulo tres, el mantenimiento basado en confiabilidad (RCM) nos ayuda a responder las preguntas 1 y 2. Se requieren métodos adicionales de optimización para responder las preguntas 3, 4 y 5. En los capítulos 4 y 5 aprendimos que la manera de enfrentar estos problemas es construir un modelo que describa los costos de mantenimiento y la confiabilidad de un ítem. En el capítulo 5 lidiamos únicamente con situaciones en que las vidas de componentes eran consideradas variables aleatorias independientes, lo que implica que para programar el mantenimiento preventivo solo se debería utilizar la edad del equipo. El CBM introduce nueva información, llamadas covariadas, que influencian la probabilidad de falla en el tiempo t. Por ende, los modelos del capítulo cinco serán ampliados para incluir el impacto de estas covariadas (por ejemplo, las partes por millón de hierro en una muestra de aceite, la amplitud de la vibración a 2 x rpm, etc.) en la vida útil restante del equipo o sus componentes. El detallado método para modelar que introducimos en este capítulo, que toma en cuenta datos medidos, se conoce como Modelamiento de Riegos Proporcionales (PHM). Desde el documento pionero de D.R. Cox [ref. 1] en 1972 sobre la materia de PHM, la gran mayoría de usos reportados del modelamiento de riesgos proporcionales ha sido para el análisis de datos de supervivencia en el campo médico. Desde 1985 ha habido un creciente número de referencias que incluyen aplicaciones a turbinas marinas a gas, generadores, reactores nucleares, motores de aeronaves y frenos de disco en trenes de alta velocidad. En 1995, en la Universidad de Toronto, A.K.S. Jardine y V. Makis iniciaron el Laboratorio del Consorcio CBM [ref. 2], cuya misión era desarrollar software de propósitos generales para el análisis de modelos de riesgos proporcionales. El software fue diseñado para ser integrado a la operación del sistema de información de mantenimiento de una planta, con el propósito de optimizar las actividades de CBM. En 1997 el resultado fue un programa llamado EXAKT (producido por Oliver Interactive), el cual, a la fecha de este escrito, estaba en su segunda versión y rápidamente capturando atención como una metodología de optimización de CBM. El ejemplo, gráficos, y cálculos asociados presentados aquí han sido elaborados usando el programa EXAKT. Lectores que quieran trabajar con los ejemplos usando el programa pueden hacerlo obteniendo una versión de demostración vía el autor.
Ingenieros de mantenimiento, planificadores y gerentes tratamos de efectuar mantenimiento sintomático recolectando datos que creemos están relacionados con el estado de salud del equipo o componente. Estos indicadores de condición (o covariadas, como son llamadas en PHM) pueden tomar diversas formas. Pueden ser continuas, tales como temperatura operativa, o tasa de alimentación de materia prima. Pueden ser discretas, tales como mediciones de análisis de aceite o vibración. Pueden ser combinaciones aritméticas de datos medidos, tales como tasas de cambio de mediciones, medias móviles, o proporciones. Dado que raramente poseemos un entendimiento profundo de los mecanismos de falla implícitos, las alternativas de indicadores de condición son interminables. Sin una manera sistemática de discriminar y rechazar datos superfluos y no-influyentes, el CBM pudiera ser mucho menos útil como táctica de decisión de mantenimiento que si el caso fuera otro. El modelamiento de riesgos proporcionales es un enfoque efectivo para el problema de sobrecarga de información, ya que filtra un gran número de datos históricos de condición y fallas, y entrega una óptima recomendación de decisión fundamentada en el estado de salud real del equipo. En este capítulo descubrimos el modelamiento de riesgos proporcionales, describiendo cada uno de los pasos por medio de ejemplos. La prueba estadística de varias hipótesis en el recorrido es parte integral del proceso. Esto nos ayudará a evitar la trampa de seguir ciegamente un método sin la verificación adecuada de los supuestos, o de si el modelo es apropiado para la situación y los datos. Dividimos el problema de optimizar el mantenimiento sintomático en seis pasos: 1. Estudiar y preparar los datos. 2. Estimar los parámetros del modelo de riesgos proporcionales. 3. Probar cuan “bueno” es el modelo PHM. 4. Construir el modelo probabilistico de transición. 5. Hacer la decisión optima para tener el menor costo de mantenimiento de largo plazo. 6. Análisis de sensibilidad.
Primer Paso: Preparación de los datos Estén o no disponibles herramientas o programas computacionales, el modelador debería siempre “mirar” los datos de varias maneras [ref. 4]. Por ejemplo, muchos conjuntos de datos pueden tener la misma media y desviación estándar, pero aún ser muy distintos – y eso puede ser de importancia crítica. Modeladores de mantenimiento deben estar involucrados con sus aplicaciones y entender el contexto. Se ha dado muy poca atención al proceso de recolectar datos, a pesar del creciente uso de sofisticados y poderosos sistemas computarizados de gestión de mantenimiento (CMMS) y de gestión de activos empresariales (EAM). Estrategias de gestión del cambio que promueven la educación y el sentido de propiedad, y la alteración de comportamientos y actitudes relativas al reconocimiento del valor de los datos, inspirarán una recolección meticulosa por mantenedores cuando retiren y reemplacen componentes que hayan fallado. En el nuevo mundo industrial del Mantenimiento Productivo Total (TPM), pueden ser considerados como los verdaderos custodios de datos y sus modelos derivados.
Datos de eventos e inspecciones Los datos requeridos son de dos tipos – datos de eventos y datos de inspecciones. Se requieren como mínimo, tres tipos de datos de eventos para definir la vida de un componente. Ellos son: 1. El Principio (B) de la vida del componente o el momento en que fue instalado. 2. El Termino por Falla (EF). 3. El Termino por Suspensión (ES) debido a reemplazo preventivo. Se deben incluir eventos adicionales en el modelo si se sabe que influyen directamente en los datos medidos. Uno de esos tipos de eventos puede ser un cambio de aceite (designado como “OC” en la figura 29). Uno debería “decirle” al modelo que con cambios de aceite se espera que algunas de las covariadas, tales como desgaste del metal, sean regresadas a cero. La inteligencia adicional va a evitar que el modelo se “engañe” por disminuciones periódicas en desgaste de metales. Esto se ilustra en la figura 28.
B
o r r e i h e d m p p
No esto D
C
A
tiempo
Intervalo de cambio de aceite
Figura 28: la transición verdadera
es A-B-C-D, NO A-B-D.
El apriete, alineación, balanceo, o recalibración periódica del equipo puede tener efectos similares en valores medidos (tales como mediciones de vibración) y deben ser tomadas en cuenta por el modelo.
Una muestra de datos de inspección La figura 29 muestra un conjunto parcial de datos de transmisiones de una flota de cuatro camiones de extracción. El conjunto completo está disponible en un archivo de base de datos MSAccess del autor [ref. 3]. Se necesitan tales datos para construir un modelo de riesgos proporcionales (y eventualmente una política de decisión optima). En este caso, las inspecciones son los resultados de análisis de aceite y están designadas con asterisco (*) en la columna de “Evento”. Los datos incluyen el historial entero de cada unidad identificada con designaciones HT-66, HT-67, HT-76, y HT-77, entre diciembre de 1993 y febrero de 1998, y están organizados cronológicamente según el número del equipo. Figura 29
Datos de inspección y eventos de transmisiones de camiones de extracción
Gráficos cruzados Los datos en la figura 29 deben ser comprendidos por el modelador. La fase de preparación de datos incluye actividades en las cuales el modelador puede familiarizarse con los datos usando un número de herramientas gráficas de software. El gráfico cruzado (figura 30) es una muy conveniente para el análisis gráfico estadístico. Por ejemplo, muestra la posible correlación entre variables de diagnóstico. La correlación entre dos variables se hace evidente cuando los puntos están agrupados en torno a una línea recta. Si los puntos están dispersos como en la figura 30 (que es un gráfico de hierro vs. plomo), uno puede ver fácilmente que no hay correlación entre las dos variables. Si la correlación fuera evidente, sería conocimiento útil en los siguientes pasos del modelamiento. Figura 29
Datos de inspección y eventos de transmisiones de camiones de extracción (continuación)
Limpiar los datos El termino técnico usado por los estadísticos cuando datos contienen eventos y valores engañosos y no apropiados es “sucios”. Los datos sucios deben ser limpiados antes de sintetizarlos en el modelo que
se usará para decisiones y políticas futuras. Esto incluye verificar la validez de datos inapropiados que se encuentran en la serie de datos de inspección.
Transformaciones de los datos El modelador necesita tener a su disposición, no solo los datos en sí, si no que además cualquier combinación (transformación) de datos que crea puedan ser covariadas influyentes. Un área obvia de interés en el terreno de datos transformados es la edad del aceite de lubricación, que no está directamente disponible en la base de datos pero que puede calcularse sabiendo las fechas de cambios de aceite (OC). En el presente ejemplo uno esperaría que el nivel de los “metales de desgaste” hierro y plomo fuese bajo justo después de un cambio de aceite, y que aumentara linealmente mientras este envejece y las partículas se acumularan y quedaran residentes en el sistema de circulación de aceite. Un gráfico cruzado (figura 31) de la edad de aceite y el hierro niega esta teoría excepto para edades muy bajas del aceite lubricante. Por ende, el modelador puede concluir que la edad del aceite, en este sistema, no es una covariada significativa.
Figura 29
Datos de inspección y eventos de transmisiones de camiones de extracción (continuación)
Segundo paso: construir el modelo de riesgos proporcionales
Este paso lo realiza en su totalidad el software. Los parámetros de la ecuación del PHM son estimados.
Ecuación 1:
h(t) = ( / )(t / ) Figura 29
-1
e 1Z1(t)+ 2Z2(t)+...+ nZn(t)
Datos de inspección y eventos de transmisiones de camiones de extracción (continuación)
Al examinar la ecuación (1) podemos ver que esta amplía la función de riesgo de Weibull descrita en el capítulo 4 y aplicada en el capítulo 5. La nueva parte incluye (en forma de expresión exponencial) las covariadas Zi(t) que son la serie de ítems CBM medidos, como por ejemplo, las partes por millón de hierro y otros metales de desgaste presentes en una muestra de aceite. Los parámetros de las covariadas γi especifican la “influencia” relativa que tiene cada covariada en la función de riesgo (o tasa de falla). Un valor muy bajo de γi tendería a indicar que la covariada correspondiente tiene poca influencia y no vale la pena medirla. El software que prueba si cada covariada es significativa o no, usa una prueba estadística. De hecho, una variedad de pruebas estadísticas dentro del software (estimaciones de probabilidad máxima,
Wald, Chi cuadrado, residuos Cox-generalizados, Kolmogorov-Smirnov) proveen criterios sistemáticos para probar diversas hipótesis relativas a la confianza y significancia del modelo. Los algoritmos del software ajustan el modelo de riesgos proporcionales a los datos, entregando estimaciones no solo del parámetro de forma y parámetro de escala como era el caso en los ejemplos de Weibull del capítulo 5, sino que también estimaciones del parámetro γi de cada covariada. Figura 29
Datos de inspección y eventos de transmisiones de camiones de extracción (continuación)
Tercer Paso: Probar el PHM Revisemos nuestros objetivos. Estamos buscando un mecanismo de decisión que en el largo plazo resultará en el menor costo total de mantenimiento. Recuerde que el costo total de mantenimiento incluye el costo de reparación de fallas (que típicamente incluyen una variedad de costos adicionales tales como el costo de producción perdida). Por lo tanto, es esencial que estemos confiados en que el modelo refleje de una manera adecuada y realista las características de las fallas de nuestro equipo o sistema. El análisis de los residuos es un procedimiento que nos dice cuan bien se ajustan los datos al modelo PHM. El modelo de residuos Cox-generalizados se aplica para probar el ajuste del modelo. El método genera matemáticamente números que son conocidos como “residuos”. Luego los residuos son analizados gráficamente.
Hay una variedad de tipos de diagramas usados para evaluar cuan bien se adecúa el modelo. Uno de ellos es el gráfico de “Residuos en Orden de Apariencia”, figura 32. Este método gráfico diagrama los residuos en el mismo orden de los historiales que aparecen en la figura 29. El valor residual promedio debe ser igual a 1 para obtener, si el modelo se ajusta bien a los datos, que la dispersión aleatoria de los puntos sea en torno a la línea y = 1. (Los datos censurados fueron discutidos en el capítulo 4.) Para ayudar a examinar los residuos, los límites inferiores y superiores están incluidos en el gráfico. Si el PHM se ajusta bien a los datos se espera que por lo menos el 90% de los residuos se encuentre dentro de estos límites. El modelador usa una variedad de herramientas matemáticas y gráficas para desarrollar, probar, comparar, y ganar confianza en su modelo. Figura 29
Datos de inspección y eventos de transmisiones de camiones de extracción (continuación)
Plomo
Hierro Figura 30:
Gráfico cruzado de ppm de hierro vs. ppm de plomo
Figura 31: Hierro vs. edad del aceite
Residuos en orden de aparición
o u d i s e R
Historia Figura 32: El modelo probabilistico de transición
Cuarto paso: El modelo probabilistico de transición En este punto del proceso de optimización de CBM, el PHM habrá sido desarrollado y probado por el modelador por medio de las herramientas de software descritas en las secciones anteriores. Estará presuntamente satisfecho o confiado que el modelo se ajusta a los datos limpios de una buena manera. Para cada una de las covariadas en el modelo, el modelador debe ahora definir rangos de valores o estados, por ejemplo bajo, medio, alto, o niveles normales, marginales o críticos. Los rangos de las covariadas son fijados por el modelador según su instinto, experiencia en planta, sus revisiones de datos, o mediante el uso de algún método estadístico tal como poner el límite a dos desviaciones estándar de la media para definir el nivel medio, y a tres desviaciones estándar para definir el nivel alto en el rango de valores.
Discusión sobre la probabilidad de transición Una vez que el modelador ya ha establecido el rango de las covariadas (límites superiores e inferiores), el software calcula la Matriz de Probabilidad de Transición del Modelo en Cadena de Markov (figura 33), que es una tabla que muestra las probabilidades de ir de un estado (por ejemplo, contaminación leve, contaminación media, contaminación alta) a otro entre intervalos de inspección. Dicho de una manera más formal, “la tabla provee una estimación cuantitativa de la probabilidad de que el equipo se encontrará en un estado en particular durante la próxima inspección, dado su estado de hoy.”
Figura 33: La matriz de probabilidad de transición del modelo en
cadena de
Markov
Esto significa que dado el presente rango de valores de una variable, podemos predecir (basados en el historial), con una cierta probabilidad, su rango de valores para la próxima inspección. Por ejemplo, si la última inspección mostró un nivel de hierro menor que 13 partes por millón (ppm) podemos, en este ejemplo, predecir que el próximo registro estará entre 13 y 26 partes ppm con una probabilidad de 12%, y en más de 26 ppm con una probabilidad de un 1.6%. Probabilidades tales como 12% y 1.6% son llamadas probabilidades de transición.
Quinto Paso: La decisión óptima En este paso le “decimos” al modelo (consistente hasta ahora del PHM y el modelo probabilistico de transición) los costos respectivos de reparaciones o reemplazos preventivos y generados por falla. El gráfico de la decisión de reemplazo, figura 34, es la culminación del proceso de modelamiento. Este combina los resultados del modelo de riesgos proporcionales, del modelo probabilistico de transición, y de la función de costos, para mostrar la mejor política de decisión con relación al componente o sistema en cuestión. La ordenada es la covariada compuesta, Z – una suma ponderada de aquellas covariadas que se ha determinado estadísticamente que influencian la probabilidad de falla. Cada covariada medida en la más reciente inspección habrá contribuido su valor a Z. Esa contribución va a haber sido ponderada de acuerdo a su grado de influencia en el riesgo de falla en el próximo intervalo de inspección.
Decisión de reemplazo
(No reemplace antes de la próxima inspección). (Espere reemplazar antes de la próxima inspección) . (Reemplace inmediatamente.)
a t s e u p m o C a d a i r a v o C
(No reemplace)
Edad Operativa Figura 34: El gráfico de la decisión optima de reemplazo La ventaja es evidente. En un solo gráfico se ha obtenido la información filtrada sobre la cual se basará una decisión de reemplazo. La alternativa hubiera sido examinar gráficos de tendencias de docenas de parámetros de condición y “adivinar” si se debe reparar o reemplazar el componente inmediatamente o esperar un poco más. Al aceptar la recomendación del Gráfico de la Decisión Optima de Reemplazo, se actúa acorde a la mejor política para minimizar los costos de mantenimiento de largo plazo.
Sexto paso: Análisis de sensibilidad Queda un paso por completar. ¿Cómo sabemos que el Gráfico de Decisión Optima de Reemplazo verdaderamente constituye la mejor política a la luz de la situación siempre cambiante de nuestra planta? ¿Son los supuestos que usamos aún validos, y si no, cuál va a ser el efecto de esos cambios? ¿Sigue siendo óptima nuestra decisión? Estas preguntas se contestan vía el análisis de sensibilidad. El supuesto que hicimos al construir la función de costos se centró en los costos relativos de un reemplazo planificado vs. los de un reemplazo forzado por una falla repentina. Esa proporción de costos puede haber cambiado. Puede que nuestros métodos contables no puedan actualmente proporcionar los costos precisos de reparación, y por tanto, hemos tenido que estimarlos para construir nuestra función de costos. En cualquiera de los casos, dudamos si la política dictada por el Gráfico de la Decisión Optima de Reemplazo está bien fundada dada la incertidumbre de los costos sobre los cuales fue construida. El propósito del análisis de sensibilidad es mitigar aquellos temores cuando no se justifican, y dirigir al modelador a que gaste un poco de esfuerzo para obtener estimaciones más precisas de los costos de mantenimiento donde sea necesario. La figura 35, el gráfico de la Sensibilidad de Riesgo de la Política Optima, nos muestra la relación entre el nivel de riesgo óptimo y la razón de costos. Si la razón de costos fuera baja, menor que tres, entonces el nivel óptimo de riesgo aumentaría exponencialmente. Por tanto, tenemos que seguir los costos de cerca para así asegurarnos de los beneficios calculados por el modelo.
Sensibilidad de riesgo de la política optima
o g s e i r e d o m i t p o l e v i N
Planificar menos reemplazo preventivo Planificar más reemplazo preventivo
Proporción de costo de reemplazo Figura 35: Sensibilidad de la política optima a la proporción de costos
Conclusión A medida que la intensa competencia del mercado global llega a la industria, la visibilidad de cada aspecto del proceso productivo, en particular éste de confiabilidad de equipos, se convertirá en un requerimiento urgente de negocio. La integración y fluidez de la cadena de abastecimiento a través de múltiples empresas en asociación y conectadas electrónicamente, forzarán a que la información de mantenimiento, disponibilidad, y confiabilidad pase a ser crítica para la misión. Software amigable al usuario, pero sin embargo sofisticado, potenciará a los profesionales de mantenimiento para responder con agilidad a la continuamente fluctuante demanda de fuerzas de mercado. Modelos matemáticos estadísticos tales como los desarrollados con ayuda de herramientas de software discutidas en este capítulo, en conjunto con sistemas expertos fundados en los principios del mantenimiento basado en confiabilidad, serán los “perros guardianes” operando silenciosamente dentro del sistema computarizado de gestión de mantenimiento de una empresa. Su función – monitorear continuamente datos entrantes de condición y edad. Cuando los datos de condición gatillen una alerta respecto al modelo de política óptima de mantenimiento, deberá tomarse y ejecutarse rápidamente una clara y apropiada decisión. El escenario está fijado y los actores de mantenimiento, en distintos estados de preparación, deberán enfrentar desafíos completamente nuevos a medida que sube el telón sobre una cultura de negocio en veloz transformación. La gestión de este cambio girará necesariamente alrededor de la meticulosa recolección y análisis de datos.
El escenario está fijado y los actores de mantenimiento, en distintos estados de preparación, deberán enfrentar desafíos completamente nuevos a medida que sube el telón sobre una cultura de negocios en veloz transformación. Sistemas de información y base de datos de gestión de mantenimiento existentes tienen baja utilización y población inadecuada de datos, principalmente porque los operarios y empleados de mantenimiento no están convencidos de que hay una relación entre el registro preciso de datos de vida de un componente y su efectividad para mantener funcionando los activos físicos de su organización. La esperanza del autor es que los métodos descritos aquí apoyen al personal de mantenimiento en sus procesos de toma de decisiones mientras progresan hacia la máxima confiabilidad al menor costo.
Referencias: 1. Métodos Estadísticos en la Teoría y Práctica de la Confiabilidad, Brian D. Bunday, Ellis Horwood Limited, 1991. 2. www.mie.utoronto.ca/labs/cbm. 3.
[email protected] 4. Confiabilidad Aplicada, Paul A. Tobias, David C. Trinidade, 1995 Van Nostrand Reinhold. 5. El Nuevo Manual de Weibull, Robert E. Abernethy, Segunda edic. Dr. Robert B. Abernethy SAE TA 169 A35 1996X C.1 Engi. 6. “La aplicación de modelos de optimización de mantenimiento: revisión y análisis” , Rommert Dekker, Ingeniería de Confiabilidad y Seguridad de Sistemas 51, 1996, 229-240 Elsevier Science Limited. 7. “Sobre la aplicación de modelos matemáticos en el mantenimiento” , Phillip A. Scarf, Periódico Europeo de Investigación Operacional, 1997 Elsevier Science. 8. “Sobre el impacto de los modelos de optimización en la toma de decisiones de mantenimiento: el estado del arte” , Rommert Dekker, Phillip A. Scarf, Ingeniería de Confiabilidad y Seguridad de Sistemas, 1998 Elsevier Science Limited. 9. Planificación de Mina y Selección de Equipo, A.A. Balkema, Acta de sesión del Tercer Simposio Internacional Sobre la Planificación de Minas y la Selección de Equipos, Estambul/Turquía.
apéndice
Navegar la red en búsqueda de información de confiabilidad ¿Está buscando páginas útiles en Internet? Aquí tiene donde empezar Por Paul Challen En las páginas anteriores de este Manual de Confiabilidad Conf iabilidad hemos visto una completa discusión de las maneras en que profesionales del mantenimiento pueden aumentar el tiempo máximo de utilización utilización en sus plantas. Parte de esta discusión se basa en la necesidad de usar tecnología para recolectar el tipo de información necesaria para implantar decisiones de confiabilidad. Junto a los los diversos paquetes de software y bases de datos que nuestros autores han recomendado, existen innumerables otros recursos disponibles para la gente en búsqueda de información de confiabilidad – y uno de los lugares de búsqueda más útiles es Internet. Lo siguiente no es, de ninguna manera, un listado exhaustivo de recursos que encontrará disponibles en la red. Aconsejamos a los lectores explorar estas páginas y seguir los vínculos (links) (links) que emanan de ellas.
Centro de análisis de Confiabilidad Ubicado en la dirección http://rac.iitri.org http://rac.iitri.org,, esta página se hace llamar el “centro de excelencia en confiabilidad y mantenimiento mantenimiento en los últimos últimos 30 años”. El RAC (centro de análisis análisis de confiabilidad) es operado por el Instituto de Investigación ITT en Estados Unidos, y provee información a la industria por medio de bases de datos, manuales de metodología, revisiones del estado del arte de la tecnología, cursos de capacitación y servicios servicios de consultoría. Su misión es proveer experiencia experiencia técnica e información información en las disciplinas de ingeniería de confiabilidad, mantenibilidad, capacidad de apoyo y calidad, y facilitar su implantación efectiva y económica en todas las fases del producto o el ciclo de vida del sistema. La página web del RAC contiene recursos de información útiles, que incluyen una base de datos bibliográfica de libros, estándares, artículos de periódicos, documentos de simposios, y otros documentos sobre confiabilidad, mantenibilidad mantenibilidad y capacidad de apoyo. También mantiene mantiene un calendario de eventos venideros en toda la industria, información sobre vínculos a otras bases de datos, un “consorcio para compartir datos” con información sobre datos de confiabilidad de partes no electrónicas, distribuciones de modos de falla, y datos de susceptibilidad a descargas electrostáticas. El RAC también ha compilado dos importantes listas, una de siglas frecuentemente usadas en el mundo de confiabilidad y otra (en la dirección http://rac.iitri.org/cgi-rac/sites?0) de vínculos (links) navegables hacia otras páginas en Internet sobre temas relacionados.
Libros y material impreso Para aquellos profesionales que estén buscando buen material impreso, aunque un poco pasado de moda, sobre el tema, hay una lista general de libros ubicada en http://www.quality.org/Bookstore. Para libros sobre la confiabilidad que usted pueda comprar en-línea por medio de Amazon ( www.amazon.com www.amazon.com)) o intentar en: http//www.quality.org/Bookstore/Reliability.htm. http//www.quality.org/Bookstore/Reliability.htm.
También hay una bibliografía completa de documentos de confiabilidad del gobierno de Estados Unidos en la dirección http://www.incose.org/lib/sebib5.html, que cubre una gran variedad de temas técnicos.
Organizaciones Profesionales La página del RAC también contiene una inmensa lista de organizaciones profesionales relevantes en la dirección http://rac.iitri.org/cgi-rac/sites?00013. Una de las más útiles, desde el punto de vista de confiabilidad, es la página de la Sociedad para Profesionales de Mantenimiento y Confiabilidad (SMRP), ubicada en la dirección http://www.smrp.org. Esta organización es una sociedad independiente sin fines de lucro dedicada a los profesionales en los campos del mantenimiento y la confiabilidad. La sociedad está, de acuerdo a su misión, “dedicada a la excelencia en el mantenimiento y la confiabilidad en todo tipo de organizaciones manufactureras o de servicios y a promover la excelencia mundial del mantenimiento.” También contiene vínculos a otras organizaciones sobre temas de mantenimiento y confiabilidad. La página de la Sociedad de Ingenieros de Confiabilidad (SRE) en la dirección http://www.sre.org es otro recurso útil que se relaciona con la confiabilidad. De particular interés será el boletín de la sociedad “Lambda Notes,” y su directorio de servicios públicos de confiabilidad. Para una perspectiva global, puede ver la página web de la Organización Mundial de Confiabilidad en la dirección http://www.world5000.com. La página de la organización describe su plan para implantar un Indice Internacional de Confiabilidad, en el cual cada país será clasificado según un número de índices que conforman una puntuación general de confiabilidad.
Información general La Revista de Confiabilidad conocida como “la primera revista dedicada específicamente a la industria del mantenimiento predictivo, de análisis de falla & causa-raíz, mantenimiento centrado en la confiabilidad y CMMS,” tiene su página en la dirección http://www.reliability-magazine.com. El Centro de Mantenimiento & Confiabilidad de la Universidad de Tennessee (MCR) es una nueva página que usa investigación y tecnología de punta para ayudar a empresas miembros a reducir las pérdidas causadas por el tiempo de detención de los equipos. Puede visitar al MRC en la dirección http://www.engr.utk.edu/mrc. El Centro para la Gestión de Confiabilidad y Costo-efectividad, ubicado en la Universidad de Exeter en Inglaterra, promueve la colaboración nacional e internacional con instituciones industriales y otras académicas o de investigación en las áreas de confiabilidad y el mantenimiento. Su página web está en la dirección http://www.ex.ac.uk/mirce. El Instituto de la Vibración (ubicado en la dirección http://www.vibinst.org/) es una organización sin fines de lucro dedicada al intercambio de información práctica sobre maquinaria y estructuras. Las actividades del instituto también incluyen publicación de la revista Vibraciones, Acta de Sesión de sus Reuniones Anuales, y “apuntes de cursos cortos”.