TECSUP – PFR
Ingeniería del Mantenimiento
Unidad II
AN ÁLISIS D DE C C AUS A R R AÍZ (Tomado de “Modelos Mixtos de Confiabilidad” por Luís Amándola)
1.
INTRODUCCIÓN En muchos casos, se está tan ocupado solventando problemas que no nos ocupamos de encontrar las causas de los mismos, por lo cuál ellos seguirán ocurriendo y, nuevamente se estará demasiado ocupado para resolverlos. A través de los años y con el surgimiento de las nuevas tecnologías, los procesos productivos pasaron de ser manuales a ser parciales y en algunos casos totalmente automatizados, los equipos son cada vez más complejos y más complicados también los sistemas productivos. Por la tanto, localizar el origen de un fallo se hará un proceso cada vez más y más complejo. Sin embargo, actualmente se cuenta con distintas herramientas que ayudan a resolver algunos de los grandes problemas de la industria actual, como por ejemplo, hallar las causas reales por las cuales ocurre un fallo y atacarlas en lugar de conformarnos con atacar sus síntomas. En las próximas páginas se mostrará una herramienta herramienta llamada “Análisis de Causa de Causa Raíz” que consta de unos pasos sistemáticos que ayudan a localizar las causas, las causas, orígenes o raíces de los fallos que se estén estudiando y avanzar así hacia el mejoramiento de los procesos productivos y de la confiabilidad de los equipos.
2.
BASES TEORICAS PARA SU APLICACIÓN ¿Qué es Análisis Causa Raíz? Es una herramienta utilizada para identificar las causas que originan los fallos o problemas, las cuáles al ser corregidas evitarán la ocurrencia de los mismos. Es una técnica de identificación de causas fundamentales que conducen a fallos o fallos recurrentes. Las causas identificadas son causas lógicas y su efecto relacionado, es importante mencionar que es un análisis deductivo, el cuál identifica la relación causal que conduce al sistema, equipo o componente a un fallo. Se utilizan una gran variedad de técnicas y su selección depende del tipo de 21
Ingeniería del Mantenimiento
TECSUP – PFR
problema, disponibilidad de la data y conocimiento de las técnicas: análisis causa-efecto, árbol de fallo, diagrama espina de pescado, análisis de cambio, análisis de barreras y eventos y análisis de factores causales.
2.1. ANTECEDENTES DEL ACR Es una aplicación que se inició, en forma sistemática, desde los 70’s y se han producido mejoras en el tiempo, la última versión es la utilización del ACR proactivo, que consiste en identificar los fallos antes de que ocurran y tomar acción antes de que falle el equipo. Sin embargo, no se han producido, ni se espera que se produzcan cambios sustanciales en la forma de ejecutar la herramienta, aún cuando pueda sufrir ciertas variaciones por el acoplamiento con otras metodologías de confiabilidad.
3.
DÓNDE Y CUANDO SE DEBE APLICAR ACR
4.
de la
en
de
BENEFICIOS GENERADOS POR EL ANÁLISIS CAUSA RAÍZ
5.
En forma proactiva para evitar fallos recurrentes de alto impacto en costes operación y mantenimiento. En forma reactiva para resolver problemas complejos que afectan organización. Equipos/sistemas con un alto coste de mantenimiento correctivo. Particularmente, si existe una data de fallos de equipos con alto impacto costes de mantenimiento o pérdidas de producción. Análisis de fallos repetitivos de equipos o procesos críticos. Análisis de errores humanos en el proceso de diseño y aplicación procedimientos y de supervisión.
Reducción del número de incidentes, fallos y desperdicios. Reducción de gastos y de la producción diferida, asociada a fallos. Mejoramiento de la confiabilidad, la seguridad y la protección ambiental. Mejoramiento de la eficiencia, rentabilidad y productividad de los procesos.
IMPORTANCIA DEL ACR Normalmente cuando ocurre un fallo, ésta es percibida porque genera ciertas manifestaciones o fenómenos de fácil localización (síntomas), no así las causas de la misma (causa raíz) que, mientras más complicado sea el sistema, mayor será la dificultad de localizar el origen de dichas causas, pudiendo atacar las manifestaciones del fallo pero no su origen, lo que se traduce en potencialidad de ocurrencia de fallos que se harán recurrentes . A continuación se muestra un pequeño diagrama: 22
TECSUP – PFR
Ingeniería del Mantenimiento
Figura 2.1. Diagrama de efectos de fallos Causa del fallo (generalmente no obvia). Síntomas (generalmente atacados por pensar que ellos son las causas del fallo).
Se puede observar que al no realizar un análisis exhaustivo del fallo y sus posibles causas, se está perdiendo la oportunidad de aprovechar ésta como un paso para mejorar en la relación coste-producción-confiabilidad. Cuando la gente responsable de mantener sus sistemas y procesos funcionando se hallan tan ocupados que no tienen tiempo para identificar las verdaderas causas de los problemas, generalmente sólo "aplican presión sobre la herida" para seguir en movimiento. Cuando se trata de un problema menor, se dice que se "pone una tirita". Ya cuando se trata de un problema mayor, se dice que se está aplicando un "torniquete". En una metáfora muy usada en inglés se dice que andamos tan ocupados extinguiendo fuegos que no podemos buscar al "tipo de los cerillos”. Posponer la acción correctiva de la "Causa Raíz" es común. En la presión de la rutina diaria, los gerentes e ingenieros se hallan con frecuencia imposibilitados de eliminar el problema de fondo, de manera que puedan dedicarse a atender los síntomas, para que el negocio se mantenga en marcha y se tenga el dinero para los sueldos. No tiene caso estar lamentándose al respecto, es simplemente un hecho, a veces necesario para la salud o supervivencia de la empresa. El segundo factor que contribuye a retardar la acción respecto a los problemas de fondo, es que se tratan de problemas generalmente "aceptables o tolerables". No
23
Ingeniería del Mantenimiento
TECSUP – PFR
tiene caso argumentar que no son aceptables, si no lo fueran, no ocurrirían o serían mucho menos frecuentes. Se hace necesario crear programas tales como el Análisis de Causa Raíz para ayudar a recordar que tal vez el programa de mantenimiento preventivo que no se ejecuta está asociado a la cantidad de fallo que presentan los equipos, esto a su vez conlleva a que la situación se convierta en una cacería de brujas, cada quién buscando culpables y evadiendo responsabilidades.
6.
APLICACIÓN DEL ANÁLISIS CAUSA RAÍZ La aplicación del análisis de causa raíz consta de cuatro (4) etapas básicas:
Definición del problema. Efectuar análisis del problema (ACR). Identificar soluciones efectivas. Implementar soluciones.
Definición del Problema Esta etapa consiste en identificar cuál el problema o situación que se desea solucionar. A partir de este punto se decide la aplicación o no de la herramienta ACR en búsqueda de mejoras para el funcionamiento de los equipos o erradicar problemas complejos que afectan la integridad de la planta y/o la competitividad del consorcio.
Análisis del Problema Esta etapa consta de las fases preliminares y de desarrollo en pleno de la herramienta. Generalmente, se comienza por un entrenamiento del personal que participará en el análisis para luego aplicar la herramienta ACR en la solución del problema previamente definido.
Pasos para la Aplicación del ACR. El Reliability Center Inc. Desarrolló una metodología de cinco (5) pasos llamada PROACTTM por sus siglas en inglés:
PReserving Failure Data. Ordering the Analysis.
24
TECSUP – PFR
Ingeniería del Mantenimiento
Analyzing the Data. Commucating Findings and Recommendations. Tracking to Ensure Success.
Recolectar Datos del Fallo (Preserve Failure Data) : Este paso consiste en reunir todos los datos relacionados con el fallo o el problema estudiado. Se debe asegurar ser lo más objetivo posible y evitar suposiciones, puesto que sólo se llegará a un resultado real contando con datos confiables. La data debe ser recolectada, clasificada y analizada cuidadosamente sin obviar detalles.
Ordenar el Análisis (Order the Análisis) : Se debe asegurar que el equipo destinado a realizar el análisis sea multidisciplinario, conformado por representantes de cada departamento involucrado con el fin de descartar y realizar un análisis de puntos de vista o de conclusiones pre-concebidas.
Analizar los Datos (Analyze the Data) : En este paso el equipo debe tomar cada pieza del rompecabezas y ponerla en su lugar, para efectuar esto existen diversos métodos, sin embargo, aquí se usará el árbol de fallos propuesto por el RCI (Reliability Center Inc.). El árbol de fallos promueve un proceso de deducciones lógicas y disciplinadas que obliga al equipo a trabajar en reversa desde el fallo hasta las causas. Constantemente se desarrollan hipótesis de cómo un evento puede ser consecuencia de otro precedente. Cuando todas las posibilidades han sido identificadas, se debe desarrollar estrategias para verificar si, de hecho, estos eventos han ocurrido. Para esto es necesario que la información (datos del fallo) haya sido cuidadosamente tratada. La única herramienta de verificación que no se debe usar es el convencional sentido común o punto de vista. Para un mejor desarrollo del análisis de causa raíz, existen dos preguntas básicas que deben ser realizadas repetidamente hasta que todas las raíces sean localizadas. Estas preguntas básicas son: a) los ¿Cómo?; y b) los ¿Por qué?. Los ¿Cómo? Están relacionados con la forma como puede ocurrir el fallo; los ¿Por qué? Se relacionan con las causas por las cuáles ella ocurre. (Communacate Findings and Recommendations) : Cuando el proceso de
ACR está completado, las soluciones de los fallos parecen aparentes. El próximo
25
Ingeniería del Mantenimiento
TECSUP – PFR
paso es presentar los hallazgos y recomendaciones en una forma que motive a tomar acciones que corrijan el problema.
En Vías de Asegurar el Éxito (Tracking to Ensure Success) : En este punto se propone realizan los cambios e inversiones necesarias para evitar que el fallo ocurra nuevamente por la misma causa, eliminando ésta y realizando un seguimiento para detectar los beneficios obtenidos.
Identificar Soluciones Efectivas Esta etapa está íntimamente ligada a los hallazgos y conclusiones obtenidas a lo largo de la aplicación del ACR al problema estudiado, donde ya localizadas las causas de fondo se identifican las correcciones que deben realizarse para asegurar la no ocurrencia del fallo debido a la no presencia de la causa que la origina.
Implementar Soluciones Cuando se realizan las correcciones y se recogen los frutos de la aplicación de la metodología. A continuación se muestra un esquema de las etapas del ACR y el orden correcto de cada una de ellas.
Figura 2.2. Etapas del ACR.
EFECTUAR 7. NIVELES DEL ACR
26
TECSUP – PFR
Ingeniería del Mantenimiento
Mediante la aplicación del ACR en las distintas industrias se han localizado causas comunes de fallos como lo son concentraciones de esfuerzos, desalineaciones, metalurgia inadecuada, falta de equipos de inspección, falta de adiestramiento del personal, etc, las cuáles se agrupan en tres niveles del ACR.
7.1.
RAÍCES FÍSICAS En este nivel se reúnen todas aquellas situaciones o manifestaciones de origen físico que afectan directamente la continuidad operativa de los equipos o plantas, por ejemplo: flujo mínimo por bloqueo de una tubería, malas conexiones, repuestos defectuosos, etc. Generalmente en este nivel no se encontrará la causa raíz del fallo, sino un punto de partida para localizarla.
7.2.
RAÍCES HUMANAS Aquí encontraremos todos aquellos errores cometidos por el factor humano y que inciden directa o indirectamente en la ocurrencia del fallo: instalación impropia, errores en diseño, no aplicar correctamente los procedimientos pertinentes, etc, esta es una de las categorías en las que se podría encontrar la causa raíz de un fallo.
7.3.
RAÍCES LATENTES Todos aquellos problemas que aunque nunca hayan ocurrido, son factibles su ocurrencia. Entre ellos: falta de procedimientos para arranque o puesta fuera de servicio, personal que realice trabajos de reparación sin adiestramiento, diseño inadecuado, inapropiados procedimientos de operación, entre otros.
27
Ingeniería del Mantenimiento
TECSUP – PFR
Figura 2.3 Niveles del ACR.
Para un mejor entendimiento de los niveles del ACR véase (Ejemplo de ACR de Fallo en el Rodamiento de una Bomba).
8.
IMPACTO LUEGO DE LA APLICACIÓN DEL ACR Se han visto casos en los cuáles la realización del ACR en una planta constituye un punto de partida para el mejoramiento del resto de las plantas y de toda la empresa, pues las causas raíces de fallos catastróficas descubiertas en una planta, después de estudios se han encontrado que, generalmente son las mismas causas de las otras plantas. Por ejemplo: si se descubre que no se cuenta con procedimientos efectivos de torque en una unidad “X”, posiblemente se presentará este mismo problema en otras unidades, constituyendo la causa raíz localizada, quizás, un problema extendido en toda la empresa. Esto permite que en el futuro no ocurra el mismo fallo en el área, unidad o planta estudiada ni en ninguna otra, por tal motivo hay quienes llaman al ACR la herramienta para “Aprender a Aprender”.
EXPERIENCIAS DE LA INDUSTRIA Durante muchos años las empresas, incluso los más grandes consorcios a nivel mundial, han arrastrado consigo graves problemas mecánicos recurrentes u ocasionales en equipos de alto impacto para la producción y/o costes de mantenimiento. Otro factor que funciona como agravante de este hecho lo constituye el miedo al cambio o a la implementación de nuevas técnicas por
28
TECSUP – PFR
Ingeniería del Mantenimiento
parte de los directivos y luego de los niveles supervisorios y artesanos, que empobrecen la amplia gama de oportunidades que se podrían alcanzar. Por lo tanto, fallos catastróficas seguían ocurriendo, procediendo luego a reparaciones originando un comportamiento reactivo en cuanto a mantenimiento se refiere. El aporte que ha brindado le técnica del Análisis Causa Raíz consiste en solventar y/o prevenir los fallos catastróficas logrando reducciones sustanciales en costes totales de mantenimiento, mejoras en los indicadores de producción y gestión de mantenimiento y mayor valor agregado; por otro lado, reducción de fallos recurrentes traduciéndose en mayor confiabilidad y disponibilidad mecánica de los equipos e instalaciones. A continuación se presentan tres ejemplos claves que muestran los beneficios que obtienen las empresas al aplicar ACR. La Empresa ISPAT Inland Steel, presentó un problema catastrófico durante una rutina de eliminación de escoria cuando un acople del soporte d e lanza se rompió y este cayó estrellándose en el piso. Durante la aplicación de ACR invirtieron € 30.000, y después de su aplicación estimaron un retorno de € 1.150.000 por no ocurrir nuevamente este fallo (retorno aproximadamente 4000%). La Empresa EASTMAN, recibía muchas quejas por la presencia de un extraño contaminante verde en elementos rodantes suministrados por este consorcio. Al decidir hallar la Causa Raíz de esta contaminación, invirtieron € 2.700 y estimaron un retorno de € 85.000 (aprox. 3.200%). La refinería LYONDEL-CITGO USA presentó muchos problemas en la unidad de destilación en vacío (construida para el procesamiento de crudo proveniente de la faja del Orinoco Venezuela), pues las dos bombas de succión del fondo de la torre de vacío llegaron a presentar un tiempo medio entre fallos de ½ fallos/mes, es decir, un (1) fallo cada dos (2) meses debido a expansión térmica y corrosividad del producto. En la aplicación de ACR se invirtió € 40.000 con un retorno estimado de € 7.150.000 (aprox. 17.000%).
CONEXIÓN CON OTRAS TÉCNICAS DE MANTENIMIENTO El mantenimiento y la confiabilidad son áreas donde muchas compañías se juegan la capacidad competitiva debido a los recursos dedicados al mantenimiento y al impacto de la confiabilidad en su capacidad para generar beneficios. La búsqueda de niveles cada vez más altos de desempeño ha abierto las puertas a la tecnología en esas áreas y a la conexión de distintas técnicas o herramientas de mantenimiento para el aumento de la confiabilidad: las
29
Ingeniería del Mantenimiento
TECSUP – PFR
decisiones que ayer se tomaban mediante una práctica profesional más o menos razonada y actualizada, hoy se toman mediante el uso de sofisticadas herramientas y de complejos sistemas de información. El creciente mundo de la industria, los equipos cada vez más sofisticados y complejos y la preocupación por mantener operaciones bajo un ambiente confiable, han generado que muchas de las herramientas que conocemos se acoplen entre sí con el fin de obtener el mayor provecho de ellas. Hoy en día, el Análisis Causa Raíz constituye una herramienta muy versátil que sirve de apoyo a otras metodologías, generando un programa completo para la detección, prevención y eliminación de fallos. En la figura se muestra la integración de varias herramientas de mantenimiento en la cuál el ACR ocupa un nivel importante.
Figura 2.4 Integración de herramientas de confiabilidad.
En los últimos años los estudios se han orientado hacia la búsqueda de metodologías integrales o la integración de metodologías ya existentes para contar con un espectro más amplio de apoyo a los planes de mejoramiento de la confiabilidad.
30
TECSUP – PFR
Ingeniería del Mantenimiento
Igualmente la última versión del ACR (ACR proactivo) tiene estrecha relación con la técnica del mantenimiento proactivo ya que consiste en identificar los fallos antes de que ocurran y tomar acción antes de que falle el equipo, previniéndose así fallos catastróficas, y realizándose controles continuos u ocasionales debido al aporte brindado por las prácticas descriptivas. Algunos profesionales han hallado una forma de conexión entre el Mantenimiento Productivo Total (TPM) y el Análisis Causa Raíz (ACR), debido a que anterior a los principios de W. Eduard Deming de TPM las empresas se contentaban con explorar la calidad del producto terminado en vez de la calidad del proceso, por lo que de existir un defecto, el producto debía ser reprocesado con elevados costes para la organización. En algunos casos de aplicación de ACR como el método de “prueba y error”, en el que cuando ocurre un problema se va directo a la causa más obvia, en caso de que no sea esa se experimenta con otra, aquí se estaría utilizando la perspectiva de la “calidad del producto”, mientras que si se realiza un árbol lógico como el propuesto por el método PROACTTM se permitiría representar gráficamente la relación entre causa y efecto, asegurando llegar de una vez a la raíz del problema (criterio de “calidad del proceso”). Por tanto, existen quienes aseguran que la práctica del ACR debería más bien considerarse como un sistema disciplinado tipo TPM de ACR: 1.
Cuando nuestro "experto" proporciona una solución, confiamos, hacemos un gasto para aplicar la solución que propuso, y vemos si funciona. A veces sí funciona, otras no. Esto equivale a la inspección de calidad a la salida de la planta. ¡Es demasiado tarde si hay un error!
2.
Cuando se forman grupos y participan en tormentas de ideas, estaremos llegando a conclusiones como resultado del consenso de los participantes. Estamos basándonos en opiniones. Quizás usaron un proceso formal como el diagrama de esqueleto de pescado, pero no hay hechos claros que respald en esas opiniones. De nuevo estamos verificando la calidad del producto al final del proceso, y no durante el mismo.
3.
Cuando los grupos de trabajo usan un proceso disciplinado que requiere que las hipótesis sean desarrolladas para ver exactamente por qué ocurrieron las causas, y luego precisa también una verificación para asegurar si es o no cierto, entonces estamos usando Calidad en el Proceso, en vez de basarnos en suposiciones y estar expuestos a la ignorancia.
31
Ingeniería del Mantenimiento
TECSUP – PFR
EJEMPLO DE ACR DE FALLA EN EL RODAMIENTO DE UNA BOMBA Para poder notar que existe un fallo en un rodamiento, tuvo que hacerse evidente porque se notó que la bomba dejó de suministrar un producto, entonces deberíamos comenzar el árbol de fallos de la siguiente forma:
Figura 2.5.Fallo de rodamiento.
Luego deberemos recolectar los datos necesarios para el análisis de las posibles causas del fallo en el rodamiento. Ya estando recolectada la data y conformado el equipo de trabajo, se deberán formular hipótesis y con los datos recolectados y la experiencia del grupo multidisciplinario para luego ir confirmando la posibilidad de que haya sido una o otra causa según las hipótesis planteadas. En el ejemplo se establecen hipótesis como erosión, corrosión, fatiga o sobrecarga, entonces para determinar cual de ellas fue la verdadera causa sencillamente se envía el rodamiento a un laboratorio metalúrgico, supongamos que la respuesta fue fatiga, entonces el árbol de fallos continuará así en retrospectiva.
Figura 2.6 Fallo de bomba.
32
TECSUP – PFR
Ingeniería del Mantenimiento
Quizás al seguir adelante con la investigación se determine que la causa de la fatiga es una alta vibración y para ésta a su vez se formulan hipótesis entre las cuales están desbalanceo, desalineado o resonancia. Así que se la pide al mecánico que la alineó la última vez que la alinee otra vez para observarlo como lo hace y se nota que no sabe hacerlo. Ahora cabría determinar por qué el mecánico no balancea bien la bomba y nuevamente se desarrollan hipótesis que deberán ser probadas, entre las cuáles estarían que no hay procedimientos adecuados, que ha tenido un entrenamiento inadecuado o que las herramientas que utiliza no son las idóneas para realizar ese trabajo. El árbol de fallos continuará así.
Figura 2.7 Fallo de bomba.
33
Ingeniería del Mantenimiento
TECSUP – PFR
Y así se seguiría investigando para determinar cuál de estas tres causas originó que el mecánico no supiera balancear la bomba, así que, si existen las herramientas adecuadas y se cuenta con los procedimientos para realizar esa tarea, ya sabríamos que la causa raíz del problema fue falta de entrenamiento del mecánico.
34