Mantenimiento predictivo industrial usando machine learning

La detección de fallos en máquinas antes de que estos se produzcan, se conoce como mantenimiento predictivo industrial. Es uno de los 3 tipos de mantenimiento existente, que junto con el mantenimiento preventivo y correctivo, tienen como objetivo que las máquinas funcionen como un reloj. Al fin y al cabo, la producción en general y el OEE en especial, dependen enormemente de la disponibilidad de las máquinas.

Que las máquinas fallen es inevitable. Largas horas de trabajo, desgaste de componentes, configuraciones incorrectas, falta de mantenimiento o simplemente, imposibilidad de realizar un mantenimiento correcto de ciertos componentes, ya sea por el coste o el periodo de inactividad que este mantenimiento conllevaría.

Creación de un modelo de mantenimiento predictivo industrial para reducir tus paradas no planificadas

No hace mucho, un jefe de producción me comentaba que en su línea de embotellado, el fallo que más temen, por la cantidad de veces que ocurre y el tiempo de parada que conlleva es la rotura de algún filtro de la llenadora. Especialmente, si ocurre un dia laborable a las 8 de la mañana. En ese caso, me comentaba, no consiguen poner la línea en marcha antes de las 11.

El coste de una parada no planificada no sólo es la cantidad de producto final no fabricado por esa máquina. A esto, debemos añadir más máquinas, ya que lamentablemente, toda la línea debe ser parada, puesto que el lavado y llenado es la primera fase de toda una línea que ha decidido que hoy vas a tener un mal día. Además, hay que sumarle retrasos en los pedidos, reajustes en la planificación y por supuesto, el coste de la mano de obra perdida. Esta es una historia que he escuchado repetidas veces, por lo que una de ellas, planteamos hacer un piloto de mantenimiento predictivo.

Los datos que se muestran a continuación, han sido debidamente anonimizados por requerimiento del cliente.

Descripción de los datos

Para este piloto se ha usado 1 año de datos de telemetría de varias máquinas de distinta antiguedad. Concretamente se usaron las siguientes medidas: voltios, velocidad de rotación, presión y vibraciones. Son variables fáciles y baratas de medir. Las 3 primeras, de hecho, ya las daba el PLC de la máquina. Al ser un siemens S7, recuperar e historizar estos datos es muy sencillo. Para las vibraciones, el equipo de mantenimiento colocó un sensor de vibraciones. Todo esto se completó con el histórico que tenían de mantenimientos correctivos y del componente concreto que ha necesitado ser reparado.

Distribución de los fallos por componente para una máquina industrial

Con estos datos, podemos observar que las máquinas tienden a no fallar demasiado. Fallan aproximadamente un 1,7% de los días de uso. Esto, para un algoritmo de este tipo, suele ser un problema, ya que tiene pocos ejemplos de cada componente en estado de fallo para ser entrenado.

Una conclusión sorprendente es que, esta tasa apenas se incrementa en las máquinas de más edad.

Variabilidad de los fallos ocurridos en una máquina industrial a lo largo de los años

Características clave que indican un fallo inminente

Tras analizar las relaciones entre las variables, se observó que es posible separar las medidas de la máquina «a punto de fallar», y deducir cual es el componente que va a fallar con 24h de antelación. Esto demuestra que el fallo está ahí antes de que la máquina se pare, por lo que es posible planificar una parada nocturna, o en horario de baja actividad para corregir el componente indicado sin que la máquina llegue a averiarse.

Como puede verse en la siguiente imagen, los 4 componentes tienen medidas completamente diferenciables del resto cuando están a 24h de producir una parada.

Diagrama de dispersión usado para crear un modelo de mantenimiento predictivo industrial

Por ello, se decidió construir un modelo predictivo basado en un árbol de clasificación. Para analizar los resultados, se probó el modelo de mantenimiento predictivo industrial con datos que nunca había visto, es decir con datos distintos a los usados para entrenar el modelo.

Resultados y fiabilidad del modelo de mantenimiento predictivo industrial

El resultado se puede ver en las matrices de confusión siguientes. En el eje de las ordenadas, tenemos lo que ocurrió realmente y en el eje de las abscisas, lo que el modelo predijo. Como se puede apreciar, a 24h si el modelo precide un fallo de componente 1, acierta un 97% de las veces. Si predice un fallo de componente 3, acierta un 87% de las veces.

Precisión del modelo de mantenimiento predictivo industrial

Tras probar el modelo de mantenimiento predictivo industrial en distintas casuísticas, vemos que a 3 días, mantiene un acierto de entre el 60 y el 64%. Sin embargo, a 2 días del fallo, su acierto es de entre el 87 y el 98%, tasa que se mantiene a 24h vista.

Con un modelo cuya tasa de error es tan baja, resulta posible planificar una parada para revisar el componente indicado cuando sea conveniente, evitando las horas de mayor carga de trabajo. Ello ha contribuído a aumentar la disponibilidad de las máquinas y por tanto el OEE.

En este caso concreto, en el que había muchas máquinas de similares características, el retorno de la inversión (ROI) ha sido menor a 4 meses.