La meteorología de los datos y el tiempo

Análisis de series de tiempo, de tendencias y explicación de resultados.

El otoño ha iniciado, un nuevo día y una nueva estación, pronósticos de temperaturas aún cálidas con tendencia a bajar en las próximas semanas. Año tras año hemos visto los mismos comportamientos y al igual que en cualquier serie de datos en el tiempo, gracias a esta estacionalidad y la revisión de los mínimos y máximos podemos planear nuestras vacaciones, seleccionar el outfit del día y eventualmente aplazar algunas reuniones para no acabar empapados por la lluvia. Gracias al análisis de series de tiempo pronosticamos y tomamos decisiones, y gracias a las matemáticas podemos aprovechar sus resultados de manera más precisa y profunda. 

El análisis está basado en cuatro componentes que se mezclan dentro de cualquier serie de tiempo:  el valor subyacente, la tendencia, la estacionalidad y la aleatoriedad. Regresemos al clima, en otoño el valor subyacente está caracterizado por temperaturas más cálidas que las de invierno, pero menores que las de verano, con tendencia a bajar a lo largo de las semanas a medida que se acerca el invierno, una estacionalidad diaria que produce temperaturas más altas en el día y más bajas en la noche, y algunas variaciones aleatorias o no explicadas por los meteorólogos debidas a frentes fríos o cambios en temperaturas de las corrientes oceánicas. 

foto_datos_otono_2020_interior_small

[Análisis de las temperaturas del Otoño 2020 - Facultad de Ciencias Astronómicas y Geofísicas - UNLP] 

Usando los cuatro elementos 

Para realizar un análisis de series de tiempo, el primer paso es seleccionar el periodo de análisis. Podemos llegar a conclusiones muy distintas si extraemos el último mes o año de datos. El periodo relevante es aquel que hace evidente el fenómeno que queremos analizar, si nos interesa estimar las temperaturas de la próxima semana, el periodo relevante sería el último año que nos muestre las temperaturas del otoño pasado, pero si queremos ver los efectos del calentamiento global este periodo debería contemplar los últimos 30 o 40 años.  

otoño

Extraída la serie de tiempo relevante para nuestro análisis lo primero es determinar el valor subyacente, para lo cual se puede usar una medida que calcule el valor representativo de la serie, es usual emplear el promedio o la mediana para este efecto y se puede acompañar con otros indicadores que nos amplíen la información, como el mínimo y el máximo o medidas de dispersión como la varianza o la desviación estándar, con esto tendremos un panorama general que nos diga que tan “constante” ha sido este valor a lo largo del tiempo y que tan extremos son los valores máximos y mínimos. 

El segundo elemento es la tendencia, dado que existe una variación es importante saber si esta marcará un cambio hacia el futuro, es decir, si el valor tiene un crecimiento o decrecimiento que determine que en el futuro los valores subyacentes sean mayores o menores. El método más simple es trazar una línea recta sobre la serie de datos, la pendiente resultante es la tendencia. Sin embargo, no siempre las tendencias son lineales, muchos procesos físicos tienen tendencias más complejas como exponenciales, logarítmicas o polinómicas, pero existen paquetes de software (incluyendo Excel) que harán el duro trabajo del cálculo por nosotros. 

El tercer elemento llamado estacionalidad, se refiere a comportamientos cíclicos u oscilatorios dentro del grupo de datos. Para muchos problemas los periodos de oscilación son conocidos como variaciones diarias, semanales, mensuales o anuales, de hecho, muchas series son multi estacionales al combinar varias estacionalidades de forma simultánea. Si lo que se quiere es detectar la estacionalidad se puede recurrir a métodos matemáticos como el cálculo de autocorrelación o las transformaciones, en estos casos les recomiendo revisar algunos libros sobre el tema o buscar un amigo ingeniero o economista que hayan lidiado con series estacionales o señales periódicas, también hay buenos paquetes de software que se encargarán del problema. Sin embargo, en muchas situaciones las estacionalidades son conocidas y claramente reconocibles, pudiéndolas asignar gracias a nuestro conocimiento del proceso. La estacionalidad se puede caracterizar a través del periodo de repetición, su amplitud (la diferencia entre el calor central y el máximo o el mínimo) y su forma. Muchos procesos tienen formas y periodos que son como una huella digital, los cuales nos permiten detectar y diferenciar la ocurrencia de procesos que difícilmente pueden ser observados sobre la serie de tiempo completa. 

El último elemento, las variaciones aleatorias, lejos de representar sucesos azarosos corresponde a todas las variaciones no explicadas por los elementos anteriores. Muchos de los eventos más importantes se manifiestan como discontinuidades en la serie de tiempo y aparecen en este elemento, descifrar las variaciones aleatorias requiere toda la destreza del analista y un amplio conocimiento del proceso en cuestión, la forma de obtener este elemento es extraer los tres elementos anteriores de la serie de tiempo original. En ocasiones, el objetivo del análisis de series de tiempo es obtener este último elemento, a esto se le llama desestacionalización de series de tiempo y es un tema muy amplio dentro del estudio de la economía. Después de separar este elemento de los tres anteriores podríamos decir al igual que el principito: “Lo esencial es invisible a los ojos”. 

No siempre es tan sencillo 

El análisis de series de tiempo es un campo amplio y en desarrollo utilizado recientemente en el mantenimiento, existen series de tiempo difíciles de tratar y portafolios de métodos muy distintos para intentar desentrañarlas. Ni los antiguos métodos analíticos que forman parte de los cursos de ingeniería, ni las revolucionarias técnicas de inteligencia artificial para predicción de fallas son completamente precisas en el análisis, pero siempre permiten ver aspectos del problema que serían imposibles de extraer desde una tabla de datos de monitoreo de condición.  

En conjunto, el análisis de series de tiempo, el conocimiento del modo en que el sistema se degrada y el funcionamiento del proceso productivo son una sola herramienta para encontrar las causas de los procesos de falla en los activos. Las técnicas de análisis de series de tiempo son tan sólo el telescopio que un buen astrónomo usa para descubrir las estrellas.  

firma juan

Prepárate para el lanzamiento de Predictto con el curso: IoT y el mantenimiento predictivo.  Conoce de forma sencilla cada uno de los aspectos básicos de esta nueva era del mantenimiento 4.0 ¡Ingresa aquí!