Autoencoders para la imputación de datos en series espacio-temporales: una aplicación a la predicción del Índice de Cifra de Negocios en la Industria
El Índice de Cifra de Negocios en la Industria (ICN) es una estadística económica coyuntural, elaborada mensualmente por institutos nacionales de estadística del Sistema Estadístico Europeo (SEE). Es un índice calculado a partir de datos obtenidos mediante encuestas a los establecimientos de la muestra, cuya publicación se ve afectada por falta de respuesta en plazo. Por otra parte, los autoencoders son redes neuronales que aprenden representaciones latentes mediante reconstrucción de datos. En particular, los denoising autoencoders se entrenan para reconstruir datos originales a partir de versiones corruptas o con ruido, aprendiendo representaciones robustas que capturan su estructura esencial. Estos modelos se han aplicado ampliamente a la eliminación de ruido en imágenes y señales. Este trabajo presenta un enfoque basado en ellos para imputar datos faltantes en series espacio-temporales, como las del ICN, que describen fenómenos a lo largo del tiempo en múltiples establecimientos.
Keywords: autoencoders imputación de datos series temporales índice de cifra de negocios en la industria aprendizaje automático