Interpretable Neural Networks by Decoupling Linear and Non-linear Effects
M. Ávila, D. Peña, A. M. Alonso
En este trabajo presentamos una arquitectura neuronal para problemas que requieren simultáneamente precisión predictiva e interpretabilidad. Aunque combinar modelos lineales con redes neuronales puede equilibrar ambos objetivos, las arquitecturas híbridas estándar sufren signal stealing, por el que la componente flexible absorbe variación linealmente explicable y dificulta la interpretación de los coeficientes lineales. Proponemos un predictor con una rama lineal explícita y una rama neuronal general, e introducimos un mecanismo de ortogonalización por mini lotes que proyecta la salida no lineal sobre el complemento ortogonal del espacio lineal. Los resultados en simulación y en varios conjuntos de datos reales muestran que este procedimiento mitiga el signal stealing, mejora la recuperación de los efectos lineales y mantiene un rendimiento predictivo competitivo frente a una red neuronal, a una regresión lineal y a una regresión lineal más red neuronal sobre residuos.
Palabras clave: Deep Learning, Interpretability, Orthogonalisation, Regression Models, Signal Stealing
Programado
Aprendizaje Automático y Métodos Estadísticos
2 de septiembre de 2026 15:30
Aula 20
Otros trabajos en la misma sesión
D. F. Merino Delgado, A. Mateos Caballero, C. J. Pérez Sánchez
E. T. López Sanjuán, M. Martínez Pizarro, D. F. Merino Delgado, M. I. Parra Arévalo
A. Mancuso, A. Iodice D'Enza, F. Palumbo, R. Simone